Собирать кластер из Raspberry Pi имеет смысл только развлечения ради. Для производительности более целесообразно взять Xeon какой-то не самого нового поколения.
Как обрабатывать данные в кластере очень сильно зависит от приложения, и общего эффективного решения, которое позволит вам с десятка Raspberry Pi сделать виртуальную машинку с хотя бы 5x производительностью по сравнению с одной системой, нет.
Принцип такой же как вы описали: что-то откуда-то берет данные, обрабатывает, и отправляет куда-то результат. Точнее нельзя сказать из такого общего вопроса. К примеру майнинг с использованием пула это один из примеров того как куча компьютеров могут работать над решением общей задачи.
В профессиональных датацентрах быстрые сети, прямой доступ к памяти и куча других ухищрений, которые даже приблизительно недоступны на Raspberry Pi. Думаю, для обучения больше смысла будет поднимать виртуалки на десктопе и настраивать между ними взаимодействие по виртуальной сети.