Apache Spark или Akka Cluster для потоковой обработки?
Что лучше использовать для потоковой обработки данных?
Имеются задачи, на вход которым подаются небольшие строки, далее задачи посылают множество запросов к различным API (vk, twitter, yandex) и в конце сохраняют результат в MongoDB. Время выполнения одной задачи 0.5 - 3 сек. Операции с диском не производятся.
Какой вариант выбрать, чтобы добиться наибольшей производительности?