Привет, тоже относительно недавно стал интересоваться данной темой. Выбрал для себя AWS сервисы. Там можно развернуть кластер(множество вычислетельных устройств, которые делят вычислительные мощности для обработки). Apache Spark там можно развернуть, другое дело как ты туда будешь данные закидывать, там тоже есть множество вариантов.