Задать вопрос

Jolt @Jolt

docker

Как организовать дублирование Spark driver?

Имеется Kafka, куда падают события, их необходимо фильтровать и заносить в разные БД.
Сейчас все построено на Apche Spark (PySpark).
В каждом docker контейнере был запущен свой локальный SparkContext, со своим writeStream.foreachBatch.
Но это весьма затратно по памяти, поэтому сейчас перенес все в один контейнер, в котором к одному контексту коннектятся writeStream.

В любом случае, хотелось бы иметь резервирование, чтобы было запущено два контейнера на разных машинах с одной задачей. Как это возможно сделать?
Предполагаю что потребуется отдельный Spark кластер с двумя мастерами и N мастерами.
А как задублировать задачи (spark driver)?

Вопрос задан более трёх лет назад
54 просмотра

Комментировать

Подписаться 1 Сложный Комментировать

Пригласить эксперта

Ответы на вопрос 1

Prompt Attestation @PromptAttestation

Can i know what are spark driver?

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программное обеспечение и интернет-сервисы

+2 ещё

Средний
Как настроить Supabase?
- 1 подписчик
- 16 июн.
- 120 просмотров
1

ответ
Docker

Простой
Почему докер не может увидеть файл при попытке запуска, но ls вывод говорит что файл есть?
- 1 подписчик
- 09 июн.
- 111 просмотров
0

ответов
Docker

Простой
Где в проекте располагать dockerfile?
- 1 подписчик
- 09 июн.
- 158 просмотров
2

ответа
Docker

+1 ещё

Простой
Как настроить Push & Pull при докеризации приложения на Битрикс24?
- 2 подписчика
- 22 мая
- 398 просмотров
0

ответов
Компьютерные сети

+2 ещё

Простой
Почему приложение не может получить доступ к бэкенду?
- 2 подписчика
- 19 мая
- 865 просмотров
1

ответ
Docker

+1 ещё

Средний
Как корректно выгрузить список docker-образов в массив?
- 2 подписчика
- 16 мая
- 872 просмотра
2

ответа
Docker

+2 ещё

Средний
Как правильно настроить Transmission в Synology NAS?
- 1 подписчик
- 01 мая
- 445 просмотров
3

ответа
Angular

+1 ещё

Простой
Как angular как собрать в docker-compose?
- 1 подписчик
- 29 апр.
- 117 просмотров
1

ответ
Docker

+1 ещё

Простой
Как написать локальный kafka со способом авторизации юзеров: username, password, SASL_SSL, SCRAM-SHA-512?
- 2 подписчика
- 26 апр.
- 812 просмотров
0

ответов
PostgreSQL

+3 ещё

Простой
Почему выдаёт ошибку HikariPool-1?
- 1 подписчик
- 22 апр.
- 184 просмотра
0

ответов
Показать ещё Загружается…

Инженер сборки DevOps/Build Engineer

БайтЭрг • Москва

от 150 000 ₽

DevOps инженер

Wanted • Москва

До 250 000 ₽

Solution Architect (Platform V)

Сбер • Москва

от 450 000 до 550 000 ₽