Задать вопрос

Jolt @Jolt

docker

Как организовать дублирование Spark driver?

Имеется Kafka, куда падают события, их необходимо фильтровать и заносить в разные БД.
Сейчас все построено на Apche Spark (PySpark).
В каждом docker контейнере был запущен свой локальный SparkContext, со своим writeStream.foreachBatch.
Но это весьма затратно по памяти, поэтому сейчас перенес все в один контейнер, в котором к одному контексту коннектятся writeStream.

В любом случае, хотелось бы иметь резервирование, чтобы было запущено два контейнера на разных машинах с одной задачей. Как это возможно сделать?
Предполагаю что потребуется отдельный Spark кластер с двумя мастерами и N мастерами.
А как задублировать задачи (spark driver)?

Вопрос задан более трёх лет назад
56 просмотров

Комментировать

Подписаться 1 Сложный Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Яндекс Практикум

Мидл фронтенд-разработчик

5 месяцев

Далее
Яндекс Практикум

Инженер облачных сервисов

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

Prompt Attestation @PromptAttestation

Can i know what are spark driver?

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Docker

Средний
Как использование переменные в Entrypoint Dockerfile?
- 1 подписчик
- 17 окт.
- 112 просмотров
2

ответа
Nginx

+1 ещё

Простой
Как оптимизировать скорость загрузки шаблонов с изображениями docker nginx laravel?
- 3 подписчика
- 09 окт.
- 249 просмотров
1

ответ
Laravel

+1 ещё

Простой
Если один контейнер создает файл laravel-2025-01-01.log топ почему другой контейнер не может получить доступ?
- 1 подписчик
- 08 окт.
- 194 просмотра
0

ответов
Nginx

+2 ещё

Средний
Какие порты пробрасывать в настройках php5.6-fpm в контейнере Docker-а?
- 1 подписчик
- 28 сент.
- 151 просмотр
1

ответ
Laravel

+3 ещё

Простой
Почему php-fpm на все запросы выдает 404?
- 1 подписчик
- 26 сент.
- 309 просмотров
0

ответов
Docker

Простой
Почему docker не видит .env?
- 1 подписчик
- 11 сент.
- 199 просмотров
2

ответа
Docker

+1 ещё

Простой
Docker ssl frontend backend?
- 1 подписчик
- 02 сент.
- 207 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить phpStan в vscode чтобы он работал через докер?
- 2 подписчика
- 30 авг.
- 176 просмотров
0

ответов
VPN

+2 ещё

Средний
Проблема с хендшейком WireGuard через Docker (wg-easy). Что я делаю не так?
- 1 подписчик
- 28 авг.
- 336 просмотров
0

ответов
Docker

Средний
Почему образы не пуллятся с Docker hub?
- 2 подписчика
- 25 авг.
- 255 просмотров
4

ответа
Показать ещё Загружается…

Python Backend Developer

SLLR.market

от 250 000 до 320 000 ₽

Python разработчик

Космос Про Медиа • Москва

от 180 000 до 200 000 ₽

Backend Tech Lead / техлид

Невасофт • Санкт-Петербург

от 300 000 ₽