Как распараллелить вычислительно Java-приложение на несколько машин?

Question

Дмитрий Логвиненко @dmlogv

Универсальный человек

Как распараллелить вычислительно Java-приложение на несколько машин?

Дано:
Некое вычислительное (не веб!) приложение на голом Java SE 8, расходующее в процессе работы около 500 Гб RAM и солидную часть ресурсов Intel Xeon E5-2*** и имеющее примерно такую, прости Господи, структуру:

«Структура» до

Т. е. один могучий jar-ник запускается на Linux-сервере, тащит к себе комплект данных из БД, которые подвергает неким арифметическим экзекуциям (из которых часть параллелится совсем никак, часть — очень хорошо и сейчас разбита по Thread), и результат отправляется назад в базу.

Само собой, с этим веществом имеются некоторые проблемы:

Слабая отказоустойчивость (что упало, то запускаем заново)
Нулевая масштабируемость (варианты «накинуть памяти/процов» скоро перестанут срабатывать)
Мониторинг только по логам либо — при дебаге — по запущенному VisualVM
Управление только через параметры командной строки jar-ника и pkill

Хотелось бы завернуть это в некий сервер приложений, для управления контроля, балансировки, заодно распределив нагрузку параллельного этапа вычислений на n машин (где n > 1). В моих туманных представлениях новая абстрактная структура приложений должна выглядеть так:

«Структура» после

где несчетное количество Slave — отдельные вычислительные машины, которым Master раздает данные (под вопросом. Вероятно, рабы сами могут их затягивать), распределяет нагрузку (если какая-то из машин уже досчитала, ей выдается еще что-нибудь), управляет отказоустойчивостью (один из хостов вышел покурить — перебрасываем его задание на более работающий), агрегирует данные из уже рассчитанных результатов и сбрасывает их в БД.

Но! Но оперативный гуглёж показал, что типичные серверы Java-приложений навроде Wildfly, GlassFish, WebSphere, WebLogic используются именно для обслуживания потребностей веб-приложений, а для числодробилок нужны монстры в стиле Hadoop, Ignite. Да? Или нет?

Что бы в таком случае применили вы?

Вопрос задан более трёх лет назад
748 просмотров

3 комментария

Подписаться 7 Средний 3 комментария

Помогут разобраться в теме Все курсы

Нетология

Java-разработчик с нуля

12 месяцев

Далее
Академия Эдюсон

Java-разработчик + ИИ

8 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

Простой
Почему не запускается Flyway?
- 1 подписчик
- 12 мая
- 192 просмотра
2

ответа
Java

Простой
Можно ли сделать «псевдоним» для пакета?
- 3 подписчика
- 06 мая
- 242 просмотра
1

ответ
Java

Простой
Возможно ли добавлять методы в пакет чужой библиотеки?
- 1 подписчик
- 05 мая
- 192 просмотра
2

ответа
Java

+2 ещё

Сложный
Как гарантировано закрыть сокет через ServerSocket?
- 2 подписчика
- 30 апр.
- 182 просмотра
1

ответ
Java

Средний
Как получать ввод с конкретной клавиатуры и мышки, если их несколько?
- 2 подписчика
- 29 апр.
- 163 просмотра
1

ответ
Java

Простой
Как переделать этот SQL запрос на java?
- 1 подписчик
- 13 мар.
- 345 просмотров
1

ответ
Java

+1 ещё

Простой
Почему не запускается собранный в .jar файл Java FX проект?
- 1 подписчик
- 26 февр.
- 225 просмотров
2

ответа
Android

+2 ещё

Простой
Как исправить ошибку при установке плагина AppMetrica в Android Studio?
- 1 подписчик
- 18 янв.
- 226 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 224 просмотра
1

ответ
Java

Простой
Как восстановить свой профиль в Майнкрафт?
- 1 подписчик
- 15 дек. 2025
- 356 просмотров
1

ответ
Показать ещё Загружается…

Использование терминологии мастер-слейв для не СУБД сильн овсе путает

Используйте термины воркер, синхронный воркер,..

Почему не используете кафку или очереди вообще?
Почему не используете кафку или очереди вообще?

По определению не подходит (управление очередями) либо не знаем, как применять
Дмитрий Логвиненко,
По определению не подходит
????

Answer 1 · 2018-02-20 11:44:34

Сергей Горностаев @sergey-gornostaev Куратор тега Java

Седой и строгий

Я бы как раз использовал Spark или Ignite, чтобы не изобретать велосипед.

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2018-02-20 11:50:35

Я конечно не сталкивался на практике но много читал про решения подобных задач и вот пара мыслей:
1) Если все лежит в БД то почему бы не начинать параллелить именно с нее. Скажем в БД (возможно отдельной) метить кто забрал себе данные, дальше ноды цепляются к БД, берут пачку данных и метят что они уже в работе, т.е. нода 2 не возьмет данные которые уже на ноде 1. Это из простых решений в лоб.
2) Все последующие это реализациия в библиотеках, gridgain , штатный RMI, Apache Ignite, Apache River.

Answer 3 · 2018-03-01 06:51:38

Как вариант — использовать AKKA. Оно есть и для скалы, и для Java. Там довольно просто "подключить несколько машин". Но собственно распараллеливание, перевод приложение на другую концепцию (асинхронный обмен сообщениями вместо прямого вызова) — это придется голову поломать.

Как распараллелить вычислительно Java-приложение на несколько машин?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт