Как лучше организовать работу с worker серверами чтобы они сами брали работу из пула или мастер сервер им дает работу?

Question

Константин Т @RooTooZ

Highload

Как лучше организовать работу с worker серверами чтобы они сами брали работу из пула или мастер сервер им дает работу?

Есть пулл серверов из 15-20 серверов из них один выделен для фронта, остальные для тяжелой работы.

под тяжелой работой я подразумеваю долгие задачи использующие почти всю мощность процессора и оперативной памяти, задачи могут быть запущены параллельно на одном сервере т.е. может одновременно работать 4-8 задачи количество зависит от load overage сервера.

Так вот, пул задач хранится на фронт-сервере который принемает запросы от пользователей. Как лучше организовать распределение задач между серверами, я пока вижу 2 варианта и не могу определиться какой лучше: (далее мастер-сервер это фронт сервер)

Каждый worker сервер, смотрить на свой load average, и до тех пока он не пиковый опрашивает мастер сервер на наличие задач, если появляется задача он ее хватает и говорит матер-серверу о том что это задача теперь его и другие серверы не должны заниматься ей впредь
Мастер сервер смотрит по статистике которую ему передает каждый воркер, какой воркер сейчас наименее загруженный и дает задачу ему и сам рулит процессами распределения задач

Минус первого подхода в том что могут возникнуть коллизии и 2 сервера могу взять одновременно задачу на себя и будут выполнять двойную работу, по этому я больше склонен считать что 2 вариант подходит, но может я ошибаюсь или чего-то не учел? Или может есть 3 вариант?

Вопрос задан более трёх лет назад
346 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Учебный центр IBS

ARC-008 Проектирование высокопроизводительных приложений и инструменты ИИ

1 неделя

Далее
Яндекс Практикум

Архитектура программного обеспечения

6 месяцев

Далее
Devhands

Производительность и масштабируемость

2 месяца

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Node.js

+3 ещё

Средний
Как организовать паралельную и последовательную обработку задач по условиям?
- 1 подписчик
- более года назад
- 218 просмотров
0

ответов
Linux

+2 ещё

Простой
Как поймать, что дает высокий Load Average?
- 3 подписчика
- более года назад
- 881 просмотр
2

ответа
PHP

+2 ещё

Средний
Какую архитектуру парсинга маркетплейса выбрать?
- 1 подписчик
- более двух лет назад
- 368 просмотров
1

ответ
Highload

+1 ещё

Простой
Существует ли практика выставления приоритета запросу в очереди сообщений?
- 4 подписчика
- более двух лет назад
- 1234 просмотра
1

ответ
Python

+2 ещё

Простой
Что выбрать в качестве промежуточного хранилища в проекте?
- 6 подписчиков
- более двух лет назад
- 2618 просмотров
3

ответа
.NET

+3 ещё

Простой
Как реализовать атомарное обновление 2 файлов?
- 4 подписчика
- более двух лет назад
- 1063 просмотра
3

ответа
Базы данных

+3 ещё

Сложный
Какие есть инструменты и решения для экстремально быстрой online-аналитики потоковых данных?
- 4 подписчика
- более двух лет назад
- 987 просмотров
3

ответа
Nginx

+1 ещё

Простой
Тест nginx -- сколько сообщений в log без потерь?
- 9 подписчиков
- более двух лет назад
- 3253 просмотра
1

ответ
Highload

Простой
Как создать новостную ленту подписчиков на высоконагруженных веб-проектах?
- 1 подписчик
- более двух лет назад
- 66 просмотров
0

ответов
Linux

+1 ещё

Простой
Access логи. Нужны ли на серверах с большой опсещаемостью?
- 1 подписчик
- более двух лет назад
- 179 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2016-12-20 18:45:45

Минус первого подхода в том что могут возникнуть коллизии и 2 сервера могу взять одновременно задачу на себя и будут выполнять двойную работу

Зависит от технологий, которые Вы собираетесь использовать. У Вас в варианте №1 структура данных с задачами для воркеров будет называться распределенная очередь (shared queue). У этой структуры данных как раз-таки основная задача - раздавать данные юнитам, предотвращая дублирование и негативные эффекты типа race condition и т.д.

В разных программных пакетах реализуется по-разному. Порекомендую глянуть например на Beanstalkd, где все Ваши проблемы уже решены, либо воспользоваться встроенной в Redis структурой данных List. Она в принципе то что нужно и делает.

Однако преимущество Beanstalkd будет в том, что он специально заточен именно под очереди задач: поддерживается сортировка задач в заданном числовом порядке, резервирование задач, автоматическое снятие резерва при превышении времени на обработку и др.

Плюс предусматривает возможность хранения задач на жестком диске (с ключом -b) помимо хранения в памяти (что в Redis реализуется только через слепки (snapshot), либо через полный лог операций - что не есть оптимальный вариант).

Answer 2 · 2016-12-20 17:47:24

да в общем однофигственно. Организуйте лок задачи, пока ее кто-то забирает - и pull будет работать корректно. Не хотите - делайте push.
а можно нечто среднее - воркер периодически говорит "я готов взять следующее", мастер ему пихает задачу.
И мастер не долбит воркера запросами "как дела?" и воркер не получит уже запущенную задачу.
т.е. очередью управляет мастер, отчет о состоянии создает воркер

Как лучше организовать работу с worker серверами чтобы они сами брали работу из пула или мастер сервер им дает работу?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт