Задать вопрос
@mashalas

Какой программой запустить распределённые вычисления на пользовательских рабочих местах?

Многие сотрудники на ночь не выключают компьютер, соответственно в это время он зря расходует электричество. А в то же время сервер на всех процессорах занят вычислениями. Есть идея разделить задачу выполняемую по ночам на сервере и раскидать её по некоторому количеству рабочих мест из тех, что остались в эту ночь включенными. Т.е. что-то вроде Kubernetes или ботнета. Рабочие станции в основном на Windows, но и Linux иногда тоже встречается.
Вероятно, на рабочие места должен ставиться какой-то агент, который периодически опрашивает "центр управления" и если там появилась новая задача, то может её взять, если задача ему подходит (версия ОС, объём памяти, незанятость другим заданием, метка (label) клиента). По завершении задачи в "центр управления" пересылается код завершения и то, что выводилось в консоль. Существуют подобные программы, которые можно было бы установить в корпоративной сети? Разумеется, по согласованию с руководством, т.к. всё легально, а не какой-то подпольный майнинг.
  • Вопрос задан
  • 152 просмотра
Подписаться 1 Средний 3 комментария
Пригласить эксперта
Ответы на вопрос 4
hint000
@hint000
у админа три руки
https://ru.wikipedia.org/wiki/BOINC
https://habr.com/ru/articles/390749/ "Распределённые вычисления: краткое введение в проекты BOINC"
Ответ написан
Комментировать
@rPman
Если задача удобно делится на части (можно разделить на независимые работы по номерам как описано в коментариях) то что-либо разрабатывать для этого не нужно.

Учесть занятость машины и запустить на ней задачу - вопрос нескольких строк кода.

Например: в linux есть утилита parallel, ей просто даешь список команд в виде текстового файлика, а она их запускает параллельно с указанным количеством одновременно запущенных процессов, по завершению одного тут же запускает следующий. Никакого контроля за работой нет (т.е. ошибки обрабатывать самостоятельно). Соответственно, настраиваешь беспарольный ssh на машины в сети, затем генерируешь текстовый файл где каждая строка вида ssh случайный_сервер команда и отдаешь его parallel с указанием количества машин -j N (на самом деле если задачи занимают только один поток и на одной машине можно их несколько запускать, то нужно будет посчитать сумму потоков, в этом случае все сложнее, ведь современные процессоры уже не дают линейного увеличения от количества ядер даже в идеальном случае, потребуются бенчмарки). Этот подход не идеален но максимально простой. В качестве развитие этого - список команд генерируется не заранее а на лету, каждая следующая команда дает сервер, нагрузка на который в последние секунды была минимальной, в командной строке это все будет красиво выглядеть с использованием пайпов:
command_generator | parallel -j 100 >> parallel.log 2>> parallel.err


Т.е. одна машина у тебя будет управляющей, все остальные - воркеры, ssh ставится на любую ос, а благодаря wsl даже не придется заметно переписывать код

p.s. Почти наверняка задача требует доступ к данным, которые по сети могут не очень эффективно передаваться (да и многопоточный доступ к данным редко бывает эффективный) поэтому нужно продумать систему кеширования данных, в т.ч. заранее (в linux и windows есть механизмы, разные, с оговорками, иногда проще самому в коде этим заниматься). Результаты тоже нужно куда то записывать, если поток большой, то лучше пусть сначала, по возможности, данные собираются на машинах в сети, там где они получались, позже можно их собрать воедино.

p.p.s. настоятельно рекомендую делать так чтобы воркеры в данной реализации самостоятельно обрабатывали ошибки, вплоть до вывода в stdout/stderr, иначе разбирать кашу вывода parallel будет сложно
Ответ написан
martin74ua
@martin74ua Куратор тега Системное администрирование
Linux administrator
https://ru.wikipedia.org/wiki/Distributed.net
поищите тут, или что то похожее.
Ответ написан
Комментировать
mayton2019
@mayton2019
Bigdata Engineer
Я думаю что это надо согласовывать с руководством. Были случаи когда админы запускали всякие майнеры и прочее а потом за их действия "прилетало" компании. Сотрудники тоже рано или поздно поймут что на десктопе происходит что-то странное. Температуру и загрузку железа невозможно просто скрыть.

Вобщем не подставляйтесь.

Да ну и отвечая на вопрос. Что можно посмотреть в этом направлении.

- YARN https://hadoop.apache.org/docs/current/hadoop-yarn...
- Mesos https://en.wikipedia.org/wiki/Apache_Mesos
- Kubernetes уже упоминали выше.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы