Какой программой запустить распределённые вычисления на пользовательских рабочих местах?

Question

mashalas @mashalas

Какой программой запустить распределённые вычисления на пользовательских рабочих местах?

Многие сотрудники на ночь не выключают компьютер, соответственно в это время он зря расходует электричество. А в то же время сервер на всех процессорах занят вычислениями. Есть идея разделить задачу выполняемую по ночам на сервере и раскидать её по некоторому количеству рабочих мест из тех, что остались в эту ночь включенными. Т.е. что-то вроде Kubernetes или ботнета. Рабочие станции в основном на Windows, но и Linux иногда тоже встречается.
Вероятно, на рабочие места должен ставиться какой-то агент, который периодически опрашивает "центр управления" и если там появилась новая задача, то может её взять, если задача ему подходит (версия ОС, объём памяти, незанятость другим заданием, метка (label) клиента). По завершении задачи в "центр управления" пересылается код завершения и то, что выводилось в консоль. Существуют подобные программы, которые можно было бы установить в корпоративной сети? Разумеется, по согласованию с руководством, т.к. всё легально, а не какой-то подпольный майнинг.

Вопрос задан более двух лет назад
169 просмотров

3 комментария

Подписаться 1 Средний 3 комментария

Сергей Горностаев @sergey-gornostaev

Ответ во многом зависит от того, что именно сервер вычисляет, далеко не все задачи поддаются параллелизации и уже тем более распределённой обработке.

Написано более двух лет назад
mashalas @mashalas Автор вопроса

Сергей Горностаев, Понятно, что не все задачи можно распараллелить, но предположим задача стоит обсчитать 250 объектов, номера которых находятся в базе данных. Первому клиенту назначаются объекты с номерами 1-100, второму 101-200, третьему - оставшиеся.
Данный пример весьма условен, т.к. деление предполагается не на 3 worker-а, а гораздо больше.

Написано более двух лет назад
Василий Банников @vabka

Алексей Машалас, а что с сетевыми доступами?
И если хочется решить проблему "сотрудники не выключают компьютер", то может:
1. У этого есть причина
2. Можно просто сделать скрипт, который выключает компьютеры, которые простаивают ночью.

Всё-таки их закупали не для вычислений

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Системный администратор

6 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Хекслет

DevOps-инженер с нуля

14 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+1 ещё

Простой
Какие нужны навыки начинающему junior сис админу и каков его карьерный рост?
- 3 подписчика
- вчера
- 411 просмотров
4

ответа
Компьютерные сети

+2 ещё

Простой
Возможно ли вывести изображение с ноутбука на три разных андроид телевизора внутри локальной сети(некий аналог anydesk)?
- 2 подписчика
- 22 окт.
- 294 просмотра
2

ответа
Системное администрирование

+2 ещё

Простой
Отвал VPN тунеля при подключении по RDP?
- 1 подписчик
- 22 окт.
- 398 просмотров
0

ответов
Linux

+2 ещё

Средний
Туннель Wireguard — всё?
- 2 подписчика
- 21 окт.
- 7878 просмотров
3

ответа
Linux

+2 ещё

Простой
Как настроить Matrix Synapse сервер, чтобы работал клиент Element X (Element подключается)?
- 1 подписчик
- 17 окт.
- 127 просмотров
1

ответ
Компьютерные сети

+2 ещё

Средний
Почему падает качество голоса при исходящих звонках VoIP?
- 2 подписчика
- 14 окт.
- 302 просмотра
0

ответов
Системное администрирование

+1 ещё

Простой
Как сделать бекап виртуальной машины с помощью veeam?
- 3 подписчика
- 14 окт.
- 259 просмотров
2

ответа
Системное администрирование

Простой
Как сделать несколько виртуалок на одном сервере?
- 5 подписчиков
- 05 окт.
- 1716 просмотров
8

ответов
Системное администрирование

+1 ещё

Простой
Ошибка при активации office 24 0xC004F074?
- 2 подписчика
- 02 окт.
- 217 просмотров
2

ответа
Системное администрирование

Простой
Как организовать доступ к рабочему компьютеру удалённо?
- 3 подписчика
- 01 окт.
- 493 просмотра
5

ответов
Показать ещё Загружается…

SRE в команду трафика Core Infrastructure

Яндекс • Москва

от 400 000 ₽

Старший дизайнер специальных проектов

Хабр • Москва

от 180 000 до 200 000 ₽

Специалист первой линии поддержки

Ай Ти без проблем • Санкт-Петербург

от 55 000 до 90 000 ₽

Ответ во многом зависит от того, что именно сервер вычисляет, далеко не все задачи поддаются параллелизации и уже тем более распределённой обработке.
Сергей Горностаев, Понятно, что не все задачи можно распараллелить, но предположим задача стоит обсчитать 250 объектов, номера которых находятся в базе данных. Первому клиенту назначаются объекты с номерами 1-100, второму 101-200, третьему - оставшиеся.
Данный пример весьма условен, т.к. деление предполагается не на 3 worker-а, а гораздо больше.
Алексей Машалас, а что с сетевыми доступами?
И если хочется решить проблему "сотрудники не выключают компьютер", то может:
1. У этого есть причина
2. Можно просто сделать скрипт, который выключает компьютеры, которые простаивают ночью.

Всё-таки их закупали не для вычислений

Answer 1 · 2023-08-01 07:18:35

https://ru.wikipedia.org/wiki/BOINC
https://habr.com/ru/articles/390749/ "Распределённые вычисления: краткое введение в проекты BOINC"

Answer 2 · 2023-08-01 06:47:20

Если задача удобно делится на части (можно разделить на независимые работы по номерам как описано в коментариях) то что-либо разрабатывать для этого не нужно.

Учесть занятость машины и запустить на ней задачу - вопрос нескольких строк кода.

Например: в linux есть утилита parallel, ей просто даешь список команд в виде текстового файлика, а она их запускает параллельно с указанным количеством одновременно запущенных процессов, по завершению одного тут же запускает следующий. Никакого контроля за работой нет (т.е. ошибки обрабатывать самостоятельно). Соответственно, настраиваешь беспарольный ssh на машины в сети, затем генерируешь текстовый файл где каждая строка вида ssh случайный_сервер команда и отдаешь его parallel с указанием количества машин -j N (на самом деле если задачи занимают только один поток и на одной машине можно их несколько запускать, то нужно будет посчитать сумму потоков, в этом случае все сложнее, ведь современные процессоры уже не дают линейного увеличения от количества ядер даже в идеальном случае, потребуются бенчмарки). Этот подход не идеален но максимально простой. В качестве развитие этого - список команд генерируется не заранее а на лету, каждая следующая команда дает сервер, нагрузка на который в последние секунды была минимальной, в командной строке это все будет красиво выглядеть с использованием пайпов:

command_generator | parallel -j 100 >> parallel.log 2>> parallel.err

Т.е. одна машина у тебя будет управляющей, все остальные - воркеры, ssh ставится на любую ос, а благодаря wsl даже не придется заметно переписывать код

p.s. Почти наверняка задача требует доступ к данным, которые по сети могут не очень эффективно передаваться (да и многопоточный доступ к данным редко бывает эффективный) поэтому нужно продумать систему кеширования данных, в т.ч. заранее (в linux и windows есть механизмы, разные, с оговорками, иногда проще самому в коде этим заниматься). Результаты тоже нужно куда то записывать, если поток большой, то лучше пусть сначала, по возможности, данные собираются на машинах в сети, там где они получались, позже можно их собрать воедино.

p.p.s. настоятельно рекомендую делать так чтобы воркеры в данной реализации самостоятельно обрабатывали ошибки, вплоть до вывода в stdout/stderr, иначе разбирать кашу вывода parallel будет сложно

Answer 3 · 2023-08-01 07:18:09

Руслан Федосеев @martin74ua Куратор тега Системное администрирование

Linux administrator

https://ru.wikipedia.org/wiki/Distributed.net
поищите тут, или что то похожее.

Ответ написан более двух лет назад

Комментировать

Answer 4 · 2023-08-01 12:28:23

Я думаю что это надо согласовывать с руководством. Были случаи когда админы запускали всякие майнеры и прочее а потом за их действия "прилетало" компании. Сотрудники тоже рано или поздно поймут что на десктопе происходит что-то странное. Температуру и загрузку железа невозможно просто скрыть.

Вобщем не подставляйтесь.

Да ну и отвечая на вопрос. Что можно посмотреть в этом направлении.

- YARN https://hadoop.apache.org/docs/current/hadoop-yarn...
- Mesos https://en.wikipedia.org/wiki/Apache_Mesos
- Kubernetes уже упоминали выше.

Какой программой запустить распределённые вычисления на пользовательских рабочих местах?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт