Задать вопрос

Как решить задачу определения равномерности загрузки кластера?

Запускаем в разных клиентских окружений несколько аналитических расчетов на кластерах из поднимаемых на время облачных машин.

Хочется по-умному подойти к вопросу эффективности утилизации ресурсов.
В распределенных вычислениях очень важно, чтобы не было ситуации, когда одна машина делает работу, а все остальные ее ждут.

Задачу можно представить формально:
Сравнивая графики утилизации некоего ресурса (к примеру, CPU) каждой из кластерных машин, можно вывести коэффициент равномерности загрузки. Если графики утилизации у всех машин примерно совпадают, можно сделать предположение, что такой кластер более эффективно распределяет нагрузку, по сравнению с ситуацией, когда графики утилизации совпадают хуже.

61f66c3984f43532655288.png

Получив для каждого запуска расчета такой индекс эффективности, можно значительно улучшить понимание того, какой расчет стоит улучшать в первую очередь.

Перед тем, как начать самим придумывать такую библиотеку, хотелось бы узнать, есть ли в природе проекты, решающие такую задачу? Идея не выглядит как что-то экстраординарное.
  • Вопрос задан
  • 196 просмотров
Подписаться 4 Средний Комментировать
Пригласить эксперта
Ответы на вопрос 2
dimonchik2013
@dimonchik2013
non progredi est regredi
проектов нет - ибо программисты пишут корректный алгоримтически и программно грамотный код

пишут же?

а так - APM сервисы, new relic и иже с ними

посмотрите на cpu benchmark и просто разные бенчмарки - нет и не может быть чего-то априорно оценивающего производительность софта на заданном железе - всегда практика оказывается иной
Ответ написан
angrySCV
@angrySCV
machine learning, programming, startuping
ну вобще этим занимаются специалисты которые разрабатывают задачи для спарка.
поидее, после разработки и запуска задачи, такой специалист может зайти в спакЮИ и посмотреть распределение ресурсов, например оценив время работы у разных тасок.
Есть и другие подходы, но в любом случае этим должен заниматься тот кто задачу для спарка разрабатывает, тк просто знать что у вас не равномерно распределены ресурсы, без такого человека бессмысленно, а у этого человека и так уже есть инструменты для оценки равномерности распределения ресурсов.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы