Задать вопрос
@mmserebryakov

Ресурсы для Apache Spark?

Всем привет! Поделитесь пожалуйста своим опытом, лучшими практиками как вы устанавливаете ресурсы для spark джобов, На какие параметры вы смотрите(например сколько весит таблица источник, сколько в ней записей) Интересует следующие параметры:
spark.driver.cores: 2 (для чего на драйвере 2 ядра, если драйвер вычисления не производит)
spark.driver.memory: '2g'
spark.executor.instances: 2 (кол-во хостов)
spark.executor.cores: 2 (кол-во ядер на каждой машине)
spark.executor.memory: '10g' (кол-во памяти на каждой машине)
Как учитывать ресурсы если еще будет загружать с партиционированием?
  • Вопрос задан
  • 141 просмотр
Подписаться 2 Средний Комментировать
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Специалист по Data Science
    13 месяцев
    Далее
  • Яндекс Практикум
    Аналитик данных расширенный
    12 месяцев
    Далее
  • Яндекс Практикум
    Специалист по Data Science плюс
    17 месяцев
    Далее
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы