Задать вопрос
@mmserebryakov

Ресурсы для Apache Spark?

Всем привет! Поделитесь пожалуйста своим опытом, лучшими практиками как вы устанавливаете ресурсы для spark джобов, На какие параметры вы смотрите(например сколько весит таблица источник, сколько в ней записей) Интересует следующие параметры:
spark.driver.cores: 2 (для чего на драйвере 2 ядра, если драйвер вычисления не производит)
spark.driver.memory: '2g'
spark.executor.instances: 2 (кол-во хостов)
spark.executor.cores: 2 (кол-во ядер на каждой машине)
spark.executor.memory: '10g' (кол-во памяти на каждой машине)
Как учитывать ресурсы если еще будет загружать с партиционированием?
  • Вопрос задан
  • 142 просмотра
Подписаться 2 Средний Комментировать
Помогут разобраться в теме Все курсы
  • МИПО
    Большие данные (Big Data) и интернет вещей (IoT)
    4 месяца
    Далее
  • Школа Больших Данных
    Практическое применение Big Data аналитики для решения бизнес-задач
    1 неделя
    Далее
  • Skypro
    Программирование для анализа данных с нуля
    9 месяцев
    Далее
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
от 210 000 до 260 000 ₽
Aston Санкт-Петербург
от 230 000 до 270 000 ₽
Aston Москва
от 200 000 до 230 000 ₽