Как посчитать сколько нужно видеопамяти для тренировки нейронной сети?

Question

Дмитрий @FerroPanda

Как посчитать сколько нужно видеопамяти для тренировки нейронной сети?

Есть ли где-нибудь информация при какой конфигурации НС сколько необходимо памяти в видеокарте для комфортного обучения нейронной сети? Или может кто-то смотрел насколько заполнена память при обучении вашей нейронной сети? Тогда хотелось бы увидеть - конфигурация сети, размер минибача при обучении и сколько это занимало памяти.

Цель сего - я только начинаю разбираться с нейронными сетями (Python+Keras). Планирую купить карту Нвидиа. На начальном этапе писать что-то сверхсложное не планирую, поэтому возник вопрос - есть ли смысл сразу гнаться за гигабайтами? Если типовые примеры из мниста или сифар-10 занимают не более 1-2 Гб при обучении, то смысла покупать карточку с 6-8-11 Гб для меня нету ... всё равно через год-полтора нужно будет апгрейдиться, а там уже и соответствующие карты "подвезут".
В принципе, самое сложное, что я сейчас вижу - входящий слой до 10к нейронов, скрытый слой до 30к нейронов с релу и выходящий слой 5-10 нейронов с софтмаксом. Размер обучающей выборки - 100к-500к примеров. Если кто-то может сказать, сколько оптимально под это нужно видеопамяти, буду благодарен. =)

Вопрос задан более трёх лет назад
3816 просмотров

5 комментариев

Подписаться 2 Простой 5 комментариев

Roman @myjcom

ssd вам нужен быстрый.
а то 500к строк из мнисты в винде грузить будете очень долго.

Написано более трёх лет назад
Roman @myjcom

10000 * 30000 * 10 = 3Gb это если по байтам считать.
double 4 байт
итого минимум 12 Gb при обучении. т.к при расчетах будут временные объекты.

Написано более трёх лет назад
Дмитрий @FerroPanda Автор вопроса

Роман, наверно 10к*30к+30к*10=итого 300 Мб
300*4байта=1,2 Гб
мниста имеет 50к строк, это мой пример до 500к.
Остаётся вопросом - в память грузятся минибатчи или "всё что влезет"?
И это всё прикидка на глазок... может у вас есть возможность запустить к примеру msi afterburner и обучение мниста, и посмотреть сколько реально съедается видеопамяти?

Написано более трёх лет назад
Roman @myjcom

FerroPanda, матрицу погрешностей забыли

может у вас есть возможность запустить к примеру msi afterburner и обучение мниста, и посмотреть сколько реально съедается видеопамяти?
сейчас нет

Написано более трёх лет назад
ivodopyanov @ivodopyanov

1. Для простых задач вполне CPU хватает.
2. На AWS, например, есть инстансы специально для машинного обучения. p3.2xlarge - это одна Tesla V100 с 16 Гб. Если делать spot instance, то выходит примерно $0.9/час. Если вы не собираетесь интенсивно 24/7 в течение нескольких месяцев обучать, то такой вариант бюджетнее.

Обучал на таком инстансе wav2letter. В память GPU модель не влезла, пришлось все веса в 4 раза сократить. Обучение заняло ~90 часов. Но это весьма хардкорная модель.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 170 просмотров
0

ответов
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 221 просмотр
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 147 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 119 просмотров
1

ответ
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 269 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 253 просмотра
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 137 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 141 просмотр
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 144 просмотра
0

ответов
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 123 просмотра
1

ответ
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

ssd вам нужен быстрый.
а то 500к строк из мнисты в винде грузить будете очень долго.
10000 * 30000 * 10 = 3Gb это если по байтам считать.
double 4 байт
итого минимум 12 Gb при обучении. т.к при расчетах будут временные объекты.
Роман, наверно 10к*30к+30к*10=итого 300 Мб
300*4байта=1,2 Гб
мниста имеет 50к строк, это мой пример до 500к.
Остаётся вопросом - в память грузятся минибатчи или "всё что влезет"?
И это всё прикидка на глазок... может у вас есть возможность запустить к примеру msi afterburner и обучение мниста, и посмотреть сколько реально съедается видеопамяти?
FerroPanda, матрицу погрешностей забыли

может у вас есть возможность запустить к примеру msi afterburner и обучение мниста, и посмотреть сколько реально съедается видеопамяти?
сейчас нет
1. Для простых задач вполне CPU хватает.
2. На AWS, например, есть инстансы специально для машинного обучения. p3.2xlarge - это одна Tesla V100 с 16 Гб. Если делать spot instance, то выходит примерно $0.9/час. Если вы не собираетесь интенсивно 24/7 в течение нескольких месяцев обучать, то такой вариант бюджетнее.

Обучал на таком инстансе wav2letter. В память GPU модель не влезла, пришлось все веса в 4 раза сократить. Обучение заняло ~90 часов. Но это весьма хардкорная модель.

Answer 1 · 2018-12-02 21:46:19

Сам отвечу. Необходимый объём памяти равен объёму обучающей выборки +ещё чуть-чуть. Если данных больше, чем объём памяти видеокарты, то падает производительность ядра, т.к. начинается постоянная подкачка данных из оперативной памяти в память видеокарты. Загрузка процессора видеокарты в таком случае падает в 2-3 раза, иногда больше.
Если у вас обучающая выборка 10+ Гб, то на 1060 возможно загрузка карты будет постоянная приближённая к максимуму. Т.е. проц не быстрый и успевает обработать то, что подгрузилось. Карта 1080 и выше в такой ситуации будет постоянно простаивать в ожидании данных, т.е. время обучения НС окажется условно одинаковым.
Если же объём выборки будет в районе 5-6 Гб или меньше, то 1080 окажется существенно быстрее.

Answer 2 · 2020-01-02 00:37:10

Завит от устройства на котором будешь обучать.
Размер обучайющей выборки обычно не сильно влияет, тк её можно делать частями, а вот модель может жрать значительно. Например на видео карке где процессы распараллеливаются - для вычеслений участки модели дублируются в памяти. Для процессора распараллеливание происходит в меньшей степени и потому модель меньше занимает данных. Дублирование данных модели необходимо потому что модель в памяти должна быть неизменна на протяжении всего процесса обучения, а вот то какими пачками ты будешь обучать модель уже меньше влияет на размер резервированной памяти

Как посчитать сколько нужно видеопамяти для тренировки нейронной сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт