Задать вопрос

OlegErmakov @OlegErmakov

нейронные-сети

Как распараллелить gpt?

Недавно для получения нового опыта решил полностью с нуля обучить модель GPT. Было решено обучить несколько моделей - 150m, 760m, 1.3B, 7B, 34B. С первыми двумя размерами модели все понятно, мой датасет поместится на видеокарточку полностью, а вот 1.3, 7 и 34B меня немножечко пугают. Почему? Потому что! Потому что
1. 34B даже сама модель на гпу не поместится
2. DataParallel не для меня. Сейчас все скажут "юзай датапараллел", а ведь если я буду использовать этот класс, то нужен DataLoader (что бы сделать батч), а данные у меня динамической длины (делаю instruct, что вы хотели), и если я не использую даталодер, а прохожусь циклом сразу по датасету (да я на голову отбитый обучаю без треинера), но загружена только одна видеокарта (я использую 2шт.)

Пожалуйста! Помогите!

Вопрос задан более года назад
1787 просмотров

Комментировать

Подписаться 6 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Нетология

Бизнес-аналитик

7 месяцев

Далее
Нетология

Data Scientist: расширенный курс

13 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 98 просмотров
0

ответов
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 81 просмотр
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 75 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 66 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 96 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 79 просмотров
1

ответ
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 156 просмотров
0

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1336 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 244 просмотра
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 277 просмотров
3

ответа
Показать ещё Загружается…

Golang Engineer в команду Отелло

2GIS

До 550 000 ₽

Personal Assistant с AI-фокусом (70% бизнес-задачи / 30% личные поручения)

Nexpanse Inc • Москва

от 200 000 ₽

HRD / People & Operations Manager (SaaS, AI)

Nexpanse Inc • Москва

от 450 000 ₽