Как запустить обучение с deepspeed у себя на пк?

Question

ermak148 @ermak148

Как запустить обучение с deepspeed у себя на пк?

Надоело мне значит обучать свой gpt кусками на cpu по 5 часов в день (так как видеокарточка на 4 гига). Статьи про DeepSpeed утверждают, что на gpu можно положить в 10 раз больше параметров, нежели чем при обычном обучении, но внятного ответа на вопрос "как обучить gpt (или другие сети на pytorch) с помощью deepspeed на винде, а так же желательно получить обещанные 10xПараметров" не нашел
Везде либо статьи для линукса, либо различаются по принципу использования: huggingface в документации пишет про какой-то класс в трансформерсах, где то пишут про команду deepspeed "gpt2" "train.txt" (подобное). Ну и я никак не пойму, так как же все таки правильно запустить дипспид у себя на пекарне? (Если будете писать про то что 4 гига даже с дипспидом мало - то я вам отвечу, что в крайних случаях gpu хосты никто не отменял)

Вопрос задан более года назад
379 просмотров

1 комментарий

Подписаться 2 Средний 1 комментарий

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему консольная программа перестает работать спустя время?
- 1 подписчик
- 16 часов назад
- 106 просмотров
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 19 часов назад
- 53 просмотра
1

ответ
Python

Простой
Как делать удаленную печать на python?
- 1 подписчик
- 21 час назад
- 74 просмотра
2

ответа
Python

Простой
Как импортировать модуль из git?
- 1 подписчик
- вчера
- 115 просмотров
0

ответов
Видео

+1 ещё

Простой
Нейросеть для перевода видео?
- 2 подписчика
- вчера
- 242 просмотра
2

ответа
Python

+3 ещё

Простой
Как с помощью Kaspersky Security Center запустить скрипт?
- 1 подписчик
- 04 авг.
- 141 просмотр
0

ответов
Python

+2 ещё

Простой
Как в группе Telegram ответить скриптом на сообщение пользователя, на которое я отвечал сообщением, которое как раз таки запустило скрипт (telethon)?
- 1 подписчик
- 04 авг.
- 149 просмотров
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 131 просмотр
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 186 просмотров
3

ответа
Python

Простой
Почему у меня программа вообще не реагирует на свойства в python?
- 1 подписчик
- 02 авг.
- 212 просмотров
3

ответа
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

так же как обучить дипспидом модель на нескольких карточках?

Answer 1 · 2024-04-26 20:08:39

deepspeed это про обучение на кластере, т.е. вместо покупки одной дорогой серверной видеокарточки, ты поднимаешь кластер из дешевых десктопных и по уму должен получить экономию в деньгах.

Как запустить обучение с deepspeed у себя на пк?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт