Возможно ли написать свой chatGPT и как?

Question

riZe_0 @riZe_0

Возможно ли написать свой chatGPT и как?

В следующем году заканчиваю ВУЗ, и думал в качестве темы для диплома взять что-то связанное с chatGPT и сделать какую-нибудь простенькую реализацию. (Понимание нейронных сетей есть, но не скажу, что оно глубокое. С машинным обучением хорошо знаком)
Однако когда я начал гуглить обо всем этом, не смог найти какой-либо толковой информации, помимо того, что это self-supervised learning модель, работает на архитектуре transformer. Остальное - инструкция как писать промпт.
Самой реализации, или хотя бы подобного, я тоже не нашел.
Отсюда вопрос к людям, которые хорошо в этом разбираются. Возможно ли за год, или вообще, просто написать что-то похожее на chatGPT? И если да, то в какую сторону начать копать и что изучать?

Вопрос задан более года назад
306 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Нетология

Бизнес-аналитик

7 месяцев

Далее
Нетология

Data Scientist: расширенный курс

13 месяцев

Далее

Решения вопроса 3

2 комментария

riZe_0 @riZe_0 Автор вопроса

Спасибо за развернутый ответ!

Написано более года назад
rPman @rPman

riZe_0, забыл добавить, если все же возьмешься делать, вместо полнотекстового ИИ, попробуй сделать ... калькулятор, т.е. обучаешь его простым текстовым выражениям "123+432=", минимум токенов, простейший токенизатор, обучающие данные генерировать можно тупо налету, такая сетка на одной домашней видеокарте наверное за час будет готова... заодно запили исследование, зависимость количества ошибок от размерности чисел и гиперпараметров сети (количество слоев, размеры векторов токенизатора и т.п.), плюс сверху поизучай с какой скоростью такая сетка сходится, и что произойдет если ее обучать на 'вычислениях в столбик' (в догонку, дообучение вычитанию, если pretrained на сложениях, или к примеру определение или поиск следующего простого числа).

Если разберешься и сделаешь, вот уверен, это не просто на дипломную пойдет, а сразу приглашения в тематические компании страны (не думаю что кто то кроме сбера и яндекса в россии этим занимаются)

Написано более года назад

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- вчера
- 73 просмотра
0

ответов
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 72 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 73 просмотра
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 64 просмотра
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 96 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 79 просмотров
1

ответ
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 154 просмотра
0

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1325 просмотров
6

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 242 просмотра
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 275 просмотров
3

ответа
Показать ещё Загружается…

Senior Business Analyst

Уницифра • Краснодар

от 180 000 до 200 000 ₽

Senior Flutter Developer

Oggetto • Ростов-на-Дону

До 350 000 ₽

Middle Frontend-разработчик

Польза

от 120 000 до 160 000 ₽

Гуглил и ничего не нашёл? Невероятно. Тогда давай первый шаг без гугления. Берёшь один из самых годных учебников про нейросети на практике. Chollet, Deep Learning with Python. Там последняя глава как раз про генеративные нейронки - и про текст, и про картинки, и про реализацию. Учебник надо читать, а в процессе писать код и много гуглить. Похоже, круг замкнулся, для изучения темы придётся искать информацию в интернете, но всё равно попробуй.
Брось это. Ты вот даже спросить у нейросетей не догадался, нагуглить не смог.. Не твоё это.

Answer 1 · 2024-08-23 20:21:13

Для начала, llm-ки, начинают показывать свойства ИИ (т.е. начинают строить внутри себя модель, которая уже начинает себя как то вести а не просто синтаксически и даже логически обоснованный бредогенератор, т.е. хуже gpt35 если что) - это 10^26 flops вычислений, оценка приблизительная, когда читал про исследования на каких величинах это начинается, погрешность была на пару порядков. Мало того, десктопное железо тут не подходит, там требуется огроменное количество оперативной памяти GPU (про CPU даже не заикайся, на нем даже просто запуск - садомазохизм).

Посчитаю за тебя - одна современная видеокарта 4090 дает 80Тфлопс (даже пусть 100 но так неверно, потому что реалии на пару порядков хуже но проигнорируем это) это 10^14 операций в секунду, т.е. только чтобы однократно обучить одну llm (а это обычно делают много раз, меняя гиперпараметры и обучающие данные) тебе потребуется 10^(26-14) секунд или 10^12 секунд или 31709 лет на одной видеокарте... приобретая чуть больше видеокарт, процесс можно ускорить почти линейно (да там начинаются проблемы уже на тысячах gpu, но они решаются спец-железом, спец-алгоритмами и спец-специалистами, и главное первое и последнее с рынка как коровой слизали крупные компании)... к сожалению эта наиважнейшая и самая крутая технология нашего времени требует минимально для старта десятки миллионов баксов вложений а лучше сотни.

Но если все же хочешь взять готовое, разобраться и предоставить это как ваша работа то пожалуйста, гугл: gpt llm training from scratch detailed guide
первая же ссылка - https://youssefh.substack.com/p/training-gpt-2-fro...

Answer 2 · 2024-08-24 13:03:28

Можно рассмотреть тему файтюнинга, тема более реалистичная а самое главное, прикладная. Денег много не нужно, особенно для llama 8b и подобных по размеру моделей.

Тем не менее, по гпт все же есть варианты, можно очень хорошо разобраться тут, по сути посмотрев видео от самого разработчика:
https://www.youtube.com/watch?v=kCc8FmEb1nY

Answer 3 · 2024-12-18 14:19:41

смотри видео andrej karpathy youtube как он делал GPT-2. вот такого уровня реально будет попробовать сделать.

Answer 4 · 2024-08-23 17:58:22

Нет, тебе за год не написать, у тебя нет базовых знаний, максимум что ты осилишь, это переиспользование готовых решений.

Возможно ли написать свой chatGPT и как?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт