Как обучить нейросеть на своих данных?

Question

jikhhe @jikhhe

Искусственный интеллект

Как обучить нейросеть на своих данных?

Хочу обучить GPT-модель на основе моих данных(переписок в телеграмме), что бы она умела поддерживать диалог, отвечать так же, как я бы ответил. Реально ли реализовать подобное, какие могут возникнуть сложности? Нужно ли будет вкладывать деньги? По поводу моих знаний, в программировании разбираюсь поверхностно, но есть опыт работы с ИИ.

Вопрос задан 21 июн.
936 просмотров

2 комментария

Подписаться 2 Средний 2 комментария

Василий Банников @vabka

По поводу моих знаний, в программировании разбираюсь поверхностно, но есть опыт работы с ИИ.

Если "опыт работы с ИИ" - это промпт-инжиниринг, то тогда будет тяжко.
1. Загугли, что такое fine-tune, посмотри, как примерно выглядят скрипты для файнтюна разных моделей, которые тебя интересуют.
2. В кошелёк залезть придётся, так как файтюн требует большего железа, чем запуск самой модели.

Написано 21 июн.
Evgeniy S @evgensenin

скорми ей все чаты которые по твоему мнению модель должна копировать более всего
попроси охарактеризовать твой стиль общения
составь системный промпт с несколькими примерами твоих диалогов
и проверяй, постепенно подгружай ее своими ответами, корректируй контекст
когда составишь этот начальный контекст, как бы заморозь эту точку (грубо говоря начальный набор messages) - от него и веди диалоги

Написано 23 сент.

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер машинного обучения

4 месяца

Далее
Skypro

Нейросети с 0

9 месяцев

Далее
Специалист.ру

Специалист по Data Science, машинному обучению и искусственному интеллекту

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

3 комментария

Дмитрий @TrueBers

они реально молодцы, openai потратили на пару порядков больше
ага, только если обойти цензуру дипсика и спросить кто он такой, он ответит, что он... ChatGPT! Реально молодцы, что тренировали свою модель на уже существующей, на которую уже потрачены деньги :D
а OpenAI в свою очередь тогда поднял цены на топовые модели свои до небес, понимая, что на них будут трениться всякие китайцы.

Написано 22 июн.
rPman @rPman

Дмитрий, естественно, так все делают

то что openai изначально зажали технологии и данные это на их совести(напомню что они некомерческая организация для создания безопасного ИИ) но после его создания они буквально насрали на весь мир

Написано 22 июн.
Steel_Balls @Steel_Balls

не "что бы", а ЧТОБЫ !

Написано 22 июн.

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Искусственный интеллект

Простой
Claude code vs codex?
- 1 подписчик
- 19 часов назад
- 108 просмотров
1

ответ
Искусственный интеллект

Простой
Как скормить весь проект нейросети (grok, chatgpt, deepseek) чтобы она понимала в нём и чтоб можно было просить ее доработать что -то?
- 1 подписчик
- 02 нояб.
- 283 просмотра
3

ответа
Adobe Photoshop

+1 ещё

Средний
Как выделить текст (шрифт) для последующего использования?
- 1 подписчик
- 02 нояб.
- 68 просмотров
1

ответ
Google

+1 ещё

Простой
Бесплатная альтернатива Gemini 2.0 Flash preview image generation?
- 2 подписчика
- 28 окт.
- 144 просмотра
2

ответа
Железо

+3 ещё

Простой
Какие есть готовые умные очки, которые можно прошить?
- 2 подписчика
- 15 окт.
- 316 просмотров
1

ответ
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 3 подписчика
- 14 окт.
- 700 просмотров
3

ответа
Видеокарты

+1 ещё

Простой
Выбрать ли RTX 3060 12 Гб или RTX 5060 8 Гб для бюджетного AI?
- 1 подписчик
- 01 окт.
- 534 просмотра
4

ответа
Искусственный интеллект

Сложный
Stable Diffusion генерит, а по итогу картинки нет, не показывает?
- 1 подписчик
- 29 сент.
- 101 просмотр
0

ответов
Искусственный интеллект

Средний
Как обучить нейросеть используя API от DeepSeek/ChatGPT?
- 1 подписчик
- 14 сент.
- 183 просмотра
1

ответ
Обработка изображений

+1 ещё

Средний
Возможен ли сегодня пакетный анализ изображений при помощи ИИ-моделей?
- 1 подписчик
- 02 сент.
- 139 просмотров
3

ответа
Показать ещё Загружается…

Product Designer

SUMMEET

от 1 000 до 1 200 $

React Native разработчик в VSRAP

VSRAP Shop • Санкт-Петербург

от 150 000 до 220 000 ₽

DevOps инженер

Data World • Москва

До 200 000 ₽

По поводу моих знаний, в программировании разбираюсь поверхностно, но есть опыт работы с ИИ.

Если "опыт работы с ИИ" - это промпт-инжиниринг, то тогда будет тяжко.
1. Загугли, что такое fine-tune, посмотри, как примерно выглядят скрипты для файнтюна разных моделей, которые тебя интересуют.
2. В кошелёк залезть придётся, так как файтюн требует большего железа, чем запуск самой модели.
скорми ей все чаты которые по твоему мнению модель должна копировать более всего
попроси охарактеризовать твой стиль общения
составь системный промпт с несколькими примерами твоих диалогов
и проверяй, постепенно подгружай ее своими ответами, корректируй контекст
когда составишь этот начальный контекст, как бы заморозь эту точку (грубо говоря начальный набор messages) - от него и веди диалоги

Answer 1 · 2025-06-21 21:43:12

По-простому, ответ — никак!

Формально можно, но по факту это будет создание своего ИИ почти с нуля (можно взять в пример опыт DeepSeek — вроде бы они всё расписали, порядок вложений — несколько десятков миллионов баксов, и хотя они “стояли на плечах гигантов”, они реально молодцы: OpenAI потратили на пару порядков больше).

Новые знания "заливать" в GPT-модель не получится! Почти любые попытки файнтюна приводят к деградации и фокусировке на конкретных знаниях (да, есть успешные примеры обучения ИИ на чатах — она отлично ловит стиль текста, но умнее от такого не становится, даже наоборот). Правильный файнтюн требует начальной обучающей выборки, есть алгоритмы прореживания данных, чтобы дообучать не на полном датасете, а только на его части и чтобы деградация была минимальной або отсутствовала.

Обучающую выборку ни одна компания с адекватными моделями не публикует (из-за жадности) — потому что для нейронки это и есть “исходники”, а итоговые веса для инференса — это как .exe-файл: работать работает, но что-то поменять не получится.

p.s. Файнтюн, а ещё лучше — алгоритмы RLHF, позволяют изменить формат представления данных, например, внедрить системный промпт в модель, чтобы при её итоговом использовании он не требовался (чтобы не тратить на него драгоценные токены). Это выглядит не так просто, как написано: нужно правильно составлять обучающую выборку и тюнить качественную модель-валидатор ответов (так, например, по словам разработчиков, "характер Алисы" от Яндекса был внедрён в её модель — все её ответы на вопросы о её предпочтениях, отношении к чему-либо и т. п.).

p.p.s. Чтобы показать, почему это сложно, проведите эксперимент: возьмите самую простую нейронную сеть, которая будет пытаться аппроксимировать какую-нибудь функцию, типа y=sin(x), дайте ей пару-тройку слоёв и визуализируйте процесс — выводя на экран исходную функцию и то, что строит сеть... А затем посмотрите, что получится, если взять обученную сетку и подсунуть ей другую функцию, пусть даже слегка модифицированную. Сеть начинает "сходить с ума", пытаясь забыть старые данные и воспринять новые... И оказывается, что обучить заново с нуля сеть на новых данных просто быстрее и дешевле, чем переобучать предыдущую.

Answer 2 · 2025-08-28 03:41:38

Начать со стилизации ответов без обучения (RAG + примеры из ваших чатов), а уже потом — дообучить компактную модель на тщательно подготовленных парах вопрос → ваш ответ. Можно по апи на клоде например. Деньги понадобятся на токены.

Как обучить нейросеть на своих данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт