Как создать свой чат бот(дообучить модель) на базе собственных знаний(ссылок на ресурсы)?

Question

roseandhabr @roseandhabr

Как создать свой чат бот(дообучить модель) на базе собственных знаний(ссылок на ресурсы)?

Я далека от этих вопросов, но точно знаю что можно дообучать различные существующие модели нейросетей(chatgpt и др), а также если установить такие модели локально они будут работать без ограничений цензур и прочего(ничего незаконного не планируется, просто действительно чат боты на большинство адекватных вопросов упираются и не отвечают и промпты не всегда помогают), так вот, я знаю что из можно дообучить на основе каких-то датасетов(понятия не имею где их брать), а также брать за основу знания взятые с целых ресурсов просто указав список ссылок на них. не подскажите ли действительно ли это возможно, и если да, то как лучше всего это сделать? и все это естественно для приватного а не публичного или коммерческого использования.

Вопрос задан более года назад
1251 просмотр

1 комментарий

Подписаться 4 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Нетология

Бизнес-аналитик

7 месяцев

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 255 просмотров
1

ответ
Искусственный интеллект

Простой
Как скормить весь проект нейросети (grok, chatgpt, deepseek) чтобы она понимала в нём и чтоб можно было просить ее доработать что -то?
- 1 подписчик
- 02 нояб.
- 330 просмотров
4

ответа
Google

+1 ещё

Простой
Бесплатная альтернатива Gemini 2.0 Flash preview image generation?
- 3 подписчика
- 28 окт.
- 169 просмотров
2

ответа
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 122 просмотра
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 97 просмотров
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 87 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 72 просмотра
0

ответов
Железо

+3 ещё

Простой
Какие есть готовые умные очки, которые можно прошить?
- 2 подписчика
- 15 окт.
- 326 просмотров
1

ответ
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 3 подписчика
- 14 окт.
- 721 просмотр
3

ответа
VPN

+2 ещё

Средний
Почему ChatGPT не пускает с прокси?
- 1 подписчик
- 05 окт.
- 1261 просмотр
2

ответа
Показать ещё Загружается…

Разработчик плагина для Wordpress

TripShock Adventures

от 1 200 до 2 500 $

Senior Elixir Developer

Clickavia

от 3 000 до 4 000 $

Data Analyst

Clickavia

от 80 000 до 100 000 ₽

на базе собственных знаний(ссылок на ресурсы)
и в чём тут знания?

Просто приведи пример или два того что требуется искать.

Answer 1 · 2024-03-03 21:26:41

Предложил бы посмотреть в сторону технологии RAG. В двух словах - берём общецелевую LLM, например доступную llama, загружаем документы, содержащие ответы на потенциальные вопросы, в векторную бд, обучаем модель отвечать с использованием контекста из векторной бд. Отдельно обучать модель тоже можно, но получится намного дороже. Пример такого подхода для русскоязычных документов - https://github.com/mpashkovskiy/ru-rag.
Nvidia недавно выпустила такой комплект для своих карт RTX серий 30 и 40 под Windows 11 - https://github.com/NVIDIA/trt-llm-rag-windowsu

Answer 2 · 2024-02-25 12:49:02

первые же запросы с гугла (с поиском по хабру)
https://habr.com/ru/articles/755114/
https://habr.com/ru/companies/neoflex/articles/722584/
https://habr.com/ru/companies/wunderfund/articles/...
https://habr.com/ru/articles/757086/

Ключевые слова finetuning, peft модели llama, mixtral, google gemma (вышла буквально на днях, выглядит неожиданно хорошо для 2b/7b)
Напрямую обучать модель новым знаниям сложно, и дорого а датасет это ты сам собираешь. Есть лайфхак - какими либо способами, на основании контекста формируют запрос в классическую базу данных (например реляционную) делают поиск, а результат вставляют в окно контекста (добавив сопроводительный текст, описывающий это как знания, на которые нужно опираться) и в результате модель получив эти данные, будет их использовать (это самое странное и непонятное в llm-ках). Само собой ВСЕ данные пихать в окно контекста не имеет смысла, оно маленькое а в открытых моделях еще и слабосвязное.
Гуглим llm rag, например https://habr.com/ru/companies/wunderfund/articles/...

p.s. просто и красиво не будет
Технология llm сырая, точнее в ней баг в идеологии, подразумевающий вероятностный результат, т.е. правильный с некоторой вероятностью, которая даже у топовых моделях (не доступных для дообучения обывателю) в среднем на специализированных бенчмарках - 60%-80%, а те модели что доступны, дают верные результаты с с еще меньшей вероятностью.

Настоятельно рекомендую смотреть в сторону mixtral (для людей доступны модели 8x7b, работают по скорости как 7b а по качеству как 70b), инструкций по дообучению не густо, придется прогружаться в тему, при которой таких вопросов как выше не будут возникать, но односложно ответ не дать.

Как создать свой чат бот(дообучить модель) на базе собственных знаний(ссылок на ресурсы)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт