Gorky
@Gorky
Веб-разработчик

Как сделать чат-бот на основе ИИ, обученный на собственной базе знаний?

Приветствую друзья.

Пару дней назад ко мне обратился товарищ, сказал что хочет сделать приложение/сайт для помощи другим людям в своей области (допустим для примера, он очень хорошо разбирается в ремонте). У него есть куча статей, видео и собственных относительно уникальных кейсов и методик, которые могут быть очень полезны другим.

Я программист и для меня не проблема в принципе сделать информационный сайт или приложение. Но основной его запрос был в том, чтобы поиск информации пользователем шел через общение с чат-ботом на естественном языке, условно как ChatGPT. Но соответственно с уникальными знаниями по нужной теме. А вот в теме нейронок ллм и прочего я как раз таки не разбираюсь от слова совсем.

Собственно вопрос, как помочь ему, как реализовать то что нужно без глубоких знаний или закапывания в тему? Желательно объяснить простыми словами и понятиями.

Например: "есть сервис xxx, он делает как раз то что нужно - загружаешь туда кучу своих текстов, оно там как-то обрабатывается, по апишке потом присылаешь любой вопрос от пользователя и получаешь ответ с учетом загруженных знаний. есть возможность гибкой настройки, хуки на определенные ключевики и тд"

Или например "оплачиваешь chatgpt, через api методом xxx загружаешь в него любые свои данные, методом yyy потом присылаешь вопрос и принимаешь ответ"

Не уверен можно ли здесь постить ссылки, но если можно, хочу поделиться тем что получилось найти самому в процессе гуглежа и чтения разных статей.

Сервисы: пока нашел три готовых сервиса, которые судя по описанию выполняют нужную мне задачу, но насколько они адекватны и гибки в плане подстройки под запросы клиента не совсем понятно, плюс они все платные, так что даже тестирование может встать в копеечку. Возможно кто-то с ними уже сталкивался и может дать комментарии?
https://olp.ru/chatbot/
https://dante-ai.com/
https://wikibot.tomleto.pro/

Инструкции: мне удалось найти очень мало текстов с конкретными пошаговыми действиями, в основном это либо объемная теория, либо что-то не подходящее по смыслу, либо разная перепечатка одного и того же подхода, в котором используется chatGPT + LlamaIndex (GPT Index) на питоне. Вот для примера: https://toadmin.ru/%D0%BA%D0%B0%D0%BA-%D0%BE%D0%B1...
Я пока не пробовал реализовать написанное, так что опять же вопрос к знатокам, можете посмотреть и прокомментировать, насколько это хороший способ или можно сделать лучше/проще? Или это вообще не то.

Вообще, с радостью приму любые мысли, идеи и комментарии по теме с огромной благодарностью. Напоминаю, я кодер (фронт-бэк на php/js/mysql), но при этом в нейросетях вообще не разбираюсь, поэтому если ваш ответ не будет полностью состоять из специфических терминов, высшей математики и всяких векторов, матриц, контуров и кластеров, т.е. будет доступен для понимания среднестатистическому хомо сапиенс, я опять же буду очень благодарен.
  • Вопрос задан
  • 1417 просмотров
Пригласить эксперта
Ответы на вопрос 3
Maksim_64
@Maksim_64
Data Analyst
Есть ощущение, что вы ожидаете очень сложного ответа, а ответ очень прост. Нет никакой математики в этой задаче, так же нету в этой задаче и архитектуры нейронных сетей. Есть лишь только работа с API, что оно предоставляет, таковы и возможности. Если бы мне нужно было решать такую задачу, я бы открывал статьи на medium (открывается с vpn) и естественно смотрел бы в стороны платных статей и от них бы отталкивался, потому что там множество пошаговых гайдов высокого качества для создания чат-ботов на базе GPT ( предполагаю вы свободно владеете английским).
Ответ написан
@vitaly_il1
DevOps Consulting
Согласен с Максимом - заставить это заработать в принципе несложно. Нюансы могут быть при тонкой настройке.
Я не спец в AI, а DevOps. Но недавно заказчик попросил поднять приватный "ChatGPT" с его страшно секретными документами. Я использовал клон https://github.com/imartinez/privateGPT. Работает в целом.

Что искать в гугле для загрузки доеументов в chatgpt - например "chatgpt my documents" .
Ответ написан
Комментировать
@Kakagawa
Ответ очень прост) Вот пример реализации похожей задачи со своей базой данных - https://www.youtube.com/watch?v=9AXP7tCI9PI
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы