Как быстро войти в тему разработки ChatGPT, LLM Agent и т.п.?

Question

Дмитрий Васильев @DmitryVasiliev

ChatGPT

Как быстро войти в тему разработки ChatGPT, LLM Agent и т.п.?

Хочу попробовать себя в разработке приложений на базе LLM, но не знаю с чего начать. В сети масса разрозненной информации, которую пока не получается собрать воедино. Подскажите, какой стек технологий стоит использовать, как настроить взаимодействие компонентов между собой? Может быть есть ссылки на какие то практические курсы? Желательно все настроить локально.

Для определенности, возьмем для примера такую задачу:
Есть отдел продаж, который совершает телефонные звонки, имеются записи этих звонков. Необходимо их анализировать в (полу)автоматическом режиме и ставить оценку менеджеру с комментариями о плюсах и минусах проведенной беседы. В качестве дополнительной информации для оценки можно использовать базу часто задаваемых вопросов, скрипт звонка, список тем, которые менеджер должен был проработать.

Сейчас я могу распознавать запись локально с разбиением по спикерам с помощью Faster-Whisper-XXL
Так же локально поднял ollama, для экспериментов использую LM Studio, AnythingLLM, пробую разные модели доступные на Hugging Faces. Поддержку RAG не сделал, оценку звонка сделать удалось, но результат слабоват. И все пока в ручном режиме.

Как упаковать все это в готовое локальное решение?
- Передаем в систему запись звонка
- Вызываем внешний процесс для распознавания речи
- Передаем распознанную речь в модель для оценки
- Выводим результат распознавания и результат оценки

В какую сторону копать, какие инструменты использовать, какие курсы мне помогут в реализации чего то подобного?

Вопрос задан 15 февр.
253 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist: расширенный курс

13 месяцев

Далее
Яндекс Практикум

Инженер машинного обучения

4 месяца

Далее
Skillfactory

Профессия Data Scientist

24 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

VPN

+2 ещё

Средний
Почему ChatGPT не пускает с прокси?
- 1 подписчик
- 05 окт.
- 817 просмотров
2

ответа
Google Play

+1 ещё

Средний
Как скачать ChatGPT из Google play?
- 2 подписчика
- 08 сент.
- 886 просмотров
0

ответов
VPN

+1 ещё

Простой
Какой хостинг выбрать для доступа к нейросетям(openai, gemini, grok)?
- 3 подписчика
- 11 авг.
- 2034 просмотра
5

ответов
API

+1 ещё

Средний
В чем ошибка open ai api response?
- 1 подписчик
- 25 июл.
- 112 просмотров
0

ответов
ChatGPT

Простой
Подписка на ChatGPT в РФ?
- 2 подписчика
- 24 июл.
- 1076 просмотров
2

ответа
Android

+2 ещё

Средний
Как отвязать устройство от ChatGPT?
- 2 подписчика
- 07 июн.
- 833 просмотра
2

ответа
ChatGPT

Простой
Обнаружила что очень мало литературы по LLM?
- 2 подписчика
- 30 апр.
- 488 просмотров
1

ответ
ChatGPT

Простой
Почему Chat GPT возвращает 1 результат вместо 2-х?
- 2 подписчика
- 21 апр.
- 623 просмотра
0

ответов
ChatGPT

Средний
Почему OpenAI сообщает о неподдерживаемой стране?
- 1 подписчик
- 29 мар.
- 834 просмотра
1

ответ
AIOgram

+1 ещё

Простой
Тема: телеграм бот с ChatGPT, несколько вопросов?
- 1 подписчик
- 26 мар.
- 373 просмотра
1

ответ
Показать ещё Загружается…

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Аналитик-разработчик (команда Intelligent Search)

Сбер • Москва

от 250 000 до 400 000 ₽

UI Designer

IT Force

от 80 000 до 150 000 ₽

Answer 1 · 2025-02-15 23:44:52

Разве эта задача решается легко? а как ее решали до сегодняшнего дня? что является критерием оценки качества беседы?

У тебя вроде все указано нужное - whisper получает текст, может с временными метками (хз что такое faster-whisper-xxl, есть есть официальная утилита на python - pip install whisper в консоли задаешь модель и кучу параметров и получаешь текстовый файл).

Результат слабоват, потому что инструменты такие. Выбирай по умнее. И не забывай, что с русским языком локальные ИИ работают значительно хуже чем с английским (или если это qwen еще и китайский).

Не пытайся решать задачу одним промптом. Набрасывай на проверяемые данные несколько промптов, по очереди (не одним чатом, а каждый раз заново). Кстати есть замечание, разные сети по разному реагируют на размещение вопроса перед данными и после (есть соблазн размещать данные в начале, потому что тогда работает кеширование и входной текст не обрабатывается заново), т.е. можно данные+вопрос и вопрос+данные

а еще бывает вопрос+данные+фразы_помощники типа 'глубоко вдохни и подумай шаг за шагом', 'ты уверен, а если подумать еще раз', 'и какой будет твой окончательный ответ' а так же извлечение строгого ответа из ответа в свободной форме, ведь если сразу ограничить формат ответа, то качество будет хуже..

еще есть совет, делать несколько прогонов одной и той же задачи и смотреть, как будут отличаться результаты, если гулять сильно, значит повод задуматься об изменении подхода или алгоритма.

Добавь сюда ручную проверку человеком (например случайные результаты проверки) и сохраняй в табличку для анализа, как часто ИИ ошибается и в каких случаях, поможет тюнить промпт и вообще следить за тем бардаком, что вытворяет ИИ.

upd. настоятельно рекомендую использовать 70b модели (та же qwen или llama3.3 например). При использовании младших моделей, старайся не использовать квантизацию, она их ломает сильнее чем для старших версий... используй 8bit, не меньше.

Мне нравятся модели deepseek distilled qwen 14b или 32b? 14b с полным контекстом можно запустить на 2x16gb nvidia 4060ti, при этом рекомендую использовать vllm а не llama.cpp (каждая стоит 50т.р. дешевле ну просто некуда) на скоростях с батчингом до тысячи tps (16 параллельных запросов мне давали 800tps ну а vllm при запуске обещал 31k tps)... внимание, промпты и ответ только на английском, но русский вроде понимает

Как быстро войти в тему разработки ChatGPT, LLM Agent и т.п.?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт