Telegram-бот в сопряжении с нейросетью?

Question

Gilly34 @Gilly34

Telegram-бот в сопряжении с нейросетью?

Здравствуйте.
Нужен бот для беглого ознакомления с постами telegram-каналов.

Входные данные:
Пул из 30 конкретных телеграм-каналов

Задача:
1. Каждый новый пост сразу после его публикации нужно представить в кратком виде. Т.е. требуется ужать текст поста в один короткий тезис, передающий общий смысл поста, состоящий из 5-8 слов.
2.Далее эти тезисы нужно формировать в список, и каждый тезис сделать активной ссылкой (направляющей на соответствующий пост).

Первое очевидное и напрашивающееся решение - это бот в сопряжении с нейронкой.
Может кто посоветует оптимальную нейронку для данной задачи?
А в части написания бота, можкто даст пару ссылок на готовые блоки Telethon или TeleBot.
Может кому-то встречались решения в Pyrogram?

Буду благодарен за любые советы/подсказки))

Вопрос задан более двух лет назад
214 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+2 ещё

Простой
Стабильные биржи для обмена rub/btc с API / Telegram ботом?
- 1 подписчик
- 9 часов назад
- 51 просмотр
0

ответов
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 28 просмотров
1

ответ
Pyrogram

Простой
Как сделать, чтобы pyrogram корректно получал id чата и сохранял в бд для будущего использования?
- 1 подписчик
- 27 июл.
- 47 просмотров
0

ответов
Telegram

Простой
Есть ли рефаунд в тг боте?
- 1 подписчик
- 24 июл.
- 191 просмотр
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 46 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 44 просмотра
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- 22 июл.
- 128 просмотров
1

ответ
Python

+1 ещё

Простой
Есть ли кд на отправку подарков от имени бота?
- 2 подписчика
- 19 июл.
- 220 просмотров
1

ответ
PHP

+1 ещё

Простой
Почему телеграмм отправляем сразу несколько webhook?
- 2 подписчика
- 18 июл.
- 1192 просмотра
1

ответ
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 46 просмотров
2

ответа
Показать ещё Загружается…

Фулстек разработчик

Tramplin.PRO

До 200 000 ₽

Fullstack Node.js Developer / Backend разработчик

United Digital Solutions • Казань

от 250 000 ₽

Fullstack разработчик

Wanted

До 250 000 ₽

Answer 1 · 2023-05-31 18:15:53

99% работы тут анализ текстов, а уж интеграция с telegram дело десятое.

ДО публикации весов llama, я бы предложил изучить технологии вокруг LLM (большие языковые модели), RLHF (Reinforced Learning from Human Feedback - это если с конца заходить, лучшее что там есть), рекомендую видео Igor Kotenkov посмотреть, он как раз с сумаризации текстов зашел, рассказывая о существующих алгоритмах и способах их оценки.

Теперь же все это практически не нужно, достаточно взять готовую языковую модель со свойствами ИИ (например open assistent 30B) и поэкспериментировав с промптами, прогонять через нее статьи, разделяя их на абзацы (если размер их с промптом превышает 2к токенов, это примерно 1.5к слов).

Скорее всего у тебя будет несколько запросов на одну и ту же статью, с разными вопросами (особенно когда длины контекста хватает в притык, а значит пытаться вести общение в пределах контекста будет сложно, т.е. статья+запрос1+ответ+запрос2+ответ+...). У llama.cpp в библиотеках есть возможность сохранять контекст и моментально загружать его (в т.ч. mmap) для как бы моментального продолжения беседы с сохраненного места, в т.ч. к примеру так - формируешь промпт таким образом, чтобы текст статьи был в начале, а вопрос в конце, затем сохраняешь состояние сети и последовательно загружаяя его раз за разом, подставляешь с новыми вопросами, таким образом тратить ресурсы будешь только на эти вопросы, пример в save-load-state.cpp.

spoiler

После того как поиграешь с gpt4, модель от фейсбука конечно туповата, но посмотрев на стоимость первой, понимаешь, что с этим можно жить. Есть лайвхаки, как улучшить качество ответа от сети, дай возможность сети по рассуждать, универсальная палочка выручалочка let's think step by step в разных формулировках, дает возможность ИИ проанализировать в процессе генерации ответа тему, а потом следующим вопросом проси суммаризировать итоги... это активирует в т.ч. One/MultiShot техники, когда предварительными наводящими обсуждениями настроить модель на лучший результат, и автоматизирует процесс, когда не нужно гадать над примерами.

Само собой можно использовать модели от openai, gpt35 быстрые дешевые, когда данных мало, можно не тратить время и потратить считанные баксы чтобы обработать свой текст.

Настоятельно рекомендую переводить анализ в сторону английского языка, по возможности (буквально перевести на английский весь текст перед подачей в промпт, почитай комментарии к статье там есть пример открытых инструментов, например FB NLLB), правда если текст это общение а не вылизанные посты от ньюсмейкеров, то лучше в сыром виде модели скармливать, она так ошибки лучше переварит.

Telegram-бот в сопряжении с нейросетью?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт