Какая модель LLama лучше для использования в telegram?

Question

Stung @Stung

Программист

Какая модель LLama лучше для использования в telegram?

Здравствуйте!
Я бы хотел узнать, могут ли модели Llama принимать несколько запросов от пользователей и выдавать свой ответ как chatgpt.
Если не трудно, можете ответить на вопрос предоставив информацию по определенной модели, и как это может быть реализовано, в telegram для обработки и ответа на запросы пользователя.
Спасибо!

Вопрос задан более двух лет назад
252 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

SMM-продвижение в Телеграме

1 месяц

Далее
GB (GeekBrains)

Интернет-маркетолог

12 месяцев

Далее
Skillbox

Профессия Интернет-маркетолог + ИИ

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MacBook

+2 ещё

Простой
Mac для машинного обучения, стоит ли брать?
- 1 подписчик
- вчера
- 246 просмотров
3

ответа
Веб-разработка

+2 ещё

Средний
Как создавать нормальный B2B SaaS? Есть ли какие то ру курсы/литература? Насколько углубленные знания языка программирования должны быть?
- 2 подписчика
- 16 июл.
- 186 просмотров
6

ответов
Telegram

Простой
Какие существует способы вывода звёзд с тгк?
- 1 подписчик
- 15 июл.
- 218 просмотров
0

ответов
Telegram

Простой
Есть ли шансы востановить аккаунт Telegram?
- 2 подписчика
- 14 июл.
- 414 просмотров
1

ответ
Telegram

+1 ещё

Простой
Как создать конкурс в телеграм со своим текстом в кнопке?
- 1 подписчик
- 07 июл.
- 94 просмотра
1

ответ
Telegram

+1 ещё

Средний
Схема в Telegram: «медсестра», звонок на номер и «авторизация пройдена», затем просят СНИЛС. Как это работает?
- 1 подписчик
- 03 июл.
- 566 просмотров
4

ответа
Боты

+1 ещё

Простой
Как создать бота ВК на иностранных мозгах?
- 1 подписчик
- 30 июн.
- 265 просмотров
2

ответа
Обработка изображений

+1 ещё

Простой
Через какой ИИ можно массово редактировать изображения?
- 2 подписчика
- 30 июн.
- 429 просмотров
3

ответа
Telegram

Простой
Платный прокси сервер для Телеграмма MTProto или собственный сервер — что сейчас лучше?
- 2 подписчика
- 25 июн.
- 6031 просмотр
1

ответ
Telegram

+1 ещё

Простой
Где можно дать старт рекламы телеграмм бота?
- 1 подписчик
- 24 июн.
- 166 просмотров
0

ответов
Показать ещё Загружается…

Answer 1 · 2024-05-11 09:58:09

Какая? llama3-70b наилучшая из открытых (те что можно запустить у себя), или command r+. Так же хорошие открытые модели основанные на mixtral (mixtral-8x22b). llama3-8b тоже не плохая для своего размера (запустится на 8-16Gb десктопных видеокартах).
https://chat.lmsys.org/?leaderboard

Llama это модель, она ничего не может, это файл на диске. Для того чтобы модель работала тебе нужна программа, например с гитхаба официальный пример на python (он очень простой, там буквально 5-10 строчек)

Не рекомендую прямо в боте telegram вставлять работу с gpt, т.е. это можно и даже будет работать но помятуя что у gpt высокие требования к железу (оперативная память) это будет не эффективно.

Готовый сервер идет в поставке с llama.cpp (запросы api по http), он же умеет обрабатывать одновременно несколько запросов (по умолчанию 10 одновременных потоков кажется) так же есть возможность самому собирать запросы в пакет и отправлять одним запросом в сервер, он все обработает и вернет, и по скорости это будет быстрее чем каждый по отдельности (особенно когда работа на gpu).

Программирование ботов gpt - это придумывание запросов на естественном языке, которые дополняются данными от пользователей или еще какими (например обычный запрос в классическую базу, вываливая в промп тупо текстом, к примеру csv форматом). У тебя ограниченное количество ресурсов, маленькое окно контекста (у llama это 8к токенов) и в попытке все туда уместить и приходится что то поверх городить. тупой пример - если ты будешь весь чат пихать в контекст, уже через 20-30 сообщений он переполнится, и нужно будет принимать решение что и как выкидывать.

А еще llama любит отвечать лишнее, т.е. ты ее просишь ответь числом, а оно отвечает - ваш ответ 3... вот эти 'ваш ответ' нужно как то выявлять. А еще модели лучше работают, если просить их по рассуждать, она тебе даст рассуждения, тебе они нафиг не нужны, как из них результат вычленить? Иногда можно отделить мусор от ответа, попросив его дать в каком то формате, например дай ответ в формате json, а так как запрос к gpt это часть беседы в форме чата, можно дать часть ответа прямо в промпте, например "...assitent: {" тогда у модели не останется варианта как сразу фигачить json.

Но чем больше ограничений ты даешь модели тем хуже ее качество ответов.

У llama.cpp есть механизмы задания gramma формата ответа, какие токены предпочтительнее и в каком формате, говорят не идеально реализовано (например не получится задать варианты ответов списком слов типа отвечай только название цвета 'красный', 'зеленый', 'желтый', 'другое',..)

Какая модель LLama лучше для использования в telegram?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт