Можно ли заставить LLama2 выполнять действия?

Question

Tokishu @Tokishu

А как?

Искусственный интеллект

Можно ли заставить LLama2 выполнять действия?

Рубрика «мысли в час ночи»
Я заинтересовался языковыми моделями по типу LLama, и задался вопросом, а можно ли помимо генерации текста заставить модель выполнять действия? К примеру обращаться к API, исполнять скрипты или подобное, если да есть ли гайды в инете?

Также доп вопросы
Можно ли сделать API для самой ламы? Чтобы я мог через апи к ней обращаться.

Вопрос задан более года назад
226 просмотров

1 комментарий

Подписаться 2 Простой 1 комментарий

Решения вопроса 2

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 1 подписчик
- 15 часов назад
- 70 просмотров
2

ответа
Видео

+1 ещё

Простой
Нейросеть для перевода видео?
- 2 подписчика
- 07 авг.
- 307 просмотров
2

ответа
Дизайн

+4 ещё

Простой
Чем генерировать текстуры материалов?
- 1 подписчик
- 02 авг.
- 148 просмотров
1

ответ
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 225 просмотров
3

ответа
Искусственный интеллект

Простой
Необходим инструмент либо схема (nocode) для поиска решений по доработке химических рецептов продуктов (не пищевых). Необходим пилот, кто сталкивался?
- 1 подписчик
- 14 июл.
- 107 просмотров
0

ответов
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 172 просмотра
2

ответа
Python

+1 ещё

Простой
Как тренировать Yolo, размер датасета, итоговый loss?
- 2 подписчика
- 13 июл.
- 1005 просмотров
2

ответа
Языки программирования

+1 ещё

Средний
Насколько TypeScript, C# и C++ способны заменить Python при разработке искусственного интелекта?
- 1 подписчик
- 12 июл.
- 198 просмотров
3

ответа
Python

+1 ещё

Средний
Как генерировать качественные изображения в stable diffusion используя python?
- 2 подписчика
- 05 июл.
- 441 просмотр
0

ответов
Искусственный интеллект

Простой
PHP+Postgres в Cursor?
- 3 подписчика
- 04 июл.
- 1222 просмотра
1

ответ
Показать ещё Загружается…

С++ developer

КОД ГРИН Инжиниринг • Санкт-Петербург

от 30 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Промпт-инженер/Prompt-инженер

Мособлгаз • Москва

от 250 000 до 300 000 ₽

Это ограничение делать только в LLama2 или другие то же подходят?

Answer 1 · 2024-04-07 03:43:00

И нет и, может быть, да. Помимо llama существует лучше модели, например mistral и основанные на нем типа openchat35 или лучше mixtral (он неожиданно умный и скорости как 7b) или или еще лучше от databrix (по скорости как llama30b).

У разработчиков языковых моделей например есть chat версии, есть instruct, а есть base. Общий смысл каждой определяется тем, на какое именно использование их заточили. Например instruct позволяет описывать инструкции на естественном языке и главное получать ответ тоже на естественном языке, со всеми вытекающими от сюда неудобствами (api предполагает стандартизацию форматов вывода). chat ожидает что с ним будут общаться в формате user: xxx, ну а base модели изначально работают только как completion, и их обычно дообучают до своих форматов и наборов знаний.

Кстати, к примеру модели, которые обучали программированию (а это почти все, ищи в бенчмарках HumanEval, потому что openai говорили что именно с этого начинали свою модель обучать и это очень было ей полезно), можно буквально попросить давать ответ в виде json, описав в промпте его формат и оно будет пытаться это делать, точно помню что прбовали за основу взять принцип - модель генерирует готовую программу, решающую вашу задачу, бакэнд ее запускает и выдает ответ и так на каждый запрос. Но чем глупее и проще модель, тем с большей вероятностью она будет отходить от строгого формата, а значит бакэнд приложение, которое будет обслуживать уже твой api должно ожидать эти расхождения и обрабатывать их не как ошибка (например лишнее текстовое описание типа "вот вам ответ в формате json: ...".

Так как llm это посимвольная (по токенам точнее) генерация ответа, на каждом из них, в момент когда происходит выбор следующего токена, можно вставить свой алгоритм, ограничивающий доступный список своими, по своему правилу. Например можно описать регулярное выражение, которое будет применяться к сгенерированному тексту плюс выбираемый токен и если оно не подходит, отказывать в выборе этого токена. Например какая то реализация этого есть в llama.cpp ищи grammar, это ключ у api вызова к server.

Использование llm это в первую очередь исследовательская работа, возможности языковых моделей иногда шокируют но часто раздражают. Например языковую модель научили играть в дум, причем максимально странным способом. Можно представить что описывая специфический запрос, можно заставить модель управлять роботом и т.п.

Есть общепринятые лайфхаки, повышающие качество ответа. Это добавление примеров (вопрос+ответ+вопрос+ответ+вопрос+...) т.е. one-shot/multi-shot, именно так слабые модели могут встать по бенчмаркам с zero-shot у сильных моделей, без примеров. Или попросить в запросе модель поразмышлять (think step by step), надавить на эмоции (найти ответ очень важно для меня, от этого зависит моя жизнь), ценой места в окне контекста. Еще есть подход, делать один и тот же запрос (или кстати слегка менять prompt) много раз, и сделать какой то механизм валидации ответа (например большая часть одних и тех же ответов считать верной) - как защита от галлюцинаций (был пример когда модель заставили миллион раз генерировать программу, запускать ее и проверять результат - так сделали реальное научное открытие)

НО! Просто не будет.

Answer 2 · 2024-04-07 12:37:48

1. API сделать можно - просто заверни обращение к модели в какой-нибудь fastapi

2. Саму модель ты не можешь заставить что-то делать - только научить "просить" сделать что-то.
Например можно научить генерировать запросы к какому-нибудь левому API, а со своей стороны - ты будешь читать эти запросы и отправлять их.

Можно ли заставить LLama2 выполнять действия?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт