Какие могут быть возможные причины изменения ответа LLM на один и тот же запрос?

Question

yMad @yMad

Нейронные сети

Какие могут быть возможные причины изменения ответа LLM на один и тот же запрос?

К примеру, имеется LLM в виде двух чат-ботов от тех же Google и OpenAI. Они естественно уже обучены и выпущены для использования конечным потребителем, т.е. в данный момент с этими чат-ботами общаются сотни тысяч пользователей.
1. Так же имеется некий запрос, каждый раз он абсолютно одинаков, и каждый раз он вводиться в новом, чистом чате, что б исключить влияние контекста. В результате на этот запрос чат-бот выдает некий ответ, раз от раза, т.е. с каждым повтором запроса, в этом ответе меняются слова и их порядок, число вариаций ответа небольшое, но общий смысл ответа не меняется.
Интересуют возможные причины, такого перефразирования ответа от LLM?
2. Допустим что запрос не меняется, и условия ввода запроса тоже остаются без изменений, это новый чат каждый раз для одного и того же запроса. При этом LLM теперь дает абсолютно новый !!ПО СМЫСЛУ!! ответ, нежели ранее.
Возможны ли какие то иные причины такого СМЫСЛОВОГО изменения ответа, нежели в какой то момент проведенное вышеупомянутыми IT гигантами дообучение LLM?

Вопрос задан более года назад
345 просмотров

Комментировать

Подписаться 3 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

Комментировать

11 комментариев

yMad @yMad Автор вопроса

Новый релиз, разве по сути не есть дообучение?

1. Ранг источника, что это? можно подробней?

Написано более года назад
Максим Припадчев @Maksim_64

yMad, LLM осуществляет поиск информации в интернете, ранг источника это рейтинг. Релиз может в себя включать дообучение, а может и не включать. Просто новых фич добавили и новый релиз. Дообучение это новые тензоры весов в нейронной сети.

Написано более года назад
rPman @rPman

Максим Припадчев, максимально ошибочная формулировка

Написано более года назад
Максим Припадчев @Maksim_64

rPman, ерунду не пиши под моими ответами на будущее.

Написано более года назад
yMad @yMad Автор вопроса

Максим Припадчев, понял тебя.
Однако, если исключить, дообучение, генератор СЧ, ранг источника, историю которая есть контекст, лайф оценки, возможно что то еще что может повлиять на смысловое изменение ответа LLM при тех же вводных что были до этого смыслового изменения ответа? Возможно ли что исключив всё очевидное останется что то неочевидное, вроде пересечения каким то образом внутри нейросети запросов от всех пользователей, так что они могут пусть и незначительно но оказывать влияние на ответы друг друга от LLM?

Написано более года назад
Максим Припадчев @Maksim_64

yMad, посмотри на ответ Rsa97
В каком-то из вариантов добавленное слово может изменить контекст настолько, что дальнейшее продолжение будет ложью - LLM галюцинирует.
он глубже чем может показаться, он приводит экстремум этого поведения то что называют "галлюцинациями", но это экстремум в обычных случаях это может вести в том числе к измененным вариациям ответа. Работа таких больших моделей имеет стохастическую природу на многих уровнях, они в принципе не гибки в своей настройке.

Написано более года назад
yMad @yMad Автор вопроса

Максим Припадчев, значит осталось только максимально исключить, уменьшив время до минимума) Спасибо за..

стохастическую природу на многих уровнях

Просто не хочется необоснованной фантастики и пафоса, нужны основания, хотя бы что нейрон суммирует входящие значения от нескольких пользователей.

Написано более года назад
rPman @rPman

@Maksim_64

LLM осуществляет поиск информации в интернете
никаким боком тут этого нет, поверх llm есть несколько продуктов, которые с помощью RAG докидывают в контекстное окно потенциально полезную информацию (типа макрософтовский bing copilot в chatgpt и как самостоятельный продукт, или боты coze, плюс совсем отстойные реализации у других, типа сберовского гигачата) и все это делают очень отвратительно, скорее всего из-за экономии денег (качественная реализация получится дорогой)

При обучении использовалась информация из интернета, собственно это и есть то что сделано llm-ки такими хорошими - обучение на мусорных данных без их разметки. Дальше там идет генерация этих данных и конечно технологии типа RLHF, когда уже обученная сетка тюнится на серии вопрос-ответ (дает хороший буст в качестве но с кучей ограничений - информации этот способ не добавляет), в этом случае качество датасета вопросов кстати наиважнейшее, и его сбор становится очень дорогим, на столько что есть кому заплатить таким проектам как lmsys, или то что дало возможность openai продвинуться вперед с gpt35 до gpt4, за счет сотни миллионов пользователей и их вопросов.

Сам finetuning моделей не добавляет информации, точнее не так, добавление новой информации ломает модель и делает ее хуже. Правильное дообучение должно содержать очень строго выверенную часть изначального обучающего датасета (в идеале всю) и даже это не гарантирует качественного результата. У нейронок есть отвратительная способность сваливаться в ловушки медленного переобучения (любых - это особенность алгоритмов обучения), когда новая информация требует на порядки больше времени обучения чем если бы та же информация была добавлена с самого начала.

llm-ки не ищут информацию внутри себя, это абсурд, я столько людей видел пытающихся с пеной у рта отстаивать эту бессмысленную идею без каких либо шансов и логики типа llm это БД. llm-ки строят внутри модель знаний и закономерностей, которые присутствовали в обучающей выборке, примерно как человеческая память, на любую информацию идет попытка сохранить ее не как факты, а как алгоритм ее создания (через структуры на основе весов в нескольких рядом стоящих слоях). Собственно вопросом является, когда нейронка пытается принимать решения на основе запомненной информации, она для этого пользуется новыми структурами (грубо говоря дважды запомнила информацию, один раз как якобы факт а другой раз для принятия решения) или строит взаимные структуры... кажется mistral публиковали работу на тему поиска тех самых весов, отвечающих за конкретные знания.

Новые версии llm-ок это не только обновление обучающего датасета, но и алгоритм (pipeline) обучения. Там уже давно не упирается все в загрузил обучающие данные, нажал кнопку, получил готовую модель... нет там последовательный процесс, с пересозданием модели, с правкой алгоритмов, структуры, токенизера и кучи всего что нам на публично не известно.

Написано более года назад
rPman @rPman

Докину, у нейронок, любых, есть проблема - переобучаемость, когда вместо выявления закономерностей обучающего датасета, она тупо 'запоминает' фактические данные, собственно главный критерий остановки обучения нейронки - сравнение метрик на обучающей и тоестовых выборках, как только качество у первой растет без роста на второй, так пора останавливаться.

Так вот для llm-ок переобученность в локальном смысле (в пределах какого то одного 'признака'/'знания') модели может оказаться проще запомнить факт а не 'понять' его (т.е. не сможет сформулировать для себя применимость этого знания), и скорее всего это даже чаще всего и происходит, когда то это идет на пользу (когда нейронка умудряется цитаты из вики выдавать, особенно это полезно при паттерне запросов think step by step, тогда вываливаемые справочные данные работают как встроенный RAG, улучшая результат) но чаще просто занимает веса и отнимает ресурсы при обучении.

Такое запоминание можно наверное считать записью в базе данных, но с очень очень большими оговорками, больше как аналогия.

Написано более года назад
Максим Припадчев @Maksim_64

rPman,
максимально ошибочная формулировка
Взрослые люди умеют отвечать за свои слова, или извиняются. Аргументов я не увидел, одни эмоции.

Весь мир под LLM понимает полный набор сервисов, а не просто тензоры весов, которые выучены во время обучения.

1. Все большие LLM (конечный продукт )осуществляют в том числе поиск информации в интернете (процессируют их и формируют ответ).

2. Они берут информацию внутри себя. Конечно не ответы, их она генерирует. Оценки на ответы. Первым делом любая LLM формирует не ответ, а отвечает на вопрос на сколько чувствительная информация в вопросе, имеет ли право она в принципе отвечать и т.д.

3. Оценки доступны им лайф, у разработчиков есть возможность поставить красный флаг на тот или иной ответ, без переобучения.

Написано более года назад
rPman @rPman

Максим Припадчев,
Взрослые люди умеют отвечать за свои слова

Написано более года назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 85 просмотров
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 81 просмотр
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 160 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 284 просмотра
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 42 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 65 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 227 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 174 просмотра
2

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Стажер Моушен дизайнер для контента в соцсетях музыкального стартапа

Vocaberry

от 15 000 до 15 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Answer 1 · 2024-07-05 08:57:48

Это основа работы алгоритма llm gpt.
При выборе следующего токена ответа, алгоритм выбирает не тот что с большей вероятностью , это параметр temp=0 (это стабилизирует ответы но значительно ухудшает из качество) а с некоторым разбросом, чем выше temp тем больше разброс выбора и 'креативность' ответа, чаще это вода в тексте, так как с ней проще разнообразить.

На сколько я помню если нужно и temp выше 0,и стабильность, то фиксируй seed генератора случайных чисел...

Answer 2 · 2024-07-05 09:05:40

Причина в самом принципе работы LLM - он ничего не знает, ни о чём не думает, а только циклически подбирает слово, вероятно продолжающее предыдущий контекст. При этом берётся не всегда одно и то же продолжение, а одно из наиболее вероятных.
В каком-то из вариантов добавленное слово может изменить контекст настолько, что дальнейшее продолжение будет ложью - LLM галюцинирует.

Answer 3 · 2024-07-05 09:12:31

Дообучение - не происходит. Кроме новых релизов. Никакого лайф дообучения не существует.

LLM - должен имитировать интеллект, по этому он перефразирует один и тот же по смыслу ответ.

В тех случаях, когда LLM дает по смыслу другой ответ , то она это может делать по ряду причин:
1. Ранг источника на котором она формирует ответ, изменился понизился

2. Она может хранить историю этот пользователь уже задавал этот вопрос и потом задает его снова и снова, "значит ответ не устраивает".

3. LLM может получать лайф оценки на свои ответы, у каждого разработчика есть команды людей которые выставляют оценки ответам LLM, и она может получить низкую оценку и начать искать другой ответ, но это не имеет ничего общего с дообучением.

Дообучение - это очень дорого.

Answer 4 · 2024-07-05 10:28:00

Юрий @riky

Laravel

спросите его что такое температура (temperature) в контексте llm он вам объяснит :)

Ответ написан более года назад

Комментировать

Какие могут быть возможные причины изменения ответа LLM на один и тот же запрос?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт