Задать вопрос
@pch1
Новичок в программировании

Где хранится информация и откуда её берет нейросеть для ответа?

При программировании на phyton нейросети, что нужно подключать, какие базы знаний для формирования ответа и его выдаче, бесплатны ли они?... Или нейросеть откуда формирует ответ, где это хранится?
  • Вопрос задан
  • 1309 просмотров
Подписаться 3 Средний 3 комментария
Решения вопроса 2
В LLM собственно все данные в самой нейросети и хранятся (в весах), либо в контексте.
+ Можно заставить нейросеть генерировать "просьбы" о получении данных и парсить их, чтобы сделать запрос к сторонней апишке.
Ответ написан
Комментировать
@rPman
Добавлю, на основе нейросети, создали специальное (сложное) приложение chatgpt. которое позволяет подключать плагины, являющиеся источниками данных (подробно как именно openai обслуживает плагины не известно, есть только общие слова, так как решением о том когда вызывать плагин и какие данные в него слать принимает сама модель, но в этом и был смысл, ты не разрабатываешь приложение - ты описываешь его а модель сама разбирается по словесному описанию, как этим пользоваться).

Плагин это буквально классическое приложение с api, к которому будет обращаться chatgpt для наполнения данными вконтекст беседы (он тупо вставит возвращенные данные в беседу, но не покажет этого).

Таким образом chatgpt не только использует свою/свои большие языковые модели как память, но и позволяет использовать внешние источники информации причем максимально свободным образом, так будто там сидит человек и читает все что написано клиентом и разработчиком плагина и делает запросы.

p.s. напомню, gpt от openai и некоторые другие, могут одинаково хорошо работать как со структурированными данными так и со свободным текстом (ты можешь им json файлы слать, добавив к ним в начало выдержки из документации по их использованию) и попросить в ответ так же давать json, который уже можно будет отправлять 'тупым и устаревшим' приложениям, не умеющим думать но идеально отрабатывающим запросы в бд.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 3
Vindicar
@Vindicar
RTFM!
Окей, если объяснить на пальцах, то есть два варианта.
1. Собственные знания модели. Большие языковые модели, по сути, умеют только одно: предсказывать следующее слово по набору предыдущих. Почти все остальные задачи сводятся к этому. Так что веса модели - это описание офигительно сложной функции, которая описывает взаимосвязь между предшествующим набором слов и последующим словом. Все "знания" модели, таким образом, сводятся к ответу на вопрос "какое слово будет дальше с наибольшей вероятностью?" Отсюда вытекают и слабые стороны языковых моделей - они не понимают, что пишут, они просто пишут "по аналогии".
2. Retrieval Augmented Generation. Грубо говоря, в распоряжении модели есть база текстов, где каждому фрагменту сопоставлено некоторое описание его смысла. Модель использует такое же представление смысла слов в запросе, чтобы найти подходящие по смыслу фрагменты. Найдя эти фрагменты, модель строит ответ уже на основании фрагментов И запроса. Это не требует переобучения модели для добавления новых знаний, как в первом случае. Но будут проблемы, если фрагменты слишком длинные или их слишком много.
Ответ написан
Комментировать
mayton2019
@mayton2019
Bigdata Engineer
В самой нейросети. Нейросеть - это и есть память. Она конечно загадочным образом сочетает
в себе и память и процессинг но в этом вся идея.
Ответ написан
Комментировать
saboteur_kiev
@saboteur_kiev
software engineer
Для генеративной нейросети нужна определенная база данных, которая хранит не только данные, но и связи между ними.
Собственно от качества этих связей и алгоритма их создания и использования и зависит результат нейросети.
Поэтому сперва нужно набрать данных.
Затем нужно сгенерировать "модель" - то есть связи между этими данными.
Естественно чем больше база, тем лучше. Чем качественнее сгенерирована модель - тем умнее нейросеть.
Самое банальное - руками проставляются теги. Сложнее - проставляются простые теги более сложные связи алгоритм генерирует сам на базе этих тегов, так создается модель.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы