Как определить смысл пользовательского ввода используя семантику или нейронные сети?

Question

Артем Вишневский @Tema_man

Как определить смысл пользовательского ввода используя семантику или нейронные сети?

Привет всем! В этом вопросе я чайник, поэтому прошу помощи.

Задача такова: Есть некоторый бот, который выдает пользователю текст и ожидает от пользователя определенного ответа, этот ответ может быть изложен в любой форме. Бот должен как-то обработать этот текст и понять ту ли информацию ему сообщили или нет.

Например: Бот просит пользователя сообщить ему какой-нибудь факт, скажем какова высота эвереста?
возможные ответы:
- 8842м
- Я точно не помню, около 9 км.
- 9669 ярдов
- Эверест? Что это такое? =)
... и т.п.

Соответственно бот должен иметь возможность обучатся.

Какие варианты для решения можно использовать? Похожее решение используют чат боты, но мне не удалось найти ни одного внятного описания принципа их работы, а уж тем более какого-то кода (буду благодарен за ссылки).

Если использовать нейросети, то каким образом можно нормализовать текст? Спасибо!

Вопрос задан более трёх лет назад
443 просмотра

Комментировать

Подписаться 4 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

ИИ в медицине: как использовать в работе каждый день

8 недель

Далее
Академия Эдюсон

Нейросети в строительстве

2 месяца

Далее
Бруноям

ИИ-агенты и n8n

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

4 комментария

Артем Вишневский @Tema_man Автор вопроса

=) Да, это самый простой вариант, но он не может самообучаться.

Написано более трёх лет назад
Александр Вульф @mannaro

Артем Вишневский: ну почему же. Добавляете в последний массив новые данные - это и есть обучение. Если вопрос о самообучении, то тут надо просто получить выборку из Х элементов, найти похожие и если их больше Y штук, то создать регулярку, чтобы подходила под все эти Y вариантов и записать ее в конец.

Написано более трёх лет назад
Артем Вишневский @Tema_man Автор вопроса

Хм... не совсем понял как вы предлагаете реализовать самообучение. Можете пример привести?

Написано более трёх лет назад
Александр Вульф @mannaro

Артем Вишневский: если только вечером, сейчас нет времени (:

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 73 просмотра
1

ответ
MacBook

+2 ещё

Простой
Mac для машинного обучения, стоит ли брать?
- 1 подписчик
- вчера
- 264 просмотра
3

ответа
Веб-разработка

+2 ещё

Средний
Как создавать нормальный B2B SaaS? Есть ли какие то ру курсы/литература? Насколько углубленные знания языка программирования должны быть?
- 2 подписчика
- 16 июл.
- 194 просмотра
6

ответов
Нейронные сети

Простой
Как решить проблему с генерацией видео в Kling AI?
- 1 подписчик
- 09 июл.
- 79 просмотров
1

ответ
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 152 просмотра
2

ответа
Боты

+1 ещё

Простой
Как создать бота ВК на иностранных мозгах?
- 1 подписчик
- 30 июн.
- 267 просмотров
2

ответа
Обработка изображений

+1 ещё

Простой
Через какой ИИ можно массово редактировать изображения?
- 2 подписчика
- 30 июн.
- 432 просмотра
3

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 511 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Нейронные сети

Средний
Как в AI ToolKit для тренировки LorA указать свои модели?
- 1 подписчик
- 09 июн.
- 74 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2015-12-14 14:57:13

Хехе, чат боты работают по такому принципу:
["какова высота эвереста?", ["8842 ?(m/м)", "9 ?(km/км/киломе*)", "9669 ?ярд*"]]
Где arr[0] - вопрос, arr[1] = answers - возможные ответы, где answers[i] - регулярное выражение для парсинга ответов.

Answer 2 · 2015-12-22 16:18:24

Если главная задача бота - определить, правильный или нет ответ на вопрос (y=1 или y=0),
то это задача классификации.
Для обучения нужно на входе иметь наборы (для несколько результатов измерений)
из одной или несколько переменнных (x1, x2, x3 . и т.д., причем x1=1),
каждому такому набору соответствует определенное значение y (равное 0 или 1).
Нужно подобрать такое уравнение логистической регрессии h(x), чтобы при h(x)>=0.5 y был равен 1, а при h(x)<0.5 y=0. Для этого с помощью оценки стоимости на обучающем наборе подбирают коэффициенты при иксах - тета1, тета2, тета3 и т.д.. Выводят требуемое уравнение (с помощью градиентного спуска или других методов), по которому можно узнать (с некоторой долей вероятности, близкой к 99%), правильный или нет ответ.
В качестве иксов можно использовать данные как из вопроса (если они будут не непрерывные числовые, а слова - например, "Эверест", "высота", то этим словам будут соответствовать дискретные значения соответствующих переменных), так и из ответа (для численных значений - непрерывные, для слов и единиц имерений - дискретные).

Как определить смысл пользовательского ввода используя семантику или нейронные сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт