Задать вопрос

Сергей Ильин

IT & creative

14

вклад
42

вопроса
54

ответа
30%

решений

Ответы пользователя по тегу Обработка естественного языка

Как сделать поиск который понимает суть запроса?

Сергей Ильин @sunsexsurf
IT & creative

Вы решаете задачу, которую решает Гугл, в целом.
в общем, путь, по которому можно пойти:

1/ прикрутить к вашей поисковой строке расстояние Левенштейна и искать совпадения. Уже будет работать. Плоховато, но лучше, чем ничего.
2/ Посчитать tf-idf на ваших документах и смотреть, что ввел пользователь. Будет работать значительно лучше
3/ построить w2v: каждому слову будет дан эмбеддинг (векторное представление), косинусные расстояния между векторами будут обозначать похожесть слов (синонимическую)
4/ Прикрутить Берт-подобные модели. Если сайт не какой-то специфический, можно даже не доучивать на вашем корпусе.
4 итерация - это, по сути, "предгенеративный" шаг. Потом начинаются большие языковые модели (типа огромного Ялма) и всякие вопросно-ответные системы типа чатЖПТ.

Ответ написан более двух лет назад

Комментировать

Комментировать

Самые активные сегодня

Everything_is_bad
- 3 ответа
- 0 вопросов
Руслан Пикулин
- 3 ответа
- 0 вопросов
Drno
- 3 ответа
- 0 вопросов
mitaichik
- 1 ответ
- 1 вопрос
Adamos
- 2 ответа
- 0 вопросов
VoidVolker
- 2 ответа
- 0 вопросов

Как сделать поиск который понимает суть запроса?

Войдите на сайт