Как сделать поиск запроса в данных?

Question

alex_ak1 @alex_ak1

Автоматизация обработки текста

Как сделать поиск запроса в данных?

Здравствуйте.
У меня есть программа, которая имеет список (небольшой, ну допустим 1000 строк). Я хочу сделать строку поиска внизу, чтобы при набирании текста список фильтровался по этому запросу. Запрос ~~на обычном человеческом языке~~ просто как набор слов.
Как мне проверить, подходит ли каждая строка или нет?
Самый простой вариант - разбить запрос на слова и искать их в элементах.
Для усовершенствования можно подключить к примеру pymorphy2 (нормально ищет первую форму слова, чтобы не мучатся спряжениями) и все слова из списка тоже привести к такой-же форме.
Но как искать синонимы и неточные слова? Может есть какие готовые решения?
Неточные слова можно попытаться искать с помощью расстояния хемминга или аналога, не знаю, правда, будет ли польза.

Можно конечно подключить какой-нибудь сфинкс или, не знаю, еще каккую-то поисковую машину, но хотелось бы обойтись менее громоздкими решениями без баз и всего такого.

Язык желательно .net, но если будет что-то другое - не критично.

Вопрос задан более трёх лет назад
86 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1С-программист

10 месяцев

Далее
Skillbox

Профессия 1C-разработчик

8 месяцев

Далее
Hi-TECH Academy

KL 004.2.4 Kaspersky SD-WAN

2 дня

Далее

Решения вопроса 1

4 комментария

alex_ak1 @alex_ak1 Автор вопроса

Ну это вместо расстояния Хемминга, что, по моему, будет одинаково в данном контексте.

Написано более трёх лет назад
alex_ak1 @alex_ak1 Автор вопроса

Стемминг - интересно, пошел читать.

Про неправильные слова - как я узнаю, что это слово неправильно? Не библиотеку слов же за собой таскать?

Написано более трёх лет назад
longclaps @longclaps

alex_ak1: таскать, иначе хана
Вот вам чуток бреда из марковского бредогенератора, натасканного на корпусе классических текстов:

видав могулка не замер воду нимаю соврагиня та окладеянным засту совенего загопорта вопрежу
кровенно волчавшись а пишь ведела когда голодавном на войственцам желатчскую фронуть так неского тел вас секу какое знаю мальшая франдоразу

Русский держит словарь в голове и отличит настоящее слова от синтезированного, а алгоритм, как и иностранец, наслушавшийся русской речи - нет.

Написано более трёх лет назад
alex_ak1 @alex_ak1 Автор вопроса

longclaps: Жепь ебрило какое-то :)))
Понятно, думаю пока "неправильным словами" можно или не заморачиватся или же посчитать с помощью хемминга или левенштейна - если слово отличается на 1 букву (к примеру) то совпадение есть.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Автоматизация обработки текста

Простой
Существует ли инструмент (система) автоматизации форматирования текста в docx по предопределенным правилам?
- 2 подписчика
- 05 авг.
- 183 просмотра
2

ответа
Нейронные сети

+1 ещё

Средний
Как автоматически создавать большие отчёты из множества docx файлов?
- 2 подписчика
- 18 апр.
- 457 просмотров
4

ответа
HTML

+2 ещё

Простой
Как выполнить ëфикацию без сторонних библиотек?
- 2 подписчика
- 28 февр.
- 701 просмотр
2

ответа
Автоматизация обработки текста

Простой
Какой код вбить, чтобы он склонял определëнное слово да ещë и повсеместно на странице/сайте?
- 2 подписчика
- 19 февр.
- 83 просмотра
2

ответа
Нейронные сети

+1 ещё

Средний
Как определить ключевые слова из текста?
- 1 подписчик
- 09 янв.
- 85 просмотров
2

ответа
Поисковая оптимизация

+4 ещё

Средний
Как заполнить таблицу excel?
- 1 подписчик
- более года назад
- 249 просмотров
4

ответа
Автоматизация обработки текста

Простой
Динамическая + стачическая сортировка одновременно возможна?
- 1 подписчик
- более года назад
- 65 просмотров
0

ответов
Регулярные выражения

+2 ещё

Простой
Как обрезать часть строки в Excel (Пример прикрепляю)?
- 2 подписчика
- более года назад
- 234 просмотра
2

ответа
Python

+3 ещё

Средний
Какие существуют библиотеки Python для комплексной обработки текста, включая исправление ошибок и удаление лишних символов?
- 1 подписчик
- более года назад
- 638 просмотров
1

ответ
Автоматизация обработки текста

+1 ещё

Сложный
Кто знает user-friendly инструмент для поиска по файлам с помощью языковых моделей (RAG)?
- 4 подписчика
- более года назад
- 275 просмотров
2

ответа
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Database Administrator / DBA

Playerok

от 300 000 ₽

Backend Developer

Playerok

от 400 000 ₽

Answer 1 · 2017-01-17 13:10:24

тыц тыц
> Но как искать синонимы и неточные слова
синонимы - по словарю синонимов
неточные слова как правило лучше отбросить - если у вас нет возможности построить такую систему машинного обучения, как у поисковиков, и обучить её разумно подсказывать - отбросьте.

Как сделать поиск запроса в данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт