Как выполнить релевантный поиск?

Question

Snewer @Snewer

MySQL

Как выполнить релевантный поиск?

Здравствуйте!

Имеется таблица с информацией о некоторых моделях.
В таблице поля: "Марка модели", "Год выпуска", "Название" и т.п.

Дана строка "Марка модели год выпуска название другие параметры", при чем порядок может быть произвольным, а так же возможны опечатки. Как отсортировать данные по релевантности исходя из данной строки?

Марка модели может быть вида "модель 1", где "1" — играет ключевую роль в релевантности. То есть, цифры и строки длиной 1 нужно учитывать.

p.s. записей в таблице не много - порядка 10 000. Общий размер текста, из полей так же не большой — подобные описанным выше полям.

спасибо!

Вопрос задан более трёх лет назад
539 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

11 комментариев

Snewer @Snewer Автор вопроса

Объясните, пожалуйста, что имеется ввиду "по автокомплиту поисковую строку формовать из базы"

Написано более трёх лет назад
Артемий @MetaAbstract

Сорри "формировать" человек начинает набирать а снизу инкрементным поиском по строке варианты для выбора появляются. Так тэги например вводятся часто

Написано более трёх лет назад
Snewer @Snewer Автор вопроса

Артем HTMLDatabase: но для автокомплита нужно же сперва получить релевантные значения? не так ли? не выводить же сразу все результаты

Написано более трёх лет назад
Артемий @MetaAbstract

Степан Романов: Результаты получите, когда поисковую строку отправите. По автокомплиту саму посиковую строку сформируете релевантную к данным.

Написано более трёх лет назад
Snewer @Snewer Автор вопроса

Артем HTMLDatabase: в принципе вашу идею я понял. спасибо. но нельзя принудить человека использовать автокомплит, и он может написать ерунду) ерунду надо как-то обработать

Написано более трёх лет назад
Артемий @MetaAbstract

В этом и архитектурное решение. Ерунду нельзя ввести. Иначе либо Fulltext index либо Elasticsearh к базе присоединять как я подозреваю. Но это уже отдельная военная операция.

Написано более трёх лет назад
Артемий @MetaAbstract

Можно же вводимые данные ограничить автокомплитными через js.

Написано более трёх лет назад
Snewer @Snewer Автор вопроса

Артем HTMLDatabase: в принципе, что бы избежать ошибок, можно часть слова вырезать. пока думаю в сторону использования операторов LIKE

Написано более трёх лет назад
Артемий @MetaAbstract

Вырезание части слова это не тривиальный алгоритм. Будете год пилить.

Написано более трёх лет назад
Snewer @Snewer Автор вопроса

Артем HTMLDatabase: как вариант использовать Sphinx, но мне не хочется делать этого в силу не большого количества данных

Написано более трёх лет назад
Артемий @MetaAbstract

Степан Романов: Sphinx vs ElasticSearch: что выбрать?

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 127 просмотров
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 102 просмотра
1

ответ
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 362 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 245 просмотров
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 214 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 223 просмотра
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 315 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 166 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 220 просмотров
1

ответ
MySQL

Средний
Почему время в mysql опережает на пару секунд?
- 4 подписчика
- 06 янв.
- 447 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2016-08-18 12:11:41

Боюсь, что средствами mysql - никак. Надо писать обвязку на каком-либо языке программирования, парсить строку по словам и по ним выполнять поиск по всем столбцам.
Насчет опечаток почитайте про Soundex и про нечеткое сравнение строк. Дело это не на пять минут.
И делать это надо было на этапе заполнения базы. Сейчас придётся переделывать.

Answer 2 · 2016-08-18 12:29:41

Fulltext Index может помочь теоретически, но лучше по автокомплиту поисковую строку формировать из базы. Это будет более эффективно.

Answer 3 · 2016-08-18 13:24:59

Правильное решение: использовать решения вроде Elastic.
Однако для этого Elastic надо куда-то поставить, что не всегда допустимо.
Любые другие решения будут костылём различной степени кривости.
Вариант с написанием обвязки будет катастрофически медленным, и, более того, не нужным, потому что всё можно сделать средствами СУБД
Костыльное решение, работающее на голой СУБД:

Для каждого ряда в БД используя самопальную версию поиска подстроки, допускающую ошибки, найти вхождения каждого поля в строку, по которой ведётся поиск.
Построить оценку каждого ряда, основанную на сумме длин найденных подстрок и количестве ошибок (этот пункт требует экспериментов на реальных данных).
Отсортировать результат по этой оценке

Как выполнить релевантный поиск?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт