Быстрый LIKE по 1 миллиону строк, как быть?

Question

SwoDs @SwoDs

PHP YII2

Быстрый LIKE по 1 миллиону строк, как быть?

Добрый день, в проекте нужно использовать данные ФИАС-а, когда пользователь начинает набирать название улицы, выводить то что подходит под вводимое, т.е. если набрал "Ленин" ему выдало на выбор Ленинский пр-т, ул. Ленина
Полнотекстовый не подходит, так как слово нужно тогда писать полностью. Как быть, что использовать?

Вопрос задан более трёх лет назад
1741 просмотр

Комментировать

Подписаться 12 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 10

6 комментариев

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 1 подписчик
- 17 июн.
- 198 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 441 просмотр
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 242 просмотра
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 190 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 153 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2461 просмотр
8

ответов
MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 127 просмотров
1

ответ
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 335 просмотров
6

ответов
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 104 просмотра
1

ответ
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 182 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2016-07-26 16:00:09

Александр Аксентьев @Sanasol Куратор тега PHP

нельзя просто так взять и загуглить ошибку

sphinx использовать.
или https://dadata.ru/

Ответ написан более трёх лет назад

6 комментариев

Answer 2 · 2016-07-26 18:46:28

Вначале, все слова записываем в виде хеша так, чтобы буквы шли по-порядку, но повторные - не повторялись. 'мама мыла раму' => 'ма ылру'
Можно дополнительно создать еще один кэш и отсортировать в порядке убывания кол-во повторов букв:
Приведём новый пример: 'мыла раму мама' (переставим слова местами)
'мыла раму мама' => [м-4][ы-1][л-1][а-4][(пробел)-2][р-1][у-1]=>'ма ылру' (предыдущий пример останется без изменений...)
и поиск вести по половинам хэша (при нечетном кол-ве -округляем в большую сторону) введённой строки 'ма ылру':
1. При не найденных совпадениях, порядок такой: 'ма ы'=>'ма'=>'м'
2. При найденных совпадениях, порядок такой: 'ма ылр'=>'ма ыл' Как выдача будет нулевая - берём предыдущий МИНИМАЛЬНЫЙ! результат выдачи.

Таким образом можно отловить с большей вероятностью пропущенные буквы при вводе.

Можно составить отдельную таблицу по всем словам и привязать их к основным данным.

Затем выборка этажеркой:
1. Преобразуем так же вводимую строку и выбираем LIKE 'ма мыл%'
(возможно несколько выборок с проверкой пропущенной буквы) запоминая результат выборки.
2. По этому результату ищем полную строку с тем же LIKE 'мама мыла раму%'
3. При следующем поиске, если хэш не уменьшился и символы в диапазоне длины предыдущего хэша не изменились - мы ищем СРАЗУ ЖЕ! по результату п.1 (и снова запоминаем результат), экономя время (т.е. поиск как бы идёт по предыдущему кэшу).

Таким образом получается, что чем больше букв, тем меньше записей мы перебираем.
А чем меньше мы перебираем, тем больше у нас времени остаётся и мы можем его использовать на дополнительные запросы: для нечеткого поиска.

Answer 3 · 2016-07-26 16:36:33

www.mysql.ru/docs/man/Fulltext_Search.html

* Звездочка является оператором усечения. В отличие от остальных операторов, она должна добавляться в конце слова, а не в начале.
apple*
... ``apple'', ``apples'', ``applesauce'', и ``applet''.

Answer 4 · 2016-07-26 16:11:23

Если название хранится не как 'ул. Ленина', а как два поля - `name` = 'Ленина', `type` = 'ул', то LIKE 'Лен%' будет использовать индекс по `name`.

Answer 5 · 2016-07-26 16:40:52

Philipp @zoonman

⋆⋆⋆⋆⋆

sphinxsearch.com/docs/current.html#conf-expand-keywords

Ответ написан более трёх лет назад

Комментировать

Answer 6 · 2016-07-26 17:35:15

Егор Казанцев @saintbyte

Django developer

ElasticSearch уже предлагали?

Ответ написан более трёх лет назад

Комментировать

Answer 7 · 2016-07-26 16:46:02

lxfr @lxfr

NoSQL?

Ответ написан более трёх лет назад

Комментировать

Answer 8 · 2016-07-26 20:47:03

Пума Тайланд @opium

Просто люблю качественно работать

сфинкс

Ответ написан более трёх лет назад

Комментировать

Answer 9 · 2016-08-04 13:13:07

вообщем от все уже написали, резюмирую относительно поиска по мускулю
1. Индексы на parengiud и formalname, причем индекс на название можно ограничить 6-7 символами, искать `parengiud` = '...' AND `formalname` LIKE "%ленин", parentguid в условии поиска ставить первым - так будет быстрее.
2. Полнотекстовый поиск если позволяет движок.

1й вариант даже наверно предпочтительный

Answer 10 · 2016-10-29 23:47:21

al_gon @al_gon

solr

Ответ написан более трёх лет назад

Комментировать

Быстрый LIKE по 1 миллиону строк, как быть?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт