Как оптимизировать MySQL запрос и нужно ли это?

Question

davin4u @davin4u

Как оптимизировать MySQL запрос и нужно ли это?

Добрый день, хочу спросить совета у более опытных коллег :)
Есть база данных с компаниями, есть основная таблица с данными, есть таблица со штатом сотрудников, есть таблица с данными сотрудников, есть еще пара таблиц с дополнительными данными, всего около 6 таблиц. В основной таблице с компаниями 1.5 млн записей, в остальных от 1 до 2.5 млн
Задача: пользователь вводит ключевые слова, система должна пройтись по всем этим таблицам и найти совпадения (используются LIKE и MATCH, да я слышал что в mysql полнотекстовый поиск работает плохо, но увы, так было уже до меня), алгоритм работает таким образом, что сперва делается поиск по одному ключу, отсеивается все лишнее, далее делается поиск по следующему ключу среди того что было найдено ранее.

Перепробовал несколько подходов
1. Использовал LEFT JOIN чтоб подключить все использующиеся таблицы (способ был эфективен, однако возникла проблема с дублями результятов, попытка использовать GROUP BY и DISTINCT значительно увеличила время выполнения)
2. Использовал вложенные подзапросы
3. Разбивал запрос на куски, выполнял поиск по очереди для каждого ключа, и результат в PHP подставлял в запрос через WHERE IN(...)
Ну и другие различные вариации.
Максимум чего удалось достигнуть это 30 секунд

Если есть кто-то, кто хорошо в этом разбирается и имеет большой опыт, буду ОЧЕНЬ рад совету
Интересует следующее:
1. В целом, mysql должен адекватно себя вести на таком объеме данных? Вроде не так много, как мне кажется
2. Как вообще умные люди поступают в таких ситуациях? Оптимизируется запрос, если да, какие методы используются?
3. Или может mysql не может работать быстро при таком объеме данных (но как по мне это смешно) при выборке из многих таблиц, и необходимо использовать другие инструменты для поиска, типа ElasticSearch?

Вопрос задан более трёх лет назад
220 просмотров

1 комментарий

Подписаться 2 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Skillbox

Java-разработчик

8 месяцев

Далее
Shultais Education

Основы SQL

3 месяца

Далее
OTUS

PHP Developer. Professional

5 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

+1 ещё

Простой
Как правильно реализовать структуру таблиц продукт и цены продуктов?
- 1 подписчик
- 20 нояб.
- 151 просмотр
2

ответа
MySQL

Простой
Почему SQL-запрос на MacOS (M2) исполняется медленнее, чем на shared-хостинге?
- 1 подписчик
- 08 нояб.
- 208 просмотров
1

ответ
MySQL

Средний
Почему после импорта базы из .sql файлов таблицу с 13Гб раздуло до 55Гб?
- 4 подписчика
- 29 окт.
- 589 просмотров
1

ответ
Python

+2 ещё

Средний
При подключении к бд MySQL через SSH из Python появляется ошибка, а через DBeaver всё чётко. В чём дело?
- 2 подписчика
- 29 сент.
- 330 просмотров
1

ответ
MySQL

Простой
MySQL JSON_OBJECT Приводит значение к строковому типу, возможно ли это как то обойти?
- 2 подписчика
- 26 сент.
- 127 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как исправить ошибку «No connection could be made because the target machine actively refused it»?
- 2 подписчика
- 02 сент.
- 335 просмотров
1

ответ
MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 20 авг.
- 127 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- 1 подписчик
- 16 авг.
- 176 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 196 просмотров
1

ответ
MySQL

Простой
Как свзять столбцы по внешнему ключу?
- 1 подписчик
- 06 авг.
- 133 просмотра
1

ответ
Показать ещё Загружается…

Linux Systems Engineer (Asterisk/SIP)

IT ATLAS • Москва

от 200 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Сетевой инженер, OpenWrt, Linux

Ростовский завод электроники • Санкт-Петербург

от 20 000 до 60 000 ₽

Это ничтожный объём данных. В соседнем вопросе мои замеры на гораздо большей выборке по WHERE IN и NOT IN: https://toster.ru/answer?answer_id=848790#comments...

Умные люди индексируют колонки, по которым производится поиск.

Можете показать запрос?
Скорее всего уже по нему будет приблизительно видно, где и как можно сделать оптимальнее и ускорить. Без запроса, всё это - гадание на гуще.

Вместе с запросом, можете показать результат того же запроса, но поставив перед ним слово EXPLAIN, чтобы MySQL вместо его выполнения показала анализ, что MySQL будет делать с запросом. По нему будет видно потенциальные тяжёлые места.

Answer 1 · 2016-07-14 11:46:05

1. Для MySQL это не большие объемы данных, если все грамотно реализовано.
2. Нужно выбирать инструмент по задаче - Ваша задача поиск данных по всем таблицам, мускуль полноценно для этого не годиться. Используйте ElasticSearch или Sphinx, все Ваши попытки выкрутится через стандартные запросы ни к чему не приведут, вот даже сейчас Вы что-то оптимизируете - станет работать быстрее, а что будет через год-два-пять когда объемы данных вырастут?

Answer 2 · 2016-07-14 11:52:57

Еще находил интересную штуку - представления. На сколько я понял, это виртуальная таблица, которая формируется на основе запроса выборки из других таблиц. Вот только не понял, эта выборка постоянно хранится в памяти, что могло бы помочь ускорить работу, либо это просто механизм для упрощения работы с базой, т.е. просто в момент запроса к представлению, выполняется тот самый запрос, который использовался при создании этого представления, после чего он расширяется?

Answer 3 · 2016-07-14 12:04:38

www.mysql.ru/docs/man/Fulltext_Search.html , если не хочется ставить отдельный ElasticSearch (у которого может быть немного больше возможностей для полнотнкстового поиска, которые вам в вашей задаче не пригодятся).

Как оптимизировать MySQL запрос и нужно ли это?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт