Как оптимизировать запрос sql?

Question

Назар Мокринский @nazarpc

Open Source enthusiast

Как оптимизировать запрос sql?

Есть запрос:

SELECT
	AVG(`d`.`x`),
	SUM(`d`.`y`)
FROM `data_table` AS `d`
INNER JOIN `group_table` AS `g`
	ON `d`.`g_id` = `g`.`id`
WHERE
	`d`.`param`	= 1
GROUP BY `g`.`group_column`

Он работает медленно, по скольку таблица group_table большая (70 тыс), а data_table огромная (3 млн записей), это для теста, реальный размер будет в сотни раз больший.
Таблица group_table введена с целью оптимизации раздела, так как нужны индексы по group_column, которых несколько разных, а данные повторяются, соответственно не хотелось добавлять несколько колонок с индексами для этих миллионов записей.
Но дело в том, что при выборке, когда подходит большое количество записей из data_table запрос выполняется 12-18 секунд с использованием быстрого SSD, что неприемлемо.

Вопрос в том, как изменить запрос, чтобы ускорить выборку (нужна группировка по колонкам типа group_column). Подходят варианты с изменением структуры БД, используется MariaDB, подходят решения, которые работают только в ней без обратной совместимости с MySQL.

Очень надеюсь на коллективный разум.

UPD структура таблиц из примера:

CREATE TABLE IF NOT EXISTS `data_table` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `x` int(11) NOT NULL,
  `y` int(11) NOT NULL,
  `param` int(11) NOT NULL,
  `g_id` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `param` (`param`),
  KEY `g_id` (`g_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE IF NOT EXISTS `group_table` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `group_column` int(11) NOT NULL,
  `group_column2` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `group_column` (`group_column`),
  KEY `group_column2` (`group_column2`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

Вопрос задан более трёх лет назад
4183 просмотра

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее
Академия Эдюсон

FullStack-разработчик: тариф PRO

14 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+3 ещё

Средний
Как организовать автоматическую выдачу цифровых товаров после оплаты на чистом PHP?
- 2 подписчика
- 20 апр.
- 218 просмотров
3

ответа
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 314 просмотров
2

ответа
1С-Битрикс

+1 ещё

Простой
Как получить доступ к SQL-базе Bitrix 14.5?
- 2 подписчика
- 18 мар.
- 268 просмотров
2

ответа
SQL

+2 ещё

Простой
Как ИИ использовать для написания sql запросов?
- 1 подписчик
- 02 мар.
- 820 просмотров
5

ответов
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 222 просмотра
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 197 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 210 просмотров
2

ответа
SQL

Простой
Как мне перестроить sql-запрос так, чтобы сообщение не удалялось, с изменением его содержания в начале?
- 1 подписчик
- 01 февр.
- 189 просмотров
1

ответ
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 295 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 152 просмотра
1

ответ
Показать ещё Загружается…

Системный администратор Linux (SysOps)

НТЦ ПРОТЕЙ • Санкт-Петербург

До 200 000 ₽

Fullstack PHP Laravel/VueJS разработчик

Emsoft

До 150 000 ₽

Fullstack developer (python/react)

Крона Лабс • Екатеринбург

от 200 000 ₽

Answer 1 · 2013-12-12 19:51:45

egor_nullptr @egor_nullptr

Структуру таблиц покажите, пожалуйста.

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2013-12-12 23:29:04

Можете попробовать добавить составной ключ из (param, g_id, x, y). Это немного ускорит выполнение запроса. Но при планируемых объёмах вы не сможете получить очень быструю выборку, т.к. агрегирующие функции должны пройтись по каждой записи из результата (и это даст вам Using temporary и Using filesort в explain). Советую вам либо использовать кеширование (заранее один раз подождать долгий запрос, потом N минут использовать результат), либо посмотреть в сторону MongoDB и MapReduce.

Answer 3 · 2013-12-13 16:56:01

SELECT
    AVG(`d`.`x`),
    SUM(`d`.`y`)
FROM `data_table` AS `d`,  `group_table` AS `g`
WHERE
    `d`.`param`	= 1
    and
    `d`.`g_id` = `g`.`id`
GROUP BY `g`.`group_column`

Answer 4 · 2013-12-27 15:09:12

Раз ты в результате, используешь только данные из таблицы data_table, то смысла в join я вообще не вижу

Напиши следующим образом

SELECT
    AVG(d.x),
    SUM(d.y)
FROM data_table AS d
WHERE EXISTS (SELECT 1 FROM group_table AS g WHERE g.id =d.g_id ) AND d.param = 1
GROUP BY g.group_column

Как оптимизировать запрос sql?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт