Как ускорить выполнения SQL запросов?

Question

Иван @SpinenkoIA

Как ускорить выполнения SQL запросов?

Доброго времени суток.
Для начала небольшая предистория:
Имеется задача сниферить траффик, и в реальном времени принимать решение о пакете (разрешен данный протокол в сети или нет). Решение принимается на основе записей в БД (MySQL), запись вида ip источника, ip назначения, протокол, порт назначения.
Используем библиотеку на C (nDPI), которая сниферит интерфейс, парсит пакет и говорит какой это протокол, на Python забираем данные с консоли, парсим регуляркой, и кладем на обработку в очередь.
Далее в другом процессе (multithreading) стучимся в базу и ищем запись соответсвующую атрибутам пакета, дальнейшие действия уже не так важны.
Самое узкое место в обработке это mysql, перерыл пол интернета, но так и не смог найти способа ускорить выполнение запроса, меньше 1 мс никак не выходит, это очень много для наших задачь, конечно python тоже узкое место, потом перепишем на C++.
Пробовал заюзать redis но больше времени уходит на накладные расходы, к слову БД довольно не большая не более 1000 записей.
Использовать локальный кэш тоже не очень хороший вариант, т.к. в БД могут писать их других мест, а данные нужны актуальные.

Прошу помощи как можно ускорить запрос, может другая БД или еще как то?

Вопрос задан более трёх лет назад
4347 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 5

1 комментарий

3 комментария

Иван @SpinenkoIA Автор вопроса

По мути да просто хранилище. Но его используют другие приложения, да вариант с построением новой хэш таблицы довольно интересный, надо затестить, а можете пояснить про пинку из триггера не совсем понял

Написано более трёх лет назад
mayorovp @mayorovp

SpinenkoIA: ну, в триггере может быть вызов UDF - а UDF может делать что угодно.

Написано более трёх лет назад
Иван @SpinenkoIA Автор вопроса

А понял, да уже предлагали буду пробовать, спасибо

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 68 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 85 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 282 просмотра
0

ответов
Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 1002 просмотра
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 625 просмотров
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 724 просмотра
1

ответ
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 646 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 549 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2015-02-10 17:21:31

Использовать локальный кэш тоже не очень хороший вариант, т.к. в БД могут писать их других мест, а данные нужны актуальные.

Использовать локальный кеш. Обновляются данные явно не каждые 1мс, за которые вы боретесь.
Обновление - вплоть до из триггера пинать UDF, которая сообщит вашему приложению, что данные в БД обновились.

Answer 2 · 2015-02-10 17:16:10

Пример запроса хотелось'б видеть, может есть что оптимизировать?
Индексы созданы?

Прибывали обратится напрямую к хранилищу через интерфейс memcached?
mysqld_plugin_memcached + отключенные транзакции.

Answer 3 · 2015-02-10 18:13:07

Таблицы в памяти держать пробовали (тип memory)?

Но скорее всего придётся отказаться от mysql в пользу какого-нибудь быстрого и нереляционного key-value хранилища, например memcache.

Answer 4 · 2015-02-10 18:33:54

Правильно ли я понимаю, что база данных для вас - просто хранилище настроек?..

Загружайте все себе в память, и кладите в хеш-таблицу. Если особенно нужна скорость - можно использовать идеальный хеш (т.е. подобрать параметры хеш-функции таким образом, чтобы в таблице не было коллизий). После этого пропадет еще и необходимость очереди - ну или в очередь будут попадать уже отфильтрованные пакеты.

Обновлять данные либо периодически подгружая их из базы, либо по "пинку" из триггера. При обновлении данных лучше всего сначала построить новую хеш-таблицу, а потом ее атомарно заменить - это позволит строить новую таблицу без ограничения по времени.

Answer 5 · 2015-04-23 14:14:13

Можно попробовать так: стоит mysql-мастер с которым работают пользователи, и есть слейв, у которого таблички с типом MEMORY и ваш анализатор трафика юзает слейв.
Еще хинт - можно предгенерять табличку, там у вас джойнов много - напишите плоскую таблицу, в которую по триггеру на инсерте/апдейте будет складываться все данные. Что бы селект получался простым, типа
"SELECT rules.rule_id " \
"FROM data_flow_rules_DENORMALIZED rules " \
"WHERE rules.ip_v4_address = '{src_ip_v4}' " \
"AND rules.ip_v4_address = '{dst_ip_v4}' " \
"AND rules.name = '{protocol}' " \
"AND rules.target_port = {target_port} " \
"LIMIT 1"
+ индекс на все поля, у вас простое равенство - поможет. не забывайте о селективности индекса (первой в индексе должно идти самое селективное поле)
Кстати, если в индекс последним включить поле rules.rule_id то обращения к табличке вообще происходить не будет, только к индексу :)
Еще откройте для себя EXPLAIN https://dev.mysql.com/doc/refman/5.5/en/explain.html

Как ускорить выполнения SQL запросов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт