Как лучше организовать такую систему?

Question

Алексей Лауд @kshshe

Frontend developer

Как лучше организовать такую систему?

Столкнулся с тем, что основной раздел сервиса с недавних пор (поспособствовал рост аудитории) загружает процессор на 100%. Возможно, есть другие варианты организации этого раздела или другие технологии, которые подойдут лучше.

Задача:
Показывать пользователю идеи (посты), которые он еще не видел и теги которых подходят под его фильтр. Фильтр представляет из себя список тегов, часть из которых могут содержать символы, меняющие их поведение. Например, теги, которых в идеях быть не должно, теги, которые должны быть в одной идее одновременно, теги, которые обязательно должны быть в каждой идее. Теги, содержащие символ *, охватывают все подходящие под маску варианты сразу.
Идеи должны сортироваться по дате последнего перезапуска (перевод поля active из 0 в 1 поднимает идею наверх).

Сейчас сделано так:
Mysql. Таблицы ideas, ideas_tags, ideas_index и ideas_seen.
Запрос выглядит примерно так:
select * from ideas where
id in (select idea_id from ideas_tags where tag_id in (123,123,13342,232,133,82))
and id not in (select idea_id ...)
and ideas.active=1
and id not in (select idea_id from ideas_seen where user_id=182736)
order by (select id from ideas_index where idea_id=ideas.id) desc
limit 10
Иногда еще добавляются фильтры по длине идей.

Есть ли варианты того, как тот же функционал реализовать более легким для сервера способом?

Вопрос задан более трёх лет назад
419 просмотров

1 комментарий

Подписаться Средний 1 комментарий

Помогут разобраться в теме Все курсы

Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Java-разработчик

9 месяцев

Далее
GB (GeekBrains)

Профессия Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- вчера
- 70 просмотров
1

ответ
MySQL

Простой
Влияет ли размер индекса на скорость MySQL?
- 3 подписчика
- 09 дек.
- 342 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как правильно реализовать структуру таблиц продукт и цены продуктов?
- 1 подписчик
- 20 нояб.
- 210 просмотров
2

ответа
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 86 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 264 просмотра
2

ответа
MySQL

Простой
Почему SQL-запрос на MacOS (M2) исполняется медленнее, чем на shared-хостинге?
- 1 подписчик
- 08 нояб.
- 226 просмотров
1

ответ
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 199 просмотров
2

ответа
MySQL

Средний
Почему после импорта базы из .sql файлов таблицу с 13Гб раздуло до 55Гб?
- 4 подписчика
- 29 окт.
- 633 просмотра
1

ответ
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 206 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 256 просмотров
4

ответа
Показать ещё Загружается…

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Программист Embedded Linux, OpenWrt

Ростовский завод электроники • Москва

от 80 000 до 120 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Er Code, вопрос был в том, есть ли для таких задач какой-нибудь распространенный принцип решения. Возможно, лучше подойдет использование чего-то другого вместо mysql или где-то уже есть решенная оптимальным способом схожая задача.

Детального решения задачи я и не ищу, мне нужно только направление, в котором искать решение.

Answer 1 · 2017-12-11 09:48:19

Необязательно логика запроса влияет на его производительность. В большей степени на это может влиять специфика данных, физика размещения данных и т.п.

Если уверены, что проблема именно в этом запросе, то анализировать нужно не запрос, а план его выполнения (explain ...). Без плана ничего дельного сказать нельзя. Можно только предложить абстрактные идеи для оптимизации:

1. продуманные индексы
2. денормализация
3. материализованные представления
4. партиционирование
5. типы движков

Answer 2 · 2017-12-11 12:04:56

order by (select id from ideas_index where idea_id=ideas.id) desc

Как минимум надо убрать ideas_index из запроса, а в таблицу ideas добавить новое поле sort (денормализовать).

Answer 3 · 2018-06-02 00:05:22

Помимо предложений выше. Я бы по оптимизировал where
Условия простые и эффективные с точки зрения индексов подвинуть наверх, далее по возрастанию неэффективности.
Ведь при каждом новом условии объем выборки уменьшается, значит серверу придется делать меньше переборов
потом id in и id not in я бы свел к двум, это будет быстрее, чем несколько раз перекапывать выборку (особенно если она большая или вообще не лезет в память) для сравнения со списком. Т.е. сначала готовим списки, потом один раз сравниваем.
Конечно сам сервер должен быть оптимизирован под такие запросы, чтобы хватало выделенной памяти.

Как лучше организовать такую систему?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт