Входные данные хранятся в MySQL, Как хранить и вычислять данные «на лету» при обновлении одной из таблиц?

Question

Anton Bormotov @qqwrst

MySQL
NoSQL

Входные данные хранятся в MySQL, Как хранить и вычислять данные «на лету» при обновлении одной из таблиц?

Вопрос заключается в следующем:
1) Входные данные хранятся в MySQL, в таблице "Results":
Results [result_id, post_id, user_id, points_bet, points_got]
Posts [post_id, category_id, text]
Categories [category_id, category_name]
Users[user_id, overall_ratio]

Значение overall_ratio для каждого пользователя рассчитывается
след. образом:

overall_ratio  = SELECT sum(points_got) / sum(points_bet) FROM Results WHERE (user_id = user->id)

2) Нам требуется рассчитать это же отношение для каждого пользователя в каждой категории:

category_id_ratio  = SELECT sum(points_got) / sum(points_bet) FROM Results WHERE (user_id = user->id) AND (category_id = category->id)

Основное значение overall_ratio, отношение сумм по всем результатам, мы храним в поле overall_ratio в таблице Users. И каждый раз при добавлении результата в таблицу Results мы пересчитываем это значение с учетом нового, добавленного, без учета категории, то есть по всем результатам пользователя.
Хорошо, мы можем посчитать это значение, это всего 1 запрос на каждый результат. (Добавляем 100 результатов, пересчитываем overall_ratio для каждого пользователя). С этим еще можно смирится, как нам кажется.

А что делать если просчитать нужно для каждого пользователя и еще в каждой категории?

Возможные проблемы, которые, возможно, возникнут в будущем:

Результатов будет большое количество, у каждого пользователя в каждой категории. И нам нужно пересчитывать данные каждый раз заново, что бы например, отобразить пользователей со смежным ratio в каждой категории.
sum(points_got) / sum(points_bet).
Например, в категории футбол, пользователь имеет ratio 1.2.
Нужно отобразить пользователей с таким же или соседним ratio (+-) из этой же категории. Но мы не храним эти данные.
Назовем эти данные промежуточными.

Вопрос: Как грамотно вычислять и хранить эти самые промежуточные данные "на лету" при добавлении данных в таблицу результатов?
То есть ration для каждой категории и для каждого пользователя.
Если просто отправлять запрос в БД и получать результат, но на большое количестве результатов, категорий и пользователей производительность может быть низкой.
Как оптимизировать данную задачу?
Следует ли применять key value storages для решения таких задач, такие как noSQL БД или cache storages?

Большое спасибо за внимание и комментарии.

Вопрос задан более трёх лет назад
2441 просмотр

1 комментарий

Подписаться 2 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 126 просмотров
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 101 просмотр
1

ответ
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 362 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 245 просмотров
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 214 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 223 просмотра
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 315 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 166 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 220 просмотров
1

ответ
MySQL

Средний
Почему время в mysql опережает на пару секунд?
- 4 подписчика
- 06 янв.
- 447 просмотров
4

ответа
Показать ещё Загружается…

Дмитрий, я попробовал объяснить ситуацию более детально, если у Вас будет время, пожалуйста прочтите. Если у вас также есть ссылки касаемо выноса запроса в redis, был бы очень признателен. Спасибо.

Answer 1 · 2014-10-30 09:22:53

0)
Основной вопрос - а сколько у вас значений в Query?

1)
А зачем собирать результаты по всей таблице?
Когда у Вас добавляется запись вы знаете user_id, знаете категорию соответственно можно пересчитать целиком только конкретную строчку

2)
Исходя из Вашей формулы - нет никакой необходимости честно пересчитывать строчку, можно сделать то то вроде

update query set `sum` = `sum`+ (значение points_got/points_bet рассчитанное ) where user_id = ... and category_id = ...

Это можно сделать как тригером автоматически, так и в логике самого приложения.
В принципе если Query большой, можно вынести его в какой нибудь redis.

UPD
Перечитал вопрос. Вы не хотите хранить именно не агрегированные данные, т.е избавиться от Results ?
Если там счет не идет на сотни миллионов записей - я бы все таки хранил, потому что если что - пересчитать значения не получится иначе.

Входные данные хранятся в MySQL, Как хранить и вычислять данные «на лету» при обновлении одной из таблиц?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт