Агрегация статистики в SQL-хранилище?

Question

Adam_Ether @Adam_Ether

Java Developer

Агрегация статистики в SQL-хранилище?

Предложите вашу реализацию задачи.

Допустим существует система, которая собирает определенную статистику с округлением до минуты. Пускай формат такой: date, count.

Хранится это все в sql-storage (postgresql или mysql).

Вопрос как агрегировать эту статистику в:

1) статистику по часам,

2) статистику по дням.

Требования:

1) обрабатывать только новые данные, т.е. инкрементальным методом.

2) обеспечить максимальное быстродействие

3) по возможности низкое потребление RAM и CPU.

Существует вариант решения задачи при помощи создания views в бд. С запоминаем последней обработанной даты. И не самым элегантным мержом конфликтов статистики.

Думал забирать статистику в MongoDB и там делать map-reduce. Потом обратно в sql-storage. Но это использовании сразу двух разных БД. Накладные ресурсы на копирование. Что выглядит тоже, не самым подходящим способом.

Вопрос задан более трёх лет назад
4614 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Продвинутый SQL

5 недель

Далее
Академия Эдюсон

SQL-разработчик: тариф Базовый

2 месяца

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Карьера в IT

+1 ещё

Средний
Хочу попробовать стать системным аналитиком, с чего лучше начать и во сколько попытаться найти работу?
- 4 подписчика
- 25 июн.
- 810 просмотров
6

ответов
Информационная безопасность

+3 ещё

Простой
Утечка кейвордов в Телеграм при посещении постороннего сайта?
- 3 подписчика
- 03 июн.
- 301 просмотр
3

ответа
IT-образование

+2 ещё

Средний
Бизнес и системный аналитик: кто это?
- 2 подписчика
- 29 мая
- 385 просмотров
3

ответа
Аналитика

Средний
DAX \ Power BI как сделать меру через промежуточную таблицу?
- 2 подписчика
- 08 апр.
- 72 просмотра
1

ответ
1С-Битрикс

+1 ещё

Простой
Как получить доступ к SQL-базе Bitrix 14.5?
- 2 подписчика
- 18 мар.
- 308 просмотров
2

ответа
SQL

+2 ещё

Простой
Как ИИ использовать для написания sql запросов?
- 1 подписчик
- 02 мар.
- 974 просмотра
5

ответов
SQL

Простой
Как мне перестроить sql-запрос так, чтобы сообщение не удалялось, с изменением его содержания в начале?
- 1 подписчик
- 01 февр.
- 209 просмотров
1

ответ
Аналитика

Средний
Как структурировать работу над новым проектом в бизнес аналитике. Какая очередность у всего процесса аналитики?
- 1 подписчик
- 15 янв.
- 137 просмотров
1

ответ
Excel

+1 ещё

Средний
PowerQuery эффективность применения при работе с большим к-вом файлов?
- 2 подписчика
- 12 дек. 2025
- 385 просмотров
2

ответа
SQL

Простой
Как получить последнюю запись для определённого поля?
- 1 подписчик
- 03 дек. 2025
- 346 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2013-03-17 08:21:41

Вариант с map-reduce — не факт, что будет более быстродействующим решением. Поможет денормализация. Чтобы избежать агрегации на каждом запросе статистики, и ударных нагрузок на процессор и память во время таких запросов, логично во время занесения каждой очередной записи увеличивать счетчики, находящиеся в специальных таблицах. Для этого на вставку можно поставить триггер, инкрементирующий нужный счетчик (счетчик текущего часа, счетчик текущего дня). Разумеется, под каждую форму статистического запроса потребуется отдельный счетчик.

Answer 2 · 2013-03-17 11:20:35

Явно в приложении увеличивать счетчики. В MySQL это можно делать одним запросом вроде:

INSERT INTO hourly_table() VALUES() ON DUPLICATE KEY UPDATE x = x + ?, y = y +?
INSERT INTO daily_table() VALUES() ON DUPLICATE KEY UPDATE x = x + ?, y = y +?

Агрегация статистики в SQL-хранилище?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт