MongoDB map-reduce — эффект маляра Шлемиэля?

Question

zxmd @zxmd

MongoDB

MongoDB map-reduce — эффект маляра Шлемиэля?

Проблема - в коллекции уже 45М записей. Каждые несколько часов по базе бегает map-reduce и аггрегирует данные. Проблема в том что с каждым днем он это делает все медленней и медленней.

Структура исходной коллекции примерно такая:
company_id:xxx, ts:.....
company_id:xxx, ts:.....
company_id:yyy, ts:.....
company_id:xxx, ts:.....
company_id:yyy, ts:.....

Аггрегирующиай запрос приводит ее к такому:
ts:...., xxx:3,
ts....., yyy:2
и т.д. где ts - дата (без времени)

То-есть мап-редъюс бегает постоянно по огромному числу уже отработанных ts, выполняя работу которая уже была сделана. Как обычно решаются такие проблемы. Тоесть как заставить его бегать только по новым данным? Можно кончено как то запоминать последний ts на момент запуска обработчика и следующий запускать уже с фильтром {ts:{$gt:__stored_ts__}} но мне кажется это не правильно. Так как:
1 - непонтно какой ts сохранять - ts начала работы или когда работа завершена.
2 - как мержить данные в результирующей таблице. Пример. У company_id:xxx, за некий день ts: 20.02.2014 было 3, после прохождения алгоритмом у этой же xxx на этот же ts добавилось 6. Тоесть по сути в результирующей коллекции должно быть 9. Пока я вижу вариант только с map-reduce в отдельную коллекцию и запуск скрипта который обновит данные в основной сводной коллекции простым перебором значений.

Вопрос задан более трёх лет назад
3062 просмотра

Комментировать

Подписаться 4 Оценить Комментировать

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как искать primary в реплике Монги?
- 1 подписчик
- 28 июн.
- 114 просмотров
0

ответов
Python

+2 ещё

Простой
Как использовать pymongo асинхронно?
- 1 подписчик
- 14 апр.
- 235 просмотров
2

ответа
Node.js

+2 ещё

Средний
Почему иногда отваливается volume в mongo docker compose?
- 4 подписчика
- 10 мар.
- 324 просмотра
0

ответов
MongoDB

Простой
Как оптимизировать мой запрос mongodb к огромной коллекции?
- 1 подписчик
- 27 янв.
- 132 просмотра
0

ответов
MongoDB

+1 ещё

Средний
Почему падает Graylog при недоступности одной из нод MongoDB?
- 1 подписчик
- 21 янв.
- 96 просмотров
1

ответ
MongoDB

Простой
Как ограничить подключение к MongoDB?
- 1 подписчик
- 21 янв.
- 107 просмотров
1

ответ
MongoDB

Простой
Что делать, если mongodb обрезает числа?
- 1 подписчик
- 30 дек. 2024
- 103 просмотра
0

ответов
Python

+1 ещё

Простой
Pymongo как добавлять значение в список и удалять его?
- 1 подписчик
- 29 дек. 2024
- 140 просмотров
0

ответов
MongoDB

Простой
Почему mongodb_exporter не выдает нужные метрики?
- 1 подписчик
- более года назад
- 51 просмотр
0

ответов
Базы данных

+1 ещё

Простой
Стоит ли изучать MongoDB в 2024?
- 1 подписчик
- более года назад
- 857 просмотров
4

ответа
Показать ещё Загружается…

GoLang разработчик на высоконагруженный проект

TrafficOX

от 2 500 до 4 500 $

Team Lead Backend Developer

EnerGO Technologies • Москва

от 350 000 ₽

Fullstack PHP Laravel/VueJS разработчик

Emsoft

До 160 000 ₽

Answer 1 · 2014-02-19 19:37:48

А нет вариантов при вставке где-то обновлять счетчик ts: .... => xxx + 1 или ts: ... => yyy + 1 ?
Операция-то копеечная, зато сэкономит вам кучу времени

Answer 2 · 2014-02-24 21:19:39

Станислав Клементьев @Marques

а википедия уже не помогает?

Ответ написан более трёх лет назад

1 комментарий

Answer 3 · 2014-03-19 06:10:45

Алексей @fuCtor

Ruby разработчик

В документации есть пример инкрементального выполнения MapReduce.
docs.mongodb.org/manual/tutorial/perform-increment...

Ответ написан более трёх лет назад

Комментировать

MongoDB map-reduce — эффект маляра Шлемиэля?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт