Какое подобрать хранилище 3 триллионов событий?

Question

Blowspirit @Blowspirit

Какое подобрать хранилище 3 триллионов событий?

Нужно подобрать хранилище в которое будет поступать большой объем однотипных событий (до 3 миллионов в секунду).
Глубина хранения 1 месяц - это примерно 3 триллиона событий.
Выборка событий будет происходить с использованием фильтров по полям в среднем раз в секунду.
Соответственно хранилище должно уметь горизонтально масштабироваться на 100-1000 узлов, быть надежным и проверенным решением, быть устойчивым к отказам узлов, делать быстро выборку по разным критериям с возможностью сортировки, поддерживать java клиента.

Вопрос задан более трёх лет назад
4278 просмотров

13 комментариев

Подписаться 28 Оценить 13 комментариев

sim3x @sim3x

Дайте определения терминам
"быстро"
"устойчивым к отказам узлов"
"быть надежным и проверенным решением"

И оценочную $

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

"быстро" - поиск не более 5-10 секунд за конкретную дату и не более 30-60 если поиск производится за месяц.
"устойчивым к отказам узлов" - при отказе узла данные не должны теряться, т.е. нужна авто репликация данных
"быть надежным и проверенным решением" - малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается
И оценочную $ - бесплатное и opensource решение

Написано более трёх лет назад
lega @lega

Blowspirit: > малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается

Тогда вам только велосипедить, что многие и делают

Написано более трёх лет назад
nirvimel @nirvimel

до 3 миллионов в секунду

Биржевые тики?
А зачем их хранить так долго? Если в реальном времени не хватает скорости на их обработку, то и в дальнем времени на это не будет. Оправданна очередь на обработку максимум в несколько минут, чтобы сгладить профиль вычислительной нагрузки в моменты "штормов".

Написано более трёх лет назад
Tsimur_S @Tsimur_S

nirvimel: еще возможен Iot и миллион сенсоров)

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

nirvimel: хранятся не тики, а события от устройств. Обработка в реальном времени не нужна, поэтому и храним за месяц

Написано более трёх лет назад
lega @lega

Blowspirit: > а события от устройств
от wifi точек?

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Я ради интереса подпишусь, но не думаю что будет бесплатное и opensource которое по факту решало такие задачи. Это все-таки ну очень специфическая задача при высокой нагрузке - если кто то себе и напишет - вряд ли отдадут в паблик.

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Blowspirit: в рамках оффтопика - у вас объем хранилища без индексов ~2ПБайт, это как бы не дешево весьма по железу. Почему при этом накладывается ограничение что софт должен быть бесплатным?

Написано более трёх лет назад
lega @lega

Дмитрий Энтелис: Вот и я про тоже

Написано более трёх лет назад
profesor08 @profesor08

Дмитрий Энтелис: похалявить

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

У меня есть пока следующие соображения:
1. поскольку при поиске данных всегда фигурирует id устройства и временной диапазон, то можно это дело хранить в hdfs в структуре типа /id_устройства/день/файл_с_данными. Соответственно нужный файл (~400мб) или файлы мы можем быстро найти, а затем данные в нем мы фильтруем с помощью чего-либо (spark, flink или hive??).
2. Можно хранить данные в кластере с elasticsearch выпилив ненужные поисковые причиндалы (full-text) из структуры данных. Идея такая: создаем каждый день новый индекс(аля база данных в реляционных терминах) где к названии индекса будем в постфиксе добавлять текущую дату. В индексе будет будет где-то 130-150 шардов (т.к. 1 шард это максимум ~2 миллиарда событий). Поисковый запрос в elasticsearch позволяет искать сразу в нескольких индексах (можно использовать соответствующие паттерны в запросе). Плюс в эластике каждое поле уже автоматом является индексом что большой плюс. Тут очень интересно насколько адекватно такой кластер с таким количеством шардов будет работать

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

Итог: попробовали несколько макетов, самым интересным оказался hadoop.
hdfs - используем для хранения данных, MapReduce - для аналитики

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Java-разработчик

10 месяцев

Далее
Skillbox

Курс Java-разработчик

4 месяца

Далее
Нетология

Java-разработчик с нуля

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 7

1 комментарий

Комментировать

4 комментария

Blowspirit @Blowspirit Автор вопроса

Одно событие весит примерно 150 байт. С учетом необходимость большого количества ssd это под вопросом. А если разливать события вручную на диск, то фактически вы предлагаете использовать полностью самописное решение для шардинга, репликации, индексации и тд, что конечно же не комильфо

Написано более трёх лет назад
lega @lega

Blowspirit: > С учетом необходимость большого количества ssd это под вопросом
Можно на HDD, будет медленнее, но тоже быстро, или вы как планировали?, если заливать в БД то размер будет ещё больше.

> полностью самописное
Не полностью (для шардинга и репликации можно gridfs например), но да, для большой нагрузки все делают кастомные решения, думаете поиск гугла или яндекса на каком нибудь sphinx/elastic работает что ли?

Хотя можете попробовать что-то готовое "тормозное", (покажите мне хоть один сервер БД который может 27 млн/сек на одной ноде)

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

lega sdd с "файликами" упрется в iops очень быстро

Написано более трёх лет назад
lega @lega

Дмитрий Энтелис: Упрется в последнюю очередь, другие решения упрутся гораздо раньше в 99%.
+ некто не отменял кеширование и балансинг.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

+1 ещё

Средний
Как добавить цепочку сертификатов pkcs12 в java8 для взаимной аутентификации TLS?
- 2 подписчика
- вчера
- 75 просмотров
0

ответов
Android

+1 ещё

Средний
Сервис Android (aidl) с системными правами (в прошивке) может быть доступен для несистемного приложения?
- 1 подписчик
- 18 нояб.
- 83 просмотра
1

ответ
Java

+1 ещё

Простой
В чем моя ошибка при deploy maven?
- 1 подписчик
- 26 окт.
- 139 просмотров
1

ответ
Java

Средний
Почему крашится сервер Minecraft Forge?
- 1 подписчик
- 13 окт.
- 162 просмотра
2

ответа
Java

+1 ещё

Простой
Как создать аннотацию, подобную Jakarta @Size?
- 2 подписчика
- 09 окт.
- 161 просмотр
0

ответов
Java

Простой
Почему способ создания String влияет на результат сравнения?
- 2 подписчика
- 27 сент.
- 286 просмотров
3

ответа
Java

+2 ещё

Простой
Какие есть варианты grpc service discovery с минимальным откликом?
- 1 подписчик
- 17 сент.
- 117 просмотров
0

ответов
Java

+1 ещё

Средний
Hibernate: Почему запрос с EntityGraph не работает?
- 1 подписчик
- 10 сент.
- 112 просмотров
0

ответов
Java

+1 ещё

Простой
Java. Трудности в начинании, нормальные ли ошибки в начале?
- 1 подписчик
- 10 сент.
- 449 просмотров
3

ответа
Java

Простой
Как эффективно реализовать балансировку очереди запросов на Java?
- 1 подписчик
- 03 сент.
- 217 просмотров
1

ответ
Показать ещё Загружается…

Инженер по автоматизации тестирования (AQA Java)

DCloud

До 250 000 ₽

Automation QA Engineer (Java)

ITK academy

от 90 000 ₽

Automation QA Engineer (Java)

ITK academy • Москва

от 90 000 ₽

Дайте определения терминам
"быстро"
"устойчивым к отказам узлов"
"быть надежным и проверенным решением"

И оценочную $
"быстро" - поиск не более 5-10 секунд за конкретную дату и не более 30-60 если поиск производится за месяц.
"устойчивым к отказам узлов" - при отказе узла данные не должны теряться, т.е. нужна авто репликация данных
"быть надежным и проверенным решением" - малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается
И оценочную $ - бесплатное и opensource решение
Blowspirit: > малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается

Тогда вам только велосипедить, что многие и делают
до 3 миллионов в секунду

Биржевые тики?
А зачем их хранить так долго? Если в реальном времени не хватает скорости на их обработку, то и в дальнем времени на это не будет. Оправданна очередь на обработку максимум в несколько минут, чтобы сгладить профиль вычислительной нагрузки в моменты "штормов".
nirvimel: еще возможен Iot и миллион сенсоров)
nirvimel: хранятся не тики, а события от устройств. Обработка в реальном времени не нужна, поэтому и храним за месяц
Blowspirit: > а события от устройств
от wifi точек?
Я ради интереса подпишусь, но не думаю что будет бесплатное и opensource которое по факту решало такие задачи. Это все-таки ну очень специфическая задача при высокой нагрузке - если кто то себе и напишет - вряд ли отдадут в паблик.
Blowspirit: в рамках оффтопика - у вас объем хранилища без индексов ~2ПБайт, это как бы не дешево весьма по железу. Почему при этом накладывается ограничение что софт должен быть бесплатным?
У меня есть пока следующие соображения:
1. поскольку при поиске данных всегда фигурирует id устройства и временной диапазон, то можно это дело хранить в hdfs в структуре типа /id_устройства/день/файл_с_данными. Соответственно нужный файл (~400мб) или файлы мы можем быстро найти, а затем данные в нем мы фильтруем с помощью чего-либо (spark, flink или hive??).
2. Можно хранить данные в кластере с elasticsearch выпилив ненужные поисковые причиндалы (full-text) из структуры данных. Идея такая: создаем каждый день новый индекс(аля база данных в реляционных терминах) где к названии индекса будем в постфиксе добавлять текущую дату. В индексе будет будет где-то 130-150 шардов (т.к. 1 шард это максимум ~2 миллиарда событий). Поисковый запрос в elasticsearch позволяет искать сразу в нескольких индексах (можно использовать соответствующие паттерны в запросе). Плюс в эластике каждое поле уже автоматом является индексом что большой плюс. Тут очень интересно насколько адекватно такой кластер с таким количеством шардов будет работать
Итог: попробовали несколько макетов, самым интересным оказался hadoop.
hdfs - используем для хранения данных, MapReduce - для аналитики

Answer 1 · 2017-02-06 11:00:25

Yandex Clickhouse (тут на веру Яндексу только, зато как раз под задачу)
Aerospike
еще начать можно с DynamoDB, там готово все, только плати

только с 3 трлн и 5-10 сек очень не уверен, так или иначе придется что-то предобрабатывать

Answer 2 · 2017-02-06 13:30:14

Tarantool и AeroSpike ? Или возможно стоит посмотреть в сторону time series database?
https://www.influxdata.com/influxdb-vs-cassandra-b...
Может ещё кассандра справится с безумным количеством серверов, но вообще больше миллиона записей в секунду это на данный момент слабо реализуемо.

Answer 3 · 2017-02-06 15:15:55

Скорость ssd до 550Mb/sec, если события по 20б, то можете по файликам разливать ~27 млн событий в сек (одного канала не хватит чтобы нагрузить)

Выборка событий будет происходить с использованием фильтров по полям в среднем раз в секунду.

Разливайте в "доль" фильтров и будет норм.

Answer 4 · 2017-02-07 02:48:07

index0h @index0h

PHP, Golang. https://github.com/index0h

KDB+

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2017-02-15 08:35:42

Akumuli может записывать 4.5 миллиона событий в секунду на единственном m3.2xlarge инстансе (если события представимы в виде комбинации набора тегов, метки времени и числа с плавающей точкой).

Answer 6 · 2017-02-06 13:19:20

Максим Тимофеев @webinar

Учим yii: https://youtu.be/-WRMlGHLgRg

https://www.oracle.com/database/solutions/index.html

Ответ написан более трёх лет назад

Комментировать

Answer 7 · 2017-02-06 13:25:26

Петр @petermzg

Самый лучший программист

Azure Datalake

Ответ написан более трёх лет назад

Комментировать

Какое подобрать хранилище 3 триллионов событий?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт