Какую БД использовать для быстро меняющихся данных?

Question

GilbertAmethyst @GilbertAmethyst

Базы данных

Какую БД использовать для быстро меняющихся данных?

Здравствуйте!

Задача:
К серверу на NodeJS по Socket.IO подключается более двух тысяч устройств и передают данные с интервалом от 5 до 40 секунд. Данные нужно обновлять для каждого устройства в неком хранилище + вести историю (интервал давности: месяц, частота: ежедневные показатели) Система будет увеличиваться в последствии (устройств будет больше).

Наслышан о nosql базах, но дел пока с ними не имел, работал только с Mysql, но учитывая количество данных и потенциальный рост потребностей и их усложнение думаю начать изучать, особенно принимая во внимание явное увеличение длительности ответа текущей бд. Думаю о Redis или Mongo, но буду рад узнать и о других вариантах, если они здесь будут удачно применимы.

Суть вопроса:
Какую технологию выбрать?
На сколько сложна технология, каков шанс допускать критические ошибки при одновременном обучении и проектировке продакшена?
На какие ограничения стоит обратить внимание, чтобы не факапнуться, если выберу её в долгую?

Вопрос задан более трёх лет назад
2175 просмотров

4 комментария

Подписаться 8 Средний 4 комментария

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

7 комментариев

d'Ivan @2ord

Дублирует мой ответ.

Написано более трёх лет назад
m0nym @m0nym

Роман Мирр,
Дублирует мой ответ.

О, как ревностно вы следите за тем, чтобы вас никто не обошел.

Но ваш ответ, извините, вода водянистая. Просто список технологий, без пояснений.

Prometheus в вашем ответе - это вообще о другом.

Чувствуется, что вы не понимаете, того, о чем пишете.

Написано более трёх лет назад
d'Ivan @2ord

m0nym, ну так у вас как-бы не развернутее, просто повторение.
А что насчет Prometheus, может я что-то упустил?

Написано более трёх лет назад
Johny Smith @Olek1

Роман Мирр, не обращайте внимания, он мне тоже сегодня чтото совершенно бесполезное писал

Написано более трёх лет назад
m0nym @m0nym

Роман Мирр, Прометей - не СУБД.
А система мониторинга

Написано более трёх лет назад
m0nym @m0nym

Olek1, я не виноват, что вы еще недостаточно компетентны, чтобы понять ответы.

Написано более трёх лет назад
d'Ivan @2ord

m0nym, ну, хорошо, Прометей - это не чисто СУБД для хранения временных рядов, а имеет ещё и другие функции. Суть же от этого не меняется! Хранить историю метрик позволяет также как и InfluxDB. То есть позволяет вести историю ежедневных показателей, как автор и просил.
Prometheus в вашем ответе - это вообще о другом.
Так о чём же тогда?
https://prometheus.io/assets/architecture.svg

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 82 просмотра
1

ответ
Node.js

+2 ещё

Простой
Как сделать регистрацию без слета через fs?
- 1 подписчик
- 03 июн.
- 164 просмотра
2

ответа
Базы данных

+1 ещё

Простой
Какую базу данных нужно использовать для телеграмм бота?
- 1 подписчик
- 10 мая
- 4813 просмотров
9

ответов
IT-образование

+1 ещё

Простой
С чего начать изучение инженерной части БД?
- 2 подписчика
- 23 апр.
- 380 просмотров
3

ответа
Python

+2 ещё

Простой
Корректно ли в данном случае отправляется запрос в базу данных?
- 1 подписчик
- 23 апр.
- 209 просмотров
2

ответа
Базы данных

Простой
БД для дискорд-бота?
- 1 подписчик
- 17 апр.
- 146 просмотров
1

ответ
Android

+4 ещё

Простой
Какие ресурсы нужны для разработки AR приложения на Unity для «оживления» фото в школьном альбоме?
- 1 подписчик
- 17 апр.
- 221 просмотр
1

ответ
Базы данных

Простой
Какие есть утилиты для автоматизированного проектирования БД?
- 3 подписчика
- 02 апр.
- 2763 просмотра
5

ответов
Базы данных

Простой
RBAC: когда создавать нового пользователя в ДБ?
- 2 подписчика
- 26 февр.
- 204 просмотра
1

ответ
Базы данных

+1 ещё

Простой
Какую скачать СУБД для БД SQlite?
- 1 подписчик
- 15 янв.
- 528 просмотров
5

ответов
Показать ещё Загружается…

Системный аналитик

Synapse AI • Москва

от 130 000 ₽

Golang Developer

ITK academy • Казань

от 75 000 до 120 000 ₽

Программист 1С

Первый мясокомбинат • Нижний Новгород

от 100 000 ₽

на NodeJS по Socket.IO
почему именно так?
sim3x, Требуется наибыстрейшая реакция сервера на передачу данных и отвал клиентов
GilbertAmethyst, тогда тем более - нода не при чем
GilbertAmethyst, какое решение в итоге было выбрано?

Answer 1 · 2018-06-30 15:14:48

подключается более двух тысяч устройств и передают данные с интервалом от 5 до 40 секунд.

вести историю (интервал давности: месяц, частота: ежедневные показатели)

Если речь лишь о периодическом добавлении каких-то одних и тех же метрик (числовых значений) во времени, то нужно выбирать что-то из Time Series баз данных типа InfluxDB, Prometheus и др.
Для IoT устройств нужно выбирать СУБД исходя из структуры хранимых данных, частоты добавления, способа извлечения данных.
Для часто обновляемых данных можно взять какую-нибудь быструю K/V СУБД (NoSQL) типа Tarantool, Aerospike или попсовую Redis. Туда стоит класть какие-то небольшие несырые данные, поскольку используется доступная RAM. Это должны быть часто используемые данные. Часто используются для кеша и очередей.

Советую получше изучить какие сырые данные будут передаваться, как будут вычисляться/аггрегироваться/обрабатываться и как часто. Прикинуть примерные объемы на ближайший срок и оставить возможность для роста на порядок. Оценить примерные объемы чистых хранимых данных, исходя их типов передаваемых данных, для того чтобы примерно можно было оценить объем хранилища.

Также подумать о применении систем обработки данных в очереди.

Answer 2 · 2018-06-30 12:05:19

Redis - это очень хороший вариант.
Если сервис быстрорастущий, то нужно предусмотреть горизонтальное масштабирование и тогда надо будет использовать Redis Cluster https://redis.io/topics/cluster-tutorial

Answer 3 · 2018-07-01 15:14:03

InfluxDB специализированная СУБД для подобных данных, если я правильно понял вашу задачу.
Или Tarantool - держит все в оперативной памяти, быстрее и не придумаешь.
Или Aerospike - типа Tarantool, но задействует диск, подходит, если оперативки маловато.

Answer 4 · 2018-07-01 15:35:12

Смотрите, если у вас данные в виде Time-Series метрик, что-то подобное мониторингу, стоит использовать описанные выше Prometheus или Influxdb. Вторая на больших объемах хранимых данных не очень стабильна и довольно прожорлива. Но опять же, никто не отменял агрегацию данных, уменьшение частоты хранимых точек, т.е. через месяц посекундные данные агрегировать поминутно. Если записи много, а чтение не так часто, что-то вроде статистики, то можно заюзать кликхаус, у него очень впечатляющая скорость записи, неплохая возможность кластеризации, запросы похожи на обычный SQL. Стоит исходить из времени хранения, если данные будут жить условно сутки-двое, то конечно, можно использовать In-Memory базы типа редиса. Либо, как выше сказано, аэроспайк. Но то, что он умеет сбрасывать на диск, не значит, что его стоит использовать, как персистентное хранилище

Какую БД использовать для быстро меняющихся данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт