Какую выбрать СУБД и структуру БД для хранения ~160 млрд записей?

Question

Сергей @phpusr

Программист, велосипедист, бегун

Базы данных

Какую выбрать СУБД и структуру БД для хранения ~160 млрд записей?

Суть проекта

Бурятся скважины около 100 штук, с них каждую секунду высылаются данные на центральный сервер.

Скважины бурятся в среднем 2 месяца.

Данные такого типа:

Время
Глубина
около 300 параметров

Параметр имеет такой вид:

ID параметра: string(3)
Значение: float

Если я ничего не напутал, то на одну скважину будет задействовано около 1.6 млрд строк (для хранения параметров), на все скважины - 160 млрд строк.

Требуется организовать систему на этом сервере, чтобы она принимала и хранила эти параметры.

А также выводила кривые изменения параметров в реальном времени. Плюс кривые за прошлое время с изменением масштаба и диапазона просмотра.

Текущая программа использует MySQL, с отдельными таблицами на каждую скважину. Самая большая таблица занимает 30GB и 160 млн строк (текущая программа сохраняет меньшее кол-во параметров).

Теперь вопросы:

Достаточно-ли PostgresQL для этих целей с 2-мя табличками?
Либо имеет смысл для каждой скважины заводить отдельные таблицы?
Может стоит использовать NoSQL?
Может это относится к Big Data и нужны соответствующие решения?

Вопрос задан более трёх лет назад
122 просмотра

Комментировать

Подписаться 3 Средний Комментировать

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Merion Academy

Базы данных с нуля

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 238 просмотров
3

ответа
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 146 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- 21 дек. 2025
- 147 просмотров
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб. 2025
- 105 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб. 2025
- 291 просмотр
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб. 2025
- 226 просмотров
1

ответ
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 237 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт. 2025
- 272 просмотра
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент. 2025
- 374 просмотра
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент. 2025
- 471 просмотр
1

ответ
Показать ещё Загружается…

Middle DevOps Engineer/DevOps-инженер

ZennoLab • Нижний Новгород

от 150 000 ₽

Chief Executive Officer (CEO)

UANT Limited

от 500 000 до 700 000 ₽

QA Engineer (Manual → AQA)

Adfinity

от 150 000 ₽

Answer 1 · 2019-12-15 16:31:11

Для хранения - key-value, для OLAP - column database. Для графиков - а зависимости от реалтайма. Или тупо стриминг из ingest'a или же регулярные агрегаты в другую базу.

Answer 2 · 2019-12-15 19:32:45

Мускуль вполне справится.

160 млрд записей по 10 байт это ~ 1,6 ТБ, не так уж и много.

Графики выводятся не из основной базы, а из slave реплики (для уменьшения нагрузки на основную базу).

Скорее всего, графики можно выводить с меньшей точностью: брать цифры не раз в секунду, а раз в 10 минут. Потому что цифры "раз в секунду" всё равно не будут видны. Т.е. для графиков можно сделать отдельную, значительно меньшую по объёму базу.

Ещё можно подумать, насколько часто меняются параметры? Если параметр почти не меняется, может быть, записывать его с увеличенными интервалами? Например, раз в минуту? А в случае каких-то резких (катастрофических?) изменений возобновить запись раз в секунду.

Answer 3 · 2019-12-16 14:25:40

Для хранения справятся log-файлы... Ровно как и MySql, mariadb или postgresql ... или KV ../ да как угодно хранить можно.

Вопрос: что после с этими сохраненными данными делать и как их обрабатывать. И в зависимости от хателок будет вырисовываться архитектура и можно выбирать подходящую под задачу базу.

Какую выбрать СУБД и структуру БД для хранения ~160 млрд записей?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт