Какой вариант архитектуры лучше выбрать для хранения данных?

Question

beduin01 @beduin01

Какой вариант архитектуры лучше выбрать для хранения данных?

Логика работы сервиса такая.
Проверяется есть ли данный ID в таблице БД. Если такой уже есть, выполняется операция удаления и затем идет вставка (upsert использовать не могу т.к. удалять нужно данные сразу из кучи связных таблиц)

Проблема в том, что БД (PG) содержит уже сотни миллионов записей и каждая подобная проверка очень сильно тормозит вставку.

Я думал использовать какое-то in-memory хранилище для указанных ID чтобы все проверки выполнялись в нем.

Вопрос -- стоит ли городить такой огород? Если стоит, то какое решение выбирать?

Вопрос задан более двух лет назад
103 просмотра

3 комментария

Подписаться 2 Простой 3 комментария

Adamos @Adamos

Поиск уникального ID в таблице "очень сильно тормозит систему"? Серьезно?
Вот в то, что удаление и вставка с перестройкой индексов создает заметный оверхед без всякой на то необходимости - в это поверить куда легче...

Написано более двух лет назад
alexalexes @alexalexes

С индексацией знакомы? Индексы создали по тем полям, по которым делаете проверки и поиски?
Какое время поиска той или иной строки по индексируемым полям в вашем случае?

Написано более двух лет назад
beduin01 @beduin01 Автор вопроса

alexalexes, индексы стоят, просто у меня куча запросов прилетает и я думал, что вынос этого всего в память ускорит процесс.

Написано более двух лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Проектирование программного обеспечения

Простой
На чём писать клиентское приложение с GUI?
- 4 подписчика
- 22 часа назад
- 4102 просмотра
11

ответов
Проектирование программного обеспечения

Простой
Как сделать проект-конструктор с зависимостями на Django с переделкой существующей админки?
- 1 подписчик
- 13 апр.
- 86 просмотров
0

ответов
Проектирование программного обеспечения

Простой
Как разделять относительно одинаковые скрипты между клиентами?
- 2 подписчика
- 03 апр.
- 197 просмотров
3

ответа
Программирование

+2 ещё

Простой
Альтернативы SourceTrail?
- 3 подписчика
- 28 мар.
- 226 просмотров
1

ответ
Мобильная разработка

+1 ещё

Средний
Дальнейшие этапы в создании Приложения после создания прототипа?
- 3 подписчика
- 25 мар.
- 1289 просмотров
8

ответов
Веб-разработка

+1 ещё

Средний
Как реализовать синхронную регистрацию на сайте и форуме(XenFORO) мб(связать их бд)?
- 1 подписчик
- 24 мар.
- 70 просмотров
0

ответов
Django

+2 ещё

Простой
Веб-приложение на Django и фоновый процесс обработки данных, как сделать?
- 1 подписчик
- 23 мар.
- 143 просмотра
2

ответа
Arduino

+1 ещё

Средний
ARDUINO принципиальная схема подкл. модулей при удаленном доступе посредством Wi-Fi (регулировка яркости светодиода) как сделать?
- 1 подписчик
- 15 мар.
- 70 просмотров
1

ответ
Веб-разработка

+1 ещё

Средний
Хорошая ли идея создавать БД на стороне клиентской части (фронтенда)?
- 1 подписчик
- 11 мар.
- 238 просмотров
3

ответа
Проектирование программного обеспечения

+1 ещё

Простой
Какой брокер сообщений выбрать под задачу — принять данные по api и записать в базу?
- 3 подписчика
- 07 мар.
- 190 просмотров
2

ответа
Показать ещё Загружается…

Разработчик баз данных PostgreSQL

Объединенные системы управления транспортом • Москва

До 220 000 ₽

DBA / Администратор баз данных PostgreSQL

СберТех • Москва

от 320 000 ₽

Программист C++ Builder / базы данных MySQL

RU Electronics • Москва

от 180 000 до 200 000 ₽

Отрисовка дизайна главной и внутренней

19 апр. 2024, в 11:08

5000 руб./за проект

Работы по АСУТП

19 апр. 2024, в 10:59

150000 руб./за проект

Нужен директолог с опытом работы

19 апр. 2024, в 10:02

6000 руб./за проект

Поиск уникального ID в таблице "очень сильно тормозит систему"? Серьезно?
Вот в то, что удаление и вставка с перестройкой индексов создает заметный оверхед без всякой на то необходимости - в это поверить куда легче...
С индексацией знакомы? Индексы создали по тем полям, по которым делаете проверки и поиски?
Какое время поиска той или иной строки по индексируемым полям в вашем случае?
alexalexes, индексы стоят, просто у меня куча запросов прилетает и я думал, что вынос этого всего в память ускорит процесс.

Answer 1 · 2021-11-03 13:49:20

Теоретически если есть индекс по ID, то поиск должен быть достаточно быстрым. Можно сделать горизонтальное партиционирование по хэшу от ID, что бы разбить таблицу на несколько кусков.

Попробовать вынести ID в отдельную, небольшую таблицу.

Еще можно только вставлять данные и выбирать только с последним временем вставки. Хотя поиск для чтения будет медленным. Опять же партиционировать по времени вставки.

Какой вариант архитектуры лучше выбрать для хранения данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт