Какой вариант архитектуры лучше выбрать для хранения данных?

Question

beduin01 @beduin01

Какой вариант архитектуры лучше выбрать для хранения данных?

Логика работы сервиса такая.
Проверяется есть ли данный ID в таблице БД. Если такой уже есть, выполняется операция удаления и затем идет вставка (upsert использовать не могу т.к. удалять нужно данные сразу из кучи связных таблиц)

Проблема в том, что БД (PG) содержит уже сотни миллионов записей и каждая подобная проверка очень сильно тормозит вставку.

Я думал использовать какое-то in-memory хранилище для указанных ID чтобы все проверки выполнялись в нем.

Вопрос -- стоит ли городить такой огород? Если стоит, то какое решение выбирать?

Вопрос задан более трёх лет назад
107 просмотров

3 комментария

Подписаться 2 Простой 3 комментария

Adamos @Adamos

Поиск уникального ID в таблице "очень сильно тормозит систему"? Серьезно?
Вот в то, что удаление и вставка с перестройкой индексов создает заметный оверхед без всякой на то необходимости - в это поверить куда легче...

Написано более трёх лет назад
alexalexes @alexalexes

С индексацией знакомы? Индексы создали по тем полям, по которым делаете проверки и поиски?
Какое время поиска той или иной строки по индексируемым полям в вашем случае?

Написано более трёх лет назад
beduin01 @beduin01 Автор вопроса

alexalexes, индексы стоят, просто у меня куча запросов прилетает и я думал, что вынос этого всего в память ускорит процесс.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Merion Academy

Базы данных с нуля

2 месяца

Далее
Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Frontend-разработчик: тариф PRO

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Проектирование программного обеспечения

Простой
Как избежать излишнего усложнения на ранних этапах развития SaaS-проектов?
- 2 подписчика
- 03 мар.
- 113 просмотров
2

ответа
C++

+2 ещё

Простой
Заголовочные файлы в Си нужны только для интерфейса?
- 2 подписчика
- 26 февр.
- 407 просмотров
5

ответов
Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- 21 дек. 2025
- 123 просмотра
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб. 2025
- 95 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб. 2025
- 282 просмотра
2

ответа
Проектирование программного обеспечения

+1 ещё

Простой
Есть ли типовые архитектуры системы диспечерезации?
- 1 подписчик
- 07 нояб. 2025
- 80 просмотров
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб. 2025
- 213 просмотров
1

ответ
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 230 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт. 2025
- 268 просмотров
4

ответа
Проектирование программного обеспечения

Простой
Как правильно в EventDriven?
- 1 подписчик
- 26 сент. 2025
- 130 просмотров
2

ответа
Показать ещё Загружается…

Frontend-разработчик (iGaming)

Cobalt Lab

от 1 700 $

Golang Developer

Правое полушарие Интроверта • Санкт-Петербург

от 200 000 до 300 000 ₽

Senior Site Reliability Engineer (SRE)

TravelLine • Санкт-Петербург

До 500 000 ₽

Поиск уникального ID в таблице "очень сильно тормозит систему"? Серьезно?
Вот в то, что удаление и вставка с перестройкой индексов создает заметный оверхед без всякой на то необходимости - в это поверить куда легче...
С индексацией знакомы? Индексы создали по тем полям, по которым делаете проверки и поиски?
Какое время поиска той или иной строки по индексируемым полям в вашем случае?
alexalexes, индексы стоят, просто у меня куча запросов прилетает и я думал, что вынос этого всего в память ускорит процесс.

Answer 1 · 2021-11-03 13:49:20

Теоретически если есть индекс по ID, то поиск должен быть достаточно быстрым. Можно сделать горизонтальное партиционирование по хэшу от ID, что бы разбить таблицу на несколько кусков.

Попробовать вынести ID в отдельную, небольшую таблицу.

Еще можно только вставлять данные и выбирать только с последним временем вставки. Хотя поиск для чтения будет медленным. Опять же партиционировать по времени вставки.

Какой вариант архитектуры лучше выбрать для хранения данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт