Какая база данных подходит для частых UPDATE и сортировки?

Question

Виктор Батиенко @xaker01

Лень все лень.

Базы данных

Какая база данных подходит для частых UPDATE и сортировки?

В базе данных есть очень нагруженная таблица примерно с 1-3млн записями.
Для упрощения в ней есть данные
id|data|used_date

backend обращается к базе данных получает строку отсортированной по used_date ( получаем строку по самой старой дате)
и делает update для нее вставляя текущее время. (пока выполняет операция select + update запись блокируется чтоб другой не мог ее получить и обновить)

Какая база больше подходит для такой задачи,
в данный момент все крутится на postgresql и 16ядер CPU еле справляются с нагрузкой

Вопрос задан более двух лет назад
644 просмотра

Комментировать

Подписаться 4 Простой Комментировать

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 4

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 1 подписчик
- 14 окт.
- 181 просмотр
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 302 просмотра
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент.
- 431 просмотр
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 203 просмотра
1

ответ
Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 92 просмотра
1

ответ
Node.js

+2 ещё

Простой
Как сделать регистрацию без слета через fs?
- 1 подписчик
- 03 июн.
- 168 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Какую базу данных нужно использовать для телеграмм бота?
- 1 подписчик
- 10 мая
- 4855 просмотров
8

ответов
IT-образование

+1 ещё

Простой
С чего начать изучение инженерной части БД?
- 2 подписчика
- 23 апр.
- 406 просмотров
3

ответа
Python

+2 ещё

Простой
Корректно ли в данном случае отправляется запрос в базу данных?
- 1 подписчик
- 23 апр.
- 214 просмотров
2

ответа
Базы данных

Простой
БД для дискорд-бота?
- 1 подписчик
- 17 апр.
- 150 просмотров
1

ответ
Показать ещё Загружается…

Art Director (TV, Youtube, Реклама)

SDL • Москва

от 190 000 ₽

Системный аналитик (Мои Сервисы)

Сбер • Москва

от 300 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2023-10-11 16:38:53

Если я правильно понял суть вопроса, вам подойдёт любая KV СУБД. Вынесите только эту таблицу в какой-нибудь Tarantool или Redis (я имею в виду использовать хранимые процедуры для вашей задачи). 1-3 млн записей - относительно немного. Даже если одна запись весит 4 КБ, все данные займут 4-12 ГБ ОЗУ, что не так уж и много. Если использовать батчинг, что Redis, что Tarantool дадут вам на 16 ядрах свыше 100к RPS на такие сложные запросы.

Можете так же глянуть AerospikeDB (хранит данные на диске, но с индексами в памяти, где один индекс стоит 64 байт), но я не уверен, что вам хватит его функционала. Если вы дадите больше контекста, возможно, я смогу предложить вам другие идеи.

UPD: AerospikeDB тоже позволяет сохранить готовые процедуры, так что его функционала хватит для вышеуказанной задачи.

Answer 2 · 2023-10-11 14:12:35

Исхлдя из того что я понял из вопроса, вы делаете два запроса в базу: поиск и затем обновление. Это можно сделать одним запросом тем самым существенно снизив нагрузку

Answer 3 · 2023-10-11 14:03:06

Подходит любая БД. Вопрос в том чем вы готовы пожертвовать ради скорости. Например вы можете хранить данные в backend (hashtable) и сбрасывать их в БД периодически. Эта схема идеально работает. Вам только надо с самим собой и с бизнесом поговорить о гарантиях. Что вы хотите? Чтоб любой вектор {id, data, user_date} сохранялся в ту-же микросекунду или вы можете эти изменения отложить на потом и применить их в БД через 15 минут например в виде
batch-update.

Поэтому вопрос оптимизации БД - это вопрос не только технически но и организационный. А запись в Postgress в через длинный сетевой стек да еще и с фиксацией транзакции это такое яростное безкомпромиссное решение
которое не всегда и нужно.

Договаривайтесь с ценностью бизнес-информацией и с компромиссами.

Answer 4 · 2023-10-11 16:36:11

Для указанной вами задачи (получение записи по вторичному ключу и ее изменение в режиме ACID) нет смысла использовать RDBMS. Рассмотрите использование собственного простого протокола поверх BerkeleyDB или аналогичной DB.

Answer 5 · 2023-10-11 19:50:14

Что то вы делаете не так.
если есть индекс по used_date

а я подозреваю что его нет, то базе вообще параллельно.

Если же он есть (что странно) сделайте какую нибудь key value базу и периодически сбрасывайте из нее значения в БД

Какая база данных подходит для частых UPDATE и сортировки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт