Какая СУБД обеспечит минимальное время доступа к непрогретым данным?

Question

Stan_1 @Stan_1

Какая СУБД обеспечит минимальное время доступа к непрогретым данным?

Добрый день!

Хочу спросить совета по такой ситуации. Имеются данные в количестве примерно 40-50 млн. строк (размер на диске с индексами - около 170 Гбайт). Данные довольно статичны (рост - 1-10 тыс. новых записей в неделю). Изначально я грузил эти данные в PostgreSQL, но здесь есть проблема с прогревом. Первый запрос выполняется до 30-40 секунд, второй около 5 секунд, и далее уже 150-300 мс.

Прогревать кеш перед работой нереально. Периодически приходят новые клиенты, которые запускают различные онлайн-демо с сайта. И здесь важно произвести первое впечатление - уже первый запрос уже должен быть обработан быстро, ну или хотя бы в 1-2 секунды.

Партицирование пробовал - принципиально ситуацию не меняет. Shared Buffers ставил в 6 Гбайт - тоже не помогло. Вопрос, что делать дальше? У меня в голове такие варианты:
1. Создавать копию данных на диске, структурировать ее по папкам и просто читать записанные "выборки" с диска. Я в принципе, так делал, и в определенных случаях - это самое классное и быстрое решение. Но оно не позволяет делать выборки по условиям.
2. Использовать что-то вроде Elsaticsearch. Пока все, что я про нее прочитал - устраивает. Даже приятно, что есть поиск по геоданным (найти объекты не далее 25 км от такой-то точки). Но я слышал, что у нее тоже есть прогрев, но я не нашел, насколько он быстр.
3. Применить in-memory базы, например Redis. Но это удорожает решение, поскольку придется покупать второй сервер. А проблема в том, что у меня не проблема роста сервиса, а проблема малого количества пользователей на огромный массив данных.
4. Применить Sphinx. Там я ни разу не читал про проблему прогрева, но может быть - не нашел просто.

Какие есть в такой ситуации типовые решения?

Вопрос задан более трёх лет назад
2849 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

PostgreSQL

+1 ещё

Простой
Как исправить неправильное отображение данных в csv после экспорта?
- 1 подписчик
- вчера
- 85 просмотров
1

ответ
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- вчера
- 135 просмотров
3

ответа
PostgreSQL

+2 ещё

Простой
Где искать рекомендуемые настройки SSL-аутентификации для Docker-образа Posgres?
- 1 подписчик
- 17 апр.
- 53 просмотра
3

ответа
MySQL

+1 ещё

Средний
Как скрестить ElasticSearch и MySQL?
- 3 подписчика
- 15 апр.
- 682 просмотра
2

ответа
PostgreSQL

+1 ещё

Простой
Как поправить язык в SQL Shell (psql)?
- 1 подписчик
- 14 апр.
- 90 просмотров
1

ответ
Python

+1 ещё

Простой
Как оптимизировать запрос?
- 1 подписчик
- 13 апр.
- 133 просмотра
2

ответа
PostgreSQL

Простой
Как взять значение из одной таблицы и прибавить к значению другой таблицы?
- 1 подписчик
- 12 апр.
- 76 просмотров
1

ответ
PostgreSQL

Простой
Psq восстановление бэкапа, что делаю не так?
- 1 подписчик
- 11 апр.
- 81 просмотр
2

ответа
PostgreSQL

+1 ещё

Средний
С чем может быть связана высокая нагрузка на сервер Postgres?
- 2 подписчика
- 11 апр.
- 186 просмотров
1

ответ
Linux

+1 ещё

Средний
Почему большой iowait в cloud vm c postgres?
- 5 подписчиков
- 11 апр.
- 2092 просмотра
4

ответа
Показать ещё Загружается…

Администратор PostgreSQL

Гринатом

До 200 000 ₽

Разработчик баз данных PostgreSQL

Объединенные системы управления транспортом • Москва

До 220 000 ₽

DBA / Администратор баз данных PostgreSQL

СберТех • Москва

от 320 000 ₽

Нужен директолог с опытом работы

19 апр. 2024, в 10:02

6000 руб./за проект

Помощь с парсингом XML файла яндекс товаров

19 апр. 2024, в 09:46

500 руб./за проект

Обработать массив фотографий

19 апр. 2024, в 08:46

5000 руб./за проект

Answer 1 · 2014-06-30 09:19:06

Пума Тайланд @opium

Просто люблю качественно работать

если выборка простая и по индексу это скорее проблема доступа к диску, поставьте базу на ссд

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2014-06-30 21:33:08

заведите для новых клиентов базу поменьше, делайте так чтобы выборки поднимали как можно меньше данных и не использовали рандомное чтение с диска. руками поднимайте необходимые данные в дисковый кэш и shared buffers. вариантов борьбы много, на всех не in-memory базах скорость будет упираться в скорость случайного чтения с винчестеров в случае запроса не поднятых в память данных. ну и, как уже посоветовали, SSD :)

Answer 3 · 2014-07-08 14:40:07

Создайте дополнительный раздел с tmpfs и при каждом запуске сервера делайте синхронизацию базы на этот раздел. Но вся база у вас не влезет, поэтому выделяйте партицию, которая влезет в раздел. И читайте с этого раздела. Конечно, это тоже прогрев, но он происходит только при перезапуске сервера.

Какая СУБД обеспечит минимальное время доступа к непрогретым данным?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт