Какую базу данных использовать для 93 млн строк (товары)?

Question

denis54 @denis54

Какую базу данных использовать для 93 млн строк (товары)?

Есть 93 млн строк (товары) 32 колонки
Какую базу данных использовать?
Что можно еще использовать в архитектуре для быстрого вывода, записи и перезаписи данных?

Возможно ваши советы.
Заранее благодарен...

Вопрос задан более трёх лет назад
2793 просмотра

2 комментария

Подписаться 12 Простой 2 комментария

Помогут разобраться в теме Все курсы

Merion Academy

Базы данных с нуля

2 месяца

Далее
Skillbox

Профессия PHP-разработчик с нуля до PRO

7 месяцев

Далее
Stepik

Тестирование ПО (без проверки)

2 недели

Далее

Пригласить эксперта

Ответы на вопрос 7

Комментировать

1 комментарий

2 комментария

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 81 просмотр
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 250 просмотров
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 186 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 200 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 247 просмотров
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 327 просмотров
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент.
- 448 просмотров
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 220 просмотров
1

ответ
API

+1 ещё

Простой
Точь в точь ли маппятся поля json-сущности на поля в таблицах базы данных?
- 1 подписчик
- 05 июл.
- 237 просмотров
2

ответа
Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 95 просмотров
1

ответ
Показать ещё Загружается…

UI/UX Designer (приложение для поиска подруг)

SUMMEET

от 1 000 до 1 200 $

React Native разработчик в VSRAP

VSRAP Shop • Санкт-Петербург

от 150 000 до 220 000 ₽

Системный аналитик

Bitbanker.ru

от 240 000 ₽

В ИТ все очень просто
Тут все четко, если быстро - то сразу указывается RPS
Я намекнул, что вы должны указать какой у вас RPS, железо и ресурсы

Answer 1 · 2018-04-11 16:07:14

93 млн. - сама по себе смешная нагрузка для современных СУБД на современных компьютерах.
Выбор СУБД зависит от того - а что именно вы собираетесь с этой базой данных делать.- в вопросе это не указано.

Ну например, если ваша цель быстро искать в это БД товары, а ваши 30 колонок - это фильтры, то отлично подходит СУБД для именно что полнотекстового поиска (пусть вас не смущает название, для фасеточного поиска она тоже подходит отлично). Это, к примеру:

если вы ориентированы на скорость SphinxSearch
если вам нужен кластер, то это ElasticSearch
если вам нужны традиционные инструменты типа SQL, - то это PostgreSQL, MySQL.

Если же задача другая - то идеальным выбором может быть и другая СУБД.
Нужны детали.

Думаю, дело в том, что вы увидели эти 90 млн. и решили, что нужно какое-то специфичное решение и не стали даже уточнять детали - а на деле, ничего такого в этих 90 млн. нет. А вот детали задачи - важны.

Рассмотрим задачу быстрой перезаписи - вы имели ввиду все 90 млн. перезаписывать целиком? Не частично. А вот это будет действительно проблемой. Мало какая из СУБД способна на быстрые изменения такого объема.

Ну и третий раз повангую - максимально быстрый доступ к данным - это если данные размещены в оперативной памяти. Один из наиболее развитых инструментов, с размещение в оперативной памяти и с функционалом СУБД - Tarantool. Быстрее, чем in-memory DB, к которым относится Tarantool - и вариантов нет.

Но понадобится соответствующее количество оперативки.

Если оперативки мало, то можно глянуть Aerospike. Это "почти in-memory DB". Но объемы данных могут быть огромны, при небольших запросах к оперативке. От оперативки требуется только целиком вмещать индексы, а не сами данные.

Короче, ванговать мне надоело.

У вас нет постановки задачи - ответить вам посему и нечего конкретного невозможно.

Answer 2 · 2018-04-11 11:07:07

Из бесплатных PostgreSQL, оптимизируйте индексацию, систему хранения СУБД и дисковую подсистему ну и памяти в сервер добавьте, если нужно.
Вообще вопрос абстрактный.
Если вас не устраивает существующий вариант, то нужно найти что именно привело к этому - возможно какая-то конкретная операция (или несколько) заставляет тормозить сервер, нужно их найти и разбираться с ними.
Если просто заменить СУБД, оставив приложение в том же виде, то на новой СУБД вы скорее всего словите те же проблемы, возможно не сразу, а через какое-то время.

Answer 3 · 2018-04-11 11:47:30

Слишком расплывчатое ТЗ. 93 млн в одной таблице? Колонки в таблице длинной 20 байт? Одна таблица в БД?
Вообщем наймите архитектора, что бы потом не мучится с низким быстродействием, внезапными блокировками и прочими прелестями ошибок в архитектуре.

Answer 4 · 2018-04-11 12:07:52

На мой взгляд, достаточно очевидно, что какую базу ни возьми, в одну таблицу все эти товары записывать бессмысленно - все операции с такой таблицей будут занимать продолжительное время.

Answer 5 · 2018-04-11 14:26:02

Ерлан Ибраев @mad_nazgul

Да какую угодно.
Можно вообще обойтись без БД.
Например каким-нибудь hadoop или kafka.
<:o)

Ответ написан более трёх лет назад

1 комментарий

Answer 6 · 2018-04-11 15:57:23

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

Свой тип товара - своя таблица и приведение к ДНФ3. БД - любая.

Ответ написан более трёх лет назад

Комментировать

Answer 7 · 2018-04-11 19:48:01

Если количество колонок постоянное и таблица денормализована, то postgresql.
Если количество колонок меняется и таблица денормализована, то mongodb.
Вместо mongo можно использовать postgres jsonb, но синтаксис запросов там довольно специфичный. Postgres jsonb работает быстро как mongo.
Если таблица нормализована, то будет тормозить на слабом железе.

Какую базу данных использовать для 93 млн строк (товары)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт