Как правильнее заносить и хранить большой объем данных в бд?

Question

theKapustaa @theKapustaa

Как правильнее заносить и хранить большой объем данных в бд?

Здравствуйте.
Имеется сайт на котором постоянно то появляются то пропадают скидки на товары.

Я создаю проект в котором должна будет храниться история цен по всем товарам.
Парсер будет запускаться каждые 4 часа.
Даже если брать не все товары а всего несколько категорий, то получается около 400 000 товаров, а в день их нужно дергать 6 раз, соответственно 2 600 000 записей в бд в день.
Вопрос в том как лучше заносить их в бд, я думаю объединять к примеру по 1000 товаров и закидывать их одним запросом чтобы уменьшить нагрузку на базу, и как и где их лучше хранить, в месяц получается около 72 000 000 записей, а статистику нужно будет собирать долгое время.
Есть еще идея вместо того чтобы собирать эту огромную базу, делать для каждого товара несколько позиций, в которых будет размещена цена и временной период, на протяжении которого стоимость товара не изменялась, и так для всех скидок/цен для каждого товара.

Подскажите каким лучше методом реализовать данную задачу, если есть свои идеи то буду только рад их выслушать, и какую бд лучше использовать для хранения и постоянной выборки таких объемов данных?

Вопрос задан более трёх лет назад
592 просмотра

Комментировать

Подписаться 2 Оценить Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Проектирование программного обеспечения

Простой
Как в 2025 году приблизиться к полному CAP (не AP/CP/CA), а именно к CAP?
- 5 подписчиков
- 12 авг.
- 994 просмотра
1

ответ
Проектирование программного обеспечения

+1 ещё

Средний
Сможет ли кластер minio выдержать 60000 клиентов, стримящих данные?
- 2 подписчика
- 03 авг.
- 277 просмотров
3

ответа
PHP

+1 ещё

Простой
Как в выборке sql обратиться к предыдущей записи?
- 2 подписчика
- 30 июл.
- 275 просмотров
6

ответов
C#

+1 ещё

Простой
Как спроектировать домены?
- 3 подписчика
- 26 июл.
- 162 просмотра
0

ответов
Проектирование программного обеспечения

Простой
Как общаются микросервисы в реальных проектах?
- 2 подписчика
- 13 июл.
- 6878 просмотров
5

ответов
API

+1 ещё

Простой
Точь в точь ли маппятся поля json-сущности на поля в таблицах базы данных?
- 1 подписчик
- 05 июл.
- 215 просмотров
2

ответа
SQL

Простой
Как реализовать набор таблиц?
- 1 подписчик
- 01 июл.
- 169 просмотров
1

ответ
Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 79 просмотров
1

ответ
SQL

Простой
Как отсортировать по полю и id в sql?
- 1 подписчик
- 18 июн.
- 192 просмотра
1

ответ
SQL

+1 ещё

Простой
Как найти нужные столбцы в таблице oracle по содержанию?
- 2 подписчика
- 04 июн.
- 102 просмотра
1

ответ
Показать ещё Загружается…

Backend Python/SQL

ПерилаГлавСнаб • Москва

от 150 000 до 250 000 ₽

Разработчик Idea Platform, Java и SQL

Idea Platform • Москва

от 100 000 до 250 000 ₽

Data Analyst со знанием 1C / SQL / Python

Agro.Сlub • Воронеж

от 150 000 до 200 000 ₽

Answer 1 · 2017-03-06 16:58:42

Не нужно записывать в БД все цены в момент каждой проверки, Вам достаточно записать только информацию о цене, которая изменилась.

products
id, name, created, ...

product_prices
id, product_id, price, created, ...

Answer 2 · 2017-03-06 16:40:54

Я бы использовал PostgreSQL, потому что знаю его) А детальнее - вначале создал бы собственный тип, описывающий цену в момент времени, состоящий из времени и цены. Потом просто создал бы таблицу товаров, в которой бы была колонка с массивом этого нового типа цен в момент времени. И при каждой новой загрузке информации я бы раскладывал для подходящего товара данные о времени и цене в этот массив. Ну и добавил бы первичный ключ по товарам и gin индекс по массиву временных точек цен. По идее в таком виде таблица не станет очень большой и вы сохраните возможность быстро проводить агрегацию по данным. Ну и данные будет легко шардировать, если потребуется.

Как правильнее заносить и хранить большой объем данных в бд?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт