Как хранить большие JSON массивы, которые постоянно обновляются (API)?

Question

Даниил Сидоров @DaniLaFokc

Проектирование программного обеспечения

Как хранить большие JSON массивы, которые постоянно обновляются (API)?

Разрабатываю сервис, который работает с API Wildberries и Ozon. Функционал простой - получил данные, посчитал и вывел на страницу. Но есть проблема - не совсем понимаю, как лучше всего организовать хранение полученных данных.

Я рассуждал так - делать запрос к API при каждом обновлении страницы нецелесообразно, к тому же попаду на "Too many requests". Значит данные надо обновлять в фоне, например каждые 15 минут, поэтому создам CRON-задание. Каждые 15 минут я буду получать JSON с 10 000+ записей. Как его лучше хранить? Не уверен, что стоит писать все эти данные в MySQL, ведь каждый раз придется полностью очищать таблицу от старых данные и записывать новые. Может тогда хранить в файлах?

Кто имел опыт разработки подобных проектов, пожалуйста подскажите как лучше сохранять большие JSON массивы.

Вопрос задан более трёх лет назад
461 просмотр

3 комментария

Подписаться 1 Простой 3 комментария

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Проектирование программного обеспечения

Простой
Как правильно в EventDriven?
- 1 подписчик
- 26 сент.
- 99 просмотров
2

ответа
1С

+1 ещё

Средний
Дашборд. Какую методу сбора данных и платформу выбрать для разработки?
- 1 подписчик
- 04 сент.
- 177 просмотров
4

ответа
Проектирование программного обеспечения

Простой
Как в 2025 году приблизиться к полному CAP (не AP/CP/CA), а именно к CAP?
- 6 подписчиков
- 12 авг.
- 1213 просмотров
1

ответ
Проектирование программного обеспечения

+1 ещё

Средний
Сможет ли кластер minio выдержать 60000 клиентов, стримящих данные?
- 2 подписчика
- 03 авг.
- 379 просмотров
3

ответа
C#

+1 ещё

Простой
Как спроектировать домены?
- 3 подписчика
- 26 июл.
- 193 просмотра
0

ответов
Проектирование программного обеспечения

Простой
Как общаются микросервисы в реальных проектах?
- 2 подписчика
- 13 июл.
- 6952 просмотра
5

ответов
PHP

+3 ещё

Простой
Как правильно построить сервис, создающий отложенные задачи на основе расписания из другого сервиса?
- 2 подписчика
- 11 мар.
- 376 просмотров
2

ответа
Проектирование программного обеспечения

Простой
Как рассмотреть все возможные сочетания во времени случайных событий?
- 1 подписчик
- 03 мар.
- 92 просмотра
2

ответа
Проектирование программного обеспечения

Средний
Как обосновать применение реляционной БД на интервью по System Design?
- 1 подписчик
- 02 мар.
- 195 просмотров
5

ответов
Проектирование программного обеспечения

Простой
Какую выбрать оболочку для совместной работы — визуализация архитектуры с возможностью описания PlantUML?
- 1 подписчик
- 27 февр.
- 70 просмотров
2

ответа
Показать ещё Загружается…

Системный аналитик

Data World • Москва

от 180 000 до 210 000 ₽

Golang-разработчик (CRM)

IT-hunter

от 300 000 ₽

Начальник отдела эксплуатации инфраструктуры и цифровых сервисов

Мособлгаз • Москва

До 240 000 ₽

вам точно нужно хранить? может хранить только результат вычислений?
А этот толстый JSON содержит в себе полный набор необходимых данных? Если да, то можно и in-memory хранением обойтись, если у приложения один инстанс.
Zhainar, Возможно так будет правильнее

Answer 1 · 2021-09-17 13:20:31

Большие объёмы данных, в особенности по которым что-то потом надо искать/агрегировать, стоит хранить в бд.
Ну и для операций с БД существуют не только операции insert, но и update.

Ну и собственно корректнее в этом случае говорить не о хранении json, а о хранении данных [полученных из json]

Answer 2 · 2021-09-17 13:19:20

Не уверен, что стоит писать все эти данные в MySQL, ведь каждый раз придется полностью очищать таблицу от старых данные и записывать новые.

А что мешает не удалять, а менять данные?
INSERT ... ON DUPLICATE KEY UPDATE

Answer 3 · 2021-09-17 16:24:20

Задать сначала вопрос нужно, как именно используются полученные данные.

Только ли для чтения или возможны изменения, или изменения только те что приходят от озона (т.е. вопрос, будут ли меняться данные после того как получены от озона)? есть ли поиск и фильтрация данных? Многопользовательский ли доступ или сервис для себя? Ожидается ли серьезная переделка в будущем с расширением функционала или это код на один раз, как часть эксперимента?

А сами данные, в формате, получаемом от озона нужны в совместимом формате (не нужна ли агрегация данных с нескольких запросов?)?

Тут конечно рекомендуют использовать базы данных, но в некоторых случаях это может оказаться оверкилом, и возможно, тебе будет достаточно хранить полученные данные прямо как есть в файлах (не объединяя их), и при запросе, просто считывать их полностью (можно сразу после получения данных, делать по ним индекс и складывать рядом тоже в файл)

Работа с файлами, в случае когда тебе сразу нужно много данных, может оказаться быстрее и на разработку не потратишь много времени.

Но стоит только этим данным начать меняться, или количество данных станет несоизмеримо больше чем однократно запрашиваемые, индексные файлы и код работы с ними станут сложнее и станет проще перенести все данные в sql базу.

p.s. я воспринимаю хранение в файлах как использование nosql база данных, тем более что это очень даже быстро, и даже если хранение данных в режиме много файлов в одной записи

p.p.s. хранение файлов в php формате (var_export) и подключение их include может оказаться самым быстрым способом из всех возможных, для readonly 'баз данных' (json или serialize медленнее в полтора два раза).
upd. мне тут подсказали что есть еще более быстрый сериализатор php - igbinary и входит в поставку того же debian/ubuntu

Answer 4 · 2021-09-17 14:01:12

Сергей Соколов @sergiks

♬♬

NoSQL бд, например, MongoDB, подходят для хранения таких json документов.

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2021-09-17 13:58:32

Developer @samodum

Какой вопрос - такой и ответ

Для хранения больших объёмов данных давно придумали базы данных

Ответ написан более трёх лет назад

Комментировать

Как хранить большие JSON массивы, которые постоянно обновляются (API)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт