Как хранить большие JSON массивы, которые постоянно обновляются (API)?

Question

Даниил Сидоров @DaniLaFokc

Проектирование программного обеспечения

Как хранить большие JSON массивы, которые постоянно обновляются (API)?

Разрабатываю сервис, который работает с API Wildberries и Ozon. Функционал простой - получил данные, посчитал и вывел на страницу. Но есть проблема - не совсем понимаю, как лучше всего организовать хранение полученных данных.

Я рассуждал так - делать запрос к API при каждом обновлении страницы нецелесообразно, к тому же попаду на "Too many requests". Значит данные надо обновлять в фоне, например каждые 15 минут, поэтому создам CRON-задание. Каждые 15 минут я буду получать JSON с 10 000+ записей. Как его лучше хранить? Не уверен, что стоит писать все эти данные в MySQL, ведь каждый раз придется полностью очищать таблицу от старых данные и записывать новые. Может тогда хранить в файлах?

Кто имел опыт разработки подобных проектов, пожалуйста подскажите как лучше сохранять большие JSON массивы.

Вопрос задан более двух лет назад
358 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Фронтенд

+2 ещё

Простой
Как правильно разделить frontend и backend на проекте с переездом на другой стек?
- 2 подписчика
- 22 апр.
- 147 просмотров
1

ответ
Проектирование программного обеспечения

Простой
На чём писать клиентское приложение с GUI?
- 7 подписчиков
- 18 апр.
- 10551 просмотр
17

ответов
Проектирование программного обеспечения

Простой
Как сделать проект-конструктор с зависимостями на Django с переделкой существующей админки?
- 1 подписчик
- 13 апр.
- 94 просмотра
0

ответов
Проектирование программного обеспечения

Простой
Как разделять относительно одинаковые скрипты между клиентами?
- 2 подписчика
- 03 апр.
- 206 просмотров
3

ответа
Программирование

+2 ещё

Простой
Альтернативы SourceTrail?
- 3 подписчика
- 28 мар.
- 232 просмотра
1

ответ
Мобильная разработка

+1 ещё

Средний
Дальнейшие этапы в создании Приложения после создания прототипа?
- 3 подписчика
- 25 мар.
- 1294 просмотра
8

ответов
Django

+2 ещё

Простой
Веб-приложение на Django и фоновый процесс обработки данных, как сделать?
- 1 подписчик
- 23 мар.
- 150 просмотров
3

ответа
Arduino

+1 ещё

Средний
ARDUINO принципиальная схема подкл. модулей при удаленном доступе посредством Wi-Fi (регулировка яркости светодиода) как сделать?
- 1 подписчик
- 15 мар.
- 72 просмотра
1

ответ
Проектирование программного обеспечения

+1 ещё

Простой
Какой брокер сообщений выбрать под задачу — принять данные по api и записать в базу?
- 3 подписчика
- 07 мар.
- 200 просмотров
2

ответа
Docker

+1 ещё

Простой
Как одновременно работать с одной папкой двум копиям приложения?
- 1 подписчик
- 05 мар.
- 158 просмотров
2

ответа
Показать ещё Загружается…

Разработчик программного обеспечения авионики

Котлин-Новатор • Санкт-Петербург

от 50 000 до 150 000 ₽

Ведущий разработчик программного обеспечения авионики

Котлин-Новатор

от 150 000 до 250 000 ₽

Программист SQL

САМО-Софт • Москва

До 220 000 ₽

Необходимо сверстать приложение согласно макету Figma используя React

26 апр. 2024, в 22:22

1500 руб./за проект

Написать модуль подключения матрицы Sony к ПЛИС (Verilog)

26 апр. 2024, в 21:30

15000 руб./за проект

8266 f12 требуется сделать ревью и оптимизировать работу

26 апр. 2024, в 20:42

2000 руб./за проект

вам точно нужно хранить? может хранить только результат вычислений?
А этот толстый JSON содержит в себе полный набор необходимых данных? Если да, то можно и in-memory хранением обойтись, если у приложения один инстанс.
Zhainar, Возможно так будет правильнее

Answer 1 · 2021-09-17 13:20:31

Большие объёмы данных, в особенности по которым что-то потом надо искать/агрегировать, стоит хранить в бд.
Ну и для операций с БД существуют не только операции insert, но и update.

Ну и собственно корректнее в этом случае говорить не о хранении json, а о хранении данных [полученных из json]

Answer 2 · 2021-09-17 13:19:20

Не уверен, что стоит писать все эти данные в MySQL, ведь каждый раз придется полностью очищать таблицу от старых данные и записывать новые.

А что мешает не удалять, а менять данные?
INSERT ... ON DUPLICATE KEY UPDATE

Answer 3 · 2021-09-17 16:24:20

Задать сначала вопрос нужно, как именно используются полученные данные.

Только ли для чтения или возможны изменения, или изменения только те что приходят от озона (т.е. вопрос, будут ли меняться данные после того как получены от озона)? есть ли поиск и фильтрация данных? Многопользовательский ли доступ или сервис для себя? Ожидается ли серьезная переделка в будущем с расширением функционала или это код на один раз, как часть эксперимента?

А сами данные, в формате, получаемом от озона нужны в совместимом формате (не нужна ли агрегация данных с нескольких запросов?)?

Тут конечно рекомендуют использовать базы данных, но в некоторых случаях это может оказаться оверкилом, и возможно, тебе будет достаточно хранить полученные данные прямо как есть в файлах (не объединяя их), и при запросе, просто считывать их полностью (можно сразу после получения данных, делать по ним индекс и складывать рядом тоже в файл)

Работа с файлами, в случае когда тебе сразу нужно много данных, может оказаться быстрее и на разработку не потратишь много времени.

Но стоит только этим данным начать меняться, или количество данных станет несоизмеримо больше чем однократно запрашиваемые, индексные файлы и код работы с ними станут сложнее и станет проще перенести все данные в sql базу.

p.s. я воспринимаю хранение в файлах как использование nosql база данных, тем более что это очень даже быстро, и даже если хранение данных в режиме много файлов в одной записи

p.p.s. хранение файлов в php формате (var_export) и подключение их include может оказаться самым быстрым способом из всех возможных, для readonly 'баз данных' (json или serialize медленнее в полтора два раза).
upd. мне тут подсказали что есть еще более быстрый сериализатор php - igbinary и входит в поставку того же debian/ubuntu

Answer 4 · 2021-09-17 14:01:12

Сергей Соколов @sergiks

♬♬

NoSQL бд, например, MongoDB, подходят для хранения таких json документов.

Ответ написан более двух лет назад

Комментировать

Answer 5 · 2021-09-17 13:58:32

Developer @samodum

Какой вопрос - такой и ответ

Для хранения больших объёмов данных давно придумали базы данных

Ответ написан более двух лет назад

Комментировать

Как хранить большие JSON массивы, которые постоянно обновляются (API)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт