Как лучше всего парсить базу данных?

Question

Лелуш Ламперуш @Lelush

Как лучше всего парсить базу данных?

Делаю запрос к базе данных сайта и получаю следующий json ответ:

{
 "info": [
        {
            "i": "1234567", ### Уникальный идентификатор
        },
        {
            "i": "7654321", ### Уникальный идентификатор
        },
        {
            "i": "1957833", ### Уникальный идентификатор
        },
        ]
}

Суть в том , что таких вот "Уникальных идентификаторов" порядка 25.000 , естественно каждый единственный в своём роде и не повторяется.

База очень часто обновляется , какие-то идентификаторы пропадают , какие-то появляются , место появления рандомно ( может появиться как в начале , так и в середине или в конце )

Задача всего одна : Найти наилучший способ быстро найти все НОВЫЕ значения , добавленные за последнее время. ( Проще говоря посмотреть , что нового появилось в таблице , а что исчезло спустя пару минут )

Задача кажется простой , но я раньше не работал с таким объёмом данных.
На ум сразу приходит мысль просто добавить все эти идентификаторы в свою базу SQliteStudio , а после ... просто каждый идентификатор из БАЗЫ САЙТА сравнивать с моей базой ? ... Если в моей базе идентификатора нет - добавить в мою базу. Если в БАЗЕ САЙТА нет идентификатора , а в моей есть - удалить из моей базы.

Но , товарищи , не стреляю ли я из пушки по воробьям?
Может быть есть более утончённый метод или функция , чем простой поиск по 1 строке и сравнение с моей базой ?

Скорость важна , поэтому хочу услышать ваши мнения : много ли у меня вариантов решения ?

Вопрос задан более трёх лет назад
133 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 1 подписчик
- 13 часов назад
- 33 просмотра
0

ответов
Python

+3 ещё

Простой
Авто торговля на байбите?
- 1 подписчик
- 15 мая
- 348 просмотров
1

ответ
Python

Простой
Как научиться извлекать математическую модель для решения задач на программирование?
- 1 подписчик
- 14 мая
- 254 просмотра
2

ответа
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 286 просмотров
1

ответ
SQLite

Простой
Стоит ли использовать в backend базу данных SQLite?
- 1 подписчик
- 16 апр.
- 244 просмотра
2

ответа
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 282 просмотра
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 321 просмотр
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 104 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 120 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 108 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2021-01-31 18:16:33

25000 - это ни о чем. Заргужаете JSON, делаете set из идентификаторов и делаете разницу со своим set'ом (хранить, в общем, неважно где)

Как лучше всего парсить базу данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт