Как увеличить скорость скрипта работающего с БД?

Question

beduin01 @beduin01

Как увеличить скорость скрипта работающего с БД?

Есть скрипт на Python, который берет данные из одной БД, проверяет есть ли они во второй БД. Если их там нет (проверка по GUID) то вставляет их туда.

Проблема в том, что скрипт работает очень медленно. Думаю как повысить скорость его работы. Первое что приходит на ум -- сделать вборку по ID, разбить их на две половины и потом в два потока проверять гуиды в другой БД. Но может есть варианты получше?

На всякий случай уточню, что БД не идентичны и и нужно синхронизировать только определенные поля.

БД PostgreSQL

Вопрос задан более трёх лет назад
457 просмотров

1 комментарий

Подписаться 2 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

6 комментариев

beduin01 @beduin01 Автор вопроса

У них структура таблиц чуток отличается. Не все поля из второй есть в первой.

Написано более трёх лет назад
sim3x @sim3x

beduin01: значит нормализовать структуру вцелом

Написано более трёх лет назад
beduin01 @beduin01 Автор вопроса

sim3x: нельзя( может я не правильно понял, но у нас нельзя их сделать 1к1 т.к. мы не можем в тестовой среде использовать рабочие данные (безопасность и все дела)

Написано более трёх лет назад
sim3x @sim3x

beduin01: тогда при чем тут перенос данных?

Написано более трёх лет назад
beduin01 @beduin01 Автор вопроса

sim3x: нужно из БД синхронизировать только определенные поля, а не все. Если я правильно понимаю вы предлагаете сделать структуру БД одинаковой так?

Написано более трёх лет назад
sim3x @sim3x

beduin01: я предлагаю тебе дополнить вопрос уточнением, что речь идет о какой-то странной процедуре создания слепка рабочей БД для использования в виде тестовой БД

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Средний
Корректно оценить стоимость разработки системы авто-покупки для e-commerce?
- 1 подписчик
- 35 минут назад
- 7 просмотров
0

ответов
Python

Простой
Существует ли менеджер виртальных окружений для python, который хранит все пакеты в одном месте?
- 1 подписчик
- 6 часов назад
- 69 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 196 просмотров
0

ответов
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 55 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 175 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 185 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 128 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 222 просмотра
0

ответов
PostgreSQL

Простой
Почему не рабоатет npx prisma generate?
- 1 подписчик
- 02 дек.
- 205 просмотров
2

ответа
Windows

+1 ещё

Средний
Работа PostgreSQL на процессорах с гетерогенной архитектурой под Windows?
- 2 подписчика
- 29 нояб.
- 427 просмотров
4

ответа
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

а если нет, но на момент вставки есть?

Answer 1 · 2016-11-29 16:23:15

Возьмите профилировщик и посмотрите, на чём именно теряете время.

О каком классе СУБД вообще речь?
Например, если речь о транзакционной РСУБД, строки объёмные, то можно сделать так:
create temporary table updatetable(guid uuid not null)
пачками этак по 1000 guid вычитываете guid'ы из источника и записываете в эту временную табличку.
select guid from updatetable where not exists (select 1 from normaltable where normaltable.guid = updatetable.guid)
Так получили список guid, которых в целевой БД нет. Сходили в источник за полной версией всех данных этих guid, пачками записали в целевую БД.

Answer 2 · 2016-11-29 16:23:37

sim3x @sim3x

Есть и получше
Соединить две БД в одну или связаться их на уровне СУБД

Ответ написан более трёх лет назад

6 комментариев

Как увеличить скорость скрипта работающего с БД?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт