Возможна ли групповая вставка с проверкой на уникальность в PostgreSql?

Question

DamskiyUgodnik @DamskiyUgodnik

PostgreSQL

Возможна ли групповая вставка с проверкой на уникальность в PostgreSql?

Всем привет!
Задача:

Распарсить большое количество csv файлов с данными, и залить всё в PostgreSql.

Дополнительные условия:

Парсер на python (csv, psycopg2)
Структура таблицы - первичный ключ, текстовое поле, численные поля (порядка 10 штук)
Текстовое поле должно быть уникальным
Текстовое поле в среднем имеет длину порядка 100 символов
По числовым полям будут выборки (нужны индексы)
Прогнозируемый объём данным ~ 2,5-3 млрд строк
На момент записи данных, чтений из таблицы не будет (т.е. данные будут периодически заливаться пачками а потом по обновлённым данным планируется строить отчёты)

Что пробовал:

Сейчас сделал решение в лоб, проверка наличия через SELECT и INSERT (заливается по одной записи) в случае необходимости, т.к. решение однопоточное, то этого вполне хватает с точки зрения логики (на всякий случай есть индекс с ограничением на уникальность).
Пробовал делать без селекта с "откатом", по скорости сильно большой разницы не заметил, только появляется "головняк" с настройкой логированием запросов, которые "откатились" (возможно просто у меня не хватает опыта в правильной настройке постгри).

Проблемы:

После вставки ~50 млн записей, сильно деградирует производительность

Идеи:

Попробовать групповую вставку с контролем уникальности через индекс, но тут не понятно, как это вообще можно сделать? ведь например если мы вставляем 50 срок и из них одна дубль, "откатывается" весь запрос.

Собственно вопрос - как это сделать быстро? Есть подозрение, что задача довольно простая и часто встречающаяся, ну и умные люди уже придумали элегантное решение.

Вопрос задан более трёх лет назад
169 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик расширенный

14 месяцев

Далее
Skillbox

Курс Java-разработчик

4 месяца

Далее
Нетология

SQL и получение данных

2 месяца

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Windows

+1 ещё

Средний
Почему не создается логическая репликация на Windows 10 и падает воркер?
- 5 подписчиков
- вчера
- 166 просмотров
1

ответ
PostgreSQL

Простой
Как сделать поиск определенного значение в строке отобранной SELECT * FROM?
- 1 подписчик
- 13 нояб.
- 165 просмотров
2

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 1 подписчик
- 11 нояб.
- 149 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 239 просмотров
2

ответа
PostgreSQL

Средний
Как получить данные и обновить записи в таблицах-источниках?
- 1 подписчик
- 05 нояб.
- 109 просмотров
1

ответ
PostgreSQL

Простой
Как отредактировать строку в таблице, не имеющей primary key?
- 1 подписчик
- 10 окт.
- 298 просмотров
5

ответов
PostgreSQL

+1 ещё

Средний
Как установить Postgres в Ubuntu от 1с (c ИТС)?
- 1 подписчик
- 22 сент.
- 228 просмотров
2

ответа
PostgreSQL

Простой
Есть ли способ логировать работу процедуры?
- 1 подписчик
- 12 сент.
- 151 просмотр
2

ответа
PostgreSQL

Простой
Как обновить версию postgres в кластере patroni?
- 1 подписчик
- 11 сент.
- 133 просмотра
1

ответ
PostgreSQL

Средний
VACUUM в PostgreSQL 15 уже несколько суток в фазе vacuuming indexes что можно сделать?
- 6 подписчиков
- 27 авг.
- 929 просмотров
2

ответа
Показать ещё Загружается…

Специалист технической поддержки Oracle Database и PostgreSQL

Омега • Москва

от 90 000 до 120 000 ₽

GO разработчик

SMALL

от 220 000 до 300 000 ₽

Python разработчик

АВ Софт • Москва

от 200 000 ₽

Привет, про структуру не совсем понятно. А если то поле что может повторяться просто сделать в базе уникальным? База сама не даст вставить повторы, если я правильно понял тему.

Answer 1 · 2020-08-15 08:19:51

Сергей Горностаев @sergey-gornostaev Куратор тега PostgreSQL

Седой и строгий

Вашу проблему решает upsert.

Ответ написан более трёх лет назад

Комментировать

Возможна ли групповая вставка с проверкой на уникальность в PostgreSql?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт