Как избежать дублирования при загрузки данных в БД?

Question

beduin01 @beduin01

SQL

Как избежать дублирования при загрузки данных в БД?

Есть таблица в БД. Есть данные с сайта которую я паршу. Данные на сайте меняются совсем не много. Могут появляться новые строки. Они дописываются в продолжение старых. Однако на сайте не бывает больше 30 строк (старые удаляются).

Вопрос: как реализовать дозапись в БД только новых значений? В начале делать SELECT из базы и потом сравнивать с теми значениями которые я туда хочу записать?

Или как это красивее сделать?

И второй вопрос. Как быть, если часть старых значений на сайте получила небольшое обновление, а в БД находится старая версия. Получается проще каждый раз из БД удалять все 30 записей которые там есть и записать туда новые?

Поясню на примере. На сайте каждые день выкладываются измерения. Каждые день - новая строка. Однако бывают случаи, когда вчерашние измерения корректируются задним числом.

Вопрос задан более трёх лет назад
2882 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Продвинутый SQL

5 недель

Далее
Яндекс Практикум

SQL для разработки

4 месяца

Далее
Академия Eduson

SQL-разработчик: тариф Базовый

3 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SQL

Простой
Как получить последнюю запись для определённого поля?
- 1 подписчик
- 03 дек.
- 221 просмотр
2

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 229 просмотров
1

ответ
SQL

Простой
Почему INSERT присваивает только один символ вместо полного значения?
- 2 подписчика
- 29 окт.
- 197 просмотров
2

ответа
SQL

Простой
Правильно ли написан SQL-запрос для вывода клиентов с действующими (непогашенными) кредитами?
- 1 подписчик
- 19 окт.
- 238 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 256 просмотров
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 330 просмотров
1

ответ
SQL

+3 ещё

Средний
IIS/Lansweeper сильно тормозит из-за аномального числа логонов, внутренний DDoS?
- 1 подписчик
- 15 сент.
- 105 просмотров
0

ответов
SQL

+1 ещё

Простой
Как объединить 2 таблицы обращаясь к одному и тому же полю 2 раза?
- 1 подписчик
- 08 сент.
- 214 просмотров
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 223 просмотра
1

ответ
SQL

+1 ещё

Средний
Как правильно написать запрос в SQL с NOT IN, NOT EXISTS или как-то иначе?
- 1 подписчик
- 28 авг.
- 196 просмотров
1

ответ
Показать ещё Загружается…

Database Administrator / DBA

Playerok

от 300 000 ₽

Разработчик баз данных

Greenway Global • Новосибирск

До 250 000 ₽

DWH Analyst

Анвио Парк

от 200 000 до 300 000 ₽

Answer 1 · 2015-01-03 00:58:34

Кроме описанного вами варианта есть еще один - можно в базе создать триггер с активацией перед вставкой строки, и в этом триггере выполнять всю работу по поиску дубля и его коррекции.
Это будет немного быстрее (данные не будут гоняться туда-сюда между БД и приложением).

Answer 2 · 2015-01-03 02:55:29

MySQL? Если корректно определен праймари (либо уникальный) индекс в таблице, можно использовать вместо INSERT/UPDATE простой REPLACE.
Некрасиво :) и немного медленно (т.к. MySQL фактически делает две операции вместо одной), зато просто и старые данные обновлять автоматом не проблема. Да и для 30 записей в пакете некритично в плане быстродействия.
dev.mysql.com/doc/refman/5.5/en/replace.html

Как избежать дублирования при загрузки данных в БД?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт