Синхронизация: Удаление данных

Question

winbackgo @winbackgo

MySQL

Синхронизация: Удаление данных

Имеются две таблицы (T1 и T2). Таблицы находятся в разных базах и на разных серверах. Данные из T1 синхронизируются с T2. Процесс синхронизации простой, из T2 берется дата последней записи, из T1 извлекаются данные обновленные после этой даты, потом вставляются/обновляются в T2.
Как бы реализовать удаление данных, которых нет в T1? Записей много, несколько миллионов. Операцию надо производить регулярно. У таблиц есть общее поле ID.
Самый просто вариант это перебрать все записи и вычислить пропущенные ID, но вот как сделать это с минимальными накладными расходами?

UPD: Структуры таблиц разные, данные используются в двух совершенно разных проектах. Репликация тут не пойдет. Скажем сервер где T2 работает как парсер и из T1 может только читать. T1 же о T2 вообще ничего не знает.

UPD2:
Пока что только дошел вот до такого запроса:

SET @counter=0;
SELECT 
ID,
IF(@counter+1 != ID, CONCAT(@counter+1, '-', ID-1), NULL) AS missing,
@counter:=ID
FROM T1 ORDER BY ID;

Думаю как теперь извлечь не NULL данные, если бы была возможность записи то можно было бы создать временную таблицу, но права есть только на чтение. Еще минус в том что полученные missing надо парсить и делать из них диапазон.

Вопрос задан более трёх лет назад
2701 просмотр

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 5

2 комментария

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 127 просмотров
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 103 просмотра
1

ответ
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 362 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 245 просмотров
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 214 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 223 просмотра
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 316 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 166 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 221 просмотр
1

ответ
MySQL

Средний
Почему время в mysql опережает на пару секунд?
- 4 подписчика
- 06 янв.
- 447 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2012-08-06 12:30:17

gaelpa @gaelpa

Написать триггер, записывающий ID удаленной/измененной записи таблицы T1 в таблицу T1del.

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2012-08-06 12:24:36

Fortop @Fortop

Tech/Team lead

Почему не настроить репликацию?

Ответ написан более трёх лет назад

2 комментария

Answer 3 · 2012-08-06 14:25:30

Немного наивный вариант — проверять строго дельту. Т. е.

delete from t2 where record_time >= sync_time and id not in (select id from t1 where record_time >= sync_time)

если синхронизации относительно частые (дельты невелики) — будет неплохо.

Answer 4 · 2012-08-06 17:50:53

dbmaster @dbmaster

Кроме предложенных вариантов есть ещё один — сделать завести флаг deleted в таблице T1.

Ответ написан более трёх лет назад

2 комментария

Answer 5 · 2012-08-08 01:13:18

как сделать это с минимальными накладными расходами?

Попробуйте простое решение в лоб, и измерьте фактические накладные расходы. Может быть, сравнительное время выполнения и возможная частота запусков вас устроят сразу?

Может быть, после 1-2 запусков сервер так или иначе «прогреется» и станет обрабатывать эти операции быстрее?

Синхронизация: Удаление данных

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт