Как гарантировать монотонное увеличение значения поля при параллельных транзакциях с максимальным быстродействием?

Question

Владимир @Degot

Как гарантировать монотонное увеличение значения поля при параллельных транзакциях с максимальным быстродействием?

Упрощённо имеются две таблицы:

1. CREATE TABLE dbo.Events(
EventNumber INT AUTOINCREMENT
)
2. CREATE TABLE dbo.ProcessedEvents (
LastEventNumber INT NOT NULL
)

В таблицу Events параллельно вставляют данные разные producer'ы.
Параллельно работает consumer' который делает след. запрос и после обработки сохраняет LastEventNumber:

SELECT TOP 1 
    e.EventNumber as LastEventNumber 
FROM 
    dbo.Events e JOIN dbo.ProcessedEvents pe
         ON e.EventNumber > LastEventNumber  
ORDER BY 
    e.EventNumber ASC

Как избежать проблемы в этом сценарии:

A> BEGIN;
B> BEGIN;
A> INSERT INTO dbo.Events() ... -- EventNumber = 1
B> INSERT INTO dbo.Events()... -- EventNumber = 2
B> COMMIT;

Если в этот момент времени произойдёт SELECT (READ COMMITED), то LastEventNumber станет 2

A> COMMIT;

В результате EventNumber = 1 будет пропущен consumer'ом.
Как избежать этой ситуации без lock'ов и сериализации транзакций, при этом гарантируя очерёдность событий?

Вопрос задан более года назад
384 просмотра

1 комментарий

Подписаться 4 Простой 1 комментарий

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+3 ещё

Простой
Не удается подключить сервер к консоли администрирования 1С. В чем может быть проблема?
- 1 подписчик
- 26 сент.
- 131 просмотр
2

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 234 просмотра
1

ответ
SQL

+3 ещё

Средний
IIS/Lansweeper сильно тормозит из-за аномального числа логонов, внутренний DDoS?
- 1 подписчик
- 15 сент.
- 73 просмотра
0

ответов
SQL

+1 ещё

Простой
Как объединить 2 таблицы обращаясь к одному и тому же полю 2 раза?
- 1 подписчик
- 08 сент.
- 172 просмотра
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 187 просмотров
1

ответ
SQL

+1 ещё

Средний
Как правильно написать запрос в SQL с NOT IN, NOT EXISTS или как-то иначе?
- 1 подписчик
- 28 авг.
- 174 просмотра
0

ответов
SQL Server

+2 ещё

Средний
Может ли тормозить 1С из-за отключенного кэширования записи на диск на сервере с 1С+MSSQL?
- 5 подписчиков
- 20 авг.
- 453 просмотра
3

ответа
SQL

+1 ещё

Простой
Проверка связывания таблиц, как проверить?
- 2 подписчика
- 20 авг.
- 284 просмотра
0

ответов
1С

+1 ещё

Средний
Как правильно протестировать регламентные задания для обслуживания баз данный MSSQL?
- 2 подписчика
- 20 авг.
- 184 просмотра
1

ответ
SQL Server

Средний
Возможно ли в UPDATE «видеть» результат обновления предыдущих строк?
- 2 подписчика
- 01 авг.
- 121 просмотр
1

ответ
Показать ещё Загружается…

Продуктовый аналитик

Selecty

от 250 000 до 320 000 ₽

Solution Architect/Архитектор цифровых решений

НПО Фарватер

от 100 000 до 200 000 ₽

Инженер по сопровождению

Сбер • Санкт-Петербург

До 140 000 ₽

Какая-то весьма противоречивая задачка-то.

У вас есть нумерация, причём последовательная. У вас есть фиксация, причём тоже последовательная. И эти последовательности несинхронны, тогда как вы хотите их синхронизировать. Что совершенно невозможно без либо изменения записей, либо дополнительной внешней синхронизации - ибо коммит фиксирует запись, но нигде не ставит пометку об относительном моменте своего выполнения.

Думаю, будет разумнее, если consumer будет не в отдельную таблицу писать, что он там последнее обработал, а ставить пометку в дополнительное поле таблицы эвентов. Тогда он легко возьмёт на дальнейшую обработку доступную (зафиксированную) запись, без пометки и с минимальным номером.

Answer 1 · 2024-07-30 05:04:53

Всегда в вопросах формулируй исходную задачу а не вопрос по одному из возможных решений, возможно выбран не тот путь?

Если задача следующая: есть много поставщиков событий, которые параллельно сохраняют их в базу данных, есть один обработчик событий, который мониторит новые события и обрабатывает их.

Эта задача решается очень просто - списком необработанных событий, лучше это сделать в отдельной таблице (просто список id из events, даже без индекса, хотя это вопрос длительности их обработки и максимального их количества), при этом монотонность идентификатора уже не требуется, только уникальность.

При появлении записи в events тригером заносится запись в этот лог, а обработчик должен удалять каждый идентификатор после обработки. Если удалять и обрабатывать события по одному, добавив статус - в обработке, то обработчиков может быть много и они могут работать параллельно, иначе же единый обработчик может пакетно запрашивать весь список записей в логе, обрабатывать их и по окончанию обработки каждого удалять по одному (потому что нужно думать, что произойдет если случится в обработчике сбой)

Answer 2 · 2024-07-29 14:35:09

Параллелизм и последовательность - это две противоречивые постановки. Тебе стоит
пересмотреть подход к разработке. Подумай насколько важен для тебя LastEventNumber
как объект наблюдения человеком. Если он меняется чаще чем 10 раз в секунду то
вряд-ли он имеет смысл для публикации.

В паралелльных системах для массовой загрузки например объекты продюсеры захватывают
диапазоны номеров. Диапазо берется из объекта SEQUENCE. Умножатеся допутим на 10000.
И получается что перый продюсер захватил номера с 1 до 10000. Второй - захватит с 10001
до 20000 и так далее.

Да у тебя не будет строгой последовательности но вопросы коллизий ключкей и performance
будут решены сразу и не будет issues в будущем.

Answer 3 · 2024-07-29 14:56:05

А почему транзакция? Или они неявные? Инсерт должен быть атомарным или все таки итерирование сиквенса и следующая вставка не атомарны?
В любом случае, вы решаете не ту задачу. Если идет гонка, значит события одномоменты и нам должно быть без разницы в каком порядке они отработают. Но, раз это важно, значит эти события зависимы, если так, то манипуляции с вставкой не помогут, сегодня вы победите порядок коммитов, а завтра будет гонка при получении сиквенса и тут уже ничего не сделаешь. Зависимые события должны обрабатываться последовательно в одном потоке, т.е. в вашем случае их должен обрабатывать один продюсер, иначе никак, если даже сегодня заработает, то завтра малейшая флуктуация поменяет порядок. Как альтернатива вы можете построить сложную логику проверки зависимостей, но контролировать такой код будет гораздо сложнее.

Как гарантировать монотонное увеличение значения поля при параллельных транзакциях с максимальным быстродействием?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт