Параллельные запросы к СУБД во время отсутствия кэша записи — какой алгоритм?

Question

Северное Сияние @php666

PHP-макака

Параллельные запросы к СУБД во время отсутствия кэша записи — какой алгоритм?

Не могу найти информацию по этой теме, нашел лишь одну статью:

Если есть запрос, который выполняется 10 секунд, ttl для его кэша 1 час.

Когда проходит это время, данные в кэше удаляются.

В первые 10 секунд после этого происходит ситуация, когда несколько пользователей одновременно вызывают этот запрос. Это может привести к катастрофическим последствиям, так как в течение 10 секунд может быть несколько сотен или тысяч таких вызовов.

Чтобы этого избежать, необходимо использовать специальную методику дублирования. Для каждого тяжелого запроса создается не один, а два ключа — ttl и ttl +10 sec.

В момент, когда в кэше удаляются данные, необходимо сначала записать в основной ключ значение из запасного, а только потом приступить к выполнению SQL запроса.

Проблема описана, но решение не ясно, т.к. смущает фраза "В момент, когда в кэше удаляются данные, необходимо сначала...".

Первое. Кэш может быть удален самим memcached по истечению времени и вышеописанный алгоритм просто "некому" применять.
Второе. Я из клиентского кода не занимаюсь удалением данных кэша, это всё возложено на memcache, на expire значение элемента данных и не знаю, когда данные из кэша будут удалены. Предполагаю, что тут идёт речь о том, что под "удалением данных" инициируется некий CRUD данных, т.е. CRUD должен инициировать вышеописанный процесс.

Но делать этого не хочется на уровне CRUD-а, т.е. не хочется, что бы кэш менялся по данному событию, в идеале - просто по установленному expire значению.

Как сделать правильно?

Вопрос задан более трёх лет назад
340 просмотров

Комментировать

Подписаться 5 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Решения вопроса 1

2 комментария

Северное Сияние @php666 Автор вопроса

Вы что то вроде этого имеете в виду - отслеживать какой-то PID?

function foo()
{
        // проверяем, что процесса перегенерации кэша ещё нет
        if (!checkExistProcess('key')) {
            // отмечаем, что процесс перегенерации кэша пошёл
            startProcess('key');

            $data = getdatafromDb();
            $memcache->set('key', $data, 60 * 60);

            // снимаем отметку
            endProcess('key');
        } else {
            // процесс есть, ждём, пока завершится
            do {
                time_nanosleep(0, 500000000);
            } while(checkExistProcess('key'));

            $data = $memcache->get('key');
        }

        return $data;
}

Написано более трёх лет назад

rPman @rPman

Северное Сияние, да, только в цикле ожидания нужно эту метку проверять

Можно совместить хранение кеша с этой пометкой, определив какое-нибудь магическое значение кеша (например null) которое сигнализирует о том что кеш в процессе генерации, при котором нужно ждать окончание

function foo()
{
        // проверяем, что процесса перегенерации кэша ещё нет (предполагается что если нужно перегенерировать кеш - то записи в memchached уже нет)
        if (!checkExistProcess('key')&&!isnull($memcache->get('key'))) {
            // отмечаем, что процесс перегенерации кэша пошёл
            $memcache->set('key', null, 10 ); // время жизни этого ключа должно быть маленьким, но не меньше худшего времени генерации (если будет фейл, чтобы ожидающие процессы не ждали вечно)
            $data = getdatafromDb();
            // сохраним кеш это так же отметит окончание генерации
            $memcache->set('key', $data, 60 * 60);
        } else {
            // процесс есть, ждём, пока завершится (тут так же можно продумать условие окончания ожидания перегенерации кеша, но времени жизни пометки более чем достаточно)
            while(checkExistProcess('key')&&isnull($memcache->get('key') )){
                time_nanosleep(0, 100000000);
            };

            $data = $memcache->get('key');
        }

        return $data;
}

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как исправить ошибки шаблона WP?
- 1 подписчик
- 14 июл.
- 127 просмотров
1

ответ
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 2 подписчика
- 17 июн.
- 214 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 473 просмотра
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 253 просмотра
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 199 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 159 просмотров
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2476 просмотров
8

ответов
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 349 просмотров
6

ответов
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 191 просмотр
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 252 просмотра
2

ответа
Показать ещё Загружается…

Answer 1 · 2021-03-31 05:14:41

Проблема не в кеше и его экспирации, проблема именно в генерации контента, когда данных в кеше нет либо когда требуется его перегенерация при изменениях данных.

Определенно, необходимо отлавливать эту ситуацию и останавливать генерацию контента на всех страницах кроме одной, буквально - 'тормозить, чтобы двигаться быстрее'.

Вариант реализации - метод, в котором генерируется контент, используя in memory key-value базу данных (наверное лучше не memcached, так как оно не гарантирует сохранность данных, хотя если администрировать с оглядкой на это, почему нет, можно предложить складывать в memcache определенное значение перед стартом генерации, и проверять именно на него), отмечает начало и конец этого процесса, со ссылкой на идентификатор этих данных (страница сайта например), т.е. запись появляется только на время генерации данных, и при наличии записи тормозит процесс.

Логично было бы не делать случайный sleep для этого, а ждать ивент от соседнего процесса, в идеале средствами этой базы данных

Answer 2 · 2021-03-31 06:58:51

Rsa97 @Rsa97

Для правильного вопроса надо знать половину ответа

https://habr.com/ru/post/43540/

Ответ написан более трёх лет назад

2 комментария

Параллельные запросы к СУБД во время отсутствия кэша записи — какой алгоритм?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт