Какой уровень изоляции транзакций выбрать для парсинга?

Question

khodos_dmitry @khodos_dmitry

PHP

Какой уровень изоляции транзакций выбрать для парсинга?

Скрипт выполняется кроном раз в минуту. Берет 10 страниц и парсит. Нужно, чтобы эти 10 страниц блокировались на время выполнения скрипта. Чтобы следующий скрипт не взял себе парсить некоторые из этих страниц. А следующий скрипт брал не заблакированные страницы.
После того, как страница спарсится, соответствующее значение подставляется в столбец parse в таблице.
Или для этого транзакции не подходят?

Вопрос задан более трёх лет назад
112 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

Язык программирования PHP

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 1

6 комментариев

khodos_dmitry @khodos_dmitry Автор вопроса

транзакциями это сделать нельзя?

Написано более трёх лет назад
dmitriy @dmitriylanets

транзакции не имеют отношение к парсингу, транзакции организуйте в 3 этапе

Написано более трёх лет назад
khodos_dmitry @khodos_dmitry Автор вопроса

еще один вопрос. Если скрипт не успел спарсить 10 страниц и закрылся. Тогда состояние work останется.

Написано более трёх лет назад
dmitriy @dmitriylanets

вы можете обработать условие "не успел спарсить 10 страниц и закрылся" например exception и сменить состояние на ERROR, или вернуть обратно в READY
тогда будет повторно запрошен на скачку

Написано более трёх лет назад
khodos_dmitry @khodos_dmitry Автор вопроса

diamond: но лучше транзакции на каждую страницу мне кажется. Если COMMIT не произошел, то вся транзакция отменяется?

Написано более трёх лет назад
dmitriy @dmitriylanets

если вы хотите за один запрос спарсить страницу, вытащить данные и добавить в базу то да через транзакции, но из практики я бы порекомендовал сперва нацелится на скачивание страниц в локальное хранилище

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
Как отдать ответ клиенту без ожидания завершения скрипта?
- 1 подписчик
- 50 минут назад
- 27 просмотров
2

ответа
PHP

Простой
Как в PHP вернуть NULL по ссылке?
- 1 подписчик
- 8 часов назад
- 83 просмотра
1

ответ
PHP

Простой
Как декодировать/закодировать спец символы в get запросе?
- 1 подписчик
- 18 дек.
- 131 просмотр
1

ответ
PHP

Простой
Как вызвать curl и не ждать ответ?
- 1 подписчик
- 16 дек.
- 308 просмотров
2

ответа
PHP

Простой
Как сделать это?
- 1 подписчик
- 11 дек.
- 293 просмотра
2

ответа
PHP

+1 ещё

Простой
Как найти значение в XML?
- 2 подписчика
- 06 дек.
- 242 просмотра
1

ответ
PHP

+1 ещё

Простой
Как на PHP пушнуть в ассоциативный массив?
- 1 подписчик
- 05 дек.
- 231 просмотр
1

ответ
PHP

Простой
Проблема с PDO LIKE?
- 1 подписчик
- 04 дек.
- 179 просмотров
0

ответов
PHP

Простой
При попытке регистрации на сайте выдаёт ошибку A PHP Error was encountered. Что делать?
- 1 подписчик
- 03 дек.
- 160 просмотров
2

ответа
PHP

Простой
Как исправить include в php 8.3?
- 1 подписчик
- 02 дек.
- 325 просмотров
3

ответа
Показать ещё Загружается…

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

TeamLead PHP (Symfony)

AGIMA • Москва

от 210 000 ₽

Answer 1 · 2017-04-14 11:08:45

можно через базу организовать, пусть фиксируеются страницы которые в работе, паралельный скрипт может делать проверку на наличие в работе и пропускать.
то есть я бы разделил задачу на два этапа сбор информации о страницах которые нужно парсить и собственно парсинг этих страниц, в момент работы можно менять статус страницы READY, WORK,COMPLETE
соответственно параллельные скрипты должны получать страницы для парсинга в READY состоянии

хотя даже и добавил бы третий этап это получение данных страниц расположенных локально:
1. получение пула страниц
2. скачка страниц в локальное хранилище
3. извлечение информации из локальных страниц

Какой уровень изоляции транзакций выбрать для парсинга?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт