Scumtron
@Scumtron

Как наименьшей «кровью» парсить каждый час статус 10000 товаров?

Здравствуйте,

Есть необходимость каждый час парсить статус около 10 тысяч товарных позиций. Каждый товар, это отдельная страница со статусом товара. Как это осуществить с наименьшей "кровью", как для сервера донора, так и для нагрузки на сервер, где будет работать парсер?

Благодарю.
  • Вопрос задан
  • 257 просмотров
Пригласить эксперта
Ответы на вопрос 3
Fesor
@Fesor
Full-stack developer (Symfony, Angular)
если есть доступ к серверу донору, то попросить сделать уведомлялку. И вместо парсинга нужно будет только повесить демона который будет принимать какие-то запросы о том что что-то поменялось. Тогда не будет вообще вхолостую трафик гоняться.

В этом случае при изменении товара в очередь записывается уведомление о том что что-то поменялось и возможно инфа о том что именно поменялось. На вашем сервере клиент к очереди слушает оную и как только там что-то появляется забирает на обработку. Это и имплементить относительно несложно, и оверхэда нет.
Ответ написан
sim3x
@sim3x
0.
с наименьшей "кровью"
попросить сделать апи

1. Запрашивать HEAD и проверять изменилась ли страница

Исходя из всего, стоит сделать очередь и размазать запросы максимально равномерно по времени.
Твой сервер мало пострадает от нагрузки, тк ему нужно будет только принимать трафик и парсить

Ну и прикрой проксями свой ип
Ответ написан
gluck59
@gluck59
Виртуальный глюк
Зачем парсить-то?
"Девяностые 2.0" что ли?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы