Задать вопрос

Как обойти редирект при парсинге?

Делал я как-то пет проект в виде парсера, который парсит сайты с категорями домашних животных (котиков) и потом отпраляет информацию в тг чат. Все получилось, спасибо хабру за помощь. Но сейчас столкнулся с проблемой, что в один момент тг бот начал в чат спамить какие-то тапки, халаты. Оказалось, что на одном из сайтов он не котиков парсит, а какие-то другие разделы. Я попробовал в запросе указать просто название сайта типа google.com (без указания категории) - эффект такой же. Я так понимаю, что меня при запросе редиректят.
1.Это можно как-то обойти, при учете, что бот хостится на хероки
2.Мой безобидный парсер, который раз в 7 минут парсит одну страницу действительно как-то мешает сайту?
для парсинга использую puppeteer
  • Вопрос задан
  • 356 просмотров
Подписаться 1 Простой 6 комментариев
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы