@MariaFirst

Как обойти блокировку сайта от ботов для его парсинга в Screaming Frog?

При парсинге сайта в Screamong Frog у многих страниц выдаётся код 403. Статус-чекеры также выдают 403. При этом в браузере эти страницы нормально прогружаются и участвуют в ранжировании.
Я пробовала снизить количество потоков, менять User-Agent. Ничего не помогает. Какие есть ещё способы обхода блокировки?
  • Вопрос задан
  • 340 просмотров
Пригласить эксперта
Ответы на вопрос 4
Grinvind
@Grinvind
Помогаю увеличивать трафик с поисковых систем
0. У большого сайта, на котором настроена защита — крайне сложно пробить её лягушкой.
1. Попробовать парсить с другого впн, например, через tunnelbear.
2. Заказать парсинг на kwork.
3. Попробовать парсинг через a-parser со сменой проксей.
Ответ написан
Комментировать
pro100taa
@pro100taa
Здравствуйте!

В robots.txt есть блокировка Screaming Frog или чего-то другого?

Пробовали снизить время парсинга страниц?
Ответ написан
Комментировать
Mike_Ro
@Mike_Ro
Python, JS, WordPress, SEO, Bots, Adversting
Какие есть ещё способы обхода блокировки?

- Ip из базы.
- Количество визитов с одного ip за промежуток времени.
- Проверка на безголовый браузер.
- Быстрая базовая проверка на всякие популярные фреймворки для тестов (selenium, puppeteer итп).
- Проверка на отпечаток устройства, в основном - на железо.
- Если с парсим от лица сенсорного устройства - проверка атрибуты сенсорного устройства.
Ответ написан
Комментировать
@Gabib
Попробуй в настройках поменять поискового робота, на гугловского или от яндекса
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы