Matthew777
@Matthew777

Где поисковые роботы берут адреса для сканирования?

У меня нет понимания, откуда поисковые системы берут адреса страниц для парсинга и индексации? Они брутфорсят, или есть определенное место, где лежат все адреса опубликованных в сети страниц? Могу ли я узнать все доступные страницы определенного домена?
  • Вопрос задан
  • 93 просмотра
Решения вопроса 1
DevMan
@DevMan
пользователи сами загружают список страниц своего сайта для начальной индексации.
плюс робот периодически парсит линки со страниц, которые у него уже в индексе, и дальше бегает по ним и т.д.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
pro100taa
@pro100taa
Добавлю, что в некоторых cms (Wordpress) есть встроенный пинг, который сообщает в службы обновления при создании и обновлении страниц. Ссылка.
Ответ написан
Комментировать
@andrey_id123456789
Могу ли я узнать все доступные страницы определенного домена?


Это называется карта сайта, например:
https://qna.habr.com/sm-questions.xml
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы