Как поведет себя поисковая система?

Допустим есть сайт на котором есть всего 3 страницы на них есть разный какой-то текст
example.com , example.com/page1.html, example.com/page2.html
Ссылки на эти страницы расставлены по цепочки
главная -> page1 -> page2
В robots.txt заблокирована только page1 для всех ботов. И не нет ни каких дополнительных meta тегов ни на одной странице.
Поисковый робот перед индексацией знает только о главной и в других источников(например другие сайты) информации о сайте нет.
Проиндексирует ли робот страницу page2. если ссылка на ее есть только на page1.
Ходит ли робот по ссылкам на заблокированных страницах.
Желательно ответ подтверждать ссылкой на документацию. Для простоты возьмем два поисковика Yandex и Google.
  • Вопрос задан
  • 114 просмотров
Решения вопроса 1
@pcdesign
Робот зайдет везде, куда только можно зайти и проиндексирует все что не запрещено.
А то что запрещено тоже проиндексирует, просто это не будет участвовать в поиске, и он не будет строить снипеты.

И чтобы не быть голословным, вот сайт у которого robots.txt вот такой. То бишь запрещено все:

User-agent: *
Disallow: /


Гоша его прекрасно проиндексировал, но не создал снипетов. Скрин
5daeb44e91f8d258506847.jpeg

Ну, а теперь документация, цитата: "Файл robots.txt сообщает поисковым роботам, какие страницы или файлы на вашем сайте можно или нельзя обрабатывать. Используйте его, чтобы ограничить количество запросов, которые получает ваш сервер, и снизить нагрузку на него. Этот файл не предназначен для того, чтобы запрещать показ веб-страниц в результатах поиска Google. Если вы не хотите, чтобы какие-либо материалы с вашего сайта были представлены в Google, применяйте директивы noindex. Также вы можете создать на сайте разделы, защищенные паролем."
https://support.google.com/webmasters/answer/60626...
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы