Как поведет себя поисковая система?

Question

Константин @andronof

Как поведет себя поисковая система?

Допустим есть сайт на котором есть всего 3 страницы на них есть разный какой-то текст
example.com , example.com/page1.html, example.com/page2.html
Ссылки на эти страницы расставлены по цепочки
главная -> page1 -> page2
В robots.txt заблокирована только page1 для всех ботов. И не нет ни каких дополнительных meta тегов ни на одной странице.
Поисковый робот перед индексацией знает только о главной и в других источников(например другие сайты) информации о сайте нет.
Проиндексирует ли робот страницу page2. если ссылка на ее есть только на page1.
Ходит ли робот по ссылкам на заблокированных страницах.
Желательно ответ подтверждать ссылкой на документацию. Для простоты возьмем два поисковика Yandex и Google.

Вопрос задан более трёх лет назад
116 просмотров

Комментировать

Подписаться 2 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

1C-разработчик

8 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Решения вопроса 1

5 комментариев

Константин @andronof Автор вопроса

Яндекс скорей всего сделает так же.
А если мы укажем noindex (и наверное nofollow)на странице page1. То в этом случаи page2 останется не проиндексирована? Или все равно проиндексируется. просто в выдачи не будит совсем page1?

Написано более трёх лет назад
pcdesign @pcdesign

Константин, имхо, второе, все равно проиндексируется. просто в выдаче не будет.

Написано более трёх лет назад
Константин @andronof Автор вопроса

Получается noindex это не тоже самое что запретить страницу в robots.txt.
И если делать не осознавая можно заблокировать страницы даже которые ты не хотел заблокировать.

Написано более трёх лет назад
dollar @dollar

Константин, как ваш вывод следует из вышесказанного? Скорее наоборот, можно НЕ заблокировать страницы, которые хотел заблокировать.

Написано более трёх лет назад
Константин @andronof Автор вопроса

Да наверное вы правы.
Мои выводы будут верны если указать nofollow или none в мета-теге.
https://developers.google.com/search/reference/rob...
Это наверное верно и для Яндекса.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Парсинг

+1 ещё

Простой
Как увеличить охват поисковых фраз Wildberries и ускорить?
- 2 подписчика
- 23 сент.
- 202 просмотра
0

ответов
Поисковая оптимизация

+3 ещё

Средний
Yandex не индексирует изображения на сайте, почему?
- 2 подписчика
- 01 июл.
- 856 просмотров
2

ответа
Поисковая оптимизация

+2 ещё

Средний
Нужно ли как-то решать проблему в файле robots (Правило, которое не учитывается Googlebot: host)?
- 1 подписчик
- 25 июн.
- 239 просмотров
2

ответа
Поисковая оптимизация

+1 ещё

Простой
Улучшают ли позиции в ПС разные «оптимизаторы» текстов?
- 1 подписчик
- 19 июн.
- 138 просмотров
3

ответа
Поисковые системы

Простой
Как подменить домен в поисковике?
- 2 подписчика
- 27 мая
- 155 просмотров
2

ответа
Поисковые системы

Простой
Какие книги посоветуете для изучение того как работает поисковая система?
- 1 подписчик
- 02 апр.
- 153 просмотра
1

ответ
htaccess

+2 ещё

Простой
Вебмастер: Страницы-дубли с GET-параметрами?
- 1 подписчик
- 27 мар.
- 232 просмотра
4

ответа
Поисковые системы

Средний
Как найти информацию о файле?
- 1 подписчик
- 25 мар.
- 89 просмотров
0

ответов
Поисковая оптимизация

+3 ещё

Простой
Какой путь исправления проблемы (sitemap.xml с дублями) для Яндекс поиска правильнее?
- 1 подписчик
- 27 февр.
- 165 просмотров
5

ответов
Поисковые системы

Простой
Полезные инструменты для проверки мошенников?
- 2 подписчика
- 15 февр.
- 676 просмотров
3

ответа
Показать ещё Загружается…

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Backend developer

Creative Code

До 160 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Answer 1 · 2019-10-22 10:50:56

Робот зайдет везде, куда только можно зайти и проиндексирует все что не запрещено.
А то что запрещено тоже проиндексирует, просто это не будет участвовать в поиске, и он не будет строить снипеты.

И чтобы не быть голословным, вот сайт у которого robots.txt вот такой. То бишь запрещено все:

User-agent: *
Disallow: /

Гоша его прекрасно проиндексировал, но не создал снипетов. Скрин

Ну, а теперь документация, цитата: "Файл robots.txt сообщает поисковым роботам, какие страницы или файлы на вашем сайте можно или нельзя обрабатывать. Используйте его, чтобы ограничить количество запросов, которые получает ваш сервер, и снизить нагрузку на него. Этот файл не предназначен для того, чтобы запрещать показ веб-страниц в результатах поиска Google. Если вы не хотите, чтобы какие-либо материалы с вашего сайта были представлены в Google, применяйте директивы noindex. Также вы можете создать на сайте разделы, защищенные паролем."
https://support.google.com/webmasters/answer/60626...

Как поведет себя поисковая система?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт