Как запретить доступ к url поисковым роботам?

Question

freshcot @freshcot

Как запретить доступ к url поисковым роботам?

Здравствуйте, собственно, вопрос описан в сабже, вот robots.txt:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Allow: /wp-content/uploads/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /xmlrpc.php
Disallow: /template.html
Disallow: /wp-content/
Disallow: /tag/
Disallow: /category/
Disallow: /archive/
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Disallow: /%D1%81%D0%B5%D0%BA%D1%80%D0%B5%D1%82%D1%8B-%D1%81%D1%82%D0%B8%D0%BB%D1%8C%D0%BD%D0%BE%D0%B9-%D1%81%D0%B2%D0%B0%D0%B4%D1%8C%D0%B1%D1%8B/

интересует последняя ссылка, запрещена ли она? Я проверяю так:

wget --user-agent="Mozilla/5.0 (iPhone; CPU iPhone OS 8_1 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12B411 Safari/600.1.4 (compatible; YandexBot/3.0; +http://yandex.com/bots" http://mydomain.com/%D1%81%D0%B5%D0%BA%D1%80%D0%B5%D1%82%D1%8B-%D1%81%D1%82%D0%B8%D0%BB%D1%8C%D0%BD%D0%BE%D0%B9-%D1%81%D0%B2%D0%B0%D0%B4%D1%8C%D0%B1%D1%8B

В итоге скачивается содержимое страницы, а оно, по идее, закрыто в robots.txt
Или так я не проверю, потому что поисковики сами сначала читают robots.txt?

Вопрос задан более трёх лет назад
1261 просмотр

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Excel: от основ до анализа данных

2 месяца

Далее
ProductStar × РБК

Figma для продакта: от интерфейса до защиты концепции

6 месяцев

Далее
Академия Эдюсон

Autocad для инженеров

2 месяца

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Google

Простой
Привязка ру номера телефона к Google?
- 1 подписчик
- 11 часов назад
- 135 просмотров
1

ответ
Разработка игр

+2 ещё

Простой
Godot для Яндекс игр или Defold?
- 1 подписчик
- 14 июн.
- 180 просмотров
0

ответов
Google

Простой
Сколько можно иметь аккаунтов Google в 2026 году?
- 1 подписчик
- 14 июн.
- 448 просмотров
1

ответ
Google

Простой
В Google Photo нет раздела «Люди и домашние животные» на аккаунте, как решить?
- 2 подписчика
- 10 июн.
- 209 просмотров
1

ответ
Яндекс

Простой
Чем сделать архивацию писем из Я360?
- 4 подписчика
- 08 июн.
- 538 просмотров
1

ответ
Железо

+1 ещё

Простой
Есть ли кибер-опасность продажи своей умной колонки Яндекс?
- 1 подписчик
- 14 мая
- 697 просмотров
2

ответа
Android

+2 ещё

Простой
Как подтвердить личность в chrome на Андроид?
- 2 подписчика
- 04 апр.
- 569 просмотров
1

ответ
Google

+1 ещё

Простой
Gemini внезапно перестало работать?
- 1 подписчик
- 24 мар.
- 1918 просмотров
3

ответа
Google

+1 ещё

Простой
Кто регистрировал аккаунт разработчика Google в России?
- 1 подписчик
- 15 мар.
- 684 просмотра
1

ответ
Поисковая оптимизация

+1 ещё

Простой
Как полностью убрать старый сайт из отчетов Google Search Console после замены сайта на том же домене?
- 2 подписчика
- 09 мар.
- 355 просмотров
3

ответа
Показать ещё Загружается…

Answer 1 · 2015-12-18 16:49:30

Файл роботов это пожелание.
Это ваше пожелание, которое приличные поисковые системы выполняют.
Добровольно выполняют.
Но этот файл ни к чему их не принуждает и никак не ограничивает.
Если они пожелают, то смогут и проигнорировать содержимое этого файла, хотя это дурной тон.
ВГету естественно все равно на это правило. ВГет выполняет вашу команду. Что ему указал человек, то он и выполнил.

Answer 2 · 2015-12-19 08:45:42

Чтобы проверить, правильно ли настроен robots.txt, можно воспользоваться инструментами поисковых систем. У Яндекса вот https://webmaster.yandex.ru/robots.xml. У гугла вот https://www.google.com/webmasters/tools/robots-tes..., но можно проверить только у подтверждённого сайта

Как запретить доступ к url поисковым роботам?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт