@AlexandrMa

Как заблокировать индексацию PDF?

На сайте 1000 страниц. Около 500 DPF файлов. Нужно скрыть от индексации эти файлы, потому что они не уникальные и вообще лишние, мешают раскрутке самих страниц. Нужна только возможность их скачать пользователю. В файле robots внесли записи
Disallow: /pdf/
Disallow: *.pdf

для всех ботов и конкретно для Гугла и Яндекса.

В итоге Яндекс заблокировал, Гугл продолжает упорно индексировать. Прошел год, ситуация не поменялась. Гугл пишет "Проиндексировано, несмотря на блокировку в файле robots.txt"

Есть ли смысл перенести файлы на поддомен с редиректом?
  • Вопрос задан
  • 913 просмотров
Пригласить эксперта
Ответы на вопрос 2
PiSaiK
@PiSaiK
IT куратор
Лучший вариант, когда конечный документ отдает заголовок noindex. Например, добавить фрагмент в корневой файл .htaccess сайта или файл httpd.conf:
<Files ~ "\.pdf$">
  Header set X-Robots-Tag "noindex, nofollow"
</Files>

Тогда действовать надо так
1. Не запрещать индексировать PDF - убрать инструкции из robots.txt
2. Отдавать заголовок, как написал выше
3. К ссылкам на документы добавить rel="nofollow"

И тогда все документы выпадут из индекса
Ответ написан
Комментировать
самый простой вариант, сделать базовую аутентификацию на урлы с pdf
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы