Задать вопрос
@AlexandrMa

Как заблокировать индексацию PDF?

На сайте 1000 страниц. Около 500 DPF файлов. Нужно скрыть от индексации эти файлы, потому что они не уникальные и вообще лишние, мешают раскрутке самих страниц. Нужна только возможность их скачать пользователю. В файле robots внесли записи
Disallow: /pdf/
Disallow: *.pdf

для всех ботов и конкретно для Гугла и Яндекса.

В итоге Яндекс заблокировал, Гугл продолжает упорно индексировать. Прошел год, ситуация не поменялась. Гугл пишет "Проиндексировано, несмотря на блокировку в файле robots.txt"

Есть ли смысл перенести файлы на поддомен с редиректом?
  • Вопрос задан
  • 1628 просмотров
Подписаться 1 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Skillbox
    SEO-специалист от AMDG
    4 месяца
    Далее
  • Skillbox
    Интернет-маркетолог с нуля до PRO
    4 месяца
    Далее
  • Digital Skills Academy
    Mini-MBA: Интернет-маркетолог
    4 месяца
    Далее
  • MAED
    Интернет-маркетолог PRO
    7 месяцев
    Далее
  • Rush Academy
    SEO для маркетолога
    1 неделя
    Далее
  • Rush Academy
    Старт в зарубежном SEO
    1 неделя
    Далее
  • Rush Academy
    Старт в SEO
    1 неделя
    Далее
  • Digital Skills Academy
    SEO-продвижение
    1 месяц
    Далее
Пригласить эксперта
Ответы на вопрос 1
PiSaiK
@PiSaiK
IT куратор
Лучший вариант, когда конечный документ отдает заголовок noindex. Например, добавить фрагмент в корневой файл .htaccess сайта или файл httpd.conf:
<Files ~ "\.pdf$">
  Header set X-Robots-Tag "noindex, nofollow"
</Files>

Тогда действовать надо так
1. Не запрещать индексировать PDF - убрать инструкции из robots.txt
2. Отдавать заголовок, как написал выше
3. К ссылкам на документы добавить rel="nofollow"

И тогда все документы выпадут из индекса
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы