Как научить поисковики не выдавать результаты с index.html, но всё же учитывать его при краулинге?

Question

zencd @zencd

robots.txt

Как научить поисковики не выдавать результаты с index.html, но всё же учитывать его при краулинге?

Есть такая обычная структура сайта. На нём установлен поиск по сайтам от гугла, но заходят и просто из поиска, конечно.

/index.html
/page1.html
/page2.html
…

Хочется запретить индексацию на этих страницах. То есть чтобы поисковик их видел, ходил по ссылкам, но при поиске людям их не выдавал (а выдавал страницы отдельных, полных статей). Соответственно robots.txt уже не годится, так ведь?

Проблема в том что такие страницы-посредники обнаруживаются в поиске, загромождая его и приводя к тому что перейдя по ссылке искомый контент не обнаруживается (содержимое на страницах пагинации меняется).

Что делают в таких случаях? Нужна совместимость со всеми мажорными плисковиками как минимум.

Вопрос задан более трёх лет назад
3124 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

htaccess

+2 ещё

Простой
Вебмастер: Страницы-дубли с GET-параметрами?
- 1 подписчик
- 27 мар.
- 227 просмотров
4

ответа
Поисковая оптимизация

+3 ещё

Простой
Какой путь исправления проблемы (sitemap.xml с дублями) для Яндекс поиска правильнее?
- 1 подписчик
- 27 февр.
- 162 просмотра
5

ответов
WordPress

+2 ещё

Простой
Как закрыть индексацию корзины в Wordpress?
- 1 подписчик
- более года назад
- 262 просмотра
1

ответ
robots.txt

Простой
Как запретить в robots.txt параметры с #?
- 1 подписчик
- более года назад
- 63 просмотра
2

ответа
robots.txt

Сложный
Проблема с файлом robots.txt в Google Search Console. Откуда он его берет?
- 1 подписчик
- более года назад
- 503 просмотра
3

ответа
Поисковая оптимизация

+1 ещё

Простой
Как скрыть от ботов-поисковиков алиас сайта с помощью robots.txt?
- 1 подписчик
- более года назад
- 78 просмотров
2

ответа
Windows

+3 ещё

Простой
При открывании csv файла в формате .txt появляются символы ("" и ;) как можно открыть csv файл без символов; и «»?
- 1 подписчик
- более года назад
- 190 просмотров
0

ответов
robots.txt

Простой
Можно ли ограничить в robots.txt страницы с символами в конце?
- 1 подписчик
- более года назад
- 70 просмотров
0

ответов
Google

+1 ещё

Средний
Почему google не видит robots.txt?
- 2 подписчика
- более года назад
- 488 просмотров
2

ответа
Поисковая оптимизация

+2 ещё

Простой
Как частично закрыть от индекса /xfsearch/?
- 1 подписчик
- более года назад
- 78 просмотров
1

ответ
Показать ещё Загружается…

Руководитель проектов по цифровому развитию клиентов в сфере недвижимости (CSM)

Сбер • Санкт-Петербург

от 200 000 ₽

Java Developer (Клик)

Сбер • Москва

от 400 000 ₽

Системный аналитик (Мои Сервисы)

Сбер • Москва

от 300 000 ₽

Answer 1 · 2013-01-25 13:37:26

Если кроме ссылок со страницы index.html на страницы с полезным контентом больше ничего не ведет, то нужно сделать sitemap и поместить эти ссылки туда, а index.html закрыть на индексирование.

Если нужно закрыть только часть страницы от индексирования, то воспользуйтесь тегом <noindex></noindex>

Answer 2 · 2013-01-25 18:16:10

WEBIVAN @WEBIVAN

meta name=«robots» content=«noindex,follow»

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2013-01-25 13:58:52

charliez @charliez

Все мажорные поисковики поддерживают карты сайтов sitemap.xml

Ответ написан более трёх лет назад

Комментировать

Как научить поисковики не выдавать результаты с index.html, но всё же учитывать его при краулинге?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт