Задать вопрос
@ProgerMir

Какой будет правильный Robots.txt для Wordpress (привел пример структуры)?

Здравствуйте. Читал ответы из поиска, они написаны несколько лет назад и некоторые правила там явно неактуальны (host, например). Структура корня выглядит так:

cgi-bin
wp-admin
wp-content
wp-includes
.htaccess
index.php
license.txt
readme.html
wp-activate.php
wp-blog-header.php
wp-comments-post.php
wp-config-sample.php
wp-config.php
wp-cron.php
wp-links-opml.php
wp-load.php
wp-login.php
wp-mail.php
wp-settings.php
wp-signup.php
wp-trackback.php
xmlrpc.php

Подойдет ли ниже составленный robots.txt (и такие же правила если дублировать ниже для User-Agent: Yandex, для Гугла вроде необязательно):

User-agent: *
Disallow: /cgi-bin # Стандартная папка на хостинге.
Disallow: /wp-admin/ # Закрываем админку.
Allow: /wp-admin/admin-ajax.php # Откроем аякс.
Disallow: /? # Все параметры запроса на главной.
Disallow: *?s= # Поиск.
Disallow: *&s= # Поиск.
Disallow: /search # Поиск.
Disallow: /author/ # Архив автора.
Disallow: */embed$ # Все встраивания.
Disallow: */xmlrpc.php # Файл WordPress API
Disallow: *utm*= # Ссылки с utm-метками
Disallow: *openstat= # Ссылки с метками openstat

Sitemap: example.com/sitemap.xml
Sitemap: example.com/sitemap.xml.gz
  • Вопрос задан
  • 42 просмотра
Подписаться 1 Простой 2 комментария
Помогут разобраться в теме Все курсы
  • МИПО
    Интернет-маркетинг
    5 месяцев
    Далее
  • Skillbox
    Профессия Интернет-маркетолог с нуля до PRO
    7 месяцев
    Далее
  • Digital Skills Academy
    Mini-MBA: Интернет-маркетолог
    4 месяца
    Далее
Решения вопроса 1
opium
@opium
Просто люблю качественно работать
Для Яндекса дублировать не нужно, User-agent: * его уже покрывает. Отдельный блок с User-agent: Yandex нужен только для Clean-param (через него удобнее выкидывать UTM из индекса, чем через Disallow).

И главное: Sitemap: должен быть абсолютным URL с протоколом: https://example.com/sitemap.xml. Без https:// некорректно обрабатывается.

В остальном всё ок.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
temnu
@temnu
SEO-специалист
Здравствуйте. Закрывать страницы с параметрами "?" в URL (включая UTM-метки) это плохая идея, так показатели страниц с параметрами не будут подклеиваться к основным страницам.

Хорошей идеей будет настроить rel=canonical и составить XML карту сайта с корректными версиями URL, это позволит избежать индексации страниц с параметрами и "подклеить" их к основным версиям страниц (без параметров). Если сделаете это, то robots.txt получится следующий:

User-agent: *
Disallow: /cgi-bin # Стандартная папка на хостинге.
Disallow: /wp-admin/ # Закрываем админку.
Allow: /wp-admin/admin-ajax.php # Откроем аякс.
Disallow: *?s= # Поиск.
Disallow: *&s= # Поиск.
Disallow: /search # Поиск.
Disallow: /author/ # Архив автора.
Disallow: */embed$ # Все встраивания.
Disallow: */xmlrpc.php # Файл WordPress API

Sitemap: https://example.com/sitemap.xml
Sitemap: https://example.com/sitemap.xml.gz

Также можно сгенерировать Clean-Param (его учитывает Яндекс) и включить его в конце файла robots.txt, после директив Sitemap.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы