Сайт без движка, сделан на html и php. Такая проблема, есть комментарии под статьями, после каждого комента в поисковой индекс гугла добавляются дубли страницы. Например, адрес странички site.com/cagegory/page, добавили коментарий и адрес странички меняется на site.com/cagegory/page?id=9243247632144.91
Дубли создаются по аналогии wordpress, только в этом случае индификатор ?id.
Я уже общался на форумах, внедрил следующие рекомендации и правила, но дубли все равно создаются. После правок дубли исчезли с яндекса и бинга, а вот гугл не слушается нив какую.
В файле robots.txt добавил такие строки:
Disallow: /*?id=*
Disallow: /*?id=
Disallow: /*?*
Disallow: /*?
В .htaccess прописал:
RewriteEngine On
RewriteCond %{QUERY_STRING} ^id=
RewriteRule (.+) /$1? [R=301,L]
Гугл в панеле google вебмастера автоматически создались Параметры URL для id, где были запрещены к сканированию эти адреса. Проблема не решилась, как быть? Мета тег canonical не могу поставить на дубли, так как их физически нет ибо движка нет. Комментарии порождают дубли.
Adamos: Может, я как то не правильно в htacces написал или роботс. Интернет обшарил и ответов не нашел. Запрет к индексации дублей везде одинаковый. Яндекс и бинг обработали правильно все, а гугл не хочет(
Почему-то все думают, что само выпадет.
А ты возьми, собери все эти дублирующие страницы из выдачи (парсинг по site:), затем затолкай все в sitemap и отправь сайтмап на индексацию через инструмент "Переобход" страниц. Яндекс быстренько подцепит карту сайта, в которой будут одни 301 редиректы и он оперативнее все выкинет.
Почему-то все боятся этого метода о_О