Игорь Воротнёв: я получил еще один ответ. Они утверждают, что ссылки были получены из иного источника, не метрики, но какого, сказать не могут, потому что эта информация не хранится в базе. Пришлось вручную ссылки удалять из индекса, благо, удаляются они в течении часа. В общем, по-прежнему ничего непонятно.
Игорь Воротнёв: все настроено, в карте сайте таких страниц нет и быть не может. В роботе, понятное дело, просто так не закроешь, хотя варианты есть. Страницам по 3-5 лет. После того, как я включил эту функцию, проблем не было, но с некоторых пор опять началось - месяца два как. Получил ответ от яндекса - говорят, галки достаточно, что бы бот не получал информацию. Но мы-то знаем, как яндекс не любит собирать информацию. Поменял код с новой метрики - по сути он такой же, но есть какие-то различия. Буду смотреть.
Игорь Воротнёв: с помощью метрики. По умолчанию информация о любых страницах на сайте предается боту, он бежит на сайт и проверяет страницу. Это может быть любая страница на сайте, не суть - бот ее посетит, если была передана информация и страница для него доступна. Что бы отключить данную функцию, необходимо включить функцию "Запрет отправки страниц на индексацию" help.yandex.ru/metrika-old/code/stop-indexing.xml
В данном случае функция включена, но информация о страницах по-прежнему передается боту. Я лишь могу подозревать, что часть или все данные по-прежнему передаются, несмотря на то, что функция включена.
Это невозможно контролировать. Сегодня цифры, завтра буквы, а послезавтра - еще что-нибудь. Поскольку яндекс мне не отвечает уже несколько дней, могу догадываться, что они в очередной раз где-то накосячили - ведь урлы передаются яндекс-боту, хотя я запретил это делать. С гуглом таких проблем нет.
Вы правы. Если есть дополнительные страницы и они существуют, они должны открываться. Но явно не те, которые уже существуют, поскольку это дубли.
Не знаю, ip разные, весь мир. проблема не только у меня, у многих есть, читал. Сейчас относительное затишье, осенью и зимой атаки были приличными - до нескольких тысяч запросов в секунду.
Вы где смотрели? На wordpress.org работает, тут, например, нет responsivetwentyten.com/download/. Это не настройки сервера, у джумлы ведь нет такой проблемы.
Это произвольные цифры, которые прописывает некий бот. Зачем - непонятно. Берется страница и понеслась: цифра от 1 и до бесконечности, иногда в виде букв. Таких страниц на сайте нет, но по всей видимости особенность движка такова, что он не отдает ошибку, а загружает ту же самую страницу, только с цифрой в адресе. Не пойму, как вывести в таком случае 404 ошибку.
Насчет логики - такая штука встречается везде, даже в twenty ten. Только на wordpress.org она отсутствует. Посмотрю функционал, но сдается мне, что это либо htaccess, либо некий скрипт.
Нет, с этими страницами проблем нет. Я имею ввиду страницы, которые позволяет генерировать движок. Для этого возьмите любую страницу, напишите после слеша набор цифр, букв или все вместе, и нажмите enter - откроется та же самая страница, только под указанным адресом. По идее, движок должен отдавать 404 или хотя бы редиректить на основную страницу, но этого не происходит.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.