Суть вопроса в том что на одном сайте на CMS 1С-Битрикс внезапно стали индексироваться странные урл. Причем состоят они из случайных наборов существующих кодов элементов (ELEMENT_CODE) и разделов (SECTION_CODE) не связанных друг с другом. Некоторые из них содержат и дополнительные параметры(навигации, включения/выключения режима правки и т.д. и т.п.). Какбы ссылок подобных быть не может, т.к. чпу настроено.
Написал небольшой парсер ссылок, который после загрузки скапливал все ссылки на странице и сохранял их в общий файл. В итоге странных ссылок там нет. Все ссылки там верные и рабочие.
UPD: забыл написать что мне нужен сервис в котором можно отследить с какой страницы был получен урл для выдачи
Модуль веб-аналитики установлен? Если да то можно поискать в хитах.
В google analytics есть отчёт по внешним ссылка, только они группируются по доменам, поэтому придётся покапаться в списке ссылающихся сайтов
Если эти кривые ссылки попали в поисковый индекс, значит в компоненте catalog не установлена настройка - возвращать 404 ошибку для некорректных адресов
Если это внешние ссылки, то вы можете пустить их в дело прописав для них 301й редирект в корень каталога - что бы с них вес перетекал
К сожалению модуль веб-аналитики отсутствует. Для каталога установлена 404, но на тех некорректных адресах 404 не вылазит. Вместо этого выводятся абсолютно все элементы из всех инфоблоков. Ссылки не внешние. Гугловскую аналитику буду изучать.