Мне нужно проверить возраст отдельно взятой страницы, раньше это можно сделать через be1.ru, почти всегда давал ответ, но сейчас их сервис не работает. Через гугл и яндекс не работает, там последняя сохраненная копия. Подскажите, есть ли какие-то сервисы аналогичные, много разных перепробовал, не сходится нормально(
Любая система сбора статистики работает ботами по принципу периодических набегов на сторонние сайты.
Не существует системы со свободным доступом, где бы на любое изменение на стороннем сайте, пришел бы бот и тут же зафиксировал состояние. Будет в любом случае лаг во времени - день, неделя, месяц, или никогда бот не придет.
По веб-архиву можно получить ответ на вопрос, что "страница не младше чем дата" (но может быть старше), но нельзя получить ответ "странице столько-то лет с момента создания".
Если сайт ваш, то вам достаточно на интересуемой странице иметь код поисковой метрики, чтобы сфокусироваться на истории ее посещения в панели управления сервиса этой метрики. Но нужно учитывать, что сбор статистики начнется только с момента выставления кода метрики на странице, и должен быть какой-то минимальный поток посетителей.
alexalexes, да, я всё это понимаю, но когда be1 работал, он показывал самую точную дату создания страницы, посредствам отслеживания её в индексе, конечно, она тоже было не точная, но временной лаг был самым маленьким из представленных сервисов, у вебархива лаг в 2 года, когда be1 показал бы максимум месяц-два, в любом случае спасибо)
AlexeyFuture, be1 либо сам сканировал сайты, либо дёргал данные из поисковиков.
Но даже поисковики отслеживают изменения не моментально. Лаг может порой исчисляться неделями.
И поисковики тоже прикрывают дыры и фичи, через которые можно получать такую инфу. Например, "сохранённая копия" гугла показывала дату создания этой копии - но теперь сохранённые копии больше в гугле недоступны.
Надёжного способа всё равно нет. Контент сейчас часто динамический. Причём многие сайтописатели уже даже 404 не отдают, по ссылке возвращают одинаковый на всех js, который уже грузит контент или рендерит ошибку текстом. Из-за этого любая страница существует всегда, даже с неправильным URL.