Приветствую.
Есть несколько сотен сайтов (не моих) на разных хостингах. Хостингов десятки, сотни и в любой момент владелец сайта может сменить хостинг на другой. Меня интересует получение информации об этих сайтах, а именно оплачен ли у того или иного сайта хостинг.
Сначала думал, что все просто — получаем ответ главной страницы. Если он отличен от кода 200, то можно предположить, что сайт сейчас не работает и что-то произошло: владелец не оплатил хостинг, перевел сайт на другой домен и пр. и можно посмотреть вручную что там да как. Но все оказалось сложнее: даже если хостинг не оплачен, то у большинства хостеров банально отдается код ответа 200 без всякого редиректа на заглушку и программно получить информацию о состоянии сайта не так-то просто.
Подскажите варианты получения состояния сайта, к примеру, оплачен ли хостинг или нет. Может быть, что-то однозначно специфичное меняется, что можно отследить, чтобы получить информацию?
несколько сотен сайтов (не моих) на разных хостингах
Какая-то мутная тема. Зачем это может понадобиться, кроме рассылки фишинговых писем с предложением оплатить хостинг на яндекс-кошелёк мошенника? Хотя, если подольше подумать, наверное, можно придумать и другие схемы.
анализируй текст главной страницы . Какой-то кусок html кода используй как сигнатуру (что-то уникальное для этого сайта, но постоянное) . Ложно будет срабатывать на смену дизайна (но это имхо редкость)
weranda, ну мы однажды получали подобное, только про регистрацию домена. Как говорил мастер Инь Фу Во, "Паранойя входит в число моих должностных обязанностей". :)
То что Вы хотите написали до вас.
Есть сервисы подобные uptimerobot, там есть проверка порта, пинг и проверка keyword.
Можете, конечно свой сервис написать.
Лучший результат дадут комбинации тестов.
uptimerobot отслеживать доступность сайта — не так? keyword, если вы про обычное ключевое слово, которое присутствует на странице, то его же могут поменять и что дальше? — Открывать сайт, смотреть наличие ключа, вносить другой ключ? — Муторновато.
Как написали выше - залить свой файл на хостинг и тестить его доступность. Или же добавить метатеги на главной и сверять роботом. Хотя с файлом мне кажется проще - залил и пингуешь. Если 200 - отлично. Если 404 - скырба (печалька).
Парси выдачу WHOIS по домену, так узнаешь когда он освободится, если он тебе нужен. Если важен именно аптайм сервера, то тупо пингуй, за тебя это никто не будет делать бесплатно. Вот API https://www.uptrends.com/support/kb/api/documentation
Возможно считывать и запоминать только часть ответа , допустим первые или последние 200 символов (число символов нужно подбирать) и в последующие разы сравнивать с сохраненым эталоном. При это если хостингом отдаеться заглушка , то это содержимое будет кардинально отличаться. Однако в случае если клиент поменяет движок сайта или целиком главную страницу , то будут ложные срабатывания.