Универсального ответа нет. Вам нужно определить свой фингерпринт несуществующей страницы на нужном сайте.
Какие-то сайты выполнят редирект на /404
или условный /notfound
, а может на /
. Кто-то может упасть в 5хх ошибки, а кто-то выдаст 404 page not found
, при этом вернув статус код 200. Если нет нужного уровня доступа, может выпасть и 401, страница то сущесвует, только прав для доступа к ней нет, это считается существованием для вас?
В общем, определять существования можно хоть как, по размеру ответа, по статус коду, по редиректам, по тексту на страница, по кол-ву слов на странице, и тд и тд. Все зависит от ваших задач и сайта. Обычный get на нужную страницу и там уже выбираем один из вариантов выше