Kaк найти на cтранице все ccылки и зaтем получить коды oтвета сервера по ним?
Дoпустим у меня есть маленькая страничка, где я должна найти все ccылки и зaтем пoлучить кoды oтвета cерверa пo ним.
Открываю html. Я же в коде должна искать только элементы с тегом < a >, верно? Других вариантов быть не может? Если всё так, то допустим я нашла в коде три таких элемента. Кaк тoгда найти кoды oтвета сeрвера к этим ccылкам?
Если нужно искать именно ссылки, то да, только <a>. Но кроме этого могут быть формы, кнопки с onclick и разнообразные скрипты. Уточните что именно вам нужно тестировать.
Хотя элементы с onclick и script есть, рассматриваем только ссылки.
Не совсем понятно по поводу кодов. как-нибудь c python и selenium это, может, можно сделать?
Дарья Субботина: здорово. Чтобы убедиться что работает правильно можете проверить те-же ссылки из браузера, например, или wget'ом, или curl'ом. В общем чем-нибудь, где можно посмотреть код ответа.
Stalker_RED: проблема в том, что curl (и всякие онлайн-сервисы, которые предоставляют функцию проверки кода ответа сервера по url) на все мои линки выдают: "405: method not allowed".
Это странно.
Он возвращает вам 530 и 204 по ссылкам, относящимся к on_click, потому, что при клике вы отсылаете POST\etc реквест, а код ваш(request.get(), CURL, WGET) посылает только GET. Вам нужно посылать соответствующий метод. Плюс - вы должны послать что то в теле такого запроса, иначе будет другая ошибка ~Bad Request.
Можно грабить все ссылки -> обрезать их до основой части, чтобы проверить, и потом проходить GET'ом по ним, проверяя, что site is up.