Как получить коды HTTP ответов из списка сайтов?

Question

VitaliyShvets @VitaliyShvets

Python

Как получить коды HTTP ответов из списка сайтов?

У меня есть список ссылок на сайты и я хочу получить код HTTP ответа на каждую из них.
Я использую этот скрипт:

import requests,urllib,sys,threading,time
def main():
    if len(sys.argv)<2:
        print """Help:
    Usage:DomainsChecker.py wordlist.txt"""
        sys.exit(0)
    wordlist=sys.argv[1]
    a=open(wordlist,"r").readlines()
    start_time = time.time()
    for url in a:
        if "http" not in url or "https" not in url:
            url="http://"+str(url)
        try:
            response=urllib.urlopen(url).getcode()
            if response in xrange(200,400) or response in xrange(100,101):
                print "["+str(response)+"] "+str(url)
                response=requests.get(url)
                if response.history:
                    for res in response.history:
                        print "\tRedirected To : "+"[Response:"+str(res.status_code)+"] "+str(res.url)
                    print "\tFinal Redirection : "+"[Response:"+str(response.status_code)+"] "+str(response.url)
        except IOError:
            pass
    print "\n[!]Finished In {} Second(s).".format(int(time.time() - start_time))

faster = threading.Thread(target=main)
faster.start()
faster.join()

Но он работает очень долго.
Есть какой-то способ ускорить процесс?

Вопрос задан более трёх лет назад
141 просмотр

6 комментариев

Подписаться 1 Простой 6 комментариев

hint000 @hint000

Например, переписать вместо Python'а на C и скомпилировать.
И "очень долго" - это примерно сколько? А то для кого-то 1 секунда долго, а для кого-то 1 час это быстро, зависит от задач.

Написано более трёх лет назад
Влад Григорьев @Vaindante

hint000, если из всего кода тормозит response=requests.get(url) то переписав на другой язык, это не сильно поможет.

Написано более трёх лет назад
VitaliyShvets @VitaliyShvets Автор вопроса

hint000, список из 90 сайтов проверяло больше 30 мн.

Написано более трёх лет назад
hint000 @hint000

Влад Григорьев, пожалуй, вы правы. Тут время в основном определяется двумя слагаемыми: временем ответа DNS и временем ответа каждого http-сервера.

Написано более трёх лет назад
alternativshik @alternativshik

head запросы отправляй, а не get

Написано более трёх лет назад
Vitsliputsli @Vitsliputsli

VitaliyShvets, посылайте запросы асинхронно.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Как добавить опцию в контекстное меню для Internet Shortcuts?
- 1 подписчик
- вчера
- 96 просмотров
1

ответ
Python

+2 ещё

Средний
Как в Pyrogram получить id отправленного сообщения?
- 1 подписчик
- вчера
- 44 просмотра
1

ответ
Python

+1 ещё

Простой
Как распарсить смешанный тип json-данных?
- 1 подписчик
- 26 июл.
- 217 просмотров
3

ответа
Python

+1 ещё

Средний
Как «На лету» добавить клик id в готовый апк, который будет скачиваться с сайта?
- 1 подписчик
- 26 июл.
- 130 просмотров
2

ответа
Python

+1 ещё

Средний
Как подключить отладчик к программе на Python в Docker-контейнере?
- 1 подписчик
- 24 июл.
- 177 просмотров
1

ответ
Python

Простой
Почему не получается создать профиль в программе Dolphin{anty}?
- 1 подписчик
- 24 июл.
- 83 просмотра
1

ответ
Python

Простой
Как совместить два .pdf файла?
- 1 подписчик
- 22 июл.
- 251 просмотр
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- 22 июл.
- 140 просмотров
1

ответ
Python

Простой
Почему AnaConda или MiniConda автоматически самоликвидируется на win10?
- 1 подписчик
- 22 июл.
- 124 просмотра
0

ответов
Python

+1 ещё

Простой
Почему форма не по центру экрана, как исправить?
- 1 подписчик
- 22 июл.
- 108 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Например, переписать вместо Python'а на C и скомпилировать.
И "очень долго" - это примерно сколько? А то для кого-то 1 секунда долго, а для кого-то 1 час это быстро, зависит от задач.
hint000, если из всего кода тормозит response=requests.get(url) то переписав на другой язык, это не сильно поможет.
hint000, список из 90 сайтов проверяло больше 30 мн.
Влад Григорьев, пожалуй, вы правы. Тут время в основном определяется двумя слагаемыми: временем ответа DNS и временем ответа каждого http-сервера.
VitaliyShvets, посылайте запросы асинхронно.

Answer 1 · 2019-07-31 17:35:25

Владимир @vintello

почитайте эту статью
думаю откроете для себя много нового

Ответ написан более трёх лет назад

Комментировать

Как получить коды HTTP ответов из списка сайтов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт