Как ускорить скрипт Python?

Question

Igor Nikolaev @nightvich

ITman

Python

Как ускорить скрипт Python?

Есть задача собрать с динамически обновляемой страницы собрать 100 значений.

мой г.код ))

import urllib
i=0
while i < 100:
url=urllib.urlopen('www.ya.ru')
print url.read().splitlines()
i+=1

интересна оптимизация только этой части, т.к. на ней наибольшие затраты времени.

Вопрос задан более трёх лет назад
4395 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 7

1 комментарий

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Как «На лету» добавить клик id в готовый апк, который будет скачиваться с сайта?
- 1 подписчик
- 5 часов назад
- 49 просмотров
1

ответ
Python

+1 ещё

Средний
Как подключить отладчик к программе на Python в Docker-контейнере?
- 1 подписчик
- 24 июл.
- 123 просмотра
0

ответов
Python

Простой
Почему не получается создать профиль в программе Dolphin{anty}?
- 1 подписчик
- 24 июл.
- 73 просмотра
1

ответ
Python

Простой
Как совместить два .pdf файла?
- 1 подписчик
- 22 июл.
- 217 просмотров
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- 22 июл.
- 112 просмотров
1

ответ
Python

Простой
Почему AnaConda или MiniConda автоматически самоликвидируется на win10?
- 1 подписчик
- 22 июл.
- 99 просмотров
0

ответов
Python

+1 ещё

Простой
Почему форма не по центру экрана, как исправить?
- 1 подписчик
- 22 июл.
- 87 просмотров
0

ответов
Python

Простой
Как исправить Python error module 'win32crypt' has no attribute 'CryptProtectData' [closed]?
- 1 подписчик
- 21 июл.
- 78 просмотров
0

ответов
Python

+1 ещё

Простой
Как торговать фьючерсами через API MEXC?
- 2 подписчика
- 19 июл.
- 401 просмотр
1

ответ
Python

+1 ещё

Простой
Есть ли кд на отправку подарков от имени бота?
- 2 подписчика
- 19 июл.
- 205 просмотров
1

ответ
Показать ещё Загружается…

Python разработчик

Bell Integrator • Москва

Разработчик Python

Bell Integrator • Москва

Python разработчик

Bell Integrator • Москва

Answer 1 · 2015-02-04 12:28:49

Andrey K @mututunus

Backend developer (Python, Golang)

Распараллелить запросы.

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2015-02-04 12:28:04

Вы, может быть, хотели бы использовать цикл в таком виде (python3):

for x in range(1, 100):  # в Py2 вроде xrange используется
    url=urllib.urlopen('www.ya.ru')
    print(url.read().splitlines())

По сути вопроса: у вас в цикле происходит http-запрос, как вы его хотите ускорить?
Эта часть вашего кода оптимизируется путем ускорения интернета + можно, если дёргаете в цикле свой сайт, оптимизировать страницу, к которой 100 раз обращаетесь.

Answer 3 · 2015-02-04 12:35:47

Igor Nikolaev @nightvich Автор вопроса

ITman

Есть рекомендация использовать ассинхронную библиотеку. Не могу понять, как это сделать. В программировании новичек...

Ответ написан более трёх лет назад

2 комментария

Answer 4 · 2015-02-04 13:05:41

raiboon @raiboon

Grab - фреймворк для парсинга сайтов — Документация ...
https://grab.readthedocs.org/

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2015-02-04 15:42:20

Можно использовать workerpool

Вот ссылка на туториал

В вашем случае код будет примерно таким:

import os
import urllib
import workerpool

urls = ['http://example.com/1','http://example.com/2']

class DownloadJob(workerpool.Job):
    def __init__(self, url):
        self.url = url # The url we'll need to download when the job runs
    def run(self):
        save_to = os.path.basename(self.url)
        urllib.urlretrieve(self.url, save_to)

pool = workerpool.WorkerPool(size=5)

for url in urls:
    job = DownloadJob(url.strip())
    pool.put(job)

pool.shutdown()
pool.wait()

Также обратите внимание на urllib3 (он более корректно и гибко работает с параллельными запросами)

Answer 6 · 2015-02-04 17:44:28

Помогут потоки. Реализация на коленке:

# -*- coding: utf-8 -*-
from threading import Thread
import urllib2

class GetPageThread(Thread):
    def __init__(self, url):
        self.url = url
        self.body = None
        super(GetPageThread, self).__init__()
    def run(self):
        try:
            #для некоторых ресурсов доступ будет закрыт 
            #без user-agent(довольно часто)
            req = urllib2.Request(self.url, headers={'User-Agent' : 'Mozilla/5.0'})
            self.body = urllib2.urlopen(req).read()
        except:
            self.body = 'Некорректный адрес'

def body_thread(url):
    return GetPageThread(url)

def main():
    url = 'http://ya.ru'
    #создание потоков
    threads = [body_thread(url) for i in range(100)]
    #запуск потоков
    for thread in threads:
        thread.start()
    #объединение с основным
    for thread in threads:
        thread.join()
    #что хотелось бы с этим сделать
    for thread in threads:
        print thread.body.splitlines()

if __name__ == '__main__':
    main()

Answer 7 · 2015-02-05 06:53:26

dvska @dvska

Можно использовать asyncio+aiohttp (Pyhon3.x).

Ответ написан более трёх лет назад

Комментировать

Как ускорить скрипт Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт