Как обработать информацию с помощью threading по очереди в Python?

Question

amirkhonov @amirkhonov

Как обработать информацию с помощью threading по очереди в Python?

Здравствуйте!
Есть список list со ссылками на страницы (около 50 тыс. страниц), которых нужно обработать с pyquery и добавить результаты в список results. Однако задача выполняется очень долго. Пробовал некоторые модули, но они не обрабатывают по очереди. Как правильно выполнять нижеуказанный код с помощью threading, чтобы результаты из обработанных страниц добавлялись по очереди в список results?

results = []
list      = ['url1', 'url2', ....]

for j in list:
    try:
        jopen = urllib2.urlopen(j)
        versions = jopen.read() # get tags/versions page
        version = pq(versions)          # send content to pyquery pq
        ....... # обработка с pyquery
        results.append(version)
    except urllib2.URLError:
        results.append('0.0')
    except urllib2.HTTPError:
        results.append('0.0')

Спасибо за помощь.

Вопрос задан более трёх лет назад
184 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Средний
Корректно оценить стоимость разработки системы авто-покупки для e-commerce?
- 1 подписчик
- 40 минут назад
- 10 просмотров
0

ответов
Python

Простой
Существует ли менеджер виртальных окружений для python, который хранит все пакеты в одном месте?
- 1 подписчик
- 6 часов назад
- 70 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 196 просмотров
0

ответов
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 55 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 175 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 185 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 128 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 222 просмотра
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 229 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 151 просмотр
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Answer 1 · 2016-06-14 18:59:45

МултиКурл
python2or3.blogspot.com/2015/05/python-multi-curl.html

если стоит задача скачивать, проще всего

можно и так
toly.github.io/blog/2014/02/13/parallelism-in-one-line

но курл быстрее и ненагруженнее невероятно

Как обработать информацию с помощью threading по очереди в Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт