Задать вопрос
JRazor
@JRazor
Senior StarkOverFlow Programmer

Python Web: Multiprocessing vs Threads. Что лучше использовать для парсинга?

Видимо я не слишком понимаю разницу, но я не пойму - что лучше использовать для web-парсинга? Есть ли русское чтиво на эту тему?
  • Вопрос задан
  • 3721 просмотр
Подписаться 8 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Fullstack-разработчик на Python + нейросети
    20 месяцев
    Далее
  • Skillfactory
    Профессия Python-разработчик
    9 месяцев
    Далее
  • SF Education
    Бэкенд-разработчик на Python
    3 месяца
    Далее
Пригласить эксперта
Ответы на вопрос 2
Sardar
@Sardar
Можно использовать Scrapy. Вам тогда не придется думать о параллельных процессах, блокировках и IO в целом. Вы просто пишете логику разбора страницы. Сам проект на Twisted.
Ответ написан
Комментировать
zxmd
@zxmd
Одно хочу сказать про lxml - не используейт его parse с передачей URL в качетве источника. Лучше скачать страницу тем же request и загнать ее в lxml через document_fromstring - много себе нервных клеток сэкономите.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы