JRazor
@JRazor
Senior StarkOverFlow Programmer

Python Web: Multiprocessing vs Threads. Что лучше использовать для парсинга?

Видимо я не слишком понимаю разницу, но я не пойму - что лучше использовать для web-парсинга? Есть ли русское чтиво на эту тему?
  • Вопрос задан
  • 3719 просмотров
Пригласить эксперта
Ответы на вопрос 2
Sardar
@Sardar
Можно использовать Scrapy. Вам тогда не придется думать о параллельных процессах, блокировках и IO в целом. Вы просто пишете логику разбора страницы. Сам проект на Twisted.
Ответ написан
Комментировать
zxmd
@zxmd
Одно хочу сказать про lxml - не используейт его parse с передачей URL в качетве источника. Лучше скачать страницу тем же request и загнать ее в lxml через document_fromstring - много себе нервных клеток сэкономите.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы