@loxnemamont

Какие библиотеки использовать для написания асинхронного многопоточного чекера сайтов на python?

Есть задача написать чекер сайтов по списку на питоне, на входе - файл с 1кк доменов, нужно пройтись по каждому (в идеале - асинхронно и в несколько потоков) и проверить вхождение определенного текста в исходном коде страницы. Если текст присутствует - записать эти домены в отдельный файл на выходе.
Что посоветуете? Возможно либы какие, статьи почитать там? В питоне совсем новичок, просто многопоточный вариант сего наг*внокодил, но скорость не радует и где-то память течет :(
  • Вопрос задан
  • 521 просмотр
Пригласить эксперта
Ответы на вопрос 1
sim3x
@sim3x
scrapy.org

в твоем простейшем случае проще сделать баш скрипт на parallels + curl + grep
или сделать питон скрипт для парсинга одного домена и запустить его через паралелс
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы