Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
GeneralMops
0
вклад
0
вопросов
0
ответов
0%
решений
Лайки
Информация
Ответы
Вопросы
Комментарии
Подписки
Нравится
Какие библиотеки использовать, чтобы собирать данные с сайтов?
gpm7315
@gpm7315
В большинстве случаев urllib+lxml. Еще
grab
интересная штука.
Ответ написан
более трёх лет назад
Комментировать
Нравится
2
Комментировать
Какие библиотеки использовать, чтобы собирать данные с сайтов?
Сергей Нижний Новгород
@Terras
Python + requests + beatysoup = в одном потоке может херачить примерно 10000 страниц за 15-20 минут.
Если прямо надо автоматизация, потоки и прочее - то уже scrappy
Ответ написан
более трёх лет назад
1
комментарий
Нравится
3
1
комментарий
Какие библиотеки использовать, чтобы собирать данные с сайтов?
Владимир Проскурин
@Vlad_IT
Front-end разработчик
1) Самый крутой scrapy
2) Для любителей css query
https://lxml.de/cssselect.html
3) Еще довольно мощный beautifulsoup
Ответ написан
более трёх лет назад
6
комментариев
Нравится
6
6
комментариев
Оценили как «Нравится»
Закрыть
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама