Web-crawling откуда начинать?

Question

Anlight @Anlight

Python

Web-crawling откуда начинать?

Заинтересовал этот раздел, но ни как не могу разобраться откуда начинать копать. Я так понял копать нужно в сторону библиотек grab и scrapy, но информации на русском практически нет, а если и попадается, то как правильно устаревшая. Так же есть документация, так же имеется документация, но опять же это документация, а интересует именно обучение.

Вопрос задан более трёх лет назад
5261 просмотр

Комментировать

Подписаться 9 Оценить Комментировать

Answer 1 · 2015-12-25 11:03:26

начните с request, для получения кода с сайта, и regexp для парсинга
потом beautifulsoup - увидите разницу и поймете ценность специализированной библиотеки
потом Scrapy - и тоже сделайте для себя выводы

после этого идите на фриланс биржу и берите любой заказ на парсинг и делайте его на более понятном вам инструменте. это может быть даже давно закрытый заказ. но результат не заработок денег а сделать реальную задачу.

после этого Вы сможете уже предложить себя за небольшие деньги, на том же фрилансе.

вот такой путь начинающего джидая. будет трудно, но интересно :)

Web-crawling откуда начинать?

Войдите на сайт