Задать вопрос

Что почитать про парсинг?

Увлёкся парсингом данных на python. Какие посоветуете книги по данной теме?
  • Вопрос задан
  • 5075 просмотров
Подписаться 13 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 5
datka
@datka
Основы HTML, CSS. Документацию по BeautifulSoup, Requests. Документацию по работам с List и Dict и циклами в питоне. Документацию по Selenium, Гайды по работе с консолью разработчиков Chrome/Firefox.Youtube ролики. Гугл. Как минимум надо знать как устроен сайт.
Ответ написан
BadCats
@BadCats
К ответу datka - как к реальному и чисто прикладному - добавлю, что еще можно углубиться в теория формальных языков, грамматики (как работают компилятор, интерпретаторы) - что, возможно, позволит писать более универсальный код - не так сильно привязанный к верстке страницы - т.к можно пытаться анализировать html/xml - на уровне токенов и лексем, даже с кастомными классами и атрибутами для элементов. Но это очень сложная область и возможно, что "овчинка выделки не стоит".
Ответ написан
Комментировать
@dmshar
Райан Митчелл. Современный скрапинг веб-сайтов с помощью Python. 2-е
межд. издание . — СПб.: Питер, 2021.
Anish Chapagain. Hands-On Web Scraping with Python.-2019.
Katharine Jarmul, Richard Lawson. Python Web Scraping. Fetching data from the web.-2017 Packt Publishing.
Richard Lawson. Web Scraping with Python Scrape.-2015 Packt Publishing
Ответ написан
Комментировать
@acwartz
Тут должна быть ваша реклама.
Смотрите в сторону комп. зрения и нейронных сетей. Действительно вкусные вещи за парсинг которых многое отдадут, защищают от всего вышеперечисленного. Например отображение их в виде стрима видео-потока, или рисовка данных в WebGL где-то на бэкэнде. А не вот это все...
Ответ написан
@Levhav
Возьмусь за разработку проектов любой сложности.
Обратите внимание на генераторы парсеров. На пример найдите какие то питон аналоги для bison / flex
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы