VadimSoloviev
@VadimSoloviev
Человек из касты создателей

Как входить в парсинг, какой софт необходимо изучить?

Хочу научиться парсить текстовые данные с различных сайтов и форумов, получая на выходе txt файл со снятыми данными, например:
https://www.dreamstime.com/forumm_35047_pg1 Требуется спарсить сообщения с 10 страниц.
https://www.litres.ru/mitio-kaku/buduschee-razuma/... Требуется спарсить отзывы к книге.
Какой парсер текстового контента наиболее прост в освоении для новичка, с чего следует начать?
Существуют ли простые в освоении решения?
Насколько сложный порог входа с полного нуля?
Сколько времени, по вашей оценке, потребуется новичку для того, чтобы научиться снимать любые нужные ему текстовые данные?
  • Вопрос задан
  • 268 просмотров
Решения вопроса 2
sim3x
@sim3x
python
requests
lxml + xpath + csspath
scrapy
selenium
Ответ написан
Комментировать
Tkreks
@Tkreks
Системный инженер
Если речь идёт о готовых решениях - Datacol
У них на сайте есть множество видео уроков, как бы материал доступный.
Ну когда меня петух в жопу клюнул, я за 4 часа освоил работу со сценариями, xpath и регулярки, в том виде и объеме, в котором это требовалось мне.
Datacol если будете искать, то не ниже 7 версии
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы