Парсер на Python, как реализовать?

Ребят, имеет такая задача:

1) Человек заходит на специальную страницу, вводит в формочку логин и пароль.
2) Эти данные используются для входа в другой сервис.
3) Открывается внутренняя страница сервиса с данными, где начинают собираться данные.
4) Когда анализ одной страницы заканчивается, идет переход на следующую страницу, и так до стоп-условий итерации.
5) Собранные данные выгружаются в виде таблицы на специальном сайте.

Можете направить меня, как это лучше реализовать?
___________________________________

Ребят, в общем нашел примерный путь, можно использовать beautifulsoup.

Остался вопрос: А как из формы передать парсеру логин и пароль для входа в админку, чтобы он вошел?
  • Вопрос задан
  • 1655 просмотров
Пригласить эксперта
Ответы на вопрос 6
un1t
@un1t
grab, scrapy - это все ернуда, request + lxml самое то. В более сложном случае понадобиться selenium и phantomjs.
Ответ написан
@stenhot
Используй
Библиотеку GRAB и MySQL иди SQLite
Grab имеет широкие возможности.

Так же пример парсера можешь посмотреть ТУТ
Ответ написан
Комментировать
dimonchik2013
@dimonchik2013
non progredi est regredi
scrapy стандарт сейчас де-факто в таком, но Граб проще в освоении
Ответ написан
Комментировать
@CobaltTheTerrible
Копипастю код на Python
Можно посмотреть еще на Scrapy.

По своему опыту сразу скажу, что имеет смысл сохранять в какой-нибудь key-value storage все загружаемые страницы. Очень помогает потом в отладке
Ответ написан
Комментировать
@Kuzmichik
Заправляю корабли и жду их возвращения...
Остался вопрос: А как из формы передать парсеру логин и пароль для входа в админку, чтобы он вошел?

doc.scrapy.org/en/1.0/topics/request-response.html...
Ответ написан
Комментировать
@alegast
парсер это только половина роботы, beautifulsoup вполне себе пойдет.
2я половина требует авторизации на сайте, сохранение кук (которые прийдут в респонс хедерах) и передачу их при каждом последуюющем за авторизацией реквесте
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы