@DayOffProgramer

Как написать код на Python для парсинга с определенной страницы?

Наверное это не сложный вопрос, для тех кто шарит.

Задача:
Нужно выгрузить ряд текстов с нескольких определенных страниц, определенного сайта. Для примера возьмем: https://market.yandex.ru/product--smartfon-samsung...

Нужно выгрузить все отзывы с датой, ссылкой, оценкой и автором в эксель, или даже лучше, прямо в гугл-таблицу, каждый в отдельную ячейку.
Причем это нужно делать не единоразово, а регулярно, и так, чтобы новые не повторяли уже выгруженные.

Дополнительная сложность - чтобы увидеть список необходимых текстов, надо еще и авторизацию на сайте пройти, без капчи, просто пара логин-пароль и после этого открыть нужную страницу из аккаунта.

Насколько это реализумо на питоне. И в сторону каких модулей смотреть. О питоне я знаю немного, чуть больше года занимаюсь им в свободное время, до этого программирование не трогал.

Всем кто ответит - большое спасибо.
  • Вопрос задан
  • 158 просмотров
Решения вопроса 1
sergey-gornostaev
@sergey-gornostaev Куратор тега Python
Седой и строгий
Это реализумо на питоне. Смотреть в сторону requests, beautiful soup, selenium и тому подобного.

P.S. За год можно стать программистом, который знает о питоне много.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
datka
@datka
BeautifulSoup
Selenium
requests
openpyxl

Вот принципе что вам нужно.Читайте документацию.Пишите код.
Также можете обратиться к фрилансу.
Ответ написан
Комментировать
IDzone-x
@IDzone-x
Костыли сила паттерны могила
Ну для получения html с определенной страницы (или нескольких) библиотека "request" для скрапинга html "BeautifulSoup". Для регистрации и имитирования роботы человека "Selenium". Ну по сути дальше только изучение и практика:).
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы