@ash2ash

Ручная авторизация через вызов браузера в коде с сохранением сессии?

Ни хао, камрады!

Не так давно сел изучать джаву и стало интересно, смогу ли я наваять говнокод, который будет авторизоваться на сайте, парсить листинг с содержимым, удалять старые и создавать новые со спарсенным до этого содержимым.

По принципу рекламных объявлений на бордах, аля старое сносит, чтобы создать новое и повыше, но в моём случае это не борд и не рекламный, вообще ничего общего с коммерцией не имеет, просто привожу пример для понимания.

Каково же было моё разочарование, когда я зашёл по линке и увидел что там прикрутили топорную капчу.

И тут появилась мысль, ведь есть прекрасная библиотека java.awt.Desktop; которая поможет мне вызвать браузер внутри программы. Но я понятия не имею, есть ли способ после авторизации (ручками в браузере) сохранить сессию и отправлять запросы уже посредством кода.

И в принципе забил бы я давно большой и толстый, но меня мучает вопрос, вообще это реально или я недоучка-сказочник-дилетант? Спасибо за внимание, буду рад любой помощи.
  • Вопрос задан
  • 65 просмотров
Решения вопроса 1
azerphoenix
@azerphoenix Куратор тега Java
Java Software Engineer
Добрый день.
В принципе, в учебных целях можно запустить браузер через selenium в headless режиме. Саму капчу резолвить через 2Captcha и подобные сервисы (интегрируется через API). Т.е. вам нужно будет спарсить страницу испльзуя Selenium. Можно попробовать слать запросы и без Selenium, например, если у них есть внутренний АПИ. Вообще, еще зависит от сайта. Если контент статический, то можно спарсить данные и при помощи jsoup. В общем, надо смотреть что за сайт, так как на некоторых сайтах (серверах) могут быть настроены honeypot и т.д.
Ну и как отметил коллега, у кукис есть срок действия.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы