azerphoenix
@azerphoenix
Java Software Engineer

При помощи чего парсить сайты на Java?

Доброго времени суток!

Хочу изучить парсинг сайтов при помощи Java. Функционала Jsoup, как я понял не хватит для того, чтобы парсить страницы сайта, отправлять get & post запросы, поддержка ajax (для пагинации например) и т.д.
Наткнулся на Selenium + HTMLUnit (судя по отзывам специфично работает с JS) или PhantomJS. Но судя по отзывам в Selenium нет оф. поддержки и используются браузеры FF || Chrome без графической оболчки. И тут к сожалению FF Quantum, также как и Chrome последних версий не поддерживают Java))) В общем... чем парсить веб-сайты на Java? Может у кого-то полезные видеоуроки даже найдутся. Заранее спасибо!
  • Вопрос задан
  • 549 просмотров
Решения вопроса 1
@l1l1l1
Практически любой сайт можно распарсить при помощи запросов, к примеру Jsoup.
В каком это плане в Selenium используются браузеры без графической оболочки?
Исходя из этого - https://github.com/mozilla/geckodriver , я понял что и Quantum Selenium поддерживает, значит и Java будет поддерживать.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы