Хочу изучить парсинг сайтов при помощи Java. Функционала Jsoup, как я понял не хватит для того, чтобы парсить страницы сайта, отправлять get & post запросы, поддержка ajax (для пагинации например) и т.д.
Наткнулся на Selenium + HTMLUnit (судя по отзывам специфично работает с JS) или PhantomJS. Но судя по отзывам в Selenium нет оф. поддержки и используются браузеры FF || Chrome без графической оболчки. И тут к сожалению FF Quantum, также как и Chrome последних версий не поддерживают Java))) В общем... чем парсить веб-сайты на Java? Может у кого-то полезные видеоуроки даже найдутся. Заранее спасибо!
Практически любой сайт можно распарсить при помощи запросов, к примеру Jsoup.
В каком это плане в Selenium используются браузеры без графической оболочки?
Исходя из этого - https://github.com/mozilla/geckodriver , я понял что и Quantum Selenium поддерживает, значит и Java будет поддерживать.