@Kornyshev
Newbie Java Student

Как спарсить HTML в Java с помощью HtmlUnit или JSOUP?

Здравствуйте. Возникла следующая проблема с парсингом сайтов: метод get в JSOUP и соответствующий механизм в HtmlUnit возвращают исходный код страницы. Но нужный текстовый контент, который я вижу в браузере, зашит в исходники, а как его оттуда извлечь я не знаю. Есть ли возможность средствами Java получить итоговую HTML страницу со всем текстовым контентом или всё это в читаемом виде? Заранее спасибо, надеюcь понятно написал.
  • Вопрос задан
  • 266 просмотров
Решения вопроса 1
erge
@erge
Примус починяю
Я думаю, что вам нужен "безголовый" хром, смотрите Introduction to Headless Chrome
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы