Как парсить HTML с помощью xpath в JAVA?

Собственно есть такой код

var source = new InputSource(new StringReader(html));

var xpath = XPathFactory.newInstance().newXPath();

var result = (String) xpath.evaluate(expression, source, XPathConstants.STRING);

Проблема в том, что кож заточен на парсинг XML, а мне нужно парсить HTML, который может содержать незакрытые теги и прочие радости HTMLной жизни, натыкаясь на которые данный код падает.

Есть ли какой-то способ парсить именно HTML со всеми его особенностями?

P. S. варианты с регулярками пока не рассматриваю.

UPD

Нашел вариант с использованием библиотеки https://github.com/code4craft/xsoup

var document = Jsoup.parse(html);

var result = Xsoup.compile(expression).evaluate(document).getElements().get(0).text();

Но все-таки хотелось бы рассмотреть другие варианты, может быть есть что-то нативное, без установки дополнительных библиотек?

Вопрос задан более двух лет назад
219 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Android

+3 ещё

Средний
Как получить разрешение для автостарта (чтобы при старте оно загружалось) для приложения под Андройд (Android)?
- 1 подписчик
- 23 апр.
- 71 просмотр
0

ответов
Java

Простой
Как сделать глобальный чат Chatty?
- 1 подписчик
- 20 апр.
- 79 просмотров
0

ответов
Java

+2 ещё

Простой
Selenide + Spring Boot. Как объявить страницу через метод open(), если класс страницы является bean?
- 1 подписчик
- 19 апр.
- 44 просмотра
0

ответов
Java

+1 ещё

Простой
Почему не видит WebSecurityConfigurerAdapter при попытке импортировать его в класс SecurityConfig?
- 1 подписчик
- 19 апр.
- 65 просмотров
1

ответ
Java

Простой
Почему происходит два пустых вывода при чтении с клавиатуры?
- 1 подписчик
- 19 апр.
- 52 просмотра
1

ответ
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- 17 апр.
- 201 просмотр
3

ответа
Java

+1 ещё

Простой
Как правильно внедрять зависимости в классы, зависящие от не-бинов?
- 1 подписчик
- 16 апр.
- 72 просмотра
1

ответ
Python

+1 ещё

Простой
Возможно ли соединить работающий java код и так же работающий скрипт python?
- 1 подписчик
- 15 апр.
- 233 просмотра
3

ответа
Java

+2 ещё

Простой
Как заставить Tomcat работать c utf-8 и кириллицей?
- 1 подписчик
- 14 апр.
- 66 просмотров
0

ответов
Java

+2 ещё

Простой
Как правильно вывести подблок с данными на странице?
- 1 подписчик
- 14 апр.
- 30 просмотров
1

ответ
Показать ещё Загружается…

Lead Java

Bell Integrator • Хабаровск

До 400 000 ₽

Lead Java

Bell Integrator • Ульяновск

До 400 000 ₽

Lead Java

Bell Integrator • Ижевск

До 400 000 ₽

Devops для видео сервиса

26 апр. 2024, в 06:46

1500 руб./в час

Найти ошибку flutter_map

26 апр. 2024, в 05:31

1000 руб./за проект

Разработать электронику для весов с Wi-Fi

26 апр. 2024, в 01:22

1000 руб./в час

Как парсить HTML с помощью xpath в JAVA?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт