Как парсить HTML с помощью xpath в JAVA?

Собственно есть такой код

var source = new InputSource(new StringReader(html));

var xpath = XPathFactory.newInstance().newXPath();

var result = (String) xpath.evaluate(expression, source, XPathConstants.STRING);

Проблема в том, что кож заточен на парсинг XML, а мне нужно парсить HTML, который может содержать незакрытые теги и прочие радости HTMLной жизни, натыкаясь на которые данный код падает.

Есть ли какой-то способ парсить именно HTML со всеми его особенностями?

P. S. варианты с регулярками пока не рассматриваю.

UPD

Нашел вариант с использованием библиотеки https://github.com/code4craft/xsoup

var document = Jsoup.parse(html);

var result = Xsoup.compile(expression).evaluate(document).getElements().get(0).text();

Но все-таки хотелось бы рассмотреть другие варианты, может быть есть что-то нативное, без установки дополнительных библиотек?

Вопрос задан более трёх лет назад
285 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Java-разработчик с нуля

12 месяцев

Далее
Skillbox

Java-разработчик

8 месяцев

Далее
ProductStar

Профессия: Java-разработчик

9 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

Простой
Как восстановить свой профиль в Майнкрафт?
- 1 подписчик
- 15 дек.
- 150 просмотров
1

ответ
Java

+2 ещё

Простой
Как изменить версию транзитивной зависимости в maven?
- 1 подписчик
- 08 дек.
- 80 просмотров
0

ответов
Java

+1 ещё

Средний
Как добавить цепочку сертификатов pkcs12 в java8 для взаимной аутентификации TLS?
- 2 подписчика
- 04 дек.
- 112 просмотров
0

ответов
Android

+1 ещё

Средний
Сервис Android (aidl) с системными правами (в прошивке) может быть доступен для несистемного приложения?
- 1 подписчик
- 18 нояб.
- 100 просмотров
1

ответ
Java

+1 ещё

Простой
В чем моя ошибка при deploy maven?
- 1 подписчик
- 26 окт.
- 151 просмотр
1

ответ
Java

Средний
Почему крашится сервер Minecraft Forge?
- 1 подписчик
- 13 окт.
- 171 просмотр
2

ответа
Java

+1 ещё

Простой
Как создать аннотацию, подобную Jakarta @Size?
- 2 подписчика
- 09 окт.
- 170 просмотров
1

ответ
Java

Простой
Почему способ создания String влияет на результат сравнения?
- 2 подписчика
- 27 сент.
- 292 просмотра
3

ответа
Java

+2 ещё

Простой
Какие есть варианты grpc service discovery с минимальным откликом?
- 1 подписчик
- 17 сент.
- 119 просмотров
0

ответов
Java

+1 ещё

Средний
Hibernate: Почему запрос с EntityGraph не работает?
- 1 подписчик
- 10 сент.
- 117 просмотров
0

ответов
Показать ещё Загружается…

Automation QA Engineer (Java)

ITK academy • Москва

от 90 000 ₽

Java Developer

ИТРУМ • Ростов-на-Дону

от 75 000 ₽

Java разработчик

SENSE

До 450 000 ₽

Как парсить HTML с помощью xpath в JAVA?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт