Какое регулярное выражение искользовать для поиска блока русского текста?

Question

xne71247 @xne71247

Android
Java

Какое регулярное выражение искользовать для поиска блока русского текста?

Имеется HTML страница, нужно из нее вытащить блок русского текста. Блок текста на русском всего один. Посоветуйте регулярное выражение или как лучше это сделать?

Вопрос задан более трёх лет назад
613 просмотров

1 комментарий

Подписаться 1 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

AndroidSprint

Android + Аутстаффинг: опыт работы в IT-команде

8 месяцев

Далее
Нетология

Android-разработчик

14 месяцев

Далее
Академия Эдюсон

Android-разработчик + ИИ

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Android

+1 ещё

Простой
Реально ли сейчас зарегать аккаунт в Play Console?
- 2 подписчика
- 27 июн.
- 298 просмотров
1

ответ
Android

+2 ещё

Простой
Как зайти в Телеграм на мобильном устройстве без SMS и SIM, если есть доступ к открытому Desktop приложению?
- 2 подписчика
- 27 мая
- 1509 просмотров
3

ответа
Android

+1 ещё

Простой
Потерял Android-смартфон, как найти?
- 2 подписчика
- 21 мая
- 612 просмотров
3

ответа
Android

+1 ещё

Простой
Почему соединение с Orbot постоянно дропается?
- 1 подписчик
- 20 мая
- 369 просмотров
1

ответ
Android

+2 ещё

Простой
А как же все таки установить chatGPT на андроид в 2026?
- 1 подписчик
- 20 мая
- 724 просмотра
1

ответ
Android

+2 ещё

Простой
Какая программа подходит для озвучки текста на андроиде?
- 3 подписчика
- 17 мая
- 452 просмотра
2

ответа
Java

Простой
Почему не запускается Flyway?
- 1 подписчик
- 12 мая
- 179 просмотров
2

ответа
Java

Простой
Можно ли сделать «псевдоним» для пакета?
- 3 подписчика
- 06 мая
- 238 просмотров
1

ответ
Java

Простой
Возможно ли добавлять методы в пакет чужой библиотеки?
- 1 подписчик
- 05 мая
- 189 просмотров
2

ответа
Android

+1 ещё

Средний
Почему не находит метод KotlinJvmCompilerOptions.getJvmDefault()?
- 1 подписчик
- 30 апр.
- 101 просмотр
1

ответ
Показать ещё Загружается…

Вы работаете только с текстом страницы или имеете доступ к DOM?

Answer 1 · 2015-04-02 16:49:10

Смотря что понимается под блоком. Если внутри него нет никаких тэгов, то можно как-то так вырезать:
>([^<]*[А-Яа-я][^<]*)<
В итоге попадёт всё, что между >< и содержит минимум одну русскую букву. Это навскидку, так-то обязательно убедитесь, чтобы регулярник работал именно с той же кодировкой.

Answer 2 · 2015-04-02 22:12:04

юзай jsoup .

Jsoup.parse(htmlText).select(":matches(REGEX)").first().text();

за REGEX задай регулярное выражение, включающее русские символы, знаки препинания.

Answer 3 · 2015-04-03 10:57:44

ShamblerR @ShamblerR

вы бы хоть дали приммер страницы

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2015-04-03 18:23:30

asd111 @asd111

Проверь на этом сайте
https://regex101.com/
([А-Яа-я]+)

text text текст text Текст теКСТ

Ответ написан более трёх лет назад

Комментировать

Какое регулярное выражение искользовать для поиска блока русского текста?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт