Как написать регулярное выражение?

Question

Акшин Ёлчуев @Akshin17

Пайтон програмист

Регулярные выражения

Как написать регулярное выражение?

<a>
<b>test</b>
<b>test</b>
</a>

<a>
<b>test</b>
<b>test</b>
</a>

<c>
<b>test</b>
<b>test</b>
</c>

По идее простая задача :

Нужно вывести все test которые находятся по пути a>b
пишу что то подобное :
[\s\S]*?([\s\S]*?)<\/b>[\s\S]*?<\/a> но это выраж...

Вопрос задан более двух лет назад
95 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Хекслет

Java-разработчик

10 месяцев

Далее
Stepik

Поколение Python: курс для профессионалов

1 неделя

Далее
МИПО

Веб-мастер

7 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Средний
Почему некорректно работает регулярное выражение в PHP?
- 1 подписчик
- 06 окт. 2025
- 322 просмотра
3

ответа
Регулярные выражения

+1 ещё

Простой
Как убрать все точки из текстового файла с помощью регулярных выражений в Notepad++?
- 1 подписчик
- 03 сент. 2025
- 247 просмотров
1

ответ
Регулярные выражения

+1 ещё

Средний
Почему один регэксп работает, а второй нет?
- 1 подписчик
- 03 сент. 2025
- 292 просмотра
4

ответа
Регулярные выражения

Простой
Как работает ленивость в регулярных выражениях?
- 2 подписчика
- 31 авг. 2025
- 247 просмотров
2

ответа
Регулярные выражения

Простой
Как удалить часть слов?
- 1 подписчик
- 04 июн. 2025
- 247 просмотров
1

ответ
Регулярные выражения

Простой
Как оставить в строке при помощи регулярки (+еще)?
- 1 подписчик
- 01 июн. 2025
- 160 просмотров
1

ответ
PHP

+1 ещё

Простой
Как в PHP найти строку, которая содержит или не содержит символ?
- 1 подписчик
- 16 мая 2025
- 268 просмотров
2

ответа
Регулярные выражения

+1 ещё

Средний
Как сделать замену текста по ssh?
- 1 подписчик
- 12 мая 2025
- 180 просмотров
0

ответов
ВКонтакте

+1 ещё

Простой
Как с помощью регулярного выражения получить oid и id видео из ссылки?
- 1 подписчик
- 05 мая 2025
- 150 просмотров
2

ответа
Регулярные выражения

Простой
Как захватить элементы по отдельности?
- 2 подписчика
- 25 апр. 2025
- 313 просмотров
2

ответа
Показать ещё Загружается…

Менеджер по продажам (со знанием английского языка)

Ingros Sales • Санкт-Петербург

от 1 500 $

Разработчик Ruby

ПСБ цифровая лаборатория • Москва

от 200 000 ₽

Web-аналитик / Веб-аналитик

ElsiKora

от 120 000 до 250 000 ₽

Answer 1 · 2023-04-29 15:33:13

Очень плохая идея парсить html регулярными выражениями. Они не для этого предназначались. Есть специальные инструменты для этой цели, которые извлекают данные по xpath.

Answer 2 · 2023-05-14 20:23:55

какой ЯП?
можно находить блоки <a>...</a>
а уже внутри них искать блоки ...

одной регуляркой, это......... м...

одной регуляркой даже скорее невозможно, только если знать точное количество блоков ...
или точнее... хотя бы максимальное их количество...

например максимум их может быть 4, тогда можно написать регулярку вида:

(?<=<a>)(\s*?<b>([^<]+)<\/b>)(\s*?<b>([^<]+)<\/b>)?(\s*?<b>([^<]+)<\/b>)?(\s*?<b>([^<]+)<\/b>)?

матчим и в каждом "матче" (совпадении) - если существует группа с нечетным номером, то в следующей группе с четным номером будет собственно значение, т.е. нам нужны только четные группы.

см, regex101

PS:
можно было бы и так... (?<=<a>)(\s*?([^<]+)<\/b>){1,}
матчиться оно будет, НО, вот группа будет только одна и писаться в нее будет последнее найденное значение.

как-то так....

UPDATE
взяв сгенерированный код в python с regex101, допиливаем "решение в лоб"

regex = r"(?<=<a>)(\s*?<b>([^<]+)<\/b>)(\s*?<b>([^<]+)<\/b>)?(\s*?<b>([^<]+)<\/b>)?(\s*?<b>([^<]+)<\/b>)?"

test_str = '''
<a>
<b>test11</b>
</a>

<a>
<b>test21</b>
<b>test22</b>
</a>

<a>
<b>test31</b>
<b>test32</b>
<b>test33</b>
</a>

<a>
<b>test41</b>
<b>test42</b>
<b>test43</b>
<b>test44</b>
</a>

<c>
<b>test51</b>
<b>test52</b>
</c>
'''

matches = re.finditer(regex, test_str, re.MULTILINE)

for matchNum, match in enumerate(matches, start=1):
    for groupNum in range(0, len(match.groups())):
        groupNum = groupNum + 1
        if (groupNum % 2 == 0) & (match.group(groupNum) != None):
            print (match.group(groupNum) )

см. пример

Как написать регулярное выражение?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт