Объясните регулярное выражение?

Question

nano_e_t_4 @nano_e_t_4

Объясните регулярное выражение?

Всем привет
Нашел такое вот регулярное выражение, никак не могу его толком разобрать:

string = '<p style="margin-left:10px;">text<b class="super-bold">bold text</b>.<p>'
pattern = '<[^>]+>'
result = re.findall(pattern,string)
print result
['<p style="margin-left:10px;">', '<b class="super-bold">', '</b>', '</p>']

Непонятен тот момент, почему в result попадает символ ">"
Спасибо

Вопрос задан более трёх лет назад
286 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 192 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 221 просмотр
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 616 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 529 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 295 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 545 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 221 просмотр
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 129 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 336 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 673 просмотра
5

ответов
Показать ещё Загружается…

Answer 1 · 2016-07-04 01:09:51

pattern = '<[^>]+>'
# выражение означает строку между символами < и >
# квантификатор + - один или более символов
# квантификатор * -  ноль или более символов
# квантификатор ? - ноль или один символ

То есть в строке
<abc def>gfh>
этой регуляркой найдется только <abc def>

>>> import re
>>> string = '<p style="margin-left:10px;">text<b class="super-bold">bold text</b>.<p>'
>>> string2 = '<abc def>gfh>'
>>> pattern = '<[^>]+>'
>>> 
>>> result = re.findall(pattern,string)
>>> print result
['<p style="margin-left:10px;">', '<b class="super-bold">', '</b>', '<p>']
>>> 
>>> result2 = re.findall(pattern,string2)
>>> print result2
['<abc def>']

Answer 2 · 2016-07-04 01:06:31

В result попадает:
1) символ < (<)
2) 1 или более любых символов отличных от > ([^>]+)
3) символ > (>)

Все это исходя из регулярки <[^>]+>

Answer 3 · 2016-07-04 02:15:33

abcd0x00 @abcd0x00

Прочитай документацию
https://docs.python.org/3/library/re.html

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2016-07-04 03:01:11

<[^>]+>
Ответ простой: после открытия ищем всё, что внутри, пока не будет закрытия.
т.е. (это лишь пример ДЛЯ ПОНИМАНИЯ, и структура тегов здесь, конечно, не корректна):
< <dfgdg> > - будет: < <dfgdg>
или
<a sdfsd>>>>> - будет: <a sdfsd>

Объясните регулярное выражение?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт