Шаблоны (группировка) в регулярных выражениях и сохранение не только первого вхождения

Question

couatl @couatl

Регулярные выражения

Шаблоны (группировка) в регулярных выражениях и сохранение не только первого вхождения

В регулярных выражениях есть такое понятие как группировка, помогающая вытащить с помощью регулярного выражения сразу несколько частей. Она обозначается через круглые скобки.
Дело в том что сохраняется лишь первое вхождение. Вот пример:

str = Mama mila ramu

regex = (?:([A-Za-z]+)\s?)+

Вот результат:

0: (Mama mila ramu) // тут вопросов нет, выражение как раз выдирает всю строку

1: (ramu) // вот оно первое вхождение

Можно ли как-нибудь с помощью группировки выдирать не только первое вхождение, а все?
То есть требуемый результат:

0: (Mama mila ramu)

1: (Mama)

2: (mila)

3: (ramu)

Естественно все это делается не для этого примера.
Мой пример где я столкнулся с этой проблемой:
Имеется КС-грамматика и ее правила

 S->a|AS

 A->AB

 B->b

Одним регулярным выражением хочется установить — является ли правило корректным и выдрать все из правила.
Написал такое регулярное выражение: \b([A-Z])->(?:([A-Za-z]+)\|?)+
Но естественно из правой части она достает с помощью группировки только первое вхождение.
Результат для S->a|AS:

0: (S->a|AS)

1: (S)

2: (AS)

а нужно

0: (S->a|AS)

1: (S)

2: (a)

3: (AS)

Вопрос задан более трёх лет назад
6847 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее
Stepik

Поколение Python: курс для профессионалов

1 неделя

Далее
Хекслет

Java-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Средний
Почему некорректно работает регулярное выражение в PHP?
- 1 подписчик
- 06 окт. 2025
- 340 просмотров
3

ответа
Регулярные выражения

+1 ещё

Простой
Как убрать все точки из текстового файла с помощью регулярных выражений в Notepad++?
- 1 подписчик
- 03 сент. 2025
- 291 просмотр
1

ответ
Регулярные выражения

+1 ещё

Средний
Почему один регэксп работает, а второй нет?
- 1 подписчик
- 03 сент. 2025
- 315 просмотров
4

ответа
Регулярные выражения

Простой
Как работает ленивость в регулярных выражениях?
- 2 подписчика
- 31 авг. 2025
- 265 просмотров
2

ответа
Регулярные выражения

Простой
Как удалить часть слов?
- 1 подписчик
- более года назад
- 264 просмотра
1

ответ
Регулярные выражения

Простой
Как оставить в строке при помощи регулярки (+еще)?
- 1 подписчик
- более года назад
- 174 просмотра
1

ответ
PHP

+1 ещё

Простой
Как в PHP найти строку, которая содержит или не содержит символ?
- 1 подписчик
- более года назад
- 279 просмотров
2

ответа
Регулярные выражения

+1 ещё

Средний
Как сделать замену текста по ssh?
- 1 подписчик
- более года назад
- 189 просмотров
0

ответов
ВКонтакте

+1 ещё

Простой
Как с помощью регулярного выражения получить oid и id видео из ссылки?
- 1 подписчик
- более года назад
- 171 просмотр
2

ответа
Регулярные выражения

Простой
Как захватить элементы по отдельности?
- 2 подписчика
- более года назад
- 325 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2011-12-02 19:46:15

Wott @Wott

можно, просто для этого обычно отдельный вызов/синтаксис
язык какой?

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2011-12-02 20:48:10

По-хорошему, нужно воспользоваться к.-л. генератором компиляторов, описав грамматику в BNF или EBNF. Регулярные выражения не обеспечят необходимой гибкости.

Более-менее, если язык простенький, регулярками можно выделить лексемы (разбить выражение). Проверять корректность надо бы синтаксическим анализатором.

Конкретно для вашего случая что-то вроде (Python):

>>> import re
>>> re.findall("^(([A-Z])->([A-Za-z]+)\|([A-Z]+))", «S->a|AS»)
[('S->a|AS', 'S', 'a', 'AS')]

Или re.match(...).group(n) юзать…

Шаблоны (группировка) в регулярных выражениях и сохранение не только первого вхождения

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт