Python: множественная замена из списка, состоящего из RegExp. Как использовать нумерацию групп и флаги компиляции?

Question

DarkWood @DarkWood

Python: множественная замена из списка, состоящего из RegExp. Как использовать нумерацию групп и флаги компиляции?

Здравствуйте.

В настоящий момент имеется следующий код:

import re

SUBS = [
  (r'(Шаг \d+)', r'[COLOR=orange][SIZE=7]\1[/SIZE][/COLOR]'),  
  (r'(^\d+.*$)', r'[COLOR=orange][SIZE=7]\1[/SIZE][/COLOR]'),
]

file = open('d:/text_sample.txt','r')
text = file.read()

def add():
        for pattern, replacement in SUBS:
                result = re.sub(pattern, replacement, text)
        return result

file.close()
file1 = open('d:/text_sample.txt','w')
file1.write(add())
file1.close()

Как видите он берет первое значение каждого кортежа из списка в качестве паттерна для re.sub и второе значение - как заменитель для него же.

Первый вопрос: как нумеровать группы в подстановочных значениях?
Второй вопрос: можно ли использовать флаги компиляции (re.compile) или саму компиляцию? Если можно, то как?

Почему у меня возникает второй вопрос? Значения замены во второй строке изначально писались как самостоятельные и имели такой вид:

section_replace = re.compile(r'(^\d+.*$)', re.MULTILINE)
section_result = section_replace.sub(r'[COLOR=orange][SIZE=7]\1[/SIZE][/COLOR]', text)

То есть, используют флаг компиляции. Может быть, можно изменить выражение поиска на иное, без флага? Оно ищет заголовки разделов (выделено жирным):

1. Название пункта

Абзац с текстом

2. Название второго пункта

Абзац с текстом

и т.д.

По сути, показанный выше код в настоящий момент работает, только если удалить вторую строку из списка замен

Подскажите, пожалуйста, пути исправления. На всякий случай скажу, что в список замен в будущем возможны добавления (и я не уверен, что у них будут использоваться флаги компиляции, если это важно).

P.S. Python не знаю лишь чуть менее, чем совсем. Решение взято отсюда.

Вопрос задан более трёх лет назад
596 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

3 комментария

DarkWood @DarkWood Автор вопроса

Спасибо за ответ, но, к сожалению, у меня работает так: теперь записывается только первая замена из списка.

Написано более трёх лет назад
lcd1232 @lcd1232

DarkWood: А так? Изменил чутка код.

Написано более трёх лет назад
DarkWood @DarkWood Автор вопроса
lcd1232: отлично, всё работает! Спасибо большое!

Я еще часть скрипта изменил, чтобы файл несколько раз не открывать:

file = open('d:/text_sample.txt','r+') text = file.read() def add(): result = text for pattern, replacement in SUBS: result = re.sub(pattern, replacement, result) return result file.seek(0) file.write(add()) file.truncate() file.close()
Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 744 просмотра
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 548 просмотров
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 619 просмотров
1

ответ
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 208 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 541 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 492 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 280 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 506 просмотров
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1342 просмотра
10

ответов
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 214 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2016-09-28 19:48:42

lcd1232 @lcd1232

def add():
        result = text
        for pattern, replacement in SUBS:
                result = re.sub(pattern, replacement, result)
        return result

Ответ написан более трёх лет назад

3 комментария

Answer 2 · 2016-09-25 13:25:59

Вроде бы разобрался с компиляцией. Изменил код следующим образом:

import re

step_replace = re.compile(r'(Шаг \d+)')
section_replace = re.compile(r'(^\d.+$)', re.MULTILINE)

SUBS = [
        (step_replace, r'[COLOR=orange][SIZE=7]\1[/SIZE][/COLOR]'),
        (section_replace, r'[COLOR=orange][SIZE=7]\1[/SIZE][/COLOR]'), 
]

file = open('d:/text_sample.txt','r')
text = file.read()

def add():
        for pattern, replacement in SUBS:
                result = re.sub(pattern, replacement, text)
        return result

file.close()
file1 = open('d:/text_sample.txt','w')
file1.write(add())
file1.close()

Но теперь проблема в том, что в файл записывается лишь последняя строка в списке замен (в данном случае section_replace).

Как записать все замены?

Python: множественная замена из списка, состоящего из RegExp. Как использовать нумерацию групп и флаги компиляции?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт