Как заменить все пробелы ограниченные определенным символом?

Есть кусок HTML документа:
...
<img alt='fdsfsd' src='text1 text2'/>
adasd 
<img alt='sadsdd' src='text3 text4'/>
adasdas
...

Нужно заменить все пробелы в пути файла подчеркивание и добавить начало пути. В результате должно получится.
...
<img alt='fdsfsd' src='CONST_text1_text2'/>
adasd 
<img alt='sadsdd' src='CONST_text3_text4'/>
adasdas
...


Язык python со стандартными обьектом re
  • Вопрос задан
  • 215 просмотров
Решения вопроса 1
@nirvimel
  1. Нельзя парcить HTML регулярками.
  2. import re
    from lxml import etree
    doc = \
        """
        <body>
        <img alt='fdsfsd' src='CONST text1 text2'/>
        adasd
        <img alt='sadsdd' src='CONST text3 text4'/>
        adasdas
        </body>
        """
    tree = etree.fromstring(doc, parser=etree.HTMLParser())
    for img in tree.xpath('//img[@src]'):
        img.attrib['src'] = re.sub(r'\s+', '_', img.attrib['src'])

Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы