import re
f1 = open("/home/tarlis/ParserTest/2.txt", 'r')
f2 = open("/home/tarlis/ParserTest/1.txt", "a")
fr = f1.read()
reg_pattern = 'title=\"(\D+)\"\D*data=\"([a-z.]+@[mailstbknox]+\.ru)'
for line in fr:
match = re.search(reg_pattern, line)
if match is not None:
f2.write(match.group(1) + '|' + match.group(2) + '\n')
f2.close()
f1.close()
Matсh всегда возвращает None, хотя проверил регулярку на regex101.com все замечательно находится. Построчно файл считывается... Не понимаю в чем проблема :(
Содержание считываемого файла примерно такое:
<div>
<a target="_blank" " title="Дмитрий" data="dim@mail.ru">Дмитрий </a>
</div>