Как распарсить файл построчно, выловив и перезаписав мой шаблон?

Question

Night Tarlis @tarlis

Student

Как распарсить файл построчно, выловив и перезаписав мой шаблон?

import re

f1 = open("/home/tarlis/ParserTest/2.txt", 'r')
f2 = open("/home/tarlis/ParserTest/1.txt", "a")

fr = f1.read()
reg_pattern = 'title=\"(\D+)\"\D*data=\"([a-z.]+@[mailstbknox]+\.ru)'
for line in fr:
    match = re.search(reg_pattern, line)
    if match is not None:
        f2.write(match.group(1) + '|' + match.group(2) + '\n')
f2.close()
f1.close()

Matсh всегда возвращает None, хотя проверил регулярку на regex101.com все замечательно находится. Построчно файл считывается... Не понимаю в чем проблема :(

Содержание считываемого файла примерно такое:

<div>

		<a  target="_blank"   " title="Дмитрий" data="dim@mail.ru">Дмитрий </a>
</div>

Вопрос задан более трёх лет назад
1027 просмотров

1 комментарий

Подписаться 1 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 22 часа назад
- 61 просмотр
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 222 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 226 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 628 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 542 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 304 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 557 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 139 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 339 просмотров
1

ответ
Показать ещё Загружается…

Проблема с построчным открыванием файла...

Answer 1 · 2015-12-22 06:58:48

f1.read() - прочтет файл разом в строку. Последующий цикл будет проходит строку.
f1 является итерируемым, можно делать примерно так

for line in f1:
   match.re.search(r, line)
   ...

Либо читать строки через f1.readlines() в список и затем итерироваться по нему.

Я бы вам рекомендовал парсить html при помощи специализированных библиотек, например lxml или pyqyery.

Как распарсить файл построчно, выловив и перезаписав мой шаблон?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт