Как написать parser для txt в словарь с использованием regex pyton?

Question

Pyty @Pyty

Как написать parser для txt в словарь с использованием regex pyton?

Нужно написать parser для файла с таким содержанием:
{## bonus:DS ##}
{## bang:fm,bv ##}

{## zf:123,230 ##} # примечание
{## zf1:349,410 ##}
{## pred:WE ##}

sadf sad ghjsgydk as

{## grable:Бараш-прототепин.f31.txt ##}
{## grable:Бараш-вкк yyy.s34.swt; ##}

rtsaydi ioi adioidsou asdy

{## da_vate: ##}

{# pronpun #}

{## te_zagol: + ##}
{## te_zagol2 : +##}
{## te_opisanie : b ##}
{## te_podtver_vushe_pricr :+ ##}
{## te_golde_babck : ##}

на выходе словарь 'grandle' - это список, 'zf' - список с кортежем, все остальные пары (ключ-значене):

{ 'grable': ['Бараш-прототепин.f31.txt', 'grable:Бараш-вкк yyy.s34.swt'], # это список
'bonus': 'DS',
'te_podtver_vushe_pricr': '+',
'te_golde_babck': '',
'te_opisanie': 'b',
'da_vate': '',
'te_zagol': '+',
'te_zagol2': '+',
'bang': 'fm,bv',
'zf': {('zf', '123,230'), ('zf1': '349, 410')], # cписок из кортежей

все что у меня получилось:
import re
def get_template_vars(filename):
result = {}
with open(filename, encoding='UTF-8') as lines:
for line in lines:
f = re.search(r,line)
result[f]

print (result)

python изучаю пару дней..

Благодарю за помощь.

Вопрос задан более трёх лет назад
2830 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 209 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 545 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 493 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 281 просмотр
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 507 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 214 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 126 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 663 просмотра
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2014-03-07 07:15:02

Валентин @vvpoloskin

Инженер связи

Вы хотите, чтобы здесь люди сделали за вас вашу работу?

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2014-03-18 19:33:26

1. Допустим, мы хотим поймать всё, что находится между символами {## и ##}. Как будет выглядеть регулярное выражение?

Нам всё равно, какие символы будут встречаться внутри, поэтому можно поставить точку — произвольный символ. Пусть этот символ будет повторяться произвольное число раз — добавляем звёздочку. Нам надо поймать всё, что находится между {## и ##} — добавляем круглые скобки, чтобы обозначить границы группы:
{## (.*) ##}
Можно немного изменить это регулярное выражение, например, поставить знак "+" вместо звёздочки — это будет означать, что произвольный символ должен встретиться хотя бы один раз (звёздочка означает, что он может встретиться ноль или более раз).

2. Как использовать это регулярное выражение?

Можно применять его к каждой строке файла по очереди. А можно применить ко всему файлу целиком, если он небольшой.

Допустим, мы считываем весь файл в одну строковую переменную:

with open('input.txt', 'r') as f:
    text = f.read()

Тогда мы можем вытащить из него сразу всё, что нас интересует:

import re
pattern = "{## (.*) ##}"
result = re.findall(pattern, text)

Результатом будет список строк вида

['bonus:DS',
'bang:fm,bv',
'zf:123,230',
'zf1:349,410',
... ]

Здесь каждую строку можно разбить на две:

s = 'bonus:DS'
s.split(':')  # получаем ['bonus', 'DS']

— и дальше действовать как потребуется.

3. Что получится, если включить двоеточие сразу в регулярное выражение?

Чтобы обойтись без использования split(), можно изначально включить двоеточие в наше регулярное выражение:
pattern = "{## (.*):(.*) ##}"
Результатом будет список кортежей:

[('bonus', 'DS'),
('bang', 'fm,bv'),
('zf', '123,230'),
('zf1', '349,410'),
... ]

4. Как собирать различные структуры данных с нуля?

Примеры того, как можно собрать с нуля списки, словари и кортежи. Все примеры легко проверить в командной строке.

Списки:

list = []
list.append('a')

Пары ключ-значение (словари):

d = dict()
d['a'] = '123'

Кортежи:

x = '123'
y = '456'
tuple = (x, y)

По идее, этой информации должно быть достаточно, чтобы вы смогли разобраться в путях решения задачи. Удачи!

Answer 3 · 2014-03-07 09:12:12

Я хочу чтобы люди дали советы как это делать, человеку у которого нет опыта, возможно помогли найти решение или хотябы направили в нужном направлении.

Как написать parser для txt в словарь с использованием regex pyton?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт