И все же sscanf в Python — или парсинг простых строк?

Question

YoungSkipper @YoungSkipper

И все же sscanf в Python — или парсинг простых строк?

Изучаю питон, пишу небольшую утилитку. Нужно парсить простые строки текстовых данных. Хочется простого, чтобы можно было написать аля такой псевдо код

(full_name, age, coof1, coof2) = «Name Surname 25 1/2».sscanf("{str} {int} {int}/{int}")

(coof1,coof2) = «1/2».sscanf("{int}/{int}")

(date, place) = «8:30 Place».sscanf("{datetime} {str}")

Ну и если не парситься, то как-то получать ошибку — мол не сматчилось…

Есть что-то подобное?

Если нет, то как все же правильно делать, как я понимаю есть следующие варианты

1. Использовать модуль, который эмулирует sscanf — не фиги не декларативно и не функционально как-то :)

2. Использовать регэкспы — нужно синтаксис вспоминать, и так-то много кода, создать регэксп, скомпилять, использовать

3. Что-то еще?

Вопрос задан более трёх лет назад
5743 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 5

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 218 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 233 просмотра
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 78 просмотров
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 106 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 99 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 120 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 468 просмотров
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 3 подписчика
- 05 мар.
- 1002 просмотра
4

ответа
Python

Простой
Как запретить удаление полей класса?
- 1 подписчик
- 27 февр.
- 322 просмотра
1

ответ
Python

Простой
Как написать правильный код Pyhton?
- 1 подписчик
- 22 февр.
- 549 просмотров
2

ответа
Показать ещё Загружается…

Middle Python developer

ITK academy • Краснодар

от 220 000 до 300 000 ₽

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

Answer 1 · 2012-09-25 23:48:25

import re

def scan_compile(pattern):
    pattern = pattern.replace('{str}', '(.+?)')
    return re.compile(pattern.replace('{int}', '(\d+)'))

def scan_match(r, s):
    match = r.match(s)
    return [int(g) if g.isdigit() else g
            for g in match.groups()]

>>> from scan_match import *
>>> r = scan_compile("{str} {int} {int}/{int}")
>>> scan_match(r, 'Mary Rose Jesus 12 24/32')
['Mary Rose Jesus', 12, 24, 32]

Answer 2 · 2012-09-25 23:56:50

Павел Тысляцкий @tbicr

Можете глянуть в сторону pyparsing и похожих утилит по парсингу тескта (синтаксическим анализаторам).

Ответ написан более трёх лет назад

1 комментарий

Answer 3 · 2012-09-25 23:10:41

Sergey Lerg @Lerg

Defold, Corona, Lua, GameDev

split()?

Ответ написан более трёх лет назад

1 комментарий

Answer 4 · 2012-09-25 23:58:12

О! Регексы, но в красиво обвернуто. Собственно библиотеки которые эмулируют sscanf делают примерно тоже самое, напрмер — code.activestate.com/recipes/502213-simple-scanf-implementation/

Answer 5 · 2012-09-26 00:04:45

Но в целом что-то такое подойдет, все свое — легче контролировать если что… Только открытый вопрос что делать со сложными типа данных — типа float или datetime.
Для float он из примера можно взять — ""([-+]?(?:\d+(?:\.\d*)?|\.\d+)(?:[eE][-+]?\d+)?)" — но жесть же :)
Да и с int проблема — такой вариант если в строке будет 0xAB уже не подойдет — в моем конкретно случае это не нужно… Но как бы потом не забыть, а то маленькие утилитки разрастаться имеют тенденцию :)

И все же sscanf в Python — или парсинг простых строк?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт