Как заставить питон преобразовать значения столбца к формату?

Question

CrimsonFox @CrimsonFox

Python

Как заставить питон преобразовать значения столбца к формату?

Добрый день!
Вопрос в следующем: у меня есть столбец в excel, который нужно привести к одному из двух форматов

(в записях типа 0-0000/00/0000 количество нулей варьируется от 1 до 4)
При попытке обозначить шаблоны и обработать таким образом задачу питон все обрабатывает.. а значения не изменяются.

import re

def convert_status(column):
    # iterate over each value in the column
    for i in range(len(column)):
        # check if the value matches the pattern '0-0000/00/0000' or '0-0000/00/00'
        if re.match(r'^\d{1}/[-]\d{4}/\d{2}/\d{2}$', str(column[i])):
#или if re.match(r'^\d+/-/\d+/\d+/\d{2}$', str(column[i])):
            # check if the last two digits of the year are '00'
            if column[i][-2:] == '00':
                # remove the last two digits of the year
                column[i] = column[i][:-2]
        if re.match(r'^\d{2}/[-]\d{4}/\d{2}/\d{2}$', str(column[i])):
            # check if the last two digits of the year are '00'
            if column[i][-2:] == '00':
                # remove the last two digits of the year
                column[i] = column[i][:-2]
        if re.match(r'^\d{1}/[-]\d{4}/\d{2}/\d{4}$', str(column[i])):
            # check if the last two digits of the year are '00'
            if column[i][-4:] == '00' or column[i][-4:-2] == '20':
                # remove the last two digits of the year
                column[i] = column[i][:-4]
        if re.match(r'^\d{2}/[-]\d{4}/\d{2}/\d{4}$', str(column[i])):
            # check if the last two digits of the year are '00'
            if column[i][-4:] == '00' or column[i][-4:-2] == '20':
                # remove the last two digits of the year
                column[i] = column[i][:-4]
        # check if the value matches the pattern '000000000'
        elif re.match(r'ФС № ^\d{9}$', str(column[i])):
            # add 'ВС №' prefix to the value
            column[i] = column[i][5:]
            column[i] = 'ВС № ' + column[i]
        elif re.match(r'^\d{9}$', str(column[i])):
            # add 'ВС №' prefix to the value
            column[i] = 'ВС № ' + column[i]
    
    return column

# convert the 'Статус ИП' column to the desired format
df['Номер ИД'] = df['Номер ИД'].astype(str).apply(convert_status)
df.to_excel('292 отчет.xlsx', index=False)
# print the updated dataframe
print(df['Номер ИД'])

Буду благодарен если подскажете в чем ошибка.

Вопрос задан более года назад
107 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Решения вопроса 1

2 комментария

CrimsonFox @CrimsonFox Автор вопроса
Добрый день!
в общем я переделал этот ужас и выходит следующее

import re import pandas as pd F1 = df['Номер ИД'].astype(str).apply(str).apply(lambda x: re.findall(r'(\d{1,2}/\d-\d{3,4}/\d{2,3}/)', x)) f2 = df['Номер ИД'].astype(str).apply(str).apply(lambda x: re.findall(r'(\d{9})', x)) df['Номер ИД формат'] = F1 + f2 df.to_excel('df.xlsx', index=False)

по логике он должен просмотреть экселевский столбец ['Номер ИД'], найти в нём соответствующие формату части строки и записать их в столбец с аналогичным индексом ['Номер ИД формат']
но в итоге он (в указанном коде) выводит [], при изменениях максимум дублит первый столбец
не подскажешь, что я не так делаю
Написано более года назад
Vindicar @Vindicar

CrimsonFox, ну вот с пандас я не работал, так что вряд ли подскажу.

Написано более года назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Как сделать lock для двух асинхронных программ?
- 1 подписчик
- 4 часа назад
- 80 просмотров
1

ответ
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 115 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 123 просмотра
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- 16 авг.
- 188 просмотров
0

ответов
Python

Простой
Как подключиться по SMTP к Reg ru?
- 1 подписчик
- 15 авг.
- 139 просмотров
0

ответов
Python

+1 ещё

Простой
Как имитировать нажатие пкм в неактивное окно DirectX?
- 1 подписчик
- 15 авг.
- 47 просмотров
1

ответ
Python

+1 ещё

Простой
Как настроить группы при создании нового пользователя в битриксе?
- 1 подписчик
- 14 авг.
- 124 просмотра
0

ответов
Python

+1 ещё

Простой
При добавления строчки @commands.has_permissions в терминале при запуске выдает ошибку?
- 1 подписчик
- 14 авг.
- 91 просмотр
0

ответов
Python

+1 ещё

Простой
Можно ли отключить SSL сертификат при парсинге?
- 1 подписчик
- 13 авг.
- 137 просмотров
0

ответов
Python

Простой
Не работает код, что делать?
- 2 подписчика
- 10 авг.
- 2142 просмотра
4

ответа
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python-разработчик (Senior)

BCraft

от 3 500 до 4 500 $

Вы у ЧатЖПТ это недоразумение взяли? Вот у него и спрашивайте. Копаться в этом г…
Ошибка в том, что вы не пытались разобраться и сделать самостоятельно и не хотите платить фрилансерам, чтобы сделали за вас, а хотите чтоб вам на халяву за вас разобрались и за вас сделали.

Answer 1 · 2023-10-07 20:03:17

Ну т.е. у тебя два формата, по сути. Первый A-B/C/DE, где A - одна цифра, B - 4 цифры, C - 2 или 3 цифры, D - от 0 до 2 цифр, E - 2 цифры. Тебе нужно извлечь две части: A-B/C и E, и использовать их как ключ. В виде регулярки это будет что-то типа (\d-\d{4}/\d{2,3}/)\d{0,2}(\d{2}). Пример:

import re
r = re.compile(r'(\d-\d{4}/\d{2,3}/)\d{0,2}(\d{2})')
m = r.match("1-2345/678/0099")
print(m.groups())  # выведет ('1-2345/678/', '99')

Для второго формата всё ещё проще, там будет 9 цифр подряд: (\d{9})

import re
r = re.compile(r'(\d{9})')
m = r.match("123456789")
print(m.groups())  # выведет ('123456789', )

Как применить это к своим данным, разбирайся - я не знаю, как они представлены.
И да, код от чатгпт лучше не брать. Он обычно не работает, и его проще переписать, чем поправить.

Как заставить питон преобразовать значения столбца к формату?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт