Добрый день!
В файле "Реестр выданных разрешений на осуществление деятельности по перевозке пассажиров и багажа легковым такси на территории Сахалинской области" с сайта
https://mintrans.sakhalin.gov.ru/about/rezultaty-d..., из столбца "марка, модель, государственный регистрационный знак транспортного средства" пытаюсь вычленить номера автомобилей.
Написал:
pattern_sakhalin = re.compile('\w\d\d\d\s*\w\w\s*\d\d\d*')
auto_number_itog_sakhalin = []
for d_1_sakhalin in df_sakhalin['марка, модель, государственный регистрационный знак транспортного средства']:
d_3_sakhalin = pattern_sakhalin.findall(str(d_1_sakhalin))
auto_number_itog_sakhalin.append(d_3_sakhalin)
Но он не забирает номера такси, которые имеют следующий формат "две буквы, три цифры, затем две или три цифры"
Как его можно дополнить, чтобы вычленять номера такси?