Как исправить ошибку с регулярными выражениями?

Question

WHATsMyName @WHATsMyName

Как исправить ошибку с регулярными выражениями?

import re

text = ["Any reason for the pump"] # 5
text = re.sub('–—!"#$%&()*,-./:;<=>@[\\]^_`{|}~\t\n\xa0–\ufeff', '', str(text))
print(text)

Возникает следующая ошибка: re.error: unterminated character set at position 21 (line 1, column 22)

Так же важно понять, почему ошибка здесь:

import re

text = ["Any reason for the pump"] # 5

text = re.sub('–—!"#$%&()*+,-./:;<=>@[\\]^_`{|}~\t\n\xa0–\ufeff', '', str(text))
print(text)

Возникает следующая ошибка: re.error: multiple repeat at position 11 (line 1, column 12)

Разница между ними лишь в том, что во втором re есть +, я его убрал, однако не понимаю, почему выдает ошибку и как сделать так, чтобы + так же был в re. Однако ошибка первого примера приоритетнее

Вопрос задан более двух лет назад
603 просмотра

3 комментария

Подписаться 1 Средний 3 комментария

Vindicar @Vindicar

А какую задачу решаешь? Удалить всё, что не буквы и не цифры?
Тогда встречный вопрос: ты синтаксис регулярных выражений изучал вообще?

Написано более двух лет назад
WHATsMyName @WHATsMyName Автор вопроса

Vindicar, Удалить все, что не буквы и не цифры, за исключением пробелов. Да, я ничего не смыслю в регулярных выражениях, потому изучаю их. Документация тяжко идет. Буду благодарен, если покажете рабочий код, чтобы я в сравнении разобрался. Спасибо

Написано более двух лет назад
WHATsMyName @WHATsMyName Автор вопроса

o5a Большое спасибо! Теперь понятно в чем ошибка, взял этот фильтр из другого источника и после ваших разъяснений понял, что там для другой цели использовался. Касательно список-строка, мне это нужно для определенной задачи, вам это неинтересно будет слушать.

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 2

Комментировать

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 234 просмотра
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 250 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 89 просмотров
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 108 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 101 просмотр
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 123 просмотра
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 472 просмотра
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 4 подписчика
- 05 мар.
- 1013 просмотров
4

ответа
Python

Простой
Как запретить удаление полей класса?
- 1 подписчик
- 27 февр.
- 327 просмотров
1

ответ
Python

Простой
Как написать правильный код Pyhton?
- 1 подписчик
- 22 февр.
- 557 просмотров
2

ответа
Показать ещё Загружается…

Python developer

ITK academy • Краснодар

от 220 000 до 300 000 ₽

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

А какую задачу решаешь? Удалить всё, что не буквы и не цифры?
Тогда встречный вопрос: ты синтаксис регулярных выражений изучал вообще?
Vindicar, Удалить все, что не буквы и не цифры, за исключением пробелов. Да, я ничего не смыслю в регулярных выражениях, потому изучаю их. Документация тяжко идет. Буду благодарен, если покажете рабочий код, чтобы я в сравнении разобрался. Спасибо
o5a Большое спасибо! Теперь понятно в чем ошибка, взял этот фильтр из другого источника и после ваших разъяснений понял, что там для другой цели использовался. Касательно список-строка, мне это нужно для определенной задачи, вам это неинтересно будет слушать.

Answer 1 · 2023-05-19 13:42:28

Если пытались исключить все символы из набора, то надо было их заключить в квадратные скобки.

text = re.sub('[–—!"#$%&()*,-./:;<=>@[\\]^_`{|}~\t\n\xa0–\ufeff]', '', str(text))

А в изначальном виде у вас написан не набор символов, а последовательный шаблон поиска.
Лучше почитайте хотя бы основы регулярных выражений, поймете ошибку.
Но помимо этого Вы что-то странное делаете: из списка формируете строку зачем-то str(text) и из нее удаляете символы. Вы не умеет работать со списками? Для чего это было нужно?

Answer 2 · 2023-05-19 13:58:01

Ну так почитай основы.
Во-первых, используй r-строки, чтобы не натыкаться на проблемы с символом \.
Во-вторых, изучи зарезервированные символы регулярных выражений, а именно: ( ) [ ] ^ $ . ? * +. Если тебе нужен этот символ как просто символ, его надо экранировать! Т.е. если тебе нужно совпадение с символом ?, надо писать \?.
В-третьих, для поиска символа из указанного набора используются квадратные скобки, т.е. [abc] совпадёт с одним символом из указанных: a, b или c. Для задания диапазона можно сделать так: [a-z]. Это зачастую короче.
В-четвёртых, для поиска символа НЕ из указанного набора используется такой синтаксис: [^abc]
В-пятых, есть заранее заданные наборы. Например, \w описывает словесные символы (буквы, цифры и подчёркивание), \d описывает цифры, и т.д. Аналогично, \W и \D описывают всё кроме словесных символов и цифр, соотв.
Тогда у тебя будет два варианта
Если подчёркивание - не проблема:

re.sub(r'\W', '', 'test:_:test', re.I)  # даст test_test

Если подчёркивание тоже нужно убрать:

re.sub(r'[\W_]', '', 'test:_:test', re.I)  # даст testtest

Как исправить ошибку с регулярными выражениями?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт