Millerish
@Millerish

Как правильно составить регулярное выражение на Python?

Добрый вечер!

Подскажите как правильно составить регулярное вырождение. Нужно забрать только текст без тегов и только который находить внутри br. Пример:

bold">Описание:</span><br/>Перед Вами стоит задача подключить предприятие или офис к сети Интернет, используя минимум средств и максимум возможностей? Этот курс для Вас! Расширьте Ваши возможности и знания сетевого администратора!<br/><br/>На данном курсе Вы получите необходимые знания и навыки для безопасного и отказоустойчивого решения большинства задач стоящих перед системным администратором, связанных с подключением предприятия к сети Интернет. Наши высококвалифицированные преподаватели дадут Вам исчерпывающую информацию по настройке серверов FTP, NFS, DNS, Proxy сервера и сервера электронной почты.<br/><a class="highslide" href="

Нужно получить:

Перед Вами стоит задача подключить предприятие или офис к сети Интернет, используя минимум средств и максимум возможностей? Этот курс для Вас! Расширьте Ваши возможности и знания сетевого администратора!На данном курсе Вы получите необходимые знания и навыки для безопасного и отказоустойчивого решения большинства задач стоящих перед системным администратором, связанных с подключением предприятия к сети Интернет. Наши высококвалифицированные преподаватели дадут Вам исчерпывающую информацию по настройке серверов FTP, NFS, DNS, Proxy сервера и сервера электронной почты
  • Вопрос задан
  • 255 просмотров
Решения вопроса 1
Tark
@Tark
Pyramid'альный мир
"Правильное" регулярное выражение для вашего случая

m = re.search('<br/>(.*)<br/>', text)
if m:
    print(m.group(1))


Но тут есть одна проблема. br - непарный тег, у него нет ничего "внутри". Это первое. Второе: парсить страницы лучше специализированными фреймворками типа BeatifulSoup, Grab, lxml - там же есть и функции для очистки результата... наверное. Если нет - можно воспользоваться Bleach. Успехов.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы