Как убрать html тэги при получения ответа на http запрос в python3?

Question

m00nkey @m00nkey

Python

Как убрать html тэги при получения ответа на http запрос в python3?

Приветствую!
есть http запрос написанный на питоне.

import urllib.request
ip = input("Server address: ")
url = 'https://' + ip + ':1337/?action=actionNames'
print("Request progress to ", url)
res = urllib.request.urlopen(url)
text = res.read()
print(text)

в ответ получаю

b"<html><head><meta http-equiv='Content-Type' content='text/html; charset=UTF-8' /></head><body><p>50 action from 120</p></body></html>"

Можно ли как-то убрать html тэги?

Вопрос задан более трёх лет назад
2482 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Решения вопроса 2

2 комментария

m00nkey @m00nkey Автор вопроса

radioxoma

text = re.search(r"(?<=</head><body><p>).+(?=</p></body></html>)", res).group()
  File "/usr/lib/python3.4/re.py", line 166, in search
    return _compile(pattern, flags).search(string)
TypeError: expected string or buffer

Process finished with exit code 1

вот так ругается

Написано более трёх лет назад

m00nkey @m00nkey Автор вопроса

разобрался

Написано более трёх лет назад

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему выходит ошибка?
- 1 подписчик
- вчера
- 143 просмотра
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 145 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 112 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 189 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 226 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 151 просмотр
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 152 просмотра
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 110 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 255 просмотров
1

ответ
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 304 просмотра
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Answer 1 · 2014-11-05 23:41:35

Грязное и мокрое решение в лоб. Everybody stand back! ^[ru]

>>> import re
>>> res = "<html><head><meta http-equiv='Content-Type' content='text/html; charset=UTF-8' /></head><body><p>50 action from 120</p></body></html>"
>>> fineprint = re.search(r"(?<=</head><body><p>).+(?=</p></body></html>)", res).group()
>>> print(fineprint)
'50 action from 120'

Если же нужно разбирать нечто более сложное, то используйте нормальный парсер, как советуют другие отвечающие.

Answer 2 · 2014-11-06 11:34:55

Я использую эту библиотеку (https://github.com/ilyutoev/python-html-purifier) - это мой форк под третий питон.

Указываем ей какие теги оставлять либо пустые настройки - отдаем строку, возвращает только текст внутри.

Answer 3 · 2014-11-05 15:15:53

Meehalkoff @Meehalkoff

Возможно это поможет

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2014-11-05 23:34:35

Можно, библиотеки для обработки dom - httpparser, lxml, beautifullsoup, grab, для регулярных выражений - re, также можно просто найти и заменить методом replace в вашей строке

Как убрать html тэги при получения ответа на http запрос в python3?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт