Как называются «заменители тегов» HTML по типу < > и т.д.?

Question

Gudsaf @Gudsaf

Школьник

HTML
Python

Как называются «заменители тегов» HTML по типу < > и т.д.?

Есть текст который представляет из себя XML страницу, в этой странице есть текст, который содержит все привычные HTML теги, которые заменены на < > и т.д. Пример такого текста расположен тут , по факту это RSS лента.

Задача проста, хочу вытащить просто текст, без тегов. Как фильтровать теги - полно статей на стеке и везде, а вот как вычищать эти сокращения не знаю. Собственно не знаю потому что не знаю как они называются на английском - что процентов с таким уже сталкивались, надо просто найти.

Подскажите, как их называют?

Вопрос задан более трёх лет назад
287 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Академия Эдюсон

Frontend-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Инженер по тестированию + ИИ

6 месяцев

Далее

Решения вопроса 1

1 комментарий

Gudsaf @Gudsaf Автор вопроса

в общем сделал через

string = "&lt;div class=&quot;....&quot;&gt;"
    string = html.unescape(your_string)
    string2 = re.sub('<[^<]+?>', '', string)
    string3 = ' '.join(string2.split())

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

HTML

+2 ещё

Простой
Как запретить формирования ссылок вида /tel:?
- 2 подписчика
- 01 июл.
- 279 просмотров
3

ответа
HTML

+1 ещё

Средний
Как выставить элементу ширину по содержимому при переносах?
- 1 подписчик
- 30 июн.
- 159 просмотров
1

ответ
HTML

+3 ещё

Средний
Как создать каркас верстки который будет считаться по высоте, а не по ширине?
- 4 подписчика
- 26 июн.
- 360 просмотров
4

ответа
JavaScript

+2 ещё

Простой
Не работает тень + слайдер, есть варианты?
- 2 подписчика
- 21 июн.
- 196 просмотров
1

ответ
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 211 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 557 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 495 просмотров
2

ответа
HTML

+1 ещё

Простой
Как оформить так карточку типа бенто стиль?
- 1 подписчик
- 13 июн.
- 234 просмотра
3

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 283 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 510 просмотров
1

ответ
Показать ещё Загружается…

я правильно понимаю что под "HTML страницей на которой все теги заменены на <>" понимается обычный XML?
Stanislav, да, сейчас поправлю, есть же пример в вопросе - ссылка на фид