@Gudsaf
Школьник

Как называются «заменители тегов» HTML по типу < > и т.д.?

Есть текст который представляет из себя XML страницу, в этой странице есть текст, который содержит все привычные HTML теги, которые заменены на < > и т.д. Пример такого текста расположен тут , по факту это RSS лента.

Задача проста, хочу вытащить просто текст, без тегов. Как фильтровать теги - полно статей на стеке и везде, а вот как вычищать эти сокращения не знаю. Собственно не знаю потому что не знаю как они называются на английском - что процентов с таким уже сталкивались, надо просто найти.

Подскажите, как их называют?
  • Вопрос задан
  • 263 просмотра
Решения вопроса 1
@Stqs
senior software developer
выберите чтото из BeautifulSoup, lxml
обе библиотеки очень просты в использовании
Ответ написан
Пригласить эксперта
Ответы на вопрос 3
@Psq
Информационная безопасность. Пентест.
Мнемоники (или сущности) html
Ответ написан
Комментировать
Спецсимволы
Ответ написан
Комментировать
Matsunaki
@Matsunaki
Любознательный пользователь :)
По примеру сделай, только вставь код своей страницы воть
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы