Есть текст который представляет из себя XML страницу, в этой странице есть текст, который содержит все привычные HTML теги, которые заменены на
< >
и т.д.
Пример такого текста расположен тут , по факту это RSS лента.
Задача проста, хочу вытащить просто текст, без тегов. Как фильтровать теги - полно статей на стеке и везде, а вот как вычищать эти сокращения не знаю. Собственно не знаю потому что не знаю как они называются на английском - что процентов с таким уже сталкивались, надо просто найти.
Подскажите, как их называют?