@MrQwerty

Чем убрать форматирование xml?

Добрый день. Есть xml-документ (дамп википедии, если быть точным).
head -n 30 показал, что он отформатирован. Чем его переформатировать из вида A в B (убрать знаки переноса строки и табы/пробелы нужные для улучшения читабельности человеком)? Парсеру в будущем же будет без разницы.
Гугление ни к чему не привело.
На вопросы "Зачем?" - дампы википедии не маленькие и этих знаков там много наберётся.
Вид А
<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>Tove</to>
  <from>Jani</from>
  <heading>Reminder</heading>
  <body>Don't forget me this weekend!</body>
</note>

Вид B
<?xml version="1.0" encoding="UTF-8"?><note><to>Tove</to><from>Jani</from><heading>Reminder</heading><body>Don't forget me this weekend!</body></note>

  • Вопрос задан
  • 225 просмотров
Пригласить эксперта
Ответы на вопрос 2
dimonchik2013
@dimonchik2013
non progredi est regredi
можно заморочиться с SAX (типа для перевариваняи больших ХМЛ файлов), так целостность точно сохранится

а можно простой регуляркой (>\s<, >< )
Ответ написан
Комментировать
Vapaamies
@Vapaamies
Разработчик будущей ОС для ПК размером 250 МБ
Вроде должен быть XML TiDy, либо TiDy последних версий (с GitHub) умеют работать и с XML.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы