Как вытащить число при помощи awk/sed из html файла?

Question

NikitinRoman @NikitinRoman

Как вытащить число при помощи awk/sed из html файла?

Добрый день! Есть html файл, в котором есть нижеприведенная строка, необходимо выдернуть из файлика сумму, в нашем случае 11 111, и вывести ее в в виде 11111.

<dl><dt>Текущий баланс</dt><dd><div class="span28"><span class="money bold">11 111<sup class="hide-text">.</sup><sup>32</sup>

Вопрос задан более трёх лет назад
2759 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Специалист по информационной безопасности + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

Простой
Как переместить неразмеченную область ext4?
- 2 подписчика
- 07 июл.
- 182 просмотра
2

ответа
Linux

+1 ещё

Простой
Почему не грузится контент каналов TG через VPN?
- 2 подписчика
- 26 июн.
- 866 просмотров
1

ответ
Linux

+2 ещё

Средний
Почему не получается войти в bios? Что делать с полосами на экране?
- 1 подписчик
- 21 июн.
- 301 просмотр
2

ответа
Linux

+1 ещё

Средний
Как мне перенести систему Proxmox на меньший диск?
- 2 подписчика
- 21 июн.
- 357 просмотров
4

ответа
Linux

Простой
Курсор «спотыкается» о рамку окна в Астре (ОС для ПК). Как убрать?
- 1 подписчик
- 20 июн.
- 263 просмотра
1

ответ
Linux

+1 ещё

Средний
Почему при малом проценте зарядки в Debian (Cinnamon) начинает лагать, перед выходом в гибернацию?
- 1 подписчик
- 17 июн.
- 143 просмотра
2

ответа
Linux

+1 ещё

Средний
Рост CLOSE-WAIT и утечки TCP-сокетов в Xray (vless + reality) — что делать?
- 3 подписчика
- 05 июн.
- 1144 просмотра
1

ответ
Linux

+1 ещё

Средний
Редактирование загрузочного меню GRUB?
- 1 подписчик
- 23 мая
- 419 просмотров
3

ответа
Linux

+2 ещё

Сложный
Восстановление таблицы разделов?
- 3 подписчика
- 15 мая
- 552 просмотра
1

ответ
Linux

+3 ещё

Средний
Radxa debian почему не работает тачскрин?
- 1 подписчик
- 13 мая
- 261 просмотр
2

ответа
Показать ещё Загружается…

Answer 1 · 2015-12-29 16:09:59

Spetros @Spetros

IT-шник

Для html принято парсеры использовать.

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2015-12-29 17:00:42

Сергей Петриков @RicoX

Ушел на http://ru.stackoverflow.com/

Если длинно и не думать:

grep "Текущий баланс" | sed -e 's/^.*money bold>//g' -e 's/<sup class=hide-text>.*$//g' -e 's/\ //g'

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2015-12-29 17:08:15

Можно воспользоваться утилитой xmllint.

Ставим libxml2-utils, например для Ubuntu:
$ sudo apt-get install libxml2-utils
Далее, для вашего варианта:

$ echo "<dl><dt>Текущий баланс</dt><dd><div class="span28"><span class="money bold">11 111<sup class="hide-text">.</sup><sup>32</sup>" | xmllint --html --xpath '//span/text()' - | sed 's/ //'

Или из файла:

$ xmllint --html --xpath '//span/text()' 2.xml| sed 's/ //'

Answer 4 · 2015-12-29 16:12:32

NikitinRoman @NikitinRoman Автор вопроса

Рабочий пример покажете?

Ответ написан более трёх лет назад

Комментировать

Как вытащить число при помощи awk/sed из html файла?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт