@strelkovandrey

Как можно в bash вытащить содержимое DIV по название классу или иному признаку?

Добрый день, имеется wget-ый html файл, в котором нужно вытащить содержимое div контейнера по определенному признаку

<div class="b-text clearfix js-topic__text mvhh" itemprop="articleBody">
   ...content...
  <div class="some_another class"> ... another content ... </div>
  ... again content ...
  <span> again and again content </span>
</div>


В идеале нужно вытащить по признаку itemprop="articleBody" , т.е. достать содержимое контейнера со свойством itemprop="articleBody"
  • Вопрос задан
  • 107 просмотров
Пригласить эксперта
Ответы на вопрос 1
saboteur_kiev
@saboteur_kiev Куратор тега bash
software engineer
Попробуйте так

xmllint --html --xpath '//div[@itemprop="articleBody"]' file.html


xmllint перед этим нужно установить (apt-get install xmllint)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы