Добрый день, имеется wget-ый html файл, в котором нужно вытащить содержимое div контейнера по определенному признаку
<div class="b-text clearfix js-topic__text mvhh" itemprop="articleBody">
...content...
<div class="some_another class"> ... another content ... </div>
... again content ...
<span> again and again content </span>
</div>
В идеале нужно вытащить по признаку itemprop="articleBody" , т.е. достать содержимое контейнера со свойством itemprop="articleBody"