В файле записана последовательность тегов приводящих к необходимой информации. Необходимо по заданной цепочки вытащить её.
К примеру:
Запись в файле:
<div class = "c1">, <div class = "c2">, <a href>, <b>
Структура страницы следующая:
<div class = "c1">
.....some
</div>
<div class = "c1">
<div class = "c2">
<a href = "Нужная информация 1"></a>
<b>Нужная информация 2</b>
</div>
</div>
Результат программы предположительно следующий:
Нужная информация 1
Нужная информация 2
Сложность в том что сайты и последовательность тегов меняется.
Возможно есть более правильная структура файла?