<html>
<body>
<div id=new_class1>
<style type="text/css"> ..... </style>
<p> Раз </p>
Два
<> Три </p>
<div class="new_class2>....</div>
</div>
</body>
</html>
Нужно распарсить весь html на промежутке от <style type="text/css"> до <div class="new_class2>....</div>, чтобы получить:
Раз
Два
Три
Как это можно реализовать на питоне?
Тупо прочитать построчно. Строки между <style type="text/css"> и <div class="new_class2>....</div> загнать в отдельный массив, и уж его парсить. Например убрать теги регулярками, оставив текст