Возможно ли написать универсальный парсер (для любого ресурса) под конкретную задачу на Python?
Если например я хочу парсить комменты из блогов (блоги разные), можно ли как то написать универсальный парсер для этой задачи (чтобы подходил для любого блога/ресурса)? Может копать в RegExp?
Интересная задача.
Можно попробовать убрать весь текст, и среди тэгов искать повторяющиеся блоки.
Найдя повторяющиеся блоки можно выбрать из них текст.
Желаю удачи в решение задачи!
Написать можно и регулярками и правилами. Но если выдача поменяется так что ваши правила не поймут это, парсер поломается. Без обучения и самосовершенствования - никак. Либо как поломается - руками.