До этого момента bs4 полностью устраивал. Но вот возникла проблема, а точнее задача. На сервер загружается html документ, и нужно из него нужно взять все что находится в контейнере body, решил эту проблему так:
def GetBody(p):
with io.open(p, 'r', encoding='utf-8') as f:
soup = bs(f.read(), features='lxml')
body = str(soup.find('body'))
return body[6:-7]
Вроде все работает, но beautifulsoup форматирует строку в строгий синтаксис html5, а в файле может так же находится jinja2 или что-то подобное. Как сделать что бы bs не форматировал строку?