Можно просто переопределить built-in функцию : )
import codecs
def open(path, mode):
return codecs.open(path, mode, 'utf-8')
Для парсинга обычно используют суп:
www.crummy.com/software/BeautifulSoup/bs4/doc
Файлы обычно открывают так:
with open("filename", "w") as f:
f.write(something)
docs.python.org/3/tutorial/inputoutput.html#methods-of-file-objects