u'
в питоне3 не используетсяpass
используете без понимания зачем онa[href^='/'] //a[starts-with(@href, '/')]
a[href$='pdf'] //a[ends-with(@href, '.pdf')]
a[href~='://'] //a[contains(@href, '://')]
.encode('cp1251')
file.getvalue().encode('cp1251')