u' в питоне3 не используетсяpass используете без понимания зачем он
a[href^='/'] //a[starts-with(@href, '/')]
a[href$='pdf'] //a[ends-with(@href, '.pdf')]
a[href~='://'] //a[contains(@href, '://')]
.encode('cp1251')file.getvalue().encode('cp1251')