Есть URL в котором присутствуют китайские иероглифы:
https://www.linkedin.com/in/%E4%BD%A9-%E4%BD%A9-88...
В браузере они выглядят нормально:

Именно по этим символам мне нужно выполнить текстовый поиск в коде страницы, т.к. нужно привязаться к элементу:

В
url requests
отображается как
"%E4%BD%A9-%E4%BD%A9-8855b5113"
, соответственно такой поиск не работает:
html.xpath(f'.//code[contains(text(), "publicIdentifier") and contains(text(), "%E4%BD%A9-%E4%BD%A9-8855b5113")]')
В тексте response эти символы отображаются так:
佩-佩-8855b5113
.
Т.е. для поиска мне нужно преобразовать строку
%E4%BD%A9-%E4%BD%A9-8855b5113
в
佩-佩-8855b5113
.