@rodion_ilnitskiy

Как парсить текст с email-protected?

Имеется данный код HTML:
<td>
OC[<a href="/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="e9aaa9a1">[email&#160;protected]</a>](OC(CCCCCCCCCCCCC)=O)COC(CCCCCCCCCCCCC)=O
</td>

Необходимо пропарсить текст с помощью python scrapy, чтобы итог выглядел как на сайте:
OC[C@H](OC(CCCCCCCCCCCCC)=O)COC(CCCCCCCCCCCCC)=O
Однако результат всегда иной:
['OC[', '](OC(CCCCCCCCCCCCC)=O)COC(CCCCCCCCCCCCC)=O']
Как решить эту проблему?
Вот код python scrapy:
response.xpath('//td[contains(text(),"Canonical SMILES")]/following::td[1]/text()').extract()
  • Вопрос задан
  • 604 просмотра
Решения вопроса 1
ramzis
@ramzis
FullStackOverflow
Гуглить пробовали?, я попробовал и нашел.

def decode(g):
    r = int(g[:2],16)
    email = ''.join([chr(int(g[i:i+2], 16) ^ r) for i in range(2, len(g), 2)])
    return email

print(decode('e9aaa9a1'))

#C@H
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы