Задать вопрос
@VuztreeCalan
Дилетант Широкого Профиля

Как на питоне правильно парсить сайт на react?

Пытаюсь пропарсить твиттер с помощью селениума(В апи отказали, дважды), в туториалах советуют находить элементы через webdriver.find_element_by_class_name, но в твиттере и на некоторых других сайтах все классы именованы чем-то вроде:

div class=""css-18t94o4 css-1dbjc4n r-1niwhzg r-sdzlij r-1phboty r-4iw3lz r-1xk2f4g r-109y4c4 r-1ii58gl r-yon6af r-1udh08x r-wwvuq4 r-1fneopy r-u8s1d r-o7ynqc r-6416eg r-lrvibr r-92ng3h

И все они внутри div id="react-root", поэтому подумал что именно реакт делает такую штуку, собственно вопрос, есть ли какая-то библиотека чтобы по человечески пропарсить это дело, либо может в самом селениуме/requests есть инструменты?
  • Вопрос задан
  • 948 просмотров
Подписаться 1 Простой 2 комментария
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
все так, Селениумом или другим JS браузером

а зацепить можно уровнем вложенности, а не именами классов
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы