@artds

Парсинг html в python?

Парсю html, на странице ищу название и расширение файла

fr = requests('https://www.geooptic.ru/product/lasernyi-skanner-trimble-x7-kit-with-t10x').text
bb_strings = re.findall(r'files:.*.short_params', fr)


на выходе получается

fr = files:[{file_name:"obzor-skanerov-trimble.pdf",name:"Сравнение сканеров TRIMBLE X7, TX6, TX8 и тахеометра SX10 (2019 год)",type_id:eW},{file_name:"Trimble T10x tablet_Datasheet.pdf",name:"Trimble T10x tablet_Datasheet",type_id:4},{file_name:"Сравнение приборов Trimble 2022 X7 X12 SX12.pdf",name:"Сравнение приборов Trimble 2022 X7 X12 SX12",type_id:eW}]

как сделать что бы было?

Сравнение сканеров TRIMBLE X7, TX6, TX8 и тахеометра SX10 (2019 год) : obzor-skanerov-trimble.pdf
  • Вопрос задан
  • 157 просмотров
Пригласить эксперта
Ответы на вопрос 1
@igor6130
Есть предложение просто поставить BeautifulSoup и не мучить себя регулярными выражениями.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы