@Brussels_Sprouts

Как спарсить из html файла кусок строки, зная ее характерное содержание, используя различные библиотеки?

Надо спарсить файл с помощью python разными способами: с BeautifulSoup разобрались, как это можно было бы осуществить с другими библиотеками, такими как: html.parser; Pyquery; html5 lib; selectolax ? если это возможно, в документации я не нашёл аналога startswith("#") из BeautifulSoup.

в файле разнообразное содержимое, но меня интересуют конкретные фрагменты следующего вида
<tr align="center"><td><a href="#Y">KEY</a></td></tr>

Y это порядковое число: 0,1,2...,10,....; под KEY стоит необходимое мне слово или словосочетание
  • Вопрос задан
  • 30 просмотров
Пригласить эксперта
Ответы на вопрос 1
@sunsexsurf
IT & creative
Гуглим "beautifulsoup a href".
Получаем: https://stackoverflow.com/questions/5815747/beauti...

решение:

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])


а вы говорите, что "не нашёл аналога startswith"... просто не то искали...
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы