Задать вопрос
@Brussels_Sprouts

Как спарсить из html файла кусок строки, зная ее характерное содержание, используя различные библиотеки?

Надо спарсить файл с помощью python разными способами: с BeautifulSoup разобрались, как это можно было бы осуществить с другими библиотеками, такими как: html.parser; Pyquery; html5 lib; selectolax ? если это возможно, в документации я не нашёл аналога startswith("#") из BeautifulSoup.

в файле разнообразное содержимое, но меня интересуют конкретные фрагменты следующего вида
<tr align="center"><td><a href="#Y">KEY</a></td></tr>

Y это порядковое число: 0,1,2...,10,....; под KEY стоит необходимое мне слово или словосочетание
  • Вопрос задан
  • 37 просмотров
Подписаться 1 Простой Комментировать
Помогут разобраться в теме Все курсы
  • AndroidSprint
    Попробуйте себя в роли разработчика за 10 дней
    1 неделя
    Далее
  • Stepik
    Парсинг на Python для начинающих
    2 недели
    Далее
  • Skillfactory
    Профессия Python-разработчик PRO
    12 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
@sunsexsurf
IT & creative
Гуглим "beautifulsoup a href".
Получаем: https://stackoverflow.com/questions/5815747/beauti...

решение:

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])


а вы говорите, что "не нашёл аналога startswith"... просто не то искали...
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы