Как спарсить/вытащить из txt или html файла кусок строки, зная ее специфическое содержание?

Question

Brussels_Sprouts @Brussels_Sprouts

Парсинг

Как спарсить/вытащить из txt или html файла кусок строки, зная ее специфическое содержание?

Есть txt или html файл, где нужные мне слова всегда записываются в строках следующего формата:

<tr align="center"><td><a href="#Y">KEY</a></td></tr>

Y это порядковое число начиная от нуля т.е. если две строки будет идти href="#0; следующая href="#1

Каким образом я могут через python вытащить только слово которое стоит в месте под названием KEY (или несколько слов, если под KEY будет словосочетание) ?

Вопрос задан более двух лет назад
517 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Stepik

4в1—Парсинг, Асинхронность, Многопоточность, Многопроцессорность

2 месяца

Далее
Хекслет

Фронтенд-разработчик

10 месяцев

Далее
Stepik

FullStack Developer and Data Scientist (Python+JS+Data+CookBook)

4 месяца

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 665 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 398 просмотров
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 4 подписчика
- 05 мар.
- 1106 просмотров
4

ответа
Парсинг

Простой
Как спарсить Интернет Магазин?
- 1 подписчик
- 27 февр.
- 427 просмотров
4

ответа
Веб-разработка

+1 ещё

Средний
Как на сайте с фильмами найти медиаплеер и скачать это видео через код?
- 1 подписчик
- 13 февр.
- 517 просмотров
2

ответа
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек. 2025
- 549 просмотров
2

ответа
Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб. 2025
- 1238 просмотров
1

ответ
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 1 подписчик
- 20 нояб. 2025
- 875 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб. 2025
- 506 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт. 2025
- 368 просмотров
0

ответов
Показать ещё Загружается…

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.4

Answer 1 · 2023-08-24 14:58:37

from bs4 import BeautifulSoup

html = '''
<tr align="center"><td><a href="#0">KEY 0</a></td></tr>
<tr align="center"><td><a href="#1">KEY 1</a></td></tr>
'''

bs = BeautifulSoup(html, 'html.parser')

for item in bs.find_all('a'):
    value = item.get('href')
    if value and value.startswith("#"):
        print(item.text)  # KEY

Answer 2 · 2023-08-24 15:07:54

from bs4 import BeautifulSoup

text = '''
    <tr align="center"><td><a href="#0">First</a></td></tr>,
    <tr align="center"><td><a href="#1">This is second</a></td></tr>,
    <tr align="center"><td><a href="#2">third</a></td></tr>
'''

soup = BeautifulSoup(text,'html.parser')
result = [ row.a.text for row in soup.find_all('tr')]
print(result)

или result = [ row.text for row in soup.find_all('a')] как удобнее для настройки дополнительных условий парсинга.

Как спарсить/вытащить из txt или html файла кусок строки, зная ее специфическое содержание?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт