Как спарсить таблицу регулярками python?

Question

kennnies @kennnies

Как спарсить таблицу регулярками python?

Есть следующая таблица:

Таблица HTML

<tr>
					<td>99</td>
					<td>Name</td>
					<td>ЕГЭ</td>
					<td>268</td><td>90</td><td>91</td><td>87</td>
					<td></td>
					<td>Копия</td>
					<td>Нет</td>
				</tr>

Использую следующую регулярку для парса чисел:

re.findall(r'\d{3,3}\d{1,3}\d{1,3}\d{1,3}

Нужно еще спарсить поле "Копия", переход на новую строку не позволяет этого, пробовал через

\s \n \t \r и \s

Не особо получилось, как это можно реализовать?

Вопрос задан более трёх лет назад
341 просмотр

2 комментария

Подписаться 2 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
Бруноям

Вёрстка на HTML и CSS

3 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 1 подписчик
- вчера
- 139 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 208 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 62 просмотра
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 180 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 195 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Как можно реализовать что то вроде селекта внутри родителя у которого есть скрытые элементы и должна быть горизонтальная прокрутка?
- 1 подписчик
- 11 дек.
- 158 просмотров
0

ответов
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 134 просмотра
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 230 просмотров
0

ответов
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек.
- 394 просмотра
2

ответа
JavaScript

+2 ещё

Простой
Как сделать резкое переключение слайдов?
- 1 подписчик
- 03 дек.
- 178 просмотров
0

ответов
Показать ещё Загружается…

WordPress (PHP, HTML/CSS) разработчик

Epiic

от 90 000 ₽

Frontend-разработчик (Vanilla JS, high-load media platform)

Karma8

от 200 000 до 300 000 ₽

Frontend разработчик React / Next.js

PurpleSchool

До 65 000 ₽

Используйте lxml и не делайте парсинг регулярками

Answer 1 · 2019-07-03 20:58:19

Ну как бы регулярки для такого далеко не самый подходящий инструмент

>>> import lxml.html
>>> str1 = """
... <tr>
...           <td>99</td>
...           <td>Name</td>
...           <td>ЕГЭ</td>
...           <td>268</td><td>90</td><td>91</td><td>87</td>
...           <td></td>
...           <td>Копия</td>
...           <td>Нет</td>
...         </tr>"""
>>> root = lxml.html.fromstring(str1)
>>> [x.text for x in root.xpath('.//td')]
['99', 'Name', 'ЕГЭ', '268', '90', '91', '87', None, 'Копия', 'Нет']

Answer 2 · 2019-07-03 20:05:22

Dimonchik @dimonchik2013

non progredi est regredi

pytablereader

Ответ написан более трёх лет назад

Комментировать

Как спарсить таблицу регулярками python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт