AnilVia
@AnilVia

Как распарсить таблицу с помощью soup имея только контент столбцов без атрибутов?

Если описывать более детально, то мне нужно было получить таблицу с одного сайтика и распарсить её и всё это на python.
С первой задачей я справился легко, просто дёрнул всю страничку и с помощью парсера, вырезал нужную мне таблицу, но таблица была без классов, айдишнииков, в общем без любых указателей на содержание контента.
Тут и возникла трудность в её парсинге, ведь я хотел получать конкретные строки из этой таблицы и конкретные столбцы с нужными мне данными.
Это ещё пол беды, помимо этого количество строк в таблице постоянно меняется.

она имеет вид
<table class="my_own">
<tbody>
<tr>
        <th> Пн </th>
        <th> ... </th>
        <th> ... </th>
        <th> ... </th>
        <th> ... </th>
        <th> ... </th>
        <th> ... </th>
        <th> ... </th>	
</tr>
<tr>...
</tbody>
</table>

Столбцов tr очень много и мне бы хотелось взять данные для дальнейшего форматирования только тех столбцов, где в начале присутствует Пн.
  • Вопрос задан
  • 56 просмотров
Решения вопроса 1
AnilVia
@AnilVia Автор вопроса
Решил вопрос, С помощью Soup, как и хотел.
Подвёл Soup к нужной таблице используя find , затем в ход пошёл раннее созданный мной цикл и метод .contents[] Пробежался построчно и поместил каждую ячейку в свою переменную, дальше создал list и с помощью метода extend дополнял лист в избежание потери переменных.
Поскольку количество столбцов одинаково, то и количество дополняемых объектов в list будет одинаково, после чего ими всеми можно будет воспользоваться.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
NikFaraday
@NikFaraday
Student full-stack Developer
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы