Чем можно находить незакрытый html тэг?

Question

pcdesign @pcdesign

Python

Чем можно находить незакрытый html тэг?

В python 2 можно было так:

import html.parser as HTMLParser
try:
    HTMLParser.HTMLParser.feed(bufer)
except HTMLParser.HTMLParseError as e:
    print(dict(msg=e.msg, pos=(e.lineno, e.offset)))

И если какой-то тег не закрыт, то выводилось такая ошибка:
malformed tag found (22, 2)
Типа, на 22 строке, офсет 2. Есть не закрытый тег.

В python 3 выкинули HTMLParseError.
И как на python3 теперь добиться такого же результата?

Вопрос задан более трёх лет назад
177 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- 2 часа назад
- 15 просмотров
0

ответов
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- вчера
- 86 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 1 подписчик
- 18 дек.
- 171 просмотр
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 214 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 71 просмотр
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 191 просмотр
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 217 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 140 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 243 просмотра
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 237 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2022-10-16 11:52:20

from html.parser import HTMLParser

bufer = '''<p>
    <div>hi!
</p>'''

class MyHTMLParser(HTMLParser):
    def __init__(self):
        super().__init__()
        self.open_tags = []
    
    def handle_starttag(self, tag, attrs):
        print("Start tag:", tag)
        self.open_tags.append((tag, self.getpos()))
    
    def handle_endtag(self, tag):
        print("End tag  :", tag)
        unclosed_tags = []
        # ищем, когда был открыт нужный тег
        for i in range(len(self.open_tags)-1, -1, -1):
            if self.open_tags[i][0] != tag:
                unclosed_tags.append(self.open_tags[i])
            else:
                break
        if len(unclosed_tags) == len(self.open_tags): # тег никогда и не был открыт
            print(f"Closing tag {tag} has no matching opening tag!")
        elif unclosed_tags: # тег был открыт, но он не последний
            print("Following tags are not closed properly:\n", '\n'.join(f'    {t} at line {line} pos {col+1}' for t,(line, col) in unclosed_tags))
            del self.open_tags[-len(unclosed_tags)+1:] # сбрасываем незакрытые теги
        else: # тег был открыт, и он последний - всё в порядке
            del self.open_tags[-1]
    
    def close(self):
        super().close()
        print('Processing done')

parser = MyHTMLParser()
parser.feed(bufer)
parser.close()

Вместо вывода текста можешь сразу выкидывать исключения, или накапливать сведения об ошибках, чтобы выкинуть одно исключение с полной информацией в методе close().

Чем можно находить незакрытый html тэг?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт