codeturn
@codeturn

Как выявить блок нужного текста в html файле?

Есть 1000 html страниц, внутри которых может быть рецепт приготовления блюда, а может и не быть. Сам рецепт может быть в теге ul, а может быть в таблице или даже просто в параграфах.
Задача: получить сам рецепт или вернуть false если его нет.

Решение, которое пока пришло в голову:
-выбрать все теги, в которых может быть рецепт (все теже ul, table ..)
-получать текст из этих блогов и проверять на хот слова (названия продуктов, вес и тд)
-сравнивать по объему,
-на выходе получать сам текст и % точности - выявленный из 2-ух пунктов выше.

Как бы вы решали эту задачу?
Подскажите, если вам известна готовая нейросеть под такие задачи, например на питоне . Спасибо!
  • Вопрос задан
  • 24 просмотра
Пригласить эксперта
Ответы на вопрос 1
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы