xmoonlight
@xmoonlight
https://sitecoder.blogspot.com

Как сделать книгу-справочник из HTML-страниц форума вопросов и ответов?

Что дано: тематика, содержание (ориентировочный план книги, структура по подтемам).
Требуется: наполнить содержание из HTML-файлов (файлы: текст и изображения - уже есть локально) так, чтобы получился некий структурированный справочник по самым востребованным и интересным вопросам, расположенных согласно заданной структуры содержания.

При этом, нужно максимально точно в полуавтоматическом режиме, исключить всякие ответы и комментарии, не относящиеся к вопросу.

Чем такое можно осуществить?
Спасибо!
  • Вопрос задан
  • 110 просмотров
Решения вопроса 1
xmoonlight
@xmoonlight Автор вопроса
https://sitecoder.blogspot.com
1. Спросить у гугла конкретный вопрос и составить по первым N-линкам, модель верного ответа - обучить модель на поисковой выдаче.
2. Применить обученную модель к текущему вопросу и найти наиболее подходящий ответ (из всех ответов и коментариев).
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
Форум2Book конвертер, а если серьезно писать свой парсер либо искать фрилансеров
Ответ написан
Комментировать
Ranwise
@Ranwise
никак не сделать, пока не придумают ИИ который за вас отсеет всякие ответы и комментарии
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы