С помощью чего узнать полезность текста для выбранной категории?
Например, есть категория "текст - рыба" и 3 текста. Первый о машинах, второй о рыбах в красном море, третий Lorem Ipsum. Правильный ответ 3, 2. Т.е. на выходе должна быть сортировка по "полезности".
Как найти нужный мне текст? И как мне в этом может помочь phpMorphy? Это уж совсем на пальцах, но думаю суть ясна :)
Задача может быть сложнее: есть десяток текстов одной категории и их надо отсортировать по "абстрактному" человеческому критерию в порядке убывания полезности.
В каждой шутке есть доля правды. Можно попробовать применить наивный байесовский классификатор. Он выдаёт некое числовое значение, насколько текст соответствует категории.
Пример классификации новостей по рубрикам есть на гитхабе, если сможете достать.