Задать вопрос

По каким параметрам определять авторство текста?

Есть задача написать программу, получающую на вход текст, анализирующую его, и на выходе выдающую вероятность того, что ее написал некий автор (сравниваются или два текста, или параметры из загруженного текста с некими сохраненными установками конкретного автора)
Собственно вопрос в том, какие параметры можно использовать для такой классификации (например, самые часто используемые слова, буквы, среднее количество существительных на прилагательное, и все в таком духе)
  • Вопрос задан
  • 414 просмотров
Подписаться 4 Оценить Комментировать
Решение пользователя SeptiM К ответам на вопрос (3)
@SeptiM
Посмотрите ключевые слова authorship attribution features. Google в первых результатах выдает статью Bozkurt et al и обзор Stamatatos. Думаю, поможет.
Ответ написан