По каким параметрам определять авторство текста?

Question

YermolaevG @YermolaevG

По каким параметрам определять авторство текста?

Есть задача написать программу, получающую на вход текст, анализирующую его, и на выходе выдающую вероятность того, что ее написал некий автор (сравниваются или два текста, или параметры из загруженного текста с некими сохраненными установками конкретного автора)
Собственно вопрос в том, какие параметры можно использовать для такой классификации (например, самые часто используемые слова, буквы, среднее количество существительных на прилагательное, и все в таком духе)

Вопрос задан более трёх лет назад
414 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Answer 1 · 2015-05-12 11:42:44

Хорошо работает определение средней длинны предложений, вводных слов, списков и их типа (нумерованные или с помощью дефисов). Сленг, мат если это возможно, если неформальный текст то приветствия. Особенно введению и заключению нужно уделять внимание.

По каким параметрам определять авторство текста?

Войдите на сайт