DenisOgr
@DenisOgr
Developer

Как составить портрет по словам?

У меня есть речь одного человека. Мне нужно составить необычней отчет из его слов. Пока что я придумал, составить облако слов по частоте повторяющихся слов, и карту фоторграфий(часто повторяющее слово заменяется фото с размером пропорциональным повторению слова). Что такое облако слов, я думаю многие знают.

Хочется в результате просчитать какой у него образ, на какого героя из Звездных воин или Властелина колец его речь похожа. Но как это сделать?
Распарсить, диалоги из книги звездных воин, сгруппировать по повторяющимся словам и найти тот массив слов, который больше всего совпадает с человеком.... Как то сложно и наврятли будет точно.

Есть у кого нить идеи, как это можно сделать? Хоть в какую сторону смотреть?
  • Вопрос задан
  • 2628 просмотров
Пригласить эксперта
Ответы на вопрос 1
Мне кажется, что речь человека, если только это не речь узкого специалиста на рабочем месте или на лекции, на самом деле почти всегда - об одних и тех же вещах. Специфика конкретного человека заключается в выборе синонимов, вводных слов, наиболее частым схемам построения предложений. Превратить эти отличия в картинки - невозможно. Они (отличия) сотрутся : как Вы нарисуете по-разному "классный", "клевый" и "прикольный" ?

Если же оставить в отчете именно слова, а не их изображения, то тогда это довольно известная задача сравнения изучаемого текста с корпусами наиболее употребительных слов. Средствами мат.статистики считаются отклонения, наблюдаемые в речи этого человека, относительно общеупотребительной лексики, и из них строится какой-нибудь отчет или визуализация :
habrahabr.ru/post/204104
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы