Существуют ли программы, защищающие от метода деанонимизации путём анализа стиля написанного текста?
Суть - есть метод сопоставления анонимной личности какой-либо личности в реальном мире, используя анализ текста и выявление похожих конструкций, вероятность использования которых уникальна для каждого человека. Есть ли программы, которые деперсонифицируют напечатанный текст, заменяя такие конструкции наиболее общеиспользуемыми и форматируя всё согласно правилам языка? Или, может, такие программы есть в разработке?
Сам бы написал, если честно - но для меня, как необученного никакому Computer Science и никогда не работавшего с чем-либо похожим, задача нетривиальная =(
Ну это вариант, конечно - только вот мне кажется, что после обработки программой текст должен подвергнуться минимальному редактированию со стороны автора, дабы опять не загрязнить своими уникальными речевыми оборотами уже очищенный от них текст. Да и переводчики всё же слишком сильно искажают текст - тут надо бы пристроить что-то вроде словаря синонимов и просто подставлять по смыслу синонимы в текст. Можно ведь даже не приводить к наиболее часто используемым выражениям, просто менять стиль в каждом сообщении, и задача деанонимизации точно так же будет осложнена.