Алгоритмы анализа текста

Доброго времени суток.
Меня интересуют алгоритмы анализа текста. Может кто то что то подскажет.

Например:
1) Анализ текста на схожесть с другим текстом
2) Анализ определенных вхождений на схожесть (Пример java, java script, javascript – по идеи javascript=java script, а java!=java script) можно конечно использовать расстояние Левенштейна, но может, есть специализированные алгоритмы

Ну и если есть еще какая литература по анализу текста поделитесь.
Спасибо.
  • Вопрос задан
  • 9272 просмотра
Пригласить эксперта
Ответы на вопрос 1
rasa
@rasa
1) Шинглы не подойдут?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы