Как рассчитать степень схожести двух текстов?

Нужно определить степень схожести двух коротких текстов, 1-2 предложения. Тексты - это команды умного дома. Нужно для реализации голосового интерфейса
  • Вопрос задан
  • 699 просмотров
Решения вопроса 1
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
1. Вам нужен синонимайзер и яндекс для составления словоформ синонимов в разных падежах: https://export.yandex.ru/inflect.xml?name=тест

2. Затем составляете все возможные схемы предложений: порядок следования КЛЮЧЕВЫХ слов и падежи (предлоги, союзы и мат :) не входят сюда).

3. Строим дерево для быстрого поиска команды на основе КЛЮЧЕВЫХ слов из произнесённой фразы.

4. Используем распознавание похожести слов Левенштейном и похожести цепочек для дерева - Шинглы.

5. Профит!

Доп. метод: также можете воспользоваться для определения частей речи моим велосипедом и через Левенштейна построить ожидаемые цепочки дерева.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы