Есть короткие сообщения, которые получает на вход программа (Python, к примеру) и есть ключевые слова, которые заложены в программе.
Нужно определить если ли это слово в тексте, допуская что в нем могут содержаться ошибки.
Пример:
Есть текст:
Какая стоимасть у этого товара?
Алгоритм должен распознать это слово, при условии что в ключевых словах есть слово
стоимость.
Сейчас всё это дело реализовано так:
1. Разбиваю текст на слова
2. Для каждого слова считаю расстояние Левенштейна от списка ключевых слов
3. Если расстояние не больше двух - это слово присутствует.