Как реализовать поиск слов с опечатками или незначительными разночтениями?
Есть корпус слов, для каждого из которых нужно найти неточные совпадения в тексте, с возможностью опечаток или отличий в одном - двух символах. Например: color - colour, gray - grey и т.п. Для длинных слов отличий может быть больше.
Считайте подряд идущие верные буквы и буквы-несовпадений (пропущена, любая лишняя, другая вместо нужной), запоминаете расстояния для всех ошибочных цепочек.
Затем вычитаете из минимальной длины строки все ошибочные расстояния и делите на длину этой минимальной строки. Получаете коэффициент несовпадения. Умножив его на 100 - получите процент несовпадения строк.