Есть следующая задача, есть например слово "авто" (полностью написанное русскими буквами), необходимо найти все возможные варианты этого слова которые похожи на "вид" но на самом деле отличаются. Слова похожи если, например заменить русскую "а", на английскую "a", выйдет слово "aвто", на вид для человека эти 2 слова одинаковы, но при сравнении кодов символов они будут отличаться. Т.е. заменяя буквы русского алфавита на буквы английского для человека слово остаётся такое же, а вот для машины они разные.
Может как то этот феномен называется, а может данная задача уже была решена и кто то может поделиться ссылкой на алгоритм.
За сравнение строк отвечает collation - таблица для сравнения символов. Каждый раз, когда ты в программе или СУБД сравниваешь два строковых значения, к сравнению привлекается эта таблица. Если у тебя, например, регистрозависимое сравнение, то используется одна таблица, если регистронезависимое - другая... Так что задача сводится к использованию при сравнении такого collation, в котором одинаковые по написанию/отображению символы равны, даже если они отличаются раскладкой.
Да, ссылку не проси - нет её у меня. Ибо последний раз использовал такую штуку лет эдак дцать назад, во времена Windows 3.11 и Winword 2.0.