"1к1"
может означать "1/1"
и это должно иметь высокий % совпадения, тогда как "1а"
и "1б"
- очень низкий. А "1а\3стр4"
и "1а\3стр5"
- тоже высокий т.к. корпусом в такой детализации часто можно пренебречь. Если больше одного...Вот этим моментом особенно, видимо нужно формировать набор предполагаемых вариантов, после чего уже далее по каким-то критериям сравнивать вероятность того, что же из них имеется в виду. Ведь например "массив" может встречаться как в названии улицы, так и в названии нас. пункта (пример г Воронеж, Жилой массив Олимпийский - числится в ФИАСе как населённый пункт внутри Воронежа)
Да и не надо сразу искать дом ... надо сначала определиться с населённым пунктом