@babaevmm

Как реализовать систему корректировки почтового адреса?

Здравствуйте!
Подскажите куда копать в вопросе приведения к канонической форме и поиска индекса для почтового адреса. Мною по работе 4 года назад была написана система работы с КЛАДР. Суть: имеются адреса, записанные как попало - не только с орфографическими ошибками, но с искаженным адресом (допустим неправильно указан район). Необходимо было находить соответствующий индекс. Реализовано было все через обучение системы - оператор при несовпадении проставлял соответствия и в следующий раз система могла определить соответствующий узел адреса. Система устарела, обучать некому. Решено сделать что-то универсальное типа сервисов dadata и т.д., но свое и чтоб локально работало.
Почитал статьи про алгоритмы нечеткого поиска. Но назрел вопрос для человека знакомого с описанной предметной областью: в каком направлении копать? Какие алгоритмы рассматривать в первую очередь? можно сузить круг по предметной области.
Заранее спасибо!
  • Вопрос задан
  • 253 просмотра
Пригласить эксперта
Ответы на вопрос 2
Adamos
@Adamos
В адресе, скорее всего, все-таки указана область (в первую очередь нужно искать ее) или хотя бы город (во вторую очередь). Когда они будут определены - количество вариантов улиц будет уже не таким страшным.
Ключевые слова "ул.", "р-н" и пр. могут помочь отличить ул. Большую Московскую от области.

Вычисляем расстояния Левенштейна для имеющихся правильных вариантов и фрагментов введенной строки. Наименьшее считаем правильным...
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы