@MrPhelko
.Net Full Stack Developer

Как нормализировать имена с помощью ML или других способов?

Всем привет.
Появился вопрос, какими образом можно нормализировать текст, а точнее ФИО.
Например на входе у нас есть:
1)Sidorov Alexey Alex.
2)Aleksey, A. Sidorrov

На выходе должно быть что 1 = 2
Какими методами это можно сделать?
  • Вопрос задан
  • 404 просмотра
Пригласить эксперта
Ответы на вопрос 2
@vanillathunder
Нужно определить степень похожести строк и подобрать подходящий коэффициент. Можно использовать Расстояние Левенштейна
Ответ написан
Комментировать
@ivodopyanov
NLP, python, numpy, tensorflow
Если текст - это исключительно ФИО, то можно попробовать написать регулярок на все варианты написания; выделить отдельно Ф, И, О; обработать случаи сокращения имен; сравнить полные варианты по Левенштейну.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы