@MrPhelko
.Net Full Stack Developer

Как нормализировать имена с помощью ML или других способов?

Всем привет.
Появился вопрос, какими образом можно нормализировать текст, а точнее ФИО.
Например на входе у нас есть:
1)Sidorov Alexey Alex.
2)Aleksey, A. Sidorrov

На выходе должно быть что 1 = 2
Какими методами это можно сделать?
  • Вопрос задан
  • 405 просмотров
Пригласить эксперта
Ответы на вопрос 2
@vanillathunder
Нужно определить степень похожести строк и подобрать подходящий коэффициент. Можно использовать Расстояние Левенштейна
Ответ написан
Комментировать
@ivodopyanov
NLP, python, numpy, tensorflow
Если текст - это исключительно ФИО, то можно попробовать написать регулярок на все варианты написания; выделить отдельно Ф, И, О; обработать случаи сокращения имен; сравнить полные варианты по Левенштейну.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 нояб. 2024, в 03:54
1500 руб./за проект
22 нояб. 2024, в 02:56
10000 руб./за проект
22 нояб. 2024, в 00:55
500 руб./за проект