Задать вопрос
@MrPhelko
.Net Full Stack Developer

Как нормализировать имена с помощью ML или других способов?

Всем привет.
Появился вопрос, какими образом можно нормализировать текст, а точнее ФИО.
Например на входе у нас есть:
1)Sidorov Alexey Alex.
2)Aleksey, A. Sidorrov

На выходе должно быть что 1 = 2
Какими методами это можно сделать?
  • Вопрос задан
  • 405 просмотров
Подписаться 3 Средний 1 комментарий
Пригласить эксперта
Ответы на вопрос 2
@vanillathunder
Нужно определить степень похожести строк и подобрать подходящий коэффициент. Можно использовать Расстояние Левенштейна
Ответ написан
Комментировать
@ivodopyanov
NLP, python, numpy, tensorflow
Если текст - это исключительно ФИО, то можно попробовать написать регулярок на все варианты написания; выделить отдельно Ф, И, О; обработать случаи сокращения имен; сравнить полные варианты по Левенштейну.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
от 200 000 до 300 000 ₽
Greenway Global Новосибирск
от 150 000 ₽
Akronix Санкт-Петербург
от 150 000 до 200 000 ₽
31 янв. 2025, в 00:16
43000 руб./за проект
30 янв. 2025, в 21:33
5000 руб./за проект
30 янв. 2025, в 19:55
7000 руб./за проект