Степень похожести строк (Ivan Petrov и Иван Петров)?

Question

FilimoniC @FilimoniC

Программирование

Степень похожести строк (Ivan Petrov и Иван Петров)?

Добрый день!

Существует проблемка:

В виду перевода с одной инфраструктуры на другую, необходимо связаять ФИО на русском и ФИО на транслите.

Имеющиеся данные:

Полное корректное ФИО на русском (Иванов Петр Федорович) и транслитированное ФИ\ФИо\ФИО (Ivanov Petr\Ivanov Petr F.\Ivamov Petr Fedorovich)

Требуется

Функция, которая принимает ФИО, транслитирированное из полного русского ФИО роботом (по правилам) и список пар [ФИО;id], где ФИО — транслитирированное человеком ФИО, почти по правилам. При том в списке ФИО может не быть отчества или оно может быть сокращено.

Требуется:

Вернуть список формата
ФИОтрансл | id | степень похожести

То есть, например,
F(toTranslit('Иванова Юлия Мымрова'),$ListTranslit)

даст
Ivanova Yulia Mymrova | BBB1123 | 130

Ivanova Julia M. | AAA5543 | 100

Ivanova Ylia | CCC2234 | 95

Подскажите, есть ли подобное решение или хотя бы алгоритм сравнения похожести строк, дающий оценку похожести в некоторых условных единицах

Вопрос задан более трёх лет назад
4692 просмотра

1 комментарий

Подписаться 3 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 22 июл.
- 179 просмотров
2

ответа
Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 1161 просмотр
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 673 просмотра
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 769 просмотров
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1513 просмотров
10

ответов
Программирование

Простой
Как создать и использовать свою кодировку знаков?
- 1 подписчик
- 02 июн.
- 738 просмотров
4

ответа
Программирование

+1 ещё

Простой
Проект для программирования?
- 2 подписчика
- 27 апр.
- 890 просмотров
9

ответов
Программирование

Простой
Олимпиадное программирование — с чего начать?
- 1 подписчик
- 18 апр.
- 613 просмотров
2

ответа
Программирование

Простой
Как управлять/хранить изображения для UI?
- 1 подписчик
- 10 апр.
- 322 просмотра
1

ответ
Программирование

+1 ещё

Простой
Стоит ли поступать в вуз на программу по математике, если в будущем хочешь иметь профессию, связанную с программированием?
- 4 подписчика
- 07 мар.
- 3583 просмотра
7

ответов
Показать ещё Загружается…

Нашел Алгоритм «Расстояние Левинштейна» Подскажите, насколько он применим?

И уточнение: Алгоритм преобразования заранее предопределен, есть робот, но когда в 1й тнфраструктуре заводились пользователи, робота не было, и было много ошибок преобразования человеческими ресурсами (привет от «Я», «Ю», «Ц», «Ч», «Щ» и т.д.)

Answer 1 · 2013-04-25 22:53:56

Вполне применим.
Можно попробовать для каждого ФИО построить все возможные транслитерации и потом посчитать для всех расстояние Левинштейна и найти наиболее похожее ФИО.

Тут можно посмотреть схему транслитерации
akmac.narod.ru/st/st9.htm