@AlexandrMa

Как сравнивать строки по неполному сходству?

На сайте есть названия товаров.
В стороннем прайс листе, эти же товары, но с отличиями в названии (запятые, тире, пробелы) и иногда слова местами поменяны.
Можно ли как-то автоматически сопоставить строки?
PS. не знаю какие теги выбрать к вопросу. Поправьте пожалуйста.
  • Вопрос задан
  • 215 просмотров
Пригласить эксперта
Ответы на вопрос 2
Расстояние Левенштейна или другие метрики для сравнения.
Ответ написан
Комментировать
@sunsexsurf
IT & creative
Про расстояние Левенштейна (как базовую метрику, с которой стоит начинать) вам уже написали. Проблема начинается, как по мне, в момент, когда приходит понимание, что "слова могут быть переставлены". И тут вам придется вспомнить комбинаторику и все эти факториалы. Потому как даже для трех слов количество перестановок будет равно 3! = 6. А вы, опять же скорее всего, будете брать и сплитить вашу строку по пробелам и сравнивать каждое слово с каждым. Чувствуете возрастающую сложность?
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы