@andrkkk

Как обрабатывать слова написанные разным способом?

К примеру у автомобился есть гидроусилитель руля,в тексте он может быть написан полностью или например ГУР, как извлекать из текста такие слова и классифицировать их?
Я вижу только создать небольшую базу вариантов написания каждого слова, правильно ли это?
  • Вопрос задан
  • 100 просмотров
Решения вопроса 1
@historydev
Острая аллергия на анимешников
Да, думаю вполне, а в идеале установить правила для написания подобного - либо кратко, либо полностью
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Можно смотреть первые буквы (и несколько первых букв, и выбрать лучший вариант по совпадениям) во всех корнях в подряд идущих слов, учитывая предлоги между ними с вероятностью в 50% (проверять с предлогами и без, и выбирать лучшее совпадение).

Это покроет большинство случаев.

И свой словарь для нескольких частных случаев - тоже можно сделать: чем больше классификаторов - тем лучше.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы