@pikkvile
developer

Какие есть библиотеки для оценки «похожести» текстов?

Лучше всего на java или каком-нибудь jvm языке.

Я новичок в анализе текстов, поэтому не уверен, как правильно сформулировать то, что надо.
Например, вот два названия товара:

HP 728 300-ml Cyan DesignJet Ink Cartridge
Hp 728 - Cyan - Original - Designjet - Blækpatron

Нужен инструмент, который с более-менее высокой вероятностью сможет понять, что это об одном и том же.
В целом задача такая: есть два списка названий, по-разному сформулированных, нужно найти соответствия между элементами списков.

Я пробую что-то изобретать, но получается медленно и много ошибок. Вот, подумал, может, есть какое-нибудь готовое решение?
  • Вопрос задан
  • 174 просмотра
Пригласить эксперта
Ответы на вопрос 1
Applez
@Applez
Разраб
Ищите библиотеки реализующие LSA. Например вот.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
Bell Integrator Ульяновск
До 400 000 ₽
Bell Integrator Хабаровск
До 400 000 ₽
Bell Integrator Ижевск
До 400 000 ₽
18 апр. 2024, в 21:56
2000 руб./за проект
18 апр. 2024, в 21:00
150 руб./за проект