@nakem

Есть ли либа, которая сможет матчить слова, которые похожи друг на друга?

Проблема: есть список неких слов на латинице, предположим, что это марки машин.
Мне приходит слово `tayota`, а в списке слов есть `toyota`. Мне нужна либа, которая сможет найти это совпадение.
  • Вопрос задан
  • 64 просмотра
Пригласить эксперта
Ответы на вопрос 2
yellow79
@yellow79
Senior Software Engineer
Одной либой тут не обойтись. Нужен как минимум комплекс решений.
Ключевые слова для поиска:
  • расстояние Левенштейна
  • стемминг
  • spell checker
  • поиск по триграммам
  • инвертированный индекс
Ответ написан
Комментировать
@nakem Автор вопроса
я нашел это https://github.com/schollz/closestmatch
Немного потестил, вроде все как я хотел. Правда я не понял, что такое bag size, но вроде с дефолтным 2 из примера все работает
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы