@lucifer_jr

Как найти самое часто встречающееся слово без учета словоформ?

Предположение: вот есть слово "олень", смотрю есть ли оно в map (путем получения ключей и поиска подстроки в строке. Если количество совпавших символов >3, к примеру, то это одно и то же слово), если есть, то инкрементирую счетчик по этому ключу, если нет, то добавляю в map. Затем иду к следующему слову.

Но тут возникает трабл, как определить, что если >3 символов подстроки совпало - то это одно и то же слово. Ведь не факт. Как быть?
  • Вопрос задан
  • 115 просмотров
Решения вопроса 1
alfss
@alfss
https://career.habr.com/alfss
https://github.com/kljensen/snowball
Вам в этом направлении
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы