@zkrvndm
Софт для автоматизации

Как разбить слитно написанные фразы на отдельные слова?

Возникла необходимость разобрать мешанину вот такого вида:
#костюмтеплый
#весеннийкостюм
#костюмвязаный
#костюмспортивный

Существуют ли готовые морфологические JS/PHP библиотеки, которые могли бы вытащить из хештегов отдельные слова?
  • Вопрос задан
  • 1098 просмотров
Решения вопроса 1
@Otrivin
junior full-stack сисадмин
У Яндекса есть спеллер. На гитхабе есть классы для работы с ним.
Попробуйте, может помочь
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
На викисловаре есть частотные биграммы.
Инвертируем список и получаем биграммы-небывальщины.
1. Проверяем по ним слова (по подстроке биграммы) и разрываем посередине.
2. После разрыва - проверяем получившиеся слова по словарю.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы