xmoonlight
@xmoonlight
https://sitecoder.blogspot.com

Алгоритм разделения слов, которые, при опечатке, случайно «склеились» (написаны без пробела)?

Всем, добра!
Вопрос в заголовке.

Наглядные примеры:
многороз => много роз
пароход => пароход (т.е. оставить без изменений)
(и самое сложное) проток => ?

Как реализовать проверку с исправлениями таких опечаток?
Есть ли готовое что-то под PHP?

Заранее благодарю за информацию!
  • Вопрос задан
  • 428 просмотров
Решения вопроса 1
DanilBaibak
@DanilBaibak
Machine Learning engineer
Как вариант, попробуйте поискать библиотеку, которая проверяет правописание.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
Без контекста бесполезно. В лучшем случае получите сам факт того, что данное слово может быть составлено из нескольких других слов. Но в большинстве случаев невозможно будет определить, а надо ли его разбивать.
Например, знаменитое по Word'у "мультиканальный"
Ответ написан
Комментировать
Vlad_IT
@Vlad_IT
Front-end разработчик
Мне кажется, даже если есть, то работает фигово. Например слово
бакалея - бак алея (не путать с аллеей). Бой_кий, воз_лежать, жар_кий, кино_театр, ком_пас, бор_мотать.
Мне кажется, даже с использованием машинного обучения возникнут неточности.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы