Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Алгоритмы
Обработка естественного языка
Алгоритм разделения слов, которые, при опечатке, случайно «склеились» (написаны без пробела)?
Всем, добра!
Вопрос в заголовке.
Наглядные примеры:
многороз => много роз
пароход => пароход (т.е. оставить без изменений)
(и самое сложное) проток => ?
Как реализовать проверку с исправлениями таких опечаток?
Есть ли готовое что-то под PHP?
Заранее благодарю за информацию!
Вопрос задан
более трёх лет назад
440 просмотров
11
комментариев
Подписаться
4
Средний
11
комментариев
Facebook
Вконтакте
Twitter
Сергей Соколов
@sergiks
Куратор тега Алгоритмы
«в сем до бра»
Написано
более трёх лет назад
xmoonlight
@xmoonlight
Автор вопроса
Сергей Соколов
, «В опрос в за головке.»
Написано
более трёх лет назад
EVGENY T.
@Beshere
Да помню банально вычленение ФИО (т.е. гораздо-гораздо сильно проще задача) принесло немало сюрпризов:
1. Фамилии типа Петрович, Сидорович
2. Имя Марта в счетах за март.
Так что нет.
Написано
более трёх лет назад
xmoonlight
@xmoonlight
Автор вопроса
EVGENY T.
, ну это шаблонами можно решить - тут всё проще с ФИО...
Написано
более трёх лет назад
xmoonlight
@xmoonlight
Автор вопроса
Ezhyg
, да, опечатался! Спасибо за правку!
Написано
более трёх лет назад
Ezhyg
@Ezhyg
xmoonlight
, не упоминай мой ник всуе... в смысле - просто прими правку :D
Зачем мне лишнее уведомление в почте?
Написано
более трёх лет назад
xmoonlight
@xmoonlight
Автор вопроса
Ezhyg
, ок. принято.
Написано
более трёх лет назад
Ezhyg
@Ezhyg
xmoonlight
, ты ещё и решил поиздеваться напоследок? Так я тебе тем же отомщу! :P
Написано
более трёх лет назад
Оптимус Пьян
@marrk2
Ezhyg
, удалось что ни будь найти за это время? Именно в плане алгоритма а не библиотеки или готового решения?
Написано
более трёх лет назад
Ezhyg
@Ezhyg
Оптимус Пьян
,
я пользуюсь PuntoSwitcher, поэтому проблема для меня не актуальна.
Ой... невнимательно прочитал - нет, я не пэхэпэшу, да и кодингом таким не увлекаюсь ваще, поэтому увы и ах.
Написано
более трёх лет назад
Оптимус Пьян
@marrk2
Ezhyg
, а на серверной стороне? ))
Написано
более трёх лет назад
Решение
пользователя
Данил
К ответам
на вопрос
(3)
Данил
@DanilBaibak
Machine Learning engineer
Как вариант, попробуйте поискать библиотеку, которая проверяет правописание.
Ответ написан
более трёх лет назад
5
комментариев
Нравится
2
5
комментариев
Facebook
Вконтакте
Twitter
xmoonlight
@xmoonlight
Автор вопроса
Искал - не нашёл. Может что посоветуете без "облака", self-hosted?
Написано
более трёх лет назад
Данил
@DanilBaibak
С фокусом php не искал.
https://github.com/bakwc/JamSpell#python
- опенсорс библиотека с интерфейсом на питоне. Есть возможность обучить свою модель - имеет смысл, если у Вас много текста определенной тематики.
Написано
более трёх лет назад
xmoonlight
@xmoonlight
Автор вопроса
Данил
, круто, даже обученные модели есть на русском и английском!
Написано
более трёх лет назад
xmoonlight
@xmoonlight
Автор вопроса
Данил
, буду портировать проверку на PHP... Спасибо!
Написано
более трёх лет назад
Данил
@DanilBaibak
Всегда пожалуйста ;)
Написано
более трёх лет назад
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама