Insolita
@Insolita
Отчаянная домохозяйка

Что лучше pymorphy2 vs phpMorphy для обработки русских слов?

pymorphy2 работает со словарём OpenCorpora
phpMorphy с AOT
задачи - лемматизировать слова, определять части речи
какой инструмент будет более качественным (какая база круче, где лучше "предсказатель")? (скорость менее принципиальна)
то что это на разных ЯП - понятно
  • Вопрос задан
  • 1778 просмотров
Решения вопроса 2
@kazmiruk
Я бы взял pymorphy (я даже не выбирал в принципе, так как php не приемлю, но не суть), так как phpmorphy не поддерживается больше разработчиком (последнее изменение 4 года назад) и Вы останетесь со всеми вопросами и багами один на один.
Какой инструмент имеет круче предсказатель - накатайте тестик по формированию частотных отношений лемм и натравите на хабр, к примеру. А потом смотрите на результат (думаю он не будет отличаться даже) На pymorphy это примерно 20 строк кода. На phpmorphy думаю не многим больше. Результат работы pymorphy по определению части речи и выдергивания лемм меня более чем удовлетворил.
По скорости - разработчик pymorphy заявляет, что одной из задач для него была оптимизация, поэтому есть шанс, что работать будет быстрее.
Ответ написан
Insolita
@Insolita Автор вопроса
Отчаянная домохозяйка
ну по скорости особо не сомневалась что питон реализация в принципе быстрее будет, видимо действительно сравнительный тест написать, думала может уже кто сравнивал
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы