Insolita
@Insolita
Отчаянная домохозяйка

Что лучше pymorphy2 vs phpMorphy для обработки русских слов?

pymorphy2 работает со словарём OpenCorpora
phpMorphy с AOT
задачи - лемматизировать слова, определять части речи
какой инструмент будет более качественным (какая база круче, где лучше "предсказатель")? (скорость менее принципиальна)
то что это на разных ЯП - понятно
  • Вопрос задан
  • 2011 просмотров
Решения вопроса 2
@kazmiruk
Я бы взял pymorphy (я даже не выбирал в принципе, так как php не приемлю, но не суть), так как phpmorphy не поддерживается больше разработчиком (последнее изменение 4 года назад) и Вы останетесь со всеми вопросами и багами один на один.
Какой инструмент имеет круче предсказатель - накатайте тестик по формированию частотных отношений лемм и натравите на хабр, к примеру. А потом смотрите на результат (думаю он не будет отличаться даже) На pymorphy это примерно 20 строк кода. На phpmorphy думаю не многим больше. Результат работы pymorphy по определению части речи и выдергивания лемм меня более чем удовлетворил.
По скорости - разработчик pymorphy заявляет, что одной из задач для него была оптимизация, поэтому есть шанс, что работать будет быстрее.
Ответ написан
Комментировать
Insolita
@Insolita Автор вопроса
Отчаянная домохозяйка
ну по скорости особо не сомневалась что питон реализация в принципе быстрее будет, видимо действительно сравнительный тест написать, думала может уже кто сравнивал
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы