@username5

Можете посоветовать базу словоформ?

Здравствуйте.
Пишу свой pet-проект, хочу сделать первые шаги к анализу текстов. Необходима база для лематизации: слово в именительном падеже, единственном числе + все словоформы.

Пример:
банк(основное слово: именительный падеж, единственное число) - банка - банку - банк - банком - банке и пр.

Можете посоветовать, где можно скачать такую базу для своего проекта? Желательно, чтобы была не коммерческая (за неё не нужно платить)
  • Вопрос задан
  • 102 просмотра
Пригласить эксперта
Ответы на вопрос 1
phaggi
@phaggi
лужу, паяю, ЭВМы починяю
Насчёт именно базы не знаю, но проблему лемматизации успешно решает фреймворк natasha. Использовал для анализа документов. У неё довольно низкоуровневый интерфейс, но если почитать и посмотреть примеры - разобраться можно.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы