Здравствуйте.
Пишу свой pet-проект, хочу сделать первые шаги к анализу текстов. Необходима база для лематизации: слово в именительном падеже, единственном числе + все словоформы.
Пример:
банк(основное слово: именительный падеж, единственное число) - банка - банку - банк - банком - банке и пр.
Можете посоветовать, где можно скачать такую базу для своего проекта? Желательно, чтобы была не коммерческая (за неё не нужно платить)
Насчёт именно базы не знаю, но проблему лемматизации успешно решает фреймворк natasha. Использовал для анализа документов. У неё довольно низкоуровневый интерфейс, но если почитать и посмотреть примеры - разобраться можно.