Сейчас сел за новую версию истио, и одним из изменений хочу сделать языковые версии (собственно русская версия изначально была как бетта :) )
Столкнулся с вопросом морфологии на других языках.
Вопрос первый:
На sourceforge помимо классических русского английского и немецкого есть «урезанные» украинский и эстонский. В них написано, что нет морфологической информации. Значит ли это, что я с ними могу только базовую форму получить? Или часть морфем таки есть? Или даже базовую форму не получить?
Вопрос второй:
Еще где-то есть словари под другие языки? гуглил но не нашел. Хорошо бы еще пару европейских языков добавить. Раз уж я ухожу от двуязычия, и решаю связанные с ним проблемы, то чего мелочиться то?))
Киньте ссылочку на пример словаря, а то, не совсем ясно что к чему.
Какой формат этих словарей?
Возможно найдется способ автоматически сгенерировать такие словари.
Думаю что эти словари (даже в отрыве от этого конкретного проекта) могут представлять собою самостоятельную ценность (например, для «собирателей» словарей вроде меня).
Там не все файлы нужны. Там в коде все более менее понятно. Если я правильно помню там бинарные деревья для индекса. НО суть то не в том. Под нее есть вроде какой-то инструмент для редактирования словарей. Но не делать же для каждого языка самому словари :) Наверняка они уже есть…