Поддерживаю предыдущего оратора. Придумать свой проект и начать пилить. А когда/если будут конкретные проблемы, обращайтесь :)
Пользуясь случаем хочу сказать спасибо за сайт prochita.la :)
P.S. Ну и да, на NLTK взгляните, хотя Вы наверняка уже :)
P.P.S. Сорри за неправильную ссылку в первом варианте ответа