1. Для небольших текстов 100% распознавание невозможно будет в принципе.
2. Для улучшения распознавания надо делать экспертную систему с базой слов и с частотами различных языков.
Но возможно получится воспользоваться Google переводчиком с помощью API или еще каким-нибудь.
Обзор определителей языков есть
здесь. Может быть у некоторых есть API.