Ищется бесплатная OCR библиотека для java, либо алгоритм
Стоит 2 задачи:
1) распознать текст, шрифт печатный (мало шумов).
2) определить наиболее схожее изображение из списка имеющихся
Есть ли какие уже готовые решения, либо нужны ссылки на алгоритмы, идеи?
Помнится мне, Cuneiform OCR выпустили в open source. Судя по сайту (openocr.org), проект остановился в развитии, и конечно там нет джавовских версий, но думаю что при желании можно наклепать вызов нативной библиотеки. Не слишком кроссплатформенно, но все же.