Тут надо решить много задач:
Определить где текст (блоки текста), правильно повернуть его, определить, был ли клик внутри этой области.
Потом слова можно выделить, используя Connected-component labeling (
en.wikipedia.org/wiki/Connected_Component_Labeling ) наверное.
Вообще, есть же бесплатные OCR библиотеки, они это точно все должны уметь делать.