Зависит от того, как этот текст был выведен на экран.
Один способ - OCR (гугли термин). Он распознаёт текст с графического изображения. Как следствие, способ наиболее универсален, но не очень надёжен - экзотические шрифты, эффекты и маленький размер букв будут сбивать его с толку, плюс нужно найти OCR под правильный язык текста. Как результат, скорее всего текст будет распознан с ошибками.
Если же текст - это содержимое обычного окна (например, текст на кнопках и в полях ввода), то тут лучше использовать WinAPI или обёртки типа pywinauto, чтобы извлечь содержимое. Плюс - ты получишь содержимое сразу текстом, независимо от языка. Минус - найти нужное окно и нужные элемент в нём может быть непросто. Кроме того, если искомое окно рисует текст самостоятельно (скажем, игры так делают), то этот способ не сработает вообще.