Поставил движок Tesseract-OCR, затем поставил пакет-врапер pytesseract на Python 3.6.
Распознаю русский текст:
text = pytesseract.image_to_string(Image.open(filename), lang='rus')
Русский текст распознается без проблем. Однако в тексте помимо русских букв встречаются ещё две буквы из английского алфавита: N и E. Как указать скрипту, что в тексте помимо русских букв могут быть ещё две данные буквы из английского алфавита? Или может быть можно самому задать свой набор символов.
И ещё вопрос. Как движку указать шрифт?