открытый бесплатный готовый к использованию - tesseract
недостаток, если документ не распознается, то нужно будет тюнить его шрифты
на английский язык и некоторые другие языки есть современные языковые OCR модели, гуглить на huggingface.co ocr multilang, на русский я не нашел. Но куча готового софта, подбираешь датасет, обучаешь,...