n1k_crimea
@n1k_crimea
29 лет Крым

Как на Python определить, что текст на изображении не горизонтален и изображение необходимо повернуть?

Есть pdf документы (сканы документов бумажных), конвертирую каждый лист в изображение и распознаю с помощью pytesseract. Но проблема в том, что некоторые листы в pdf имеют вертикальную ориентацию. Необходимо определять какие изображения нужно повернуть на 90грд.
Какая библиотека в этом поможет?
  • Вопрос задан
  • 532 просмотра
Решения вопроса 1
n1k_crimea
@n1k_crimea Автор вопроса
29 лет Крым
Собственно, решение такое.
В pytesseract есть метод image_to_osd, возвращает строку:
Page number: 0
Orientation in degrees: 90
Rotate: 270
Orientation confidence: 23.51
Script: Cyrillic
Script confidence: 10.63
есть еще EXIF - в этой статье хорошо описано https://habr.com/ru/post/471112/, но мне не подходит из-за того что работаю с конвертированным изображением
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы