n1k_crimea
@n1k_crimea
29 лет Крым

Как на Python определить, что текст на изображении не горизонтален и изображение необходимо повернуть?

Есть pdf документы (сканы документов бумажных), конвертирую каждый лист в изображение и распознаю с помощью pytesseract. Но проблема в том, что некоторые листы в pdf имеют вертикальную ориентацию. Необходимо определять какие изображения нужно повернуть на 90грд.
Какая библиотека в этом поможет?
  • Вопрос задан
  • 133 просмотра
Решения вопроса 1
n1k_crimea
@n1k_crimea Автор вопроса
29 лет Крым
Собственно, решение такое.
В pytesseract есть метод image_to_osd, возвращает строку:
Page number: 0
Orientation in degrees: 90
Rotate: 270
Orientation confidence: 23.51
Script: Cyrillic
Script confidence: 10.63
есть еще EXIF - в этой статье хорошо описано https://habr.com/ru/post/471112/, но мне не подходит из-за того что работаю с конвертированным изображением
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
OnederX Москва
от 100 000 до 120 000 ₽
iCode Москва
от 90 000 до 200 000 ₽
SwapZilla.co Сочи
от 200 000 ₽
12 июл. 2020, в 23:05
25000 руб./за проект
12 июл. 2020, в 22:52
750 руб./за проект