Как разбить таблицу на ячейки со скана?

Написал на питоне скрипт, который разбивает сканированный документ на блоки и нарезает их в отдельные файлы, эти файлы скармливать в Tesseract. Проблема заключается в появлении таблицы в документе, каким образом можно понять что это таблица и нарезать ее на ячейки(учитывать collspan/rowspan)?
  • Вопрос задан
  • 152 просмотра
Пригласить эксперта
Ответы на вопрос 1
svetloffs
@svetloffs
python DS ML
Павел, а где "Проблема заключается в появлении таблицы в документе" это ?
Ваш код выдает nparray - это набор чиселок, но не данные таблицы.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы