@ekopiy

Какую библиотеку/sdk выбрать для распознавания таблиц?

Есть около 60 млн. документов в формате pdf, в которых есть таблицы разных форматов. В основном, сканы. Разный формат это может не быть внешних границ или ячейки объединены и присутствует цветовое оформление. Попробовали tabula + opencv с предобученной моделью, найденной в интернете, но очень медленно дело идёт. Есть ли инструменты лучше и быстрее или нужно смотреть на платные?
  • Вопрос задан
  • 143 просмотра
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
ABBYY конечно
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
YCLIENTS Москва
от 200 000 до 350 000 ₽
Ведисофт Екатеринбург
от 25 000 ₽
ИТЦ Аусферр Магнитогорск
от 100 000 до 160 000 ₽