Есть электронная книга в формате djvu, нужно извлечь данные в бд, с помощью fine reader извлек текст, но получилась каша, которую надо приводить в порядок так чтобы добавить в бд, правлял под формат csv, но это очень долго, есть ли какое нибудь другое решение данной проблемы, какие еще есть варианты?
Из описания задачи непонятно что именно не получается:
1. качественный OCR (если плохое качество скана, то возможно результат OCR будет неточным)
2. извлечение информации из текстовой информации
3. занесение данных в БД