Задать вопрос
@stepan-neretin7

Как можно адекватно извлекать все таблицы (в csv или в excel) из pdf файла?

Попробовал tabula, camelot
Они крайне посредственно это делают, может кто сталкивался с моей задачей
Посоветуйте инструмент
руки не предлагать :D
Файлов очень много и они большущие
Вот пример файла, который хочется перевести тык
  • Вопрос задан
  • 151 просмотр
Подписаться 3 Простой 1 комментарий
Пригласить эксперта
Ответы на вопрос 1
Adamos
@Adamos
ps2txt спокойно выдирает из этого файла текст с кучей пробелов.
Проходишься по нему регуляркой, заменяя "больше одного пробела" на табулятор, например.
Открываешь в офисе, который спрашивает, какие в файле разделители (LibreOffice, например).
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы