Vladimir_KZ
@Vladimir_KZ
Student

Как из pdf-файла спарсить таблицу, размещенную на двух страницах и сохранить в Excel?

Есть pdf-файл с таблицами. Требуется одну из таблиц, размещенную на двух листах поместить в один файл Excel.
С использованием tabula и pandas получается через два датафрейма вытащить таблицу и экспортировать в csv-файл, применяя для второго mode='a'. Потом переэкспорт в Excel.
Есть ли вариант напрямую экспортировать в Excel без лишних бубнов?

6400f8c55158c986327389.jpeg
  • Вопрос задан
  • 171 просмотр
Решения вопроса 1
Maksim_64
@Maksim_64
Data Analyst
Когда у вас есть два пандас фрейма конкатенируйте их с помощью pd.concat и записывайте объеденный фрейм напрямую в excel.
псевдо код будет что то вроде этого.
final_df = pd.concat([df1,df2], ignore_index=True)
final_df.to_excel('имя файла')

Все быстро и удобно без лишних записей в csv. Самое сложное это установка tabula бывает капризничает. Но в остальном все просто.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы