Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
157 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+2 ещё
Простой
Как парсить динамическую таблицу с помощью selenium?
1 подписчик
15 часов назад
47 просмотров
0
ответов
Python
Простой
Python requests как правильно написать алгоритм?
2 подписчика
16 часов назад
140 просмотров
0
ответов
Python
+1 ещё
Простой
Как решить проблему с подключение к серверу через websocket?
2 подписчика
вчера
344 просмотра
1
ответ
Python
+2 ещё
Простой
Прошу о помощи: Автоматизация действий Python + Playwright, как исправить?
1 подписчик
вчера
69 просмотров
0
ответов
Python
+2 ещё
Простой
Как сделать, чтобы при парсинге bs4 как то надо нажать на кнопку «показать еще», чтобы подгрузило еще 20 постов?
1 подписчик
вчера
99 просмотров
2
ответа
Python
+3 ещё
Простой
У меня не получается спарсить ссылку на фото с сайта, help?
1 подписчик
07 апр.
162 просмотра
2
ответа
Python
Простой
Проблема с запуском собранного exe на путоне на windows 7. Помогетe пожалуйста?
1 подписчик
07 апр.
184 просмотра
2
ответа
Python
Простой
Как эту задачу решить по другому?
1 подписчик
07 апр.
758 просмотров
2
ответа
Python
Простой
Хочу посмотреть реализацию функции в builtins.py, но там только докстринги по функциям. Как посмотреть реализацию?
1 подписчик
06 апр.
118 просмотров
2
ответа
Python
+1 ещё
Простой
Как отслеживать геопозицию в реально времени в телеграмм боте?
1 подписчик
05 апр.
275 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python разработчик Middle+/Senior
Arcanis
•
Бали
от 3 000 до 4 000 $
Senior Python Developer (Blockchain)
WebGears Services LTD
от 3 500 до 4 500 $
Python разработчик
DimaTech Ltd
•
Краснодар
от 100 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама