Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
157 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
Есть ли способ сжать данные?
2 подписчика
вчера
250 просмотров
1
ответ
Python
Простой
Почему функция ImportAuthorizationRequest не авторизует клиента, хотя не вызывает ошибку?
1 подписчик
28 авг.
42 просмотра
1
ответ
Python
Сложный
Как запустить отдельный скрипт в субпроцессах, получив интерфейс типа concurrent.futures.Executor?
2 подписчика
27 авг.
108 просмотров
1
ответ
Python
Средний
Как формируется запрос на стороне сайта?
1 подписчик
27 авг.
99 просмотров
1
ответ
Python
+1 ещё
Простой
Как написать бота для Bitrix24 на Python?
1 подписчик
26 авг.
193 просмотра
1
ответ
Python
Простой
Syntaxerror invaild syntax Что я делаю не так?
1 подписчик
26 авг.
88 просмотров
1
ответ
Python
+1 ещё
Простой
Как бороться с отступами в сформированном шаблоне Django python?
2 подписчика
24 авг.
463 просмотра
1
ответ
Python
Простой
Как правильно спроектировать эту функцию?
1 подписчик
23 авг.
189 просмотров
2
ответа
Python
+1 ещё
Простой
Что не так с моими асинхронными запросами?
2 подписчика
20 авг.
236 просмотров
0
ответов
Python
Простой
Как в питоне генерировать (создавать+заполнять значениями по умолчанию) вложенный словарь так, чтобы вложенные элементы не были копиями друг друга?
1 подписчик
20 авг.
169 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Ведущий Python разработчик
Сбер
•
Москва
от 200 000 до 250 000 ₽
Python разработчик
ITK academy
•
Казань
от 75 000 ₽
Backend Python/Django
Borderless360
от 3 000 до 6 000 $
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама