Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
156 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+1 ещё
Простой
Как сделать проверку при кике есть ли человек в беседе или нет?
1 подписчик
18 часов назад
69 просмотров
1
ответ
Python
+2 ещё
Простой
Как добавить в приложение видео из html-фреймов (youtube, vk, vimeo)?
2 подписчика
вчера
252 просмотра
2
ответа
Python
+2 ещё
Простой
Как пользоваться методом messages.addChatUser vk api?
1 подписчик
вчера
65 просмотров
1
ответ
Python
Простой
Какие ошибки в понимании объектов?
1 подписчик
28 февр.
120 просмотров
1
ответ
Python
Простой
Создал код и когда пишу в powershell pyinstaller --onefile --windowed --icon=icon.ico testret.py пишет IndexError: tuple index out of range?
1 подписчик
28 февр.
72 просмотра
1
ответ
Python
+2 ещё
Простой
Как указать путь к chromedriver.exe в seleniumbase?
1 подписчик
28 февр.
48 просмотров
0
ответов
Python
Простой
Как определить правильно IP для замены функции PrintLastLog на свою?
1 подписчик
28 февр.
43 просмотра
1
ответ
Python
+2 ещё
Простой
Как выделить текст после парсинга?
1 подписчик
24 февр.
303 просмотра
1
ответ
Python
+2 ещё
Простой
Как вывести определенное расширение TLS из .pcapng файла с помощью pyshark?
1 подписчик
24 февр.
80 просмотров
1
ответ
Python
Средний
Как правильно написать код на Python для шифра «Цезарь»?
1 подписчик
24 февр.
1230 просмотров
2
ответа
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python-разработчик
Dalyoko
от 2 000 до 4 000 $
Python developer
Greenway Global
•
Новосибирск
от 150 000 ₽
Backend разработчик Middle (Python)
Bitbanker.ru
•
Москва
от 300 000 до 350 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама