Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
157 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+1 ещё
Простой
Почему endpoint отрабатывается дважды?
1 подписчик
час назад
56 просмотров
0
ответов
Python
Простой
Какой способ эффективнее при объединении двух словарей?
нет подписчиков
23 часа назад
132 просмотра
1
ответ
Python
Простой
Автоматизация входа на устройство через Jumphost с целью передачи команд?
1 подписчик
вчера
79 просмотров
0
ответов
Python
+1 ещё
Простой
В ffmpeg неправильно считывается имя пользователя, он видит в нем цифру и начинает ее раскладывать, как пофиксить?
1 подписчик
вчера
104 просмотра
1
ответ
Python
+2 ещё
Средний
Бот долго отвечает сообщением, где фото+текст. Как исправить?
1 подписчик
вчера
147 просмотров
1
ответ
Python
Простой
Как добавить в дату, записанную в строке, нули перед месяцем и днём?
1 подписчик
05 мая
160 просмотров
4
ответа
Python
Простой
Как завершить работу консольного приложения?
1 подписчик
04 мая
175 просмотров
1
ответ
Python
+1 ещё
Средний
В Coqui TTS есть поддержка русского языка для озвучки текста?
1 подписчик
04 мая
77 просмотров
1
ответ
Python
Простой
Как запустить VapourSynth-Editor?
1 подписчик
03 мая
77 просмотров
0
ответов
Python
Простой
Почему ошибка в терминале?
1 подписчик
03 мая
149 просмотров
0
ответов
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python-разработчик
BCraft
от 2 000 до 3 500 $
Python разработчик Senior
Туроператор «Русь»
•
Москва
от 200 000 до 300 000 ₽
Python разработчик
DevTeam.Space
•
Москва
от 1 500 до 3 000 $
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама