Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
156 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
Как проверять кодом наличие конкретно той или иной библиотеки?
2 подписчика
13 часов назад
186 просмотров
2
ответа
Python
+1 ещё
Средний
Как избавится от эффекта бандинга/постеризации градиента?
1 подписчик
вчера
109 просмотров
2
ответа
Python
+1 ещё
Простой
В чем ошибка при парсинге на python?
1 подписчик
11 мар.
173 просмотра
2
ответа
Python
+2 ещё
Средний
Почему не все упоминания юзеров Telegram кликабельны?
1 подписчик
10 мар.
482 просмотра
2
ответа
Python
+2 ещё
Простой
Как анализировать востребованность технологии?
1 подписчик
10 мар.
116 просмотров
1
ответ
Python
Простой
Есть ли в питоне файл проекта?
1 подписчик
10 мар.
198 просмотров
2
ответа
Python
+1 ещё
Средний
Как выполнить Olx парсинг номера?
3 подписчика
08 мар.
769 просмотров
2
ответа
Python
+1 ещё
Средний
Как интегрировать python код в tauri?
1 подписчик
08 мар.
137 просмотров
2
ответа
Python
+1 ещё
Средний
Playwright Python, работа с профилями браузеров?
1 подписчик
08 мар.
78 просмотров
1
ответ
Python
+1 ещё
Простой
Как правильно конвертировать .pdf -> .png -> .pdf?
1 подписчик
07 мар.
225 просмотров
2
ответа
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Старший Python разработчик/Senior Python developer
Платежное решение
•
Москва
До 300 000 ₽
Python developer
Greenway Global
•
Новосибирск
от 150 000 ₽
Руководитель группы разработки Python/Tech Lead Python
Платежное решение
•
Москва
До 500 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама