Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
159 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Помогут разобраться в теме
Все курсы
Нетология
Fullstack-разработчик на Python + нейросети
20 месяцев
Далее
Skillfactory
Профессия Python-разработчик
9 месяцев
Далее
SF Education
Бэкенд-разработчик на Python
3 месяца
Далее
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
2 подписчика
31 окт.
199 просмотров
0
ответов
Python
Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
1 подписчик
31 окт.
102 просмотра
0
ответов
Python
+1 ещё
Простой
Почему callback_query_handler в telebot не работает?
1 подписчик
31 окт.
110 просмотров
3
ответа
Python
+1 ещё
Простой
Как исправить проблему с Docling?
1 подписчик
28 окт.
124 просмотра
0
ответов
Python
Простой
Что делать если turtle в python не отвечает?
1 подписчик
22 окт.
236 просмотров
2
ответа
Python
Простой
Не могу разобраться почему не работает код python?
1 подписчик
22 окт.
393 просмотра
1
ответ
Python
Простой
Какие есть удобные API для генерации картинок через AI?
3 подписчика
20 окт.
260 просмотров
1
ответ
Python
Простой
Дублирование логов в python logging?
2 подписчика
19 окт.
306 просмотров
1
ответ
Python
+1 ещё
Средний
Как сделать чтоб аккаунт писал при подписке на канал?
1 подписчик
16 окт.
185 просмотров
0
ответов
Python
+1 ещё
Простой
Какие есть простые легковесные LLM для локального использования?
2 подписчика
14 окт.
685 просмотров
3
ответа
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Backend developer (Python, FastAPI)
BCraft
До 4 000 $
Python Developer
Strikt
от 100 000 до 150 000 ₽
Backend Python Developer Middle/Senior
AppRoute
До 3 000 $
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама