Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
157 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+2 ещё
Средний
Из-за ошибки текстовый файлик занимает всё свободное место на носителе, как это исправить?
1 подписчик
8 часов назад
149 просмотров
2
ответа
Python
+1 ещё
Простой
Критерии поиска грамотного специалиста для кроссплатформенного проекта?
1 подписчик
18 часов назад
168 просмотров
5
ответов
Python
+1 ещё
Простой
Как искать primary в реплике Монги?
1 подписчик
28 июн.
87 просмотров
0
ответов
Python
+1 ещё
Простой
Есть ли способ, получать прямые ссылки на видео VK для скачивания на Python?
1 подписчик
25 июн.
239 просмотров
1
ответ
Python
+3 ещё
Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
нет подписчиков
23 июн.
262 просмотра
2
ответа
Python
Простой
Как исправить игнорирование кода при импорте в python?
1 подписчик
23 июн.
146 просмотров
2
ответа
Python
+2 ещё
Простой
Как проверить что файл подписан конкретной (открепленной) ЭЦП?
1 подписчик
23 июн.
157 просмотров
0
ответов
Python
Простой
Почему зависает скрипт запущенный из Visual Studio Code?
2 подписчика
23 июн.
494 просмотра
1
ответ
Python
Простой
Почему не работает pydantic-settings SettingsConfigDict(yaml_file)?
1 подписчик
21 июн.
73 просмотра
2
ответа
Python
Простой
В чем ошибка при вызове import requests?
1 подписчик
21 июн.
125 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python разработчик
ITK academy
•
Саратов
от 75 000 ₽
backend developer (Python) intern
BCraft
от 500 до 1 500 $
Ведущий Python разработчик
Сбер
•
Москва
от 200 000 до 250 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама