Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
hikionori
@hikionori
Python
Как конвертировать pdf в html разметку?
Мне нужно конвертировать pdf с изображениями, таблицами, уникальными шрифтами и т.д. в html разметку
я уже перерыл кучу информации о том как это можно сделать но так ничего и не нашёл.
Если кто знает как это сделать подскажите пожалуйста.
Вопрос задан
более трёх лет назад
157 просмотров
2
комментария
Подписаться
3
Простой
2
комментария
Facebook
Вконтакте
Twitter
shurshur
@shurshur
В общем случае это нельзя сделать. PDF может быть полностью растровым. Даже если там есть текстовый слой, он может быть устроен ужасно.
Самый простой способ - прогнать через FineReader, а потом пересохранить в html. Но результат будет так себе.
Написано
более трёх лет назад
Viktor T2
@Viktor_T2
https://github.com/coolwanglu/pdf2htmlEX
Как конвертировать pdf в HTML средствами python?
Написано
более трёх лет назад
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
borovinskiy
@borovinskiy
Используйте утилиту pdftohtml из состава poppler или pdf2htmlEX
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+1 ещё
Простой
Какие есть простые легковесные LLM для локального использования?
2 подписчика
вчера
409 просмотров
2
ответа
Python
+1 ещё
Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
2 подписчика
вчера
75 просмотров
0
ответов
Python
+1 ещё
Простой
FastAPI Prometheus_fastapi_instrumentator где мне следует разместить?
1 подписчик
09 окт.
130 просмотров
1
ответ
Python
+1 ещё
Простой
Пытаюсь пропустить число 10 двумя способами.(правильный второй код) Почему эти два кода дают разный результат?
1 подписчик
09 окт.
478 просмотров
2
ответа
Python
+2 ещё
Простой
В каком слое DTO объект преобразовывать в словарь перед сохранением в БД?
1 подписчик
08 окт.
134 просмотра
2
ответа
Python
+1 ещё
Простой
Visual Studio Code Имя «pipenv» не распознано как имя командлета?
1 подписчик
08 окт.
111 просмотров
1
ответ
Python
+2 ещё
Простой
Как реализовать асинхронность + многопоточность одновременно?
5 подписчиков
08 окт.
502 просмотра
1
ответ
Python
+1 ещё
Средний
Как парсить фотографии gspread?
1 подписчик
06 окт.
177 просмотров
1
ответ
Python
+1 ещё
Простой
Python kafka не видит headers?
1 подписчик
29 сент.
142 просмотра
1
ответ
Python
+2 ещё
Средний
При подключении к бд MySQL через SSH из Python появляется ошибка, а через DBeaver всё чётко. В чём дело?
2 подписчика
29 сент.
277 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python Developer
Strikt
от 100 000 до 150 000 ₽
Python разработчик
Космос Про Медиа
•
Москва
от 180 000 до 200 000 ₽
Junior Python Developer
ITK academy
•
Нижний Новгород
от 75 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама