@Safronov_Alexei

Как конвертировать pdf в HTML средствами python?

Привет Хабр!

Возможно вопрос и глупый, но обыскал весь интернет и не нашел годную либу для конвертированию!
Кто может помочь?
  • Вопрос задан
  • 582 просмотра
Решения вопроса 1
Viktor_T2
@Viktor_T2
python developer
https://github.com/coolwanglu/pdf2htmlEX
результат получается прям скажем странный
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
leahch
@leahch
3Д специалист. Долго, Дорого, Дерьмово.
И так, скажут прямо. Конвертировать pdf в html не получится ни на каком языке программирования! Максимум, что можно извлечь из pdf , это текст, который будет лишен какой бы то ни было разметки. Ибо сам формат pdf создан для препринта и в нем отсутствует информация о заголовках, параграфах, стилях. Более того, в pdf есть текст и атрибуты, где и как этот текст разместить, и больше ничего для текста.
Ответ написан
LouisPython
@LouisPython
Здравствуй, это не то что тебе нужно?

Ссылка: *тык*
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы