@tomskiydenis
Студент

Скрипт конвертера doc(pdf) в html?

Доброго времени суток! Нужен скрипт конвертера файла doc в html, с выбором файла было бы отлично. Чтоб сохранял все ссылки, таблицы и картинки. Жду ващей помощи
  • Вопрос задан
  • 1042 просмотра
Пригласить эксперта
Ответы на вопрос 2
@krypt3r
pandoc в помощь. Оказался лучшим вариантом конвертации docx -> html (в моем случае, далее идет конвертация в pdf с помощью wkhtmltopdf). К html можно прикрутить свои стили css.
Таблицы pandoc сохраняет нормально только простые. С ячейками на несколько строк или столбцов не работает (пришлось костылить, чтобы прописывался ячейке нужный colspan). Ссылки вроде работают. Картинки не проверял — в шаблонах документов они не нужны.
pandoc требователен к исходному docx. Вложенные списки не работают. Лишняя строка между элементами нумерованного списка приводит к разрыву нумерации. Многоуровневые нумерованные списки поддерживаются, достаточно правильно "сверстать" их в ворде и соорудить правильный CSS.
Однако, повторюсь, это лучший вариант конвертации docx -> html
PS. На гитхабе есть обертки на PHP как для pandoc, так и для wkhtmltopdf
Ответ написан
@tomskiydenis Автор вопроса
Студент
скрипт на должен быть на js или php
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы