pandoc в помощь. Оказался лучшим вариантом конвертации docx -> html (в моем случае, далее идет конвертация в pdf с помощью wkhtmltopdf). К html можно прикрутить свои стили css.
Таблицы pandoc сохраняет нормально только простые. С ячейками на несколько строк или столбцов не работает (пришлось костылить, чтобы прописывался ячейке нужный colspan). Ссылки вроде работают. Картинки не проверял — в шаблонах документов они не нужны.
pandoc требователен к исходному docx. Вложенные списки не работают. Лишняя строка между элементами нумерованного списка приводит к разрыву нумерации. Многоуровневые нумерованные списки поддерживаются, достаточно правильно "сверстать" их в ворде и соорудить правильный CSS.
Однако, повторюсь, это лучший вариант конвертации docx -> html
PS. На гитхабе есть обертки на PHP как для pandoc, так и для wkhtmltopdf