@jazzus

Как конвертировать doc в HTML?

Использую библиотеку phpWord
Файл с расширением DocX без проблем конвертирую в html
$file = storage_path('file.docx');
$phpWord = \PhpOffice\PhpWord\IOFactory::createReader('Word2007')->load($file);
$objWriter = \PhpOffice\PhpWord\IOFactory::createWriter($phpWord, 'HTML');
$objWriter->save(storage_path('helloWorld.html'));

При конвертации .doc выдает ошибку
ZipArchive::getFromName(): Invalid or uninitialized Zip object

Как исправить или какой есть другой путь для конвертации doc в html?
Php 7.3
Laravel 5.8
Zip enabled
Zip version 1.15.4
Libzip version 1.4.0

АПДЕЙТ
Получилось уйти от ошибки с указанием ридера MsDoc
$phpWord = \PhpOffice\PhpWord\IOFactory::createReader('MsDoc')->load($file);

но файл с русским текстом конвертируется с проблемной кодировкой:
5d35115077d73373950519.png
английский текст конвертируется без ошибок
  • Вопрос задан
  • 1378 просмотров
Пригласить эксперта
Ответы на вопрос 1
Библиотека не работает с doc файлами, вам нужно что-нибудь другое найти. Это бинарный формат данных, лучше заранее подготовить файлы в docx формате, если нет возможности, тогда можете воспользоваться кодом из статьи на Хабре https://m.habr.com/ru/post/72745/
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы