(не спрашивайте зачем такое извращение, надо)
Есть задача запихать все файлы с кодом в вордовский файл в виде текста, по типу:
название файла;
содержимое файла;
Внутрь Word файла пойдёт все содержимое сайта в чем есть код и стили в частности: js, php,html, css,tpl, sh, scss;
Все бы хорошо но получаеться вгрузить с фильтрами только php, tpl , scss, sh файлы, дальше ворд просто выкидывает ошибку парсинга, как правильно экранировать случайное содержимое?
пока фильтрую так: htmlspecialchars(htmlentities($code['text']))
для очистки персональных данных стоит еще фильтр, в качестве либы для работы с вордовским форматом использую PhpWord
Поскольку я в душе не знаю что там в содержимом ломает парсер (его много), но в идеале хотелось бы оставить полное содержимое файлов при внесении их в ворд без изменений (в формате чтения).
v3shin, мне надо сделать читабельный файл со всей написанной програмной частью, без графики, только стили и скрипты.
Чтоб он открывался как обычный вордовский файл.
По варианту с архивом:
Ilya12345, а doc и не должен открываться: это все еще архив, просто название сменил.
А по проблеме: выглядит так, будто phpword'у не нравится html и css. Научитесь импортировать один файл, затем - все файлы проблемного формата, затем переходите к другому формату. Если все ок по отдельным форматам, но не собирает все вместе, вероятно, проблема с количеством текста.
В общем ларчик просто открывался, я грешил на содержимое файлов и при этом забывал экранировать названия файлов, собстна из за которых и вылетал парсер ворда.
v3shin, при заливке файлов в документ проблем не заметил, главное экранировать все что идет внутрь и проблем не будет в плане текста.
Если возникнут проблемы то колупать проблемный файл на предмет того на что грешит ворд и выпиливать это.
В общем ларчик просто открывался, я грешил на содержимое файлов и при этом забывал экранировать названия файлов, собстна из за которых и вылетал парсер ворда.