Объясняю подробнее: на сервер заливают docx файл. Я читаю его, нахожу нужный кусок, копирую текст с xml кодом. Теперь, как имея xml код сформировать новый документ docx, чтоб форматирование текста было, как в старом?
Другими словами, мне надо автоматом делать ctrl+c, ctrl+v из загруженного файла в новый.
Я же правильно понимаю, что в xml коде все описано: позиция текста, размеры, типы шрифтов, абзацы и прочее.
docx - это zip c внутренней структурой, состоящей из xml файлов и картинок, как linked объекты.
Ваша задача (если делать все руками):
unzip .docx > поиск требуемого xml файла > парсинг и выцепка фрагмента внутри xml > xslt преобразование в новый xml > zip .xml > получается docx.
Вам надо знать:
- спецификацию docx (на структуру каталога zip файла).
- спецификацию внутреннего xml файла.
- XSLT (в т.ч. работа с namespace).