libreoffice --headless --convert-to txt file.docx
cat file.txt | uniq -u > file1.txt
libreoffice --headless --convert-to docx file1.txt
Также, я уже обращался с подобным вопросом на ru.stackoverflow.com и мне написали, что из XML-файла можно вытащить все, что угодно.