.docx является ZIP-контейнером, в нём есть document.xml, который без проблем разбирается. Наверняка где-то должны быть XSLT для его причёсывания в автоматическом режиме.
Для .doc есть unoconv, с помощью libreoffice в пакетном режиме умеет преобразовать форматы. Мне кажется, логичнее им преобразовать, чем искать специфичную библиотеку для Python.
Насколько я знаю, unoconv/python-uno умеет не только PDF выдавать. :)