С помощью какой библиотеки Python распарсить DOCX файл?
Необходимо вытащить из docx файла главы книги и запостить в telegra.ph. Текст нужно вытащить вместе с форматированием(курсив, жирный). Для телеграфа знаю удобную библиотеку. А какие есть библиотеки для docx файлов?
переименуйте docx в zip, распакуйте архив. внутри будет куча xml файликов. выберите тот который вам надо и обычной либой lxml вытащите все что вам надо
docx это ответ от microsoft для libreoffice за то что они придумали хранить свои файлы в xml формате
ну или же используйте либу, которую посоветовал Сергей Горностаев, она вполне хорошо бегает