Вот код, которым я читаю файл:
pip install python-docx
import docx
doc = docx.Document("C:/Users/Сhange_contract_14.docx")
text = []
for paragraph in doc.paragraphs:
text.append(paragraph.text)
print('\n'.join(text))
Далее нужно работать с документом с применением регулярных выражений.
У документа пропадает нумерация абзацев, которая была сделана в word с использованием сервиса "Нумерация", который автоматически каждый абзац в тексте нумерует по правилам, выбранным пользователем, с разной глубиной:
1.
1.1.
1.1.1. и т.д.
Так вот, с помощью кода, написанного выше, в документе остается только нумерация проставленная в ручную, а автоматическая исчезает. Как правильно нужно прочитать документ, что бы избежать проблемы. Может есть какие то параметры, которые устанавливаются при чтении файла или может есть другая библиотека, которая способна это делать?