если пытаюсь сразу прочитать docx файл
f = open("11.docx", "r", encoding='utf-8')
print(f.read())
то при чтении выпадает такая ошибка:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 14: invalid start byte
если пытаюсь сначала переконвертить в txt а потом прочитать,
import docx2txt
import codecs
my_text = docx2txt.process("11.docx")
with codecs.open(my_text, encoding='utf-8') as fin:
line = next(fin)
print(type(line))
то такая:
OSError: [Errno 63] File name too long: 'АБВГД 1234567.1234567\n\nБла\n\nблаблабла\n\n\n\n\n\nКакой-то текст тут\n\n...