Спасибо за ответ.
Согласен - волшебных палочек нет. Вопрос в том что есть?
Есть нейросетки созданные для чего-то подобного и их надо поставить и обучать ИЛИ такую сетку надо писать с нуля?
Скажем, если есть нейронка - то сгенерировать для нее 1 000 000 обучающих файлов с текстом, как мне кажется будет проще, чем разобраться в том, что навернули MS в формате OOXML. Как я понял, что LibreOffice, что OpenOffice, что Google Docs формат docx понимают и открывают, но с оговорками. А уж над ними люди трудятся поумнее меня 8).
Парсинг это первое, что пришло в голову, но его я оставил на крайний случай. Вдруг уже все давно изобретено и мой велосипед избыточен.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.