Нейросетки выполняют те действия, на которые их натренировали.
Те действия, которые нужны конкретным пользователям, никакие волшебные палочки не исполнят.
С вашей проблемой вы, имхо, начали не с того конца. Вам нужно работать с информацией? Прекрасно, для начала ее нужно вытащить из помойки офисных форматов, потом все станет проще и прямее.
Правила разбора вы уже более-менее прикинули. Осталось поднять локальный сервер и написать скрипты, которые распарсят DOCX-файлы и вынут из них осмысленные блоки текста, списков, таблиц и картинок.
С возможностью потом составить из этого хоть DOCX, хоть PDF. И использовать в дальнейшей работе, указывая конкретную информацию для конкретных блоков, оставляя компьютеру оформление, которое достаточно прописать один раз.