Ответы пользователя по тегу Word
  • Вирусы с Word файле. Возможно ли?

    Adamos
    @Adamos
    Вредоносный код может быть в любом файле, который обрабатывается какими-либо программами целевого компьютера. И в офисных форматах, и в PDF, и даже в PNG - вот, например, свежая новость: https://www.opennet.ru/opennews/art.shtml?num=58610
    Не уверен насчет уязвимостей в картинках, а более распространенные зловреды неплохо выявляет сайт virustotal.com , например.
    Ответ написан
  • В чем секрет кодировки PDF документа?

    Adamos
    @Adamos
    PDF - это сжатый PostScript. В PostScript нет кодировок в принципе, только привязка к глифам шрифта. Поэтому если шрифт кривой - глифы названы по европейским символам, например, а нарисована в них кириллица - получаем кракозябры в любых программах, которые попытаются вытянуть этот текст. При желании можно перемешать весь шрифт и переставить глифы произвольным образом, искалечив так же и текст.

    Но что-то защищать такими методами - имхо, дурь.
    Ответ написан
    Комментировать
  • Как дополнять, а не перезаписывать .docx файл?

    Adamos
    @Adamos
    Стоит просто хранить полученную информацию, а не docx.
    Из нормальной информации нет проблем в любой момент сформировать docx - исключительно для вывода.
    Ответ написан
  • Автоматизация перевода из PDF в WORD и обратно?

    Adamos
    @Adamos
    DOCX -> PDF может делать, например, headless libreoffice. Да и поделки на Пыхе можно присобачить, решив проблемы с кодировками.
    PDF -> DOCX в общем случае мало чем отличается от JPEG -> DOCX. FineReader, по факту, не конвертирует одно в другое (это невозможно), а распознает документ, пытаясь собрать куски текста и картинки во что-то непротиворечивое. Открытых аналогов, насколько мне известно, просто нет.
    Ответ написан
    Комментировать
  • Можете помочь в написании программы для оптимизации работы с большим документом Word?

    Adamos
    @Adamos
    libreoffice --headless --convert-to txt file.docx 
    cat file.txt | uniq -u > file1.txt
    libreoffice --headless --convert-to docx file1.txt
    Ответ написан
    8 комментариев
  • Как реализовать присвоение номеров исходящих писем?

    Adamos
    @Adamos
    У вас вся организация больше ничего не делает, кроме отправки исходящих?
    Решается задача элементарно, мини-сайтиком на РНР + mpdf, но неужели это единственная задача, требующая автоматизации?
    Ответ написан
    Комментировать
  • Работать с файлом word из программы?

    Adamos
    @Adamos
    По-простому - формируешь html, обзываешь его .docx, Ворд откроет и не поморщится.
    Посложнее - формируешь rtf, дальше по той же схеме.
    Всерьез - копаться в COM/OLE и получить монстра, который просто так на произвольной машине еще может и не запуститься за отсутствием вордовских библиотек.
    Ну, и совсем для героев - посмотреть исходники альтернативных офисов...

    P.S. Да, пожалуй, вторая часть ответа устарела, т.к. относилась к .DOC.
    Более-менее открытый DOCX позволил-таки наклепать сторонних библиотек для его создания.
    Ответ написан
    Комментировать
  • Как в PHP сделать Word-документ?

    Adamos
    @Adamos
    HTML-портянка со вставками %ПОД_ЗАМЕНУ%. Любой офис ее откроет, как родную.
    А прогиб именно под M$-офисный формат в данном случае - первый шаг на Темную сторону.
    Ответ написан
    Комментировать
  • Как можно из DOCX вытащить и отобразить на HTML-странице формулу, созданную с помощьюMicrosoft Equation 3.0?

    Adamos
    @Adamos
    Также, я уже обращался с подобным вопросом на ru.stackoverflow.com и мне написали, что из XML-файла можно вытащить все, что угодно.

    Это правда, но есть один нюанс: как из этого "чего угодно" отрисовать формулу - знает только майкрософтовский пакет. А вам данные из этого XML не дадут ровным образом ничего. Открытость по-майкрософтовски.
    Все, что вы можете сделать - это открыть документ в Офисе и попробовать экспортировать его в какой-нибудь реально распространенный графический формат. Можно попробовать начать с PDF...
    Ответ написан
    Комментировать
  • Свой сервис PDF-конвертер, есть решения?

    Adamos
    @Adamos
    В общем случае формат PDF для обратной конвертации непригоден.
    Текст из него еще можно попытаться вытащить - есть, например, открытый pdftotext - но это будет только текст, и то не факт, что не порванный в клочья.

    Чтобы собрать этот хаос обратно в том виде, каким он был до превращения в PDF, придется применять чисто эмпирические хаки. ABBYY, ориентируясь на клиентов, может себе позволить копаться в этом мусоре. Искать же свободные и/или бесплатные аналоги бесполезно.
    Ответ написан
    1 комментарий