Protos
@Protos
Спрашивай - отвечу

Чем очистить метаданные в документах?

Чем очистить метаданные в документах?
How to remove metadata from office documents? (docx, doc)
На сервере куча гигабайт документов MS Office, чем очистить метаданные?
Нашел MetadaCleaner 3 (Document metada cleaner), но она не умеет работать docX, xlsX и т.д., а так же с большим количеством файлов - вылетает. Старая версия вроде не вылетает, но тоже не понятные ошибки.
РЕШЕНИЕ для doc и docx:
#Скрипт ищет все подпапки в указанной папке с глубиной 1, и для каждой папки отдельно
#ищет в цикле все файлы, это сделано для того, что если у вас в папке будут десятки или
#сотни тысяч файлов, powershell просто вылетит, так и не найдя файлы. А при таком подходе
#не будет переполнения размера массива и вылетов.
#Скрипт не обрабатывает ошибки открытия файлов доступных только на чтение, запароленных,
#т.е. всех тех при открытии которых выскакивает какое-либо окошко
$StartPath = "c:\"
$pathAll = Get-ChildItem -Name -Path $StartPath -Exclude *.*
$Errors = 0
$iterator = 1
$countAll = $StartPath.length
foreach($path in $pathAll) 
{    
    $path=$StartPath+$path    
    Write-Host "Составляю список файлов *.doc, *.docx в папке $path"
    Add-Type -AssemblyName Microsoft.Office.Interop.Word
    $WdRemoveDocType = "Microsoft.Office.Interop.Word.WdRemoveDocInfoType" -as [type]
    $wordFiles       = Get-ChildItem -Path $path -include *.doc, *.docx -recurse
    $objword         = New-Object -ComObject word.application
    $i = 1
    $wordFileslength = $wordFiles.length
    $count = $wordFiles.length
    "Найдено Word файлов: $wordFileslength"
    $objword.visible = $false
    foreach($obj in $wordFiles) 
    { 
        $progressBar = [int]($i*100/$count)
        try{
            $documents = $objword.Documents.Open($obj.fullname)
            “$i / $count ($progressBar%) Удаляю метаданные из $obj”
            $i = $i + 1
            $documents.RemoveDocumentInformation($WdRemoveDocType::wdRDIAll)
            $documents.Save()
            $objword.documents.close()            
        }
        catch{
            Write-Host "Ошибка очистки метаданных в $obj"
            $Errors = $Errors + 1
        }
    } 
    $objword.Quit()
    $progressBarAll = [int]($iterator*100/$countAll)
    Write-Host "Удаление метаданных в $path завершено в папках: $iterator / $countAll ($progressBarAll%)"
    $iterator = $iterator +1
}
Write-Host "Удаление метаданных завершено! Ошибок: $Errors"
  • Вопрос задан
  • 4536 просмотров
Решения вопроса 1
@yellowmew
Cloud infrastructure, monitoring engineer. SRE
https://blogs.technet.microsoft.com/heyscriptinggu...
Это пример для Excel
в комментариях к статье есть ссылка на работающий пример с word.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы