@ReBlock

Как подсчитать кол-во страниц множества PDF- файлов?

Собственно вопрос в том, как в окружении windows подсчитать суммарное кол-во страниц множества pdf-файлов в директории? Желательно без установки какого-либо софта, либо оно должно быть portable…
  • Вопрос задан
  • 7982 просмотра
Пригласить эксперта
Ответы на вопрос 3
m08pvv
@m08pvv
Либо использовать соответствующую сборку для работы с pdf, либо использовать более хитрый метод.
Ответ написан
bobermaniac
@bobermaniac
Вы можете взять любую опенсорсную библиотеку работы с PDF и написать приложение самостоятельно. Это несложно.
Ответ написан
Комментировать
Вот решение на питоне собранное с помощью py2exe в exe файл и не требующее .net (использует pyPdf если запускать сам скрипт). Первым параметром передается путь к папке, а если его нет, то считаются что это текущая директория:

# -*- coding: utf-8 -*-

import os
import sys
from pyPdf import PdfFileReader


PDF_EXTENSION = '.pdf'
DEFAULT_PATH = '.'

def pages_count(path):
    return PdfFileReader(file(path, "rb")).getNumPages()

if __name__=="__main__":
    path = sys.argv[1] if len(sys.argv) > 1 else DEFAULT_PATH
    total_pages_count = 0
    for root, dirs, files in os.walk(path):
        for file_name in files:
            if file_name[-len(PDF_EXTENSION):] == PDF_EXTENSION:
                file_path = os.path.join(root, file_name)
                file_pages_count = pages_count(file_path)
                print file_path, file_pages_count
                total_pages_count += file_pages_count
    print 'total:', total_pages_count

Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы