PDF бывают разные. Бывают текстовые, из которых можно копипастом извлекать фрагменты текста. А бывают - наборы сканированных страниц (в пиратских копиях книг такое сплошь и рядом). Если для первых еще можно отыскать утилиты, то для вторых единственный способ - это разборка на битмапы, прогонка через OCR и сохранение результата в формат Word