Символы вы еще, может быть, и сможете подсчитать более-менее близко к правильному значению.
А вот слова в общем случае - пальцем к носу, плюс-минус лапоть.
Если в PDF используются разные шрифты (в том числе просто выделение полужирным или курсивом), колонки, таблицы, переносы, аккуратный кернинг - кашу вы получите, а не слова. Просто исходя из самого формата.
1ое - pdf очень часто - картинки, с картинок текст я не знаю как взять
2ое - выше сказанный ответ, тоесть распаковываем pdf и читаем текст (если только это не картинки)
3е - мне кажеться средствами php реализовывать такое - самый медленный вариант