Как извлечь слова из PDF файла по маске и сложить их в список?
Добрый день.
Есть файл PDF в несколько сотен или тысяч страниц. Почти на каждой странице этого файла есть конкретное слово "город", а после слова "город" находится собственно само название города. Как извлечь из всего этого документа все названия городов, которые стоят после слова "город" (то есть без самого слова "город") и выдать их одним списком один под другим?
Есть ли для этого программы специальные, или пишутся скрипты на ЯП? Буду рад любой полезной информации (могу не ограничиваться только радостью:) ).
Спасибо.