@LuchS-lynx
инженер-ПТО

Какие программы есть для индексации и контекстного поиска в офисных файлах и файлах PDF?

Множество файлов нормативной литературы, которые постоянно пополняются. Как организовать контекстный поиск в специально выделенной под это дело папке с подпапками, что бы выводились места в документах где поисковый запрос упоминается, желательно с учетом словоформ (игнорированием/учетом родов/падежей). Форматы файлов - doc/rtf/docx/odt/pdf и т.п. если pdf, то, как правило, уже с распознанным текстом.
  • Вопрос задан
  • 961 просмотр
Пригласить эксперта
Ответы на вопрос 3
dimonchik2013
@dimonchik2013
non progredi est regredi
https://docfetcher.sourceforge.io/ru/index.html из фри,

платные постоянно меняются, что-то когда-то мог Copernic
сейчас он Copernic Desktop Search или чертишо, когда-то был поисковиком по всем поисковикам, в общем, что-то могут, но платный, хоть есть продажа на рутракере помоему
Ответ написан
uvelichitel
@uvelichitel
habrahabr.ru/users/uvelichitel
Попробовал несколько полнотекстовых поисковиков, остановился на Recoll https://www.lesbonscomptes.com/recoll/pages/index-...
Интерфейс Qt, индекс Xapian.
Мне удобно, рекомендую.
Ответ написан
Комментировать
@JustMoose
Программист. Радиолюбитель. Прокрастинатор ;)
Раньше была такая тулза - Персональный поиск Яндекса.
Она индексировала основные текстовые документы на диске и позволяла по ним искать (с учётом морфологии и вот это вот всё).
Но чем её заменить в 21 веке я не знаю.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы