Какие программы есть для индексации и контекстного поиска в офисных файлах и файлах PDF?
Множество файлов нормативной литературы, которые постоянно пополняются. Как организовать контекстный поиск в специально выделенной под это дело папке с подпапками, что бы выводились места в документах где поисковый запрос упоминается, желательно с учетом словоформ (игнорированием/учетом родов/падежей). Форматы файлов - doc/rtf/docx/odt/pdf и т.п. если pdf, то, как правило, уже с распознанным текстом.
Иерокопус Таманский, в иксах не живу постоянно, но и обжился ))
штатные средства поиска устраивают более чем.. допустим по тому что нет больших архивов?
тот же фар присутствует в обоих системах и способен на удовлетворительно гибкий поиск ))) мне хватает )))
Иерокопус Таманский, был несколько лет назад оппонент... сразу предложил название клуба.. эмм.. его приглашение не принял ;)))
.. если про линукс - см профиль ))).. скромно, но присутствую в теге )))
платные постоянно меняются, что-то когда-то мог Copernic
сейчас он Copernic Desktop Search или чертишо, когда-то был поисковиком по всем поисковикам, в общем, что-то могут, но платный, хоть есть продажа на рутракере помоему
Сам пользуюсь DocFetcher, правда, не часто. Написано на Java, так что Windows, Linux поддерживаются.
Выбираются корневые папки, содержащие документы и прочее, которые индексирует их и заносит в полнотекстовый индекс Lucene. Поддерживает различные операторы при поиске.
Раньше была такая тулза - Персональный поиск Яндекса.
Она индексировала основные текстовые документы на диске и позволяла по ним искать (с учётом морфологии и вот это вот всё).
Но чем её заменить в 21 веке я не знаю.