Задать вопрос

Как организовать поиск по содержанию файлов?

Всем привет!

Есть около 1000 файлов, формата pdf, doc, odt. Подскажите, пожалуйста, инструменты, либы и т.д., с помощью которых можно через веб (браузер) осуществлять поиск по содержанию файлов. Механика поиска: ввожу текст для поиска, на выходе получаю ссылку на документ, часть текста, где встречается строка запроса. В общем как гугл, но только среди файлов )
  • Вопрос задан
  • 258 просмотров
Подписаться 1 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 2
AlexXYZ
@AlexXYZ
O Keep Clear O
Хороший вопрос. Раньше было проще, пока корпорации были не такими жадными. Был Google Desktop Search (разработка прекращена) и Yandex Desktop Search (тоже прекращена). Это для локальных машин.

Для файловых серверов можете поискать в инете Yandex Server Enterprize. Отличная штука! Работает как yandex.server. Документация поверхностная, но освоить можно. (разрабока тоже прекращена году в 2010, но ваши стандартные офисные форматы должен обработать без вопросов). Мне он больше всего нравился. Один раз настраиваете и... забываете о нём. Проблем не доставлял, работал как часы.

Есть вариант с elasticsearch - весьма активный проект, может индексировать файлы, только их надо в него загрузить. Требуется высокий порог вхождения для развёртывания и использования api (если раньше вы с ним дело не имели, то будет очень сложно и настроить и gui прикрутить, но если освоите, то будет вам счастье, обещаю).

Это из тех, что я пробовал. Говорят, что можно sphinx ещё использовать, но лично я его даже не пробовал ставить.

Немного обсуждения на тостере: Аналог для Яндекс.Сервер (продукт для корпоративного поиска)

Ну и стандартный способ гуглирования: программы для поиска файлов на компьютере

P.S.
Совсем нереальный вариант (просто для справки) - Google appliance - может всё, но позволить себе может даже не каждая компания. Лет 8 назад интересовался ценой - до 400.000 тыс р в топовой комплектации. Сейчас, уверен, больше.
Ответ написан
dimonchik2013
@dimonchik2013
non progredi est regredi
docfetcher.sourceforge.net/en/index.html

либы смотри в исходниках
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы