Задать вопрос

Как сделать поиск в документах на сайте?

Есть система куда пользователи загружают документы в формате .pdf, .doc, .xls
Как организовать поиск слов по этим документам?
  • Вопрос задан
  • 635 просмотров
Подписаться 3 Оценить Комментировать
Решения вопроса 1
Taraflex
@Taraflex
Ищу работу. Контакты в профиле.
Перегоняем документы в текст
PDF https://github.com/smalot/pdfparser (и еще куча решений google)
DOC https://github.com/PHPOffice/PHPWord
XLS https://github.com/PHPOffice/PHPExcel
Дальше ищем по ним через sphinxsearch.com
Неплохой цикл статей по настройке chakrygin.ru/search/label/Sphinx (немного устарел, но думаю разберетесь)
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 3
reaferon
@reaferon
Если контент (файлы) не закрыты за авторизацией, то быстрым решением может быть https://xml.yandex.ru , по документам ищет прекрасно, время на внедрение - минимально. Подводные камни - суточные лимиты на кол-во запросов.
Ответ написан
Комментировать
lazalu68
@lazalu68
Salmon
g o o g l e xD
Ответ написан
Комментировать
@jaxel
Elasticsearch с плагинами вроде как умеет такое делать.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы