Как сделать поиск в документах на сайте?

Есть система куда пользователи загружают документы в формате .pdf, .doc, .xls
Как организовать поиск слов по этим документам?
  • Вопрос задан
  • 617 просмотров
Решения вопроса 1
Taraflex
@Taraflex
Ищу работу. Контакты в профиле.
Перегоняем документы в текст
PDF https://github.com/smalot/pdfparser (и еще куча решений google)
DOC https://github.com/PHPOffice/PHPWord
XLS https://github.com/PHPOffice/PHPExcel
Дальше ищем по ним через sphinxsearch.com
Неплохой цикл статей по настройке chakrygin.ru/search/label/Sphinx (немного устарел, но думаю разберетесь)
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 3
reaferon
@reaferon
Если контент (файлы) не закрыты за авторизацией, то быстрым решением может быть https://xml.yandex.ru , по документам ищет прекрасно, время на внедрение - минимально. Подводные камни - суточные лимиты на кол-во запросов.
Ответ написан
Комментировать
lazalu68
@lazalu68
Salmon
g o o g l e xD
Ответ написан
Комментировать
@jaxel
Elasticsearch с плагинами вроде как умеет такое делать.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
YCLIENTS Москва
от 200 000 до 350 000 ₽
Ведисофт Екатеринбург
от 25 000 ₽
ИТЦ Аусферр Магнитогорск
от 100 000 до 160 000 ₽
25 апр. 2024, в 09:29
2500 руб./за проект
25 апр. 2024, в 09:27
4000 руб./за проект
25 апр. 2024, в 09:20
10000 руб./за проект