Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Евгений Генералов
@Generalof
PHP
Как сделать поиск в документах на сайте?
Есть система куда пользователи загружают документы в формате .pdf, .doc, .xls
Как организовать поиск слов по этим документам?
Вопрос задан
более трёх лет назад
637 просмотров
Комментировать
Подписаться
3
Оценить
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
1
Александр Таратин
@Taraflex
Ищу работу. Контакты в профиле.
Перегоняем документы в текст
PDF
https://github.com/smalot/pdfparser
(и еще куча решений
google
)
DOC
https://github.com/PHPOffice/PHPWord
XLS
https://github.com/PHPOffice/PHPExcel
Дальше ищем по ним через
sphinxsearch.com
Неплохой цикл статей по настройке
chakrygin.ru/search/label/Sphinx
(немного устарел, но думаю разберетесь)
Ответ написан
более трёх лет назад
Комментировать
Нравится
2
Комментировать
Facebook
Вконтакте
Twitter
Пригласить эксперта
Ответы на вопрос
3
Андрей
@reaferon
Если контент (файлы) не закрыты за авторизацией, то быстрым решением может быть
https://xml.yandex.ru
, по документам ищет прекрасно, время на внедрение - минимально. Подводные камни - суточные лимиты на кол-во запросов.
Ответ написан
более трёх лет назад
Комментировать
Нравится
1
Комментировать
Facebook
Вконтакте
Twitter
Kovalsky
@lazalu68
Salmon
g
o
o
g
l
e
xD
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
jaxel
@jaxel
Elasticsearch с плагинами вроде как умеет такое делать.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
PHP
+3 ещё
Простой
Как правильно построить сервис, создающий отложенные задачи на основе расписания из другого сервиса?
2 подписчика
11 мар.
197 просмотров
2
ответа
JavaScript
+2 ещё
Простой
Ton — Connect UI, подключаем к фреймворку, есть ошибки при оплате, как решить?
1 подписчик
11 мар.
76 просмотров
0
ответов
JavaScript
+1 ещё
Простой
Как прочитать файл через РНР, чтобы обработать его яваскриптом?
2 подписчика
10 мар.
1743 просмотра
3
ответа
JavaScript
+2 ещё
Средний
Почему FullCalendar не правильно отображает диапазоны событий (в клиентской части)?
2 подписчика
04 мар.
108 просмотров
1
ответ
PHP
+1 ещё
Простой
Что не так с параметром — password = root?
3 подписчика
02 мар.
2485 просмотров
1
ответ
PHP
Простой
Какой параметр php модуля отключает тему формы с сайта?
нет подписчиков
27 февр.
242 просмотра
3
ответа
PHP
Средний
При входе в аккаунт, всегда пишет Заполните все поля, кто-то нашел ошибку почему так происходит?
1 подписчик
25 февр.
226 просмотров
1
ответ
PHP
+1 ещё
Простой
Нужно составить запрос если?
1 подписчик
25 февр.
411 просмотров
1
ответ
PHP
+3 ещё
Простой
Почему при копировании контейнера с php — перестает работать php?
2 подписчика
21 февр.
788 просмотров
2
ответа
PHP
+1 ещё
Средний
Как в PHPWord создать условие вывода текста?
1 подписчик
21 февр.
148 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Middle PHP-developer / PHP-разработчик
Wanted.
До 250 000 ₽
PHP-разработчик
Decart IT-production
от 260 000 до 340 000 ₽
Backend-разработчик PHP
Wanted.
•
Москва
До 160 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама