Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Евгений Генералов
@Generalof
PHP
Как сделать поиск в документах на сайте?
Есть система куда пользователи загружают документы в формате .pdf, .doc, .xls
Как организовать поиск слов по этим документам?
Вопрос задан
более трёх лет назад
643 просмотра
Комментировать
Подписаться
3
Оценить
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
1
Александр Таратин
@Taraflex
Ищу работу. Контакты в профиле.
Перегоняем документы в текст
PDF
https://github.com/smalot/pdfparser
(и еще куча решений
google
)
DOC
https://github.com/PHPOffice/PHPWord
XLS
https://github.com/PHPOffice/PHPExcel
Дальше ищем по ним через
sphinxsearch.com
Неплохой цикл статей по настройке
chakrygin.ru/search/label/Sphinx
(немного устарел, но думаю разберетесь)
Ответ написан
более трёх лет назад
Комментировать
Нравится
2
Комментировать
Facebook
Вконтакте
Twitter
Пригласить эксперта
Ответы на вопрос
3
Андрей
@reaferon
Если контент (файлы) не закрыты за авторизацией, то быстрым решением может быть
https://xml.yandex.ru
, по документам ищет прекрасно, время на внедрение - минимально. Подводные камни - суточные лимиты на кол-во запросов.
Ответ написан
более трёх лет назад
Комментировать
Нравится
1
Комментировать
Facebook
Вконтакте
Twitter
Kovalsky
@lazalu68
Salmon
g
o
o
g
l
e
xD
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
jaxel
@jaxel
Elasticsearch с плагинами вроде как умеет такое делать.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
PHP
Простой
Как добавить в скрипт заявки тему для письма?
1 подписчик
6 часов назад
88 просмотров
1
ответ
PHP
Простой
Как поставить картинку под текст?
1 подписчик
вчера
92 просмотра
1
ответ
PHP
+1 ещё
Простой
Как правильно создать объект класса Request в Workerman?
2 подписчика
31 мая
641 просмотр
0
ответов
PHP
Простой
Как установить timezone в php.ini?
1 подписчик
29 мая
87 просмотров
1
ответ
PHP
+1 ещё
Простой
Symfony 6.4 php 8.4 много сыплется deprecated, есть ли пути решения?
1 подписчик
29 мая
127 просмотров
1
ответ
PHP
+2 ещё
Средний
Не работает авторизация через телеграмм для определенного домена, может кто сталкивался с этим?
1 подписчик
29 мая
316 просмотров
0
ответов
PHP
Простой
Как получить родительскую ноду PHPSTAN?
2 подписчика
27 мая
266 просмотров
2
ответа
PHP
+1 ещё
Простой
Как передать аватар пользователя телеграм в телеграм группу?
1 подписчик
26 мая
153 просмотра
0
ответов
PHP
Простой
Как называется такая вложенность в php?
1 подписчик
25 мая
1384 просмотра
2
ответа
PHP
Простой
Почему возникает ошибка (T_VARIBLE)?
1 подписчик
23 мая
144 просмотра
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Middle PHP-developer / PHP-разработчик
Wanted.
До 250 000 ₽
PHP-разработчик
Stoking
•
Пермь
от 200 000 ₽
PHP-разработчик
Wanted.
До 300 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама