Как организовать поиск по библиотеке книг?

Question

Егор Чернышов @jarogor

Как организовать поиск по библиотеке книг?

В чём суть проблемы: если текст книг хранить целиком, то поиск фрагмента означает выборка всей книги для дальнейшей вырезки фрагмента. Получается, что фраза состоящая из высокочастотно-употребимых слов может попадаться во всех книгах и не один раз. Соответственно выбирать их нужно будет все для постобработки. Не сильно ли это энергозатратно?

А если не так, то как? Я не профессионал, может чего-то не знаю, не понимаю. Подскажите пожалуйста знающие. Как правильно организовать поиск фрагментов текста по библиотеке книг?

Вопрос задан более трёх лет назад
145 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 1 подписчик
- 17 июн.
- 145 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 364 просмотра
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 214 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 165 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 138 просмотров
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2423 просмотра
8

ответов
MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 115 просмотров
1

ответ
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 306 просмотров
6

ответов
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 84 просмотра
1

ответ
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 164 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2016-09-19 18:59:36

Ответ от Uwe_Boll неправильный(а то и прямо, вредный)
Дело в том, что не identity поиск не может использовать стандартный индекс.
------------
Я имею ввиду, что запросы вида %some word% нельзя отсортировать, и соответственно по ним нельзя пройтись бинарным поиском как это делают в случае обычных индексов, делая ваш индекс, фактически, бессмысленным превращая O(log N) алгоритм в O(N)
-------------
У вас, фактически, только один вариант:
Обратный индекс с взвешиванием по https://en.wikipedia.org/wiki/Tf%E2%80%93idf
Для этого вы можете использовать:
https://www.postgresql.org/docs/8.3/static/textsea...
https://www.sqlite.org/fts3.html
dev.mysql.com/doc/refman/5.7/en/fulltext-search.html
https://www.elastic.co/

Answer 2 · 2016-09-19 18:28:14

Uwe_Boll @Uwe_Boll

Я Злой и Страшный Уве Болл в Разработке знаю Толк

индексы поставь на название книги и индекс на ISBN

Ответ написан более трёх лет назад

Комментировать

Как организовать поиск по библиотеке книг?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт