В чём суть проблемы: если текст книг хранить целиком, то поиск фрагмента означает выборка всей книги для дальнейшей вырезки фрагмента. Получается, что фраза состоящая из высокочастотно-употребимых слов может попадаться во всех книгах и не один раз. Соответственно выбирать их нужно будет все для постобработки. Не сильно ли это энергозатратно?
А если не так, то как? Я не профессионал, может чего-то не знаю, не понимаю. Подскажите пожалуйста знающие. Как правильно организовать поиск фрагментов текста по библиотеке книг?