Индексирование и последующий поиск по индексу.
Грубо говоря, текст разбивается на отдельные слова, слова приводятся в нормальную форму, заносятся в словарь, потом строится таблица связей между отдельными словами и документами (в каком документе какое слово как часто встречается и в какой форме).
Когда клиент вводит поисковый запрос, он так же разбивается на слова, слова нормализуются, и по индексу находятся документы, в которых встречаются искомые слова.
Дальше происходит определение релевантности, и это самый сложный и наукоёмкий этап, не знаю подробностей, но, возможно, по ключевым словам «релевантность», «полнотекстовый поиск», «индексирование» сможете что-то найти.