Узловое "дерево", где каждый узел - это одно слово (может и би/три-грамма).
Кол-во набранных баллов (длина пути) в момент прохода по связям и наличие определённых ID-шников, точно определяет (выделяет) сайты, которые содержат цитируемую строку.
(и, разумеется, поиск ведётся только по проиндексированным заранее данным)