1. Индексируется отдельно текст, картинки, файлы.
2. Каждый тип данных хранится через связки уникальных цепочек данных.
3. Каждая уникальная цепочка - принадлежит множеству страниц на разных сайтах.
4. Их цепь принадлежит уже меньшему количеству страниц и т.д.
При запросе Вы набираете эту цепочку (поисковую фразу) и далее идёт "спуск" по дереву вглубь из предыдущей цепочки результатов выборки. Таким образом достигается скорость подсказок, и затем, выдачи списка сайтов.