Допустим есть сайт
Что из себя представляет страница на сайте? Документ HTML. У документа есть путь - как часть адреса URL.
Есть заголовок (header)
<title>Example Domain</title>
Есть тело документа (body)
<div>
<h1>Example Domain</h1>
<p>This domain is for use in illustrative examples in documents. You may use this
domain in literature without prior coordination or asking for permission.</p>
<p><a href="https://www.iana.org/domains/example">More information...</a></p>
</div>
Если я верно понял вопрос, то необходимо уметь искать по заголовку и телу страницы. Поскольку AL производит поиск по чистому тексту, а не HTML, то в понятиях AL нужно индексировать документ, состоящий из:
- идентификатор страницы
- заголовок
- тело
- дата создания
- автор
- метки
Необходимо обеспечить синхронизацию страниц в AL: при создании или изменении любой страницы сайта проиндексировать её в AL в качестве документа с заданными полями.