Путь URL можно рассматривать как ориентированный граф.
Каждая часть пути, разделённая косой чертой, представляет собой узел.
Повторяющиеся узлы могут быть слиты воедино, если они соответствуют определённым шаблонам узлов и частота таких узлов равна единице (URL некоторого товара на сайте уникален несмотря на повторения в запросах в логах). Допустим, только числовые значения (/1/, /2/, /999/) или узлы, генерируемые для permalink (/kakoe-to-nazvanie-statii-bloga/).
Дополнительная ссылка:
Кластеризация графов и поиск сообществ.