У большинства сайтов в шапке или в футере часто находится их название.
Какой алгоритм можно использовать, чтобы найти повторяющиеся значения и попытаться из них получить данные о названии?
Например, есть адрес
Нужно найти название организации. Вручную алгоритм следующий. Смотрим шапку, смотрим футер, если не находим переходим на страницу контакты или о сайте
Результатом будет названия: Хабрахабр Компания "ТМ"
Как не переходя на сайт вручную получить подобные данные?
Хотелось бы понять алгоритм