1. У них есть некая панель, которая синхронизирована с поисковым роботом (crawlers), который сканирует около 2.5 миллионов страниц в день
2. Интернет-провайдеры предоставляют им анонимную информацию касательно посещаемости того или иного сайта.
3. Обширная обучающая выборка, в которой находятся миллионы сайтов по всему миру. Сайты предоставляют им данные о посещаемости. Эту выборку они пропускают через свои алгоритмы.
Это ответ техподдержки SimilarWeb