Тут встала немного нетривиальная задача: собрать ТОП-10000 русскоязычных сайтов (по кол-ву посещений), которые дают людям письменный контент (новости, различные истории), исключая блоги.
Как это можно осуществить?
На ум приходит лишь парсинг различных баз с последующим ручным отсеиванием. Проблема лишь в том, что баз, откуда можно взять ТОП-10000 (а нужно ведь больше, если потом куча отсеется) самых посещаемых сайтов рунета, просто нету. Ну, либо я плохо искал.
Пройти по топам li.ru, mail.ru ещё надо парсить по специальному запросу закрытую статистику li.ru и смотреть сколько там посещаемость. Но некоторых посещаемых сайтов вообще нет в li.ru они сидят на закрытой статистике в GA - до них никак не добраться к сожалению.
А вообще интересно что у вас получится, где-то можно следить за вашим проектом?