очевидно взять большой новостной сайт и аккуратно напарсить, делается это на раз два.
а лучше несколько сайтов, чтобы один не перегружать запросами и получить относительно быстро.
Правда они ориентированы на сами новостные сайты (считается что новость более интересна, если о ней трубят больше новостных сайтов) без учета индекса интересов пользователя (то есть, не учитывается количество людей прочитавших эту новость).