Хороший вопрос. В принципе, интересует "полезная нагрузка", без тизеров и прочего мусора.
Например, оценить _полную_ загрузку
yandex.ru или
rbc.ru (на РБК бывают тизеры и подсасываемые ленты новостей, но это мне не надо, главное, что основная страница для пользователя сфомирована).
Сейчас прорабатываю вариант с PhantomJS + HAR + парсилка_HAR/JSON.