В премиум версии Google Analytics можно выгрузить данные на уровне hits к ним в облако. Не знаю включают ли они эту функцию только премиум юзерам, но мне кажется, что Google хранит информацию именно на уровне хитов для всей GA.
Да, в самой GA, для скорости отчётов используется та или иная техника преагрегации (ответы выше скорее всего верны), но гугл использует эту информацию в своём основном бизнесе.
Ну и объём там небольшой в сравнении с их сервисами (YouTube).
Кроме того MapReduce, вышел из стен Google? Насколько я знаю по статьям на хабре и течкраче, компании вроде Гугл и Фейсбук используют свои системы храниния, которые на поколение опережают опен сорс аналоги. Пока они их используют, они закрыты и услышать о них можно только на конференциях и в научных работах, выходящих из стен компании. Ну а когда приходит время новой системы - Google открывает исходники)