Где можно почитать о структурах данных (детальное описание того как данные лежат в файлах, как представлены в памяти).
Очень интересно как хранится это их:
row_key -> column_family -> column -> timestamp
при том, что какие-то column пустые, время у всего разное.
Какие наиболее частые запросы на чтение к такой структуре например в Google в их MapReduce? У них BigTable используется так:
row_key -- имя страницы
column_family -- группа параметров, например "ссылка на эту страницу" - "anchor"
column -- для "anchor" это будут разные страницы, где стоит ссылка на row_key страницу
timestamp -- ну версия данных в ячейке. Я так понимаю, чаще всего идёт доступ к последней версии.
Какие типичные задачи решает гугл на такой структуре?