@pavelkolodin

Как физически хранятся данные в Cassandra, HBase и прочих клонах BigTable?

Где можно почитать о структурах данных (детальное описание того как данные лежат в файлах, как представлены в памяти).

Очень интересно как хранится это их:
row_key -> column_family -> column -> timestamp
при том, что какие-то column пустые, время у всего разное.

Какие наиболее частые запросы на чтение к такой структуре например в Google в их MapReduce? У них BigTable используется так:
row_key -- имя страницы
column_family -- группа параметров, например "ссылка на эту страницу" - "anchor"
column -- для "anchor" это будут разные страницы, где стоит ссылка на row_key страницу
timestamp -- ну версия данных в ячейке. Я так понимаю, чаще всего идёт доступ к последней версии.


Какие типичные задачи решает гугл на такой структуре?
  • Вопрос задан
  • 286 просмотров
Пригласить эксперта
Ответы на вопрос 1
@Roman_Kh
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы