Задать вопрос
@dayvion

Как спроектировать dwh звезда?

Здравствуйте, у меня возникла проблема с пониманием архитектуры dwh. Мне требуется сделать хранилище, но при проектировании получается, что у меня не одна единственная таблица фактов а их несколько. К примеру:
У меня есть таблица транзакций маркетплейса где указан: тип транзации, артикул, дата, склад, режим отправки и т.д.
Также у этой таблицы есть таблицы измерений (по артикулу, складу).
Но есть ещё одна таблица "Заказы" у которой указаны столбцы: статус заказа, артикул, дата, время доставки и т.д

Таким образом таких таблиц фактов несколько.
И я не понимаю как это возможно свести к одной таблице фактов, если их мне нужно несколько
  • Вопрос задан
  • 58 просмотров
Подписаться 1 Средний 3 комментария
Решения вопроса 1
mayton2019
@mayton2019
Bigdata Engineer
Здравствуйте, у меня возникла проблема с пониманием архитектуры dwh. Мне требуется сделать хранилище, но при проектировании получается, что у меня не одна единственная таблица фактов а их несколько. К примеру:
У меня есть таблица транзакций маркетплейса где указан: тип транзации, артикул, дата, склад, режим отправки и т.д.
Также у этой таблицы есть таблицы измерений (по артикулу, складу).
Но есть ещё одна таблица "Заказы" у которой указаны столбцы: статус заказа, артикул, дата, время доставки и т.д


Это нормальная ситуация. Для DWH-систем тебе нормализация не нужна. Можно денормализовывать.
Тебе нужно все таблицы поделить на 2 кучки. Первая кучка - это DWH-факты которые будут денормализованы.
Транзакции и заказы должны быть денормализованы и слиты в 1 ооооочень большую таблицу.
Она будет в центре снежинки.

Вторая кучка - это dimensions. Они будут лучами снежинки.

И не забывай сделать partitioning для главной DWH таблички.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы