Здравствуйте, у меня возникла проблема с пониманием архитектуры dwh. Мне требуется сделать хранилище, но при проектировании получается, что у меня не одна единственная таблица фактов а их несколько. К примеру:
У меня есть таблица транзакций маркетплейса где указан: тип транзации, артикул, дата, склад, режим отправки и т.д.
Также у этой таблицы есть таблицы измерений (по артикулу, складу).
Но есть ещё одна таблица "Заказы" у которой указаны столбцы: статус заказа, артикул, дата, время доставки и т.д
Это нормальная ситуация. Для DWH-систем тебе нормализация не нужна. Можно денормализовывать.
Тебе нужно все таблицы поделить на 2 кучки.
Первая кучка - это DWH-факты которые будут денормализованы.
Транзакции и заказы должны быть денормализованы и слиты в 1 ооооочень большую таблицу.
Она будет в центре снежинки.
Вторая кучка - это
dimensions. Они будут лучами снежинки.
И не забывай сделать partitioning для главной DWH таблички.