Architetture Data Warehouse
Sto scorrendo il capitolo 3 del redbook IBM “Dimensional Modeling: In a Business Intelligenge Environment” in questo capitolo parla ad un certo punto delle possibili architetture di un data warehouse proponento tre possibilità:
- Enterprise data warehouse
- Independent data marts
- Dependent data marts
Riporto anche un’immagine che da’ un po’ un’idea:
In sostanza l’architettura a “data mart indipendenti” è un’architettuttura un po’ disordinata, dove ognuno si fa il proprio data mart indipendente, senza curarsi del fatto che molti dati sono comuni con quelli di altri dipartimenti.
L’architettura a “data mart dipendenti” invece è una archittettura più ordinata, potremmo dire un po’ normalizzata, perchè se più data mart hanno dati comuni essi vengono condivisi e non ridondati, ottenendo gli stessi vantaggli che la normalizzazione porta nel modello relazionale.
Proseguendo nel capitolo si trova un’altra interessante figura, in cui si distingue tra “data warehousing environment” e “data warehouse.
Mi ha lasciato perplesso il fatto che questo paragrafo si afferma che EDW (Enterprise Data Warehouse) è principalmente in terza forma normale (3NF). Se non ho capito male gli strumenti OLAP (quando ci sono) si pongono tra l’EDW, il data mart e l’utente che fa i “report”.
Modello dimensionale
Prima di descrivere le architetture data warehouse il redbook parla dei modelli dimensionali utilizzati per i data mart, generalmente si parla di modello a stella, però vi sono tre varianti:
- Modello a stella
- Modello a fiocco di neve
- Modello multistella
L’immagine che descrive i tre modelli è questa:
In pratica i modelli a fiocco di neve (snowflake) e il modello multistella (multi-star) sono un’estensione del modello a stella.
Postato in: Business Intelligence





Read Translated version of this blog 

