scritto da | on , , | Nessun commento

Star-schema

In precedente articolo abbiamo visto come sia importante disporre di un buon modello dati per la realizzazione di un sistema elementare di business intelligence con PowerPivot. In quest’articolo vedremo alcuni suggerimenti su come realizzare un buon schema a stella per analizzare i nostri dati.

Uno schema a stella si compone di fatti e dimensioni. I fatti sono le registrazioni di eventi aziendali come le vendite, lo stock di magazzino, le prenotazioni di un albergo, le telefonate di un call center e così via. Le dimensioni sono le modalità di analisi dei fatti come ad esempio la dimensione geografica, quella temporale o di prodotto.

Per definire un buon schema a stella possiamo seguire i questi passaggi:

  • Identificare i fatti
  • Definire la grana dei fatti
  • Individuare le dimensioni

Identificare i fatti: In questa fase bisogna indentificare quali elementi vengono misurati e quindi registrati su un database (non intesto in senso stretto, questo database potrebbe essere anche un file Excel o un file di testo) che riteniamo importanti per il nostro modello di BI. È bene non superare le 3/4 tabelle di fatti all’interno di uno stesso modello dati PowerPivot per non renderlo troppo complicato ed ingestibile. Esistono diverse tipologie di tabelle di fatti, la prima è una classica tabella che registra gli eventi man mano che si manifestano come ad esempio le vendite, gli acquisti o le spedizioni. Un’altra tipologia è la tabella snapshot che registra l’istantanea dei dati in un certo momento ad esempio la giacenza di magazzino dei prodotti, o il valore dei conti ad una determinata data.

Definire la grana dei fatti: Una volta individuati i fatti è necessario definire la granularità dei fatti ovvero il livello di dettaglio che vogliamo inserire nella tabella dei fatti. Ad esempio per le vendite il livello più basso di dettaglio è la singola riga di fattura o dello scontrino, mentre un livello superiore è rappresentato dall’importo totale della fattura o dello scontrino. Il suggerimento è quello (se disponiamo dei dati e se la loro quantità non è eccessiva) di definire la grana al maggior livello di dettaglio. Altro suggerimento è quello di definire, se sono presenti più tabelle di fatti lo stesso livello di dettaglio per tutte. Ad esempio se ho una tabella con gli ordini di vendita ed una tabella con le spedizioni il livello di dettaglio deve essere uguale: riga d’ordine e riga del DDT.

Individuare le dimensioni: A questo punto individuiamo le dimensioni necessarie all’analisi, di cui una quasi sempre presente è quella temporale e definiamo quali attributi inserire per ogni dimensione. Ad esempio per la dimensione prodotto gli attributi potrebbero essere il prezzo, il costo d’acquisto, l’unità di misura, il peso e così via. Tra questi attributi identifichiamo quelli che sono candidati a diventare una gerarchia come ad esempio nel caso del prodotto la categoria e la sottocategoria o nel caso dei punti vendita la gerarchia geografica (comune, provincia, regione, area geografica). Anche per le dimensione è bene non individuarne troppe, per un modello dati di PowerPivot ne vanno bene una decina.

Lascia un Commento

News