La cluster analysis

feb
2011
04

scritto da | on | Nessun commento

La cluster analysis è una tecnica statistica volta alla selezione e raggruppamento di elementi omogenei in un insieme di dati, tale tecnica si rivela utile ogni qual volta è necessario raggruppare degli elementi numerosi in pochi gruppi sui quali effettuare altre analisi o prendere delle decisioni. Supponiamo ad esempio di avere circa 1000 clienti e di voler formulare delle politiche di servizio logistico, non avrebbe senso formulare 1000 offerte ma è più opportuno raggruppare i clienti in 4/5 gruppi omogenei e formulare una offerta per ogni gruppo omogeneo di clienti. In questo post vedremo come realizzare tale analisi con due strumenti software: XLSTAT un add-on commerciale per Excel e R un software opensource per analisi statistiche. Il primo passo da compiere per effettuare una cluster analysis è avere una tabella con gli elementi da raggruppare e per ogni elemento avere delle caratteristiche da analizzare per il raggruppamento
XLSTAT
In Excel posizionarsi sul menù di XLSTAT e cliccare sul menù Analisi dei dati, classificazione K-means, a questo punto si apre una maschera in cui impostare i dati per l’analisi dei gruppi. Nella scehda generale impostare la tabella osservazioni/variabili selezionando le celle della tabella da analizzare, fleggare l’opzione etichette delle righe e selezionare l’etichette di riga, in numero di classi indicare il numero di gruppi in cui suddividere gli elementi della tabella, a questo punto si avvia l’elaborazione che al termine genererà un nuovo foglio con i risultati delle analisi.
R
Avviamo il software R ed il pacchetto con l’interfaccia grafica R commander, andiamo sul menù dati/importa dati / da file di testo o blocco appunti, nella finestra che si apre indicare le specifiche del file di testo (nel caso siamo partiti da un file di Excel bisogna salvarlo come CVS ed impostare nella finestra delle specifiche come separatore di campo la virgola) successivamente importiamo il file. A questo punto andiamo sul menù statistiche e clicchiamo su Analisi dimensionale/ analisi dei cluster/ analisi dei cluster mediante k-mens, nella maschera che si apre impostare l’opzione del numero dei gruppi da creare e premere OK.

Lascia un Commento

News