statistica con excel procedure utili per lanalisi dati ottenute col foglio elettronico. giovanni...

16
Statistica con Excel Procedure utili per l’analisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011 Edizione 2011 prog. Giocìvanni Raho 1

Upload: benvenuto-martina

Post on 01-May-2015

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Statistica con Excel

Procedure utili per l’analisi dati ottenute col foglio elettronico.

Giovanni Raho

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 1

Page 2: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Fasi di una ricerca

• Analisi del problema.• Individuare la popolazione.

– Estrarre un campione: vantaggio nell'esaminare un sottoinsieme della popolazione per generalizzare i risultati alla popolazione complessiva

• Def. Scegliere alcuni elementi della popolazione– Dall’elenco dei soggetti si possono estrarre casualmente alcuni

elementi.• Excel permette l’estrazione di campioni casuali.• Useremo le seguenti procedure:

– Generazione di un numero casuale. – Estrazione di un campione da un elenco.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 2

Page 3: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Campione• Nelle scienze applicate il campione è la parte dell'oggetto della

ricerca che dovrà essere sottoposta ad un esperimento• In statistica il campione è il numero di rilevazioni fatte per

l'indagine• Modalità di selezione del campione• Scelta di comodo (campionamento per quote o convenience

sampling).• Scelta ragionata (campionamento ragionato o judgmental

sampling).• Scelta casuale (campionamento casuale o random sampling).• Scelta probabilistica (campionamento probabilistico o probabilistic

sampling).

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 3

Page 4: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Campione casuale

• Ogni elemento della popolazione ha uguale probabilità di far parte del campione.

• ... equi probabilità ...• Probabilità: rapporto tra numero degli eventi

estratti e numero degli eventi possibili.– Es. 1/6 la probabilità di avere un numero dalle

facce di un dado.– 1/40 la probabilità di estrarre un re di picche da

40 carte

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 4

Page 5: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Campionamento in Excel

• Casuale• Senza argomento genera un numero casuale tra 0 e 1

• Casuale tra• Genera un numero casuale tra due numeri da indicare.

• Campionamento• Se si possiede l’elenco (numerico) dei soggetti è possibile usare la procedura

campionamento ottenibile da l’Analisi dati che permette di generare un elenco di oggetti estratti casualmente.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 5

Page 6: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Variabili e misure

• Individuare le variabili intervenienti.• Fissare le modalità di misura.• Ossia il modo col quale sono costruite le categorie

• Misure metriche: si basano su un’unità di misura, sono espresse da numeri razionali e quindi permettono le esecuzioni di operazioni tra numeri.

• Misure ordinali: in esse valgono le proprietà di maggiore e minore ossia è possibile stabilire una regola di ordinamento.

• Misure nominali: in esse vale solo la proprietà delle classi di equivalenza: univocità dell’assegnazione ed esaustività.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 6

Page 7: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Analisi: sintesi

• Determinare le possibili sintesi.– Valore centrale:

• Media aritmetica per le misure metriche• Mediana per le misure ordinali• Moda per le misure nominali.

– Grafico e percentuale:• Grafico a torta• Grafico a barre o istogramma (orizzontale o verticale)

– Andamento di un fenomeno• Grafici lineari e linee di tendenza (regressione)

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 7

Page 8: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Valori centrali

• Il valore centrale / media di una raccolta di valori deve essere valutato:

• Excel può calcolare:– S.D. per la media aritmetica (n-1)– Usando n-1 come numero n degli oggetti della ricerca.

– S.D. pop (n)– Usando n come numero degli oggetti delle ricerca.

– Deviazione interquartilica per la mediana.– Calcolando il primo ed il secondo ed il 3° quartile

– Differenza tra valore minimo e massimo per la moda.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 8

Page 9: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Analisi: relazioni

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 9

Page 10: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Analisi: relazioni

• Valutare le possibili relazioni tra le variabili.– In EXCEL esiste la possibilità di correlare i valori di

due variabili con i grafico a dispersione.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 10

Page 11: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Legge di relazione

• Fissando un’opportuna linea di tendenza.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 11

Page 12: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Valutazione di una relazione

• Due variabili possono assumere valori tra loro dipendenti.

• Il test può valutare l’indipendenza tra due variabili.

• O la dipendenza.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 12

Page 13: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Test

• Coefficiente di Pearson:– Valuta la correlazione tra due variabili.

• Test del chi quadrato.– Valuta l’indipendenza tra due o più variabili, ossia

la casualità delle relazioni apparenti.– Casualità significa non estensibilità di quanto

trovato nel campione con la popolazione.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 13

Page 14: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Correlazione di Pearson

• Il test di Pearson è direttamente ottenibile da EXCEL.– Vi sono tuttavia alcune approssimazioni che lo

rendono diverso secondo l’edizione di EXCEL usata.

– Useremo una opportuna formulazione del test di Pearson che ci permetterà di calcolare tale test direttamente.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 14

Page 15: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Correlazione di Pearson

• Useremo per tale calcolo i punteggi normalizzati che permettono di stabilire i punteggi coerenti con la misura usata.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 15

Page 16: Statistica con Excel Procedure utili per lanalisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011Edizione 2011 prog. Giocìvanni Raho1

Punteggi normalizzati

• Punteggi ottenuti ricorrendo alla media e alla S.D. del gruppo esaminato.

11/04/2011 Edizione 2011 prog. Giocìvanni Raho 16