prof.ssa maddalena dominijanni elementi di statistica ipsseoa - soverato
TRANSCRIPT
Prof.ssa Maddalena Dominijanni
Elementi
di
Statistica
IPSSEOA - SOVERATOIPSSEOA - SOVERATO
Prof.ssa Maddalena Dominijanni
Statistica e fenomeni collettiviStatistica e fenomeni collettivi
La STATISTICA si occupa dello studio dei FENOMENICOLLETTIVI.
Si dice fenomeno collettivo qualsiasi fenomeno costituito da un insieme di fenomeni singoli, tutti dello stesso tipo.
Un fenomeno singolo costituisce una unità statistica
ESEMPIOL’età di un alunno in una classe costituisce un FENOMENO SINGOLO.L’età di tutti gli alunni in una classe costituisce un FENOMENO COLLETTIVO
Prof.ssa Maddalena Dominijanni
L’indagine statistica e le sue fasiL’indagine statistica e le sue fasi
Per INDAGINE STATISTICA si intende un’insieme di attività
finalizzate ad approfondire la conoscenza di un fenomeno.
Le FASI di un’indagine statistica sono:
11. Impostazione dell’indagine statistica. Impostazione dell’indagine statistica
2. Raccolta dei dati2. Raccolta dei dati 33. . Spoglio e trascrizione dei datiSpoglio e trascrizione dei dati
4. Elaborazione dei dati4. Elaborazione dei dati 5.5. Rappresentazione dei datiRappresentazione dei dati
Prof.ssa Maddalena Dominijanni
1.1. Impostazione dell’indagine statistica Impostazione dell’indagine statistica
In questa prima fase occorre precisare:
Lo scopo della ricercaLo scopo della ricerca
Gli obiettivi che si vogliono raggiungereGli obiettivi che si vogliono raggiungere
Le unità statistiche oggetto di indagini Le unità statistiche oggetto di indagini
1. 1. ImpostazioneImpostazione dell’indagine statistica dell’indagine statistica
Prof.ssa Maddalena Dominijanni
2. Raccolta dei dati2. Raccolta dei dati
A) NATURA DEI DATIA) NATURA DEI DATI
I dati raccolti possono essere di natura QUANTITATIVA oppure QUALITATIVA
I dati qualitativi sono rappresentati in generale da aggettivi (il colore degli occhi, il colore dei capelli,ecc)
I dati quantitativi sono espressi da numeri (altezza, peso, età, ecc.)
In questa seconda fase occorre stabilire in modo preciso quali sono i dati da rilevare
Prof.ssa Maddalena Dominijanni
2. Raccolta dei dati2. Raccolta dei dati
B) B) METODI DI RACCOLTA DEI DATIMETODI DI RACCOLTA DEI DATI
La raccolta dei dati può essere GLOBALE oppure a CAMPIONE
La raccolta globale riguarda tutte le unità statistiche che compongono il fenomeno collettivo
La raccolta a campione riguarda solo una parte delle unità statistiche che compongono il fenomeno collettivo
Prof.ssa Maddalena Dominijanni
C) TECNICA DI RACCOLTA DEI DATIC) TECNICA DI RACCOLTA DEI DATI
Tecnicamente, la raccolta dei dati può essere fatta inmodi diversi. In generale, la raccolta più seguita è quelladell’INTERVISTA DIRETTA o INDIRETTA
L’intervista diretta prevede domande poste direttamente dall’intervistatoreL’intervista diretta prevede domande poste direttamente dall’intervistatore
L’intervista indiretta prevede il riempimento di un questionarioche l’intervistato deve riempire in tutte le sue parti
L’intervista indiretta prevede il riempimento di un questionarioche l’intervistato deve riempire in tutte le sue parti
2. Raccolta dei dati2. Raccolta dei dati
Prof.ssa Maddalena Dominijanni
TRASCRIZIONE DEI DATI IN TABELLETRASCRIZIONE DEI DATI IN TABELLE Una volta enumerati e classificati, i dati vengono trascritti in TABELLE.
CLASSIFICAZIONE DEI DATI IN GRUPPICLASSIFICAZIONE DEI DATI IN GRUPPI I dati raccolti, dopo essere stati enumerati vengono CLASSIFICATI in GRUPPI a seconda degli obiettivi che si vogliono raggiungere
33. . Spoglio e trascrizione dei datiSpoglio e trascrizione dei dati
ENUMERAZIONE DEI DATIENUMERAZIONE DEI DATI I dati vengono enumeratiI dati vengono enumerati allo scopo di effettuare un controllo sul numero delle unità statistiche effettivamente prese in considerazione
Questa terza fase comporta:
Prof.ssa Maddalena Dominijanni
4. Elaborazione dei dati4. Elaborazione dei dati
In questa quarta fase i dati vengono sottoposti ad una elaborazione matematica il cui scopo è quello di esprimere i risultati dell’indagine in modo sintetico
4) LA MEDIANA4) LA MEDIANA
Alcune forme di elaborazione dei dati statistici sono:
1) LE FREQUENZE ASSOLUTE, RELATIVE e PERCENTUALI1) LE FREQUENZE ASSOLUTE, RELATIVE e PERCENTUALI
2) LA MEDIA ARITMETICA SEMPLICE e PONDERATA2) LA MEDIA ARITMETICA SEMPLICE e PONDERATA
3) LA MODA3) LA MODA
Prof.ssa Maddalena Dominijanni
Frequenze assolute
La FREQUENZA ASSOLUTA indica quante volte la MODALITÀ di un CARATTERE si ripete
Voto(carattere)
N° studenti
(frequenza assoluta)
4 3
5 4
6 6
7 4
8 3
Totale 20
Frequenze assolute
carattere
modalità
Voti ottenuti da 20 studenti in una verifica di Matematica
Prof.ssa Maddalena Dominijanni
Frequenze relative
La frequenza relativa di una certa modalità è data dal rapporto tra la frequenza assoluta di tale modalità ed il numero totale dei casi
Le FREQUENZE ASSOLUTE, di due distribuzioni di dati, anche della stessa specie, non sono confrontabili in quanto si riferiscono, in generale, ad un diverso numero di casi complessivi.Questo inconveniente viene superato introducendo il concetto di
FREQUENZA RELATIVA
totalefrequenzaassolutafrequenzarelativafrequenza
Prof.ssa Maddalena Dominijanni
Frequenze percentuali
Le frequenze relative spesso si indicano come percentuali.
La FREQUENZA PERCENTUALE è il rapporto tra frequenza assoluta e la frequenza totale moltiplicato per 100 ed espresso in percentuale. In sostanza per calcolare la frequenza percentuale basta moltiplicare per 100 la frequenza relativa
100totalefrequenzaassolutafrequenza
epercentualfrequenza
OSSERVAZIONE: Le frequenze relative non sonoaltro che RAPPORTI PERCENTUALI
Prof.ssa Maddalena Dominijanni
Calcolo delle frequenze
FREQUENZA ASSOLUTA, FREQUENZA RELATIVA e PERCENTUALE
carattere
modalità
Voti(carattere)
(frequenza assoluta)
(frequenza relativa)
(frequenza percentuale)
4 3 3/20 = 0,15 15%
5 4 4/20 = 0,20 20%
6 6 6/20 = 0,30 30%
7 4 4/20 = 0,20 20%
8 3 3/20 = 0,15 15%
TOTALE 20 100%
Prof.ssa Maddalena Dominijanni
Media aritmetica semplice
nnaaaa
M
......
321
naaa ..............21
Consideriamo una distribuzione di DATI DIVERSI UNODALL’ALTRO:
La MEDIA ARITMETICA SEMPLICE è uguale alla somma dei dati divisa per n, cioè:
Prof.ssa Maddalena Dominijanni
COMPITO VOTO
N° 1 4
N° 2 6
N° 3 5
TOTALE 15
Un alunno nei tre compiti di matematica ha riportato i voti presenti in tabella. Calcolare la MEDIA ARITMETICA dei voti.
n
aaaM 321
53
15
3
564 M
Dove:15 = somma dei voti 3 = numero dei voti 5 = MEDIA ARITMETICA dei voti
Media aritmetica sempliceEsempio di calcolo
Prof.ssa Maddalena Dominijanni
Media aritmetica ponderata
Se i dati si presentano con una certa FREQUENZA o PESO allora il calcolo della media può essere effettuato sommando ogni termine tante volte quante indica la sua frequenza
Supponiamo che:
Il termine a1 si presenti con frequenza p1
Il termine a2 si presenti con frequenza p2
…………………………………………………………………………
Il termine an si presenti con frequenza pn
Il calcolo della MEDIA PONDERATA si effettua con la relazione:
n
nn
pppp
papapapaMp
.......
......
321
332211
Prof.ssa Maddalena Dominijanni
Media aritmetica ponderata
Esempio di calcolo 20 Studenti di una classe, hanno ottenuto in matematica i voti riportati in tabellaCalcolare la MEDIA PONDERATA dei voti.
54321
5544332211
ppppp
papapapapaMp
Dove:120 = somma dei voti 20 = numero di studenti 6 = MEDIA PONDERATA dei voti
Voto in Matematica
Numero
studenti
4 3
5 4
6 6
7 4
8 3
totale 20
620
120
34643
3847664534
Mp
Prof.ssa Maddalena Dominijanni
Media aritmetica
In STATISTICA la MEDIA ARITMETICA è una sola: le formule
nnaaaa
M
......
321n
nn
pppp
papapapaMp
.......
......
321
332211
se applicate correttamente, forniscono lo stesso risultato. La
distinzione tra media aritmetica semplice e media aritmetica
ponderata è una distinzione che riguarda il metodo seguito per
arrivare al risultato
se applicate correttamente, forniscono lo stesso risultato. La
distinzione tra media aritmetica semplice e media aritmetica
ponderata è una distinzione che riguarda il metodo seguito per
arrivare al risultato
Prof.ssa Maddalena Dominijanni
Si definisce MODA di una distribuzione di dati il termine corrispondente alla MASSIMA FREQUENZA.
In sostanza si tratta del termine più comune
MODA
ESEMPIO: Determinare la MODA della seguente distribuzione di voti:
Il termine che corrisponde alla massima frequenza (6) è il 6, pertanto:
MODA = 6
Voto(carattere)
N° studenti
(frequenza assoluta)
4 3
5 4
6 6
7 4
8 3
Prof.ssa Maddalena Dominijanni
MEDIANA Si definisce MEDIANA il termine che occupa il POSTO CENTRALEdi una distribuzione di dati ordinati in modo crescenti
ESEMPIO: Determinare la MEDIANA della seguente distribuzione di voti:
4 4 4 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 8 8 8
Il TERMINE CENTRALE è il 6, infatti è quelloche lascia alla sua destra e alla sua sinistra uneguale numero di termini, pertanto si ha:
MEDIANA = 6
Si ordinano i dati in maniera crescente
Se i dati sono in numero pari, allora si hanno due termini centrali, in tal caso come mediana si prendela loro media aritmetica
Voto(carattere)
N° studenti
(frequenza assoluta)
4 3
5 4
6 7
7 4
8 3
Prof.ssa Maddalena Dominijanni
Rappresentazionenumerica dei dati:
Rappresentazionegrafica dei dati:
La rappresentazione dei dati può essere NUMERICA e GRAFICA
1) TABELLE SEMPLICITABELLE SEMPLICI2)2) TABELLE COMPOSTETABELLE COMPOSTE3)3) TABELLE A DOPPIA ENTRATATABELLE A DOPPIA ENTRATA
1) DIAGRAMMI CARTESIANIDIAGRAMMI CARTESIANI2) ISTOGRAMMI2) ISTOGRAMMI3) IDEOGRAMMI3) IDEOGRAMMI4) DIAGRAMMI A TORTA4) DIAGRAMMI A TORTA
44. . Rappresentazione dei dati statisticiRappresentazione dei dati statistici
Prof.ssa Maddalena Dominijanni
1) TABELLE SEMPLICI1) TABELLE SEMPLICI Una TABELLA SEMPLICE è formata da DUE COLONNE e consentela classificazione dei dati rispetto ad un SOLO CARATTERE
2) TABELLE COMPOSTE2) TABELLE COMPOSTE
Una TABELLA COMPOSTA è formata da PIÙ COLONNE, econsente la classificazione dei dati rispetto a PIÙ CARATTERI
Colore capelli(carattere)
N° persone(frequenza assoluta)
Neri 10
Castani 6
Rossi 1
biondi 5
Totale 22
Persona altezza
h = cm
peso
P = kg
Padre 175 80
Madre 162 64
Figlio 180 74
Figlia 168 55
Prof.ssa Maddalena Dominijanni
3) TABELLE A DOPPIA ENTRATA3) TABELLE A DOPPIA ENTRATA
Talvolta in un’indagine statistica è necessario considerare contemporaneamente due caratteri distinti. In tal caso è utile utilizzare una TABELLA A DOPPIA ENTRATA In tale tabella le righe corrispondono alle modalità di uno dei due caratteri considerati e le colonne corrispondono alle modalità dell’altro carattere. In ogni cella è riportata la frequenza con cui i due caratteri si presentano con le modalità corrispondenti alla riga e alla colonna cui appartiene la cella
capelli
occhi
biondi castani neri Totale
celesti 20 11 9 40
castani 5 25 20 50
verdi 5 3 2 10
Totale 30 39 31 100
Prof.ssa Maddalena Dominijanni
TRASCRIZIONE DEI DATI PER CLASSITRASCRIZIONE DEI DATI PER CLASSI
La rappresentazione di una DISTRIBUZIONE DI DATI PER CLASSI, si presenta VANTAGGIOSA quando i dati sono molto NUMEROSI per una rappresentazione ponderata
Rappresentazione ponderata Rappresentazione per classi di peso
CLASSI DI ETA’
(termini)
N° STUDENTI
(frequenze)
11 – 14 4
14 – 17 4
17 – 20 6
TOTALE 14
L’ informazione, diviene meno precisa nelcaso di una distribuzione per classi, tuttaviala visione della distribuzione diventa più semplice e rapida
Età
(termini)
N° STUDENTI
(frequenze)
11 1
12 1
13 2
14 1
15 1
16 2
17 3
18 1
19 1
20 1
TOTALE 14
Prof.ssa Maddalena Dominijanni
I GRAFICI possono essere di diverso tipo:
Le INFORMAZIONI che derivano da una raccolta dati
sono più evidenti se sono visualizzate attraverso
GRAFICI
Rappresentazionigrafiche dei dati:
1) DIAGRAMMI CARTESIANIDIAGRAMMI CARTESIANI2) ISTOGRAMMI2) ISTOGRAMMI3) DIAGRAMMI A TORTA3) DIAGRAMMI A TORTA
Prof.ssa Maddalena Dominijanni
1) DIAGRAMMA CARTESIANO
Esempio: Riportiamo su di un DIAGRAMMA CARTESIANO le TEMPERATURE registrate ogni sei ore
T (°C)
Un DIAGRAMMA CARTESIANO è formato da due RETTE (assi) perpendicolaritra loro, l’asse ORIZZONTALE si chiama ASCISSA(asse X), l’asse VERTICALE si chiama ORDINATA (asse Y). Su di essi vengono riportati i dati statistici.Questo tipo di grafico è particolarmente indicato per rappresentare le serie storiche: si rappresentano sull’asse x i tempi e sull’asse y i valori rilevati del fenomeno che si sta osservando.
0 6 12 18 24 h (ore)
15
1210 8 6 4 2
Y
X
(0;4) (6;4)
(12;15)
(18;8)
(24;6)
Basta riportare sull’ asse X il Tempo e sull’ asse Y le Temperature
Orario(h)
Temperatura (°C)
0 4
6 4
12 15
18 8
24 6
Prof.ssa Maddalena Dominijanni
Esempio: Riportiamo in un ISTOGRAMMA Il numero di ore che 35 ragazzi
intervistati trascorrono su Internet al giorno
L’ISTOGRAMMA è un grafico a colonne: le colonne (rettangoli) hanno
basi uguali e possono essere disegnate una vicino all’altra.
L’altezza è proporzionale alla frequenza di ciascun dato.
Noki Siem Sams Pana Moto
ISTOGRAMMA
2) ISTOGRAMMA
3. Quante ore stai su internet al giorno?
8
15
12
0
2
4
6
8
10
12
14
16
Non più di 1 ora algiorno
Da 1 a 2 ore algiorno
3 o più ore al giorno
N. s
tud
enti
Prof.ssa Maddalena Dominijanni
In tal caso si traccia una CIRCONFERENZA e si procede alla sua divisionein parti proporzionali alle intensità delle componenti del fenomeno statistico
Esempio
3) AEROGRAMMA O DIAGRAMMI A TORTA
L’AREOGRAMMA è un tipo di rappresentazione grafica alla quale si ricorrequando si vogliono rappresentare le parti che compongono un fenomeno statistico.
AEROGRAMMA odiagramma a torta
Quante ore stai su Internet al giorno?
34%
23%
43%
Non più di 1 ora algiorno
Da 1 a 2 ore al giorno
3 o più ore al giorno