università del piemonte orientale corso di laurea in biotecnologia...
TRANSCRIPT
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 1
Università del Piemonte Orientale
Corso di laurea in biotecnologia
Corso di Statistica Medica
Test di ipotesi
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 3
Inferenza statistica : ‘…indurre o inferire proprietà di un universo
[parametri] sulla base dei dati conosciuti relativi ad un campione
[statistiche].’ (H.M.Blalock).
Solo eccezionalmente conosciamo direttamente le caratteristiche della
popolazione, di solito dobbiamo stimarle in base alle caratteristiche
dei campioni che sono stati estratti dalla popolazione.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 4
Possiamo trarre conclusioni sul valore del parametro nella
popolazione a partire dai dati campionari seguendo due percorsi:
1. Il calcolo dell'intervallo di confidenza
2. Il test dell'ipotesi
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 5
Il test dell'ipotesi verifica se il campione è compatibile con un’ipotesi
relativa alle caratteristiche della popolazione.
Il campione non interessa di per sé ma solo in quanto consente di
stimare le caratteristiche della popolazione.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 6
La verifica (o test) dell’ipotesi è un procedimento logico.
Il procedimento prevede dapprima la formulazione dell’ipotesi e quindi
la valutazione della probabilità di ottenere il campione dato se l’ipotesi
è vera.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 7
Che cos'è un’ipotesi?
‘Un ipotesi è un’affermazione relativa ad un evento futuro, o
comunque ad un evento il cui risultato è sconosciuto al momento in
cui l’affermazione viene fatta, costruita in modo da poter risultare non
vera e pertanto da respinta.’ (H.M.Blalock).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 8
Dal punto di vista filosofico il concetto essenziale è quello della
provvisorietà dei risultati scientifici: una affermazione relativa ad un
fenomeno scientifico è un’ipotesi di lavoro, che resta provvisoriamente
valida fino a quando si osservano risultati sperimentali incompatibili
con essa.
A quel punto l’ipotesi di lavoro viene lasciata cadere perchè
inadeguata e sarà necessario sviluppare ipotesi diverse o più
complesse per spiegare il fenomeno.
Tali ipotesi saranno altrettanto provvisorie e sottoposte a verifica
sperimentale, ripetendo ciclicamente lo stesso percorso.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 9
Intuitivamente si vorrebbe formulare le ipotesi in modo da
confermarle.
“Se la mia ipotesi è vera potrò ripetere molte volte gli stessi
esperimenti ed i loro risultati ripetuti la confermeranno”.
Se così fosse, la ripetizione di un esperimento consentirebbe di
confermare l'ipotesi. Sarebbe quindi utile condurre ripetuti
esperimenti al solo scopo di confermare un'ipotesi che si ritiene
valida.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 10
Alcuni filosofi, in particolare Karl Popper hanno invece
evidenziato come la semplice reiterazione di un risultato non sia
di per sé conferma di una teoria.
Una teoria non può essere confermata ma soltanto rifiutata. Si
giunge al rifiuto quando le conclusioni basate sulla toria non
sono più compatibili con risultati sperimentali.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 11
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 12
Pertanto secondo Popper, il ricercatore deve formulare una
teoria compatibile con tutte le conoscenze già disponibili e
condurre esperimenti per “metterla in crisi”.
- La funzione dell'esperimento è solo di mettere in crisi una
teoria, portando fatti nuovi in contraddizione con essa.
- Ripetere esperimenti relativi ad una teoria già confutata è
inutile.
- Cercare di confermare una teoria ripetendo esperimenti che
sono la replica di esperimenti precedenti è altrettanto inutile.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 13
Come può il ricercatore che lavora dopo questa rivoluzione
epistemologica sostenere una teoria? Attraverso il
procedimento di verifica dell'ipotesi.
L'ipotesi che corrisponde alla teoria è detta ipotesi di lavoro.
Abbiamo visto che la semplice ripetizione di esperimenti non
basta a confermare una teoria e la corrispondente ipotesi di
lavoro.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 14
L'unica soluzione che rimane è quindi formulare un'ipotesi
contrastante con essa e cercare di negarla con evidenze
sperimentali.
Questa ipotesi costruita ad arte è detta ipotesi nulla.
L’esperimento non ha la funzione di ‘sostenere’ l’ipotesi di
lavoro ma, all’opposto ha la funzione di cercare di negare
un’ipotesi simmetrica ed opposta ad essa, costruita
appositamente e detta ipotesi nulla.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 15
Il procedimento prevede un percorso analogo a quello delle
dimostrazioni per assurdo usate spesso in matematica ed in
geometria.
Se l’esperimento nega l’ipotesi nulla, la teoria (ipotesi di lavoro)
resta corroborata (attenzione: non “provata”!).
La teoria resta provvisoriamente valida fino a quando un diverso
esperimento entrerà in contraddizione con essa.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 16
Se invece l’esperimento non nega l’ipotesi nulla, sarà l’ipotesi di
lavoro (quindi la teoria da cui deriva) a dover essere rivista.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 17
La realtà non è perfetta ed esistono errori 'giudiziari'.
Realtà
Verdetto Colpevole Innocente
Colpevole Corretto Non corretto
Innocente Non corretto Corretto
In statistica questi errori accadono in conseguenza della
variabilità casuale.
Lo statistico indica il rischio che considera accettabile di fornire una
conclusione diversa dalla realtà (ignota).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 18
Nel procedimento di verifica delle ipotesi applichiamo metodi
probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla
quando essa è vera.
Si parla in questo caso di Errore di 1° tipo o Errore α.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 19
Ipotesi nulla
Statistico falsa vera
Rifiuta Corretto Non corretto
Non rifiuta Non corretto Corretto
Ipotesi nulla
Statistico falsa vera
Rifiuta Corretto Errore α
Non rifiuta Errore β Corretto
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 20
Di solito l’errore di primo tipo è fissato al 5% (α = 0.05).
Questo significa che ripetendo molte volte un esperimento, nella
situazione in cui H0 è vera, ci troveremo a rifiutarla nel 5% degli
esperimenti.
Come può accadere?
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 21
Basta che il nostro campione sia uno di questi!
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 22
Le fasi del procedimento di verifica dell’ipotesi:
1. Il ricercatore formula un’ipotesi di lavoro, che costituisce la
spiegazione di un fenomeno o indica il valore di un parametro.
2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore
intende sottoporre a verifica, costruita in modo simmetrico all’ipotesi
di lavoro e formulata in modo tale da poter essere negata
dall’esperimento programmato.
3. Viene valutato dal ricercatore quanto è grande il rischio per lui
accettabile di fornire una conclusione diversa dalla realtà (a lui
ignota).
4. Viene disegnato l’esperimento e viene definita la dimensione del
campione.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 23
5. Vengono delineati tutti i possibili risultati dell’esperimento e viene
calcolata la probabilità associata a ciascun risultato, data l’ipotesi
nulla.
6. Viene scelto il test statistico appropriato.
7. Viene condotto l’esperimento.
8. Il risultato dell’esperimento viene letto e confrontato con la
distribuzione di probabilità precedentemente calcolata. Se la
probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è
inferiore alla soglia definita al punto 3 precedente, si conclude per il
rifiuto dell’ipotesi nulla.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 24
Il percorso logico del test dell'ipotesi è comune a tutti i test
statistici. Ricostruiamolo con il seguente esempio per il
confronto della media.
1.Ipotizzo in base all’osservazione clinica sui miei pazienti che il
fumo di tabacco modifica i valori pressori nei forti fumatori (H1: i
forti fumatori hanno pressione media diversa rispetto alla
popolazione non fumatrice).
2. H0: 'i forti fumatori hanno la stessa pressione media della
popolazione'.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 25
Il valore medio nella popolazione è 145, conosciuto da studi
precedenti.
ll valore della deviazione standard nella popolazione, conosciuto
da studi precedenti, è 8,5.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 26
3. fisso l'errore α al 5%; sono interessato ad eventuali
scostamenti in entrambe le direzioni (test di ipotesi bilaterale o
'a 2 code').
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 27
4. Programmo uno studio in cui viene misurata la pressione
arteriosa sistolica a 23 soggetti.
5. La variabile 'pressione arteriosa' nella popolazione ha
distribuzione gaussiana. Pertanto la distribuzione di probabilità
delle medie campionarie è data dalla distribuzione gaussiana
anche se il campione è piccolo.
6. Il test statistico è il test z. (Il test mi indicherà la probabilità
che i soggetti studiati siano un campione casuale estratto da
una popolazione con i valori dati di media e deviazione
standard).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 28
7. Conduco lo studio ed ottengo i seguenti risultati.
Media = 148,5
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 29
8a Calcolo del test .
Media campione = 148,5
media popolazione = 145
Deviazione standard popolazione = 8,5
n = 23
8b Interpreto il risultato ottenuto con l’uso delle tavole della
distribuzione normale standard.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 30
8a Calcolo del test .
z = (Media campione – media popolazione) / Errore standard =
(148,5 – 145) / (8,5 / radq(23)) = 3,5 / 1,772 = 1,97
8b Interpreto il risultato ottenuto con l’uso delle tavole della
distribuzione normale standard.
La probabilità che il campione sia stato estratto da una
popolazione con media pari a 145 mmHg è < 0,05.
Rifiuto l’ipotesi nulla che il campione sia stato estratto da una
popolazione con tale media.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 31
ESEMPIO 2.
Il caso della distribuzione binomiale
Esaminiamo i diversi punti sviluppando la semplice situazione della
verifica di un’ipotesi relativa al bilanciamento di una moneta.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 32
1. Il ricercatore formula un’ipotesi di lavoro, che costituisce la
spiegazione di un fenomeno o il valore di un parametro.
Il processo che porta alla formulazione della teoria e quindi dell’ipotesi
di lavoro non è statistico ma entrano in gioco molteplici elementi, tra
cui:
- studio delle precedenti teorie (la ricerca di letteratura);
- conoscenze su altri fenomeni collegati a quello che si vuole
indagare (es. studi di laboratorio, informazioni su meccanismi di
azione);
- osservazioni empiriche (es. osservazioni cliniche ripetute).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 33
Questo percorso non è codificato: un aspetto importante è costituito
da inventiva e capacità del ricercatore e dalla capacità di riconoscere
aspetti che non corrispondono alle previsioni basate sulle ipotesi di
lavoro correnti.
E’ importante la rivalutazione sotto nuove prospettive delle
conoscenze già acquisite.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 34
Esempio.
Descrizione delle conoscenze e del contesto che ha generato l’ipotesi.
Al tavolo da gioco (lancio di una moneta) si osserva un giocatore
particolarmente fortunato la cui moneta viene frequentemente lanciata
in modo a lui favorevole.
L’ipotesi di lavoro che viene formulata è che la moneta sia alterata e
quindi uno dei possibili risultati (testa) compaia con frequenza diversa
da quanto sarebbe atteso da una moneta bilanciata.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 35
I controlli di laboratorio che abbiamo potuto effettuare non sono stati
indicativi sulla simmetria e sul bilanciamento della moneta.
Non possono essere escluse altre ipotesi, quali l’abilità del giocatore o
il caso.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 36
2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore
intende sottoporre a verifica
La formulazione è simmetrica a quella dell’ipotesi di lavoro.
Ipotesi di lavoro (anche detta Ipotesi alternativa).
H1: ‘la moneta è alterata in modo tale che un risultato si verifichi con
frequenza diversa rispetto all'altro’.
Ipotesi nulla.
H0: ‘la moneta è bilanciata. L'attesa è che i due risultati si verifichino
con eguale frequenza’.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 37
H0 è formulata in modo tale da poter essere negata dall’esperimento
programmato.
Le conseguenze dell’affermazione dell’ipotesi nulla sono quantificabili
(se la moneta è bilanciata si applica la distribuzione binomiale con
π=0.5), pertanto l’ipotesi nulla è formulata in modo tale da poter
essere negata.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 38
3. Lo statistico indica il rischio accettabile di fornire una conclusione
diversa dalla realtà (a lui ignota).
a. Nel procedimento di verifica delle ipotesi applichiamo metodi
probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla
quando essa è vera.
Si parla in questo caso di Errore di 1° tipo o Errore α.
Di solito l’errore di primo tipo è fissato al 5% (α = 0.05).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 39
Ipotesi nulla
Statistico falsa vera
Rifiuta Corretto Non corretto
Non rifiuta Non corretto Corretto
Ipotesi nulla
Statistico falsa vera
Rifiuta Corretto Errore α
Non rifiuta Errore β Corretto
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 40
Calcoliamo le combinazioni di teste e croci che corrispondono al rifiuto
dell’ipotesi nulla, con errore di primo tipo inferiore al 5%
Croci Teste p
0 10
1 9
2 8
3 7
4 6
5 5
6 4
7 3
8 2
9 1
10 0
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 41
N
P(r successi su N prove) =
(R
) (π)r (1-π)(N-r)
N
(R
)
= N! / [r! (N-r)!]
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 42
Se fissiamo l'errore α a 0,05, rifiuteremo l'ipotesi nulla solo se
l'esperimento di 10 lanci ha dato uno tra i seguenti risultati:
0 teste
1 testa
9 teste
10 teste
Se l'ipotesi nulla è vera, questi sono i valori (simmetrici nelle due
code) la cui probabilità sommata è < 0,05.
Sono evenienze remote, sempre che l'ipotesi nulla sia vera.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 43
Distribuzione binomiale N=10
0,000
0,050
0,100
0,150
0,200
0,250
0,300
pro
bab
ilit
à
0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001
0 1 2 3 4 5 6 7 8 9 10
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 44
Nel caso si voglia essere maggiormente ‘conservativi’ nella difesa
dell’ipotesi nulla si sceglie α = 0.01
Nel caso si voglia essere maggiormente ‘favorevoli’ all’ipotesi di lavoro
si sceglie α = 0.10
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 45
b. Lo statistico misura anche il rischio di non rifiutare l’ipotesi nulla
quando essa è falsa.
Si parla in questo caso di Errore di 2° tipo o Errore β.
Complementare all'errore β abbiamo la potenza dello studio:
Potenza = 1 – (Errore β)
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 46
Ipotesi nulla
Statistico falsa vera
Rifiuta Corretto Non corretto
Non rifiuta Non corretto Corretto
Ipotesi nulla
Statistico falsa vera
Rifiuta Corretto Errore α
Non rifiuta Errore β Corretto
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 47
Di solito si disegna l'esperimento in modo che la potenza sia tra 80%
e 90% (rispettivamente: β = 0.20 o β = 0.10).
In alternativa possiamo misurare l'errore β corrispondente ad una data
numerosità campionaria.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 48
Supponiamo che la realtà sia di una monetina sbilanciata, con π=0.75
e (1-π)=0.25. Questa è la distribuzione di probabilità.
distribuzione binomiale n=10
0,000
0,050
0,100
0,150
0,200
0,250
0,300
numero successi
pro
bab
ilit
à
0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056
0 1 2 3 4 5 6 7 8 9 10
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 49
Possiamo quantificare l'errore β misurando la probabilità di estrarre
uno dei valori per cui non rifiuteremmo l'ipotesi nulla.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 50
L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10, π=0,75).
Si noti l’ampia sovrapposizione. Diversi risultati sono compatibili con entrambe le distribuzioni
Distribuzione binomiale N=10
0,000
0,050
0,100
0,150
0,200
0,250
0,300
numero di successi
pro
bab
ilità
0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001
0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056
0 1 2 3 4 5 6 7 8 9 10
Risultati che portano al rifiuto dell'ipotesi nulla
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 51
In questo caso l'errore β è molto alto:
0,282+0,250+0,146+0,058+0,016+0,003 = 0,755
Conclusione: l'esperimento è mal disegnato. Lo studio è inadeguato a
mettere in evidenza una differenza elevata (0,75 vs. 0,5) nella
probabilità di ottenere testa al lancio della moneta.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 52
Come possiamo procedere?
Solo aumentando le dimensioni del campione possiamo ridurre sia
l’errore α sia l’errore β (l’argomento sarà ripreso in seguito).
Se le dimensioni del campione non cambiano:
diminuendo α aumenta β
e viceversa.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 53
Senza anticipare la lezione sulla potenza dello studio, consideriamo
nei prossimi lucidi la sovrapposizione tra due distribuzioni di
probabilità binomiali con il variare di N.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 54
L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10,
π=0,75). Si noti l’ampia sovrapposizione. Diversi risultati dell'esperimento sono compatibili con
entrambe le distribuzioni
Distribuzione binomiale N=10
0,000
0,050
0,100
0,150
0,200
0,250
0,300
numero di successi
pro
bab
ilità
0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001
0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056
0 1 2 3 4 5 6 7 8 9 10
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 55
L’istogramma presenta la distribuzione di probabilità binomiale per (N=50, π=0,5) e (N=50,
π=0,75). Si noti che la sovrapposizione è inferiore a quanto osservato nella figura precedente.
distribuzione binomiale n=50
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 2 4 6 8 10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
n. successi
pro
bab
ilità
0,500
0,750
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 56
In questo caso l'errore β è:
0,01482+0,00765+0,00365+0,00160+0,00065+0,00024+
0,00001= 0,02862 =
2,862 %
Conclusione: l'esperimento è ben disegnato. Lo studio ha una potenza
elevata per mettere in evidenza la differenza (0,75 vs. 0,5) nella
probabilità di ottenere testa al lancio della moneta.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 57
Attenzione quando parliamo di errori di 1° e 2° tipo ci riferiamo solo
agli errori campionari, cioè agli effetti della variabilità casuale, che
porta a differenze tra i diversi campioni.
Non esistono metodi statistici per ovviare agli errori sistematici.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 58
4. Viene disegnato l’esperimento e viene definita la dimensione del
campione.
Si ricorda qui che il termine ‘esperimento’ non si riferisce ai soli
esperimenti di laboratorio ma include anche gli studi epidemiologici
(osservazionali).
La dimensione del campione dipenderà dal risultato atteso dello
studio e dagli errori di primo e di secondo tipo. Il calcolo della
dimensione del campione sarà affrontato nelle successive lezioni.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 59
5. Vengono delineati tutti i possibili risultati dell’esperimento e viene
calcolata la probabilità associata a ciascun risultato, data l’ipotesi
nulla.
Si tratta qui di enumerare tutti i possibili risultati e quindi di calcolare la
probabilità associata a ciascun risultato, data H0.
Nell’esempio considerato, la funzioni di probabilità è la funzione
binomiale.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 60
N
P(r successi su N prove) =
(R
) (π)r (1-π)(N-r)
N
(R
)
= N! / [r! (N-r)!]
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 61
Distribuzione binomiale N=10, p=0.5
0,000
0,050
0,100
0,150
0,200
0,250
0,300
0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001
0 1 2 3 4 5 6 7 8 9 10
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 62
‘Qual è la probabilità di avere almeno un certo numero di successi (r)
dato un certo numero di prove (N)’?
In questo caso:
1 Calcolo la probabilità per tutti i numeri interi compresi tra r ed N
(inclusi)
2 Sommo la probabilità per ciascuno degli interi compresi tra r ed N
P(r’>=r in N prove) = p(r) + p(r+1) + …+ p(N-1) + p(N)
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 63
7. Viene scelto il test statistico appropriato.
Il test statistico serve a calcolare la probabilità associata al risultato
osservato dall’esperimento
Nell’esempio dato il test appropriato è il calcolo della distribuzione di
probabilità binomiale, che fornisce direttamente un valore di
probabilità.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 64
A quale delle due situazioni seguenti siamo interessati?
- valore di probabilità cumulativo del singolo risultato e di tutti i
risultati che si allontanano maggiormente dall’ipotesi nulla,
considerando soltanto una direzione (test di ipotesi
monolaterali).
- valore di probabilità cumulativo del singolo risultato e di tutti i
risultati che si allontanano maggiormente dall’ipotesi nulla,
considerando entrambe le direzioni (test di ipotesi bilaterali).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 65
Il grafico illustra la coda di sinistra (probabilità cumulativa <=0.05) della distribuzione di probabilità binomiale
con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori
considerati è non è esattamente uguale a 0.05 ma è lievemente inferiore.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 66
0
0,02
0,04
0,06
0,08
0,1
0,12
0 1 2 3 4 5 6 7 8 9 10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0,500
Serie1
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 67
Il grafico illustra la coda di destra (probabilità cumulativa => 0.95) della distribuzione di probabilità binomiale
con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori
considerati è lievemente inferiore a 0.05.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 68
0
0,02
0,04
0,06
0,08
0,1
0,12
0 1 2 3 4 5 6 7 8 9 10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0,500
Serie1
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 69
Il grafico illustra le due code (probabilità cumulativa <=0.05, equamente ripartita) della distribuzione di
probabilità binomiale con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità
cumulativa per i valori considerati è lievemente inferiore a 0.05 .
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 70
0
0,02
0,04
0,06
0,08
0,1
0,12
0 1 2 3 4 5 6 7 8 9 10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0,500
Serie1
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 71
8. Viene condotto l’esperimento.
Nell’esempio l’esperimento consiste semplicemente nel lancio della
moneta in oggetto per N volte (n=dimensione del campione).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 72
Il risultato dell’esperimento viene letto e confrontato con la
distribuzione di probabilità precedentemente calcolata. Se la
probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è
inferiore alla soglia definita al punto precedente, si conclude per il
rifiuto dell’ipotesi nulla.
Altrimenti si conclude per il 'non rifiuto' dell'ipotesi nulla.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 73
Il risultato dell’esperimento condotto con n=10 ha indicato 3 teste e
7 croci.
Il test a due code fornisce per tale risultato un valore di probabilità
cumulativa pari a 0,172 * 2 = 0,344.
La soglia era fissata a 0,05
L’ipotesi nulla non viene negata.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 74
Esercizio 1
A quale conclusione saremmo giunti con 15 teste e 35 croci in un
esperimento con 50 lanci?
Esercizio 2
A quale conclusione saremmo giunti con 8 teste in un esperimento
con 20 lanci?
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 75
Esempio 3
Il caso in cui è necessario usare la distribuzione t di Student
Il percorso logico del test dell'ipotesi è comune a tutti i tests statistici.
Ricostruiamolo con il seguente esempio per il confronto della media.
1.Ipotizzo in base a dati di laboratorio che il fumo di tabacco aumenti i
valori pressori nei forti fumatori (H1).
2. H0: 'i forti fumatori hanno la stessa pressione media della popolazione'.
3. fisso l'errore α al 5%; sono interessato ad eventuali scostamenti in
entrambe le direzioni (test di ipotesi bilaterale o 'a 2 code')
4. Programmo uno studio in cui viene misurata la pressione arteriosa
sistolica a 23 soggetti.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 76
5. La variabile 'pressione arteriosa' nella popolazione ha distribuzione
gaussiana. Pertanto la distribuzione di probabilità delle medie
campionarie è data dalla distribuzione gaussiana anche se il campione è
piccolo. I valore medio nella popolazione è 145. Non conosco il valore
della deviazione standard nella popolazione.
6. Il test statistico è il test t di student. (Il test mi indicherà la probabilità che
i soggetti studiati siano un campione casuale estratto da una popolazione
con media della pressione arteriosa sistolica pari a 145).
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 77
7. Conduco lo studio ed ottengo i seguenti risultati.
Media campionaria = 148,5
Deviazione standard campionaria = 8,5
L’errore standard sarà quindi = 1,772
8a Calcolo del test .
t = (Media campione – media popolazione) / Errore standard =
(148,5 – 145) / 1,772 = 1,974
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 78
8b Interpreto il risultato ottenuto con l’uso delle tavole della distribuzione t
di student con 22 g.l.
La probabilità che il campione sia stato estratto da una popolazione con
media pari a 145 mmHg è > 0,05.
Non escludo pertanto l’ipotesi nulla che il campione sia stato estratto da
una popolazione con tale media.
Discussione: Perchè il risultato discorda rispetto a quello ottenuto dal
precedente esempio 1?
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 79
Applichiamo le stesse tecniche in 3 situazioni distinte:
- campionamento casuale da popolazione definita
- campionamento da popolazione non enumerabile o non definita
- campionamento ‘immaginario’ avendo considerato tutti i soggetti
con caratteristiche idonee ma sapendo che essi sono solo parte
di una ‘popolazione teorica’.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 80
Test dell'ipotesi ed intervallo di confidenza sono strettamente
associati:
Ripetendo un campionamento dalla stessa popolazione, se vale l’ipotesi
nulla la proporzione di campioni il cui intervallo di confidenza non
comprende l’ ipotesi nulla è pari al valore dell’errore di 1° tipo.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 81
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 82
Cerchiamo di ricostruire il percorso dell’inferenza statistica in un articolo
pubblicato.
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 83
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 84
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 85
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 86
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 87
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 88
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 89
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 90
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 91
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 92
Esercizi sul testo
p 194 es. 1
p 194 es. 2
p 194 es. 3
p 194 es. 4
p 194 es. 6
p 194 es. 9 + calcolo dell'intervallo di confidenza al 95% ed al 99%
p 195 es. 11
p 195 es. 12