università del piemonte orientale corso di laurea in biotecnologia...

46
Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 1 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Test di ipotesi Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2

Upload: others

Post on 07-Aug-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 1

Università del Piemonte Orientale

Corso di laurea in biotecnologia

Corso di Statistica Medica

Test di ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2

Page 2: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 3

Inferenza statistica : ‘…indurre o inferire proprietà di un universo

[parametri] sulla base dei dati conosciuti relativi ad un campione

[statistiche].’ (H.M.Blalock).

Solo eccezionalmente conosciamo direttamente le caratteristiche della

popolazione, di solito dobbiamo stimarle in base alle caratteristiche

dei campioni che sono stati estratti dalla popolazione.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 4

Possiamo trarre conclusioni sul valore del parametro nella

popolazione a partire dai dati campionari seguendo due percorsi:

1. Il calcolo dell'intervallo di confidenza

2. Il test dell'ipotesi

Page 3: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 5

Il test dell'ipotesi verifica se il campione è compatibile con un’ipotesi

relativa alle caratteristiche della popolazione.

Il campione non interessa di per sé ma solo in quanto consente di

stimare le caratteristiche della popolazione.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 6

La verifica (o test) dell’ipotesi è un procedimento logico.

Il procedimento prevede dapprima la formulazione dell’ipotesi e quindi

la valutazione della probabilità di ottenere il campione dato se l’ipotesi

è vera.

Page 4: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 7

Che cos'è un’ipotesi?

‘Un ipotesi è un’affermazione relativa ad un evento futuro, o

comunque ad un evento il cui risultato è sconosciuto al momento in

cui l’affermazione viene fatta, costruita in modo da poter risultare non

vera e pertanto da respinta.’ (H.M.Blalock).

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 8

Dal punto di vista filosofico il concetto essenziale è quello della

provvisorietà dei risultati scientifici: una affermazione relativa ad un

fenomeno scientifico è un’ipotesi di lavoro, che resta provvisoriamente

valida fino a quando si osservano risultati sperimentali incompatibili

con essa.

A quel punto l’ipotesi di lavoro viene lasciata cadere perchè

inadeguata e sarà necessario sviluppare ipotesi diverse o più

complesse per spiegare il fenomeno.

Tali ipotesi saranno altrettanto provvisorie e sottoposte a verifica

sperimentale, ripetendo ciclicamente lo stesso percorso.

Page 5: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 9

Intuitivamente si vorrebbe formulare le ipotesi in modo da

confermarle.

“Se la mia ipotesi è vera potrò ripetere molte volte gli stessi

esperimenti ed i loro risultati ripetuti la confermeranno”.

Se così fosse, la ripetizione di un esperimento consentirebbe di

confermare l'ipotesi. Sarebbe quindi utile condurre ripetuti

esperimenti al solo scopo di confermare un'ipotesi che si ritiene

valida.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 10

Alcuni filosofi, in particolare Karl Popper hanno invece

evidenziato come la semplice reiterazione di un risultato non sia

di per sé conferma di una teoria.

Una teoria non può essere confermata ma soltanto rifiutata. Si

giunge al rifiuto quando le conclusioni basate sulla toria non

sono più compatibili con risultati sperimentali.

Page 6: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 11

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 12

Pertanto secondo Popper, il ricercatore deve formulare una

teoria compatibile con tutte le conoscenze già disponibili e

condurre esperimenti per “metterla in crisi”.

- La funzione dell'esperimento è solo di mettere in crisi una

teoria, portando fatti nuovi in contraddizione con essa.

- Ripetere esperimenti relativi ad una teoria già confutata è

inutile.

- Cercare di confermare una teoria ripetendo esperimenti che

sono la replica di esperimenti precedenti è altrettanto inutile.

Page 7: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 13

Come può il ricercatore che lavora dopo questa rivoluzione

epistemologica sostenere una teoria? Attraverso il

procedimento di verifica dell'ipotesi.

L'ipotesi che corrisponde alla teoria è detta ipotesi di lavoro.

Abbiamo visto che la semplice ripetizione di esperimenti non

basta a confermare una teoria e la corrispondente ipotesi di

lavoro.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 14

L'unica soluzione che rimane è quindi formulare un'ipotesi

contrastante con essa e cercare di negarla con evidenze

sperimentali.

Questa ipotesi costruita ad arte è detta ipotesi nulla.

L’esperimento non ha la funzione di ‘sostenere’ l’ipotesi di

lavoro ma, all’opposto ha la funzione di cercare di negare

un’ipotesi simmetrica ed opposta ad essa, costruita

appositamente e detta ipotesi nulla.

Page 8: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 15

Il procedimento prevede un percorso analogo a quello delle

dimostrazioni per assurdo usate spesso in matematica ed in

geometria.

Se l’esperimento nega l’ipotesi nulla, la teoria (ipotesi di lavoro)

resta corroborata (attenzione: non “provata”!).

La teoria resta provvisoriamente valida fino a quando un diverso

esperimento entrerà in contraddizione con essa.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 16

Se invece l’esperimento non nega l’ipotesi nulla, sarà l’ipotesi di

lavoro (quindi la teoria da cui deriva) a dover essere rivista.

Page 9: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 17

La realtà non è perfetta ed esistono errori 'giudiziari'.

Realtà

Verdetto Colpevole Innocente

Colpevole Corretto Non corretto

Innocente Non corretto Corretto

In statistica questi errori accadono in conseguenza della

variabilità casuale.

Lo statistico indica il rischio che considera accettabile di fornire una

conclusione diversa dalla realtà (ignota).

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 18

Nel procedimento di verifica delle ipotesi applichiamo metodi

probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla

quando essa è vera.

Si parla in questo caso di Errore di 1° tipo o Errore α.

Page 10: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 19

Ipotesi nulla

Statistico falsa vera

Rifiuta Corretto Non corretto

Non rifiuta Non corretto Corretto

Ipotesi nulla

Statistico falsa vera

Rifiuta Corretto Errore α

Non rifiuta Errore β Corretto

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 20

Di solito l’errore di primo tipo è fissato al 5% (α = 0.05).

Questo significa che ripetendo molte volte un esperimento, nella

situazione in cui H0 è vera, ci troveremo a rifiutarla nel 5% degli

esperimenti.

Come può accadere?

Page 11: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 21

Basta che il nostro campione sia uno di questi!

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 22

Le fasi del procedimento di verifica dell’ipotesi:

1. Il ricercatore formula un’ipotesi di lavoro, che costituisce la

spiegazione di un fenomeno o indica il valore di un parametro.

2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore

intende sottoporre a verifica, costruita in modo simmetrico all’ipotesi

di lavoro e formulata in modo tale da poter essere negata

dall’esperimento programmato.

3. Viene valutato dal ricercatore quanto è grande il rischio per lui

accettabile di fornire una conclusione diversa dalla realtà (a lui

ignota).

4. Viene disegnato l’esperimento e viene definita la dimensione del

campione.

Page 12: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 23

5. Vengono delineati tutti i possibili risultati dell’esperimento e viene

calcolata la probabilità associata a ciascun risultato, data l’ipotesi

nulla.

6. Viene scelto il test statistico appropriato.

7. Viene condotto l’esperimento.

8. Il risultato dell’esperimento viene letto e confrontato con la

distribuzione di probabilità precedentemente calcolata. Se la

probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è

inferiore alla soglia definita al punto 3 precedente, si conclude per il

rifiuto dell’ipotesi nulla.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 24

Il percorso logico del test dell'ipotesi è comune a tutti i test

statistici. Ricostruiamolo con il seguente esempio per il

confronto della media.

1.Ipotizzo in base all’osservazione clinica sui miei pazienti che il

fumo di tabacco modifica i valori pressori nei forti fumatori (H1: i

forti fumatori hanno pressione media diversa rispetto alla

popolazione non fumatrice).

2. H0: 'i forti fumatori hanno la stessa pressione media della

popolazione'.

Page 13: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 25

Il valore medio nella popolazione è 145, conosciuto da studi

precedenti.

ll valore della deviazione standard nella popolazione, conosciuto

da studi precedenti, è 8,5.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 26

3. fisso l'errore α al 5%; sono interessato ad eventuali

scostamenti in entrambe le direzioni (test di ipotesi bilaterale o

'a 2 code').

Page 14: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 27

4. Programmo uno studio in cui viene misurata la pressione

arteriosa sistolica a 23 soggetti.

5. La variabile 'pressione arteriosa' nella popolazione ha

distribuzione gaussiana. Pertanto la distribuzione di probabilità

delle medie campionarie è data dalla distribuzione gaussiana

anche se il campione è piccolo.

6. Il test statistico è il test z. (Il test mi indicherà la probabilità

che i soggetti studiati siano un campione casuale estratto da

una popolazione con i valori dati di media e deviazione

standard).

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 28

7. Conduco lo studio ed ottengo i seguenti risultati.

Media = 148,5

Page 15: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 29

8a Calcolo del test .

Media campione = 148,5

media popolazione = 145

Deviazione standard popolazione = 8,5

n = 23

8b Interpreto il risultato ottenuto con l’uso delle tavole della

distribuzione normale standard.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 30

8a Calcolo del test .

z = (Media campione – media popolazione) / Errore standard =

(148,5 – 145) / (8,5 / radq(23)) = 3,5 / 1,772 = 1,97

8b Interpreto il risultato ottenuto con l’uso delle tavole della

distribuzione normale standard.

La probabilità che il campione sia stato estratto da una

popolazione con media pari a 145 mmHg è < 0,05.

Rifiuto l’ipotesi nulla che il campione sia stato estratto da una

popolazione con tale media.

Page 16: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 31

ESEMPIO 2.

Il caso della distribuzione binomiale

Esaminiamo i diversi punti sviluppando la semplice situazione della

verifica di un’ipotesi relativa al bilanciamento di una moneta.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 32

1. Il ricercatore formula un’ipotesi di lavoro, che costituisce la

spiegazione di un fenomeno o il valore di un parametro.

Il processo che porta alla formulazione della teoria e quindi dell’ipotesi

di lavoro non è statistico ma entrano in gioco molteplici elementi, tra

cui:

- studio delle precedenti teorie (la ricerca di letteratura);

- conoscenze su altri fenomeni collegati a quello che si vuole

indagare (es. studi di laboratorio, informazioni su meccanismi di

azione);

- osservazioni empiriche (es. osservazioni cliniche ripetute).

Page 17: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 33

Questo percorso non è codificato: un aspetto importante è costituito

da inventiva e capacità del ricercatore e dalla capacità di riconoscere

aspetti che non corrispondono alle previsioni basate sulle ipotesi di

lavoro correnti.

E’ importante la rivalutazione sotto nuove prospettive delle

conoscenze già acquisite.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 34

Esempio.

Descrizione delle conoscenze e del contesto che ha generato l’ipotesi.

Al tavolo da gioco (lancio di una moneta) si osserva un giocatore

particolarmente fortunato la cui moneta viene frequentemente lanciata

in modo a lui favorevole.

L’ipotesi di lavoro che viene formulata è che la moneta sia alterata e

quindi uno dei possibili risultati (testa) compaia con frequenza diversa

da quanto sarebbe atteso da una moneta bilanciata.

Page 18: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 35

I controlli di laboratorio che abbiamo potuto effettuare non sono stati

indicativi sulla simmetria e sul bilanciamento della moneta.

Non possono essere escluse altre ipotesi, quali l’abilità del giocatore o

il caso.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 36

2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore

intende sottoporre a verifica

La formulazione è simmetrica a quella dell’ipotesi di lavoro.

Ipotesi di lavoro (anche detta Ipotesi alternativa).

H1: ‘la moneta è alterata in modo tale che un risultato si verifichi con

frequenza diversa rispetto all'altro’.

Ipotesi nulla.

H0: ‘la moneta è bilanciata. L'attesa è che i due risultati si verifichino

con eguale frequenza’.

Page 19: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 37

H0 è formulata in modo tale da poter essere negata dall’esperimento

programmato.

Le conseguenze dell’affermazione dell’ipotesi nulla sono quantificabili

(se la moneta è bilanciata si applica la distribuzione binomiale con

π=0.5), pertanto l’ipotesi nulla è formulata in modo tale da poter

essere negata.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 38

3. Lo statistico indica il rischio accettabile di fornire una conclusione

diversa dalla realtà (a lui ignota).

a. Nel procedimento di verifica delle ipotesi applichiamo metodi

probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla

quando essa è vera.

Si parla in questo caso di Errore di 1° tipo o Errore α.

Di solito l’errore di primo tipo è fissato al 5% (α = 0.05).

Page 20: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 39

Ipotesi nulla

Statistico falsa vera

Rifiuta Corretto Non corretto

Non rifiuta Non corretto Corretto

Ipotesi nulla

Statistico falsa vera

Rifiuta Corretto Errore α

Non rifiuta Errore β Corretto

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 40

Calcoliamo le combinazioni di teste e croci che corrispondono al rifiuto

dell’ipotesi nulla, con errore di primo tipo inferiore al 5%

Croci Teste p

0 10

1 9

2 8

3 7

4 6

5 5

6 4

7 3

8 2

9 1

10 0

Page 21: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 41

N

P(r successi su N prove) =

(R

) (π)r (1-π)(N-r)

N

(R

)

= N! / [r! (N-r)!]

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 42

Se fissiamo l'errore α a 0,05, rifiuteremo l'ipotesi nulla solo se

l'esperimento di 10 lanci ha dato uno tra i seguenti risultati:

0 teste

1 testa

9 teste

10 teste

Se l'ipotesi nulla è vera, questi sono i valori (simmetrici nelle due

code) la cui probabilità sommata è < 0,05.

Sono evenienze remote, sempre che l'ipotesi nulla sia vera.

Page 22: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 43

Distribuzione binomiale N=10

0,000

0,050

0,100

0,150

0,200

0,250

0,300

pro

bab

ilit

à

0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001

0 1 2 3 4 5 6 7 8 9 10

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 44

Nel caso si voglia essere maggiormente ‘conservativi’ nella difesa

dell’ipotesi nulla si sceglie α = 0.01

Nel caso si voglia essere maggiormente ‘favorevoli’ all’ipotesi di lavoro

si sceglie α = 0.10

Page 23: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 45

b. Lo statistico misura anche il rischio di non rifiutare l’ipotesi nulla

quando essa è falsa.

Si parla in questo caso di Errore di 2° tipo o Errore β.

Complementare all'errore β abbiamo la potenza dello studio:

Potenza = 1 – (Errore β)

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 46

Ipotesi nulla

Statistico falsa vera

Rifiuta Corretto Non corretto

Non rifiuta Non corretto Corretto

Ipotesi nulla

Statistico falsa vera

Rifiuta Corretto Errore α

Non rifiuta Errore β Corretto

Page 24: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 47

Di solito si disegna l'esperimento in modo che la potenza sia tra 80%

e 90% (rispettivamente: β = 0.20 o β = 0.10).

In alternativa possiamo misurare l'errore β corrispondente ad una data

numerosità campionaria.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 48

Supponiamo che la realtà sia di una monetina sbilanciata, con π=0.75

e (1-π)=0.25. Questa è la distribuzione di probabilità.

distribuzione binomiale n=10

0,000

0,050

0,100

0,150

0,200

0,250

0,300

numero successi

pro

bab

ilit

à

0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056

0 1 2 3 4 5 6 7 8 9 10

Page 25: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 49

Possiamo quantificare l'errore β misurando la probabilità di estrarre

uno dei valori per cui non rifiuteremmo l'ipotesi nulla.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 50

L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10, π=0,75).

Si noti l’ampia sovrapposizione. Diversi risultati sono compatibili con entrambe le distribuzioni

Distribuzione binomiale N=10

0,000

0,050

0,100

0,150

0,200

0,250

0,300

numero di successi

pro

bab

ilità

0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001

0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056

0 1 2 3 4 5 6 7 8 9 10

Risultati che portano al rifiuto dell'ipotesi nulla

Page 26: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 51

In questo caso l'errore β è molto alto:

0,282+0,250+0,146+0,058+0,016+0,003 = 0,755

Conclusione: l'esperimento è mal disegnato. Lo studio è inadeguato a

mettere in evidenza una differenza elevata (0,75 vs. 0,5) nella

probabilità di ottenere testa al lancio della moneta.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 52

Come possiamo procedere?

Solo aumentando le dimensioni del campione possiamo ridurre sia

l’errore α sia l’errore β (l’argomento sarà ripreso in seguito).

Se le dimensioni del campione non cambiano:

diminuendo α aumenta β

e viceversa.

Page 27: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 53

Senza anticipare la lezione sulla potenza dello studio, consideriamo

nei prossimi lucidi la sovrapposizione tra due distribuzioni di

probabilità binomiali con il variare di N.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 54

L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10,

π=0,75). Si noti l’ampia sovrapposizione. Diversi risultati dell'esperimento sono compatibili con

entrambe le distribuzioni

Distribuzione binomiale N=10

0,000

0,050

0,100

0,150

0,200

0,250

0,300

numero di successi

pro

bab

ilità

0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001

0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056

0 1 2 3 4 5 6 7 8 9 10

Page 28: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 55

L’istogramma presenta la distribuzione di probabilità binomiale per (N=50, π=0,5) e (N=50,

π=0,75). Si noti che la sovrapposizione è inferiore a quanto osservato nella figura precedente.

distribuzione binomiale n=50

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 2 4 6 8 10

12

14

16

18

20

22

24

26

28

30

32

34

36

38

40

42

44

46

48

50

n. successi

pro

bab

ilità

0,500

0,750

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 56

In questo caso l'errore β è:

0,01482+0,00765+0,00365+0,00160+0,00065+0,00024+

0,00001= 0,02862 =

2,862 %

Conclusione: l'esperimento è ben disegnato. Lo studio ha una potenza

elevata per mettere in evidenza la differenza (0,75 vs. 0,5) nella

probabilità di ottenere testa al lancio della moneta.

Page 29: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 57

Attenzione quando parliamo di errori di 1° e 2° tipo ci riferiamo solo

agli errori campionari, cioè agli effetti della variabilità casuale, che

porta a differenze tra i diversi campioni.

Non esistono metodi statistici per ovviare agli errori sistematici.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 58

4. Viene disegnato l’esperimento e viene definita la dimensione del

campione.

Si ricorda qui che il termine ‘esperimento’ non si riferisce ai soli

esperimenti di laboratorio ma include anche gli studi epidemiologici

(osservazionali).

La dimensione del campione dipenderà dal risultato atteso dello

studio e dagli errori di primo e di secondo tipo. Il calcolo della

dimensione del campione sarà affrontato nelle successive lezioni.

Page 30: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 59

5. Vengono delineati tutti i possibili risultati dell’esperimento e viene

calcolata la probabilità associata a ciascun risultato, data l’ipotesi

nulla.

Si tratta qui di enumerare tutti i possibili risultati e quindi di calcolare la

probabilità associata a ciascun risultato, data H0.

Nell’esempio considerato, la funzioni di probabilità è la funzione

binomiale.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 60

N

P(r successi su N prove) =

(R

) (π)r (1-π)(N-r)

N

(R

)

= N! / [r! (N-r)!]

Page 31: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 61

Distribuzione binomiale N=10, p=0.5

0,000

0,050

0,100

0,150

0,200

0,250

0,300

0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001

0 1 2 3 4 5 6 7 8 9 10

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 62

‘Qual è la probabilità di avere almeno un certo numero di successi (r)

dato un certo numero di prove (N)’?

In questo caso:

1 Calcolo la probabilità per tutti i numeri interi compresi tra r ed N

(inclusi)

2 Sommo la probabilità per ciascuno degli interi compresi tra r ed N

P(r’>=r in N prove) = p(r) + p(r+1) + …+ p(N-1) + p(N)

Page 32: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 63

7. Viene scelto il test statistico appropriato.

Il test statistico serve a calcolare la probabilità associata al risultato

osservato dall’esperimento

Nell’esempio dato il test appropriato è il calcolo della distribuzione di

probabilità binomiale, che fornisce direttamente un valore di

probabilità.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 64

A quale delle due situazioni seguenti siamo interessati?

- valore di probabilità cumulativo del singolo risultato e di tutti i

risultati che si allontanano maggiormente dall’ipotesi nulla,

considerando soltanto una direzione (test di ipotesi

monolaterali).

- valore di probabilità cumulativo del singolo risultato e di tutti i

risultati che si allontanano maggiormente dall’ipotesi nulla,

considerando entrambe le direzioni (test di ipotesi bilaterali).

Page 33: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 65

Il grafico illustra la coda di sinistra (probabilità cumulativa <=0.05) della distribuzione di probabilità binomiale

con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori

considerati è non è esattamente uguale a 0.05 ma è lievemente inferiore.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 66

0

0,02

0,04

0,06

0,08

0,1

0,12

0 1 2 3 4 5 6 7 8 9 10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

0,500

Serie1

Page 34: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 67

Il grafico illustra la coda di destra (probabilità cumulativa => 0.95) della distribuzione di probabilità binomiale

con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori

considerati è lievemente inferiore a 0.05.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 68

0

0,02

0,04

0,06

0,08

0,1

0,12

0 1 2 3 4 5 6 7 8 9 10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

0,500

Serie1

Page 35: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 69

Il grafico illustra le due code (probabilità cumulativa <=0.05, equamente ripartita) della distribuzione di

probabilità binomiale con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità

cumulativa per i valori considerati è lievemente inferiore a 0.05 .

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 70

0

0,02

0,04

0,06

0,08

0,1

0,12

0 1 2 3 4 5 6 7 8 9 10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

0,500

Serie1

Page 36: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 71

8. Viene condotto l’esperimento.

Nell’esempio l’esperimento consiste semplicemente nel lancio della

moneta in oggetto per N volte (n=dimensione del campione).

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 72

Il risultato dell’esperimento viene letto e confrontato con la

distribuzione di probabilità precedentemente calcolata. Se la

probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è

inferiore alla soglia definita al punto precedente, si conclude per il

rifiuto dell’ipotesi nulla.

Altrimenti si conclude per il 'non rifiuto' dell'ipotesi nulla.

Page 37: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 73

Il risultato dell’esperimento condotto con n=10 ha indicato 3 teste e

7 croci.

Il test a due code fornisce per tale risultato un valore di probabilità

cumulativa pari a 0,172 * 2 = 0,344.

La soglia era fissata a 0,05

L’ipotesi nulla non viene negata.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 74

Esercizio 1

A quale conclusione saremmo giunti con 15 teste e 35 croci in un

esperimento con 50 lanci?

Esercizio 2

A quale conclusione saremmo giunti con 8 teste in un esperimento

con 20 lanci?

Page 38: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 75

Esempio 3

Il caso in cui è necessario usare la distribuzione t di Student

Il percorso logico del test dell'ipotesi è comune a tutti i tests statistici.

Ricostruiamolo con il seguente esempio per il confronto della media.

1.Ipotizzo in base a dati di laboratorio che il fumo di tabacco aumenti i

valori pressori nei forti fumatori (H1).

2. H0: 'i forti fumatori hanno la stessa pressione media della popolazione'.

3. fisso l'errore α al 5%; sono interessato ad eventuali scostamenti in

entrambe le direzioni (test di ipotesi bilaterale o 'a 2 code')

4. Programmo uno studio in cui viene misurata la pressione arteriosa

sistolica a 23 soggetti.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 76

5. La variabile 'pressione arteriosa' nella popolazione ha distribuzione

gaussiana. Pertanto la distribuzione di probabilità delle medie

campionarie è data dalla distribuzione gaussiana anche se il campione è

piccolo. I valore medio nella popolazione è 145. Non conosco il valore

della deviazione standard nella popolazione.

6. Il test statistico è il test t di student. (Il test mi indicherà la probabilità che

i soggetti studiati siano un campione casuale estratto da una popolazione

con media della pressione arteriosa sistolica pari a 145).

Page 39: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 77

7. Conduco lo studio ed ottengo i seguenti risultati.

Media campionaria = 148,5

Deviazione standard campionaria = 8,5

L’errore standard sarà quindi = 1,772

8a Calcolo del test .

t = (Media campione – media popolazione) / Errore standard =

(148,5 – 145) / 1,772 = 1,974

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 78

8b Interpreto il risultato ottenuto con l’uso delle tavole della distribuzione t

di student con 22 g.l.

La probabilità che il campione sia stato estratto da una popolazione con

media pari a 145 mmHg è > 0,05.

Non escludo pertanto l’ipotesi nulla che il campione sia stato estratto da

una popolazione con tale media.

Discussione: Perchè il risultato discorda rispetto a quello ottenuto dal

precedente esempio 1?

Page 40: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 79

Applichiamo le stesse tecniche in 3 situazioni distinte:

- campionamento casuale da popolazione definita

- campionamento da popolazione non enumerabile o non definita

- campionamento ‘immaginario’ avendo considerato tutti i soggetti

con caratteristiche idonee ma sapendo che essi sono solo parte

di una ‘popolazione teorica’.

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 80

Test dell'ipotesi ed intervallo di confidenza sono strettamente

associati:

Ripetendo un campionamento dalla stessa popolazione, se vale l’ipotesi

nulla la proporzione di campioni il cui intervallo di confidenza non

comprende l’ ipotesi nulla è pari al valore dell’errore di 1° tipo.

Page 41: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 81

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 82

Cerchiamo di ricostruire il percorso dell’inferenza statistica in un articolo

pubblicato.

Page 42: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 83

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 84

Page 43: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 85

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 86

Page 44: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 87

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 88

Page 45: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 89

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 90

Page 46: Università del Piemonte Orientale Corso di laurea in biotecnologia …magnani/pdf/biotech_2009_8_test... · 2009-12-15 · L'unica soluzione che rimane è quindi formulare un'ipotesi

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 91

Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 92

Esercizi sul testo

p 194 es. 1

p 194 es. 2

p 194 es. 3

p 194 es. 4

p 194 es. 6

p 194 es. 9 + calcolo dell'intervallo di confidenza al 95% ed al 99%

p 195 es. 11

p 195 es. 12