imparare a vivere con l’incertezza calculated riskshostingwin.unitn.it/micciolo/phd/bayes.pdf ·...
Post on 18-Feb-2020
14 Views
Preview:
TRANSCRIPT
Quando i numeri ingannano
Imparare a vivere con l’incertezza
Calculated RisksGerd Gigerenzer
(Istituto Max Plank di Berlino)(Istituto Max Plank di Berlino)
a questo mondo non c’è niente di certo,a parte la morte e le tasse.
BENJAMIN FRANKLIN
A tutti capita di esseri convinti di sapere,e invece di sbagliare,
perché il nostro pensiero è inconsciamenteincanalato verso l’errore da “tunnel mentali ”.
In analogia con le “illusioni ottiche”,In analogia con le “illusioni ottiche”,sono state chiamate “illusioni cognitive ”.
Dove si colloca Trieste rispetto a Napoli?
Quante volte:nel decidere un investimento economico
nel decidere il luogo dove trascorrere le vacanze,nello stipulare una assicurazione
nel fornire un parere professionalenella scelta di un lavoro o della scuola
ci siamo affidati all’intuizione o,ci siamo affidati all’intuizione o,più semplicemente, al buon senso?
Ogni giorno dobbiamo risolvere problemi piccoli e grandi, nei campi più disparati,
con informazioni spesso insufficienti econ poco tempo a disposizione.
Il caso del reparto maternitàIn una città ci sono due cliniche con reparto maternità. Una è nettamente più grande dell'altra. Nella prima si registrano in media 45 nascite al giorno, nella seconda 15. Si decide di annotare, in ciascuna clinica, i giorni in cui i nati sono per oltre il 60% dello stesso genere. Quale delle due cliniche avrà un maggior numero di tali Quale delle due cliniche avrà un maggior numero di tali giorni? Sono eguali?
Precisazione: la percentuale di maschi e di femmine sul totale delle nascite è circa del cinquanta per cento, ma, la percentuale non sarà esattamente del 50% ogni giorno. Ci saranno giorni nei quali nasceranno per caso più maschi o più femmine. I giorni che vengono registrati sono quelli nei quali uno dei due generi ha una percentuale superiore al 60%.
• Ecco le risposte ottenute in media su un gran numero di soggetti:
Non c’è differenza 56% Non c’è differenza 56%
Nella clinica più grande 24%Nella clinica più piccola 20%
Qualunque sia stata la vostra risposta, proviamo ora a cambiare leggermente i dati di questo problema.Supponiamo, adesso, che in queste due cliniche si annotino sul registro speciale i giorni cliniche si annotino sul registro speciale i giorni nei quali i nati sono tutti dello stesso genere.Quale delle due cliniche registrerà un maggior numero di tali giorni?
Pensateci un momento.
Stando alle risposte ottenute nel passato inquesto tipo di test, a questo preciso punto,
dovremmo cominciare ad avvertire una qualche seria perplessità.
Qualcosa è andato storto nel nostro ragionamento.Può essere che quello che vale per il caso del
“60%” sia radicalmente diverso “60%” sia radicalmente diverso quando si arriva al 100% ?
Nella nostra testa le cose cominciano ariassestarsi, riconsideriamo il nostro giudizio iniziale e forse cominciamo
a intravvedere la risposta giusta.
È vero che si parte da un meccanismobiologico che genera una media del 50%,
ma il problema tratta di una fluttuazione statistica.
Una fluttuazione di ampiezza prefissata (nel nostro caso un 10% o più di scarto rispetto alla media) è tanto più probabile
quanto più piccolo è il campione. Non bisogna confondere le cause
(in questo caso biologiche) di un fenomeno con la probabilità di una fluttuazione casuale
nelle loro conseguenze.
La risposta giusta è
“nella clinica più piccola”, in quanto una fluttuazione è tanto più
probabile quanto più piccolo è il campione.Lo si vede bene nel caso in cui
tutti i nati sono dello stesso genere. tutti i nati sono dello stesso genere. Ci rendiamo conto che è più probabile avere
15 nati dello stesso genere nello stesso giorno
di quanto non sia probabile averne 45.
Paradosso di Monthy HallNota storica
Questo quesito è noto come il dilemma di “Monty Hall” perché fu proposto agli ospiti di un celebre gioco a premi televisivo americano “Let's make a deal”, il cui conduttore era appunto Monty Hall, e suscitò una conduttore era appunto Monty Hall, e suscitò una accesa controversia sulla rivista “Parade” nel 1990.Si tratta di una variante del Paradosso delle tre carte di Warren Weaver (1950) il quale, a sua volta, deriva dal Paradosso delle tre scatole proposto per la prima volta dal matematico francese Joseph Bertrand nel 1889.
Paradosso di Monthy Hall
3 scatole identiche
1 2 3
1) 1000 € in una scatola, le altre due sono vuote;2) scegliete una scatola;3) mostro il contenuto vuoto di una delle due non scelte;4) offro di cambiare la vostra con la rimanente chiusa.
Ed ecco il problema
Come regola generale, vi converrà mantenere la prima scelta, oppure mantenere la prima scelta, oppure cambiare?Quale sarà la strategia migliore?
L'intuizione, in questo caso, è schiacciante: sono rimaste due scatole, sono rimaste due scatole,
la probabilità deve essere del 50%.
È stata proposta anche la versione con un’automobile e due capreCi sono tre porte …
In questa versione il paradosso di Monty Hall è stato presentato in un episodio della serie televisiva Numb3rs
https://www.youtube.com/watch?v=PJWmi7Ovaag
Se si cambia, 2 volte su 3 si vince. Se non si cambia si vince 1 volta su 3.
⇓
⇓
⇓
la strategia vincente è quella dicambiare (sempre)!!!
VforVendettaWLa stupidità della probabilità : poteva benissimo aver trovato la carta giusta al primo colpo!
Le probabilità condizionateLe probabilità condizionate
• Nella popolazione generale la probabilità che una donna abbia un tumore al seno è dello 0.8 % (8/1000).
• Se una donna ha un tumore al seno, la probabilità che la mammografia risulti positiva è del 90%.
• Se una donna non ha un tumore al seno vi è comunque la
Le probabilità condizionate
• Se una donna non ha un tumore al seno vi è comunque la probabilità che la mammografia sia positiva per tumore nel 7 % dei casi.
Se una donna ha una mammografia positiva, quale è la probabilità che abbia effettivamente un tumore?
Metodo delle frequenze naturali
• p (malattia) : 0.008 (8 per mille)
• p (non malattia): 0.992 (992 per mille)
• p (test positivo|malattia): 0.90 (90%)
• p (test positivo|non malattia): 0.07 (7%)
1000 donne
8 malate 992 sane
7 positive 1 negativa 70 positive 922 negative
mammografia
“Un risultato positivo significa che nel suo sangue sono statitrovati gli anticorpi dell’HIV, e questo vuol dire che Lei haun’infezione da HIV. É infetto per il resto della vita, e puòtrasmettereHIV adaltrepersone.”
Le probabilità condizionate
trasmettereHIV adaltrepersone.”(ILLINOIS DPT OF PUBLIC HEALTH)
Nel decennio 1980-1990 in Florida, su 22 donatori di sangue a cui era stato comunicato che il test ELISA (il piú semplice per l’HIV) era risultato positivo 7 si sono suicidati.
Se uno di noi si sottopone a test per HIV e risulta positivo, che
probabilità ha di essere malato?
• p (malattia) : 0.01 % (in maschi “senza rischi”)
• p (non malattia): 0.9999
• p (test positivo|malattia): 0.999 (99.9%)
• p (test positivo|non malattia): 0.0001 (0.01%)• p (malattia) : 1.5 % (in maschi “a rischio”)
• p (non malattia): 0.985
• p (test positivo/malattia): 0.999 (99,9%)
• p (test positivo/non malattia): 0.0001 (0.01%)
Se un maschio omosessuale si sottopone a test per HIV e risulta positivo, che probabilità
ha di essere malato?
10000 persone
1 malata 9999 sane
1 positiva
0 negativa
1 positiva
9998 negative
Test HIV
10000 maschi
150 malati 9850 sani
0 negativi
1 positivo
Test HIV
150 positivi
9849 negativi
P = 50 % (2 positivi: 1 con patologia e 1 senza) P = 99.3 %
ATTENZIONE2
IL TEOREMA DI BAYESovveroovvero
la “probabilità delle cause”ovvero
come apprendere dall’esperienza
Reverendo Thomas Bayes
Londra, 1702Tunbridge Wells, Kent (Inghilterra) 1761
La scatola A contiene nove carte numerate da 1 a 9, la scatola Bcontiene cinque carte numerate da 1 a 5. Viene scelta unascatolaa caso e da questa si estrae una carta. Si determinilaprobabilità che venga scelto un numero pari.
A
D
P1/2
5/9
4/9441 =×
18
5
9
5
2
1 =×
B
P
D
P1/2
4/9
3/5
2/5
1892=×
10
2
5
2
2
1 =×
10
3
5
3
2
1 =×
190
18
90
27
90
20
90
25 =+++
422.090
38
90
18
90
20
5
2
2
1
9
4
2
1 )Pari( ≈=+=×+×=P
La scatola A contiene nove carte numerate da 1 a 9, la scatola Bcontiene cinque carte numerate da 1 a 5. Viene scelta unascatolaa caso e da questa si estrae una carta.Il numero è pari .Calcolare la probabilità che la carta venga dallascatola A.
A
D
P1/2
5/9
4/9241 =×
!!! ZERO
B
P
D
P1/2
4/9
3/5
2/5
526.019
10
52
21
94
21
94
21
)( ≈=×+×
×=PAP
992=×
5
1
5
2
2
1 =×
!!! ZERO
1C
A
2C 3C
4C
5C 6C
Un evento A è l’effetto di k possibili cause: gli eventi ki CCC ...,,...,,1 necessari ed incompatibili.
( ) ?=ACP i
Notare la particolarità del problema!
Prima:
le probabilità degli eventi venivano determinate le probabilità degli eventi venivano determinate prima degli esperimenti.
Adesso:
situazione rivoltata: si conosce il risultato dell’esperimento e si vuole calcolare la probabilità che sia dovuto
ad una certa causa.
Soluzione:
kiCi ...,,1, = costituiscono una partizione diS:
kCCCS ∪∪∪= ...21
( )( ) ( )k
k
CACA
CCASAA
∩∪∪∩=∪∪∩=∩=
...
...
1
1
( )iCA ∩ , i = 1, …,k sono disgiunti
( ) ( ) ( )kCAPCAPAP ∩++∩= ...1
oppure
( ) ( ) ( ) ( )( )kk CACPCAPCPAP ++= ...11
Ma per definizione:
( ) ( )( )AP
ACPACP i
i∩= ( ) ( ) ( )
( ) ( )∑=
=k
jjj
iii
CAPCP
CAPCPACP
1
( ) ( ) ( )( )
( ) ( )( ) ( )∑
=
== k
jjj
iiiii
CAPCP
CAPCP
AP
CAPCPACP
1
( ) =ACP i probabilità a posteriori
( ) =iCP probabilità a priori i
( ) =iCAP probabilità probative o verosimiglianza
Il verificarsi di A modifica la probabilità di iCfacendola passare da ( )iCP a ( )ACP i ; a determinare tale modifica sono le probabilità probative.
https://jasp-stats.org/https://jasp-stats.org/
top related