statistica a.a. 2002-2003 –distribuzione binomiale (cenni) –distribuzione normale...

36
STATISTICA a.a. 2002-2003 – DISTRIBUZIONE BINOMIALE (cenni) – DISTRIBUZIONE NORMALE – DISTRIBUZIONE DI POISSON (cenni)

Upload: enrica-leo

Post on 01-May-2015

223 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

STATISTICAa.a. 2002-2003

– DISTRIBUZIONE BINOMIALE (cenni)

– DISTRIBUZIONE NORMALE

– DISTRIBUZIONE DI POISSON (cenni)

Page 2: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

PROBLEMA DELLE PROVE RIPETUTE

– Vogliamo conoscere la probabilità di ottenere una sequenza di eventi favorevoli A e contrari B, contenente k volte A e n-k volte B, comunque disposti.

– La probabilità dell’evento A è p, quella di B è q = 1-p.

– La probabilità di una specifica sequenza è la probabilità composta dei k eventi A e degli n-k eventi B:

Page 3: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

PROBLEMA DELLE PROVE RIPETUTE

p · p · p….(k volte) · q · q · q….(n-k volte)

ossia

P = pk q n-k

Calcolando su tutte le possibili sequenze ,

knkqpk

nP

Page 4: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

PROBLEMA DELLE PROVE RIPETUTE

– Quindi la probabilità di avere una qualsiasi sequenza con k eventi A e n-k eventi B sarà

knkqpk

nP

P probabilità di ottenere k eventi di probabilità costante p su n prove indipendenti.

Page 5: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE BINOMIALE– I lanci successivi devono essere

indipendenti dai precedenti– Le uscite devono essere completamente

casuali– La probabilità di una uscita deve essere

costante nel tempo.– Se poniamo in ascissa i valori di k e in

ordinata le probabilità P(k), rappresentiamo graficamente la formula vista.

– Ad esempio assumiamo che la probabilità singola p sia 0.3, e il numero di prove n sia 10.

Page 6: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE BINOMIALE– Distribuzione delle probabilità P(k) relative

ai vari k considerati, quando p=0.3 e n=10.

Page 7: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE BINOMIALE– La distribuzione binomiale permette di

calcolare, per numeri n piccoli, le probabilità di avere un certo numero k di successi nelle n prove.

– Se abbiamo molte prove, n diventa molto grande.

– Trovare le probabilità dei successi k diventa difficile.

– Per alti n il problema non è di trovare la probabilità connessa ad uno specifico numero k di successi, ma di trovare ad esempio la probabilità di trovare più o meno di k successi.

Page 8: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE– Si ricorre allora alle distribuzioni

NORMALE ( GAUSSIANA) o di Poisson, che valgono per n molto grande.

– In questo caso lo scaloide della distribuzione di probabilità binomiale, ossia l’insieme dei rettangoli che rappresentano le probabilità dei singoli k, tende a diventare un’area sottostante ad una linea continua.

Page 9: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

Page 10: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

Page 11: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

Page 12: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• La forma della curva cui tende la distribuzione al tendere di n all’infinito è differente secondo il valore che p (e quindi q) assume.

• Si danno due casi:• Nel primo caso p e q non sono molto differenti

fra loro e quindi nessuno dei due valori si scosta molto dal valore di probabilità ½. In questo caso al tendere di n all’infinito la distribuzione tende alla curva teorica che si chiama gaussiana.

Page 13: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• Si intende di solito che una distribuzione di probabilità è normale quando il prodotto n p è maggiore di 5 (nel caso p>q).

• Nel secondo caso p è molto maggiore o molto minore di q, in modo che ambedue si discostano molto da probabilità ½.

• Se al tendere di n all’infinito il prodotto p n rimane costante, la distribuzione tende alla cosiddetta curva di Poisson.

Page 14: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• Si parla di poissoniana quando il prodotto

n p << n.• Una distribuzione binomiale è simmetrica solo

se n=p=1/2. • Anche una distribuzione normale è in

generale asimmetrica, ma diventa simmetrica al crescere di n. Per n infinito è perfettamente simmetrica.

Page 15: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE• E’ sbagliato suddividere l’intervallo di variazione in

un numero piccolo di intervalli: il diagramma risulta scarsamente informativo e si discosta molto dalla normale.

• E’ anche sbagliato suddividerlo in troppi intervalli. In questo caso l’informazione è troppo dispersa e si possono trovare dei buchi, ossia intervalli in cui la frequenza è molto minore che in quelli adiacenti.

• Un numero ragionevole di classi di frequenza può andare da un minimo di 16 ad un massimo di 30.

Page 16: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• Molte distribuzioni empiriche (ossia distribuzioni di frequenza) sono approssimativamente normali.

• Quando effettuiamo un campionamento e ne diagrammiamo la distribuzione di frequenza, se il numero di elementi del campione è sufficientemente elevato e il numero di classi non è troppo piccolo (almeno 10-15), troveremo quasi sempre un campione distribuito normalmente.

Page 17: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE• Se il campione è distribuito normalmente si

possono applicare le proprietà della curva teorica gaussiana al campione rimanendo entro un intervallo accettabile di errore (il campione essendo finito non sarà mai perfettamente normale).

• Data una grandezza x distribuita normalmente con media e deviazione standard , l’equazione della curva normale è

Page 18: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• f(x) non dà la probabilità associata ad x, bensì la densità di probabilità. Per ottenere la probabilità associata ad un evento relativo ad una distribuzione normale occorre integrare su un intervallo appropriato.

2)-x

1/2(e

2

1f(x)

Page 19: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• Ad esempio la probabilità che x sia minore di x0 sarà

dxxxPxx

2200

/σμ)1/2(x0 e

2πσ

1f(x))(

Page 20: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• Ad esempio la probabilità che x sia compreso fra due valori x1 e x2 sarà

dxxxxPx

x

x

x

222

1

2

1

/σμ)1/2(x21 e

2πσ

1f(x))(

Page 21: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE• Sappiamo che l’area delimitata dalla curva e

dall’asse x vale 1. Quindi l’area sotto la curva compresa fra le due ordinate x=a e x=b , dove a<b, rappresenta la probabilità che x sia compreso fra a e b.

• Quando la variabile x viene espressa in unità standard,

z= (x - )/ L’equazione precedente viene sostituita dalla

sua FORMA STANDARDIZZATA

Page 22: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

e in tal caso diciamo che z è distribuita normalmente con media zero e varianza uno. Il grafico sarà simmetrico intorno allo zero.

2z 1/2e 2

1f(z)

Page 23: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• L’uso delle tavole ci risparmierà la fatica di risolvere gli integrali.

• Nel caso di approssimazione della distribuzione binomiale a quella normale si avrà

= n p = n p qx=k numero di successi su n prove

Page 24: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• E quindi

2)npq

np-k1/2(

enpq 2

1f(k)

Page 25: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE• Rappresentando graficamente questa funzione

otteniamo la caratteristica curva a campana simmetrica intorno alla media:

Page 26: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE• In corrispondenza di + e – la curva

presenta i suoi punti di flesso.• Tracciando diversi diagrammi per diversi

valori di ci accorgiamo che la curva è tanto più appiattita quanto maggiore è la deviazione standard.

Page 27: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE• Una proprietà fondamentale della gaussiana

è la seguente:• La probabilità che uno scarto dalla media sia

maggiore di un certo valore è inversamente proporzionale al rapporto fra questo valore e la deviazione standard.

• Quindi esiste una probabilità definita e uguale per tutte le curve normali che un certo scarto sia inferiore a una (2, 3) deviazione standard.

• Tale probabilità è equivalente all’area tratteggiata in figura:

Page 28: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

Page 29: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

Page 30: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

Page 31: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE• Probabilità che un valore cada casualmente

entro alcune deviazioni standard:

• Entro 1.0 d.s. dalla media = 68.26%• Entro 1.96 d.s. dalla media = 95.00%• Entro 2.0 d.s. dalla media = 95.44%• Entro 2.575 d.s. dalla media = 99.00%• Entro 3.0 d.s. dalla media = 99.73%• Entro 3.29 d.s. dalla media = 99.90%

Page 32: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE NORMALE

• Ossia il 95% delle osservazioni cade entro 1.96 d.s., ed entro 3 d.s. sono comprese pressochè tutte le osservazioni.

Page 33: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE DI POISSON

• La distribuzione binomiale tende alla poissoniana quando la probabilità dell’evento p è molto piccola con n (prove) molto grande.

• La poissoniana è una distribuzione discreta, con la caratteristica che la media teorica (valore atteso) è uguale alla varianza:

= = n p

Page 34: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE DI POISSON

• Quindi la funzione che rappresenta questa distribuzione è

• dove P è la probabilità che il valor medio si presenti k volte in n prove (con n molto grande).

μk

ek!

μP

Page 35: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE DI POISSON

• Questo tipo di distribuzione di frequenze (eventi che si verificano con frequenza molto bassa in uno spazio o in un tempo molto grande) si presenta in natura in alcuni casi, ad es.:

• Numero di microorganismi in una certa superficie o volume

• Decadimento di sostanze radioattive• Insorgenza di antibioticoresistenza in una

popolazione batterica• Numero di morti per una malattia non

frequente in una grande popolazione.

Page 36: STATISTICA a.a. 2002-2003 –DISTRIBUZIONE BINOMIALE (cenni) –DISTRIBUZIONE NORMALE –DISTRIBUZIONE DI POISSON (cenni)

DISTRIBUZIONE DI POISSON

• Es. numero di morti dovute a calcio di cavallo nei reggimenti di cavalleria prussiani (studio statistico di Von Bortkiewicz):

N. morti /reggimento/anno n. regg/anno0 1091 652 223 31 1