05 distribuzioni di probabilit [1]

46
1 DISTRIBUZIONI DI PROBABILITÁ

Upload: alessandro-turco

Post on 11-Jan-2017

154 views

Category:

Education


1 download

TRANSCRIPT

Page 1: 05 distribuzioni di probabilit [1]

1

DISTRIBUZIONI DI PROBABILITÁ

Page 2: 05 distribuzioni di probabilit [1]

2

A tutte le variabili casuali, discrete e continue, è associata una distribudistribu--zione che permette di calcolare le zione che permette di calcolare le probabilitprobabilitàà degli eventi possibilidegli eventi possibili.Nel caso discretodiscreto, tale distribuzione soddisfa le due condizioni:

( ) 10 ≤≤ ixp

( ) 1=∑ ixp

1.

2.

Nel caso continuocontinuo, si tratta di una funzione che soddisfa le due condizioni:

1. ( ) 0≥xf

( ) 1=∫+∞

∞−

dxxf2.

Page 3: 05 distribuzioni di probabilit [1]

3

distribuzione binomialedistribuzione binomiale

Si indichi con pp la probabilità che si presenti un determinato evento in una prova, e con q = 1q = 1--pp la probabilità che l’evento non si presenti;

allora, la probabilità che in nn prove l’evento si presenti esattamente kk volte èdata da:

knkk qp

kn

P −⎟⎟⎠

⎞⎜⎜⎝

⎛=

Si utilizza per eventi che possono assumere solo due valori, tipo “giusto-sbagliato”, “testa-croce”, “vero-falso”.

Page 4: 05 distribuzioni di probabilit [1]

4

distribuzione binomialedistribuzione binomiale

knkk qp

kn

P −⎟⎟⎠

⎞⎜⎜⎝

⎛=

La formula permette di calcolare la probabilità che in nn prove l’evento con probabilità pp si verifichi kk volte:

dove:

kPnkp

pq −=1

probabilità di kk successi in nn prove

numero delle prove

numero dei successi

probabilità del successo

probabilità dell’insuccesso

Page 5: 05 distribuzioni di probabilit [1]

5

knk qp −La quantità calcola la probabilitàdi ottenere in maniera ordinata k successi (eventi con probabilità p) e n-k insuccessi (eventi con probabilità q).

Ovviamente non siamo interessati all’ordine con cui questi successi appaiono, quindi è necessario moltiplicare questa probabilità per il numero di successioni ordinate di n eventi in cui il numero di successi è k (ogni successione di k successi su n tentativi/eventi ha uguale probabilità). Questo numero è facilmente calcolabile con la formula per calcolare le combinazioni di n su k:

)!(!!

knkn

kn

−=⎟⎟

⎞⎜⎜⎝

Page 6: 05 distribuzioni di probabilit [1]

6

esempio 1esempio 1(1)(1)

Calcolare la probabilità di ottenere 4 teste lanciando una moneta non truccata 10 volte.L’evento che consideriamo, “esito del lancio di una moneta”, ha due risultati possibili, pertanto utilizziamo la distribuzione binomiale con:

nkp

pq −=1

numero delle prove = 10

numero dei successi (teste) = 4

probabilità del successo (testa) = 0,5

probabilità dell’insuccesso = 0,5

Page 7: 05 distribuzioni di probabilit [1]

7

esempio 1esempio 1(2)(2)

Calcolare la probabilità di ottenere 4 volte testa lanciando una moneta non truccata.

( ) ( ) 205,05,05,0410 4104

4 =⎟⎟⎠

⎞⎜⎜⎝

⎛= −P

Allo stesso modo possiamo calcolare le probabilità di ottenere un qualunque numero di teste (compreso tra 0 e 10) in 10 prove.

Page 8: 05 distribuzioni di probabilit [1]

8

esempio 1esempio 1(3)(3)

Rappresentazione grafica della distribuzione di probabilità della v.c.

X = numero di teste in 10 lanci di una monetaX = numero di teste in 10 lanci di una moneta

0

0,05

0,1

0,15

0,2

0,25

0 1 2 3 4 5 6 7 8 9 10

numero di teste in 10 lanci

prob

abili

Page 9: 05 distribuzioni di probabilit [1]

9

proprietproprietàà (1) (1)

La distribuzione binomialedistribuzione binomiale gode delle seguenti proprietà:

1. È una distribuzione discretadistribuzione discreta in quanto kkassume solo valori interi (compresi tra 00 e nn);

2. Pk ≥ 0 per qualunque valore di k;

3. 10

=∑=

n

kkP

Queste proprietà, in particolare la 2 e la 3 consentono di dire che la distribuzione binomiale è una distribuzione di probabilità.

Page 10: 05 distribuzioni di probabilit [1]

10

proprietproprietàà (2) (2)

4. se p = q = 0,5 si tratta di una distribuzione simmetricadistribuzione simmetrica, in tutti gli altri casi è asimmetricaasimmetrica (basti pensare che se la moneta è sbilanciata ed ha un’alta probabilità di produrre testa ad ogni tiro, un numero alto di teste nel totale dei tiri èpiù probabile di un numero basso di teste)

np=μ5. la mediala media della distribuzione è data da

npq=2σ

6. la varianzala varianza della distribuzione è data da

npq=σ

7. la deviazione standardla deviazione standard è data da

Page 11: 05 distribuzioni di probabilit [1]

11

distribuzione ipergeometricadistribuzione ipergeometrica

Si utilizza quando si eseguono estrazioni senza reinserimento. In generale, volendo estrarre, da un insieme di NN elementi, NN11dei quali aventi una certa caratteristica ed NN22 un’altra caratteristica (con NN1 1 + N+ N2 2 = = NN), un campione di nn elementi distinti me-diante un’estrazione senza reinserimento; ci si chiede quale sia la probabilità che, di questi nn elementi, kk siano di un tipo e gli altri (n (n -- k)k) dell’altro tipo.

Per determinare tale probabilità ènecessario individuare quali siano i casi possibili nello spazio campionario relativo all’esperimento: “numero di campioni di n elementi che si possono ottenere dall’insieme”.

Page 12: 05 distribuzioni di probabilit [1]

12

distribuzione ipergeometricadistribuzione ipergeometrica

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

⎛−⎟⎟

⎞⎜⎜⎝

=

nN

knN

kN

Pk

21

Alla fine, si giunge alla formula:

dove:

n

k

numero di elementi del campione

numero di elementi del campione con la prima caratteristica

N numero di elementi dell’insieme

2N numero di elementi dell’insieme con la seconda caratteristica

1N numero di elementi dell’insieme con la prima caratteristica

Page 13: 05 distribuzioni di probabilit [1]

13

esempio 2esempio 2(1)(1)Un’urna contiene 10 palline di cui 4 sono rosse e 6 bianche. Si estraggono in blocco (senza reinserimento) 3 palline; calcolare la probabilità di estrarre 2 palline rosse.

La variabile casuale che consideriamo èX = numero di palline rosse estratte, in particolare ci interessa determinare la probabilità che [X =2] con:

n

k

numero di elementi del campione = 3

numero di elementi del campione con la prima caratteristica = 2

N numero di elementi dell’insieme = 10

2N numero di elementi dell’insieme con la seconda caratteristica = 6 (bianco)

1N numero di elementi dell’insieme con la prima caratteristica = 4 (rosso)

Page 14: 05 distribuzioni di probabilit [1]

14

esempio 2esempio 2(2)(2)

Applicando la formula avremo:

3,012036

310

16

24

2 ==

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

=P

Allo stesso modo possiamo calcolare le probabilità di ottenere un qualunque numero di palline rosse (compreso tra 0 e 3) in un campione di 3 palline estratte senza reinserimento.

Page 15: 05 distribuzioni di probabilit [1]

15

esempio 2esempio 2(3)(3)

Rappresentazione grafica della distribuzione di probabilità della v.c.

X = numero di palline rosse estratte X = numero di palline rosse estratte

0

0,1

0,2

0,3

0,4

0,5

0,6

0 1 2 3

numero di palline rosse estratte

prob

abili

Page 16: 05 distribuzioni di probabilit [1]

16

proprietproprietàà

1. la distribuzione ipergeometricadistribuzione ipergeometrica è una distribuzione discreta;

( ) npNNn

== 1μ

2. la mediala media della distribuzione è data da

( )( )

( )( )11

212

−−

=−−

=N

nNnpqN

nNNN

NNnσ

3. la varianzala varianza della distribuzione è data da

Page 17: 05 distribuzioni di probabilit [1]

17

distribuzione normaledistribuzione normale

Si tratta della più importante distribuzione di variabili continue, in quanto:

1.1. si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali;

2.2. è la forma limite di molte altre distri-buzioni di probabilità;

3.3. trasformando opportunamente delle v.c.non normali, si possono ottenere nuove variabili distribuite normalmente;

4.4. sotto determinate condizioni, delle somme di v.c. possono essere approssimate da una distribuzione normale (teorema del limite centrale).

Page 18: 05 distribuzioni di probabilit [1]

18

distribuzione normaledistribuzione normale

Una v.c. con media μ e varianza σ2

(parametri della distribuzione) ha una distribuzione normale se la sua densità èdata da

( )2

21

21 ⎟

⎠⎞

⎜⎝⎛ −

−= σ

μ

πσ

x

exf

dove:

π costante = 3,146...

σ deviazione standard

( )2μ−x scarto dalla media elevato al quadrato

e base di logaritmi naturali = 2,183...

Page 19: 05 distribuzioni di probabilit [1]

19

Rappresentazione grafica della distribuzione normale con media μ = 3 e varianza σ2 = 4

distribuzione normaledistribuzione normale

Page 20: 05 distribuzioni di probabilit [1]

20

proprietproprietàà

1. la distribuzione normaledistribuzione normale è una distribuzione continua, con valori compresi tra -∞ e +∞;2. la curva da essa descritta è simmetrica rispetto alla media (punto di ordinata massima): ( )μf3. per valori di X che vanno a -∞ oppure a +∞ la curva tende a zero senza mai toccare l’asse delle ascisse (la probabilità di ottenere valori “molto” lontani dalla media è “molto bassa”);

5. presenta due punti di flesso in corrispon-denza a μ -σ e μ+σ, punti in cui la curva da convessa diventa concava.

4. è crescente per valori di X che vanno da -∞ a μ, decrescente per i valori da μ a +∞

Page 21: 05 distribuzioni di probabilit [1]

21

ruolo dei parametri μ e σ(1/2)

• μ è la media della normale (la punta della campana) è un indicatore di posizione. Il suo variare “sposta” la campana sulla retta dei valori

• σ2 è la varianza è un indicatore di dispersione, è legata all’”apertura” della campana (valori più alti indicano distribuzioni più disperse).

Page 22: 05 distribuzioni di probabilit [1]

22

ruolo dei parametri μ e σ(2/2)

Variazioni di μ

Variazioni di σ

μ=0, σ2=1

μ=0, σ2=9

μ=2, σ2=1

μ=2, σ2=9-10 -8 -6 -4 -2 0 2 4 6 8 100

0.05

0.1

0.15

0.2

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.05

0.1

0.15

0.2

Page 23: 05 distribuzioni di probabilit [1]

23

distribuzione normale distribuzione normale standardizzatastandardizzata

Si tratta di una distribuzione semplificata, e che consente di tabulare i valori di probabi-lità in apposite tavole;

si ottiene mediante una trasformazione dei dati con la formula

( )σ

μ−=

Xz

di conseguenza la funzione di densitàdiventa:

( )2

21

21 z

exf−

con μ = 0 e σ = 1.

Page 24: 05 distribuzioni di probabilit [1]

24

proprietproprietàà

1. la distribuzione normale standardizdistribuzione normale standardiz--zatazata è una distribuzione continua, con valori compresi tra -∞ e +∞, con media zero e deviazione standard 1;

2. la curva da essa descritta è perfettamente simmetrica rispetto al punto di ordinata massima: 3. per valori di X che vanno a -∞ oppure a +∞ la curva tende a zero senza mai toccare l’asse delle ascisse;

5. presenta due punti di flesso in corrispon-denza a -1 e +1, punti in cui la curva da convessa diventa concava.

4. è crescente per valori di X che vanno da -∞ a 0, decrescente per i valori da 0 a +∞

Page 25: 05 distribuzioni di probabilit [1]

25

tavole della normaletavole della normale

I valori delle aree della distribuzione normale standardizzata sono tabulati in apposite tavole;

tali tavole vengono utilizzate per due scopi:

a) per calcolare l’area compresa tra due determinati valori della variabile studiata;

b) per determinare la proporzione di punteggi compresi tra due valori di una variabile casuale (distribuita normalmente)

Page 26: 05 distribuzioni di probabilit [1]

26

la tavola della normalela tavola della normale

Page 27: 05 distribuzioni di probabilit [1]

27

esempio 3esempio 3Supponiamo di voler calcolare l’area compre-sa tra le ordinate z = 0z = 0 e z = 1,96z = 1,96.

Page 28: 05 distribuzioni di probabilit [1]

28

la tavola della normalela tavola della normale

L’area compresa tra z = 0 e z = 1,96è 0,475

Page 29: 05 distribuzioni di probabilit [1]

29

esempio 4esempio 4Supponiamo di voler calcolare l’area compre-sa tra le ordinate z = z = --11 e z = +1z = +1

Page 30: 05 distribuzioni di probabilit [1]

30

esempio 4esempio 4(2)(2)Dalla lettura della tavola rileviamo che l’area compresa tra z = 0z = 0 e z = +1z = +1 è pari a 0,3413;

dal momento che la curva è simmetrica e centrata sullo zero, l’area compresa tra z = z = --11e z = 0 z = 0 sarà identica e pari anch’essa a 0,3413;

per ottenere l’area cercata sarà sufficiente sommare le due aree:

0,3413 + 0,3413 = 0,6826

0,6826

Page 31: 05 distribuzioni di probabilit [1]

31

esempio 5esempio 5Data una serie di 500 punteggi distribuiti normalmente con media 100 e deviazione standard 15, si stimi quanti possano essere i punteggi compresi tra 88 e 130.

• calcoliamo i punti zeta corrispondenti a 88 e 130, che saranno:

( ) 8,015

1008888 −=−

=z

( ) 215

100130130 +=−

=z

Page 32: 05 distribuzioni di probabilit [1]

32

esempio 5esempio 5(2)(2)

• dalla lettura delle tavole ricaviamo che l’area compresa tra z = z = --0,80,8 e z = 0z = 0 è pari a 0,2881;

• l’area compresa tra z = 0z = 0 e z = +2z = +2 è 0,4772;

• l’area complessiva tra z = z = --0,80,8 e z = +2z = +2 sarà0,2881 + 0,4772 = 0,7653;

• tale valore 0,7653 può essere letto sia come proporzione dei casi compresi tra i valori 88 e 130, sia come la probabilità che il punteggio di un soggetto cada all’interno di tale intervallo;

• in conclusione, per ottenere il numero di punteggi che ci si attende nell’intervallo com-preso tra 88 e 130 si calcola:

38365,3825007653,0 ≅=×

Page 33: 05 distribuzioni di probabilit [1]

33

distribuzione chidistribuzione chi--quadratoquadrato

Si tratta di una distribuzione continua con densità data dalla relazione:

( ) ( ) ( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛−

⎟⎠⎞

⎜⎝⎛

= 2222

21 χν

ν χχ eCf

dove:

( )νC costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1

ν gradi di libertà della distribuzione

Page 34: 05 distribuzioni di probabilit [1]

34

distribuzione chidistribuzione chi--quadratoquadrato

Quando νν = 1= 1 il grafico della curva è

Page 35: 05 distribuzioni di probabilit [1]

35

distribuzione chidistribuzione chi--quadratoquadrato

Quando νν = 2= 2 il grafico della curva è

Page 36: 05 distribuzioni di probabilit [1]

36

distribuzione chidistribuzione chi--quadratoquadrato

Quando νν = 3 = 3 il grafico della curva è

Page 37: 05 distribuzioni di probabilit [1]

37

proprietproprietàà

1.1. la distribuzione distribuzione χχ2 2 è una distribuzione continua, con valori compresi tra 0 e +∞;

2.2. al crescere dei gradi di libertà la curva tende ad assumere la forma della normale;

3.3. dato che la v.c. χ2 è generata da una somma dei quadrati di n valori indipen-denti di una v.c. normale standardizzata, quando tali valori non sono indipendenti ènecessario stabilire le condizioni che li vincolano; sottraendo ad n tali vincoli, si ottiene il numero di gradi di libertà, cioèil numero di valori, tra loro indipendenti, della v.c. normale standardizzata.

Page 38: 05 distribuzioni di probabilit [1]

38

distribuzione t di Studentdistribuzione t di Student

Si tratta di una distribuzione continua con densità data dalla relazione:

( )⎟⎠⎞

⎜⎝⎛ +

⎟⎟⎠

⎞⎜⎜⎝

⎛+=

21

2

1

ν

νtCtf

dove:

C costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1

ν gradi di libertà della distribuzione

Page 39: 05 distribuzioni di probabilit [1]

39

distribuzione t di Studentdistribuzione t di Student

Quando νν = 1= 1 il grafico della curva è

Page 40: 05 distribuzioni di probabilit [1]

40

distribuzione t di Studentdistribuzione t di Student

Quando νν = 10 = 10 il grafico della curva è

Page 41: 05 distribuzioni di probabilit [1]

41

proprietproprietàà

1.1. la distribuzione tdistribuzione t è una distribuzione continua, con valori compresi tra -∞ e +∞;

2.2. si rivela particolarmente utile nello studio di fenomeni casuali relativi a campioni piccoli (n < 30);

3.3. il valore dei gradi di libertà è dato da νν = n = n -- 11

4.4. con νν →→ ∞∞ la distribuzione tende alla distribuzione normale

Page 42: 05 distribuzioni di probabilit [1]

42

distribuzione F di distribuzione F di SnedecorSnedecor

Si tratta di una distribuzione continua con densità data dalla relazione:

( ) ( )2

2

1

2

,21

11

21

1

νν

ν

νν

νν

+

⎟⎠⎞

⎜⎝⎛

⎟⎟⎠

⎞⎜⎜⎝

⎛+

=

F

FCFf

dove:

( )21 ,ννC costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1

21,νν gradi di libertà della distribuzione

Page 43: 05 distribuzioni di probabilit [1]

43

distribuzione F di distribuzione F di SnedecorSnedecor

Quando νν11 = 2 = 2 e νν22 = 4= 4 il grafico della curva è

Page 44: 05 distribuzioni di probabilit [1]

44

distribuzione F di distribuzione F di SnedecorSnedecor

Quando νν11 = 4 = 4 e νν22 = 4= 4 il grafico della curva è

Page 45: 05 distribuzioni di probabilit [1]

45

distribuzione F di distribuzione F di SnedecorSnedecor

Quando νν11 = 12 = 12 e νν22 = 12= 12 il grafico della curva è

Page 46: 05 distribuzioni di probabilit [1]

46

proprietproprietàà

1.1. la distribuzione Fdistribuzione F è una distribuzione continua, con valori compresi tra 0 e +∞;

2.2. si dimostra che il rapporto tra due varianze campionarie si distribuisce con questa forma;

3.3. con νν11 = 1 = 1 e νν2 2 →→ ∞∞ la distribuzionetende alla normale standardizzata

4.4. con νν11 = 1 = 1 e νν2 2 = = νν la distribuzione èuguale alla distribuzione t di Student

5.5. con νν11 = = νν e νν2 2 →→ ∞∞ la distribuzionetende a quella del χ2