teoria della probabilità - descrivere lo spazio di probabilità (ovverosia lo spazio campionario,la...
TRANSCRIPT
Teoria della probabilità
- Descrivere lo Spazio di Probabilità (ovverosia lo Spazio Campionario,la Famiglia di eventi e la Distribuzione di Probabilità) del lancio contemporaneo di due dadi a quattro facce
Si definisce Spazio di probabilità una qualsiasi terna (Ω,Є,Pr) costituita da:1. Uno Spazio Campionario Ω (insiemi degli esiti di un dato fenomeno casuale)2. Una Famiglia di Eventi Є (insieme di sottoinsiemi di Ω, chiuso a tutte le
operazioni)3. Una Distribuzione di probabilità Pr (definita su ε a valori reali)
SPAZIO CAMPIONARIO: insieme che racchiude tutti gli esiti di un dato esperimento casuale. Nel caso in cui un esperimento sia composto da più operazioni dall’esito casuale, lo spazio campionario sarà composto dal prodotto cartesiano delle singole operazioni.
Ω = Ω1 x Ω2 = 1,2,3,4 x 1,2,3,4
Card (X)²= 4²= 16 X²=X x X= 1,2,3,4 x 1,2,3,4= (1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),
(4,1),(4,2),(4,3),(4,4)
FAMIGLIA DI EVENTI:simbolicamente rappresentata da Є, è un qualsiasi insieme di eventi chiuso a tutte le operazioni insiemistiche (“campo” di eventi). Ovvero è un insieme di sottoinsiemi di Ω dove, compiendo una qualsiasi operazione insiemistica tra qualsiasi due insiemi (eventi) , il risultato (evento risultante ) è presente tra gli elementi che compongono la Famiglia di Eventi.
Se non specificato si può intendere come l’insieme potenza dello spazio campionario P(Ω).
Є= P(Ω)= Ǿ,(1,1), (1,2), (1,3),(1,4), (2,1), (2,2),…, (1,1),(1,2),(1,1),(1,3),…, (1,1),(1,2),(1,3),…, (1,1),(1,2),
(1,3),(1,4),…, (1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)
DISTRIBUZIONE DI PROBABILITA’(o misura di probabilità):
Si definisce come una qualsiasi funzione Pr con dominio la famiglia di eventi Є e codominio i numeri reali R che soddisfi le tre seguenti proprietà:
1. ¥a εЄ : Pr(a) ≥ 0 (non-negatività)
2. Pr(Ω) = 1 (normatività)
3. ¥ a; b ε Є : (a/b = Ǿ ) Pr(a [ b) = Pr(a) + Pr(b) (additività)
Per determinare la probabilità di verificarsi di un evento semplice dentro uno spazio campionario considereremo soltanto l’approccio classico:
Ogni esito di un dato esperimento ha la stessa probabilità di verificarsi degli altri; si parla quindi di esiti equiprobabili.
¥ Ω : Ω è equiprobabile
¥ ω ε Ω : Pr(ω) = 1/ |Ω|
Pr(Ǿ)=0
Pr ((1,1))= 1/ |Ω|= 1/16Pr ((1,2))= 1/ |Ω|=1/16Pr ((1,3))= 1/ |Ω|=1/16Pr ((1,4))= 1/ |Ω|=1/16
Pr ((1,1),(1,2))= Pr ((1,1)) + Pr ((1,2))=1/16 +1/16= 2/16= 1/8…Pr ((1,1),(1,2),(1,3))= Pr ((1,1)) + Pr ((1,2))+ Pr ((1,3) )=1/16
+1/16+ 1/16= 3/16…Pr ((1,1),(1,2),(1,3),(1,4))= Pr ((1,1)) + Pr ((1,2))+ Pr ((1,3),(1,4))=
1/16+1/16+1/16+1/16= 4/16=1/4…
Pr((1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1), (4,2),(4,3),(4,4) = 16/16= 1
Graficamente…
Ǿ (1,1)… 1(1,1),(1,2)… …(1,1),(1,2),(1,3)… …(1,1),(1,2),(1,3),(1,4)… ……. …(1,1),(1,2),(1,3),(1,4),(2,1), … (2,2),(2,3),(2,4),(3,1),(3,2), 1/4(3,3),(3,4),(4,1), 3/16 (4,2),(4,3) 1/8,(4,4) 1/16 0
ε R
E ora???….
• 2. Partendo da tale spazio di probabilità, rappresentare con un grafico la variabile casuale X che associa ad ogni esito la somma dei valori registrati e rappresentare infine la funzione cumulativa e quella di massa della variabile casuale X.
Dobbiamo prima definire lo spazio di probabilità euclideo…
SPAZIO DI PROBABILITA’Standard- Euclideo
Spazio di probabilità euclideo
una qualsiasi terna (R;B; Pr) costituita da:
• 1. Uno Spazio Campionario R (qualsiasi numero reale `e un potenziale esito)
• 2. Una Famiglia di Eventi B (insieme di sottoinsiemi di R chiuso a tutte le operazioni)
• 3. Una Distribuzione di probabilit`a Pr (definita su B a valori reali)
è detta Spazio di Probabilità Euclideo Unidimensionale.
Similmente, una qualsiasi terna (Rn;Bn; Pr) costituita da:
• 1. Uno Spazio Campionario Rn (qualsiasi numero reale `e un potenziale esito)
• 2. Una Famiglia di Eventi Bn (insieme sottoinsiemi di R chiuso a tutte le operazioni)
• 3. Una Distribuzione di probabilità Pr definita su B a valori reali)
è detta Spazio di Probabilità Euclideo n-dimensionale.
Le Variabili casualiDati uno spazio di probabilità (Ω,Є, Pr) e spazio di probabilità euclideo (R;B; Pr), si chiama Variabile Casuale una qualsiasi funzione V con dominio Ώ e codominio R tale per cui: ¥ В εΒ Vˉ¹(B) εΒ Quindi è una funzione che associa ad ogni esito dello spazio campionario un
valore in R.
Dallo Spazio campionario
Ώ=(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)
Devo associare ad ogni esito la somma dei valori, quindi: (1,1)=2,
(1,2),(2,1)=3,
(1,3),(3,1),(2,2)=4,
(1,4),(2,3),(3,2),(4,1)=5, (2,4),(3,3),(4,2)= 6,
(3,4),(4,3)= 7,
(4,4)=8;
R
2 3 4 5 6 7 8
…(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)
Ω
FUNZIONE DI DISTRIBUZIONE CUMULATIVA Si chiama funzione di distribuzione cumulativa, ed è
genericamente indicata con la lettera F, una qualsiasi funzione a valori reali definita su ℝ che soddisfi le seguenti condizioni:
(x<y)⇒F(x)≤F(y), ∀ x,y ∈ ℝ (monotòna non decrescente)
Limxx1 + F (x) = F(x1), ∀x1 ∈ ℝ (continua da destra) Limx-∞F(x) = 0 (convergenza a 0 verso -∞)
limx+∞F(x) = 1 (convergenza a 1 verso +∞ )
Se x = Pr([-∞, x ])
F(x)=Pr([-∞, x ])=Pr(Ø)=0F(2)=Pr([-∞, 2 ])=Pr(1,1)= 1/16F(3)=Pr([-∞, 3 ])=Pr(1,2),(2,1)= 2/16F(4)=Pr([-∞, 4 ])=Pr(1,3),(3,1),(2,2)= 3/16
F(5)=Pr([-∞, 5])=Pr(1,4),(2,3),(3,2),(4,1)= 4/16=1/4F(6)=Pr([-∞, 6])=Pr(2,4),(3,3),(4,2)= 3/16F(7)=Pr([-∞, 7])=Pr(3,4),(4,3)= 2/16F(8)=Pr([-∞, 8])=Pr(4,4)= 1/16
4/16 3/16 2/16 1/16
2 3 4 5 6 7 8
FUNZIONE DI MASSA
Si chiama funzione di massa, ed è genericamente indicata con la lettera f , una qualsiasi funzione a valori reali definita su ℝ per la quale esista un insieme Mf c ℝ di cardinalità inferiore o uguale a N(|Mf | ≤ N0) tale per cui le seguenti condizioni siano soddisfatte:
1. >0 x ∈Mf
f (x) =0 x ∉ Mf ∀ x ∈ ℝ
2. Σ f(x) =1
• Gli elementi dell’insieme Mf sono detti Punti Massa.
Quindi considerando i punti massa…
• F(2)=F(2)=Pr(1,1)= 1/16• F(3)=Pr(1,2),(2,1)= 2/16• F(4)=Pr(1,3),(3,1),(2,2)= 3/16• F(5)=Pr(1,4),(2,3),(3,2),(4,1)= 4/16=1/4• F(6)=Pr(2,4),(3,3),(4,2)= 3/16• F(7)=Pr(3,4),(4,3)= 2/16• F(8)=Pr(4,4)= 1/16
4/16 3/16 2/16 1/16
2 3 4 5 6 7 8
Teoria della probabilità.. parte II
Sia X una raccolta di dati (su scala a intervalli) di un campione di 28 studenti di psicologia sul tempo mediamente impiegatone preparare un esame:
X = 15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120,
120
92 %0,9228Tot.
100%287 %0,072120
92,8 %263 %0,031110
89,2 %2520 %0,26100
67,8 %197 %0,07295
60,7 %1710 %0,1390
50 %143 %0,03180
46,4 %133 %0,03175
42,8 %123 %0,03165
39,2 %1110 %0,1350
28,5 %87 %0,07245
21,4 %63 %0,031 35
17,8 %53 %0,03130
14,2 %410 %0,1320
3,5 %13 %0,03115
Freq.Cum.P.
f. c. %
Freq. Cum.
f. c.
Freq. Perc.
f %
Proporzioni
P
Frequenza f
a) compilare una tabella delle frequenze e calcolare tutte le statistiche significanti su tale scala (tra cui il 13° e il 78°
percentile).
INDICI DELLA TENDENZA CENTRALE
MODA: All’interno di un insieme di misurazioni di un dato sistema relazionale empirico è quel valore che compare con la massima frequenza
Md = 100 (frequenza = 6)
MEDIANA: All’interno di un insieme di misurazioni disposte in ordine crescente è quel valore che occupa la posizione centrale ovvero il dato al di sopra e al di sotto del quale si trovano il 50% dei dati. Se il numero n delle osservazioni è pari: i = n/2 e la successiva all’interno dei dati
i = 28/2 = 14 e la successiva ovvero 15 Mdn (X) = Mdn(15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120, 120) = 85
MEDIA: è la statistica che associa all’insieme X il numero che si ottiene sommando tutti gli n dati e dividendo il valore ottenuto per n.
Media = 71.7
Indici di posizione
QUARTILI: - primo quartile (Q1),è quel valore che ha il 25% dei dati a lui uguali o inferiori:
i = ¼ (n+1)
i = ¼ (28+1) =7,25 Q1 = 45
- secondo quartile (Q2), coincide con la mediana: i = ½ (n +1)
i = ½ (28+1) =14,5 Q2 = 80
- terzo quartile (Q3),è quel valore che ha il 75% dei dati a lui inferiori: i = ¾ (n+1)
i = ¾ (28+1) =21,7 Q3 = 100
- quarto quartile (Q4) è il valore più alto della serie ordinata: i = n
i = 29 Q4 = 120
PERCENTILI (Pm): quel valore al di sotto del quale cade una percentuale di dati pari ad m:
i = (n·m)/100
i = (28 × 13) / 100 = 3,64 posizione 3 Þ 20 i = (28 × 78) / 100 = 21,84 posizione 21 Þ 100
92 %0,9228Tot.
100%287 %0,072120
92,8 %263 %0,031110
89,2 %2520 %0,26100
67,8 %197 %0,07295
60,7 %1710 %0,1390
50 %143 %0,03180
46,4 %133 %0,03175
42,8 %123 %0,03165
39,2 %1110 %0,1350
28,5 %87 %0,07245
21,4 %63 %0,031 35
17,8 %53 %0,03130
14,2 %410 %0,1320
3,5 %13 %0,03115
Freq.Cum.P.
f. c. %
Freq. Cum.
f. c.
Freq. Perc.
f %
Proporzioni
P
Frequenza f
RANGHI PERCENTILI: è quel numero che rappresenta la percentuale di dati uguali o inferiori a lui: Rp (xi) = (k/n)·100
Indici di dispersione o di variabilitàCLASSI DI EQUIVALENZA: Valore che indica il numero di classi di equivalenza
riscontrate a livello del sistema relazionale empirico• NdE = 14• GAMMA: è statistica che associa all’insieme X il numero che si ottiene
sottraendo il valore minimo al valore massimo degli elementi di X.
G = 120-15= 105• DIFFERENZA INTERQUARTILICA: è la statistica che associa all’insieme X il
numero che si ottiene sottraendo il valore del primo quartile al terzo quartile. • DI = 89 - 28 = 61SEMIDIFFERENZA INTERQUARTILICA: si ottiene dividendo a metà la
differenza interquartilica. SI = 61/2 = 30,5
VARIANZA: è la statistica che associa all’insieme X il numero che si ottiene sommando il quadrato di tutte le differenze di ogni dato dalla media di X e dividendo il risultato per n. s² = ∑ⁿ¡=1 (xi –media)² n
s² = 1082,5 (Varianza)
DEVIAZIONE STANDARD: è la radice quadrata della varianza
…………
- 0,244,89- 6,7165
- 0,6470,89- 21,7350
- 0,8712,89- 26,7245
- 1,11346,89- 36,7…135
- 1,21738,89- 41,7…130
- 1,52672,89- 51,771,7320
- 1,732,93214,89- 56,771,7115
Punti zs =√∑ⁿ¡=1 (xi - media)² √n
f·(Xi-media)²( xi – media)MediafXi
Calcoliamo:
Ω*= 15, 20, 30, 35, 45, 50, 65, 75, 80, 90, 95, 100, 110, 120 N.B. Ω * indica lo Spazio Campionario con gli eventi non ripetuti
2. La famiglia di Eventi å coincide con l’insieme potenza P(Ù*) = å
å = P(Ù*) = Ø,15, 20, 30, 35,…, 15, 20, 15, 30,…, 15, 20, 30,…
Gli esiti dello spazio campionario sono equiprobabili, ovvero l’esito di un dato
esperimento ha la stessa probabilità di verificarsi degli altri. La probabilità di accadere di un certo evento è uguale alla cardinalità
dell’insiemeche esprime tale evento diviso la cardinalità dello spazio campionario:
per ogni e Є ε Pr(e) = |e| / | Ω |
• Dunque: Pr( 15 ) = Pr( 30 ) = Pr( 35 ) = Pr( 65 ) = Pr( 75 ) = Pr( 80 ) = Pr( 110 ) = 1/28 = 0.03
• • Pr( 20) = Pr( 50 ) = Pr( 90 ) = 3/28 = 0.1• Pr( 45) = Pr( 95 ) = Pr( 120 ) = 2/28 = 0.07• Pr( 100 ) = 6/28 = 0,2
• Pr (15, 20 ) = Pr(15 ) + Pr(20 ) = 1/28 + 3/28 = 4/28 = 0,14
• Pr (15, 45 ) = Pr(15 ) + Pr(45) = 1/28 + 2/28 = 3/28 = 0,1
• Pr (15,100 ) = Pr(15 ) + Pr(100) = 1/28 + 6/28 = 7/28 = o,25
• Pr (15, 20,45 ) = Pr(15 ) + Pr(20 ) + Pr(45) = 1/28 + 3/28 + 2/28 = 6/28 = 0,2
• Pr (15, 20,45, 100 ) = Pr(15 ) + Pr(20 ) + Pr(45)+ Pr(100) = 1/28 + 3/28 + 2/28 + 6/28 = 12/28 = 0,42
15,20,30,…,
15,20, …, 15, 20,120
15, 20,45 100
15,20,45
…
…15,100…
15,45
15, 20
100
…
45
20
15
Ø
1
0,42
0,25
0,2
0,14
0,1
0,07
0,03
0
εPr
R
Distribuzione di probabilità
Teoria della probabilità..
parte III
Sia V una variabile casuale che associa ad ogni studente il tempo mediamente impiegato per preparare un esame. Descrivere la distribuzione di probabilità indotta da tale variabile casuale.
DISTRIBUZIONE DI PROBABILITA’ INDOTTA
Dati uno spazio di probabilità (Ω,ε,Pr), uno spazio di probabilità euclideo (ℝ,B,Pr), e una variabile casuale V, si chiama distribuzione di probabilità indotta da Pr mediante la variabile casuale V e indicata simbolicamente da PrV, la funzione così definita:
¥ B Є B
PrV(B) = Pr(V-1(B))
X = (15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100, 100, 100, 100, 100, 100, 110, 120, 120)
0 15 20 30 35 45 50 65 75 80 90 95 100 110 120
X x x x x x x x x x x x x x x x x x x x x x x x x x x x1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
V
Spazio campionario teorico: Ω = X
Famiglia degli eventi: ε = P(Ω), | ε| = 228
Spazio campionario effettivo: Ω* = 15,20,30,35,45,50,65,75,80,90,95,100,110,120
Famiglia degli eventi: ε = P(Ω*), | ε| = 214
DISTRIBUZIONE DI PROBABILITA’ INDOTTA DA V
Per semplicità calcoliamo solo le probabilità degli intervalli punti campione in B:
PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28
PrV ([45]), ([95]), ([120]) = 2/28
PrV ([20], ([50]), ([90]) = 3/28
PrV ([100]) = 6/28
La distribuzione di probabilità indotta PrV per ognuno dei rimanenti elementi di ε si otterrà sommando le singole probabilità dei punti campione.
Esempio: PrV(15,20) = 1/28 + 3/28 = 4/28
….
Rappresentare le funzioni di distribuzione cumulative e di massa derivate dalla variabile casuale V.
F(x) = PrV((-∞,15[) = 0/28
F(x) = PrV((-∞,15]) = 1/28
F(x) = PrV((-∞,20]) = 4/28
F(x) = PrV((-∞,30]) = 5/28
F(x) = PrV((-∞,35]) = 6/28
F(x) = PrV((-∞,45]) = 8/28
F(x) = PrV((-∞,50]) = 11/28
F(x) = PrV((-∞,65]) = 12/28
F(x) = PrV((-∞,75]) = 13/28
F(x) = PrV((-∞,80]) = 14/28
F(x) = PrV((-∞,90]) = 17/28
F(x) = PrV((-∞,95]) = 19/28
F(x) = PrV((-∞,100]) = 25/28
F(x) = PrV((-∞,110]) = 26/28
F(x) = PrV((-∞,120]) = 28/28
28/28
27/28
26/28
25/28
24/28
23/28
22/28
21/28
20/28
19/28
18/28
17/28
16/28
15/28
14/28
13/28
12/28
11/28
10/28
9/28
8/28
7/28
6/28
5/28
4/28
3/28
2/28
1/28
12
0
11
5
11
0
10
5
10
0
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
50
FUNZIONE DI MASSA..
Limitando il calcolo ai punti massa:
f (15), (30), (35), (65), (75), (80), (110) = PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28
f (45), (95), (120) = PrV ([45]), ([95]), ([120]) = 2/28
f (20), (50), (90) = PrV ([20], ([50]), ([90]) = 3/28
f (100) = PrV ([100]) = 6/28
Si noti la differenza tra PrV ([x]) funzione di insiemi e f(x) funzione di punti.
Il medesimo risultato si sarebbe ottenuto con la formula:
f(x) = F(x) – F(x-), ∀x ∈ ℝ
28/28
27/28
26/28
25/28
24/28
23/28
22/28
21/28
20/28
19/28
18/28
17/28
16/28
15/28
14/28
13/28
12/28
11/28
10/28
9/28
8/28
7/28
6/28
5/28
4/28
3/28
2/28
1/28
12
0
11
5
11
0
10
5
10
0
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
50
Maiorano DorianaMontecchi GiuliaPiovesan Jessica