stat 03 - 1 / 43 lezione 5 strumenti statistici: campioni e stimatori
TRANSCRIPT
Stat 03 - 1 / 43
Lezione 5Strumenti statistici:
campioni e stimatori
Stat 03 - 2 / 43
dalla caratteristica comune di una popolazioneal suo modello probabilistico …
1,61m < h < 1,63m X = 162
1,59m < h < 1,61m X = 160
1,57m < h < 1,59m X = 158
una popolazione (distribuita in modo) normale
su cui viene definita una variabile casuale continua X
con media e varianza 2 può essere modellata mediante una
funzione di densità di probabilità fX ( x ) espressa nella forma:
2
2
1exp
2
1 xxf X
Stat 03 - 3 / 43
dalla caratteristica comune di una popolazioneal suo modello probabilistico …
Stat 03 - 4 / 43
Nella parte 1 ...
gli stimatoricampionari V = v ( X1, X2, …, Xn )
correttezza: VE
consistenza: 1lim
V-Vn
EP
efficienza:
2
11
2
22
21 /V-V
V-VVVEff
E
E
E
E
le strategie di campionamento:- sistematico,- stratificato,- per quote,- a grappolo
Stat 03 - 5 / 43
Nella parte 2 ...
consistente: 1lim
nnn
X-X EP
La media campionaria:
n
jjn X
nX
1
1
corretto: nXE
)(xf
Stat 03 - 6 / 43
22 σSE
Nella parte 2 ...
La varianza campionaria:
n
jnj XX
nS
1
22 1
corretto: 22 σnSE
La varianza campionaria corretta:
n
jnjn XX
nS
1
22
1
1
Consistente: ? 1lim 22
nnn
S-S EP ?
Stat 03 - 7 / 43
parte 3 gli stimatori: “varianza campionaria corretta”
Stat 03 - 8 / 43
Principali stimatori:varianza campionaria corretta Sn 2
definizione 5.8:• estraendo da una popolazione per cui è definita la variabile
casuale X un campione di n elementi a cui corrisponde
l’insieme di variabili casuali { X1, X2, …, Xn } si definisce
“varianza campionaria corretta” la quantità:
con numerosità n del campione maggiore di 1.
n
j
njn XXn
S1
22
1
1
Stat 03 - 9 / 43
Principali stimatori:varianza campionaria corretta Sn 2
la “varianza campionaria corretta”
di un campione proveniente da una popolazione su cui è stata
definita la variabile casuale X è uno stimatore corretto della
varianza 2 della X per l’intera popolazione dato che:
n
j
njn XXn
S1
22
1
1
2
1
22
1
1
n
jnjn XX
nS EE
Stat 03 - 10 / 43
Principali stimatori:varianza campionaria corretta Sn
2
Per verificare se la varianza campionaria corretta
possa essere considerata uno stimatore consistente della
varianza della X relativa all’intera popolazione si dovrà individuare la sua distribuzione, in modo da poter individuare il
limite per n che tende all’infinito della sua varianza.
Ricordiamo infatti che si era scritto:
11
1
1
22
nXXn
Sn
j
njn
consistenza degli stimatori campionari
1lim
V-Vn
EP
Stat 03 - 11 / 43
Principali stimatori:varianza campionaria corretta Sn
2
Per ricavare la distribuzione della varianza campionaria corretta
si dovranno introdurre tre nuove distribuzioni:
- la distribuzione “Gamma”,
- la distribuzione “Chi - quadro”,
- la distribuzione “C2 modificata”.
11
1
1
22
nXXn
Sn
j
njn
Stat 03 - 13 / 43
la distribuzione Gamma ( )
Stat 03 - 14 / 43
Distribuzione Gamma ( )
Costruiamo una funzione della variabile X in cui compaiono
due parametri p e a cui è possibile assegnare arbitrariamente
valori reali positivi:
R,con
0se0
0seexp,,
1
p
x
xxxppxfxf
pp
XX
0
1 exp dxxxp p
in cui è stata indicata con ( p) la funzione:
Stat 03 - 15 / 43
Distribuzione Gamma ( )
Stat 03 - 16 / 43
Distribuzione Gamma ( )
Stat 03 - 17 / 43
Distribuzione Gamma ( )
La funzione :
0
1
0
1exp0,, xdxxp
xdxdpxf pp
X
può essere presa come funzione di densità di probabilità dato che:– ha dominio in R e codominio in R + ;
– il suo integrale è unitario;
– rispetta gli assiomi di Kolmogoroff.
R,con
0se0
0seexp,,
1
p
x
xxxppxfxf
pp
XX
Stat 03 - 18 / 43
Distribuzione Gamma ( )
come funzione di densità di probabilità viene chiamata
“distribuzione Gamma con parametri p e ”
R,con
0se0
0seexp,,
1
p
x
xxxppxfxf
pp
XX
0
1 exp dxxxp p
Una distribuzione per cui si possa adottare la
Stat 03 - 19 / 43
Media e varianza della distribuzione Gamma
Se X è una variabile casuale che ha distribuzione Gamma con
parametri p e :
R
,con
0se0
0seexp,,
1
p
x
xxxppxfxf
pp
XX
2
vare
p
Xp
XE
si ha :
Stat 03 - 20 / 43
la distribuzione “chi-quadro”
o
“distribuzione di Pearson”
Karl Pearson (1857-1936)
Stat 03 - 21 / 43
0
exp,,
1 xxppxfxf
pp
XX
Distribuzione chi-quadro
La distribuzione Gamma con parametri p = n / 2 e = 1 / 2 assume un particolare interesse:
0
2exp
2
21,,
12
2 xx
npxfxf
nn
XX
0
12 exp2 dxxxnn
avendo indicato con ( n / 2 ) la funzione definita da:
R,con
0se
0se
p
x
x
Stat 03 - 22 / 43
Distribuzione chi-quadro
0se0
0se2
exp2
21,
12
2
x
xx
xnnxf
nn
X
0
12 exp2 dxxxnn
come funzione di densità di probabilità viene chiamata:
distribuzione chi - quadro con n gradi di libertà
Una distribuzione per cui si possa adottare la
Stat 03 - 23 / 43
0se
2exp
2
21,
12
2
x
xx
nnxf
nn
X
Distribuzione chi-quadro
Stat 03 - 24 / 43
Media e varianza della distribuzione chi-quadro
Dato che la distribuzione chi-quadro con n gradi di libertà è un caso particolare della distribuzione Gamma con parametri
p = n / 2 e = 1 / 2 la sua media e la sua varianza possono essere dedotte introducendo tali valori nella espressione di media e varianza della generica Gamma :
ottenendo:
2
vare
p
Xp
XE
nn
Xnn
X 221
2vare
21
22 E
Stat 03 - 25 / 43
Proprietà della distribuzione chi-quadro
teorema 5.5:
Se le variabili casuali X1, X2 … , Xn, sono indipendenti
e ciascuna ha distribuzione normale con media j e
varianza 2j con j = 1, 2, … , n, allora la variabile casuale:
2
1
2
n
j j
jjX
segue una distribuzione chi-quadro con n gradi di libertà
Stat 03 - 26 / 43
2
2
11
2
n
j j
jj
n
j
j
XZ
la somma dei quadrati di n variabili casuali indipendenti, ciascuna distribuita in modo normale
standard, segue una distribuzione chi-quadro con n gradi di libertà !
Proprietà della distribuzione chi-quadro
corollario al teorema 5.5:
Se le variabili casuali X1, X2 … , Xn, sono indipendenti
e ciascuna ha una distribuzione normale
con media j e varianza 2j con j = 1, 2, … , n,
allora le variabili casuali Z1, Z2 … , Zn definite come :
j
jjj
XZ
sono indipendenti e seguono una distribuzione normale standard.
Ma allora si può anche affermare che:
Stat 03 - 27 / 43
la distribuzione della variabile C2 modificata
Stat 03 - 28 / 43
Distribuzione chi-quadro
Stat 03 - 29 / 43
Media e varianza della distribuzione chi-quadro
Dato che la distribuzione chi-quadro con n gradi di libertà è un caso particolare della distribuzione Gamma con parametri
p = n / 2 e = 1 / 2 la sua media e la sua varianza possono essere dedotte introducendo tali valori nella espressione di media e varianza della generica Gamma :
ottenendo:
2
vare
p
Xp
XE
nn
Xnn
X 221
2vare
21
22 E
La distribuzione chi-quadro ha
media e varianza che aumentano all’aumentare di n
Stat 03 - 30 / 43
La variabile C 2
Partendo da una variabile casuale 2 che segue una
distribuzione chi-quadro con n gradi di libertà, definiamo
una nuova variabile che indichiamo C 2 :
nC
χ 22
che prende il nome di
“variabile modificata di chi-quadro con n g.d.l.”
La “variabile modificata di chi-quadro” è quindi una variabile casuale che si ottiene dividendo una variabile casuale distribuita secondo una chi-quadro per il numero dei suoi gradi di libertà.
Stat 03 - 31 / 43
La distribuzione della variabile C 2
Dato che la C 2, “variabile modificata di chi-quadro”, si ottiene dividendo una variabile distribuita secondo una chi-quadro per il numero dei suoi gradi di libertà, il suo valore medio e la sua varianza si possono facilmente ricavare da quelli della
corrispondente 2 :
ottenendo:
nn χχ 2vare 22 E
111 2
22
n
nnnC χχ EEE
n
nnnn
C χχ 22
1var
1varvar
22
2
22
Stat 03 - 32 / 43
La distribuzione della variabile C 2
Stat 03 - 33 / 43
La distribuzione della variabile C 2
La distribuzione della varianza campionaria corretta
Stat 03 - 34 / 43
Distribuzione della varianza campionaria corretta
Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media e varianza 2 , un campione di n elementi a cui corrisponde
l’insieme di variabili casuali { X1, X2, …, Xn }
è facile vedere che la variabile casuale:
segue una distribuzione normale con media nulla.
nj XX
Se definiamo una nuova variabile Z :
possiamo affermare che essa segue una distribuzione normale standard.
njj
XXZ
Stat 03 - 35 / 43
possiamo affermare che W segue una distribuzione
chi-quadro con n - 1 gradi di libertà in quanto
somma dei quadrati
di n -1 variabili indipendenti normali standard
( la media introduce un vincolo fra le n variabili Xi )
n
j
njn
jj
XXZW
1
2
1
2
Se ora sommiamo i quadrati delle Z1 , Z2 , … , Zn :
Distribuzione della varianza campionaria corretta
Stat 03 - 36 / 43
2
2
1
nSnV
Definiamo ora una nuova variabile V :
n
j
nj
n
jnj XX
XXn
nV1
2
21
2
1
1
1
che, esplicitando Sn2, possiamo anche scrivere come:
Distribuzione della varianza campionaria corretta
Stat 03 - 37 / 43
Se ricordiamo che :
possiamo notare che :
e, ricordando che W segue una distribuzione chi-quadro
possiamo affermare che anche
V segue una distribuzione chi-quadro con n - 1 gradi di libertà.
WXXS
nVn
j
njn
1
2
2
2
1
n
j
njn
jj
XXZW
1
2
1
2
Distribuzione della varianza campionaria corretta
Stat 03 - 38 / 43
Definiamo infine una nuova variabile che indichiamo C 2 :
12
n
VC
che risulta essere una
“variabile modificata di chi-quadro con n - 1 gradi di libertà”
2
22
2
2
2
2
2
1
1
1
1
n
nn
S
n
Sn
C
n
VC
SnV
Distribuzione della varianza campionaria corretta
Stat 03 - 39 / 43
La varianza campionaria corretta e la C 2
22
2
22 1
n
n
S
SC
E
EE
Stat 03 - 40 / 43
La varianza campionaria corretta e la C 2
0varlim
1
2var
1
2varvar
2
42
2
22
nn
n
n
S
nS
n
SC
Stat 03 - 41 / 43
Lo stimatore varianza campionaria corretta
• Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media e varianza 2 , un campione di n elementi a cui corrisponde
l’insieme di variabili casuali { X1, X2, …, Xn }
posto:
si ha che la varianza campionaria corretta:
– è uno stimatore corretto in quanto
– è uno stimatore consistente in quanto :
11
1
1
22
nXXn
Sn
j
njn
0varlim
1
2
22
nn
n
S
nSE
Stat 03 - 42 / 43
Lo stimatore varianza campionaria corretta
• Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media e varianza 2 , un campione di n elementi a cui corrisponde
l’insieme di variabili casuali { X1, X2, …, Xn }
posto:
si ha che :
– segue una distribuzione C 2 con n-1 gradi di libertà.
11
1
1
22
nXXn
Sn
j
njn
11
1
1
2
2
2
nXX
n
S n
j
njn
Stat 03 - 43 / 43
Lo stimatore varianza campionaria corretta
• Il rapporto fra la varianza campionaria corretta dei campioni estratti casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in
modo normale con media e varianza 2 , e la stessa
varianza 2 della X è una variabile casuale che
segue una distribuzione C 2 con n-1 gradi di libertà.
22
2
22 1
n
n
S
SC
E
EE
42
2
22
1
2var
1
2varvar
nS
n
SC
n
n