intervalli di confidenza corso di teoria dell’inferenza statistica 2 a.a. 2003/2004 quarto periodo...
TRANSCRIPT
Intervalli di ConfidenzaIntervalli di Confidenza
Corso di Teoria dell’Inferenza Statistica 2
a.a. 2003/2004 Quarto PeriodoProf. Filippo DOMMA
Corso di Laurea in Statistica – Facoltà di Economia - UniCal
Intervalli di Confidenza F. Domma 2
I metodi di stima puntuali anche se corredati di tutte le proprietà giudicate desiderabili e ottimali, difficilmente potranno fornire delle stime che coincidono con il parametro incognito, poiché ci si dovrà sempre attendere un certo errore di campionamento.Nasce, quindi, l’esigenza di associare allo stimatore una misure dell’errore di stima commesso, in modo tale da valutare quanto la stima sia da considerarsi “vicina” al parametro incognito.Tali valutazioni possono essere fatte facendo riferimento alladispersione della distribuzione campionaria dello stimatore T(X).In relazione alla stima t(x), ottenuta tramite il campione osservato, e alla precisione dello stimatore, ci saranno dei valori di che sulla base del campione debbono essere considerati più plausibilidi altri.Definito, quindi, il grado di plausibilità si potrà dividere lo spazio parametrico in due sottoinsiemi:
Intervalli di Confidenza F. Domma 3
uno di valori probabili per secondo il grado di plausibilità fissato ed un altro di valori poco probabili per . Così, invece di stimare un unico valore per , si stimerà un insieme di valori possibili a cuiverrà associato il grado di plausibilità scelto il quale deve essere interpretato come livello di confidenza per l’insieme.
Intervalli di Confidenza F. Domma 4
Sia X un c.c. estratto da f(x;) appartenente alla famiglia di distribuzioni P. Diamo la seguente Definizione. La famiglia di intervalli S(X) di , funzione di X
ma non di , è chiamato intervallo casuale. S(X) è del tipo
)(),(__
XX
dove )(X
)(__
Xe
sono, rispettivamente, il limite inferiore e superiore dell’intervallo casuale.
Intervalli di Confidenza F. Domma 5
Definizione. Per un dato valore di (usualmente piccolo), 0< <1, un intervallo di confidenza al 100(1-)% per è la realizzazione di un intervallo casuale tale che
1)()(Pr XX
La quantità
)()(Pinf r XX
in genere è uguale ad 1-, è chiamato coefficiente fiduciario dell’intervallo casuale.
Intervalli di Confidenza F. Domma 6
Un metodo generale per la costruzione di intervalli di confidenzaè costituito dalla ricerca di una funzione del campione e del parametro incognito da stimare che abbia una distribuzione indipendente da parametro stesso.
Intervalli di Confidenza F. Domma 7
1qQqP 21r
2n11 q);x,...,x(qq
Metodo della Quantità PivotMetodo della Quantità Pivot
Definizione. Quantità Pivot.
Sia X1,…,Xn un c.c. estratto da una fd (o fp) f(x;) appartenente a PP.
Sia Q=q(X1,…,Xn;) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot.
Definizione. Quantità Pivot.
Sia X1,…,Xn un c.c. estratto da una fd (o fp) f(x;) appartenente a PP.
Sia Q=q(X1,…,Xn;) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot.
Se Q=q(X;) è una quantità pivot, allora per ogni fissato, 0<<1, esisteranno due valori q1 e q2 dipendenti da , tali che
Se Q=q(X;) è una quantità pivot, allora per ogni fissato, 0<<1, esisteranno due valori q1 e q2 dipendenti da , tali che
Per ogni c.o. x1,…,xn, si ha:Per ogni c.o. x1,…,xn, si ha:
Ora, se da questa doppia diseguaglianza, riusciamo a calcolare la seguente: Ora, se da questa doppia diseguaglianza, riusciamo a calcolare la seguente:
Intervalli di Confidenza F. Domma 8
)x,...,x(t)x,...,x(t n12n11
Per funzioni t1 e t2 indipendenti da , allora (t1,t2) è un intervallo fiduciario (di confidenza) al 100(1-)% per .
Per funzioni t1 e t2 indipendenti da , allora (t1,t2) è un intervallo fiduciario (di confidenza) al 100(1-)% per .
In tal modo costruiamo un I.C. per in due fasi:
1a - individuare la q.p.;
2a - invertire la doppia diseguaglianza in termini di .
In tal modo costruiamo un I.C. per in due fasi:
1a - individuare la q.p.;
2a - invertire la doppia diseguaglianza in termini di .
Intervalli di Confidenza F. Domma 9
0\),(:(.,.)NP 2
Campionamento da popolazioni Normali Campionamento da popolazioni Normali
Sia X un c.c. iid estratto da Sia X un c.c. iid estratto da
Costruire un I.C. per con il metodo della quantità pivot.Costruire un I.C. per con il metodo della quantità pivot.
Esistono due casi distinti:
a) varianza nota;
b) varianza sconosciuta.
Esistono due casi distinti:
a) varianza nota;
b) varianza sconosciuta.
Intervalli di Confidenza F. Domma 10
0\),(:(.,.)NP 20
n,N~X
n
1X
20
n
1ii
A) Varianza nota A) Varianza nota
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
Sia X un c.c. iid estratto da N(.;.). Sappiamo che, in tale contesto, la media campionaria ha la seguente distribuzione
Sia X un c.c. iid estratto da N(.;.). Sappiamo che, in tale contesto, la media campionaria ha la seguente distribuzione
E’ evidente che la media campionaria non è una quantità pivot. E’ evidente che la media campionaria non è una quantità pivot.
Intervalli di Confidenza F. Domma 11
)1,0(N~n/
XZ
0
);(qZ X
1qZqP 21r
Consideriamo la standardizzazione della media campionaria, cioè:Consideriamo la standardizzazione della media campionaria, cioè:
Z è una quantità pivot per ; infatti, si ha:Z è una quantità pivot per ; infatti, si ha:
1) è funzione del c.c. X e del parametro incognito , cioè1) è funzione del c.c. X e del parametro incognito , cioè
2) Z ha distribuzione indipendente dal parametro incognito . 2) Z ha distribuzione indipendente dal parametro incognito .
Fissato , con 0< <1, possiamo trovare due valori, q1 e q2, tali che Fissato , con 0< <1, possiamo trovare due valori, q1 e q2, tali che
Intervalli di Confidenza F. Domma 12
21r21r q);(qqPqZqP1 X
2
0
1r qn/
XqP
n/qXn/qP 0201r
n/qXn/qXP 0201r
n/qXn/qXP 0201r
n/qXn/qXP 0102r
2) Inversione della doppia diseguaglianza in termini di ;2) Inversione della doppia diseguaglianza in termini di ;
Intervalli di Confidenza F. Domma 13
21
ZqPr
zq2
1
2
qZP 2r
zq2
2
La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.
Generalmente, viene fissato ad un valore molto basso 0.01, 0.05.
Ripartiamo in parti uguali, sulle code della normale standardizzata, in modo tale che
Generalmente, viene fissato ad un valore molto basso 0.01, 0.05.
Ripartiamo in parti uguali, sulle code della normale standardizzata, in modo tale che
Intervalli di Confidenza F. Domma 14
1n
zXn
zXP 00r
22
nzXT 0
12
nzXT 0
22
nzx ,
nzx 00
22
Sostituendo si ha:Sostituendo si ha:
Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:
Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:
Intervalli di Confidenza F. Domma 15
Sia X X1 9,.... un c.c. estratto da una popolazione statistica che è benadattata da una v.c. Normale con media incognita e varianza pari a 25.Utilizzando le realizzazioni finite delle variabili casuali componenti ilcampione, abbiamo calcolato il valore della media campionaria, pari a 27.Determinare l’intervallo di confidenza per la media della popolazione allivello di confidenza pari al 97%.
Esempio.Esempio.
Il termine fiduciario nasce dalla seguente osservazione:se estraessimo dalla popolazione ripetutamente campioni di dimensione n e se calcolassimo per ognuno di questi l’intervallo(t1,t2), la frequenza relativa di intervalli che contengono tenderebbeal 100(1-)%. Abbiamo, quindi, una considerevole fiducia che l’intervallo osservato contenga . La misura della nostra fiducia è 100(1-)%.
Intervalli di Confidenza F. Domma 16
0\),(:(.,.)NP 2
)1,0(N~n/
XZ
B) Varianza sconosciutaB) Varianza sconosciuta
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
Dire perché la quantitàDire perché la quantità
non è utile per costruire un I.C. per con sconosciuta.non è utile per costruire un I.C. per con sconosciuta.
Intervalli di Confidenza F. Domma 17
)1,0(N~n/
XZ
)1n(~S)1n(
V 22
2
)1n(t~
)1n(V
ZT
Osservazione:Osservazione:
Si dimostra, inoltre, che:Si dimostra, inoltre, che:
Sappiamo che:Sappiamo che:
In definitiva, la v.c. T ha distribuzione indipendente da parametri incogniti (dipende solo dai gradi di libertà n-1).
In definitiva, la v.c. T ha distribuzione indipendente da parametri incogniti (dipende solo dai gradi di libertà n-1).
Intervalli di Confidenza F. Domma 18
n/S
X
Sn/
Xn/
X
)1n(V
ZT
)1n(
S)1n(2
2
)1n(t~n/S
XT
1qTqP 21r
Si osservi, ora, che Si osservi, ora, che
In definitiva, abbiamo In definitiva, abbiamo
Quest’ultima quantità è una q.p.; infatti, T è funzione di X e di , con f.d. indipendente da parametri incogniti. Individuata la q.p., fissato , possiamo trovare q1 e q2 tali che
Quest’ultima quantità è una q.p.; infatti, T è funzione di X e di , con f.d. indipendente da parametri incogniti. Individuata la q.p., fissato , possiamo trovare q1 e q2 tali che
Intervalli di Confidenza F. Domma 19
21r21r q);(qqPqTqP1 X
21r qn/S
XqP
n/SqXn/SqP 21r
n/SqXn/SqXP 21r
n/SqXn/SqXP 21r
n/SqXn/SqXP 12r
2) Inversione della doppia diseguaglianza in termini di ;2) Inversione della doppia diseguaglianza in termini di ;
Intervalli di Confidenza F. Domma 20
2
TqP 1r
1)-(ntq2
1
22
qTPr
1)-(ntq2
2
Ripartiamo in parti uguali, sulle code della t di Student, in modo tale che Ripartiamo in parti uguali, sulle code della t di Student, in modo tale che
La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.
Intervalli di Confidenza F. Domma 21
1t
n
SXt
n
SXP )1n()1n(
22r
)1n(2
tn
SXT1 )1n(
2t
n
SXT2
)1n( , )1n(
22t
n
sxt
n
sx
Sostituendo si ha:Sostituendo si ha:
Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:
Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:
Intervalli di Confidenza F. Domma 22
In un grande comune rurale, da un’indagine campionaria su 900famiglie, è risultato un reddito medio di 2.3 milioni ed unadeviazione standard di 0.8 milioni. Si determini l’intervallo diconfidenza per il reddito medio annuo di tutte le famiglie, sottol’ipotesi che lo stesso segua una v.c. Normale, al livello diconfidenza del 95%.
Esempio.Esempio.
Intervalli di Confidenza F. Domma 23
nzx ,
nzx 00
22
nz2
nzx
nzxL 000
222
nz
2
L 0
2
Osservazione - 1Osservazione - 1
Dato l’intervalloDato l’intervallo
La lunghezza ( L ) dell’intervallo di confidenza è definita come differenza tra gli estremi dell’intervallo stesso, cioè
La lunghezza ( L ) dell’intervallo di confidenza è definita come differenza tra gli estremi dell’intervallo stesso, cioè
Si definisce errore la lunghezza dell’intervallo diviso 2, cioèSi definisce errore la lunghezza dell’intervallo diviso 2, cioè
Intervalli di Confidenza F. Domma 24
- a parità di :
- L diminuisce al diminuire di ;
- L diminuisce all’aumentare di n.
- a parità di :
- L diminuisce al diminuire di ;
- L diminuisce all’aumentare di n.
- a parità di n e :
- L diminuisce all’aumentare di
[in tal caso diminuisce il grado di fiducia (1-) ]
- a parità di n e :
- L diminuisce all’aumentare di
[in tal caso diminuisce il grado di fiducia (1-) ]
Situazione ottima: L piccolo - (1-) elevatoSituazione ottima: L piccolo - (1-) elevato
Intervalli di Confidenza F. Domma 25
Osservazione - 2Osservazione - 2
Fissato , a parità di e s e della dimensione campionaria n, gli intervalli di confidenza per la media della popolazione costruiti con T sono più ampi.
Fissato , a parità di e s e della dimensione campionaria n, gli intervalli di confidenza per la media della popolazione costruiti con T sono più ampi.
Intervalli di Confidenza F. Domma 26
L :n
nz2 0
2nz2 0
2
2
0
2z2n
Osservazione - 3Osservazione - 3
In alcuni casi, è necessario calcolare la dimensione campionaria minima affinché l’I.C. abbia una lunghezza prefissata.
In alcuni casi, è necessario calcolare la dimensione campionaria minima affinché l’I.C. abbia una lunghezza prefissata.
Così,ad esempio, nel caso di I.C. per con noto, si ha: Così,ad esempio, nel caso di I.C. per con noto, si ha:
Intervalli di Confidenza F. Domma 27
Le uova prodotte in una azienda agricola hanno un peso che sidistribuisce secondo una normale con media incognita e varianza pariaa 49. Determinare la dimensione del campione che consente di stimare ,mediante la media campionaria, con un errore non superiore a 4 con unaprobabilità di 0.95.
EsempioEsempio
Intervalli di Confidenza F. Domma 28
0\),(:(.,.)NP 2
Campionamento da popolazioni Normali Campionamento da popolazioni Normali
Sia X un c.c. iid estratto da Sia X un c.c. iid estratto da
Esistono due casi distinti:
a) sconosciuta;
b) nota.
Esistono due casi distinti:
a) sconosciuta;
b) nota.
Costruire un I.C. per 2 con il metodo della quantità pivot.Costruire un I.C. per 2 con il metodo della quantità pivot.
Intervalli di Confidenza F. Domma 29
)1n(~
XXS)1n(
V 22
n
1i
2
i
2
2
A) Media sconosciutaA) Media sconosciuta
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
Si è visto in precedenza che la quantitàSi è visto in precedenza che la quantità
E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n-1) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per
E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n-1) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per
Intervalli di Confidenza F. Domma 30
22
1r21r q);(qqPqVqP1 X
2
2
2
1r22
2
1r q
1
S)1n(q
1Pq
S)1n(qP
2
22
1
2
r q
S)1n(
q
S)1n(P
1
22
2
2
r q
S)1n(
q
S)1n(P
2) Inversione della doppia diseguaglianza in termini di ;2) Inversione della doppia diseguaglianza in termini di ;
Fissato , possiamo determinare q1 e q2 tali che Fissato , possiamo determinare q1 e q2 tali che
Intervalli di Confidenza F. Domma 31
2
VqP 1r
q 1)-(n2
12
22
VqPr
q 1)-(n212
2
Ripartiamo in parti uguali, sulle code della Chi-quadrato, in modo tale che Ripartiamo in parti uguali, sulle code della Chi-quadrato, in modo tale che
La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.
Intervalli di Confidenza F. Domma 32
)1n(21
2
1
2
S)1n(T
1S)1n(S)1n(
P)1n()1n(
2
22
21
2
r
22
)1n(2
2
2
2
S)1n(T
)1n()1n(2
2
21
2
22
s)1n( ,
s)1n(
Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:
Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:
Sostituendo si ha:Sostituendo si ha:
Intervalli di Confidenza F. Domma 33
)n(~
Xˆn
V 22
n
1i
2i
2
2
B) Media notaB) Media nota
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
1) Individuazione della Quantità Pivot.
Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.
E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per
E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per
Intervalli di Confidenza F. Domma 34
1ˆnˆn
P)n()n(
2
22
21
2
r
22
)n(21
2
1
2
ˆnT
)n(
2
2
2
2
ˆnT
)n()n(2
2
21
2
22
ˆn ,
ˆn
Utilizzando lo stesso procedimento del caso (A), si ottiene l’I.C. per 2, cioèUtilizzando lo stesso procedimento del caso (A), si ottiene l’I.C. per 2, cioè
Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:
Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:
Intervalli di Confidenza F. Domma 35
Il diametro delle sfere di acciaio, prodotte da una determinata industria, è adattatostatisticamente da una v.c. X che si distribuisce come una Normale. Si effettua uncampionamento casuale di numerosità 9 e si misura il diametro delle sfere costituenti ilcampione. I risultati, realizzazioni delle v.c. componenti il campione, sono i seguenti :20.1 , 19.9 , 20 , 19.8 , 19.7 , 20.2 , 20.1 , 23.1 , 22.8Determinare l’intervallo di confidenza al livello del 90% per il valor medio dellapopolazione ed un altro intervallo allo stesso livello di confidenza per la varianza dellapopolazione.
Esempio.Esempio.
Intervalli di Confidenza F. Domma 36
2xx ,N~X 2
yy ,N~Y
)1m( X)1n( Y
m,N~X
2x
x
n,N~Y
2y
y
Intervallo di Confidenza per la differenza tra le medie
di due popolazioni Normali.
Intervallo di Confidenza per la differenza tra le medie
di due popolazioni Normali.
Siano X ed Y due v.c. indipendenti e normalmente distribuite, cioèSiano X ed Y due v.c. indipendenti e normalmente distribuite, cioè
Intervalli di Confidenza F. Domma 37
2x 2
y
YXD
yxDE
nm
DV2y
2x
nmND yx
yx
22
, ~
Vogliamo costruire un I.C. per la differenza tra le medie x e y.Vogliamo costruire un I.C. per la differenza tra le medie x e y.
Primo Caso:Primo Caso: ee NoteNote
Stimatore naturale della differenza tra le medie Stimatore naturale della differenza tra le medie
E’ semplice verificare che E’ semplice verificare che
Intervalli di Confidenza F. Domma 38
1 , 0 ~22
N
nm
DZ
yx
yx
21r qZqP1
La v.c.La v.c.
E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito (x-y) ed ha distribuzione indipendente da parametri incogniti.
Fissato , possiamo determinare q1 e q2 tali che
E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito (x-y) ed ha distribuzione indipendente da parametri incogniti.
Fissato , possiamo determinare q1 e q2 tali che
Intervalli di Confidenza F. Domma 39
222
1 q
nm
DqP
yx
yxr
nm
qDnm
qP2y
2x
2yx
2y
2x
1r
nm
qDnm
qDP yxyx
yxr
22
2
22
1 )(
Intervalli di Confidenza F. Domma 40
nm
qDnm
qDP yxyx
yxr
22
2
22
1
nm
qDnm
qDP yxyx
yxr
22
1
22
2
qZP2
qZP 2r1r2
zq1 2
zq2
Ricordando che Ricordando che
Intervalli di Confidenza F. Domma 41
1nm
zDnm
zDP2y
2x
xx
2y
2x
r22
nmzDT
2y
2x
12
nmzDT
2y
2x
22
Si ottiene:Si ottiene:
Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze note, sono:
Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze note, sono:
Intervalli di Confidenza F. Domma 42
nmzd ,
nmzd
2y
2x
2y
2x
22
yxd
m
1iix
m
1x
n
1iiy
n
1y
Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze note, al 100(1-)% è:
Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze note, al 100(1-)% è:
dovedove
conconee
Intervalli di Confidenza F. Domma 43
22y
2x
YXD
1 , 0 ~1122
N
nm
D
nm
DZ yx
yx
yx
Se le varianza sono sconosciute, Z non è una quantità pivot per (x-y).Se le varianza sono sconosciute, Z non è una quantità pivot per (x-y).
Secondo Caso: varianze uguali ma sconosciuteSecondo Caso: varianze uguali ma sconosciute
Stimatore naturale della differenza tra le medie Stimatore naturale della differenza tra le medie
Da quanto detto in precedenza, si evince che Da quanto detto in precedenza, si evince che
Intervalli di Confidenza F. Domma 44
)1m(~
XXS)1m(
V 22
m
1i
2
i
2
2x
1
)1n(~
YYS)1n(
V 22
n
1i
2
i
2
2y
2
)2mn(~YYXX1
VV 2n
1i
2
i
m
1i
2
i211
Si osserva, inoltre, che Si osserva, inoltre, che
Poiché V1 e V2 sono indipendenti, dalla proprietà riproduttiva della v.c. chi-quadrato, si ha:
Poiché V1 e V2 sono indipendenti, dalla proprietà riproduttiva della v.c. chi-quadrato, si ha:
Intervalli di Confidenza F. Domma 45
)2mn(t~
)2nm(VV
ZT
21
n1
m1
S
D
)2nm(
S)1n(S)1m(
n1
m1
D
T
p
yx
2
2y
2x
yx
Dato che le v.c. Z e V1+V2 sono indipendenti, possiamo costruire la v.c. t-student, cioèDato che le v.c. Z e V1+V2 sono indipendenti, possiamo costruire la v.c. t-student, cioè
Tale rapporto si può scrive nel seguente modo:Tale rapporto si può scrive nel seguente modo:
Intervalli di Confidenza F. Domma 46
)2nm(
S)1n(S)1m(S
2y
2x2
p
)2nm(
SE)1n(SE)1m(SE
2y
2x2
p
222
)2nm(
)1n()1m(
dovedove
È lo stimatore non-distorto della varianza comune 2; infatti, si ha:È lo stimatore non-distorto della varianza comune 2; infatti, si ha:
Intervalli di Confidenza F. Domma 47
)2(~
11
nmt
nmS
DT
p
yx
21r qTqP1
In definitiva, la v.c. In definitiva, la v.c.
È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare (x-y) con distribuzione che non dipende da parametri incogniti.
Fissato , possiamo determinare q1 e q2 tali che
È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare (x-y) con distribuzione che non dipende da parametri incogniti.
Fissato , possiamo determinare q1 e q2 tali che
Intervalli di Confidenza F. Domma 48
21
11q
nmS
DqP
p
yxr
nm
SqDnm
SqP pyxpr
111121
nm
SqDnm
SqDP pyxpr
111121
nm
SqDnm
SqDP pyxpr
111121
Intervalli di Confidenza F. Domma 49
nm
SqDnm
SqDP pyxpr
111112
qTP2
qTP 2r1r
)2nm(
)2nm(
2
2
tq
tq
2
1
Ricordando che Ricordando che
Intervalli di Confidenza F. Domma 50
11111
)2()2(22 nmnm
pyxpr StDStDP nmnm
n
1
m
1p1 StDT )2nm(
2
n
1
m
1p2 StDT )2nm(
2
Sostituendo, si ottiene:Sostituendo, si ottiene:
Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze incognite ma uguali, sono:
Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze incognite ma uguali, sono:
Intervalli di Confidenza F. Domma 51
n
1
m
1
n
1
m
1pp std , std )2nm()2nm(
22
yxd
m
1iix
m
1x
n
1iiy
n
1y
)2nm(
)1n()1m(2y
2x2
p
sss
m
1i
2i
2x xx
1m
1s
n
1i
2i
2y yy
1n
1s
Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze incognite ma uguali, al 100(1-)% è:
Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze incognite ma uguali, al 100(1-)% è:
dovedove
concon
ee
Intervalli di Confidenza F. Domma 52
Per provare l’efficacia di due nuovi semi per la produzione di grani sottocondizioni climatiche normali, un’industria di semi selezionacasualmente otto aziende agricole in una regione italiana e provaentrambi i semi su una determinata superficie coltivabile. Le produzioniper le otto aziende, secondo il seme utilizzato, sono le seguenti:A : 86, 87, 56, 93, 84, 93, 75, 79B : 80, 79, 58, 91, 77, 82, 74, 66Supponendo che le due produzione siano, in ogni azienda, distribuitenormalmente e che le varianze delle due popolazioni siano uguali,determinare l’intervallo di confidenza per la differenza delle produzionimedie, ad un livello di confidenza del 95%.
EsempioEsempio
Intervalli di Confidenza F. Domma 53
Intervallo di Confidenza sulla probabilità di successoIntervallo di Confidenza sulla probabilità di successo
Sia X una v.c. di Bernoulli con probabilità di successo pari a . Si ricorda che E(X)= e V(X)= (1- ).Dato un c.c. X1,…,Xn estratto da B(,1), si vuole costruire unintervallo di Confidenza per al 100(1-)%.Consideriamo la proporzione di successi in n-prove indipendenti
n
1iiX
n
1X
Sappiamo che
XE n
)1(XV
Intervalli di Confidenza F. Domma 54
Dal teorema di De Moivre-Laplace, sappiamo che
)1,0(N
n)1(
X
XV
XEXZ
n
d
Si evidenzia che la v.c. Z pur essendo una q.p. (perché è funzione del c.c. e del parametro incognito ed ha distribuzione indipendenteda parametri incogniti) NON può essere utilizzata per costruire un intervallo di confidenza asintotico per la probabilità di successo.Infatti, la varianza della popolazione è sconosciuta. E’ necessario quindi stimare la varianza della popolazione.
Intervalli di Confidenza F. Domma 55
Consideriamo lo stimatore naturale della varianza della popolazione
X1XXXn
1XX
n
1S 2
n
1ii
2n
1i
2i
'2
Perché
n
1ii
n
1i
2i XX essendo Xi=0 oppure Xi=1.
Consideriamo, ora, la varianza campionaria non-distorta
1n
X1XnS
1n
nS
'22
Intervalli di Confidenza F. Domma 56
)1n(X1X
X
)1n(nX1Xn
X
nS
X
XV
XEXZ
2
Sostituiamo a V(X) lo stimatore non-distorto S2
Si dimostra che
)1,0(N
)1n(X1X
XZ
n
d
Quest’ultima è una quantità pivot per la probabilità di successo .
Intervalli di Confidenza F. Domma 57
Fissato , possiamo determinare q1 e q2 tali che
21r qZqP1
21r q
1nX1X
XqP
1n
X1XqX
1n
X1XqP 21r
Intervalli di Confidenza F. Domma 58
1n
X1XqX
1n
X1XqXP 21r
1n
X1XqX
1n
X1XqXP 12r
Analogamente, a quanto visto in precedenza possiamo dire che
2zq1
2zq2
Intervalli di Confidenza F. Domma 59
11n
X1XzX
1n
X1XzXP
22r
Sostituendo abbiamo
1n
X1XzXT
21
Gli estremi dell’intervallo casuale (T1,T2), per la probabilità di successo, sono: Gli estremi dell’intervallo casuale (T1,T2), per la probabilità di successo, sono:
1n
X1XzXT
22
Intervalli di Confidenza F. Domma 60
1n
)x1(xzx ,
1n
)x1(xzx
22
Osservato x=(x1,…,xm) , l’I.C. asintotico per la probabilità di successo al 100(1-)% è:
Osservato x=(x1,…,xm) , l’I.C. asintotico per la probabilità di successo al 100(1-)% è:
dovedove
n
1iix
n
1x
Intervalli di Confidenza F. Domma 61
Esempio.Esempio.
Dal deposito di una industria che produce lampade, si estrae un c.c.di 350 unità e si osserva che il 25% sono difettose. Si determini unintervallo di confidenza per la proporzione di lampade difettoseprodotte dall’industria in esame, al livello di confidenza del 95%.
Intervalli di Confidenza F. Domma 62
Intervalli di Confidenza F. Domma 63
Intervalli di Confidenza F. Domma 64
Intervalli di Confidenza F. Domma 65
Intervalli di Confidenza F. Domma 66