9 testarea ipotezelor statistice
TRANSCRIPT
9 Testarea ipotezelor statistice
Un test statistic consta în obtinerea unei deductii bazata pe o selectie din populatie prin testarea unei anumite
ipoteze (rezultata din experienta anterioara, din observatii, din teorie, sau din cerinte legate de calitatea produselor,
etc). De multe ori aceasta ipoteza este o afirmatie referitoare la valoarea parametrului necunoscut al densitatii
populatiei, spre exemplu media sau dispersia populatiei.
Rezultatul testarii este apoi folosit pentru luarea unei anumite decizii, cum ar fi decizia de cumparare a unui
anumit automobil (bazata pe testul priving consumul de carburant), de administrare a unui anumit medicament
(bazata pe testul privind eficienta acestuia), de aplicare a unei anumite strategii de marketing (bazata pe testul
privind reactia consumatorilor la aceasta strategie), etc.
Testarea unei ipoteze statistice este procedeul prin care folosind informatia dintr-o selectie a populatiei se ajunge
la o decizie asupra ipotezei în cauza. Daca informatia data de selectie este consistenta cu ipoteza, atunci se accepta
ipoteza, iar în caz contrar aceasta este respinsa.
Pentru a întelege modul de aplicare a testului statistic, consideram urmatorul exemplu.
Exemplul 9.1 Dorim sa cumparam 100 km de cablu de un anumit tip, cu conditia ca specificatia producatorului
ca acest cablu are o rezistenta de rupere de = 0 = 200 kg este îndeplinita. Aceasta reprezinta testarea ipotezei
(numita ipoteza nula) = 0 = 200. Decidem sa nu cumparam cablul daca testul statistic arata ca valoarea reala
= 1 200, deoarece aceasta arata ca acest tip de cablu are o rezistenta la rupere mai mica decât cea dorita.
Valoarea 1 se numeste ipoteza alternativa a testului. Formalizam aceasta prin
0 : = 200
1 : 200
Daca rezultatul testului sugereaza ca ipoteza nula 0 este adevarata, vom accepta aceasta ipoteza, iar în caz
contrar o vom respinge (si vom accepta deci ipoteza alternativa 1).
Trebuie avut însa în vedere ca verificarea cu siguranta a ipotezei considerate este imposibila în practica (cu
exceptia cazului când se poate selecta întreaga populatie), si deci verificarea ipotezelor statistice trebuie avuta în
vedere probabilitatea luarii unei decizii gresite: vom nota prin probabilitatea de a respinge ipoteza nula 0 când
de fapt aceasta este adevarata. Valoarea se numeste nivelul de semnificatie al testului.
Selectând în mod aleator 25 de role de cablu, si taiând câte o bucata din fiecare, obtinem un esantion de volum
= 25 din populatia considerata. Daca se masoara rezistenta la rupere a fiecarei bucâti de cablu, obtinem spre
exemplu rezistenta medie de rupere = 197 kg si abaterea patratica medie = 6 kg.
Ne punem problema daca diferenta 197− 200 = −3 este datorata anumitor factori aleatori (erori de masurare,spre exemplu), sau daca ea este semnificativa pentru populatia studiata.
Daca presupunem ca rezistenta cablului este o variabila aleatoare normala N ¡ 2
¢, în ipoteza ca = 0 = 200
(adica daca ipoteza nula este adevarata), variabila aleatoare
= − 0
√
este o variabila aleatoare Student cu − 1 grade de libertate.Deoarece în acest caz este iportanta respingerea ipotezei nule când valoarea medie a esantionului este mica (când
cablul nu are rezistenta dorita), pentru un nivel de semnificatie = 5% fixat, folosind Anexa 3 determinam valoarea
constantei astfel încât () = ( ≤ ) = = 005, obtinând = −171 (deoarece valoarea 005 05, pentru adetermina pe folosind Anexa 3, folosim faptul ca distributia Student este simetrica fata de origine, si determinam
astfel încât () = 1− 005 = 095 adica = 171. Valoarea lui este deci = − = −171. A se vedea Figura15).
Ideea testului este urmatoarea: daca ipoteza nula este adevarata, probabilitatea ca o valoare calculata a lui sa
fie mai mica decât = −171 este = 005 (probabilitatea este aproape nula). Deci, daca pentru selectia considerataobservam ca valoarea este mai mica decât = −171, afirmam ca ipoteza nula nu poate fi adevarata si respingem
aceasta ipoteza, adica acceptam ipoteza alternativa. Daca însa ≥ , atunci acceptam ipoteza nula.
În cazul concret prezentat avem1
=− 0
√25
=197− 200
65
= −52= −25 −171
1 Înlocuim = 1++
(media selectiei) si =
=1(−)
−1 (dispersia selectiei) prin valorile observate = 197 si = 6.
61
c = −1.71 c = 1.710
F (c) = α = 0.05 1− F (c) = α = 0.05
Figure 15: Functia de densitate a distributiei Student este simetrica fata de origine.
si deci respingem ipoteza nula = 0 = 200 si acceptam ipoteza alternativa = 1 200.
Exemplul anterior ilustreaza etapele parcurse în elaborarea unui test statistic, si anume:
1. Se formuleaza ipoteza nula ( = 0 în exemplul anterior)
2. Se formuleaza ipoteza alternativa ( 0 în exemplul anterior)
3. Se alege un nivel de semnificatie dorit (spre exemplu 5% 1%, 01%, etc)
4. Se determina o variabila aleatoare Θ = (1 ) ce depinde de parametrul necunoscut al populatiei,
dar a carei distributie nu depinde de . Folosind distributia variabilei aleatoare Θ se determina valoarea critica
( ( ≤ ) = în exemplul anterior)
5. Pentru valori 1 ale esantionului, se determina valoarea observata = (1 ) a lui Θ.
6. Se accepta sau se respinge ipoteza nula, în functie de valorile concrete a lui si (în exemplul anterior, se
respinge ipoteza nula daca )
9.1 Diferite ipoteze alternative
Sa presupunem parametrul necunoscut al populatiei studiate este , si ca ipoteza nula testata este = 0. În
principiu, în acest caz exista trei ipoteze alternative, si anume:
(1) 0
(2) 0
(3) 6= 0
(1) si (2) se numesc ipoteze alternative unilaterale, iar (3) se numeste ipoteza alternativa bilaterala.
În cazul ipotezei alternative (1), valoarea critica trebuie aleasa la dreapta lui 0, pentru ca în acest caz valorile
din ipoteza alternativa se afla la dreapta lui 0 (a se vedea Figura 16). Regiunea pentru care se accepta ipoteza
nula (la stânga lui în acest caz) se numeste regiune de acceptare, iar regiunea pentru care se respinge ipoteza
nula (la dreapta lui în acest caz) se numeste regiune de respingere. Valoarea care separa aceste regiune se
numeste valoare critica.
În mod similar, în cazul ipotezei (2), valoarea critica trebuie aleasa la stanga lui 0, iar în cazul ipotezei
alternative (3), valorile critice 1 si 2 trebuie alese de o parte si de alta a lui 0.
Toate cele trei ipoteze alternative prezentate apar în probleme practice, cum ar fi:
- atunci când este important ca valoarea lui sa nu depaseasca o valoarea maxima admisa 0 (spre exemplu
tensiunea maxima de alimentare a unui circuit electric), se alege ipoteza alternativa (1)
- atunci când este important ca valoarea lui sa nu fie mai mica decât o valoare minima admisa 0 (ca în
exmplul anterior), se alege ipoteza alternativa (2)
- atunci când este important ca valoarea lui sa aiba exact dimensiunea dorita (spre exemplu diametrul unui
surub trebuie sa aiba o dimensiune precisa pentru a putea fi înfiletat), se alege ipoteza alternativa (3).
62
θ0 c
Regiune de acceptare Regiune de respingere(Se accepta ipoteza nula) (Se respinge ipoteza nula)
θ0c
Regiune de acceptareRegiune de respingere(Se accepta ipoteza nula)(Se respinge ipoteza nula)
θ0c1
Regiune de acceptareRegiune de respingere(Se accepta ipoteza nula)(Se respinge ipoteza nula)
c2
Regiune de respingere(Se respinge ipoteza nula)
Figure 16: Cele trei tipuri de ipoteze alternative: (1) 0 (sus), (2) 0 (mijloc) si (3) 6= 0 (jos).
9.2 Erori în testarea ipotezelor
În testarea ipotezelor apare riscul a doua tipuri de decizii eronate:
(I) Respingerea ipotezei nule atunci când ea este adevarata (numita eroare de tip I). Notam cu probabilitatea
unei erori de tip I, adica
(se respinge 0| 0 este adevarata) =
(II) Acceptarea ipotezei nule atunci când ea este falsa (numita eroare de tip II). Notam cu probabilitatea unei
erori de tip II, adica
(se accepta 0|0 este falsa) =
Cu toate ca nu putem elimina aparitia acestor doua tipuri de erori, putem alege nivele acceptabile de aparitie a
acestor erori, si .
Spre exemplu, sa consideram cazul testarii ipotezei = 0 în cazul ipotezei alternative = 1 0 (celelate
cazuri sunt similare).
Alegem o valoare critica corespunzatoare, si pentru un esantion fixat 1 calculam valoarea = (1 )
pentru o anumita functie (spre exemplu, în cazul în care reprezinta media, alegem (1 ) = = 1++
).
Daca respingem ipoteza nula, iar daca ≤ o acceptam.
Valoarea este valoarea observata a variabilei aleatoare Θ = (1 ), deoarece 1 sunt valorile
observate ale selectiei 1 .
În cazul unei erori de tip I, ipoteza nula este respinsa desi ea este adevarata (adica = 0), si deci probabilitatea
acestei erori este
³Θ (1 )
¯ = 0
´=
iar se numeste nivelul de semnificatie al testului.
În cazul unei erori de tip II, ipoteza nula este acceptata desi ea este falsa (adica = 1), si deci probabilitatea
acestei erori este
³Θ (1 ) ≤
¯ = 1
´=
iar = 1 − se numeste puterea testului ( este probabilitatea de a respinge ipoteza nula atunci când ea este
falsa).
Probabilitatile si din formulele anterioare depind de valoarea lui , si este dorit ca valoarea lui sa fie
astfel aleasa încât ambele probabilitati sa fie cât mai mici. Acest lucru nu este însa posibil, deoarece pentru ca
probabilitatea sa fie minima, trebuie ales cât mai mare (spre dreapta lui 0), si atunci probabilitatea creste.
În practica, se alege o valoare convenabila pentru (spre exemplu = 5% sau 1%), se determina valoarea lui ,
si apoi se calculeaza valoarea lui . Daca valoarea obtinuta este prea mare, atunci se repeta testul, considerând
o selectie de volum mai mare.
Daca ipoteza alternativa nu este de forma = 1 ci de una din formele (1) — (3), atunci probabilitatea este o
functie de (numita caracteristica de operare). Graficul acestei functii (numit curba caracteristica) permite
determinarea probabilitatii pentru o anumita valoarea a lui (si al volumului al selectiei).
63
9.3 Test pentru media a unei populatii normale cu dispersie cunoscuta
Presupunem ca populatia ∈ N ¡ 2
¢este normala cu dispersie 2 cunoscuta, si consideram spre exemplu cazul
testului
0 : = 0
1 : 6= 0
pentru media a populatiei (cazul ipotezelor alternative 0, respectiv 0 este similar).
Daca 1 este o selectie a populatiei ∈ N¡ 2
¢, rezulta ca media de selectie = 1++
este o
variabila aleatoare normala N³
2
´cu medie si dispersie 2
. Daca ipoteza nula este adevarata (adica = 0),
variabila aleatoare
= − 0
√
∈ N (0 1)
este o variabila aleatoare normala standard.
Pentru un nivel de semnificatie fixat, determinam punctul 2 cu proprietatea ca aria de sub densitatea
normala standard, la dreapta acestui punct, este egala cu 2, adica
Φ¡2
¢=
¡ ≤ 2
¢= 1−
2
unde Φ este functia de distributie normala standard (a se vedea Anexa 1 sau Anexa 2).
Folosind faptul ca distributia normala standard este simetrica fata de origine, obtinem ca daca ipoteza nula este
adevarata, atunci
Ã−2 ≤
− 0√
≤ 2
!= 1−
sau echivalent (rezolvând dubla inegalitate în raport cu )
µ0 − 2
√≤ ≤ 0 + 2
√
¶= 1−
Testul este deci urmatorul: pentru valori observate 1 ale selectiei 1 , se calculeaza media
= 1++
. Daca valoarea calculata apartine regiunii de respingere³−∞ 0 − 2
√
´∪³0 + 2
√∞´
se respinge ipoteza nula (si deci se accepta ipoteza alternativa 6= 0), iar în caz contrar se accepta ipoteza nula
= 0.
Definim -valoarea testului ca fiind egala cu cel mai mic nivel de semnificatie pentru care se respinge ipoteza
nula pentru un esantion 1 fixat. În cazul prezentat, aceasta revine la
= 0 ± 2√⇐⇒ 2 =
¯¯− 0
√
¯¯ ⇐⇒ Φ
ï¯− 0
√
¯¯!= 1−
2
adica = 2³1−Φ
³¯−0√
¯´´.
Exemplul 9.2 Fie o populatie cu o distributie normala având dispersie cunoscuta 2 = 9. Folosind un esantion
de volum = 10 cu medie sa se testeze ipoteza nula = 0 = 24 în cazul ipotezei alternative
(a) 0 (b) 0 (c) 6= 0
Consideram nivelul de semnificatie = 5%. Un estimator al mediei este
=1 + +
iar daca ipoteza nula este adevarata, atunci este o variabila aleatoare normala cu medie = 24 si dispersie2
= 09, si folosind Anexa 2 se determina valoarea lui dupa cum urmeaza.
64
Cazul (a). În acest caz, determinam valoarea lui astfel încât ¡
¯ = 24
¢= = 005, adica
( ≤ | = 24) = Φµ− 24√09
¶= 1− = 095
Folosind Anexa 2 se determina −24√09
= 1645, si deci = 2556. Daca media esantionului ≤ 2556, ipotezanula este acceptata, iar daca 2556 ea este respinsa.
Puterea testului este data de
() = ¡ 2556
¯ 6= 24¢ = 1−
¡ ≤ 2556
¯ 6= 24¢ = 1−Φµ2556− √
09
¶
Cazul (b). În acest caz, determinam valoarea lui astfel încât
( ≤ | = 24) = Φµ− 24√09
¶= = 005
Folosind Anexa 2 se determina −24√09
= −1645, si deci = 2244. Daca media esantionului ≥ 2244, ipotezanula este acceptata, iar daca 2244 ea este respinsa.
Puterea testului este
() = ¡ ≤ 2244
¯ 6= 24¢ = Φµ2244− √
09
¶
Cazul (c).Cum distributia normala este simetrica fata de origine, determinam constantele 1 si 2 astfel încât
sa fie egal departate fata de media 0 = 24, adica vom considera 1 = 24− si 2 = 24+ si determinam constanta
astfel încât
¡24− ≤ ≤ 24 +
¯ = 24
¢= Φ
µ√09
¶−Φ
µ− √
09
¶= 1− = 095.
Folosind Anexa 2, obtinem √09= 1960, sau = 186, si deci 1 = 24− 186 = 2214 si 2 = 24+186 = 2586.
Daca media a esantionului este cuprinsa între 1 si 2, acceptam ipoteza nula, iar în caz contrar o respingem.
Puterea testului este
() = ¡ 2214
¯ 6= 24¢+
¡ 2586
¯ 6= 24¢
= Φ
µ2214− √
09
¶+ 1−Φ
µ2586− √
09
¶
În practica, daca crestem volumul al esantionului (spre exemplu de la = 10 la = 100), valoarea erorii
() = 1− () scade. În functie de problema în cauza, volumul al selectiei se alege astfel încât valoarea erorii
() sa fie acceptabila (în caz contrar, se alege un esantion de volum mai mare si se repeta testul).
9.4 Test pentru media a unei populatii normale cu dispersia necunoscuta
Presupunem ca populatia ∈ N ¡ 2
¢este normala cu dispersie 2 necunoscuta, si consideram spre exemplu
cazul testului
0 : = 0
1 : 6= 0
pentru media a populatiei (cazul ipotezelor alternative 0, respectiv 0 este similar).
Cum dispersia 2 a populatiei este necunoscuta, procedam în mod similar cazului dispersiei cunoscute, înlocuind
abaterea patratica medie (necunoscuta) prin estimatorul =
q1
−1P
=1
¡ −
¢2, unde 1 este o
selectie de volum din populatia .
Variabila aleatoare rezultata
= − 0
√
65
are în acest caz o distributie Student cu − 1 grade de libertate, si procedând în mod analog cazului anterior,determinam punctul 2−1 astfel încât aria de sub densitatea Student cu − 1 grade de libertate, la dreaptaacestui punct este egala cu
2, adica
¡2−1
¢= 1−
2
unde este functia de distributie Student cu − 1 grade de libertate (se va folosi Anexa 3).Testul este urmatorul: pentru valori observate 1 ale selectiei1 se calculeaza valoarea =
−0√
,
unde = 1++
si =
q1
−1P
=1 ( − )2. Daca ∈ ¡−2−1 2−1¢ se respinge ipoteza nula = 0,
iar în caz contrar aceasta este acceptata.
Exemplul 9.3 Testând rezistenta la rupere a unor frânghii pentru un esantion de volum = 16, s-a determinat
valoarea medie = 4482 kg si abaterea patratica medie = 115 kg. Presupunând ca rezistenta la rupere este o
variabila aleatoare normala, sa se testeze ipoteza = 0 = 4500 kg.
Consideram nivelul de semnificatie = 5%. Daca ipoteza nula este adevarata, atunci variabila aleatoare
= − 0
√
= − 4500
√
este are o distributie student cu − 1 = 15 grade de libertate.Cum în aceasta problema este important daca media are (sau nu) valoarea minima admisa 0 = 4500, alegem
ca ipoteza alternativa 0 = 4500.
Determinam valoarea critica astfel încât ( | = 4500) = = 005. Folosind Anexa 3 determinam
= −175.Valoarea observata a variabilei aleatoare în cazul esantionului selectat este = 4482−4500
115√16
= −0626. Deoarece = −0626 −175 = , acceptam ipoteza nula = 0 = 4500 kg.
9.5 Test pentru dispersia 2 a unei populatii normale
Presupunem ca populatia ∈ N ¡ 2
¢este normala si dorim sa testam
0 : 2 = 20
1 : 2 6= 20
(cazul ipotezelor alternative 2 20, respectiv 2 20 este similar).
Vom considera în acest caz statistica
=(− 1)2
20
Daca ipoteza nula este adevarata, atunci populatia are dispersie 20, si deci
=(− 1)2
20=
X=1
µ −
0
¶2are o distributie 2 cu − 1 grade de libertate.Consideram punctele 2−1 si 1−2−1 alese astfel ariile de sub densitatea
2 cu − 1 grade de libertate,la dreapta acestor puncte, sunt
2, respectiv 1−
2, adica
³2−1
´= 1−
2si
³1−2−1
´=
2
unde reprezinta functia de distributie a variabilei 2 cu − 1 grade de libertate (Anexa 4).Pentru un nivel de semnificatie fixat, testul este urmatorul: pentru valori observate 1 ale selectiei
1 se calculeaza valoarea =(−1)2
20, unde =
q1
−1P
=1 ( − )2si = 1++
. Daca ∈³
−1−2−1 2−1´se respinge ipoteza nula 2 = 20, iar în caz contrar aceasta este acceptata.
66
Exemplul 9.4 Folosind un esantion dintr-o populatie normala, de volum = 15 având dispersie 2 = 13, sa se
testeze ipoteza nula 2 = 20 = 10 în cazul ipotezei alternative 2 = 21 = 20.
Consideram un nivel de semnificatie = 5%. Daca ipoteza nula este adevarata, atunci variabila aleatoare
= (− 1) 2
20= 14
2
10= 142
este o variabila aleatoare 2 cu − 1 = 14 grade de libertate.Folosind Anexa 4 cu − 1 = 14 grade de libertate determinam valoarea constantei astfel încât ( ) =
= 005, sau echivalent ( ≤ ) = 1− = 095. Obtinem = 2386.
În cazul esantionului selectat obtinem valoarea = 142 = 14 · 13 = 182 2386 = , si deci în acest caz
acceptam ipoteza nula 2 = 20 = 10.
Observatia 9.5 Atât în cazul testului pentru media unei populatii normale cu dispersie necunoscuta, cât si în cazul
testului pentru dispersia unei populatii normale, pentru a calcula puterea testului este nevoie de tabele suplimentare
(pentru distributia Student, respectiv pentru distributia 2). În acest curs nu vom studia aceste probleme.
9.6 Test pentru proportia unei populatii
Presupunem ca suntem interesati în testarea unei anumite caracteristici a populatiei. Pentru o selectie1
a populatiei, notând cu numarul de observatii ce îndeplinesc caracteristica respectiva si cu proportia necunoscuta
a populatiei ce verifica caracteristica, rezulta ca variabila aleatoare ∈ Bin ( ) are o distributie populatia
binomiala cu parametrii si , si din teorema limita centrala rezulta ca pentru valori mari ale volumului selectiei,
variabila aleatoare
= − p (1− )
este aproximativ o variabila aleatoare normala standard.
Pentru a testa deci ipoteza
0 : = 0
1 : 6= 0
procedând ca si în cazurile anterioare, obtinem urmatorul test.
Pentru valori observate ale esantionului si pentru un nivel de semnificatie fixat, se calculeaza valoarea core-
spunzatoare = −0√0(1−0)
a variabilei aleatoare ; daca ∈ ¡−2 2¢ se respinge ipoteza nula, iar în cazcontrar se aceasta este acceptata.
67