4 laboratorinis darbas. parametrŲ ĮverČiai ir statistinĖs...
TRANSCRIPT
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 1
4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS HIPOTEZĖS
DARBO TIKSLAS - išstudijuoti parametrų taškinių ir intervalinių įverčių radimo, parametrinių ir neparametrinių hipotezių tikrinimo uždavinius ir jų taikymą.
1. Teorijos klausimai
Suformuluokite parametrų taškinių ir intervalinių įverčių radimo 1.uždavinius.Paaiškinkite dvi termino statistika prasmes.2.Kokie įverčiai vadinami taškiniais?3.Apibrėžkite, kokį įvertį vadiname suderintu, nepaslinktu ir efektyviu?4.Kokie taškiniai įverčiai laikomi gerais?5.Taškinių įverčių sudarymo būdai (momentų ir didžiausio tikėtinumo 6.metodai). Kokios yra jų teigiamos ir neigiamos pusės?Ką vadiname pasikliautinuoju intervalu ir pasikliovimo lygmeniu?7.Paaiškinkite pasikliautinojo intervalo sudarymo žingsnius.8.Kaip keičiasi pasikliautinojo intervalo ilgis: a) didinant imtį; b) mažinant 9.pasikliovimo lygmenį?Kokios statistikos naudojamos sudarant normaliojo skirstinio vidurkio 10.pasikliautinąjį intervalą, kai dispersija žinoma ir kai ji nežinoma?Kaip sudaromas normaliojo skirstinio dispersijos pasikliautinasis 11.intervalas, kai vidurkis ir dispersija nežinomi?Kaip randamas įvykio tikimybės pasikliautinasis intervalas?12.Paaiškinkite statistinės hipotezės sąvoką ir pateikite pavyzdžių.13.Kokią hipotezę vadiname nuline, kokią - alternatyvia?14.Kokią hipotezę vadiname parametrine, kokią - neparametrine? Pateikite 15.pavyzdžių.Paaiškinkite pirmosios ir antrosios rūšies klaidos bei reikšmingumo 16.lygmens prasmes.Ką vadiname kritine reikšme ir kritine sritimi? Kaip parenkama kritinė 17.sritis? Paaiškinkite hipotezės tikrinimo žingsnius.18.Paaiškinkite reikšmingumo lygmens ir p-reikšmės prasmes.19.Ką vadiname kriterijaus galia?20.Suformuluokite suderinamumo hipotezę. Pateikite pavyzdžių.21.Kokie kriterijai dažniausiai naudojami suderinamumo hipotezių tikrinimui?22.
Paaiškinkite suderinamumo χ2 kriterijaus sudarymo schemą.23.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 2
2. Tipinių uždavinių sprendimas
2.1. Normaliojo skirstinio parametrų įverčiai
Užduotis. Iš didelės elektros lempučių siuntos atsitiktinai atrinktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valandomis). Atsitiktinės imties realizacija įrašyta katalogo D:\duomenys faile elektros lemputes.dat . Reikia rasti elektros lempučių degimo laiko vidurkio ir dispersijos taškinius įverčius ir pasikliautinuosius intervalus. Tarkime, kad stebime normalųjį atsitiktinį dydį
X~ N µ σ2,( ) , čia kintamasis X yra lemputės degimo laikas (valandomis).
Parametrai µ ir σ2 nežinomi.
Sprendimas. Įvedame duomenis.
ORIGIN 1:=
x READPRN "D:\duomenys\elektros lemputes.dat"( ):=
Išvedame pirmuosius 10 imties elementų.
Vidurkio pasikliautinojo intervalo radimo žingsniai:
1. Randame nežinomų skirstinio parametrų taškinius įverčius. Vidurkio taškinis įvertis: xvid mean x( ):= xvid 2017.20= .
Dispersijos taškinis įvertis: s Stdev x( ):= s 100.62= s2 10124.05=
Apskaičiuojame imties didumą n.
x
112345678910
2037193620432099204320511958202820342193
= n length x( ):=
n 55=
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 3
α 0.05:=, tuomet 2. Parenkame pasikliovimo lygmenį 1-α = 0.95
. s2 10124.1=s Stdev x( ):=1. Randame parametro taškinį įvertį
Dispersijos pasikliautinojo intervalo radimo žingsniai:
Išvada, Su 95% garantija galime teigti, kad elektros lempučių vidutinis degimo laikas yra nuo 1990 iki 2044.4 valandų.
. PI1-α µ( )[ ] 1990 2044.4( )=
PI1-α µ( )[ ] xvids
nt1-α/2 ; n-1[ ]⋅− xvid
s
ntα/2 ; n-1[ ]⋅−
:=
1 α−( ) 0.95=Apskaičiuojame populiacijos vidurkio pasikliautinąjį intervalą.
5.
t1-α/2 ; n-1[ ] 2.005=t1-α/2 ; n-1[ ] qt 1α2
− n 1−,
:=
tα/2 ; n-1[ ] 2.005−=tα/2 ; n-1[ ] qtα2
n 1−,
:=
Randame Stjudento skirstinio α/2 ir 1-α/2 lygmens kvantilius tα/2 ; n-1
ir t1-α/2 ; n-1 , tenkinančius lygtį
P( tα/2 ; n-1 < Xvid µ−
Sn⋅ < t1-α/2 ; n-1 ) = 1- α ,
arba pertvarkytą lygtį
P ( Xvid - S
nt1-α/2 ; n-1 < µ < Xvid - S
ntα/2 ; n-1 ) = 1- α .
4. kuri turi Stjudento skirstinį su n-1 laisvės laipsnių.
,TXvid µ−
Sn⋅
3. Pasikliautinojo intervalo sudarymui parenkame statistiką
. α 0.05:=, tuomet 2. Parenkame pasikliovimo lygmenį 1-α = 0.95
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 4
Išvada, Su 95% garantija galime teigti, kad elektros lempučių degimo laiko dispersija yra intervale nuo 7175,3 iki 15362,6 .
. PI1-α σ2( ) 7175.3 15362.6( )=
PI1-α σ2( ) s2 n 1−( )⋅
χ2( )1 α/2 ; n-1−
s2 n 1−( )⋅
χ2( )α/2 ; n-1
:=
1 α− 0.95=Apskaičiuojame populiacijos dispersijos pasikliautinąjį intervalą.
5.
χ2( )1 α/2 ; n-1−
76.19=χ2( )1 α/2 ; n-1−
qchisq 1α2
− n 1−,
:=
χ2( )α/2 ; n-1
35.59=χ2( )α/2 ; n-1
qchisqα2
n 1−,
:=
Randame chi-kvadrato skirstinio α/2 ir 1-α/2 lygmens kvantilius χ2( )
α/2 ; n-1 ir χ2( )
1 α/2 ; n-1−, tenkinančius lygtį
P( χ2( )α/2 ; n-1
< S2 n 1−( )⋅
σ2< χ2( )
1-α/2 ; n-1) = 1- α ,
arba pertvarkytą lygtį
P ( S2 n 1−( )⋅
χ2( )1-α/2 ; n-1
< σ2 < S2 n 1−( )⋅
χ2( )α/2 ; n-1
) = 1- α .
4.
kuri turi chi-kvadrato skirstinį su n-1 laisvės laipsnių.
,χ2 S2 n 1−( )⋅
σ2
3. Pasikliautinojo intervalo sudarymui parenkame statistiką
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 5
z1 α/2−[ ] 1.64=z1 α/2−[ ] qnorm 1α2
− 0, 1,
:=
zα/2[ ] 1.64−=zα/2[ ] qnormα2
0, 1,
:=
4. Randame standartinio normaliojo skirstinio α/2 ir 1-α/2 lygmens kvantilius zα/2 ir z1 α/2− , tenkinančius lygtį
P( zα/2 < p p−
p 1 p−( )⋅n⋅ < z1 α/2− ) = 1- α ,
arba pertvarkytą lygtį
P ( p z1 α/2−p 1 p−( )⋅
n⋅− < p < p zα/2
p 1 p−( )⋅n
⋅− ) = 1- α.
kuri turi standartinį normalųjį skirstinį Z~N(0; 1) .
,Zp p−
p 1 p−( )⋅n⋅
3. Pasikliautinojo intervalo sudarymui parenkame statistiką
. α 0.10:=, tuomet 2. Parenkame pasikliovimo lygmenį 1-α = 0.90
p 0.35=p35100
:=
1. Randame parametro p taškinį įvertį p
Pasilkliautinojo intervalo radimo žingsniai:
Sprendimas. Tarkime, kad X yra darbuotojo atsakymas į klausimą. Tegul X įgyja reikšmę (jeigu darbuotojas nepritaria įmonėje vykdomoms reformoms) arba 0 (priešingu atveju). Tuomet X skirstinys yra binominis X~B(1; p), čia p - dalis įmonės darbuotojų nepritariančių reformoms.
Užduotis. Apklausus 100 atsitiktinai atrinktų įmonės darbuotojų, paaiškėjo, kad prieš įmonėje vykdomas reformas pasisakė 35 darbuotojai. Raskite darbuotojų, nepritariančių įmonėje vykdomoms reformoms, dalies 90% pasikliautinąjį intervalą.
2.2. Įvykio tikimybės įverčiai
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 6
α 0.05:=
2. Parenkame reikšmingumo lygmenį µ µ0≠Ha:
µ µ0H0:
µ0 2000:=
1. Suformuluojame statistinę hipotezę
Hipotezės tikrinimo žingsniai:n 55=n length x( ):=Imties didumas
x READPRN "D:\duomenys\elektros lemputes.dat"( ):=
ORIGIN 1:=
Sprendimas. Įvedame duomenis.
Užduotis. Iš didelės elektros lempučių siuntos atsitiktinai atrinktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valandomis). Imties duomenys įrašyti faile elektros lemputes.dat . Reikia patikrinti hipotezę, kad vidutinis lempučių degimo laikas lygus 2000 valandoms. Tarkime, kad stebime normalųjį atsitiktinį
dydį X~ N µ σ2,( ) , čia kintamasis X yra lemputės degimo laikas (valandomis).
Parametrai µ ir σ2 nežinomi.
2.3. Hipotezės apie normaliojo skirstinio vidurkio reikšmes
Išvada. Su 90% garantija galime teigti, kad įmonėje vykdomoms reformoms nepritaria nuo 24 iki 46 procentų dirbančiųjų.
PI1-α p( )[ ] 0.24 0.46( )=
PI1-α p( )[ ] p z1 α/2−[ ] p 1 p−( )⋅n
⋅− p zα/2[ ] p 1 p−( )⋅n
⋅−
:=
pasikliautinąjį intervalą.
1 α− 0.9= 5. Apskaičiuojame tikimybės p
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 7
Išvada. Hipotezė H0 neatmetama, nes timt ∈ W0 . Teiginys, kad vidutinis elektros lempčių degimo laikas yra 2000 valandų neprieštarauja imties duomenims. Tačiau gali būti ir kitų teisingų nulinių hipotezių. Pavyzdžiui, vidutinis lemučių degimo laikas yra 1995 arba 2015 valandų. Patikrinkite tai savarankiškai.
timt 1.268=timtxvid µ0−( )
sn⋅:=
s 100.62=s Stdev x( ):=
xvid 2017.20=xvid mean x( ):=
Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę timt ir priimame sprendimą. Jeigu timt ∈ W0 , tai hipotezė H0 neatmetama, priešingu atveju ji atmetama ir priimama Ha.
5.
Kritinę sritį sudaro aibėWK= (-∞ ; tα/2 ; n-1 )∪ ( t1-α/2 ; n-1 ;+ ∞ ) = (-∞ ; -2.005)∪ (2.005;+∞ ),
o neatmetimo sritį aibė W0=[ tα/2 ; n-1 ; t1-α/2 ; n-1 ] = (-2.005; 2.005).
t1-α/2 ; n-1[ ] 2.005=t1-α/2 ; n-1[ ] qt 1α2
− n 1−,
:=
tα/2 ; n-1[ ] 2.005−=tα/2 ; n-1[ ] qtα2
n 1−,
:=
Randame hipotezės H0 kritinę sritį WK ir neatmetimo sritį W0. Kadangi šiuo atveju kritinė sritis yra dvipusė, randame du Stjudento skirstinio kvantilius (dvi kritines reikšmes) tα/2 ; n-1 ir t1-α/2 ; n-1 .
4.
kuri turi Stjudento skirstinį su n-1 laisvės laipsnių.
,TXvid µ0−( )
Sn⋅
3. Hipotezės tikrinimui parenkame statistiką
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 8
Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją (kai H0 teisinga), hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir stebėtą statistikos reikšmę timt.
t 4− 3.9−, 4..:= O 0.05:=
4 0 40
0.1
0.2
0.3
0.4
dt t n 1−,( )
O
tα/2 ; n-1[ ] t1-α/2 ; n-1[ ]
t timt,timt
Kritinė sritis WK
H0 neatmetimo sritis W0
Kritinė sritisWK
Matome, kad stebėta kriterijaus statistikos reikšmė t imt patenka į sritį W0, todėl nulinė hipotezė H0 neatmetama.Panaudoję Mathcad programavimo galimybes, sudarysime funkciją, kuri patikrina ar stebėtoji kriterijaus statistikos reikšmė timt patenka į sritį W0 ir išveda hipotezės tikrinimo atsakymą.
Žemiau pateikta Mathcad funkcija Atsakymas patikrina ar stebėta statistikos reikšmė t imt patenka į sritį W0. Jeigu timt patenka į sritį W0, tai išvedamas tekstas "H 0 neatmesta", priešingu atveju - " H0 atmesta" Po to, skaičiuojamas stebėtas statistikos reikšmingumo lygmuo (p-reikšmė) , kuris apvalinamas 3 ženklų po kablelio tikslumu.
Funkcijos Atsakymas reikšmė yra vektorius, kurio pirmoji komponentė yra tekstas "H0 neatmesta" arba "H0 atmesta", o antroji komponentė - "p=p-reikšmė". Jeigu gauname , kad p-reikšmė yra mažesnė už pasirinktą reikšmingumo lygmenį α , tai hipotezė H0 atmetama.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 9
Atsakymas tekstas 1 "Ho neatmesta"←
tekstas 1 tα/2 ; n-1[ ] timt≤ t1-α/2 ; n-1[ ]≤if
tekstas 1 "Ho atmesta"← otherwise
p 2 min pt timt n 1−,( ) 1 pt timt n 1−,( )−,( )⋅←
p substr num2str round p 3,( )( ) 0, 6,( )←
tekstas 2 concat "p=" p,( )←
tekstas
:=
Atsakymas"Ho neatmesta"
"p=0.21"
=
Vienpusių alternatyvų atveju naudojama ta pati statistika ir panašiai sudaromos kritinės sritys. Kai alternatyva yra
Ha: µ µ0<apskaičiuojame vieną kritinę reikšmę kritinėsritis vienpusė kairė( ).
tα ; n-1[ ] qt α n 1−,( ):= tα ; n-1[ ] 1.674−=
Kritinė sritis yra aibė WK= (-∞ ; tα ; n-1 )= (-∞ ; -1.675), o hipotezės H0
neatmetimo sritis aibė W0=[ tα ; n-1 ; + ∞ ) = [-1.674; +∞ ).
Išvada. Hipotezė H0 neatmetama, nes timt ∈ W0 . Teiginys ,,vidutinis elektros lempčių degimo laikas yra 2000 valandų'' neprieštarauja imties duomenims. Su 95% garantija mes negalime teigti, kad jis mažesnis už 2000 valandų.
Pateiksime Mathcad funkciją Atsakymas1K, kuri išveda hipotezės tikrinimo rezultatą ir p-reikšmę, kai kritinė sritis yra vienpusė kairė.
Atsakymas1K tekstas 1 "Ho neatmesta"← timt tα ; n-1[ ]≥if
tekstas 1 "Ho atmesta"← otherwise
p pt timt n 1−,( )←
p substr num2str round p 3,( )( ) 0, 6,( )←
tekstas 2 concat "p=" p,( )←
tekstas
:=
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 10
Atsakymas1K"Ho neatmesta"
"p=0.895"
=
Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją ( kai H0 teisinga), hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir stebėtą statistikos reikšmę timt.
t 4− 3.9−, 4..:= O 0.05:=
4 2 0 2 40
0.1
0.2
0.3
0.4
dt t n 1−,( )
O
tα ; n-1[ ]
t timt,timt
Kritinė sritis WK H0 neatmetimo sritis W0
Matome, kad stebėta kriterijaus statistikos reikšmė t imt patenka į sritį W0, todėl nulinė hipotezė H0 neatmetama.
2.4. Hipotezė apie dviejų normaliųjų skirstinių vidurkių lygybę
Hipotezių apie dviejų vidurkių lygybę tikrinimui naudojamos statistikos turi Stjudento skirstinius, todėl atitinkami kriterijai vadinami Stjudento t kriterijais. Skirtingi t kriterijai taikomi priklausomoms ir nepriklausomoms imtims. Vertinantvidurkių skirtumus svarbi ir duomenų sklaida - stebimų dydžių dispersijos, todėl skirtingi Stjudento t kriterijai taikomi, kai abiejų populiacijų dispersijos lygios ir tais atvejais kai populiacijų dispersijos skiriasi statistiškai reikšmingai. Čia pateiksime hipotezės apie vidurkių lygybę tikrinimo pavyzdį nepriklausomoms imtims, kai populiacijų dispersijos yra lygios.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 11
kuri turi Stjudento skirstinį su m+n-2 laisvės laipsnių.
, ,TXvid Yvid−( )
n 1−( ) Sx2⋅ m 1−( ) Sy
2⋅+
n m⋅ n m+ 2−( )⋅n m+
⋅
3. Hipotezės tikrinimui parenkame statistiką
.α 0.05:=2. Parenkame reikšmingumo lygmenį µx µy>Ha:
µx µyH0:
1. Suformuluojame statistinę hipotezę
Hipotezės tikrinimo žingsniai:
m 40=m length y( ):=
n 60=n length x( ):=Imčių didumai:
y READPRN "D:\duomenys\naktine pamaina.dat"( ):=
x READPRN "D:\duomenys\dienine pamaina.dat"( ):=
ORIGIN 1:=
Sprendimas. Įvedame duomenis.
Užduotis. Gamykla dirba dviem pamainomis. Jos vadovai nori sužinoti ar darbo našumas dieninėje ir naktinėje pamainose yra vienodas. Atsitiktinai atrinkta 100 darbininkų (60 dirbančių dieninėje, 40 - naktinėje pamainose) ir užregistruota, kiek detalių jie pagamino per pamainą. Gautų imčių duomenys įrašyti failuose dienine pamaina.dat ir naktine pamaina.dat . Reikia patikrinti hipotezę: ar abiejuose pamainose vienas darbininkas pagamina vidutiniškai tiek pat
detalių. Tarkime, kad stebime normaluosius atsitiktinius dydžius X~ N µx σ2,( ) ir Y~ N µy σ2,( ) , čia X yra dieninės pamainos darbininko pagamintų detalių
skaičius, o Y - naktinės pamainos darbininko. Parametrai µx , µy ir σ2 nežinomi.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 12
2.5. Hipotezė apie dviejų normaliųjų skirstinių dispersijų lygybę
Išvada. Hipotezė H0 atmetama, nes timt ∈ WK . Statistiškai įrodyta, kad dieninės pamainos darbininkas pagamina vidutiniškai daugiau detalių lyginant su naktinės pamainos darbininku.
timt 10.695=
timtxvid yvid−( )
n 1−( ) sx2⋅ m 1−( ) sy
2⋅+
n m⋅ n m+ 2−( )⋅[ ]n m+
⋅:=
sy 5.39=sy Stdev y( ):=
sx 4.86=sx Stdev x( ):=
yvid 118.95=yvid mean y( ):=
xvid 130.03=xvid mean x( ):=
Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę timt ir priimame sprendimą. Jeigu timt ∈ W0 , tai hipotezė H0 neatmetama, priešingu atveju ji atmetama ir priimama Ha.
5.
Kritinę sritį sudaro aibė WK= (t1-α ; n m+ 2− ; + ∞ ) = (1.661; +∞ ), o
H0 neatmetimo sritį aibė W0=( ∞− ; t1-α ; n m+ 2− ] = (-∞ ; 1.661].
t1-α ; n m+ 2−[ ] 1.661=t1-α ; n m+ 2−[ ] qt 1 α− n m+ 2−,( ):=
Randame hipotezės H0 kritinę sritį WK ir neatmetimo sritį W0. Kadangi šiuo atveju kritinė sritis yra vienpusė , randame vieną Stjudento skirstinio kvantilį (kritinę reikšmę) t1-α ; n m+ 2− .
4.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 13
kuri turi Fišerio skirstinį su n-1 ir m-1 laisvės laipsnių.
,FSx
2
Sy2
3. Hipotezės tikrinimui parenkame statistiką
. α 0.05:=2. Parenkame reikšmingumo lygmenį
σx2 σy
2≠Ha:
σx2 σy
2H0:
1. Suformuluojame statistinę hipotezę Hipotezės tikrinimo žingsniai:
m 40=m length y( ):=
n 60=n length x( ):=Imčių didumai:
y READPRN "D:\duomenys\naktine pamaina.dat"( ):=
x READPRN "D:\duomenys\dienine pamaina.dat"( ):=
ORIGIN 1:=
Sprendimas.
lygybę. Hipotezė apie dispersijų lygybę svarbi sprendžiant ir kitus uždavinius. Pavyzdžiui, tiriant kainų stabilumą, dviejų testų rezultatų homegeniškumą ir panašiai. Šiame skyrelyje pateiksime hipotezės apie dispersijų lygybę tikrinimo pavyzdį dviems nepriklausomoms imtims. Imtys yra tos pačios kaip ir skyrelyje
3.4.2.4, t.y. stebime normaliuosius atsitiktinius dydžius X~ N µx σx2,( ) ir
Y~ N µy σy2,( ) , čia X yra vieno dieninės pamainos darbininko pagamintų
detalių skaičius, o Y - naktinės pamainos darbininko. Parametrai µx , µy , σx2
ir σy2 nežinomi. Reikia patikrinti hipotezę apie dispersijų lygybę.
Nuo to, ar dviejų populiacijų dispersijas galima laikyti lygiomis, priklauso Stjudento kriterijaus statistika, kuri taikoma tikrinant hipotezę apie vidurkių
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 14
Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją (kai H0 teisinga), hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir stebėtą statistikos reikšmę Fimt.
Išvada. Hipotezė H0 neatmetama, nes Fimt ∈ W0 . Teiginys, kad darbininkų pagamintų detalių skaičiaus dispersija lygios abiejuose pamainose neprieštarauja imties duomenims.
Fimt 0.814=Fimtsx
2
sy2
:=
sy 5.39=sx 4.86=
sy Stdev y( ):=sx Stdev x( ):=
Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę Fimt ir priimame sprendimą. Jeigu Fimt ∈ W0 , tai hipotezė H0 neatmetama, priešingu atveju ji atmetama ir priimama Ha.
5.
Kritinę sritį sudaro aibė WK= ( 0; Fα/2 ; n-1; m-1 )∪ (F1-α/2 ; n-1; m-1 ; + ∞ ) =
( 0; 0.57 )∪ ( 1.816; +∞ ),
o neatmetimo sritį aibė
W0=[ Fα/2 ; n-1; m-1 ; F1-α/2 ; n-1; m-1 ] = [ 0.57; 1.816 ].
F1-α/2 ; n-1; m-1[ ] 1.816=F1-α/2 ; n-1; m-1[ ] qF 1α2
− n 1−, m 1−,
:=
Fα/2 ; n-1; m-1[ ] 0.57=Fα/2 ; n-1; m-1[ ] qFα2
n 1−, m 1−,
:=
Randame hipotezės H0 kritinę sritį WK ir neatmetimo sritį W0. Kadangi šiuo atveju kritinė sritis yra dvipusė, randame du Fišerio skirstinio kvantilius (dvi kritines reikšmes) Fα/2 ; n-1; m-1 ir F1-α/2 ; n-1; m-1 .
4.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 15
Uždavinys. Iš didelės elektros lempučių siuntos atsitiktinai atrinktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valandomis). Imties duomenys įrašyti faile elektros lemputes.dat . Reikia patikrinti hipotezę , kad imtis gauta iš
populiacijos, kurios skirstinys yra normalusis, t.y. X~ N µ σ2,( ) , čia kintamasis
X yra lemputės degimo laikas (valandomis), parametrai µ ir σ2 nežinomi.
Suderinamumo hipotezių tikrinimui yra siūlomi keli kriterijai. Mes naudosime χ2 kriterijų, kurį įvedė Pirsonas (K. Pearson).
. /X~ N µ σ2,( )Ha: ,X~ N µ σ2,( )H0:
Nagrinėsime stebimo skirstinio ir aprioriškai pasirinkto teorinio skirstinio atitikimo problemą, t.y. tikrinsime ar turimas empirinis skirstinys suderinamas su teoriniu modeliu. Formaliai statistinę hipoteze apie tai, kad mūsų imtis gauta iš populiacijos, kurios skirstinys yra normalusis užrašysime
2.6. Suderinamumo hipotezės
Kritinė sritis
WK
H0 neatmetimo sritis W0
Kritinė sritis WK
Fimt 0 0.5 1 1.5 2 2.5 3
0
0.4
0.8
1.2
1.6
dF F n 1−, m 1−,( )
O
Fα/2 ; n-1; m-1[ ] F1-α/2 ; n-1; m-1[ ]
F Fimt,
O 0.2:=F 0 0.05, 3..:=
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 16
Statistikos χ2 formulėje Oj yra skirtingų imties reikšmių (kategorijų) dažniai, jei stebimas diskretusis kintamasis arba intervaliniai dažniai, jei stebimas tolydusis kintamasis, k - kategorijų arba intervalų skaičius, r - skirstinio parametrų, įvertinamų pagal imties duomenis skaičius, Ej - tikėtinieji dažniai (teoriniai dažniai). Pastaba: Kai skirstinio parametrai žinomi, tai r=0. Kai skirstinio
parametrai nežinomi, tai χ2 kriterijus taikomas korektiškiau (teisingiau), jei skirstinio parametrų taškiniai įverčiai randami maksimalaus tikėtinumo metodu, taikomu grupuotiems duomenims. Kai tolydžiųjų skirstinių šeimų, priklausančių tik nuo poslinkio ir mąstelio parametrų (pvz. normaliojo skirstinio) nežinomų parametrų įverčiai randami maksimalaus tikėtinumo metodu, taikomu negrupuotiems duomenims
siūloma taikyti tikslesnį, modifikuotą χ2 kriterijų, kurį pasiūlė rusų statistikas L. Bolševas .
kuri turi χ2 skirstinį su k-r-1 laisvės laipsnių.
,χ2
1
k
j
Oj Ej−( )2
Ej∑
=
3. Hipotezės tikrinimui parenkame statistiką
. α 0.05:=2. Parenkame reikšmingumo lygmenį
/X~ N xvid. s2,( )Ha:
X~ N xvid. s2,( )H0:
1. Užrašome statistinę hipotezę
Hipotezės tikrinimo žingsniai:
. n 55=n length x( ):=Imties didumas:
x READPRN "D:\duomenys\elektros lemputes.dat"( ):=
ORIGIN 1:=
Sprendimas.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 17
histograma a imtis,( ) ν hist a imtis,( )←
b2 i⋅ 1− ai←
b2 i⋅ ai←
c2 i⋅ 1− 0←
c2 i⋅ ν i← i last a( )≠if
c2 i⋅ 0← otherwise
i 1 last a( )..∈for
augment b c,( )
:=
Nubrėšime empirinės tankio funkcijos grafiką pasinaudodami funkcija :
ai a1 i 1−( ) h⋅+:=i 2 k..:=
h 90=hak 1+ a1−
k:=
ak 1+ 2290:=a1 1750:=
, tai k 6:=Jeigu parenkame IP 496=IP xmax xmin−:=
xmax 2287=xmin 1791=
xmax max x( ):=xmin min x( ):=
Pasirenkame intervalą (a1 ; ak 1+ ] su savybe a1 xmin≤ ak 1+ xmax≥, ,
pasistengiant, kad intervalo ak 1+ a1− ilgis būtų kiek galima artimesnis imties pločiui IP xmax xmin− ,
o dalinių intervalų ilgis h būtų "gražus" skaičius.
1 3.322 log n( )⋅+ 6.781=
Kai duomenų aibė simetriška, tai intervalų skaičių k patartina pasirinkti artimą skaičiui
Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę
χ2( )imt
.
4.
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 18
x histograma a x,( ) 1⟨ ⟩:=
∆∆∆∆1
n h⋅histograma a x,( ) 2⟨ ⟩⋅:=
1750 1840 1930 2020 2110 2200 22900
0.001
0.002
0.003
0.004
0.005
∆∆∆∆
x
Normalusis atsitiktinis dydis įgyja reikšmes nuo ∞− iki ∞ , todėl formaliai turime pakeisti pirmojo ir paskutiniojo intervalų kraštinius taškus.
b a:= b1 ∞−:= b k 1+ ∞:=
Skaičiuojame stebėtus intervalinius dažnius
o hist b x,( ):=
Naudodamiesi teorinio skirstinio (hipotezės H0 formuluotėje nurodytas normalusis skirstinys) savybėmis, apskaičiuojame, kiek kintamojo reikšmių turėtų patektų į kiekvieną intervalą, jeigu hipotezė apie kintamojo X skirstinį būtų teisinga.
j 1 k..:=
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 19
Apskaičiuokime imties vidurkį ir dispersiją grupuotiems duomenims:
xvid1n
1
k
i
ai ai 1++
2oi⋅∑
=⋅:= xvid 2015.91=
s1
n 1−1
k
i
ai ai 1++
2xvid−
2
oi⋅∑=
⋅:= s 99.22=
ej pnorm b j 1+ xvid, s,( ) pnorm b j xvid, s,( )−( ) n⋅:=
b
1− 10307×
1840
1930
2020
2110
2200
1 10307×
= o
3
6
18
21
5
2
= e
2.097
8.42
17.591
17.176
7.87
1.851
=
Taikant χ2 kriterijų reikalaujama, kad kiekviename intrevale tikėtinas dažnis ei būtų ne mažesnis už 5. Intervalus, kuriuose tikėtinas dažnis yra mažiau kaip 5, reikia jungti su gretimais intervalais, nes priešingu atveju išvados gali būti klaidingos. Mūsų pavyzdyje yra du tokie intervalai (pirmas ir paskutinis), nes
e1 2.097= ir e6 1.851= .
Sujungsime du pirmuosius ir du paskutinius intervalus ( iš vektoriaus b pašalinsime du taškus 1840 ir 2200). Tam sudarysime funkciją pasalinti V c,( ) , kuri pašalina vektoriaus V koordinatę
Vc (vektoriaus V ilgis sumažėja vienetu).
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 20
Pastaba. Skaičius 1 10307× yra "kompiuterio begalybė".
e
10.81
17.58
16.99
9.62
=o
9
18
21
7
=b
1− 10307×
1930
2020
2110
1 10307×
=
e j pnorm b j 1+ xvid, s,( ) pnorm b j xvid, s,( )−( ) n⋅:=
s 105.1=s1
n 1−1
k
i
ai ai 1++
2xvid−
2
oi⋅∑=
⋅:=
xvid 2015.91=xvid1n
1
k
i
ai ai 1++
2oi⋅∑
=
⋅:=
j 1 k..:=
k 4=k rows o( ):=
e 0:=o hist b x,( ):=
Naujai sudarytiems intervalams apskaičiuojame tikėtinus dažnius ir stebėtą kriterijaus statistikos reikšmę .
a pasalinti a 5,( ):=b pasalinti b 5,( ):=
a pasalinti a 2,( ):=b pasalinti b 2,( ):=
pasalinti V c,( ) i 1←
Ui Vj←
i i 1+←
j c≠( )if
j 1 rows V( )..∈for
U
:=
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 21
o e−
1.81−
0.42
4.01
2.62−
= o e−( )2
3.29
0.18
16.07
6.85
=
χ2( )imt
j
o j e j−( )2
e j∑:= χ2( )
imt 1.973=
5. Randame hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir priimame
sprendimą. Jeigu, χ2( )imt
∈ W0 , tai hipotezė H0 neatmetama, priešingu
atveju ji atmetama ir priimama Ha . Kadangi šiuo atveju kritinė sritis yra
vienpusė dešinė, randame vieną χ2 skirstinio kvantilį χ2( )1-α ; k r− 1−
,
čia k=4, r=2, nes du parametrai įvertinti, pagal imties duomenis.
χ2( )1 α ;1−
qchisq 1 α− 1,( ):= χ2( )1 α ;1−
3.841=
Kritinę sritį sudaro aibė
WK= ( χ2( )1-α ; 1
; + ∞ ) = (3.841; +∞ ),
o H0 neatmetimo sritį aibė
W0=[ 0 ; χ2( )1-α ; 1
] = [ 0; 3.841].
Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją (kai H0 teisnga), hipotezės H 0 kritinę sritį WK , neatmetimo sritį W0 ir
stebėtą statistikos reikšmę χ2( )imt
:
χ2 0 0.01, 5..:= O 0.3:=
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas
KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 22
0 1 2 3 4 50
0.4
0.8
1.2
1.6
χ2( )1 α ;1−
χ2( )imt
H0 neatmetimo sritis W0
Kritinė sritis WK
Išvada. Hipotezė H0 neatmetama, nes χ2( )imt
∈ W0 . Teiginys, kad elektros
lemputės degimo laikas turi normalųjį skirstinį, neprieštarauja imties duomenims.