testování hypotéz
DESCRIPTION
Testování hypotéz. 4. přednáška 6. 3. 2010. Základní pojmy. Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo ne. Nulová hypotéza H 0 Hypotéza, jejíž platnost ověřujeme. Značíme je H 0. - PowerPoint PPT PresentationTRANSCRIPT
Základní pojmy• Statistická hypotéza• Je tvrzení o vlastnostech základního souboru, • o jehož pravdivosti se chceme přesvědčit.• Předem nevíme, zda je pravdivé nebo ne.
• Nulová hypotéza H0 • Hypotéza, jejíž platnost ověřujeme.• Značíme je H0.
• Alternativní hypotéza H1Říká, co bude platit,
• když nebude platit nulová hypotéza H0.• Říkáme, že testujeme H0 proti H1.
Základní pojmy
Testy jednostranné a dvoustranné záleží na formulaci alternativní hypotézy
Nulová hypotéza H0: A = B
Dvourstranná H1:
Jednostranná H1:
H1:
Základní pojmy• Statistický test• Jednoznačné pravidlo, • které určuje podmínky, za kterých hypotézu H0
– zamítneme nebo nezamítneme.
• Testovací kritérium (Z)• Je funkce náhodného výběru, • jejíž tvar je závislý na:
– testované hypotéze a – rozdělení pravděpodobností základního souboru.
• Kritická oblasti (KO)• Je množina hodnot testovacího kritéria, které neptaří do oblasti přípustných
hodnot.
• Oblast přípustných hodnot (OPH)• Je množina hodnot testovacího kritéria, které nepatří do kritické oblasti.
Základní pojmy• Kritická hranice (KH)• Odděluje kritickou oblast od oblasti přípustných hodnot.• • Hladina významnosti testu• Je pravděpodobnost kritické oblasti • Postup testování hypotézy1. získání údajů (například měřením),2. stanovení statistického testu s příslušnou kritickou oblastí,3. dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty
testovacího kritéria Z4. zjistíme, kam padla hodnota testovacího kritéria:5. zda do kritické oblasti nebo6. do oblasti přípustných hodnot.
Postup testování hypotéz1. získání údajů (například měřením),
2. stanovení statistického testu s příslušnou kritickou oblastí,
3. dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z
4. zjistíme, kam padla hodnota testovacího kritéria:
– zda do kritické oblasti nebo= nulovou hypotézu zamítáme
– do oblasti přípustných hodnot.= nulovou hypotézu nezamítáme
Postup testování hypotéz• Pokud Z KO ……… hypotéza H0 se
zamítáŘíkáme: pokud hodnota testovacího kritéria padne do kritické oblasti, hypotézu H0 zamítáme.
• Pokud Z KO ……… hypotéza H0 se nezamítá
Říkáme: pokud hodnota testovacího kritéria padne oblasti přípustných hodnot, hypotézu H0 nezamítáme.
Dělení testů hypotéz podle toho zda známe RP
• Parametrické testy– Rozdělení pravděpodobností základního souboru je
známé.
– Testování se týká pouze hodnot parametrů.
– Jsou spojovány s testováním parametrů normálního rozdělení pravděpodobností.
• Neparametrické testy– Neznáme rozdělení pravděpodobností
Dělení testů hypotéz• Testy významnosti
Rozdělení pravděpodobností je známé.Testované hypotézy se týkají pouze parametrů základního souboru.– Jednovýb. testy významnosti pro střední hodnotu N-RP
• Známe δ,• Neznáme δ.
– Jednovýb. Testy významnosti pro rozptyl • Testy shody
Týkají se typu rozdělení pravděpodobností základního souboru.
Test pro střední hodnotu pokud: známe δ a soubor má normální RP
• Testovací kritérium
• = aritmetický průměr náhodného výběru• n = rozsah náhodného výběru• k = střední hodnota (konstanta)• δ = směrodatná odchylka náhodného výběru
Test pro střední hodnotu pokud: známe δ a soubor má normální RP
• Kritická oblasta) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k
W =
Příklad Podle jízdního řádu je jízdní doba nedělního posilového spoje číslo 13 mezi
Strakonicemi a Prahou 100 minut. Po deset neděl byl sledován příjezd tohoto spoje do Prahy a za předpokladu,
že autobus vyjel ze Strakonic včas, byly zaznamenány tyto jízdní doby:
Na hladině významnosti testujete, zda jízdní doba uvedená v jízdním řádu odpovídá skutečnosti, jestliže víte, že hodnoty pocházejí ze základního souboru s normálním rozložením pravděpodobností se směrodatnou odchylkou δ = 10,3.
Datum 7.3. 14.3. 21.3. 28.3 4.4. 11.4. 18.4. 25.4. 2.5. 9.5.
Doba 90 112 103 86 98 100 120 89 95 100
Test pro střední hodnotu pokud: neznáme δ, studentovo RP
• Testovací kritérium
• = aritmetický průměr náhodného výběru• n = rozsah náhodného výběru• k = střední hodnota (konstanta)• s = směrodatná odchylka náhodného výběru
(musí se dopočítat)
Test pro střední hodnotu pokud: neznáme δ, studentovo RP
• Kritická oblasta) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k
W =
Příklad
10 majitelů vozů Škoda Octavia sledovalo spotřebu paliva, hodnoty jejich měření jsou uvedeny v tabulce. Výrobce udává průměrnou spotřebu tohoto typu automobilu Octavita 8,9 l/100km. Předpokládejme, že spotřeba má normální rozdělení pravděpodobnosti.
• a) Otestuje na hladině významnosti 0,05, zda se liší spotřeba naměřená majiteli vozů od střední hodnoty dané výrobcem.
• b) Otestujte na hladině významnosti 0,05, zda je spotřeba naměřená
majiteli vozů významně vyšší než hodnota udaná výrobcem.
•Majitel 1 2 3 4 5 6 7 8 9 10
Spotř. 10,0 9,3 8,8 9,0 8,85 9,05 9,05 8,9 8,95 10,2
Test pro rozptyl
• Kritická oblasta) dvoustranná alternativní hypotéza H0: DX= k2 proti H1: DX k2
W =
Příklad
• Automat vyrábí pístové kroužky o daném průměru. Výrobce udává, že směrodatná odchylka průměru kroužků je 0,05 mm. K ověření této informace bylo vybráno náhodně 80 kroužků a vypočtena směrodatná odchylka jejich průměru s = 0,04 mm.
• Lze tento rozdíl považovat za významný?
• Na 5% hladině významnosti testujte hypotézu, že směrodatná odchylka průměru kroužků je rovna 0,05 mm.