testování statistických hypotéz

Testování statistických hypotéz

Co je to statistická hypotéza?

Hypotéza o základním souboru (populaci).

Typy stat. hypotéz

• Parametrické hypotézy- hypotézy o parametrech populace

a) Hypotézy o parametru jedné populace (o střední hodnotě, mediánu, rozptylu, relativní četnosti…)

b) Hypotézy o parametrech dvou populací (srovnávací testy)c) Hypotézy o parametrech více než dvou populací (ANOVA …)

• Neparametrické hypotézy- hypotézy o jiných vlastnostech populace (tvar rozdělení, závislost proměnných…)

Zdroje hypotéz

• Hypotéza je založena na předchozí zkušenosti

• Hypotéza vychází z teorie, kterou je třeba doložit

• Hypotéza vychází z požadavku na kvalitu produktu

• Hypotéza je pouhým dohadem založeným na náhodném pozorování

Co to je testování hypotéz?

Egon Sharpe Pearson (1895-1980) Jerzy Neymann (1894-1981)

Rozhodovací proces, v němž proti sobě stojí 2 tvrzení - nulová a alternativní hypotéza.

Nulová hypotéza- takové tvrzení o populaci, které je bráno jak

předpoklad při testování - představuje určitý rovnovážný stav a bývá

vyjádřena rovnosti „=“ např. μ = 100, μ1 = μ2 = μ3 …

Alternativní hypotéza- představuje porušení rovnovážného stavu a

zapisujeme ji tedy jedním ze tří možných zápisů nerovnosti ( ≠ , <, >)

Výběr vhodné alternativní hypotézy

• jednostranná vs. oboustranná alternativa

• alternativní hypotéza musí být v souladu s výběrovým souborem

Princip testování hypotéz

Základní soubor

(populace)

Hypotéza o populaci

Výběrový soubor

Jsou data konzistentní s hypotézou o populaci ?

Chyby při testování hypotéz

jsou nevyhnutelnou součásti testování

Rozhodnutí

Nezamítáme H0 Zamítáme H0

Platí H0Správné rozhodnutí

Pravděpodobnost: 1 – α(spolehlivost)

Chyba I. druhuPravděpodobnost: α (hladina významnosti)

Platí HAChyba II. druhu

Pravděpodobnost: β Správné rozhodnutí

Pravděpodobnost: 1 – β(síla testu)

Skut

ečno

st

• Chyba I. druhu- nulová hypotéza platí, ale my ji zamítneme - maximální přípustná pravděpodobnost chyby I. druhu (hladina významnosti) se volí ještě před pořízením výběrového souboru)

• Chyba II. druhu- nulová hypotéza neplatí, ale my ji nezamítneme (nepoznáme, že neplatí)- síla testu závisí na zvolené testové metodě (zejména na skutečném rozdělení dat)

Grafický zápis chyby II. druhu (pro konkrétní alternativu)

Operativní charakteristika Křivka síly testu (Power Curve)

Příklad

Standardním výrobním způsobem lze vyrobit monitory se střední životnosti 1200 hodin a směrodatnou odchylkou 300 hodin. Novou technologií, kterou navrhuje vývojové centrum bylo zkušebně vyrobeno 100 obrazovek, jejichž průměrná životnost byla 1265 hodin. Předpokládejme, že výběr pocházel z normálního rozdělení.

Jde o kvalitnější technologii, nejde pouze o náhodný rozdíl?

hodinHhodinH

A 1200:1200:0

hodinX 1265

Nakolik průměr odpovídá nulové hypotéze?

900;1200

100300;1200

;

2

2

NX

NX

nNX

α (volíme)β

CX

1200:0 H1200: AH

Jestliže platí H0

µ0 =1200

Jestliže platí konkrétní HA

μA = 1240

H0 HA

H0 OK Chyba I. druhu

HA Chyba II.druhu

OK

Výsledek testu

Sku

tečn

ost

1240:1

AH

Zamítáme H0Nezamítáme H0

Jak snížit pravděpodobnost obou chyb?

1200:0 H1200: AH

1240:1

AH

Jestliže platí H0

µ0 =1200 CX

Jestliže platí konkrétní HA

μA = 1240


αβ

Vliv rostoucího rozsahu výběru na pravděpodobnost chyb I. a II. druhu

Přístupy k testování hypotéz

• Testování pomocí intervalových odhadů• Klasický test

• Čistý test významnosti (testování pomocí p-value (p-hodnoty))

Testování pomocí intervalových odhadů

1. Formulace nulové a alternativní hypotézy2. Nalezení příslušného intervalového odhadu (POZOR! Umíme

zatím nalézt pouze int. odhady parametrů normálního rozdělení!!!)3. Ověření toho, zda testovaná hodnota parametru leží v nalezeném

intervalovém odhadu4. Formulace závěru testu

Lze použít pouze pro testování parametrických hypotéz

Klasický test

1. Formulace nulové a alternativní hypotézy2. Volba testové statistiky (testového kritéria) T(X),

musíme znát (nulové rozdělení)3. Ověření předpokladů testu4. Sestrojení kritického oboru a oboru přijetí5. Výpočet pozorované hodnoty testové statistiky T(X) -

xOBS

6. Formulace závěru testu

) )(( )( 00 HxXTPxF

Konstrukce kritického oboru - C

1. Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy svědčí nízké hodnoty testové statistiky)

C ≤ Tα

2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí vysoké hodnoty testové statistiky), pak je kritický obor vymezen jako:

C ≥ T1-α

3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) – POZOR! Lze použít pouze při symetrickém nulovém rozdělení!!!!

(C ≤ Tα/2) nebo (C ≥ T1-α/2)

0HCXTP

Příklad

1200:0 H1200: AH

1. Formulace nulové a alternativní hypotézy:

2. Volba testového kritéria:

1;0NnXZXT

4. Výpočet pozorované hodnoty:

100.,300.,1265 nhodhodX

17,2100300

1200126500

nXZx HOBS

3. Ověření předpokladu testu:

Viz. předpoklad v zadání úlohy.

5. Konstrukce kritického oboru:

CX

Jestliže platí H0

µ0 =1200


α

z0,95=1,64

T(X), jestliže platí H0

µ =0


α C

6. Rozhodnutí:

Zamítáme H0 ve prospěch HA, tj. s 95% ní pravděpodobnosti lze tvrdit, že došlo ke zlepšení střední životnosti monitorů.

1,64


µ =0


α C

xOBS=2,17

Vliv volby α na rozhodnutí

1,64


µ =0


α C

xOBS=2,17

Čistý test významnosti1. Formulace nulové a alternativní hypotézy2. Volba testové statistiky (testového kritéria) T(X),

musíme znát (nulové rozdělení) 3. Ověření předpokladů testu4. Výpočet pozorované hodnoty testové statistiky T(X) –

xOBS

5. Určení p-value6. Formulace závěru testu

Co je to p-value?

1,64


µ =0


α C

xOBS=2,17

p-value

p-value je pravděpodobnost, že testová statistika bude alespoň tak „extrémní“ jako pozorovaná hodnota.

Jak určujeme p-value?1.Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy svědčí nízké hodnoty testové statistiky)

p-value = F0(xOBS)

2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí vysoké hodnoty testové statistiky), pak je kritický obor vymezen jako:

p-value = 1-F0(xOBS)

3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) – POZOR! Lze použít pouze při symetrickém nulovém rozdělení!!!!

p-value = 2.min{F0(xOBS) ;1-F0(xOBS)}

Jak rozhodujeme pomocí p-value?

1,64


µ =0


α C

xOBS=2,17

p-value

α>p-value zamítáme H0

α<p-value nezamítáme H0

α>p-value zamítáme H0

α<p-value nezamítáme H0

• P-value je nejvyšší hladina významnosti na níž nezamítáme nulovou hypotézu.

• P-value je nejnižší hladina významnosti na níž zamítáme nulovou hypotézu.

Rozhodování na klasických hladinách významnosti (0,05 a 0,01)

0,01 0,05

p-value

Nezamítáme H0Zamítáme H0 Nerozhodná oblast

testování statistických hypotéz

Documents