statistické testy
DESCRIPTION
statistické testy. z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd. liší se hmotnost samic a samců?. mám hypotézu H: m f ≠ m m - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/1.jpg)
statistické testy
• z náhodného výběru vyvozuji závěry ohledně základního souboru
• často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd.
![Page 2: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/2.jpg)
liší se hmotnost samic a samců?• mám hypotézu H: mf ≠ mm
– předpokládám, že se liší
• hypotézu nemůžu potvrdit (verifikovat) → zkusím zamítnout (falzifikovat) nulovou hypotézu H0: mf = mm
– mají stejnou hmotnostpokud ji zamítnu, přijmu opačnou
alternativní hypotézu HA (tu moji původní)
• průměr mf, mm se téměř určitě bude lišit. Bude se lišit tak, abych mohl zamítnout H0?
![Page 3: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/3.jpg)
statistické testy
• z dat spočítám testovou statistiku, která má známé teoretické rozdělení (t, F, 2, U….)
• lze určit, jakou hodnotu bude testová statistika mít, pokud platí H0
• na základě stupňů volnosti (d.f., s.v. – z počtu nezávislých pozorování) stanovím, jestli odchylky jsou jen dílem náhody - p
![Page 4: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/4.jpg)
statistické testy• definuji si hladinu významnosti α –
pravděpodobnost, že zamítnu H0 ačkoli platí – chyba prvního druhu
• většinou 5 % (= 0.05)
• pokud spočítané p je menší než α – zamítám H0 a tím „přijímám“ HA
![Page 5: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/5.jpg)
statistické testy
• jako výsledek statistického testu uvádím– hodnotu testové statistiky (t, F, 2, U…..)– stupně volnosti (degrees of freedom – d.f., s.v.)– dosažená hladina významnosti (p)
• t = 3.414, d.f. = 28, p = 0.0215
• t (28) = 3.414, p = 0.0215
• t28 = 3.414, p = 0.0215
![Page 6: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/6.jpg)
Studentův t-test
![Page 7: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/7.jpg)
• testuji, zda můj výběr má střední hodnotu shodnou s danou hodnotou – jednovýběrový t-test (H0: μ = k)– dlouhodobá průměrná denní teplota v červnu je rovna
17.5 °C. Byla letos stejná?
• testuji, zda dva náhodné výběry (nezávislé) pochází ze stejného základního souboru (mají stejnou střední hodnotu) – dvouvýběrový t-test (H0: μA = μB)– hmotnost samic a samců,….
• testuji, zda rozdíl párových hodnot (závislých) je roven dané hodnotě (větš. 0) - párový t-test (H0: μ1- μ2 = 0)– hmotnost před a po zásahu, délka pravé a levé nohy,
….
![Page 8: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/8.jpg)
Studentův t-test
• předpoklad použití:– normalita dat
• pracuji s průměry, pokud mám dostatek dat, tak se rozdělení blíží normálnímu (centrální limitní věta)
• pokud mám dat málo, většinou nemůžu zamítnout že data nepochází z normálního rozdělení
• ne kategoriální či ordinální stupnice!
– shodnost variancí – ale různé modifikace
![Page 9: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/9.jpg)
Příklad:
• měřím zadní stehno bruslařky a chci porovnat, jestli se liší samci a samice
• chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků 2 gymnázií
• měřím střevle ve dvou řekách a chci zjistit, jestli jsou stejně velké
dvouvýběrový t-test
![Page 10: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/10.jpg)
Příklad:
• měřím zadní stehno bruslařky a chci porovnat, jestli se liší levé a pravé
• chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků před a po prázdninách / přednášce
• vážím lidi (myši) před a po snězení 0.1 kg cukru – je změna 0.1 kg?
párový t-test
![Page 11: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/11.jpg)
formální provedení• chci ukázat: střevle z povodí Stropnice jsou jinak velké
než střevle z povodí Černé (musím zdůvodnit proč!)• formuluji hypotézu: H0: Výběry naměřených délek střevlí
pochází z jednoho základního souboru (průměry se neliší)
• alternativní hypotéza: HA: Výběry naměřených délek střevlí z povodí Stropnice i Černé nepochází z jednoho základního souboru (= střevle obou povodí jsou různě velké)
• provedu testování, jak moc je pravděpodobné že oba výběry pochází ze stejného souboru
• pokud je pravděpodobnost malá (p < 0.05), zamítnu H0 a akceptuji HA
• pokud je p > 0.05, nemůžu zamítnout H0 (ale ani HA!)
![Page 12: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/12.jpg)
![Page 13: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/13.jpg)
dvouvýběrový t-test• rovnají se rozptyly?
• shodnost rozptylů testuji F-testem (H0: s21
= s22)
• pokud p větší než 0.05 – nemůžu zamítnout H0 rozptyly se rovnají (asi)
• pokud p menší než 0.05 – můžu zamítnout H0 rozptyly se nerovnají (asi)
![Page 14: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/14.jpg)
Excel vyžaduje, aby data s větším rozptylem byla zadána jako první!!!
![Page 15: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/15.jpg)
stupně volnosti
hodnota t
odpovídající p:
-jednostranného testu
-dvoustranného testu
![Page 16: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/16.jpg)
test jednostranný a dvoustranný
• testuji zda A se liší od B (H0: A=B) – dvoustranný• testuji zda A je menší / větší než B (H0: A≤B) - jednostranný
![Page 17: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/17.jpg)
výsledek
• Průměrná velikost střevlí z povodí Stropnice a Černé se signifikantně liší (t (33) = -2.61, p = 0.013)
• dobré je i uvést výsledek F-testu: Po nezamítnutí homogenity variancí (F(15,18) = 1.429, p = 0.466)…..
• formálně – zamítám H0 o shodnosti velikostí střevlí z obou povodí….
![Page 18: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/18.jpg)
chyby statistických testů testu
zamítnu H0 nezamítnu H0
H0 platí
(např. A=B)
chyba 1. druhu správně
H0 neplatí
(např. A≠B)
správně chyba 2. druhurealita
rozhodnutí
pravděpodobnost chyby je α = hladina významnosti
pravděpodobnost chyby je β = neznáme
![Page 19: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/19.jpg)
Grafické vyjádření
• pro znázornění t-testu je vhodný krabicový graf Krab icový gra f (Tabulka6 10v*40c)
M ed ián 25% -75% R ozsah neodleh . O d leh lé E xtrém yČ erná S tropn ice
P rom 1
6.0
6.2
6 .4
6 .6
6 .8
7 .0
7 .2
7 .4
7 .6
7 .8
8 .0
8 .2
8 .4
8 .6
8 .8
Pro
m2
![Page 20: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/20.jpg)
krabicový graf
• v Excelu problém
![Page 21: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/21.jpg)
krabicový graf
• v Excelu problém• doplněk do Excelu: http://peltiertech.com
/Excel/Zips/PTS_Box_Charter_Setup.zip
5
5.5
6
6.5
7
7.5
8
8.5
9
Černá Stropnice
![Page 22: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/22.jpg)
Statistica• data se zadávají
odlišně• každý sloupec je
jedna proměnná• u t-testu je jedna
kategoriální proměnná (zde povodí) a jedna kvantitativní (zde délka)
![Page 23: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/23.jpg)
![Page 24: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/24.jpg)
dvouvýběrový t-test, data ve sloupci pod sebou
dvouvýběrový t-test, data ve sloupcích vedle sebe (jako v Excelu)
párový t-test, data ve sloupcích vedle sebe (jako v Excelu)
jednovýběrový t-test na střední hodnotu
![Page 25: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/25.jpg)
![Page 26: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/26.jpg)
výsledek testů se ukládá v samostatném souboru
![Page 27: statistické testy](https://reader033.vdocuments.mx/reader033/viewer/2022061507/568143ae550346895db03735/html5/thumbnails/27.jpg)
další výsledky, grafy apod.