statistiČki testovi i razina znaČajnosti
DESCRIPTION
STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI. dr.sc. Vesna Ilakovac, znanstveni suradnik Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku Medicinski fakultet Osijek. OSNOVNI POJMOVI. STATISTIČKI TEST - PowerPoint PPT PresentationTRANSCRIPT
PDDS MOLBIO 1
STATISTIČKI TESTOVI I RAZINA STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTIZNAČAJNOSTI
dr.sc. Vesna Ilakovac, znanstveni suradnik
Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku
Medicinski fakultet Osijek
2PDDS MOLBIO
STATISTIČKI TEST– postupak pomoću kojeg se dolazi do odluke o
prihvaćanju ili odbacivanju statističke hipoteze uz određenu vjerojatnost
STATISTIČKA HIPOTEZA– izjava (tvrdnja) o nekoj karakteristici populacije koju
prihvaćamo ili odbacujemo na osnovu informacija dobivenih iz prikupljenih podataka
NUL-HIPOTEZA (H0)– polazna hipoteza koja se testira
H1 – alternativna hipoteza, negacija H0
OSNOVNI POJMOVI OSNOVNI POJMOVI
3PDDS MOLBIO
POSTUPAK STATISTIČKOG TESTIRANJA POSTUPAK STATISTIČKOG TESTIRANJA
1. postavljanje nul-hipoteze
npr.
H0 .....1 = 2
parametri populacija iz kojih su uzorci uzeti su jednaki
uzorci pripadaju istoj populaciji
4PDDS MOLBIO
POSTUPAK STATISTIČKOG TESTIRANJA POSTUPAK STATISTIČKOG TESTIRANJA
2. testiranje
izračunavanje odgovarajuće test statistike i određivanje vjerojatnosti da su razlike u ocjenama parametara (x1 i x2) slučajne (p-vrijednost)
5PDDS MOLBIO
POSTUPAK STATISTIČKOG TESTIRANJA POSTUPAK STATISTIČKOG TESTIRANJA
3. donošenje odluke
o odbacivanju H0
ili
ne odbacivanju H0
na određenoj razini značajnosti
6PDDS MOLBIO
POGRJEŠKE PRI ODLUČIVANJU O POGRJEŠKE PRI ODLUČIVANJU O STATISTIČKOJ HIPOTEZISTATISTIČKOJ HIPOTEZI
ODLUKAH0 točna H1 točna
NE ODBACITI H0
ISPRAVNOPOGRJEŠKA TIPA 2 ()
ODBACITI H0POGRJEŠKA TIPA 1 ()
ISPRAVNO
STVARNO STANJE
7PDDS MOLBIO
VJEROJATNOSTI POGRJEŠKEVJEROJATNOSTI POGRJEŠKE
najveća vjerojatnost pogrješke tipa 1 () je razina značajnosti testa
– najmanja vjerojatnost uz koju još ne odbacujemo H0
– kada je p < test sugerira odbacivanje H0 (“statistički značajno”)
– određuje ju istraživač na temelju modela pokusa– uobičajeno se stavlja = 0.05
8PDDS MOLBIO
VJEROJATNOSTI POGREŠKEVJEROJATNOSTI POGREŠKE najveća vjerojatnost pogrješke tipa 2 ()
– djelomično je pod kontrolom– ovisi o:
stvarnom stanju u populacijirazini značajnosti modelu pokusa
– i su inverzno povezane (ali ne direktno)
9PDDS MOLBIO
ODABIR NIVOA ZNAČAJNOSTIODABIR NIVOA ZNAČAJNOSTI
pitanje štetnih posljedica pogrješke:
1. Odluka/zaključak da razlike postoje onda kada ih u stvarnosti nema može prouzročiti štetne posljedice => smanjiti vjerojatnost nastajanja pogrješke tipa 1, tj. odabrati manji
2. Odluka/zaključak da nema razlike onda kada u stvarnosti razlika postoji može prouzročiti štetne posljedice => smanjiti vjerojatnost pogrješke tipa 2, tj. odabrati veći
10PDDS MOLBIO
Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je lijek X povučen iz uporabe. Ispitan je novi alternativni lijek Y i ustanovljeno je smanjenje štetnog utjecaja u odnosu na lijek X. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti smanjenja štetnog utjecaja lijeka Y u odnosu na lijek X?
11PDDS MOLBIO
ODLUKA: Lijek Y ima manje štetne posljedice od lijeka X.
ODLUKA: Lijek Y ima jednako štetne posljedice kao i lijek X.
STVARNO STANJE: Oba lijeka jednako su štetna.
STVARNO STANJE: Lijek Y manje je štetan od lijeka X.
12PDDS MOLBIO
ODLUKA: Lijek
Y ima manje
štetne posljedice
od lijeka X.
ODLUKA: Lijek
Y ima jednako
štetne posljedice
kao i lijek X.
STVARNO
STANJE: Oba
lijeka jednako su
štetna.
STVARNO
STANJE: Lijek Y
manje je štetan od
lijeka X.
13PDDS MOLBIO
Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije prije i nakon konzumacije određene količine alkohola pokazala su prosječno povećanje vremena reakcije nakon konzumacije alkohola. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti pronađene razlike?
14PDDS MOLBIO
ODLUKA: Alkohol produljuje vrijeme reakcije
ODLUKA: Alkohol ne utječe na vrijeme reakcije.
STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije.
STVARNO STANJE: Alkohol produljuje vrijeme reakcije.
15PDDS MOLBIO
ODLUKA: Alkohol produljuje vrijeme reakcije
ODLUKA: Alkohol ne utječe na vrijeme reakcije.
STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije.
STVARNO STANJE: Alkohol produljuje vrijeme reakcije.
16PDDS MOLBIO
POSTAVKE DIZAJNAPOSTAVKE DIZAJNA općenito testove treba dizajnirati tako da imaju
gdje je odabrani 0.2 ili 0.1
za = 0.2 , to znači samo 80% šanse da se detektira određena alternativna hipoteza kada je stvarno točna
izraz
100(1-)%
naziva se (statistička) SNAGA TESTA
17PDDS MOLBIO
JEDNOSMJERNO I DVOSMJERNO JEDNOSMJERNO I DVOSMJERNO TESTIRANJETESTIRANJE
jednosmjerno testiranje– interes istraživača usmjeren je na promjene u
jednom smjeru (npr. povećanje ili smanjenje)H0: 16 ; H1: > 16
dvosmjerno testiranje– interes istraživača usmjeren je na promjenu u
bilo kojem smjeruH0: = 0 ; H1: 0
Testiranje bi trebalo biti dvosmjerno, osim ako istraživanje posebno ne zahtijeva da se promjene usmjere u određenom smjeru UNAPRIJED!
18PDDS MOLBIO
ŠTO JE P-VRIJEDNOST?ŠTO JE P-VRIJEDNOST?
NIJE vjerojatnost istinitosti nul-hipoteze (iako je vrlo
slično)
JESTE vjerojatnost dobivanja istih ili ekstremnijih
rezultata kada je nul-hipoteza istinita
19PDDS MOLBIO
statistička značajnost NIJE isto što i klinička važnost
bolje je navesti točnu vrijednost p nego “NS”
20PDDS MOLBIO
VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA
valjanost se smanjuje višestrukim testiranjem
– pretpostavimo da uspoređujemo težinu triju nezavisnih skupina ispitanika podvrgnutih različitim tretmanima;
H0: 1 = 2 = 3 nul-hipoteza
H1: 1 2
H2: 1 3
H3: 2 3
(za k eksperimentalnih grupa moguće je izvršiti k(k-1)/2 ovakve usporedbe)
alternativne hipoteze
21PDDS MOLBIO
VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA razina značajnosti može se izraziti kao
vjerojatnost (odbacivanje H0 kada je H0 točna)
odnosno
1 – vjerojatnost(ne odbacivanje H0 kada je H0 točna)
tj. 1-(1-)
u slučaju višestrukih (r) testova to postaje
1 – vjerojatnost(ne odbacivanje svih H0 kada su sve H0 točne)
odnosno 1-(1-)r
22PDDS MOLBIO
VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA
r 1 2 3 4 5 6 7 8 9 10
r 0.050 0.098 0.143 0.185 0.226 0.265 0.302 0.337 0.370 0.401
ako je = 0.05, tada je za r višestrukih testova
r 11 12 13 14 15 16 17 18 19 20
r 0.431 0.460 0.487 0.512 0.537 0.560 0.582 0.603 0.623 0.642
23PDDS MOLBIO
Koliko slučajnih značajnih rezultata očekujemo na 20 učinjenih višestrukih testova ako su sve nul-hipoteze istinite uz = 0.05?
U slučaju da su sve nul-hipoteze istinite, uz
=0.05 očekujemo 5% značajnih rezultata
slučajno => za 20 testova to je 1, tj. očekujemo
1 značajan rezultat kao posljedicu
SLUČAJNOSTI !
24PDDS MOLBIO
VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA
rješenje:
– prilagodba p vrijednosti u cilju održavanja općeg nivoa značajnosti (Bonferroni, Sidak, Hochberg...)
– primjena sofisticiranijih metoda analize (npr. ANOVA, multivarijatne metode)
25PDDS MOLBIO
VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA
Bonferroni metoda
– za r nezavisnih testova
pcorr = p·r
npr. za tri nezavisna testa
H1: 1= 2 ; p = 0.017; pcorr = 0.051
H2: 1 = 3 ; p = 0.025 ; pcorr = 0.075
H3: 2 = 3 ; p = 0.063 ; pcorr = 0.189
26PDDS MOLBIO
VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA
AKO MUČITE PODATKE
DOVOLJNO DUGO ONI ĆE
NAPOSLIJETKU PRIZNATI !!!
27PDDS MOLBIO
IZBOR STATISTIČKOG TESTAIZBOR STATISTIČKOG TESTA
Ovisi o:
prirodi (tipu) varijabli (ljestvica mjerenja, razdioba)
broju uzoraka (1, 2 ili više)
jesu li su uzorci zavisni ili ne
28PDDS MOLBIO
PARAMETRIJSKI TESTOVIPARAMETRIJSKI TESTOVI
najmanje intervalna skala
normalna razdioba
razdiobe varijabli očigledno nisu normalne
uzorak je mali, a postoji sumnja na normalnost
varijable su mjerene ordinalnom skalom
NEPARAMETRIJSKI TESTOVINEPARAMETRIJSKI TESTOVI
29PDDS MOLBIO
VARIJABLA
BROJ UZORAKA NOMINALNA
ORDINALNA ILI KONTINUIRANA
KOJA NIJE NORMALNO
DISTRIBUIRANA
KONTINUIRANA NORMALNO
DISTRIBUIRANA
JEDAN 2-testKolmogorov-Smirnov
testt-test
DVA
NEZAVISNI2-test
Fisherov egzaktni test
Mann-Whitney U test
Medijan testStudentov t-test
ZAVISNI McNemarov test Wilcoxonov test t-test diff.
VIŠE OD 2
NEZAVISNI 2-test Kruskall-Wallis test ANOVA
ZAVISNICochran Q
Stuart-MaxwellFriedmanov test
ANOVA za ponavljana mjerenja
POVEZANOST DVIJU VARIJABLI
Koef. kontingencije
Kappa koef.
Spermanov Kendalov
Pearsonov r