statistiČki testovi i razina znaČajnosti

29
PDDS MOLBIO 1 STATISTIČKI TESTOVI I RAZINA STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI ZNAČAJNOSTI dr.sc. Vesna Ilakovac, znanstveni suradnik Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku Medicinski fakultet Osijek

Upload: ramla

Post on 10-Jan-2016

74 views

Category:

Documents


11 download

DESCRIPTION

STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI. dr.sc. Vesna Ilakovac, znanstveni suradnik Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku Medicinski fakultet Osijek. OSNOVNI POJMOVI. STATISTIČKI TEST - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

PDDS MOLBIO 1

STATISTIČKI TESTOVI I RAZINA STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTIZNAČAJNOSTI

dr.sc. Vesna Ilakovac, znanstveni suradnik

Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku

Medicinski fakultet Osijek

Page 2: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

2PDDS MOLBIO

STATISTIČKI TEST– postupak pomoću kojeg se dolazi do odluke o

prihvaćanju ili odbacivanju statističke hipoteze uz određenu vjerojatnost

STATISTIČKA HIPOTEZA– izjava (tvrdnja) o nekoj karakteristici populacije koju

prihvaćamo ili odbacujemo na osnovu informacija dobivenih iz prikupljenih podataka

NUL-HIPOTEZA (H0)– polazna hipoteza koja se testira

H1 – alternativna hipoteza, negacija H0

OSNOVNI POJMOVI OSNOVNI POJMOVI

Page 3: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

3PDDS MOLBIO

POSTUPAK STATISTIČKOG TESTIRANJA POSTUPAK STATISTIČKOG TESTIRANJA

1. postavljanje nul-hipoteze

npr.

H0 .....1 = 2

parametri populacija iz kojih su uzorci uzeti su jednaki

uzorci pripadaju istoj populaciji

Page 4: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

4PDDS MOLBIO

POSTUPAK STATISTIČKOG TESTIRANJA POSTUPAK STATISTIČKOG TESTIRANJA

2. testiranje

izračunavanje odgovarajuće test statistike i određivanje vjerojatnosti da su razlike u ocjenama parametara (x1 i x2) slučajne (p-vrijednost)

Page 5: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

5PDDS MOLBIO

POSTUPAK STATISTIČKOG TESTIRANJA POSTUPAK STATISTIČKOG TESTIRANJA

3. donošenje odluke

o odbacivanju H0

ili

ne odbacivanju H0

na određenoj razini značajnosti

Page 6: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

6PDDS MOLBIO

POGRJEŠKE PRI ODLUČIVANJU O POGRJEŠKE PRI ODLUČIVANJU O STATISTIČKOJ HIPOTEZISTATISTIČKOJ HIPOTEZI

ODLUKAH0 točna H1 točna

NE ODBACITI H0

ISPRAVNOPOGRJEŠKA TIPA 2 ()

ODBACITI H0POGRJEŠKA TIPA 1 ()

ISPRAVNO

STVARNO STANJE

Page 7: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

7PDDS MOLBIO

VJEROJATNOSTI POGRJEŠKEVJEROJATNOSTI POGRJEŠKE

najveća vjerojatnost pogrješke tipa 1 () je razina značajnosti testa

– najmanja vjerojatnost uz koju još ne odbacujemo H0

– kada je p < test sugerira odbacivanje H0 (“statistički značajno”)

– određuje ju istraživač na temelju modela pokusa– uobičajeno se stavlja = 0.05

Page 8: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

8PDDS MOLBIO

VJEROJATNOSTI POGREŠKEVJEROJATNOSTI POGREŠKE najveća vjerojatnost pogrješke tipa 2 ()

– djelomično je pod kontrolom– ovisi o:

stvarnom stanju u populacijirazini značajnosti modelu pokusa

– i su inverzno povezane (ali ne direktno)

Page 9: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

9PDDS MOLBIO

ODABIR NIVOA ZNAČAJNOSTIODABIR NIVOA ZNAČAJNOSTI

pitanje štetnih posljedica pogrješke:

1. Odluka/zaključak da razlike postoje onda kada ih u stvarnosti nema može prouzročiti štetne posljedice => smanjiti vjerojatnost nastajanja pogrješke tipa 1, tj. odabrati manji

2. Odluka/zaključak da nema razlike onda kada u stvarnosti razlika postoji može prouzročiti štetne posljedice => smanjiti vjerojatnost pogrješke tipa 2, tj. odabrati veći

Page 10: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

10PDDS MOLBIO

Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je lijek X povučen iz uporabe. Ispitan je novi alternativni lijek Y i ustanovljeno je smanjenje štetnog utjecaja u odnosu na lijek X. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti smanjenja štetnog utjecaja lijeka Y u odnosu na lijek X?

Page 11: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

11PDDS MOLBIO

ODLUKA: Lijek Y ima manje štetne posljedice od lijeka X.

ODLUKA: Lijek Y ima jednako štetne posljedice kao i lijek X.

STVARNO STANJE: Oba lijeka jednako su štetna.

STVARNO STANJE: Lijek Y manje je štetan od lijeka X.

Page 12: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

12PDDS MOLBIO

ODLUKA: Lijek

Y ima manje

štetne posljedice

od lijeka X.

ODLUKA: Lijek

Y ima jednako

štetne posljedice

kao i lijek X.

STVARNO

STANJE: Oba

lijeka jednako su

štetna.

STVARNO

STANJE: Lijek Y

manje je štetan od

lijeka X.

Page 13: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

13PDDS MOLBIO

Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije prije i nakon konzumacije određene količine alkohola pokazala su prosječno povećanje vremena reakcije nakon konzumacije alkohola. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti pronađene razlike?

Page 14: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

14PDDS MOLBIO

ODLUKA: Alkohol produljuje vrijeme reakcije

ODLUKA: Alkohol ne utječe na vrijeme reakcije.

STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije.

STVARNO STANJE: Alkohol produljuje vrijeme reakcije.

Page 15: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

15PDDS MOLBIO

ODLUKA: Alkohol produljuje vrijeme reakcije

ODLUKA: Alkohol ne utječe na vrijeme reakcije.

STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije.

STVARNO STANJE: Alkohol produljuje vrijeme reakcije.

Page 16: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

16PDDS MOLBIO

POSTAVKE DIZAJNAPOSTAVKE DIZAJNA općenito testove treba dizajnirati tako da imaju

gdje je odabrani 0.2 ili 0.1

za = 0.2 , to znači samo 80% šanse da se detektira određena alternativna hipoteza kada je stvarno točna

izraz

100(1-)%

naziva se (statistička) SNAGA TESTA

Page 17: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

17PDDS MOLBIO

JEDNOSMJERNO I DVOSMJERNO JEDNOSMJERNO I DVOSMJERNO TESTIRANJETESTIRANJE

jednosmjerno testiranje– interes istraživača usmjeren je na promjene u

jednom smjeru (npr. povećanje ili smanjenje)H0: 16 ; H1: > 16

dvosmjerno testiranje– interes istraživača usmjeren je na promjenu u

bilo kojem smjeruH0: = 0 ; H1: 0

Testiranje bi trebalo biti dvosmjerno, osim ako istraživanje posebno ne zahtijeva da se promjene usmjere u određenom smjeru UNAPRIJED!

Page 18: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

18PDDS MOLBIO

ŠTO JE P-VRIJEDNOST?ŠTO JE P-VRIJEDNOST?

NIJE vjerojatnost istinitosti nul-hipoteze (iako je vrlo

slično)

JESTE vjerojatnost dobivanja istih ili ekstremnijih

rezultata kada je nul-hipoteza istinita

Page 19: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

19PDDS MOLBIO

statistička značajnost NIJE isto što i klinička važnost

bolje je navesti točnu vrijednost p nego “NS”

Page 20: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

20PDDS MOLBIO

VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA

valjanost se smanjuje višestrukim testiranjem

– pretpostavimo da uspoređujemo težinu triju nezavisnih skupina ispitanika podvrgnutih različitim tretmanima;

H0: 1 = 2 = 3 nul-hipoteza

H1: 1 2

H2: 1 3

H3: 2 3

(za k eksperimentalnih grupa moguće je izvršiti k(k-1)/2 ovakve usporedbe)

alternativne hipoteze

Page 21: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

21PDDS MOLBIO

VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA razina značajnosti može se izraziti kao

vjerojatnost (odbacivanje H0 kada je H0 točna)

odnosno

1 – vjerojatnost(ne odbacivanje H0 kada je H0 točna)

tj. 1-(1-)

u slučaju višestrukih (r) testova to postaje

1 – vjerojatnost(ne odbacivanje svih H0 kada su sve H0 točne)

odnosno 1-(1-)r

Page 22: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

22PDDS MOLBIO

VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA

r 1 2 3 4 5 6 7 8 9 10

r 0.050 0.098 0.143 0.185 0.226 0.265 0.302 0.337 0.370 0.401

ako je = 0.05, tada je za r višestrukih testova

r 11 12 13 14 15 16 17 18 19 20

r 0.431 0.460 0.487 0.512 0.537 0.560 0.582 0.603 0.623 0.642

Page 23: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

23PDDS MOLBIO

Koliko slučajnih značajnih rezultata očekujemo na 20 učinjenih višestrukih testova ako su sve nul-hipoteze istinite uz = 0.05?

U slučaju da su sve nul-hipoteze istinite, uz

=0.05 očekujemo 5% značajnih rezultata

slučajno => za 20 testova to je 1, tj. očekujemo

1 značajan rezultat kao posljedicu

SLUČAJNOSTI !

Page 24: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

24PDDS MOLBIO

VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA

rješenje:

– prilagodba p vrijednosti u cilju održavanja općeg nivoa značajnosti (Bonferroni, Sidak, Hochberg...)

– primjena sofisticiranijih metoda analize (npr. ANOVA, multivarijatne metode)

Page 25: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

25PDDS MOLBIO

VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA

Bonferroni metoda

– za r nezavisnih testova

pcorr = p·r

npr. za tri nezavisna testa

H1: 1= 2 ; p = 0.017; pcorr = 0.051

H2: 1 = 3 ; p = 0.025 ; pcorr = 0.075

H3: 2 = 3 ; p = 0.063 ; pcorr = 0.189

Page 26: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

26PDDS MOLBIO

VIŠESTRUKA TESTIRANJAVIŠESTRUKA TESTIRANJA

AKO MUČITE PODATKE

DOVOLJNO DUGO ONI ĆE

NAPOSLIJETKU PRIZNATI !!!

Page 27: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

27PDDS MOLBIO

IZBOR STATISTIČKOG TESTAIZBOR STATISTIČKOG TESTA

Ovisi o:

prirodi (tipu) varijabli (ljestvica mjerenja, razdioba)

broju uzoraka (1, 2 ili više)

jesu li su uzorci zavisni ili ne

Page 28: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

28PDDS MOLBIO

PARAMETRIJSKI TESTOVIPARAMETRIJSKI TESTOVI

najmanje intervalna skala

normalna razdioba

razdiobe varijabli očigledno nisu normalne

uzorak je mali, a postoji sumnja na normalnost

varijable su mjerene ordinalnom skalom

NEPARAMETRIJSKI TESTOVINEPARAMETRIJSKI TESTOVI

Page 29: STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

29PDDS MOLBIO

VARIJABLA

BROJ UZORAKA NOMINALNA

ORDINALNA ILI KONTINUIRANA

KOJA NIJE NORMALNO

DISTRIBUIRANA

KONTINUIRANA NORMALNO

DISTRIBUIRANA

JEDAN 2-testKolmogorov-Smirnov

testt-test

DVA

NEZAVISNI2-test

Fisherov egzaktni test

Mann-Whitney U test

Medijan testStudentov t-test

ZAVISNI McNemarov test Wilcoxonov test t-test diff.

VIŠE OD 2

NEZAVISNI 2-test Kruskall-Wallis test ANOVA

ZAVISNICochran Q

Stuart-MaxwellFriedmanov test

ANOVA za ponavljana mjerenja

POVEZANOST DVIJU VARIJABLI

Koef. kontingencije

Kappa koef.

Spermanov Kendalov

Pearsonov r