statistički testovi 1

Click here to load reader

Post on 01-Feb-2017

265 views

Category:

Documents

2 download

Embed Size (px)

TRANSCRIPT

  • 4 Testiranje statistickihhipoteza

    1

  • 4.1. Statisticka hipoteza

    Promatramo statisticko obiljezje X.

    Statisticka hipoteza je (bilo koja) pretpostavka o

    (populacijskoj) razdiobi od X.

    Kazemo da je statisticka hipoteza jednostavna uko-

    liko jednoznacno odreduje razdiobu od X. U suprot-

    nom kazemo da je slozena.

    2

  • Primjeri.

    H1 : X ima normalnu razdiobu slozena hipoteza

    H2 : X N(170,64) jednostavna hipoteza

    3

  • 4.2. Statisticki test

    Neka je = E[X].

    Na primjer, pretpostavimo da nas zanima je li tocna

    hipoteza:

    H0 : 50.

    Preciznije, zelimo na osnovi realizacije slucajnog u-

    zorka za X donijeti odluku hocemo li odbaciti ili ne

    odbaciti tu hipotezu.

    4

  • Postupak donosenja odluke o odbacivanju ili ne odbaci-

    vanju statisticke hipoteze zove se testiranje statistickih

    hipoteza.

    Primijetimo da uz osnovnu ili nul - hipotezu, npr.:

    H0 : 50,postoji njoj alternativna hipoteza:

    H1 : > 50.

    5

  • Buduci da sve odluke bazirane na uzorcima iz po-

    pulacije nisu 100% pouzdane, ni zakljucak (odluka)

    statistickog testa nije 100% pouzdan.

    Dakle, moze se dogoditi da je zakljucak testa pogresan.

    Prema tome, imamo sljedecu situaciju:

    6

  • zakljucaktocno je ne odbaciti H0 odbaciti H0

    H0

    pogresno! (I)H1 pogresno! (II)

    Pogreska koju cinimo kada odbacujemo H0, a ona

    je istinita, je pogreska prve vrste.

    Pogreska koju cinimo kada ne odbacujemo H0, a

    istinita je H1, je pogreska druge vrste.

    7

  • Test ce u potpunosti biti sproveden ako mozemo

    procijeniti vjerojatnosti mogucih pogresaka u za-

    kljucku testa.

    Razumno je zahtjevati test kojemu se mogu kontroli-

    rati vjerojatnosti obiju pogresaka. To nije moguce

    jer smanjivanjem vjerojatnosti pogreske prve vrste

    povecava se vjerojatnost pogreske druge vrste i o-

    bratno.

    8

  • S druge strane, u velikoj vecini slucajeva moguce je

    za zadanu razinu znacajnosti testa ( 0,1)medu testovima kojima vjerojatnost pogreske prve

    vrste ne prelazi broj naci (konstruirati) test s naj-

    manjom vjerojatnosti pogreske druge vrste.

    9

  • Neka je X1, X2, . . . , Xn slucajni uzorak za X i

    X := (X1, X2, . . . , Xn).

    Tada su realizacije x = (x1, x2, . . . , xn) tog uzorka

    elementi od Rn.

    Definicija. Test (hipoteze H0 u odnosu na alterna-

    tivu H1) je preslikavanje : Rn {0,1}.

    Interpretacija. Ako je za realizaciju x uzorka X

    (x) = 1, tada odbacujemo H0 u korist H1, a ako je

    (x) = 0, tada ne odbacujemo H0 u korist H1.

    10

  • Tada je

    C := 1(1) = {x Rn : (x) = 1}podrucje realizacija uzoraka za koje se H0 odbacuje

    u korist H1.

    C se naziva kriticno podrucje za test .

    11

  • Populacijska razdioba: X f(x|), Vjerodostojnost od : L(|x) = ni=1 f(xi|)

    Preslikavanje : [0,1] def. sa:

    () := E[(X)] = P(X C) =

    C

    L(|x) dx

    zove se jakost testa .

    Interpretacija. Ukoliko je 1 vrijednost parametra za

    koju je H1 istinito, jakost testa (1) je sposobnost

    testa da odbaci H0 ako je H0 neistinita hipoteza.

    12

  • Neka su:H0: 0H1: 1.

    Preslikavanje : 0 [0,1] def. sa:() := () = P(X C)

    je vjerojatnost pogreske 1. vrste.

    := sup0

    ()

    je znacajnost testa . Kazemo da test ima razinuznacajnost ukoliko mu je znacajnost manja ili jed-naka .

    13

  • H0: 0H1: 1.

    Preslikavanje : 1 [0,1] def. sa:

    () := 1 () = P(X / C)je vjerojatnost pogreske 2. vrste.

    14

  • Definicija. Kazemo da je test uniformno najjaci

    ako za svaki drugi test takav da je , vrijedida je () () za sve .

    Ukoliko postoji, kako naci uniformno najjaci test?

    15

  • Pretpostavimo da zelimo testirati:

    H0: = 0H1: = 1

    gdje su 0 6= 1 dvije vrijednosti parametra.

    Nadalje, neka su

    L(0|x) =n

    i=1

    f(xi|0), L(1|x) =n

    i=1

    f(xi|1)

    vjerodostojnosti od 0 i 1.

    16

  • Lema. (Neyman, Pearson)Neka je k > 0 takav broj da za skup

    C = {x Rn : L(0|x) kL(1|x)}vrijedi da je

    C

    L(0|x) dx = za zadani 0,1.Ako za neki drugi B Rn vrijedi da je

    B

    L(0|x) dx ,

    tada je nuzno

    B

    L(1|x) dx

    C

    L(1|x) dx.

    (Dokaz.)

    17

  • Interpretacija.

    Test (x) := 1C(x) za C iz N-P leme je uniformno

    najjaci test za testiranje jednostavne hipoteze H0 u

    odnosu na jednostavnu alternativu H1.

    18

  • Primjer 4.1. Za varijablu X poznato je da je

    X N(,9) i {13.8,15.0}.

    Na osnovi uzorka za X duljine n = 70 treba testiratinul-hipotezu

    H0 : = 15.0

    u odnosu na alternativu

    H1 : = 13.8

    uz razinu znacajnosti od = 5%.

    19

  • Konstrukcija testa sastoji se od odredivanja testne

    statistike na osnovi cijih vrijednosti se donose od-

    luke, i (slike) kriticnog podrucja koji je skup onih

    mogucih vrijednosti testne statistike za koje se od-

    bacuje H0 u korist H1. Takav skup takoder zovemo

    kriticnim podrucjem.

    (Izvod optimalnog (tj. uniformno najjaceg testa).)

    20

  • Dakle, za ovaj primjer, testna statistika (optimalnog)testa je

    Z =X 15.0

    3

    70.

    Kriticno podrucje uz uvjet da vjerojatnost pogreskeprve vrste bude jednaka = 0.05:

    P(Z u |H0) = 0.05

    ZH0 N(0,1) u = z0.05 = (tablice) = 1.64

    kriticno podrucje je interval ,1.64]

    Dakle, H0 odbacujemo ako je z 1.64.21

  • Ako je z > 1.64 ne odbacujemo H0. U tom slucajuje vjerojatnost pogreske druge vrste

    = P(Z > 1.64 |H1) == P(

    X 13.83

    70 >

    15.0 13.83

    70 1.64 |H1) =

    = P(X > 1.71) == 1(1.71) == 0.50(1.71) == 0.0436.

    22

  • Jakost testa je

    = P(Z 1.64 |H1) == 1 P(Z > 1.64 |H1) == 1 = 1 0.0436 == 0.9564.

    23

  • Zadatak 1. (jednostrani z-test)

    Pokazite da je za X N(, 20), gdje je 20 poznato,uniformno najjaci test za testiranje hipoteza

    H0 : = 0H1 : < 0,

    na razini znacajnosti , dan testnom statistikom

    Z =X 0

    0

    n

    i kriticnim podrucjem z z.

    (0 je zadani broj, z je vrijednost od Z)

    24

  • Zadatak 2. (jednostrani z-test, 2. put)

    Pokazite da je za X N(, 20), gdje je 20 poznato,uniformno najjaci test za testiranje hipoteza

    H0 : = 0H1 : > 0,

    na razini znacajnosti , dan testnom statistikom

    Z =X 0

    0

    n

    i kriticnim podrucjem z z.

    (0 je zadani broj, z je vrijednost od Z)

    25

  • Zadatak 3. (dvostrani z-test)

    Neka je X N(, 20), gdje je 20 poznato. Je li testhipoteza

    H0 : = 0H1 : 6= 0,

    dan testnom statistikom

    Z =X 0

    0

    n

    i kriticnim podrucjem |z| z/2 (na razini znacajnosti), uniformno najjaci?

    (0 je zadani broj, z je vrijednost od Z)

    26

  • Primijetimo da nam je u primjeru 4.1. racun bioolaksan jer su obje hipoteze (osnovna i alternativna)bile jednostavne. U praksi to nije slucaj.

    Na primjer, ako za X N(,9) zelimo testiratiH0 : 15H1 : < 15,

    onda su obje hipoteze slozene.

    Pretpostavimo da je testna statistika ista kao u pri-mjeru 4.1:

    Z =X 15

    3

    n.

    27

  • I kriticno podrucje je istoga oblika kao u primjeru

    4.1: ,u]. Odredimo u > 0 t.d. je za zadanurazinu znacajnosti

    P(Z u | = 15 + ) za sve 0 P(X

    3

    n u

    3

    n) za sve 0

    (u 3

    n) za sve 0.

    Buduci da je za sve 0, (u 3

    n) (u),u odredimo tako da je (u) = 0.50(u) = .

    28

  • Dakle, konstrukcija kriticnog podrucja je ista ako

    originalnu (slozenu) hipotezu H0 zamijenimo sa (jed-

    nostavnom) hipotezom

    H0: = 15,

    odnosno, ako testiramo

    H0 : = 15H1 : < 15.

    Dakle, sada smo problem testiranja sveli na z-test

    opisan u zadatku 1.

    29

  • U pravilu, za nul-hipotezu uvijek se uzimaju jednos-

    tavne hipoteze ili hipoteze koje jednoznacno odreduju

    razdiobu testne statistike.

    U interpretaciji, za nul-hipoteze uzimamo one hipoteze

    za koje zelimo kontrolirati vjerojatnost da cemo ih

    odbaciti ako su istinite, odn. vjerojatnost pogresaka

    prve vrste.

    30

  • Primjer 4.2. (Primjer 1.4.) Kockar je optuzen da je

    koristio namjestenu kocku. Koju osnovnu hipotezu

    koristi statisticar kada sprovodi odgovarajuci test za

    sud?

    31

  • H0: Kocka je simetricna.

    Trebamo kontrolirati vjerojatnost da cemo pogrijesiti

    ako odbacimo H0, tj. da se proglasi krivim nevini

    covjek.

    32

  • Primjer 4.3. Tvornica je proizvela novu seriju pado-

    brana. Kontrolor kvalitete mora statistickim meto-

    dama (statisticki test) odluciti hoce li padobrane

    propustiti na trziste ili ne. Koju hipotezu treba uzeti

    za osnovnu?

    33

  • H0: Padobran nije ispravan.

    34

  • 4.3 Testovi omjera vjerodostojnosti

    Neka je X1, X2, . . . , Xn slucajni uzorak za X i neka

    je populacijska gustoca od X: f(x|), .

    Cilj: konstrirati test za testiranje

    H0 : 0H1 : 1.

    35

  • Neka je x = (x1, x2, . . . , xn) opazeni uzorak.

    Vjerodostojnost:

    L(|x) =n

    i=1

    f(xi|),

    Pretpostavimo da postoje:

    0 = 0(x) 0 i = (x) t.d. da vrijedi

    L(0|x) = max0

    L(|x), L(|x) = max

    L(|x).

    36

  • Definicija. Omjer vjerodostojnosti je funkcija:

    x 7 (x) := L(0|x)L(|x) .

    Test za testiranje nevedenih hipoteza kojemu je kri-

    ticno podrucje oblika

    C = {x Rn : (x) c},za neku realnu konstanu c < 1, zovemo testom om-

    jera vjerodostojnosti (engl. likelihood ratio test ili

    LR-test).

    37

  • Zadatak 4. (dvostrani z-test)

    Neka je X1, X2, . . . , Xn slucajni uzorak za X s nor-

    malnom populacijskom distribucijom N(, 20) (20 je

    poznato). Odredite test omjera vjerodostojnosti za

    testiranje nul-hipoteze H0: = 0 u odnosu na

    dvostranu alternativu H1: 6= 0.

    38

  • Zadatak 5. (t-test) Neka je X1, X2, . . . , Xn slucajni

    uzorak za X s normalnom populacijskom distribuci-

    jom N(, 2) (oba parametra su nepoznata). Odre-

    dite test omjera vjerodostojnosti za testiranje nul-

    hipoteze H0: = 0 u odnosu na

    (a) jednostranu alternativu H1: < 0;

    (b) jednostranu alternativu H1: > 0;

    (c) dvostranu alternativu H1: 6= 0.

    39

  • 4.4 Test o ocekivanju normalno distribuirane

    populacije (t-test)

    Neka je X1, . . . , Xn slucani uzorak za X N(, 2).

    Zelimo testirati hipoteze o parametru (2 je nepoz-

    nat).

    Od sada pa nadalje, neka 0 oznacava neki unaprijed

    zadani broj.

    40

  • Razlikujemo tri slucaja:

    (1) : (2) : (3) :

    H0 : = 0 H0 : = 0 H0 : = 0H1 : > 0 H1 : < 0 H1 : 6= 0

    Alternative u (1) i (2) su jednostrane

    jednostrani testovidok je alternativa u (3) dvostrana

    dvostrani test.41

  • U sva tri slucaja, testna statistika je jednaka:

    T =X 0

    S

    n

    H0 t(n 1)

    Kriticna podrucja se razlikuju.

    Neka je zadana razina znacajnosti.

    42

  • (1):

    H0 : = 0H1 : > 0

    P(T t(n 1) |H0) = kriticno podrucje:

    [t(n 1),+

    43

  • (2):

    H0 : = 0H1 : < 0

    P(T t(n 1) |H0) = kriticno podrucje:

    ,t(n 1)]

    44

  • (3):

    H0 : = 0H1 : 6= 0

    P(|T | t/2(n 1) |H0) = kriticno podrucje:

    ,t/2(n 1)] [t/2(n 1),+

    45

  • Primjer 4.4. (Primjer 3.13)U svrhu istrazivanja toksicnosti jedne vrste plijesnina urod kukuruza, mjeri se kolicina toksicne tvari umg. Uzorak od 9 ekstrakata te plijesni:

    1.2, 0.8, 0.6, 1.1, 1.2, 0.9, 1.5, 0.9, 1.0

    Pretpostavka je da mjereno obiljezje ima normalnurazdiobu.Iz uzorka je izracunano: x = 1.02 i s = 0.28.

    Uz 5% znacajnosti testirajte

    H0 : = 1.00H1 : > 1.00.

    46

  • Jednostrani t-test:

    Testna statistika: T = X1.00S 3

    Kriticno podrucje: [t0.05(8),+ = [1.86,+

    Vrijednost testne statistike:

    t =x 1.00

    s 3 = 1.02 1.00

    0.28 3 = 0.214

    47

  • Buduci da je t = 0.214 < 1.86, tj. t ne pripada

    kriticnom podrucju, ne odbacujemo H0 u korist al-

    ternative.

    Preciznije, uz znacajnost od 5%, ne odbacujemo

    pretpostavku da je manje ili jednako od 1.00, odn.

    ne mozemo tvrditi da je ocekivana kolicina toksicne

    tvari u ekstraktu plijesni veca od 1.00.

    48