seminar 2 - prezentacija

Upload: biljana-kuzmanovic

Post on 10-Feb-2018

229 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/22/2019 Seminar 2 - Prezentacija

    1/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 1/71

    LLLSeminari u okviruTEMPUS projekta

    Naziv projekta: 511140 TEMPUS JPCRMaster programe in Applied Statistics - MAS

    Broj projekta: 511140

    Nosilac projekta: Departman za matematiku i informatiku,PMF Novi Sad

    Rukovodilac: Prof. dr Andreja Tepavevi

    Vreme trajanja: 15.10.2010. 14.10.2013.

    Finansiranje: Projekat finansira EU

  • 7/22/2019 Seminar 2 - Prezentacija

    2/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 2/71

    STATISTIKA ANALIZA PODATAKA,

    IZBOR I OBRADA UZORKA

    I

    T U M A E N J E R E Z U L T A T A

    I S T R A I V A N J A

  • 7/22/2019 Seminar 2 - Prezentacija

    3/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 3/71

    etvrta etapa- STATISTIKA ANALIZA PODATAKA

    U procesu statistikog istraivanja na nekoj populaciji, polazi se odpojedinanih vrednosti obeleja, to znai da operiemo velikim brojempodataka. esto se u praksi trai brza informacija, pa je potrebno definisatineku karakteristiku obeleja koja e u veoj ili manjoj meri dobropredstavljati to obeleje. Drugim reima, treba seriju podataka zamenitimalim brojem nekih novih veliina.

    Ti brojevi koji na neki nain prezentuju posmatrano obeleje nazivaju separametri obeleja. Oni su pokazatelji (mere) rasporeda vrednostiposmatranog obeleja na uzorku i populaciji. U tu svrhu, tj. za dobijanje vieinformacija o statistikim serijama, koriste se:

    (1)srednje vrednosti(mere centriranosti, mere centralne tendencije),

    (2) mere odstupanja, i

    (3) mere oblika.

  • 7/22/2019 Seminar 2 - Prezentacija

    4/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 4/71

    (1) SREDNJE VREDNOSTI

    Srednje vrednosti nose zajednike karakteristike svih vrednosti obeleja naposmatranom statistikom skupu. Pojam srednje vrednosti posmatranog

    obeleja moe se uvesti po dva osnova, pa razlikujemo:

    - raunske srednje vrednosti(izraunate iz podataka uzorka ili populacije, ato su: aritmetika sredina, geometrijska sredina, harmonijska sredina,

    sredina kvadrata, i dr.) i

    -pozicione srednje vrednosti(one su odreene pozicijom koju zauzimaju useriji podataka, a to su: medijanai modus (mod)).

  • 7/22/2019 Seminar 2 - Prezentacija

    5/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 5/71

    ARITMETIKA SREDINA

    Neka su 1 2, , ..., nx x x vrednosti numerikog obeleja X uzete u uzorak.Aritmetika sredinavredosti obeleja X na ovom uzorku je vrednost:

    =

    = 1

    1.

    n

    n ii

    x xn

    U sluaju intervalno prikazanih podataka odreuju se sredine intervala (klasa)++= 12 ,

    i i

    i

    a asx =( 1,..., ),i k pa je aritmetika sredina

    nx data sa:

    = == = 1 1

    1, za .i

    k k

    n i s ii i

    x f x f nn

    Aritmetika sredina se smatra najvanijom merom obeleja i ima veliki znaaju ozbiljnim statistikim analizama. Aritmetika sredina je osetljiva na

    ekstremne vrednosti, ali je zato saglasna sa pojavom koja se ponaa linearno.Zbir odstupanja svake pojedinane vrednosti obeleja od aritmetikesredine jednak je nuli, tj.

    ( )= =

    1

    0.n

    n

    ii

    x x

  • 7/22/2019 Seminar 2 - Prezentacija

    6/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 6/71

    Zbir kvadrata odstupanja svake pojedinane vrednosti obeleja odaritmetike sredine je minimalan, tj.

    ( ) ( )= =

    2 2

    1 1,

    n n

    ni ii i

    x x x a

    gde je a proizvoljan broj.

    PRIMER 9.Za uzorak obraen u Primeru 7 aritmetika sredina je = 7.4425nx ,

    dok za te iste podatke grupisane i prikazane u Tabeli 5 je = 7.44nx . Jasno jeda vrednost

    n

    x preciznije izraunata, jer se grupisanjem podataka izgubilona preciznosti, u ovom sluaju zanemarljivo malo.

  • 7/22/2019 Seminar 2 - Prezentacija

    7/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 7/71

    GEOMETRIJSKA SREDINA

    Geometrijska sredina G od brojeva 1 2, , ..., nx x x data je sa:

    = 1 2 ... .n

    nG x x x

    PRIMER 10.Plata radnika posle prve godine staa bila je 16 000 dinara, posledruge 20 000 dinara i posle tree godine 24 000 dinara. Koliko iznosi

    proseno poveanje ove plate.

    Reenje.Ovaj problem se reava preko geometrijske sredine, pa je

    = = =1 2

    20000 24000 3.

    16000 20000 2G x x

    Zaista, =3 32 216000 24000, tj. plata se proseno poveavala32 puta,

    tj. u odnosu na prvu godinu plata se poveala 1.5 puta.

  • 7/22/2019 Seminar 2 - Prezentacija

    8/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 8/71

    HARMONIJSKA SREDINA

    Harmonijska sredina se koristi kod obrnuto proporcionalnih veliina iizraunava se za vrednosti razliite od nule.

    Harmonijska sredinapredstavlja recipronu vredost aritmetike sredinerecipronih vrednosti obeleja ,X pa za uzorak ( )1 2, , ..., nx x x harmonijskasredina je:

    ( )=

    = =+ + + 1 2

    1 1 1 11

    1

    1....

    ni

    n

    n x x x x

    i

    nH

    Odnos prethodnih triju sredina je sledei:

    __

    .nH G x

  • 7/22/2019 Seminar 2 - Prezentacija

    9/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 9/71

    PRIMER 11.Dva radnika rade na dve iste maine. Za 1h prvi radnik proizvede6 proizvoda, a drugi radnik 4 proizvoda. Nai:

    )a prosean broj proizvoda po radniku na toj maini;)b proseno vreme za jedan proizvod na toj maini.

    Reenje.

    )a Prosean broj proizvoda po radniku na toj maini je aritmetika sredina+ += = =1 2 6 42 2 2 5.

    x xx

    )b Za jedan proizvod prvom radniku treba 10 minuta, a drugom 15minuta. Zato proseno vreme za jedan proizvod na toj maini jeharmonijska sredina te dve vrednosti:

    += = = =

    +1 110 15

    2 60 10 1512, a ne 12.5 minuta.

    5 2H

  • 7/22/2019 Seminar 2 - Prezentacija

    10/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 10/71

    MEDIJANA

    Medijana jepozicionasrednja vrednost koja je odreena pozicijom kojuzauzima u rastuem nizu vredosti obeleja X. Kako je aritmetika sredina

    n

    x osetljiva na ekstremne vredosti obeleja, uticaj tih ekstremnih vrednostise iskljuuje upotrebom medijane ili moda (modusa).Medijana je ona vrednost obeleja koja varijacioni niz vrednosti deli na dvajednaka dela. Zato definicija pojma medijane zavisi od toga da li je broj nparan ili neparan.

    Neka je 1 2, , ..., nx x x varijacioni niz uzorakih vrednosti obeleja X.

    Medijanase definie kao vrednostmed

    x data sa:

    +

    +

    = +

    ( 1)/2

    /2 /2 1

    , ako je neparan broj;

    , ako je paran broj.2

    n

    med n n

    x n

    x x xn

  • 7/22/2019 Seminar 2 - Prezentacija

    11/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 11/71

    U sluaju kada je n paran broj, moe se dogoditi da ta vrednost ne pripadavarijacionom nizu 1 2, , ..., nx x x .

    Geometrijski gledano, medijana je taka na x-osikoja deli histogram na dvadela jednakih povrina.

    PRIMER 12.Medijana za uzorak iz Primera 6 odreuje se uvidom u Tabelu 3 ikolonu kumulativ ispod iz te tabele.

    Tabela 3

    potr. ( )ix br. dom.

    ( )if rel. fr.[%]

    kum.ispod

    kum.iznad

    kum.fr.[%]

    7 8 20% 8 40 20%

    9 4 10% 12 32 30%12 10 25% 22 28 55%15 6 15% 28 18 70%16 7 17,5% 35 12 87.5%

    20 512,5%

    40 5 100% 40 100%

  • 7/22/2019 Seminar 2 - Prezentacija

    12/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 12/71

    Trei lan u toj koloni je broj 22, to znai da se u tom kumulativu prvi putsadri 20, tj. / 2n vrednosti obeleja iz rastueg varijacionog niza. To znai davrednost obeleja = =3 12kg medx x predstavlja medijalnu vrednost mesenepotronje voa u zimskom periodu za jednu porodicu. U ovom primeru,

    =40 12.85kgx to znai da su u ovom sluaju vrednosti aritmetike sredine i

    medijane pribline.

    PRIMER 13.Medijana za uzorak iz Primera 7 dobija se kao aritmetika sredina20. i 21. vrednosti obeleja (prosena ocena), jer je obim uzorka 40. Zato od

    uzorakih vrednosti moramo prvo napraviti varijacioni niz, a on je sledei nizvrednosti:

    6.53 6.58 6.60 6.71 6.77 6.80 6.80 6.86 6.87 6.89

    6.90 6.94 7.06 7.10 7.11 7.12 7.20 7.31 7.33 7.34

    7.34 7.48 7.50 7.53 7.53 7.54 7.57 7.57 7.87 7.90

    7.95 7.97 8.00 8.11 8.20 8.48 8.50 8.57 8.60 8.67

  • 7/22/2019 Seminar 2 - Prezentacija

    13/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 13/71

    + += = = =20 21 40

    7.34 7.347.34 7.44 .2 2med

    x xx x

    Kod intervalnih serijadistribucije frekvencija, izrauna se kumulativ ispod iodredi se medijalni interval [ )

    +1

    , ,m m

    a a ( )= 1,..., 1 .m k To je prvi u nizurastuih intervala koji sadri / 2n vrednosti posmatranog obeleja. Ako je mf frekventnost toga intervala, onda je

    = + 1/ 2

    ,mmed mm

    n Fx a d

    f

    gde je

    =

    = 1

    11

    m

    m jj

    F f kumulativna frekvencija predmedijalnog intervala i

    d duina medijalnog intervala.

  • 7/22/2019 Seminar 2 - Prezentacija

    14/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 14/71

    Za Primer 7, prikazan Tabelom 5, medijalni interval je[ )7.2,7.6 i

    = + = = 4020 16

    7.2 0.4 7.33 7.44 .12med

    x x

    Vrednosti medx i

    ,medx su priblino jednake i obe se bitno razlikuju odaritmetike sredine. Da li je ta razlika zaista bitna, moe se proveriti metodomtestiranja parametarske hipoteze o uzorakoj srednjoj vrednosti. Kada seneke izraunate vrednosti iz obinog rasporeda uzorka i iz intervalno

    sreenih podataka tog istog uzorka bitno razlikuju, koriste se takozvaneepardove korekcijeza popravku ovih vredosti.

    U svakom sluaju, ta razlika ukazuje na injenicu da u svakom konkretnom

    uzorku treba dobro razmisliti koju meru centriranosti treba koristiti.Prava = 7.33x deli histogram na Slici 2 na dva dela jednakih povrina.

  • 7/22/2019 Seminar 2 - Prezentacija

    15/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 15/71

    MODUS (MOD)

    Modusili modje onapozicionavrednost obeleja koja se najee pojavljujeu realizovanom uzorku. Takvih vrednosti moe biti jedna ili vie. Kodneprekidnih numerikih obeleja merenih intervalnom skalom ili skalomodnosa, nema velike potrebe za ovom vrednou. U tom sluaju, aritmetikasredina je najbolja mera centriranosti.

    PRIMER 14.U Primeru 6, modus je =mod 12kgx , to znai da je najee sluajda domainstva troe 12kg voa meseno u zimskom periodu. U ovomprimeru je = =mod 12kgmedx x .

  • 7/22/2019 Seminar 2 - Prezentacija

    16/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 16/71

    PRIMER 15.U Primeru 7, postoje etiri modalne vrednosti: =mod(1)

    6.80,x

    =mod(2) 7.34,x =mod(3) 7.53,x =mod(4) 7.57.x

    U sluaju intervalno prikazanih podataka, prvo se odredi modalni interval, tj.

    interval koji ima najveu frekventnost. Modus je vrednost iz toga intervala,npr. [ )+1, ,m ma a koja se izraunava po formuli:

    ( ) ( )

    +

    = +

    + 1

    mod

    1 1

    ,m mmm m m m

    f fx a d

    f f f f

    gde su 1,m mf f i +1mf frekvencije modalnog, predmodalnog i postmodalnogintervala i d - duina intervalnih klasa.

    PRIMER 16.Za Primer 7, iji su grupisani podaci prikazani u Tabeli 5, modalni

    interval je [ )7.2,7.6 , pa je: = + = < =

    + mod

    12 117.2 0.4 7.24 7.33 .

    (12 11) (12 4) medx x

    Geometrijski, modus je vrednost na x osiza koju poligon frekvencija

    dostie maksimum (taka 3T na Slici 2).

  • 7/22/2019 Seminar 2 - Prezentacija

    17/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 17/71

    Slika 2.Histogram i poligon apsolutne irelativne frekvencije prosene ocene studenata.

  • 7/22/2019 Seminar 2 - Prezentacija

    18/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 18/71

    Priblina vrednost modusa moe se odrediti i na histogramu: dijagonalno sespoje krajnja i poetna vrednost histograma na modalnom intervalu sakrajnjom takom histograma predmodalnog i poetnom takom histogramapostmodalnog intervala. Apscisa take preseka ovih dui je modalna taka(Slika 49).

    Slika 49.Modus odreen iz histograma frekvencija.

  • 7/22/2019 Seminar 2 - Prezentacija

    19/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 19/71

    (2) MERE ODSTUPANJA

    Mere centriranosti, kao to su aritmetika sredina i druge, ne daju dovoljnoinformacija o obeleju.

    PRIMER 17.Posmatrajmo ocene dva studenta.

    Prvi: 7,8,8,9,7,8,9,8,8,9 = =10 8.1, 8medx x i =mod 8.x

    Drugi: 7,6,8,6,10,8,10,6,10,10 =10 8.1,y = 8medy i =mod 10.y

    Primeujemo da se njihove prosene ocene i medijane poklapaju, ali kod

    prvog studenta duina intervala varijacije [ ]( )7,9 je 2, dok je kod drugogtaj interval [ ]( )6,10 duine 4, to ukazuje na vee varijacije u kvalitetupripreme ispita. Te uoene razlike mogu se oceniti merama rasturanja ilimerama odstupanja (varijacije).

  • 7/22/2019 Seminar 2 - Prezentacija

    20/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 20/71

    RASPON VARIJACIJE

    Raspon varijacijeje odreen duinom intervala varijacije obeleja ipredstavlja razliku izmeu najvee i najmanje vrednosti obeleja:

    = max min.R x x

    Ova mera nije uvek dobar pokazatelj rasturanja vrednosti obeleja jer zavisiod ekstremnih vrednosti, koje su esto izuzetci i kao takve ih obinoiskljuujemo iz uzorka.

  • 7/22/2019 Seminar 2 - Prezentacija

    21/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 21/71

    SREDNJE APSOLUTNO ODSTUPANJE

    Ova mera odstupanja pokazuje proseno odstupanje svake vrednostiobeleja od aritmetike sredine uzorka, tj.

    == 1

    1.

    n

    nii

    sao x x n

    Ako se radi o intervalnoj distribuciji frekvencija, onda je:

    == 1

    1, gde je sredina klse.i i

    k

    ni s si

    sao f x x x n

    U Primeru 17, sao =prvi 0.54 i sao =drugi 1.52 to ukazuje na znaajno veerasturanje oko srednje vrednosti uzorka.

  • 7/22/2019 Seminar 2 - Prezentacija

    22/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 22/71

    SREDNJE KVADRATNO ODSTUPANJE

    Rad sa apsolutnim vrednostima valjalo bi, kad god je to mogue, izbei. To se

    jednostavno postie kvadriranjem prethodno posmatranih razlika nix x .

    Na taj nain dolo se do jedne nove mere odstupanja, koja je istovremeno

    najvanija i najvie se koristi.

    Uzoraka disperzija(ili disperzija uzorkaili srednje kvadratno odstupanje)definie se sa:

    ( )= =

    = = 22 22

    1 1

    1 1 .n n

    n nn i ii i

    s x x x x n n

    U praksi i u raunarskim paketima dosta se koristi tzv. korigovanailipopravljena vrednost uzorake disperzije:

    ( )=

    = =

    22 2

    1

    1 .1 1

    n

    nn n ii

    ns s x x n n

    Kada je obim uzorka n veliki, svejedno je koju od ove dve mere emokoristiti.

    Lif L L i i li d i i (LLL i i)

  • 7/22/2019 Seminar 2 - Prezentacija

    23/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 23/71

    Kako bi se ova mera odstupanja izraavala u istim jedinicama kao i vrednostiobeleja, posmatra se kvadratni koren iz uzorake disperzije. Ta vrednost

    =2

    n ns s se naziva standardna devijacija.

    Navedene formule vae i za intervalno prikazane podatke, stim to se za

    popravku vrednosti2

    ns koristi epardova korekcija za uzoraku disperziju(objavljena prvi put u jednom asopisu iz 1898.) koja je data formulom:

    =

    22 2

    , pri emu su svi intervali iste duine .12

    n nd

    s s d

    Uopte, prosek odstupanja vrednosti obeleja od aritmetike sredine uzet nanekom stepenu ,k naziva se centralni momenat reda k:

    ( )== =

    2

    21

    1, gde je .

    n k

    n nk ii

    c x x c sn

    Za njihovo izraunavanje koriste se obini momentik-tog reda:

    == =1

    1

    1

    , gde je .

    nk

    nk iim x m x n

    Lif L L i i li d t ti ti (LLL i i)

  • 7/22/2019 Seminar 2 - Prezentacija

    24/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 24/71

    Te veze za neke centralne momente su sledee:

    ( )

    ( ) ( )= =

    = =

    = = =

    = = =

    = = +

    = +

    = + =

    1

    11 1

    2 222

    1 1

    22

    1 1 1

    2 22 1 1 1 2 1

    1 1 10

    1 12

    1 12

    12 ,

    n n

    n ni ii i

    n n

    n n ni i ii i

    n n nnni i

    i i i

    c x x x nx n n n

    c x x x x x x n n

    xx x xn n n

    m m m nm m m

    n

    ( ) ( )= =

    = = + = + 3 2 33 2 2

    3 3 2 1 11 1

    1 13 3 3 2

    n n

    n n n ni i i i i i

    c x x x x x x x x m m m mn n

    ,

    ( ) ( )= == = + +

    = + + = +

    4 2 3 44 3 2

    41 1

    2 2 4 4 2 2 44 3 1 2 1 1 1 4 3 1 2 1 1

    1 14 6 4

    4 6 4 4 6 3 ,

    n n

    n n n n ni i i i i i i

    c x x x x x x x x x x n nm m m m m m m m m m m m m

    = + 55 5 4 1 15 4c m m m m .

    Life Long Learning programs in applied statistics (LLL seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    25/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 25/71

    KOEFICIJENAT VARIJACIJE

    Koeficijenat varijacijese koristi za uporeivanje varijabilnostidvaju statistikihskupova i rauna se na sledei nain:

    = .n

    V

    n

    sc

    x

    Ponekad se izraava u % i ima smisla samo ako je 0.nx

    PRIMER18.Za uzorak iz Primera 17, pregled nekih mera dat je u Tabeli 7.

    Tabela 7.

    ocene stud. ( ix ) 6 7 8 9 10 10x medx modx 10s sao 100%Vc

    prvi stud. 0 2 5 3 0 8.1 8 8 0.7 0.54 9%

    drugi stud. 3 1 2 0 4 8.1 8 10 1.7 1.52 21%

    Sve ove izraunate mere pokazuju da je uspeh prvog studenta bolji.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    26/71

    Life Long Learning programs in applied statistics (LLL-seminari)

    dr Vera Lazarevi, vanr. prof. 26/71

    (3) MERE OBLIKA

    Sve do sada navedene mere odstupanja mogu se primenitisamo naobeleja za koja je mogue izraunati aritmetiku sredinu. To su obelejaija je merna skala intervalna, skala odnosa i ponekad ordinalna skala. Usluaju nominalne skale, aritmetika sredina ili medijana se ne moeizraunati, ali i za ovu vrstu obeleja treba definisati neku meru odstupanja. Utu svrhu se koriste pokazatelji razliitosti i time se bavi klaster analiza.

    Podaci o vrednostima numerikog obeleja na jedinicama statistikog skupa

    obino nisu pravilno i simetrino rasporeeni oko svojih srednjih vrednosti.Mere odstupanja ukazuju na veliinu odstupanja od srednje vrednosti, ali ne ina smer odstupanja. Zato se koriste mere asimetrijei spljotenosti.

    Neka je ( )1 2, , ..., nx x x realizovani prost sluajan uzorak. Znaajnu informacijuo uzorku daju nam uzoraki momenti:

    - obian uzoraki momenat k-tog reda:=

    = 11

    ,n

    kk in

    im x i

    - centralni uzoraki momenat k-tog reda: ( )== 1 1 .n k

    nk inic x x

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    27/71

    Life Long Learning programs in applied statistics (LLL seminari)

    dr Vera Lazarevi, vanr. prof. 27/71

    Uzoraka srednja vrednost = 1nx m , a uzoraka disperzija =2

    2ns c .

    Dodatnu, vrlo vanu informaciju o uzorku dobijamo izraunavajui nekeodnose izmeu obinih i centralnih momenata odgovarajueg reda.

    Uzoraki koeficijenat asimetrijeje:( )

    = =3 33 32

    3n

    c c

    s c

    Uzoraki koeficijenat spljotenosti (ekscesa)je: = 444 3.ncs

    Ako je =3 0, onda je = = modn medx x x i raspodela je simetrina u odnosu naaritmetiku sredinu uzorka.

    Ako je >3 0, onda je > > modn medx x x i imamo asimetriju udesno.

    Ako je

  • 7/22/2019 Seminar 2 - Prezentacija

    28/71

    f g g p g pp ( )

    dr Vera Lazarevi, vanr. prof. 28/71

    to je 3 po apsolutnoj vrednosti vee, asimetrija je vea. Smatra se da je

    asimetrija umerena kada je

  • 7/22/2019 Seminar 2 - Prezentacija

    29/71

    f g g p g pp ( )

    dr Vera Lazarevi, vanr. prof. 29/71

    Slika 51.Mera spljotenosti

    PRIMER 19.Za uzorke iz Primera 17, vai:Za prvog studenta : = = = 33 3

    10

    0.0483 0.7

    0.14cs

    i = = 444 3 0.96.n

    c

    s

    Slino izraunavamo i za drugog studenta: = 3 0.03 i = 4 1.35.

    U oba sluaja raspodela frekvencija je simetrina u odnosu na srednju ocenustudenta i u oba sluaja spljotenost krive je vea od spljotenosti normalne

    krive, ali je kod drugog studenta to vie izraeno.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    30/71

    dr Vera Lazarevi, vanr. prof. 30/71

    Sada emo u paketu Statistica 8pokazati postupak dobijanja srednjih

    vrednosti. Iz menija Statisticsbiramo Basic Statistics/Tables, pa ondaodaberemo Descriptive statistics.Na dugmetu Variablesodaberemo obelejaza koja raunamo srednje vrednosti. U naem sluaju to su obeleja: Srednjaocena, Ocena na diplomskom i druga. Onda prelazimo u karticuAdvancedi

    biramo sve srednje vrednosti koje nam trebaju (Slika 52).

    Slika 52.Izgled prozora za izbor vrednosti koje raunamo.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    31/71

    dr Vera Lazarevi, vanr. prof. 31/71

    Nakon tikliranja odreenih opcija prelazimo na odabir varijabli (eng.

    Variables)i dobijamo sledei prozor (Slika 53) i potvrdom na Ok, vraamo se uprethodni prozor gde nam preostaje samo da izaberemo opciju Summary:Statistics.

    Slika 53.Prozor za izbor varijable

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    32/71

    dr Vera Lazarevi, vanr. prof. 32/71

    Prethodno opisanim koracima dobijamo rezultate prikazane u sledeimtabelama.

    Slika 54.Prikaz tabele sa raunskim i pozicionimvrednostima za studente koji su diplomirali 1995. god.

    Slika 55.Prikaz tabele sa raunskim i pozicionim vrednostimaza studente koji su diplomirali u periodu 1995-1999. god.

    Slika 56.Prikaz tabele sa raunskim i pozicionim vrednostimaza studente iz sluajnog uzorka cele populacije 1995-1999. god.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    33/71

    dr Vera Lazarevi, vanr. prof. 33/71

    Nakon klika na Summary: Statistics iz populacije studenata diplomiranih od2000-2004. godine dobijamo sledee tabele sa srednjim vrednostima.

    Slika 57.Tabela sa srednjim vrednostimaza uzorak diplomiranih 2001. god.

    Slika 58.Tabela sa srednjim vrednostimaza celu populaciju (diplomirali 2000-2004).

    Slika 59.Tabela sa srednjim vrednostimaza sluajan uzorak studenata iz populacije 2000-2004.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    34/71

    dr Vera Lazarevi, vanr. prof. 34/71

    TABLICE KONTIGENCIJE

    Programski paket Statistica 8ima mogunost kreiranja tzv. tablicakontigencijekoje su veoma pogodne za praenje nekih statistikih podataka.Na primer, moemo pratiti brojno stanje studenata u odnosu na dvaobeleja godine upisa i godine zavretka studija.

    Postupak je sledei:

    Najpre iz menija Statisticsbiramo Basic Statistics/Tables, i nakon toga biramoMultiple response tables. Dobiemo novi prozor i u njemu biramo Specify Tablekao na Slici 60.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    35/71

    dr Vera Lazarevi, vanr. prof. 35/71

    Slika 60.Kreiranje tablice kontigencije za sluajni uzorak iz 2000-2004. god.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    36/71

    dr Vera Lazarevi, vanr. prof. 36/71

    Sledee to treba da uradimo je da odaberemo obeleja koja elimo da

    pratimo. To su u naem sluaju God. upisa i Diplomirao/la, to selektujemoi potvrdimo sa OK. Tada nam se otvara novi prozor u kome treba da kliknemona Summary: Review summary tables(Slika 61).

    Slika 61.Poslednji korak pri kreiranju tabele kontigencije.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    37/71

    dr Vera Lazarevi, vanr. prof. 37/71

    Na taj nain dobijamo eljene rezultate na Slici 62.

    Slika 62.Tabela kontigencije za sluajni uzorak iz populacije 2000-2004.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    38/71

    dr Vera Lazarevi, vanr. prof. 38/71

    Primenom navedenog postupka obraujemo studente koji su diplomirali1991, 1992, 1993 i 1994 (Slika 63).

    Slika 63.Tabela kontigencije izmeu godine upisa i godinediplomiranja za studenate koji su diplomirali od 1991-1994. god.

    Sa slike jasno moemo videti da je najvie studenata diplomiralo 1991.godine i to njih 73.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    39/71

    dr Vera Lazarevi, vanr. prof. 39/71

    Obrada jo jedne populacije (20082011.) prikazana je na Slici 64.

    Slika 64.Prikaz broja studenata u odnosu nadva obeleja godina upisa i godina diplomiranja.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    40/71

    dr Vera Lazarevi, vanr. prof. 40/71

    STATISTIKO ZAKLJUIVANJE METODOM UZORAKA

    UVODProuavanje osnovnog statistikog skupa retko se vri na celom tom skupu(jer je neekonomino, neracionalno, nemogue i slino). Uzorak je deo tepopulacije koji treba da obezbedi to tanije informacije o osnovnom skupu.Taj zahtev se realizuje kroz reprezentativnostuzorka. Sam izbor elemenata izpopulacije u reprezentativan uzorak moe se izvriti na vie naina (tablicasluajnih brojeva, uz pomo raunara i drugo). U statistikoj teoriji u svakojkonkretnoj situaciji, zavisno od eljene tanosti i stanja u osnovnomstatistikom skupu, moe se odrediti i obim uzorka za zadate oceneparametara.

    Na taj nain, uzorak je umanjena slika osnovnog skupa i njegova aritmetikasredina, uzoraka disperzija, mera asimetrije ili mera ekscesa su procene, tj.ocene ovih parametara osnovnog skupa. Pored toga, raspodela frekvencijaposmatranog statistikog obeleja na uzorku predstavlja aproksimativnu

    raspodelu sluajne promenljive u osnovnom skupu.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    41/71

    dr Vera Lazarevi, vanr. prof. 41/71

    Neka je ( )1,..., nX X prost sluajan uzorak od n sluajnih promenljivih1, ..., .nX X Za svaki takav uzorak moemo formirati neku novu sluajnu

    promenljivu ( )= 1,..., nY f X X koju nazivamo statistika.

    Formule po kojima se raunaju realizovane vrednosti navedenih numerikihkarakteristika obeleja (aritmetika sredina, uzoraka disperzija, mod,medijana, koeficijenat varijacije, mera asimetrije, mera ekscesa, uzorakikoeficijenat korelacije i drugo) mogu posluiti da se za svaku od navedenihkarakteristika napie odgovarajua statistika, po analogiji sa tim formulama, inazivi tih statistika poklapaju se sa nazivima tih numerikih karakteristika.

    Life Long Learning programs in applied statistics (LLL-seminari)

    b l k d

  • 7/22/2019 Seminar 2 - Prezentacija

    42/71

    dr Vera Lazarevi, vanr. prof. 42/71

    Pri prouavanju obeleja na osnovu uzorka sreemo se sa dva osnovnazadatka.

    Prvi zadatakima za cilj da na osnovu uzorka ustanovi kakva je raspodelaobeleja u populaciji, kao i da oceni parametre te raspodele izraunavajuirealizovane vrednosti pogodno odabranih statistika. To suproblemi ocene

    parametara raspodele.

    Drugi zadataksastoji se u tome da na osnovu procenjenih karakteristikaosnovnog skupa iz uzorka, formuliemo i proverimo neku pretpostavku(hipotezu) u vezi sa nekom karakteristikom osnovnog skupa. To suproblemitestiranja (verifikacije) hipoteza. Te pretpostavke mogu se odnositi naparametre raspodele (parametarske hipoteze) ili na same raspodele obeleja(neparametarske hipoteze).

    Inae, u statistikoj teoriji se smatra da su uzorci iji obim prelazi 30 jedinicaosnovnog statistikog skupa veliki uzorci i na njih se primenjuje teorijazasnovana na normalnoj raspodeli. Za uzorak do 30 jedinica osnovnogstatistikog skupa kaemo da su mali uzorci i njih razmatramo u okviru teorije

    studentove t raspodele.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    43/71

    dr Vera Lazarevi, vanr. prof. 43/71

    OCENE PARAMETARA RASPODELE

    Koriste se dve vrste ocena.

    Takasta ocenaje ocena nekog parametra realnim brojem koji se izraunavana osnovu uzorka i predstavlja realizovanu vrednost odabrane statistike. Tajbroj je taka na realnoj osi (otuda i naziv) i on slui kao aproksimacijanepoznate vrednosti parametra raspodele.

    Intervalne ocenese daju preko intervala, koji se nazivaju intervalimapoverenja, jer sa unapred zadatom pouzdanou prekrivaju nepoznatiparametar. Ta pouzdanost se zove nivo poverenjai obeleava sa .

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    44/71

    dr Vera Lazarevi, vanr. prof. 44/71

    TAKASTE OCENE PARAMETARA RASPODELE

    Neka je ( )1,..., nX X prost sluajan uzorak i nepoznati parametar obelejaX u populaciji. Za ocenu ovog parametra biramo statistiku:

    ( ) =

    1, ..., .nf X X

    Za realizovani uzorak ( )1,..., nx x izraunamo broj

    ( )=

    1,..., nv f x x

    koji predstavlja jednu ocenu parametra . Obino se zahteva da ta ocenabude nepristrasna, tj.

    ( ) ( )( ) = =

    1, ..., .nE E f X X

    U sluaju pristrasnosti, mera pristrasnosti je razlika ( )

    .E

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    45/71

    dr Vera Lazarevi, vanr. prof. 45/71

    TAKASTA OCENA SREDNJE VREDNOSTI I DISPERZIJE IZ UZORKA

    Neka obeleje X u osnovnom skupu ima srednju vrednost m i disperziju2 . Elementi uzorka ( )1,..., nX X u sluaju izbora elemenata sa vraanjem izkonanog osnovnog skupa (ili bez vraanja iz beskonanog skupa) imaju ista

    oekivanja =( )iE X m i disperzije = 2( )iD X , ( )=1,..., .i n

    Statistika

    =

    = 1

    1 nn i

    i

    X X

    n

    je nepristrasna ocena za m , bez obzira na raspodelu obeleja X.

    Standardna greka pri oceni sredine populacije je

    = .x n

    Life Long Learning programs in applied statistics (LLL-seminari)

    U sluaju da uzorak formiramo iz konane populacije ali bez vraanja

  • 7/22/2019 Seminar 2 - Prezentacija

    46/71

    dr Vera Lazarevi, vanr. prof. 46/71

    U sluaju da uzorak formiramo iz konane populacije ali bez vraanja,standardna greka je

    =

    1xN nNn

    ,

    gde je N broj elemenata osnovnog statistikog skupa.Zakljuujemo, da se srednja vrednost m populacije aproksimira

    aritmetikom sredinom uzorka=

    = 11

    ,n

    n ini

    x x tj.

    = ,nm x a to je obian momenat prvog reda.

    Slino, disperzija 2 osnovnog skupa aproksimira se centralnim uzorakim

    momentom drugog reda ( )=

    = 22

    1

    1,

    n

    nn ini

    s x x tj.

    =

    2 2

    .ns Ova metoda za odreivanje takastih ocena parametara statistikog skupa,naziva se metoda momenata.

    Pored ove, za odreivanje takastih ocena, esto se koristi

    metod najmanjih kvadratai metod maksimalne verodostojnosti.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    47/71

    dr Vera Lazarevi, vanr. prof. 47/71

    INTERVALNE OCENE PARAMETARA RASPODELE

    Pored takastih, u praksi moda i ee, koriste se tzv. intervalne oceneparametra . Sutina ovih ocena svodi se na odreivanje intervala 1 2 [ , ]

    koji sadri nepoznati parametar sa verovatnoom 100 %.

    Dakle, problem se svodi na to da se odrede dve statistike = 1 1 1 ( , , )nf X X i

    = 2 2 1

    ( , , )n

    f X X takve da je

    = = 1 2 1 2 { } 1 i { } ,P P

    gde je zadata verovatnoa koja se zove nivo poverenjaza .

    Interval 1 2 [ , ] je sluajan interval interval poverenjaza .

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    48/71

    dr Vera Lazarevi, vanr. prof. 48/71

    PRIMER 20.Odrediti takastu ocenu prosene ocene m prvog i drugog

    studenta, kao i intervalnu ocenu za parametar m kod oba studenta sanivoom poverenja = 0.90 i = 0.95 (Primer 17).

    Reenje.Za takastu ocenu prosene ocene prvog i drugog studenta

    koristimo aritmetiku sredinu uzorka i ona je u oba sluaja ista: = = =10 10 10 8.1m x y

    Prvi student: 90% interval poverenja za prosenu ocenu je: [ ]7.67,8.53 ;

    95% interval poverenja za prosenu ocenu je: [ ]7.57,8.63 .Drugi student:

    90% interval poverenja za prosenu ocenu je: [ ]7.06,9.14 ; 95% interval poverenja za prosenu ocenu je:

    [ ]6.82,9.38 .

    Oigledno je da poveanje nivoa poverenja poveava irinu intervala ,mI tj. poveanje garancija za ocenjeni parametar smanjuje preciznost ocene.Dalje, duina intervala poverenja za prvog studenta je manja za bilo koji

    nivoa poverenja .

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    49/71

    dr Vera Lazarevi, vanr. prof. 49/71

    PRIMER 21.Nai intervalnu ocenu standardne devijacije prosene ocene

    studenata iz Primera 17, za = 0.90 i = 0.950 , kao i takastu ocenu togaparametra.

    Reenje. Takasta ocena,90% i 95% intervalna ocena, redom, standardne

    devijacije prosene ocene je : za prvog studenta:

    = = 0.7ns , [ ]= 0,0.57I i [ ]= 0,0.54 ;I

    za drugog studenta:

    = =1.7ns , [ ]= 0,1.40I i [ ]= 0,1.37 .I

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    50/71

    dr Vera Lazarevi, vanr. prof. 50/71

    Interval poverenja za oekivanu vrednost primenom paketa Statistica

    Postupak dobijanja intervala poverenja za neku oekivanu vrednost je istikao i prilikom dobijanja raunskih i pozicionih vrednosti u paketu Statistica,samo to umesto tada selektovanih vrednosti u ovom sluaju aktiviramo

    Confirm limits for means. Idemo na padajui meni Statistics izabiramoBasic Statistics/Tabeles.

    Zatim odabiramo Descriptive Statistics i potvrdimo na Ok. Nadobijenom prozoru odaberemo karticu Advaced i aktivnost Confirm limitsfor means. Na kraju se odabere koeficijent pouzdanosti (najee 95%) idobija se sledea tabela potvrdom na Summary: Descriptive statistics.

    Slika 65.Intervali poverenja nekih obeleja za sluajni uzorak iz populacije

    1995-1999 pri koeficijentu pouzdanosti od 95% (1995-1999).

  • 7/22/2019 Seminar 2 - Prezentacija

    51/71

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    52/71

    dr Vera Lazarevi, vanr. prof. 52/71

    Slika 68.Interval poverenja za prosenu ocenu studenatadiplomiranih 2001. pri koef. pouzdanosti 95%.

    Slika 69.Interval poverenja za prosenu ocenu studenata na osnovusluajnog uzoraka iz populacije 2000-2004 pri koef. pouzdanosti 95%.

    Slika 70.Interval poverenja dobijen iz celepopulacije pri koef. pouzdanosti 95%.

    Life Long Learning programs in applied statistics (LLL-seminari)

    Slede rezultati vezani za populaciju 2008-2011.

  • 7/22/2019 Seminar 2 - Prezentacija

    53/71

    dr Vera Lazarevi, vanr. prof. 53/71

    p p j

    Slika 71.Intervali poverenja za obelejapopulacije2008.-2011. sa nivoom poverenja 95%.

    Slika 72.Intervali poverenja za obeleja sluajno odabranoguzorka iz populacije20082011. sa nivoom poverenja 95%.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    54/71

    dr Vera Lazarevi, vanr. prof. 54/71

    TESTIRANJE STATISTIKIH HIPOTEZA

    Postupak testiranja hipoteze se izvodi se kroz nekoliko koraka:

    1)Definiu se nulta i alternativna hipoteza;2)Izbor modela teorijske raspodele;3)Odreuje se nivo znaajnosti testa , odnosno verovatnoa (1);4)Definisanje uzorka;5)Izraunavanje statistike testa na osnovu uzorka;6)Iz tablice teorijske raspodele oitava se tablina vrednost (kriterijum);7)Uporeivanje statistike testa sa tablinom vrednou;8)Odluka o prihvatanju ili odbacivanju formulisane hipoteze.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    55/71

    dr Vera Lazarevi, vanr. prof. 55/71

    Definisanje hipoteza

    Metode ili testovi provere hipoteze omoguavaju da se donese sud otanosti hipoteze sa verovatnoom dovoljno bliskoj jedinici. Provera

    statistikih hipoteza naziva se verifikacija statistikih hipoteza. Osnovnizadatak u teoriji provere statistikih hipoteza je odreivanje pravila po komese na osnovu uzoraka moe reiti pitanje da li se postavljena hipotezaprihvata ili odbacuje.

    Postupak testiranja hipoteze u paketu Statistica je sledei: Na menijuStatistics izaberemo Basic Statistics/Tables, zatim izaberemo t-test, singlesample. Potvrdom na OKotvara nam se prozor kao na Slici 73.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    56/71

    dr Vera Lazarevi, vanr. prof. 56/71

    Slika 73.Prozor za unos vrednosti 0m .

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    57/71

    dr Vera Lazarevi, vanr. prof. 57/71

    Klikom na polje Variblesodabira se obeleje, a zatim na jeziku Optionsu

    polje pored teksta Test all means againstunosimo vrednost za m0. Vrednostmo je vrednost koja je priblina aritmetikoj sredini obeleja.

    Pri korienju statistikog paketa kao rezultat dobija se izraunatat-vrednost i odgovarajua p vrednost za izraunato t. Na osnovu dobijenep vrednosti zakljuci se donose na sledei nalin.

    Ako jep

    > 0.05 tada sa pouzdanou 95% prihvatamo hipotezuH

    0.

    Ako je p 0.05 tada sa pouzdanou od 95% odbacujemo hipotezu H0.

    Nivo poverenja se moe menjati u zavisnosti od potrebe.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    58/71

    dr Vera Lazarevi, vanr. prof. 58/71

    NEJEE TESTIRANE HIPOTEZE

    Testiranje hipoteze ( )=0 0H m m protiv ( )1 0 ,H m m kada je 2 poznato

    Moemo vriti sledea testiranja:

    (1) Uzeti da je =0 nm x , gde je nx prosena ocena diplomiranihstudenata iz uzorka u koji su uzeti studenti upisani na prvu godinu

    studija pri upisu Fakulteta, a =22Ns iz populacije iste kategorije

    studenata. Za prag znaajnosti uzeti = 0.01, = 0.05 ili = 0.10.

    (2) Uzeti da je =0 nm x , gde je nx prosena ocena diplomiranihstudenata iz uzorka u koji su uzeti studenti upisani na 3. godinu pri

    upisu na Fakultet, a =22Ns iz populacije toga uzorka. Za prag

    znaajnosti uzeti = 0.01, = 0.05 ili = 0.10.

    Life Long Learning programs in applied statistics (LLL-seminari)

    Testiranje hipoteze ( )=0 0H m m protiv ( )1 0H m m ,

  • 7/22/2019 Seminar 2 - Prezentacija

    59/71

    dr Vera Lazarevi, vanr. prof. 59/71

    kada 2 nije poznato

    Ovde je =0 nm x , gde je nx prosena ocena svih diplomiranih studenata iz

    uzorka, a =22ns iz uzorka.

    Testiranje hipoteze o jednakosti dve aritmetike sredine,

    tj. ( )=0 M ZH m m protiv ( )1 M ZH m m Uzeemo da je = nMm x , gde je nx prosena ocena studenata iz sluajnog

    uzorka, a =Z nm y , gde je ny prosena ocena studentkinja iz tog istoguzorka, za neki prag znaajnosti uzeti .

    Testiranje hipoteze o razlici dve populacije,tj. =0 1 2( )H p p protiv 1 1 2( )H p p

    Ovde se posmatraju dve populacije studenata: prvu ine studenti upisani naprvu godinu Fakulteta, a drugu populaciju ine studenti upisani na neku

    stariju godinu-prelaznici sa visokih kola ili nekih drugih fakulteta. Parametar1p odnosi se na procenat studenata koji studiraju 5 i vie godina, a upisani su

    u 1. godinu Fakulteta, a parametar 2p odnosi se na procenat studenata kojistudiraju 3 i vie godina, a upisani su u 3. godinu Fakulteta. Za pragznaajnosti uzeti = 0.01, = 0.05 ili = 0.10.

    Life Long Learning programs in applied statistics (LLL-seminari)

    N l d i lik id l i j hi i

  • 7/22/2019 Seminar 2 - Prezentacija

    60/71

    dr Vera Lazarevi, vanr. prof. 60/71

    Na sledeim slikama videemo rezultate testiranja hipoteze u vezi sa

    obelejem Srednja ocena za razliite uzorke. Nulta hipoteza tvrdi da jevrednost srednje ocene cele populacije studenata diplomiranih od 1995. do1999. god., m0= 7.17746 sa pragom znaajnosti = 0.05. Alternativnahipoteza je 1 0( ).H m m

    Pri korienju statistikog paketa kao rezultat dobija se izraunatat-vrednost i odgovarajua p vrednost za izraunato t. Na osnovu dobijenep vrednosti zakljuci se donose na sledei nain:

    - Ako jep> 0.05 tada sa pouzdanou 95% prihvatamo hipotezu H0.- Ako jep 0.05 tada sa pouzdanou od 95% odbacujemo hipotezu H0.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    61/71

    dr Vera Lazarevi, vanr. prof. 61/71

    Slika 74.Rezultati testiranja hipoteze o srednjoj oceni cele populacije

    Na osnovu dobijene vrednostipkoja je manja od 0,05 zakljuujemo da senultna hipoteza odbacuje za prag znaajnosti = 0,05.

    Slika 75.Rezultati testiranja hipotezeo srednjoj oceni studenata diplomiranih 1995. god.

    Vrednost p = 0,200934 > 0,05 pa nemamo razloga da odbacimo nultuhipotezu, odnosno prihvatamo nultu hipotezu da je prosena ocenadiplomiranih studenata 1995. godine upravo 7,195893 sa pragom

    znaajnosti = 0,05.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    62/71

    dr Vera Lazarevi, vanr. prof. 62/71

    Slika 76.Dobijeni rezultati prilikom testiranja hipotezeo srednjoj oceni studenata na osnovu sluajnog uzorka.

    Kao to vidimo iz tabele dobijena vrednost p = 0,198678 > 0,05 i prihvatamonultu hipotezu, to znai da je prosena ocena studenata diplomiranih u

    periodu od 19951999., priblino 7.277273 sa nivoom poverenja 95%.

    Primetimo da program Statisticau sluaju odbacivanja nulte hipoteze u

    prozoru sa rezultatima koristi crvenu boju za izraunate vrednosti, to jesluaj i na prethodnim slikama. Na taj nain smo i vizuelno opomenuti danultu hipotezu treba odbaciti.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    63/71

    dr Vera Lazarevi, vanr. prof. 63/71

    2TEST NEZAVISNOSTI

    Koristei 2-test mogu se odrediti verovatnoe povezanosti izmeu dva

    obeleja ali ne i jaina te povezanosti. Jaina povezanosti moe se odreditiprimenom koeficijenata kontigencije. 2 se primenjuje kada je potrebnoutvrditi da li se neke realizovane frekvencije razlikuju od frekvencije kojebismo oekivali pod odreenom hipotezom.

    U paketu Statistica, 2-test se moe realizovati tako to iz menijaStatistics, izaberemo Basic Statistics/Tables, a zatim Tables and Banners.

    Dobijamo prozor kao na Slici 77.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    64/71

    dr Vera Lazarevi, vanr. prof. 64/71

    Slika 77.Izgled prozora Crosstabulation Tables.

    Izbor obeleja vrimo preko dugmeta Specify tables i nakon toga potvrdimodvaput OK. Sada dobijamo novi prozor prikazan na Slici 78.

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    65/71

    dr Vera Lazarevi, vanr. prof. 65/71

    Slika 78.Prozor za izbor vrste analize.

    Po izboru analize koju elimo da vrimo, vraamo se na karticu Advanced ikliknemo na opciju Detailed two-way tables.

    Life Long Learning programs in applied statistics (LLL-seminari)

    Neke mogua testiranja:

  • 7/22/2019 Seminar 2 - Prezentacija

    66/71

    dr Vera Lazarevi, vanr. prof. 66/71

    Neke mogua testiranja:

    Ispitati preko uzorka da li su POL i DUINA STUDIRANJA zavisnaobeleja.

    Ispitati preko uzorka da li su PROSENA OCENA i DUINA STUDIRANJA

    zavisna obeleja.

    U sledeem primeru ispitivali smo zavisnost izmeu dva obeleja iz

    populacije studenata diplomiranih u periodu 1995-1999. godine naTehnikom fakultetu u aku.

    Ispituje se da li postoji zavisnost izmeu pola studenata i ocene dobijene

    na diplomskom radu (Tabele 79 i 80).

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    67/71

    dr Vera Lazarevi, vanr. prof. 67/71

    Slika 79.Tabela kontigencije cele populacije 19951999. god.

    Slika 80.Rezultat 2-testa cele populacije

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    68/71

    dr Vera Lazarevi, vanr. prof. 68/71

    Na osnovu dobijenih rezultata u programu Statistica prikazanih naSlikama 79 i 80 moemo zakljuiti sledee:

    H0 hipoteza koja tvrdi da su pol i ocena studenata na diplomskom ispitu

    nezavisna obeleja na celoj populaciji diplomjranih studenata u periodu19951999.

    Kako je p = 0,00306 < 0,05 to znai da sa pouzadnou od 95%odbacujemo nultu hipotezu i zakljuujemo da postoji zavisnost izmeu polastudenata i ocena na diplomskom za posmatranu populaciju.

    Meutim prema odraenom sluajnom uzorku te populacije dobijamosledee rezultate (Slika 81).

    Life Long Learning programs in applied statistics (LLL-seminari)

  • 7/22/2019 Seminar 2 - Prezentacija

    69/71

    dr Vera Lazarevi, vanr. prof. 69/71

    Slika 81.Tabela 2-testa za sluajni uzorak.

    Kako je p = 0,06265 > 0,05 to znai da na osnovu uzorka, sa pouzdanou od95%, prihvatamo nultu hipotezu i zakljuujemo da su pol i ocena nadiplomskom ispitu nezavisna obeleja.

    Life Long Learning programs in applied statistics (LLL-seminari)

    Za subjektivno odabrani uzorak iz populacije 19951999., tj. za studente

  • 7/22/2019 Seminar 2 - Prezentacija

    70/71

    dr Vera Lazarevi, vanr. prof. 70/71

    diplomirane 1995. dobijamo sledee rezultate (Slika 82).

    Slika 82. Tabela 2-testa za studente koji su diplomirali 1995. god.

    Sada je p = 0,03671 < 0,05 to znai da sa pouzadnou od 95%odbacujemo nultu hipotezu i zakljucujemo da postoji zavisnost izmeu polastudenata i ocene na diplomskom ispitu.

    Life Long Learning programs in applied statistics (LLL-seminari)

    Za generaciju studenata diplomiranih 2001. godine ispitaemo zavisnost

    izmeu pola studenta i smera koji je student upisao, za = 0,05.

  • 7/22/2019 Seminar 2 - Prezentacija

    71/71

    dr Vera Lazarevi, vanr. prof. 71/71

    izmeu pola studenta i smera koji je student upisao, za 0,05.

    Slika 83.Tabela kontigencije za uzorak studenata diplomiralih 2001.

    Slika 84.Tabela 2-testa za uzorak studenata diplomiralih 2001.

    Kako jep= 0,00481 < 0,05 to znai da odbacujemo nultu hipotezu,pa sa pouzdanou od 95% moemo rei da smerna koji se student upisaozavisi od polaza generaciju studenata Tehnikog fakulteta u aku

    koji su diplomirali 2001. godine.