ocenjivanje parametara

Upload: andirjafcb

Post on 18-Oct-2015

88 views

Category:

Documents


0 download

DESCRIPTION

ocenjivanje parametara

TRANSCRIPT

  • STATISTIKA U PSIHOLOGIJI 1STATISTIKA U ISTRAIVANJU OBRAZOVANJA

    OCENJIVANJE PARAMETARAOliver TokoviUniverzitet u BeograduFilozofski fakultet

  • Polazni pojmoviStatistiko zakljuivanje: zakljuivanje o populaciji na osnovu informacija sadranih u sluajnom uzorku.

    Populacija je skup entiteta P na koji elimo da primenimo zakljuke istraivanja ili psiholokog ispitivanja.

    Sluajni uzorak se dobija sluajnim uzorkovanjem. Sluajno uzorkovanje: verovatnoa da bude izabran uzorak odreene veliine iz populacije moe biti unapred poznata.

    Statistiko zakljuivanje podrazumeva da su informacije na kojima se zasniva dobijene na sluajnom uzorku.

  • Polazni pojmoviStatistiko zakljuivanje obuhvata:Ocenjivanje parametaraTestiranje statistikih hipoteza

    Parametar: numerika karakteristika populacije. aritmetika sredina populacije, relativna uestalost odreene kategorije u populaciji, standardna devijacija populacije.

    Statistik: numerika karakteristika uzorka. aritmetika sredina uzorka, relativna uestalost odreene kategorije u uzorku, standardna devijacija uzorka. Statistik moe sluiti samo za deskripciju uzorka, ali i kao ocenitelj parametra.

    Parametri grka slova - aritmetika sr. populacije; statistici latinina - M aritmetika sredina uzorka.

  • Ocenjivanje parametara: kljune teorijske pretpostavke

    Pre nego to izvedemo posmatranje ili istraivanje na uzorku, svaka opservacija predstavlja sluajnu varijablu. merenja X1, X2,..., Xn na sluajnom uzorku veliine n teorijski predstavljaju n sluajnih varijabli.postoji verovatnoa da e Lumberjack voleti da see drva, ali i da e poeleti da bude ensko u konkretnom ponaanju uvek postoji veliki broj mogunosti ali sa razliitim verovatnoama deavanjaTeorema: Svaka funkcija sluajnih varijabli jeste sluajna varijabla.sama raspodela zavisi od konkretnih vrednosti ako su one promenjive, promenjiva je i raspodelaSvaki statistik G je funkcija sluajnih varijabli, G = f (X1, X2,..., Xn), pa, prema tome, svaki statistik predstavlja sluajnu varijablu

    Celokupna teorija o sluajnim varijablama moe se primeniti na opservacije koje se izvode na uzorku, kao i na statistike koji slue kao ocenitelji parametara.

  • Ocenjivanje parametara

    Takasto ocenjivanje: parametar ocenjujemo jednom vrednou statistika kao ocenitelja. vrednost statistika dobijena na sluajnom uzorku predstavlja ocenu parametra.prosena depresivnost uzorka je ocena prosene depresivnosti populacije

    Intervalno ocenjivanje: parametar ocenjujemo intervalom moguih vrednosti statistika koje moe dobiti na razliitim uzorcima iste veliine iz iste populacije.

  • Takasto ocenjivanje parametara

    Najee korieni postupci:Metod momenata: prvi momenti distribucije uzorka se izjednae sa momentima distribucije populacije i reavanjem jednaina dobija se ocena parametra.

  • Momenti?

  • Takasto ocenjivanje parametara

    Najee korieni postupci:Metod momenata: prvi momenti distribucije uzorka se izjednae sa momentima distribucije populacije i reavanjem jednaina dobija se ocena parametra.

    Metod maksimalne verodostojnosti: bira se ona vrednost kao ocena parametra koja podatke dobijene na uzorku ini najverodostojnijim.

  • Ilustracija principa maksimalne verodostojnosti Ako je u 100 bacanja novia 56 puta palo pismoNeka je ocena parametra za binomnu raspodelu koja je model dobijenih podataka (u 100 bacanja novia 56 puta palo pismo) = 0.5.

    Verodostojnost je tada:

  • Ilustracija principa maksimalne verodostojnosti

    Ili neka je ocena parametra za binomnu raspodelu koja predstavlja model podataka (u 100 bacanja novia 56 puta palo pismo) = 0.52.

    Verodostojnost je tada:

  • Ilustracija principa maksimalne verodostojnosti Najvea vrednost za L dobija se kada se kao ocena za uzme 0.56. A to je u primeru p, proporcija pisama u sto bacanja novia!

    Dakle, proporcija 0.56 je ocena za dobijena po principu maksimalne verodostojnosti.

    Uopte, vai da je proporcija p bilo kojeg uzorka ocenitelj za po principu maksimalne verodostojnosti.

  • Takasto ocenjivanje parametara

    Najee korieni postupci:Metod momenata: prvi momenti distribucije uzorka se izjednae sa momentima distribucije populacije i reavanjem jednaina dobija se ocena parametra.

    Metod maksimalne verodostojnosti: bira se ona vrednost kao ocena parametra koja podatke dobijene na uzorku ini najverodostojnijim.

    Metod najmanjih kvadrata, Bajesovski postupci itd.

    JEDINO VANO: postoje razliiti postupci za takasto ocenjivanje parametara.

  • Svojstva statistika-ocenitelja parametaraNepristrasnost (eng. unbaisedness): ocenitelj G je nepristrasan ako je njegova oekivana vrednost, E(G) ili G, jednaka parametru koji se ocenjuje datim oceniteljem.

    E(G) = G =

    Konzistentnost (eng. consistency): ocenitelj G je konzistentan ako se verovatnoa da uzme vrednost koja se razlikuje od parametra pribliava 0 kako n (veliina uzorka) tei beskonanosti.

    Dovoljnost (eng. sufficency): ocenitelj G je dovoljan ocenitelj parametra ukoliko koristi sve informacije iz uzorka koje su relevantne za ocenu parametra .

  • Svojstva statistika-ocenitelja parametaraRelativna efikasnost (eng. relative efficiency) ocenitelja G2 u odnosu na ocenitelj G1 definisana je kolinikom njihovih prosenih kvadriranih odstupanja:

    Proseno kvadrirano odstupanje ocenitelja G:

  • Svojstva statistika-ocenitelja parametaraRelativna efikasnost (eng. relative efficiency) ocenitelja G2 u odnosu na ocenitelj G1 ako su ocenitelji G1 i G2 nepristrasni, definisana je kolinikom njihovih varijansi:

    Varijansa ocenitelja G, u oznaci 2G:

  • Pristrasnost i efikasnost ocenitelja

  • Standardna greka ocenitelja Standardna greka statistika G, (G) - pozitivni kvadratni koren varijanse statistika.

    Standardna greka statistika-ocenitelja predstavlja standardnu devijaciju distribucije uzorkovanja tog statistika.

    Distribucija uzorkovanja statistika je distribucija verovatnoa (funkcija gustine) statistika kao sluajne varijable.

    Ocena standardne greke statistika ocenitelja G se oznaava SEG (Standard Error = standardna greka).

  • Distribucija uzorkovanjaStatistik kao sluajna varijablaReprezentativnost uzorka greka uzorkovanjaSvako pojedinano merenje merenje sa grekomPonavljanje merenja meusobno razliite mereGreke merenja su nesistematskeSvaka mera (statistik) se distribuira sluajno

  • Distribucija uzorkovanjaDistribucija uzorkovanja - distribucija verovatnoa ili funkcija gustine statistika

    Pokazuje funkcionalnu vezu moguih vrednosti statistika i verovatnoe koja odgovara datoj vrednosti, za sve mogue uzorke odreene veliine iz date populacije

  • MSD?

  • Distribucija uzorkovanjaAritmetika sredina distribucije uzorkovanja nekog statistika vrednost parametra Standardna devijacija distribucije uzorkovanja nekog statistika je standardna greka tog statistika

    Realno ne postoje podaci za distribuciju uzorkovanjaStandarda greka se procenjuje na osnovu SD empirijske distribucije

  • Standardna greka ocenitelja Standardna greka nepristrasnog statistika - koliko poverenja moemo imati u dobijenu ocenu parametra: to je standardna greka statistika manja utoliko vie poverenja u dobijenu takastu ocenu parametra imamo. Primer standardne greke-standardna greka za aritmetiku sredinu, u oznaci M:( je standardna devijacija populacije, n veliina uzorka)Ocena standardne greke za aritmetiku sredinu, u oznaci SEm:(S je standardna devijacija uzorka, n veliina uzorka)

  • Intervalno ocenjivanje parametaraTeorema 1: Ako sluajna varijabla X ima normalnu raspodelu sa parametrima X i 2X (X ~ N (X; 2X ) tada sluajna varijabla Y, Y = a + bX, ima takoe normalnu raspodelu sa parametrima Y = a + bX i 2Y = b22X.

    dakle, linearna transformacija ne menja oblik raspodele!

    Prema tome:Ako sluajna varijabla X ima normalnu raspodelu sa parametrima X i 2X tada sluajna varijabla Z, Z = (X - X)/ X, ima takoe normalnu raspodelu sa parametrima Z = 0 i 2Z = 1 (Z ~ N(0; 1 )Raspodela varijable Z zove se standardizovana normalna raspodela.

  • Intervalno ocenjivanje parametara: poznata varijansa populacije, normalna distribucijaPosledice Teoreme 1 koja se odnosi na varijablu Z:P(-1.96 < Z < + 1.96) = 0.95.P(-2.58 < Z < + 2.58) = 0.99.Sluajna varijabla Z = (M - )/M takoe ima normalnu raspodelu sa parametrima 0 i 1. Prema tome:P(-1.96 < (M - )/M < + 1.96) = 0.95.P(-2.58 < (M - )/M < + 2.58) = 0.99.Reavanjem dobijamo:P(M - 1.96M < < M + 1.96M) = 0.95. P(M- 2.58M < < M + 2.58M) = 0.99.

  • Intervali poverenjapopulacijauzorak

  • Intervali poverenja

  • Intervali poverenjaIP95 sa sigurnou (verovatnoom) od 95% verujemo da se procenjeni parametar nalazi u datom inetrvalu

    IP99 sa sigurnou (verovatnoom) od 99% verujemo da se procenjeni parametar nalazi u datom inetrvalu

  • Intervalno ocenjivanje parametara: poznata varijansa populacije, nije normalna distribucijaCentralna granina teorema:Ako su sluajne varijable X1, X2,, Xn nezavisne i sve imaju identinu raspodelu sa aritmetikom sredinom i varijansom 2 tada, ako n tei , distribucija varijable Z = (M - )/ tei standardizovanoj normalnoj raspodeli.

    Praktino to znai da sa poveanjem veliine sluajnog uzorka (n tei ), ak i kad uzorak nije iz populacije koja je normalno distribuirana, intervale poverenja moemo praviti isto kao i u sluaju kada sluajni uzorak jeste iz populacije koja je normalno distribuirana.

  • Centralna granina teorema

  • Intervalno ocenjivanje parametara: poznata varijansa populacije, normalna distribucija ili je uzorak veliki 95% interval poverenja za aritmetiku sredinu: donja granica: M-1.96 Mgornja granica: M+1.96M99% interval poverenja za aritmetiku sredinu: donja granica: M-2.58 Mgornja granica: M+2.58M

    Ali, praktino nikada ne znamo varijansu populacije, pa prema tome ne znamo ni M.

  • Intervalno ocenjivanje parametara: nepoznata varijansa populacijeTeorema 2: Ako su M i S aritmetika sredina i standardna devijacija sluajnog uzorka veliine n iz populacije sa normalnom funkcijom gustine tada:- sluajna varijabla T = (M - )/(S/n) = (M - )/SEM, ima Studentovu T funkciju gustine sa parametrom = n 1. - T: razlika statistika i parametra, podeljena grekom merenja

    Parametar predstavlja stepene slobode.

    Dakle, T ~ Student T ( = n 1)

  • Stepeni slobodeOdgovara veliini uzorkaVei uzorak, vea sloboda raunanja i zakljuivanjaBroj stepeni slobode - broj nezavisnih opservacija u uzorku, umanjen za broj parametara koji se moraju oceniti na osnovu uzorkaNepristrasna ocena (N
  • !?

  • W. Gosset i njegova (Studentova) T funkcija gustineStudentova raspodela jo jedna mogua raspodelaAli, sa poveanjem broja stepeni slobode, Studentova raspodela se pribliava standardizovanoj normalnoj.

  • Intervalno ocenjivanje parametara: nepoznata varijansa populacije, normalna distribucijaPosledice Teoreme 2 koja se odnosi na varijablu T:P(-t0.025 < T < +t0.025) = 0.95. (-t0.025 je kvantil 0.025 u Studentovoj raspodeli, a +t0.025 je kvantil 0.975)izmeu ta dva kvantila se nalazi 95% sluajeva P(-t0.005 < T < +t0.005) = 0.99.(-t0.005 je kvantil 0.005 u Studentovoj raspodeli, a +t0.005 je kvantil 0.995)izmeu ta dva kvantila se nalazi 99% sluajeva Prema tome:P(- t0.025 < (M - )/SEM < + t0.025) = 0.95.P(- t0.005 < (M - )/SEM < +t0.005) = 0.99.Reavanjem dobijamo:P(M- t0.025SEM < < M+ t0.025SEM) = 0.95. P(M- t0.005SEM < < M+ t0.005SEM) = 0.99.

  • Intervalno ocenjivanje parametara: nepoznata varijansa populacije, normalna distribucija95% intervala poverenja za aritmetiku sredinu: donja granica:M- t0.025SEMgornja granica: M+ t0.025SEM99% intervala poverenja za aritmetiku sredinu: donja granica: M- t0.005SEMgornja granica: M+ t0.005SEM

    Proizvod koji se oduzima od M ili dodaje na M zove se margina greke

  • Intervalno ocenjivanje parametara: nepoznata varijansa populacije, normalna distribucija -opti sluaj.

    Posledice Teoreme 2 koja se odnosi na varijablu T:P(-tp/2 < T < +tp/2) = 1 - p.ako je npr p=0.05 P(-t0.025 < T < +t0.025) = 0.95.

    Prema tome:P(-tp/2 < (M - )/SEM < +tp/2) = 1 - p.Reavanjem dobijamo:P(M- tp/2SEM < < M+ tp/2SEM) = 1 - p.

  • Intervalno ocenjivanje parametara: nepoznata varijansa populacije (opti sluaj)Donja granica 100*(1 p)% intervala poverenja za aritmetiku sredinu: M- tp/2SEMGornja granica 100*(1 p)% intervala poverenja za aritmetiku sredinu: M+ tp/2SEMIzraz 100(1 - p)% za p = 0.05 jednak je 95%, a za p = 0.01 jednak je 99%.Proizvod tp/2SEM je margina greke.

  • Intervalno ocenjivanje parametara: tumaenje intervala poverenja

    Na osnovu P(M- tp/2SEM < < M+ tp/2SEM) = 1 - p sledi: verovatnoa da e 100*(1 p)% intervala poverenja obuhvatiti parametar, a 100*p% intervala nee obuhvatiti parametar.

    npr: p = 0.05, 100(1 - p)% = 100(1-0.05)% = 95%,a 100p% = (100*0.05)% =5%.

  • Intervalno ocenjivanje parametara: tumaenje intervala poverenjaKada granice 100(1 p)% intervala poverenja dobijemo na jednom konkretnom sluajnom uzorku onda verujemo i to sa sigurnou od 100(1 p)% da je parametar obuhvaen tim intervalom.

    Pazite: pogreno je rei da je verovatnoa 100(1 p)% da je parametar u datom konkretnom intervalu koji je dobijen na jednom sluajnom uzorku.

    Parametar je konstanta pa on u jednom konkretnom intervalu ili jeste ili nije. Dobijena verovatnoa jeste % nae sigurnosti!

  • I EMU SVE TO?

  • ZNAAJNOST RAZLIKAM1-M2 > 0

  • ZNAAJNOST RAZLIKAM1-M2 > 0POLAGRESIVNOSTmukienski