estimarea punctuala a parametrilor
TRANSCRIPT
Statistică 1
Estimarea parametrilor
Cu ajutorul statisticii matematice se studiază fenomene din economie, industrie, etc.
Pentru a studia un fenomen se fac observaţii asupra unui eşantion finit ales din populaţie, care
este foarte mare sau infinită. Considerăm că informaţiile obţinute caracterizează întreaga
populaţie. Acestui fenomen i se asociază un model matematic. Modelul matematic (teoretic)
împreună cu setul de date (selecţia) formează modelul statistic. Statistica matematică trebuie:
- să stabilească ce model teoretic se potriveşte selecţiei;
- să determine valorile parametrilor ce intervin în modelul teoretic;
- să determine intervale în care să se afle parametrii cu o probabilitate dată;
- să verifice ipotezele făcute asupra parametrilor necunoscuţi sau asupra modelului
teoretic ales;
- să facă o generalizare la nivelul întregii populaţii;
- să realizeze predicţii privind evoluţia viitoare a fenomenului.
În anumite cazuri datele obţinute pot sugera ce repartiţie teoretică se poate aplica. În acest caz
se spune că funcţia de repartiţie asociată variabilei aleatoare este specificată. Dacă se cunosc
parametrii ce apar în funcţia de repartiţie se spune că legea este complet specificată.
Procedeul prin care se determină parametrii necunoscuţi se numeşte estimare. Estimarea
poate fi :
- punctuală dacă se determină o valoare numerică a parametrului;
- prin intervale de încredere dacă se determină un interval în care se găseşte
parametrul cu o oarecare probabilitate.
Estimaţii punctuale ale parametrilor
Fie variabila aleatoare X, discretă sau continuă ce studiază caracteristica unei populaţii
statistice, având densitatea de repartiţie ,xf cu un parametru real necunoscut. Notăm cu
S spaţiul de selecţie.
Definiţie. O funcţie IRS:Tn se numeşte estimator pentru parametrul dacă
n21n X,...,X,XT aproximează . Valoarea n21n X,...,X,XT se numeşte estimaţie.
Pentru fiecare selecţie de volum n, funcţia nT ia altă valoare, adică se obţine o altă valoare
aproximativă a parametrului . Putem considera funcţia nT ca o variabilă aleatoare pentru
care se pot calcula momente.
Definiţii.
1) Eroarea estimaţiei este nT .
2) Deplasarea estimaţiei este nTM .
3) Un estimator nT pentru parametrul se numeşte nedeplasat dacă media sa este
egală cu :
nTM
4) Estimatorul nT pentru parametrul se numeşte consistent dacă pentru orice 0
1TPlim nn
Teoremă. Dacă nT este un estimator pentru parametrul al repartiţiei teoretice X cu
densitatea de repartiţie ,xf a.î.
nTM
0TDlim nn
atunci nT este un estimator consistent şi nedeplasat pentru .
Statistică 2
Teoremă. Fie n21 X,...,X,X o selecţie de volum n dintr-o populaţie. Media de selecţie X este
un estimator nedeplasat şi consistent pentru media teoretică a populaţiei.
Consecinţă. Pentru orice repartiţie care depinde de un singur parametru valoarea acestuia
poate fi estimată din relaţia XXM (adică egalând media teoretică cu media de selecţie).
a) Pentru repartiţia Poisson Po avem XXM
b) Pentru repartiţia geometrică XXMp
1
c) Pentru repartiţia binomială Xp
d) Pentru repartiţia exponenţială X
Propoziţie. Dispersia de selecţie 2s*XD este un estimator deplasat pentru dispersia
teoretică 2 , iar dispersia modificată de selecţie este un estimator nedeplasat pentru 2 .
Metode de estimare punctuală a parametrilor
I Metoda momentelor
Teoremă. Fie X o variabilă aleatoare teoretică, fie n21 X,...,X,X o selecţie de volum n şi
n
1...
n
1
n
1
x...xx
*Xn21
variabila aleatoare de selecţie. Atunci *XM r sunt estimatori
eficienţi pentru XM r .
Metoda momentelor
Fie X o variabilă aleatoare teoretică cu densitatea de repartiţie IRIR:f , p1,...,,xff ,
unde p1,..., sunt parametrii necunoscuţi ce trebuie aflaţi. Fie n21 X,...,X,X o selecţie de
volum n şi
n
1...
n
1
n
1
x...xx
*Xn21
variabila aleatoare de selecţie. Pentru a afla p1,...,
rezolvăm sistemul
*XMXM
*XMXM
*XMXM
pp
22
11
pp
22
*XMXM
*XMXM
*XMXM
Observaţie. Din *XMXM şi 22 *XMXM obţinem *XDXD .
II Metoda verosimilităţii maxime
Definiţie. Fie X o variabilă aleatoare teoretică cu densitatea de repartiţie
IRIR:f , p1,...,,xff şi fie n21 X,...,X,X o selecţie de volum n. Definim funcţia de
Statistică 3
verosimilitate IRIRIR:L pn ,
n
1j
p21jp21n21 ,..,,,xf,..,,,x,...,x,xL , ce
reprezintă probabilitatea de a obţine valorile nn2211 xX,...,xX,xX .
Teoremă.
Fie X o variabilă aleatoare teoretică cu densitatea de repartiţie IRIR:f , p1,...,,xff ,
unde p1,..., sunt parametrii necunoscuţi ce trebuie aflaţi. Fie n21 X,...,X,X variabile
aleatoare de selecţie independente, n21 x,...,x,x valorile concrete obţinute şi fie funcţia de
verosimilitate IRIRIR:L pn ,
n
1j
p21jp21n21 ,..,,,xf,..,,,x,...,x,xL . Cea mai
bună estimaţie a parametrilor p1,..., sunt valorile pentru care funcţia de verosimilitate are
valoarea maximă.
Propoziţie. Punctele de extrem ale funcţiei L coincid cu cele ale funcţiei Lln .
Practic
Găsim punctele critice ale funcţiei Lln rezolvând sistemul
0
,..,,,x,...,x,xLln
j
p21n21
, p,1j
apoi verificăm dacă soluţia găsită reprezintă un punct de maxim pentru Lln .
Probleme
1. Dintr-o populaţie statistică s-a făcut o selecţie de volum 80 care a dat următoarele rezultate.
Să se găsească un estimator nedeplasat pentru dispersia teoretică 2 .
xj 2.5 2.8 3 3.2
j 12 32 21 15
2. S-au cântărit 100 de piese şi s-au obţinut următoarele rezultate:
Greutatea (g) Frecvenţe absolute
[30; 30,5] 14
[30,5; 31] 30
[31; 31,5] 35
[31,5; 32] 21
Presupunem că variabila aleatoare teoretică asociată acestei caracteristici are o repartiţie
uniformă. Să se determine parametrii a şi b ai acestei repartiţii prin metoda momentelor.
3. O firmă are 10 utilaje care produc un anumit tip de piese. S-a înregistrat timp de 200 de
zile numărul utilajelor care prezintă defecţiuni şi s-au obţinut următoarele rezultate:
nr
utilaje
defecte
0 1 2 3 4 5 6 7 8 9 10
nr zile 40 38 32 20 18 12 8 6 2 1 0
Să se reprezinte grafic datele. Presupunând că datele urmează o repartiţie Poisson să se
estimeze parametrul . Care este probabilitatea ca într-o zi să fie defecte cel mult 3
utilaje?
Statistică 4
4. Se consideră v.a. X cu densitatea de repartiţie 1,xf x , INx , 1,0 . Să
se estimeze parametrul prin metoda verosimilităţii maxime pe baza selecţiei care a dat
rezultatele : 8 10 9 8 7 10 9 10 8 9 9 8 10 7 9. Să se calculeze probabilitatea ca X să ia
cel mult valoarea 9.
5. Să se determine un estimator pentru parametrul al repartiției exponenţiale cu
densitatea de repartiţie
x
e1
,xf , 0 , 0x , pe baza unei selecţii de volum n
care a dat rezultatele 9 10 8 10 12 8 9 11 8 9 8.
6. Să se estimeze parametrii m şi ai repartiţiei normale pe baza unei selecţii de volum n
care a dat rezultatele:
jx 0 1 2 3 4 5
j 3 4 5 6 3 2
7. Fie v.a. continuă X cu densitatea de repartiţie IRIR:f ,
0x,0
0x,exk,xf
x3
Să se
determine parametrul k. Să se estimeze parametrul prin ambele metode de estimare
punctuală pe baza unei selecţii de volum n.