estimarea punctuala a parametrilor

4
Statistică 1 Estimarea parametrilor Cu ajutorul statisticii matematice se studiază fenomene din economie, industrie, etc. Pentru a studia un fenomen se fac observaţii asupra unui eşantion finit ales din populaţie, care este foarte mare sau infinită. Considerăm că informaţiile obţinute caracterizează întreaga populaţie. Acestui fenomen i se asociază un model matematic. Modelul matematic (teoretic) împreună cu setul de date (selecţia) formează modelul statistic. Statistica matematică trebuie: - să stabilească ce model teoretic se potriveşte selecţiei; - să determine valorile parametrilor ce intervin în modelul teoretic; - să determine intervale în care să se afle parametrii cu o probabilitate dată; - să verifice ipotezele făcute asupra parametrilor necunoscuţi sau asupra modelului teoretic ales; - să facă o generalizare la nivelul întregii populaţii; - să realizeze predicţii privind evoluţia viitoare a fenomenului. În anumite cazuri datele obţinute pot sugera ce repartiţie teoretică se poate aplica. În acest caz se spune că funcţia de repartiţie asociată variabilei aleatoare este specificată. Dacă se cunosc parametrii ce apar în funcţia de repartiţie se spune că legea este complet specificată. Procedeul prin care se determină parametrii necunoscuţi se numeşte estimare. Estimarea poate fi : - punctuală dacă se determină o valoare numerică a parametrului; - prin intervale de încredere dacă se determină un interval în care se găseşte parametrul cu o oarecare probabilitate. Estimaţii punctuale ale parametrilor Fie variabila aleatoare X, discretă sau continuă ce studiază caracteristica unei populaţii statistice, având densitatea de repartiţie , x f cu un parametru real necunoscut. Notăm cu S spaţiul de selecţie. Definiţie. O funcţie IR S : T n se numeşte estimator pentru parametrul dacă n 2 1 n X ,..., X , X T aproximează . Valoarea n 2 1 n X ,..., X , X T se numeşte estimaţie. Pentru fiecare selecţie de volum n, funcţia n T ia altă valoare, adică se obţine o altă valoare aproximativă a parametrului . Putem considera funcţia n T ca o variabilă aleatoare pentru care se pot calcula momente. Definiţii. 1) Eroarea estimaţiei este n T . 2) Deplasarea estimaţiei este n T M . 3) Un estimator n T pentru parametrul se numeşte nedeplasat dacă media sa este egală cu : n T M 4) Estimatorul n T pentru parametrul se numeşte consistent dacă pentru orice 0 1 T P lim n n Teoremă. Dacă n T este un estimator pentru parametrul al repartiţiei teoretice X cu densitatea de repartiţie , x f a.î. n T M 0 T D lim n n atunci n T este un estimator consistent şi nedeplasat pentru .

Upload: adi10k

Post on 08-Aug-2015

229 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimarea Punctuala a Parametrilor

Statistică 1

Estimarea parametrilor

Cu ajutorul statisticii matematice se studiază fenomene din economie, industrie, etc.

Pentru a studia un fenomen se fac observaţii asupra unui eşantion finit ales din populaţie, care

este foarte mare sau infinită. Considerăm că informaţiile obţinute caracterizează întreaga

populaţie. Acestui fenomen i se asociază un model matematic. Modelul matematic (teoretic)

împreună cu setul de date (selecţia) formează modelul statistic. Statistica matematică trebuie:

- să stabilească ce model teoretic se potriveşte selecţiei;

- să determine valorile parametrilor ce intervin în modelul teoretic;

- să determine intervale în care să se afle parametrii cu o probabilitate dată;

- să verifice ipotezele făcute asupra parametrilor necunoscuţi sau asupra modelului

teoretic ales;

- să facă o generalizare la nivelul întregii populaţii;

- să realizeze predicţii privind evoluţia viitoare a fenomenului.

În anumite cazuri datele obţinute pot sugera ce repartiţie teoretică se poate aplica. În acest caz

se spune că funcţia de repartiţie asociată variabilei aleatoare este specificată. Dacă se cunosc

parametrii ce apar în funcţia de repartiţie se spune că legea este complet specificată.

Procedeul prin care se determină parametrii necunoscuţi se numeşte estimare. Estimarea

poate fi :

- punctuală dacă se determină o valoare numerică a parametrului;

- prin intervale de încredere dacă se determină un interval în care se găseşte

parametrul cu o oarecare probabilitate.

Estimaţii punctuale ale parametrilor

Fie variabila aleatoare X, discretă sau continuă ce studiază caracteristica unei populaţii

statistice, având densitatea de repartiţie ,xf cu un parametru real necunoscut. Notăm cu

S spaţiul de selecţie.

Definiţie. O funcţie IRS:Tn se numeşte estimator pentru parametrul dacă

n21n X,...,X,XT aproximează . Valoarea n21n X,...,X,XT se numeşte estimaţie.

Pentru fiecare selecţie de volum n, funcţia nT ia altă valoare, adică se obţine o altă valoare

aproximativă a parametrului . Putem considera funcţia nT ca o variabilă aleatoare pentru

care se pot calcula momente.

Definiţii.

1) Eroarea estimaţiei este nT .

2) Deplasarea estimaţiei este nTM .

3) Un estimator nT pentru parametrul se numeşte nedeplasat dacă media sa este

egală cu :

nTM

4) Estimatorul nT pentru parametrul se numeşte consistent dacă pentru orice 0

1TPlim nn

Teoremă. Dacă nT este un estimator pentru parametrul al repartiţiei teoretice X cu

densitatea de repartiţie ,xf a.î.

nTM

0TDlim nn

atunci nT este un estimator consistent şi nedeplasat pentru .

Page 2: Estimarea Punctuala a Parametrilor

Statistică 2

Teoremă. Fie n21 X,...,X,X o selecţie de volum n dintr-o populaţie. Media de selecţie X este

un estimator nedeplasat şi consistent pentru media teoretică a populaţiei.

Consecinţă. Pentru orice repartiţie care depinde de un singur parametru valoarea acestuia

poate fi estimată din relaţia XXM (adică egalând media teoretică cu media de selecţie).

a) Pentru repartiţia Poisson Po avem XXM

b) Pentru repartiţia geometrică XXMp

1

c) Pentru repartiţia binomială Xp

d) Pentru repartiţia exponenţială X

Propoziţie. Dispersia de selecţie 2s*XD este un estimator deplasat pentru dispersia

teoretică 2 , iar dispersia modificată de selecţie este un estimator nedeplasat pentru 2 .

Metode de estimare punctuală a parametrilor

I Metoda momentelor

Teoremă. Fie X o variabilă aleatoare teoretică, fie n21 X,...,X,X o selecţie de volum n şi

n

1...

n

1

n

1

x...xx

*Xn21

variabila aleatoare de selecţie. Atunci *XM r sunt estimatori

eficienţi pentru XM r .

Metoda momentelor

Fie X o variabilă aleatoare teoretică cu densitatea de repartiţie IRIR:f , p1,...,,xff ,

unde p1,..., sunt parametrii necunoscuţi ce trebuie aflaţi. Fie n21 X,...,X,X o selecţie de

volum n şi

n

1...

n

1

n

1

x...xx

*Xn21

variabila aleatoare de selecţie. Pentru a afla p1,...,

rezolvăm sistemul

*XMXM

*XMXM

*XMXM

pp

22

11

pp

22

*XMXM

*XMXM

*XMXM

Observaţie. Din *XMXM şi 22 *XMXM obţinem *XDXD .

II Metoda verosimilităţii maxime

Definiţie. Fie X o variabilă aleatoare teoretică cu densitatea de repartiţie

IRIR:f , p1,...,,xff şi fie n21 X,...,X,X o selecţie de volum n. Definim funcţia de

Page 3: Estimarea Punctuala a Parametrilor

Statistică 3

verosimilitate IRIRIR:L pn ,

n

1j

p21jp21n21 ,..,,,xf,..,,,x,...,x,xL , ce

reprezintă probabilitatea de a obţine valorile nn2211 xX,...,xX,xX .

Teoremă.

Fie X o variabilă aleatoare teoretică cu densitatea de repartiţie IRIR:f , p1,...,,xff ,

unde p1,..., sunt parametrii necunoscuţi ce trebuie aflaţi. Fie n21 X,...,X,X variabile

aleatoare de selecţie independente, n21 x,...,x,x valorile concrete obţinute şi fie funcţia de

verosimilitate IRIRIR:L pn ,

n

1j

p21jp21n21 ,..,,,xf,..,,,x,...,x,xL . Cea mai

bună estimaţie a parametrilor p1,..., sunt valorile pentru care funcţia de verosimilitate are

valoarea maximă.

Propoziţie. Punctele de extrem ale funcţiei L coincid cu cele ale funcţiei Lln .

Practic

Găsim punctele critice ale funcţiei Lln rezolvând sistemul

0

,..,,,x,...,x,xLln

j

p21n21

, p,1j

apoi verificăm dacă soluţia găsită reprezintă un punct de maxim pentru Lln .

Probleme

1. Dintr-o populaţie statistică s-a făcut o selecţie de volum 80 care a dat următoarele rezultate.

Să se găsească un estimator nedeplasat pentru dispersia teoretică 2 .

xj 2.5 2.8 3 3.2

j 12 32 21 15

2. S-au cântărit 100 de piese şi s-au obţinut următoarele rezultate:

Greutatea (g) Frecvenţe absolute

[30; 30,5] 14

[30,5; 31] 30

[31; 31,5] 35

[31,5; 32] 21

Presupunem că variabila aleatoare teoretică asociată acestei caracteristici are o repartiţie

uniformă. Să se determine parametrii a şi b ai acestei repartiţii prin metoda momentelor.

3. O firmă are 10 utilaje care produc un anumit tip de piese. S-a înregistrat timp de 200 de

zile numărul utilajelor care prezintă defecţiuni şi s-au obţinut următoarele rezultate:

nr

utilaje

defecte

0 1 2 3 4 5 6 7 8 9 10

nr zile 40 38 32 20 18 12 8 6 2 1 0

Să se reprezinte grafic datele. Presupunând că datele urmează o repartiţie Poisson să se

estimeze parametrul . Care este probabilitatea ca într-o zi să fie defecte cel mult 3

utilaje?

Page 4: Estimarea Punctuala a Parametrilor

Statistică 4

4. Se consideră v.a. X cu densitatea de repartiţie 1,xf x , INx , 1,0 . Să

se estimeze parametrul prin metoda verosimilităţii maxime pe baza selecţiei care a dat

rezultatele : 8 10 9 8 7 10 9 10 8 9 9 8 10 7 9. Să se calculeze probabilitatea ca X să ia

cel mult valoarea 9.

5. Să se determine un estimator pentru parametrul al repartiției exponenţiale cu

densitatea de repartiţie

x

e1

,xf , 0 , 0x , pe baza unei selecţii de volum n

care a dat rezultatele 9 10 8 10 12 8 9 11 8 9 8.

6. Să se estimeze parametrii m şi ai repartiţiei normale pe baza unei selecţii de volum n

care a dat rezultatele:

jx 0 1 2 3 4 5

j 3 4 5 6 3 2

7. Fie v.a. continuă X cu densitatea de repartiţie IRIR:f ,

0x,0

0x,exk,xf

x3

Să se

determine parametrul k. Să se estimeze parametrul prin ambele metode de estimare

punctuală pe baza unei selecţii de volum n.