teória štatistického odhadu (to)

1

Teória štatistického odhadu (TO)

Rozlišujeme:

1. Bodový odhad

2. Intervalový odhad

Podstatou teórie odhadu je neznáme parametre základného súboru odhadovať pomocou výberových charakteristík

2

Bodový odhadZákladom bodového odhadu je odhadnúť parameter G základného súboru pomocou údajov z výberového súboru, tj. pomocou výberovej charakteristiky un . Parameter pritom odhadujeme jedným číslom, (jedným bodom) odtiaľ názov bodový odhad tj.:

un = G resp. nestG učo čítame : estimátorom (odhadom ) parametra G je un .

Výberová charakteristika je náhodná premenná, ktorej hodnoty sa menia v závislosti od toho, ktoré jednotky základného súboru tvoria výberový súbor. Rozdiel medzi G a un definuje chybu odhadu tj.:

nn uGu

Prirodzenou požiadavkou je, aby chyba odhadu bola čo najmenšia. To dosiahneme vtedy ak výberová charakteristika spĺňa základné vlastnosti bodových odhadov.

3

K odhadu charakteristiky G základného súboru nevolíme teda akúkoľvek štatistiku, ale takú štatistiku, ktorá spĺňa určité kritéria – vlastnosti . Uvedieme tie najdôležitejšie:

1. Neskreslenosť2. Konzistentnosť3. Výdatnosť4. Postačujúcnosť

4

1. neskreslenosť

Najdôležitejšou vlastnosťou je aby zvolená štatistika neviedla k systematickému nadhodnocovaniu či podhodnocovaniu, tj. aby neviedla k systematickým chybám. Požadujeme teda, aby stredná hodnota výberovej štatistiky bola rovná odhadovanej charakteristike. Ak platí:

nazývame výberovú štatistiku neskresleným (nevychýleným, nestranným) odhadom charakteristiky základného súboru. Rozdiel:

nazývame skreslením (vychýlením). Ak pri rastúcich rozsahoch výberu sa skreslenie stráca tj.:

hovoríme o asymptoticky neskreslenom odhade.

( )nE u G

nu

( )nE u G

lim ( ) 0nnE u G

5

2. konzistencia

tj výberová charakteristika un je konzistentným odhadom parametra G základného súboru, ak sa so zväčšovaním rozsahu výberového súboru výberová charakteristika blíži parametru G.

Podmienka konzistencie teda vyjadruje požiadavku, aby s rastúcim rozsahom výberu rástla aj pravdepodobnosť toho, že použitá štatistika un sa bude líšiť od skutočnej hodnoty parametra základného súboru G len veľmi málo ε > 0. tj.:

lim 1nnP u G

6

3. výdatnosť tj. výdatným odhadom parametra G základného súboru nazývame takú charakteristiku un , ktorej rozptyl je zo všetkých výberových charakteristík poskytujúcich neskreslený odhad parametra G najmenší.

4. postačujúcnosť

Výberová štatistika je postačujúcou, ak okrem nej neexistuje žiadna iná štatistika, ktorá by poskytovala ďalšie doplňujúce informácie o odhadovanej charakteristike základného súboru

7

K bodovému odhadu parametrov základného súboru najčastejšie využívame tieto metódy:

- metóda momentov- metóda maximálnej vierohodnosti- metóda najmenších štvorcov.

8

Na základe vlastností, ktoré musí spĺňať výberová charakteristika, platí, že výberový priemer , je, neskresleným konzistentným a výdatným odhadom strednej hodnoty základného súboru , čo zapíšeme:

x

est x a čítame: estimátorom (bodovým odhadom) strednej hodnoty základného súboru je výberový priemer . Ak odhadujeme priemer základného súboru výberovým priemerom dopúšťame sa chyby odhadu, ktorú definujeme:

xun

pričom jej veľkosť nevieme presne určiť. Ale môžeme odhadnúť tzv. štandardnú chybu odhadu, ktorá predstavuje priemernú veľkosť chýb odhadov pri mnohokrát opakovaných výberoch daného rozsahu. Štandardnú chybu pri známej štandardnej odchýlke základného súboru a rozsahu výberového súboru vypočítame

n

x

9

Avšak štandardnú odchýlku základného súboru často nepoznáme, preto nemôžeme štandardnú chybu výberového priemeru určiť presne, a tak ju odhadujeme pomocou výberovej štandardnej chyby odhadu výberového priemeru , ktorú definujeme

xs

n

sxs 1

1

s

n

10

Pre rozptyl základného súboru platí, že jeho bodovým odhadom

(neskresleným konzistentným a výdatným), je výberový rozptyl tj.:2 2

1est s čo čítame: estimátorom (bodovým odhadom) rozptylu základného súboru je výberový rozptyl , ktorý vypočítame podľa vzťahu

n

ii xx

ns

1

221 1

1

Pre štandardnú odchýlku základného súboru platí, že jej bodovým odhadom, (neskresleným konzistentným a výdatným), je výberová štandardná odchýlka

čo čítame: estimátorom, (bodovým odhadom) štandardnej odchýlky základného súboru je výberová štandardná odchýlka , ktorú vypočítame ako odmocninu s výberového rozptylu

Skutočnosť, že pri bodových odhadoch dochádza k výberovým chybám, veľkosť ktorých nie je možné presne určiť, vedie k tomu, že sa bodové odhady dopĺňajú o intervalové odhady

1est s

211 ss

12

Intervalové odhadyIntervalovým odhadom parametra G základného súboru sa nazýva taký odhad, kedy sa odhadovaný parameter nachádza s pravdepodobnosťou v intervale , tj.:1

121 gGgP

Interval sa nazýva interval spoľahlivosti. Hranice g1 a g2 sú funkcie výberovej charakteristiky un . Ak sú hranice intervalu spoľahlivosti konečné čísla definujeme pravdepodobnosť

22 gGP 11 gGP

tj. pravdepodobnosť, že parameter základného súboru G je menší ako g1 sa rovná a pravdepodobnosť, že prekročí hodnotu g2 sa rovná . Súčet pravdepodobností označuje pravdepodobnosť, že parameter

základného súboru G nie je z intervalu spoľahlivosti a nazýva sa riziko odhadu

( riziko podhodnotenia, riziko nadhodnotenia)

1 221

12

13

)( nuf

1

2

1-

g1 g2

Riziko odhadu a interval spoľahlivosti

14

Pravdepodobnosť sa nazýva koeficient spoľahlivosti alebo jednoducho spoľahlivosť odhadu, a je hladina významnosti. Za predpokladu, že koeficient spoľahlivosti je číslo blízke jednej, možno s určitosťou tvrdiť, že parameter základného súboru je z intervalu spoľahlivosti.

Zvyšovaním spoľahlivosti sa však súčasne interval spoľahlivosti rozširuje, čím sa znižuje presnosť odhadu - a naopak, so znižovaním spoľahlivosti sa interval spoľahlivosti zužuje, čím sa zvyšuje presnosť odhadu. Bodový odhad potom môžeme považovať za extrémny prípad intervalového odhadu s nulovou šírkou intervalu ( odhad je síce presný ale stráca na spoľahlivosti ).

1

Pri praktických výpočtoch najčastejšie zostavujeme intervaly spoľahlivosti obojstranné, ak je parameter základného súboru ohraničený zdola aj zhora, kedy aj sú rôzne od nuly. O symetrickom intervale hovoríme vtedy ak riziko nadhodnotenia aj podhodnotenia je rovnaké (v ďalšom texte sa budeme zaoberať len symetrickými intervalmi),

15

Intervalový odhad strednej hodnoty

x

ux

1)( 2121 u

x

xuP

1))(.)(.( 2121 xuxxuxP

21 u je kvantil normovaného normálneho rozdelenia / normsinv (1-α/2)

16

1xxP

Intervalový odhad je možné zapísať v tvare

prípustná chyba odhadu predstavujúca polovicu šírky symetrického intervalu spoľahlivosti a je daná výrazom:

n

uxu .. 2121

b.) ak nepoznáme rozptyl základného súboru a n >30 má veličina u tvar

x

us x

1)( 2121 u

xs

xuP

17

1))(.)(.( 2121 xstxxstxP

1xxP

n

st 1

21 .alebo 1 2

1

st

n

c.) ak nepoznáme rozptyl základného súboru

a n je menší ako 30 má veličina tvar

1 2 1 2( . ( ) . ( )) 1P x u s x x u s x

n

uxu .. 2121

1 2t Kvantil studentovho rozdelenia / tinv(α,n – 1)

x

ts x

19

Od čoho závisí veľkosť prípustnej chyby ??

1. od zvolenej spoľahlivosti odhadu (1- )2. strednej - štandardnej chyby priemeru, ktorá je ovplyvnená:

- variabilitou znaku – nevieme ju ovplyvniť- veľkosťou výberového súboru, ktorý ovplyvniť môžme!

2

212

/2-1

s u n

Potrebný rozsah súboru pri vopred zvolenej spoľahlivosti a požadovanej presnosti môžme určiť nasledovne:

20

Intervalový odhad rozptylu a štandardnej odchýlky

1)1

( 2212

212

2

snP

1)11

(2

2

212

221

21 snsn

P

22 je dolný kvantil / chiinv(α/2, n – 1)

221 je horný kvantil /chiinv(1-α/2, n – 1) rozdelenia z (n-1) stupňami

voľnosti

2

Pri konštrukcii intervalu spoľahlivosti z veličiny:

212

2

1n s

21

1112

2

21

221

21 snsn

P

2

teória štatistického odhadu (to)

Documents