osnove teorije uzoraka - fsb online...osnove teorije uzoraka testiranje hipoteza za proporcije...
TRANSCRIPT
Inženjerska statistika
Osnove teorije uzoraka
Osnove teorije uzoraka
Inženjerska statistika
Osnove teorije uzoraka
• Osnove teorije uzoraka
UZORAK: slučajni, reprezentativni dio osnovnog skupa – populacije
2
1 1
2
2 2
2
1.uzorak: , ,
2.uzorak: , ,
.uzorak: , ,i i
n x
n x
i n x
Uzorci:
Inženjerska statistika
Osnove teorije uzoraka
Razdioba aritmetičke sredine uzorka
osnovni skup:
aritm. sredina uzorka:
2
0( ) ;N E x
2( ) ;N xE x
Raspon osnovnog skupa
2x
3x
4x
5x
6x
,x x
( )
( )
f x
f xrazdioba
aritmetičke
sredine uzorka
osnovni
skup
x1
Inženjerska statistika
Osnove teorije uzoraka
Nepristrane procjene parametara osnovnog skupa
Pojam nepristrane procjene:
neka varijabla nepristrano procjenjuje parametar
osnovnog skupa Θ ako vrijedi:
( )E
( ) ( )E x E x
2 2
0( )E
2 2
0( )E s
dakle: uzorka nepristrano procjenjuje očekivanja osn.
skupa
dakle: varijanca uzorka nije nepristrana procjena
varijance osnovnog skupa
dakle: varijabla nepristrano procjenjuje
varijancu osnovnog skupa
2 2
1
ns
n
x
Inženjerska statistika
Osnove teorije uzoraka
Standardna pogreška aritmetičke sredine uzorka
• Pomoću varijable s2 određuje se
• VAŽNO:
k = (n – 1)... broj stupnjeva slobode uzorka od n podataka
2
x
22 0 0
22
x x
x x
n n
s ss s
n n
2
2 1
( )
1
n
i
i
x x
sn
standardna pogreška
ar. sredine
Inženjerska statistika
Osnove teorije uzoraka
Intervalna procjena očekivanja osnovnog skupa
2
2 (1 2)
1
21
( )2
x x
x
z
x z x z
xz
f z e
xz
interval povjerenja
(vjerodostojnosti)
varijabla
standardizirane
normalne razdiobe
1
2
2
2x 1 2x
x
( )f x
1 2 30–1–2–3 z
f(z)
Inženjerska statistika
Osnove teorije uzoraka
Važno:
• Veliki uzorci: n > 30 elemenata, podataka
– vrijednost varijable z → iz standardizirane normalne razdiobe
• Mali uzorci: n ≤ 30 elemenata, podataka
– koristiti Studentovu t-razdiobu
Studentova t-razdioba
• simetrična
• za velike uzorke se ne
razlikuje od normalne razdiobe
t
f(t) N 0,1
Studentova t-razdioba sa
k = n – 1 stupanj slobode
Inženjerska statistika
Osnove teorije uzoraka
Konačno:
• Za velike uzorke
Koristiti standardiziranu
(jediničnu) normalnu
razdiobu
• Za male uzorke
Koristiti Studentovu t-
razdiobu s parametrom k =
n – 1
( 2) (1 2)
s sx z x z
n n
( ; 2) ( ;1 2)k k
s sx t x t
n n
... 0,1varijabla Nz ... varijabla Studentove
t-razdiobe
t
Inženjerska statistika
Osnove teorije uzoraka
Primjer:
• Podaci utvrđeni u nekom procesu:52.1, 49.0, 51.4, 50.0, 50.3, 49.6, 50.6, 50.8, 51.0, 51.7
Intervalno procijeniti očekivanje osnovnog skupa iz kojeg potječe uzorak, uz
interval vjerodostojnosti 1 – = 0,95 (95%)
• Rezultati dobiveni računanjem, iz uzorka:
n = 10; = 50,65; s = 0.96x
( 2) (1 2)
0.96 0.9650.65 2.262 50.65 2.262
10 10
49.96 51.34 uz P 0,95 (95%)
s sx t x t
n n
Inženjerska statistika
Osnove teorije uzoraka
Opaska
• U slučaju kada je poznata standardna devijacija osnovnog skupa, nije nužno
korištenje Studentove t-razdiobe kao ni nepristrane procjene standardne
pogreške
• U tom je slučaju:
• Za prethodni primjer:
ako prihvatimo da je standardna devijacija osnovnog skupa , slijedi:
( 2) (1 2)x z x zn n
1 150.65 1.96 50.65 1.96
10 10
50.03 51.27 uz P 0,95 (95%)
1
Inženjerska statistika
Osnove teorije uzoraka
Intervalna procjena proporcija
• Uzorkovanje nekog dvoslojnog osnovnog skupa (populacije) u
kojem neki događaj ima proporciju P rezultiralo bi slučajnom
varijablom p, tj. proporcijom istog događaja ali u uzorku:
Vrijedi:
( 2) (1 2)p pp z s P p z s
uz povjerenje (vjerodostojnost)
procjene (1 – )
1
2
2
( )f p
pP1p
2p
( ) ; pN E p P
Inženjerska statistika
Osnove teorije uzoraka
• Važne pretpostavke:
– proporcija uzorka
– sp ... nepristrana procjena standardne pogreške proporcije
uzorka:
– n ... veličina uzorka
– VRIJEDI SAMO ZA VELIKE UZORKE (n → 100)
( )( ) ; pp N E p P
, 1p
p qs q p
n
Inženjerska statistika
Osnove teorije uzoraka
Intervalna procjena varijance
• Varijance (osobito malih) uzoraka ne rasipaju se normalno oko varijance
osnovnog skupa
• Vrijedi (K. Pearson, 1857.–1936.)
– varijabla rasipa se prema 2 razdiobi s
k = n – 1 stupanj slobode 2
2 2
( 2) (1 2)2
0
n
uz vjerojatnost (1 – )2( )E k
k = n – 1
1
2
( 2) 2
(1 2)
2( )f k = 1 k = 5 k = 10
k = 15
220
2 22
2 21 10 0
( )n ni
i i
x x n
Inženjerska statistika
Osnove teorije uzoraka
Konačno:
2 22
02 2
(1 2) ( 2)
,n n
uz razinu povjerenja (1 – )
Inženjerska statistika
Osnove teorije uzoraka
Testiranje statističkih hipoteza
• T.S.H. predstavlja postupak donošenja odluke na bazi uzorka
• uzorak, n podataka: x1, x2, ... , xn
• rezultati se uzorka mogu shvatiti kao točka u
n-dimenzionalnom prostoru
• prostor se može podijeliti na dva međusobno disjunktna dijela (koji
se isključuju), dio A i dio B
U praksi: umjesto n-dimenzionalnog modela
služimo se jednodimenzionalnim varijablama
(uglavnom).
dio B
(odbacivanje H0)
dio A
(prihvaćanje H0)
Inženjerska statistika
Osnove teorije uzoraka
• Postavimo dvije hipoteze
H0: nulta hipoteza
H1: alternativna hipoteza
– Ako se točka T kao realizacija uzorka nađe u dijelu A,
smatramo hipotezu H0 ispravnom i prihvaćamo je
– Ako se točka T kao realizacija uzorka nađe u dijelu B,
smatramo hipotezu H0 neispravnom i odbacujemo je
dio B
(odbacivanje H0)
dio A
(prihvaćanje H0)
Inženjerska statistika
Osnove teorije uzoraka
Pogreške pri testiranju hipoteza
• Očito: pri uporabi opisanog modela moguće su pogreške
• Uzrok pogrešaka: slučajnost odabira elemenata uzorka!
• Vrste pogrešaka:
– Pogreška 1. vrste nastaje odbacivanjem nulte hipoteze H0 (i prihvaćanjem alternativne hipoteze H1) iako je hipoteza H0
ispravna:• Vjerojatnost pogreške 1. vrste:
– Pogreška 2. vrste nastaje prihvaćanjem hipoteze H0 u uvjetima ispravnosti alternativne hipoteze H1
• Vjerojatnost pogreške 2. vrste:
0 POGREŠNO ODBACIVANJE HIPOTEZE HoP T B H
1 POGREŠNO PRIHVAĆANJE HIPOTEZE HoP T A H
Inženjerska statistika
Osnove teorije uzoraka
Jakost testa
• Jakost (moć) testa predstavlja vjerojatnost odbacivanja
nulte hipoteze kada je uistinu neispravna:
• očito: + p = 1 p = 1 – ISPRAVNO
ODBACIVANJE Ho
1p B H P T
Inženjerska statistika
Osnove teorije uzoraka
Hipoteza Ho
Stanje
ISTINITA NEISTINITA
O
D
L
U
K
A
Odbaciti
Pogreška
1. vrste
ISPRAVNO
Prihvatiti ISPRAVNO
Pogreška
2. vrste
Inženjerska statistika
Osnove teorije uzoraka
Testiranje hipoteza za očekivanje
• Uzorak – osnovni skup, hipoteze
• Razdioba aritmetičke sredine uzorka
– Studentova razdioba s k = n – 1 st. slob.
1
2
2
2x 1 2x
x
( )f x
1
2
2
0t
( )f t
t00t
k = n – 1 ss
0
1
:
: – dvostrani test
H x
H x
1
1
:
:
– jednostrani
testovi
H x
H x
Pogodna jednodimenzionalna varijabla:
Ako je odbaciti Ho, uz
vjerojatnost pogreške 1. vrste
x
xt
s
... varijabla Studentove
t-razdiobe, k = n – 1
stup. slobode
. 0račt t
Hipoteze:
Inženjerska statistika
Osnove teorije uzoraka
Primjer:
• Podaci iz primjera za intervalnu procjenu očekivanja n = 10; = 50.65; s = 0.96;
• Provjeriti hipotezu da je riječ o podacima skupa čije je očekivanje 51.5 jedinica,
naprama alternativnoj hipotezi
• Vjerojatnost pogreške 1. vrste neka iznosi 0.05 ( = 0.05)
0 1: 51.5 : 51.5 ( 51.5)H x H x
.
50.65 51.50 0.852.7997
0.96 0.3036
10
račt
0.05
( )f t
t00 1.833t
. 2.7997račt
Zaključak:
. 0 0ODBACITIračt t H
51.5
x
Inženjerska statistika
Osnove teorije uzoraka
Provjera hipoteza uzorak – uzorak
• 1. skup: očekivanje 1, varijanca 201
1. uzorak: n1 podataka,
• 2. skup: očekivanje 2, varijanca 202
2. uzorak: n2 podataka,
Hipoteze:
1
2 2
1 1, , xx s s
2
2 2
2 2, , xx s s
0 1 2
1 1 2
1 1 2
1 1 2
:
:
:
:
H
H
H
H
1 1 2,x x
1( )f x
2( )f x
2
Inženjerska statistika
Osnove teorije uzoraka
• aritmetička sredina svakog od uzoraka rasipat će se oko očekivanja
skupa iz kojeg uzorak potječe
• njihova razlika rasipat će se oko veličine
• pretpostavimo li da je hipoteza Ho istinita, ,
varijabla d će se rasipati oko 0.
1 2d x x
1 2D 1 2
2
2
( )f d
d0
Inženjerska statistika
Osnove teorije uzoraka
• pri tome je standardna pogreška varijable d:
• varijabla pogodna za testiranje nulte hipoteze:
2 2
1 2
1 2
2 2
1 1 2 2 1 2
1 2 1 2
( 1) ( 1)
2
d
d
s ss
n n
n s n s n ns
n n n n
... za uzorke s n1 + n2 – 2 ≤ 30
... za uzorke s n1 + n2 – 2 > 30,
i ako se n1 i n2 znatno razlikuju
1 2
.rač
d
x xt
s
... varijabla Studentove t-razdiobe
s k = n1 + n2 – 2 s. s.
Ako odbaciti Ho, uz vjerojatnost
pogreške 1. vrste .. 0račt t
2
2
0t
( )f t
t00t
k = n1 + n2 – 2
Inženjerska statistika
Osnove teorije uzoraka
Testiranje hipoteza za proporcije
(atributivne podatke)
• slučaj: uzorak – osn. skup
– osnovni dvoslojni skup s
proporcijom P elementa sa
svojstvom A.
– uzorak n elemenata s
proporcijom p
– važno: E(p) = P
– rasipanje proporcije p oko
proporcije P ima standardnu
pogrešku:
• slučaj: uzorak – uzorak
– osnovni skupovi
– uzorci
– nulta hipoteza:
– alternativna hip.:
p
p qs
n
1. skup, proporcije P1 2. skup, proporcije P2
n1 pod., proporcija p1
n2 pod., proporcija p2
0 1 2
1 1 2
1 1 2
2 1 2
:
:
:
:
H P P
H P P
H P P
H P P
Inženjerska statistika
Osnove teorije uzoraka
– varijabla za testiranje hipoteze
Ho : P
– razlika d = p1 – p2 rasipa se oko
E(d) = 0, ako pretpostavimo
istinitost nulte hipoteze
– varijabla pogodna za testiranje
nulte hipoteze: 0,1var. razdiobe N
p
p Pz
s
Vrijedi samo za VELIKE uzorke
tj. n 100
1 2
1 2
1 2
1 1 2 2
1 2
(1 )
d
d
p pz
s
n ns p p
n n
n p n pp
n n
Zaključak:
Ako . ( )račz z o ODBACITI H
Inženjerska statistika
Osnove teorije uzoraka
Usporedba (testiranje) varijanci
• 1. Osnovni skup: očekivanje 1, varijanca 201
nepristrana procjena varijance
• 2. Osnovni skup: očekivanje 2, varijanca 202
nepristrana procjena varijance
• Nulta hipoteza: naprama alternativnoj
• Varijabla
…varijabla F-razdiobe s kb = n1 – 1 s.s. i kn = n2 – 1 s.s.
2
1s
2
2s
2 2
0 01 02
2 2
1 01 02
:
:
H
H
2
1
2
2
sF
s
Inženjerska statistika
Osnove teorije uzoraka
Ako: Frač. > F0 odbaciti Ho
Konvencija:
Tipično: = 0.05; 0.01
2 2
1 2s s
VAŽNO: Svakom testu aritmetičkih sredina mora prethoditi provjera značajnosti
razlika među varijancama
• F-razdioba: utemeljio G. Snedecor (1881.–1934.)
• Naziv F-razdioba u čast R. Fishera (1890.–1962.)
( )f F
kb; kn
1
FF0