varyans analİzİ

18
VARYANS ANALİZİ İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden fazla örnek ortalamasını birlikte test etmek ve aralarındaki farkın önem kontrolünü yapmak mümkün değildir. İki veya daha fazla örnek ortalaması arasındaki farkın önemli olup

Upload: vahe

Post on 02-Feb-2016

169 views

Category:

Documents


7 download

DESCRIPTION

VARYANS ANALİZİ. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: VARYANS ANALİZİ

VARYANS ANALİZİİki örnek ortalaması arasındaki farkın önem

kontrolü, örnek büyüklüğüne göre z veya t

testlerinden biriyle yapılır. Bu testlerle, ikiden

fazla örnek ortalamasını birlikte test etmek ve

aralarındaki farkın önem kontrolünü yapmak

mümkün değildir. İki veya daha fazla örnek

ortalaması arasındaki farkın önemli olup

olmadığını test ederken varyans analizine

başvurulur.

Page 2: VARYANS ANALİZİ

Tek Yönlü Varyans Analizi(ANOVA)

Tek yönlü varyans analizi, iki ya da daha fazla

ortalamanın eşitliğini, varyansları kullanarak test

etmeye yarayan bir yöntemdir. Tamamen rassal

deney tasarımı modellerini analiz etmekte kullanılır.

Varsayımları:

• Örneklerin elde edildiği populasyonlar normal ya da

yaklaşık olarak normal dağılış gösterir.

•Örnekler bağımsızdır.

•Populasyon varyansları eşittir.

Page 3: VARYANS ANALİZİ

TEK YÖNLÜ VARYANS ANALİZİ

k adet anakütleden n hacimli bağımsız tesadüfi

örnekler seçildiğinde, bu örneklerin ortalamalarından

hareketle anakütle ortalamalarının birbirinden farklı

olup olmadığı test edilebilir. Öncelikle k adet

anakütleyi belirli kriterlere göre farklı işlem

gruplarına ayırmak gerekir. Bu sınıflama şeklinde,

veriler farklı işlem gruplarına ayrılırken işlem grubu

içersindeki veriler birbirinden bağımsız olur. Tek yönlü

sınıflama durumunda veriler aşağıdaki gibi gösterilir.

Page 4: VARYANS ANALİZİ

İşlemler1 2 … i … kX11 X21 … Xi1 … Xk1

X12 X22 … Xi2 … Xk2

.

.X1n X2n … Xin … Xkn

Toplam T1 T2 Ti Tk T

Ortalama1X 2X iX kX

X

X

Test Hipotezleri

Kurulabilecek sıfır hipotezi ve alternatif hipotez aşağıdaki gibi olur.

değildireşit birbirine ortalaması anakütle iki az :

...:

1

210

EnH

H k

Page 5: VARYANS ANALİZİ

Hipotezler

•H0: 1 = 2 = 3 = ... = c– Tüm populasyon

ortalamaları eşittir

(Tedavi etkisi yoktur)

•H1: Tüm j ler eşit değildir– Populasyonlardan en az

birinin ortalaması diğerlerininkinden farklıdır.

(Tedavi etkisi vardır)

X

f(X)

1 = 2 = 3

X

f(X)

1 = 2 3

Page 6: VARYANS ANALİZİ

Test İstatistiği:

Varyans analizinde temel amaç, ikiden fazla örnek için

lerin genel ortalama ’dan sapmalarının kareler

toplamını, bu sapmalara sebep olan unsurlar itibariyle

kısımlara ayırmak ve analiz etmektir.

Bu analiz sonunda, örnekler arasında uygunluk olup olmadığı

yani söz konusu örneklerin aynı anakütleye ait birer şans

örneği olup olmadıkları da ortaya konulmuş olur.

2

1 1

)( XXk

i

n

jij

iX

değerinin, yani örneklerdeki bütün değerlerinin genel ortalamadan gösterdikleri sapmaların kareler toplamının iki kaynağı vardır:

X

ijX

Page 7: VARYANS ANALİZİ

Toplam Değişkenliğin Sebepleri

Gruplar arası değişkenlik

Gruplar arası değişkenlik

Gruplar içi değişkenlik Gruplar içi

değişkenlik

Toplam Değişkenlik

Toplam Değişkenlik

Page 8: VARYANS ANALİZİ

2

1 1

2

1

2

1 1

)()()( i

k

i

n

jij

k

ii

k

i

n

jij XXXXnXX

)(

2

1 1

2

kn

TXGKT

k

i

n

jij

)(

21

2

kn

T

n

TGAKT

k

ii

n

TXGAKTGKTGİKT

k

iik

i

n

jij

1

2

1 1

2

Eşitliğin sol tarafındaki ifadeye genel kareler toplamı (GKT) denir.

Eşitliğin sağ kısmındaki ifadelerin birincisi örnek ortalamalarının

genel ortalamadan gösterdiği sapmalar, diğeri ise her bir örnekteki

değerlerin kendi örnek ortalamalarından gösterdiği sapmalardır.

Birincisine, gruplar arası kareler toplamı ( GAKT ), ikincisine grup içi

kareler toplamı ( GİKT ) denir.

Eşit örnekler durumunda

GKT GAKT GİKT

Page 9: VARYANS ANALİZİ

Gruplar arası kareler ortalaması s12 , gruplar içi kareler

ortalaması s22 bölünerek varyans analizinin test istatistiği

olan F değeri elde edilir.Eşit örnek hacimleri durumunda varyans analizi tablosu;

Değişim Kaynağı

Kareler Toplamı

Serbestlik Derecesi

Kareler Ortalaması

Test İstatistiği

İşlem GAKT v1=k-1

Hata GİKT v2= k(n-1)

Toplam GKT n(k)-1

121

k

GAKTs

)1(22

nk

GİKTs

22

21

s

sF

k:örnek sayısı

N:örnek büyüklüğü

Page 10: VARYANS ANALİZİ

Eşit olmayan örnekler durumunda, toplam gözlem sayısı N ile gösterilirse;

N

TXGKT

k

i

n

jij

2

1 1

2 N

T

n

TGAKT

k

i i

i2

1

2

k

i i

ik

iij n

TXGAKTGKTGİKT

1

2

1

2

Bu eşitliklerdeki üç varyasyon kaynağının her biri uygun bir

serbestlik derecesi ile bölünerek birer varyans elde edilir.Değişim Kaynağı

Kareler Toplamı

Serbestlik Derecesi

Kareler Ortalaması

Test İstatistiği

işlem GAKT v1=k-1

Hata GİKT v2= N-k

Toplam GKT N-1

121

k

GAKTs

kN

GİKTs

2

2 22

21

s

sF

Page 11: VARYANS ANALİZİ

KRİTİK DEĞER

Çeşitli önem seviyeleri ve örnek büyüklükleri için s12 / s2

2 nin

hangi noktaya kadar şansa verilebileceği, hangi noktadan

sonra önemli kabul edilerek örneklerin farklı anakütlelere ait

olduklarına hükmedilebileceği F cetvelleriyle tespit edilmiştir.

Hesaplanan F değeri, F tablosundan elde edilen kritik

değerden küçükse örnek ortalamaları arasındaki farklılık

tesadüfi; yani şanstan ileri gelmiştir ve örnekler aynı

anakütleye aittir.

Page 12: VARYANS ANALİZİ

Hesaplanan test istatistiği , kritik değerden büyükse örnek

ortalamaları arasındaki farklılığın önemli olduğuna

hükmedilir ve bu örneklerin farklı anakütlelere ait

olduklarına karar verilir.

F değeri, iki varyansın birbirine bölümü olduğu için negatif

değer almaz.

Bu yüzden F dağılımı sağa çarpıktır. H0 hipotezinin red bölgesi

eğrinin sağ ucunda yer alır.

Page 13: VARYANS ANALİZİ

ÖRNEK 1

Bir üretimden n=5 büyüklüğündeki k = 4 örnekten aşağıdaki sonuçlar elde edilmiştir. % 5 önem seviyesine göre örnek ortalamaları arasındaki farkın önemli olup olmadığını ; bir başka deyişle, üretimin kontrol altında olup olmadığını varyans analizi ile kontrol ediniz.

I II III IV

1 10 11 16 12

2 10 10 13 10

3 11 10 15 14

4 12 9 16 13

5 12 10 15 11

Ti55 50 75 60

Ti2 3025 2500 5625 3600

T=240

T2=57600

k=4

n=5

Page 14: VARYANS ANALİZİ

değildireşit birbirine ortalaması anakütle iki az :

:

1

0

EnH

H IVIIIIII

115

55IX 10

5

50IIX 15

5

75IIIX 12

5

60IVX

2972111314...1212111010 22222222

1 1

2

k

i

n

jijX

22

1 1

576002972 92

( ) 5(4)

k n

iji j

TGKT X

n k

70)4(5

57600

5

3600562525003025

)(

21

2

kn

T

n

TGAKT

k

ii

22295029721

2

1 1

2

n

TXGAKTGKTGİKT

k

iik

i

n

jij

Page 15: VARYANS ANALİZİ

Değişim Kaynağı

Kareler Toplamı

Serbestlik Derecesi

Kareler Ortalaması

Test İstatistiği

işlem

(GAKT)

70 v1=4-1

Hata

(GİKT)

22 v2= 4(5-1)

Toplam

(GKT)

92 5(4)-1

333.233

7021 s

375.116

2222 s 97.16

375.1

333.23F

önem seviyesi , v1 =3 ve v2 = 16 sd. göre Ftab= 3.24

Test istatistiği , kritik değerden ( Ftab= 3.24) büyük olduğu için % 5 önem seviyesinde H0 hipotezini red ederek en az iki örnek ortalamasının birbirinden farklı olduğuna karar verilir. Bu durum üretimin kontrol altında olmadığı kanaatini uyandırır.

05.0

97.16F

Page 16: VARYANS ANALİZİ

ÖRNEK 2

Üç pil fabrikasında üretilen pillerin ortalama ömrünü mukayese

etmek isteyen bir araştırmacı aşağıdaki verileri elde etmiştir. Bu

verilere göre pillerin ortalama ömürleri arasında önemli bir

farklılığın olup olmadığını % 1 önem seviyesinde test ediniz.

I II III

222 226 220

224 228 221

226 228 222

227 227 224

226 220

222

Ti1125 909 1329 T=3363 T2 =11309769

k=3

N=15

Page 17: VARYANS ANALİZİ

değildireşit birbirine ortalaması anakütle iki az :

:

1

0

EnH

H IIIIII

2255

1125IX 25.227

4

909IIX 5.221

6

1329IIIX

754099222220224...226224222 222222

1 1

2

k

i

n

jijX

4.11415

11309769754099

2

1 1

2 N

TXGKT

k

i

n

jij

75.7540686

1329

4

909

5

1125 222

1

2

k

i i

i

n

T

25.3075.7540687540991

2

1

2

k

i i

ik

iij n

TXGAKTGKTGİKT

15.8415

1130976975.754068

2

1

2

N

T

n

TGAKT

k

i i

i

Page 18: VARYANS ANALİZİ

Değişim Kaynağı

Kareler Toplamı

Serbestlik Derecesi

Kareler Ortalaması Test İstatistiği

işlem

(GAKT)

84.15 v1=3-1

Hata 30.25 v2= 15-3

Toplam 114.40 15-1

075.422

15.8421 s

521.212

25.3022 s 69.16

521.2

075.42F

önem seviyesi , v1 =2 ve v2 = 12 sd. göre Ftab= 6.93

Test istatistiği , kritik değerden ( Ftab= 6.93) büyük

olduğu için % 1 önem seviyesinde H0 hipotezini red ederek en

az iki örnek ortalamasının birbirinden farklı olduğuna

karar verilir. En az iki fabrikada üretilen pillerin ortalama

dayanma süreleri birbirine eşit değildir.

01.0

69.16F