ki kare testi

37
Ki kare testi Ki kare analizi, χ 2 , parametrik olmayan bir analiz olup, tek değişkenli ve çift değişkenli olmak üzere iki türü bulunmaktadır. Özünde uyum iyiliğini ölçen χ 2 , gözlem değerlerinin, beklenen değerlerden farklı olup olmadığını test eder. Gözlenen her olayın aslında, teorik ya da beklenen bir değeri vardır.

Upload: murat-akin

Post on 08-Aug-2015

239 views

Category:

Documents


11 download

TRANSCRIPT

Page 1: Ki Kare Testi

Ki kare testi

Ki kare analizi, χ2, parametrik olmayan bir analiz olup, tek değişkenli ve çift değişkenli olmak üzere iki türü bulunmaktadır. Özünde uyum iyiliğini ölçen χ2, gözlem değerlerinin, beklenen değerlerden farklı olup olmadığını test eder. Gözlenen her olayın aslında, teorik ya da beklenen bir değeri vardır.

Page 2: Ki Kare Testi

Ki kare testi

• Ki kare testi, daima iki yönlü bir test olup, tek yönlü alternatif hipotezi kullanılmaz. Buna karşılık, aynı problemin çözümünde kullanılan “iki grupta Z testi” iki yönlü test olabileceği gibi, tek yönlü olarak da oluşturulabilir.

• Ki kare testi bir ilgi testidir. Diğer parametrik olmayan testlerin aksine medyanla değil ortalamayla (mean) ilgilenir.

Page 3: Ki Kare Testi

Testin varsayımları• Rasgele örneklem; eğer örneklemin belirlenmesinde taraf tutulmadı

ise, rasgele örnekleme çok önemli değildir.• Frekans veri; veriler sıklık verisi şeklinde olmalıdır. Bir diğer

ifadeyle, analiz edilen her bir durumdaki denekler sayılabilmelidir. Veriler normal dağılmıyor ve parametrik test varsayımları ihlal ediliyorsa kategorikleştirmek uygun olabilir.

• Bağımsız gözlemler; • Bütün gözlemleri ihtiva eden birbirinden tamamen bağımsız satır ve

sütün kategorileri; hiçbir gözlemin birden fazla kategoriye dahil edilmemesi gerekir. Meslek sorusuna cevap veren doktor hem devlet hastanesinde hem de özel muayenehanesinde hasta kabul ediyorsa iki farklı kategoride yer alması gerekir. Bu durumda bu veriye bağımsız iki veriyi karşılaştırmak için ki kare testi uygulanamaz.

Page 4: Ki Kare Testi

Testin varsayımları

• Bu testin belki de en fazla özen gösterilmesi gereken varsayımı ise;

• Yeterli büyüklükte beklenen frekanslar; ki kare tablolarında, hücrelerin toplamının % 20’si 5 ve 5’ten küçük gözlenen değer içermemelidir.

• Gözlenen değerlerin 5’ten küçük olması durumunda uygulanabilecek başka çözümler bulunmaktadır. Bunlar;

• Daha büyük veri seti kullanılabilir.• Devamlı düzeltmeli ki kare istatistiği veya çoğunlukla aynı

anlamada kullanılan “Yates Düzeltmeli Ki Kare istatistiği” kullanılabilir.

• Fisher Kesin Ki Kare Testi de uygulanabilir. • Satır ve sütün birleştirilebilir.

Page 5: Ki Kare Testi

Hipotezler

• Ki kare testi bir ilgi ve farklılık analizidir. Değişkenler arasında anlamlı bir ilginin ya da homojenliğin olup olmadığını gösterir. Bunu yaparken de gözlenene ve beklenen değerlerin karşılaştırmasını yapar.

• H0: Bağımlı değişken ile bağımsız değişken arasında anlamlı bir farklılık yoktur.

• H1: Bağımlı değişken ile bağımsız değişken arasında anlamlı bir farklılık vardır.

Page 6: Ki Kare Testi

Kritik değer ve İhtimalin Hesaplanması

• Ki Kare testinde de diğer bütün testlerde olduğu gibi % 95 güven aralığı ve % 5 hata payı ile çalışılacaktır. Kritik değerimizi belirlerken Ki Kare tablosundan faydalanılacaktır. Ki kare tablosuna bakabilmek için ise, serbestlik derecesinin (sd) bilinmesi gerekmektedir.

• Tekli karşılaştırmada; sd = n -1 formülünden faydalanılırken, • Çiftli karşılaştırmada ise; sd= (s -1) (s – 1) formülünden faydalanılır.• Bulunan tablo değeri; H0 hipotezinin ret ve kabul sınırının

belirlemesine yardımcı olacaktır.

Page 7: Ki Kare Testi

Hesaplanması

• Ki kare değerinin hesaplanması;• Χ2= ∑ (Oij – Eij)2 / Eij

• Oij: i’inci satır ve j’inci sütundaki gözlenen değerler.

• Eij: i’inci satır ve j’inci sütundaki beklenen değerler.

• Beklenen değerin hesaplanmasında ise;• Eij = (i’inci satır x j’inci sütun) / (satır veya

sütün toplamı)

Page 8: Ki Kare Testi

Karar

• Karar aşamasında ise; hesaplanan değerle tablo değerinin kıyaslaması yapılır. Tablo değeri hesaplanan değerden büyükse H0 kabul, küçükse H0 ret edilecektir.

Page 9: Ki Kare Testi

Kararın Grafik Üzerinde Gösterimi

Page 10: Ki Kare Testi

Örnek

• Bol kepçe lokantası haftada beş gün çalışmaktadır. Sahibi, bu beş günde gelen müşteri sayısının aynı olup olmadığını öğrenerek, yemek miktarını ayarlamak istemektedir. Bu amaçla, beş günde gelen müşterilerin sayısını hesaplamış ve 220, 200, 250, 210, 220 kişi olduğunu tespit etmiştir. Beş günde gelen müşterilerin sayısı istatistiki yönden farklı mıdır?

Page 11: Ki Kare Testi

Hipotezin belirlenmesi

• H0: Beş günde gelen müşterilerin sayısı farklı değildir.

• H1: Beş günde gelen müşterilerin sayısı farklıdır.

• Beş günde gelmesi beklenen müşteri sayısı, bu gözlemlerin ortalamasıdır. (220+200+250+210+220) / 5 = 1100 / 5 = 220

• Χ2= [(220-220)2+(200-220)2+(250-220)2+(210-220)2+(220-220)2] / 220 = 6,36

Page 12: Ki Kare Testi

Kritik Değer ve İhtimalin Belirlenmesi

• sd= n – 1= 5 – 1= 4 olarak serbestlik derecesi bulunur. Tabloda sd sütunda, hata payı ise satırda yer almaktadır. 4 ile 0,05’in kesiştiği noktadaki değer bizim kritik değerimizi yani H0 hipotezimizin ret ve kabul sınırlarını verecektir. Bu değer; 9,49 olarak tablodan okunmuştur.

Page 13: Ki Kare Testi

Karar

• 9,49 tablo değeri ile hesapladığımız değer olan 6,36 değerinin karşılaştırılması sonucunda hipotez testi sonuçlandırılacaktır. Buna göre;

• 9,49>6,36 olduğu için H0 hipotezimiz kabul edilecektir.

Page 14: Ki Kare Testi

Karar

• Grafikte de görüldüğü üzere hesaplanan değer tablo değerinden daha küçük bir değer olduğu için kabul alanı içerisinde yer almaktadır.

Page 15: Ki Kare Testi

Örnek

• Tüketim malları üreten A ve B firmaları eşit Pazar payına sahiptirler. A firmasının yöneticileri devamlı müşteriye sahip olma açısından firmalarının en önde geldiğine inanmaktadırlar. Bunu test etmek amacıyla yapılan araştırma için A firması tüketicilerinden 223 kişi, B firması tüketicilerinden 262 kişi seçilmiştir. Sonuçta, A firması tüketicilerinin % 56’sının (125 kişi), B firması tüketicilerinin % 75’inin (197 kişi) devamlı tüketici olduğu ortaya çıkmıştır. Buna göre A firması yöneticilerinin inançları hakkında ne söylenebilir.

Page 16: Ki Kare Testi

Hipotezler

• H0: A firması ile B firması arasında devamlı tüketiciler açısından bir fark yoktur.

• H1: A firması ile B firması arasında devamlı tüketiciler açısından bir fark vardır.

Page 17: Ki Kare Testi

Frekans Veri

Devamlı Tüketiciler

Devamlı Olmayan

Tüketiciler

Toplam

A Firması 125

148,1

98

74,95223

B Firması 197

173,95

65

88,1262

Toplam 322 163 485

Page 18: Ki Kare Testi

Beklenen Değerin Hesaplanması

• E11: 223x322/485 = 148,1

• E12: 163x223/485 = 74,95

• E21: 322x262/485 = 173,95

• E22: 163x262/485 = 88,1

• Χ2= (125-148,1)2/148,1+(98-74,95)2/74,95+(197-173,95)2/173,95+(65-88,1)2/88,1=19,803

Page 19: Ki Kare Testi

Kritik değerin belirlenmesi

• Kritik değerin belirlenmesi aşamasında Ki kare tablosundan faydalanılacaktır. Bunun için öncelikle sd değerinin bilinmesi gerekir.

• sd= (s-1) (s-1) = (2 – 1) (2 – 1)=1

• 0,05’e tekabül eden ki kare değeri ise; 3,84 olarak bulunur.

Page 20: Ki Kare Testi

Karar

• Bu aşamada yapılması gereken tablo değeri ile hesaplanan değerin karşılaştırılmasının yapılmasıdır.

• 3,84<19,803 olduğu için H1 hipotezi kabul edilecektir. Yani, A ve B firmaları arasında tüketicinin devamlılığı açısından bir farklılık vardır.

Page 21: Ki Kare Testi

Örnek

• Yönetici olarak kadınlar mı, yoksa erkeklerin mi daha fazla başarı gösterdikleri araştırılmak istenmektedir. Bu amaçla 69 kişilik bir örnek üzerinde araştırma yapılmıştır. 69 kişinin 45’i erkek ve 24’ü kadın yöneticilerden oluşmaktadır. Bu kadın ve erkek yöneticilere bayan yöneticilerin mi yoksa erkek yöneticilerin mi daha başarılı oldukları “Evet – Hayır” şeklinde sorulmuştur.

Page 22: Ki Kare Testi

Frekans veri

• Cevaplayıcıların verdikleri soruların bayan ve erkek yöneticiler arasındaki dağılımı şu şekilde gerçekleşmiştir.

Cinsiyet

Başarı

Bayan Erkek Toplam

Evet 15 16 31

Hayır 45 24 69

Toplam 60 40 100

Page 23: Ki Kare Testi

Hipotezler

• H0: Yöneticilerin başarısıyla cinsiyet arasında anlamlı bir ilgi yoktur.

• H1: Yöneticilerin başarısıyla cinsiyet arasında anlamlı bir ilgi vardır.

Page 24: Ki Kare Testi

Kritik değer

• Kritik değerin belirlenmesi aşamasında Ki kare tablosundan faydalanılacaktır.

• sd= (2-1) (2-1) = 1

• Tablo değeri 3,84 olarak tablodan okunur.

• Bundan sonra yapılacak iş ise, beklenen değerin hesaplanması ve ardından da ki kare değerinin hesaplanmasıdır.

Page 25: Ki Kare Testi

Frekans Veri ve Beklenen Değer

BASARI * CINSIYET Crosstabulation

45 24 69

41,4 27,6 69,0

15 16 31

18,6 12,4 31,0

60 40 100

60,0 40,0 100,0

Count

Expected Count

Count

Expected Count

Count

Expected Count

Evet

Hayır

BASARI

Total

Erkek Bayan

CINSIYET

Total

Page 26: Ki Kare Testi

Test İstatistik

Chi-Square Tests

2,525b 1 ,112

1,872 1 ,171

2,499 1 ,114

,127 ,086

2,499 1 ,114

100

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Computed only for a 2x2 tablea.

0 cells (,0%) have expected count less than 5. The minimum expected count is12,40.

b.

Page 27: Ki Kare Testi

Tabloda yer alan ifadelerin anlamı

• Pearson değeri; hesaplamalar elle yapıldığında elde edilen sonuçtur. Bu değere göre anlamlılık seviyesi P=0,112 olarak tablodan okunmaktadır. 0,05 den daha büyük olduğu için H0 hipotezi kabul edilecektir. Böylece, erkekler ve kadınlar arasında yöneticilik başarısı açısından anlamlı bir ilginin olmadığı sonucuna ulaşılır.

• Sıfır hipotezi ret edilmiş olsa idi. İlişkinin tabiatını ortaya koymak için, ileri analiz tekniklerini kullanmak gerekirdi.

Page 28: Ki Kare Testi

• Devamlılık düzeltmesi (continuity correction), çoğunlukla Yates düzeltmesi olarak da bilinir. 2x2’lik düzende, hücrelerden birinde 5’ten küçük beklenen frekans olduğunda, örneklem sayısı arttırılarak araştırma yenilenemiyorsa, Yates düzeltmeli ki kare istatistiği kullanılabilir.

• Ancak, düzeltme uygulaması ki kare analizinin gücünü zayıflatır. Pearson değeri 0,112 bulunmuşken Yates düzeltmeli ki kare değerinin anlamlılık düzeyi 0,171 olarak görülmektedir.

• Örneğimizde minimum beklenen frekans 12,4 olduğu için Pearson sonucu kullanılır. Bu değer 5’ten küçük olsa idi bu takdirde devamlılık düzeltmesi değeri kullanılırdı.

Page 29: Ki Kare Testi

• İhtimal oranı (likelihood ratio), ki kare istatistiği, maksimum ihtimal teorisine dayanır. Örneklem büyük olduğunda, “ihtimal oranı”, Pearson istatistiğine çok benzer.

• Fisher’s Exact Test Linear by Linear Association, bu test Pearson korelasyon katsayısı ile ölçülen iki değişken arasındaki ilişkiye dayanır. Nominal veri için uygun değildir.

Page 30: Ki Kare Testi

Symmetric Measures

,159 ,112

,159 ,112

,157 ,112

100

Phi

Cramer's V

Contingency Coefficient

Nominal byNominal

N of Valid Cases

Value Approx. Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the nullhypothesis.

b.

Page 31: Ki Kare Testi

• Nominal veriler için uygun olan testler.

• Phi, iki değişken arasındaki ilişkiyi ölçmede kullanılır. Phi katsayısı, sadece ki kare önemli olduğunda kullanılması uygundur. Örneğimizde yöneticilik başarısıyla cinsiyet arasında önemli bir ilişki olmadığı için, Phi kullanılmamalıdır.

• Kullanılması uygun olduğunda bir ilişki gücü ölçütü olarak yorumlanır. Bir başka ifadeyle, bu iki değişken arasındaki ilişki 0,1589’dur. Bu da ilişkinin zayıf olduğunu göstermektedir. Phi katsayısı 0 – 1 arasında değer alır ve 0 yaklaştıkça ilişkin zayıf olduğu 1’e yaklaştıkça ise ilişkinin güçlü olduğu şeklinde yorumlanır. Araştırmalar arasındaki mukayeselerde kullanılabilir. Örneklem büyüklüğüne daha az hassastır. 1’den büyük değer aldığında kullanılma faydası azalır.

Page 32: Ki Kare Testi

• Olağanlık katsayısı (Contingency Coefficient), iki nominal seviyesi olan değişkenler arasındaki ilişkiyi ölçmede kullanılır. Söz konusu katsayı, parametrik olmayan teknik olup, parametrik korelasyon katsayısını kestirme şekli değildir. Her tablo büyüklüğünde kullanılabilir. 0- 1 arasında değer alır ama hiçbir zaman 0 ya da 1 olmaz. Ancak katsayı, hücre sayısından etkilenir. 2x2’lik tablolarda maksimum değeri 0,707 iken, 4x4’lük tabloda 0,87 dir. Tablo büyüdükçe maksimum değeri 1’e yaklaşır. Araştırmalar arasındaki karşılaştırmalarda kullanılacak ise, eşit sayıda satır ve sütün olmasına dikkat edilmelidir.

Page 33: Ki Kare Testi

• Cramer’s V Oranı; Phi katsayısının değişik bir türüdür. Ki kare tablosunun 2x2 den büyük olduğu durumlarda kullanılır. İlişkinin olup olmadığını gösterir. Ama ilişkinin nasıl bir ilişki olduğu konusunda bilgi vermez. 0 – 1 arası değer alır.

Page 34: Ki Kare Testi

Directional Measures

,014 ,078 ,180 ,857

,000 ,000 ,c ,c

,025 ,137 ,180 ,857

,025 ,032 ,114d

,025 ,032 ,114d

,019 ,024 ,790 ,114e

,020 ,025 ,790 ,114e

,019 ,023 ,790 ,114e

Symmetric

BASARI Dependent

CINSIYET Dependent

BASARI Dependent

CINSIYET Dependent

Symmetric

BASARI Dependent

CINSIYET Dependent

Lambda

Goodman andKruskal tau

Uncertainty Coefficient

Nominal byNominal

ValueAsymp.

Std. Errora

Approx. Tb

Approx. Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Cannot be computed because the asymptotic standard error equals zero.c.

Based on chi-square approximationd.

Likelihood ratio chi-square probability.e.

Page 35: Ki Kare Testi

• Lambda, tahmini hata oranında meydana gelen azalmayı ölçer.

• Lambda 0 – 1 arasında değişir. • 0 değeri, bağımsız değişken hakkında bilgi sahibi

olmanın, bağımlı değişkenin tahmin hatasını azaltmada faydası olmadığını belirtir. Diğer bir ifadeyle; bağımsız değişkenin, bağımlı değişkeni önceden kestirmek için yardımcı olmayacağı anlamına gelir.

• 1 ise mükemmel olup, doğru tahminin yapıldığını gösterir. Bir diğer ifadeyle, bağımsız değişkenin bağımlı değişkenin her kategorisini mükemmel belirlediğini gösterir. Mükemmellik ancak her satırdaki hücrenin sıfırdan büyük olması durumunda oluşur.

• İki değişken bağımsız ise lambda 0 olur. Ancak, lambdanın 0 olması istatistiksel bağımsızlığı ima etmez.

Page 36: Ki Kare Testi

• Belirli bir ki kare tablosunda üç farklı lambda hesaplanabilir. Simetrik lambda yanında, iki simetrik olmayan, tek yönlü lambda hesaplanır.

• Örneğimizde, başarı bağımlı değişken olduğunda, bağımsız değişken olan cinsiyet bilgisi tahmin hatasının azaltılmasına hiç katkısı olmamıştır. Çünkü bu durumda, lambda 0,0000 bulunmuştur. Diğer taraftan başarı durumu bilindiğinde, araştırmaya dahil kişilerin cinsiyetini tahmin etmek istediğimizde, hata oranı 0,025 yani %2,5 azalır.

• Değişkenler arasında karşılıklı bir ilişki mevcut ise, simetrik lambda hesaplanabilir. Ancak, çift yönlü bir ilişki olduğunda, simetrik lambdaya bakmak gerekir. Bu durumda, lambda 0,01408 bulunur.

Page 37: Ki Kare Testi

• Asymp. Std. Error, asimptotik standart hata olup, güven aralığının oluşturulmasında kullanılabilir.

• Goodman&Kruskal Tau, nominal ölçümlerdeki asimetrik ilişkiyi ölçer. Bazen değişkenler arasında bir bağlantı varsa bile, lambda 0 olabilir. Bu durumda Goodman&Kruskal Tau ölçütünü kullanmak gerekir. Örneğimizde bağımlı değişken, ister başarı, ister cinsiyet olsun, tahmin hatası %2,5’tir.

• Belirsizlik katsayısı (Uncertanity Coefficiant), bağımlı değişkendeki belirsizliğin ne kadarının bağımsız değişken bilgisi tarafından azaltıldığını ölçer. Söz konusu katsayı, 0 – 1 arasında yer alır. 0 tamamen belirsizliği ifade ederken, 1 ise tamamen belirliliği ifade eder.