ki-kare İstatistiğiyunus.hacettepe.edu.tr/~dcaktan/ebb629_sunu/chapter16_ki_kare.pdf · ki-kare...
TRANSCRIPT
Ki-Kare İstatistiği
Kazanımlar • ki-kare testinin ne zaman uygun olduğunu
açıklamak 1
• ki-kare uyum iyiliğini kullanarak dağılımın şekli hakkında hipotez test etmek 2
• ki-kare bağımsızlık testini kullanarak değişkenler arasındaki ilişkiyi test etmek 3
• phi-katsayısı veya Cramer’s V ile etki büyüklüğünü bulmak 4
Parametrik ve parametrik olmayan istatistiksel testler • Parametrik testlerin varsayımları
– Verilerin evrende normal dağıldığı – Evrende varyansın homojenliği – Her bir birey için sayısal değer
• Parametrik olmayan testler parametrik testlerin varsayımlarının karşılanmadığı durumlarda kullanılırlar
ki-kare ve diğer parametrik olamayan testler • Hipotezleri belli bir evren parametresiyle ifade
etmezler • Evrenin dağılımı hakkında çok az
varsayımları vardır • Genellikle dağılımdan bağımsız tesler olarak
nitelenirler • Katılımcılar genellikle kategorilere ayrılırlar
– Adlandırma veya sıralama ölçekleri kullanılır – Parametrik olmayan testlerde veri frekans
verileridir
Uyum iyiliği için ki-kare Testi
• Evren dağılımının şekli veya oranı hakkında hipotezleri test etmek için örneklem verilerini kullanır.
• Örneklemden elde edilen oranlar ile evrende hipoteze göre öngörülen oranların uyumunu test eder.
Uyum iyiliği için Yokluk Hipotezi
• Evrendeki her bir kategorinin oranını (yüzdesini) belirler.
• Yokluk hipotezinin mantığı: – Kategoriler arasında tercih yoktur. – Bilinen bir evrendeki oranlarla diğer
evrendekiler arasında fark yoktur.
Göz rengi örnekleminin dağılımı n = 40
Uyum iyiliği testi için veri
• Örneklem verisinde, her bir kategorideki bireyler sayılır.
• Her bir kategorideki gözlenen frekanslar ölçülür.
• Herbir birey sadece tek bir kategoride sayılır.
Uyum iyiliği testinde beklenen frekanslar • Uyum iyiliği testi yokluk hipotezine dayanan
varsayımlarıyla gözlenen frekansları karşılaştırır.
• Yokluk hipotezine mükemmel uyan beklenen frekansları oluşturur.
• Beklenen frekanslar H0 ve örneklem büyüklüğünden tahmin edilen frekans değerleridir. – Ideal, hipothetik örneklem dağılımı
∑ −=
e
eo
fff 2
2 )(χ
ki-kare İstatistiği
• Notasyon – χ2 yunan alfabesindeki küçük harf “kay” dır (ki
okuyoruz)
– fo Gözlenen Frekans – fe Beklenen Frekans
• ki-kare İstatistiği
ki-kare dağılımı
• Yokluk Hipotezi – Beklenen ve gözlenen değerler arasındaki
farklar küçük ise rededilmez – Beklenen ve gözlenen değerler arasındaki
farklar büyük ise rededilir • ki-kare dağılımı H0 doğru ise olası mümkün
tüm tesadüfi örneklem değerlerini içeririr – Bütün ki-kare değerleri ≥ 0. – H0 doğru ise, ki-kare değerleri küçük olacaktır.
Serbestlik derecesi ve ki-kare
• ki-kare dağılımı sağa çarğıktır • ki-kare dağılımlar ailesini temsil eder
– Dağılımlar serbestlik derecesi ile belirlenir – Herbir df için az farklı dağılımlar vardır
• Uyum iyiliği testi için serbestlik derecesi – df = C – 1 – C kategorilerin sayısı
Figure 16.2 ki-kare dağılımı ve kritik bölge
Farklı df ler için ki-kare dağılımı
ki-kare Testi için Kritik Bölge
• Anlamlılık seviyesini belirler. • ki-karenin kritik değeri tabloda
– Serbestlik derecesine (df) – Seçilen anlamlılık düzeyine göre belirlenir
Kritik Bölge Örnek 16.1
Uyum iyiliği ve Tek-örneklem t Testi
• Her iki testtte bir evren hakkındaki hipotezi test etmede bir örneklemden gelen verileri kullanır
• Ölçek türü kullanılacak testi belirler: – Sayısal puanlar eşit aralık/oran ölçeği)
ortalamanın hesaplanması için uygundur ve t-testi kullanılır
– Sayısal olmayan kategorilere sınıflandırma (adlandırma ve sıralama ölçeği) oranları veya yüzdelerin hesaplanmasına uygundur ve bu verilere ki-kare testi uygulanır
Soru • ki-kare testinde beklenen frekanslar
______.
• Her zaman tam sayılardır A
• can contain fractions or decimal values B • can contain both positive and negative values C
• can contain fractions and negative numbers D
Cevap • The expected frequencies in a ki-kare test
______.
• are always whole numbers A
• can contain fractions or decimal values B • can contain both positive and negative values C
• can contain fractions and negative numbers D
Soru • Decide if each of the following statements
is True or False.
• ki-kare Testinde, beklenen ve gözlenen frekanslar her zaman tam sayılardır.
T/F
• büyük ki-kare değerleri yokluk hipotezinin reddedilmemesiyle sonuçlanır.
T/F
Cevap
• Gözlenen frekanslar kategorilerdeki bireylerin sayılarıdır. Bu nedenle tam sayıdır
True
• Large values of ki-kare indicate that the observed values were not very similar to what was predicted by the null hypothesis.
False
16.3 ki-kare bağımsızlık testi
• ki-kare istatistiği iki değişken arasında ilişkinin olup olmadığını test eder. – Herbir birey bir kategoride ele alınır – Sayılar tablodadaki hücrelere yazılır
• Örneklemden elde edilen frekans verisi evrendeki iki değişken arasındaki ilişkiyi test etmek için kullanılır.
Bağımsızlık testimde Yokluk hipotezi
• Yokluk hipotezi: iki değişken birbirinden bağımsızdır.
• İki durum sözkonusu – Tek evren: Bu evrendeki iki değişken arasında
ilişki yoktur. – İki farklı evren: İki evrendeki değişkenin
dağılımları arasında fark yoktur • Aralarında yordanabilen bir ilişki yoksa
değişkenler bağımsızdır.
Gözlenen ve beklenen frekanslar
• Örneklemdeki frekanslar testte gözlenen frekanslar olarak ifade edilirler.
• Beklenen frekanslar yokluk hipotezinde belirtilen (evrendeki) herbir kategorideki oranları belirtir.
Beklenen frekansların hesaplanması
– fc ilgilenilen sütundaki frekansların toplamı – fr ilgilenilen satırdaki frekanların toplamı
nfff rc
e =
∑ −=
e
eo
fff 2
2 )(χ
ki-kare bağımsızlık testi
• Formülü uyum iyiliği testindekinin aynısıdır • ki-kare
• Serbestlik derecesi df = (R-1)(C-1) – R satır sayısı – C sütun sayısı
16.4 ki-kare için etki büyüklüğü
• Ki-kare hipotez testi farkın şans eseri olmadığının bir göstergesidir. – Fakat etkinin büyüklüğü hakkında bilgi vermez
• 2x2 tablo için, fi (phi)-katsayısı Φ aradaki ilişkinin ölçüsünü verir
n
2χφ =
Daha büyük matrisler için etki büyüklüğü • Daha büyük matrisler için: Cramer’in V si kullanılır
• df* (R-1) veya (C-1) in küçük olanıdır
*)(
2
dfnV χ=
16.5 ki-kare Testlerinin sınırlıkları ve varsayımları • Gözlemlerin bağımsızlığı
– Her bir gözlem frekansı fdarklı bir bireyden gelir
• Beklenen frekansların büyüklüğü – ki-kare testi herhangi bir hücredeki beklenen
frekans 5 ten küçük olduğunda gerçekleştirilmemelidir.
Learning Check • A basic assumption for a ki-kare
hypothesis test is ______.
• the population distribution(s) must be normal A • the scores must come from an interval or
ratio scale B • the observations must be independent C • None of the other choices are assumptions
for ki-kare. D
Learning Check - Answer • A basic assumption for a ki-kare
hypothesis test is ______.
• the population distribution(s) must be normal A • the scores must come from an interval or
ratio scale B • the observations must be independent C • None of the other choices are assumptions
for ki-kare. D
Learning Check • Decide if each of the following statements
is True or False.
• The value of df for a ki-kare test does not depend on the sample size (n) T/F
• In the ki-kare test for independence, a positive value for the ki-kare statistic indicates a positive correlation between the two variables.
T/F