ki-kare İstatistiğiyunus.hacettepe.edu.tr/~dcaktan/ebb629_sunu/chapter16_ki_kare.pdf · ki-kare...

Click here to load reader

Post on 23-Aug-2020

0 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Ki-Kare İstatistiği

  • Kazanımlar • ki-kare testinin ne zaman uygun olduğunu

    açıklamak 1

    • ki-kare uyum iyiliğini kullanarak dağılımın şekli hakkında hipotez test etmek 2

    • ki-kare bağımsızlık testini kullanarak değişkenler arasındaki ilişkiyi test etmek 3

    • phi-katsayısı veya Cramer’s V ile etki büyüklüğünü bulmak 4

  • Parametrik ve parametrik olmayan istatistiksel testler • Parametrik testlerin varsayımları

    – Verilerin evrende normal dağıldığı – Evrende varyansın homojenliği – Her bir birey için sayısal değer

    • Parametrik olmayan testler parametrik testlerin varsayımlarının karşılanmadığı durumlarda kullanılırlar

  • ki-kare ve diğer parametrik olamayan testler • Hipotezleri belli bir evren parametresiyle ifade

    etmezler • Evrenin dağılımı hakkında çok az

    varsayımları vardır • Genellikle dağılımdan bağımsız tesler olarak

    nitelenirler • Katılımcılar genellikle kategorilere ayrılırlar

    – Adlandırma veya sıralama ölçekleri kullanılır – Parametrik olmayan testlerde veri frekans

    verileridir

  • Uyum iyiliği için ki-kare Testi

    • Evren dağılımının şekli veya oranı hakkında hipotezleri test etmek için örneklem verilerini kullanır.

    • Örneklemden elde edilen oranlar ile evrende hipoteze göre öngörülen oranların uyumunu test eder.

  • Uyum iyiliği için Yokluk Hipotezi

    • Evrendeki her bir kategorinin oranını (yüzdesini) belirler.

    • Yokluk hipotezinin mantığı: – Kategoriler arasında tercih yoktur. – Bilinen bir evrendeki oranlarla diğer

    evrendekiler arasında fark yoktur.

  • Göz rengi örnekleminin dağılımı n = 40

  • Uyum iyiliği testi için veri

    • Örneklem verisinde, her bir kategorideki bireyler sayılır.

    • Her bir kategorideki gözlenen frekanslar ölçülür.

    • Herbir birey sadece tek bir kategoride sayılır.

  • Uyum iyiliği testinde beklenen frekanslar • Uyum iyiliği testi yokluk hipotezine dayanan

    varsayımlarıyla gözlenen frekansları karşılaştırır.

    • Yokluk hipotezine mükemmel uyan beklenen frekansları oluşturur.

    • Beklenen frekanslar H0 ve örneklem büyüklüğünden tahmin edilen frekans değerleridir. – Ideal, hipothetik örneklem dağılımı

  • ∑ −=e

    eo

    fff 22 )(χ

    ki-kare İstatistiği

    • Notasyon – χ2 yunan alfabesindeki küçük harf “kay” dır (ki

    okuyoruz)

    – fo Gözlenen Frekans – fe Beklenen Frekans

    • ki-kare İstatistiği

  • ki-kare dağılımı

    • Yokluk Hipotezi – Beklenen ve gözlenen değerler arasındaki

    farklar küçük ise rededilmez – Beklenen ve gözlenen değerler arasındaki

    farklar büyük ise rededilir • ki-kare dağılımı H0 doğru ise olası mümkün

    tüm tesadüfi örneklem değerlerini içeririr – Bütün ki-kare değerleri ≥ 0. – H0 doğru ise, ki-kare değerleri küçük olacaktır.

  • Serbestlik derecesi ve ki-kare

    • ki-kare dağılımı sağa çarğıktır • ki-kare dağılımlar ailesini temsil eder

    – Dağılımlar serbestlik derecesi ile belirlenir – Herbir df için az farklı dağılımlar vardır

    • Uyum iyiliği testi için serbestlik derecesi – df = C – 1 – C kategorilerin sayısı

  • Figure 16.2 ki-kare dağılımı ve kritik bölge

  • Farklı df ler için ki-kare dağılımı

  • ki-kare Testi için Kritik Bölge

    • Anlamlılık seviyesini belirler. • ki-karenin kritik değeri tabloda

    – Serbestlik derecesine (df) – Seçilen anlamlılık düzeyine göre belirlenir

  • Kritik Bölge Örnek 16.1

  • Uyum iyiliği ve Tek-örneklem t Testi

    • Her iki testtte bir evren hakkındaki hipotezi test etmede bir örneklemden gelen verileri kullanır

    • Ölçek türü kullanılacak testi belirler: – Sayısal puanlar eşit aralık/oran ölçeği)

    ortalamanın hesaplanması için uygundur ve t-testi kullanılır

    – Sayısal olmayan kategorilere sınıflandırma (adlandırma ve sıralama ölçeği) oranları veya yüzdelerin hesaplanmasına uygundur ve bu verilere ki-kare testi uygulanır

  • Soru • ki-kare testinde beklenen frekanslar

    ______.

    • Her zaman tam sayılardır A

    • can contain fractions or decimal values B • can contain both positive and negative values C

    • can contain fractions and negative numbers D

  • Cevap • The expected frequencies in a ki-kare test

    ______.

    • are always whole numbers A

    • can contain fractions or decimal values B • can contain both positive and negative values C

    • can contain fractions and negative numbers D

  • Soru • Decide if each of the following statements

    is True or False.

    • ki-kare Testinde, beklenen ve gözlenen frekanslar her zaman tam sayılardır.

    T/F

    • büyük ki-kare değerleri yokluk hipotezinin reddedilmemesiyle sonuçlanır.

    T/F

  • Cevap

    • Gözlenen frekanslar kategorilerdeki bireylerin sayılarıdır. Bu nedenle tam sayıdır

    True

    • Large values of ki-kare indicate that the observed values were not very similar to what was predicted by the null hypothesis.

    False

  • 16.3 ki-kare bağımsızlık testi

    • ki-kare istatistiği iki değişken arasında ilişkinin olup olmadığını test eder. – Herbir birey bir kategoride ele alınır – Sayılar tablodadaki hücrelere yazılır

    • Örneklemden elde edilen frekans verisi evrendeki iki değişken arasındaki ilişkiyi test etmek için kullanılır.

  • Bağımsızlık testimde Yokluk hipotezi

    • Yokluk hipotezi: iki değişken birbirinden bağımsızdır.

    • İki durum sözkonusu – Tek evren: Bu evrendeki iki değişken arasında

    ilişki yoktur. – İki farklı evren: İki evrendeki değişkenin

    dağılımları arasında fark yoktur • Aralarında yordanabilen bir ilişki yoksa

    değişkenler bağımsızdır.

  • Gözlenen ve beklenen frekanslar

    • Örneklemdeki frekanslar testte gözlenen frekanslar olarak ifade edilirler.

    • Beklenen frekanslar yokluk hipotezinde belirtilen (evrendeki) herbir kategorideki oranları belirtir.

  • Beklenen frekansların hesaplanması

    – fc ilgilenilen sütundaki frekansların toplamı – fr ilgilenilen satırdaki frekanların toplamı

    nfff rce =

  • ∑ −=e

    eo

    fff 22 )(χ

    ki-kare bağımsızlık testi

    • Formülü uyum iyiliği testindekinin aynısıdır • ki-kare

    • Serbestlik derecesi df = (R-1)(C-1) – R satır sayısı – C sütun sayısı

  • 16.4 ki-kare için etki büyüklüğü

    • Ki-kare hipotez testi farkın şans eseri olmadığının bir göstergesidir. – Fakat etkinin büyüklüğü hakkında bilgi vermez

    • 2x2 tablo için, fi (phi)-katsayısı Φ aradaki ilişkinin ölçüsünü verir

    n

    2χφ =

  • Daha büyük matrisler için etki büyüklüğü • Daha büyük matrisler için: Cramer’in V si kullanılır

    • df* (R-1) veya (C-1) in küçük olanıdır

    *)(

    2

    dfnV χ=

  • 16.5 ki-kare Testlerinin sınırlıkları ve varsayımları • Gözlemlerin bağımsızlığı

    – Her bir gözlem frekansı fdarklı bir bireyden gelir

    • Beklenen frekansların büyüklüğü – ki-kare testi herhangi bir hücredeki beklenen

    frekans 5 ten küçük olduğunda gerçekleştirilmemelidir.

  • Learning Check • A basic assumption for a ki-kare

    hypothesis test is ______.

    • the population distribution(s) must be normal A • the scores must come from an interval or

    ratio scale B • the observations must be independent C • None of the other choices are assumptions

    for ki-kare. D

  • Learning Check - Answer • A basic assumption for a ki-kare

    hypothesis test is ______.

    • the population distribution(s) must be normal A • the scores must come from an interval or

    ratio scale B • the observations must be independent C • None of the other choices are assumptions

    for ki-kare. D

  • Learning Check • Decide if each of the following statements

    is True or False.

    • The value of df for a ki-kare test does not depend on the sample size (n) T/F

    • In the ki-kare test for independence, a positive value for the ki-kare statistic indicates a positive correlation between the two variables.

    T/F

    � Ki-Kare İstatistiğiKazanımlarParametrik ve parametrik olmayan � istatistiksel testlerki-kare ve diğer parametrik olamayan testlerUyum iyiliği için ki-kare TestiUyum iyiliği için Yokluk HipoteziGöz rengi örnekleminin dağılımı n = 40 Uyum iyiliği testi için veriUyum iyiliği testinde beklenen frekanslarki-kare İstatistiğiki-kare dağılımıSerbestlik derecesi ve ki-kareFigure 16.2 ki-kare dağılımı� ve kritik bölgeFarklı df ler için ki-kare dağılımı ki-kare Testi için Kritik BölgeKritik Bölge Örnek 16.1 Uyum iyiliği ve Tek-örneklem t TestiSoruCevapSoruCevap16.3 ki-kare bağımsızlık testiBağımsızlık testimde Yokluk hipoteziGözlenen ve beklenen frekanslarBeklenen frekansların hesaplanmasıki-kare bağımsızlık testi16.4 ki-kare için etki büyüklüğüDaha büyük matrisler için etki büyüklüğü16.5 ki-kare Testlerinin sınırlıkları ve varsayımlarıLearning CheckLearning Check - AnswerLearning Check