analisis data kategori

55
ANALISIS DATA KATEGORI Eni Sumarminingsih

Upload: marc

Post on 29-Jan-2016

66 views

Category:

Documents


0 download

DESCRIPTION

ANALISIS DATA KATEGORI. Eni Sumarminingsih. Distribusi Multinomial. Misalnya terdapat c kategori pada variabel respon . Peluangnya dinotasikan {  1 , 2 ,…, c } di mana 1. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: ANALISIS DATA KATEGORI

ANALISIS DATA KATEGORIEni Sumarminingsih

Page 2: ANALISIS DATA KATEGORI

Distribusi Multinomial

• Misalnya terdapat c kategori pada variabel respon. Peluangnya dinotasikan {1 ,2 ,…,c} di mana 1.

• Untuk n sampel, peluang Multinomial bahwa n1 jatuh pada kategori1, n2 jatuh pada kategori 2,…, nc jatuh pada kategori c di mana

Page 3: ANALISIS DATA KATEGORI

Distribusi Multinomial

Page 4: ANALISIS DATA KATEGORI

Regresi Logistik MultinomialRegresi Logistik yang melibatkan variabel respon dengan kategori lebih dari dua dengan skala nominal yaitu tidak memiliki tingkatan serta variabel prediktor yang bersifat kategori dan atau kontinyu disebut sebagai regresi logistik multinomial

Page 5: ANALISIS DATA KATEGORI

Suatu variabel respon dengan M kategori akan membentuk persamaan logit sebanyak M-1 di mana masing-masing persamaan ini membentuk regresi logistik biner yang membandingkan suatu kelompok kategori terhadap kategori pembanding

Page 6: ANALISIS DATA KATEGORI

Secara umum model multinomial logit adalah

Page 7: ANALISIS DATA KATEGORI

Jika yang digunakan sebagai pembanding adalah kategori M, maka ξM = 0 untuk

di mana p adalah banyaknya variabel prediktor, sehingga transformasi logitnyamenjadi,

Page 8: ANALISIS DATA KATEGORI
Page 9: ANALISIS DATA KATEGORI

Multinomial Logit dengan 3 Kategori Respon

Dalam model regresi logistik dengan 3 kategori Y (Y=0,1,2),dibutuhkan 2 fungsi logit dan harus diputuskan kategori respon mana yang menjadi kategori pembandingMisal Y=0 sebagai kategori pembanding untuk membentuk 2 logit (yaitu sebagai pembandinguntuk Y=1 dan Y=2) maka

Page 10: ANALISIS DATA KATEGORI

Menurut Hosmer dan Lemeshow (2000) untuk mendapatkan model, asumsikan terdapat p variabel prediktor dan n sampel yang dinotasikan sebagai vektor X dengan matrik berukuran n x (p+1)di mana X0=1. Dua fungsi logit dinotasikan sebagai:

Page 11: ANALISIS DATA KATEGORI
Page 12: ANALISIS DATA KATEGORI
Page 13: ANALISIS DATA KATEGORI
Page 14: ANALISIS DATA KATEGORI

Bentuk Umum fungsi peluang dengan 3 kategori respon

Page 15: ANALISIS DATA KATEGORI

• Secara teori, model dengan 3 kategori peubah respon akan menghasilkan dua fungsi logit.

• Sebenarnya dapat digunakan pasangan kategori pembanding yang mana saja tergantung dari tujuan yang ingin dicapai dalam penelitian, tetapi menurut Hosmer dan Lemeshow (2000) lebih baik menggunakan kategori 0 sebagai pembanding karena merupakan perluasan dari model dengan dua

• kategori variabel respon (biner).

Page 16: ANALISIS DATA KATEGORI

Pendugaan Parameter

• Pendugaan parameter dari model logit menggunakan metode maksimum likelihood

• Untuk membuat fungsi likelihood pada model dengan kategori respon lebih dari 2 (misalnya 3 kategori) hal pertama yang dilakukan adalah membuat 3 variabel biner yang dikode 0 atau 1 untuk menandai group membership (anggota kelompok) pada suatu observasi

Page 17: ANALISIS DATA KATEGORI

• Dalam kasus ini 3 variabel biner tersebut hanya untuk menjelaskan fungsi likelihood dan bukan digunakan untuk analisis regresi logistik multinomial yang sebenarnya

Page 18: ANALISIS DATA KATEGORI
Page 19: ANALISIS DATA KATEGORI
Page 20: ANALISIS DATA KATEGORI
Page 21: ANALISIS DATA KATEGORI
Page 22: ANALISIS DATA KATEGORI
Page 23: ANALISIS DATA KATEGORI
Page 24: ANALISIS DATA KATEGORI
Page 25: ANALISIS DATA KATEGORI
Page 26: ANALISIS DATA KATEGORI
Page 27: ANALISIS DATA KATEGORI
Page 28: ANALISIS DATA KATEGORI

Pengujian Terhadap Pendugaan Parameter

a. Pengujian pendugaan parameter () secara parsialUji koefisien regresi secara parsial digunakan untuk memeriksa peranan koefisien regresi dari masing-masing variabel prediktor secara individu dalam model. Hipotesis yang digunakan adalah:

Page 29: ANALISIS DATA KATEGORI

Pengujian Terhadap Pendugaan Parameter

Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

Page 30: ANALISIS DATA KATEGORI

Pengujian Terhadap Pendugaan Parameter

Page 31: ANALISIS DATA KATEGORI

Pengujian Terhadap Pendugaan Parameter

Page 32: ANALISIS DATA KATEGORI

Pengujian Terhadap Pendugaan Parameter

Page 33: ANALISIS DATA KATEGORI

Pengujian Terhadap Pendugaan Parameter

Page 34: ANALISIS DATA KATEGORI

Pengujian Terhadap Pendugaan Parameter

Page 35: ANALISIS DATA KATEGORI

Interpretasi Koefisien regresi logistik

• Interpretasi dalam regresi logistik menggunakan nilai odds ratio yang menunjukkan perbandingan tingkat kecenderungan dari kategori yang ada dalam satu variabel prediktor.

• Nilai odds ratio pada respon multinomial menggunakan notasi umum yang digunakan dalam respon biner.

Page 36: ANALISIS DATA KATEGORI

• Misalnya Y=0 digunakan sebagai kategori pembanding, odd ratio untuk Y=j terhadap Y=0 yang dihitung pada dua nilai

adalah

Page 37: ANALISIS DATA KATEGORI

• pada regresi logistik politomus dengan tiga kategori respon akan terbentuk dua odds ratio.

• Yang pertama perbandingan peluang antara respon kategori 1 (Y=1) dengan respon kategori pembanding (Y=0)

• Yang kedua adalah perbandingan peluang antara respon kategori 2 (Y=2) dengan respon kategori pembanding (Y=0).

Page 38: ANALISIS DATA KATEGORI
Page 39: ANALISIS DATA KATEGORI

Koefisien Determinasi

Page 40: ANALISIS DATA KATEGORI

Contoh

Suatu penelitian ingin mengetahui berapa peluang seseorang terkena PJK (Penyakit Jantung Koroner), PJK disertai hipertensi danPJK disertai hipertensi serta diabetes mellitus. Adapun faktor – faktor yang diduga mempengaruhi terjadinya PJK dan komplikasinyaadalah usia, tekanan darah sistole, tekanan darah diastole, kolesterol, HDl, LDL dan Trigliserid. Variabel Respon:

Page 41: ANALISIS DATA KATEGORI

Y= 0 (PJK), Y= 1 (PJK disertai hipertensi), Y= 2 (PJK disertai hipertensi dan diabetes mellitus).Variabel Prediktor:X1 = Usia (tahun) X2 = Tekanan darah sistole (mmHg)X3 = Tekanan darah diastole (mmHg)X4 = Kolesterol (mg/dl)X5 = HDL (mg/dl)

Page 42: ANALISIS DATA KATEGORI

X6 = LDL (mg/dl)X7 = Trigliserid (mg/dl)

Page 43: ANALISIS DATA KATEGORI

Model regresi logistik multinomial setelah dilakukan transformasi adalah sebagai berikut:• Model regresi logistik yang pertama

Page 44: ANALISIS DATA KATEGORI

Model regresi logistik yang kedua adalah

Page 45: ANALISIS DATA KATEGORI

Nilai odds ratio model regresi logistik pertama

Page 46: ANALISIS DATA KATEGORI

Interpretasi untuk model logistik pertama, • Untuk variabel X1 diperoleh nilai odds ratio

sebesar 1.109, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar 1.109 kali.

• Untuk variabel X2• dengan nilai odds ratio sebesar 9.318 berarti

dengan bertambahnya 1• 57• mmHg tekanan darah sistole akan

meningkatkan peluang orang• tersebut terkena penyakit jantung koroner

sekaligus hipertensi• sebesar 9.318 kali, sedangkan untuk

bertambahnya 1 mmHg tekanan• darah diastole (X3) akan meningkatkan resiko

terkena penyakit• jantung serta hipertensi sebesar 9.309 kali.

Untuk variabel kolesterol• (X4), mengindikasikan bahwa dengan

menurunnya 1 mg/dl kadar• kolesterol akan menurunkan resiko terkena

penyakit jantung koroner• sekaligus hipertensi sebesar 0.749 kali. Untuk

kenaikan 1 mg/dl• kadar HDL (X5) akan meningkatkan resiko

terkena PJK serta• hipertensi sebesar 1.704 kali. Sedangkan

untuk penurunan 1 mg/dl• kadar LDL dan kadar trigliserid dapat

mengurangi resiko terkena• PJK disertai hipertensi berturut turut sebesar

0.488 kali dan 0.895• kali.

Page 47: ANALISIS DATA KATEGORI

• Untuk variabel X2 dengan nilai odds ratio sebesar 9.318 berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar 9.318 kali,

• sedangkan untuk bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit

• jantung serta hipertensi sebesar 9.309 kali.

Page 48: ANALISIS DATA KATEGORI

• Untuk variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligus hipertensi sebesar 0.749 kali.

• Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK serta hipertensi sebesar 1.704 kali.

Page 49: ANALISIS DATA KATEGORI

• Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi berturut turut sebesar 0.488 kali dan 0.895 kali.

Page 50: ANALISIS DATA KATEGORI

Nilai odds ratio model regresi logistik kedua

Page 51: ANALISIS DATA KATEGORI

• Interpretasi untuk model logistik kedua, untuk variabel X1 diperoleh nilai odds ratio sebesar 2.659, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner disertai hipertensi dan diabetes mellitus (DM) sebesar 2.659 kali.

Page 52: ANALISIS DATA KATEGORI

Untuk variabel X2 dengan nilai odds ratio sebesar 6.938 berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi dan DM sebesar 6.938 kali,

Page 53: ANALISIS DATA KATEGORI

• bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung disertai hipertensi dan DM sebesar 5.667 kali

• variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner disertai hipertensi dan DM sebesar 0.977 kali

Page 54: ANALISIS DATA KATEGORI

• Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK disertai hipertensi dan DM sebesar 1.166 kali.

• Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi dan DM berturut turut sebesar 0.891 kali dan 0.866 kali.

Page 55: ANALISIS DATA KATEGORI

TERIMA KASIH