analisis regresi logistik ordinal halaman judul

i

ANALISIS REGRESI LOGISTIK ORDINAL

HALAMAN JUDUL

Makalah

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Matematika

Program Studi Matematika

Oleh:

Maria Anggun Puspasari

NIM: 123114013

PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

ii

ANALYSIS OF ORDINAL LOGISTIC REGRESSION

HALAMAN JUDUL DALAM BAHASA INGGRIS

Paper

Presented as Partial Fulfillment of the Requirements

to Obtain Sarjana Matematika Degree

in Mathematics Study Program

By:


NIM: 123114013

MATHEMATICS STUDY PROGRAM, MATHEMATICS DEPARTMENT

FACULTY OF SCIENCE TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2017


iii


iv

HALAMAN PENGESAHAN


v

HALAMAN PERSEMBAHAN

“Bertekunlah dalam doa dan dalam pada itu berjaga-jagalah sambil

mengucap sykuur”

Kolose 4:2

Tugas Akhir ini dipersembahkan untuk:

Tuhan Yesus Kristus yang selalu menyertai dan memberkatiku dengan

berkatNya yang sangat melimpah

Kedua orang tua Andy Pramudya dan Rini Sih Mintowati

Kakakku tercinta Anggy Sabatrani Pramudya

Beserta keluarga besar Soepardjo dan Purwo

Serta almamater yang kubanggakan


vi


vii

ABSTRAK

HALAMAN ABSTRAK

Analisis Regresi Logistik Ordinal adalah analisis regresi yang peubah

responnya bersifat ordinal yang memiliki tiga atau lebih kategori. Analisis regresi

logistik ordinal didasarkan pada suatu fungsi:

𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )

1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

dengan 𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) = peluang kumulatif pada p variabel independen yang

dinyatakan dalam vektor 𝑿𝒊, 𝛽0𝑗 = parameter intersep kategori ke-j, 𝑿𝒊 =

[𝑋𝑖1 𝑋𝑖2 … 𝑋𝑖𝑝]𝑇

dan 𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝).

Analisis regresi logistik ordinal diawali dengan langkah pendugaan

parameter model dengan menggunakan metode kemungkinan maksimum

(Maximum Likelihood) dan metode Newton-Rhapson dan dilanjutkan interpretasi

koefisien parameter model.

Kata kunci: regresi logistik ordinal, metode kemungkinan maksimum, pendugaan

parameter.


viii

ABSTRACT

HALAMAN ABSTRACT

Ordinal Logistic Regression analysis is a regression analysis which its variable

response is ordinal and have three or more categories. Ordinal Logistic Regression

analysis is originated from function:


𝑝𝑘=1 )


where 𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) = cumulative probability of variable dependen p which is

expressed by vector𝑿𝒊 , 𝛽0𝑗 = parameter of category intercept for j, 𝑿𝒊 =

[𝑋𝑖1 𝑋𝑖2 … 𝑋𝑖𝑝]𝑇 and 𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝).

Ordinal Logistic Regression analysis is started with parameter estimation

of the model by using Maximum Likelihood method and Newton-Rhapson

method and be continued by the interpretation of the parameterof the model.

Keyword: ordinal logistic regression, maximum likelihood method, parameter

estimation


ix

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma:

Nama : Maria Anggun Puspasari

NIM Mahasiswa : 123114013

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan

Universitas Sanata Dharma karya ilmiah yang berjudul:

ANALISIS REGRESI LOGISTIK ORDINAL

Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan

kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan,

mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan

data, mendistribusikannya secara terbatas, dan mempublikasikannya di internet

atau media lain untuk kepentingan akademis tanpa meminta ijin dari saya maupun

memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai

penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di Yogyakarta

Pada Tanggal: 06 November 2017

Yang menyatakan

(Maria Anggun Puspasari)


x

KATA PENGANTAR

Puji syukur penulis haturkan ke hadirat Tuhan Yang Maha Kuasa atas segala

berkat dan penyertaanNya sehingga penulis dapat menyelesaikan tugas akhir

dengan baik. Tugas akhir yang berjudul “Analisis Regresi Logistik Ordinal” ini

adalah salah satu syarat untuk memperoleh gelar sarjana Matematika pada

Fakultas Sains dan Teknologi. Dalam penulisan tugas akhir ini, tentunya penulis

telah menerima bantuan baik secara moril maupun materil dari berbagai pihak.

Oleh karena itu penulis ingin menyampaikan ucapan terima kasih kepada:

1. Bapak Ir. Ig. Aris Dwiatmoko M. Sc. Selaku dosen pembimbing yang

dengan penuh kesabaran telah memberikan bimbingan nasihat dan

arahan kepada penulis.

2. Bapak Hartono Ph. D, selaku Ketua Program Studi yang telah

memberikan banyak bimbingan dalam hal akademik dan perkuliahan.

3. Serta bapak dan ibu dosen yang telah memberikan banyak ilmu

pengetahuan kepada penulis selama menjalani perkuliahan di Universitas

Sanata Dharma.

4. Mas Susilo selaku laboran yang telah banyak membantu penulis dalam

perkuliahan terutama dalam penulisan tugas akhir ini.

5. Perpustakaan Universitas Sanata Dharma dan staf sekretariat Fakultas

Sains dan Teknologi yang telah memberikan fasilitas dan kemudahan

pembelajaran serta administrasi bagi penulis selama masa perkuliahan.

6. Papah Andy Pramudya dan Mamah Rini Sih Mintowati serta kakak

Anggy Sabatrani Pramudya yang telah banyak memberikan dukungan


xi

dan pengorbanan sehingga penulis dapat menyelesaikan studi dengan

baik.

7. Alusisus Ari Setyanto yang telah banyak memberikan dukungan dan

pengorbanan bagi penulis selama penulisan tugas akhir.

8. Teman-teman angkatan 2012 Program Studi Matematika yaitu, Amanda,

Dewi, Noni, Putri, Sila, Ajeng, Bobi, Budi, Ega, Ferni, Happy, Ilga,

Risma, Tika, Oksi, Juli, Arum, Lia, Rian.

9. Teman-teman kos, Febri, Nia, Rita, Nindy, Hesti, Yanti, Iin, Priska,

Vita, Dea, Mela.

10. Dan sahabatku Imas, Hami, Inggrit, Kiki, Riska.

11. Semua pihak yang tidak dapat disebutkan satu persatu yang telah banyak

memberikan bantuan, dorongan, dan motivasi sehingga tugas akhir ini

dapat diselesaikan.

Penulis menyadari bahwa tugas akhir ini masih jauh dari kesempurnaan,

maka saran dan kritik yang konstruktif dari semua pihak sangat

diharapkan demi penyempurnaan selanjutnya. Semoga tugas akhir ini

dapat bermanfaat bagi semua pihak, khususnya bagi penulis dan

pembaca pada umumnya.

Yogyakarta, 06 November 2017

Penulis



xii

DAFTAR ISI

HALAMAN JUDUL ........................................................................................................... i

HALAMAN JUDUL DALAM BAHASA INGGRIS ........................................................ ii

HALAMAN PERSETUJUAN PEMBIMBING ...................Error! Bookmark not defined.

HALAMAN PENGESAHAN.............................................................................................iv

HALAMAN PERSEMBAHAN ......................................................................................... v

HALAMAN PERNYATAAN KEASLIAN KARYA ..........Error! Bookmark not defined.

HALAMAN ABSTRAK ................................................................................................... vii

HALAMAN ABSTRACT ................................................................................................ viii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI.............................................. ix

KATA PENGANTAR ........................................................................................................ x

DAFTAR ISI ...................................................................................................................... xii

DAFTAR TABEL ............................................................................................................. xiv

DAFTAR GAMBAR ......................................................................................................... xv

BAB 1 PENDAHULUAN .................................................................................................. 2

A. LATAR BELAKANG ............................................................................................ 3

B. RUMUSAN MASALAH ........................................................................................ 2

C. TUJUAN PENULISAN .......................................................................................... 2

D. BATASAN MASALAH ......................................................................................... 2

E. MANFAAT PENULISAN ...................................................................................... 2

F. SISTEMATIKA PENULISAN ............................................................................... 3

BAB II LANDASAN TEORI ............................................................................................. 7

A. PROBABILITAS .................................................................................................... 7

B. DISTRIBUSI PROBABILITAS ........................................................................... 18

C. METODE KUADRAT TERKECIL ..................................................................... 24

D. MODEL KUADRAT TERKECIL MENGGUNAKAN MATRIKS .................... 27

E. METODE KEMUNGKINAN MAKSIMUM (Maximum Likelihood) ................. 31

F. METODE NEWTON-RAPHSON ........................................................................ 36

BAB III DASAR-DASAR MATEMATIS MODEL REGRESI LOGISTIK ORDINAL 38

A. REGRESI LOGISTIK .......................................................................................... 38

B. REGRESI LOGISTIK ORDINAL ........................................................................ 59

BAB IV APLIKASI REGRESI LOGISTIK ORDINAL .................................................. 80


xiii

A. PENDUGAAN PARAMETER ............................................................................. 80

B. PERHITUNGAN DAN ANALISIS DATA ......................................................... 88

BAB V KESIMPULAN .................................................................................................... 99

DAFTAR PUSTAKA ..................................................................................................... 100

LAMPIRAN .................................................................................................................... 102


xiv

DAFTAR TABEL

Tabel 2.1 Tabel untuk kejadian 𝐴 dan 𝐵 ………………………………………. 13

Tabel 3.1 Tabel frekuensi pengelompokan umur pada CHD ………………….. 43

Tabel 3.9 Hasil perhitungan dari algoritma Newton-Rhapson …….…………… 56

Tabel 3.10 Nilai Model Regresi Logistik ……………………………………..... 58

Tabel 3.11 Klasifikasi silang AGE pada 55 tahun dan CHD untuk 100 responden

………….…………………………………………………………... 59

Tabel 3.12 Klasifikasi silang 4 kategori skala ordinal hasil berat badan bayi lahir

dengan status ibu merokok ………...……………………………..... 70

Tabel 3.13 Output ………………………………………………………………. 72

Tabel 3.14 Klasifikasi silang antara keinginan melanjutkan dan pendidikan orang

tua ……………………………………………..……..…………….. 75

Tabel 3.15 Klasifikasi silang antara keinginan melanjutkan dan GPA ……….. 77

Tabel 4.1 Output ………………………………………………………………... 89

Tabel 4.2 Klasifikasi silang antara kesehatan mental dan status peristiwa

kehidupan ………………………………………………………...... 93

Tabel 4.3 Klasifikasi silang antara kesehatan mental dan status SES …………. 95


xv

DAFTAR GAMBAR

Gambar 2.1 Ruang sampel untuk percobaan pelemparan sebuah dadu ………… 9

Gambar 2.2 X : S → R …………………………………………………..………. 19

Gambar 2.3 Ilustrasi garis singgung (slope) …………………………………… 38

Gambar 3.1 Scatterplot CHD menurut AGE pada 100 individu …………….… 42

Gambar 3.2 Plot presentase individu dengan CHD pada setiap kelompok umur 43

Gambar 3.3 Kurva hubungan dari variabel biner dengan prediktor X …………. 47


BAB 1 PENDAHULUAN

PENDAHULUAN

A. RUMUSAN MASALAH

Perumusan masalah yang akan dibicarakan pada tugas akhir ini adalah:

1. Bagaimana dasar-dasar matematis model regresi logistik ordinal?

2. Bagaimana menerapkan metode regresi logistik ordinal untuk

menganalisis suatu kejadian?

B. TUJUAN PENULISAN

Tujuan dari penulisan tugas akhir ini:

1. Memahami landasan matematika tentang analisis regresi logistik.

2. Menganalisis penyebab suatu kejadian dengan menggunakan metode

regresi logistik ordinal.

C. BATASAN MASALAH

Tugas akhir ini dibatasi pada masalah-masalah sebagai berikut:

1. Model Regresi yang dibahas adalah model Regresi Logistik Ordinal.

2. Aplikasi yang digunakan adalah program R dan program SPSS.

D. MANFAAT PENULISAN

Manfaat yang dapat diperoleh dari penulisan tugas akhir ini adalah

mahasiswa atau pembaca dapat memahami penyebab suatu kejadian dengan

cara metode matematika.


E. LATAR BELAKANG

Regresi logistik merupakan salah satu metode statistika yang

berfungsi untuk menganalisis variabel respon atau biasa disebut variabel tak

bebas (dependen) yang mempunyai data berupa skala ordinal atau nominal.

Dilihat dari variabel bebasnya, regresi logistik terbagi menjadi dua yaitu

regresi logistik sederhana (hanya memiliki satu variabel bebas) dan regresi

logistik berganda (memiliki satu atau lebih variabel bebas) sedangkan dilihat

dari variabel responnya, regresi logistik dapat dibedakan menjadi dua yaitu

regresi logistik biner (variabel responnya dichotomous atau hanya memiliki

dua kategori) dan regresi logistik multinomial (variabel responnya

polytomous atau memiliki lebih dari dua kategori).

Model Matematika Regresi Logistik adalah model regresi yang

digunakan apabila variabel respon bersifat kualitatif. Fungsi model Regresi

Logistik adalah

𝜋(𝑥) = 𝑒𝛽0+𝛽1𝑥

1 + 𝑒𝛽0+𝛽1𝑥

Keterangan:

𝜋(𝑥) = peluang kumulatif variabel independen

𝛽0 dan 𝛽𝑖 = parameter regresi

x = variabel dependen


Persamaan ini bersifat nonlinear dalam parameter, maka diperlukan

proses transformasi agar bersifat linear yang dinamakan transformasi logit,

yaitu:

𝑙𝑛 (𝜋(𝑥)

1 − 𝜋(𝑥)) = 𝛽

0+ 𝛽

1𝑥

Regresi logistik membentuk variabel dependen yang merupakan

kombinasi linear dari variabel independen. Nilai variabel dependen ini

kemudian ditransformasikan menjadi probabilitas dengan transformasi logit.

Regresi logistik menghasilkan rasio peluang atau biasa disebut odds rations,

yang terkait dengan nilai setiap variabel independen.

Regresi Logistik merupakan salah satu metode regresi yang

digunakan untuk mencari hubungan antara peubah respon bersifat kategori

berskala nominal atau ordinal dengan satu atau lebih peubah penjelas kontinu

maupun kategori. Jika peubah respon berskala nominal digunakan regresi

logistik multinominal, sedangkan pada peubah respon berskala ordinal

digunakan regresi logistik ordinal. Analisis regresi logistik nominal

digunakan apabila memiliki lebih dari tiga kategori dan tidak berurutan (skala

nominal). Analisis regresi logistik ordinal digunakan apabila memiliki lebih

dari tiga kategori dan ada urutan kategori (skala ordinal).

Model Matematika Regresi Logistik Ordinal adalah model logit

kumulatif. Sifat dari variabel dependen Y diberikan dalam peluang kumulatif

sehingga model yang didapatkan dengan membandingkan peluang kumulatif

yaitu peluang kurang dari sama dengan kategori respon ke-j pada p variabel


independen yang dinyatakan dalam vektor 𝑿, 𝑃(𝑌 ≤ 𝑗|𝑿) dengan peluang

lebih besar daripada kategori dependen ke-j, 𝑃(𝑌 > 𝑗|𝑿) (Hosmer dan

Lemeshow, 2000: 290).

Sehingga, peluang kumulatif didefinisikan sebagai berikut:

𝑃(𝑌𝑖 ≤ 𝑗|𝑋𝑖) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )


Dengan

𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊)= peluang kumulatif pada p variabel independen yang

dinyatakan dalam vektor 𝑿𝒊

𝑗 = 1, 2, … , 𝐽 − 1, 𝑖 = 1, 2, … , 𝑛 dan 𝑘 = 1, 2, … , 𝑝

𝛽0𝑗 = parameter intersep kategori ke-j

𝑌𝑖 = variabel Y pada pengamatan ke-i

𝑋𝑖𝑘 = vektor variabel X pada pengamatan ke-i

𝛽𝑘 = vektor parameter regresi

Persamaan ini bersifat nonlinear dalam parameter, maka diperlukan

proses transformasi agar bersifat linear yang dinamakan transformasi logit,

yaitu:

ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)

𝑃(𝑌 > 𝑗|𝑿𝑖)) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝

𝑘=1

Pendugaan parameter model regresi logistik ordinal dilakukan dengan

metode Maximum Likelihood Estimation (MLE) yaitu:


𝐿(𝜷) = ∑𝑦1𝑖 ln[∅1(𝑿𝑖) ] + 𝑦2𝑖 ln[∅2(𝑿𝑖)

] + 𝑦3𝑖 ln[∅3(𝑿𝑖) ]

𝑛

𝑖=1

Regresi logistik ordinal juga merupakan perluasan dari regresi logistik

biner dengan bahwa variabel dependen dari regresi logistik ordinal berskala

ordinal yang terdiri dari tiga atau lebih kategori.

F. SISTEMATIKA PENULISAN

BAB I PENDAHULUAN

A. Latar Belakang

B. Rumusan Masalah

C. Batasan Masalah

D. Tujuan Penulisan

E. Manfaat Penulisan

F. Metode Penulisan

G. Sistematika Penulisan

BAB II LANDASAN TEORI

A. Probabilitas

1. Probabilitas pada Kasus Diskrit

2. Menghitung Probabilitas suatu Kejadian dengan

Menggunakan Metode Titik Sampel

3. Probabilitas Bersyarat dan Kejadian Bebas

4. Dua Aturan Probabilitas

B. Distribusi Probabilitas

1. Variabel Random


2. Fungsi Probabilitas

3. Fungsi Distribusi Kumulatif

C. Metode Kuadrat Terkecil

D. Model Kuadrat Terkecil menggunakan Matriks

E. Metode Kemungkinan Maksimum (Maximum Likelihood)

F. Metode Newton-Rhapson

BAB III DASAR-DASAR MATEMATIS MODEL REGRESI

LOGISTIK ORDINAL

A. Regresi Logistik

1. Pendahuluan

2. Model Regresi Logistik

3. Pendugaan Model Regresi Logistik

4. Oods Ratio pada Regresi Logistik

B. Regresi Logistik Ordinal

1. Model Regresi Logistik Ordinal

2. Pendugaan Model Regresi Logistik Ordinal

BAB IV APLIKASI METODE REGRESI LOGISTIK ORDINAL

A. Pendugaan Parameter

B. Perhitungan dan Analisis Data

BAB V KESIMPULAN


7

BAB II

LANDASAN TEORI

BAB II LANDASAN TEORI

A. PROBABILITAS

Pada istilah sehari-hari, probabilitas adalah ukuran keyakinan

seseorang akan kemungkinan terjadinya suatu peristiwa di masa depan.

Konsep probabilitas diperlukan dalam pekerjaan fisik, biologis, atau

mekanisme sosial yang menghasilkan pengamatan yang tidak dapat diprediksi

dengan pasti. Misalnya, tekanan darah seseorang pada suatu titik waktu

tertentu tidak dapat diprediksi dengan pasti.

1. Probabilitas pada Kasus Diskrit

Definisi 2.1

Percobaan adalah suatu proses yang menghasilkan pengamatan

(observarsi).

Definisi 2.2

Ruang sampel adalah himpunan yang anggota-anggotanya adalah semua

kemungkinan hasil yang mungkin dari suatu percobaan dan

dilambangkan dengan S.

Definisi 2.3

Setiap kemungkinan hasil yang mungkin dari suatu percobaban disebut

titik sampel. Titik sampel biasanya dinotasikan dengan 𝐸𝑖 , 𝑖 = 1, 2, 3, …


8

Definisi 2.4

Sebuah ruang sampel diskrit memuat berhingga atau tak berhingga

terbilang titik sampel.

Definisi 2.5

Kejadian dalam ruang sampel diskrit S merupakan himpunan bagian dari

ruang sampel S. Kejadian dilambangkan dengan E.

Definisi 2.6

Kejadian sederhana adalah kejadian yang hanya anggotanya satu titik

sampel.

Contoh 2.1

Percobaan pelemparan sebuah dadu. Ketika percobaan berlangsung, ini

akan menghasilkan ruang sampel, yaitu 𝑆 = {𝐸1, 𝐸2, 𝐸3, 𝐸4, 𝐸5, 𝐸6} dan

dapat menghasilkan beberapa kejadian A, B, dan C.

A: kejadian munculnya bilangan ganjil

B: kejadian munculnya bilangan yang kurang dari 5

C: kejadian munculnya bilangan 2 atau 3

𝐸1: munculnya bilangan 1

𝐸2 : munculnya bilangan 2





Dengan 𝐸1, 𝐸2, 𝐸3, 𝐸4, 𝐸5, 𝑑𝑎𝑛 𝐸6 adalah titik-titik sampel.


9

Diagram venn di bawah ini menunjukkan contoh ruang sampel untuk

percobaan pelemparan sebuah dadu.

S

Gambar 2.1 Ruang sampel untuk percobaan pelemparan sebuah dadu.

𝐸1 = kejadian munculnya bilangan 1 dan 𝐸1 disebut kejadian sederhana

karena hanya memuat satu titik sampel yaitu bilangan 1.

Definisi 2.7

Misalkan S adalah ruang sampel percobaan. Untuk setiap kejadian A di S

(A adalah himpunan bagian S). P(A) adalah probabilitas kejadian A yang

memenuhi aksioma:

Aksioma 1: 𝑃(𝐴) ≥ 0

Aksioma 2: 𝑃(𝑆) = 1

Aksioma 3: Misal 𝐴1, 𝐴2, 𝐴3, … membentuk pasangan barisan pada

kejadian di S (yaitu, 𝐴𝑖 ∩ 𝐴𝑗 = ∅ jika 𝑖 ≠ 𝑗) maka

𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ …) = ∑𝑃(𝐴𝑖).

∞

𝑖=1

(2.1)

𝐸1

𝐸2

𝐸3 𝐸4

𝐸5

𝐸6


10

2. Menghitung Probabilitas suatu Kejadian dengan Menggunakan

Metode Titik Sampel.

Langkah-langkah yang digunakan untuk mengetahui probabilitas suatu

kejadian:

a. Definisikan percobaan dan deskripsikan secara jelas bagaimana

untuk menggambarkan salah satu kejadian sederhana,

b. Daftarkan kejadian-kejadian sederhana yang terkait dengan

percobaan dan ujilah masing-masing untuk memastikan bahwa

kejadian-kejadian tersebut tidak dapat diuraikan. Hal ini

mendefinisikan ruang sampel S.

c. Tetapkan probabilitas untuk titik sampel di S, yang menghasilkan

𝑃(𝐸𝑖) ≥ 0 dan ∑𝑃(𝐸𝑖) = 1.

d. Definisikan kejadian khusus, A, sebagai himpunan spesifik dari titik

sampel.

e. Tentukan 𝑃(𝐴) dengan menjumlahkan probabilitas semua titik

sampel di A.

Contoh 2.2

Diketahui ada dua pelamar pekerjaan dari sebuah grup yang terdiri dari

lima orang dan pelamar memiliki kompetensi yang berbeda-beda, yaitu 1

menjadi yang terbaik, 2 terbaik kedua, dan seterusnya untuk 3, 4, dan 5.

Penilaian ini tentu saja tidak diketahui oleh karyawan. Didefinisikan dua

kejadian A dan B sebagai berikut:


11

A: Karyawan memilih yang terbaik dan salah satu dari dua pelamar yang

paling kurang baik (pelamar 1 dan 4 atau 1 dan 5)

B: Karyawan memilih minimal satu dari dua yang terbaik.

Tentukan probabilitas dari kejadian tersebut!

Jawab:

Langkah-langkahnya:

1. Percobaan dua pelamar yang terpilih dari lima secara acak.

Notasikan terpilihnya pelamar 3 dan 5 dengan {3, 5}.

2. Sepuluh kemungkinan kejadian sederhana, pelamar i dan j yang

terpilih dinotasikan dengan {i, j} adalah

𝐸1: {1, 2}, 𝐸5: {2, 3}, 𝐸8: {3, 4}, 𝐸10: {4, 5}

𝐸2: {1, 3}, 𝐸6: {2, 4}, 𝐸9: {3, 5}

𝐸3: {1, 4}, 𝐸7: {2, 5}, 𝐸8: {3, 6}

𝐸4: {1, 5}.

3. Memilih dua secara acak dari lima mengakibatkan masing-masing

pasangan memiliki peluang yang sama untuk dipilih. Sebab itu, kita

tetapkan setiap titik sampel probabilitasnya 1/10, yaitu,

𝑃(𝐸𝑖) =1

10= .1, 𝑖 = 1, 2, … , 10

4. Memeriksa titik sampel, kita lihat bahwa B muncul setiap kali

𝐸1, 𝐸2, 𝐸3, 𝐸4, 𝐸5, 𝐸6, atau 𝐸7 terjadi. Sebab itu, titik sampel ini

termuat di B.

5. Akibatnya, 𝑃(𝐵) bernilai sama dengan jumlahan dari probabilitas

dari titik-titik sampel di B, atau


12

𝑃(𝐵) = ∑𝑃(𝐸𝑖) = ∑.1 = .7.

7

𝑖=1

7

𝑖=1

Dengan cara yang sama, dapat dilihat kejadian 𝐴 = 𝐸3 ∪ 𝐸4 dan 𝑃(𝐴) =

.1 + .1 = .2

3. Probabilitas Bersyarat dan Kejadian Bebas

Definisi 2.8

Probabilitas bersyarat dari suatu kejadian A, bila kejadian B terjadi

dinotasikan sebagai

𝑃(𝐴|𝐵) =𝑃(𝐴 ∩ 𝐵)

𝑃(𝐵) (2.2)

dengan 𝑃(𝐵) > 0. (𝑃(𝐴|𝐵) dibaca “probabilitas kejadian A jika kejadian

B terjadi”.

Konfirmasi lebih lanjut dari konsistensi Definisi 2.8 dengan konsep

frekuensi relatif probabilitas dapat diperoleh dari bentuk berikut.

Andaikan sebuah percobaan diulang sebanyak 𝑁 bilangan yang besar,

dengan hasil kejadian 𝐴 dan 𝐵, 𝐴 ∩ 𝐵, 𝑛11 kali; pada 𝐴 dan tidak pada

𝐵, 𝐴 ∩ �̅�, 𝑛21 kali; pada 𝐵 dan tidak pada 𝐴, �̅� ∩ 𝐵, 𝑛12kali; dan tidak

pada 𝐴 maupun B, �̅� ∩ �̅�, 𝑛22kali. Hasil ini ada di dalam tabel 2.1.

Catatan bahwa 𝑛11 + 𝑛12 + 𝑛21 + 𝑛22 = 𝑁. Kemudian selanjutnya

𝑃(𝐴) ≈𝑛11+𝑛21

𝑁, 𝑃(𝐵) ≈

𝑛11+𝑛12

𝑁, 𝑃(𝐴|𝐵) ≈

𝑛11

𝑛11+𝑛12,

𝑃(𝐵|𝐴) ≈𝑛11

𝑛11+𝑛21, dan 𝑃(𝐴 ∩ 𝐵) ≈

𝑛11

𝑁,


13

dengan ≈ dibaca mendekati sama dengan.

Menggunakan probabilitas, dapat dilihat sebagai berikut

𝑃(𝐴|𝐵) =𝑃(𝐴∩𝐵)

𝑃(𝐵) dan 𝑃(𝐵|𝐴) =

𝑃(𝐴∩𝐵)

𝑃(𝐴)

Oleh karena itu, definisi 2.8 ini konsisten dengan konsep frekuensi relatif

probabilitas.

Tabel 2.1 Tabel untuk kejadian 𝐴 dan 𝐵

𝐴 �̅�

𝐵 𝑛11 𝑛12 𝑛11 + 𝑛12

�̅� 𝑛21 𝑛22 𝑛21 + 𝑛22

𝑛11 + 𝑛21 𝑛12 + 𝑛22 𝑁

Contoh 2.3

Di suatu desa yang berpenduduk 2000 orang, terdapat 1250 orang yang

tergolong ke dalam usia kerja, yang terdiri atas 750 orang laki-laki dan

500 orang wanita. Dari 750 orang laki-laki terdapat 650 orang yang

bekerja sedangkan diantara 500 orang wanita tersebut terdapat 200 orang

yang bekerja. Jika dari mereka yang tergolong dalam usia kerja dipilih

secara acak, berapa peluang bahwa yang terpilih adalah bekerja jika ada

tambahan informasi bahwa yang terpilih adalah laki-laki.


14

Jawab:

Andaikan L = kejadian bahwa yang terpilih laki-laki

B = kejadian bahwa yang terpilih bekerja

N = banyaknya orang yang tergolong dalam usia kerja

maka: 𝑃(𝐿) =𝑛(𝐿)

𝑁=

750

1250=

3

5

𝑃(𝐿 ∩ 𝐵) =𝑛(𝐿 ∩ 𝐵)

𝑁=

650

1250=

13

15

Jadi

𝑃(𝐵|𝐿) =𝑃(𝐿 ∩ 𝐵)

𝑃(𝐿)=

351315

=9

13

Definisi 2.9

Dua kejadian A dan B disebut saling bebas jika memenuhi salah satu:

𝑃(𝐴|𝐵) = 𝑃(𝐴) (2.3)

𝑃(𝐵|𝐴) = 𝑃(𝐵) (2.4)

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) (2.5)

Jika tidak,maka kejadian disebut tergantung atau tidak saling bebas.

Contoh 2.4

Sebuah dadu bersisi enam dilempar. Kejadian A adalah kejadian bahwa

banyaknya mata dadu yang muncul adalah bilangan ganjil, B adalah


15

kejadian bahwa banyaknya mata yang muncul lebih besar dari 4 dan C

adalah kejadian bahwa banyaknya mata yang muncul lebih kecil dari 4.

a. Apakah A dan B merupakan dua kejadian yang bebas?

b. Apakah A dan C merupakan dua kejadian yang bebas?

Jawab:

S = {1, 2, 3, 4, 5, 6}

A = {1, 3, 5}

B = {5, 6}

C = {1, 2, 3}

𝐴 ∩ B = {5}

𝐴 ∩ C = {1, 3}

Karena dadu yang dilempar seimbang maka setiap sisi mempunyai

peluang yang sama untuk muncul, maka:

𝑃(𝐴) =𝑛(𝐴)

𝑁=

3

6 , 𝑃(𝐵) =

𝑛(𝐵)

𝑁=

2

6 , 𝑃(𝐶) =

𝑛(𝑐)

𝑁=

3

6

𝑃(𝐴 ∩ B) =𝑛(𝐴 ∩ B)

N=

1

6

𝑃(𝐴 ∩ C) =𝑛(𝐴 ∩ C)

N=

2

6=

1

3


16

Sehingga

a. 𝑃(𝐴)𝑃(𝐵) = (3

6) (

2

6) =

1

6= 𝑃(𝐴 ∩ B) sehingga A dan B adalah dua

kejadian saling bebas.

b. 𝑃(𝐴)𝑃(𝐶) = (3

6) (

3

6) =

1

4≠

1

3= 𝑃(𝐴 ∩ C) sehingga A dan C bukan

merupakan dua kejadian saling bebas.

4. Dua Aturan Probabilitas

Teorema 2.1

Aturan probabilitas perkalian. Probabilitas kejadian A dan B adalah

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴) (2.6)

= 𝑃(𝐵)𝑃(𝐴|𝐵) (2.7)

Jika A dan B saling bebas, maka

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) (2.8)

Bukti:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴)

= 𝑃(𝐵)𝑃(𝐴|𝐵)

Menurut definisi 2.9

𝑃(𝐴|𝐵) = 𝑃(𝐴) 𝑑𝑎𝑛 𝑃(𝐵|𝐴) = 𝑃(𝐵), maka

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) ∎

Teorema 2.2

Aturan probabilitas penjumlahan. Probabilitas dari gabungan kejadian A

dan B adalah


17

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) (2.9)

Jika A dan B kejadian saling asing 𝑃(𝐴 ∩ 𝐵) = 0 dan

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) (2.10)

Bukti:

Jika A adalah himpunan dari S, maka komplemen dari A dinotasikan

dengan �̅� yang mana �̅� adalah himpunan titik-titik yang berada di S

tetapi tidak di A. Perhatikan bahwa 𝐴 ∪ 𝐵 = 𝐴 ∪ (�̅� ∩ 𝐵), dengan 𝐴 dan

�̅� ∩ 𝐵 adalah kejadian saling asing.

Selanjutnya, 𝐵 = (�̅� ∩ 𝐵) ∪ (𝐴 ∩ 𝐵), dengan (𝐴 ∩ �̅�) dan (𝐴 ∩ 𝐵)

adalah kejadian saling asing.

Lalu dengan menggunakan Aksioma 3,

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(�̅� ∩ 𝐵) dan 𝑃(𝐵) = 𝑃(�̅� ∩ 𝐵) + 𝑃(𝐴 ∩ 𝐵).

Maka (�̅� ∩ 𝐵) = 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵).

Lalu subsitusikan persamaan 𝑃(�̅� ∩ 𝐵) ke persamaan 𝑃(𝐴 ∪ 𝐵) maka

didapatkan 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) ∎

Teorema 2.3

Jika A adalah kejadian, maka

𝑃(𝐴) = 1 − 𝑃(�̅�) (2.11)

Bukti:

Diketahui bahwa 𝑆 = 𝐴 ∪ �̅�.

Karena 𝐴 dan �̅� adalah kejadian saling asing.


18

Ini mengakibatkan 𝑃(𝑆) = 𝑃(𝐴) + 𝑃(�̅�).

Sehingga, 𝑃(𝐴) + 𝑃(�̅�) = 1 ∎

B. DISTRIBUSI PROBABILITAS

1. Variabel Random

Definisi 2.10

Variabel random adalah fungsi yang bernilai real yang domainnya adalah

ruang sampel. Variabel random dinotasikan dengan X.

Contoh 2.5

Percobaan pengambilan 2 bola tanpa pengembalian pada kantong yang

berisi 3 bola berwarna hitam dan 5 bola berwarna putih. Dimisalkan

variabel random X adalah banyaknya bola putih yang terambil.

Ruang sampel S pada percobaan di atas:

𝑆 = {𝐻𝐻,𝐻𝑃, 𝑃𝐻, 𝑃𝑃}

Dengan H menyatakan bola berwana “hitam” dan P menyatakan bola

berwarna “putih”.

X menyatakan banyaknya bola putih yang terambil.

Nilai 0, 1, atau 2 dapat diberikan pada setiap titik sampel, dimana nilai 0,

1, atau 2 menyatakan besaran acak yang nilainya ditentukan dari

percobaan. Variabel random X dapat dinyatakan dengan diagram

pemetaan berikut:


19

S R

X

Gambar 2.2 X : S → R

Definisi 2.11

Variabel Random dikatakan diskret jika himpunan dari kemungkinan

hasilnya adalah berhingga atau terbilang.

Jika tidak memenuhi definisi di atas maka variabel random di atas

disebut variabel random kontinu.

Contoh variabel random diskret adalah jumlah anak dalam sebuah

keluarga dan contoh variabel random kontinu adalah usia penduduk suatu

daerah.

2. Fungsi Probabilitas

Fungsi probabilitas dibagi menjadi dua macam, yaitu fungsi probabilitas

diskret dan fungsi probabilitas kontinu.

a. Distribusi Variabel Random Diskret

Definisi 2.12

Himpunan pasangan terurut (𝑥, 𝑃(𝑥)) adalah fungsi probabilitas dari

variabel random diskret X jika memenuhi sifat:

HH

HP

PH

PP

0

1

2


20

1. 0 ≤ 𝑃(𝑥) ≤ 1 untuk setiap x

2. ∑𝑃(𝑥) = 1

Contoh 2.6

Dari contoh 2.5 tentukan peluang banyaknya bola putih yang

dihasilkan pada pelemparan 2 kali.

Jawab:

Pada gambar 2.2 nilai X adalah banyaknya bola putih yang terambil.

𝑃(𝑋 = 0) =(30) (

52)

(82)

=10

28

𝑃(𝑋 = 1) =(31) (

51)

(82)

=15

28

𝑃(𝑋 = 2) =(32) (

50)

(82)

=3

28

b. Distribusi Variabel Random Kontinu

Definisi 2.13

Suatu fungsi f(x) adalah fungsi probabilitas untuk variabel random

kontinu jika memenuhi sifat:

1. 𝑓(𝑥) ≥ 0, untuk setiap 𝑥,−∞ < 𝑥 > ∞.


21

2. ∫ 𝑓(𝑥)𝑑𝑥 = 1∞

−∞

Contoh 2.7

Misalkan 𝑌 adalah proses fungsi densitas

𝑓(𝑦) = {𝑐𝑦, 0 ≤ 𝑦 ≤ 20, 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛

a. Carilah nilai c yang memuat sehingga 𝑓(𝑦) adalah fungi

probabilitas densitas

b. Tentukan 𝐹(𝑦)

c. Gunakan 𝐹(𝑦)untuk menentukan 𝑃(1 ≤ 𝑌 ≤ 2)

Jawab:

Sehingga didapat

𝑓(𝑦) = {

1

2𝑦, 0 ≤ 𝑦 ≤ 2

0, 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛

a. 𝑓(𝑦) = ∫ 𝑐𝑦 𝑑𝑦2

0

1 = 𝑐 ∫ 𝑦 𝑑𝑦2

0

1 = 𝑐 [1

2𝑦2]

20

1 = 𝑐 (2)

1 = 2𝑐

𝑐 =1

2


22

b. Dalam distribusi varibel random kontinu

𝐹(𝑦) = 𝑃(𝑌 ≤ 𝑦) = ∫ 𝑓(𝑡)𝑑𝑡𝑦

−∞

Sehingga

Untuk 𝑦 < 0

𝐹(𝑦) = ∫ 𝑓(𝑡)𝑑𝑡 = ∫ 0 𝑑𝑡 =𝑦

−∞

𝑦

−∞

0

Untuk 0 ≤ 𝑦 ≤ 2

𝐹(𝑦) = ∫ 𝑓(𝑡)𝑑𝑡𝑦

−∞

= ∫ 0 𝑑𝑡 + ∫1

2𝑡 𝑑𝑡

𝑦

0

0

−∞

= 0 + [1

4𝑡2]

𝑦0

=1

4𝑦2

Untuk 𝑦 > 2

𝐹(𝑦) = ∫ 𝑓(𝑡)𝑑𝑡𝑦

−∞

= ∫ 0 𝑑𝑡 + ∫1

2𝑡 𝑑𝑡

2

0

0

−∞

+ ∫ 0 𝑑𝑡𝑦

2

= 0 + [1

4𝑡2]

20

+ 0

= (1 − 0)

= 1


23

Maka didapatkan

𝐹(𝑦) = {

0, 𝑦 < 21

4𝑦2, 0 ≤ 𝑦 ≤ 2

1, 𝑦 > 2

c. 𝑃(1 ≤ 𝑌 ≤ 2) = 𝑃(𝑌 ≤ 2) − 𝑃(𝑌 ≤ 1)

= 𝐹(2) − 𝐹(1)

= 1 − (1

4(12))

= 1 −1

4

=3

4

3. Fungsi Distribusi Kumulatif

Definisi 2.14

Fungsi distribusi kumulatif dari sebuah variabel random diskret dan

kontinu didefinisikan sebagai berikut:

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = { ∫ 𝑓(𝑡)𝑑𝑡 ,jika X kontinu

𝑥−∞

∑ 𝑃(𝑥) ,∀𝑋≤𝑥 jika X diskret

Contoh 2.8

Diketahui fungsi distribusi kumulatif sebagai berikut:

𝐹(𝑥) = {

0, 𝑥 < 0𝑥 + 1

2, 0 ≤ 𝑥 ≤ 1

1, 1 ≤ 𝑥

a. Tentukan 𝑃 (−3 < 𝑥 ≤1

2)

b. Tentukan 𝑃(𝑋 = 0)


24

Jawab:

a. 𝑃 (−3 < 𝑋 ≤1

2) = 𝐹 (

1

2) − 𝐹(−3) =

3

4− 0 =

3

4

b. 𝑃(𝑋 = 0) = 𝐹(0) − 𝐹(0) =1

2− 0 =

1

2

C. METODE KUADRAT TERKECIL

Model regresi yang baik adalah model regresi yang dapat mendekati

nilai aktualnya.

Definisi 2.15

Model linier sederhana didefinisikan sebagai berikut:

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖, 𝑖 = 1,2, … , 𝑛 (2.12)

dengan 𝑌𝑖 =pengamatan ke-i variabel dependen

𝛽0 =intersep

𝛽1 =parameter regresi

𝑋𝑖 =pengamatan ke-i variabel independen

𝑢𝑖, = galat (error) dari pengamatan ke-i

Metode yang dapat digunakan untuk menentukan nilai-nilai penduga

parameter dalam regresi tersebut adalah metode kuadrat terkecil atau yang

biasa disebut ordinary least square (OLS). Misalkan (𝑥𝑖 , 𝑦𝑖 ) sampel random

berukuran n dari sebuah populasi. Berdasarkan Definisi 2.12 maka persamaan

garis regresinya adalah

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖 (2.13)


25

Metode Kuadrat Terkecil bertujuan untuk menentukan penduga dari 𝛽0 dan

𝛽1 yaitu 𝛽0̂ dan 𝛽1̂ yang akan meminimumkan Jumlah Kuadrat Galat (sum of

square error).

Dengan asumsi 𝐸(𝑢𝑖 ) = 0 persamaan regresi akan diduga oleh

𝑌�̂� = 𝛽0̂ + 𝛽1̂𝑋𝑖. (2.14)

Definisi 2.16

Jumlah kuadrat galat (sum of squares error) didefinisikan sebagai

𝑆𝑆𝐸 = ∑(𝑦𝑖 − 𝑦�̂�)2 = ∑[𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑥𝑖)]

2𝑛

𝑖=1

𝑛

𝑖=1

(2.15)

Jumlah Kuadrat Galat minimum diperoleh dengan menggunakan turunan

parsial terhadap 𝛽0̂ dan 𝛽1̂, maka:

𝜕𝑆𝑆𝐸

𝜕 𝛽0̂ =

𝜕{∑ [𝑦𝑖−(𝛽0̂+ 𝛽1̂𝑥𝑖)]2𝑛

𝑖=1 }

𝜕 𝛽0̂ = 0

= − ∑2[𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑥𝑖)]

𝑛

𝑖=1

= 0

= −2(∑𝑦𝑖

𝑛

𝑖−1

− 𝑛𝛽0̂ − 𝛽1̂ ∑𝑥𝑖

𝑛

𝑖=1

) = 0

= ∑ 𝑦𝑖

𝑛

𝑖−1

− 𝑛𝛽0̂ − 𝛽1̂ ∑𝑥𝑖

𝑛

𝑖=1

= 0

∑𝑦𝑖

𝑛

𝑖=1

= 𝑛𝛽0̂ + 𝛽1̂ ∑𝑥𝑖

𝑛

𝑖=1

(2.16)


26

𝜕𝑆𝑆𝐸

𝜕 𝛽1̂ =

𝜕{∑ [𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑥𝑖)]2𝑛

𝑖=1 }

𝜕 𝛽1̂ = 0

= − ∑2{[𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑋𝑖)]𝑥𝑖}

𝑛

𝑖=1

= 0

= −2(∑𝑥𝑖𝑦𝑖

𝑛

𝑖−1

− 𝛽0̂ ∑𝑥𝑖

𝑛

𝑖=1

− 𝛽1̂ ∑𝑥𝑖2

𝑛

𝑖=1

) = 0

= ∑ 𝑥𝑖𝑦𝑖

𝑛

𝑖−1

− 𝛽0̂ ∑𝑥𝑖

𝑛

𝑖=1

− 𝛽1̂ ∑𝑥𝑖2

𝑛

𝑖=1

= 0

∑𝑥𝑖𝑦𝑖

𝑛

𝑖−1

= 𝛽0̂ ∑𝑥𝑖

𝑛

𝑖=1

+ 𝛽1̂ ∑𝑥𝑖2

𝑛

𝑖=1

(2.17)

Dengan menggunakan metode eliminasi pada persamaan kedua di atas maka

diperoleh

∑ 𝑦𝑖𝑛𝑖=1 = 𝑛𝛽0̂ + 𝛽1̂ ∑ 𝑥𝑖

𝑛𝑖=1

𝑛𝛽0̂ = ∑𝑦𝑖

𝑛

𝑖=1

− 𝛽1̂ ∑𝑥𝑖

𝑛

𝑖=1

𝛽0̂ = ∑𝑦𝑖

𝑛

𝑛

𝑖=1

− 𝛽1̂ ∑𝑥𝑖

𝑛

𝑛

𝑖=1

𝛽0̂ = �̅� − 𝛽1̂�̅� (2.18)

∑ 𝑥𝑖𝑦𝑖𝑛𝑖=1 = 𝛽0̂ ∑ 𝑥𝑖

𝑛𝑖=1 + 𝛽1̂ ∑ 𝑥𝑖

2𝑛𝑖=1

𝛽1̂ ∑ 𝑥𝑖2

𝑛

𝑖=1

= ∑𝑥𝑖𝑦𝑖

𝑛

𝑖=1

− 𝛽0̂ ∑𝑥𝑖

𝑛

𝑖=1


27

𝛽1̂ ∑ 𝑥𝑖2

𝑛

𝑖=1


𝑛

𝑖=1

− (�̅� − 𝛽1̂�̅�) ∑𝑥𝑖

𝑛

𝑖=1

𝛽1̂ ∑ 𝑥𝑖2

𝑛

𝑖=1


𝑛

𝑖=1

− (∑𝑦𝑖

𝑛

𝑛

𝑖=1

− 𝛽1̂ ∑𝑥𝑖

𝑛

𝑛

𝑖=1

) ∑𝑥𝑖

𝑛

𝑖=1

𝛽1̂ ∑ 𝑥𝑖2

𝑛

𝑖=1


𝑛

𝑖=1

− (∑𝑦𝑖

𝑛

𝑛

𝑖=1

∑𝑥𝑖

𝑛

𝑖=1

− 𝛽1̂ ∑𝑥𝑖

𝑛

𝑛

𝑖=1

∑𝑥𝑖

𝑛

𝑖=1

)

𝛽1̂ (∑𝑥𝑖2

𝑛

𝑖=1

− ∑𝑥𝑖

𝑛

𝑛

𝑖=1

∑𝑥𝑖

𝑛

𝑖=1

) = ∑𝑥𝑖𝑦𝑖

𝑛

𝑖=1

− ∑𝑦𝑖

𝑛

𝑛

𝑖=1

∑𝑥𝑖

𝑛

𝑖=1

𝛽1̂ = ∑ 𝑥𝑖𝑦𝑖

𝑛𝑖=1 − ∑

𝑦𝑖

𝑛𝑛𝑖=1 ∑ 𝑥𝑖

𝑛𝑖=1

(∑ 𝑥𝑖2𝑛

𝑖=1 − ∑𝑥𝑖

𝑛𝑛𝑖=1 ∑ 𝑥𝑖

𝑛𝑖=1 )

𝛽1̂ = ∑ 𝑥𝑖𝑦𝑖

𝑛𝑖=1 −

1𝑛

∑ 𝑦𝑖𝑛𝑖=1 ∑ 𝑥𝑖

𝑛𝑖=1

∑ 𝑥𝑖2𝑛

𝑖=1 −1𝑛

(∑ 𝑥𝑖𝑛𝑖=1 )2

(2.19)

D. MODEL KUADRAT TERKECIL MENGGUNAKAN MATRIKS

Model linear dengan 𝑘 variabel independen didefinisikan sebagai

berikut:

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘 + 𝜀𝑖, 𝑖 = 1,2, … , 𝑛 (2.20)

dengan 𝑌𝑖 = pengamatan ke-i variabel dependen

𝛽0 = intersep

𝛽𝑗 = parameter regresi (𝑗 = 1,… , 𝑘)

𝑋𝑖𝑗 = pengamatan ke − 𝑖 variabel 𝑋 ke − 𝑗

𝜀𝑖 = galat (error) dari pengamatan ke-i


28

Untuk mempermudah analisis maka model dapat diekspesikan dalam bentuk

matriks. Misalkan

𝒀 = (𝑌1

⋮𝑌𝑛

) , 𝑿 = (1 𝑋11 …⋮ ⋮ 1 𝑋1𝑛 …

𝑋𝑘1

⋮𝑋𝑘𝑛

) , 𝜷 = (𝛽0

⋮𝛽𝑘

) , 𝜺 = (

𝜀1

⋮𝜀𝑛

) (2.21)

Perhatikan bahwa pada matriks 𝑿 = (𝑋𝒊𝒋) berukuran 𝑛 𝑥 𝑘, pada indeks

pertama yaitu 𝑗 (𝑗 = 1,… , 𝑘) menunjukkan variabel independen ke-j (dalam

kolom) dan indeks kedua yaitu 𝑖 (𝑖 = 1, … , 𝑛) menunjukkan jumlah

pengamatan (dalam baris), sehingga dapat ditulis sebagai

(𝑌1

⋮𝑌𝑛

) = (1 𝑋11 …⋮ ⋮ 1 𝑋1𝑛 …

𝑋𝑘1

⋮𝑋𝑘𝑛

)(𝛽0

⋮𝛽𝑘

) + (

𝜀1

⋮𝜀𝑛

) (2.22)

Pada notasi di atas dapat ditulis kembali dengan

𝒀 = 𝑿𝜷 + 𝜺 (2.23)

dengan 𝜷 merupakan vektor parameter (𝑘 + 1)𝑥1 dan 𝜺 merupakan vektor

galat 𝑛𝑥1.

Residual dan kriteria kuadrat terkecil

Misalkan �̂� merupakan vektor penduga dari vektor parameter 𝜷 yang

berukuran (𝑘 + 1)𝑥 1, maka penduga modelnya dapat ditulis sebagai

𝒀 = 𝑿 �̂� + 𝜺 (2.24)


29

Sehingga didapatkan

𝜺 = 𝒀 − 𝑿 �̂� (2.25)

Transpos dari sebuah matriks dinotasikan dengan (′). Misalkan transpos dari

vektor residual 𝜺 adalah matriks yang berukuran 1 𝑥 𝑛, yaitu 𝜺′ = (𝜀1, … , 𝜀𝑛).

Dengan demikian jumlah kuadrat galat dapat dinyatakan dalam bentuk

perkalian vektor sebagai berikut:

𝜺′𝜺 = [𝜀1 … 𝜀1]1𝑥𝑛 [

𝜀1

⋮𝜀1

]

𝑛𝑥1

(2.26)

Untuk menentukan penduga kuadrat terkecil, kita menuliskan jumlah kuadrat

residual sebagai:

𝑆( �̂�) = ∑𝜀𝑖2

= 𝜺′𝜺

= (𝒀 − 𝑿 �̂�)′(𝒀 − 𝑿 �̂�)

= 𝒀′𝒀 − 𝒀′𝑿 �̂� − �̂�′𝑿′𝒀 + �̂�′𝑿′𝑿 �̂� (2.27)

Karena 𝒀′𝑿 �̂� dan �̂�′𝑿′𝒀′ merupakan skalar yang bernilai sama sehingga

diketahui bahwa dalam aturan matriks:

𝒀′𝑿 �̂� = (𝒀′𝑿 �̂�)′= �̂�′𝑿′𝒀 (2.28)

Sehingga

𝜺′𝜺 = 𝒀′𝒀 − �̂�′𝑿′𝒀 − �̂�′𝑿′𝒀 + �̂�′𝑿′𝑿 �̂�


30

= 𝒀′𝒀 − 2 �̂�′𝑿′𝒀 + 𝑿′𝑿 �̂�𝟐 (2.29)

Dengan menggunakan OLS untuk menentukan penduga �̂� yang mampu

meminimalkan jumlah kuadrat galat, maka dilakukan pendiferensialan

(penurunan) terhadap �̂� sebagai berikut:

𝜕𝑆

𝜕 �̂�= −2𝑿′𝒀 + 2𝑿′𝑿 �̂� (2.30)

karena

𝜕(2 �̂�′𝑿′𝒀)

𝜕 �̂�=

𝜕2 �̂�′(𝑿′𝒀)

𝜕 �̂�= 2𝑿′𝒀

misalkan 𝑨 = 𝑿′𝑿, maka

𝜕(�̂�′𝑿′𝑿 �̂�)

𝜕 �̂�=

𝜕( �̂�′𝑨�̂�)

𝜕 �̂�= 2𝑨�̂�

Sehingga

𝜕(�̂�′𝑿′𝑿 �̂�)

𝜕 �̂�= 2𝑿′𝑿�̂�

Sebagai contoh, bila persamaan regresi dengan parameter 𝛽1 dan 𝛽2, misalkan

𝑿′𝑿 = 𝑐𝑖𝑗, 𝑖, 𝑗 = 1,2 dengan 𝑐12 = 𝑐21. Maka: �̂�′𝑿′𝑿 �̂� = 𝑐11𝛽12̂ + 𝑐22𝛽2

2̂ +

2𝑐12𝛽1̂𝛽2̂. Lalu, �̂�′𝑿′𝑿 �̂� akan diturunkan terhadap 𝛽1̂ dan 𝛽2̂.

𝜕(�̂�′𝑿′𝑿 �̂�)

𝜕𝛽1̂ =

𝜕(𝑐11𝛽12̂ + 𝑐22𝛽2

2̂ + 2𝑐12𝛽1̂𝛽2̂)

𝜕𝛽1̂

= 2𝑐11𝛽1 + 2𝑐12𝛽2


31

Dan

𝜕(�̂�′𝑿′𝑿 �̂�)

𝜕𝛽2̂ =

𝜕(𝑐11𝛽12̂ + 𝑐22𝛽2

2̂ + 2𝑐12𝛽1̂𝛽2̂)

𝜕𝛽2̂

= 2𝑐12𝛽1 + 2𝑐12𝛽2

Karena kedua turunan parsial dalam vektor 2 𝑥 1,maka dapat ditulis dengan

2𝑿′𝑿�̂�.

Untuk mencari penduga kuadrat terkecil bagi 𝜷 adalah dengan

meminimalkan 𝑆( �̂�). Oleh karena itu nilai derivatif sama dengan nol,

𝜕𝑆

𝜕 �̂�= 0

Sehingga

0 = −2𝑿′𝒀 + 2𝑿′𝑿 �̂�

2𝑿′𝑿 �̂� = 2𝑿′𝒀

(𝑿′𝑿) �̂� = 𝑿′𝒀

Dengan demikian, menggunakan aturan matriks kita akan memperoleh

nilai �̂�, yaitu:

�̂� = (𝑿′𝑿)−1𝑿′𝒀 (2.31)

E. METODE KEMUNGKINAN MAKSIMUM (Maximum Likelihood)

Untuk mengilustrasikan Metode Kemungkinan Maksimum dapat

menggunakan contoh. Dimisalkan terdapat kotak yang berisikan tiga buah


32

bola, dimana ketiga bola itu berwarna merah atau putih tetapi tidak diketahui

berapa banyaknya masing-masing jumlah tiap warna. Lalu diambil sampel

secara random tanpa pengembalian. Jika yang terambil adalah dua bola

berwarna merah maka dapat disimpulkan bahwa jumlah bola berwana merah

yang ada di kotak haruslah dua atau tiga (jika terdapat nol atau satu bola

merah pada kotak, maka tidak mungkin sampel yang terambil dua bola

merah). Jika terdapat dua bola merah dan satu bola putih di dalam kotak,

peluang terambilnya dua bola merah secara acak adalah

( 22 ) (

10)

(32)

=1

3

Jika terdapat tiga bola berwarna merah di dalam kotak, maka peluang

terambilnya tiga buah bola secara acak adalah

( 32 )

(32)

= 1

Karena itu dipilih tiga sebagai penduga dari banyaknya bola merah di dalam

kotak karena ini merupakan penduga yang memaksimalkan probabilitas dari

sampel yang diamati. Tentu saja ini mungkin apabila terdapat dua bola merah

di dalam kotak, tetapi sampel yang diamati memberikan kepercayaan lebih

untuk tiga bola merah yang terdapat di dalam kotak. Contoh ilustrasi ini

adalah metode untuk menemukan penduga yang dapat diaplikasikan pada


33

berbagai situasi. Secara teknik, metode ini disebut Metode Kemungkinan

Maksimum (Maximum Likelihood Method).

Definisi 2.17

Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah variabel random kontinu berukuran 𝑛 dengan

fungsi probabilitas 𝑓(𝑥, 𝜃) dan 𝜃 adalah parameter yang tidak diketahui,

fungsi likelihood dari sampel random adalah densitas bersama dari 𝑛 variabel

random dan bergantung pada fungsi parameter yang tidak diketahui. Fungsi

likelihood dinotasikan dengan 𝐿(𝜃) dan didefinisikan sebagai

𝐿(𝜃) = ∏𝑓(𝑥𝑖; 𝜃)

𝑛

𝑖=1

(2.32)

Definisi 2.18

Penduga Kemungkinan Maksimum (Maximum Likelihood Estimator) 𝜃𝑀𝐿

dari 𝜃 memaksimumkan likelihood 𝐿(𝜃|𝑌) atau ekuivalen dengan

memaksimumkan log-likelihood 𝑙(𝜃|𝑌) dengan 𝑙 = ln 𝐿(𝜃).

Selain itu, karena biasanya sulit untuk mencari turunan fungsi

likelihood, maka yang dilakukan adalah menentukan nilai maksimum dari

logaritma natural fungsi likelihood tersebut atau disebut dengan fungsi log-

likelihood. Fungsi log-likelihood dapat ditulis dalam bentuk:

𝑙 = ln 𝐿(𝜃) (2.33)

Nilai parameter 𝜃 dapat diperoleh dengan memaksimumkan fungsi

likelihood. Hal ini tersebut dilakukan dengan mencari turunan parsial pertama


34

dari fungsi log-likelood-nya terhadap setiap parameternya. Sehingga, MLE

𝜃 merupakan penyelesaian dari persamaan berikut:

𝑑𝑙

𝑑𝜃= 0 (2.34)

Misalkan terdapat 𝑘 parameter yang tidak diketahui, maka pendugaan

parameter 𝜃𝑖 dengan Metode Kemungkinan Maksimum

𝑑𝑙

𝑑𝜃1= 0 (2.35)

dengan 𝑙 = ln(𝜃1, 𝜃2, … , 𝜃𝑛) , 𝑖 = 1, 2, … , 𝑘

Contoh 2.9

Misal 𝑋 adalah variabel random diskrit dengan fungsi probabilitas dengan

parameter 0 ≤ 𝜃 ≤ 1. Berikut 10 sampel random:

𝑥 0 1 2 3

𝑃(𝑥) 2𝜃

3

𝜃

3

2(1 − 𝜃)

3

1 − 𝜃

3

Yang diambil dari distribusi probabilitas di atas: (3, 0, 2, 1, 3, 2, 1, 0, 2, 1).

Tentukan penduga kemungkinan maksimum dari 𝜃!

Jawab:

Sampel yang diketahui (3, 0, 2, 1, 3, 2, 1, 0, 2, 1), maka likelihoodnya adalah

𝐿(𝜃) = 𝑃(𝑋 = 3)𝑃(𝑋 = 0)𝑃(𝑋 = 2)𝑃(𝑋 = 1)𝑃(𝑋 = 3)

𝑃(𝑋 = 2) 𝑃(𝑋 = 1) 𝑃(𝑋 = 0)𝑃(𝑋 = 2)𝑃(𝑋 = 1)


35

Substitusikan dari distribusi probabilitas yang diberikan di atas, kita dapatkan

𝐿(𝜃) = ∏𝑃(𝑋𝑖|𝜃) = (2𝜃

3)2

(𝜃

3)

3

(2(1 − 𝜃)

3)

3

(1 − 𝜃

3 )

2

𝑛

𝑖=1

Ini jelas bahwa fungsi likelihood 𝐿(𝜃) tidak mudah untuk dimaksimalkan.

Mari kita lihat fungsi log-likelihood.

𝑙(𝜃) = 𝑙𝑜𝑔𝐿(𝜃) = ∑𝑙𝑜𝑔 𝑃(𝑋𝑖|𝜃)

𝑛

𝑖=1

= 2 (log2

3+ log 𝜃) + 3 (log

1

3+ log 𝜃) + 3 (log

2

3+ log(1 − 𝜃))

+ 2 (log1

3+ log(1 − 𝜃))

= 𝐶 + 5 log 𝜃 + 5 log(1 − 𝜃),

dengan 𝐶 adalah konstanta. Dapat dilihat bahwa fungsi log-likelihood lebih

mudah dimaksimalkan dibandingkan fungsi likelihood.

Penduga 𝜃dapat diperoleh dengan mencari turunan dari 𝑙(𝜃) terhadap 𝜃 dan

disamadengankan nol.

𝑑𝑙(𝜃)

𝑑𝜃=

5

𝜃−

5

1 − 𝜃= 0

dan solusi yang diberikan oleh MLE, dengan 𝜃 = 0.5.


36

F. METODE NEWTON-RAPHSON

Metode Newton-Rhapson merupakan salah satu metode untuk

menyelesaikan persamaan 𝑓(𝑥) = 0 yang tidak dapat diselesaikan secara

eksplisit.

Misalkan 𝑓 mempunyai akar pada suatu interval real. Misalkan 𝑥0 ∈

[𝑎, 𝑏] adalah pendekatan ke penyelesaian persamaan 𝑝, dengan 𝑓′(𝑥0) ≠ 0

dan |𝑥0 − 𝑝| suatu bilangan kecil. Deret Taylor untuk 𝑓(𝑥) di sekitar 𝑥0

adalah:

𝑓(𝑥) = 𝑓(𝑥0) + (𝑥 − 𝑥0)𝑓′(𝑥0) +

𝑓′′(𝑥0)

2!(𝑥 − 𝑥0)

2 + ⋯ (2.36)

Jika 𝑓(𝑝) = 0 dan 𝑥 = 𝑝 sehingga persamaannya menjadi

0 = 𝑓(𝑥0) + (𝑝 − 𝑥0)𝑓′(𝑥0) + +

𝑓′′(𝑥0)

2!(𝑝 − 𝑥0)

2 + ⋯ (2.37)

Metode Newton diperoleh dengan mengasumsikan bahwa, jika |𝑝 − 𝑥0|

bernilai kecil, maka (𝑝 − 𝑥0)2 dapat diabaikan sehingga

0 ≈ 𝑓(𝑥0) + (𝑝 − 𝑥0)𝑓′(𝑥0) (2.38)

dan penyelesaian untuk 𝑝 dalam persamaan ini adalah

𝑝 ≈ 𝑥0 − 𝑓(𝑥0)

𝑓′(𝑥0) (2.39)

Uraian di atas merupakan tahap metode Newton-Raphson, yang dimulai

dengan nilai awal 𝑝0 dan menghasilkan barisan {𝑝𝑛} yang didefinisikan oleh

𝑝𝑛 = 𝑝𝑛−1 − 𝑓(𝑝𝑛−1)

𝑓′(𝑝𝑛−1), 𝑛 ≥ 1 (2.40)


37

Gambar (2.3) mengilustrasikan bagaimana pendekatan-pendekatan untuk

menyelesaikan p dilakukan menggunakan garis singgung (slope) secara

berturut-turut.

Gambar 2.3 Ilustrasi garis singgung (slope)

Metode Newton merupakan suatu teknik fungsi iterasi dari bentuk 𝑝𝑛 =

𝑔(𝑝𝑛−1) dengan

𝑔(𝑝𝑛−1) = 𝑝𝑛−1 − 𝑓(𝑝𝑛−1)

𝑓′(𝑝𝑛−1), 𝑛 ≥ 1 (2.41)

Metode Newton tidak dapat dilanjutkan jika 𝑓′(𝑝𝑛−1) = 0 untuk suatu n.


38

BAB III

DASAR-DASAR MATEMATIS MODEL REGRESI LOGISTIK

ORDINAL

BAB III DASAR-DASAR MATEMATIS MODEL REGRESI LOGISTIK ORDINAL

A. REGRESI LOGISTIK

I. Pendahuluan

Regresi logistik merupakan salah satu metode statistika yang

berfungsi untuk menganalisis variabel respon atau biasa disebut variabel

tak bebas (dependen) yang datanya berskala ordinal atau nominal. Dilihat

dari variabel bebasnya, regresi logistik terbagi menjadi dua yaitu regresi

logistik sederhana (hanya memiliki satu variabel bebas) dan regresi

logistik berganda (memiliki lebih dari satu variabel bebas) sedangkan

dilihat dari variabel responnya, regresi logistik dapat dibedakan menjadi

dua yaitu regresi logistik biner (variabel responnya dichotomous atau

hanya memiliki dua kategori) dan regresi logistik multinomial (variabel

responnya polytomous atau memiliki lebih dari dua kategori).

Estimasi untuk model regresi ordinal merupakan perluasan dari

regresi logistik biner. Model ini secara kolektif didefinisikan sebagai

model linear umum, yang terdiri dari tiga komponen:


39

1. Komponen acak, dengan variabel dependen 𝑌 memiliki salah satu

distribusi eksponensial seperti normal, binomial, atau invers

Gaussian.

2. Komponen linear, yang menjelaskan fungsi 𝑌′, dari variabel

dependen 𝑌 tergantung pada prediktor.

3. Fungsi link, yang menggambarkan transformasi variabel dependen

𝑌 ke 𝑌′ (Fox,1997)

Analisis logistik untuk percobaan respon biner terhadap model odds

memungkinkan terjadinya suatu kejadian dan memperkirakan efek dari

variabel dependen terhadap odds. Odds untuk suatu kejadian merupakan

hasil bagi (perbandingan) antara probabilitas terjadinya (“sukses”)

dengan probabilitas kegagalan. Ketika probabilitas keberhasilan lebih

besar dari kegagalan, maka nilai odds lebih besar dari 1. Jika kedua

hasilnya sama besar maka nilai oddsnya 1 dan jika probabilitas

keberhasilan kurang dari probabilitas kegagalan, maka nilai oddsnya

kurang dari 1.

Contoh 𝟑. 𝟏

Percobaan mengamati hasil ujian Surat Ijin Mengemudi (SIM). Hasilnya

dapat digambarkan sebagai biner: seorang anak berhasil lulus ujian SIM

(sukses) atau tidak (gagal). Odds dapat dihitung dari data sampel dengan

membagi probabilitas kejadian lulus ujian (𝑌 = 1) dengan probabilitas

kejadian tidak lulus ujian (𝑌 = 0):

Odds =𝑃(𝑌 = 1)

𝑃(𝑌 = 0)=

𝑃(𝑌 = 1)

1 − 𝑃(𝑌 = 1)


40

Untuk menguji suatu oods variabel independen, seperti jenis kelamin

atau usia, kita menggunakan rasio odds (OR), yang membandingkan odds

untuk nilai yang berbeda dari variabel bebas.

Contoh 𝟑. 𝟐

Seperti pada contoh 3.1, kita akan membandingkan oods kejadian

“berhasil lulus ujian” laki-laki (𝑥 = 1) dengan odds kejadian “lulus

ujian” perempuan (𝑥 = 0), maka kita dapat menghitung rasio:

𝑂𝑅 =

𝑃(𝑌 = 1|𝑥 = 1)1 − 𝑃(𝑌 = 1|𝑥 = 1)

𝑃(𝑌 = 1|𝑥 = 0)1 − 𝑃(𝑌 = 1|𝑥 = 0)

Rasio Odds mempunyai batas 0 tetapi tidak mempunyai batas atas.

Adapun sifat-sifat dari rasio odds:

1. Rasio odds, 𝑂𝑅 = 1 menyatakan bahwa peluang kejadian pada

kedua grup adalah sama.

2. Rasio odds, 𝑂𝑅 > 1 menyatakan bahwa peluang kejadian pada grup

pertama lebih besar daripada grup kedua.

3. Rasio odds, 𝑂𝑅 < 1 menyatakan bahwa peluang kejadian pada grup

pertama lebih kecil daripada grup kedua.

4. Rasio odds harus lebih besar dari atau sama dengan 0 atau 𝑂𝑅 ≥ 1.

5. Rasio odds harus mendekati nol jika odds kejadian dari grup pertama

mendekati nol.

6. Rasio odds akan mendekati positif tak terhingga jika odds kejadian

dari kategori kedua mendekati nol.


41

II. Model Regresi Logistik

Model regresi logistik adalah model yang peubah terikatnya atau

responnya berupa peubah kategorik sedangkan menurut Hosmer

(1989) metode regresi logistik adalah suatu metode analisis statistika

yang mendeskripsikan hubungan antara peubah respon yang memiliki

dua kategori atau lebih dengan satu atau lebih peubah bebas berskala

kategori atau interval.

Yang membedakan model regresi logistik dengan model regresi

linear adalah variabel hasil dalam regresi logistik merupakan variabel

biner atau dikotomis.

Contoh 𝟑. 𝟑

Dalam penelitian terhadap resiko terkena penyakit jantung koroner

(CHD) dengan bertambahnya usia (AGE), ada 100 individu yang

berpartisipasi dalam penelitian dan hasilnya tercatat dalam Tabel 3.1

pada lampiran 1, yang berisi variabel pengenal (ID), variabel umur

(AGE), variabel kelompok umur (AGRP) dan variabel hasil CHD yang

diberi kode dengan "0" menunjukkan CHD tidak ada atau "1"

menunjukkan bahwa CHD ada pada individu.


42

Gambar 𝟑. 𝟏. scatterplot CHD menurut AGE pada 100 individu

Dalam scatterplot, semua titik jatuh pada salah satu dari dua garis sejajar

yang mewakili tidak adanya CHD (𝑦 = 0) dan adanya CHD (𝑦 = 1).

Karena tidak memberikan gambaran yang jelas tentang hubungan antara

CHD dan AGE, maka dilakukan strategi dengan menciptakan interval

untuk variabel independen dan menghitung nilai rata-rata (proporsi) di

dalam masing-masing kelompok dengan menggunakan variabel

kelompok umur (AGRP).

Kelompok

umur

Banyaknya

(n)

CHD Rata-rata

(proporsi)

[(+)/n] (-) (+)

20-29 10 9 1 0.10

30-34 15 13 2 0.13

0

0.2

0.4

0.6

0.8

1

1.2

0 10 20 30 40 50 60 70 80

CH

D

AGE


43

35-39 12 9 3 0.25

40-44 15 10 5 0.33

45-49 13 7 6 0.46

50-54 8 3 5 0.63

55-59 17 4 13 0.76

60-69 10 2 8 0.80

Total 100 57 43 0.43

Tabel 𝟑. 𝟏 Tabel frekuensi pengelompokan umur pada CHD

Gambar 𝟑. 𝟐 Plot persentase individu dengan CHD pada setiap

kelompok umur

Ada dua perbedaan penting dari kedua gambar di atas. Perbedaan yang

pertama pada hubungan antara variabel dependen (tak bebas) dan

variabel independen (bebas). Dalam regresi linear biasa, kuantitas utama

adalah nilai rata-rata dari variabel hasil, jika diketahui nilai variabel

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0 2 4 6 8 10

CH

D

dal

am p

ers

en

AGE


44

independen. Kuantitas ini disebut rata-rata bersyarat dan dapat

dinyatakan sebagai

𝐸(𝑌|𝑥)

Dibaca “nilai harapan 𝑌, jika diketahui nilai 𝑥”,

dengan 𝑌 = variabel dependen

𝑥 = nilai variabel independen

Pada regresi linear kita asumsikan bahwa rata-rata dapat dinyatakan

sebagai persamaan linear dalam 𝑥, yaitu

𝐸(𝑌|𝑥) = 𝛽0 + 𝛽1𝑥 (3.1)

dengan nilai 𝐸(𝑌|𝑥) berada di antara daerah −∞ dan +∞.

Pada regresi logistik, kolom “rata-rata” pada Tabel 3.1 memberikan

pendugaan nilai 𝐸(𝑌|𝑥). Dengan menggunakan data dikotomis, nilai dari

rata-rata bersyarat harus lebih besar atau sama dengan 0 dan kurang dari

atau sama dengan 1 (0 ≤ 𝐸(𝑌|𝑥) ≤ 1). Dan pada gambar 3.2

menunjukkan bahwa rata-ratanya mendekati 0 dan 1. Perubahan dalam

𝐸(𝑌|𝑥) berubah dalam 𝑥 menjadi semakin kecil karena rata-rata

bersyaratnya mendekati 0 atau 1, sehingga kurva akan berbentuk S.

Untuk menyederhanakan notasi, akan digunakan kuantitas 𝜋(𝑥) =

𝐸(𝑌|𝑥) untuk mewakili rata-rata bersyarat 𝑌, jika diketahui 𝑥 saat

distribusi logistik digunakan. Bentuk spesifik dari model regresi logistik

adalah

𝜋(𝑥) =𝑒𝛽0+𝛽1𝑥

1 + 𝑒𝛽0+𝛽1𝑥 (3.2)


45

Persamaan (3.2) dapat ditransformasikan ke bentuk lain yang ekivalen.

Dengan menggunakan manipulasi aljabar, maka didapatkan:

𝜋(𝑥) =𝑒𝛽0+𝛽1𝑥

1 + 𝑒𝛽0+𝛽1𝑥

𝜋(𝑥)[1 + 𝑒𝛽0+𝛽1𝑥] = 𝑒𝛽0+𝛽1𝑥

𝜋(𝑥) + 𝜋(𝑥)[𝑒𝛽0+𝛽1𝑥] = 𝑒𝛽0+𝛽1𝑥

𝜋(𝑥) = 𝑒𝛽0+𝛽1𝑥 − 𝜋(𝑥)[𝑒𝛽0+𝛽1𝑥]

𝜋(𝑥) = (1 − 𝜋(𝑥))𝑒𝛽0+𝛽1𝑥

𝜋(𝑥)

1 − 𝜋(𝑥)= 𝑒𝛽0+𝛽1𝑥 (3.3)

Bentuk dari persamaan (3.3) sering disebut sebagai odds. Agar

persamaan (3.3) dapat dipadankan dengan model regresi linear, maka

persamaan (3.3) dapat ditransformasi dengan logaritma sebagai berikut:

ln (𝜋(𝑥)

1 − 𝜋(𝑥)) = ln(𝑒𝛽0+𝛽1𝑥)

ln (𝜋(𝑥)

1 − 𝜋(𝑥)) = 𝛽0 + 𝛽1𝑥

Maka didapat sebagai berikut:

𝑔(𝑥) = ln (𝜋(𝑥)

1 − 𝜋(𝑥)) = 𝛽0 + 𝛽1𝑥

(3.4)

Persamaan (3.4) sehingga disebut sebagai persamaan logit. Pentingnya

transformasi di atas adalah bahwa 𝑔(𝑥) memiliki sifat yang diinginkan

dari model regresi linear, dan logit 𝑔(𝑥) adalah linear dalam

parameternya, mungkin kontinu dan berada di antara daerah −∞ dan

+∞ dengan 𝑔(𝑥) berkisar antara 0 dan 1.


46

Perbedaan yang kedua adalah distribusi bersyarat dari variabel

hasil. Pada model regresi linear kita asumsikan bahwa pengamatan

terhadap variabel hasil dapat dinyatakan sebagai 𝑦 = 𝐸(𝑌|𝑥) + 𝜀,

dengan 𝜀 disebut galat dan dapat didefinisikan sebagai selisih

pengamatan dengan rata-rata bersyarat. Asumsi paling umum bahwa 𝜀

berdistribusi normal dengan rata-rata nol dan variansi konstan. Hal yang

demikian ini tidak terjadi pada variabel hasil yang dikotomis. Pada situasi

ini kita dapat mengeskpresikan nilai variabel hasil bila diberikan 𝑥

sebagai 𝑦 = 𝜋(𝑥) + 𝜀, dengan 𝜀 didefinisikan sebagai salah satu dari dua

nilai yang mungkin.

Jika 𝑦 = 1, maka 𝜀 = 1 − 𝜋(𝑥) terjadi dengan probabilitas 𝜋(𝑥).

Jika 𝑦 = 0, maka 𝜀 = − 𝜋(𝑥) terjadi dengan probabilitas 1 − 𝜋(𝑥).

Sehingga 𝜀 memiliki distribusi dengan rata-rata nol dan varians yang

sama dengan 𝜋(𝑥)[1 − 𝜋(𝑥)] yang artinya adalah distribusi bersyarat

dari variabel hasil mengikuti distribusi Binomial dengan parameter 𝜋(𝑥).

Demikian pembahasan di atas, persamaan regresi logistik yang ekivalen

ada 3 yaitu:

Persamaan (3.2) merupakan ekspresi aljabar persamaan regresi

logistik untuk memprediksi �̂�(𝑥), yaitu probabilitas “sukses”.

�̂�(𝑥) =𝑒𝛽0+𝛽1𝑥

1 + 𝑒𝛽0+𝛽1𝑥


47

Plot dari �̂�(𝑥) sebagai fungsi 𝑋 dengan menggunakan persamaan (3.2)

didapatkan lim𝑥→−∞

𝐹(𝑥) = 0, lim𝑥→0

𝐹(𝑥) =1

2, 𝑑𝑎𝑛 lim

𝑥→∞𝐹(𝑥) = 1, akan

menghasilkan kurva berbentuk S.

Gambar 3.3 Kurva hubungan dari variabel biner dengan prediktor X

Persamaan (3.3) adalah odds, yang merupakan perbandingan antara

probabilitas kejadian “sukses” dengan probabilitas kejadian “tidak

sukses”.

𝜋(𝑥)

1 − 𝜋(𝑥)= 𝑒𝛽0+𝛽1𝑥

Persamaan (3.4) adalah persamaan logistik yang menggambarkan

estimasi probabilitas �̂�(𝑥) yang linear terhadap prediktor X yaitu

memungkinkan sisi prediktor persamaan regresi menjadi linear dalam

estimasi parameter.

𝑔(𝑥) = ln (�̂�(𝑥)

1 − �̂�(𝑥)) = 𝛽0 + 𝛽1𝑥


48

III. Pendugaan Model Regresi Logistik

Misalkan diketahui sampel n pasang pengamatan (𝑥𝑖, 𝑦𝑖), 𝑖 =

1,… . , 𝑛. Dengan 𝑦𝑖 menunjukkan nilai variabel respon dikotomis dan 𝑥𝑖

menunjukkan nilai ke- 𝑖 variabel independen. Sehingga permasalahannya

adalah menduga regresi logistik dalam persamaan (3.2) dengan menduga

nilai 𝛽0 dan 𝛽1.

Dalam regresi linear, metode yang digunakan dalam menduga

parameter yang tidak diketahui adalah dengan menggunakan metode

kuadrat terkecil. Tetapi bila diterapkan pada model hasil dikotomis maka

estimator tidak lagi memiliki sifat yang sama, sehingga menggunakan

metode kemungkinan maksimum. Metode ini memaksimalkan

probabilitas pada data yang diamati. Maka kita harus mempunyai fungsi

untuk menerapkan metode ini yang disebut fungsi likelihood. Yang

didefinisikan sebagai probabilitas data yang diamati sebagai fungsi dari

parameter yang tidak diketahui.

Jika Y dikodekan sebagai 0 dan 1 maka ungkapan untuk 𝜋(𝑥) pada

persamaan (3.2) adalah (untuk nilai vektor parameter 𝜷 = (𝛽0, 𝛽1))

probabilitas bersyarat bahwa 𝑌 sama dengan 1 jika diberikan nilai x. Ini

akan dinotasikan sebagai 𝑃(𝑌 = 1|𝑥). Dengan demikian kuantitas 1 −

𝜋(𝑥) berarti probabilitas bersyarat bahwa Y sama dengan nol jika

diberikan nilai x, 𝑃(𝑌 = 0|𝑥). Jadi, untuk pasangan (𝑥𝑖, 𝑦𝑖), dengan 𝑦𝑖 =

1, kontribusi terhadap fungsi likelihood adalah 𝜋(𝑥𝑖), dan untuk 𝑦𝑖 = 0,


49

kontribusi terhadap fungsi likelihood adalah 1 − 𝜋(𝑥𝑖), dengan kuantitas

𝜋(𝑥𝑖) menunjukkan nilai 𝜋(𝑥) yang dihitung pada 𝑥𝑖.

Fungsi likelihood untuk pasangan (𝑥𝑖, 𝑦𝑖) adalah

𝜋(𝑥𝑖)𝑦𝑖[1 − 𝜋(𝑥𝑖)]

1−𝑦𝑖 (3.5)

Karena pengamatan diasumsikan independen, fungsi likelihood

diperoleh sebagai perkalian dari persamaan (3.5) dengan 𝜷 = (𝛽0, 𝛽1)

yang dapat dibentuk sebagai

𝐿(𝜷) = ∏𝜋(𝑥𝑖)𝑦𝑖[1 − 𝜋(𝑥𝑖)]

1−𝑦𝑖

𝑛

𝑖=1

(3.6)

Untuk memudahkan proses berikutnya, persamaan (3.6) diubah ke

dalam persamaan log, sehingga persamaan log likelihood yang didapat

adalah

𝑙(𝜷) = ln[𝑙(𝜷)] = ∑{

𝑛

𝑖=1

𝑦𝑖 ln[𝜋(𝑥𝑖)] + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]} (3.7)

Untuk menentukan nilai 𝜷 yang memaksimalkan nilai 𝑙(𝜷), maka

kita harus menurunkan persamaan 𝑙(𝜷) terhadap 𝛽0 dan 𝛽1 dan

menyamakannya dengan nol.

Turunan pertama dari persamaan (3.7) terhadap 𝛽0 dengan

ln[𝜋(𝑥𝑖)] = 𝛽0 + 𝛽1𝑥𝑖 adalah:

𝜕𝑙(𝜷)

𝜕𝛽0=

𝜕

𝜕𝛽0{∑{

𝑛

𝑖=1

𝑦𝑖 ln[𝜋(𝑥𝑖)] + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}

= 𝜕

𝜕𝛽0{∑{

𝑛

𝑖=1

𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖) + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}


50

=𝜕

𝜕𝛽0{∑𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖)

𝑛

𝑖=1

+ ∑(1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]

𝑛

𝑖=1

}

= ∑𝑦𝑖 + ∑1

(1 − 𝜋(𝑥𝑖))(−1)(

𝑛

𝑖=1

𝑛

𝑖=1

1 − 𝜋(𝑥𝑖))𝜋(𝑥𝑖)

= ∑[𝑦𝑖 − 𝜋(𝑥𝑖)]

𝑛

𝑖=1

(3.8)

Turunan pertama dari persamaan (3.7) terhadap 𝛽1 dengan

ln[𝜋(𝑥𝑖)] = 𝛽0 + 𝛽1𝑥𝑖 adalah:

𝜕𝑙(𝜷)

𝜕𝛽1=

𝜕

𝜕𝛽1{∑{

𝑛

𝑖=1

𝑦𝑖 ln[𝜋(𝑥𝑖)] + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}

= 𝜕

𝜕𝛽0{∑{

𝑛

𝑖=1

𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖) + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}

=𝜕

𝜕𝛽0{∑𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖)

𝑛

𝑖=1

+ ∑(1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]

𝑛

𝑖=1

}

= ∑𝑦𝑖𝑥𝑖 + ∑1

(1 − 𝜋(𝑥𝑖))(−1)(𝑥𝑖)(𝜋(𝑥𝑖))(

𝑛

𝑖=1

𝑛

𝑖=1

1 − 𝜋(𝑥𝑖))

= ∑[𝑥𝑖𝑦𝑖 − 𝑥𝑖(1 − 𝜋(𝑥𝑖))]

𝑛

𝑖=1

= ∑𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

(3.9)


51

Persamaan (3.8) dan (3.9) dikenal sebagai persamaan likelihood

dengan:

∑[𝑦𝑖 − 𝜋(𝑥𝑖)]

𝑛

𝑖=1

= 0 (3.10)

dan

∑𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) = 0

𝑛

𝑖=1

(3.11)

Persamaan (3.10) dan (3.11) dalam bentuk matriks adalah

𝑆(𝛽0, 𝛽1) = [𝑆1(𝛽0

, 𝛽1 )

𝑆2(𝛽0 , 𝛽1

)] =

[ ∑[𝑦𝑖 − 𝜋(𝑥𝑖)]

𝑛

𝑖=1

= 0

∑ 𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) = 0

𝑛

𝑖=1 ]

(3.12)

Nilai 𝜷 yang diberikan pada solusi persamaan (3.10) dan (3.11)

disebut penduga kemungkinan maksimum dan akan dinotasikan oleh �̂�.

Secara umum, penggunaan simbol "^" menunjukkan penduga

kemungkinan maksimum dari kuantitas masing-masing. Sebagai contoh,

�̂�(𝑥𝑖) adalah penduga kemungkinan maksimum dari 𝜋(𝑥𝑖). Kuantitas ini

memberikan perkiraan probabilitas bersyarat bahwa 𝑌 sama dengan 1,

karena 𝑥 sama dengan 𝑥𝑖. Dengan demikian, persaman di atas mewakili

nilai penduga untuk model regresi logistik. Konsekuensi yang menarik

pada persamaan (3.10) adalah

∑𝑦𝑖 = ∑�̂�(𝑥𝑖)

𝑛

𝑖=1

𝑛

𝑖=1

(3.13)


52

Yang artinya, jumlah nilai 𝑦 yang teramati sama dengan jumlah nilai

prediksi (yang diharapkan).

Contoh 3.4

Pada persamaan (3.2), (3.3), dan (3.4) merupakan tiga bentuk

persamaan regresi logistik secara aljabar. Kemudian akan diilustrasikan

dengan contok numerik fiktif. Misalkan memprediksi probabilitas

promosi seorang asisten professor menjadi professor dengan banyaknya

“publikasi”. Persamaan regresi logistik fiktif dari bentuk persamaan (3.4)

memprediksi logit “promosi” diberikan sebagai berikut:

logit(promosi) = 𝛽0 + β1(publikasi)

= −6.00 + 0.39(publikasi)

dengan 𝛽0 = −6.00 dan 𝛽1 = 0.39. pada Tabel 3.2 (lampiran 1) terdapat

31 kasus yang bervariasi dalam banyaknya jumlah “publikasi” dari 0

sampai 30. Sebagai tambahan, diberikan tiga nilai yang diprediksi: logit,

odds untuk “promosi”, dan estimasi probabilitas “promosi”.

Pada persamaan regresi logistik, logit(promosi) = −6.00 +

0.39(publikasi), maka β1 = 0.39 menunjukkan bahwa logit yang

diprediksi meningkat sebesar 0.39 untuk setiap kenaikan satu jumlah

“publikasi”. Hal ini dapat diverifikasi pada table 3.2 (lampiran 1) dengan

memeriksa dua kolom jumlah publikasi dan logit. 𝛽0 = −6.00 adalah

nilai log yang diprediksi ketika jumlah publikasinya 0 (𝑥 = 0).

Secara ekivalen, persamaan reresi logistik dapat ditulis dalam

bentuk persamaan (3.3) memprediksi odds promosi:


53

odds(promosi) = 𝑒(−6.00+0.39(publikasi))

Sehingga persamaan dapat ditulis dalam bentuk persamaan (3.2)

probabilitas (promosi) =1

1 + 𝑒(−6.00+0.39(publikasi))

Contoh 𝟑. 𝟓

Dengan menggunakan data yang diberikan pada lampiran 2, akan dicari

penduga kemungkinan maksimum bagi model

𝐶𝐻𝐷 = 𝛽0 + 𝛽1𝐴𝐺𝐸

Penyelesaian:

Akan dicari penduga kemungkinan maksimum 𝛽0 ̂ dan 𝛽1̂ dengan

menggunakan persamaan (3.10) dan (3.11). Karena nilai 𝜋(𝑥𝑖)

tergantung dengan nilai 𝛽0 dan 𝛽1, sehingga sulit untuk menyelesaikan

secara eksplisit. Oleh karena itu diperlukan suatu cara untuk

menyelesaikan secara numerik yaitu dengan menggunakan algoritma

Newton-Rhapson. Dengan menggunakan turunan pertama dari

persamaan (3.10) dan (3.11) terhadap 𝛽0 dan 𝛽1 didapat sebagai berikut:

Persamaan (3.10)

𝜕 ∑ [𝑦𝑖 − 𝜋(𝑥𝑖)] 𝑛𝑖=1

𝜕𝛽0= −∑𝜋(𝑥𝑖)(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

(3.14)

𝜕 ∑ [𝑦𝑖 − 𝜋(𝑥𝑖)] 𝑛𝑖=1

𝜕𝛽1= −∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

(3.15)


54

Persamaan (3.11)

𝜕 ∑ 𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) 𝑛𝑖=1

𝜕𝛽0= −∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

(3.16)

𝜕 ∑ 𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) 𝑛𝑖=1

𝜕𝛽1= −∑𝑥𝑖

2(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

(3.17)

Didapatkan fungsi matriks dari 𝛽0 dan 𝛽1:

𝐼(𝛽0, 𝛽1) =

[ ∑𝜋(𝑥𝑖)(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1

∑𝑥𝑖2(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))

𝑛

𝑖=1 ]

(3.18)

Dengan Algoritma Newton-Raphson, pemaksimuman diawali

dengan nilai awal (𝛽0(0)

, 𝛽1(0)

). Nilai awal (𝛽0, 𝛽1) yang berlaku dari

fungsi log-likelihood dapat digunakan untuk menentukan nilai (𝛽0, 𝛽1)

baru, sehingga mencapai nilai (𝛽0, 𝛽1) yang memaksimumkan fungsi

tersebut. Sehingga, jika 𝛽0(𝑗)

dan 𝛽1(𝑗)

adalah nilai parameter yang berlaku

setelah langkah (iterasi) ke-𝑗 dalam algoritma, maka pasangan nilai

berikutnya (𝛽0(𝑗+1)

, 𝛽1(𝑗+1)

) dihitung dengan:

[𝛽0

(𝑗+1)

𝛽1(𝑗+1)

] = [𝛽0

(𝑗)

𝛽1(𝑗)

] + [𝛽0

(𝑗)

𝛽1(𝑗)

]

−1

[𝑆1(𝛽0

(𝑗), 𝛽1

(𝑗))

𝑆2(𝛽0(𝑗)

, 𝛽1(𝑗)

)]

(3.19)

Dimulai dengan 𝛽0(0)

dan 𝛽1(0)

, evaluasi dari persamaan (3.18)

diulang sehingga menghasilkan barisan (𝛽0(1)

, 𝛽1(1)

), (𝛽0(2)

, 𝛽1(2)

), … ,

yang mendekati nilai penduga maksimum (𝛽0̂, 𝛽1̂). Karena nilai


55

maksimum itu tunggal, maka pemilihan nilai awal 𝛽0(0)

dan 𝛽1(0)

tidak

begitu penting. Agar lebih mudah, pilih 𝛽0(0)

= 0 dan 𝛽1(0)

= 0.

Sehingga digunakan nilai awal 𝛽0(0)

= 𝛽1(0)

= 0. Karena 𝛽0(0)

=

𝛽1(0)

= 0, maka untuk semua 𝑖 = 1,… ,100 sehingga

𝜋(𝑥𝑖) =exp(0 + 0𝑥𝑖)

1 + exp(0 + 0𝑥𝑖)= 0.5

1 − 𝜋(𝑥𝑖) = 1 − 0.5 = 0.5

ln(1 − 𝜋(𝑥𝑖)) = −0.6931.

Nilai fungsi log-kemungkinan pada 𝛽0(0)

= 𝛽1(0)

= 0 adalah

𝑙(0,0) = ∑[𝑦𝑖(0 + 0𝑥𝑖) +

100

𝑖=1

ln(1 − 𝜋(𝑥𝑖))

= 100(−0.6931)

= −69.31

Dilihat pada Tabel 3.4. Hasil perhitungan dengan 𝛽0(0)

= 0 dan 𝛽1(0)

= 0

(lampiran 2) didapat:

[𝛽0

(1)

𝛽1(1)

] = [𝛽0

(0)

𝛽1(0)

] + [𝛽0

(0)

𝛽1(0)

]

−1

[𝑆1(𝛽0

(0), 𝛽1

(0))

𝑆2(𝛽0(0)

, 𝛽1(0)

)]

= [00] + [

25 1109.51109.5 52640

]−1

[−7 −14

]

= [00] + [

0.6192 −0.0130−0.0130 0.0003

]

[−7 −14

]

= [00] + [

−4.1518 0.0872

]


56

=[−4.1518

0.087]

Selanjutnya, dengan lima iterasi dari persamaan (3.11) didapatkan nilai

akhir 𝛽0̂ =-5.3112 dan 𝛽1̂ =0.1110 seperti yang terlihat pada tabel 3.9

dan langkah perhitungannya dapat dilihat pada lampiran 3.

Iterasi (j) 𝛽0(𝑗)

𝛽1(𝑗)

fungsi likelihood

0 0 0 -69.3147

1 -4.1518 0.0872 -440.2146

2 -5.1811 0.1083 -529.7331

3 -5.1904 0.1083 -531.3981

4 -5.3080 0.1109 -542.1340

5 -5.3112 0.1109 -531.5906

Tabel 3.9. Hasil perhitungan dari algoritma Newton-Raphson

Sehingga, nilai penduga persamaan (3.2) yang didapatkan diberikan

oleh persamaan sebagai berikut:

�̂�(𝑥) =𝑒−5.3112+0.1110xAGE

1 + 𝑒−5.3112+0.1110xAGE

yang menunjukkan peluang terjadinya CHD sebagai fungsi dari umur

(AGE).

Hal ini berarti dapat disimpulkan bahwa semakin bertambahnya

usia (AGE), maka peluang terjangkit penyakit CHD semakin besar.

Sehingga, penduga logit akan diberikan oleh persamaan:

�̂�(𝑥) = −5.3112 + 0.1110(AGE)


57

Persamaan di atas merupakan persamaan regresi linear sederhana, dengan

koefisien regresi variabel AGE sebesar 0.111 artinya jika AGE

bertambah 1th, maka kemungkinan terkena penyakit CHD akan

meningkat sebesar 0.111. Koefisien bernilai positif artinya terjadi

hubungan positif antara usia (AGE) dengan kemungkinan terkenanya

penyakit CHD, semakin bertambah nilai usia (AGE) maka akan semakin

meningkat resiko terkena penyakit CHD. Dengan 𝛽0 = −5.3112 adalah

nilai log yang diprediksi ketika AGE = 0.

IV. Odds Ratio pada Regresi Logistik

Diasumsikan bahwa variabel independen (𝑥) dikodekan sebagai

nol atau satu. Sehingga perbedaan logit untuk 𝑥 = 1 dan 𝑥 = 0 adalah

𝑔(𝑡) − 𝑔(0) = [𝛽0 + 𝛽1] − [𝛽0] = 𝛽1

Untuk menafsirkan hasil ini, kita menggunakan ukuran asosiasi yang

disebut rasio odds (OR). Nilai odds paada 𝑥 = 1 didefinisikan sebagai

𝜋(1)

[1−𝜋(1)] dan nilai odds paada 𝑥 = 0 didefinisikan sebagai

𝜋(0)

[1−𝜋(0)].

Sehingga rasio odds diberikan oleh persamaan

𝑂𝑅 =

𝜋(1)[1 − 𝜋(1)]

𝜋(0)[1 − 𝜋(0)]

(3.20)

Dengan mensubsitusikan ekspresi untuk model regresi logistik yang

ditunjukkan pada Tabel 3.10 ke persamaan (3.20) didapatkan


58

Variabel

Dependen (Y)

Variabel Independen (x)

𝑥 = 1 𝑥 = 0

𝑦 = 1 𝜋(1) =𝑒𝛽0+𝛽1

1 + 𝑒𝛽0+𝛽1 𝜋(0) =

𝑒𝛽0

1 + 𝑒𝛽0

𝑦 = 0 1 − 𝜋(1) =1

1 + 𝑒𝛽0+𝛽1𝑥 1 − 𝜋(0) =

1

1 + 𝑒𝛽0

Total 1 1

Tabel 3.10 Nilai Model Regresi Logistik

𝑂𝑅 =

(𝑒𝛽0+𝛽1

1 + 𝑒𝛽0+𝛽1)

(1

1 + 𝑒𝛽0+𝛽1𝑥)

(𝑒𝛽0

1 + 𝑒𝛽0)

(1

1 + 𝑒𝛽0)

=𝑒𝛽0+𝛽1

𝑒𝛽0

= 𝑒(𝛽0+𝛽1)−𝛽0

= 𝑒𝛽1

Sehingga hubungan antara rasio odds dan koefisien regresi adalah

𝑂𝑅 = 𝑒𝛽1

Dengan menggunakan data pada Contoh 3.4 dicari rasio odds yaitu

dengan membuat variabel baru, AGE yang didefinisikan nilai 1 jika umur

responden lebih besar dari atau sama dengan 55 dan 0 jika umur

responden lebih kecil dari 55 disajikan dalam Tabel 3.4.


59

CHD (y)

AGE (x)

Total ≥ 55

(1)

< 55

(0)

𝑦 = 1

(Ada) 21 22 43

𝑦 = 0

(Tidak Ada)

6 51 57

Total 27 73 100

Tabel 3.11 Klasifikasi Silang AGE pada 55 tahun dan CHD untuk 100

responden

Maka 𝑂𝑅 =21

622

51

= 8.11

Yang mempunyai arti bahwa responden yang berusia lebih dari sama

dengan 55 tahun beresiko memiliki CHD 8.11 (atau 8:1) kali lipat

dibandingkan responden yang berusia kurang dari 55 tahun.

B. REGRESI LOGISTIK ORDINAL

I. Model Regresi Logistik Ordinal

Analisis regresi logistik ordinal merupakan salah satu metode

statistik yang menggambarkan hubungan antara suatu variabel dependen

(𝑌) dengan lebih dari satu variabel independen (𝑋) dengan variabel

dependennya lebih dari dua kategori dan skala pengukuran bersifat

tingkatan (Hosmer dan Lemeshow, 2000). Regresi logistik ordinal juga


60

merupakan perluasan dari regresi logistik biner dengan variabel

dependen berskala ordinal yang terdiri dari tiga atau lebih kategori.

Model regresi logistik ordinal adalah sebagai berikut:

𝜋(𝑥) =𝑒𝑔(𝑥)

1 + 𝑒𝑔(𝑥) (3.21)

Dengan 𝑔(𝑥) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 .

Model yang dipakai untuk regresi logistik ordinal adalah model

logit kumulatif. Sifat dari variabel dependen Y diberikan dalam peluang

kumulatif sehingga model yang didapatkan dengan membandingkan

peluang kumulatif yaitu “peluang Y kurang dari sama dengan kategori

respon ke-j pada p variabel independen yang dinyatakan dalam vektor

𝑿𝑖”, 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) dengan peluang Y lebih dari kategori ke-j variabel

dependen, 𝑃(𝑌 > 𝑗|𝑿𝑖) (Hosmer dan Lemeshow, 2000: 290). Jika

diasumsikan 𝑿𝒊 = [𝑋𝑖1 𝑋𝑖2 … 𝑋𝑖𝑝]𝑇 dan 𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝). Maka

peluang kumulatif didefinisikan sebagai berikut:


𝑝𝑘=1 )


(3.22)

Dengan

𝑗 = 1, 2, … , 𝐽 − 1, 𝑖 = 1, 2, … , 𝑛 dan 𝑘 = 1, 2, … , 𝑝

𝛽0𝑗 = parameter intersep kategori ke-j

𝑌𝑖 = pengamatan ke-i variabel Y

𝑋𝑖𝑘 = pengamatan ke-i variabel X ke-k

𝛽𝑘 = parameter regresi ke-k


61

Maka berikut formulasi model logit kumulatif didapatkan:

𝐿𝑜𝑔𝑖𝑡 𝑃(𝑌 ≤ 𝑗|𝑿𝑖)

= ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)

𝑃(𝑌 > 𝑗|𝑿𝑖))

= ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)

1 − 𝑃(𝑌 ≤ 𝑗|𝑿𝑖))

= ln

(

exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )


1 −exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )

1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))

= ln

(





−exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )

1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))

= ln

(



1 + +exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

)

= ln (exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝

𝑘=1

))

= 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝

𝑘=1

Maka didapatkan sebagai berikut:

𝑔(𝑥) = ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)

𝑃(𝑌 > 𝑗|𝑿𝑖)) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝

𝑘=1

(3.23)

Fungsi klasifikasi dari variabel dependen kategori ke-j terbentuk

𝐽 − 1, Jika ∅𝑗(𝑿𝑖) = 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) menyatakan peluang kategori ke-j dari


62

variabel dependen pada p variabel independen yang dinyatakan dalam

vektor 𝑿𝑖 dan 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) menyatakan peluang kumulatif pada p

variabel independen yang dinyatakan dalam vektor 𝑿𝑖, maka nilai

∅𝑗(𝑿𝑖) adalah sebagai berikut:

𝛾𝑗 = ∅𝑗𝑿𝑖 = 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) = ∅1(𝑿𝑖) + ∅2(𝑿𝑖) + ⋯+ ∅𝑗(𝑿𝑖) (3.24)

dengan 𝑗 = 1, 2, … , 𝐽.

Misalkan 𝛾𝑗 = ∅1(𝑿𝑖) + ⋯+ ∅𝑗(𝑿𝑖). Maka 𝛾1 = ∅1(𝑿𝑖), 𝛾2 =

∅1(𝑿𝑖) + ∅2(𝑿𝑖), dan 𝛾𝐽 = ∅1(𝑿𝑖) + ⋯+ ∅𝐽(𝑿𝑖) = 1. Model Regresi

Logistik Ordinal diberikan sebagai berikut:

𝑙𝑜𝑔𝑖𝑡(𝛾1) = log (𝛾1

1 − 𝛾1) = 𝛽01 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘

𝑙𝑜𝑔𝑖𝑡(𝛾2) = log (𝛾2

1 − 𝛾2) = 𝛽02 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘

⋯

𝑙𝑜𝑔𝑖𝑡(𝛾𝐽−1) = log (𝛾𝐽−1

1 − 𝛾𝐽−1) = 𝛽0𝐽−1 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘

Sehingga

𝛾𝑗 = ∅1(𝑿𝑖) + ∅2(𝑿𝑖) + ⋯+ ∅𝑗(𝑿𝑖) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )


(3.25)

Dengan 𝑗 = 1,… , 𝐽 − 1 dan 𝛾𝐽 = 1. Model ini diketahui sebagai model

proporsional oods karena rasio oods kejadian (𝑌 ≤ 𝑗) merupakan

indikator kategori independen.


63

Jika 𝐽 = 3 kategori variabel dependen, dengan 𝑗 = 1,2,3 maka nilai

peluang untuk masing-masing kategori variabel dependen adalah sebagai

berikut:

∅1(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)

= 𝑃(𝑌 ≤ 1|𝑿𝑖)

=exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )

1 + exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

(3.26)

∅2(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)

= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)


𝑝𝑘=1 )


−exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )


(3.27)

∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)

= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)

= 1 −exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )


(3.28)

Perhatikan bahwa dengan J = 3 maka

∅1(𝑿𝑖) + ∅2(𝑿𝑖) + ∅3(𝑿𝑖) = 1

II. Pendugaan Model Regresi Logistik Ordinal

Metode kemungkinan maksimum (Maximum Likelihood

Estimator) merupakan metode yang digunakan untuk menduga

parameter-parameter model regresi logistik dengan memberikan nilai

estimasi 𝜷 dengan memaksimumkan fungsi Likelihood analog dengan

persamaan (3.5).


64

Andaikan, untuk penyederhanaan variabel respon Y mempunyai 3

kategori (𝑗 = 1, 2, 3). Andaikan pula ada sebanyak p variabel bebas 𝑿𝑖

(𝑋𝑖1, 𝑋𝑖2, … , 𝑋𝑖𝑝) dan ada sampel random sebanyak n (𝑖 = 1, … , 𝑛).

Ketika lebih dari satu observarsi Y muncul pada nilai 𝑥𝑖. Berikut

fungsi likelihood untuk model regresi logistik ordinal untuk sampel

dengan n sampel random:

𝐿(𝜷) = ∏[∅1(𝑿𝑖)𝑦1𝑖∅2(𝑿𝑖)

𝑦2𝑖∅3(𝑿𝑖)𝑦3𝑖]

𝑛

𝑖=1

(3.29)

dengan 𝑖 = 1,… , 𝑛 dan 𝐽 = 3

Dari persamaan (3.28) didapatkan fungsi ln-likelihood sebagai berikut:

𝑙(𝜷) = ∑𝑦1𝑖 ln[∅1(𝑿𝑖) ] + 𝑦2𝑖 ln[∅2(𝑿𝑖)

] + 𝑦3𝑖 ln[∅3(𝑿𝑖) ]

𝑛

𝑖=1

(3.30)

Dengan mensubstitusikan persamaan (3.26, 3.27 dan 3.28) ke persamaan

(3.30). Misalkan 𝑒𝑔𝑗(𝑥) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 , maka fungsi ln-

likelihoodnya menjadi:

𝑙(𝜷) = ∑𝑦1𝑖 ln [𝑒𝑔1(𝑥)

1 + 𝑒𝑔1(𝑥)]

𝑛

𝑖=1

+ 𝑦2𝑖 ln [𝑒𝑔2(𝑥)

1 + 𝑒𝑔2(𝑥)−

𝑒𝑔1(𝑥)

1 + 𝑒𝑔1(𝑥)]

+ 𝑦3𝑖 ln [1 −𝑒𝑔2(𝑥)

1 + 𝑒𝑔2(𝑥)]

(3.31)

Karena ln [𝑒𝑔2(𝑥)

1+𝑒𝑔2(𝑥) −𝑒𝑔1(𝑥)

1+𝑒𝑔1(𝑥)]


65

= ln [(𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(1 + 𝑒𝑔2(𝑥))

(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))]

=(𝑒𝑔2(𝑥)) + (𝑒𝑔2(𝑥))(𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(𝑒𝑔2(𝑥))

(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))

=(𝑒𝑔2(𝑥)) − (𝑒𝑔1(𝑥))

(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))

=𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 ) − 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )

(1 + 𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1

)) (1 + 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1

))

=𝑒

∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 𝑒(𝛽02−𝛽01)

(1+𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )(1+𝑒

𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

(3.32)

Maka fungsi log likelihood menjadi:

𝑙(𝜷) = ∑𝑦1𝑖 ((𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝

𝑘=1

) − ln (1 + 𝑒 𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))

𝑛

𝑖=1

+∑𝑦2𝑖 (∑ 𝛽𝑘𝑋𝑖𝑘

𝑝

𝑘=1

+ ln(𝑒𝛽02 − 𝑒𝛽01) − ln (1 + 𝑒 𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ) − ln (1 + 𝑒 𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 ))

𝑛

𝑖=1

+∑𝑦3𝑖 (− ln (1 + 𝑒 𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))

𝑛

𝑖=1

(3.33)

Maksimum likelihood dapat diperoleh dengan cara

mendiferensialkan fungsi likelihood terhadap parameter yang akan

diestimasi dan disamakan dengan nol.

Hasil turunan parsial pertama dari fungsi log-likehood terhadap

parameter 𝛽01 dan 𝛽02:


66

𝜕 𝐿(𝜷)

𝜕 𝛽01= ∑{𝑦1𝑖 (1 −

𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1

1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1

)+𝑦2𝑖 (−𝑒𝛽01

𝑒𝛽02 − 𝑒𝛽01−



)}

𝑛

𝑖=1

(3.34)

𝜕 𝐿(𝜷)

𝜕 𝛽02= ∑{𝑦2𝑖 (

𝑒𝛽02

𝑒𝛽02 − 𝑒𝛽01−



) + 𝑦3𝑖 (−𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1


)}

𝑛

𝑖=1

(3.35)

Pada koefisien regresi dimisalkan 𝜷 = (𝛽1,𝛽2) maka hasil turunan

parsial pertama dari fungsi likelihood terhadap parameter 𝛽1 dan 𝛽2

𝜕 𝐿(𝜷)

𝜕𝛽1 = ∑{𝑦1𝑖 (𝑋𝑖1 −

𝑋𝑖1 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1


)

𝑛

𝑖=1

+ 𝑦2𝑖 (𝑋𝑖1 −𝑋𝑖1 𝑒

𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1


−𝑋𝑖1 𝑒



)

+ 𝑦3𝑖 (𝑋𝑖1 −𝑋𝑖1𝑒



)}

(3.36)

𝜕 𝐿(𝜷)

𝜕𝛽2 = ∑{𝑦1𝑖 (𝑋𝑖2 −


𝑝𝑘=1


)

𝑛

𝑖=1




−𝑋𝑖2 𝑒



)




)}

(3.37)

Penyelesaian turunan pertama merupakan fungsi nonlinear,

sehingga digunakan metode numerik yaitu iterasi Newton-Raphson untuk

mendapatkan penduga parameternya.

Hasil turunan parsial kedua dari fungsi log-likehood terhadap

parameter:


67

𝜕2 𝑙(𝜷)

𝜕𝛽012 = ∑{𝑦1𝑖 (−


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦2𝑖 (−𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2−


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(3.38)

𝜕2 𝑙(𝜷)

𝜕𝛽01𝛽02= ∑{𝑦2𝑖 (

𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2)}

𝑛

𝑖=1

(3.39)

𝜕2 𝑙(𝜷)

𝜕𝛽02𝛽01= ∑{𝑦2𝑖 (

𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2)}

𝑛

𝑖=1

(3.40)

𝜕2 𝑙(𝜷)

𝜕 𝛽022 = ∑{𝑦2𝑖 (

𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2−


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦3𝑖 (−𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1

(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(3.41)

𝜕2 𝑙(𝜷)

𝜕𝛽01𝛽1 = ∑{−(𝑦1𝑖 + 𝑦2𝑖) (

𝑋𝑖1𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(3.42)

𝜕2 𝑙(𝜷)

𝜕𝛽01𝛽2= ∑{−(𝑦1𝑖 + 𝑦2𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(3.43)

𝜕2 𝑙(𝜷)

𝜕𝛽02𝛽1 = ∑{−(𝑦2𝑖 + 𝑦3𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(3.44)

𝜕2 𝑙(𝜷)

𝜕𝛽02𝛽2= ∑{−(𝑦2𝑖 + 𝑦3𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(3.45)


68

𝜕2 𝑙(𝜷)

𝜕𝛽12 = ∑{𝑦1𝑖 (−


𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦2𝑖 (−𝑋𝑖1

2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1

(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2 −𝑋𝑖1


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

+ 𝑦3𝑖 (−𝑋𝑖1


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(3.46)

𝜕2 𝑙(𝜷)

𝜕𝛽22 = ∑{𝑦1𝑖 (−


𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦2𝑖 (−𝑋𝑖2


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2 −𝑋𝑖2


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

+ 𝑦3𝑖 (−𝑋𝑖2


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(3.47)

𝜕2 𝑙(𝜷)

𝜕𝛽1𝛽2= ∑{𝑦1𝑖 (−

𝑋𝑖1𝑋𝑖2𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦2𝑖 (−𝑋𝑖1𝑋𝑖2𝑒


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2 −𝑋𝑖1𝑋𝑖2𝑒


(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)



(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(3.48)


69

Metode Newton-Raphson yang digunakan untuk mendapatkan

penduga parameter yaitu sebagai berikut:

𝜷𝒕+𝟏 = 𝜷𝒕 − (𝑯𝒕)−𝟏𝒒𝒕 (3.49)

Dengan

𝒒𝒕 = (𝜕𝑙(𝜷)

𝜕𝛽01 𝜕𝑙(𝜷)

𝜕𝛽02 𝜕𝑙(𝜷)

𝜕𝛽1

𝜕𝑙(𝜷)

𝜕𝛽2)

𝑇

(3.50)

𝑯𝒕 =

(

𝜕2𝑙(𝜷)

𝜕𝛽012

𝜕2𝑙(𝜷)

𝜕𝛽01𝜕𝛽02

𝜕2𝑙(𝜷)

𝜕𝛽02𝛽01

𝜕2𝑙(𝜷)

𝜕𝛽022

𝜕2𝑙(𝜷)

𝜕𝛽01𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽01𝛽2

𝜕2𝑙(𝜷)

𝜕𝛽02𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽02𝛽2

𝜕2𝑙(𝜷)

𝜕𝛽1𝛽01

𝜕2𝑙(𝜷)

𝜕𝛽1𝛽02

𝜕2𝑙(𝜷)

𝜕𝛽2𝛽01

𝜕2𝑙(𝜷)

𝜕𝛽2𝛽02

𝜕2𝑙(𝜷)

𝜕𝛽12

𝜕2𝑙(𝜷)

𝜕𝛽1𝛽2

𝜕2𝑙(𝜷)

𝜕𝛽2𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽22 )

𝑻

(3.51)

Dengan banyaknya iterasi t = 0, 1, 2, …

Salah satu program aplikasi yang menggunakan metode Newton-

Raphson adalah SPSS. Berikut diberikan contohnya

Contoh 3.7

Dengan menggunakan data pada contoh buku “Applied Logistic

Regression” (Hosmer, 2000). Analisis ini bertujuan untuk melihat apakah

faktor dari ibu yang “merokok” dapat mempengaruhi kelahiran bayi

dengan berat badan rendah (BWT). Diberikan pengkodean variabel hasil,

yaitu BWT > 3500𝑔 (0), 3000𝑔 < BWT ≤ 3500𝑔 (1), 2500𝑔 <

BWT ≤ 3000𝑔(2), BWT ≤ 2500𝑔 (3). Status merokok (x) merupakan

bilangan biner (0 = tidak merokok, 1 = merokok). Tujuan dari penelitian


70

ini adalah menghitung nilai rasio odds pengaruh merokok pada berat

badan bayi lahir rendah. Sehingga didapatkan klasifikasi perkalian pada

Tabel 3.12 yaitu:

Kategori Berat Lahir (y)

Status Merokok (x)

Total Tidak

(0)

Iya

(1)

y = 0

(BWT > 3500)

35 11 46

y = 1

(3000 < BWT ≤ 3500)

29 17 46

y = 2

(2500 < BWT ≤ 3000)

22 16 38

y = 3

(BWT ≤ 2500)

29 30 38

Total 115 74 189

Tabel 3.12 Klasifikasi perkalian 4 kategori skala ordinal hasil berat lahir

bayi dengan status ibu merokok.

Sehingga nilai rasio odds pada variabel status merokok adalah:

𝑂�̂�(1,0) =17𝑥35

29𝑥11= 1.87

𝑂�̂�(2,0) =16𝑥35

22𝑥11= 2.31


71

𝑂�̂�(3,0) =10𝑥35

29𝑥11= 3.29

Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds merokok ibu untuk BWT4 = j

dengan BWT4 = 0. Sehingga dapat disimpulkan bahwa peningkatan rasio

odds menunjukkan adanya peningkatan berat badan bayi yang semakin

rendah ketika ibu merokok pada masa kehamilan.

Contoh 3.8

Dengan menggunakan data yang diberikan pada lampiran 4 akan

dicari nilai penduga model kemungkinan maksimum. Dengan data ini

analisis bertujuan untuk melihat faktor-faktor yang mempengaruhi

keputusan keinginan melanjutkan ke jenjang yang lebih tinggi (y).

Dengan data keinginan melanjutkan merupakan data ordinal yang

mempunyai beberapa kategori (tidak berminat (0), agak berminat (1), dan

sangat berminat (2)). Status pendidikan orang tua (𝑥1) merupakan

bilangan biner (0 = SMA, 1 = diatas SMA). GPA (𝑥2) adalah nilai ujian

responden. Tujuan dari penelitian ini adalah menduga model hubungan

antara pendidikan orang tua dan GPA dengan minat melanjutkan ke

jenjang yang lebih tinggi. Dengan demikian, variabel dependen

ordinalnya adalah keinginan melanjutkan ke jenjang yang lebih tinggi,

sedangkan variabel bebasnya adalah GPA dan status pendidikan

orangtua. Hasil penelitian dijelaskan di bawah ini.


72

Data: Keinginan_melanjutkan

Tabel 3.13 Output

3) Parameter Estimates

Estimate Std. Error

Threshold [keinginan_melanjutkan = 0] 13.908 5.593

[keinginan_melanjutkan = 1] 17.024 6.110

Location pendidikan_ortu -1.111 1.281

nilai 5.611 2.091


73

Interpretasi output SPSS:

Output 1) menjelaskan bahwa dari 20 responden penduduk

dewasa yang diketahui valid digunakan (tidak terdapat data yang

hilang). Ada 3 responden masuk dalam kategori tidak berminat

melanjutkan ke jenjang yang lebih tinggi, 8 responden masuk dalam

kategori gejala agak berminat melanjutkan ke jenjang yang lebih

tinggi, dan 9 responden masuk dalam kategori sangat berminat

melanjutkan ke jenjang yang lebih tinggi.

Output 2) menjelaskan hasil perhitungan mencari nilai

penduga parameter secara iterasi, dimana hasil akhirnya didapatkan

nilai penduga parameter konstan 𝛽01 (kategori tidak berminat) adalah

13.908 dan 𝛽02 (kategori agak berminat) adalah 17.024. Lalu nilai

penduga parameter 𝛽1 (pendidikan orang tua) adalah -1.111 dan 𝛽2

(GPA) adalah 5.611.

Output 3) adalah hasil akhir dari estimasi model regresi

logistik ordinal disertai dengan standar error. 𝛽01 = 13.908, 𝛽02 =

17.024, 𝛽1 = −1.111, dan 𝛽2 =5.611.

Persamaan regresi logistiknya adalah

(𝑃(𝑌 ≤ 0|𝑿𝑖)) =exp(13.908 − 1.111X1 + 5.611X2)

1 + exp(13.908 − 1.111X1 + 5.611X2)

(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(17.024 − 1.111X1 + 5.611X2)

1 + exp(17.024 − 1.111X1 + 5.611X2)


74

Model peluang persamaan (3.25, 3.26, dan 3.27) yang

didapatkan dari persamaan regresi logistik ordinal keputusan

keinginan melanjutkan ke jenjang yang lebih tinggi adalah sebagai

berikut:

∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)

= 𝑃(𝑌 ≤ 1|𝑿𝑖)

=exp(13.908 − 1.111X1 + 5.611X2)

1 + exp(13.908 − 1.111X1 + 5.611X2)

∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)

= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)

=exp(17.024 − 1.111X1 + 5.611X2)

1 + exp(17.024 − 1.111X1 + 5.611X2)

−exp(13.908 − 1.111X1 + 5.611X2)

1 + exp(13.908 − 1.111X1 + 5.611X2)

∅3(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)

= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)

= 1 −exp(17.024 − 1.111X1 + 5.611X2)

1 + exp(17.024 − 1.111X1 + 5.611X2)

Rasio Odds

Nilai rasio odds masing-masing koefisien pada model yang diperoleh

yaitu model keinginan melanjutkan ke jenjang yang lebih tinggi yang

dipengaruhi oleh status pendidikan orangtua dan GPA adalah sebagai

berikut:


75

1. Nilai rasio odds pada variabel status pendidikan orang tua (𝑥1)

dengan 𝑥 = 1 (di atas SMA) dan 𝑥 = 0 (SMA) sehingga

didapatkan klasifikasi perkalian untuk empat kategori keinginan

melanjutkan dengan pendidikan orang tua adalah

Keinginan

melanjutkan (y)

Status pendidikan orang tua (𝑥1)

Total SMA

(0)

di atas SMA

(1)

𝑦 = 0

(tidak berminat)

2 1 3

𝑦 = 1

(agak berminat)

3 5 8

𝑦 = 2

(berminat sekali)

3 6 9

Total 8 12 20

Tabel 3.14 Klasifikasi silang antara keinginan melanjutkan

dan pendidikan orangtua.

Sehingga nilai rasio odds keinginan melanjutkan dengan

pendidikan orang tua di atas SMA adalah

𝑂�̂�(1,0) =5𝑥2

3𝑥1= 3.33

𝑂�̂�(2,0) =6𝑥2

3𝑥1= 4

Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds pendidikan di atas

SMA untuk y = j dengan y = 0. Sehingga dapat disimpulkan


76

bahwa peningkatan rasio odds menunjukkan adanya

peningkatan minat responden melanjutkan ke jenjang lebih

tinggi yang semakin tinggi ketika status pendidikan orangtua di

atas SMA. Lalu akan dicari kemungkinan rasio odds untuk

responden dengan pendidikan orangtua di atas SMA:

𝑂�̂�(𝑗, 𝑗 − 1) = exp(1.111) = 3.037394

Dengan j = 1, 2, 3. Berdasarkan hasil perhitungan, nilai odds

rasio untuk variabel pendidikan orangtua (X1) adalah sebesar

3.037394 artinya “pendidikan orangtua di atas SMA” beresiko

mempengaruhi keputusan responden untuk melanjutkan ke

jenjang yang lebih tinggi sebesar 3.037394 kali (atau 3: 1)

dibanding “pendidikan orangtua SMA”.

2. Nilai odds ratio pada variabel variabel GPA (𝑥2) dengan 𝑥 = 1

( ≥ 3 ) dan 𝑥 = 0 ( > 3 ) sehingga didapatkan klasifikasi silang

untuk empat kategori keinginan melanjutkan dengan nilai GPA

adalah

Keinginan

melanjutkan (y)

GPA (𝑥2)

Total > 3

(0)

≥ 3

(1)

𝑦 = 0

(tidak berminat)

2 1 3

𝑦 = 1

(agak berminat)

5 3 8


77

𝑦 = 2

(berminat sekali)

1 8 9

Total 8 12 20

Tabel 3.15 Klasifikasi silang antara keinginan melanjutkan dan

GPA

Sehingga nilai rasio odds keinginan melanjutkan dengan GPA

≥ 3 adalah

𝑂�̂�(1,1) =3𝑥2

5𝑥1= 1.2

𝑂�̂�(2,1) =8𝑥2

1𝑥1= 16

Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds GPA ≥ 3untuk y = j

dengan y = 0. Sehingga dapat disimpulkan bahwa adanya

peningkatan minat responden melanjutkan ke jenjang lebih

tinggi yang semakin tinggi ketika GPA ≥ 3. Lalu akan dicari

kemungkinan rasio odds untuk responden dengan GPA ≥ 3

𝑂�̂�(3,2) = exp(5.611) = 273.4175

Dengan j = 1, 2, 3. Berdasarkan hasil perhitungan, nilai odds

rasio untuk variabel GPA (X2)adalah sebesar 273.4175 artinya

“GPA ≥ 3” beresiko mempengaruhi keputusan responden untuk

melanjutkan ke jenjang yang lebih tinggi sebesar 273.4175 kali

(atau 273: 1) dibandingkan dengan GPA < 3.


78

Perhitungan odds ratio dengan menggunakan salah satu sampel

jawaban responden yaitu jika diketahui responden dengan pendidikan

orangtua SMA dan memiliki GPA sebesar 2.5.

(𝑃(𝑌 ≤ 0|𝑿𝑖)) =exp(13.908 − 1.111(0) + 5.611(2.5))

1 + exp(13.908 − 1.111(0) + 5.611(2.5))

= 0.999999999999262

(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(17.024 − 1.111(1) + 5.611(3))

1 + exp(17.024 − 1.111(1) + 5.611(3))

= 0.999999999999967

Sehingga peluang persamaan regresi logistik ordinal keputusan

keinginan melanjutkan ke jenjang yang lebih tinggi adalah sebagai

berikut:

∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)

= 𝑃(𝑌 ≤ 1|𝑿𝑖)

=exp(13.908 − 1.111(0) + 5.611(2.5))

1 + exp(13.908 − 1.111(0) + 5.611(2.5))

= 0.999999999999262

∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)

= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)

=exp(17.024 − 1.111(0) + 5.611(2.5))

1 + exp(17.024 − 1.111(0) + 5.611(2.5))

−exp(13.908 − 1.111(0) + 5.611(2.5))

1 + exp(13.908 − 1.111(0) + 5.611(2.5))

= 0.999999999999967 − 0.999999999999262


79

= 0.000000000000704

∅3(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)

= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)

= 1 −exp(17.024 − 1.111(0) + 5.611(2.5))

1 + exp(17.024 − 1.111(0) + 5.611(2.5))

= 1 − 0.999999999999967

= 0.00000000000032

Responden yang pendidikan orangtuanya SMA dan memiliki GPA

sebesar 2.5 maka secara umum maka responden tidak berminat

melanjutkan ke jenjang yang lebih tinggi adalah

0.999999999999262, peluang responden agak berminat melanjutkan

ke jenjang yang lebih tinggi adalah 0.000000000000704, dan

peluang responden sangat berminat melanjutkan ke jenjang yang lebih

tinggi adalah 0.00000000000032. Dari hasil peluang di atas dapat

disimpulkan bahwa jika responden memiliki orangtua yang

pendidikannya SMA berpeluang untuk mempengaruhi responden

tidak berminat melanjutkan ke jenjang lebih tinggi

sebesar 0.999999999999262 dan berpeluang untuk mempengaruhi

responden berminat melanjutkan ke jenjang lebih tinggi sebesar

0.000000000000737.


80

BAB IV

APLIKASI REGRESI LOGISTIK ORDINAL

BAB IV APLIKASI REGRESI LOGISTIK ORDINAL Dalam bab ini, analisis regresi logistik akan diterapkan dalam contoh. Data

yang diambil merupakan hasil data yang diambil pada buku Categorical Data

Analysis (2002). Pengolahan data dilakukan dengan program SPSS. Penggunaan

program SPSS ini bertujuan untuk memudahkan dan mempercepat proses analisis.

A. PENDUGAAN PARAMETER

Pada data yang diberikan (lampiran 5) kategori variabel dependen yang

diketahui dimana 𝑗 = 1, 2, 3, 4. Maka peluang untuk masing-masing kategori

dependen adalah:

∅1(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)

= 𝑃(𝑌 ≤ 1|𝑿𝑖)


𝑝𝑘=1 )


(4.1)

∅2(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)

= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)


𝑝𝑘=1 )



𝑝𝑘=1 )


(4.2)

∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)

= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)


81


𝑝𝑘=1 )



𝑝𝑘=1 )


(4.3)

∅4(𝑿𝑖) = 𝑃(𝑌 = 4|𝑿𝑖)

= 𝑃(𝑌 ≤ 4|𝑿𝑖) − 𝑃(𝑌 ≤ 3|𝑿𝑖)


𝑝𝑘=1 )



𝑝𝑘=1 )


= 1 −exp(𝛽03 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )


(4.4)

Maka fungsi untuk model regresi logistik ordinal adalah

𝐿(𝜷) = ∏[∅1(𝑿𝑖)𝑦1𝑖∅2(𝑿𝑖)

𝑦2𝑖∅3(𝑿𝑖)𝑦3𝑖∅4(𝑿𝑖)

𝑦4𝑖] ,

𝑛

𝑖=1

(4.5)

dengan 𝑖 = 1,… , 𝑛 dan 𝐽 = 4

Dari persamaan (4.5) didapatkan fungsi ln-likelihood sebagai berikut:

𝑙(𝜷) = ∑𝑦1𝑖 ln[∅1(𝑿𝑖) ] + 𝑦2𝑖 ln[∅2(𝑿𝑖)

] + 𝑦3𝑖 ln[∅3(𝑿𝑖) ] + 𝑦4𝑖 ln[∅4(𝑿𝑖)

]

𝑛

𝑖=1

(4.6)

Dengan mensubstitusikan persamaan (4.1, 4.2, 4.3, dam 4.4) ke

persamaan (4.5). Misalkan 𝑒𝑔𝑗(𝑥) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 , maka fungsi ln

likelihoodnya menjadi:

𝑙(𝜷) = ∑𝑦1𝑖 ln [𝑒𝑔1(𝑥)

1 + 𝑒𝑔1(𝑥)]

𝑛

𝑖=1


1 + 𝑒𝑔2(𝑥)−

𝑒𝑔1(𝑥)

1 + 𝑒𝑔1(𝑥)]


1 + 𝑒𝑔3(𝑥)−

𝑒𝑔2(𝑥)

1 + 𝑒𝑔2(𝑥)]+ 𝑦4𝑖 ln [1 −

𝑒𝑔3(𝑥)

1 + 𝑒𝑔3(𝑥)]

(4.7)

Karena ln [𝑒𝑔2(𝑥)

1+𝑒𝑔2(𝑥) −𝑒𝑔1(𝑥)

1+𝑒𝑔1(𝑥)]


82

= ln [(𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(1 + 𝑒𝑔2(𝑥))

(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))]

=(𝑒𝑔2(𝑥)) + (𝑒𝑔2(𝑥))(𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(𝑒𝑔2(𝑥))

(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))

=(𝑒𝑔2(𝑥)) − (𝑒𝑔1(𝑥))

(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))

=𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 ) − 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )

(1 + 𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1

)) (1 + 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1

))

=𝑒∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 𝑒(𝛽02−𝛽01)

(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ) (1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1 )

(4.8)

Maka fungsi log likelihood menjadi:

𝑙(𝜷) = ∑𝑦1𝑖 ((𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘

𝑝

𝑘=1

) − ln (1 + 𝑒 𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))

𝑛

𝑖=1


𝑝

𝑘=1


𝑝𝑘=1 ))

𝑛

𝑖=1


𝑝

𝑘=1


𝑝𝑘=1 ))

𝑛

𝑖=1

+∑𝑦4𝑖 (− ln (1 + 𝑒 𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))

𝑛

𝑖=1

(4.9)

Maksimum likelihood dapat diperoleh dengan cara mendiferensialkan

fungsi likelihood terhadap parameter yang akan diestimasi dan disamakan

dengan nol.


83

Hasil turunan parsial pertama dari fungsi log-likehood terhadap

parameter 𝛽01, 𝛽02, dan 𝛽03:

𝜕 𝑙(𝜷)

𝜕 𝛽01= ∑ {𝑦1𝑖 (1 −



)+ 𝑦2𝑖 (−𝑒𝛽01

𝑒𝛽02 − 𝑒𝛽01

𝑛

𝑖=1

−𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1


)}

(4.10)

𝜕 𝑙(𝜷)

𝜕 𝛽02= ∑ {𝑦2𝑖 (

𝑒𝛽02

𝑒𝛽02 − 𝑒𝛽01−



)

𝑛

𝑖=1

+ 𝑦3𝑖 (−𝑒𝛽02

𝑒𝛽03 − 𝑒𝛽02−



)}

(4.11)

𝜕 𝑙 (𝜷)

𝜕 𝛽03= ∑{𝑦3𝑖 (

𝑒𝛽03

𝑒𝛽03 − 𝑒𝛽02−



)

𝑛

𝑖=1


𝑝𝑘=1


)}

(4.12)

Pada koefisien regresi dimisalkan 𝜷 = (𝛽1,𝛽2) maka hasil turunan

parsial pertama dari fungsi likelihood terhadap parameter 𝛽1 dan 𝛽2:

𝜕 𝑙(𝜷)

𝜕𝛽1 = ∑{𝑦1𝑖 (𝑋𝑖1 −


𝑝𝑘=1


)

𝑛

𝑖=1




−𝑋𝑖1 𝑒



)




−𝑋𝑖1 𝑒



)




)}

(4.13)


84

𝜕 𝑙(𝜷)

𝜕𝛽2 = ∑{𝑦1𝑖 (𝑋𝑖2 −


𝑝𝑘=1


)

𝑛

𝑖=1




−𝑋𝑖2 𝑒



)




−𝑋𝑖2 𝑒



)




)}

(4.14)

Penyelesaian turunan pertama merupakan fungsi nonlinear, sehingga

digunakan metode numerik yaitu iterasi Newton-Rhapson untuk mendapatkan

penduga parameternya.

Hasil turunan parsial kedua dari fungsi log-likehood terhadap

parameter:

𝜕2 𝑙(𝜷)

𝜕𝛽012 = ∑{𝑦1𝑖 (−


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦2𝑖 (−𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2−


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(4.15)

𝜕2 𝑙(𝜷)

𝜕𝛽01𝛽02= ∑{𝑦2𝑖 (

𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2)}

𝑛

𝑖=1

(4.16)

𝜕2 𝑙(𝜷)

𝜕𝛽01𝛽03= 0 (4.17)

𝜕2 𝑙(𝜷)

𝜕𝛽02𝛽01= ∑{𝑦2𝑖 (

𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2)}

𝑛

𝑖=1

(4.18)


85

𝜕2 𝑙(𝜷)

𝜕 𝛽022 = ∑{𝑦2𝑖 (

𝑒𝛽01+𝛽02

(𝑒𝛽02 − 𝑒𝛽01)2−


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦3𝑖 (−𝑒𝛽02+𝛽03

(𝑒𝛽03 − 𝑒𝛽02)2−


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(4.19)

𝜕2 𝑙(𝜷)

𝜕𝛽02𝛽03= ∑{𝑦3𝑖 (

𝑒𝛽02+𝛽03

(𝑒𝛽03 − 𝑒𝛽02)2)}

𝑛

𝑖=1

(4.20)

𝜕2 𝑙(𝜷)

𝜕𝛽03𝛽01= 0 (4.21)

𝜕2 𝑙(𝜷)

𝜕𝛽03𝛽02= ∑{𝑦3𝑖 (

𝑒𝛽02+𝛽03

(𝑒𝛽03 − 𝑒𝛽02)2)}

𝑛

𝑖=1

(4.22)

𝜕2 𝑙(𝜷)

𝜕 𝛽032 = ∑{𝑦3𝑖 (

𝑒𝛽02+𝛽03

(𝑒𝛽03 − 𝑒𝛽02)2−


(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1


𝑝𝑘=1

(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(4.23)

𝜕2 𝑙(𝜷)

𝜕𝛽01𝛽1 = ∑{−(𝑦1𝑖 + 𝑦2𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(4.24)

𝜕2 𝑙(𝜷)

𝜕𝛽01𝛽2= ∑{−(𝑦1𝑖 + 𝑦2𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(4.25)

𝜕2 𝑙(𝜷)

𝜕𝛽02𝛽1 = ∑{−(𝑦2𝑖 + 𝑦3𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(4.26)

𝜕2 𝑙(𝜷)

𝜕𝛽02𝛽2= ∑{−(𝑦2𝑖 + 𝑦3𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(4.27)


86

𝜕2 𝑙(𝜷)

𝜕𝛽03𝛽1 = ∑{−(𝑦3𝑖 + 𝑦4𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(4.28)

𝜕2 𝑙(𝜷)

𝜕𝛽03𝛽2= ∑{−(𝑦3𝑖 + 𝑦4𝑖) (


𝑝𝑘=1

(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

𝑛

𝑖=1

(4.29)

𝜕2 𝑙(𝜷)

𝜕𝛽12 = ∑{𝑦1𝑖 (−


𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦2𝑖 (−𝑋𝑖1


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2 −𝑋𝑖1


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 𝛽)

2)

+ 𝑦3𝑖 (−𝑋𝑖1


(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2 −𝑋𝑖1


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

+ 𝑦4𝑖 (−𝑋𝑖1


(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(4.30)

𝜕2 𝑙(𝜷)

𝜕𝛽22 = ∑{𝑦1𝑖 (−


𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1

+ 𝑦2𝑖 (−𝑋𝑖2


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2 −𝑋𝑖2


(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

+ 𝑦3𝑖 (−𝑋𝑖2


(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2 −𝑋𝑖2


(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

+ 𝑦4𝑖 (−𝑋𝑖2


(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(4.31)


87

𝜕2 𝑙(𝜷)

𝜕𝛽1𝛽2= ∑{𝑦1𝑖 (−

𝑋𝑖1𝑋𝑖2𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘

𝑝𝑘=1

(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)

𝑛

𝑖=1



(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )



(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)



(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )



(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)



(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )

2)}

(4.32)

Metode Newton-Raphson yang digunakan untuk mendapatkan penduga

parameter yaitu sebagai berikut:

𝜷𝒕+𝟏 = 𝜷𝒕 − (𝑯𝒕)−𝟏𝒒𝒕 (4.33)

Dengan

𝒒𝒕 = (𝜕𝑙(𝜷)

𝜕𝛽01 𝜕𝑙(𝜷)

𝜕𝛽02 𝜕𝑙(𝜷)

𝜕𝛽03

𝜕𝑙(𝜷)

𝜕𝛽1

𝜕𝑙(𝜷)

𝜕𝛽2)

𝑇

(4.34)

𝑯𝒕 =

(

𝜕2𝑙(𝜷)

𝜕𝛽012

𝜕2𝑙(𝜷)

𝜕𝛽01𝜕𝛽02

𝜕2𝑙(𝜷)

𝜕𝛽01𝛽03

𝜕2𝑙(𝜷)

𝜕𝛽02𝛽01

𝜕2𝑙(𝜷)

𝜕𝛽022

𝜕2𝑙(𝜷)

𝜕𝛽02𝛽03

𝜕2𝑙(𝜷)

𝜕𝛽03𝛽01

𝜕2𝑙(𝜷)

𝜕𝛽03𝛽02

𝜕2𝑙(𝜷)

𝜕𝛽032

𝜕2𝑙(𝜷)

𝜕𝛽01𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽01𝛽2

𝜕2𝑙(𝜷)

𝜕𝛽02𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽02𝛽2

𝜕2𝑙(𝜷)

𝜕𝛽03𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽03𝛽2

𝜕2𝑙(𝜷)

𝜕𝛽1𝛽01

𝜕2𝑙(𝜷)

𝜕𝛽1𝛽02

𝜕2𝑙(𝜷)

𝜕𝛽1𝛽03

𝜕2𝑙(𝜷)

𝜕𝛽2𝛽01

𝜕2𝑙(𝜷)

𝜕𝛽1𝛽02 𝜕2𝑙(𝜷)

𝜕𝛽2𝛽03

𝜕2𝑙(𝜷)

𝜕𝛽03𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽03𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽2𝛽1

𝜕2𝑙(𝜷)

𝜕𝛽022 )

𝑻

(4.35)

dengan banyaknya iterasi t = 0, 1, 2, …


88

B. PERHITUNGAN DAN ANALISIS DATA

Tabel pada lampiran 6 merupakan data yang berasal dari studi

kesehatan mental dengan variabel randomnya (responden) adalah penduduk

dewasa yang berada di Negara Alachua, Florida. Dengan data kesehatan

mental (y) merupakan data ordinal yang mempunyai beberapa kategori (baik

(1), gejala sakit ringan (2), gejala sakit sedang (3), buruk (4)). Peristiwa

kehidupan (𝑥1) adalah gabungan dari jumlah dan keparahan dari peristiwa

hidup penting seperti kelahiran anak, pekerjaan baru, perceraian, atau

kematian dalam keluarga yang terjadi dalam jangka waktu 3 tahun. Nilai 𝑥1

dikategorikan menjadi " < 5" dan " ≥ 5". Status ekonomi sosial/SES (𝑥2)

merupakan bilangan biner (0 = rendah, 1 = tinggi). Tujuan dari penelitian ini

adalah mencari seberapa besar pengaruh peristiwa kehidupan dan status

ekonomi sosial/SES terhadap kesehatan mental. Hasil penelitian dijelaskan di

bawah ini.

Data: kesehatan_mental

Tabel 4.1 Output:


89

3) Parameter Estimates

Estimate Std. Error

Threshold [kesehatan_mental = 1] -.282 .623

[kesehatan_mental = 2] 1.213 .651

[kesehatan_mental = 3] 2.209 .717

Location SES -1.111 .614

peristiwa_kehidupan .319 .119

Interpretasi output SPSS:

Output 1) menjelaskan bahwa dari 40 responden penduduk

dewasa yang diketahui valid digunakan (tidak terdapat data yang

hilang). Ada 12 responden masuk dalam kategori baik, 12

responden masuk dalam kategori gejala sakit ringan, 7 responden

masuk dalam kategori gejala sakit sedang, dan 9 responden masuk

dalam kategori gejala buruk (parah).

Output 2) menjelaskan hasil perhitungan mencari nilai

penduga parameter secara iterasi, dimana hasil akhirnya didapatkan

nilai penduga parameter konstan 𝛽01 (kategori baik) adalah -0.282,


90

𝛽02 (kategori gejala sakit ringan) adalah 1.213, dan 𝛽03 (kategori

gejala sakit sedang) adalah 2.209. Lalu 𝛽1 (SES) adalah -1.111 dan

𝛽2 (peristiwa kehidupan) adalah 0.319.

Output 3) adalah hasil estimasi model regresi logistik ordinal

disertai dengan standar error. 𝛽01 = −0.282, 𝛽02 = 1.213, 𝛽03 =

2.209, 𝛽1 = −1.111, dan 𝛽2 = 0.319.

Persamaan regresi logistiknya adalah

(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(−0.282 + 0.319X1 − 1.111X2)

1 + exp(−0.282 + 0.319X1 − 1.111X2)

(𝑃(𝑌 ≤ 2|𝑿𝑖)) =exp(1.213 + 0.319X1 − 1.111X2)

1 + exp(1.213 + 0.319X1 − 1.111X2)

(𝑃(𝑌 ≤ 3|𝑿𝑖)) =exp( 2.209 + 0.319X1 − 1.111X2)

1 + exp(2.209 + 0.319X1 − 1.111X2)

Model peluang persamaan (3.25, 3.26, dan 3.27) yang

didapatkan dari persamaan regresi logistik ordinal resiko terkena

kesehatan mental adalah sebagai berikut:

∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)

= 𝑃(𝑌 ≤ 1|𝑿𝑖)

=exp(−0.282 + 0.319X1 − 1.111X2)

1 + exp(−0.282 + 0.319X1 − 1.111X2)

∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)

= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)


91

=exp(1.213 + 0.319X1 − 1.111X2)

1 + exp(1.213 + 0.319X1 − 1.111X2)

− exp(−0.282 + 0.319X1 − 1.111X2)

1 + exp(−0.282 + 0.319X1 − 1.111X2)

∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)

= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)

=exp( 2.209 + 0.319X1 − 1.111X2)

1 + exp(2.209 + 0.319X1 − 1.111X2)

−exp(1.213 + 0.319X1 − 1.111X2)

1 + exp(1.213 + 0.319X1 − 1.111X2)

∅4(𝑿𝑖) = 𝑃(𝑌 = 4|𝑿𝑖)

= 𝑃(𝑌 ≤ 4|𝑿𝑖) − 𝑃(𝑌 ≤ 3|𝑿𝑖)

= 1 −exp(2.209 + 0.319X1 − 1.111X2)

1 + exp(2.209 + 0.319X1 − 1.111X2)

Rasio odds

Nilai odds ratio masing masing koefisien pada model yang diperoleh

yaitu model terkena kesehatan mental dipengaruhi oleh peristiwa

kehidupan dengan status ekonomi sosial (SES) adalah sebagai berikut:

1. Nilai odds ratio pada variabel peristiwa kehidupan (𝑥1)

dengan 𝑥 = 1 (≥ 5) dan 𝑥 = 0 (< 5) sehingga didapatkan

klasifikasi silang untuk empat kategori terkena kesehatan

mental adalah


92

Kesehatan mental

(y)

Peristiwa kehidupan (𝑥1)

Total (< 5)

(0)

(≥ 5)

(1)

𝑦 = 1

(baik)

10 2 12

𝑦 = 2

(gejala sakit ringan)

6 6 12

𝑦 = 3

(gejala sakit sedang)

5 2 7

𝑦 = 4

(parah)

3 6 9

Total 24 16 40

Tabel 4.1 Klasifikasi silang antara kesehatan mental dan

status peristiwa kehidupan

Sehingga nilai rasio odds kesehatan mental dengan peristiwa

kehidupan sebesar ≥ 5 adalah

𝑂�̂�(2,0) =6𝑥10

6𝑥2= 5

𝑂�̂�(3,0) =2𝑥10

5𝑥2= 2

𝑂�̂�(4,0) =6𝑥10

3𝑥2= 10

Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds peristiwa kehidupan

sebesar ≥ 5 untuk y = j dengan y = 0. Sehingga dapat


93

disimpulkan bahwa peningkatan rasio odds menunjukkan

adanya peningkatan peluang responden untuk terkena

gangguan kesehatan mental ketika mempunyai peristiwa

kehidupan (≥ 5). Lalu akan dicari kemungkinan rasio odds

untuk responden dengan peristiwa kehidupan (≥ 5)

𝑂�̂�(𝑗, 𝑗 − 1) = exp(0.319) = 1.37571

Dengan 𝑗 = 1, 2, 3, 4. Berdasarkan hasil perhitungan, nilai

odds variabel peristiwa kehidupan (𝑋1) adalah

sebesar 1.375751 memberikan arti bahwa “peristiwa

kehidupan ((≥ 5)” beresiko mempengaruhi kesehatan mental

sebesar 1.375751 kali (13:10) dibanding “peristiwa kehidupan

(< 5)”.

2. Nilai odds ratio pada variabel status SES (𝑥2) dengan 𝑥 = 1

(tinggi) dan 𝑥 = 0 (rendah) sehingga didapatkan klasifikasi

silang untuk empat kategori kesehatan mental dengan status

SES.

3.

Kesehatan mental

(y)

status SES (𝑥2)

Total ( rendah )

(0)

(tinggi)

(1)

𝑦 = 1

(baik)

4 8 12

𝑦 = 2 4 8 12


94

(gejala sakit ringan)

𝑦 = 3

(gejala sakit sedang)

5 2 7

𝑦 = 4

(parah)

5 4 9

Total 18 22 40

Tabel 4.2 Klasifikasi silang antara kerusakan mental dan status

SES

Sehingga nilai rasio odds kesehatan mental dengan status SES

tinggi adalah

𝑂�̂�(2,1) =8𝑥4

4𝑥8= 1

𝑂�̂�(3,1) =2𝑥4

5𝑥8= 0.2

𝑂�̂�(4,1) =4𝑥4

5𝑥8= 0.4

Yang berarti bahwa penurunan rasio odds menunjukkan

adanya penurunan peluang responden untuk terkena kerusakan

mental ketika status SES tinggi. Lalu akan dicari kemungkinan

rasio odds untuk responden dengan status SES tinggi.

𝑂�̂�(𝑗, 𝑗 − 1) = exp(1.111) = 0.32923

Dengan 𝑗 = 1, 2, 3, 4. Nilai odds rasio untuk variabel SES (X2)

adalah sebesar 0.32923 artinya “status sosial ekonomi (SES)” tinggi

beresiko mempengaruhi kesehatan mental sebesar 0.32923 kali (atau

3:10) dibanding “SES” rendah.


95

Perhitungan odds ratio dengan menggunakan salah satu sampel

jawaban responden yaitu jika diketahui responden dengan peristiwa

kehidupan sebesar 3 dan memiliki SES yang rendah.

(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(−0.282 + 0.319(3) − 1.111(0))

1 + exp(−0.282 + 0.319(3) − 1.111(0))

= 0.6626

(𝑃(𝑌 ≤ 2|𝑿𝑖)) =exp(1.213 + 0.319(3) − 1.111(0))

1 + exp(1.213 + 0.319(3) − 1.111(0))

= 0.8975

(𝑃(𝑌 ≤ 3|𝑿𝑖)) =exp( 2.209 + 0.319(3) − 1.111(0))

1 + exp(2.209 + 0.319(3) − 1.111(0))

= 0.2224

Sehingga peluang persamaan regresi logistik ordinal resiko

terkena gangguan kesehatan mental adalah sebagai berikut:

∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)

= 𝑃(𝑌 ≤ 1|𝑿𝑖)

=exp(−0.282 + 0.319(3) − 1.111(0))

1 + exp(−0.282 + 0.319(3) − 1.111(0))

= 0.6626

∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)

= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)


96

=exp(1.213 + 0.319(3) − 1.111(0))

1 + exp(1.213 + 0.319(3) − 1.111(0))

− exp(−0.282 + 0.319(3) − 1.111(0))

1 + exp(−0.282 + 0.319(3) − 1.111(0))

= 0.8975 − 0.6626

= 0.2349

∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)

= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)

=exp( 2.209 + 0.319(3) − 1.111(0))

1 + exp(2.209 + 0.319(3) − 1.111(0))

−exp(1.213 + 0.319(3) − 1.111(0))

1 + exp(1.213 + 0.319(3) − 1.111(0))

= 0.2224 − 0.8975

= −0.6752

∅4(𝑿𝑖) = 𝑃(𝑌 = 4|𝑿𝑖)

= 𝑃(𝑌 ≤ 4|𝑿𝑖) − 𝑃(𝑌 ≤ 3|𝑿𝑖)

= 1 −exp ( 2.209 + 0.319(3) − 1.111(0))

1 + exp(2.209 + 0.319(3) − 1.111(0))

= 1 − 0.2224

= 0.7776

Responden yang memiliki peristiwa kehidupan sebesar 3 dan memiliki

SES yang rendah maka secara umum maka peluang responden terkena

gangguan kesehatan mental baik adalah 0.6626, peluang responden

terkena gejala kesehatan mental ringan adalah 0.2349, peluang

responden terkena gejala kesehatan mental sedang adalah −0.6752


97

dan peluang responden terkena gejala kesehatan mental parah adalah

0.7776. Dari hasil peluang di atas dapat disimpulkan bahwa jika

responden memiiliki SES rendah dan peristiwa kehidupan 3

berpeluang tidak terkena gangguan mental sebesar 0.6626 dan

berpeluang terkena gangguan mental sebesar 0.3374


99

BAB V

KESIMPULAN

BAB V KESIMPULAN Analisis regresi logistik ordinal adalah analisis regresi yang peubah

responnya bersifat kategori berskala ordinal yang memiliki tiga atau lebih kategori

dan ada urutan kategori (skala ordinal) yang tidak dapat dianalisa dengan

menggunakan metode regresi biasa. Dengan menggunakan analisis regresi logistik

ordinal, dapat memprediksi adanya pengaruh suatu kejadian. Beberapa landasan

matematika tentang analisis regresi logistik yang dapat dipelajari seperti

probabilitas, metode kuadrat terkecil, metode kemungkinan maksimum, dan

metode Newton-Raphson. Dan berikut langkah-langkah menganalisi penyebab

suatu kejadian dengan menggunakan regresi logistik ordinal adalah:

1. Pendugaan model

2. Intreprestasi koefisien atau parameter model

3. Menguji model

Metode yang digunakan untuk menduga parameter dari model regresi

logistik ordinal adalah dengan menggunakan metode kemungkinan maksimum

(Maximum Likelihood) dan metode Newton-Rhapson. Hasil dari penduga

parameter dapat digunakan untuk menghitung peluang terjadinya gangguan

kesehatan mental seseorang dengan faktor pengaruh suatu peristiwa kehidupan

seperti kelahiran anak, pekerjaan baru, perceraian atau kematian dalam keluarga

dan dengan tinggi rendahnya status ekonomi sosial.


100

DAFTAR PUSTAKA

Agresti, Alan. (2002). Categorical Data Analysis, Second edition. Kanada: John

Wiley and Sons Inc.

Arum, Eva Setyarini dan Salamah, Mutiah. Analisis Regersi Logistik Ordinal

untuk Mengetahui Tingkat Gangguan Tunagrahita di Kabupaten Ponorogo

Berdasarkan Faktor-Faktor Internal Penyebab Tunagrahita. Jurnal Sains

dan Seni ITS, 4(2):2337-3520.

Burden, Richard L dan Faires, J. Douglas. (2011). Numerical Analysis Nine

Edition.USA: Brooks.

Cohen. Jacob. Dkk. (2003). Applied Multiple Regression/Corelation Analysis for

the Behavioral Sciences, Third Edition. New Jersey: Lawrence Erlbaum

Associates Inc.

Hosmer, D.W. and Lemeshow, S. (2000). Applied Logistic Regression. Kanada:

John Wiley and Sons Inc.

Kleinbaum, David G dan Mitchel Klein. (2002). Logistic Regression a Self-

Learning Text Second Edition. New York: Springer-Verlag.

Kleinbaum, David G dan Mitchel Klein. (2010). Logistic Regression a Self-

Learning Text Third Edition. New York: Springer-Verlag.

Kothari, C.R. (2004). Research Methodology Methods and Techniques (Second

Revised Edition). New Delhi: New Age International.

Meilia, Nur Indah S. (2014).Statisistika Deskriptif dan Induktif. Graha Ilmu:

Yogyakarta

O’Connel Ann A. (2006). Logistic Regression Models for Ordinal Response

Variables. Thousand Oaks: Sage Publications.

Riani, Galuh Putri, dkk. Analisis Faktor- Faktor yang Mempengaruhi Penerimaan

Peserta Didik SMA Negeri 2 Semarang Menggunakan Metode Rege=resi

Logistik Ordinal. Jurnal Gaussian, 5(3):405-416.

Scheaffer, Wackerly dan Mendenhall. (2008). Mathematical Statistics with

Applications, Seven Edition. USA: Thomson Higher education


101

Sun, Hyun Kim. (2004). Disertasi: Topics in Ordinal Logistic Regression and Its

Applications. Texas: Texas A&M University.

Tjarta, Ahmad, dkk. (2006). Buku Ajar Patologi. Jakarta: Sagung Seto

Widarjono, Agus. (2010). Analisis Statistika Multivariat Terapan. Yogyakarta:

Unit Penerbit dan Percetakan Sekolah Tinggi Ilmu Manajemen YKPN.

Yudiaatmaja, Fridayana. (2013). Analisis Regresi dengan Menggunakan Aplikasi

Komputer Statistik SPSS. Jakarta: PT Gramedia Pustaka Utama.


102

LAMPIRAN


analisis regresi logistik ordinal halaman judul

Documents