analisis regresi logistik ordinal halaman judul
TRANSCRIPT
i
ANALISIS REGRESI LOGISTIK ORDINAL
HALAMAN JUDUL
Makalah
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Matematika
Program Studi Matematika
Oleh:
Maria Anggun Puspasari
NIM: 123114013
PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
ANALYSIS OF ORDINAL LOGISTIC REGRESSION
HALAMAN JUDUL DALAM BAHASA INGGRIS
Paper
Presented as Partial Fulfillment of the Requirements
to Obtain Sarjana Matematika Degree
in Mathematics Study Program
By:
Maria Anggun Puspasari
NIM: 123114013
MATHEMATICS STUDY PROGRAM, MATHEMATICS DEPARTMENT
FACULTY OF SCIENCE TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
HALAMAN PENGESAHAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
HALAMAN PERSEMBAHAN
“Bertekunlah dalam doa dan dalam pada itu berjaga-jagalah sambil
mengucap sykuur”
Kolose 4:2
Tugas Akhir ini dipersembahkan untuk:
Tuhan Yesus Kristus yang selalu menyertai dan memberkatiku dengan
berkatNya yang sangat melimpah
Kedua orang tua Andy Pramudya dan Rini Sih Mintowati
Kakakku tercinta Anggy Sabatrani Pramudya
Beserta keluarga besar Soepardjo dan Purwo
Serta almamater yang kubanggakan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
ABSTRAK
HALAMAN ABSTRAK
Analisis Regresi Logistik Ordinal adalah analisis regresi yang peubah
responnya bersifat ordinal yang memiliki tiga atau lebih kategori. Analisis regresi
logistik ordinal didasarkan pada suatu fungsi:
𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
dengan 𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) = peluang kumulatif pada p variabel independen yang
dinyatakan dalam vektor 𝑿𝒊, 𝛽0𝑗 = parameter intersep kategori ke-j, 𝑿𝒊 =
[𝑋𝑖1 𝑋𝑖2 … 𝑋𝑖𝑝]𝑇
dan 𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝).
Analisis regresi logistik ordinal diawali dengan langkah pendugaan
parameter model dengan menggunakan metode kemungkinan maksimum
(Maximum Likelihood) dan metode Newton-Rhapson dan dilanjutkan interpretasi
koefisien parameter model.
Kata kunci: regresi logistik ordinal, metode kemungkinan maksimum, pendugaan
parameter.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRACT
HALAMAN ABSTRACT
Ordinal Logistic Regression analysis is a regression analysis which its variable
response is ordinal and have three or more categories. Ordinal Logistic Regression
analysis is originated from function:
𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
where 𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) = cumulative probability of variable dependen p which is
expressed by vector𝑿𝒊 , 𝛽0𝑗 = parameter of category intercept for j, 𝑿𝒊 =
[𝑋𝑖1 𝑋𝑖2 … 𝑋𝑖𝑝]𝑇 and 𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝).
Ordinal Logistic Regression analysis is started with parameter estimation
of the model by using Maximum Likelihood method and Newton-Rhapson
method and be continued by the interpretation of the parameterof the model.
Keyword: ordinal logistic regression, maximum likelihood method, parameter
estimation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma:
Nama : Maria Anggun Puspasari
NIM Mahasiswa : 123114013
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan
Universitas Sanata Dharma karya ilmiah yang berjudul:
ANALISIS REGRESI LOGISTIK ORDINAL
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan
kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan,
mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan
data, mendistribusikannya secara terbatas, dan mempublikasikannya di internet
atau media lain untuk kepentingan akademis tanpa meminta ijin dari saya maupun
memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai
penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di Yogyakarta
Pada Tanggal: 06 November 2017
Yang menyatakan
(Maria Anggun Puspasari)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
KATA PENGANTAR
Puji syukur penulis haturkan ke hadirat Tuhan Yang Maha Kuasa atas segala
berkat dan penyertaanNya sehingga penulis dapat menyelesaikan tugas akhir
dengan baik. Tugas akhir yang berjudul “Analisis Regresi Logistik Ordinal” ini
adalah salah satu syarat untuk memperoleh gelar sarjana Matematika pada
Fakultas Sains dan Teknologi. Dalam penulisan tugas akhir ini, tentunya penulis
telah menerima bantuan baik secara moril maupun materil dari berbagai pihak.
Oleh karena itu penulis ingin menyampaikan ucapan terima kasih kepada:
1. Bapak Ir. Ig. Aris Dwiatmoko M. Sc. Selaku dosen pembimbing yang
dengan penuh kesabaran telah memberikan bimbingan nasihat dan
arahan kepada penulis.
2. Bapak Hartono Ph. D, selaku Ketua Program Studi yang telah
memberikan banyak bimbingan dalam hal akademik dan perkuliahan.
3. Serta bapak dan ibu dosen yang telah memberikan banyak ilmu
pengetahuan kepada penulis selama menjalani perkuliahan di Universitas
Sanata Dharma.
4. Mas Susilo selaku laboran yang telah banyak membantu penulis dalam
perkuliahan terutama dalam penulisan tugas akhir ini.
5. Perpustakaan Universitas Sanata Dharma dan staf sekretariat Fakultas
Sains dan Teknologi yang telah memberikan fasilitas dan kemudahan
pembelajaran serta administrasi bagi penulis selama masa perkuliahan.
6. Papah Andy Pramudya dan Mamah Rini Sih Mintowati serta kakak
Anggy Sabatrani Pramudya yang telah banyak memberikan dukungan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
dan pengorbanan sehingga penulis dapat menyelesaikan studi dengan
baik.
7. Alusisus Ari Setyanto yang telah banyak memberikan dukungan dan
pengorbanan bagi penulis selama penulisan tugas akhir.
8. Teman-teman angkatan 2012 Program Studi Matematika yaitu, Amanda,
Dewi, Noni, Putri, Sila, Ajeng, Bobi, Budi, Ega, Ferni, Happy, Ilga,
Risma, Tika, Oksi, Juli, Arum, Lia, Rian.
9. Teman-teman kos, Febri, Nia, Rita, Nindy, Hesti, Yanti, Iin, Priska,
Vita, Dea, Mela.
10. Dan sahabatku Imas, Hami, Inggrit, Kiki, Riska.
11. Semua pihak yang tidak dapat disebutkan satu persatu yang telah banyak
memberikan bantuan, dorongan, dan motivasi sehingga tugas akhir ini
dapat diselesaikan.
Penulis menyadari bahwa tugas akhir ini masih jauh dari kesempurnaan,
maka saran dan kritik yang konstruktif dari semua pihak sangat
diharapkan demi penyempurnaan selanjutnya. Semoga tugas akhir ini
dapat bermanfaat bagi semua pihak, khususnya bagi penulis dan
pembaca pada umumnya.
Yogyakarta, 06 November 2017
Penulis
Maria Anggun Puspasari
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
DAFTAR ISI
HALAMAN JUDUL ........................................................................................................... i
HALAMAN JUDUL DALAM BAHASA INGGRIS ........................................................ ii
HALAMAN PERSETUJUAN PEMBIMBING ...................Error! Bookmark not defined.
HALAMAN PENGESAHAN.............................................................................................iv
HALAMAN PERSEMBAHAN ......................................................................................... v
HALAMAN PERNYATAAN KEASLIAN KARYA ..........Error! Bookmark not defined.
HALAMAN ABSTRAK ................................................................................................... vii
HALAMAN ABSTRACT ................................................................................................ viii
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI.............................................. ix
KATA PENGANTAR ........................................................................................................ x
DAFTAR ISI ...................................................................................................................... xii
DAFTAR TABEL ............................................................................................................. xiv
DAFTAR GAMBAR ......................................................................................................... xv
BAB 1 PENDAHULUAN .................................................................................................. 2
A. LATAR BELAKANG ............................................................................................ 3
B. RUMUSAN MASALAH ........................................................................................ 2
C. TUJUAN PENULISAN .......................................................................................... 2
D. BATASAN MASALAH ......................................................................................... 2
E. MANFAAT PENULISAN ...................................................................................... 2
F. SISTEMATIKA PENULISAN ............................................................................... 3
BAB II LANDASAN TEORI ............................................................................................. 7
A. PROBABILITAS .................................................................................................... 7
B. DISTRIBUSI PROBABILITAS ........................................................................... 18
C. METODE KUADRAT TERKECIL ..................................................................... 24
D. MODEL KUADRAT TERKECIL MENGGUNAKAN MATRIKS .................... 27
E. METODE KEMUNGKINAN MAKSIMUM (Maximum Likelihood) ................. 31
F. METODE NEWTON-RAPHSON ........................................................................ 36
BAB III DASAR-DASAR MATEMATIS MODEL REGRESI LOGISTIK ORDINAL 38
A. REGRESI LOGISTIK .......................................................................................... 38
B. REGRESI LOGISTIK ORDINAL ........................................................................ 59
BAB IV APLIKASI REGRESI LOGISTIK ORDINAL .................................................. 80
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
A. PENDUGAAN PARAMETER ............................................................................. 80
B. PERHITUNGAN DAN ANALISIS DATA ......................................................... 88
BAB V KESIMPULAN .................................................................................................... 99
DAFTAR PUSTAKA ..................................................................................................... 100
LAMPIRAN .................................................................................................................... 102
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
DAFTAR TABEL
Tabel 2.1 Tabel untuk kejadian 𝐴 dan 𝐵 ………………………………………. 13
Tabel 3.1 Tabel frekuensi pengelompokan umur pada CHD ………………….. 43
Tabel 3.9 Hasil perhitungan dari algoritma Newton-Rhapson …….…………… 56
Tabel 3.10 Nilai Model Regresi Logistik ……………………………………..... 58
Tabel 3.11 Klasifikasi silang AGE pada 55 tahun dan CHD untuk 100 responden
………….…………………………………………………………... 59
Tabel 3.12 Klasifikasi silang 4 kategori skala ordinal hasil berat badan bayi lahir
dengan status ibu merokok ………...……………………………..... 70
Tabel 3.13 Output ………………………………………………………………. 72
Tabel 3.14 Klasifikasi silang antara keinginan melanjutkan dan pendidikan orang
tua ……………………………………………..……..…………….. 75
Tabel 3.15 Klasifikasi silang antara keinginan melanjutkan dan GPA ……….. 77
Tabel 4.1 Output ………………………………………………………………... 89
Tabel 4.2 Klasifikasi silang antara kesehatan mental dan status peristiwa
kehidupan ………………………………………………………...... 93
Tabel 4.3 Klasifikasi silang antara kesehatan mental dan status SES …………. 95
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
DAFTAR GAMBAR
Gambar 2.1 Ruang sampel untuk percobaan pelemparan sebuah dadu ………… 9
Gambar 2.2 X : S → R …………………………………………………..………. 19
Gambar 2.3 Ilustrasi garis singgung (slope) …………………………………… 38
Gambar 3.1 Scatterplot CHD menurut AGE pada 100 individu …………….… 42
Gambar 3.2 Plot presentase individu dengan CHD pada setiap kelompok umur 43
Gambar 3.3 Kurva hubungan dari variabel biner dengan prediktor X …………. 47
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB 1 PENDAHULUAN
PENDAHULUAN
A. RUMUSAN MASALAH
Perumusan masalah yang akan dibicarakan pada tugas akhir ini adalah:
1. Bagaimana dasar-dasar matematis model regresi logistik ordinal?
2. Bagaimana menerapkan metode regresi logistik ordinal untuk
menganalisis suatu kejadian?
B. TUJUAN PENULISAN
Tujuan dari penulisan tugas akhir ini:
1. Memahami landasan matematika tentang analisis regresi logistik.
2. Menganalisis penyebab suatu kejadian dengan menggunakan metode
regresi logistik ordinal.
C. BATASAN MASALAH
Tugas akhir ini dibatasi pada masalah-masalah sebagai berikut:
1. Model Regresi yang dibahas adalah model Regresi Logistik Ordinal.
2. Aplikasi yang digunakan adalah program R dan program SPSS.
D. MANFAAT PENULISAN
Manfaat yang dapat diperoleh dari penulisan tugas akhir ini adalah
mahasiswa atau pembaca dapat memahami penyebab suatu kejadian dengan
cara metode matematika.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
E. LATAR BELAKANG
Regresi logistik merupakan salah satu metode statistika yang
berfungsi untuk menganalisis variabel respon atau biasa disebut variabel tak
bebas (dependen) yang mempunyai data berupa skala ordinal atau nominal.
Dilihat dari variabel bebasnya, regresi logistik terbagi menjadi dua yaitu
regresi logistik sederhana (hanya memiliki satu variabel bebas) dan regresi
logistik berganda (memiliki satu atau lebih variabel bebas) sedangkan dilihat
dari variabel responnya, regresi logistik dapat dibedakan menjadi dua yaitu
regresi logistik biner (variabel responnya dichotomous atau hanya memiliki
dua kategori) dan regresi logistik multinomial (variabel responnya
polytomous atau memiliki lebih dari dua kategori).
Model Matematika Regresi Logistik adalah model regresi yang
digunakan apabila variabel respon bersifat kualitatif. Fungsi model Regresi
Logistik adalah
𝜋(𝑥) = 𝑒𝛽0+𝛽1𝑥
1 + 𝑒𝛽0+𝛽1𝑥
Keterangan:
𝜋(𝑥) = peluang kumulatif variabel independen
𝛽0 dan 𝛽𝑖 = parameter regresi
x = variabel dependen
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Persamaan ini bersifat nonlinear dalam parameter, maka diperlukan
proses transformasi agar bersifat linear yang dinamakan transformasi logit,
yaitu:
𝑙𝑛 (𝜋(𝑥)
1 − 𝜋(𝑥)) = 𝛽
0+ 𝛽
1𝑥
Regresi logistik membentuk variabel dependen yang merupakan
kombinasi linear dari variabel independen. Nilai variabel dependen ini
kemudian ditransformasikan menjadi probabilitas dengan transformasi logit.
Regresi logistik menghasilkan rasio peluang atau biasa disebut odds rations,
yang terkait dengan nilai setiap variabel independen.
Regresi Logistik merupakan salah satu metode regresi yang
digunakan untuk mencari hubungan antara peubah respon bersifat kategori
berskala nominal atau ordinal dengan satu atau lebih peubah penjelas kontinu
maupun kategori. Jika peubah respon berskala nominal digunakan regresi
logistik multinominal, sedangkan pada peubah respon berskala ordinal
digunakan regresi logistik ordinal. Analisis regresi logistik nominal
digunakan apabila memiliki lebih dari tiga kategori dan tidak berurutan (skala
nominal). Analisis regresi logistik ordinal digunakan apabila memiliki lebih
dari tiga kategori dan ada urutan kategori (skala ordinal).
Model Matematika Regresi Logistik Ordinal adalah model logit
kumulatif. Sifat dari variabel dependen Y diberikan dalam peluang kumulatif
sehingga model yang didapatkan dengan membandingkan peluang kumulatif
yaitu peluang kurang dari sama dengan kategori respon ke-j pada p variabel
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
independen yang dinyatakan dalam vektor 𝑿, 𝑃(𝑌 ≤ 𝑗|𝑿) dengan peluang
lebih besar daripada kategori dependen ke-j, 𝑃(𝑌 > 𝑗|𝑿) (Hosmer dan
Lemeshow, 2000: 290).
Sehingga, peluang kumulatif didefinisikan sebagai berikut:
𝑃(𝑌𝑖 ≤ 𝑗|𝑋𝑖) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
Dengan
𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊)= peluang kumulatif pada p variabel independen yang
dinyatakan dalam vektor 𝑿𝒊
𝑗 = 1, 2, … , 𝐽 − 1, 𝑖 = 1, 2, … , 𝑛 dan 𝑘 = 1, 2, … , 𝑝
𝛽0𝑗 = parameter intersep kategori ke-j
𝑌𝑖 = variabel Y pada pengamatan ke-i
𝑋𝑖𝑘 = vektor variabel X pada pengamatan ke-i
𝛽𝑘 = vektor parameter regresi
Persamaan ini bersifat nonlinear dalam parameter, maka diperlukan
proses transformasi agar bersifat linear yang dinamakan transformasi logit,
yaitu:
ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)
𝑃(𝑌 > 𝑗|𝑿𝑖)) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
Pendugaan parameter model regresi logistik ordinal dilakukan dengan
metode Maximum Likelihood Estimation (MLE) yaitu:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
𝐿(𝜷) = ∑𝑦1𝑖 ln[∅1(𝑿𝑖) ] + 𝑦2𝑖 ln[∅2(𝑿𝑖)
] + 𝑦3𝑖 ln[∅3(𝑿𝑖) ]
𝑛
𝑖=1
Regresi logistik ordinal juga merupakan perluasan dari regresi logistik
biner dengan bahwa variabel dependen dari regresi logistik ordinal berskala
ordinal yang terdiri dari tiga atau lebih kategori.
F. SISTEMATIKA PENULISAN
BAB I PENDAHULUAN
A. Latar Belakang
B. Rumusan Masalah
C. Batasan Masalah
D. Tujuan Penulisan
E. Manfaat Penulisan
F. Metode Penulisan
G. Sistematika Penulisan
BAB II LANDASAN TEORI
A. Probabilitas
1. Probabilitas pada Kasus Diskrit
2. Menghitung Probabilitas suatu Kejadian dengan
Menggunakan Metode Titik Sampel
3. Probabilitas Bersyarat dan Kejadian Bebas
4. Dua Aturan Probabilitas
B. Distribusi Probabilitas
1. Variabel Random
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2. Fungsi Probabilitas
3. Fungsi Distribusi Kumulatif
C. Metode Kuadrat Terkecil
D. Model Kuadrat Terkecil menggunakan Matriks
E. Metode Kemungkinan Maksimum (Maximum Likelihood)
F. Metode Newton-Rhapson
BAB III DASAR-DASAR MATEMATIS MODEL REGRESI
LOGISTIK ORDINAL
A. Regresi Logistik
1. Pendahuluan
2. Model Regresi Logistik
3. Pendugaan Model Regresi Logistik
4. Oods Ratio pada Regresi Logistik
B. Regresi Logistik Ordinal
1. Model Regresi Logistik Ordinal
2. Pendugaan Model Regresi Logistik Ordinal
BAB IV APLIKASI METODE REGRESI LOGISTIK ORDINAL
A. Pendugaan Parameter
B. Perhitungan dan Analisis Data
BAB V KESIMPULAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
BAB II
LANDASAN TEORI
BAB II LANDASAN TEORI
A. PROBABILITAS
Pada istilah sehari-hari, probabilitas adalah ukuran keyakinan
seseorang akan kemungkinan terjadinya suatu peristiwa di masa depan.
Konsep probabilitas diperlukan dalam pekerjaan fisik, biologis, atau
mekanisme sosial yang menghasilkan pengamatan yang tidak dapat diprediksi
dengan pasti. Misalnya, tekanan darah seseorang pada suatu titik waktu
tertentu tidak dapat diprediksi dengan pasti.
1. Probabilitas pada Kasus Diskrit
Definisi 2.1
Percobaan adalah suatu proses yang menghasilkan pengamatan
(observarsi).
Definisi 2.2
Ruang sampel adalah himpunan yang anggota-anggotanya adalah semua
kemungkinan hasil yang mungkin dari suatu percobaan dan
dilambangkan dengan S.
Definisi 2.3
Setiap kemungkinan hasil yang mungkin dari suatu percobaban disebut
titik sampel. Titik sampel biasanya dinotasikan dengan 𝐸𝑖 , 𝑖 = 1, 2, 3, …
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
Definisi 2.4
Sebuah ruang sampel diskrit memuat berhingga atau tak berhingga
terbilang titik sampel.
Definisi 2.5
Kejadian dalam ruang sampel diskrit S merupakan himpunan bagian dari
ruang sampel S. Kejadian dilambangkan dengan E.
Definisi 2.6
Kejadian sederhana adalah kejadian yang hanya anggotanya satu titik
sampel.
Contoh 2.1
Percobaan pelemparan sebuah dadu. Ketika percobaan berlangsung, ini
akan menghasilkan ruang sampel, yaitu 𝑆 = {𝐸1, 𝐸2, 𝐸3, 𝐸4, 𝐸5, 𝐸6} dan
dapat menghasilkan beberapa kejadian A, B, dan C.
A: kejadian munculnya bilangan ganjil
B: kejadian munculnya bilangan yang kurang dari 5
C: kejadian munculnya bilangan 2 atau 3
𝐸1: munculnya bilangan 1
𝐸2 : munculnya bilangan 2
𝐸3: munculnya bilangan 3
𝐸4: munculnya bilangan 4
𝐸5: munculnya bilangan 5
𝐸6: munculnya bilangan 6
Dengan 𝐸1, 𝐸2, 𝐸3, 𝐸4, 𝐸5, 𝑑𝑎𝑛 𝐸6 adalah titik-titik sampel.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
Diagram venn di bawah ini menunjukkan contoh ruang sampel untuk
percobaan pelemparan sebuah dadu.
S
Gambar 2.1 Ruang sampel untuk percobaan pelemparan sebuah dadu.
𝐸1 = kejadian munculnya bilangan 1 dan 𝐸1 disebut kejadian sederhana
karena hanya memuat satu titik sampel yaitu bilangan 1.
Definisi 2.7
Misalkan S adalah ruang sampel percobaan. Untuk setiap kejadian A di S
(A adalah himpunan bagian S). P(A) adalah probabilitas kejadian A yang
memenuhi aksioma:
Aksioma 1: 𝑃(𝐴) ≥ 0
Aksioma 2: 𝑃(𝑆) = 1
Aksioma 3: Misal 𝐴1, 𝐴2, 𝐴3, … membentuk pasangan barisan pada
kejadian di S (yaitu, 𝐴𝑖 ∩ 𝐴𝑗 = ∅ jika 𝑖 ≠ 𝑗) maka
𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ …) = ∑𝑃(𝐴𝑖).
∞
𝑖=1
(2.1)
𝐸1
𝐸2
𝐸3 𝐸4
𝐸5
𝐸6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
2. Menghitung Probabilitas suatu Kejadian dengan Menggunakan
Metode Titik Sampel.
Langkah-langkah yang digunakan untuk mengetahui probabilitas suatu
kejadian:
a. Definisikan percobaan dan deskripsikan secara jelas bagaimana
untuk menggambarkan salah satu kejadian sederhana,
b. Daftarkan kejadian-kejadian sederhana yang terkait dengan
percobaan dan ujilah masing-masing untuk memastikan bahwa
kejadian-kejadian tersebut tidak dapat diuraikan. Hal ini
mendefinisikan ruang sampel S.
c. Tetapkan probabilitas untuk titik sampel di S, yang menghasilkan
𝑃(𝐸𝑖) ≥ 0 dan ∑𝑃(𝐸𝑖) = 1.
d. Definisikan kejadian khusus, A, sebagai himpunan spesifik dari titik
sampel.
e. Tentukan 𝑃(𝐴) dengan menjumlahkan probabilitas semua titik
sampel di A.
Contoh 2.2
Diketahui ada dua pelamar pekerjaan dari sebuah grup yang terdiri dari
lima orang dan pelamar memiliki kompetensi yang berbeda-beda, yaitu 1
menjadi yang terbaik, 2 terbaik kedua, dan seterusnya untuk 3, 4, dan 5.
Penilaian ini tentu saja tidak diketahui oleh karyawan. Didefinisikan dua
kejadian A dan B sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
A: Karyawan memilih yang terbaik dan salah satu dari dua pelamar yang
paling kurang baik (pelamar 1 dan 4 atau 1 dan 5)
B: Karyawan memilih minimal satu dari dua yang terbaik.
Tentukan probabilitas dari kejadian tersebut!
Jawab:
Langkah-langkahnya:
1. Percobaan dua pelamar yang terpilih dari lima secara acak.
Notasikan terpilihnya pelamar 3 dan 5 dengan {3, 5}.
2. Sepuluh kemungkinan kejadian sederhana, pelamar i dan j yang
terpilih dinotasikan dengan {i, j} adalah
𝐸1: {1, 2}, 𝐸5: {2, 3}, 𝐸8: {3, 4}, 𝐸10: {4, 5}
𝐸2: {1, 3}, 𝐸6: {2, 4}, 𝐸9: {3, 5}
𝐸3: {1, 4}, 𝐸7: {2, 5}, 𝐸8: {3, 6}
𝐸4: {1, 5}.
3. Memilih dua secara acak dari lima mengakibatkan masing-masing
pasangan memiliki peluang yang sama untuk dipilih. Sebab itu, kita
tetapkan setiap titik sampel probabilitasnya 1/10, yaitu,
𝑃(𝐸𝑖) =1
10= .1, 𝑖 = 1, 2, … , 10
4. Memeriksa titik sampel, kita lihat bahwa B muncul setiap kali
𝐸1, 𝐸2, 𝐸3, 𝐸4, 𝐸5, 𝐸6, atau 𝐸7 terjadi. Sebab itu, titik sampel ini
termuat di B.
5. Akibatnya, 𝑃(𝐵) bernilai sama dengan jumlahan dari probabilitas
dari titik-titik sampel di B, atau
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
𝑃(𝐵) = ∑𝑃(𝐸𝑖) = ∑.1 = .7.
7
𝑖=1
7
𝑖=1
Dengan cara yang sama, dapat dilihat kejadian 𝐴 = 𝐸3 ∪ 𝐸4 dan 𝑃(𝐴) =
.1 + .1 = .2
3. Probabilitas Bersyarat dan Kejadian Bebas
Definisi 2.8
Probabilitas bersyarat dari suatu kejadian A, bila kejadian B terjadi
dinotasikan sebagai
𝑃(𝐴|𝐵) =𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵) (2.2)
dengan 𝑃(𝐵) > 0. (𝑃(𝐴|𝐵) dibaca “probabilitas kejadian A jika kejadian
B terjadi”.
Konfirmasi lebih lanjut dari konsistensi Definisi 2.8 dengan konsep
frekuensi relatif probabilitas dapat diperoleh dari bentuk berikut.
Andaikan sebuah percobaan diulang sebanyak 𝑁 bilangan yang besar,
dengan hasil kejadian 𝐴 dan 𝐵, 𝐴 ∩ 𝐵, 𝑛11 kali; pada 𝐴 dan tidak pada
𝐵, 𝐴 ∩ �̅�, 𝑛21 kali; pada 𝐵 dan tidak pada 𝐴, �̅� ∩ 𝐵, 𝑛12kali; dan tidak
pada 𝐴 maupun B, �̅� ∩ �̅�, 𝑛22kali. Hasil ini ada di dalam tabel 2.1.
Catatan bahwa 𝑛11 + 𝑛12 + 𝑛21 + 𝑛22 = 𝑁. Kemudian selanjutnya
𝑃(𝐴) ≈𝑛11+𝑛21
𝑁, 𝑃(𝐵) ≈
𝑛11+𝑛12
𝑁, 𝑃(𝐴|𝐵) ≈
𝑛11
𝑛11+𝑛12,
𝑃(𝐵|𝐴) ≈𝑛11
𝑛11+𝑛21, dan 𝑃(𝐴 ∩ 𝐵) ≈
𝑛11
𝑁,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
dengan ≈ dibaca mendekati sama dengan.
Menggunakan probabilitas, dapat dilihat sebagai berikut
𝑃(𝐴|𝐵) =𝑃(𝐴∩𝐵)
𝑃(𝐵) dan 𝑃(𝐵|𝐴) =
𝑃(𝐴∩𝐵)
𝑃(𝐴)
Oleh karena itu, definisi 2.8 ini konsisten dengan konsep frekuensi relatif
probabilitas.
Tabel 2.1 Tabel untuk kejadian 𝐴 dan 𝐵
𝐴 �̅�
𝐵 𝑛11 𝑛12 𝑛11 + 𝑛12
�̅� 𝑛21 𝑛22 𝑛21 + 𝑛22
𝑛11 + 𝑛21 𝑛12 + 𝑛22 𝑁
Contoh 2.3
Di suatu desa yang berpenduduk 2000 orang, terdapat 1250 orang yang
tergolong ke dalam usia kerja, yang terdiri atas 750 orang laki-laki dan
500 orang wanita. Dari 750 orang laki-laki terdapat 650 orang yang
bekerja sedangkan diantara 500 orang wanita tersebut terdapat 200 orang
yang bekerja. Jika dari mereka yang tergolong dalam usia kerja dipilih
secara acak, berapa peluang bahwa yang terpilih adalah bekerja jika ada
tambahan informasi bahwa yang terpilih adalah laki-laki.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
Jawab:
Andaikan L = kejadian bahwa yang terpilih laki-laki
B = kejadian bahwa yang terpilih bekerja
N = banyaknya orang yang tergolong dalam usia kerja
maka: 𝑃(𝐿) =𝑛(𝐿)
𝑁=
750
1250=
3
5
𝑃(𝐿 ∩ 𝐵) =𝑛(𝐿 ∩ 𝐵)
𝑁=
650
1250=
13
15
Jadi
𝑃(𝐵|𝐿) =𝑃(𝐿 ∩ 𝐵)
𝑃(𝐿)=
351315
=9
13
Definisi 2.9
Dua kejadian A dan B disebut saling bebas jika memenuhi salah satu:
𝑃(𝐴|𝐵) = 𝑃(𝐴) (2.3)
𝑃(𝐵|𝐴) = 𝑃(𝐵) (2.4)
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) (2.5)
Jika tidak,maka kejadian disebut tergantung atau tidak saling bebas.
Contoh 2.4
Sebuah dadu bersisi enam dilempar. Kejadian A adalah kejadian bahwa
banyaknya mata dadu yang muncul adalah bilangan ganjil, B adalah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
kejadian bahwa banyaknya mata yang muncul lebih besar dari 4 dan C
adalah kejadian bahwa banyaknya mata yang muncul lebih kecil dari 4.
a. Apakah A dan B merupakan dua kejadian yang bebas?
b. Apakah A dan C merupakan dua kejadian yang bebas?
Jawab:
S = {1, 2, 3, 4, 5, 6}
A = {1, 3, 5}
B = {5, 6}
C = {1, 2, 3}
𝐴 ∩ B = {5}
𝐴 ∩ C = {1, 3}
Karena dadu yang dilempar seimbang maka setiap sisi mempunyai
peluang yang sama untuk muncul, maka:
𝑃(𝐴) =𝑛(𝐴)
𝑁=
3
6 , 𝑃(𝐵) =
𝑛(𝐵)
𝑁=
2
6 , 𝑃(𝐶) =
𝑛(𝑐)
𝑁=
3
6
𝑃(𝐴 ∩ B) =𝑛(𝐴 ∩ B)
N=
1
6
𝑃(𝐴 ∩ C) =𝑛(𝐴 ∩ C)
N=
2
6=
1
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
Sehingga
a. 𝑃(𝐴)𝑃(𝐵) = (3
6) (
2
6) =
1
6= 𝑃(𝐴 ∩ B) sehingga A dan B adalah dua
kejadian saling bebas.
b. 𝑃(𝐴)𝑃(𝐶) = (3
6) (
3
6) =
1
4≠
1
3= 𝑃(𝐴 ∩ C) sehingga A dan C bukan
merupakan dua kejadian saling bebas.
4. Dua Aturan Probabilitas
Teorema 2.1
Aturan probabilitas perkalian. Probabilitas kejadian A dan B adalah
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴) (2.6)
= 𝑃(𝐵)𝑃(𝐴|𝐵) (2.7)
Jika A dan B saling bebas, maka
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) (2.8)
Bukti:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴)
= 𝑃(𝐵)𝑃(𝐴|𝐵)
Menurut definisi 2.9
𝑃(𝐴|𝐵) = 𝑃(𝐴) 𝑑𝑎𝑛 𝑃(𝐵|𝐴) = 𝑃(𝐵), maka
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) ∎
Teorema 2.2
Aturan probabilitas penjumlahan. Probabilitas dari gabungan kejadian A
dan B adalah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) (2.9)
Jika A dan B kejadian saling asing 𝑃(𝐴 ∩ 𝐵) = 0 dan
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) (2.10)
Bukti:
Jika A adalah himpunan dari S, maka komplemen dari A dinotasikan
dengan �̅� yang mana �̅� adalah himpunan titik-titik yang berada di S
tetapi tidak di A. Perhatikan bahwa 𝐴 ∪ 𝐵 = 𝐴 ∪ (�̅� ∩ 𝐵), dengan 𝐴 dan
�̅� ∩ 𝐵 adalah kejadian saling asing.
Selanjutnya, 𝐵 = (�̅� ∩ 𝐵) ∪ (𝐴 ∩ 𝐵), dengan (𝐴 ∩ �̅�) dan (𝐴 ∩ 𝐵)
adalah kejadian saling asing.
Lalu dengan menggunakan Aksioma 3,
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(�̅� ∩ 𝐵) dan 𝑃(𝐵) = 𝑃(�̅� ∩ 𝐵) + 𝑃(𝐴 ∩ 𝐵).
Maka (�̅� ∩ 𝐵) = 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵).
Lalu subsitusikan persamaan 𝑃(�̅� ∩ 𝐵) ke persamaan 𝑃(𝐴 ∪ 𝐵) maka
didapatkan 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) ∎
Teorema 2.3
Jika A adalah kejadian, maka
𝑃(𝐴) = 1 − 𝑃(�̅�) (2.11)
Bukti:
Diketahui bahwa 𝑆 = 𝐴 ∪ �̅�.
Karena 𝐴 dan �̅� adalah kejadian saling asing.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
Ini mengakibatkan 𝑃(𝑆) = 𝑃(𝐴) + 𝑃(�̅�).
Sehingga, 𝑃(𝐴) + 𝑃(�̅�) = 1 ∎
B. DISTRIBUSI PROBABILITAS
1. Variabel Random
Definisi 2.10
Variabel random adalah fungsi yang bernilai real yang domainnya adalah
ruang sampel. Variabel random dinotasikan dengan X.
Contoh 2.5
Percobaan pengambilan 2 bola tanpa pengembalian pada kantong yang
berisi 3 bola berwarna hitam dan 5 bola berwarna putih. Dimisalkan
variabel random X adalah banyaknya bola putih yang terambil.
Ruang sampel S pada percobaan di atas:
𝑆 = {𝐻𝐻,𝐻𝑃, 𝑃𝐻, 𝑃𝑃}
Dengan H menyatakan bola berwana “hitam” dan P menyatakan bola
berwarna “putih”.
X menyatakan banyaknya bola putih yang terambil.
Nilai 0, 1, atau 2 dapat diberikan pada setiap titik sampel, dimana nilai 0,
1, atau 2 menyatakan besaran acak yang nilainya ditentukan dari
percobaan. Variabel random X dapat dinyatakan dengan diagram
pemetaan berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
S R
X
Gambar 2.2 X : S → R
Definisi 2.11
Variabel Random dikatakan diskret jika himpunan dari kemungkinan
hasilnya adalah berhingga atau terbilang.
Jika tidak memenuhi definisi di atas maka variabel random di atas
disebut variabel random kontinu.
Contoh variabel random diskret adalah jumlah anak dalam sebuah
keluarga dan contoh variabel random kontinu adalah usia penduduk suatu
daerah.
2. Fungsi Probabilitas
Fungsi probabilitas dibagi menjadi dua macam, yaitu fungsi probabilitas
diskret dan fungsi probabilitas kontinu.
a. Distribusi Variabel Random Diskret
Definisi 2.12
Himpunan pasangan terurut (𝑥, 𝑃(𝑥)) adalah fungsi probabilitas dari
variabel random diskret X jika memenuhi sifat:
HH
HP
PH
PP
0
1
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
1. 0 ≤ 𝑃(𝑥) ≤ 1 untuk setiap x
2. ∑𝑃(𝑥) = 1
Contoh 2.6
Dari contoh 2.5 tentukan peluang banyaknya bola putih yang
dihasilkan pada pelemparan 2 kali.
Jawab:
Pada gambar 2.2 nilai X adalah banyaknya bola putih yang terambil.
𝑃(𝑋 = 0) =(30) (
52)
(82)
=10
28
𝑃(𝑋 = 1) =(31) (
51)
(82)
=15
28
𝑃(𝑋 = 2) =(32) (
50)
(82)
=3
28
b. Distribusi Variabel Random Kontinu
Definisi 2.13
Suatu fungsi f(x) adalah fungsi probabilitas untuk variabel random
kontinu jika memenuhi sifat:
1. 𝑓(𝑥) ≥ 0, untuk setiap 𝑥,−∞ < 𝑥 > ∞.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
2. ∫ 𝑓(𝑥)𝑑𝑥 = 1∞
−∞
Contoh 2.7
Misalkan 𝑌 adalah proses fungsi densitas
𝑓(𝑦) = {𝑐𝑦, 0 ≤ 𝑦 ≤ 20, 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛
a. Carilah nilai c yang memuat sehingga 𝑓(𝑦) adalah fungi
probabilitas densitas
b. Tentukan 𝐹(𝑦)
c. Gunakan 𝐹(𝑦)untuk menentukan 𝑃(1 ≤ 𝑌 ≤ 2)
Jawab:
Sehingga didapat
𝑓(𝑦) = {
1
2𝑦, 0 ≤ 𝑦 ≤ 2
0, 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛
a. 𝑓(𝑦) = ∫ 𝑐𝑦 𝑑𝑦2
0
1 = 𝑐 ∫ 𝑦 𝑑𝑦2
0
1 = 𝑐 [1
2𝑦2]
20
1 = 𝑐 (2)
1 = 2𝑐
𝑐 =1
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
b. Dalam distribusi varibel random kontinu
𝐹(𝑦) = 𝑃(𝑌 ≤ 𝑦) = ∫ 𝑓(𝑡)𝑑𝑡𝑦
−∞
Sehingga
Untuk 𝑦 < 0
𝐹(𝑦) = ∫ 𝑓(𝑡)𝑑𝑡 = ∫ 0 𝑑𝑡 =𝑦
−∞
𝑦
−∞
0
Untuk 0 ≤ 𝑦 ≤ 2
𝐹(𝑦) = ∫ 𝑓(𝑡)𝑑𝑡𝑦
−∞
= ∫ 0 𝑑𝑡 + ∫1
2𝑡 𝑑𝑡
𝑦
0
0
−∞
= 0 + [1
4𝑡2]
𝑦0
=1
4𝑦2
Untuk 𝑦 > 2
𝐹(𝑦) = ∫ 𝑓(𝑡)𝑑𝑡𝑦
−∞
= ∫ 0 𝑑𝑡 + ∫1
2𝑡 𝑑𝑡
2
0
0
−∞
+ ∫ 0 𝑑𝑡𝑦
2
= 0 + [1
4𝑡2]
20
+ 0
= (1 − 0)
= 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
Maka didapatkan
𝐹(𝑦) = {
0, 𝑦 < 21
4𝑦2, 0 ≤ 𝑦 ≤ 2
1, 𝑦 > 2
c. 𝑃(1 ≤ 𝑌 ≤ 2) = 𝑃(𝑌 ≤ 2) − 𝑃(𝑌 ≤ 1)
= 𝐹(2) − 𝐹(1)
= 1 − (1
4(12))
= 1 −1
4
=3
4
3. Fungsi Distribusi Kumulatif
Definisi 2.14
Fungsi distribusi kumulatif dari sebuah variabel random diskret dan
kontinu didefinisikan sebagai berikut:
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = { ∫ 𝑓(𝑡)𝑑𝑡 ,jika X kontinu
𝑥−∞
∑ 𝑃(𝑥) ,∀𝑋≤𝑥 jika X diskret
Contoh 2.8
Diketahui fungsi distribusi kumulatif sebagai berikut:
𝐹(𝑥) = {
0, 𝑥 < 0𝑥 + 1
2, 0 ≤ 𝑥 ≤ 1
1, 1 ≤ 𝑥
a. Tentukan 𝑃 (−3 < 𝑥 ≤1
2)
b. Tentukan 𝑃(𝑋 = 0)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
Jawab:
a. 𝑃 (−3 < 𝑋 ≤1
2) = 𝐹 (
1
2) − 𝐹(−3) =
3
4− 0 =
3
4
b. 𝑃(𝑋 = 0) = 𝐹(0) − 𝐹(0) =1
2− 0 =
1
2
C. METODE KUADRAT TERKECIL
Model regresi yang baik adalah model regresi yang dapat mendekati
nilai aktualnya.
Definisi 2.15
Model linier sederhana didefinisikan sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖, 𝑖 = 1,2, … , 𝑛 (2.12)
dengan 𝑌𝑖 =pengamatan ke-i variabel dependen
𝛽0 =intersep
𝛽1 =parameter regresi
𝑋𝑖 =pengamatan ke-i variabel independen
𝑢𝑖, = galat (error) dari pengamatan ke-i
Metode yang dapat digunakan untuk menentukan nilai-nilai penduga
parameter dalam regresi tersebut adalah metode kuadrat terkecil atau yang
biasa disebut ordinary least square (OLS). Misalkan (𝑥𝑖 , 𝑦𝑖 ) sampel random
berukuran n dari sebuah populasi. Berdasarkan Definisi 2.12 maka persamaan
garis regresinya adalah
𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖 (2.13)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
Metode Kuadrat Terkecil bertujuan untuk menentukan penduga dari 𝛽0 dan
𝛽1 yaitu 𝛽0̂ dan 𝛽1̂ yang akan meminimumkan Jumlah Kuadrat Galat (sum of
square error).
Dengan asumsi 𝐸(𝑢𝑖 ) = 0 persamaan regresi akan diduga oleh
𝑌�̂� = 𝛽0̂ + 𝛽1̂𝑋𝑖. (2.14)
Definisi 2.16
Jumlah kuadrat galat (sum of squares error) didefinisikan sebagai
𝑆𝑆𝐸 = ∑(𝑦𝑖 − 𝑦�̂�)2 = ∑[𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑥𝑖)]
2𝑛
𝑖=1
𝑛
𝑖=1
(2.15)
Jumlah Kuadrat Galat minimum diperoleh dengan menggunakan turunan
parsial terhadap 𝛽0̂ dan 𝛽1̂, maka:
𝜕𝑆𝑆𝐸
𝜕 𝛽0̂ =
𝜕{∑ [𝑦𝑖−(𝛽0̂+ 𝛽1̂𝑥𝑖)]2𝑛
𝑖=1 }
𝜕 𝛽0̂ = 0
= − ∑2[𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑥𝑖)]
𝑛
𝑖=1
= 0
= −2(∑𝑦𝑖
𝑛
𝑖−1
− 𝑛𝛽0̂ − 𝛽1̂ ∑𝑥𝑖
𝑛
𝑖=1
) = 0
= ∑ 𝑦𝑖
𝑛
𝑖−1
− 𝑛𝛽0̂ − 𝛽1̂ ∑𝑥𝑖
𝑛
𝑖=1
= 0
∑𝑦𝑖
𝑛
𝑖=1
= 𝑛𝛽0̂ + 𝛽1̂ ∑𝑥𝑖
𝑛
𝑖=1
(2.16)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
𝜕𝑆𝑆𝐸
𝜕 𝛽1̂ =
𝜕{∑ [𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑥𝑖)]2𝑛
𝑖=1 }
𝜕 𝛽1̂ = 0
= − ∑2{[𝑦𝑖 − (𝛽0̂ + 𝛽1̂𝑋𝑖)]𝑥𝑖}
𝑛
𝑖=1
= 0
= −2(∑𝑥𝑖𝑦𝑖
𝑛
𝑖−1
− 𝛽0̂ ∑𝑥𝑖
𝑛
𝑖=1
− 𝛽1̂ ∑𝑥𝑖2
𝑛
𝑖=1
) = 0
= ∑ 𝑥𝑖𝑦𝑖
𝑛
𝑖−1
− 𝛽0̂ ∑𝑥𝑖
𝑛
𝑖=1
− 𝛽1̂ ∑𝑥𝑖2
𝑛
𝑖=1
= 0
∑𝑥𝑖𝑦𝑖
𝑛
𝑖−1
= 𝛽0̂ ∑𝑥𝑖
𝑛
𝑖=1
+ 𝛽1̂ ∑𝑥𝑖2
𝑛
𝑖=1
(2.17)
Dengan menggunakan metode eliminasi pada persamaan kedua di atas maka
diperoleh
∑ 𝑦𝑖𝑛𝑖=1 = 𝑛𝛽0̂ + 𝛽1̂ ∑ 𝑥𝑖
𝑛𝑖=1
𝑛𝛽0̂ = ∑𝑦𝑖
𝑛
𝑖=1
− 𝛽1̂ ∑𝑥𝑖
𝑛
𝑖=1
𝛽0̂ = ∑𝑦𝑖
𝑛
𝑛
𝑖=1
− 𝛽1̂ ∑𝑥𝑖
𝑛
𝑛
𝑖=1
𝛽0̂ = �̅� − 𝛽1̂�̅� (2.18)
∑ 𝑥𝑖𝑦𝑖𝑛𝑖=1 = 𝛽0̂ ∑ 𝑥𝑖
𝑛𝑖=1 + 𝛽1̂ ∑ 𝑥𝑖
2𝑛𝑖=1
𝛽1̂ ∑ 𝑥𝑖2
𝑛
𝑖=1
= ∑𝑥𝑖𝑦𝑖
𝑛
𝑖=1
− 𝛽0̂ ∑𝑥𝑖
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
𝛽1̂ ∑ 𝑥𝑖2
𝑛
𝑖=1
= ∑𝑥𝑖𝑦𝑖
𝑛
𝑖=1
− (�̅� − 𝛽1̂�̅�) ∑𝑥𝑖
𝑛
𝑖=1
𝛽1̂ ∑ 𝑥𝑖2
𝑛
𝑖=1
= ∑𝑥𝑖𝑦𝑖
𝑛
𝑖=1
− (∑𝑦𝑖
𝑛
𝑛
𝑖=1
− 𝛽1̂ ∑𝑥𝑖
𝑛
𝑛
𝑖=1
) ∑𝑥𝑖
𝑛
𝑖=1
𝛽1̂ ∑ 𝑥𝑖2
𝑛
𝑖=1
= ∑𝑥𝑖𝑦𝑖
𝑛
𝑖=1
− (∑𝑦𝑖
𝑛
𝑛
𝑖=1
∑𝑥𝑖
𝑛
𝑖=1
− 𝛽1̂ ∑𝑥𝑖
𝑛
𝑛
𝑖=1
∑𝑥𝑖
𝑛
𝑖=1
)
𝛽1̂ (∑𝑥𝑖2
𝑛
𝑖=1
− ∑𝑥𝑖
𝑛
𝑛
𝑖=1
∑𝑥𝑖
𝑛
𝑖=1
) = ∑𝑥𝑖𝑦𝑖
𝑛
𝑖=1
− ∑𝑦𝑖
𝑛
𝑛
𝑖=1
∑𝑥𝑖
𝑛
𝑖=1
𝛽1̂ = ∑ 𝑥𝑖𝑦𝑖
𝑛𝑖=1 − ∑
𝑦𝑖
𝑛𝑛𝑖=1 ∑ 𝑥𝑖
𝑛𝑖=1
(∑ 𝑥𝑖2𝑛
𝑖=1 − ∑𝑥𝑖
𝑛𝑛𝑖=1 ∑ 𝑥𝑖
𝑛𝑖=1 )
𝛽1̂ = ∑ 𝑥𝑖𝑦𝑖
𝑛𝑖=1 −
1𝑛
∑ 𝑦𝑖𝑛𝑖=1 ∑ 𝑥𝑖
𝑛𝑖=1
∑ 𝑥𝑖2𝑛
𝑖=1 −1𝑛
(∑ 𝑥𝑖𝑛𝑖=1 )2
(2.19)
D. MODEL KUADRAT TERKECIL MENGGUNAKAN MATRIKS
Model linear dengan 𝑘 variabel independen didefinisikan sebagai
berikut:
𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘 + 𝜀𝑖, 𝑖 = 1,2, … , 𝑛 (2.20)
dengan 𝑌𝑖 = pengamatan ke-i variabel dependen
𝛽0 = intersep
𝛽𝑗 = parameter regresi (𝑗 = 1,… , 𝑘)
𝑋𝑖𝑗 = pengamatan ke − 𝑖 variabel 𝑋 ke − 𝑗
𝜀𝑖 = galat (error) dari pengamatan ke-i
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
Untuk mempermudah analisis maka model dapat diekspesikan dalam bentuk
matriks. Misalkan
𝒀 = (𝑌1
⋮𝑌𝑛
) , 𝑿 = (1 𝑋11 …⋮ ⋮ 1 𝑋1𝑛 …
𝑋𝑘1
⋮𝑋𝑘𝑛
) , 𝜷 = (𝛽0
⋮𝛽𝑘
) , 𝜺 = (
𝜀1
⋮𝜀𝑛
) (2.21)
Perhatikan bahwa pada matriks 𝑿 = (𝑋𝒊𝒋) berukuran 𝑛 𝑥 𝑘, pada indeks
pertama yaitu 𝑗 (𝑗 = 1,… , 𝑘) menunjukkan variabel independen ke-j (dalam
kolom) dan indeks kedua yaitu 𝑖 (𝑖 = 1, … , 𝑛) menunjukkan jumlah
pengamatan (dalam baris), sehingga dapat ditulis sebagai
(𝑌1
⋮𝑌𝑛
) = (1 𝑋11 …⋮ ⋮ 1 𝑋1𝑛 …
𝑋𝑘1
⋮𝑋𝑘𝑛
)(𝛽0
⋮𝛽𝑘
) + (
𝜀1
⋮𝜀𝑛
) (2.22)
Pada notasi di atas dapat ditulis kembali dengan
𝒀 = 𝑿𝜷 + 𝜺 (2.23)
dengan 𝜷 merupakan vektor parameter (𝑘 + 1)𝑥1 dan 𝜺 merupakan vektor
galat 𝑛𝑥1.
Residual dan kriteria kuadrat terkecil
Misalkan �̂� merupakan vektor penduga dari vektor parameter 𝜷 yang
berukuran (𝑘 + 1)𝑥 1, maka penduga modelnya dapat ditulis sebagai
𝒀 = 𝑿 �̂� + 𝜺 (2.24)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Sehingga didapatkan
𝜺 = 𝒀 − 𝑿 �̂� (2.25)
Transpos dari sebuah matriks dinotasikan dengan (′). Misalkan transpos dari
vektor residual 𝜺 adalah matriks yang berukuran 1 𝑥 𝑛, yaitu 𝜺′ = (𝜀1, … , 𝜀𝑛).
Dengan demikian jumlah kuadrat galat dapat dinyatakan dalam bentuk
perkalian vektor sebagai berikut:
𝜺′𝜺 = [𝜀1 … 𝜀1]1𝑥𝑛 [
𝜀1
⋮𝜀1
]
𝑛𝑥1
(2.26)
Untuk menentukan penduga kuadrat terkecil, kita menuliskan jumlah kuadrat
residual sebagai:
𝑆( �̂�) = ∑𝜀𝑖2
= 𝜺′𝜺
= (𝒀 − 𝑿 �̂�)′(𝒀 − 𝑿 �̂�)
= 𝒀′𝒀 − 𝒀′𝑿 �̂� − �̂�′𝑿′𝒀 + �̂�′𝑿′𝑿 �̂� (2.27)
Karena 𝒀′𝑿 �̂� dan �̂�′𝑿′𝒀′ merupakan skalar yang bernilai sama sehingga
diketahui bahwa dalam aturan matriks:
𝒀′𝑿 �̂� = (𝒀′𝑿 �̂�)′= �̂�′𝑿′𝒀 (2.28)
Sehingga
𝜺′𝜺 = 𝒀′𝒀 − �̂�′𝑿′𝒀 − �̂�′𝑿′𝒀 + �̂�′𝑿′𝑿 �̂�
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
= 𝒀′𝒀 − 2 �̂�′𝑿′𝒀 + 𝑿′𝑿 �̂�𝟐 (2.29)
Dengan menggunakan OLS untuk menentukan penduga �̂� yang mampu
meminimalkan jumlah kuadrat galat, maka dilakukan pendiferensialan
(penurunan) terhadap �̂� sebagai berikut:
𝜕𝑆
𝜕 �̂�= −2𝑿′𝒀 + 2𝑿′𝑿 �̂� (2.30)
karena
𝜕(2 �̂�′𝑿′𝒀)
𝜕 �̂�=
𝜕2 �̂�′(𝑿′𝒀)
𝜕 �̂�= 2𝑿′𝒀
misalkan 𝑨 = 𝑿′𝑿, maka
𝜕(�̂�′𝑿′𝑿 �̂�)
𝜕 �̂�=
𝜕( �̂�′𝑨�̂�)
𝜕 �̂�= 2𝑨�̂�
Sehingga
𝜕(�̂�′𝑿′𝑿 �̂�)
𝜕 �̂�= 2𝑿′𝑿�̂�
Sebagai contoh, bila persamaan regresi dengan parameter 𝛽1 dan 𝛽2, misalkan
𝑿′𝑿 = 𝑐𝑖𝑗, 𝑖, 𝑗 = 1,2 dengan 𝑐12 = 𝑐21. Maka: �̂�′𝑿′𝑿 �̂� = 𝑐11𝛽12̂ + 𝑐22𝛽2
2̂ +
2𝑐12𝛽1̂𝛽2̂. Lalu, �̂�′𝑿′𝑿 �̂� akan diturunkan terhadap 𝛽1̂ dan 𝛽2̂.
𝜕(�̂�′𝑿′𝑿 �̂�)
𝜕𝛽1̂ =
𝜕(𝑐11𝛽12̂ + 𝑐22𝛽2
2̂ + 2𝑐12𝛽1̂𝛽2̂)
𝜕𝛽1̂
= 2𝑐11𝛽1 + 2𝑐12𝛽2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
Dan
𝜕(�̂�′𝑿′𝑿 �̂�)
𝜕𝛽2̂ =
𝜕(𝑐11𝛽12̂ + 𝑐22𝛽2
2̂ + 2𝑐12𝛽1̂𝛽2̂)
𝜕𝛽2̂
= 2𝑐12𝛽1 + 2𝑐12𝛽2
Karena kedua turunan parsial dalam vektor 2 𝑥 1,maka dapat ditulis dengan
2𝑿′𝑿�̂�.
Untuk mencari penduga kuadrat terkecil bagi 𝜷 adalah dengan
meminimalkan 𝑆( �̂�). Oleh karena itu nilai derivatif sama dengan nol,
𝜕𝑆
𝜕 �̂�= 0
Sehingga
0 = −2𝑿′𝒀 + 2𝑿′𝑿 �̂�
2𝑿′𝑿 �̂� = 2𝑿′𝒀
(𝑿′𝑿) �̂� = 𝑿′𝒀
Dengan demikian, menggunakan aturan matriks kita akan memperoleh
nilai �̂�, yaitu:
�̂� = (𝑿′𝑿)−1𝑿′𝒀 (2.31)
E. METODE KEMUNGKINAN MAKSIMUM (Maximum Likelihood)
Untuk mengilustrasikan Metode Kemungkinan Maksimum dapat
menggunakan contoh. Dimisalkan terdapat kotak yang berisikan tiga buah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
bola, dimana ketiga bola itu berwarna merah atau putih tetapi tidak diketahui
berapa banyaknya masing-masing jumlah tiap warna. Lalu diambil sampel
secara random tanpa pengembalian. Jika yang terambil adalah dua bola
berwarna merah maka dapat disimpulkan bahwa jumlah bola berwana merah
yang ada di kotak haruslah dua atau tiga (jika terdapat nol atau satu bola
merah pada kotak, maka tidak mungkin sampel yang terambil dua bola
merah). Jika terdapat dua bola merah dan satu bola putih di dalam kotak,
peluang terambilnya dua bola merah secara acak adalah
( 22 ) (
10)
(32)
=1
3
Jika terdapat tiga bola berwarna merah di dalam kotak, maka peluang
terambilnya tiga buah bola secara acak adalah
( 32 )
(32)
= 1
Karena itu dipilih tiga sebagai penduga dari banyaknya bola merah di dalam
kotak karena ini merupakan penduga yang memaksimalkan probabilitas dari
sampel yang diamati. Tentu saja ini mungkin apabila terdapat dua bola merah
di dalam kotak, tetapi sampel yang diamati memberikan kepercayaan lebih
untuk tiga bola merah yang terdapat di dalam kotak. Contoh ilustrasi ini
adalah metode untuk menemukan penduga yang dapat diaplikasikan pada
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
berbagai situasi. Secara teknik, metode ini disebut Metode Kemungkinan
Maksimum (Maximum Likelihood Method).
Definisi 2.17
Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah variabel random kontinu berukuran 𝑛 dengan
fungsi probabilitas 𝑓(𝑥, 𝜃) dan 𝜃 adalah parameter yang tidak diketahui,
fungsi likelihood dari sampel random adalah densitas bersama dari 𝑛 variabel
random dan bergantung pada fungsi parameter yang tidak diketahui. Fungsi
likelihood dinotasikan dengan 𝐿(𝜃) dan didefinisikan sebagai
𝐿(𝜃) = ∏𝑓(𝑥𝑖; 𝜃)
𝑛
𝑖=1
(2.32)
Definisi 2.18
Penduga Kemungkinan Maksimum (Maximum Likelihood Estimator) 𝜃𝑀𝐿
dari 𝜃 memaksimumkan likelihood 𝐿(𝜃|𝑌) atau ekuivalen dengan
memaksimumkan log-likelihood 𝑙(𝜃|𝑌) dengan 𝑙 = ln 𝐿(𝜃).
Selain itu, karena biasanya sulit untuk mencari turunan fungsi
likelihood, maka yang dilakukan adalah menentukan nilai maksimum dari
logaritma natural fungsi likelihood tersebut atau disebut dengan fungsi log-
likelihood. Fungsi log-likelihood dapat ditulis dalam bentuk:
𝑙 = ln 𝐿(𝜃) (2.33)
Nilai parameter 𝜃 dapat diperoleh dengan memaksimumkan fungsi
likelihood. Hal ini tersebut dilakukan dengan mencari turunan parsial pertama
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
dari fungsi log-likelood-nya terhadap setiap parameternya. Sehingga, MLE
𝜃 merupakan penyelesaian dari persamaan berikut:
𝑑𝑙
𝑑𝜃= 0 (2.34)
Misalkan terdapat 𝑘 parameter yang tidak diketahui, maka pendugaan
parameter 𝜃𝑖 dengan Metode Kemungkinan Maksimum
𝑑𝑙
𝑑𝜃1= 0 (2.35)
dengan 𝑙 = ln(𝜃1, 𝜃2, … , 𝜃𝑛) , 𝑖 = 1, 2, … , 𝑘
Contoh 2.9
Misal 𝑋 adalah variabel random diskrit dengan fungsi probabilitas dengan
parameter 0 ≤ 𝜃 ≤ 1. Berikut 10 sampel random:
𝑥 0 1 2 3
𝑃(𝑥) 2𝜃
3
𝜃
3
2(1 − 𝜃)
3
1 − 𝜃
3
Yang diambil dari distribusi probabilitas di atas: (3, 0, 2, 1, 3, 2, 1, 0, 2, 1).
Tentukan penduga kemungkinan maksimum dari 𝜃!
Jawab:
Sampel yang diketahui (3, 0, 2, 1, 3, 2, 1, 0, 2, 1), maka likelihoodnya adalah
𝐿(𝜃) = 𝑃(𝑋 = 3)𝑃(𝑋 = 0)𝑃(𝑋 = 2)𝑃(𝑋 = 1)𝑃(𝑋 = 3)
𝑃(𝑋 = 2) 𝑃(𝑋 = 1) 𝑃(𝑋 = 0)𝑃(𝑋 = 2)𝑃(𝑋 = 1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
Substitusikan dari distribusi probabilitas yang diberikan di atas, kita dapatkan
𝐿(𝜃) = ∏𝑃(𝑋𝑖|𝜃) = (2𝜃
3)2
(𝜃
3)
3
(2(1 − 𝜃)
3)
3
(1 − 𝜃
3 )
2
𝑛
𝑖=1
Ini jelas bahwa fungsi likelihood 𝐿(𝜃) tidak mudah untuk dimaksimalkan.
Mari kita lihat fungsi log-likelihood.
𝑙(𝜃) = 𝑙𝑜𝑔𝐿(𝜃) = ∑𝑙𝑜𝑔 𝑃(𝑋𝑖|𝜃)
𝑛
𝑖=1
= 2 (log2
3+ log 𝜃) + 3 (log
1
3+ log 𝜃) + 3 (log
2
3+ log(1 − 𝜃))
+ 2 (log1
3+ log(1 − 𝜃))
= 𝐶 + 5 log 𝜃 + 5 log(1 − 𝜃),
dengan 𝐶 adalah konstanta. Dapat dilihat bahwa fungsi log-likelihood lebih
mudah dimaksimalkan dibandingkan fungsi likelihood.
Penduga 𝜃dapat diperoleh dengan mencari turunan dari 𝑙(𝜃) terhadap 𝜃 dan
disamadengankan nol.
𝑑𝑙(𝜃)
𝑑𝜃=
5
𝜃−
5
1 − 𝜃= 0
dan solusi yang diberikan oleh MLE, dengan 𝜃 = 0.5.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
F. METODE NEWTON-RAPHSON
Metode Newton-Rhapson merupakan salah satu metode untuk
menyelesaikan persamaan 𝑓(𝑥) = 0 yang tidak dapat diselesaikan secara
eksplisit.
Misalkan 𝑓 mempunyai akar pada suatu interval real. Misalkan 𝑥0 ∈
[𝑎, 𝑏] adalah pendekatan ke penyelesaian persamaan 𝑝, dengan 𝑓′(𝑥0) ≠ 0
dan |𝑥0 − 𝑝| suatu bilangan kecil. Deret Taylor untuk 𝑓(𝑥) di sekitar 𝑥0
adalah:
𝑓(𝑥) = 𝑓(𝑥0) + (𝑥 − 𝑥0)𝑓′(𝑥0) +
𝑓′′(𝑥0)
2!(𝑥 − 𝑥0)
2 + ⋯ (2.36)
Jika 𝑓(𝑝) = 0 dan 𝑥 = 𝑝 sehingga persamaannya menjadi
0 = 𝑓(𝑥0) + (𝑝 − 𝑥0)𝑓′(𝑥0) + +
𝑓′′(𝑥0)
2!(𝑝 − 𝑥0)
2 + ⋯ (2.37)
Metode Newton diperoleh dengan mengasumsikan bahwa, jika |𝑝 − 𝑥0|
bernilai kecil, maka (𝑝 − 𝑥0)2 dapat diabaikan sehingga
0 ≈ 𝑓(𝑥0) + (𝑝 − 𝑥0)𝑓′(𝑥0) (2.38)
dan penyelesaian untuk 𝑝 dalam persamaan ini adalah
𝑝 ≈ 𝑥0 − 𝑓(𝑥0)
𝑓′(𝑥0) (2.39)
Uraian di atas merupakan tahap metode Newton-Raphson, yang dimulai
dengan nilai awal 𝑝0 dan menghasilkan barisan {𝑝𝑛} yang didefinisikan oleh
𝑝𝑛 = 𝑝𝑛−1 − 𝑓(𝑝𝑛−1)
𝑓′(𝑝𝑛−1), 𝑛 ≥ 1 (2.40)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Gambar (2.3) mengilustrasikan bagaimana pendekatan-pendekatan untuk
menyelesaikan p dilakukan menggunakan garis singgung (slope) secara
berturut-turut.
Gambar 2.3 Ilustrasi garis singgung (slope)
Metode Newton merupakan suatu teknik fungsi iterasi dari bentuk 𝑝𝑛 =
𝑔(𝑝𝑛−1) dengan
𝑔(𝑝𝑛−1) = 𝑝𝑛−1 − 𝑓(𝑝𝑛−1)
𝑓′(𝑝𝑛−1), 𝑛 ≥ 1 (2.41)
Metode Newton tidak dapat dilanjutkan jika 𝑓′(𝑝𝑛−1) = 0 untuk suatu n.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
BAB III
DASAR-DASAR MATEMATIS MODEL REGRESI LOGISTIK
ORDINAL
BAB III DASAR-DASAR MATEMATIS MODEL REGRESI LOGISTIK ORDINAL
A. REGRESI LOGISTIK
I. Pendahuluan
Regresi logistik merupakan salah satu metode statistika yang
berfungsi untuk menganalisis variabel respon atau biasa disebut variabel
tak bebas (dependen) yang datanya berskala ordinal atau nominal. Dilihat
dari variabel bebasnya, regresi logistik terbagi menjadi dua yaitu regresi
logistik sederhana (hanya memiliki satu variabel bebas) dan regresi
logistik berganda (memiliki lebih dari satu variabel bebas) sedangkan
dilihat dari variabel responnya, regresi logistik dapat dibedakan menjadi
dua yaitu regresi logistik biner (variabel responnya dichotomous atau
hanya memiliki dua kategori) dan regresi logistik multinomial (variabel
responnya polytomous atau memiliki lebih dari dua kategori).
Estimasi untuk model regresi ordinal merupakan perluasan dari
regresi logistik biner. Model ini secara kolektif didefinisikan sebagai
model linear umum, yang terdiri dari tiga komponen:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
1. Komponen acak, dengan variabel dependen 𝑌 memiliki salah satu
distribusi eksponensial seperti normal, binomial, atau invers
Gaussian.
2. Komponen linear, yang menjelaskan fungsi 𝑌′, dari variabel
dependen 𝑌 tergantung pada prediktor.
3. Fungsi link, yang menggambarkan transformasi variabel dependen
𝑌 ke 𝑌′ (Fox,1997)
Analisis logistik untuk percobaan respon biner terhadap model odds
memungkinkan terjadinya suatu kejadian dan memperkirakan efek dari
variabel dependen terhadap odds. Odds untuk suatu kejadian merupakan
hasil bagi (perbandingan) antara probabilitas terjadinya (“sukses”)
dengan probabilitas kegagalan. Ketika probabilitas keberhasilan lebih
besar dari kegagalan, maka nilai odds lebih besar dari 1. Jika kedua
hasilnya sama besar maka nilai oddsnya 1 dan jika probabilitas
keberhasilan kurang dari probabilitas kegagalan, maka nilai oddsnya
kurang dari 1.
Contoh 𝟑. 𝟏
Percobaan mengamati hasil ujian Surat Ijin Mengemudi (SIM). Hasilnya
dapat digambarkan sebagai biner: seorang anak berhasil lulus ujian SIM
(sukses) atau tidak (gagal). Odds dapat dihitung dari data sampel dengan
membagi probabilitas kejadian lulus ujian (𝑌 = 1) dengan probabilitas
kejadian tidak lulus ujian (𝑌 = 0):
Odds =𝑃(𝑌 = 1)
𝑃(𝑌 = 0)=
𝑃(𝑌 = 1)
1 − 𝑃(𝑌 = 1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
Untuk menguji suatu oods variabel independen, seperti jenis kelamin
atau usia, kita menggunakan rasio odds (OR), yang membandingkan odds
untuk nilai yang berbeda dari variabel bebas.
Contoh 𝟑. 𝟐
Seperti pada contoh 3.1, kita akan membandingkan oods kejadian
“berhasil lulus ujian” laki-laki (𝑥 = 1) dengan odds kejadian “lulus
ujian” perempuan (𝑥 = 0), maka kita dapat menghitung rasio:
𝑂𝑅 =
𝑃(𝑌 = 1|𝑥 = 1)1 − 𝑃(𝑌 = 1|𝑥 = 1)
𝑃(𝑌 = 1|𝑥 = 0)1 − 𝑃(𝑌 = 1|𝑥 = 0)
Rasio Odds mempunyai batas 0 tetapi tidak mempunyai batas atas.
Adapun sifat-sifat dari rasio odds:
1. Rasio odds, 𝑂𝑅 = 1 menyatakan bahwa peluang kejadian pada
kedua grup adalah sama.
2. Rasio odds, 𝑂𝑅 > 1 menyatakan bahwa peluang kejadian pada grup
pertama lebih besar daripada grup kedua.
3. Rasio odds, 𝑂𝑅 < 1 menyatakan bahwa peluang kejadian pada grup
pertama lebih kecil daripada grup kedua.
4. Rasio odds harus lebih besar dari atau sama dengan 0 atau 𝑂𝑅 ≥ 1.
5. Rasio odds harus mendekati nol jika odds kejadian dari grup pertama
mendekati nol.
6. Rasio odds akan mendekati positif tak terhingga jika odds kejadian
dari kategori kedua mendekati nol.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
II. Model Regresi Logistik
Model regresi logistik adalah model yang peubah terikatnya atau
responnya berupa peubah kategorik sedangkan menurut Hosmer
(1989) metode regresi logistik adalah suatu metode analisis statistika
yang mendeskripsikan hubungan antara peubah respon yang memiliki
dua kategori atau lebih dengan satu atau lebih peubah bebas berskala
kategori atau interval.
Yang membedakan model regresi logistik dengan model regresi
linear adalah variabel hasil dalam regresi logistik merupakan variabel
biner atau dikotomis.
Contoh 𝟑. 𝟑
Dalam penelitian terhadap resiko terkena penyakit jantung koroner
(CHD) dengan bertambahnya usia (AGE), ada 100 individu yang
berpartisipasi dalam penelitian dan hasilnya tercatat dalam Tabel 3.1
pada lampiran 1, yang berisi variabel pengenal (ID), variabel umur
(AGE), variabel kelompok umur (AGRP) dan variabel hasil CHD yang
diberi kode dengan "0" menunjukkan CHD tidak ada atau "1"
menunjukkan bahwa CHD ada pada individu.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
Gambar 𝟑. 𝟏. scatterplot CHD menurut AGE pada 100 individu
Dalam scatterplot, semua titik jatuh pada salah satu dari dua garis sejajar
yang mewakili tidak adanya CHD (𝑦 = 0) dan adanya CHD (𝑦 = 1).
Karena tidak memberikan gambaran yang jelas tentang hubungan antara
CHD dan AGE, maka dilakukan strategi dengan menciptakan interval
untuk variabel independen dan menghitung nilai rata-rata (proporsi) di
dalam masing-masing kelompok dengan menggunakan variabel
kelompok umur (AGRP).
Kelompok
umur
Banyaknya
(n)
CHD Rata-rata
(proporsi)
[(+)/n] (-) (+)
20-29 10 9 1 0.10
30-34 15 13 2 0.13
0
0.2
0.4
0.6
0.8
1
1.2
0 10 20 30 40 50 60 70 80
CH
D
AGE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
35-39 12 9 3 0.25
40-44 15 10 5 0.33
45-49 13 7 6 0.46
50-54 8 3 5 0.63
55-59 17 4 13 0.76
60-69 10 2 8 0.80
Total 100 57 43 0.43
Tabel 𝟑. 𝟏 Tabel frekuensi pengelompokan umur pada CHD
Gambar 𝟑. 𝟐 Plot persentase individu dengan CHD pada setiap
kelompok umur
Ada dua perbedaan penting dari kedua gambar di atas. Perbedaan yang
pertama pada hubungan antara variabel dependen (tak bebas) dan
variabel independen (bebas). Dalam regresi linear biasa, kuantitas utama
adalah nilai rata-rata dari variabel hasil, jika diketahui nilai variabel
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0 2 4 6 8 10
CH
D
dal
am p
ers
en
AGE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
independen. Kuantitas ini disebut rata-rata bersyarat dan dapat
dinyatakan sebagai
𝐸(𝑌|𝑥)
Dibaca “nilai harapan 𝑌, jika diketahui nilai 𝑥”,
dengan 𝑌 = variabel dependen
𝑥 = nilai variabel independen
Pada regresi linear kita asumsikan bahwa rata-rata dapat dinyatakan
sebagai persamaan linear dalam 𝑥, yaitu
𝐸(𝑌|𝑥) = 𝛽0 + 𝛽1𝑥 (3.1)
dengan nilai 𝐸(𝑌|𝑥) berada di antara daerah −∞ dan +∞.
Pada regresi logistik, kolom “rata-rata” pada Tabel 3.1 memberikan
pendugaan nilai 𝐸(𝑌|𝑥). Dengan menggunakan data dikotomis, nilai dari
rata-rata bersyarat harus lebih besar atau sama dengan 0 dan kurang dari
atau sama dengan 1 (0 ≤ 𝐸(𝑌|𝑥) ≤ 1). Dan pada gambar 3.2
menunjukkan bahwa rata-ratanya mendekati 0 dan 1. Perubahan dalam
𝐸(𝑌|𝑥) berubah dalam 𝑥 menjadi semakin kecil karena rata-rata
bersyaratnya mendekati 0 atau 1, sehingga kurva akan berbentuk S.
Untuk menyederhanakan notasi, akan digunakan kuantitas 𝜋(𝑥) =
𝐸(𝑌|𝑥) untuk mewakili rata-rata bersyarat 𝑌, jika diketahui 𝑥 saat
distribusi logistik digunakan. Bentuk spesifik dari model regresi logistik
adalah
𝜋(𝑥) =𝑒𝛽0+𝛽1𝑥
1 + 𝑒𝛽0+𝛽1𝑥 (3.2)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
Persamaan (3.2) dapat ditransformasikan ke bentuk lain yang ekivalen.
Dengan menggunakan manipulasi aljabar, maka didapatkan:
𝜋(𝑥) =𝑒𝛽0+𝛽1𝑥
1 + 𝑒𝛽0+𝛽1𝑥
𝜋(𝑥)[1 + 𝑒𝛽0+𝛽1𝑥] = 𝑒𝛽0+𝛽1𝑥
𝜋(𝑥) + 𝜋(𝑥)[𝑒𝛽0+𝛽1𝑥] = 𝑒𝛽0+𝛽1𝑥
𝜋(𝑥) = 𝑒𝛽0+𝛽1𝑥 − 𝜋(𝑥)[𝑒𝛽0+𝛽1𝑥]
𝜋(𝑥) = (1 − 𝜋(𝑥))𝑒𝛽0+𝛽1𝑥
𝜋(𝑥)
1 − 𝜋(𝑥)= 𝑒𝛽0+𝛽1𝑥 (3.3)
Bentuk dari persamaan (3.3) sering disebut sebagai odds. Agar
persamaan (3.3) dapat dipadankan dengan model regresi linear, maka
persamaan (3.3) dapat ditransformasi dengan logaritma sebagai berikut:
ln (𝜋(𝑥)
1 − 𝜋(𝑥)) = ln(𝑒𝛽0+𝛽1𝑥)
ln (𝜋(𝑥)
1 − 𝜋(𝑥)) = 𝛽0 + 𝛽1𝑥
Maka didapat sebagai berikut:
𝑔(𝑥) = ln (𝜋(𝑥)
1 − 𝜋(𝑥)) = 𝛽0 + 𝛽1𝑥
(3.4)
Persamaan (3.4) sehingga disebut sebagai persamaan logit. Pentingnya
transformasi di atas adalah bahwa 𝑔(𝑥) memiliki sifat yang diinginkan
dari model regresi linear, dan logit 𝑔(𝑥) adalah linear dalam
parameternya, mungkin kontinu dan berada di antara daerah −∞ dan
+∞ dengan 𝑔(𝑥) berkisar antara 0 dan 1.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
Perbedaan yang kedua adalah distribusi bersyarat dari variabel
hasil. Pada model regresi linear kita asumsikan bahwa pengamatan
terhadap variabel hasil dapat dinyatakan sebagai 𝑦 = 𝐸(𝑌|𝑥) + 𝜀,
dengan 𝜀 disebut galat dan dapat didefinisikan sebagai selisih
pengamatan dengan rata-rata bersyarat. Asumsi paling umum bahwa 𝜀
berdistribusi normal dengan rata-rata nol dan variansi konstan. Hal yang
demikian ini tidak terjadi pada variabel hasil yang dikotomis. Pada situasi
ini kita dapat mengeskpresikan nilai variabel hasil bila diberikan 𝑥
sebagai 𝑦 = 𝜋(𝑥) + 𝜀, dengan 𝜀 didefinisikan sebagai salah satu dari dua
nilai yang mungkin.
Jika 𝑦 = 1, maka 𝜀 = 1 − 𝜋(𝑥) terjadi dengan probabilitas 𝜋(𝑥).
Jika 𝑦 = 0, maka 𝜀 = − 𝜋(𝑥) terjadi dengan probabilitas 1 − 𝜋(𝑥).
Sehingga 𝜀 memiliki distribusi dengan rata-rata nol dan varians yang
sama dengan 𝜋(𝑥)[1 − 𝜋(𝑥)] yang artinya adalah distribusi bersyarat
dari variabel hasil mengikuti distribusi Binomial dengan parameter 𝜋(𝑥).
Demikian pembahasan di atas, persamaan regresi logistik yang ekivalen
ada 3 yaitu:
Persamaan (3.2) merupakan ekspresi aljabar persamaan regresi
logistik untuk memprediksi �̂�(𝑥), yaitu probabilitas “sukses”.
�̂�(𝑥) =𝑒𝛽0+𝛽1𝑥
1 + 𝑒𝛽0+𝛽1𝑥
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
Plot dari �̂�(𝑥) sebagai fungsi 𝑋 dengan menggunakan persamaan (3.2)
didapatkan lim𝑥→−∞
𝐹(𝑥) = 0, lim𝑥→0
𝐹(𝑥) =1
2, 𝑑𝑎𝑛 lim
𝑥→∞𝐹(𝑥) = 1, akan
menghasilkan kurva berbentuk S.
Gambar 3.3 Kurva hubungan dari variabel biner dengan prediktor X
Persamaan (3.3) adalah odds, yang merupakan perbandingan antara
probabilitas kejadian “sukses” dengan probabilitas kejadian “tidak
sukses”.
𝜋(𝑥)
1 − 𝜋(𝑥)= 𝑒𝛽0+𝛽1𝑥
Persamaan (3.4) adalah persamaan logistik yang menggambarkan
estimasi probabilitas �̂�(𝑥) yang linear terhadap prediktor X yaitu
memungkinkan sisi prediktor persamaan regresi menjadi linear dalam
estimasi parameter.
𝑔(𝑥) = ln (�̂�(𝑥)
1 − �̂�(𝑥)) = 𝛽0 + 𝛽1𝑥
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
III. Pendugaan Model Regresi Logistik
Misalkan diketahui sampel n pasang pengamatan (𝑥𝑖, 𝑦𝑖), 𝑖 =
1,… . , 𝑛. Dengan 𝑦𝑖 menunjukkan nilai variabel respon dikotomis dan 𝑥𝑖
menunjukkan nilai ke- 𝑖 variabel independen. Sehingga permasalahannya
adalah menduga regresi logistik dalam persamaan (3.2) dengan menduga
nilai 𝛽0 dan 𝛽1.
Dalam regresi linear, metode yang digunakan dalam menduga
parameter yang tidak diketahui adalah dengan menggunakan metode
kuadrat terkecil. Tetapi bila diterapkan pada model hasil dikotomis maka
estimator tidak lagi memiliki sifat yang sama, sehingga menggunakan
metode kemungkinan maksimum. Metode ini memaksimalkan
probabilitas pada data yang diamati. Maka kita harus mempunyai fungsi
untuk menerapkan metode ini yang disebut fungsi likelihood. Yang
didefinisikan sebagai probabilitas data yang diamati sebagai fungsi dari
parameter yang tidak diketahui.
Jika Y dikodekan sebagai 0 dan 1 maka ungkapan untuk 𝜋(𝑥) pada
persamaan (3.2) adalah (untuk nilai vektor parameter 𝜷 = (𝛽0, 𝛽1))
probabilitas bersyarat bahwa 𝑌 sama dengan 1 jika diberikan nilai x. Ini
akan dinotasikan sebagai 𝑃(𝑌 = 1|𝑥). Dengan demikian kuantitas 1 −
𝜋(𝑥) berarti probabilitas bersyarat bahwa Y sama dengan nol jika
diberikan nilai x, 𝑃(𝑌 = 0|𝑥). Jadi, untuk pasangan (𝑥𝑖, 𝑦𝑖), dengan 𝑦𝑖 =
1, kontribusi terhadap fungsi likelihood adalah 𝜋(𝑥𝑖), dan untuk 𝑦𝑖 = 0,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
kontribusi terhadap fungsi likelihood adalah 1 − 𝜋(𝑥𝑖), dengan kuantitas
𝜋(𝑥𝑖) menunjukkan nilai 𝜋(𝑥) yang dihitung pada 𝑥𝑖.
Fungsi likelihood untuk pasangan (𝑥𝑖, 𝑦𝑖) adalah
𝜋(𝑥𝑖)𝑦𝑖[1 − 𝜋(𝑥𝑖)]
1−𝑦𝑖 (3.5)
Karena pengamatan diasumsikan independen, fungsi likelihood
diperoleh sebagai perkalian dari persamaan (3.5) dengan 𝜷 = (𝛽0, 𝛽1)
yang dapat dibentuk sebagai
𝐿(𝜷) = ∏𝜋(𝑥𝑖)𝑦𝑖[1 − 𝜋(𝑥𝑖)]
1−𝑦𝑖
𝑛
𝑖=1
(3.6)
Untuk memudahkan proses berikutnya, persamaan (3.6) diubah ke
dalam persamaan log, sehingga persamaan log likelihood yang didapat
adalah
𝑙(𝜷) = ln[𝑙(𝜷)] = ∑{
𝑛
𝑖=1
𝑦𝑖 ln[𝜋(𝑥𝑖)] + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]} (3.7)
Untuk menentukan nilai 𝜷 yang memaksimalkan nilai 𝑙(𝜷), maka
kita harus menurunkan persamaan 𝑙(𝜷) terhadap 𝛽0 dan 𝛽1 dan
menyamakannya dengan nol.
Turunan pertama dari persamaan (3.7) terhadap 𝛽0 dengan
ln[𝜋(𝑥𝑖)] = 𝛽0 + 𝛽1𝑥𝑖 adalah:
𝜕𝑙(𝜷)
𝜕𝛽0=
𝜕
𝜕𝛽0{∑{
𝑛
𝑖=1
𝑦𝑖 ln[𝜋(𝑥𝑖)] + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}
= 𝜕
𝜕𝛽0{∑{
𝑛
𝑖=1
𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖) + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
=𝜕
𝜕𝛽0{∑𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖)
𝑛
𝑖=1
+ ∑(1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]
𝑛
𝑖=1
}
= ∑𝑦𝑖 + ∑1
(1 − 𝜋(𝑥𝑖))(−1)(
𝑛
𝑖=1
𝑛
𝑖=1
1 − 𝜋(𝑥𝑖))𝜋(𝑥𝑖)
= ∑[𝑦𝑖 − 𝜋(𝑥𝑖)]
𝑛
𝑖=1
(3.8)
Turunan pertama dari persamaan (3.7) terhadap 𝛽1 dengan
ln[𝜋(𝑥𝑖)] = 𝛽0 + 𝛽1𝑥𝑖 adalah:
𝜕𝑙(𝜷)
𝜕𝛽1=
𝜕
𝜕𝛽1{∑{
𝑛
𝑖=1
𝑦𝑖 ln[𝜋(𝑥𝑖)] + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}
= 𝜕
𝜕𝛽0{∑{
𝑛
𝑖=1
𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖) + (1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]}}
=𝜕
𝜕𝛽0{∑𝑦𝑖(𝛽0 + 𝛽1𝑥𝑖)
𝑛
𝑖=1
+ ∑(1 − 𝑦𝑖) ln[1 − 𝜋(𝑥𝑖)]
𝑛
𝑖=1
}
= ∑𝑦𝑖𝑥𝑖 + ∑1
(1 − 𝜋(𝑥𝑖))(−1)(𝑥𝑖)(𝜋(𝑥𝑖))(
𝑛
𝑖=1
𝑛
𝑖=1
1 − 𝜋(𝑥𝑖))
= ∑[𝑥𝑖𝑦𝑖 − 𝑥𝑖(1 − 𝜋(𝑥𝑖))]
𝑛
𝑖=1
= ∑𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
(3.9)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
Persamaan (3.8) dan (3.9) dikenal sebagai persamaan likelihood
dengan:
∑[𝑦𝑖 − 𝜋(𝑥𝑖)]
𝑛
𝑖=1
= 0 (3.10)
dan
∑𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) = 0
𝑛
𝑖=1
(3.11)
Persamaan (3.10) dan (3.11) dalam bentuk matriks adalah
𝑆(𝛽0, 𝛽1) = [𝑆1(𝛽0
, 𝛽1 )
𝑆2(𝛽0 , 𝛽1
)] =
[ ∑[𝑦𝑖 − 𝜋(𝑥𝑖)]
𝑛
𝑖=1
= 0
∑ 𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) = 0
𝑛
𝑖=1 ]
(3.12)
Nilai 𝜷 yang diberikan pada solusi persamaan (3.10) dan (3.11)
disebut penduga kemungkinan maksimum dan akan dinotasikan oleh �̂�.
Secara umum, penggunaan simbol "^" menunjukkan penduga
kemungkinan maksimum dari kuantitas masing-masing. Sebagai contoh,
�̂�(𝑥𝑖) adalah penduga kemungkinan maksimum dari 𝜋(𝑥𝑖). Kuantitas ini
memberikan perkiraan probabilitas bersyarat bahwa 𝑌 sama dengan 1,
karena 𝑥 sama dengan 𝑥𝑖. Dengan demikian, persaman di atas mewakili
nilai penduga untuk model regresi logistik. Konsekuensi yang menarik
pada persamaan (3.10) adalah
∑𝑦𝑖 = ∑�̂�(𝑥𝑖)
𝑛
𝑖=1
𝑛
𝑖=1
(3.13)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
Yang artinya, jumlah nilai 𝑦 yang teramati sama dengan jumlah nilai
prediksi (yang diharapkan).
Contoh 3.4
Pada persamaan (3.2), (3.3), dan (3.4) merupakan tiga bentuk
persamaan regresi logistik secara aljabar. Kemudian akan diilustrasikan
dengan contok numerik fiktif. Misalkan memprediksi probabilitas
promosi seorang asisten professor menjadi professor dengan banyaknya
“publikasi”. Persamaan regresi logistik fiktif dari bentuk persamaan (3.4)
memprediksi logit “promosi” diberikan sebagai berikut:
logit(promosi) = 𝛽0 + β1(publikasi)
= −6.00 + 0.39(publikasi)
dengan 𝛽0 = −6.00 dan 𝛽1 = 0.39. pada Tabel 3.2 (lampiran 1) terdapat
31 kasus yang bervariasi dalam banyaknya jumlah “publikasi” dari 0
sampai 30. Sebagai tambahan, diberikan tiga nilai yang diprediksi: logit,
odds untuk “promosi”, dan estimasi probabilitas “promosi”.
Pada persamaan regresi logistik, logit(promosi) = −6.00 +
0.39(publikasi), maka β1 = 0.39 menunjukkan bahwa logit yang
diprediksi meningkat sebesar 0.39 untuk setiap kenaikan satu jumlah
“publikasi”. Hal ini dapat diverifikasi pada table 3.2 (lampiran 1) dengan
memeriksa dua kolom jumlah publikasi dan logit. 𝛽0 = −6.00 adalah
nilai log yang diprediksi ketika jumlah publikasinya 0 (𝑥 = 0).
Secara ekivalen, persamaan reresi logistik dapat ditulis dalam
bentuk persamaan (3.3) memprediksi odds promosi:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
odds(promosi) = 𝑒(−6.00+0.39(publikasi))
Sehingga persamaan dapat ditulis dalam bentuk persamaan (3.2)
probabilitas (promosi) =1
1 + 𝑒(−6.00+0.39(publikasi))
Contoh 𝟑. 𝟓
Dengan menggunakan data yang diberikan pada lampiran 2, akan dicari
penduga kemungkinan maksimum bagi model
𝐶𝐻𝐷 = 𝛽0 + 𝛽1𝐴𝐺𝐸
Penyelesaian:
Akan dicari penduga kemungkinan maksimum 𝛽0 ̂ dan 𝛽1̂ dengan
menggunakan persamaan (3.10) dan (3.11). Karena nilai 𝜋(𝑥𝑖)
tergantung dengan nilai 𝛽0 dan 𝛽1, sehingga sulit untuk menyelesaikan
secara eksplisit. Oleh karena itu diperlukan suatu cara untuk
menyelesaikan secara numerik yaitu dengan menggunakan algoritma
Newton-Rhapson. Dengan menggunakan turunan pertama dari
persamaan (3.10) dan (3.11) terhadap 𝛽0 dan 𝛽1 didapat sebagai berikut:
Persamaan (3.10)
𝜕 ∑ [𝑦𝑖 − 𝜋(𝑥𝑖)] 𝑛𝑖=1
𝜕𝛽0= −∑𝜋(𝑥𝑖)(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
(3.14)
𝜕 ∑ [𝑦𝑖 − 𝜋(𝑥𝑖)] 𝑛𝑖=1
𝜕𝛽1= −∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
(3.15)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
Persamaan (3.11)
𝜕 ∑ 𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) 𝑛𝑖=1
𝜕𝛽0= −∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
(3.16)
𝜕 ∑ 𝑥𝑖(𝑦𝑖 − 𝜋(𝑥𝑖)) 𝑛𝑖=1
𝜕𝛽1= −∑𝑥𝑖
2(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
(3.17)
Didapatkan fungsi matriks dari 𝛽0 dan 𝛽1:
𝐼(𝛽0, 𝛽1) =
[ ∑𝜋(𝑥𝑖)(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
∑𝑥𝑖(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1
∑𝑥𝑖2(𝜋(𝑥𝑖))(1 − 𝜋(𝑥𝑖))
𝑛
𝑖=1 ]
(3.18)
Dengan Algoritma Newton-Raphson, pemaksimuman diawali
dengan nilai awal (𝛽0(0)
, 𝛽1(0)
). Nilai awal (𝛽0, 𝛽1) yang berlaku dari
fungsi log-likelihood dapat digunakan untuk menentukan nilai (𝛽0, 𝛽1)
baru, sehingga mencapai nilai (𝛽0, 𝛽1) yang memaksimumkan fungsi
tersebut. Sehingga, jika 𝛽0(𝑗)
dan 𝛽1(𝑗)
adalah nilai parameter yang berlaku
setelah langkah (iterasi) ke-𝑗 dalam algoritma, maka pasangan nilai
berikutnya (𝛽0(𝑗+1)
, 𝛽1(𝑗+1)
) dihitung dengan:
[𝛽0
(𝑗+1)
𝛽1(𝑗+1)
] = [𝛽0
(𝑗)
𝛽1(𝑗)
] + [𝛽0
(𝑗)
𝛽1(𝑗)
]
−1
[𝑆1(𝛽0
(𝑗), 𝛽1
(𝑗))
𝑆2(𝛽0(𝑗)
, 𝛽1(𝑗)
)]
(3.19)
Dimulai dengan 𝛽0(0)
dan 𝛽1(0)
, evaluasi dari persamaan (3.18)
diulang sehingga menghasilkan barisan (𝛽0(1)
, 𝛽1(1)
), (𝛽0(2)
, 𝛽1(2)
), … ,
yang mendekati nilai penduga maksimum (𝛽0̂, 𝛽1̂). Karena nilai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
maksimum itu tunggal, maka pemilihan nilai awal 𝛽0(0)
dan 𝛽1(0)
tidak
begitu penting. Agar lebih mudah, pilih 𝛽0(0)
= 0 dan 𝛽1(0)
= 0.
Sehingga digunakan nilai awal 𝛽0(0)
= 𝛽1(0)
= 0. Karena 𝛽0(0)
=
𝛽1(0)
= 0, maka untuk semua 𝑖 = 1,… ,100 sehingga
𝜋(𝑥𝑖) =exp(0 + 0𝑥𝑖)
1 + exp(0 + 0𝑥𝑖)= 0.5
1 − 𝜋(𝑥𝑖) = 1 − 0.5 = 0.5
ln(1 − 𝜋(𝑥𝑖)) = −0.6931.
Nilai fungsi log-kemungkinan pada 𝛽0(0)
= 𝛽1(0)
= 0 adalah
𝑙(0,0) = ∑[𝑦𝑖(0 + 0𝑥𝑖) +
100
𝑖=1
ln(1 − 𝜋(𝑥𝑖))
= 100(−0.6931)
= −69.31
Dilihat pada Tabel 3.4. Hasil perhitungan dengan 𝛽0(0)
= 0 dan 𝛽1(0)
= 0
(lampiran 2) didapat:
[𝛽0
(1)
𝛽1(1)
] = [𝛽0
(0)
𝛽1(0)
] + [𝛽0
(0)
𝛽1(0)
]
−1
[𝑆1(𝛽0
(0), 𝛽1
(0))
𝑆2(𝛽0(0)
, 𝛽1(0)
)]
= [00] + [
25 1109.51109.5 52640
]−1
[−7 −14
]
= [00] + [
0.6192 −0.0130−0.0130 0.0003
]
[−7 −14
]
= [00] + [
−4.1518 0.0872
]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
=[−4.1518
0.087]
Selanjutnya, dengan lima iterasi dari persamaan (3.11) didapatkan nilai
akhir 𝛽0̂ =-5.3112 dan 𝛽1̂ =0.1110 seperti yang terlihat pada tabel 3.9
dan langkah perhitungannya dapat dilihat pada lampiran 3.
Iterasi (j) 𝛽0(𝑗)
𝛽1(𝑗)
fungsi likelihood
0 0 0 -69.3147
1 -4.1518 0.0872 -440.2146
2 -5.1811 0.1083 -529.7331
3 -5.1904 0.1083 -531.3981
4 -5.3080 0.1109 -542.1340
5 -5.3112 0.1109 -531.5906
Tabel 3.9. Hasil perhitungan dari algoritma Newton-Raphson
Sehingga, nilai penduga persamaan (3.2) yang didapatkan diberikan
oleh persamaan sebagai berikut:
�̂�(𝑥) =𝑒−5.3112+0.1110xAGE
1 + 𝑒−5.3112+0.1110xAGE
yang menunjukkan peluang terjadinya CHD sebagai fungsi dari umur
(AGE).
Hal ini berarti dapat disimpulkan bahwa semakin bertambahnya
usia (AGE), maka peluang terjangkit penyakit CHD semakin besar.
Sehingga, penduga logit akan diberikan oleh persamaan:
�̂�(𝑥) = −5.3112 + 0.1110(AGE)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
Persamaan di atas merupakan persamaan regresi linear sederhana, dengan
koefisien regresi variabel AGE sebesar 0.111 artinya jika AGE
bertambah 1th, maka kemungkinan terkena penyakit CHD akan
meningkat sebesar 0.111. Koefisien bernilai positif artinya terjadi
hubungan positif antara usia (AGE) dengan kemungkinan terkenanya
penyakit CHD, semakin bertambah nilai usia (AGE) maka akan semakin
meningkat resiko terkena penyakit CHD. Dengan 𝛽0 = −5.3112 adalah
nilai log yang diprediksi ketika AGE = 0.
IV. Odds Ratio pada Regresi Logistik
Diasumsikan bahwa variabel independen (𝑥) dikodekan sebagai
nol atau satu. Sehingga perbedaan logit untuk 𝑥 = 1 dan 𝑥 = 0 adalah
𝑔(𝑡) − 𝑔(0) = [𝛽0 + 𝛽1] − [𝛽0] = 𝛽1
Untuk menafsirkan hasil ini, kita menggunakan ukuran asosiasi yang
disebut rasio odds (OR). Nilai odds paada 𝑥 = 1 didefinisikan sebagai
𝜋(1)
[1−𝜋(1)] dan nilai odds paada 𝑥 = 0 didefinisikan sebagai
𝜋(0)
[1−𝜋(0)].
Sehingga rasio odds diberikan oleh persamaan
𝑂𝑅 =
𝜋(1)[1 − 𝜋(1)]
𝜋(0)[1 − 𝜋(0)]
(3.20)
Dengan mensubsitusikan ekspresi untuk model regresi logistik yang
ditunjukkan pada Tabel 3.10 ke persamaan (3.20) didapatkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
Variabel
Dependen (Y)
Variabel Independen (x)
𝑥 = 1 𝑥 = 0
𝑦 = 1 𝜋(1) =𝑒𝛽0+𝛽1
1 + 𝑒𝛽0+𝛽1 𝜋(0) =
𝑒𝛽0
1 + 𝑒𝛽0
𝑦 = 0 1 − 𝜋(1) =1
1 + 𝑒𝛽0+𝛽1𝑥 1 − 𝜋(0) =
1
1 + 𝑒𝛽0
Total 1 1
Tabel 3.10 Nilai Model Regresi Logistik
𝑂𝑅 =
(𝑒𝛽0+𝛽1
1 + 𝑒𝛽0+𝛽1)
(1
1 + 𝑒𝛽0+𝛽1𝑥)
(𝑒𝛽0
1 + 𝑒𝛽0)
(1
1 + 𝑒𝛽0)
=𝑒𝛽0+𝛽1
𝑒𝛽0
= 𝑒(𝛽0+𝛽1)−𝛽0
= 𝑒𝛽1
Sehingga hubungan antara rasio odds dan koefisien regresi adalah
𝑂𝑅 = 𝑒𝛽1
Dengan menggunakan data pada Contoh 3.4 dicari rasio odds yaitu
dengan membuat variabel baru, AGE yang didefinisikan nilai 1 jika umur
responden lebih besar dari atau sama dengan 55 dan 0 jika umur
responden lebih kecil dari 55 disajikan dalam Tabel 3.4.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
CHD (y)
AGE (x)
Total ≥ 55
(1)
< 55
(0)
𝑦 = 1
(Ada) 21 22 43
𝑦 = 0
(Tidak Ada)
6 51 57
Total 27 73 100
Tabel 3.11 Klasifikasi Silang AGE pada 55 tahun dan CHD untuk 100
responden
Maka 𝑂𝑅 =21
622
51
= 8.11
Yang mempunyai arti bahwa responden yang berusia lebih dari sama
dengan 55 tahun beresiko memiliki CHD 8.11 (atau 8:1) kali lipat
dibandingkan responden yang berusia kurang dari 55 tahun.
B. REGRESI LOGISTIK ORDINAL
I. Model Regresi Logistik Ordinal
Analisis regresi logistik ordinal merupakan salah satu metode
statistik yang menggambarkan hubungan antara suatu variabel dependen
(𝑌) dengan lebih dari satu variabel independen (𝑋) dengan variabel
dependennya lebih dari dua kategori dan skala pengukuran bersifat
tingkatan (Hosmer dan Lemeshow, 2000). Regresi logistik ordinal juga
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
merupakan perluasan dari regresi logistik biner dengan variabel
dependen berskala ordinal yang terdiri dari tiga atau lebih kategori.
Model regresi logistik ordinal adalah sebagai berikut:
𝜋(𝑥) =𝑒𝑔(𝑥)
1 + 𝑒𝑔(𝑥) (3.21)
Dengan 𝑔(𝑥) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 .
Model yang dipakai untuk regresi logistik ordinal adalah model
logit kumulatif. Sifat dari variabel dependen Y diberikan dalam peluang
kumulatif sehingga model yang didapatkan dengan membandingkan
peluang kumulatif yaitu “peluang Y kurang dari sama dengan kategori
respon ke-j pada p variabel independen yang dinyatakan dalam vektor
𝑿𝑖”, 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) dengan peluang Y lebih dari kategori ke-j variabel
dependen, 𝑃(𝑌 > 𝑗|𝑿𝑖) (Hosmer dan Lemeshow, 2000: 290). Jika
diasumsikan 𝑿𝒊 = [𝑋𝑖1 𝑋𝑖2 … 𝑋𝑖𝑝]𝑇 dan 𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝). Maka
peluang kumulatif didefinisikan sebagai berikut:
𝑃(𝑌𝑖 ≤ 𝑗|𝑿𝒊) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(3.22)
Dengan
𝑗 = 1, 2, … , 𝐽 − 1, 𝑖 = 1, 2, … , 𝑛 dan 𝑘 = 1, 2, … , 𝑝
𝛽0𝑗 = parameter intersep kategori ke-j
𝑌𝑖 = pengamatan ke-i variabel Y
𝑋𝑖𝑘 = pengamatan ke-i variabel X ke-k
𝛽𝑘 = parameter regresi ke-k
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
Maka berikut formulasi model logit kumulatif didapatkan:
𝐿𝑜𝑔𝑖𝑡 𝑃(𝑌 ≤ 𝑗|𝑿𝑖)
= ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)
𝑃(𝑌 > 𝑗|𝑿𝑖))
= ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)
1 − 𝑃(𝑌 ≤ 𝑗|𝑿𝑖))
= ln
(
exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
1 −exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))
= ln
(
exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
−exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))
= ln
(
exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
1 + +exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
)
= ln (exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
))
= 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
Maka didapatkan sebagai berikut:
𝑔(𝑥) = ln (𝑃(𝑌 ≤ 𝑗|𝑿𝑖)
𝑃(𝑌 > 𝑗|𝑿𝑖)) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
(3.23)
Fungsi klasifikasi dari variabel dependen kategori ke-j terbentuk
𝐽 − 1, Jika ∅𝑗(𝑿𝑖) = 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) menyatakan peluang kategori ke-j dari
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
variabel dependen pada p variabel independen yang dinyatakan dalam
vektor 𝑿𝑖 dan 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) menyatakan peluang kumulatif pada p
variabel independen yang dinyatakan dalam vektor 𝑿𝑖, maka nilai
∅𝑗(𝑿𝑖) adalah sebagai berikut:
𝛾𝑗 = ∅𝑗𝑿𝑖 = 𝑃(𝑌 ≤ 𝑗|𝑿𝑖) = ∅1(𝑿𝑖) + ∅2(𝑿𝑖) + ⋯+ ∅𝑗(𝑿𝑖) (3.24)
dengan 𝑗 = 1, 2, … , 𝐽.
Misalkan 𝛾𝑗 = ∅1(𝑿𝑖) + ⋯+ ∅𝑗(𝑿𝑖). Maka 𝛾1 = ∅1(𝑿𝑖), 𝛾2 =
∅1(𝑿𝑖) + ∅2(𝑿𝑖), dan 𝛾𝐽 = ∅1(𝑿𝑖) + ⋯+ ∅𝐽(𝑿𝑖) = 1. Model Regresi
Logistik Ordinal diberikan sebagai berikut:
𝑙𝑜𝑔𝑖𝑡(𝛾1) = log (𝛾1
1 − 𝛾1) = 𝛽01 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘
𝑙𝑜𝑔𝑖𝑡(𝛾2) = log (𝛾2
1 − 𝛾2) = 𝛽02 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘
⋯
𝑙𝑜𝑔𝑖𝑡(𝛾𝐽−1) = log (𝛾𝐽−1
1 − 𝛾𝐽−1) = 𝛽0𝐽−1 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯+ 𝛽𝑘𝑋𝑖𝑘
Sehingga
𝛾𝑗 = ∅1(𝑿𝑖) + ∅2(𝑿𝑖) + ⋯+ ∅𝑗(𝑿𝑖) =exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(3.25)
Dengan 𝑗 = 1,… , 𝐽 − 1 dan 𝛾𝐽 = 1. Model ini diketahui sebagai model
proporsional oods karena rasio oods kejadian (𝑌 ≤ 𝑗) merupakan
indikator kategori independen.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
Jika 𝐽 = 3 kategori variabel dependen, dengan 𝑗 = 1,2,3 maka nilai
peluang untuk masing-masing kategori variabel dependen adalah sebagai
berikut:
∅1(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)
= 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(3.26)
∅2(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)
= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
−exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(3.27)
∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)
= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)
= 1 −exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(3.28)
Perhatikan bahwa dengan J = 3 maka
∅1(𝑿𝑖) + ∅2(𝑿𝑖) + ∅3(𝑿𝑖) = 1
II. Pendugaan Model Regresi Logistik Ordinal
Metode kemungkinan maksimum (Maximum Likelihood
Estimator) merupakan metode yang digunakan untuk menduga
parameter-parameter model regresi logistik dengan memberikan nilai
estimasi 𝜷 dengan memaksimumkan fungsi Likelihood analog dengan
persamaan (3.5).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
Andaikan, untuk penyederhanaan variabel respon Y mempunyai 3
kategori (𝑗 = 1, 2, 3). Andaikan pula ada sebanyak p variabel bebas 𝑿𝑖
(𝑋𝑖1, 𝑋𝑖2, … , 𝑋𝑖𝑝) dan ada sampel random sebanyak n (𝑖 = 1, … , 𝑛).
Ketika lebih dari satu observarsi Y muncul pada nilai 𝑥𝑖. Berikut
fungsi likelihood untuk model regresi logistik ordinal untuk sampel
dengan n sampel random:
𝐿(𝜷) = ∏[∅1(𝑿𝑖)𝑦1𝑖∅2(𝑿𝑖)
𝑦2𝑖∅3(𝑿𝑖)𝑦3𝑖]
𝑛
𝑖=1
(3.29)
dengan 𝑖 = 1,… , 𝑛 dan 𝐽 = 3
Dari persamaan (3.28) didapatkan fungsi ln-likelihood sebagai berikut:
𝑙(𝜷) = ∑𝑦1𝑖 ln[∅1(𝑿𝑖) ] + 𝑦2𝑖 ln[∅2(𝑿𝑖)
] + 𝑦3𝑖 ln[∅3(𝑿𝑖) ]
𝑛
𝑖=1
(3.30)
Dengan mensubstitusikan persamaan (3.26, 3.27 dan 3.28) ke persamaan
(3.30). Misalkan 𝑒𝑔𝑗(𝑥) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 , maka fungsi ln-
likelihoodnya menjadi:
𝑙(𝜷) = ∑𝑦1𝑖 ln [𝑒𝑔1(𝑥)
1 + 𝑒𝑔1(𝑥)]
𝑛
𝑖=1
+ 𝑦2𝑖 ln [𝑒𝑔2(𝑥)
1 + 𝑒𝑔2(𝑥)−
𝑒𝑔1(𝑥)
1 + 𝑒𝑔1(𝑥)]
+ 𝑦3𝑖 ln [1 −𝑒𝑔2(𝑥)
1 + 𝑒𝑔2(𝑥)]
(3.31)
Karena ln [𝑒𝑔2(𝑥)
1+𝑒𝑔2(𝑥) −𝑒𝑔1(𝑥)
1+𝑒𝑔1(𝑥)]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
= ln [(𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(1 + 𝑒𝑔2(𝑥))
(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))]
=(𝑒𝑔2(𝑥)) + (𝑒𝑔2(𝑥))(𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(𝑒𝑔2(𝑥))
(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))
=(𝑒𝑔2(𝑥)) − (𝑒𝑔1(𝑥))
(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))
=𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 ) − 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
(1 + 𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)) (1 + 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
))
=𝑒
∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 𝑒(𝛽02−𝛽01)
(1+𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )(1+𝑒
𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(3.32)
Maka fungsi log likelihood menjadi:
𝑙(𝜷) = ∑𝑦1𝑖 ((𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
) − ln (1 + 𝑒 𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))
𝑛
𝑖=1
+∑𝑦2𝑖 (∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
+ ln(𝑒𝛽02 − 𝑒𝛽01) − ln (1 + 𝑒 𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ) − ln (1 + 𝑒 𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 ))
𝑛
𝑖=1
+∑𝑦3𝑖 (− ln (1 + 𝑒 𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))
𝑛
𝑖=1
(3.33)
Maksimum likelihood dapat diperoleh dengan cara
mendiferensialkan fungsi likelihood terhadap parameter yang akan
diestimasi dan disamakan dengan nol.
Hasil turunan parsial pertama dari fungsi log-likehood terhadap
parameter 𝛽01 dan 𝛽02:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
66
𝜕 𝐿(𝜷)
𝜕 𝛽01= ∑{𝑦1𝑖 (1 −
𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)+𝑦2𝑖 (−𝑒𝛽01
𝑒𝛽02 − 𝑒𝛽01−
𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
𝑛
𝑖=1
(3.34)
𝜕 𝐿(𝜷)
𝜕 𝛽02= ∑{𝑦2𝑖 (
𝑒𝛽02
𝑒𝛽02 − 𝑒𝛽01−
𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
) + 𝑦3𝑖 (−𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
𝑛
𝑖=1
(3.35)
Pada koefisien regresi dimisalkan 𝜷 = (𝛽1,𝛽2) maka hasil turunan
parsial pertama dari fungsi likelihood terhadap parameter 𝛽1 dan 𝛽2
𝜕 𝐿(𝜷)
𝜕𝛽1 = ∑{𝑦1𝑖 (𝑋𝑖1 −
𝑋𝑖1 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
𝑛
𝑖=1
+ 𝑦2𝑖 (𝑋𝑖1 −𝑋𝑖1 𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
−𝑋𝑖1 𝑒
𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
+ 𝑦3𝑖 (𝑋𝑖1 −𝑋𝑖1𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
(3.36)
𝜕 𝐿(𝜷)
𝜕𝛽2 = ∑{𝑦1𝑖 (𝑋𝑖2 −
𝑋𝑖2 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
𝑛
𝑖=1
+ 𝑦2𝑖 (𝑋𝑖2 −𝑋𝑖2 𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
−𝑋𝑖2 𝑒
𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
+ 𝑦3𝑖 (𝑋𝑖2 −𝑋𝑖2 𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
(3.37)
Penyelesaian turunan pertama merupakan fungsi nonlinear,
sehingga digunakan metode numerik yaitu iterasi Newton-Raphson untuk
mendapatkan penduga parameternya.
Hasil turunan parsial kedua dari fungsi log-likehood terhadap
parameter:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
67
𝜕2 𝑙(𝜷)
𝜕𝛽012 = ∑{𝑦1𝑖 (−
𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2−
𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(3.38)
𝜕2 𝑙(𝜷)
𝜕𝛽01𝛽02= ∑{𝑦2𝑖 (
𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2)}
𝑛
𝑖=1
(3.39)
𝜕2 𝑙(𝜷)
𝜕𝛽02𝛽01= ∑{𝑦2𝑖 (
𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2)}
𝑛
𝑖=1
(3.40)
𝜕2 𝑙(𝜷)
𝜕 𝛽022 = ∑{𝑦2𝑖 (
𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2−
𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦3𝑖 (−𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(3.41)
𝜕2 𝑙(𝜷)
𝜕𝛽01𝛽1 = ∑{−(𝑦1𝑖 + 𝑦2𝑖) (
𝑋𝑖1𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(3.42)
𝜕2 𝑙(𝜷)
𝜕𝛽01𝛽2= ∑{−(𝑦1𝑖 + 𝑦2𝑖) (
𝑋𝑖2𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(3.43)
𝜕2 𝑙(𝜷)
𝜕𝛽02𝛽1 = ∑{−(𝑦2𝑖 + 𝑦3𝑖) (
𝑋𝑖1𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(3.44)
𝜕2 𝑙(𝜷)
𝜕𝛽02𝛽2= ∑{−(𝑦2𝑖 + 𝑦3𝑖) (
𝑋𝑖2𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(3.45)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
𝜕2 𝑙(𝜷)
𝜕𝛽12 = ∑{𝑦1𝑖 (−
𝑋𝑖12 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑋𝑖1
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖1
2 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦3𝑖 (−𝑋𝑖1
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(3.46)
𝜕2 𝑙(𝜷)
𝜕𝛽22 = ∑{𝑦1𝑖 (−
𝑋𝑖22 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑋𝑖2
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖2
2 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦3𝑖 (−𝑋𝑖2
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(3.47)
𝜕2 𝑙(𝜷)
𝜕𝛽1𝛽2= ∑{𝑦1𝑖 (−
𝑋𝑖1𝑋𝑖2𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑋𝑖1𝑋𝑖2𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖1𝑋𝑖2𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦3𝑖 (−𝑋𝑖1𝑋𝑖2𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(3.48)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
Metode Newton-Raphson yang digunakan untuk mendapatkan
penduga parameter yaitu sebagai berikut:
𝜷𝒕+𝟏 = 𝜷𝒕 − (𝑯𝒕)−𝟏𝒒𝒕 (3.49)
Dengan
𝒒𝒕 = (𝜕𝑙(𝜷)
𝜕𝛽01 𝜕𝑙(𝜷)
𝜕𝛽02 𝜕𝑙(𝜷)
𝜕𝛽1
𝜕𝑙(𝜷)
𝜕𝛽2)
𝑇
(3.50)
𝑯𝒕 =
(
𝜕2𝑙(𝜷)
𝜕𝛽012
𝜕2𝑙(𝜷)
𝜕𝛽01𝜕𝛽02
𝜕2𝑙(𝜷)
𝜕𝛽02𝛽01
𝜕2𝑙(𝜷)
𝜕𝛽022
𝜕2𝑙(𝜷)
𝜕𝛽01𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽01𝛽2
𝜕2𝑙(𝜷)
𝜕𝛽02𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽02𝛽2
𝜕2𝑙(𝜷)
𝜕𝛽1𝛽01
𝜕2𝑙(𝜷)
𝜕𝛽1𝛽02
𝜕2𝑙(𝜷)
𝜕𝛽2𝛽01
𝜕2𝑙(𝜷)
𝜕𝛽2𝛽02
𝜕2𝑙(𝜷)
𝜕𝛽12
𝜕2𝑙(𝜷)
𝜕𝛽1𝛽2
𝜕2𝑙(𝜷)
𝜕𝛽2𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽22 )
𝑻
(3.51)
Dengan banyaknya iterasi t = 0, 1, 2, …
Salah satu program aplikasi yang menggunakan metode Newton-
Raphson adalah SPSS. Berikut diberikan contohnya
Contoh 3.7
Dengan menggunakan data pada contoh buku “Applied Logistic
Regression” (Hosmer, 2000). Analisis ini bertujuan untuk melihat apakah
faktor dari ibu yang “merokok” dapat mempengaruhi kelahiran bayi
dengan berat badan rendah (BWT). Diberikan pengkodean variabel hasil,
yaitu BWT > 3500𝑔 (0), 3000𝑔 < BWT ≤ 3500𝑔 (1), 2500𝑔 <
BWT ≤ 3000𝑔(2), BWT ≤ 2500𝑔 (3). Status merokok (x) merupakan
bilangan biner (0 = tidak merokok, 1 = merokok). Tujuan dari penelitian
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
ini adalah menghitung nilai rasio odds pengaruh merokok pada berat
badan bayi lahir rendah. Sehingga didapatkan klasifikasi perkalian pada
Tabel 3.12 yaitu:
Kategori Berat Lahir (y)
Status Merokok (x)
Total Tidak
(0)
Iya
(1)
y = 0
(BWT > 3500)
35 11 46
y = 1
(3000 < BWT ≤ 3500)
29 17 46
y = 2
(2500 < BWT ≤ 3000)
22 16 38
y = 3
(BWT ≤ 2500)
29 30 38
Total 115 74 189
Tabel 3.12 Klasifikasi perkalian 4 kategori skala ordinal hasil berat lahir
bayi dengan status ibu merokok.
Sehingga nilai rasio odds pada variabel status merokok adalah:
𝑂�̂�(1,0) =17𝑥35
29𝑥11= 1.87
𝑂�̂�(2,0) =16𝑥35
22𝑥11= 2.31
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
𝑂�̂�(3,0) =10𝑥35
29𝑥11= 3.29
Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds merokok ibu untuk BWT4 = j
dengan BWT4 = 0. Sehingga dapat disimpulkan bahwa peningkatan rasio
odds menunjukkan adanya peningkatan berat badan bayi yang semakin
rendah ketika ibu merokok pada masa kehamilan.
Contoh 3.8
Dengan menggunakan data yang diberikan pada lampiran 4 akan
dicari nilai penduga model kemungkinan maksimum. Dengan data ini
analisis bertujuan untuk melihat faktor-faktor yang mempengaruhi
keputusan keinginan melanjutkan ke jenjang yang lebih tinggi (y).
Dengan data keinginan melanjutkan merupakan data ordinal yang
mempunyai beberapa kategori (tidak berminat (0), agak berminat (1), dan
sangat berminat (2)). Status pendidikan orang tua (𝑥1) merupakan
bilangan biner (0 = SMA, 1 = diatas SMA). GPA (𝑥2) adalah nilai ujian
responden. Tujuan dari penelitian ini adalah menduga model hubungan
antara pendidikan orang tua dan GPA dengan minat melanjutkan ke
jenjang yang lebih tinggi. Dengan demikian, variabel dependen
ordinalnya adalah keinginan melanjutkan ke jenjang yang lebih tinggi,
sedangkan variabel bebasnya adalah GPA dan status pendidikan
orangtua. Hasil penelitian dijelaskan di bawah ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
Data: Keinginan_melanjutkan
Tabel 3.13 Output
3) Parameter Estimates
Estimate Std. Error
Threshold [keinginan_melanjutkan = 0] 13.908 5.593
[keinginan_melanjutkan = 1] 17.024 6.110
Location pendidikan_ortu -1.111 1.281
nilai 5.611 2.091
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
Interpretasi output SPSS:
Output 1) menjelaskan bahwa dari 20 responden penduduk
dewasa yang diketahui valid digunakan (tidak terdapat data yang
hilang). Ada 3 responden masuk dalam kategori tidak berminat
melanjutkan ke jenjang yang lebih tinggi, 8 responden masuk dalam
kategori gejala agak berminat melanjutkan ke jenjang yang lebih
tinggi, dan 9 responden masuk dalam kategori sangat berminat
melanjutkan ke jenjang yang lebih tinggi.
Output 2) menjelaskan hasil perhitungan mencari nilai
penduga parameter secara iterasi, dimana hasil akhirnya didapatkan
nilai penduga parameter konstan 𝛽01 (kategori tidak berminat) adalah
13.908 dan 𝛽02 (kategori agak berminat) adalah 17.024. Lalu nilai
penduga parameter 𝛽1 (pendidikan orang tua) adalah -1.111 dan 𝛽2
(GPA) adalah 5.611.
Output 3) adalah hasil akhir dari estimasi model regresi
logistik ordinal disertai dengan standar error. 𝛽01 = 13.908, 𝛽02 =
17.024, 𝛽1 = −1.111, dan 𝛽2 =5.611.
Persamaan regresi logistiknya adalah
(𝑃(𝑌 ≤ 0|𝑿𝑖)) =exp(13.908 − 1.111X1 + 5.611X2)
1 + exp(13.908 − 1.111X1 + 5.611X2)
(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(17.024 − 1.111X1 + 5.611X2)
1 + exp(17.024 − 1.111X1 + 5.611X2)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
Model peluang persamaan (3.25, 3.26, dan 3.27) yang
didapatkan dari persamaan regresi logistik ordinal keputusan
keinginan melanjutkan ke jenjang yang lebih tinggi adalah sebagai
berikut:
∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)
= 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(13.908 − 1.111X1 + 5.611X2)
1 + exp(13.908 − 1.111X1 + 5.611X2)
∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)
= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(17.024 − 1.111X1 + 5.611X2)
1 + exp(17.024 − 1.111X1 + 5.611X2)
−exp(13.908 − 1.111X1 + 5.611X2)
1 + exp(13.908 − 1.111X1 + 5.611X2)
∅3(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)
= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)
= 1 −exp(17.024 − 1.111X1 + 5.611X2)
1 + exp(17.024 − 1.111X1 + 5.611X2)
Rasio Odds
Nilai rasio odds masing-masing koefisien pada model yang diperoleh
yaitu model keinginan melanjutkan ke jenjang yang lebih tinggi yang
dipengaruhi oleh status pendidikan orangtua dan GPA adalah sebagai
berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
1. Nilai rasio odds pada variabel status pendidikan orang tua (𝑥1)
dengan 𝑥 = 1 (di atas SMA) dan 𝑥 = 0 (SMA) sehingga
didapatkan klasifikasi perkalian untuk empat kategori keinginan
melanjutkan dengan pendidikan orang tua adalah
Keinginan
melanjutkan (y)
Status pendidikan orang tua (𝑥1)
Total SMA
(0)
di atas SMA
(1)
𝑦 = 0
(tidak berminat)
2 1 3
𝑦 = 1
(agak berminat)
3 5 8
𝑦 = 2
(berminat sekali)
3 6 9
Total 8 12 20
Tabel 3.14 Klasifikasi silang antara keinginan melanjutkan
dan pendidikan orangtua.
Sehingga nilai rasio odds keinginan melanjutkan dengan
pendidikan orang tua di atas SMA adalah
𝑂�̂�(1,0) =5𝑥2
3𝑥1= 3.33
𝑂�̂�(2,0) =6𝑥2
3𝑥1= 4
Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds pendidikan di atas
SMA untuk y = j dengan y = 0. Sehingga dapat disimpulkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
76
bahwa peningkatan rasio odds menunjukkan adanya
peningkatan minat responden melanjutkan ke jenjang lebih
tinggi yang semakin tinggi ketika status pendidikan orangtua di
atas SMA. Lalu akan dicari kemungkinan rasio odds untuk
responden dengan pendidikan orangtua di atas SMA:
𝑂�̂�(𝑗, 𝑗 − 1) = exp(1.111) = 3.037394
Dengan j = 1, 2, 3. Berdasarkan hasil perhitungan, nilai odds
rasio untuk variabel pendidikan orangtua (X1) adalah sebesar
3.037394 artinya “pendidikan orangtua di atas SMA” beresiko
mempengaruhi keputusan responden untuk melanjutkan ke
jenjang yang lebih tinggi sebesar 3.037394 kali (atau 3: 1)
dibanding “pendidikan orangtua SMA”.
2. Nilai odds ratio pada variabel variabel GPA (𝑥2) dengan 𝑥 = 1
( ≥ 3 ) dan 𝑥 = 0 ( > 3 ) sehingga didapatkan klasifikasi silang
untuk empat kategori keinginan melanjutkan dengan nilai GPA
adalah
Keinginan
melanjutkan (y)
GPA (𝑥2)
Total > 3
(0)
≥ 3
(1)
𝑦 = 0
(tidak berminat)
2 1 3
𝑦 = 1
(agak berminat)
5 3 8
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
77
𝑦 = 2
(berminat sekali)
1 8 9
Total 8 12 20
Tabel 3.15 Klasifikasi silang antara keinginan melanjutkan dan
GPA
Sehingga nilai rasio odds keinginan melanjutkan dengan GPA
≥ 3 adalah
𝑂�̂�(1,1) =3𝑥2
5𝑥1= 1.2
𝑂�̂�(2,1) =8𝑥2
1𝑥1= 16
Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds GPA ≥ 3untuk y = j
dengan y = 0. Sehingga dapat disimpulkan bahwa adanya
peningkatan minat responden melanjutkan ke jenjang lebih
tinggi yang semakin tinggi ketika GPA ≥ 3. Lalu akan dicari
kemungkinan rasio odds untuk responden dengan GPA ≥ 3
𝑂�̂�(3,2) = exp(5.611) = 273.4175
Dengan j = 1, 2, 3. Berdasarkan hasil perhitungan, nilai odds
rasio untuk variabel GPA (X2)adalah sebesar 273.4175 artinya
“GPA ≥ 3” beresiko mempengaruhi keputusan responden untuk
melanjutkan ke jenjang yang lebih tinggi sebesar 273.4175 kali
(atau 273: 1) dibandingkan dengan GPA < 3.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
78
Perhitungan odds ratio dengan menggunakan salah satu sampel
jawaban responden yaitu jika diketahui responden dengan pendidikan
orangtua SMA dan memiliki GPA sebesar 2.5.
(𝑃(𝑌 ≤ 0|𝑿𝑖)) =exp(13.908 − 1.111(0) + 5.611(2.5))
1 + exp(13.908 − 1.111(0) + 5.611(2.5))
= 0.999999999999262
(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(17.024 − 1.111(1) + 5.611(3))
1 + exp(17.024 − 1.111(1) + 5.611(3))
= 0.999999999999967
Sehingga peluang persamaan regresi logistik ordinal keputusan
keinginan melanjutkan ke jenjang yang lebih tinggi adalah sebagai
berikut:
∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)
= 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(13.908 − 1.111(0) + 5.611(2.5))
1 + exp(13.908 − 1.111(0) + 5.611(2.5))
= 0.999999999999262
∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)
= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(17.024 − 1.111(0) + 5.611(2.5))
1 + exp(17.024 − 1.111(0) + 5.611(2.5))
−exp(13.908 − 1.111(0) + 5.611(2.5))
1 + exp(13.908 − 1.111(0) + 5.611(2.5))
= 0.999999999999967 − 0.999999999999262
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
79
= 0.000000000000704
∅3(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)
= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)
= 1 −exp(17.024 − 1.111(0) + 5.611(2.5))
1 + exp(17.024 − 1.111(0) + 5.611(2.5))
= 1 − 0.999999999999967
= 0.00000000000032
Responden yang pendidikan orangtuanya SMA dan memiliki GPA
sebesar 2.5 maka secara umum maka responden tidak berminat
melanjutkan ke jenjang yang lebih tinggi adalah
0.999999999999262, peluang responden agak berminat melanjutkan
ke jenjang yang lebih tinggi adalah 0.000000000000704, dan
peluang responden sangat berminat melanjutkan ke jenjang yang lebih
tinggi adalah 0.00000000000032. Dari hasil peluang di atas dapat
disimpulkan bahwa jika responden memiliki orangtua yang
pendidikannya SMA berpeluang untuk mempengaruhi responden
tidak berminat melanjutkan ke jenjang lebih tinggi
sebesar 0.999999999999262 dan berpeluang untuk mempengaruhi
responden berminat melanjutkan ke jenjang lebih tinggi sebesar
0.000000000000737.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
BAB IV
APLIKASI REGRESI LOGISTIK ORDINAL
BAB IV APLIKASI REGRESI LOGISTIK ORDINAL Dalam bab ini, analisis regresi logistik akan diterapkan dalam contoh. Data
yang diambil merupakan hasil data yang diambil pada buku Categorical Data
Analysis (2002). Pengolahan data dilakukan dengan program SPSS. Penggunaan
program SPSS ini bertujuan untuk memudahkan dan mempercepat proses analisis.
A. PENDUGAAN PARAMETER
Pada data yang diberikan (lampiran 5) kategori variabel dependen yang
diketahui dimana 𝑗 = 1, 2, 3, 4. Maka peluang untuk masing-masing kategori
dependen adalah:
∅1(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)
= 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(4.1)
∅2(𝑿𝑖) = 𝑃(𝑌 = 2|𝑿𝑖)
= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
−exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(4.2)
∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)
= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
81
=exp(𝛽03 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽03 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
−exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽02 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(4.3)
∅4(𝑿𝑖) = 𝑃(𝑌 = 4|𝑿𝑖)
= 𝑃(𝑌 ≤ 4|𝑿𝑖) − 𝑃(𝑌 ≤ 3|𝑿𝑖)
=exp(𝛽04 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽04 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
−exp(𝛽03 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽03 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
= 1 −exp(𝛽03 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
1 + exp(𝛽03 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
(4.4)
Maka fungsi untuk model regresi logistik ordinal adalah
𝐿(𝜷) = ∏[∅1(𝑿𝑖)𝑦1𝑖∅2(𝑿𝑖)
𝑦2𝑖∅3(𝑿𝑖)𝑦3𝑖∅4(𝑿𝑖)
𝑦4𝑖] ,
𝑛
𝑖=1
(4.5)
dengan 𝑖 = 1,… , 𝑛 dan 𝐽 = 4
Dari persamaan (4.5) didapatkan fungsi ln-likelihood sebagai berikut:
𝑙(𝜷) = ∑𝑦1𝑖 ln[∅1(𝑿𝑖) ] + 𝑦2𝑖 ln[∅2(𝑿𝑖)
] + 𝑦3𝑖 ln[∅3(𝑿𝑖) ] + 𝑦4𝑖 ln[∅4(𝑿𝑖)
]
𝑛
𝑖=1
(4.6)
Dengan mensubstitusikan persamaan (4.1, 4.2, 4.3, dam 4.4) ke
persamaan (4.5). Misalkan 𝑒𝑔𝑗(𝑥) = 𝛽0𝑗 + ∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 , maka fungsi ln
likelihoodnya menjadi:
𝑙(𝜷) = ∑𝑦1𝑖 ln [𝑒𝑔1(𝑥)
1 + 𝑒𝑔1(𝑥)]
𝑛
𝑖=1
+ 𝑦2𝑖 ln [𝑒𝑔2(𝑥)
1 + 𝑒𝑔2(𝑥)−
𝑒𝑔1(𝑥)
1 + 𝑒𝑔1(𝑥)]
+ 𝑦3𝑖 ln [𝑒𝑔3(𝑥)
1 + 𝑒𝑔3(𝑥)−
𝑒𝑔2(𝑥)
1 + 𝑒𝑔2(𝑥)]+ 𝑦4𝑖 ln [1 −
𝑒𝑔3(𝑥)
1 + 𝑒𝑔3(𝑥)]
(4.7)
Karena ln [𝑒𝑔2(𝑥)
1+𝑒𝑔2(𝑥) −𝑒𝑔1(𝑥)
1+𝑒𝑔1(𝑥)]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
82
= ln [(𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(1 + 𝑒𝑔2(𝑥))
(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))]
=(𝑒𝑔2(𝑥)) + (𝑒𝑔2(𝑥))(𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥)) − (𝑒𝑔1(𝑥))(𝑒𝑔2(𝑥))
(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))
=(𝑒𝑔2(𝑥)) − (𝑒𝑔1(𝑥))
(1 + 𝑒𝑔2(𝑥))(1 + 𝑒𝑔1(𝑥))
=𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 ) − 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
(1 + 𝑒(𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)) (1 + 𝑒(𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
))
=𝑒∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 𝑒(𝛽02−𝛽01)
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ) (1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 )
(4.8)
Maka fungsi log likelihood menjadi:
𝑙(𝜷) = ∑𝑦1𝑖 ((𝛽01 + ∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
) − ln (1 + 𝑒 𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))
𝑛
𝑖=1
+∑𝑦2𝑖 (∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
+ ln(𝑒𝛽02 − 𝑒𝛽01) − ln (1 + 𝑒 𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ) − ln (1 + 𝑒 𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 ))
𝑛
𝑖=1
+∑𝑦3𝑖 (∑ 𝛽𝑘𝑋𝑖𝑘
𝑝
𝑘=1
+ ln(𝑒𝛽03 − 𝑒𝛽02) − ln (1 + 𝑒 𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ) − ln (1 + 𝑒 𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1 ))
𝑛
𝑖=1
+∑𝑦4𝑖 (− ln (1 + 𝑒 𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 ))
𝑛
𝑖=1
(4.9)
Maksimum likelihood dapat diperoleh dengan cara mendiferensialkan
fungsi likelihood terhadap parameter yang akan diestimasi dan disamakan
dengan nol.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
83
Hasil turunan parsial pertama dari fungsi log-likehood terhadap
parameter 𝛽01, 𝛽02, dan 𝛽03:
𝜕 𝑙(𝜷)
𝜕 𝛽01= ∑ {𝑦1𝑖 (1 −
𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)+ 𝑦2𝑖 (−𝑒𝛽01
𝑒𝛽02 − 𝑒𝛽01
𝑛
𝑖=1
−𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
(4.10)
𝜕 𝑙(𝜷)
𝜕 𝛽02= ∑ {𝑦2𝑖 (
𝑒𝛽02
𝑒𝛽02 − 𝑒𝛽01−
𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
𝑛
𝑖=1
+ 𝑦3𝑖 (−𝑒𝛽02
𝑒𝛽03 − 𝑒𝛽02−
𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
(4.11)
𝜕 𝑙 (𝜷)
𝜕 𝛽03= ∑{𝑦3𝑖 (
𝑒𝛽03
𝑒𝛽03 − 𝑒𝛽02−
𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
𝑛
𝑖=1
+ 𝑦4𝑖 (−𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
(4.12)
Pada koefisien regresi dimisalkan 𝜷 = (𝛽1,𝛽2) maka hasil turunan
parsial pertama dari fungsi likelihood terhadap parameter 𝛽1 dan 𝛽2:
𝜕 𝑙(𝜷)
𝜕𝛽1 = ∑{𝑦1𝑖 (𝑋𝑖1 −
𝑋𝑖1 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
𝑛
𝑖=1
+ 𝑦2𝑖 (𝑋𝑖1 −𝑋𝑖1 𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
−𝑋𝑖1 𝑒
𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
+ 𝑦3𝑖 (𝑋𝑖1 −𝑋𝑖1 𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
−𝑋𝑖1 𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
+ 𝑦4𝑖 (𝑋𝑖1 −𝑋𝑖1 𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
(4.13)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
84
𝜕 𝑙(𝜷)
𝜕𝛽2 = ∑{𝑦1𝑖 (𝑋𝑖2 −
𝑋𝑖2 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
𝑛
𝑖=1
+ 𝑦2𝑖 (𝑋𝑖2 −𝑋𝑖2 𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
−𝑋𝑖2 𝑒
𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
+ 𝑦3𝑖 (𝑋𝑖2 −𝑋𝑖2 𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
−𝑋𝑖2 𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)
+ 𝑦4𝑖 (𝑋𝑖2 −𝑋𝑖2 𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
)}
(4.14)
Penyelesaian turunan pertama merupakan fungsi nonlinear, sehingga
digunakan metode numerik yaitu iterasi Newton-Rhapson untuk mendapatkan
penduga parameternya.
Hasil turunan parsial kedua dari fungsi log-likehood terhadap
parameter:
𝜕2 𝑙(𝜷)
𝜕𝛽012 = ∑{𝑦1𝑖 (−
𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2−
𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(4.15)
𝜕2 𝑙(𝜷)
𝜕𝛽01𝛽02= ∑{𝑦2𝑖 (
𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2)}
𝑛
𝑖=1
(4.16)
𝜕2 𝑙(𝜷)
𝜕𝛽01𝛽03= 0 (4.17)
𝜕2 𝑙(𝜷)
𝜕𝛽02𝛽01= ∑{𝑦2𝑖 (
𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2)}
𝑛
𝑖=1
(4.18)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
85
𝜕2 𝑙(𝜷)
𝜕 𝛽022 = ∑{𝑦2𝑖 (
𝑒𝛽01+𝛽02
(𝑒𝛽02 − 𝑒𝛽01)2−
𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦3𝑖 (−𝑒𝛽02+𝛽03
(𝑒𝛽03 − 𝑒𝛽02)2−
𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(4.19)
𝜕2 𝑙(𝜷)
𝜕𝛽02𝛽03= ∑{𝑦3𝑖 (
𝑒𝛽02+𝛽03
(𝑒𝛽03 − 𝑒𝛽02)2)}
𝑛
𝑖=1
(4.20)
𝜕2 𝑙(𝜷)
𝜕𝛽03𝛽01= 0 (4.21)
𝜕2 𝑙(𝜷)
𝜕𝛽03𝛽02= ∑{𝑦3𝑖 (
𝑒𝛽02+𝛽03
(𝑒𝛽03 − 𝑒𝛽02)2)}
𝑛
𝑖=1
(4.22)
𝜕2 𝑙(𝜷)
𝜕 𝛽032 = ∑{𝑦3𝑖 (
𝑒𝛽02+𝛽03
(𝑒𝛽03 − 𝑒𝛽02)2−
𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦4𝑖 (−𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(4.23)
𝜕2 𝑙(𝜷)
𝜕𝛽01𝛽1 = ∑{−(𝑦1𝑖 + 𝑦2𝑖) (
𝑋𝑖1𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(4.24)
𝜕2 𝑙(𝜷)
𝜕𝛽01𝛽2= ∑{−(𝑦1𝑖 + 𝑦2𝑖) (
𝑋𝑖2𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(4.25)
𝜕2 𝑙(𝜷)
𝜕𝛽02𝛽1 = ∑{−(𝑦2𝑖 + 𝑦3𝑖) (
𝑋𝑖1𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(4.26)
𝜕2 𝑙(𝜷)
𝜕𝛽02𝛽2= ∑{−(𝑦2𝑖 + 𝑦3𝑖) (
𝑋𝑖2𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(4.27)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
86
𝜕2 𝑙(𝜷)
𝜕𝛽03𝛽1 = ∑{−(𝑦3𝑖 + 𝑦4𝑖) (
𝑋𝑖1𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(4.28)
𝜕2 𝑙(𝜷)
𝜕𝛽03𝛽2= ∑{−(𝑦3𝑖 + 𝑦4𝑖) (
𝑋𝑖2𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
𝑛
𝑖=1
(4.29)
𝜕2 𝑙(𝜷)
𝜕𝛽12 = ∑{𝑦1𝑖 (−
𝑋𝑖12 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑋𝑖1
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖1
2 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 𝛽)
2)
+ 𝑦3𝑖 (−𝑋𝑖1
2 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖1
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦4𝑖 (−𝑋𝑖1
2 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(4.30)
𝜕2 𝑙(𝜷)
𝜕𝛽22 = ∑{𝑦1𝑖 (−
𝑋𝑖22 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑋𝑖2
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖2
2 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦3𝑖 (−𝑋𝑖2
2 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖2
2 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦4𝑖 (−𝑋𝑖2
2 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(4.31)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
87
𝜕2 𝑙(𝜷)
𝜕𝛽1𝛽2= ∑{𝑦1𝑖 (−
𝑋𝑖1𝑋𝑖2𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘
𝑝𝑘=1
(1 + 𝑒𝛽01+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
𝑛
𝑖=1
+ 𝑦2𝑖 (−𝑋𝑖1𝑋𝑖2𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖1𝑋𝑖2𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦3𝑖 (−𝑋𝑖1𝑋𝑖2𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2 −𝑋𝑖1𝑋𝑖2𝑒
𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽02+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)
+ 𝑦4𝑖 (−𝑋𝑖1𝑋𝑖2𝑒
𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1
(1 + 𝑒𝛽03+∑ 𝛽𝑘𝑋𝑖𝑘𝑝𝑘=1 )
2)}
(4.32)
Metode Newton-Raphson yang digunakan untuk mendapatkan penduga
parameter yaitu sebagai berikut:
𝜷𝒕+𝟏 = 𝜷𝒕 − (𝑯𝒕)−𝟏𝒒𝒕 (4.33)
Dengan
𝒒𝒕 = (𝜕𝑙(𝜷)
𝜕𝛽01 𝜕𝑙(𝜷)
𝜕𝛽02 𝜕𝑙(𝜷)
𝜕𝛽03
𝜕𝑙(𝜷)
𝜕𝛽1
𝜕𝑙(𝜷)
𝜕𝛽2)
𝑇
(4.34)
𝑯𝒕 =
(
𝜕2𝑙(𝜷)
𝜕𝛽012
𝜕2𝑙(𝜷)
𝜕𝛽01𝜕𝛽02
𝜕2𝑙(𝜷)
𝜕𝛽01𝛽03
𝜕2𝑙(𝜷)
𝜕𝛽02𝛽01
𝜕2𝑙(𝜷)
𝜕𝛽022
𝜕2𝑙(𝜷)
𝜕𝛽02𝛽03
𝜕2𝑙(𝜷)
𝜕𝛽03𝛽01
𝜕2𝑙(𝜷)
𝜕𝛽03𝛽02
𝜕2𝑙(𝜷)
𝜕𝛽032
𝜕2𝑙(𝜷)
𝜕𝛽01𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽01𝛽2
𝜕2𝑙(𝜷)
𝜕𝛽02𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽02𝛽2
𝜕2𝑙(𝜷)
𝜕𝛽03𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽03𝛽2
𝜕2𝑙(𝜷)
𝜕𝛽1𝛽01
𝜕2𝑙(𝜷)
𝜕𝛽1𝛽02
𝜕2𝑙(𝜷)
𝜕𝛽1𝛽03
𝜕2𝑙(𝜷)
𝜕𝛽2𝛽01
𝜕2𝑙(𝜷)
𝜕𝛽1𝛽02 𝜕2𝑙(𝜷)
𝜕𝛽2𝛽03
𝜕2𝑙(𝜷)
𝜕𝛽03𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽03𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽2𝛽1
𝜕2𝑙(𝜷)
𝜕𝛽022 )
𝑻
(4.35)
dengan banyaknya iterasi t = 0, 1, 2, …
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
88
B. PERHITUNGAN DAN ANALISIS DATA
Tabel pada lampiran 6 merupakan data yang berasal dari studi
kesehatan mental dengan variabel randomnya (responden) adalah penduduk
dewasa yang berada di Negara Alachua, Florida. Dengan data kesehatan
mental (y) merupakan data ordinal yang mempunyai beberapa kategori (baik
(1), gejala sakit ringan (2), gejala sakit sedang (3), buruk (4)). Peristiwa
kehidupan (𝑥1) adalah gabungan dari jumlah dan keparahan dari peristiwa
hidup penting seperti kelahiran anak, pekerjaan baru, perceraian, atau
kematian dalam keluarga yang terjadi dalam jangka waktu 3 tahun. Nilai 𝑥1
dikategorikan menjadi " < 5" dan " ≥ 5". Status ekonomi sosial/SES (𝑥2)
merupakan bilangan biner (0 = rendah, 1 = tinggi). Tujuan dari penelitian ini
adalah mencari seberapa besar pengaruh peristiwa kehidupan dan status
ekonomi sosial/SES terhadap kesehatan mental. Hasil penelitian dijelaskan di
bawah ini.
Data: kesehatan_mental
Tabel 4.1 Output:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
89
3) Parameter Estimates
Estimate Std. Error
Threshold [kesehatan_mental = 1] -.282 .623
[kesehatan_mental = 2] 1.213 .651
[kesehatan_mental = 3] 2.209 .717
Location SES -1.111 .614
peristiwa_kehidupan .319 .119
Interpretasi output SPSS:
Output 1) menjelaskan bahwa dari 40 responden penduduk
dewasa yang diketahui valid digunakan (tidak terdapat data yang
hilang). Ada 12 responden masuk dalam kategori baik, 12
responden masuk dalam kategori gejala sakit ringan, 7 responden
masuk dalam kategori gejala sakit sedang, dan 9 responden masuk
dalam kategori gejala buruk (parah).
Output 2) menjelaskan hasil perhitungan mencari nilai
penduga parameter secara iterasi, dimana hasil akhirnya didapatkan
nilai penduga parameter konstan 𝛽01 (kategori baik) adalah -0.282,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
90
𝛽02 (kategori gejala sakit ringan) adalah 1.213, dan 𝛽03 (kategori
gejala sakit sedang) adalah 2.209. Lalu 𝛽1 (SES) adalah -1.111 dan
𝛽2 (peristiwa kehidupan) adalah 0.319.
Output 3) adalah hasil estimasi model regresi logistik ordinal
disertai dengan standar error. 𝛽01 = −0.282, 𝛽02 = 1.213, 𝛽03 =
2.209, 𝛽1 = −1.111, dan 𝛽2 = 0.319.
Persamaan regresi logistiknya adalah
(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(−0.282 + 0.319X1 − 1.111X2)
1 + exp(−0.282 + 0.319X1 − 1.111X2)
(𝑃(𝑌 ≤ 2|𝑿𝑖)) =exp(1.213 + 0.319X1 − 1.111X2)
1 + exp(1.213 + 0.319X1 − 1.111X2)
(𝑃(𝑌 ≤ 3|𝑿𝑖)) =exp( 2.209 + 0.319X1 − 1.111X2)
1 + exp(2.209 + 0.319X1 − 1.111X2)
Model peluang persamaan (3.25, 3.26, dan 3.27) yang
didapatkan dari persamaan regresi logistik ordinal resiko terkena
kesehatan mental adalah sebagai berikut:
∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)
= 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(−0.282 + 0.319X1 − 1.111X2)
1 + exp(−0.282 + 0.319X1 − 1.111X2)
∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)
= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
91
=exp(1.213 + 0.319X1 − 1.111X2)
1 + exp(1.213 + 0.319X1 − 1.111X2)
− exp(−0.282 + 0.319X1 − 1.111X2)
1 + exp(−0.282 + 0.319X1 − 1.111X2)
∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)
= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)
=exp( 2.209 + 0.319X1 − 1.111X2)
1 + exp(2.209 + 0.319X1 − 1.111X2)
−exp(1.213 + 0.319X1 − 1.111X2)
1 + exp(1.213 + 0.319X1 − 1.111X2)
∅4(𝑿𝑖) = 𝑃(𝑌 = 4|𝑿𝑖)
= 𝑃(𝑌 ≤ 4|𝑿𝑖) − 𝑃(𝑌 ≤ 3|𝑿𝑖)
= 1 −exp(2.209 + 0.319X1 − 1.111X2)
1 + exp(2.209 + 0.319X1 − 1.111X2)
Rasio odds
Nilai odds ratio masing masing koefisien pada model yang diperoleh
yaitu model terkena kesehatan mental dipengaruhi oleh peristiwa
kehidupan dengan status ekonomi sosial (SES) adalah sebagai berikut:
1. Nilai odds ratio pada variabel peristiwa kehidupan (𝑥1)
dengan 𝑥 = 1 (≥ 5) dan 𝑥 = 0 (< 5) sehingga didapatkan
klasifikasi silang untuk empat kategori terkena kesehatan
mental adalah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
92
Kesehatan mental
(y)
Peristiwa kehidupan (𝑥1)
Total (< 5)
(0)
(≥ 5)
(1)
𝑦 = 1
(baik)
10 2 12
𝑦 = 2
(gejala sakit ringan)
6 6 12
𝑦 = 3
(gejala sakit sedang)
5 2 7
𝑦 = 4
(parah)
3 6 9
Total 24 16 40
Tabel 4.1 Klasifikasi silang antara kesehatan mental dan
status peristiwa kehidupan
Sehingga nilai rasio odds kesehatan mental dengan peristiwa
kehidupan sebesar ≥ 5 adalah
𝑂�̂�(2,0) =6𝑥10
6𝑥2= 5
𝑂�̂�(3,0) =2𝑥10
5𝑥2= 2
𝑂�̂�(4,0) =6𝑥10
3𝑥2= 10
Dengan 𝑂�̂�(𝑗, 0) menunjukkan rasio odds peristiwa kehidupan
sebesar ≥ 5 untuk y = j dengan y = 0. Sehingga dapat
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
93
disimpulkan bahwa peningkatan rasio odds menunjukkan
adanya peningkatan peluang responden untuk terkena
gangguan kesehatan mental ketika mempunyai peristiwa
kehidupan (≥ 5). Lalu akan dicari kemungkinan rasio odds
untuk responden dengan peristiwa kehidupan (≥ 5)
𝑂�̂�(𝑗, 𝑗 − 1) = exp(0.319) = 1.37571
Dengan 𝑗 = 1, 2, 3, 4. Berdasarkan hasil perhitungan, nilai
odds variabel peristiwa kehidupan (𝑋1) adalah
sebesar 1.375751 memberikan arti bahwa “peristiwa
kehidupan ((≥ 5)” beresiko mempengaruhi kesehatan mental
sebesar 1.375751 kali (13:10) dibanding “peristiwa kehidupan
(< 5)”.
2. Nilai odds ratio pada variabel status SES (𝑥2) dengan 𝑥 = 1
(tinggi) dan 𝑥 = 0 (rendah) sehingga didapatkan klasifikasi
silang untuk empat kategori kesehatan mental dengan status
SES.
3.
Kesehatan mental
(y)
status SES (𝑥2)
Total ( rendah )
(0)
(tinggi)
(1)
𝑦 = 1
(baik)
4 8 12
𝑦 = 2 4 8 12
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
94
(gejala sakit ringan)
𝑦 = 3
(gejala sakit sedang)
5 2 7
𝑦 = 4
(parah)
5 4 9
Total 18 22 40
Tabel 4.2 Klasifikasi silang antara kerusakan mental dan status
SES
Sehingga nilai rasio odds kesehatan mental dengan status SES
tinggi adalah
𝑂�̂�(2,1) =8𝑥4
4𝑥8= 1
𝑂�̂�(3,1) =2𝑥4
5𝑥8= 0.2
𝑂�̂�(4,1) =4𝑥4
5𝑥8= 0.4
Yang berarti bahwa penurunan rasio odds menunjukkan
adanya penurunan peluang responden untuk terkena kerusakan
mental ketika status SES tinggi. Lalu akan dicari kemungkinan
rasio odds untuk responden dengan status SES tinggi.
𝑂�̂�(𝑗, 𝑗 − 1) = exp(1.111) = 0.32923
Dengan 𝑗 = 1, 2, 3, 4. Nilai odds rasio untuk variabel SES (X2)
adalah sebesar 0.32923 artinya “status sosial ekonomi (SES)” tinggi
beresiko mempengaruhi kesehatan mental sebesar 0.32923 kali (atau
3:10) dibanding “SES” rendah.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
95
Perhitungan odds ratio dengan menggunakan salah satu sampel
jawaban responden yaitu jika diketahui responden dengan peristiwa
kehidupan sebesar 3 dan memiliki SES yang rendah.
(𝑃(𝑌 ≤ 1|𝑿𝑖)) =exp(−0.282 + 0.319(3) − 1.111(0))
1 + exp(−0.282 + 0.319(3) − 1.111(0))
= 0.6626
(𝑃(𝑌 ≤ 2|𝑿𝑖)) =exp(1.213 + 0.319(3) − 1.111(0))
1 + exp(1.213 + 0.319(3) − 1.111(0))
= 0.8975
(𝑃(𝑌 ≤ 3|𝑿𝑖)) =exp( 2.209 + 0.319(3) − 1.111(0))
1 + exp(2.209 + 0.319(3) − 1.111(0))
= 0.2224
Sehingga peluang persamaan regresi logistik ordinal resiko
terkena gangguan kesehatan mental adalah sebagai berikut:
∅1(𝑿𝑖) = 𝑃(𝑌 = 0|𝑿𝑖)
= 𝑃(𝑌 ≤ 1|𝑿𝑖)
=exp(−0.282 + 0.319(3) − 1.111(0))
1 + exp(−0.282 + 0.319(3) − 1.111(0))
= 0.6626
∅2(𝑿𝑖) = 𝑃(𝑌 = 1|𝑿𝑖)
= 𝑃(𝑌 ≤ 2|𝑿𝑖) − 𝑃(𝑌 ≤ 1|𝑿𝑖)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
96
=exp(1.213 + 0.319(3) − 1.111(0))
1 + exp(1.213 + 0.319(3) − 1.111(0))
− exp(−0.282 + 0.319(3) − 1.111(0))
1 + exp(−0.282 + 0.319(3) − 1.111(0))
= 0.8975 − 0.6626
= 0.2349
∅3(𝑿𝑖) = 𝑃(𝑌 = 3|𝑿𝑖)
= 𝑃(𝑌 ≤ 3|𝑿𝑖) − 𝑃(𝑌 ≤ 2|𝑿𝑖)
=exp( 2.209 + 0.319(3) − 1.111(0))
1 + exp(2.209 + 0.319(3) − 1.111(0))
−exp(1.213 + 0.319(3) − 1.111(0))
1 + exp(1.213 + 0.319(3) − 1.111(0))
= 0.2224 − 0.8975
= −0.6752
∅4(𝑿𝑖) = 𝑃(𝑌 = 4|𝑿𝑖)
= 𝑃(𝑌 ≤ 4|𝑿𝑖) − 𝑃(𝑌 ≤ 3|𝑿𝑖)
= 1 −exp ( 2.209 + 0.319(3) − 1.111(0))
1 + exp(2.209 + 0.319(3) − 1.111(0))
= 1 − 0.2224
= 0.7776
Responden yang memiliki peristiwa kehidupan sebesar 3 dan memiliki
SES yang rendah maka secara umum maka peluang responden terkena
gangguan kesehatan mental baik adalah 0.6626, peluang responden
terkena gejala kesehatan mental ringan adalah 0.2349, peluang
responden terkena gejala kesehatan mental sedang adalah −0.6752
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
97
dan peluang responden terkena gejala kesehatan mental parah adalah
0.7776. Dari hasil peluang di atas dapat disimpulkan bahwa jika
responden memiiliki SES rendah dan peristiwa kehidupan 3
berpeluang tidak terkena gangguan mental sebesar 0.6626 dan
berpeluang terkena gangguan mental sebesar 0.3374
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
99
BAB V
KESIMPULAN
BAB V KESIMPULAN Analisis regresi logistik ordinal adalah analisis regresi yang peubah
responnya bersifat kategori berskala ordinal yang memiliki tiga atau lebih kategori
dan ada urutan kategori (skala ordinal) yang tidak dapat dianalisa dengan
menggunakan metode regresi biasa. Dengan menggunakan analisis regresi logistik
ordinal, dapat memprediksi adanya pengaruh suatu kejadian. Beberapa landasan
matematika tentang analisis regresi logistik yang dapat dipelajari seperti
probabilitas, metode kuadrat terkecil, metode kemungkinan maksimum, dan
metode Newton-Raphson. Dan berikut langkah-langkah menganalisi penyebab
suatu kejadian dengan menggunakan regresi logistik ordinal adalah:
1. Pendugaan model
2. Intreprestasi koefisien atau parameter model
3. Menguji model
Metode yang digunakan untuk menduga parameter dari model regresi
logistik ordinal adalah dengan menggunakan metode kemungkinan maksimum
(Maximum Likelihood) dan metode Newton-Rhapson. Hasil dari penduga
parameter dapat digunakan untuk menghitung peluang terjadinya gangguan
kesehatan mental seseorang dengan faktor pengaruh suatu peristiwa kehidupan
seperti kelahiran anak, pekerjaan baru, perceraian atau kematian dalam keluarga
dan dengan tinggi rendahnya status ekonomi sosial.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
100
DAFTAR PUSTAKA
Agresti, Alan. (2002). Categorical Data Analysis, Second edition. Kanada: John
Wiley and Sons Inc.
Arum, Eva Setyarini dan Salamah, Mutiah. Analisis Regersi Logistik Ordinal
untuk Mengetahui Tingkat Gangguan Tunagrahita di Kabupaten Ponorogo
Berdasarkan Faktor-Faktor Internal Penyebab Tunagrahita. Jurnal Sains
dan Seni ITS, 4(2):2337-3520.
Burden, Richard L dan Faires, J. Douglas. (2011). Numerical Analysis Nine
Edition.USA: Brooks.
Cohen. Jacob. Dkk. (2003). Applied Multiple Regression/Corelation Analysis for
the Behavioral Sciences, Third Edition. New Jersey: Lawrence Erlbaum
Associates Inc.
Hosmer, D.W. and Lemeshow, S. (2000). Applied Logistic Regression. Kanada:
John Wiley and Sons Inc.
Kleinbaum, David G dan Mitchel Klein. (2002). Logistic Regression a Self-
Learning Text Second Edition. New York: Springer-Verlag.
Kleinbaum, David G dan Mitchel Klein. (2010). Logistic Regression a Self-
Learning Text Third Edition. New York: Springer-Verlag.
Kothari, C.R. (2004). Research Methodology Methods and Techniques (Second
Revised Edition). New Delhi: New Age International.
Meilia, Nur Indah S. (2014).Statisistika Deskriptif dan Induktif. Graha Ilmu:
Yogyakarta
O’Connel Ann A. (2006). Logistic Regression Models for Ordinal Response
Variables. Thousand Oaks: Sage Publications.
Riani, Galuh Putri, dkk. Analisis Faktor- Faktor yang Mempengaruhi Penerimaan
Peserta Didik SMA Negeri 2 Semarang Menggunakan Metode Rege=resi
Logistik Ordinal. Jurnal Gaussian, 5(3):405-416.
Scheaffer, Wackerly dan Mendenhall. (2008). Mathematical Statistics with
Applications, Seven Edition. USA: Thomson Higher education
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
101
Sun, Hyun Kim. (2004). Disertasi: Topics in Ordinal Logistic Regression and Its
Applications. Texas: Texas A&M University.
Tjarta, Ahmad, dkk. (2006). Buku Ajar Patologi. Jakarta: Sagung Seto
Widarjono, Agus. (2010). Analisis Statistika Multivariat Terapan. Yogyakarta:
Unit Penerbit dan Percetakan Sekolah Tinggi Ilmu Manajemen YKPN.
Yudiaatmaja, Fridayana. (2013). Analisis Regresi dengan Menggunakan Aplikasi
Komputer Statistik SPSS. Jakarta: PT Gramedia Pustaka Utama.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
102
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI