estimasi parameter model regresi probit dengan metode
TRANSCRIPT
Estimasi Parameter Model Regresi Probit Dengan Metode Ridge Pada
Data yang Mengandung Multikolinieritas
Sri Irma Yani1*, Anisa2*, Amran3*
Abstrak
Model regresi probit merupakan suatu model regresi yang digunakan ketika variabel respon yang bertipe
kategorik berupa variabel dikotomi yang menunjukkan ada atau tidaknya kriteria atribut dengan menggunakan
nilai 0 atau 1. Terdapat banyak cara yang dapat digunakan untuk mengestimasi parameter model regresi probit,
salah satunya dengan menggunakan metode maximum likelihood estimation (MLE). Namun, ketika terjadi
multikolinieritas antar variabel prediktor, maka variansi semakin membesar yang menyebabkan estimasi dengan
MLE menjadi tidak efisien. Salah satu metode untuk menangani multikolinearitas adalah regresi ridge. Penelitian
ini bertujuan untuk memperoleh estimasi parameter model regresi probit dengan menggunakan metode ridge
pada data yang mengandung multikolinearitas. Pendugaan paremeter pada model regresi probit dengan metode
ridge melibatkan penambahan konstanta bias (๐) ke setiap elemen diagonal matriks. Penelitian ini diaplikasikan
pada data kemiskinan kabupaten/kota di Provinsi Sulawesi Selatan tahun 2017. Variabel respon yang bersifat
kategorik dalam penelitian ini yaitu persentase penduduk miskin sesuai indikator kemiskinan dari Badan Pusat
Statistik dan variabel prediktor yaitu faktor-faktor yang mempengaruhi kemiskinan yaitu pengeluaran perkapita,
ketenagakerjaan, fasilitas perumahan dan pendidikan. Hasil yang diperoleh adalah nilai mean square error
(MSE) dari penduga parameter dengan metode ridge sebesar 0.3672 sedangkan dengan metode MLE diperoleh
MSE sebesar 4.5108 dan metode klasik, yaitu metode Ordinary Least Square diperoleh MSE sebesar 10.19. Hal
ini menunjukkan bahwa metode ridge lebih efektif digunakan untuk mengatasi masalah multikolinearitas.
Kata kunci: Regresi Probit, Multikolinieritas, Maximum Likelihood Estimation, Ridge, Mean Square
Error.
ABSTRACT
The probit regression model is a regression model that is used when the response variable with the categorical
type is a dichotomous variable that indicates the presence or absence of attribute criteria using a value of 0 or 1.
There are many ways that can be used to estimate the parameters of the probit regression model, one of them
using the maximum method likelihood estimation (MLE). However, when there is multicollinearity between
predictor variables, the variance will increase which will make estimation with MLE inefficient. One method for
dealing with multicollinearity is ridge regression. The estimation of parameters in the probit regression model
with the ridge method involves adding a bias constant (k) to each diagonal element of the matrix. This study aims
to obtain parameter estimates of probit regression models using the ridge method on data containing
multicollinearity. This study was applied to the poverty data of districts / cities in South Sulawesi Province in
2017. Categorical response variables in this study were the percentage of poor people according to poverty
indicators from the Central Statistics Agency and predictor variables namely factors that influence poverty,
namely expenditure per capita, employment housing and education facilities. The results obtained are the mean
square error (MSE) of the parameter estimator with the ridge method of 0.3672 while the MLE method obtained
by MSE is 4.5108 and the classical method, namely the Ordinary Least Square method obtained by MSE is 10.19.
This shows that the ridge method is more effectively used to overcome multicollinearity problems.
Keywords: Probit Regression, Multicollinearity, Maximum Likelihood Estimation, Ridge, Mean
Square Error.
*Program Studi Statistika, Universitas Hasanuddin
Email : [email protected], [email protected], [email protected]
1. Pendahuluan Model regresi probit adalah model tak linier yang digunakan untuk menganalisis hubungan
antara satu variabel respon dan beberapa variabel bebas, dengan variabel responnya berupa data
kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan suatu karakteristik dan bernilai
0 untuk menyatakan ketidakberadaan suatu karakteristik [25]. Permasalahan yang sering terjadi
pada regresi probit dengan variabel prediktor lebih dari satu adalah terjadi korelasi antar variabel-
variabel prediktor tersebut yang disebut sebagai multikolinieritas. Hal ini mengakibatkan
penduga/estimator yang dihasilkan menjadi tidak efisien sehingga variansi dari koefisien regresi
menjadi tidak minimum serta variabel prediktor tidak signifikan mempengaruhi variabel respon,
meskipun nilai koefisien determinasinya (R2) tinggi sehingga model yang didapatkan menjadi
kurang layak.
Metode ridge merupakan salah satu metode untuk mengatasi masalah multikolinearitas yakni
dengan cara menambahkan suatu konstanta positif (k) yang kecil pada elemen diagonal matriks
๐ฟ๐ก๐ฟ, yang mengakibatkan matriks ๐ฟ๐ก๐ฟ menjadi matriks non-singular. Berdasarkan uraian diatas,
pada penelitian ini penulis mengkaji tentang estimasi parameter model regresi prob it. Sehingga
penulis tertarik untuk mengambil judul penelitian Estimasi Parameter Model Regresi Probit
Dengan Metode Ridge Pada Data yang Mengandung Multikolinieritas.
2. Tinjauan Pustaka
2.1 Estimasi Parameter
Estimasi merupakan suatu pernyataan untuk menduga hubungan mengenai parameter populasi
yang tidak diketahui menggunakan sampel (statistik), dalam hal ini peubah acak yang diambil dari
populasi yang bersangkutan. Jadi dengan estimasi, keadaan populasi dapat diketahui [8]. Adapun
sitat-sifat estimator yang baik adalah sebagai berikut:
1) Unbiased
Suatu hal yang menjadi tujuan dalam mengestimasi adalah estimator harus mendekati nilai
sebenarnya dari parameter yang diduga tersebut.
2) Efisien
Suatu estimator misalkan ๏ฟฝฬ๏ฟฝ dikatakan efisien bagi parameter ๏ฟฝฬ ๏ฟฝ apabila penduga tersebut
mempunyai variansi yang kecil.
3) Konsisten
Suatu estimasi dikatakan konsisten apabila nilai estimasi tersebut sama dengan parameter yang
diestimasi.
2.2 Analisis Regresi
Analisis regresi adalah teknik analisis yang mencoba menjelaskan bentuk hubungan antara
peubah-peubah yang mendukung sebab akibat. Prosedur analisisnya didasarkan atas distribusi
probabilitas bersama peubah-peubahnya. Tujuan utama dari analisi regresi adalah untuk
mendapatkan dugaan dari suatu variabel dengan menggunakan variabel lain yang diketahui.
2.2.1 Regresi Linier Berganda
Persamaan model regresi linier dengan ๐ variabel bebas diberikan sebagai
๐ = ๐ฝ0 + ๐ฝ1๐1 + ๐ฝ2๐2 + โฏ+ ๐ฝ๐๐๐ + ๐ (2.1)
dengan,
๐ = variabel respon
๐1, ๐2, โฆ , ๐๐ = variabel prediktor
๐ฝ0, ๐ฝ1, ๐ฝ2, โฆ , ๐ฝ๐ = parameter
๐ = galat
Bila pengamatan ๐, ๐1, ๐2, โฆ , ๐๐ dinyatakan masing-masing dengan ๐๐ , ๐๐1, ๐๐2, โฆ , ๐๐๐ dan
galatnya ๐๐, maka Persamaan (2.1) dapat dituliskan sebagai
๐๐ = ๐ฝ0 + ๐ฝ1๐๐1 + ๐ฝ2๐๐2 + โฏ+ ๐ฝ๐๐๐๐ + ๐๐, ๐ = 1,2,โฆ , ๐ (2.2)
dengan mean ๐ธ(๐๐) = 0 dan variansinya ๐2(๐๐) = ๐2, dan tidak berkorelasi
sehingga kovariansinya ๐ธ(๐๐, ๐๐) = 0,๐ โ ๐, ๐ = ๐ = 1,2,โฆ , ๐. Apabila dinotasikan dalam bentuk
matriks, menjadi
[
๐1
๐2
โฎ๐๐
] =
[ 1 ๐11 โฆ ๐1๐
1โฎ1
๐21
โฎ๐๐1
โฆโฑโฆ
๐2๐
โฎ๐๐ ]
[
๐ฝ0
๐ฝ1
โฎ๐ฝ๐
] + [
๐1
๐2
โฎ๐๐
] (2.3)
Persamaan (2.3) dapat dinyatakan sebagai [17]
๐ = ๐ฟ๐ท + ๐บ (2.4)
dengan,
๐ = vektor variabel respon (ukuran ๐ ร 1)
๐ฟ = matriks variabel prediktor ukuran (๐ ร (๐ + 1))
๐ท = vektor parameter (ukuran (๐ + 1) ร 1)
๐บ = vektor galat (ukuran ๐ ร 1)
Persamaan matriks (2.4) dikenal sebagai penyajian matriks model regresi linier (๐-variabel).
2.2.1 Regresi Probit
Regresi probit merupakan regresi nonlinier yang digunakan untuk menganalisis hubungan
antara satu variabel respon dengan beberapa variabel prediktor, dengan variabel respon berupa
data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah atribut dan bernilai
0 untuk menyatakan ketidakberadaan sebuah atribut [4]. Menurut Skrondal & Hesketh [23],
regresi probit merupakan modifikasi regresi logistik dengan menetapkan persamaan regresi logit
berdistribusi normal.
Model regresi probit ditunjukkan pada persamaan [13]
๐ฆ๐โ = ๐ฅ๐โฒ๐ท + ๐๐ (2.5)
dengan ๐ฆ๐โ merupakan variabel laten, ๐ฅ๐ adalah baris ke-i dari ๐ฟ yang merupakan matriks berordo
๐ ร (๐ + 1) dengan ๐ merupakan banyaknya variabel prediktor, ๐ท adalah vektor koefisien (๐ +
1) ร 1 dan ๐๐ adalah error yang diasumsikan berdistribusi normal. Variabel laten tidak dapat
diamati secara langsung, namun dapat dianalisis melalui variabel dummy sebagai berikut:
๐ฆ๐ = {1, ๐๐๐๐ ๐ฆ๐
โ > 0
0, ๐ข๐๐ก๐ข๐ ๐ฆ๐โ ๐๐๐๐๐๐ฆ๐
๐ฆ๐ berdistribusi ๐ต๐(๐๐), dengan ๐๐ = ะค(๐ฅ๐โฒ๐ท) dan ะค adalah fungsi distribusi normal standar.
2.3 Metode Maximum Likelihood Estimator
Metode Maximum Likelihood Estimator (MLE) merupakan metode yang digunakan dalam
menduga parameter regresi logistik. Karena setiap observasi bersifat independen, maka bentuk
umum fungsi likelihood dari distribusi Bernoulli adalah [2]:
๐ฟ(๐ท) = โ๐(๐ฆ๐)
๐
๐=1
= โ ๐๐๐ฆ๐(1 โ ๐๐)
1โ๐ฆ๐๐๐=1 (2.6)
dengan
๐๐ =exp (๐ฝ0+๐ฝ1๐ฅ๐1+๐ฝ2๐ฅ๐2+โฏ+๐ฝ๐๐ฅ๐๐)
1+exp (๐ฝ0+๐ฝ1๐ฅ๐1+๐ฝ2๐ฅ๐2+โฏ+๐ฝ๐๐ฅ๐๐)
=exp (โ ๐ฝ๐๐๐๐)
๐๐=0
1+exp (โ ๐ฝ๐๐๐๐)๐๐=0
=exp (๐ฟ๐๐ท)
1+exp (๐ฟ๐๐ท), ๐ = 1,2, โฆ , ๐
dengan ๐ฟ๐ = (1, ๐ฅ๐1, ๐ฅ๐2, โฆ , ๐ฅ๐๐) dan ๐ท = (๐ฝ0 ๐ฝ1 ๐ฝ2 โฆ๐ฝ๐)๐ก
Perhitungan lebih mudah dilakukan dengan memaksimumkan fungsi likelihood yang disebut
fungsi log-likelihood berupa logaritma natural dari fungsi likelihood tersebut, sehingga dituliskan
sebagai:
โ = ln ๐ฟ(๐ท) = ln(โ๐๐๐ฆ๐(1 โ ๐๐)
1โ๐ฆ๐
๐
๐=1
)
= โ {โ ln (1 + exp(๐ฟ๐๐ท)) + ๐ฆ๐ ๐ฟ๐๐ท}๐๐=1 (2.7)
Penduga varian dan kovarian diperoleh dari turunan kedua fungsi log likelihood, sebagai
berikut [14]:
๐2โ
๐2๐ฝ= โโ (๐ฟ๐
2๐๐(1 โ ๐๐)) =๐๐=1 โ โ (๐ฟ1
2๏ฟฝฬ๏ฟฝ๐)๐๐=1
= โ๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ (2.8)
dengan ๏ฟฝฬ๏ฟฝ = ๐๐๐๐[๐๐(1 โ ๐๐)]
Karena model regresi logistik merupakan fungsi nonlinear, maka proses perhitungan MLE
dapat didekati dengan metode Weighted Least Square (WLS) yang dapat ditulis sebagai berikut:
๏ฟฝฬ๏ฟฝ๐๐ฟ๐ = (๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ)โ1
๐ฟ๐ก๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ (2.9)
Metode ini merupakan pengembangan dari metode fisher scoring [2]. Penduga parameter
dengan metode fisher scoring pada iterasi ke-๐ก + 1 dalam proses iterasi ๐ก= 0, 1, 2 ,... adalah
sebagai berikut :
๏ฟฝฬ๏ฟฝ๐ก+1 = ๏ฟฝฬ๏ฟฝ๐ก + ๐ฐโ1(๐ท๐ก)๐บ(๐ท๐ก) (2.10)
dengan
๏ฟฝฬ๏ฟฝ๐ก dan ๏ฟฝฬ๏ฟฝ๐ก+1 : vektor untuk ๐ท pada iterasi ke-t dan ke-t + 1
๐ฐโ1(๐ท๐ก) : matriks informasi yang berisi negatif ekspektasi dari turunan kedua ln-likelihood
terhadap ๐ท๐ก
๐บ(๐ท๐ก) : vektor turunan pertama ln-likelihood terhadap ๐ท๐ก
Dari iterasi tersebut akan diperoleh penduga maksimum likelihood untuk ๏ฟฝฬ๏ฟฝ dan ๏ฟฝฬ๏ฟฝ yang
dinotasikan dengan ๏ฟฝฬ๏ฟฝ๐๐ฟ dan ๏ฟฝฬ๏ฟฝ
๏ฟฝฬ๏ฟฝ๐๐ฟ = (๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ)โ1
๐ฟ๐ก๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ (2.11)
dengan merupakan vektor yang setiap elemen ke-i bernilai
๐ง๐ = ln (๐๐
1โ๐๐) +
๐ฆ๐โ๐๐
๐๐(1โ๐๐) (2.12)
2.4 Iterasi Method of Scoring
Iterasi method of scoring adalah salah satu iterasi dari metode nonlinier maximum likelihood
untuk mendapatkan estimasi prameter ๐ฝ yang merupakan bagian dari metode fisher scoring
dengan
๐ท(๐ก+1) = ๐ท๐ก โ (๐ธ (๐2โ
๐๐ท๐๐ท๐ก โ๐ท๐ก))
โ1๐โ
๐๐ทโ๐ท๐ก (2.13)
Selanjutnya PDF dari ๐ฆ๐ yang diberikan oleh ๐ฟ๐, ๐ท, dan ๐2 berikut :
๐(๐ฆ๐|๐ฟ๐, ๐ท, ๐2) =1
๐โ2๐๐๐ฅ๐ (โ
1
2๐2(๐ฆ๐ โ ๐(๐ฟ๐, ๐ท))2)
= ๐ฟ๐(๐ท, ๐2) (2.14)
sebagaimana diketahui Persamaan (2.14), maka dapat dibentuk
โ๐ = ln๐ฟ๐(๐ท, ๐2) = ln ๐(๐ฆ๐|๐ฟ๐, ๐ท, ๐2) (2.15)
maka
๐โ๐
๐๐ท=
1
๐ฟ๐(๐ท, ๐2)
๐๐ฟ๐(๐ท, ๐2)
๐๐ท
=1
๐(๐ฆ๐|๐ฟ๐, ๐ท, ๐2)
๐๐(๐ฆ๐|๐ฟ๐, ๐ท, ๐2)
๐๐ท (2.16)
dari Persamaan (2.16) diperoleh
โซ๐๐(๐ฆ๐|๐ฟ๐, ๐ท, ๐2
)
๐๐ท๐
โ
โโ๐ฆ๐ = 0
= โซ๐โ๐
๐๐ท๐(๐ฆ๐|๐ฟ๐, ๐ท, ๐2)๐
โ
โโ๐ฆ๐ (2.17)
Selanjutnya turunan parsial pertama Persamaan (2.19) terhadap ๐ท๐ก dan menyakaman
persamaanya dengan nol sehingga diperoleh, ๐
๐๐ท๐ก (โซ๐โ๐
๐๐ท๐(๐ฆ๐|๐ฟ๐, ๐ท, ๐2)๐
โ
โโ๐ฆ๐) = 0
= ๐ธ (๐2โ๐
๐๐ท๐๐ท๐ก +๐โ๐
๐๐ท
๐โ๐
๐๐ท๐ก)
atau dapat dituliskan sebagai
๐ธ (๐2โ๐
๐๐ท๐๐ท๐ก) = โ๐ธ (๐โ๐
๐๐ท
๐โ๐
๐๐ท๐ก) (2.18)
2.5 Multikolinieritas
Istilah multikolinieritas diciptakan oleh Ragner Frish yang menyatakan adanya hubungan linier
yang sempurna atau eksak (perfect or exact) di antara variabel-variabel prediktor dalam model
regresi yang menyebabkan variabel prediktor ๐ฟ akan mengakibatkan determinan matriks ๐ฟ๐ก๐ฟ
pada estimator ordinary least square maupun maximum likelihood mendekati nol sehingga
menjadi singular. [6] menyatakan bahwa hal ini dapat diketahui dari matriks korelasi hasil
pemusatan dan penskalaan matriks X sebagai berikut:
๏ฟฝฬ๏ฟฝ๐ฟ๐ = (๐ฟ๐ก๐ฟ)โ1๐ฟ๐ก๐
= [1 ๐12
๐21 1]โ1
[๐1๐ฆ
๐2๐ฆ] (2.19)
dengan ๐12 adalah koefisien korelasi antara ๐ฟ1 dan ๐ฟ2.
Menurut Setiawan dan Kusrini (2010), salah satu ukuran untuk menguji adanya
multikolinieritas adalah Variance Inflation Factors (VIF). VIF merupakan elemen diagonal dari
matriks ๐ฟ๐ก๐ฟ.
(๐ฟ๐ก๐ฟ)โ1 = [
1
1โ๐122
โ๐12
1โ๐122
โ๐12
1โ๐122
1
1โ๐122
] (2.20)
๐๐ผ๐น๐ = ๐๐๐๐(๐ฟ๐ก๐ฟ) =1
1โ๐น๐2 (2.21)
Pengujian multikolinieritas juga dapat dilakukan dengan menghitung nilai Tolerance (TOL)
dengan persamaan
๐๐๐ฟ๐ =1
๐๐ผ๐น๐ (2.22)
Nilai ๐๐๐ฟ < 0.1 mengindikasikan bahwa terjadi multikolinieritas antar variabel prediktor.
Sedangkan nilai VIF dari estimator generalized ridge regression dapat dihitung melalui
persamaan
๐๐ผ๐น = ๐๐๐๐ (1
๐โ1(๐ฟ๐ก๐ฟ) โ ๐ซ๐ฒ๐ซ๐ก)
โ1(
1
๐โ1(๐ฟ๐ก๐ฟ)) (
1
๐โ1(๐ฟ๐ก๐ฟ) โ ๐ซ๐ฒ๐ซ๐ก)
โ1 (2.23)
dengan K adalah matriks yang elemen diagonalnya merupakan parameter ridge ๐ โฅ 0. D
menyatakan suatu matriks ortogonal dengan ๐ซ = ๐ซโ1sedemikian sehingga ๐ซ๐ก๐ซ = ๐ฐ dan
๐ซ๐ก๐ช๐ซ = ษ , dengan ๐ช = ๐ฟ๐ก๐ฟ dan ษ merupakan matriks ๐ ร ๐ yang anggota diagonal utamanya
merupakan nilai eigen dari matriks ๐ฟ๐๐ฟ.
2.6 Metode Ridge
Estimasi ridge untuk koefisien regresi dapat diperoleh dengan menyelesaikan suatu bentuk dari
persamaan normal regresi [10]. Penduga ridge dapat dituliskan sebagai berikut:
๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐ฟ + ๐๐ฐ)โ1๐ฟ๐ก๐ (2.24)
Pada dasarnya penduga ridge merupakan metode kuadrat terkecil. Perbedaannya adalah bahwa
pada metode regresi ridge, nilai variabel bebasnya ditransformasikan dahulu melalui prosedur
centering dan rescaling [22].
Pada tahun 1984, R.L Schaefer, L.D Roi dan R.A Wolfe mengembangkan penduga ridge pada
model regresi logistik untuk menangani masalah multikolinearitas dengan metode Lagrange yang
meminimumkan fungsi Weighted Sum of Square Error (WSSE) berikut:
๐พ๐บ๐บ๐ฌ = (๐ โ ๐ฟ๐ท)๐ก๐พ(๐ โ ๐ฟ๐ท) (2.25)
Parameter penting yang membedakan regresi ridge dari metode kuadrat terkecil adalah k.
Parameter ridge k yang relatif kecil ditambahkan pada diagonal utama matriks ๐ฟ๐ก๐ฟ, sehingga
koefisien estimator regresi ridge dipenuhi dengan besarnya parameter ridge k. Estimator ridge
diperoleh dengan meminimumkan jumlah kuadrat error untuk model
๐ = ๐ฟ๐ท + ๐บ (2.26)
dengan menggunakan metode pengali Lagrange yang meminimumkan fungsi
๐บ๐ก๐บ = (๐ โ ๐ฟ๐ท๐ ๐ )๐ก(๐ โ ๐ฟ๐ท๐ ๐ ) (2.27)
dengan syarat pembatas
๐ท๐ ๐ ๐ก ๐ท๐ ๐ โ ๐2 = 0
๐ฎ = (๐ โ ๐ฟ๐ท๐ ๐ )๐ก(๐ โ ๐ฟ๐ท๐ ๐ ) + ๐(๐ท๐ ๐ ๐ก ๐ท๐ ๐ โ ๐2) (2.28)
yang memenuhi syarat ๐๐ฎ
๐๐ท๐ ๐ | ๏ฟฝฬ๏ฟฝ๐ ๐ = 0
โ2๐ฟ๐ก๐ + 2๐ฟ๐ก๐ฟ๏ฟฝฬ๏ฟฝ๐ ๐ + 2๐๐ฐ๏ฟฝฬ๏ฟฝ๐ ๐ = 0
๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐ฟ + ๐๐ฐ)โ1๐ฟ๐ก๐ (2.29)
dengan ๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐ฟ + ๐๐ฐ)โ1๐ฟ๐ก๐ dengan 0 โค ๐ โค โ, itulah yang disebut sebagai estimator
regresi ridge. k โฅ 0 aalah nilai konstan yang dipilih sebagai indeks dari kelas estimator. Adapun
model regresi probit dengan metode ridge menggunakan parameter ridge
๐ = ๐๐๐ฅ (1
๐๐) (2.30)
๐๐ =๐๐๐๐ฅ
(๐โ๐)๏ฟฝฬ๏ฟฝ2+๐๐๐๐ฅ๏ฟฝฬ๏ฟฝ๐2 (2.31)
2.7 Kemiskinan
Masalah kemiskinan merupakan salah satu persoalan mendasar yang menjadi pusat perhatian
pemerintah di negara manapun. Salah satu aspek penting untuk mendukung Strategi
Penanggulangan Kemiskinan adalah tersedianya data kemiskinan yang akurat. Pengukuran
kemiskinan yang dapat dipercaya dapat menjadi instrumen tangguh bagi pengambil kebijakan
dalam memfokuskan perhatian pada kondisi hidup orang miskin. Data kemiskinan yang baik dapat
digunakan untuk mengevaluasi kebijakan pemerintah terhadap kemiskinan, membandingkan
kemiskinan antar waktu dan daerah, serta menentukan target penduduk miskin dengan tujuan
untuk memperbaiki kondisi mereka [3].
Kemiskinan telah menjadi masalah di hampir semua negara, baik negara maju atau negara
yang sedang berkembang. Tingkat kekompleksitas tiap negara berbeda dalam menyelesaikan
masalah kemiskinan. Indonesia sebagai salah satu negara berkembang, angka kemiskinan masih
cukup tinggi. Pemerintah melalui Badan Pusat Statistik (BPS) membuat kriteria kemiskinan, agar
dapat menyusun secara lengkap pengertian kemiskinan sehingga dapat diketahui dengan pasti
jumlahnya dan cara tepat menanggulanginya.
3. Metodologi Penelitian
3.1 Data
Data yang digunakan dalam penelitian ini merupakan data sekunder dari 24 kabupaten/kota
di provinsi Sulawesi Selatan tentang faktor-faktor yang mempengaruhi kemiskinan di Provinsi
Sulawesi Selatan tahun 2017. Sumber data diperoleh dari publikasi BPS berupa buku yang
berjudul โData dan Informasi Kemiskinan Kabupaten/Kota Tahun 2017โ.
Variabel respon Y bersifat kategorik yaitu dengan mengelompokkan kabupaten/kota menjadi
dua kelompok, yakni miskin atau tidak miskin berdasarkan nilai Head Count Index (HCI) Provinsi
Sulawesi Selatan tahun 2016 sebesar 10.34% [9], yaitu: 0 = kabupaten/kota tidak miskin (nilai
HCI dibawah 10,34%)
1 = kabupaten/kota miskin (nilai HCI diatas 10,34%)
Adapun variabel prediktor berdasarkan masing-masing sektor yang
ditampilkan pada Tabel 3.1.
Tabel 3. 1 Variabel penelitian kemiskinan
Sektor Simbol Variabel
- Y (HCI) Persentase penduduk miskin (%)
Pendidikan
X1 Persentase penduduk miskin usia 15 tahun keatas (<SD)
(%)
X2 Angka melek huruf untuk golongan usia 15-55 tahun
(%)
Ketenagakerjaan
X3 Persentase penduduk usia >15 tahun yang tidak bekerja
(%)
X4 Persentase penduduk miskin usia 15 tahun keatas yang
bekerja di sektor pertanian (%)
X5 Persentase penduduk miskin usia 15 tahun keatas yang
bekerja bukan di sektor pertanian (%)
Pengeluaran Perkapita X6 Persentase pengeluaran perkapita penduduk miskin
untuk makanan (%)
Fasilitas Perumahan
X7 Persentase rumah tangga miskin yang menggunakan air
layak (%)
X8 Persentase rumah tangga miskin yang menggunakan
jamban sendiri/bersama (%)
3.2 Metode Analisis
Metode analisis yang digunakan dalam penelitian ini adalah
1. Mendeteksi adanya multikolinieritas pada data dengan menghitung nilai korelasi antar
variabel prediktor (X) dan dengan menghitung nilai VIF serta nilai TOL menggunakan
Persamaan (2.21) dan Persamaan (2.22).
2. Melakukan proses standariasi pada variabel prediktor (X) menggunakan Persamaan
๐ =๐ โ ๐
๐
3. Melakukan proses pendeskripsian model ke bentuk GLM.
4. Melakukan pendugaan koefisien regresi probit ๏ฟฝฬ๏ฟฝ๐๐ฟ dengan proses sebagai berikut:
a. Menghitung nilai dugaan awal ๏ฟฝฬ๏ฟฝ๐๐ฟ0 yang diperoleh dari penduga parameter dengan
menggunakan metode Ordinary Least Square (OLS).
b. Menghitung nilai ๏ฟฝฬ๏ฟฝ dan ๐ = ๐ฆ โ ๏ฟฝฬ๏ฟฝ;๏ฟฝฬ๏ฟฝ = ๏ฟฝฬ๏ฟฝ
c. Menghitung nilai ๏ฟฝฬ๏ฟฝ dan ๏ฟฝฬ๏ฟฝ serta nilai ๏ฟฝฬ๏ฟฝ1 dengan metode MLE menggunakan Persamaan
(2.11)
d. Mengulangi langkah b dan c agar nilai ๏ฟฝฬ๏ฟฝ๐๐ฟ konvergen hingga m iterasi
๏ฟฝฬ๏ฟฝ๐๐ฟ๐ = (๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐๐ฟ)
โ1๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐๏ฟฝฬ๏ฟฝ๐
5. Menghitung nilai eigen dan vektor eitgen dari ๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐๐ฟ.
6. Menghitung nilai tetapan ๐.
๐ = ๐๐๐ฅ (1
๐๐) dengan ๐๐ =
๐๐๐๐ฅ
(๐โ๐)๏ฟฝฬ๏ฟฝ2+๐๐๐๐ฅ๏ฟฝฬ๏ฟฝ๐2
7. Melakukan pendugaan koefisien regresi Probit dengan metode ridge, dinotasikan dengan
๏ฟฝฬ๏ฟฝ๐ ๐ .
๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐พ๐ฟ + ๐๐ฐ)โ1๐ฟ๐ก๐พ๐ฟ๏ฟฝฬ๏ฟฝ๐๐ฟ๐
8. Membentuk model regresi Probit.
9. Memeriksa apakah multikolinieritas telah teratasi dengan melakukan uji formal, yakni
dengan menghitung kembali nilai VIF setelah penambahan parameter ridge.
10. Membandingkan hasil estimasi dengan data yang sebenarnya untuk mengetahui kesesuaian
model yang didapatkan. Perbandingan dilakukan dengan mengkategorikan nilai ๐ฆ๐โ, dengan
๏ฟฝฬ๏ฟฝ๐ = {1, ๐๐๐๐ ๐ฆ๐
โ > 0
0, ๐๐๐๐ ๐ฆ๐โ โค 0
11. Penarikan Kesimpulan.
4 Hasil dan Pembahasan
4.1 Estimasi Parameter Model Regresi Probit
Estimasi parameter model regresi probit menggunakan metode ridge diperoleh dengan terlebih
dahulu mendeskripsikan model berupa fungsi distribusi yang dari model ke dalam bentuk GLM,
kemudian dilanjutkan dengan estimasi parameter menggunakan metode MLE. Estimator yang
telah didapatkan kemudian digunakan untuk mengestimasi parameter regresi probit dengan
metode ridge.
Variabel respon ๐ฆ๐(๐ = 1,2,โฆ , ๐) dalam model regresi probit diasumsikan berdistribusi
Bernoulli dengan peluang sukses ๐๐ = ะค(๐ฅ๐๐ก, ๐ท), ๐ = 1,2,โฆ , ๐ dengan ะค adalah fungsi distribusi
normal standar, ๐ฅ๐ adalah kolom ke-i dari matriks X berordo ๐ ร ๐ dengan ๐ adalah banyaknya
variabel prediktor, dan ๐ท adalah matriks berordo ๐ ร 1.
Karena ๐ฆ๐ berdistribusi Bernoulli dengan peluang sukses ๐๐, maka dalam bentuk persamaan
dapat dituliskan sebagai
๐(๐ฆ๐) = ๐๐๐ฆ๐(1 โ ๐๐)
1โ๐ฆ๐ (4.1)
Untuk mengestimasi parameter ๐ท digunakan metode MLE setelah mendeskripsikan Persamaan
(4.1) ke dalam bentuk GLM terlebih dahulu.
4.1.1 Deskripsi Model ke Bentuk Generalized Linier Model
Model regresi probit merupakan hasil modifikasi dari model regresi logistik yang merupakan
anggota dari exponential family. Oleh karena itu langkah pertama yang harus dilakukan untuk
mendeskripsikan fungsi distribusi dari variabel respon ke dalam bentuk GLM adalah dengan
menunjukkan bahwa fungsi distribusi tersebut merupakan keluarga eksponensial. Dengan
menggunakan fungsi logaritma natural, Persamaan (4.1) menjadi
ln ๐(๐ฆ๐) = ๐ฆ๐ ln(๐๐) + (1 โ๐ฆ๐)ln (1 โ ๐๐)
= ๐ฆ๐ ln (๐๐
1โ๐๐) + ln(1 โ ๐๐) (4.2)
Persamaan (4.2) dapat dituliskan sebagai
โ๐ = ln๐( ๐ฆ๐) = ๐ฆ๐๐๐ โ ๐(๐๐)
dari ๐๐ = ln (๐๐
1โ๐๐), dapat diperoleh ๐๐ sebagai berikut:
๐๐ =๐๐๐
1 + ๐๐๐
sehingga,
๐(๐๐) = โ ln(1 โ ๐๐) = ln(1 + ๐๐๐) (4.3)
Dari Persamaan (4.3), diperoleh
๐ธ(๐ฆ๐) = ๐๐
dan
๐๐๐(๐ฆ๐) = ๐๐(1 โ ๐๐)
4.1.2 Estimasi dengan Metode Maximum Likelihood
Metode MLE untuk GLM digunakan pada penduga parameter model yang distribusi
eksponensial. Adapun penduga parameter regresi probit dengan variabel respon mengikuti
distribusi Bernouli diberikan PDF sebagai berikut :
๐(๐ฆ๐) = (๐๐)๐ฆ๐(1 โ ๐๐)
1โ๐ฆ๐ , ๐ฆ = 0,1 (4.4)
dari Persamaan (4.4) diperoleh fungsi likelihood:
๐ฟ(๐ท) = โ ๐(๐ฆ๐)๐๐=1 = โ (
exp (๐ฟ๐๐ท)
1+exp (๐ฟ๐๐ท))
๐ฆ๐(
1
1+exp (๐ฟ๐๐ท))1โ๐ฆ๐๐
๐=1 (4.5)
dan fungsi log-likelihood sebagai berikut :
โ = ln ๐ฟ(๐ท) = โ [โ ln(1 + exp(๐ฟ๐๐ท)) + ๐ฆ๐๐ฟ๐๐ท]๐๐=1 (4.6)
turunan pertama dari fungsi log-likelihood terhadap parameter ๐ท yaitu:
๐โ
๐๐ทโ๐ท=๏ฟฝฬ๏ฟฝ = โ ๐ฟ๐ [๐ฆ๐ โ
(exp(๐ฟ๐๏ฟฝฬ๏ฟฝ))
1+exp(๐ฟ๐๏ฟฝฬ๏ฟฝ)]๐
๐=1 (4.7)
dengan ๏ฟฝฬ๏ฟฝ(๐ฅ) =(exp(๐ฟ๐๏ฟฝฬ๏ฟฝ))
1+exp(๐ฟ๐๏ฟฝฬ๏ฟฝ) atau dalam bentuk matriks dapat dituliskan sebagai:
๐โ
๐๐ท= ๐ฟ๐ก(๐ฆ โ ๏ฟฝฬ๏ฟฝ(๐ฅ)) (4.8)
turunan kedua dari fungsi log-likelihood menghasilkan
๐2โ
๐2๐ท= โโ (๐ฟ๐
2๏ฟฝฬ๏ฟฝ๐)๐๐=1
dalam bentuk matriks, dapat dituliskan sebagai:
๐2โ
๐2๐ท= โ๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ (4.9)
dengan ๏ฟฝฬ๏ฟฝ = ๐๐๐๐[๏ฟฝฬ๏ฟฝ๐(1 โ ๏ฟฝฬ๏ฟฝ๐)]
Iterasi fisher scoring dapat dibentuk ulang menggunakan menjadi
๏ฟฝฬ๏ฟฝ๐ก+1 = ๏ฟฝฬ๏ฟฝ๐ก+ (๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ)โ1
(๐ฟ๐ก(๐ฆ โ ๏ฟฝฬ๏ฟฝ(๐ฅ))) (4.10)
Persamaan (4.10) dapat dituliskan dalam bentuk matriks sebagai berikut :
๏ฟฝฬ๏ฟฝ๐ก+1 = (๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ)โ1
๐ฟ๐ก๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ
dengan ๏ฟฝฬ๏ฟฝ = ๐ง๐ = ln (๐๐
1โ๐๐) +
๐ฆ๐โ๐๐
๐๐(1โ๐๐) dan ๐ก menyatakan banyakmya iterasi.
Dari iterasi Method of Scoring tersebut diperoleh penduga MLE yang dituliskan sebagai
๏ฟฝฬ๏ฟฝ๐๐ฟ = (๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ)โ1
๐ฟ๐ก๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ (4.11)
4.2 Estimasi Parameter Model Regresi Probit Ridge
Penduga parameter ๏ฟฝฬ๏ฟฝ๐๐ฟ akan menghasilkan galat yang lebih tinggi ketika variabel-variabel
prediktor mengandung multikolinieritas. Penduga parameter dengan metode ridge pada keluarga
regresi logistik diperoleh dengan metode Lagrange yang fungsi tujuannya meminimumkan fungsi:
๐พ๐บ๐บ๐ฌ = (๐ โ ๐ฟ๐ท)๐ก๐พ(๐ โ ๐ฟ๐ท)
dengan fungsi kendala ๐๐ท๐ก๐ท, sehingga dapat diperoleh
๐ฎ = ๐๐ก๐พ๐ โ 2๐ท๐ ๐ ๐ก ๐ฟ๐ก๐พ๐ + ๐ท๐ ๐
๐ก ๐ฟ๐ก๐พ๐ฟ๐ท๐ ๐ + ๐(๐ท๐ ๐ ๐ก ๐ท๐ ๐ โ ๐2) (4.12)
kemudian untuk memaksimalkan Persamaan (4.12) maka turunan pertama dari ๐ฎ terhadap
๐ท๐ ๐ disamakan dengan nol diperoleh:
๐๐ฎ
๐๐ท๐ ๐ โ๐ท๐ ๐ =๏ฟฝฬ๏ฟฝ๐ ๐
= 0 โ 2๐ฟ๐ก๐พ๐ + 2๐ฟ๐ก๐พ๐ฟ๏ฟฝฬ๏ฟฝ๐ ๐ + 2๐๐ฐ๏ฟฝฬ๏ฟฝ๐ ๐
๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐พ๐ฟ + ๐๐ฐ)โ1๐ฟ๐ก๐พ๐
Berdasarkan persamaan yang diperoleh, maka penduga parameter dengan metode ridge
untuk model regresi probit dapat dituliskan sebagai:
๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐พ๐ฟ + ๐๐ฐ)โ1๐ฟ๐ก๐พ๐ฟ๏ฟฝฬ๏ฟฝ๐๐ฟ (4.13)
4.3 Aplikasi pada Data yang Mengandung Multikolinieritas
4.3.1 Uji Multikonieritas
Pengujian multikolinearitas bertujuan untuk mengetahui apakah antara sesama variabel
prediktor (X) memiliki korelasi (hubungan) yang kuat. Korelasi yang kuat mengakibatkan biasnya
hasil penelitian. Masalah multikolinearitas pada model regresi logistik dapat dideteksi dengan
melihat nilai VIF, TOL maupun matriks korelasinya. Jika nilai VIF<10 pada variabel prediktor,
maka dapat disimpulkan bahwa tidak terjadi multikolinearitas, sedangkan apabila nilai VIF>10
maka telah terjadi multikolinearitas pada data. Dilakukan perhitungan matriks korelasi, nilai untuk
VIF dan TOL pada variabel prediktor dengan hasil sebagai berikut sebagai berikut:
Tabel 4. 1 Nilai korelasi antar Variabel Prediktor
Variabel
Prediktor X1 X2 X3 X4 X5 X6 X7 X8
X1 1
X2 -0.548 1
X3 -0.408 0.253 1
X4 0.606 -0.312 -0.728 1
X5 -0.612 0.342 0.431 -0.877 1
X6 0.316 -0.371 -0.204 0.341 -0.380 1
X7 -0.475 0.001 0.534 -0.607 0.512 0.145 1
X8 -0.116 0.300 0.012 0.019 0.034 0.125 -0.040 1
Sumber : Data diolah, 2019
Tabel 4.1 menunjukkan bahwa terdapat beberapa nilai korelasi yang tinggi antar
variabel prediktor yang menunjukkan bahwa terdapat gejala multikolinearitas pada data.
Tabel 4. 2 Nilai VIF dan TOL
Variabel VIF TOL Keterangan
X1 2.499 0.400 Tidak Multikolinearitas
X2 1.994 0.501 Tidak Multikolinearitas
X3 11.652 0.086 Multikolinearitas
X4 38.274 0.026 Multikolinearitas
X5 19.957 0.050 Multikolinearitas
X6 1.786 0.560 Tidak Multikolinearitas
X7 2.688 0.372 Tidak Multikolinearitas
X8 1.270 0.787 Tidak Multikolinearitas
Sumber : Data diolah, 2019
Tabel 4.2 menunjukkan bahwa variabel X3, X4 dan X5 memiliki nilai VIF yang lebih besar
dari 10 yaitu masing-masing sebesar 11.652, 38.274 dan 19.957. Nilai TOL yang kurang dari 0.1
terlihat pada variabel X3, X4 dan X5. Dengan demikian dapat disimpulkan bahwa terdapat masalah
multikolinearitas pada model regresi.
4.3.2 Pendugaan Parameter Regresi dengan Metode MLE
Langkah pertama yang dilakukan untuk mengestimasi parameter model dengan metode ridge
adalah dengan menentukan nilai penduga awal yang digunakan menggunakan metode (OLS).
Model regresi yang diperoleh dengan menggunakan metode OLS diberikan sebagai berikut :
๐ฆ๐โ = โ0.3750 โ 0.1146๐1๐ + 0.0386๐2๐ โ 0.2969๐3๐ โ 0.281๐4๐ โ 0.2032๐5๐
โ 0.0889๐6๐ + 0.0968๐7๐ โ 0.0974๐8๐
Dengan menggunakan proses iterasi Method of Scoring, dengan nilai dugaan awal dari metode
OLS, maka model regresi yang diperoleh dengan menggunakan metode MLE diberikan sebagai
berikut :
๐ฆ๐โ = โ0.4339 โ 0.3836๐1๐ + 0.0754๐2๐ โ 1. 5450๐3๐ โ 1. 1092๐4๐ โ 1.2081๐5๐
โ 0.2996๐6๐ + 0.2942๐7๐ โ 0.2694๐8๐
4.3.3 Pendugaan Parameter Regresi dengan Metode Ridge
Langkah awal dalam proses estimasi menggunakan metode ridge dilakukan dengan pemilihan
nilai konstanta ridge (๐). Terdapat beragam metode yang telah dikemukakan peneliti sebelumnya
dalam pemilihan nilai tetapan k. Penduga parameter ๏ฟฝฬ๏ฟฝ๐ ๐ dapat diperoleh dengan mengunakan
rumus berikut:
๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐พ๐ฟ + ๐๐ฐ)โ1๐ฟ๐ก๐พ๐ฟ๏ฟฝฬ๏ฟฝ๐๐ฟ
Untuk mendapatkan ๏ฟฝฬ๏ฟฝ๐ ๐ , maka harus ditentukan parameter ridge (๐). Dalam hal ini digunakan
๐ = ๐๐๐ฅ (1
๐๐)
dengan ๐๐ =๐๐๐๐ฅ
(๐โ๐)๏ฟฝฬ๏ฟฝ2+๐๐๐๐ฅ๏ฟฝฬ๏ฟฝ๐2, dan ๐๐๐๐ฅ adalah nilai eigen maksimum dari ๐ฟ๐ก๐พ๐ฟ, ๏ฟฝฬ๏ฟฝ๐
2
didefinisikan sebagai elemen ke-๐ dari ๐ธ๏ฟฝฬ๏ฟฝ๐๐ฟ yang merupakan vektor eigen sedemikian sehingga
๐ฟ๐๐พ๐ฟ = ๐ธ๐กษ ๐ธ, dengan ษ yang merupakan matriks diagonal dengan elemen diagonal berupa ๐๐
dan ๏ฟฝฬ๏ฟฝ2 merupakan jumlah kuadrat sisa dibagi derajat bebas. Adapun persamaannya dapat
dituliskan sebagai berikut :
๏ฟฝฬ๏ฟฝ2 =โ (โโ2(๐ฆ๐ log ๏ฟฝฬ๏ฟฝ๐+(1โ๐ฆ๐) log(1โ๏ฟฝฬ๏ฟฝ๐)))
2๐๐=1
๐โ๐โ1
Pemilihan koefisien ridge untuk model regresi probit dilakukan dengan memilih nilai ๐
yang paling optimal, dimana ๐ menjadi optimal saat nilai jumlah kuadrat sisa (๏ฟฝฬ๏ฟฝ2) besar, sehingga
harus di pilih nilai ๐ terkecil. Adapun nilai ๐ diperoleh sebagai berikut:
๐ =
[ โ11.15290.40190.60130.70611.41130.41941.02731.15930.5896 ]
maka diperoleh ๐ = ๐๐๐ฅ (1
๐๐) = 2.4879
Untuk mengetahui model terbaik dari metode pendugaan parameter yang dugunakan,
dilakukan perbandingan nilai MSE masing-masing metode. Adapun perbandingan nilai MSE dan
๐น๐ tiap metode dapat dilihat pada Tabel 4.3 berikut :
Tabel 4. 3 Perbandingan nilai MSE dan ๐น๐ tiap metode pendugaan parameter
No Metode Nilai MSE Nilai ๐ 2
1 OLS 10.19 36.62 %
2 MLE 4.5108 46.16%
3 Ridge 0.3672 63.45%
Sumber : Data diolah, 2019
Berdasarkan perbandingan nilai MSE pada Tabel 4.3, diperoleh nilai MSE terkecil terdapat
pada penduga metode ridge yakni sebesar 0.3672, sehingga dapat disimpulkan bahwa metode
penduga parameter terbaik untuk penduga parameter data kemiskinan di tiap Kabupaten/Kota di
Sulawesi Selatan adalah penduga dengan menggunakan metode ridge. Model regresi probit
dengan metode ridge untuk kasus kemiskinan di tiap Kabupaten/Kota di Sulawesi Selatan dapat
dibentuk sebagai berikut :
๐ฆ๐โ = โ0.1674 โ 0.078๐1๐ + 0.0779๐2๐ โ 0.2265๐3๐ + 0.181๐4๐ โ 0.01263๐5๐ โ 0.0528๐6๐
+ 0.0046๐7๐ โ 0.1729๐8๐
dengan ๐ฆ๐โ merupakan variabel laten sedemikian sehingga ๏ฟฝฬ๏ฟฝ๐ = {
1, ๐๐๐๐ ๐ฆ๐โ > 0
0, ๐๐๐๐ ๐ฆ๐โ โค 0
4.3.4 Uji Multikolinieritas Parameter Ridge
Untuk mengetahui apakah multikolinieritas antar variabel prediktor telah teratasi, maka
dilakukan uji multikolinieritas kembali setelah penambahan parameter ridge. Nilai VIF setelah
penambahan konstanta bias (๐), dengan ๐ฒ = ๐๐ฐ, maka diperoleh:
๐๐ผ๐น = ๐๐๐๐ (1
๐ โ 1(๐ฟ๐ก๐ฟ) โ ๐ฒ)
โ1
(1
๐ โ 1(๐ฟ๐ก๐ฟ)) (
1
๐ โ 1(๐ฟ๐ก๐ฟ) โ ๐ฒ)
โ1
Perhitungan yang dilakukan menghasilkan VIF dan TOL yang sangat kecil, dapat dilihat pada
Tabel 4.4 berikut:
Tabel 4. 4 Nilai VIF dan TOL setelah penambahan parameter ridge
Variabel VIF TOL Keterangan
X1 0.5664 1.7655 Tidak Multikolinearitas
X2 0.6885 1.4524 Tidak Multikolinearitas
X3 0.5550 1.8018 Tidak Multikolinearitas
X4 0.6745 1.4825 Tidak Multikolinearitas
X5 0.5909 1.6923 Tidak Multikolinearitas
X6 0.6317 1.5830 Tidak Multikolinearitas
X7 0.6872 1.4552 Tidak Multikolinearitas
X8 0.5794 1.7259 Tidak Multikolinearitas
Sumber : Data diolah, 2019
Tabel 4.4 menunjukkan nilai VIF setelah penambahan ๐, sehingga dapat diketahui bahwa
dengan menggunakan parameter ridge sebesar ๐ = 2.4879 multikolinieritas pada data
kemiskinan di tiap Kabupaten/Kota di Provinsi Sulawesi Selatan tahun 2017 dapat teratasi dengan
baik menggunakan model regresi probit.
4.3.5 Analisis Hasil
Ketepatan model yang diperoleh dapat diketahui dengan melakukan perbandingan antara
data asli dengan hasil pendugaan. Adapun pendugaan dari nilai ๏ฟฝฬ๏ฟฝ๐โ dan ๏ฟฝฬ๏ฟฝ๐ beserta keterangan hasil
pendugaa disajikan dalam Tabel 4.5 berikut:
Tabel 4. 5 Hasil pengkategorian nilai ๐
No Kabupaten/Kota ๐ฆ๐ ๏ฟฝฬ๏ฟฝ ๏ฟฝฬ๏ฟฝ๐โ ๏ฟฝฬ๏ฟฝ๐ Keterangan
1 Selayar 1 0.6231 0.3137 1 Sesuai
2 Bulukumba 0 0.3171 -0.4759 0 Sesuai
3 Bantaeng 0 0.1424 -0.1824 0 Sesuai
4 Jeneponto 1 0.4778 -0.0557 0 Tidak Sesuai
5 Takalar 0 0.3341 -0.4287 0 Sesuai
6 Gowa 0 0.2884 -0.5582 0 Sesuai
7 Sinjai 0 0.3258 -0.4516 0 Sesuai
8 Maros 1 0.3864 -0.2886 0 Tidak Sesuai
9 Pangkajene
Kepulauan 1 0.3133 -0.4866 0 Tidak Sesuai
10 Barru 0 0.3410 -0.4096 0 Sesuai
11 Bone 0 0.5480 0.1205 1 Tidak Sesuai
12 Soppeng 0 0.5504 0.1267 1 Tidak Sesuai
13 Wajo 0 0.3165 -0.4774 0 Sesuai
14 Sidrap 0 0.2649 -0.6284 0 Sesuai
15 Pinrang 0 0.3024 -0.5175 0 Sesuai
16 Enrekang 1 0.7653 0.7233 1 Sesuai
17 Luwu 1 0.6267 0.3230 1 Sesuai
18 Tana Toraja 1 0.6101 0.2796 1 Sesuai
19 Luwu Utara 1 0.5941 0.2381 1 Sesuai
20 Luwu Timur 0 0.6532 0.3941 1 Tidak Sesuai
21 Toraja utara 1 0.6013 0.2566 1 Sesuai
22 Makassar 0 0.2122 -0.7988 0 Sesuai
23 Pare-Pare 0 0.2230 -0.7622 0 Sesuai
24 Palopo 0 0.2626 -0.6354 0 Sesuai
Sumber : Data diolah, 2019
Tabel 4.5 menunjukkan hasil pendugaan parameter model dengan nilai ๏ฟฝฬ๏ฟฝ๐โ yaitu nilai variabel
respon (nilai HCI) dugaan, nilai ๏ฟฝฬ๏ฟฝ menyatakan kecenderungan suatu kabupaten atau kota
tergolong kabupaten/kota yang miskin atau tidak miskin dan nilai ๏ฟฝฬ๏ฟฝ๐ adalah hasil mengkaterorian
nilai HCI dugaan.
Dengan melihat hasil pendugaan dari model regresi probit yang diperoleh terlihat bahwa
terdapat enam kabupaten/kota yang tidak sesuai dengan model, atau hanya 18 (75%) dari 24
kabupaten/kota di Provinsi Sulawesi Selatan yang bersesuaian dengan model. Adapun enam
kabupaten/kota yang tidak sesuai dengan nilai ๏ฟฝฬ๏ฟฝ๐โ dari model yang diperoleh, yakni:
1. Kabupaten Jeneponto, berdasarkan BPS dikategorikan kapubaten/kota yang miskin tetapi
berdasarkan nilai ๏ฟฝฬ๏ฟฝ๐โ dikategorikan kabupaten/kota yang tidak miskin.
2. Kabupaten Maros, berdasarkan BPS dikategorikan kapubaten/kota yang miskin tetapi
berdasarkan nilai ๏ฟฝฬ๏ฟฝ๐โ dikategorikan kabupaten/kota yang tidak miskin.
3. Kabupaten Pangkajene Kepulauan, berdasarkan BPS dikategorikan kapubaten/kota yang
miskin tetapi berdasarkan nilai ๏ฟฝฬ๏ฟฝ๐โ dikategorikan kabupaten/kota yang tidak miskin.
4. Kabupaten Bone, berdasarkan BPS dikategorikan kapubaten/kota yang tidak miskin tetapi
berdasarkan nilai ๏ฟฝฬ๏ฟฝ๐โ dikategorikan kabupaten/kota yang miskin.
5. Kabupaten Soppeng, berdasarkan BPS dikategorikan kapubaten/kota yang tidak miskin
tetapi berdasarkan nilai ๏ฟฝฬ๏ฟฝ๐โ dikategorikan kabupaten/kota yang miskin.
6. Kabupaten Luwu Timur, berdasarkan BPS dikategorikan kapubaten/kota yang tidak miskin
tetapi berdasarkan nilai ๏ฟฝฬ๏ฟฝ๐โ dikategorikan kabupaten/kota yang miskin
5 Kesimpulan Berdasarkan analisis data dan pembahasan hasil penelitian, maka dapat ditarik kesimpulan
sebagai berikut:
1. Masalah multikolinieritas pada model regresi prrobit dapat diatasi dengan menggunakan
metode ridge. Penduga parameter model regresi probit dengan metode ridge diperoleh
dengan menggunakan penduga maximum likelihood dengan persamaan sebagai berikut:
๏ฟฝฬ๏ฟฝ๐๐ฟ = (๐ฟ๐ก๏ฟฝฬ๏ฟฝ๐ฟ)โ1
๐ฟ๐ก๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ
selanjutnya diperoleh penduga metode ridge yang melibatkan penambahan satu konstanta
(๐) pada setiap elemen diagonal matriks ๐ฟ๐ก๐พ๐ฟ, menghasilkan penduga dengan persamaan
sebagai berikut :
๏ฟฝฬ๏ฟฝ๐ ๐ = (๐ฟ๐ก๐พ๐ฟ + ๐ฒ)โ1๐ฟ๐ก๐พ๐ฟ๏ฟฝฬ๏ฟฝ๐๐ฟ
2. Model regresi probit yang terbentuk untuk kasus data kemiskinan di tiap Kabupaten/Kota di
Provinsi Sulawesi Selatan tahun 2017 menggunakan penduga ridge adalah sebaga berikut :
๐ฆ๐โ = โ0.1674 โ 0.078๐1๐ + 0.0779๐2๐ โ 0.2265๐3๐ + 0.181๐4๐ โ 0.01263๐5๐
โ 0.0528๐6๐ + 0.0046๐7๐ โ 0.1729๐8๐
dengan melihat nilai ๏ฟฝฬ๏ฟฝ๐โ, yaitu nilai variabel respon (nilai HCI) dugaan yang diperoleh,
terdapat enam kabupaten/kota yang tidak sesuai dengan model, yakni berdasarkan Badan
Pusat Statistik dikategorikan kapubaten/kota miskin tetapi berdasarkan nilai ๏ฟฝฬ๏ฟฝ๐โdikategorikan
sebagai kabupaten/kota yang tidak miskin, begitupun sebaliknya.
Daftar Pustaka [1] Aziz, A. 2010. Ekonometrika Teori & Praktik Eksperimen dengan MATLAB. Malang: UIN-
Maliki Press.
[2] Agresti, A. 2002. Categorical Data Analysis. New York: John Wiley and Sons.
[3] Badan Pusat Statistik. Publikasi: Data dan Informasi Kemiskinan Kabupaten/Kota Tahun
2017. (http://bps.go.id/Publikasi/). Diakses pada tanggal 10 Oktober 2018.
[4] Candra, Y. 2009. Pembentukan Model Probit Bivariat. Semarang: Universitas Diponegoro.
[5] Djalal, N. 2004. Teknik Pengambilan Keputusan. Jakarta: Gasindo.
[6] Draper, N. dan Smith, H. 1992. Analisis Regresi Terapan. Jakarta: PT. Gramedia Pustaka
Umum.
[7] Gujarati, D.N. 2006. Dasar-dasar Ekonometrika. (terj. Eugenia Mardanugraha, Sita
Wardhani, dan Carlos Mangunsong). Jakarta: Salemba Empat.
[8] Hasan, I. 2002. Pokok-pokok Materi Statistik 2 (Statistik Inferensif). Jakarta: Bumi Aksara.
[9] Hasriana. 2016. Pemodelan Kemiskinan Menggunakan Geographically Weighted Logistic
Regression Dengan Fungsi Pembobot Fixed Kernel. Makassar: Universitas Hasanuddin.
[10] Hoerl, A.E. dan Kennard, R.W. 1970. Ridge Regression: Biased Estimation For
Nonorthogonal Problems. Technometrics, 12: 55-67.
[11] Hosmer, D.W. dan Lemeshow, S. 2000. Applied Logistic Regression 2nd Edition. New
York: John Willey and Sons.
[12] Kibria, B.M.G. dan Saleh, A.K.Md.E. 2012. Improving the Estimators of the Parameters of
a Probit Regression Model: A Ridge Regression Approach. Journal of Statistical Planning
and Inference, 142: 1421-1435.
[13] Locking, H., Mansson, K., dan Shukur, G. 2011. Performance of Some Ridge Parameters
for Probit Regression: with Application on Swedish Job Search Data. Journal of
Computational Econometrics, 40: 415-433.
[14] McCullagh, P. dan Nelder, J.A. 1989. Generalized Linear Models. Second Edition. London
New York: Chapman and Hall.
[15] Muliati, A. 2018. Pendugaan Parameter Model Regresi Logistik dengan Metode Ridge.
Makassar: Universitas Hasanuddin.
[16] Myers, R.H. 1990. Classical And Modern Regression With Applications. Boston: PWS-
KENT Publishing Company.
[17] Sembiring, R.K. 1995. Analisis Regresi. Bandung: ITB.
[18] Setiawan dan Kusrini, D.E. 2010. Ekonometrika. Yogyakarta: Andi.
[19] Sunyoto. 2009. Regresi Logistik Ridge: Pada Keberhasilan Siswa SMA Negeri 1 Kediri
Diterima di Perguruan Tinggi Negeri. Surabaya: Institut Teknolni Sepuluh Nopember.
[20] Supranto, J. 2005. Ekonometri. Bogor: Ghalia Indonesia.
[21] Supranto, M.A. 1986. Pengantar Probabilita Dan Statistik Induk. Jakarta: Erlangga.
[22] Wasilaine, T.L., Talakua, M.W., dan Lesnussa, Y.A. 2014. Model Regresi Ridge untuk
Mengatasi Model Regresi Linier Berganda Yang Mengandung Multikolinearitas. Barekeng,
8(1), 31-37.
[23] Widhiarso, W. 2012. Berkenalan dengan Regresi Probit. Yogyakarta: Universitas Gadjah
Mada.
[24] Yitnosumarto. 1990. Dasar-Dasar Statistika. Jakarta: Rajawali.
[25] Young, B. 2003. Penaksir Maksimum Likelihood Bagi Model Probit Dan Model Probit
Bivariat. Bandung: Universitas Katolik Parahyangan.