regr. logistik

21
LAPORAN PRAKTIKUM BIOSTATISTIKA REGRESI LOGISTIK Oleh: Nama : Firli Rahmah P. D NIM : 0810910009 Tanggal : 09 November 2010 Asisten :1. Dewi Susanawati 2. Yusrina Nur Dianati LABORATORIUM KOMPUTER JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS BRAWIJAYA MALANG 2010

Upload: firly-cinnamons

Post on 26-Jun-2015

407 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: regR. LogistIk

LAPORAN PRAKTIKUM BIOSTATISTIKA

REGRESI LOGISTIK

Oleh:Nama : Firli Rahmah P. DNIM : 0810910009Tanggal : 09 November 2010Asisten :1. Dewi Susanawati

2. Yusrina Nur Dianati

LABORATORIUM KOMPUTERJURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMUNIVERSITAS BRAWIJAYA

MALANG2010

Page 2: regR. LogistIk
Page 3: regR. LogistIk

BAB IPENDAHULUAN

1.1 Latar BelakangAnalisa regresi merupakan salah satu uji statistika yang

memiliki dua jenis pilihan model yaitu linear dan non linear dalam parameternya. Model linear memiliki dua sifat yaitu regresi sederhana dan regresi berganda dengan kurva yang dihasilkan membentuk garis lurus, sedangkan untuk model non linear dalam parameternya bersifat kuadratik dan kubik dengan kurva yang dihasillkan membentuk garis lengkung. Regresi logistik dapat dibedakan menjadi 2, yaitu: Binary Logistic Regression (Regresi Logistik Biner) dan Multinomial Logistic Regression (Regresi Logistik Multinomial). Regresi Logistik biner digunakan ketika hanya ada 2 kemungkinan variabel respon (Y), misal membeli dan tidak membeli. Sedangkan Regresi Logistik Multinomial digunakan ketika pada variabel respon (Y) terdapat lebih dari 2 kategorisasi. Karena pentingnya pemahaman tentang regresi logistik inilah sehingga praktikum ini penting untuk diadakan.

1.2 Tujuan Tujuan Umum

- Mampu melakukan pendugaan parameter pada model regresi logistik dan menginterpretasikannya.

Tujuan Khusus - Dapat menghitung penduga parameter regresi logistik - Menginterpretasikan model regresi logistik.

Page 4: regR. LogistIk

BAB IITINJAUAN PUSTAKA

Model linear memiliki dua sifat yaitu regresi sederhana dan regresi berganda dengan kurva yang dihasilkan membentuk garis lurus, sedangkan untuk model non linear dalam parameternya bersifat kuadratik dan kubik dengan kurva yang dihasillkan membentuk garis lengkung. Secara empiris, persamaan-persamaan matematis tertentu yang sering digunakan di antaranya adalah (Fowler, 1990) :

(a). Persamaan ‘garis lurus’ (linier): y = ax+b(b). Persamaan parabolis (kuadratis): y=px2+qx+r(c). Persamaan polinomial (secara umum):

Y=c1+c2x+ c3 x2+…+ckxk-1+…+ cnxn-1

(d). Persamaan eksponensial: y=aebx2+cx+d

(e). Persamaan asimptotis: y= ax 2 +bx cx+d

Regresi Logistik (Logistic Regression) Bila regresi dengan variabel bebas (X) berupa variabel dummy,  maka dikatagorikan sebagai regresi dummy. Regresi logistik digunakan jika variabel terikatnya (Y) berupa variabel masuk katagori klasifikasi. Misalnya, variabel Y berupa dua respon yakni gagal (dilambangkan dengan nilai 0) dan berhasil (dilambangkan dengan nilai 1). Kondisi demikian juga sering dikatagorikan sebagai regresi dengan respon biner. Seperti pada analisis regresi berganda, untuk regresi logistik variabel bebas (X) bisa juga terdiri lebih dari satu variabel. Sebagai contoh yaitu terdapat kasus: ingin diketahui apakah konsumen akan membeli makanan di rumah makan berdasarkan penilaian konsumen terhadap lokasi, pelayanan, pendapatan, kebersihan selera dan harga. Dalam kasus ini hanya ada 2 kemungkinan respon konsumen, yaitu konsumen membeli dan tidak membeli. Dari contoh kasus tersebut, dapat diketahui bahwa tipe data variabel respon (Y) adalah nominal, yaitu kategorisasi keputusan konsumen apakah membeli atau tidak (misal membeli dilambangkan angka 1, sedangkan tidak membeli dengan angka 0), sedangkan tipe data untuk variabel bebas (X) setidak-tidaknya interval (skala likert). Bila metode regresi linier biasa diterapkan pada kasus semacam ini, akan terdapat 2 pelanggaran asumsi Gauss-Markov dan 1 buah pelanggaran terhadap batasan dari nilai duga (fitted value) dari variabel respon (Y), yaitu: (Kutner dkk, 2004)

1. Error dari model regresi yang didapat tidak menyebar normal.

Page 5: regR. LogistIk

2. Ragam (variance) dari error tidak homogen (terjadi heteroskedastisitas pada ragam error).

3. Sedangkan, pelanggaran bagi batasan nilai duga Y (fitted value) adalah bahwa nilai duga yang dihasilkan dari model regresi linier biasa melebihi rentang antara 0 s.d. 1. Hal ini jelas tidak masuk akal , karena batasan nilai pada variabel Y (dalam kasus ini adalah membeli=1 dan tidak membeli=0). Bayangkan jika Anda mendapatkan nilai duga Y = 4 saat Anda memasukkan suatu nilai X tertentu. What does it mean? It is no longer interpretable, guys.Untuk mengatasi masalah ini, diperkenalkan metode Regresi

Logistik. Sebagaimana metode regresi biasa, regresi logistik dapat dibedakan menjadi 2, yaitu: Binary Logistic Regression (Regresi Logistik Biner) dan Multinomial Logistic Regression (Regresi Logistik Multinomial). Regresi Logistik biner digunakan ketika hanya ada 2 kemungkinan variabel respon (Y), misal membeli dan tidak membeli. Sedangkan Regresi Logistik Multinomial digunakan ketika pada variabel respon (Y) terdapat lebih dari 2 kategorisasi.

Model Logistik memiliki bentuk fungsi seperti pada persamaan (1) dan (2). Untuk memudahkan interpretasi, maka model logistik ditransformasi menjadi bentuk fungsi logit, seperti pada persamaan (3). Nilai duga regresi logistik (Y duga) merupakan nilai peluang. Lebih tepatnya berapakah peluang seorang konsumen akan membeli makanan di warung/rumah makan tersebut berdasarkan penilaiannya pada variabel lokasi, pelayanan, pendapatan, kebersihan, selera dan harga. Rentang nilai duga yang dihasilkan akan berkisar antara 0 s.d. 1. (Kita ingat bahwa kisaran atau rentang nilai peluang adalah 0 s.d 1). Regresi logistik tidak terbatas hanya dapat diterapkan pada kasus dimana variabel X nya bertipe interval atau rasio saja.  Tapi regresi logistik juga bisa diterapkan untuk kasus dimana variabel X nya bertipe data nominal atau ordinal (Steel, 1993).

Regresi Logistik merupakan salah satu metode klasifikasi yang sering digunakan. Regresi Logistik Biner digunakan saat variabel dependen merupakan variabel dikotomus (kategorik dengan 2 macam kagegori), sedangkan Regresi Logistik Multinomial digunakan saat variabel dependen adalah variabel kategorik dengan lebih dari 2 kategori. Regresi Logistik tidak memodelkan secara langsung variabel dependen (Y) dengan variabel independen (X), melainkan melalui transformasi variabel dependen ke variabel logit yang merupakan

Page 6: regR. LogistIk

natural log dari odds rasio (Fractal, 2003). Model regresi logistik multivariate dengan k variabel prediktor dinyatakan:

(2.3)

dengan

Salah satu cara untuk mengestimasi parameter regresi logistik adalah dengan menggunakan metode maximum likelihood. Metode ini memperoleh dugaan maksimum likelihood bagi β dengan iterasi Newton Raphson. Estimasi maksimum likelihood merupakan pendekatan dari estimasi Weighted Least Square, dimana matrik pembobotnya berubah setiap putaran. Proses menghitung estimasi maksimum likelihood ini disebut juga sebagai Iteratif Reweighted Least Square(Hosmer dan Lemeshow, 1989).

Evaluasi fungsi klasifikasi (fungsi logistik) dilakukan dengan cara yang sama seperti pada analisis diskriminan. Yaitu terlebih dahulu dibuat tabulasi antara actual group dan predicted group ynag diperoleh dari fungsi logistik. Selanjutnya dihitung proporsi pengamatan yang salah diklasifikasikan. Diharapkan proporsi pengamatan yang salah diklasifikasikan tersebut bisa sekecil mungkin. Pemilihan antara kedua metode tersebut biasanya tergantung pada asumsi yang diperlukan oleh kedua metode tersebut. Analisis diskriminan mengasumsikan data berdistribusi multivariate normal, sedangkan regresi logistik tidak mengasumsikan data harus berdistribusi tertentu. Pelanggaran asumsi multivariate normal pada analisis diskriminan biasanya menghasilkan tingkat ketepatan klasifikasi yang rendah. Namun ada peneliti yang menganjurkan tetap menggunakan analisis diskriminan meskipun ada pelanggaran asumsi, dengan catatan tidak ada data yang outlier (Meshbane, 1996).

g ( x )=β0+β1 x1+…. βk xk

g(x) = ln

( π ( x)1−π (x ))

Page 7: regR. LogistIk

BAB IIMETODOLOGI

2.1. Waktu dan TempatPraktikum dengan judul ‘Regresi Logistik’ ini

dilaksanakan pada hari Selasa, 09 November 2010 di laboratorium Komputer Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Brawijaya, Malang 2.2 Langkah-langkah Penggunaan MINITAB

1. Memasukkan data ke dalam worksheet2. Klik Stat > Regression > Binary Logistik regression,

maka akan muncul kotak sebagai berikut:

3. Isilah dialog box sesuai variabel Klik Ok4. Diinterpretasikan

Page 8: regR. LogistIk

BAB IIIHASIL DAN PEMBAHASAN

Permasalahan 1Praktikum Fisiologi tumbuhan Jurusan Biologi, FMIPA,

UB dengan judul “Pengaruh Hormon Auksin Terhadap Pembentukan Akar Adventif” dengan perlakuan yaitu pemberian hormon auksin dan tidak. Diketahui variabel respon Y bersifat nominal biner (bivariat) yaitu 1 (akar tumbuh banyak dan panjang) dan 0 (akar tidak tumbuh), dan variabel X bersifat nominal biner (bivariat) yaitu 1 (pemberian hormon auksin) dan 0 (tidak ada pemberian hormon auksin). Nilai-nilai frekuensi sebagai berikut:

X1 X2 y Frekuensi

1 1 1 141 1 0 81 0 1 121 0 0 100 1 1 80 1 0 90 0 1 110 0 0 7

Ho: tidak ada hubungan antara pemberian hormon auksin terhadap jumlah akarH1: terdapat hubungan antara pemberian hormon auksin terhadap jumlah akar

Page 9: regR. LogistIk

Hasil dan Pembahasan Masalah dengan Program MinitabBinary Logistic Regression: y versus X1; X2

Link Function: Normit

Response Information

Variable Value County 1 45 (Event) 0 34 Total 79Frequency: Frekuensi

Logistic Regression Table Predictor Coef SE Coef Z PConstant 0,1217 0,2532 0,48 0,631X1 0,1225 0,2855 0,43 0,668X2 -0,0287 0,2839 -0,10 0,919

Log-Likelihood = -53,893Test that all slopes are zero: G = 0,194; DF = 2; P-Value = 0,908

Goodness-of-Fit Tests

Method Chi-Square DF PPearson 1,062 1 0,303Deviance 1,064 1 0,302Hosmer-Lemeshow 1,062 2 0,588

Table of Observed and Expected Frequencies:(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)

GroupValue 1 2 3 4 Total1 Obs 8 11 14 12 45 Exp 9,1 9,9 12,9 13,1 0 Obs 9 7 8 10 34 Exp 7,9 8,1 9,1 8,9

Total 17 18 22 22 79

Page 10: regR. LogistIk

Measures of Association:(Between the Response Variable and Predicted Probabilities)

Pairs Number Percent Summary MeasuresConcordant 611 39,9% Somers' D 0,05Discordant 538 35,2% Goodman-Kruskal Gamma 0,06Ties 381 24,9% Kendall's Tau-a 0,02Total 1530 100,0%

Berdasarkan pada hasil perhitungan dengan menggunakan program minitab didapatkan hasil yaitu: pada count of variabel y = 45 (Event) artinya sukses regresi logistik (kategori akar menjadi tumbuh panjang = 1) atau merupakan hasil dari penjumlahn 14+12+8+11 = 45.

Page 11: regR. LogistIk
Page 12: regR. LogistIk

Permasalahan 2Praktikum Biologi umum yang dilaksanakan oleh mahasiswa Biologi ingin mengetahui tentang pengaruh pemberian NaCl dengan konsentrasi x= 0, 25, 50, 75 terhadap pertumbuhan biji kacang hijau (Phaseolus radiatus) (y=1 berarti biji tumbuh, y=0 berarti tidak tumbuh). Hasil pengamatan adalah sebagai berikut:

x y ∑1 0

0 8 2 1025 6 4 1050 5 5 1075 9 1 10∑ 28 12 40

Hipotesis:H0 : tidak ada hubungan antara pemberian NaCl dengan jumlah biji kacang hijau yang tumbuhH1 : terdapat hubungan antara pemberian NaCl dengan jumlah biji kacang hijau yang tumbuh

Output dari Minitab:

Link Function: Normit

Response Information

Variable Value CountY2 1 28 (Event) 0 12 Total 40Frequency: frekuensi2

Logistic Regression Table Predictor Coef SE Coef Z PConstant 0,4350 0,3448 1,26 0,207X 0,002422 0,007469 0,32 0,746

Log-Likelihood = -24,384Test that all slopes are zero: G = 0,100; DF = 1; P-Value = 0,752

Goodness-of-Fit Tests

Page 13: regR. LogistIk

Method Chi-Square DF PPearson 4,775 2 0,092Deviance 4,936 2 0,085Hosmer-Lemeshow 4,775 2 0,092

Table of Observed and Expected Frequencies:(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)

GroupValue 1 2 3 4 Total1 Obs 8 6 5 9 28 Exp 6,7 6,9 7,1 7,3 0 Obs 2 4 5 1 12 Exp 3,3 3,1 2,9 2,7

Total 10 10 10 10 40

Measures of Association:(Between the Response Variable and Predicted Probabilities)

Pairs Number Percent Summary MeasuresConcordant 141 42,0% Somers' D 0,06Discordant 121 36,0% Goodman-Kruskal Gamma 0,08Ties 74 22,0% Kendall's Tau-a 0,03Total 336 100,0%

Page 14: regR. LogistIk

BAB IVPENUTUP

Page 15: regR. LogistIk

4.1 KesimpulanRegresi Logistik (Logistic Regression) merupakan regresi

dengan variabel bebas (X) berupa variabel dummy,  maka dikatagorikan sebagai regresi dummy. Regresi logistik digunakan jika variabel terikatnya (Y) berupa variabel masuk katagori klasifikasi. Salah satu cara untuk mengestimasi parameter regresi logistik adalah dengan menggunakan metode maximum likelihood. 4.2 Saran

Diharapkan untuk praktikum selanjutnya semua fasilitas untuk praktikum dapat digunakan dengan baik (misalnya: computer yang rusak atau tidak dapat digunakan) sehingga setiap praktikan dapat menggunakan satu computer, tidak satu computer digunakan dua praktikan. Dengan demikian praktikum dapat berjalan dengan lancar.

Page 16: regR. LogistIk

DAFTAR PUSTAKA

Fowler, J. dan L. Cohen. 1990. Practical statistics for field biology. John Wiley & Sons. Chichester.

Hosmer, D.W. dan Lemeshow.1989. Applied Logistic Regression, John Wiley. New York,

Kutner, M.H., C.J. Nachtsheim dan J. Neter. Applied Linear Regression Models. Fourth Edition. The McGraw-Hill Companies, Inc. Singapore.

Meshbane, Alice, Morris, John D.1996. Predictive Discriminant Analysis Versus Logistic Regression in Two-Group Classification Problems, American Educational Research Paper.

Steel, R. G. D. dan J. H. Torrie. 1993. Prinsip dan Prosedur Statistika. PT. Gramedia Pustaka Utama. Jakarta.