pemilihan peubah bebas untuk data yang … · pemilihan peubah bebas untuk data yang mengandullg...

47
PEMILIHAN PEUBAH BEBAS UNTUK DATA YANG MENGANDUNG PENCILAN DENGAN MENGGUNAKAN KRITERIA Cp, RC p DAN RTp Olen: Harl11i Sugiarti 96140/STK PROGRAM PASCASARJANA INSTITUT PERT ANIAN BOGOR 1999

Upload: dangtruc

Post on 19-Mar-2019

223 views

Category:

Documents


0 download

TRANSCRIPT

PEMILIHAN PEUBAH BEBAS UNTUK DATA YANG MENGANDUNG PENCILAN

DENGAN MENGGUNAKAN KRITERIA Cp, RCp DAN RTp

Olen: Harl11i Sugiarti

96140/STK

PROGRAM PASCASARJANA INSTITUT PERT ANIAN BOGOR

1999

RINGKASAN

HARMI SUGIARTI. Pemilihan Peubah Bebas untuk Data yang Mengandullg Pendlan dengan Menggunakan Kriteria Cp, RCp dan RTp (di bawah bimbingan Dr.Ir. Ahmad Ansori Mattjik, M.Sc sebagai ketua dan Dr.Ir. Budi Susetyo, M.S sebagai anggota)

Adanya pengamatan pencilan (outlier) yaitu pengamatan dengan sisaan yang

cukup besar dalam himpunan data mempunyai pengaruh besar dalam pendugaan

koefisien regresi. Penggunaan kriteria Cp dalam memilih persamaan regresi terbaik tidak

memberikan rekomendasi yang konsisten tentang peubah bebas mana yang harus masuk

ke dalam model. Hal ini karena statistik Cp didasarkan pada metode kuadrat terkecil yang

sangat sensitif terhadap penyimpangan asumsi, khususnya adanya pencilan dalam

himpunan data. Sebagai alternatif digunakan kriteria RCp dan RTp, yang didasarkan pada

prosedur regresi robust dan metode yang digunakan adalah metode kuadrat terkecil dan

metode robust dengan penduga-M.

Data yang digunakan dalam tulisan ini merupakan data simulasi yang

dibangkitkan dengan bantuan MlNITAB verSl 11.12 termasuk dengan pengolahan

datanya.

Hasil analisis menunjukkan bahwa kriteria RCp dan RTp lebih konsisten dalam

rnemberikan rekornendasi tentang peubah bebas mana yang harus masuk ke dalarn model

dibanding kriteria Cpo Dalam hal tidak terdapat pencilan, ketiga statistik memberikan

hasil yang sarna.

PEMIUHAN PEUBAH BEBAS UNTUK DATA YANG MENGANDUNG PENCILAN

DENGAN MENGGUNAKAN KRITERIA Cp, RCp DAN RTp

Oleh: Harmi Sugiarti

9614Q/STK

Tesis sebagai salah satu syarat untuk memperoleh gelar

Magister Sains pada

Program Studi Statistika

PROGRAM PASCASARJ ANA INSTITUT PERT ANIAN BOGOR

1999

J udul Penelitian

Nama Mahasiswa

NomorPokok

Program Studi

c

PEMILIHAN PEUBAH BEBAS UNTUK DATA YANG MENGANDUNG PENCILAN DENGAN MENGGUNAKAN KRITERIA Cp , R-Cp DAN R- 7P

HARMI SUGIARTI

96140

STATISTIKA

Menyetujui:

I. Komisi Pembimbing,

Ii dvI ' ~t

Dr. Ir. HA Ansori Mattj ik, M. Sc Ketua

Dr. Ir. Budi Suset 0 MS Anggota

2. Ketua Program Studi Statistika 1d~~tur Program PascasaIjana,

Dr. Ir. Aunuddin

Tanggal Lulus: 5 Maret 1999

RIWAYAT HIDUP

Penulis lahir di Surabaya pada tanggal 11 Maret 1967, anal< pertama dari empat

bersaudara keluarga Bapak Taslim dan lbu Asiyam.

Pada tahun 1977 penulis menyelesaikan jenjang pendidikan Sekolah Dasar di

SD Negeri Banyuurip Surabaya dan menyelesaikan pendidikan Sekolah Menengah

Pertama di SMP Negeri 10 Surabaya pada tahun 1981. Jenjang pendidikan Sekolah

Menengah Atas ditempuh di SMA Negeri 11 Surabaya dan lulus pada tahun 1984.

Selanjutnya, penulis menyelesaikan pendidikan S-1 jurusan Statistika di Universitas

Terbuka pada tahun 1989 dan terdaftar sebagai mahasiswa Program Pascasarjana Institut

Pertanian Bogor pada program studi Statistika tahun 1996.

Pada tahun 1991 sampai sekarang, penulis menjadi staf pengajar di jurusan

Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Terbuka.

KATA PENGANTAR

Puji syukur kehadirat Tuhan YME atas berkat dan karuniaNya sehingga penuIis

dapat menyelesaikan tulisan ini, yang beIjudul Pemilihan Peubah Bebas untuk Data yang

Mengandung Pencilan dengan Menggunakan Kriteria Cp, RCp dan RTp . Tulisan ini

diharapkan dapat memberikan masukan tentang kriteria terbaik yang dapat digunakan

untuk mernilih peubab bebas jika dalam data terdapat pengamatan pencilan.

Pada kesempatan ini penulis ucapkan terima kasih kepada komisi pembimbing

yakni: Bapak Dr. Ir. Ahmad Ansori Mattjik, M.Sc selaku ketua dan Bapak Dr. Ir. Budi

Susetyo, MS selaku anggota, yang telah banyak membantu memberikan masukan dalam

menyelesaikan tulisan ini. Penulis ucapkan terima kasih juga kepada Bapak Dr. Ir.

Aunuddin selaku Ketua Program Studi Statistika, Program PascasaIjana Institut Pertanian

Bogor atas saran dan arahannya.

Penulis menyadari bahwa tulisan ini masih jauh dari sempurna, kritik dan saran

bagi kesempurnaannya sangat penulis harapkan.

Bogor, Maret 1999

Penulis

DAFTARISI

Halaman

KATAPENGANTAR

DAFTARISI

DAFTAR TABEL

DAFTAR GAMBAR

1. PENDAHULUAN .............................................................................. 1

1.1. Latar Belakang ........................................................................... 1

1.2. Perumusan Masalah ..................................................................... 3

1.3. Tujuan Penelitian ........................................................................ 3

2. TlNJAUANPUSTAKA ............... '" ............ '" ........ , .,. '" ....................... 4

2.1. Pemilihan Peubah Bebas ............................................................... .4

2.2. Pengamatan Pencilan dan Berpengaruh .............................................. .4

2.3. Statistik Cp-Mallows ..................................................................... 7

2.4. Statistik RCp (Robust-Cp) ............................................................... 8

2.5. StatistikRTp(Robust-Tp) .............................................................. 13

3. METODA ............................................................... '" .................... 15

4. HASILDANPEMBAHASAN ............................................................. 16

5. KESIMPULAN DAN SARAN ............................................................. 28

DAFTAR PUSTAKA

LAMPIRAN

DAFTAR TABEL

No. Teks Halaman

I. Nilai statistik Cp, RCp dan RTp ............................................................. 17

2. Nilai statistik Cp , RCp dan RT p untuk kasus 1 pencilan ................................. 18

3. Nilai statistik Cp , RCp dan RTp untuk kasus 2 pencilan ................................. 20

4. Nilai statistik Cp , RCp dan RTp untuk kasus 3 pencilan ................................. 22

5. Nilai statistik Cp , RCp dan RTp untuk kasus 4 pencilan ................................ .24

6. Nilai statistik Cp , RCp dan RT p untuk kasus 5 pencilan .: ......... : ..................... 26

No. Lampiran Halaman

1. Data hasil simulasi ............................................................................ 31

2. Nilai hii , t i , DFFITS i dan Di ............................................................. 32

3. Nilaihii, ti ,DFFITSi danDi untukkasus 1 pencilan ................................. 33

4. Penduga koefisien regresi untuk data tanpa pencilan .................................... 34

5. Penduga koefisien regresi untuk data dengan 4 pencilan ................................ 34

DAFTAR GAMBAR

No. Teks Halaman

1. Fungsi Huber ............................................. """"'"'''''''''''''''''''''' ..... 11

2. Fungsi PembobotHuber "'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''' ... 11

3. Plot antara Cp , RCp dan RT p terhadap p untuk data tanpa pencilan .................. 17

4. Plot antara Cp, RCp dan RTp terhadap p untuk data dengan 1 pencilan .............. 19

5. Plot antara Cp , RCp dan RT p terhadap p untuk data dengan 2 pencilan .............. 21

6. Plot antara Cp , RCp dan RT p terhadap p untuk data dengan 3 pencilan .............. 22

7. Plot antara Cp , RCp dan RTp terhadap p untuk data dengan 4 pencilan .............. 25

8. Plot antara Cp, RCp dan RT p terhadap p untuk data dengan 5 pencilan .............. 27

No. Lampiran Halaman

1. Plot antara X dan Y untuk data tanpa pencilan ............................................ 35

2. Plot sisaan untuk data tanpa pencilan ."".".""""."."."."."."."."."."."." .. 35

3. Plot antara X dan Y untuk data dengan 1 pencilan ....................................... 36

4. Plot sisaan untuk data dengan 1 pencilan ............ " .................................... 36

5. Plot antara X dan Y untuk data dengan 2 pencilan "."."""".".".""""""".". 3 7

6. Plot sisaan untuk data dengan 2 pencilan .......... " ................ " ............. " ..... 37

7. Plot antara X dan Y untuk data dengan 3 pencilan ....................... " .............. 38

8. Plot sisaan untuk data dengan 3 pencilan ... " ............................................. 38

1. PENDAHULUAN

1.1. Latar Belakang

Salah satu permasalahan penting dalam penerapan analisis regresi adalah memilih

himpunan peubah bebas (independent variables) yang akan digunakan dalam model. Ada

beberapa prosedur yang dapat digunakan dalam pemilihan peubah bebas, diantaranya

adalah prosedur semua kemungkinan regresi yang memuat peubah bebas potensial dan

memilih persamaan terbaik menurut kriteria Cp Mallows. Prosedur statistik ini dianggap

dapat mengkompromikan dua kriteria yaitu: model yang memuat sebanyak mungkin

peubah untuk mendapatkan nilai prediksi yang handal dan model yang memuat sedikit

mungkin peubah untuk menghindari biaya yang tinggi (Draper & Smith, 1981).

Masalah pemilihan peubah bebas sering dibahas dalam kondisi ideal. Model

regresi linear Y = X /3 + E , dimana Y dan X masing-masing merupakan peubah tak bebas

dan peubah bebas, diperlukan asumsi-asumsi vektor galat E adalah peubah acak yang

identik, bebas terhadap sesamanya dan menyebar menurut sebaran Normal (0, Icr2).

Adanya pengamatan pencilan (outlier) dalam data, yaitu pengamatan dengan sisaan yang

sangat besar dapat mengganggu terpenuhinya asumsi-asumsi tersebut. Jika pengamatan

pencilan yang ada merupakan pengamatan yang berpengaruh, maka tindakan membuang

atau menghilangkan pengamatan tersebut dapat mengakibatkan perubahan pada model.

Dalam hal terdapat penyimpangan terhadap asumsi idealnya, khususnya jika

terdapat pengamatan pencilan, permasalahannya adalah apakah penggunaan statistik Cp

ini masih dapat dianggap reliabel atau konsisten dalam merekomendasikan peubah­

peubah bebas yang harns dimasukkan ke dalam model, mengingat statistik ini didasarkan