zainal abidin

29
LAPORAN PRAKTIKUM METODE REGRESI Modul 2 ANALISIS REGRESI BERGANDA PADA DATA JUMLAH PENDUDUK MISKIN DAN FAKTOR- FAKTOR YANG MEMPENGARUHI DI INDONESIA PADA TAHUN 2013 Oleh : Miranda Ita Febrina 1314030024 Zainal Abidin 1314030068 Asisten Dosen : Mei Rizka Shovalina

Upload: zainibrahimy

Post on 06-Dec-2015

270 views

Category:

Documents


3 download

DESCRIPTION

modul 2 lapsem metreg

TRANSCRIPT

Page 1: zainal abidin

LAPORAN PRAKTIKUM

METODE REGRESI

Modul 2

ANALISIS REGRESI BERGANDA PADA DATA

JUMLAH PENDUDUK MISKIN DAN FAKTOR-

FAKTOR YANG MEMPENGARUHI DI

INDONESIA PADA TAHUN 2013

Oleh :

Miranda Ita Febrina

1314030024

Zainal Abidin

1314030068

Asisten Dosen :

Mei Rizka Shovalina

Program Studi Diploma III

Jurusan Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Teknologi Sepuluh Nopember

Surabaya

Page 2: zainal abidin

2015

Page 3: zainal abidin

ii

Page 4: zainal abidin

ABSTRAK

Penelitian yang menggunakan data populasi besar sangat sulit dilakukan. Untuk menyelesaikan masalah tersebut biasanya seorang peneliti menggunakan sebagian kecil dari populasi yakni sampel sebagai bahan untuk penelitian. Uji regresi linear berganda dilakukan menggunakan konsep hubungan antara variabel prediktor (x) yang jumlahnya lebih dari satu yaitu x1 dan x2 serta variabel respon (y). Analisis regresi linier berganda bertujuan untuk mengetahui korelasi, pengujian signifikansi parameter, dan koefisien determinasi dari variabel prediktor dan parameter tersebut terletak ada metode regresi. Dalam praktikum ini digunakan data sekunder yaitu jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun

2013. TAMBAHKAN LAGI YA NAL DARI KESIMPULAN DI BAB 5 Kata kunci : IIDN, Korelasi,Regresi Linear Berganda, Statistika Deskriptif,, Uji Parsial, Uji Serentak,

ii

Page 5: zainal abidin

DAFTAR ISI

HalamanHALAMAN JUDUL...............................................................................................i

ABSTRAK..............................................................................................................ii

DAFTAR ISI.........................................................................................................iii

DAFTAR TABEL...................................................................................................v

DAFTAR GAMBAR.............................................................................................vi

BAB I PENDAHULUAN

1.1 Latar Belakang....................................................................................1

1.2 Rumusan Masalah...............................................................................1

1.3 Tujuan Penelitian................................................................................2

1.4 Manfaat Penelitian..............................................................................2

1.5 Batasan Masalah.................................................................................3

BAB II TINJAUAN PUSTAKA

2.1 Karakteristik Data.................................................................................

2.2 Hubungan Antar Variabel.....................................................................

2.3 Regresi Linear Berganda.......................................................................

2.4 Uji Serentak..........................................................................................

2.5 Uji Parsial..............................................................................................

2.6 Pemeriksaan Asumsi IIDN...................................................................

2.7 Penduduk Miskin..................................................................................

BAB III METODOLOGI PENELITIAN

3.1 Sumber Data..........................................................................................

3.2 Variabel Penelitian................................................................................

3.3 Langkah Analisis Data..........................................................................

3.4 Diagram Alir.........................................................................................

BAB IV ANALISIS DATA DAN PEMBAHASAN

4.1 Karakteristik Data.................................................................................

4.2 Korelasi.................................................................................................

4.3 Analisis Regresi Linear Sederhana.......................................................

4.3.1 Model Analisis Regresi Linear Sederhana...................................

4.3.2 Pengujian Parameter Regresi secara Serentak.............................

Page 6: zainal abidin

4.3.3 Pengujian Parameter Regresi secara Parsial................................

4.4 Pemeriksaan Asumsi Residual..............................................................

4.4.1 Pemeriksaan Asumsi Residual Identik.........................................

4.4.2 Pemeriksaan Asumsi Residual Independen.................................

4.4.3 Pemeriksaan Asumsi Residual Berdistribusi Normal..................

BAB V KESIMPULAN

5.1 Kesimpulan...........................................................................................

5.2 Saran.....................................................................................................

DAFTAR PUSTAKA

LAMPIRAN

Page 7: zainal abidin

DAFTAR TABEL

Tabel 3.1 Variabel Penelitian....................................................................................

Page 8: zainal abidin

DAFTAR GAMBAR

Halaman

Gambar 3.1 Diagram Alir.....................................................................................11

Page 9: zainal abidin

DAFTAR LAMPIRAN

Page 10: zainal abidin

BAB IPENDAHULUAN

1.1 Latar Belakang

Analisis regresi linier berganda adalah analisis yang menggunakan konsep

hubungan antara variabel prediktor (x) yang jumlahnya lebih dari satu yaitu x1

dan x2 serta variabel respon (y). Analisis regresi linier berganda bertujuan untuk

mengetahui korelasi, pengujian signifikansi parameter, dan koefisien determinasi

dari variabel prediktor (x1,x2, …,, xn) serta parameter tersebut terletak pada suatu

model regresi.

Praktikum ini akan membahas apakah pengambilan sampel dari suatu

populasi sudah memenuhi regresi. Data yang digunakan dalam penelitian ini

adalah data sekunder yang diperoleh dari data website resmi Badan Pusat Statistik

tentang jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di

Indonesia pada tahun 2013.

Untuk menunjukkan bahwa sampel data yang diambil dari data jumlah

penduduk miskin dan faktor-faktor yang mempengaruhinya, dilakukan pengujian

regresi linear berganda. Data tersebut akan dianalisis menggunakan statistika

deskriptif, korelasi, metode regresi linier sederhana, dan asumsi residual IIDN.

1.2 Rumusan Masalah

Dari latar belakang di atas, dapat disimpulkan bahwa rumusan masalah

yang digunakan sebagai acuan untuk pengujian data adalah sebagai berikut.

1. Bagaimana hasil analisis statistika deskriptif tentang jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013?

2. Bagaimana hubungan antar variabel terhadap data jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013?

3. Bagaimana model regresi linear berganda terhadap data jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013?

4. Bagaimana hasil pemeriksaan asumsi IIDN terhadap data jumlah

penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada

tahun 2013?

1

Page 11: zainal abidin

1.3 Tujuan

Dari rumusan masalah di atas, dapat disimpulkan bahwa tujuan dari

praktikum ini adalah sebagai berikut.

1. Mengetahui hasil analisis statistika deskriptif tentang jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013

2. Mengetahui hubungan antar variabel terhadap data jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013

3. Mengetahui model regresi linear berganda terhadap data jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013

4. Mengetahui hasil pemeriksaan asumsi IIDN terhadap data jumlah

penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada

tahun 2013

1.4 Manfaat

Manfaat yang diperoleh dari percobaan ini adalah kita dapat mengetahui

apakah data yang digunakan sebagai penelitian merupakan data yang

memberikan gambaran tentang karakteristik data dan hubungan jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013.

Sehingga data yang diperoleh dapat dijadikan salah satu literatur bagi peneliti

yang ingin melakukan penelitian lebih lanjut.

1.5 Batasan Masalah

Batasan masalah yang dipakai pada praktikum kali ini adalah data yang

diperoleh berdasarkan survei Badan Pusat Statistik. Data yang digunakan yaitu

jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia

pada tahun 2013.

Page 12: zainal abidin

BAB II

TINJAUAN PUSTAKA

2.1 Karakteristik Data

Karakteristik Data adalah metode-metode yang berkaitan dengan

pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi

yang berguna (Walpole, 1996).

a. Rata-rata

Rata – rata (mean) adalah nilai rata-rata dari beberapa buah data. Nilai

mean dapat ditentukan dengan membagi jumlah data dengan banyaknya data.

Berdasarkan definisi dari mean adalah jumlah seluruh data dibagi dengan

banyaknya data.

Dengan kata lain jika kita memiliki n data sebagai berikut maka mean data

tersebut dapat kita rumuskan sebagai berikut.

x=∑i=1

n

x i

n (2.1)

keterangan :

x = rata-rata sampel

xi = data ke-i

n = banyaknya data

(Walpole,1996).

b. Varians

Varians adalah rata-rata kuadrat selisih dari semua nilai data terhadap rata-

rata hitung sebagai berikut.

Data sampel

s2=∑i=1

n

( xi−x )2

( n−1 ) (2.2)

keterangan :

S2 : Varians suatu data sampel

Page 13: zainal abidin

x i : titik tengah interval ke i

x : nilai rata – rata suatu data sample

μx : nilai rata – rata suatu data populasi

n : jumlah frekuensi

(Walpole,1996).

c. Median

Nilai tengah (median) adalah nilai yang terletak di tengah-tengah data

yang sudah terurut atau nilai yang hasilnya diperoleh dari 50% banyaknya data.

Nilai tengah dihitung menggunakan rumus sebagai berikut.

Data tunggal :

Me=x n+12 jika n ganjil (2.3)

Me=x n

2+x n

2+1

2 jika n genap (2.4)

d. Maksimum dan Minimum

Maksimum adalah nilai terbesar dari suatu data. Minimum adalah nila

terkecil dari suatu data (Walpole,1996).

2.2 Hubungan Antar Variabel

Menganalisis korelasi digunakan untuk mengetahui hubungan antara

kedua variabel yang terdapat pada model regresi. Nilai dari korelasi adalah antara

1 sampai -1, jika nilai korelasi yang dihasilkan 1 artinya terdapat hubungan yang

kuat (saling berkaitan) antara variabel x dan variabel y, sebaliknya jika nilai

korelasi yang dihasilkan adalah -1 artinya hubungan antara x dan y berkorelasi

rendah. Sedangkan jika nilai korelasi yang dihasilkan adalah 0 artinya tidak ada

korelasi antara variabel x dan variabel y. Dapat juga diartikan bahwa semakin

besar nilai dari variabel x, maka semakin besar pula nilai dari variabel y, demikian

pula sebaliknya. Untuk meencari nilai korelasi digunakan rumus sebagai berikut :

Page 14: zainal abidin

r=n∑

i

n

x i y i−(∑i

n

xi )(∑i

n

yi )

√ [n∑i

n

xi2−(∑

i

n

x i )2][ n∑

i

n

y i2−(∑

i

n

y i)2

(2.5)

Sedangkan langkah-langkah pengujian korelasi adalah sebagai berikut :

Hipotesis :

H0 : ρxy=0

(tidak ada korelasi antara variabel X dan Y)

H1 : ρxy≠0

(ada korelasi antara variabel X dan Y)

Daerah kritis : tolak H0 jika thit>t(α/2,df)

Persamaan koefisien korelasi adalah :

thit=r xy(√n−2

rxy2

(2.6)

Scatterplot merupakan penampilan secara visual dalam konsep hubungan

2 variabel yang disajikan dalam bentuk diagram. Sacatterplot digunakan untuk

menunjukkan pola korelasi antara nilai-nilai variabel y dengan nilai-nilai variabel

x. Jika plot berkumpul di sekitar garis, maka variabel x dan variabel y dikatakan

mempunyai korelasi yang erat. Sebaliknya, jika plot menyebar maka variabel x

dan variabel y dikatakan tidak mempunyai korelasi.

2.3 Regresi Linear Berganda

Dalam regresi linear berganda terdapat sejumlah peubah bebas yang

dihubungkan dengan Y linear atau berpangkat satu dalam semua peubah bebas.

Jika peubah bebas itu X1, X1 , .... Xk (k ≥ 2) maka bentuk umum regresi linear

ganda Y atas X1, X1 , .... Xk adalah :

Y=b0+b1 X1+b2 X2+. ..+bk X k+ε(2.7)

Dengan struktur data sebagai berikut :

Page 15: zainal abidin

x=[1 x11 x12 ⋯ xk 1

1 x12 x22 ⋯ xk 2

1 x13 x23 ⋯ xk 3

⋮ ⋮ ⋮ ⋱ ⋮1 x1 n x2 n ⋯ xkn

] ;

β=[β0

β1

⋮βk

] ;

Y=[Y 1

Y 2

⋮Y k

];

ε=[ ε1

ε2

⋮ε k

]Taksiran model regresi linear berganda :

Y=b0+b1 X1+b2 X2+. ..+bk X k(2.8)

Menghitung koefisien regresi linear melalui pendekatan matriks

b = (XT X)-1 XT Y = (b0

b1

⋮bk

) (2.9)

2.3 Uji Serentak

Statistik uji yang dipakai untuk melakukan uji serentak ini adalah uji F.

Uji F dikenal juga dengan uji Anova (Analysis Of Varians) yaitu uji untuk melihat

bagaimanakah pengaruh semua variabel prediktornya secara bersama-sama

terhadap variabel terikatnya atau untuk menguji apakah model regresi yang kita

buat baik (signifikan) atau tidak baik (non signifikan). Jika model signifikan maka

model bisa digunakan untuk peramalan, sebaliknya jika non signifikan maka

model regresi tidak bisa digunakan untuk peramalan. Uji serentak merupakan uji

terhadap nilai-nilai koefisien regresi secara bersama-sama dengan hipotesa

hipotesisnya sebagai berikut :

1. H0 : β1=β2=. ..=βk=0

H1 : β j 0, j = 1,2,…,k

2. Tentukan taraf nyata

3. Daerah kritik penerimaan

− f(∝2 )(

v1 , v2 ) ≤F0≤ f (∝2 )(v1 , v2 )

4. Daerah kritik penolakan

Page 16: zainal abidin

F0< − f(∝2 )(

v1 , v2 ) atau F0 > f (∝2 )(v1 , v2 )

5. Statistik Uji

f h itung=¿ (2.10)

6. Kesimpulan

fhitung ≤ fα(v1,v2), H0 gagal tolak

fhitung > fα(v1,v2), Ho ditolak

Uji F dapat dilakukan dengan membandingkan F hitung dengan F tabel,

jika F hitung > dari F tabel, maka Ho di tolak dan H1 diterima dengan kata lain

persamaaan garis regresi tersebut tidak bisa kita terima sebagai penduga

hubungan antara variabel X dengan variabel Y. Bila bentuk hubungan antar

variabel X dengan variabel Y sudah dapat kita terima maka kita bisa mengetahui

seberapa besar keeratan hubungannya (korelasinya).

2.4 Uji Parsial

Statistik uji yang dipakai untuk melakukan uji parsial ini adalah statistik

uji T. Uji T digunakan untuk menguji bagaimana pengaruh masing-masing

variabel bebasnya secara sendiri-sendiri terhadap variabel terikatnya. Jika hasil

pada uji serentak menunjukkan bahwa H0 ditolak, maka perlu dilakukan uji

individu dengan

1. Hipotesis :

H0: β = 0

H1: β ≠ 0 atau H1: β < 0 atau H1: β >0

2. Tentukan taraf nyata

3. Daerah kritik penerimaan :

−t(∝2 )

≤ t0 ≤ t(∝2 )

4. Daerah penolakan:

Page 17: zainal abidin

t0< −t

(∝2 ) atau t0 > t(∝2 )

5. Uji statistik

thitung =

( b−β1 )

se/√∑ ( X−X )2 atau thitung =

(a−β0 )

se(√ 1n+ x2

∑ ( xi− x )2 )(2.11)

keterangan:

a = taksiran bagi β0

b = taksiran bagi β1

t = nilai sebaran t

6. Keputusan:

H0 ditolak jika thitung > tα/2(n-2) atau thitung < - tα/2(n-2)

2.5 Pemeriksaan Asumsi IIDN

Pemeriksaan Asumsi Residual IIDN (Identik, Independen, Distribusi

Normal) merupakan uji yang harus dilakukan apakah data yang digunakan

memenuhi ketiga asumsi tersebut dalam melakukan pengujian (Sudjana, 1996).

2.4.1 Pemeriksaan Asumsi Residual Identik

Memeriksa residual identik dilakukan untuk melihat apakah residual

memenuhi asumsi identik.Pemeriksaan asumsi residual identik dapat dilihat pada

gambar Versus Fits yang menjelaskan bahwa data tersebut memiliki titik-titik

yang menyebar secara acak dan tidak membentuk pola tertentu, sehingga dapat

dikatakan bahwa variabel respon dan variabel prediktornya adalah memiliki

residual yang identik.

1. Uji visual (residual versus fits)

Uji visual adalah pengujian yang dilakukan dengan melihat gambar grafik

hasil perhitungan residual versus fits. Jika grafik tidak berpola maka residual

memenuhi asumsi sifat identik.

2. Uji Glejser

Page 18: zainal abidin

Uji Glejser adalah uji untuk mengetahui apakah sebuah model regresi memiliki

indikasi asumsi klasik sebagai prasyarat melakukan analisis regresi dengan cara

meregresi absolut residual (Laporanpenelitian, 2015).

Hipotesis : H0: residual identik

H1: residual tidak identik

Daerah penolakan : Tolak H0 jika Fhitung>F(p,n-p-1)

Statistik Uji :

Fhitung= ¿MSRMSE

¿¿ (2.12)

2.4.2 Pemeriksaan Asumsi Residual Independen

Pemeriksaan asumsi residual independen dapat dilihat pada gambar

Versus Fits yang didapatkan bahwa grafik dari data tersebut tidak memiliki pola

tertentu, hal ini dapat terlihat pada titik-titik grafik cenderung bersifat naik turun,

dalam hal ini tidak ada autokorelasi antar residual.

1. Uji visual (residual versus order)

Uji visual adalah pengujian yang dilakukan dengan melihat gambar grafik

hasil perhitungan residual versus order.Jika grafik tidak berpola, maka

residualnya memenuhi asumsi sifat independen.

2. Uji Durbin-Watson

Uji Durbin-Watson adalah pengujian yang dilakukan untuk mengetahui

adanya autokorelasi antar variabel.Jika hasil pengujian menunjukkan bahwa tidak

ada autokorelasi antar variabel maka data dikatakan memenuhi asumsi residual

independen. Berikut proses pengujian Durbin-Watson.

Hipotesis :

H0 :ρ= 0 (Tidak ada autokorelasi antar residual/independen)

H1 :ρ≠ 0 (Ada autokorelasi antar residual/tidak independen)

Daerah penolakan : Jika d < dL, maka tolak H0

Jika dU ≤ d ≤ 4-dU maka gagal tolak H0

Jika 4-dU ≤ d ≤ 4-dL atau dL ≤ d ≤ dU maka tidak

ada kesimpulan.

Page 19: zainal abidin

Statistik Uji : d=

∑i=1

n

(ei+1−ei)2

∑i=1

n

ei (2.13)

2.4.3 Pemeriksaan Asumsi Residual berdistribusi Normal

Pemeriksaan asumsi residual berdistribusi normal dapat dilihat pada

gambar Normal Probability Plot yang dapat diketahui bahwa titik-titiknya

mendekati garis normal dan mengikuti garis linier.Pengujian asumsi residual

normal dapat dilakukan melalui uji Kolmogorov Smirnov.Uji Kolmogorov-

Smirnov biasa digunakan untuk memutuskan jika sampel berasal dari populasi

dengan distribusi tertentu.Uji Kolmogorov Smirnov untuk membandingkan

serangkaian data pada sampel terhadap distribusi normal serangkaian nilai untuk

mengetahui kenormalan distribusi beberapa data.

Hipotesis :

H0 :F0 (x) = F(x) (data berdistribusi normal)

H1 :F0 (x) ≠ F(x) (data tidak berdistribusi normal)

Daerah penolakan:

Tolak H0 jika │D│>q(1-α) dimana q merupakan nilai dari tabel Kolmogorov

Smirnov

Statistik Uji :

D= maksimal │F0(x) – SN (x) │ F0 (x) adalah fungsi distribusi kumulatif teoritis.

Sedangkan SN (x) = i/n merupakan fungsi peluang kumulatif pengamatan dari

suatu sampel random dengan i adalah pengamatan dan n adalah jumlah

pengamatan.

2.6 Penduduk Miskin

Penduduk yang memiliki rata-rata pengeluaran perkapita perbulan di bawah garis

kemiskinan. Garis kemiskinan merupakan penjumlahan dari garis kemiskinan

makanan dan garis kemiskinan non makan. Penduduk yang memiliki rata-rata

pengeluaran perkapita per bulan dibawah garis kemiskinan dikategorikan sebagai

penduduk miskin (bps, 2014).

Page 20: zainal abidin

BAB III

METODE PENELITIAN

3.1 Sumber Data

Sumber data pada penelitian ini adalah sumber data sekunder yang

diperoleh dari website resmi Badan Pusat Statistik tentang jumlah penduduk

miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013.

Data di peroleh pada hari Rabu, 7 Oktober 2015, pukul 15:00 WIB di Jurusan

Statistika ITS.

3.2 Variabel Penelitian

Variabel yang akan diamati dari hasil percobaan yang telah dilakukan

adalah data jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di

Indonesia pada tahun 2013. Variabel pada praktikum ini adalah.

Tabel 3.1Variabel PenelitianNo

Variabel Keterangan

1 YJumlah Penduduk Miskin

2 X1Jumlah Pendapatan Pajak

3 X2Jumlah Belanja Barang dan Jasa

4 X3 Prosentase Buta Huruf5 X4 Angka Partisipasi

Page 21: zainal abidin

Sekolah6 X5 Jumlah Lowongan Kerja

7 X6Pengeluaran dan Pembiayaan

3.3 Langkah Analisis

Langkah analisis pada praktikum ini adalah sebagai berikut.

1. Memasukkan data pada software Minitab

2. Menganalisis dengan menggunakan statistika deskriptif

3. Menganalisis hubungan antar variabel

4. Menganalisis data dengan regresi linear berganda

5. Melakukan pengujian serentak

6. Melakukan pengujian parsial

7. Menganalisis data dengan pemeriksaan asummsi IIDN

8. Menarik kesimpulan

9. Membuat laporan.

3.4 Diagram Alir

Berdasarkan langkah analisis data yang dilakukan maka diagram alir

dalam praktikum ini dapat digambarkan sebagai berikut.

Mulai

Memasukkan data

Statistika deskriptif

Analisis Korelasi

Uji Linier Berganda

Page 22: zainal abidin

Gambar 3.1 Diagram Alir

Kesimpulan

Selesai

Uji Residual

Page 23: zainal abidin

DAFTAR PUSTAKA

Aridinanti, Lucia, dkk. 2007. Pengantar Metode Statistika. Surabaya: ITS Press.Draper, Smith. 1992.Analisis Regresi Terapan. PT. Gramedia Pustaka Utama.Nawari. 2010. Analisis Statistika Dengan MS Excel 2007 dan SPSS 17.

Jakarta:Elex Media Komputindo. Walpole, Ronald E. 1993. Pengantar Statistika Edisi ke-3. Jakarta: PT

Gramedia.Pustaka Utama.

Page 24: zainal abidin