8. uji korelasi pearson dan regresi linier
TRANSCRIPT
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
1/14
R A 1
KuliahOleh Ir. Rahayu Astuti, M.Kes
UJI KORELASI PEARSON DAN REGRESI LINIER
PENDAHULUAN
Dalam suatu penelitian kadang kita ingin mengetahui hubungan antara dua
variabel yang numerik atau continuous misalnya ingin mengetahui apakah ada
hubungan antara berat badan dengan tekanan darah sistole, apakah ada hubungan
antara umur dengan kadar Hb, apakah ada hubungan antara umur pasien dengan lama
hari rawat, apakah ada hubungan antara indeks masa tubuh (IMT) dengan kadar
kholesterol dan sebagainya. Metode statistik yang paling umum digunakan untuk
menggambarkan hubungan antara dua variabel yang numerik atau kuantitative ( X dan
Y ) adalah korelasi linier dan regresi linier.
Misalnya hubungan antara berat badan sekelompok ibu hamil dengan berat
badan lahir bayinya. Untuk menilai seberapa kuat/ erat hubungan antara berat badan
ibu dengan berat lahir bayi, maka digunakan koefisien korelasi untuk mengukur
kekuatan hubungan antara dua variable tersebut. Namun jika ingin memprediksi berat
lahir bayi jika berat badan ibu hamil diketahui maka digunakan analisis regresi linier.
KORELASI PEARSON
Korelasi Pearson digunakan untuk menguji hubungan dua variabel kuantitatif
(interval, rasio) dan berdistribusi normal. Sedangkan korelasi Spearman atau Kendall
tau-b mengukur hubungan antara dua variabel kualitatif atau kuantitatif yang tidak
berdistribusi normal.Korelasi Pearson disamping dapat untuk mengetahui kekuatan/ keeratan
hubungan, juga dapat untuk mengetahui arah hubungan dua variabel numerik.
Misalnya apakah hubungan antara berat badan ibu dengan berat lahir bayi mempunyai
hubungan yang kuat atau lemah, juga apakah hubungan tersebut berpola positif atau
negatif.
Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari
diagram tebar/ pencar (scatter plot). Diagram tebar adalah grafik yang menunjukkan
titik-titik perpotongan nilai data dari dua variabel ( X dan Y ). Pada umumnya dalam
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
2/14
R A 2
grafik, variabel independen (X) diletakkan pada garis horizontal sedangkan variabel
dependen (Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara dua
variabel X dan Y. Selain memberi informasi pola hubungan dari kedua variabel,
diagram tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel
tersebut.
. . . . . .. . . . . . . . . . . . . . .
. . . . . .. . . . . . . . . . .. . . . . . . . . . . . .. . . .
.. . . . . .. . .. . . . . . . .. . . . .. .. . . . . . . .
________________ __________________ __________________
linier positif linier negatif tidak ada hubungan inier
Derajat hubungan (kuat lemahnya hubungan) dapat dilihat dari tebaran datanya,
semakin rapat tebaran datanya semakin kuat hubungannya dan sebaliknya semakin
melebar tebarannya menunjukkan hubungannya semakin lemah.
Untuk mengetahui lebih tepat kekuatan hubungan digunakan Koefisien Korelasi
Pearson. Koefisien Korelasi disimbulkan dengan r (huruf r kecil)
Koefisien Korelasi Pearsons Disimbulkan dengan r , dapat diperoleh dari formula berikut :
( XY ) [( X ) ( Y ) / n ]r =
[( X2 ) ( X ) 2 /n ] [( Y2 ) ( Y ) 2 / n ]
atau
n ( XY ) ( X Y )r =
[ n X2 (X)2 ] [ n Y2 (Y)2 ]
Dari nilai r kita dapat menentukan :
a. Kekuatan hubungan ( nilai 0 s/d 1 )
b. Arah hubungan ( + atau - )
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
3/14
R A 3
Kisaran nilai r antara 0 s/d 1 :
0 : tidak ada hubungan linier
+ 1 : ada hubungan linier positip sempurna
- 1 : ada hubungan linier negatif sempurna
Arah hubungan :
+ : hubungan positif : semakin besar nilai X semakin besar nilai Y
- : hubungan negatif : semakin besar nilai X semakin kecil nilai Y
Hubungan dua variabel dapat berpola positip atau negatip. Hubungan positip
terjadi bila kenaikan satu variabel diikuti kenaikan variabel lain ,misalnya semakin
bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya.
Sedangkan hubungan negatip dapat terjadi bila kenaikan satu variabel diikuti
penurunan variable yang lain, misalnya semakin bertambah umurnya (semakin tua)
semakin rendah kadar Hb nya.
Asumsi :
Koefisien Korelasi Pearson hanya valid jika asumsi berikut dipenuhi :
1. Untuk setiap nilai X, nilai Y terdistribusi secara normal
2. Untuk setiap nilai Y, nilai X terdistribusi secara normal
3. Perkalian antara X dan Y terdistribusi secara normal (bivariat normal distr.)
(Kleinbaum, DG.;Kupper, LL.; Muller, KE.; Nizam, 1998)
Uji hipotesis :
Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk
menjelaskan derajat hubungan linier antara dua variabel. Selanjutnya perlu dilakukan
uji hipotesis untuk mengetahui apakah hubungan antara dua variabel terjadi secara
signifikan atau hanya karena faktor kebetulan dari random sampel (by chance). Uji
hipotesis dapat dilakukan dengan dua cara, yaitu pertama, membandingkan nilai r
hitung dengan r tabel; kedua, menggunakan pengujian dengan pendekatan distribusi t.
Formula uji t :
n 2 rt = r atau t =
1 r2 ( 1 r2 ) / ( n 2 )
df = n 2 n = jumlah sampel
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
4/14
R A 4
Ho : = 0
Ha : 0 Uji statistik : uji t (rumus diatas)
Keputusan : Ho ditolak jika | t hitung | t ( tabel : /2, df = n-2 )Jika keputusan Ho ditolak maka kesimpulannya koefisien korelasi populasi ( ) tidak
sama dengan nol dengan kata lain koefisien tersebut benar eksis/ada
Jika menggunakan program SPSS sudah langsung didapatkan nilai r dan nilai
signifikansinya ( p value).
Pengambilan keputusan : Ho ditolak jika p value r tabel maka tolak Ho
Kesimpulannya: ada hubungan yang signifikan antara BB ibu dengan BB bayi
dengan r positif artinya semakin besar BB ibu semakin besar pula BB bayi
b) Jika menggunakan tabel t
n 2t = r
1 r2
10 2t = 0,8045 = 3,83
1 (0,8045) 2
Keputusan : Ho ditolak jika | t hitung | t ( tabel : /2, df = n-2 )Nilai t tabel dengan /2 = 0,05/2 = 0,025 , df = 10-2 = 8 diperoleh 2,306
Karena t hitung ( 3,83 ) > t tabel ( 2,306 ) maka tolak Ho
Kesimpulannya: ada hubungan yang signifikan antara BB ibu dengan BB bayi dengan
r positif artinya semakin besar BB ibu semakin besar pula BB bayi.
Jika digunakan program SPSS maka diperoleh:
1. Uji kenormalan:Tests of Normality
,243 10 ,097 ,901 10 ,222,138 10 ,200* ,959 10 ,773
bb bumil (kg)bb bayi (gram)
Statistic df Sig. Statistic df Sig.Kolmogorov-Smirnov a Shapiro-Wilk
This is a lower bound of the true significance.*.
Lilliefors Significance Correctiona.
Terlihat bahwa pada uji Kolmogorov-Smirnov, p-value bb bumil = 0,097 dan bb bayi
= 0,200. Variabel bb ibu hamil dan bb bayi berdistribusi normal karena p-value >
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
7/14
R A 7
(0,05). Begitu pula dengan uji Shapiro-Wilk dimana p-value bb ibu hamil = 0,222 dan
p-value bb bayi = 0,773.
2. Uji Korelasi Pearson:
Correlations
1.000 .805**. .005
10 10.805** 1.000.005 .
10 10
Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N
bb bumil (kg)
bb bayi (gram)
bb bumil (kg)bb bayi(gram)
Correlation is significant at the 0.01 level (2-tailed).**.Terlihat hasil analisis korelasi Pearson diperoleh koefisien korelasi ( r ) = 0,805
Dilihat dari besaran r mendekati nilai 1 sehingga korelasi kuat dan arahnya positif
artinya semakin meningkat berat badan bumil semakin meningkat pula berat lahir bayi.
Pada hasil analisis dengan komputer diperoleh p-value = 0,005. Karena p-value
< tolak Ho sehingga kesimpulannya : Ada hubungan yang signifikan antara berat
badan ibu hamil dengan berat badan bayi lahir
REGRESI LINIER SEDERHANA
Analisis regresi dapat digunakan untuk menggambarkan hubungan linier antara
dua variable numerik. Tujuan analisis regresi adalah untuk membuat perkiraan /
memprediksi nilai suatu variabel (variabel dependen) melalui variabel yang lain
(variabel independen).
Sebagai contoh dalam hubungan antara Pemberian Makanan Tambahan (PMT)
dalam satuan Kalori dengan pertambahan berat badan dalam satuan kg, ingindiprediksi berapa besarnya pertambahan berat badan bila diketahui banyaknya Kalori
pada PMT.
Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh
dengan berbagai cara/ metode. Salah satu cara yang sering digunakan oleh peneliti
adalah dengan menggunakan metode kuadrat terkecil (least square).
Metode least square merupakan metode pembuatan garis regresi dengan cara
meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan nilai Y yang
diramalkan oleh garis regresi .
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
8/14
R A 8
PERSAMAAN GARIS
Secara matematis model persamaan garis regresi sebagai berikut :
= a + b X
Dimana : : nilai Y yang diprediksi X : variabel independen = variabel bebas = prediktora : intercept = nilai bila X=0
atau intercept/perpotongan garis regresi dengan sumbu Yb : slope = kemiringan garis regresi = koefisien regresi
= nilai Y meningkat sebesar b unit untuk setiap kenaikan nilai X sebesar satu
Sedangkan a dan b diperoleh dengan persamaan sebagai berikut:
[ XY ] [( X ) ( Y ) / n]b = [ X2] [(X)2 / n ]
a = Y b X
dimana Y = mean Y dan X = mean X
Perbedaan p enting antara (nilai prediksi) dimana semua akan jatuh pada garisregresi sedangkan Y (nilai observasi) biasanya tidak semua jatuh pada pada garis
regresi. Konstanta a dan b adalah estimasi dari dua parameter pada persamaan regresiyang sesungguhnya dimana dianggap pada lokasi garis.
Gambar 1 : Persamaan garis lurusY
= a + bX
Y
Y : X : b = = slope: : X
a= Y intercept :: :
X X+ X
Pada gambar terlihat:
Konstanta a titik dimana garis lurus/garis regresi berpotongan dengan sumbu y.
Sedangkan b slope atau gradien dari garis.
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
9/14
R A 9
Slope didefinisikan jumlah perubahan ( Y) pada variabel dependen dibagi dengan
jumlah perubahan ( X) pada variabel independen. Slope disebut juga koefisien regresi
Contoh:
Suatu studi ingin melihat hubungan antara variabel berat badan ibu dengan berat badanbayi yang dilahirkannya. Datanya sebagai berikut:
Ibu BB ibu (kg) BB bayi (gram)1 49,4 35152 63,5 37423 68,0 36294 52,5 28805 54,4 30086 70,3 40687 50,8 3373
8 73,9 41249 65,8 357210 54,4 3359
Pada analisis korelasi diperoleh koefisien korelasi sebesar r = 0,805. Sehingga ada
hubungan yang kuat antara BB ibu hamil dengan BB lahir bayi dengan r berpola linier
positif artinya semakin besar BB ibu hamil semakin besar pula BB lahir bayi
Pada contoh diatas dapat dilihat bagaimana BB lahir bayi tergantung dari BB
ibu hamil. Untuk itu dapat dilakukan analisis regresi linier. Pada analisis ini dapat
diprediksi berapa BB lahir bayi jika diketahui BB ibu hamil.
Persamaan :
= a + bXBB lahir bayi = a + b BB ibu hamil
Pada soal diatas diperoleh:
XY = 2151860,8 X = 602,7 X = 60,27
X2 = 37053,75 Y = 35270 Y = 3527Y2 = 125845088
Sehingga:
[ XY ] [( X ) ( Y ) / n]b =
[ X2] [(X)2 / n ]
[2151860,8] [(602,7) (35270) / 10] 26137,9b = = = 35,853
[37053,75] [(602,7)2 / 10 ] 729,021
a = 3527 ( 35,853 ) ( 60,27 ) = 1366,139
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
10/14
R A 10
Jadi persamaannya adalah : = 1366,139 + 35,853X
KOEFISIEN REGRESI
Yaitu dilihat slope dari garis regresi atau dilihat nilai bMisalnya : b = 35,853 , artinya tiap kenaikan pada X sebesar 1 satuan X akan
meningkatkan Y sebesar 35,853 satu satuan Y.
Tiap kenaikan BB ibu hamil sebesar 1 kg maka meningkatkan BB lahir bayi sebesar
35,853 gram.
KOEFISIEN DETERMINASI ( R 2 ) = R-Square
Koefisien determinasi mengukur proporsi varians Y yang dapat diterangkan oleh X.
r = 0,805 sehingga R 2 = 0,648 = 64,8 %. Jadi variabel berat lahir bayi dapat
diterangkan oleh berat badan ibu hamil sebesar 64,8 %
Jadi jika diketahu BB ibu hamil 50 kg maka berat lahir bayi :
= 1366,139 + 35,853X= 1366,139 + 35,853 ( 50 ) = 3158,789 gram
Hasil analisis regresi linier menggunakan program SPSS:
Coefficients a
1366.114 569.599 2.398 .04335.853 9.357 .805 3.832 .005
(Constant)bb bumil (kg)
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig.
Dependent Variable: bb bayi (gram)a.
Diperoleh nilai a = 1366,114nilai b = 35,853sehingga persamaan garis regresinya adalah: = 1366,139 + 35,853 X
KETERBATASAN ANALISIS REGRESI LINIER
Analisis regresi linier sangat banyak kegunaannya. Namun dalam
menerapkannya perlu diperhatikan keterbatasannya. Hal ini untuk mencegah
penafsiran yang keliru, karena saat ini penghitungan analisis regresi linier tersebut
telah sedemikian mudahnya dilakukan oleh komputer.
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
11/14
R A 11
Keterbatasannya adalah sebagai berikut:
1. Analisis regresi linier dihitung dengan asumsi khusus, sehingga asumsi ini harus
diteliti apakah dipenuhi atau tidak. Pemeriksaan asumsi ini memerlukan
perhitungan lebih lanjut yang tidak akan dijelaskan disini. Salah satu asumsi adalah
sebaran residu yang mengikuti sebaran Gauss. Dengan demikian analisis regresi
linier ini dilakukan dengan prosedur statistik parametric.
2. Penyimpulan hasil hendaknya memperhatikan rentang data yang diamati. Bila akan
melakukan ekstrapolasi atau proyeksi, diperlukan berbagai asumsi agar linieritas
garis dapat dipertahankan.
3. Hubungan yang digambarkan pada analisis regresi linier tidak dapat diartikan
sebagai hubungan kausal atau sebab akibat. Dapat diingat bahwa simpulan
hubungan sebab akibat harus didukung oleh beberapa hasil lain seperti yang
diutarakan oleh Bradford Hill (1971).
SOAL:
1. Seorang peneliti ingin mengetahui hubungan antara umur dengan tekanan darahsistole. Datanya adalah sebagai berikut:
Sampel Umur Tekanan darah sistole
123456789
101112
252931354255384827574337
105110112115120130118125106140125115
Pertanyaan :a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung
koefisien korelasinya)b). Apakah ada hubungan antara umur dengan tekanan darah sistole?c). Buatlah persamaan garis regresinya.d). Jika diketahui seseorang yang umurnya 45 tahun maka berapa prediksi tekanan
darah sistoliknya?
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
12/14
R A 12
2. Pada data berikut:
Sampel Jumlah anggotakeluarga
Status gizi(Z skor)
123456789
10
4936767654
-1.00-2.81-1.93-1.97-2.18-2.63-2.82-1.69-1.61.19
Pertanyaan :
a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung koefisienkorelasinya).
b). Apakah ada hubungan antara jumlah anggota keluarga dengan status gizi padabalita?
c). Buatlah persamaan garis regresinya.
Daftar Pustaka
1. Budiarto. Biostatistika untuk kedokteran dan kesehatan masyarakat. EGC. Jakarta.
20022. Chandra, B. Pengantar Statistik Kesehatan. Penerbit Buku Kedokteran EGC.
Jakarta.1995.3. Dawson B, Trapp RG. Basic and Clinical Biostatistics. Third Edition. McGraw-Hill
International Editions. Lange Medical Books, The McGraw-Hill Companies. 2001.4. Kleinbaum, DG.;Kupper, LL.; Muller, KE.; Nizam. Applied Regression Analysis
and Other Multivariate Methods. 3 rd.Ed.. Duxbury Press, California. 1998.5. Kuzma. Basic Statistics for the Health Sciences. Mayfield Publishing Company.
19846. Norman and Streiner. Biostatistics : The Bare Essentials, Mosby. 1994.7. Pagano, M dan K. Gaureau. Principles of Biostatistics. Belmont, Duxury Press.1993.8. Prasetyo, SB. Aplikasi Analisis Regresi Linier. Program Studi Magister Kesehatan
Masyarakat, FKM, UI. 2002.9. Sabri dan Hastomo. Statistika kesehatan. PT Raja Grafindo Persada. Jakarta. 2006.10. Sheskin, D.J. Handbook of Parametric and Nonparametric Statistical Prosedures.
Third Edition. Chapman & Hall/CRC. Florida. 2004.
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
13/14
R A 13
TABEL NILAI KRITIS r PEARSON
df =n-2Tingkat signifikansi (one- tailed)
0,05 0,025 0,01 0,005Tingkat signifikansi (two- tailed)
0,1 0,05 0,02 0,01
12345678
910
1112131415161718
1920
21222324252627282930
3540455060708090
100
0.9880.9000.8050.7290.6690.6220.5820.549
0.5210.497
0.4760.4580.4410.4260.4120.4000.3890.378
0.3690.360
0.3520.3440.3370.3300.3230.3170.3110.3060.3010.296
0.2750.2570.2430.2310.2110.1950.1830.1730.164
0.9970.9500.8780.8110.7540.7070.6660.632
0.6020.576
0.5530.5320.5140.4970.4820.4680.4560.444
0.4330.423
0.4130.4040.3960.3880.3810.3740.3670.3610.3550.349
0.3250.3040.2880.2730.2500.2320.2170.2050.195
0.9950.9000.9340.8820.8330.7890.7500.716
0.6850.658
0.6340.6120.5920.5740.5580.5420.5280.516
0.5030.492
0.4820.4720.4620.4530.4450.4370.4300.4230.4160.409
0.3810.3580.3380.3220.2950.2740.2560.2420.230
0.9990.9900.9590.9170.8740.8340.7980.765
0.7350.708
0.6840.6610.6410.6230.6060.5900.5750.561
0.5490.537
0.5260.5150.5050.4960.4870.4790.4710.4630.4560.449
0.4180.3930.3720.3540.3250.3020.2830.2670.254
-
8/6/2019 8. Uji Korelasi Pearson Dan Regresi Linier
14/14
R A 14