2013 · pdf filemengunakan regresi dan korelasi dalam menganalisisnya. ... jawaban penghasilan...
TRANSCRIPT
MODUL STATISTIKA II
2013
(Part 2)
Note : Terdapat beberapa kesalahan dalam
modul ini, misalnya dalam kunci jawaban
Alya Fauziyah Taufik Nur Rachman Deasy Puspasari
Karina Indri M. S. Rudolf P. Purba Yessica Sardina Purba
Ahmad Hamdi Farhatunisa Siti Hudaepah
Lois Jessica Karina Megasari
Anita Kesia Zonebia
Nina Arina Yana Mulyana Fauzi Catra Evan Ramadhani
DAFTAR ISI
REGRESI DAN KORELASI SEDERHANA………………………………………………..79
REGRESI DAN KORELASI BERGANDA………………………………………………..101
CHI-SQUARE………………………………………………………………………………154
NON PARAMETRIK ……………………………………………………………………...168
NON PARAMETRIK 1…………………………………………………………………….171
NON PARAMETRIK 2……………………………………………………………………198
79
REGRESI DAN KORELASI SEDERHANA
Untuk mempelajari hubungan-hubungan antar variabel dalam suatu persamaan dapat
mengunakan regresi dan korelasi dalam menganalisisnya. Regresi sederhana menunjukan
hubungan linear (garis lurus) antar dua variabel dan memperkirakan nilai dari variabel terikat
Y berdasarkan nilai dari variabel bebas X. Sedangkan korelasi sederhana mempelajari
hubungan antara variabel-variabel atau dengan kata lain menunjukan apakah dua variabel
mempunyai hubungan atau tidak.
A. REGRESI SEDERHANA
1. Pengertian Regresi
Persamaan Regresi adalah sebuah persamaan yang menunjukan hubungan linear
antara dua variabel. (Lind, Teknik-teknik Statistik dalam Ekonomi dan Bisnis :74)
Bentuk Umum
Keterangan :
Ŷ = Variabel Terikat (Variabel yang diperkirakan)
X = Variabel Bebas (Variabel yang mempengaruhi variabel terikat)
a = nilai Y dimana diperkirakan garis regresinya memotong sumbu Y ketika X bernilai
nol (intercept)
b = kemiringan garis, atau perubahan rata-rata Y setiap perubahan satu unit X (slope)
2. Metode Pengukuran Regresi Sederhana
a. Least Square Method
Bentuk Umum = Ŷ = a + bX
Ŷ = a + bX
80
Rum
us :
ΣY = an + bΣX atau a =
( )
ΣXY = aΣX + bΣX2 atau
(∑ ) (∑ )(∑ )
( )
b. Product Moment Method
Bentuk Umum : Ŷ = a + bX
Rumus :
Σxy = b ΣX+ bΣX2 atau b=
,dimana
Σxy = ΣXY –
Σx
2 = ΣX
2 –
( )
Σy
2 = ΣY
2 –
( )
∑
∑
B. Korelasi
Analisis korelasi adalah sekumpulan teknik untuk mengukur hubungan antar dua
variabel. (Lind, Teknik-teknik Statistika dalam Bisnis dan Ekonomi: 61)
1. Koefisien korelasi (r)
Koefisien korelasi menunjukan kekuatan hubungan antara dua himpunan variabel.
Diberi tanda r, dan nilai r dapat berkisar dari -1 sampai +1. Tanda negatif berarti varibel
berkorelasi negatif, tanda positif berarti variabel berkorelasi positif, serta apabila tidak
terdapat hubungan sama sekali antar variabel maka r bernilai 0.
Kekuatan dari koefisien korelasi menurut Iqbal Hasan:
0.00 < r ≤ 0.20 = sangat lemah
0.21 < r ≤ 0.40 = lemah
0.41 < r ≤ 0.60 = cukup
81
0.61 < r ≤ 0.80 = kuat
0.81 < r ≤ 1.00 = sangat kuat
Rumus Pearson :
√( ( ) )( ( ) )
Rumus Product Moment :
r =
√( )
2. Koefisien Determinasi
Koefisien determinasi adalah perbandingan total variasi dalam variabel terikat Y yang
dapat dijelaskan oleh variasi dalam variabel bebas X. (Lind)
Dirumuskan
r2 x 100%
- Koefisien non determinasi adalah perbandingan total variasi terikat Y yang dapat
dijelaskan oleh variabel diluar model.
Dirumuskan
1 - r2
3. Kesalahan Standard Estimasi ( Standard Error of Estimate )
Adalah suatu ukuran yang menunjukan seberapa tepat prediksi untuk Y berdasarkan X atau
sebaliknya, seberapa tidak akuratnya estimasi itu. Dirumuskan
Least Square Method Product Moment Method
SYX =√
SYX = √
Keterangan :
n = banyaknya pasangan variabel independen x dan variabel dependen y
82
k = banyaknya macam variabel independen x
4. Penaksiran tentang interval α dan interval β
Menaksir interval α
(n > 30)
a – Z1/2α.Sa < konstanta α < a + Z1/2α.Sa
(n ≤ 30)
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
Sa = SYX . √
Menaksir interval β
(n > 30)
b – Z1/2α.Sb < konstanta β < b + Z1/2α.Sb
(n ≤ 30)
b – t1/2α.Sb < konstanta β < b + t1/2α.Sb
Sb = SYX . √
5. Pengujian tentang Koefisien Regresi
Menguji α
- Tentukan Ho dan Ha
Ho : Konstanta α = 0 (tidak berpengaruh
signifikan)
Ha : Konstanta α ≠ 0 (ada pengaruh
signifikan)
- Tentukan t1/2α dengan df = n-k-1
n = jumlah sampel
k = jumlah variabel x
Tentukan thitung dengan :
t =
- Tentukan daerah penolakan yaitu
thitung < -t1/2α atau thitung > t1/2α Ho ditolak
t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat ditolak
Menguji β
- Tentukan Ho dan Ha
Ho : β = (tidak berpengaruh
signifikan)
Ha : β ≠ (ada pengaruh signifikan)
- Tentukan t1/2α dengan df = n-k-1
- Tentukan thitung dengan
t =
- Tentukan daerah penolakan yaitu
thitung < -t1/2α atau thitung > t1/2α Ho
ditolak
t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat
ditolak
Daerah penerimaan Ho
-t1/2α t1/2α
Daerah penolakan Ho ( daerah kritis )
Daerah penolakan Ho ( daerah kritis )
?
83
- Kesimpulan
6. Interval Taksiran
Interval taksiran untuk rata-rata taksiran µYX
Ŷo – t1/2α SŶ< µYX < Ŷo + t1/2α SŶ
SŶ = SYX √
( x )
Interval taksiran untuk Y individu
Ŷo – t1/2α SŶ< Y< Ŷo + t1/2α SŶ
SŶ = SYX √
( x )
7. Pengujian Korelasi populasi
Menguji apakah sampel berasal dari populasi
yang berkorelasi
Ho : ρ = 0 (tidak berasal dari populasi yang
berkorelasi)
Ha : ρ ≠ 0 (berasal dari populasi yang
berkorelasi)
df = n-k-1
t = (√
√
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
8. Batas-batas koefisien korelasi populasi ρ
- jika berkorelasi tidak perlu dihitung, jika berkorelasi perlu dihitung
( )
( ) Z1/2α. Sr <
( )
( ) <
( )
( ) Z1/2α.Sr
Sr =
√
84
CONTOH SOAL
Manager Investasi di Astra International, memiliki data mengenai penghasilan karyawan di
perusahaan tersebut dan persentase investasi kembali para karyawan pada produk keuangan
yang dikeluarkan perusahaan.
Karyawan Penghasilan (juta) Investasi Kembali (%)
Ade 7,0 20,2
Ahmad 7,8 20,4
Anjar 8,2 30,6
Andi 9,1 28,5
Adi 8,7 25,4
Anji 11,3 30,5
Adi 11,7 32,8
Ari 10,0 42,0
Apri 12,8 29,0
Ati 12,2 29,3
Tentukanlah :
a. Persamaan regresi dan interpretasi
b. Koefisien korelasi, determinasi, non determinasi serta artinya
c. Standard Error of estimate.
Jawaban
Penghasilan
(X)
Investasi Kembali
(Y) (XY) X² Y²
7,0 20,2 141,4 49 408,04
7,8 20,4 159,12 60,84 416,16
8,2 30,6 250,92 67,24 936,36
85
9,1 28,5 259,35 82,81 812,25
8,7 25,4 220,98 75,69 645,16
11,3 30,5 344,65 127,69 930,25
11,7 32,8 383,76 136,89 1075,84
10,0 42,0 420 100 1764
12,8 29,0 371,2 163,84 841
12,2 29,3 357,46 148,84 858,49
X = 98.8 Y = 288.7 ΣXY = 2908,76 ΣX² = 1012,84 ΣY²= 8687,55
a. Persamaan Regresi
a =
( )
= ( ) ( )
( ) ( ) = 13.6838565511
Dan (∑ ) (∑ )(∑ )
(∑ ) (∑ )
= ( ) ( )
( ) ( ) = 1.53706126008
Maka persamaan regresinya adalah : Y= 13.6838565511 + 1.53706126008X Dari persamaan
tersebut dapat diketahui bahwa rata-rata persentase investasi kembali tanpa dipengaruhi oleh
variabel apapun adalah sebesar 13.6838565511 Sedangkan jika dipengaruhi oleh penghasilan,
jika pendapatan naik sebesar 1 juta rupiah rata-rata jumlah investasi kembali akan bertambah
adalah sebanyak 1.53706126008 unit.ceteris paribus
b. r =
√( ( ) )( ( ) )
r = ( ) ( )
√( ( ) ( )( ( ) ( ))
r = 0.49573313338
Artinya, korelasi antara jumlah pengasilan dengan investasi kembali adalah cukup kuat dan
searah.
Koefisien determinasi adalah :
R2
X 100% = 0.495733133382 X 100% = 24.575133953 %
86
Artinya, variasi jumlah penghasilan menjelaskan total variasi Persentase investasi kembali
sebesar 24.575133953 % dan sisanya dijelaskan oleh variabel lain diluar model.
Koefisien non determinasi
1 – R2 = 1 - 0.49573313338
2 = 0.24575133953 x 100 % = 75.424866047
c. SYX =√
= √( ) ( ) ( )
= 5.69799
Jadi, rata-rata penyimpangan variabel persentasi investasi kembali prediksi terhadap variabel
variabel persentase investasi kembali adalah sebesar 5.69799.
87
SOAL REGRESI DAN KORELASI SEDERHANA
1. Berikut ini adalah data berat mobil dalam ribuan pon dan konsumsi bahan bakar dalam
mil/gallon.
Berat mobil 2.0 2.4 2.8 3.4 3.6 3.2 2.6 2.9 2.5 2.7
Konsumsi
bahan bakar 32 30 28 23 19 25 27 24 29 33
a. Buat persamaan regresi dan interpretasinya!
b. Hitung standard error of estimate!
c. Hitung koefisien korelasi dan determinasi, jelaskan!
d. Pada tingkat signifikansi 5%, dapatkah disimpulkan bahwa terhadap hubungan negatif
antara dua variabel tersebut?
e. Batas-bats taksiran koefisien regresi α pada tingkat kepercayaan 95%!
Jawab :
Berat Mobil (X) Konsumsi Bahan
Bakar (Y) XY X
2 Y
2
2.0 32 64 4 1024
2.4 30 72 5.76 900
2.8 28 78.4 7.84 784
3.4 23 78.2 11.56 529
3.6 19 68.4 12.96 361
3.2 25 80 10.24 625
2.6 27 70.2 6.76 729
2.9 24 69.6 8.41 576
2.5 29 72.5 6.25 841
2.7 33 89.1 7.29 1089
ΣX=28.1 ΣY=270 ΣXY=742.4 ΣX2=81.04 ΣY
2=7458
a. Persamaan Regresi
a =
( )
( )( ) ( )( )
( ) ( )
88
(∑ ) (∑ )(∑ )
( ) ( ) ( )( )
( ) ( )
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa rata-rata konsumsi bahan bakar tanpa
dipengaruhi oleh variabel apapun adalah sebesar %. Sedangkan jika
dipengaruhi oleh berat mobil , jika berat mobil naik sebesar 1 ribu pon, maka rata-rata
konsumsi bahan bakar akan turun sebesar mil/gallon, ceteris paribus.
b.SYX = √
√
( ) ( )( )
Jadi, rata-rata penyimpangan variabel konsumsi bahan bakar bakar prediksi terhadap
variabel konsumsi bahan bakar sebenarnya adalah sebesar
c.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( ))
Artinya, koefisien korelasi dari berat mobil dan bahan bakar minyak adalah sebesar
. Artinya korelasi antara kedua variabel adalah negatif dan sangat kuat.
Koefisien determinasi adalah
R2 X 100% = ( )
2 X 100 % = 0.76069653449 x 100 = 76.069653449 %
Artinya variabel berat mobil mampu menjelaskan variabel konsumsi bahan bakar
sebanyak 76.069653449 % dan sisanya 23.930346551% dijelaskan oleh faktor lain di luar
model.
d. Ho : ρ = 0 (tidak ada korelasi)
Ha : ρ ≠ 0 (ada korelasi )
df = 10-1-1 = 8
t 1/2α = 2,3060
t = (√
√
√
√
t =
89
kriteria :
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
Ternyata < -2,306 atau > 2.306 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi negatif antara berat mobil dan
konsumsi bahan bakar.
e. Sa = SYX . √
→ Σx
2 = ΣX
2 –
( )
= –
( )
= 2.079
Sa = . √
Sa = 0.708899 df = 10-1-1=8
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
–2.3060*0.708899 < Konstanta α < +
2.3060*0.708899
47.396545 < Konstanta α < 50.665988
Jadi pada tingkat signifikansi 5%, batas-batas taksiran kostanta α berada dalam regresi
populasi -47.396545 hingga 50.665988.
2. Norton Corp. Ingin mengetahui hubungan antara bonus yang diterima dengan jumlah
lembur karyawan tersebut. Kemudian Norton Corp. Mewawancarai 20 karyawannya dan
mendapatkan :
ΣX=75 ; ΣY=250 ; ΣXY=1500; ΣX2=700 ; ΣY
2=5000. Dari informasi tersebut, tentukan :
a. Tentukan persamaan regresinya dan interpretasi!
b. r dan r2
serta berikan interpretasinya!
c. Pada tingkat signifikansi 5%, ujilah bahwa jumlah lembur dapat mempengaruhi jumlah
bonus yang diterima oleh karyawan Norton Corp.!
Jawab :
a. a =
( )
( )( ) ( )( )
( ) ( )
(∑ ) (∑ )(∑ )
( ) ( ) ( )( )
( ) ( )
90
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa jumlah bonus tanpa dipengaruhi oleh
variabel apapun adalah sebesar satuan. Sedangkan jika dipengaruhi oleh
lembur, jika jumlah lembur naik sebesar 1 satuan, maka rata-rata jumlah bonus akan naik
sebesar satuan, ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) (
))
0.6348111
Artinya, koefisien korelasi dari jumlah bonus dan jumlah lembur adalah sebesar
0.6348111. Artinya korelasi antara kedua variabel adalah positif dan kuat.
r2 = (0.6348111)
2 = 0.4029851 x 100% = 40.29851 %
k2 + r
2 = 100%
k 2 = 100% - 40.29851 %= 59.70149%
Artinya variabel berat mobil mampu menjelaskan variabel konsumsi bahan bakar
sebanyak 40.29851 % dan sisanya 59.70149% dijelaskan oleh faktor lain di luar model.
c. Ho : ρ = 0 (tidak ada korelasi)
Ha : ρ ≠ 0 (ada korelasi )
df = 20-1-1 = 18
t 1/2α = 2.1009
t = (√
√
√
√ = 3.4856851
kriteria :
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
Ternyata < -2.1009 atau 3.4856851 > 2.1009 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi positif antara jumlah bonus dan
jumlah lembur karyawan.
3. Based on the theory of supply, it can be presumed that there is a relationship between
production and price. below is the data production and palm oil prices from 1995 to 2004.
91
Year Production
(million of ton)
Price
(US $/ton)
1995 4.54 271
1996 4.53 319
1997 5.03 411
1998 6.05 348
1999 6.09 287
2000 6.14 330
2001 6.37 383
2002 7.40 384
2003 7.22 472
2004 7.81 610
2005 8.49 640
2006 8.81 652
Determine :
a. The regression equation and give the interpretation!
b. How much r and r2
and give the interpretation!
c. The standard error of estimation and interpretation!
d. With significance 5%, estimate interval constanta α!
e. With significance 5%, estimate interval constanta β and test constanta β can influence
the regression model significantly!
f. At significance 5%, can we conclude that the sample comes from population which
have correlation?
Answer :
Production (Y) Price (X) X2 Y
2 XY
4.54 271 73441 20.61 1230.34
4.53 319 101761 20.52 1445.07
5.03 411 168921 25.30 2067.33
6.05 348 121104 36.60 2105.40
6.09 287 82369 37.09 1747.83
6.14 330 108900 37.70 2026.20
6.37 383 146689 40.58 2439.71
7.40 384 147456 54.76 2841.60
7.22 472 222784 52.13 3407.84
7.81 610 372100 61.00 4764.10
8.49 640 409600 72.08 5433.60
8.81 652 425104 77.62 5744.12
ΣY=78.48 ΣX=5107 Σ X2=2380229 Σ Y
2=535.98 Σ XY=35253.14
a. Regression equation
a =
( )
( )( ) ( )( )
( ) ( )
92
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
0.008963
So, the regression equation is Y = + X. It means that average
production if not influenced by anything variabel is about millions of ton. And
if influenced by price, in one US $/ton increasing in price then average production will be
increasing about 0.008963 US $/ton, ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) (
))
0.8550648
So, the correlation between production and price is 0.8550648. On the other hand, the
corelation is very strong and positive, because the value close to +1.
r2 = (0.8550648)
2 = 0.7311359 x 100% = 73.11359 %
k2 + r
2 = 100%
k 2 = 100% - 73.11359 %= 0.99268864%
so, the variation of production can explain total variation of price about 73.11359 % and
the residual about 0.99268864% is explained by variable out of model.
c. SYX = √
√
( ) ( )( )
So the standard error of estimate is . It means that varians of production
prediction can explain real production about 16.28992761.
d. Sa = SYX . √
→ Σx
2 = ΣX
2 –
( )
= –
( )
= 206774.9167
Sa = . √
Sa = 2.19560320235 df = 12-1-1=10
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
–2.2281*2.19560320235 < Konstanta α < + 2.2281*2.19560320235
-2.28275 < Konstanta α < 7.733593
So, with significance 5% the limits of estimated α are constant in the population
regression -2.28275 to 7.733593.
e. (n ≤ 30)
b – t1/2α.Sb < konstanta β< b + t1/2α.Sb
93
Sb = SYX . √
Σx2 = ΣX
2 –
( )
Σx2 = –
( )
= 206774.9167
Maka Sb = . √
Sb = 0.00492982807 df = 12-1-1=10
b – t1/2α.Sb < konstanta β< b + t1/2α.Sb
–2.2281*0.00492982807 < Konstanta α < + 2.2281*0.00492982807
2.71443785 < Konstanta β < 2.73640615
With significance 5%, interval estimation constanta β for regression of population is
between 2.71443785 to 2.73640615
Uji t
Ho: β = 0 (tidak ada pengaruh signifikan)
Ha: β ≠ 0 (Ada pengaruh signifikan)
α= 0,05 df = 10
t α/2 = 2.2281
t =
t =
t = 552.8432151
criteria
-thitung <-t1/2α atau thitung > t1/2α → Ho ditolak
evidently -552.8432151 < - 2.2281 or 552.8432151 > 2.2281 → Ho rejected
so, with significance 5%, the test shows that constanta β ≠ 0. It means that constanta β
influence significantly.
d. Ho : ρ = 0 (no correlation)
Ha : ρ ≠ 0 (correlation)
df = 12-1-1 = 10
t 1/2α = 2.2281
94
t = (√
√
√
√
t = 5.214740
criteria :
Ho rejected if
-thitung < -t1/2α or thitung > t1/2α
-5.214740 < -2.2281 or 5.214740 > 2.2281 then Ho is rejected
So, at significance 5%, there are positif correlation between production and price.
4. The data below is the income and consumption data per day from Nabila.
Income
(tens of thousands of dollars)
Consumption
(tens of thousands of dollars)
40 25
55 40
60 50
75 55
87 65
95 73
120 90
Determine :
a. What is the regression equation and give the interpretation?
b. How much the coeficient corelation for the case and interpretation?
c. How much the size of house can explain the selling price and interpretation?
d. Determine the standard error of estimate and interpretation?
Answer :
Income
(X)
Consumption
(Y) X
2 Y
2 XY
40 25 100 121 140
55 40 121 169 143
60 50 110.25 144 126
75 55 144 121 132
87 65 64 169 104
95 73 110.25 100 105
120 90 81 144 108
ΣX=532 ΣY=398 Σ X2=44.844 Σ Y
2=25.404 Σ XY=33.715
95
a. Regression equation
a =
( )
( )( ) ( )( )
( ) ( ) 0.000318
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( ) 0.73545
So, the regression equation is Y = 0.000318+ 0.73545X. It means that average
consumption if not influenced by anything variabel is about 0.000318 tens of thousands of
dollars. And if influenced by income, in tens of thousands of dollars increasing in price
then average consumption will be increasing about 0.73545 tens of thousands of dollars,
ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( )) -1.0000013
So, the correlation between consumption and income is -1.0000013. On the other hand, the
corelation is very strong and negative.
c. r2 = (-1.0000013)
2 = 1.00000 x 100% = 100 %
k2 + r
2 = 100%
k 2 = 100% - 100 %= 0%
so, the variation of consumption can explain total variation of price about 100 % and the
residual about 0% is explained by variable out of model.
d. SYX = √
√
( ) ( )( )
So the standard error of estimate is . It means that varians of production
prediction can explain real production about .
5. The following table is the observation of the random sample of 8 villages in cities
"alphabet" of income and health expenditure villagers during 2012.
Village Income
(millions of rupiah)
Health expenditure
(millions of rupiah)
A 21 4
B 15 3
C 15 3.5
D 9 2
E 12 3
F 18 3.5
G 6 2.5
H 12 2.5
96
a. What is the regression equation and give the interpretation?
b. Determine the value of the coefficient of correlation, coefficient of determination,
coefficient of non-determination and give the explanation!
Answer :
Village Income (X) Health
expenditure (Y) X
2 Y
2 XY
A 21 4 441 16 84
B 15 3 225 9 45
C 15 3.5 225 12.25 52.5
D 9 2 81 4 18
E 12 3 144 9 36
F 18 3.5 324 12.25 63
G 6 2.5 36 6.25 15
H 12 2.5 144 6.25 30
ΣX=108 ΣY=24 Σ X2=1620 Σ Y
2=75 Σ XY=343.5
a. Regression equation
a =
( )
( )( ) ( )( )
( ) ( ) 0.735443361
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( ) 0.735443
So, the regression equation is Y = 0.735443361+ 0.735443X. It means that average health
expenditure if not influenced by anything variabel is about 0.735443361 millions of
rupiah. And if influenced by income, in one millions of rupiah increasing in income then
average health expenditure will be increasing about 0.735443 millions of rupiah, ceteris
paribus.
b. Coefficient of correlation
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( )) 0.884538
So, the correlation between consumption and income is 0.884538. On the other hand, the
corelation is very strong and positive.
Coefficient of determination
r2 = (0.884538)
2 = 0.7824074 x 100% = 78.24074 %
k2 + r
2 = 100%
Coefficient of non determination
k 2 = 100% - 78.24074 %= 21.75926 %
so, the variation of income can explain total variation of health expenditure about
78.24074 % and the residual about 21.75926 % is explained by variable out of model.
97
6. Tabel berikut menunjukkan hasil pengamatan terhadap sampel acak yang terdiri dari 15
usaha kecil di suatu kecamatan mengenai omzet penjualan dan laba (dalam juta rupiah).
Omzet Penjualan Laba
34 32
38 36
34 31
40 38
30 29
40 35
40 33
34 30
35 32
39 36
33 31
32 31
42 36
40 37
42 35
a. Tentukan persamaan regresinya dan interpretasi!
b. r dan r2
serta berikan interpretasinya!
c. Pada tingkat signifikansi 5%, ujilah bahwa omzet penjualan dapat mempengaruhi laba!
Jawab :
Omzet
Penjualan (X)
Laba
(Y)
X2 Y
2 XY
34 32 1156 1024 1088
38 36 1444 1296 1368
34 31 1156 961 1054
40 38 1600 1444 1520
30 29 900 841 870
40 35 1600 1225 1400
40 33 1600 1089 1320
34 30 1156 900 1020
35 32 1225 1024 1120
39 36 1521 1296 1404
33 31 1089 961 1023
32 31 1024 961 992
42 36 1764 1296 1512
40 37 1600 1369 1480
42 35 1764 1225 1470
ΣX=553 ΣY=502 Σ X2=20599 Σ Y
2=16912 Σ XY=18641
a. a =
( )
( )( ) ( )( )
( ) ( ) 115.7944
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( ) 0.632557
98
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa laba tanpa dipengaruhi oleh variabel
apapun adalah sebesar 115.7944 juta rupiah. Sedangkan jika dipengaruhi oleh omzet
penjualan, jika jumlah omzet penjualan naik sebesar 1 juta rupiah, maka rata-rata laba
akan naik sebesar juta rupiah, ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) (
))
0.8707684
Artinya, koefisien korelasi dari laba dan omzet penjualan adalah sebesar 0.6348111.
Artinya korelasi antara kedua variabel adalah positif dan kuat.
r2 = (0.8707684)
2 = 0.7582377 x 100% = 75.82377 %
k2 + r
2 = 100%
k 2 = 100% - 75.82377 %= 24.17623 %
Artinya variabel omzet penjualan mampu menjelaskan variabel laba sebanyak 75.82377 %
dan sisanya 24.17623 % dijelaskan oleh faktor lain di luar model.
c. Ho : ρ = 0 (tidak ada korelasi)
Ha : ρ ≠ 0 (ada korelasi )
df = 15-1-1 = 13
t 1/2α = 2.1604
t = (√
√
√
√
t = 6.38528
kriteria :
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
Ternyata -6.38528 < -2.1604 atau 6.38528 > 2.1604 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi positif antara laba dan omzet
penjualan.
99
7. Dibawah ini adalah biaya promosi dan volume penjualan dari PT.Cahaya Kamila.
Biaya Promosi
(Rupiah)
Volume Penjualan
(Buah)
12 56
13.50 62.43
12.75 60.85
12.60 61.30
14.85 65.83
15.20 66.35
15.75 65.26
16.80 68.80
18.45 70.47
17.90 65.20
Tentukan :
a. Persamaan regresi dan interpretasi!
b. Hitunglah standard error estimasinya!
c. Taksirlah berapa volume penjualan, apabila biaya promosi yang dikeluarkan adalah Rp
19?
Jawab :
Biaya Promosi
(X)
Volume
Penjualan
(Y)
X2 Y
2 XY
12 56 144 3136 672
13.50 62.43 182.25 3897.5 842.805
12.75 60.85 162.563 3702.72 775.838
12.60 61.30 158.76 3757.69 772.38
14.85 65.83 220.523 4333.59 977.576
15.20 66.35 231.04 4402.32 1008.52
15.75 65.26 248.063 4258.87 1027.85
16.80 68.80 282.24 4733.44 1155.84
18.45 70.47 340.403 4966.02 1300.17
17.90 65.20 320.41 4251.04 1167.08
ΣX=149.8 ΣY=642.49 Σ X2=2290.25 Σ Y
2=41439.2 Σ XY=9700.05
100
a. a =
( )
( )( ) ( )( )
( ) ( ) 39.77692
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( ) 1.63365
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa volume penjualan tanpa dipengaruhi oleh
variabel apapun adalah sebesar rupiah. Sedangkan jika dipengaruhi oleh biaya
promosi, jika biaya promosi naik sebesar 1 rupiah, maka rata-rata vome penjualan akan
naik sebesar 1.63365 satuan, ceteris paribus.
b. SYX =√
= √
( )( ) ( )( )
= 62.9775912527
Jadi, rata-rata penyimpangan variabel volume penjualan prediksi terhadap variabel volume
penjualan sebenarnya adalah 62.9775912527.
c. Y = X
Y = (15)
Y = 64.28167
Jadi, ketika biaya promosi yang dikeluarkan adalah Rp 19 maka volume penjualan adalah
sebesar 64.28167.
101
REGRESI DAN KORELASI BERGANDA
A. REGRESI LINEAR BERGANDA
1. Hubungan Linear Lebih dari Dua Variabel
Disamping hubungan linear antar dua variabel, hubungan linear lebih dari dua
variabel juga sering terjadi. Misalnya, hubungan antara hasil penjualan dengan harga
dan daya beli, hubungan antara rata-rata harga beras dengan dengan jumlah
penduduk, pendapatan, dan jumlah uang beredar, atau hubungan antara produksi
padi dengan bibit, pupuk, luas sawah, dan curah hujan. (Ir. M. Iqbal Hasan, M.M.,
Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua).Friedman (1962)
menyatakan bahwa keputusan seseorang untuk mengonsumsi sesuatupada dasarnya
tidak hanya dipengaruhi oleh faktor pendapatannya, tetapi juga perkiraan
pendapatannya pada masa akan dating, selain faktor suku bunga, pajak, distribusi
pendapatan, dan lainnya.
Hubungan linear lebih dari dua variabel bila dibuat dalam persamaan
matematis sebagai berikut:
= a + b1X1 + b2X2+ ... +bkXk
Keterangan:
Y = variabel dependen
X1, X2, ..., Xk = variabel independen
a = bilangan konstan (konstanta)
b1, b2, ..., bk = koefisien variabel
Pada persamaan linear lebih dari dua variabel, variabel Y dipengaruhi oleh
lebih dari dua variabel, yaitu X1, X2,...., Xk. Dimana variabel Y disebut dengan
variabel terikat atau dependent variable / explained variable / predictand /
regressand / response / endogeneous / outcome / controlled variable, dan variabel-
variabel X1, X2,...., Xk disebut dengan variabel bebas atau independent variable /
explanatory variable / predictor / regressor / stimulus / exogenous / covariate /
control variable.(Damodar N. Gujarati, Basic Econometrics).
102
2. Persamaan Regresi Linear Berganda
Regresi Linear berganda adalah regresi dimana variabel terikatnya (Y) di
dijelaskan oleh lebih dari satu variabel bebas (X1, X2,...., Xk) namun masih
menunjukkan diagram hubungan yang linear.(Ir. M. Iqbal Hasan, M.M., Pokok-
Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua)
Bentuk umum persamaan regresi linear berganda :
a. Bentuk Stokastik
= a + b1X1 + b2X2+ ... +bkXk + e
b. Bentuk Nonstokastik (Deterministik)
= a + b1X1 + b2X2+ ... +bkXk
Keterangan:
= variabel terikat / dependen (nilai duga Y)
X1, X2, ..., Xk = variabel bebas / independen
a = bilangan konstan (konstanta)
b1, b2, ..., bk = koefisien regresi (parameter)
e = nilai residual / error / pengganggu (Y- )
3. Persamaan Regresi Linear Berganda dengan Dua Variabel Bebas
Bentuk umum persamaan regresi linear berganda dengan dua variabel bebas
adalah sebagai berikut:
= a + b1X1 + b2X2
Keterangan:
Y = variabel terikat / dependen (nilai duga Y)
X1, X2 = variabel bebas / independen
b1,b2 =koefisien regresi linear berganda disebut juga sebagai koefisien
regresi parsial (partial coefficient regression)
a = konstanta (nilai Y, apabila X1 = X2 = 0)
b1 = besarnya kenaikan/penurunan Y dalam satuan,
jika X1naiksatu satuan dan X2 konstan
b2 = besarnya kenaikan/penurunan Y dalam satuan,
jika X2naik satu satuan dan X1 konstan
+ atau - = tanda yang menunjukkan arah hubungan antara Y dan X1atau X2
103
Nilai dari koefisien a, b1, b2 dapat ditentukan salah satunya dengan metode
kuadrat terkecil atau Ordinary Least Square Method.
Metode Kuadrat Terkecil
Metode Kuadrat terkecil atau Ordinary Least Square Method pada prinsipnya
adalah meminimumkan jumlah kuadrat deviasi di sekitar garis regresi. Dan nilai
koefisien regresi a, b1, dan b2 dapat dipecahkan secara simultan dari tiga persamaan
berikut :
∑Y = na + b1∑X1 + b2∑X2
∑X1Y = a∑X1 + b1∑X12 + b2∑X1∑X2
∑X2Y = a∑X2 + b1∑X1∑X2 + b2∑X22
Untuk mendapatkan koefisien regresi a, b1, dan b2 dengan menggunakan persamaan
di atas, diperlukan perhitungan yang cukup panjang, oleh karena itu, dikembangkan
beberapa cara yang lebih mudah, sebagai berikut :
A = n∑X1Y – ∑X1∑Y
B = n∑X22– (∑X2)
2
C = n∑X1X2 - ∑X1∑X2
D = n∑X2Y - ∑X2∑Y
E = n∑X12– (∑X1)
2
F = EB – C2
Dari beberapa persamaan tersebut, nilai koefisien regresi untuk a, b1, dan b2dapat
diperoleh dengan cara berikut :
∑ ∑ ∑
104
B. PENGUJIAN KOEFISIEN REGRESI
1. Standard Error of Estimate / KesalahanBaku dalam Penaksiran (SE)
Kesalahan baku dalam penaksiran melihat seberapa jauh nilai penduga, yaitu b1
dan b2 dari nilai sebenarnya, yaitu B1 dan B2 (parameter populasi). Oleh karena
nilai ini menunjukkan besarnya penyimpangan atau error, maka semakin kecil
nilainya dianggap akan lebih baik. Untuk menghitung kesalahan baku ini dapat
digunakan rumus berikut :
√
∑
∑ ∑ (∑ )
∑
∑ ∑ (∑ )
df = n – k – 1 = n – 3
∑
∑ ∑( )
2. Pendugaan Hipotesis Koefisien Regresi Berganda (Parameter 𝛃1 dan 𝛃1)
a. Pengujian Hipotesis Simultan (F statistik)
Digunakan untuk melihat signifikansi variabel independent
( )secara keseluruhan / bersama–sama dalam mempengaruhi nilai
variabel dependen (Y).Langkah-langkah pengujiannya adalah sebagai berikut :
i. Menentukan formulasi hipotesis
(X1 dan X2 secara bersama-sama tidak
mempengaruhi Y)
(X1 dan X2 secara bersama-sama mempengaruhi Y atau
paling sedikit ada satu X yang mempengaruhi Y)
ii. Menentukan Taraf nyata (α) dan nilai F
Taraf nyata (α) dan nilai F tabel ditentukan dengan derajat kebebasan v1 = k -
1 dan v2 = n – k.
105
iii. Menentukan nilai F stat
SST = ΣY2 – n Y 2
SSR = b1 ΣX1Y + b2 ΣX2Y
SSE = SST – SSR
iv. Menentukan Kriteria Pengujian
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
atau
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
v. Membuat Kesimpulan
Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
b. Pengujian Hipotesis Individual / Parsial (t statistik)
Digunakan untuk melihat signifikansi variabel independent ( )
secara parsial dalam mempengaruhi variabel dependen (Y).Langkah-langkah
pengujiannya adalah sebagai berikut :
i. Menentukan formulasi hipotesis
Ho : 𝛃i = 0 ( tidak ada pengaruh Xi secara parsial terhadap Y)
Ha : 𝛃i > 0 ( ada pengaruh positif Xi secara parsial terhadap Y)
𝛃i < 0 ( ada pengaruh negatif Xi secara parsial terhadap Y)
𝛃i ≠ 0 ( ada pengaruh Xi secara parsial terhadap Y)
ii. Menentukan Taraf nyata (α) dan nilai t tabel
Taraf nyata dari t tabel ditentukan dengan derajat kebebasan :
df = n – k – 1, (k = banyaknya jumlah variabel X)
iii. Menentukan nilai t stat
iv. MenentukanKriteria Pengujian
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
3,2,
iSb
Bbt
i
iistat
1df
SSRMSR
2df
SSEMSE
106
tstat> ttabel→ Ho ditolak
atau
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
v. Membuat Kesimpulan
Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
C. KORELASI LINEAR BERGANDA
Korelasi linear berganda merupakan alat ukur mengenai hubungan yang
terjadi antara variabel terikat (variabel Y) dan dua atau lebih variabel bebas (X1, X2,
..., Xk). Analisis korelasinya menggunakan tiga koefisien korelasi, yaitu koefisien
determinasi berganda, koefisien korelasi berganda dan koefisien korelasi parsial.(Ir.
M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi
kedua )
a. Koefisien Determinasi Berganda (R2)
Koefisien Determinasi Berganda, dilambangkan dengan R2, merupakan ukuran
kesesuaian garis regresi linear berganda terhadap suatu data. Koefisien determinasi
tersebut digunakan untuk :
Mengukur besarnya kontribusi variasi X1 dan X2 (variable independen)
terhadap variasi Y dalam hubungnnya dengan persamaan garis regresi
linear berganda = a + b1X1 + b2X2.
Menentukkan apakah garis regresi linear berganda Y terhadap X1 dan X2
sudah cocok untuk dipakai sebagai pendekatan hubungan linear antar
variabel berdasarkan hasil observasi (goodness of fit).
Nilai koefisien determinasi berganda terletak antara 0 dan 1 (0 ≤ R2 ≤ 1).
Koefisien determinasi berganda dirumuskan:
(Ir. M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi
kedua )
2
22112
y
yxbyxbR
107
b. Koefisien Korelasi Berganda (R)
Koefisien korelasi berganda, disimbolkan Ry.12, merupakan ukuran keeratan
hubungan antara variabel terikat dan semua variabel bebas secara bersama-sama.
c. Koefisien Korelasi Parsial (r)
Koefisien korelasi parsial merupakan koefisien korelasi antara dua variabel
jika variabel lainnya konstan, pada hubungan yang melibatkan lebih dari dua
variabel. Sebelum menghitung koefisien korelasi parsial, dilakukan terlebih dahulu
perhitungan koefisien korelasi sederhana, yaitu:
∑ ∑ ∑
√[ ∑ (∑ ) ][ ∑ (∑ ) ]
∑ ∑ ∑
√[ ∑ (∑ ) ][ ∑ (∑ ) ]
∑ ∑ ∑
√[ ∑ (∑ ) ][ ∑
(∑ ) ]
Koefisien Korelasi Parsial antara Y dan X1, apabila X2 konstan
√( )( )
Koefisien Korelasi Parsial antara Y dan X2, apabila X1 konstan
√( )(
)
Koefisien Korelasi Parsial antara X1 dan X2, apabila Y konstan
√( )(
)
(Suharyadi & Purwanto, Statistika, Untuk Ekonomi dan Keuangan Modern, Edisi 2)
2
2211
12.y
yxbyxbRy
108
Contoh soal:
Dibawah ini adalah data dari PDB, jumlah investasi, dan nilai ekspor negara YY dalam kurun
waktu 10 tahun terakhir:
PDB
(triliun rupiah)
Jumlah Investasi
(miliar rupiah)
Nilai Ekspor
(miliar rupiah)
190 20 40
340 45 65
350 30 70
400 57 80
300 40 50
450 62 80
370 50 70
180 22 35
280 60 40
300 34 60
Sumber: fiktif
a. Tentukan persamaan regresi dan interpretasikan!
b. Tentukan koefisien determinasi dan nondeterminasi! Interpretasikan nilainya!
c. Berapa besar penyimpangan variabel PDB yangdiprediksi terhadap variabel PDB
sebenarnya?
d. Tentukan koefisien korelasi berganda dan korelasi parsial antara variabel jumlah
investasi terhadap variabel PDB dengan menganggap variabel nilai ekspor konstan,
korelasi parsial antara variabel nilai ekspor terhadap variable PDB dengan
menganggap variabel jumlah investasi konstan, dan korelasi parsial antarvariabel
independen ! Bagaimana sifatnya?
e. Dengan tingat kepercayaan 95%, apakah jumlah investasi dan nilai ekspor
memengaruhi secara parsial terhadap PDB?
f. Apakah investasi dan nilai ekspor memengaruhi secara bersama-sama terhadap PDB?
(α=5%)
109
Penyelesaian:
Langkah – langah dengan menggunakan softwareSPSS :
1. Buka SPSS, masukkan nama variabel pada variable view, dan masukkan data pada
data view
2. pada menu bar, pilih analyze, sub menu regression, lalu klik linear
3. masukkan variabel Y ke dalam kotak dependent dan X1 dan X2 ke dalam kotak
independent
4. Klik Statistics
Regression Coefficient → aktifkan estimates
Aktifkan model fit, descriptives, dan part and partial correlations
Klik Continue
5. Klik Option
Pilih Stepping Method Kriteria → entry 0.05
Aktifkan Include Constant in Equation
Pada box missing value pilih exclude cases pairwise
Klik Continue
Lalu klik OK
6. Outputnya adalah sebagai berikut :(Jawab)
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std.
Error Beta
Zero-
order Partial Part
1 (Constant) 8.942 20.079
0.445 0.669
X1 1.987 0.416 0.356 4.772 0.002 0.766 0.875 0.298
X2 3.79 0.38 0.744 9.971 0 0.94 0.967 0.622
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 8,942 + 1,987 X1 + 3,790 X2
Interpretasi :
a = 8,942
Tanpa dipengaruhi oleh variabel apapun, rata – rata PDB yang didapatkan negara YY
adalah sebesar 8,942 triliun rupiah.
110
b1 = 1,987
Artinya, setiap kenaikan jumlah investasi sebesar 1 miliar rupiah, maka rata – rata PDB
akan naik sebesar 1,987 triliun rupiah dengan variabel nilai ekspor dianggap konstan.
b2 = 3,790
artinya setiap kenaikan nilai ekspor sebesar 1 miliar rupiah, maka rata – rata PDB akan
naik sebesar 3,790 triliun rupiah dengan variabel investasi dianggap konstan.
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .986a .973 .965 16.00284
a. Predictors: (Constant), X2, X1
b. Koefisien determinasi : R2 = 0,973
Koefisien nondeterminasi : K2
= 1 - R2 = 1 – 0,973 = 0,027
Artinya,variabel jumlah investasidanvariabel nilai ekspor mampu menjelaskan variasi
dari PDB negara YY sebesar 97,3%, dan sisanya sebesar 2,7% dijelaskan oleh faktor
lain di luar model.
c. Standard Error of Estimate (SE)
SE = 16,00284
Artinya, rata-rata penyimpangan variabel PDB yang diprediksi dengan variabel PDB
sebenarnya adalah sebesar 16,00284 Triliun Rupiah
d. Koefisien korelasi berganda (R) = 0,986
Artinya, hubungan keseluruhan antara variabel PDB, variabeljumlah investasi, dan
variabel nilai eksporadalah searah dan sifatnya sangat erat yaitu sebesar 0,986.
111
Correlations
Y X1 X2
Pearson
Correlation
Y 1.000 .766 .940
X1 .766 1.000 .550
X2 .940 .550 1.000
Sig. (1-tailed) Y . .005 .000
X1 .005 . .050
X2 .000 .050 .
N Y 10 10 10
X1 10 10 10
X2 10 10 10
ry1.2 = 0,766
Artinya hubungan antara variabel jumlah investasi secara parsial terhadap variabel
PDB adalahsearah dan sifatnya erat dengan nilai sebesar 0,766, dengan menganggap
variabel nilai ekspor konstan.
ry2.1 = 0,940
Artinya hubungan antara variabel nilai ekspor secara parsial terhadap variabel PDB
adalahsearah dan sifatnya sangat erat dengan nilai sebesar 0,940, dengan menganggap
variabel jumlah investasi konstan.
r12.y = 0,550
Artinya hubungan antara variabel jumlah investasi dan variabel nilai ekspor secara
parsial adalahsearah dan sifatnya cukup eratdengan nilai sebesar 0,550, dengan
menganggap variabel PDB konstan.
112
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std.
Error Beta
Zero-
order Partial Part
1 (Constant) 8.942 20.079
0.445 0.669
X1 1.987 0.416 0.356 4.772 0.002 0.766 0.875 0.298
X2 3.79 0.38 0.744 9.971 0 0.94 0.967 0.622
a. Dependent Variable: Y
e. Uji t statistik :
1. Uji Parsial variabel PDB terhadap Variabel Jumlah Investasi
Hipotesis :
(variabel jumlah investasi secara parsial tidak berpengaruh
signifikan terhadap variabel PDB)
(variabel jumlah investasi secara parsial berpengaruh signifikan
terhadap variabel PDB)
Nilai t stat dan t tabel :
t stat = 4,772
t tabel = 2,3646
df = n – k – 1 = 10 – 2 – 1 = 7
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 4,772 ˃ 2,3646 makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,002 dan α = 0,05
Ternyata Sig. < α, yaitu 0,002< 0,05 maka ditolak
113
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah investasi secara parsial
berpengaruh signifikan terhadap variabel PDB
2. Uji Parsial variabel PDB terhadap Variabel Jumlah Investasi
Hipotesis :
(variabel nilai ekspor secara parsial tidak berpengaruh signifikan
terhadap variabel PDB)
(variabel nilai ekspor secara parsial berpengaruh signifikan
terhadap variabel PDB)
Nilai t stat dan t tabel :
t stat = 9,971
t tabel = 2,3646
df = n – k – 1 = 10 – 2 – 1 = 7
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 9,971 > 2,3646 makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,000 dan α = 0,05
Ternyata Sig. < α, yaitu 0,000< 0,05 maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel nilai ekspor secara parsial berpengaruh
signifikan terhadap variabel PDB.
114
f. Uji F statistik
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 64047.363 2 32023.681 125.048 .000a
Residual 1792.637 7 256.091
Total 65840.000 9
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hipotesis :
(variabel jumlah investasidan variabel nilai ekspor secara
bersama-samatidak berpengaruh signifikan terhadap
variabel PDB)
(variabel jumlah investasidan variabel nilai eksporsecara
bersama-sama berpengaruh signifikan terhadap variabel
PDB)
Nilai F stat dan F tabel :
F stat = 125,048 F tabel = 5,32 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 10 – 2 = 8
Kriteria uji :
i. Uji tabel F
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
Ternyata F stat > F tabel, yaitu 125,048 >5,32 maka Ho ditolak
ii. Uji Sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,000 dan α = 0,05
Ternyata Sig. < α, yaitu 0,000< 0,05, maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah investasidan variabel nilai
eksporsecara bersama-sama berpengaruh signifikan terhadap variabel PDB
115
SOAL REGRESI DAN KORELASI BERGANDA
1. Konsumen yang loyal akan memberi peningkatan keuntungan. Banyak cara yang bisa
dilakukan untuk meningkatkan loyalitas konsumen. Untuk memuaskan konsumen,
ada pemikiran di kalangan pengusaha kuliner atau rumah makan di daerah Bandung
untuk meningkatkan keuntungan usaha, yaitu dengan menambah jumlah tenaga kerja
untuk meningkatkan kepuasan pelayanan atau memperluas area parkir sebagai usaha
memberikan pelayanan yang baik pada konsumen. Untuk itu, dilakukan survey
terhadap 15 pengusaha kulinerdi wilayah Bandung pada tahun 2012. Hasil survey
tersebut adalah sebagai berikut:
Nama Restoran Pendapatan
(Juta Rupiah)
Jumlah Tenaga Kerja
(Orang)
Parkir Mobil
(Ruang)
Double Steak 280 14 18
Waroeng Steak 130 7 3
Steak Ranjang 123 13 8
Giggle Box 160 12 7
Hummingbird 450 39 36
Tokyo Connection 570 67 84
The Cost 315 20 5
Javan Steak 64 4 8
Kopi Progo 340 48 55
Hanamasa 670 81 98
Laksana 370 12 65
Nanny’s Pavillon 644 59 9
Bebek Garang 128 44 12
The Kiosk 415 28 9
Ampera 387 65 12
a. Tentukan persamaan regresinya dan interpretasikan !
b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial !
Interpretasikan !
c. Berapa besar penyimpangan variabel pendapatan pengusaha kuliner
yangdiprediksi terhadap variabel pendapatan yang sebenarnya?
116
d. Lakukan pengujian secara parsial antar variabel pendapatan dan jumlah tenaga
kerja, juga variabel pendapatan dan parkir mobil, dengan tingkat signifikansi
5% !
e. Lakukan pengujian simultan antara variabel jumlah tenaga kerja dan variabel
parkir mobil terhadap variabel pendapatan !
f. Jika anda seorang pengusaha kuliner di Bandung, apakah anda harus
menambah tenaga kerja saja, area parkir saja, atau keduanya ?
Jawab :
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
Correlations
B Std. Error
Beta
Zero-order
Partial Part
1 (Constant)
123.911 54.379 2.279 0.042
X1 4.873 1.5789 0.634 3.087 0.009 0.785 0.665 0.519
X2 1.602 1.260 0.261 1.271 0.228 0.627 0.345 0.214
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 123,911 + 4,873 X1 + 1,602 X2
Interpretasi :
a = 123,911
Tanpa dipengaruhi oleh variabel apapun, rata – rata pendapatan yang didapatkan
pengusaha kuliner adalah sebesar Rp 123.911.000.
b1 = 4,873
Artinya, setiap kenaikan jumlah tenaga kerja sebanyak 1 orang, maka rata – rata
pendapatan pengusaha kuliner akan naik sebesar Rp 4.873.000 dengan variabel
lahan parkir mobil dianggap konstan.
b2 = 1,602
Artinya setiap kenaikan lahan parkir mobil sebanyak1 lahan, maka rata – rata
pendapatan akan naik sebesar Rp 1.602.000 dengan variabel jumlah tenaga kerja
dianggap konstan.
117
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .813a .661 .605 121.55813
a. Predictors: (Constant), X2, X1
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .785 .627
X1 .785 1.000 .576
X2 .627 .576 1.000
Sig. (1-tailed)
Y . .000 .006
X1 .000 . .012
X2 .006 .012 .
N
Y 15 15 15
X1 15 15 15
X2 15 15 15
b.
Koefisien Determinasi : R2 = 0,605 (Adjusted R
2)
Koefisien Non Determinasi : K2
= 1 - R2 = 1 – 0,605 = 0,395
Artinya,variabel jumlah tenaga kerjadanvariabel lahan parkir mobil mampu
menjelaskan variasi dari pendapatan pengusaha kulinersebesar 60,5%, dan sisanya
sebesar 39,5% dijelaskan oleh faktor lain di luar model.
Koefisien Korelasi Berganda (R) = 0,813
Artinya, hubungan keseluruhan antara variabel pendapatan pengusaha kuliner,
variabeljumlah tenaga kerja, dan variabel lahan parkir adalah searah dan sifatnya
cukup erat yaitu sebesar 0,813 atau 81,3%.
Koefisien Korelasi Parsial (r)
ry1.2 = 0,785
Artinya hubungan antara variabel jumlah tenaga kerja secara parsial terhadap
variabel pendapatan pengusaha kulineradalah searah dan sifatnya eratdengan
nilai sebesar 0,785, dengan menganggap variabel lahan parkir mobil konstan.
118
ry2.1 = 0,627
Artinya hubungan antara variabel lahan parkir mobil secara parsial terhadap
variabel pendapatan pengusaha kulineradalah searah dan
sifatnyacukuperatdengan nilai sebesar 0,627, dengan menganggap variabel
jumlah tenaga kerja konstan.
r12.y = 0,576
Artinya hubungan antara variabel jumlah tenaga kerja dan variabel lahan parkir
mobil secara parsial adalah searah dan sifatnya cukup eratdengan nilai sebesar
0,576, dengan menganggap variabel pendapatan pengusaha kuliner konstan.
c. Standard Error of Estimate (SE)
SE = 121,55813
Artinya, rata-rata penyimpangan variabel pendapatan pengusaha kuliner yang
diprediksi dengan variabel pendapatan pengusaha kuliner yang sebenarnya adalah
sebesar RP 121.558.130.
d. Uji t statistik :
1. Uji Parsial Variabel Pendapatan Pengusaha Kuliner Terhadap Variabel
Jumlah Tenaga Kerja
Hipotesis :
(variabel jumlah tenaga kerja secara parsial tidak berpengaruh
signifikan terhadap variabel pendapatan pengusaha kuliner)
(variabel jumlah tenaga kerja secara parsial berpengaruh
signifikan terhadap variabel pendapatan pengusaha kuliner)
Nilai t stat dan t tabel :
t stat = 3,087
t tabel = 2,1788
df = n – k – 1 = 15 – 2 – 1 = 12
α = 0,05
119
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 3,087 ˃ 2,1788makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,009 dan α = 0,05
Ternyata Sig. < α, yaitu 0,009< 0,05 maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah tenaga kerja secara parsial
berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner.
2. Uji Parsial Variabel Pendapatan Pengusaha Kuliner Terhadap Variabel
Lahan Parkir Mobil
Hipotesis :
(variabellahan parkir mobil secara parsial tidak berpengaruh
signifikan terhadap variabel pendapatan pengusaha kuliner)
(variabellahan parkir mobil secara parsial berpengaruh signifikan
terhadap variabel pendapatan pengusaha kuliner)
Nilai t stat dan t tabel :
t stat = 1,271
t tabel = 2,1788
df = n – k – 1 = 15 – 2 – 1 = 12
α = 0,05
120
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,1788 <1,271< 2,1788makaHo tidak
dapat ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,228 dan α = 0,05
Ternyata Sig. > α, yaitu 0,228 > 0,05 maka tidak dapat ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel lahan parkir mobil secara parsial tidak
berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner.
ANOVAb
Model Sum of
Squares df Mean Square F Sig.
1
Regression 346473.054 2 173236.527 11.724 .002a
Residual 177316.546 12 14776.379
Total 523789.600 14
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hipotesis :
(variabel jumlah tenaga kerja dan variabel lahan parkir
mobil secarabersama-sama tidak berpengaruh signifikan
terhadap variabel pendapatan pengusaha kuliner)
(variabel jumlah tenaga kerja dan variabel lahan parkir mobil
secara bersama-sama berpengaruh signifikan terhadap
variabel pendapatan pengusaha kuliner)
121
Nilai F stat dan F tabel :
F stat = 11,724 F tabel = 4,67 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 15 – 2 = 13
Kriteria uji :
iii. Uji tabel F
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
Ternyata F stat > F tabel, yaitu 11,724> 4,67 maka Ho ditolak
iv. Uji Sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,002 dan α = 0,05
Ternyata Sig. < α, yaitu 0,002< 0,05, maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah tenaga kerjadan variabel lahan
parkir mobilsecara bersama-sama berpengaruh signifikan terhadap variabel
pendapatan pengusaha kuliner.
2. Salah satu penyebab krisis ekonomi di Indonesia yang berkepanjangan adalah belum
membaiknya iklim di sektor riil yang disebabkan masih tingginya suku bunga kredit.
Ada beberapa alasan mengapa suku bunga bank tetap tinggi, yaitu masalah inflasi dan
nilai tukar. Berdasarkan hal tersebut, disusun hipotesis, yaitu suku bunga dipengaruhi
oleh besarnya inflasi dan nilai tukar secara individual. Untuk analisis tersebut, akan
digunakan data dari tahun 1996 sampai 2007. Berikut adalah hasil pengumpulan data
tersebut :
Tahun Suku Bunga
(% / tahun)
Inflasi
(% / tahun)
Nilai Tukar
(Rp / USD)
1996 20,37 8,91 1905
1997 20,69 9,52 1997
1998 19,25 9,48 2074
1999 15,24 9,77 2118
122
2000 16,77 9,24 2205
2001 16,86 6,09 2305
2002 17,02 6,47 2385
2003 18,49 11,05 5700
2004 25,09 7,63 8025
2005 26,22 2,01 7100
2006 19,55 9,35 9595
2007 19,15 12,55 10435
Dengan menggunakan data tersebut, buatlah persamaan regresinya dan apakah benar
suku bunga dipengaruhi oleh inflasi dan nilai tukar secara individual ?
Jawab :
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig. Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 22.644 2.641 8.576 .000
X1 -.651 .284 -.538 -2.296 .047 -.482 -.608 -.535
X2 .001 .000 .532 2.272 .049 .476 .604 .529
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 22,644– 0,651X1 + 0,001X2
Interpretasi :
a = 22,644
Tanpa dipengaruhi oleh variabel apapun, rata – rata suku bunga kredit adalah
sebesar22,644%.
b1 = -0,651
Artinya, setiap kenaikan inflasi sebesar 1%, maka rata – rata suku bunga
kreditakanturun sebesar 0,651%, dengan variabel nilai tukar dianggap konstan.
b2 = 0,001
Artinya setiap kenaikan nilai tukar sebesarRp 1 / USD, maka rata – rata suku
bunga kreditakan naik sebesar 0,001% dengan variabel inflasi dianggap konstan.
123
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1
Regression 60.597 2 30.298 4.709 .040a
Residual 57.903 9 6.434
Total 118.500 11
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
b. Uji t statistik :
1. Uji Parsial Variabel Suku Bunga Kredit Terhadap Variabel Inflasi
Hipotesis :
(variabelinflasi secara parsial tidak berpengaruh signifikan
terhadap variabel suku bunga kredit)
(variabelinflasi secara parsial berpengaruh signifikan terhadap
variabel suku bunga kredit)
Nilai t stat dan t tabel :
t stat = -2,296
t tabel = 2,2622
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat˂-ttabel, yaitu -2,296˂-2,2622makaHo ditolak
ii. UjiSig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,047 dan α = 0,05
Ternyata Sig. < α, yaitu 0,047< 0,05 maka ditolak
124
Kesimpulan :
Pada tingkat signifikansi 5%, variabel inflasi secara parsial berpengaruh
signifikan terhadap variabelsuku bunga kredit.
2. Uji Parsial Variabel Suku Bunga Kredit Terhadap Variabel Nilai Tukar
Hipotesis :
(variabelnilai tukar secara parsial tidak berpengaruh signifikan
terhadap variabel suku bunga kredit)
(variabelnilai tukar secara parsial berpengaruh signifikan terhadap
variabel suku bunga kredit)
Nilai t stat dan t tabel :
t stat = 2,272
t tabel = 2,2622
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyatatstat> ttabel, yaitu 2,272> 2,2622makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,049dan α = 0,05
Ternyata Sig. < α, yaitu 0,049< 0,05 maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel nilai tukar secara parsial tidak
berpengaruh signifikan terhadap variabel suku bunga kredit.
125
3. Taufik, The district sales manager for a major automobile manufacturer is studying
car sales. Specifically, he would like to determine what factors affect the number of
cars sold at a dealership. To investigate, he randomly selects 10 dealers. From these
dealers, he obtains the number cars sold last month, the minutes of radio advertising
purchased last month, the number of full-time salespeople employed in the dealership,
and wheter the dealer is located in the city. The information is as follows :
Cars Sold Last Month Advertising Sales Force City
(No = 0, Yes = 1)
127 18 10 Yes
138 15 15 No
159 22 14 Yes
144 23 12 Yes
139 17 12 No
128 16 12 Yes
161 25 14 Yes
180 26 17 Yes
102 15 7 No
163 24 15 Yes
a. Determine the regression equation, how many cars would to be sold by a
dealership employing 20 salespeople, purchasing 15 minutes of advertising, and
located in a city ?
b. Conduct a global test of hypothesis with α = 5%
c. Conduct a test of hypothesis for the individual regression coefficients. Would you
consider deleting any of the independent variables ? Let α = 5%
Jawab :
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig. Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 30.816 7.657 4.024 .007
X1 2.687 .534 .518 5.034 .002 .868 .899 .304
X2 4.713 .612 .600 7.699 .000 .910 .953 .465
X3 -1.513 4.014 -.033 -.377 .719 .546 -.152 -.023
126
a. Regression Equatiom :
Y = 30,818 + 2,687 X1 + 4,713 X2- 1,513 X3
Interpretation :
a = 30,818
Without affected with no variable, the average of cars sold is about 30,818 or 31
unit of cars.
b1 = 2,687
Every increasing of 1 minutes advertising, the average of cars sold will be increase
as much as 2,687 or 3 unit of cars, considering sales force and city variable are
constant.
b2 = 4,713
Every increasing of 1 salespeople, the average of cars sold will be increase as much
as 4,713 or 5 unit of cars, considering advertising and city variable are constant.
b3 = -1,513
Every increasing of 1 point of distantce of the dealer to the city, the average of cars
sold will be decrease as much as 1,513 or 2 unit of cars, considering advertising
and sales force variable are constant.
Estimation :
Advertising = 15 minutes
Sales Force = 20 salespeople
The Dealer near the city (X3 = -1), [X=1 (farther to the city), X=-1 (nearby the city)
Y = 30,818 + 2,687 X1 + 4,713 X2- 1,513 X3
Y = 30,818 + (2,687 x 15) + (4,731 x 20) – (1,513 x -1)
Y = 167,256 ~ 168
So, there would be 168 cars sold by a dealership employing 20 salespeople,
purchasing 15 minutes of advertising, and located in a city.
127
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1
Regression 4441.505 3 1480.502 89.370 .000a
Residual 99.395 6 16.566
Total 4540.900 9
a. Predictors: (Constant), X3, X2, X1
b. Dependent Variable: Y
b. Global Hypothesis Test
Hypothesis :
(Advertising, sales force, and dealer location variables
simultaneous don’t affect significantly the amount of cars
sold las month)
(Advertising, sales force, and dealer location variables
simultaneous affect significantly the amount of cars sold
las month)
The Value of F-Stat and F-table :
F stat = 89,370 F tabel = 4,74 α = 0,05
v1 = k – 1 = 3 – 1 = 2
v2 = n – k = 10 – 3 = 7
Criteria :
i. F-Table Test
F stat ≤ F table → Ho accepted
F stat > F table → Ho rejected
F stat > F table, or 89,370> 4,74soHo rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,000andα = 0,05
Sig. < α, or 0,000< 0,05, so rejected
128
Conclusion :
Using 5% significance level, advertising, sales force, and dealer location
variables simultaneous affect significantly to the amount of cars sold last month.
c. t-Test :
1. Partial Test of Advertising Variable to The Amount of Cars Sold
Hypothesis :
(Advertising variable partially doesn’t affect significantly to the
amount of cars sold variable)
(Advertising variable partially affects significantly to the amount
of cars sold variable)
Value of t-stat and t-table :
t stat = 5,034
t table = 2,447
df = n – k – 1 = 10 – 3 – 1 = 6
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat>ttable, or5,034>2,447, so Ho rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,002andα = 0,05
Sig. < α, or0,002< 0,05so rejected
Conclusion :
Using 5% significance level, advertising variable partiallyaffects significantly
to the amount of cars sold last month.
129
2. Partial Test of Sales Force Variable to The Amount of Cars Sold
Hypothesis :
(Sales force variable partially doesn’t affect significantly to the
amount of cars sold variable)
(Sales force variable partially affects significantly to the amount
of cars sold variable)
Value of t-stat and t-table :
t stat = 7,699
t table = 2,447
df = n – k – 1 = 10 – 3 – 1 = 6
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat>ttable, or7,699 > 2,447, so Ho rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,000 and α = 0,05
Sig. < α, or0,000< 0,05so rejected
Conclusion :
Using 5% significance level, sales force variable partiallyaffects significantly
to the amount of cars sold last month.
3. Partial Test of Dealer Location Variable to The Amount of Cars Sold
Hypothesis :
(Dealer location variable partially doesn’t affect significantly to
the amount of cars sold variable)
(Dealer location variable partially affects significantly to the
amount of cars sold variable)
130
Value of t-stat and t-table :
t stat = -0,377
t table = 2,447
df = n – k – 1 = 10 – 3 – 1 = 6
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
-ttable ≤ tstat ≤ ttable, or-2,447 <-0,377< 2,447, so Ho accepted
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,719 and α = 0,05
Sig. ≥ α, or0,719≥ 0,05so accepted
Conclusion :
Using 5% significance level, dealer location variable partiallydoesn’taffects
significantly to the amount of cars sold last month.
Variables Entered/Removedb
Model Variables Entered Variables Removed Method
1 X3, X2, X1a . Enter
a. All requested variables entered.
b. Dependent Variable: Y
There is no variable should be removed or deleted from the model, although
one variable (dealer location) doesn’t affect significantly to the amount of
cars sold last month.
131
4. Menurut para pengusaha di bidang properti, faktor-faktor yang paling mempengaruhi
harga apartemen adalah luas apartemen itu sendiri, jumlah ruangan di dalamnya,
fasilitas apartemen, dan jarak apartemen ke pusat perbelanjaan dan rekreasi. Berikut
ini adalah data yang diperoleh dari beberapa apartemen di Bandung :
Nama Apartemen Harga
(Rp .000.000)
Luas
(m2)
Jumlah
Ruangan Fasilitas
Jarak ke Pusat
Perbelanjaan (Km)
Dago Suites 275 24 2 4 3
Grand Setiabudhi 300 32 3 5 8
Grand Asia Afrika 250 28 3 5 5
Marbella Suites 143 15 2 3 10
Newton Hybrid 460 40 4 6 7
Pasadena 226 35 3 5 15
Pinewood 178 20 2 3 25
The Majesty 294 27 2 3 12
The Jarrdin 330 33 3 6 10
The Edge 312 26 2 6 9
a. Tentukan persamaan regresi dan berikan interpretasinya !
b. Tentukan koefisien determinasi, korelasi sederhana, dan korelasi parsial untuk
semua variabel independen terhadap variabel dependen ! Interpretasikan.
Jawab :
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig. Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 66.637 112.822 .591 .580
X1 9.611 6.329 .806 1.519 .189 .799 .562 .360
X2 -22.747 59.483 -.181 -.382 .718 .661 -.169 -.091
X3 8.105 26.863 .117 .302 .775 .704 .134 .072
X4 -3.566 3.771 -.250 -.946 .388 -.450 -.389 -.224
a. Dependent Variable: Y
132
a. Persamaan regresi :
Y = 66,637 + 9,611 X1– 22,747 X2+ 8,105 X3 – 3,566 X4
Interpretasi :
a = 66,637
Tanpa dipengaruhi oleh variabel apapun, rata – rata harag apartemen di Bandung
adalah sebesar Rp 66.637.000.
b1 = 9,611
Artinya, setiap kenaikan luas apartemen sebesar 1 m2, maka rata – rata harga
apartemen akan naik sebesar Rp 9.611.000 dengan variabel jumlah ruangan,
fasilitas, dan jarak ke pusat perbelanjaan dan rekreasi dianggap konstan.
b2 = -22,747
Artinya setiap kenaikanjumlahruangan apartemen sebanyak1 ruangan, maka rata –
rata harga apartemen akan turun Rp 22.747.000 dengan variabel luas apartemen,
fasilitas, dan jarak ke pusat perbelanjaan dan rekreasi dianggap konstan.
b3 = 8,105
Artinya, setiap kenaikan jumlah fasilitas apartemen sebanyak 1 macam, maka rata
–rata harga apartemen akan naik sebesar Rp 8.105.999 dengan variabel luas
apartemen, jumlah ruangan, dan jarak ke pusat perbelanjaanm dan rekreasi
dianggap konstan.
b4 = -3,566
Artinya setiap kenaikan jarak apartemen ke pusat perbelanjaan dan rekreasi
sebanyak1 km, maka rata – rata harga apartemen akan turun sebesar Rp 3.566.000
dengan variabel luas apartemen, jumlah ruangan, dan fasilitas dianggap konstan.
133
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .848a .719 .494 62.50674
a. Predictors: (Constant), X4, X1, X3, X2
Correlations
Y X1 X2 X3 X4
Pearson Correlation
Y 1.000 .799 .661 .704 -.450
X1 .799 1.000 .863 .752 -.248
X2 .661 .863 1.000 .678 -.269
X3 .704 .752 .678 1.000 -.420
X4 -.450 -.248 -.269 -.420 1.000
Sig. (1-tailed)
Y . .003 .019 .011 .096
X1 .003 . .001 .006 .245
X2 .019 .001 . .016 .226
X3 .011 .006 .016 . .113
X4 .096 .245 .226 .113 .
N
Y 10 10 10 10 10
X1 10 10 10 10 10
X2 10 10 10 10 10
X3 10 10 10 10 10
X4 10 10 10 10 10
b.
Koefisien Determinasi : R2 = 0,494 (Adjusted R
2)
Koefisien Non Determinasi : K2
= 1 - R2 = 1 – 0,494 = 0,506
Artinya,variabel luas apartemen, jumlah ruangan, fasilitas, dan jarak apartemen ke
pusat perbelanjaan dan rekreasi mampu menjelaskan variasi dari harga
apartemensebesar 49,4%, dan sisanya sebesar 50,6% dijelaskan oleh faktor lain di
luar model.
Koefisien Korelasi Berganda (R) = 0,848
Artinya, hubungan keseluruhan antara variabel harga apartemen, variabel luas
apartemen, jumlah ruangan, fasilitas, dan jarak apartemen ke pusat perbelanjaan
dan rekreasiadalah searah dan sifatnya erat yaitu sebesar 0,848 atau 84,8%.
134
Koefisien Korelasi Parsial (r)
ry1.234 = 0,799
Artinya hubungan antara variabel luas apartemen secara parsial terhadap variabel
harga apartmenadalah searah dan sifatnya eratdengan nilai sebesar 0,799, dengan
menganggap konstan variabel jumlah ruangan, fasilitas, dan jarak ke pusat
perbeanjaan dan rekreasi.
ry2.134 = 0,661
Artinya hubungan antara variabel jumlah ruangan secara parsial terhadap variabel
harga apartemenadalah searah dan sifatnya cukup eratdengan nilai sebesar
0,661, dengan menganggap konstan variabel luas apartemen, fasilitas, dan jarak ke
pusat perbelanjaan dan rekreasi.
ry3.124 = 0,704
Artinya hubungan antara variabel fasilitas secara parsial terhadap variabel harga
apartmenadalah searah dan sifatnyaeratdengan nilai sebesar 0,704, dengan
menganggap konstan variabel luas apartmen, jumlah ruangan, dan jarak ke pusat
perbelanjaan dan rekreasi.
ry4.123 = -0,405
Artinya hubungan antara variabel jarak ke pusat perbelanjaan dan rekreasi secara
parsial terhadap variabel harga apartmenadalah berlainan arah dan
sifatnyacukup eratdengan nilai sebesar 0,405, dengan menganggap konstan
variabel luas apartmen, jumlah ruangan, dan fasilitas.
r12.y34 = 0,863
Artinya hubungan antara variabel luas apartemen dan variabel jumlah ruangan
secara parsial adalah searah dan sifatnya eratdengan nilai sebesar 0,863, dengan
menganggap variabel lainnya konstan.
r13.y24 = 0,752
Artinya hubungan antara variabel luas apartemen dan variabel fasilitas secara
parsial adalah searah dan sifatnya eratdengan nilai sebesar 0,752, dengan
menganggap variabel lainnya konstan.
r14.y23 = -0,248
Artinya hubungan antara variabel luas apartemen dan variabel jarak ke pusat
perbelanjaan dan rekreasi secara parsial adalah berlainanarah dan sifatnya
sangat lemahdengan nilai sebesar 0,248, dengan menganggap variabel lainnya
konstan.
135
R23.y14 = 0,678
Artinya hubungan antara variabel jumlah ruangan dan variabel fasilitas secara
parsial adalah searah dan sifatnya cukup eratdengan nilai sebesar 0,678, dengan
menganggap variabel lainnya konstan.
R24.y13 = -0,269
Artinya hubungan antara variabel jumlah ruangan dan variabel jarak ke pusat
perbelanjaan dan rekreasi secara parsial adalah berlainanarah dan sifatnya
sangat lemahdengan nilai sebesar 0,269, dengan menganggap variabel lainnya
konstan.
R34.y12 = -0,420
Artinya hubungan antara variabel fasilitas dan variabel jarak ke pusat perbelanjaan
dan rekreasi secara parsial adalah berlainanarah dan sifatnya cukup eratdengan
nilai sebesar 0,420, dengan menganggap variabel penlainnya konstan.
5. Karina owns a catering company that prepares food and beverages for banquets and
parties. But Karina is quite uncertain about her estimation of food-beverage and labor
cost over theoverhead cost estimation, it’s all because of the increase of gasoline
price.The overhead estimation was based on the actual data for the past 12
monthswhich are presented here. These data indicate the overhead cost vary with
direct labor-hours used and electricity used for cooking.
Month Labor Hours Electricity (Kwh) Overhead Cost ($)
January 1500 7400 67000
February 1700 8800 73000
March 2000 9250 65000
April 3100 9480 70000
May 6400 10000 78000
June 4500 10300 71000
July 5500 11210 76500
August 3400 6900 68700
September 6000 8000 75430
October 3500 7760 72990
November 3100 7600 70400
December 5300 9520 74000
136
a. Determine regression equation for Karina’s Catering Company, then interpret it!
b. Determine determination and nondetermination coefficient and interpret the value!
c. Find the difference between predicted overhead cost variable and actual overhead
cost !
d. Determine the multiple regression correlation coefficient and all possible partial
correlation ! How strong it is ?
e. Conduct a global test of hypothesis with α = 5% !
f. Using α = 5%, conduct a test of hypothesis for the individual regression
coefficients !
Jawab :
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig. Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 62878.868 5088.530 12.357 .000
X1 1.783 .500 .775 3.568 .006 .813 .765 .687
X2 .240 .636 .082 .377 .715 .440 .125 .073
a. Dependent Variable: Y
a. Regression Equation :
Y = 62.878,868 + 1,783 X1 + 0,24 X2
Interpretation :
a = 62.878,868
Without affected with no variable, the average of overhead cost is about
$62.878,868.
b1 = 1,783
Every increasing of 1 hour of labor-hour, the average of overhead cost will be
increase as much as $1,783, considering electricity variable is constant.
b2 = 0,240
Every increasing of 1 Kwh of electricity, the average of overhead cost will be
increase as much as $0,240, considering labor-hour variable is constant.
137
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .816a .666 .592 2482.01916
a. Predictors: (Constant), X2, X1
b. Determination Coefficient : R2 = 0,592 (Adjusted R
2)
Nondetermination Coefficient: K2
= 1 - R2 = 1 – 0,592 = 0,408
It means that labor hour and electricity variable explained the variation of overhead
cost of Karina’s Catering Company as much as 59,2%,and the 40,8%
residualvalueis explained by another factor out of the model.
c. Standard Error of Estimate (SE)
SE = 2482,01916
It means that the difference between predicted overhead cost variable and actual
overhead cost is about $2482,01916.
d. Multiple Regression Correlation (R) = 0,986
A whole relation between overhead cost, labor hour, dan electricity variable is
positive and have a very strong relation, it’s 0,986.
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .813 .440
X1 .813 1.000 .463
X2 .440 .463 1.000
Sig. (1-tailed)
Y . .001 .076
X1 .001 . .065
X2 .076 .065 .
N
Y 12 12 12
X1 12 12 12
X2 12 12 12
138
ry1.2 = 0,813
The relation between labor hour variable partially to overhead cost variable is
positive and strong with 0,813 value of correlation, considering electricity variable is
constant.
ry2.1 = 0,440
The relation between electricity variable partially to overhead cost variable is
positive and strong enough with 0,440 value of correlation, considering labor hour
variable is constant.
r12.y = 0,463
The partial relation between labor hour and electricity variable partially is positive
and strong enough with 0,463 value of correlation, considering overhear cost
variable is constant.
e. Global Hypothesis Test (F-Test)
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1
Regression 110674528.067 2 55337264.034 8.983 .007a
Residual 55443771.933 9 6160419.104
Total 166118300.000 11
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hypothesis :
(Labor hour and electricity variables simultaneous don’t affect
significantly the overhead cost)
(Labor hour and electricity variables simultaneous affect
significantly the overhead cost)
The Value of F-Stat and F-table :
F stat = 8,983 F tabel = 4,96 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 12 – 2 = 10
139
Criteria :
i. F-Table Test
F stat ≤ F table → Ho accepted
F stat > F table → Ho rejected
F stat > F table, or 8,983> 4,96soHo rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,007 and α = 0,05
Sig. < α, or 0,007 < 0,05, so rejected
Conclusion :
Using 5% significance level, advertising, sales force, and dealer location
variables simultaneous affect significantly to the amount of cars sold last month.
f. Individual Hypothesis Test (t-Test)
1. Partial Test of Labor Hour Variable to The Overhead Cost
Hypothesis :
(Labor hour variable partially doesn’t affect significantly to the
overhead cost variable)
(Labor hour variable partially affects significantly to the overhead
cost variable)
Value of t-stat and t-table :
t stat = 3,568
t table = 2,262
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat>ttable, or3,568 > 2,262, so Ho rejected
140
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,006 and α = 0,05
Sig. < α, or0,006< 0,05so rejected
Conclusion :
Using 5% significance level, labor hour variable partiallyaffects significantly
to the overhead cost of Karina’s Catering Company.
2. Partial Test of ElectricityVariable to The Overhead Cost
Hypothesis :
(Electricity variable partially doesn’t affect significantly to the
overhead cost variable)
(Electricity variable partially affects significantly to the overhead
cost variable)
Value of t-stat and t-table :
t stat = 0,377
t table = 2,262
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
-ttable ≤ tstat ≤ ttable, or-2,262<0,377 < 2,262, so Ho accepted
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,715 and α = 0,05
Sig. ≥ α, or0,715≥ 0,05so accepted
141
Conclusion :
Using 5% significance level, electricity variable partiallydoesn’taffects
significantly to the overhead cost of Karina’s Catering Company.
6. Consider a study designed to examine the role of television viewing in the lives of
selected group of people over 65 years of age. The purpose of the study was to
provide guidelines for developing television programming that would adequately
meet the special needs of the audience. A sample of 25 senior citizen was selected and
from each senior citizen the following data were obtained : y = the average number of
hours per day an interviewee spend watching television; x1 = the age of the
interviewee; and x3 = the number of years of education of the interviewee. The data
are listed below :
Individual Hours Age Education
A 0,5 73 14
B 0,5 66 16
C 0,7 65 15
D 0,8 65 16
E 0,8 68 9
F 0,9 69 10
G 1,1 82 12
H 1,6 83 12
I 1,6 81 12
J 2,0 72 10
K 2,5 69 8
L 2,8 71 16
M 2,8 71 12
N 3,0 80 9
O 3,0 71 6
P 3,0 75 6
Q 3,2 76 10
R 3,2 78 6
S 3,3 79 6
T 3,3 79 4
142
U 3,4 78 6
V 3,5 76 9
W 3,6 65 12
X 3,7 72 12
Y 3,7 80 6
a. Determine regression equation for this study, then interpret it!
b. Determine determination and nondetermination coefficient and interpret the value!
c. Find the difference between predicted average number of hours spent by
interviewee for watching televison variable and actual value of that dependent
variable !
d. Determine the multiple regression correlation coefficient and all possible partial
correlation ! How strong it is ?
e. Conduct a global test of hypothesis with α = 5% !
f. Using α = 5%, conduct a test of hypothesis for the individual regression
coefficients !
Jawab :
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig. Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 3.355 3.182 1.054 .303
X1 .010 .038 .053 .272 .788 .328 .058 .046
X2 -.178 .061 -.571 -2.928 .008 -.596 -.530 -.500
a. Dependent Variable: Y
a. Regression Equation :
Y = 3,355 + 0,01 X1–0,178 X2
Interpretation :
a = 3,355
Affected with no variable, the average hours that the interviewee spent for
watching television is about 3,355 hours.
143
b1 = 0,01
Every increasing of 1 year age, the average hours that the interviewee spent for
watching television will be increase as much as 0,01 hours, considering education
variable is constant.
b2 = -0,178
Every increasing of 1 year of education, the average hours that the interviewee
spent for watching television will be decrease as much as 0,178 hours, considering
age variable is constant.
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .598a .358 .299 .94240
a. Predictors: (Constant), X2, X1
b. Determination Coefficient : R2 = 0,299 (Adjusted R
2)
Nondetermination Coefficient : K2
= 1 - R2 = 1 – 0,299 = 0,701
It means that age and education variable explained the variation of time spent for
watching televison as much as 29,9%,and the 70,1% residualvalueis explained by
another factor out of the model.
c. Standard Error of Estimate (SE)
SE = 0,94240
It means that the difference between predicted time spent for watching television
variable and actual time spent for watching television is about 0,94240 hours.
d. Multiple Regression Correlation (R) = 0,598
A whole relation between time spent by interviewee for watching televison, age, and
education variable is positive and have a strong enough correlation, it’s 0,598.
144
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .328 -.596
X1 .328 1.000 -.482
X2 -.596 -.482 1.000
Sig. (1-tailed)
Y . .055 .001
X1 .055 . .007
X2 .001 .007 .
N
Y 25 25 25
X1 25 25 25
X2 25 25 25
ry1.2 = 0,328
The relation between age variable partially to time spent by inteviewee for watching
television variable is positive and weak with 0,328 value of correlation, considering
education variable is constant.
ry2.1 = -0,596
The relation between education variable partially to time spent by inteviewee for
watching televisionvariable is negative and strong enough with 0,596 value of
correlation, considering age variable is constant.
r12.y = -0,482
The partial relation between age and education variable is negative and strong
enough with 0,482 value of correlation, considering the time spent by inteviewee for
watching televisionvariable is constant.
e. Global Hypothesis Test (F-Test)
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1
Regression 10.888 2 5.444 6.130 .008a
Residual 19.539 22 .888
Total 30.426 24
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
145
Hypothesis :
(Age and education variables simultaneous don’t affect
significantly the time spent by inteviewee for watching
television)
(Age and education variables simultaneous affect significantly
the time spent by inteviewee for watching television)
The Value of F-Stat and F-table :
F stat = 6,130 F tabel = 4,24 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 25 – 2 = 23
Criteria :
j. F-Table Test
F stat ≤ F table → Ho accepted
F stat > F table → Ho rejected
F stat > F table, or 6,130> 4,24soHo rejected
iii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,008 and α = 0,05
Sig. < α, or 0,008< 0,05, so rejected
Conclusion :
Using 5% significance level, age and education variables simultaneous affect
significantly to the time spent by inteviewee for watching television.
f. Individual Hypothesis Test (t-Test)
1. Partial Test of AgeVariable to The Time Spent By Inteviewee For
Watching Television
Hypothesis :
(Age variable partially doesn’t affect significantly to the time
spent by inteviewee for watching television variable)
(Age variable partially affects significantly to the time spent by
inteviewee for watching televisionvariable)
146
Value of t-stat and t-table :
t stat = 0,272
t table = 2,074
df = n – k – 1 = 25 – 2 – 1 = 22
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
-ttable ≤ tstat ≤ ttable, or-2,074 < 0,272 < 2,262, so Ho accepted
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,788 and α = 0,05
Sig. ≥ α, or0,788< 0,05so accepted
Conclusion :
Using 5% significance level, age variable partiallydoesn’t affectsignificantly
to the time spent by inteviewee for watching television.
2. Partial Test of EducationVariable to The Time Spent By Inteviewee For
Watching Television
Hypothesis :
(Education variable partially doesn’t affect significantly to the
time spent by inteviewee for watching televisionvariable)
(Education variable partially affects significantly to the time spent
by inteviewee for watching televisionvariable)
Value of t-stat and t-table :
t stat = -2,928
t table = 2,074
df = n – k – 1 = 25 – 2 – 1 = 22
α = 0,05
147
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat< -ttable, or-2,928<-2,074, so Ho rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,008 and α = 0,05
Sig. < α, or0,008< 0,05so rejected
Conclusion :
Using 5% significance level, education variable partiallyaffects significantly
to the time spent by inteviewee for watching television.
7. Deasy, pemilik perkebunan tembakau yang relatif besar di Sumedang, selama 2 tahun
terakhir, Deasy melakukan uji coba pemberian 2 jenis pupuk pada tanaman
tembakaunya demi mendapatkan tembakau dengan kualitas terbaik, yaitu pupuk jenis
Zwazelzure Kali (ZK) dan pupuk jenis Zwazelzure Amoniak (ZA). Tembakau jenis
ini dipanen setiap 4 bulan sekali, sehingga didapat 8 data penggunaan kedua jenis
pupuk terhadap hasil panen tembakau. Berikut data yang berhasil diperoleh :
Waktu Panen Hasil Panen
(Kw)
Pupuk ZK
(Kg)
Pupuk ZA
(Kg)
Panen I 160 75 60
Panen II 200 125 100
Panen III 250 130 125
Panen IV 185 100 97
Panen V 300 170 156
Panen VI 325 175 160
Panen VII 400 230 218
Panen VIII 500 200 230
148
a. Tentukan persamaan regresinya dan interpretasikan !
b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial
!Interpretasikan !
c. Lakukan pengujian secara parsial antar variabel hasil panen dan jumlah pupuk
ZK yang digunakan, juga variabel hasil panen dan jumlah pupuk ZA yag
digunakan, dengan tingkat signifikansi 5% !
d. Lakukan pengujian simultan antara variabel jumlah pupuk ZK dan variabel
jumlah pupuk ZA yang digunakan terhadap variabel hasil panen tembakau !
e. Jika anda juga memiliki perkebunan tembakau, apakah anda harus menambah
pupuk ZK saja, pupuk ZA saja, atau keduanya ?
Jawab :
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig. Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 54.154 27.025 2.004 .101
X1 -1.286 .586 -.576 -2.195 .080 .902 -.700 -.152
X2 2.998 .513 1.532 5.839 .002 .976 .934 .403
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 54,154–1,286 X1 + 2,998 X2
Interpretasi :
a = 54,154
Tanpa dipengaruhi oleh variabel apapun, rata – rata hasil panen yang
dihasilkanadalah sebanyak 54,154 Kwintal.
b1 = -1,286
Artinya, setiap kenaikan penggunaan pupuk ZK sebanyak 1 Kg, maka rata – rata
hasil panen akan turun sebesar 1,286 Kwintal dengan variabel penggunaan pupuk
ZA dianggap konstan.
149
b2 = 2,998
Artinya, setiap kenaikan penggunaan pupuk ZA sebanyak 1 miliar rupiah, maka rata
– rata hasil panen akan naik sebanyak2,998 Kwintal dengan variabel penggunaan
pupuk ZK dianggap konstan.
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .988a .976 .967 21.29678
a. Predictors: (Constant), X2, X1
b. Koefisien determinasi : R2 = 0,967 (Adjusted R
2)
Koefisien nondeterminasi : K2
= 1 - R2 = 1 – 0,967 = 0,033
Artinya,variabel penggunaan pupuk ZKdanvariabel penggunaan pupuk ZA mampu
menjelaskan variasi dari hasil panen Tembakausebesar 96,7%, dan sisanya sebesar
3,3% dijelaskan oleh faktor lain di luar model.
c. Standard Error of Estimate (SE)
SE = 21,29678
Artinya, rata-rata penyimpangan variabel hasil panen tembakau yang diprediksi dengan
variabel hasil panen tembakau yang sebenarnya adalah sebanyak21,29678 Kwintal.
d. Koefisien korelasi berganda (R) = 0,988
Artinya, hubungan keseluruhan antara variabel hasil panen tembakau,
variabelpenggunaan pupuk ZK, dan variabel penggunaan pupuk ZAadalah searah dan
sifatnya sangat erat yaitu sebesar 0,988.
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .902 .976
X1 .902 1.000 .965
X2 .976 .965 1.000
Sig. (1-tailed)
Y . .001 .000
X1 .001 . .000
X2 .000 .000 .
N
Y 8 8 8
X1 8 8 8
X2 8 8 8
150
Koefisien Korelasi Parsial :
ry1.2 = 0,902
Artinya hubungan antara variabel penggunaan pupuk ZK secara parsial terhadap
variabel hasil panen tembakauadalahsearah dan sifatnya sangat erat dengan nilai
sebesar 0,902, dengan menganggap variabel penggunaan pupuk ZA ekspor konstan.
ry2.1 = 0,976
Artinya hubungan antara variabel penggunaan pupuk ZA secara parsial terhadap
variabel hasil panen tembakauadalahsearah dan sifatnya sangat erat dengan nilai
sebesar 0,976, dengan menganggap variabel penggunaan pupuk ZK konstan.
r12.y = 0,965
Artinya hubungan antara variabel penggunaan pupuk ZK dan variabel penggunaan
pupuk ZA secara parsial adalahsearah dan sifatnya sangat eratdengan nilai sebesar
0,965, dengan menganggap variabel hasil panen tembakau konstan.
e. Uji t statistik :
1. Uji Parsial variabel Hasil Panen terhadap Variabel Penggunaan Pupuk ZK
Hipotesis :
(variabelpenggunaan pupuk ZK secara parsial tidak berpengaruh
signifikanterhadap variabel hasil panen tembakau)
(variabelpenggunaan pupuk ZK secara parsial berpengaruh
signifikanterhadap variabel hasil panen tembakau)
Nilai t stat dan t tabel :
t stat = -2,195
t tabel = 2,571
df = n – k – 1 = 8 – 2 – 1 = 5
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,571< -2,195 <2,571makaHo tidak dapat
ditolak
151
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,08 dan α = 0,05
Ternyata Sig. ≥ α, yaitu 0,08≥ 0,05 maka tidak dapat ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZK secara parsial tidak
berpengaruh signifikan terhadap variabel hasil panen tembakau
2. Uji Parsial Variabel Hasil PanenTerhadap Variabel Penggunaan Pupuk ZA
Hipotesis :
(variabelpenggunaan pupuk ZA secara parsial tidak berpengaruh
signifikanterhadap variabel hasil panen tembakau)
(variabelpenggunaan pupuk ZA secara parsial berpengaruh
signifikan terhadap variabel hasil panen tembakau)
Nilai t stat dan t tabel :
t stat = 5,839
t tabel = 2,571
df = n – k – 1 = 8 – 2 – 1 = 5
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 5,839> 2,571makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,002 dan α = 0,05
Ternyata Sig. < α, yaitu 0,008 < 0,05 maka ditolak
152
Kesimpulan :
Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZA secara parsial
berpengaruh signifikan terhadap variabel hasil panen tembakau.
g. Uji F statistik
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1
Regression 92882.235 2 46441.118 102.394 .000a
Residual 2267.765 5 453.553
Total 95150.000 7
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hipotesis :
(variabelpenggunaan pupuk ZKdan variabel penggunaan
pupuk ZA secarabersama-sama tidak berpengaruh
signifikan terhadap variabel hasil panen tembakau)
(variabelpenggunaan pupuk ZK dan variabel penggunaan
pupuk ZA secara bersama-sama berpengaruh signifikan
terhadap variabel hasil panen tembakau)
Nilai F stat dan F tabel :
F stat = 102,394 F tabel = 5,99 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 8 – 2 = 6
Kriteria uji :
i. Uji tabel F
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
Ternyata F stat > F tabel, yaitu 102,394>5,99 maka Ho ditolak
153
ii. Uji Sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,000 dan α = 0,05
Ternyata Sig. < α, yaitu 0,000< 0,05, maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZKdan variabel
penggunaan pupuk ZAsecara bersama-sama berpengaruh signifikan terhadap
variabel hasil panen tembakau.
154
CHI-SQUARE
Bila kita mempunyai dua macam proporsi dan kita ingin menguji apakah perbedaan antar
kedua proporsi itu signifikan atau tidak, maka disini kita menggunakan pengujian hipotesa mengenai
beda dua proporsi. Perluasan dari pada pengujian selisih proporsi (beda antara dua proporsi) adalah
pengujian Chi Kuadrat, karena didalam pengujian ini kita mengadakan pengujian hipotesa tentang
perbedaan proporsi dari proporsi yang banyaknya lebih dari dua. Dengan perkataan lain, pengujian 2
ada-lah pengujian hipotesa mengenai perbe-daan k proporsi dimana k 2 proporsi.
Chi square merupakan suatu ukuran yang menyangkut perbedaan yang terdapat di antara
frekuensi pengamatan dengan frekuensi teoritis/frekuensi harapan (Schaum’s). Maksud dari pengujian
chi square adalah untuk membandingkan fakta yang diperoleh berdasarkan hasil observasi dan fakta
yang didasarkan secara teoritis (Drs. Andi Supangat, M.Si.) Dalam statistik, distribusi chi-square
(dilambangkan dengan χ2
BUKAN X2) termasuk dalam statistik nonparametrik. Distribusi
nonparametrik adalah distribusi dimana besaran-besaran populasi tidak diketahui. Distribusi ini sangat
bermanfaat dalam melakukan analisis statistik jika kita tidak memiliki informasi tentang populasi atau
jika asumsi-asumsi yang dipersyaratkan untuk penggunaan statistik parametrik tidak terpenuhi.
Berikut ini beberapa hal yang berhubungan dengan chi square:
a. Adanya derajat kebebasan/ degree of freedom (df). Besarnya df menunjukan banyak observasi
yang bebas untuk bervariasi sesudah batasan-batasan tertentu dikenakan pada data. (Sidney
Siegel)
b. Chi-square tidak pernah bernilai negatif. Hal ini dikarenakan selisih antara frekuensi data
observasi )( of dengan frekuensi data yang diharapkan ef dikuadratkan, yaitu 2
eo ff
c. Jika χ2= 0 maka frekuensi-frekuensi teoritis sama dengan frekuensi pengamatan. Jika χ
2>0 maka
frekuensi-frekuensi teoritis tidak tepat sama dengan frekuensi pengamatan. Semakin besar nilai
χ2 semakin besar pula perbedaan antara frekuensi yang diobservasi dan frekuensi teoritis.
d. Distribusi chi-square adalah menceng kanan. Jika n nya sangat besar maka distribusi χ2 ini
mendekati distribusi normal.
1. Penaksiran Standar Deviasi
Dalam pembahasan sebelumnya telah di sampaikan bahwa pada umumnya ada dua
cara menaksir, yakni titik taksiran dan interval taksiran. Titik taksiran untuk σ2 digunakan
varians dari sampel yang dipakai sebagai bahan untuk menaksir. Guna mendapatkan interval
taksiran parameter σ maka:
155
rumus : 2
2/1
2
2
2/
2 )1()1(
nsns ; df = n-1
dimana: s = standar deviasi
n = banyaknya data yang diobservasi
α = tingkat signifikansi
2
2/ dan 2
2/1 didapat dari daftar distribusi chi-square dengan df = n-1 dan p
masing-masing sama dengan2
dan 1- 2
.
Uji Hipotesis Standar Deviasi
Langkah-langkah pengujian standar deviasi:
1. Tentukan hipotesis awal dan alternatifnya
Uji dua pihak
Ho : a
Ha : a
Uji pihak kanan
Ho : a
Ha : a
Uji pihak kiri
Ho : a
Ha : a
2. Tentukan uji kriteria distribusi χ dengan df = n-1 dan tingkat signifikansi α
3. Lakukan uji statistik pada data yang diobservasi dengan menggunakan rumus:
1
ns
; df = n-1
4. Bandingkan nilai χ dengan nilai distribusi χ yang telah didapat pada langkah sebelumnya
sesuai kriteia uji yang digunakan
5. Buat kesimpulan
Uji dua pihak Uji pihak kanan Uji pihak kiri
Ho tidak dapat
ditolak 2/2/1 1
Ho ditolak 2/1
2/
1
156
2. Uji Chi-Square Dari Data Multinomial
Uji ini dilakukan untuk meneliti peristiwa yang terdiri lebih dari dua golongan.
Eksperimen yang dilakukan sebanyak n kali dan hasilnya dicatat, dikumpulkan menrut
golongan atau kategorinya masing-masing lalu diperoleh sebuah data, data yang diperoleh
demikian dinamakan data multinomial.(Sudjana)
Langkah-langkah:
1. Tentukan hipotesis awal dan hipotesis alternatifnya
Ho : c ...321
Ha : terdapat paling sedikit satu tanda ≠
2. Tentukan nilai 2
pada distribusi chi-square dengan df = c-1 dan tingkat signifikansi α
dimana c adalah banyaknya kolom dari data.
3. Lakukan uji statistik dengan menggunakan rumus
j
ji
e
eo 2
2)(
Dimana:
oi = data hasil observasi
ej = data yang diharapkan atau diestimasikan
4. lakukan uji kriteria dengan membandingkan nilai 2 dan 2
, yaitu:
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
5. Buat kesimpulan
3. Uji Chi-Square dari Tabel Kontingensi
Tabel kontingensi merupakan tabel klasifikasi dua arah yang terdiri dari banyak
kolom dan banyak baris yang merupakan pengambangan konsep dari uji chi-square data
multinomial yang menggunakan tabel klasifikasi satu arah atau hanya sebuah variabel saja.
Langkah-langkah:
1. Tentukan hipotesis awal dan alternatifnya
Ho : c1131211 ...
c
c
3333231
2232221
...
...
Ha : terdapat paling sedikit satu tanda ≠
157
2. Tentukan nilai 2
dari distribusi chi-square dengan tingkat signifikansi α dan
df = (r-1).(c-1), dimana r adalah banyaknya baris dari data dan c adalah banyaknya
kolom dari data.
3. Lakukan uji statistik dengan menggunakan rumus:
ij
ijij
e
eo2
2
Dimana:
oij= data hasil observasi dari baris ke-i kolom ke-j
eij= data hasil estimasi dari baris ke-i kolom ke-j
4. Tentukan uji kriterianya
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
5. Buat kesimpulan
Koefisien Kontingensi (C)
Koefisien kontingensi yaitu bilangan yang digunakan untuk menentukan derajat
hubungan antara dua faktor yang telah disusun dalam daftar kontingensi.
Rumus: n
C
2
2
dengan nilai maksimum
m
mC
1max
Dimana:
n = banyaknya data
m = banyaknya baris atau kolom minimal
keterangan:
Cmax-C < C, hubungan erat
Cmax-C = C, hubungan cukup erat
Cmax-C > C, hubungan kurang erat
Contoh Soal
Dilakukan suatu penelitianterhadap seorang penjual sepatu untuk mengetahui apakah
ada pengaruh warna sepatu terhadap banyaknya sepatu yang terjual. Berikut adalah hasil
pengamatan sepatu berbagai warna selama satu periode tertentu:
158
Warna Sepatu Hitam Putih Biru Coklat Total
Sepatu yang
terjual (unit)
90 55 25 30 200
Pada tingkat signifikansi 1% dapatkah disimpulkan bahwa warna sepatu tersebut berpengaruh
terhadap banyaknya sepatu yang terjual?
Jawab:
Ho: 4321
Ha: terdapat paling sedikit satu ≠
df = c-1= 4-1 = 3
α = 1%
2
= 11, 3449
Uji statistik:
504
200
e
oe j
53
50
5030
50
5025
50
5055
50
509022222
2
e
eo
Uji kriteria:
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
Ternyata 53>11,3449 atau 22
→ Ho ditolak
Pada tingkat signifikansi 1% hasil pengamatan diatas menunjukkan bahwa warna sepatu
mempengaruhi banyaknya sepatu yang terjual karena perbedaannya signifikan.
159
SOAL CHI-SQUARE
1. Banyaknya orang yang berbelanja ke sebuah toko setiap hari selama 6 hari adalah sebagai
berikut :
Apakah banyaknya orang yang berbelanja itu tergantung dari nama-nama hari ataukah
tidak?
Penyelesaian
1) . H0 : banyaknya orang yang berbelanja ke toko itu tidak tergantung pada
nama hari.
H1 : banyaknya orang yang berbelanja ke toko itu tergantung pada nama hari.
2) df = k – 1 = 6 – 1 = 5
α = 0,05
χα2 = 11,0705
3)
4) . Kriteria:
H0 diterima
H0 ditolak
5) Ternyata :
H0 diterima
6) Kesimpulan :
Meskipun banyaknya orang berbelanja tiap hari tidak sama, akan tetapi
karena perbedaan hari itu tidak signifikan, maka banyaknya orang
yang berbelanja ke toko tersebut setiap harinya selama seminggu
adalah sama.
2. Ada yang berpendapat bahwa pekerja-pekerja yang berasal dari dalam kota pada
umunya kurang rajin bila dibandingkan dengan pekerja-pekerja dari luar kota. Untuk
menguji pendapat ini diadakan penilaian terhadap kerajinan bekerja dari 50 orang
pekerja dan diperoleh data seperti dibawah ini :
Hari Senin Selasa Rabu Kamis Jumat Sabtu
Jumlah yang
berbelanja
127 112 121 109 132 149
56,8
125
125149....
125
125112
125
125127222
2
160
Penyelesaian
1) H0 : tingkat kerajinan dengan asal pekerja tidak ada hubungan (independen).
H1 : tingkat kerajinan dengan asal pekerja ada hubungan (dependen).
2) df = (r – 1).(k – 1) = (2 – 1).(2 – 1) = 1
α = 5% = 0,05
χα2 = 3,841
3)
Kerajinan Pekerja
Asal Pekerja
Rajin
Kurang Rajin
Dalam Kota (30).(10)/50 = 6 (20).(10)/50 = 4
Luar Kota (30).(40)/50 = 24 (20).(40)/50 =16
Kerajinan Pekerja
Asal Pekerja
Rajin
Kurang Rajin
Dalam Kota 5
6
5
4
Luar Kota 25
24
15
16
Kerajinan Pekerja
Asal Pekerja
Rajin
Kurang Rajin
Dalam Kota 5 5
Luar Kota 25 15
161
4) . Kriteria:
H0 tidak ditolak
H0 ditolak
5) Ternyata : <
H0 tidak ditolak
6) Kesimpulan :
Kita tidak menolak hipotesa. Dengan perkataan lain, tidak terdapat hubungan antara
kerajinan pekerja dengan asal pekerja.
3. Simpangan baku dari masa hidup semacam lampu pijar adalah 36 jam dengan sampel
26 buah. Tentukanlah batas-batas taksiran simpangan baku dari masa hidup seluruh
produksi lampu, dengan menggunakan tingkat kepercayaan 95%!
Dik : s = 36 n = 26 α = 5%
Dit : taksiran simpangan baku
Jawab :
Df = 25
= 40,6465 (
) = 13,91197
2
2/1
2
2
2/
2 )1()1(
nsns
√ ( )
√
( )
28,2325349 48,2589856
Dengan tingkat signifikansi 5% maka batas-batas taksiran simpangan baku dari masa hidup
seluruh produksi lampu adalah antara 28,2325349 jam dan 48,2589856 jam.
162
4. The Federal Correction Agency wants to investigate the question citied below: Does a
male released from federal prison make a different adjustment to civilian life if he
returns to his hometown or if he goes elsewhere to live? The agency’s psychologist
interviewed 200 randomly selected former prisoners.
Adjustment to civilian life
Residence After
Released from Prison Outstanding Good Fair Unsatisfactory
Hometown 27 35 33 25
Not Hometown 13 15 25 25
To put it another way, is there a relationship between adjustment to civilian life and place
of residence after released from prison?
Dik : Ho :there is no relationship between adjustment to civilian life and place of
residence after released from prison
Ha : there is a relationship between adjustment to civilian life and place of residence after
released from prison
df= (r-1)(c-1)=(2-1)(4-1)= 3
α = 1% 2
= 11,345
Residence After
Released from Prison Outstanding Good Fair Unsatisfactory Total
Hometown 27 35 33 25 120
Not Hometown 13 15 25 25 80
Total 40 50 60 50 200
163
o
ooe
ojio
ij
ij
ijij
e
eo2
2
( )
( )
( )
( )
( )
( )
( )
( )
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
Ternyata <11,345 maka 22
→ Ho tidak dapat ditolak
At 1% significance level there is no relationship between adjustment to civilian life and place
of residence after released from prison
5. Simpangan baku dari kekuatan semacam kabel yang dihasilkan oleh perusahaan X
adalah 100 kg. Didapat data dari industri penjualan kabel bahwa berdasarkan 8
sampel kabel yang diteliti, nilai simpangan bakunya adalah 120 kg. Telitilah, apakah
proses dalam pebuatan kabel perusahaan X mengalami perubahan variasi kekuatan
kabel yang berarti atau tidak? Ujilah dengan tingkat signifikansi 1%!
164
Penyelesaian
Dik : s = 100 kg
n = 8
σ = 120 kg
df = n-1= 8-1 = 7
α = 1%
Dit : apakah proses dalam pebuatan kabel perusahaan X mengalami perubahan variasi
kekuatan kabel yang berarti atau tidak
Jawab :
Ho : σ = 120
Ha : σ ≠120
2048,2
120
18100
Uji Kriteria:
2/2/1 → ho tidak dapat ditolak
2/1
2/
→ ho ditolak
Ternyata 0,99462 < 2,2048 < 4,50308 maka 2/2/1 → ho tidak dapat ditolak
Dengan tingkat signifikansi 1% maka proses dalam pebuatan kabel perusahaan X tidak
mengalami perubahan variasi kekuatan kabel yang berarti.
6. In a particular television market there are three commercial television stations, each
with its own evening news program from 06.00 to 06.30 pm. According to a report in
this morning’s local newspaper, a random sample of 180 viewers last night revealed
53 Watched the news on channel 5, 64 watched on channel 11, 33 on channel 13and
30 watched on channel 19. At the 0,05 significance level, is there a difference in the
proportion of viewers watching the three channels?
50308,42777,20
99462,0989265,0
2/
2/1
1
ns
165
Solution
Dik :
Channel 5 11 13 19
viewer 53 64 33 30
α = 5%
Jawab :
: there is no difference in the proportion of viewers watching the the three channels
: there is difference in the proportion of viewers watching the the three channels
j
ji
e
eo 2
2)(
= ( )
+
( )
( )
( )
= 9,711
Df = 5-1 =4
= 9,48773
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
Ternyata 9,711 > 9,48773 , 22
→ Ho ditolak
At 5% significane level there is difference in the proportion of viewers watching the the three
channels
7. Suatu penelitian diadakan untuk mengetahui apakah ada hubungan antara penghasilan
keluarga yang digolongkan dalam golongan-golongan rendah, sedang dan tinggi,
dengan penggunaan angkutan umum ketika bepergian. Angkutan umum yang dapat
digunkan ada tiga golongan yaitu kereta api, bus, dan taxi. Hasilnya diberikan dalam
daftar berikut :
Kereta Api Bus Taxi
Pendapatan Rendah 130 270 16
Pendapatan Sedang 215 214 39
Pendapatan Tinggi 80 28 140
166
Apakah ada hubungan yang berarti antara golongan pendapatan dan angkutan umum
yang digunakan? Gunakan tingkat signifikasni 1%, Tentukan pula sifat hubungan
tersebut !
Dik : Ho : 131211
333231
232221
Ha : terdapat paling sedikit satu tanda ≠
df= (r-1)(c- 1)=(3-1)(3-1)=4
α = 1% 2
=9,48773
o
ooe
ojio
ij
707,1751132
425468
661,711132
195416
155,1881132
512416
183,1561132
425416
21
13
12
11
e
e
e
e
721,421132
195248
170,1121132
512248
110,931132
425248
618,801132
195468
675,2111132
512468
33
32
31
23
22
e
e
e
e
e
Kereta Api Bus Taxi Jumlah
Pendapatan
Rendah
130 270 16 416
Pendapatan
Sedang
215 214 39 468
Pendapatan
Tinggi
80 28 140
248
Jumlah 425 512 195 1132
167
ij
ijij
e
eo2
2
2 ( 183,156 )
183,156 ( )
( )
( )
( )
( )
( )
( )
( )
2 = 400,0387
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
Ternyata 400,0387 >9,48773 maka 22
→ Ho ditolak
Dengan tingkat signifikansi 1% maka terdapat hubungan antara tingkat pendapatan dan
angkutan umum yang digunakan.
nC
2
2
m
mC
1max
C= √
= 0,511 C max= √
Kriteria :
Cmax-C < C, erat
Cmax-C = C, cukup erat
Cmax-C > C, kurang erat
Ternayata 0,511, makaCmax-C > C, kurang erat
Maka sifat hubungan antara tingkat pendapatan dan angkutan umum yang digunakan kurang erat.
168
NON PARAMETRIK
Data pada penelitian kuantitatif dianalisis dengan cara tertentu yaitu menggunakan
statistik. Statistik tersebut dibagi menjadi dua kelompok, yaitu statistik deskriptif dan statistik
inferensial. Statistik deskriptif adalah jenis statistik yang menganalisis data populasi dengan
cara mendeskripsikan atau menggambarkan data yang telah terkumpul, dan tanpa membuat
kesimpulan yang berlaku umum. Sedangkan statistik inferensial adalah jenis statistik yang
menganalisis data sampel, dan membuat generalisasi (diberlakukan secara umum) pada
populasi.
Statistik inferensial kemudian dibedakan menjadi statistik parametrik dan statistik
non-parametrik. Statistik parametrik mensyaratkan banyak asumsi, yaitu asumsi tentang
kenormalan data, homogenitas data, dan datanya berupa interval atau rasio. Sedangkan
statistik non-parametrik tidak memerlukan asumsi-asumsi di atas terpenuhi.
Statistik non-parametrik dipakai apabila peneliti tidak mengetahui karakteristik
kelompok item yang menjadi sumber sampelnya. Metode ini dapat diterapkan terhadap data
yang diukur dengan skala ordinal dan dalam kasus tertentu, dengan skala nominal. Pengujian
non-parametrik bermanfaat untuk digunakan apabila sampelnya kecil dan lebih mudah
dihitung daripada metode parametrik.
Pada kenyataannya sangatlah sulit untuk mendapatkan sampel yang memenuhi asumsi
mempunyai distribusi tertentu. Kebanyakan sampel yang diperoleh hanyalah sebatas
mendekati tertentu, seperti mendekati normal. Bahkan banyak juga sampel yang distribusinya
tidak diketahui sama sekali. Oleh karena itu kemudian dikembangkan suatu teknik inferensi
Perbedaan Parametrik Nonparametrik
Skala pengukuran Skala interval dan rasio. Skala nominal dan ordinal.
Bentuk distribusi Harus diketahui bentuk
distribusinya, mis
berdistribusi normal atau
bentuk distribusi yang
lainnya (binomial, poisson,
dsb).
Tidak mempermasalahkan
bentuk distribusinya (bebas
distribusi).
Jumlah sampel Jumlah sampel besar, atau
bisa juga jumlah sampel
kecil tetapi memenuhi
asumsi salah satu bentuk
distribusi.
Sampel kecilpun dapat
dipergunakan (misalnya
sampelnya (n) = 6.
169
yang tidak memerlukan uji asumsi-asumsi tertentu mengenai distribusi sampelnya, dan juga
tidak memerlukan uji hipotesis yang berhubungan dengan parameter populasinya. Teknik
statistik ini dikenal dengan statistik non-parametrik.
Istilah non parametrik pertama kali digunakan oleh Wolfowitz pada tahun 1942.
Statistik non-parametrik adalah statistik yang tidak memerlukan asumsi-asumsi yang
melandasi metode statistik parametrik, terutama tentang bentuk distribusinya, dan juga tidak
memerlukan uji hipotesis yang berhubungan dengan parameter-parameter populasinya, oleh
karena itu teknik ini dikenal juga dengan distribution-free statistics dan assumption-free test.
Adapun asumsi-asumsi yang harus terpenuhi pada penggunaan metode parametrik
antara lain:
Sampel (data) diambil dari populasi yang mempunyai distribusi normal.
Pada uji t dan uji F untuk dua sampel atau lebih, kedua sampel diambil dari dua
populasi yang mempunyai varians sama.
Variabel (data) yang diuji haruslah data bertipe interval atau rasio, yang tingkatnya
lebih tinggi dari data tipe nominal atau ordinal.
Ukuran sampel yang memadai (direkomendasikan > 30 per kelompok) - central limit
theorem.
Jadi, untuk data yang tidak memenuhi salah satu dari asumsi di atas, lebih baik menggunakan
prosedur statistik non-parametrik untuk pengujian hipotesis.
Keuntungan dari penggunaan metode non-parametrik :
1. metode non-paramertrik tidak mengharuskan data berdistribusi normal,
perhitungannya singkat dan syarat skala pengukuran datanya tidak terlalu ketat.
2. Metode ini bisa dipakai untuk level data nominal dan ordinal.
3. Metode non-parametrik cenderung lebih sederhana dan mudah dimengerti.
Beberapa Metode non-parametrik1 yang biasa digunakan adalah:
1 Diadaptasi dari: Pett MA. 1997. Nonparametric Statistics for Health Care Research. London, Thousand Oaks,
New Delhi: Sage Publications (dalam Christy C. Tomkins, An Introduction to Non-parametric Statistics,
University of Alberta Health Sciences Journal, June 2006, Volume 3 Issue 1).
170
Metode
Non-parametrik
Penjelasan
Sign test Uji yang digunakan untuk mengetahui apakah terdapat
perbedaan yang nyata atau tidak dari pasangan data
dengan skala ordinal. Data yang akan dianalisis
dinyatakan dalam bentuk tanda-tanda yang tanda
positif dan negatif. Biasanya digunakan pada kasus
“sebelum sesudah”
Wilcoxon signed rank
test
Sama seperti sign test tapi lebih menitikberatkan pada
besaran perbedaannya
Mc Nemar test Digunakan untuk menguji hipotesis komparatif dua
sampel yang berkorelasi bila datanya nominal/diskrit.
Rancangan penelitiannya biasanya berupa “before
after”
Mann Whitney test Digunakan untuk menguji perbedaan dua populasi
yang berupa dua sampel yang independen
Kolmogorov Smirnov
test
Digunakan untuk goodness of fit test dan menguji dua
sampel independen (data berbentuk ordinal),
khususnya untuk perbedaan varians.
Cox and Stuart test Digunakan untuk mengetahui tren suatu data yang
minimal ordinal
Spearman correlation
test
Digunakan untuk mengetahui hubungan atau untuk
menguji signifikansi hipotesis asosiatif bila masing-
masing variabel berbentuk ordinal dan sumber datanya
tidak sama.
Kruskal Wallis test Memiliki kegunaan sama seperti Mann Whitney tapi
menggunakan lebih dari dua sampel
171
NON-PARAMETRIK 1
RINGKASAN TEORI
A. SIGN TEST
• Disebut juga uji tanda dimana kita menggunakan uji ini untuk mengetahui apakah
terdapat perbedaan antara data - data yang tersedia atau pengaruh dari hasil dua
perlakuan yang diwakili dengan tanda positif (+) dan negatif (-). Hanya melihat arah
& adanya perbedaan nyata atau tidak untuk setiap pasangan data, tanpa
memperhatikan besarnya perbedaan . Sampel yang digunakan saling berhubungan
dengan skala ordinal , uji ini berhubungan pada kasus – kasus “ sebelum –
sesudah”.
Langkah – Langkah Penyelesaian Sign Test Problems
1. Bandingkanlah nilai dari pasangan data yang tersedia, jika data sebelum (x)
lebih besar dari data sesudah (y) maka beri tanda “ + ”, Jika sebaliknya nilai x
< y maka beri tanda “ – “, Tapi jika nilai data x = y maka data diabaikan atau
dihilangkan.namun ini tergantung pada data yang dibandingkan tetapi harus
konsisten
2. Kemudian hitunglah jumlah data yang masuk kedalam masing – masing tanda
baik + maupun –, lalu ambil data “ + ” = T
3. Lalu, buatlah Hipotesis untuk :
Two-Tailed test Lower tailed test Upper tailed test
Ho : P (+) = P (-)
Ha : P (+) ≠ P (-)
Ho : P (+) ≥ P (-)
Ha : P (+) < P (-)
Ho : P (+) ≤ P (-)
Ha : P (+) > P (-)
4. Menentukan kriteria pengujian
i. Two-Tailed test
T ≤ t tabel atau T ≥ n-t tabel maka ditolak
t < T < n – t maka tidak dapat ditolak
172
ii. Lower tailed test
T ≤ t tabel maka ditolak
T > t tabel maka tidak dapat ditolak
iii. Upper tailed test
T ≥ n - t tabel maka ditolak
T < n - t tabel maka tidak dapat ditolak
5. Menentukan nilai uji statistika
Merupakan nilai probabilitas hasil sampel. ( lihat tabel probabilitas binomial
dengan n, x tertentu dan p = 0,5), dimana x = jumlah tanda yang terkecil
6. Untuk n > 30 maka kita dapat mengunakan distribusi normal.sebagai
pendekatan distribsui binomial ( gunakan tabel distribusi normal baku ) dengan
menggunakan faktor koreksi sebagai berikut:
Z = ( )
√
Note :
T + 0,5 jika T < ½ n, danT – 0,5 jika T > ½ n
Kriteria :
Z < α maka tolak Ho.
Z > α maka terima Ho.
7. Kesimpulan.
Butalah kesimpulan berdasarkan kepada apakah hipotesa tersebut tidak dapat
ditolak atau dapat ditolak
173
Contoh soal :
Karyawan di suatu perusahaan akan diberikan pelatihan untuk meningkatkan
kemampuannya dalam bidang komputer. Diambil 15 orang sebagai sampel yang akan
diukur kemampuan dalam penggunaan komputer sebelum dan setelah dilakukan
pelatihan, dengan menggunakan skala likert, sbb:
– 1: luar biasa
– 2: sangat baik
– 3: baik
– 4: cukup
– 5: kurang
Dengan taraf kepercayaan 95 % , apakah ada perubahan yang sinifikansi terhadap 15
orang tersebut sesudah dan sebelum diadakanya pelatihan ?
( Bahan Kuliah Statistika 2 Merita Bernik, S.E.M.Si )
Jawab Manual:
Pegawai Sebelum Sesudah Tanda perbedaan
A 3 1 +
B 4 2 +
C 2 3 -
D 5 3 +
E 2 2 0
F 3 1 +
G 5 4 +
H 2 1 +
I 3 5 -
J 5 3 +
K 3 1 +
L 4 2 +
M 3 4 -
N 3 1 +
O 5 3 +
Pegawai A B C D E F G H I J K L M N O
Sebelum 3 4 2 5 2 3 5 2 3 5 3 4 3 3 5
Sesudah 1 2 3 3 2 1 4 1 5 3 1 2 4 1 3
174
• Hipotesis ( uji 2 pihak ):
– Ho: tidak adanya perbedaan kemampuan komputer sebelum dan setelah
adanya pelatihan.
– Ha: adanya perbedaan kemampuan komputer sebelum dan setelah adanya
pelatihan.
• Pengujian
– n = 14,tanda + = 11, tanda - = 3
– Nilai T = 11
– Nilai tabel untuk n=14 dan p =0,05 berdasarkan tabel binomial maka diperoleh
nilai yang mendekati α = 0,05 adalah y = 0,0287 t = 3
Kriteria
T ≤ t tabel atau T ≥ n-t tabel maka ditolak
t < T < n – t maka tidak dapat ditolak
Ternyata
T < n - t ( 11 ≥ 11 ) maka Ho ditolak
Kesimpulan
Jadi, dengan taraf signifikansi 5 %, tidak adanya perbedaan kemampuan
komputer sebelum dan setelah adanya pelatihan
B. WILCOXON SIGNED RANK TEST
Wilcoxon signed rank test merupakan test atau uji yang sangat berguna untuk ilmu
pengetahuan sosial, dengan data sosial (seperti : tingkah laku manusia, sosial,
antropologi, psikologi, dan lain lain)
Wilcoxon signed rank test pertama sekali diperkenalkan oleh Frank wilcoxon pada
tahun 1949 sebagai penyempurnaan dari uji tanda. Selain memperhatikan tanda
perbedaan Wilcoxon signed rank test juga memperhatikan besarnya beda dalam
menentukan apakah ada perbedaan nyata antara data pasangan yang diambil dari
sampel atau sampel yang berhubungan ( Pokok – pokok materi statistika 2 : 304)
175
Langkah – langkah pengujian :
Apabila pasangan data kurang dari 30 ( n ≤ 30)
– Tentukan formulasi hipotesisnya, apakah uji 2 pihak atau 1 pihak
– Untuk setiap pasangan tentukanlah selisihnya.
– Rankinglah nilai selisih tersebut tanpa melihat tanda + atau -.
– Berilah tanda pada setiap ranking (+ atau -) sesuai dengan tanda selisih yang
dihasilkan.
– Tentukanlah T = jumlah yang terkecil dari kedua kelompok ranking yang
memiliki tanda yang sama.
– Dengan menggunakan tabel uji wilcoxon dan dibantu dengan nilai α dan n
hitunglah Wα
– Tentukanlah n = banyaknya pasangan data yang memiliki selisih / tanpa tanda 0.
Pengujian jika n > 30, pengujian bisa menggunakan nilai Z, dengan menggunakan
tebel distribusi normal.
Untuk sampel yang besar n > 30. T = jumlah rangking +
(Mathematical statistics with aplication, KM Ramachandran: 615)
– Kriteria pengujian:
• Kriteria Untuk n ≤ 30 :
– Two-Tailed test
• T+/T- terkecil ≤ Wα/2 (T tabel) → Ho ditolak
• T+/T- terkecil > Wα/2 → Ho tidak dapat ditolak
– Lower Tailed Test
• T+/T- terkecil ≤ Wα → Ho ditolak
• T+/T- terkecil > Wα → Ho tidak dapat ditolak
– Upper Tailed Test
• T+/T- terkecil ≤ Wα → Ho ditolak
• T+/T- terkecil > Wα → Ho tidak dapat ditolak
T
T
TT
TZ
NNNNN
24
)12)(1(
4
)1(
176
• Kriteria Untuk n > 30 :
Daerah penolakan Ho apabila :
– z > zα Untuk Upper Tailed Test
– z < - zα Untuk Lower Tailed Test
– |z| > zα/2 Untuk Two-Tailed test
– Kesimpulan :
Butalah kesimpulan berdasarkan kepada apakah hipotesa tersebut tidak dapat
ditolak atau dapat ditolak
Contoh Soal:
• Pada suatu perusahaan pemerintah dilakukan penelitian untuk mengetahui pengaruh
ruangan yang diberi AC terhadap produktivitas kerja. Pengumpulan data terhadap
produktivitas kerja pegawai dilakukan pada waktu AC sebelum dipasang dan sesudah
dipasang. Data produktivitas kerja pegawai sebelum dipasang AC adalah X dan
sesudah dipasang adalah Y. jumlah pegawai yang dijadikan sampel adalah 10 orang.
Pegawai X Y
1 100 105
2 98 94
3 76 78
4 90 98
5 87 90
6 89 85
7 77 86
8 92 87
9 78 80
10 82 83
Dengan α = 5 %, hitunglah apakah ada perbedaan yang berarti bagi pegawai sebelum
dan sesudah pemasangan AC ? ( Bahan Kuliah Statistika 2 ; Ibu Merita Bernik )
177
Jawab :
Buatlah tabel seperti tertera di bawah ini kemudian lakukan perhitungan sesuai
dengan langlah – langkah yang diberikan diatas
T = 18,5 dan n = 10
Formulasi Hipotesisnya : H0 = Ruangan ber-AC tidak mempunyai perbedaab
terhadap produktifitas pegawai
H1 =Ruangan ber-AC mempunyai perbedaan
terhadap produktifitas pegawai
Tarif nyata = 5 % dan n = 10 dengan melihat tabel t distribution atau tabel uji
wilcoxon maka kita mendapatkan Wα/2 = 9
Kriteria pengujian : T+/T- terkecil ≤ Wα/2 (T tabel) → Ho ditolak
T+/T- terkecil > Wα/2 → Ho tidak dapat ditolak
Kesimpulan : karena T = 18,5 dan Wα/2 = 9, T > Tα , maka H0 tidak dapat ditolak, Jadi
dengan taraf kepercayaan 95 % ruang kerja yang ber-AC tidak mempunyai pengaruh
yang berarti terhadap produktifitas pegawai
Pegawai X Y Beda
X-Y
Tanda ranking
Ranking + -
1 100 105 -5 7.5 7.5
2 98 94 4 5.5 5.5
3 76 78 -2 2.5 2.5
4 90 98 -8 9.0 9.0
5 87 90 -3 4.0 4.0
6 89 85 4 5.5 5.5
7 77 86 -9 10.0 10.0
8 92 87 5 7.5 7.5
9 78 80 -2 2.5 2.5
10 82 83 -1 1.0 1.0
Jumlah T=18.5 36.5
178
C. MC NEMAR
Digunakan untuk menguji hipotesis komparatif dua sampel yang berkorelasi bila
datanya nominal/diskrit. Rancangan penelitiannya biasanya berupa “before after”,
dengan pada umumnya menggunakan data yang ditabulasi dalam bentuk tabel
kontingensi 2 x 2 , Uji McNemar sangat cocok untuk membandingan 2 variabel
kategori yang dikodekan dengan 2 nilai (biner).
Langkah – langkah pengujian :
– Tentukan formulasi hipotesis
– Bentuklah tabel kontingensi 2 x 2 berdasarkan kasus yang ada
– Carilah nilai dari Mc. Nemar hitung atau dengan menggunakan :
( )
( )
– Tentukan nilai Mc.Nemar Tabel menggunakan Tabel Chi-Square dengan :
df = ( banyak kolom – 1)x(banyak baris-1)
Siginifikansi level yang digunakan
– Tentukan Kriteria
: Ho tidak dapat ditolak
: Ho ditolak
– Buatlah Kesimpulan
Buatlah kesimpulan berdasarkan kepada apakah hipotesa tersebut tidak
dapat ditolak atau dapat ditolak
Contoh Soal Mc.Nemar
Seorang manajer salon ingin meningkatkan penjualan jasa creambath. Diambil
sampel 200 pengunjung salon, kemudian bersama para pelayan salon melakukan
promosi dan menawarkan langsung kepada calon konsumen yang datang ke salon
tersebut. Diperoleh data konsumen yang ingin creambath sebelum promosi adalah 77
dan sisanya tidak creambath. Setelah dilakukan promosi, jumlah pengunjung
sebanyak 13 orang yang tadinya ingin creambath jadi tidak creambath dan 36
pengunjung yang tadinya tidak akan creambath menjadi creambath. Dapatkah pemilik
salon tersebut mengambil simpulan bahwa promosi creambath berpengaruh pada
penjualan jasa creambath?
179
Jawab:
1. Ho: P(Xi) = P(Yi) (Tidak ada perubahan keinginan konsumen untuk menggunakan
jasa creambath sebelum dan sesudah promosi)
Ha: P(Xi) ≠ P(Yi) (Ada perubahan keinginan konsumen untuk menggunakan jasa
creambath sebelum dan sesudah promosi)
Sesudah
Sebelum
Tidak
Membeli Membeli Jumlah
Tidak
Membeli
87 36 123
Membeli 13 64 77
Jumlah 100 100 200
( )
( ) ( )
( )
( )( ) ( )( )
α = 5%
lihat tabel chi-square →
Kriteria:
: Ho tidak dapat ditolak
: Ho ditolak
Ternyata
atau > 3,84146 → Ho ditolak
Jadi, dengan tingkat signifikansi 5% manajer salon tersebut dapat mengambil
kesimpulan bahwa promosi jasa creambath berpengaruh pada permintaan jasa
creambath karena terdapat perubahan keinginan konsumen sebelum dan sesudah
promosi dilakukan.
D. PROSEDUR NON PARAMETRIK 1 DENGAN APLIKASI
Sebenarnya banyak sekali aplikasi pada komputer yang dapat kita gunakan untuk
menguji Sign test, wilcoxon rank test, dan Mc Nemar dengan komputer diantaranya
180
seperti SPSS ( Statistical Program for Social Science ), Minitab, E-Views, bahkan kita
juga bisa menggunakan Microsoft Excel untuk bagian bagian tertentu yang tentu kita
sudah familiar dengan itu, karena program SPSS lebih mudah untuk digunakan maka
kita akan menggunakan program ini dalam penyelesaian persoalan Nonparametrik ini
Langkah – langkah :
Pada Komputer atau Laptop yang telah di instal program SPSS, klik Program
SPSS tersebut.
Pada Lembar Variable View isilah kotak yang tesedia yang nantinya akan
menjadi label kolom pada lembar Data view.
Masukkan data pada Data view
Kemudian Klik Analyze Non Parametric Test 2 Related samples
Pindahkan isi kotak sebelah kiri ke kotak test pair(s) list dengan mengklik
tombol panah yang berada di tengah – tengah
Jika ingin melakukan test sign test maka beri tanda √ pada sign test yang
berada di kotak test type, begitu juga jika ingin melakuakn wilcoxon rank test
dan Mc Nemar test. Lebih lanjut silahkan lihat contoh dibawah ini,
(i) Contoh pada kasus Sign test:
Universitas Padjadjaran setiap tahunnya menerima Mahasiswa baru melalui jalur –
jalur khusus misalnya SMUP dan mahasiswa undangan. Guna mengetahui kualitas
mahasiswa yang telah diterima melalui jalur tersebut, dilakukan test matrikulasi dan
pihak pelaksana melakukan dua kali ujian yaitu sebelum program matrikulasi
dilakukan dan setelahnya untuk mengetahui keefektifan program tersebut. Dan untuk
itu diambil sampel sebanyak 15 orang dari IPA untuk mata ujian Statistika, dan
diperoleh data ( α = 5 %) :
Peserta 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Sebelum 67 54 67 55 87 60 70 45 54 66 73 88 80 65 75
Sesudah 66 75 80 60 78 89 65 70 68 75 74 85 89 90 75
181
Analisanya dalam SPSS adalah sebagai berikut ;
Buka Software SPSS
Pada Variable View ketikkan Sebelum pada Kolom nama baris 1 dan sesudah
pada kolom nama baris ke 2
Kemudian pada Data view masukkan data sebagai berikut
Klik Analyze Nonparametric Test 2 Relates samples
Aktifan Wilcoxon pada test type jika ingin melakukan wilcoxon rank test dan
masukkan variabel yang akan di uji sebagaimana tampak pada kotak dialog :
182
Kemudian Klik OK maka akan muncul outputnya :
Dari output tersebut diperoleh:
Negative Ranks atau selisih antara variabel sebelum dan sesudah yang negatif
sebanyak 4 observasi atau dengan kata lain terdapat 4 observasi pada variabel sesudah
yang kurang dari observasi pada variabel sebelum. Dan rata-rata rangkingnya = 4
dengan jumlah rangking negatif = 16
Positive Ranks atau selisih variabel sebelum dan sesudah yang positif sebanyak 10
observasi atau denga kata lain terdapat 10 observasi pada variabel sesudah yang lebih
dari observasi pada variabel sebelum dengan ratarata rangkingnya = 8,90 dan jumlah
rangking positif = 89.
Ties atau tidak ada perbedaan antara variabel sebelim dan sesudah sebanyak 1
observasi.Oleh karena jumah rangking negatif lebih kecil dibanding rangking positif
maka nilai T yang digunakan adalah jumlah rangking yang negatif.
Selanjutnya dilakukan uji hipotesis:
H0 : P = 0 (tidak ada perbedaan nilai tes sebelum matrikulasi dan sesudah
matrikulasi)
H1 : P ≠ 0 (ada perbedaan diantara nilai tes sebelum matrikulasi dan
sesudah matrikulasi )
Tingkat signifikansi a =0,05
183
Statistik uji
Untuk nilai statistik uji, tinjau tabel output berikut:
Dari tabel diperoleh nilai asymp sig = 0,022
Kriteria :
H0 ditolak jika nilai asymp sig < nilai α
Ho tidak dapat ditolak jika nilai asymp sign ≥ α
Kesimpulan
Oleh karena asymp sig < α , (0,022 < 0,05 ) maka Ho ditolak yang berarti bahwa
tidak ada perbedaan nilai Statistika calon mahasiswa sebelum dan sesudah mengikuti
program matrikulasi.
(ii) SPSS untuk Kasus Mc-Nemar:
Seorang manajer salon ingin meningkatkan penjualan jasa creambath. Untuk
itu, dia akan melakukan sebuah penelitian untuk mengetahui perilaku
konsumen. Diambil sampel sebanyak 200 orang pengunjung salon, kemudian
bersama-sama para pelayan salon melakukan promosi dan menawarkan secara
langsung kepada calon konsumen yang datang ke salon tersebut. Diperoleh data
konsumen yang ingin creambath sebelum promosi adalah 77 dan sisanya tidak
creambath. Setelah dilakukan promosi, jumlah pengunjung sebanyak 13 orang
yang tadinya ingin creambath jadi tidak creambath dan 36 pengunjung yang
tadinya tidak akan creambath menjadi creambath. Dapatkah pemilik salon
tersebut mengambil simpulan bahwa promosi creambath berpengaruh pada
penjualan jasa creambath?
184
Buka software SPSS
Pada lembar Variable View ketik sebelum pada baris 1 dan sesudah pada baris 2,
untuk measure: pilih nominal
Masukkan data di Data View.
Klik Analyze Non Parametric Tests 2 Related Samples, pada menu
maka kotak dialog Two Related Samples Tests akan muncul.
Blok sebelum dan sesudah sehingga aktif dan pindahkan ke kotak Test Pair(s)
List dengan klik tombol panah sehingga muncul sebelum-sesudah pada kotak
tersebut.
Pada kotak Test Type, pilih McNemar
Klik Ok
Maka diperoleh output sebagai berikut :
Sebelum & Sesudah
Sebelum Sesudah
0 1
0 87 36
1 13 64
Hipotesis
Ho: P(Xi) = P(Yi) (Tidak ada perubahan keinginan konsumen untuk menggunakan
jasa creambath sebelum dan sesudah promosi)
Ha: P(Xi) ≠ P(Yi) (Ada perubahan keinginan konsumen untuk menggunakan jasa
creambath sebelum dan sesudah promosi)
Test Statisticsb
Sebelum &
Sesudah
N 200
Chi-Squarea 9.878
Asymp. Sig. .002
a. Continuity Corrected
b. McNemar Test
185
Exact Sig. (2-tailed) dan Tingkat Signifikansi
Exact Sig. (2-tailed) = 0,002
= 5 %
Kriteria
Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak
Exact Sig. (2-tailed) < α : Ho ditolak
Ternyata
Exact Sig. (2-tailed) < α atau 0,002 < 0,05 Ho ditolak
Kesimpulan
Jadi, dengan tingkat kepercayaan 95% manager salon tersebut dapat mengambil
kesimpulan bahwa promosi jasa creambath berpengaruh pada permintaan jasa
creambath karena terdapat perubahan keinginan konsumen sebelum dan sesudah
promosi dilakukan.
186
SOAL NONPARAMETRIK I
1. Faculty of Economics do the training of a new employees for one full month to
provide increased capacity of the workforce, at the beginning and end of training, new
employees be given sort test to evaluate the training, The following are presented the
results of their training evaluation:
No Name Evaluation
1 Intan Decrease
2 Puspa Increase
3 Taufik Decrease
4 Rudolf Increase
5 Purba Increase
6 Ahmad Increase
7 Hamdi Increase
8 Yessica Decrease
9 Sardina Increase
10 Alya No change
11 Karina Increase
12 Nainggolan Decrease
13 Deasy No change
From the data, can we conclude that the training program enhanced capabilities the
new employees ? (significance level of 5%)
A. MANUAL SOLUTION
No Name Evaluation Sign
1 Intan Decrease -
2 Puspa Increase +
3 Taufik Decrease -
4 Rudolf Increase +
5 Purba Increase +
6 Ahmad Increase +
7 Hamdi Increase +
8 Yessica Decrease -
9 Sardina Increase +
10 Alya No change 0
11 Karina Increase +
12 Nainggolan Decrease -
13 Deasy No change 0
Total : 0 = 2; + = 7; - = 4
Hypotesis :
Ho : P (+) ≤ P (-) : There is no increase in workfores capacity
Ha : P (+) > P (-) : There is an increase in workfores capacity
187
Value T hitung = 7 sedangkan nilai ttabel : 2
Because T < n-t ( 7 < 9 ) so Ho cannot be rejected.
So, using 5% significance level, we can conclude that there is no increase in
workfores capacity
B. SPSS SOLUTION
Conclusion :
So, using 5% significance level, we can conclude that there is no increase in
workfores capacity
2. STA Corp. ingin mengetahui apakah ada perbedaan pemberian program reward and
punishment terhadap loyalitas karyawan dalam bekerja di perusahaan. untuk itu
diambil skor 12 karyawan yang dihimpun dari para manager pada saat sebelum dan
sesudah program reward and punishment dilakukan.
Employee 1 2 3 4 5 6 7 8 9 10 11 12
Before
Program
901 900 600 809 605 800 905 708 850 802 885 709
After
Program
900 888 605 800 605 804 902 700 850 800 889 704
Dengan menggunakan tingkat kepercayaan 5 %, apakah ada perbedaan loyalitas
karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program reward
and punishment tersebut. ( Wilcoxon ranked sign test)
Frequencies
N
sesudah -
sebelum
Negative
Differencesa
4
Positive
Differencesb
7
Tiesc 2
Total 13
a. sesudah < sebelum
b. sesudah > sebelum
c. sesudah = sebelum
KRITERIA
Exact sig./2 < α Ho rejected
Exact sig./2 ≥ α Ho can be rejected
0,274,5 > 0,05 Ho can be rejected
188
A. JAWAB MANUAL:
Karyawan Sebelum Sesudah Beda
Skor
Beda
Skor
Ranking Ranking
-
Rangking
+
1 901 900 -1 1 1 1
2 900 898 -2 2 2,5 2,5
3 600 605 5 5 7,5 7,5
4 809 800 -9 9 10 10
5 605 605 0 0 - - -
6 800 804 4 4 5,5 5,5
7 905 902 -3 3 4 4
8 708 700 -8 8 9 9
9 850 850 0 0 - - -
10 802 800 -2 2 2,5 2,5
11 885 889 4 4 5,5 5,5
12 709 704 -5 5 7,5 7,5
JUMLAH 36,5 18,5
Hipotesis: = Tidak ada perbedaan loyalitas karyawan di perusahaan antara
sesudah dan sebelum dilaksanakannya program reward and
punishment
= ada perbedaan loyalitas karyawan di perusahaan antara sesudah
dan sebelum dilaksanakannya program reward and punishment
T hitung dan Tα ( T tabel )
T-hitung ( jumlah rangking terkecil ) = 18,5
Wα atau T tabel :
n ( jumlah sampel tanpa tanda 0 ) = 10, dengan α = 5 % , dan dengan melihat
tabel uji wilcoxon maka didapat Wα/2 ( T tabel ) = 9
Kriteria
T hitung > Wα/2 ( T tabel ) tidak dapat ditolak
T hitung ≤ Wα/2 ( T tabel ) ditolak
Kesimpulan :
Karena T hitung > Tα/2, 18,5 > 9, maka tidak dapat ditolak
Jadi, dengan taraf signifikansi 5 % ternyata tidak terdapat perbedaan loyalitas
karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program
reward and punishment.
189
B. JAWABAN SPSS
Jadi, dengan taraf signifikansi 5 % ternyata tidak terdapat perbedaan loyalitas
karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program
reward and punishment
3. Pada pemilihan president director dari STA Corp. Terdapat 2 calon, yaitu A dan H.
Sebelum kandidat memaparkan program kerja mereka, yang memilih A sebanyak 10
orang dan yang memilih H sebanyak 8 orang. Setelah pemaparan program kerja
kadidat, ternyata 5 orang sebelumnya memilih A berubah menjadi mimilih H, dan
yang tadinya memilih H berubah menjadi A sebanyak 6 orang, dengan signifikansi
5%, apakah ada perbedaan respon sebelum dan sesudah diberikannya pemaparan
program kerja yang akan dilaksanakan oleh calon tersebut ?
A. JAWAB MANUAL:
Sebelum
Pemaparan
Program
Setelah Pemaparan Program Total
Calon A H
A 5 5 10
H 6 2 8
Total 11 7 18
Hipotesis :
Ho : tidak ada perbedaan respon sebelum dan sesudah diberikannya pemaparan
program kerja
Ha : ada perbedaan respon sebelum dan sesudah diberikannya pemaparan program
kerja
Test Statisticsb
Sesudah -
Sebelum
Z -.919a
Asymp. Sig. (2-tailed) .358
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
KRITERIA :
Asymp sig. (2-tailed) < α Ho ditolak
Asymp sig. (2-tailed) ≥ α Ho tidak dapat ditolak
0,358 > 0,05 MAKA Ho tidak dapat ditolak
190
( )
( ) ( )
( )
( )( ) ( )( )
α = 5%
lihat tabel chi-square →
Kriteria
: Ho tidak dapat ditolak
: Ho ditolak
Kesimpulan : Karena ; 0,009090909 < 3,84, maka Ho tidak dapat ditolah
Jadi, dengan tingkat signifikansi 5 %, tidak ada perbedaan respon sebelum dan
sesudah diberikannya pemaparan program kerja
B. JAWAB SPSS
Jadi, dengan tingkat signifikansi 5 %, tidak ada perbedaan respon sebelum dan
sesudah diberikannya pemaparan program kerja
4. STA Corp has 5 subsidiary companies engaged in telecommunications, mining,
agriculture, finance, and transportation. At the AGM, each subsidiary is expected to
provide benefits Rp.50.000.000,00/years. Test whether the expectations of
shareholders exceeds the real profit will be true? (use 5% significance level).
Subsidiary Companies Real Profit (*in
million)
Telecommunications 41
Mining 84
Agliculture 28
Finance 52
Transportation 59
Test Statisticsb
sebelum &
sesudah
N 18
Exact Sig. (2-tailed) 1.000a
a. Binomial distribution used.
b. McNemar Test
KRITERIA :
Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak
Exact Sig. (2-tailed) < α : Ho ditolak
1,000 > 0,05 Maka Ho tidak dapat ditolak
191
A. JAWAB MANUAL:
Subsidiary
Companies
Real Profit
(*in million) Expected D [D] Rank
Rank -
Rank +
Telecommunications 41 50 -9 9 2,5 2,5
Mining 84 50 34 34 5 5
Agriculture 28 50 -22 22 4 4
Finance 52 50 2 2 1 1
Transportation 59 50 9 9 2,5 2,5
Ket : D = differences ∑ 6,5 8,5
Hypotesis: = shareholders expectation not exceeds real profit
= shareholders expectation exceeds real profit
(right tailed test)
T hitung dan Tα ( T tabel )
T-hitung ( jumlah rangking terkecil ) = 6,5
Wα atau T tabel :
n ( number of sample without 0 ) = 5, with α = 5 % , using tabel wilcoxon ,Wα
( T tabel ) = 1
Kriteria
T hitung ≤ Wα rejected
T hitung > Wα cannot be rejected
Kesimpulan :
Karena T hitung > Wα, 6,5 > 1, maka cannot be rejected
So, using 5% significance level, shareholders expectation is not exceeds real profit
B. JAWABAN SPSS
Test Statisticsb
expected -
real_profit
Z -.271a
Asymp. Sig. (2-tailed) .786
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
KRITERIA :
Asymp sig. (2-tailed)/2 < α Ho rejected
Asymp sig. (2-tailed)/2 ≥ α Ho can be rejected
0,393 > 0,05 MAKA Ho tidak dapat ditolak
192
So, using 5% significance level, shareholders expectation is not exceeds real profit
5. Fly Emirates ingin mengetahui perbedaan sebelum dan sesudah pemberian
sponsorship kepada Real Madrid dalam rangka meningkatkan profit perusahaan.
untuk itu diambil 20 orang sebagai sampel dimana, sebelum sponsor diberikan
terdapat 5 orang yang membeli produk tersebut, sedangkan sisanya tidak. Namun
setelah sponsor diberikan, ternyata ada 8 orang yang tidak membeli jadi membeli dan
ada 3 orang yang membeli menjadi tidak membeli. Dengan taraf nyata 5%, dapatkah
disimpulkan bahwa setelah pemberian sponsor tersebut dapat mempengaruhi profit
perusahaan atau tidak?
A. JAWAB MANUAL:
After Sponsorship Total
Buy Not buy
Before
Sponsorship
Buy 2 3 5
Not buy
8 7 15
Total 10 10 20
Hipotesis :
Ho : Pemberian sponsor tersebut tidak dapat mempengaruhi profit perusahaan
Ha : Pemberian sponsor tersebut dapat mempengaruhi profit perusahaan
( )
( ) ( )
( )
( )( ) ( )( )
α = 5%
lihat tabel chi-square →
Kriteria
: Ho tidak dapat ditolak
: Ho ditolak
Kesimpulan : Karena ; 2,27272 < 3,84, maka Ho tidak dapat ditolah
Jadi, dengan tingkat signifikansi 5 %, Pemberian sponsor tersebut tidak dapat
mempengaruhi profit perusahaan.
193
B. JAWAB SPSS:
Test Statisticsb
sebelum &
sesudah
N 20
Exact Sig. (2-tailed) .227a
a. Binomial distribution used.
b. McNemar Test
Jadi, dengan tingkat signifikansi 5 %, Pemberian sponsor tersebut tidak dapat
mempengaruhi profit perusahaan
6. Statistics Laboratory conducts research to get offer improved campus facilities
difference, before and after the application of UKT by the University, using a
representative sample of 15 in each faculty, the following sample response to
increased facilities
Sample K L M N O
Before 2 4 3 5 5
After 5 6 4 4 5
5 = very satisified,... ; 1 = very unsatisfied
Test the null hypothesis that there is no difference facilities before and after the
imposition of UKT by the university? (α = 5%)
A. JAWAB MANUAL:
Sample A B C D E F G H I J
Before 2 3 3 3 5 2 3 3 2 3
After 5 4 4 3 6 1 3 2 7 5
Sampel A B C D E F G H I J
Sebelum 2 3 3 3 5 2 3 3 2 3
Sesudah 5 4 4 3 6 1 3 2 7 5
Tanda + + + 0 + - 0 - + +
KRITERIA :
Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak
Exact Sig. (2-tailed) < α : Ho ditolak
0,227 > 0,05 Maka Ho tidak dapat ditolak
194
Sampel K L M N O
Sebelum 2 4 3 5 5
Sesudah 5 6 4 4 5
Tanda + + + - 0
Jumlah tanda “ + “ =9 dan tanda ‘ – “ = 3
Hipotesis: : there is no difference in facilities before and after UKT
: there is a difference in facilities before and after UKT
Pengujian
T hitung = 9
T tabel = Gunakan Tabel Binomial untuk mencari nilai t
Dengan n =12, p =0,5 mendekati α, y =0,0193 t = 2
i. Kriteria
t < T < n – t Ho tidak dapat ditolak
T ≤ t atau T ≥ n – t Ho ditolak
ii. Ternyata
t < T < n – t atau 2 < 9 < 7 maka Ho tidak dapat ditolak
B. JAWABAN SPSPS
Frequencies
N
sesudah -
sebelum
Negative
Differencesa
3
Positive
Differencesb
9
Tiesc 3
Total 15
a. sesudah < sebelum
b. sesudah > sebelum
c. sesudah = sebelum
KRITERIA
Exact sig. < α maka Ho ditolak
Exact sig. ≥ α maka Ho tidak dapat ditolak
0,146 > 0,05 Maka Ho tidak dapat ditolak
195
iii. Kesimpulan
Jadi dengan taraf signifikansi 5 %, tidak ada perbedaan fasilitas sebelum dan sesudah
pemberlakukan UKT oleh universitas.
7. The following data is the monthly rents ( in dollars ) paid by a random sampe of 25
household selected from a large city.
425 960 1450 655 1025 750 670 975 660 880
1250 780 870 930 550 575 425 900 525 1800
545 840 765 950 1080
Using the wilcoxon signed rank test, test the hypotheses that the median rent in this
city is $ 750 against the alternative that it is higher, with α = 0,05 ?
(KM Ramachandran .Mathematical statistics with aplication: 615 )
1. MANUAL SOLUTION:
No Median Monthly
rents
D D Rank Rank
+
Rangk
-
1 750 425 -325 325 19,5 19,5
2 750 960 210 210 15 15
3 750 1450 700 700 23 23
4 750 655 -95 95 6 6
5 750 1025 275 275 18 18
6 750 750 0 0 - - -
7 750 670 -80 80 3 3
8 750 975 225 225 16,5 16,5
9 750 660 -90 90 4,5 4,5
10 750 880 130 130 8 8
11 750 1250 500 500 22 22
12 750 780 30 30 2 2
13 750 870 120 120 7 7
14 750 930 180 180 11 11
15 750 550 -200 200 25 12,5
196
16 750 575 -175 175 10 10
17 750 425 -325 325 19,5 19,5
18 750 900 150 150 9 9
19 750 525 -225 225 16,5 16,5
20 750 1800 1050 1050 24 24
21 750 545 -205 205 14 14
22 750 840 90 90 4,5 4,5
23 750 765 15 15 1 1
24 750 950 200 200 12,5 12,5
25 750 1080 330 330 21 21
∑ 194,5 105,5
Hipotesis: = the median rent in this city = $ 750
= the median rent in this city > $ 750
T calc and Tα ( T tabel )
T-calc ( total of small rank ) = 105,5
Wα atau T table :
n (sample without 0 ) = 24, with α = 5 % , and we found Wα ( T table ) = 92
Criteria
T hitung ≤ Wα rejected
T hitung > Wα can be rejected
Kesimpulan :
Karena T hitung > Wα, 105,5 > 9, maka can be rejected
So, with significance level 5 % , we can conclude the median rent in this city = $ 750
197
2. SPSS SOLUTION:
Test Statisticsb
MEDIAN -
RENTS
Z -1.272a
Asymp. Sig. (2-tailed) .203
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
So, with significance level 5 % , we can conclude the median rent in this city = $ 750
KRITERIA :
Asymp sig. (2-tailed) < α Ho rejected
Asymp sig. (2-tailed) ≥ α Ho can be rejected
0,203 > 0,05 MAKA Ho tidak dapat ditolak
198
NON PARAMETRIK 2
Data pada penelitian kuantitatif dianalisis dengan cara tertentu yaitu menggunakan
statistik. Statistik tersebut dibagi menjadi dua kelompok, yaitu statistik deskriptif dan statistik
inferensial. Statistik deskriptif adalah jenis statistik yang menganalisis data populasi dengan
cara mendeskripsikan atau menggambarkan data yang telah terkumpul, dan tanpa membuat
kesimpulan yang berlaku umum. Sedangkan statistik inferensial adalah jenis statistik yang
menganalisis data sampel, dan membuat generalisasi (diberlakukan secara umum) pada
populasi.
Statistik inferensial kemudian dibedakan menjadi statistik parametrik dan statistik
non-parametrik. Statistik parametrik mensyaratkan banyak asumsi, yaitu asumsi tentang
kenormalan data, homogenitas data, dan datanya berupa interval atau rasio. Sedangkan
statistik non-parametrik tidak memerlukan asumsi-asumsi di atas terpenuhi.
Statistik non-parametrik dipakai apabila peneliti tidak mengetahui karakteristik
kelompok item yang menjadi sumber sampelnya. Metode ini dapat diterapkan terhadap data
yang diukur dengan skala ordinal dan dalam kasus tertentu, dengan skala nominal. Pengujian
non-parametrik bermanfaat untuk digunakan apabila sampelnya kecil dan lebih mudah
dihitung daripada metode parametrik.
Metode ini digunakan untuk situasi berikut:
1. Apabila ukuran sampel demikian kecil sehingga distribusi statistik pengambilan sampel
tidak mendekati normal, dan apabila tidak ada asumsi yang dapat dibuat tentang bentuk
distribusi populasi yang menjadi sumber sampel.
2. Apabila digunakan data peringkat atau ordinal. (Data ordinal hanya memberikan
informasi tentang apakah suatu item lebih tinggi, lebih rendah, atau sama dengan item
lainnya; data ini sama sekali tidak menyatakan ukuran perbedaan)
3. Apabila digunakan data nominal. (Data nominal adalah data dimana sebutan seperti laki-
laki atau perempuan diberikan kepada item dan tidak ada implikasi dalam sebutan
tersebut)
199
SPEARMAN
Koefisien korelasi peringkat sperman, rs, adalah ukuran erat-tidaknya kaitan antara dua
variabel ordinal; artinya rs merupakan ukuran atas kadar/derajat hubungan antara data yang
telah disusun menurut peringkat (ranked data) (Supranto, Johanes; 2001). Koefisien korelasi
(r) dihitung dengan menggunakan nilai aktual dari X dan Y, sedangkan koefisien Spearman
yang akan kita bicarakan berikut ini menggunakan nilai peringkat untuk X dan Y, dan bukan
nilai aktual.
Langkah Penghitungan Koefisien Korelasi Spearman (rs)
(1) Menyusun peringkat data
(2) Menghitung perbedaan peringkat
(3) Menyusun hipotesis
(4) Menghitung rs
(5) Menghitung Wp dengan menggunakan tabel Quantiles of Spearman’s
(6) Bandingkan nilai rs dan Wp dengan kriteria
(7) Menarik kesimpulan
Hipotesis Spearman
Uji dua pihak
Ho: Tidak ada korelasi antara variabel X dengan variabel Y (independen)
Ha: Ada korelasi antara variabel X dengan variabel Y
Uji pihak kiri
Ho: Tidak ada korelasi antara variabel X dan variabel Y (independen)
Ha: Ada kecendrungan korelasi negatif antara variabel X dan variabel Y
Uji pihak kanan
Ho: Tidak ada korelasi antara variabel X dan variabel Y (independen)
Ha: Ada kecendrungan korelasi positif antara nilai variabel X dan Y
200
Menghitung rs
(1) Jika tidak ada angka yang sama
rs = 1 - ( ∑
( ))
di = beda urutan dalam satu pasangan data
n= banyaknya pasangan data
(2) Jika ada angka yang sama
rs = ∑ ( ) ( ) (
)
(∑ ( ) (
)
)
(∑ ( ) (
)
)
R(Xi) = Ranking grup 1
R(Yi) = Ranking grup 2
n = banyaknya pasangan data
Kriteria
Uji dua pihak : |rs| ≤ W 1- α/2 : Ho tidak dapat ditolak
|rs|> W 1- α/2 : Ho ditolak
Uji pihak kiri : rs ≥ - W1-α : Ho tidak dapat ditolak
rs < - W1-α : Ho ditolak
Uji pihak kanan : rs ≤ W1-α : Ho tidak dapat ditolak
rs > W1-α : Ho ditolak
201
Contoh Soal :
STA Corporation berencana untuk membuka cabang baru di Surabaya, untuk itu Departemen
Marketing melakukan pengujian pengaruh antara biaya iklan suatu jasa dan produk yang
ditawarkan perusahaan dengan konsumen yang membeli jasa atau produk tersebut.
Biaya Iklan 3,5 2,9 3,9 1,25 2 2,75 4 3 2,8 2,6
Jumlah Konsumen 280 259 320 150 175 250 285 260 290 275
Saudara diminta untuk membantu Departemen marketing untuk menemukan kesimpulan
pengujian, gunakan tingkat signifikansi 5% !
Jawab :
(1) Tentukan Hipotesis
H0 : tidak ada hubungan antara biaya iklan dan jumlah konsumen
Ha: ada hubungan antara biaya iklan dan jumlah konsumen
X Y R (X) R (Y) Di Di2
3,5 280 8 7 1 1
2,9 259 6 4 2 4
3,9 320 9 10 -1 1
1,25 150 1 1 0 0
2 175 2 2 0 0
2,75 250 4 3 1 1
4 285 10 8 2 4
3 260 7 5 2 4
2,8 290 5 9 -4 16
2,6 275 3 6 -3 9
Jumlah 40
(2) Menghitung rs
rs = 1 - ( ∑
( ))
202
(3) Menghitung Wp dengan menggunakan tabel Quantiles of Spearman’s
n = 10
Wp = W1-α/2 = W1-0,05/2 = W0,975 = 0,6364
(4) Bandingkan nilai rs dan Wp dengan kriteria
|rs| ≤ W 1- α/2 : Ho tidak dapat ditolak
|rs|> W 1- α/2 : Ho ditolak
Ternyata 0,757575 > 0,6364 atau |rs| > W 1- α/2 maka H0 ditolak
(5) Kesimpulan
Dengan tingkat signifikansi 5% maka ada hubungan antara biaya iklan dan jumlah konsumen
Menggunakan SPSS
(1) Buka program SPSS
(2) Klik Variable View, kemudian isi variabel-variabel yang telah ditentukan
(3) Mengolah data:
• Dari menu SPSS, pilih menu Analyze, pilih submenu Correlate kemudian Bivariate
• Masukan variabel yang akan dikorelasi ke dalamTest variables, kemudian klik
Spearman
• Pada kolom Test of Significance pilih Two-tailed
• Klik Flag Significant Correlation
• OK
Correlations
Biaya Konsumen
Spearman's
rho
Biaya Correlation Coefficient 1.000 .758*
Sig. (2-tailed) . .011
N 10 10
Konsumen Correlation Coefficient .758* 1.000
Sig. (2-tailed) .011 .
N 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
203
Kriteria : Sig α ≥ α H0 tidak dapat ditolak
Sig α < α H0 ditolak
Ternyata 0,011 < 0,05 atau Sig α < α maka Ho ditolak
Kesimpulan : Dengan tingkat signifikansi 5% ada hubungan antara biaya iklan dan jumlah
konsumen
MANN WHITNEY
Menguji apakah dua kelompok data yang independen berasal dari populasi yang sama atau
tidak. Uji Mann-Whitney mengasumsikan bahwa sampel yang berasal dari populasi adalah
acak. Pada uji Mann-Whitney sampel bersifat independen (berdiri sendiri). Skala pengukuran
yang digunakan adalah (minimal) ordinal.
Langkah Perhitungan Mann Whitney
(1) Menyusun hipotesis
(2) Menyusun peringkat data tanpa memperhatikan kategori sample (gabungan)
(3) Menjumlahkan peringkat di setiap kategori sample yang telah di gabungkan
(4) Hitung T statistic.
(5) Tentukan nilai table (Wα)
(6) Bandingkan nilai T statistic dan nilai table dengan kriteria
(7) Menarik kesimpulan
Menyusun Hipotesis dan Kriteria
Hipotesis :
Uji Dua Pihak Uji Pihak Kiri Uji Pihak Kanan
Ho : P (X) = P (Y) Ho : P (X) = P (Y) Ho : P (X) = P (Y)
Ha : P (X) ≠ P (Y) Ha : P (X) < P (Y) Ha : P (X) > P (Y)
Kriteria :
Uji Dua Pihak Uji Pihak Kiri Uji Pihak Kanan
Ho Tidak Dapat
Ditolak
W1-α/2 ≤ T ≤Wα /2
T ≥Wα
T ≤ W1-α
Ho Ditolak
T < Wα /2
T > W1-α/2
T < Wα
T > W1-α
Keterangan : W1-α = n(N+1)- Wα
W1-α/2 = n(N+1)- Wα/2
204
Menghitung T Statistic
Jika tidak ada peringkat yang sama atau hanya sedikit yang sama peringkatnya maka statistik
ujinya adalah :
dimana ∑ ( ) :
Jika banyak peringkatnya yang seri maka statistic ujinya :
√
( )∑
( ) ( )
Contoh Soal :
A study to examine whether the assistance is able to improve student test scores. For it's
taken nine students selected as samples.
Samples Participated
Assistance
Samples Not Part of
Assistance
A 80 F 100
B 90 G 50
C 70 H 39
D 49 I 40
E 60
Test with a significant level 5%. Are the students who participated assistance is higher than
that is not part of assistance?
205
Jawab :
(1) Menyusun Hipotesis
Ho : P (X) = P (Y) (score of the students who participated assistance is same as the
student who is not part of assistance)
Ha : P (X) > P (Y) (score of the students who participated assistance is higher than
that is not part of assistance)
Score Rank
39 1
40 2
49 3
50 4
60 5
70 6
80 7
90 8
100 9
(2) Menghitung T Statistic
S = ∑ R(X) = 29
T = 29 - 5 (5+1)
2
T = 14
(3) Menentukan Nilai Tabel
Lihat tabel:
Wα (n=5, m=4 α = 0,05 )( tabel mann whitney )
= 18
W1-α = n(N+1)- Wα
= 5(9 +1) - 18 = 32
206
(4) Bandingkan nilai T statistic dan nilai table dengan kriteria
Kriteria T ≤ W1-α Ho tidak dapat ditolak
T > W1-α Ho ditolak
Ternyata, 14 < 32 atau T ≤ W1-α maka Ho tidak dapat ditolak
(5) Menarik Kesimpulan
With a significant level 5%, we can conclude that score of the students who
participated assistance is same as the student who is not part of assistance.
Menggunakan SPSS
• Masuk ke SPSS
• Masuk ke variable view, measure Ordinal
• Masukkan data ke dalam data view (gabungkan sample 1 & sample 2 dalam 1 kolom)
• Kolom 1 = SCORE, kolom 2 = GROUP ( isikan 0 untuk sample Participated
Assistance & 1 untuk sample Not Part of Assistance)
• Masuk ke Analyze , klik Nonparametric Test
• Klik 2 Independent sample, masukkan SCORE di Test Variable List dan GROUP di
grouping Variable
• Klik Define Group, masukkan grup 1 = 0, grup 2 = 1, continue
• Checklist Mann whitney
Ranks
GROUP N Mean Rank Sumof Ranks
SCORE
0 5 5.80 29.00
1 4 4.00 16.00
Total 9
Kriteria :
Exact Sig (1-tailed) ≥ α, Ho tidak dapat ditolak
Exact Sig (1-tailed) < α, Ho ditolak
Asymp Sig (2-tailed) ≥ α, Ho tidak dapat ditolak
Asymp Sig (2-tailed) < α, Ho ditolak
207
Test Statisticsb
SCORE
Mann-Whitney U 6.000
Wilcoxon W 16.000
Z -.980
Asymp. Sig. (2-tailed) .327
Exact Sig. [2*(1-tailed Sig.)] .413a
a. Not corrected for ties.
b. Grouping Variable: GROUP
Ternyata :
Exact Sig (1-tailed) < α, atau 0.413 > 0,05 maka Ho tidak dapat ditolak
Asymp Sig (2-tailed) > α atau 0.327 > 0,05 maka Ho tidak dapat ditolak
Kesimpulan :
With 5% significant level, we can conclude that score of the students who participated
assistance is same as the student who is not part of assistance
208
SOAL NON PARAMETRIK 2
1. Sebuah perusahaan yang bergerak dibidang kecantikan yaitu Beauty Skin Care Company,
ingin mengetahui apakah terdapat hubungan yang erat antara harga dari produk yang
diproduksi dengan permintaan konsumen atas produk kecantikan yang diproduksinya.
Untuk itu diambil sampel 20 konsumen untuk diobservasi. Berikut ini adalah data dari
sampel yang diobservasi.
Konsumen Harga Permintaan
1 28 37
2 37 35
3 31 33
4 42 43
5 38 49
6 35 48
7 29 30
8 30 36
9 32 39
10 43 40
11 36 41
12 33 50
13 44 55
14 50 58
15 34 42
16 39 44
17 45 46
18 46 51
19 55 56
20 53 29
Dari data diatas hitunglah spearman rank coefficient of correlation dan apakah terdapat
hubungan antara kedua variabel tersebut. Gunakan taraf nyata 5% !
Konsumen Harga (Xi) Permintaan ( Yi) R Xi R Yi di di2
1 28 37 1 6 -5 25
2 37 35 10 4 6 36
3 31 33 4 3 1 1
4 42 43 13 11 2 4
5 38 49 11 15 -4 16
6 35 48 8 14 -6 26
7 29 30 2 2 0 0
8 30 36 3 5 -2 4
9 32 39 5 7 -2 4
10 43 40 14 8 6 36
11 36 41 9 9 0 0
12 33 50 6 16 -10 100
13 44 55 15 18 -3 9
209
14 50 58 18 20 -2 4
15 34 42 7 10 -3 9
16 39 44 12 12 0 0
17 45 46 16 13 3 9
18 46 51 17 17 0 0
19 55 56 20 19 1 1
20 53 29 19 1 18 324
Total 618
Ho : tidak terdapat hubungan antara harga produk dan permintaan konsumen
Ha : terdapat hubungan antara harga produk dan permintaan konsumen
rs = 1 - ( ∑
( ))
n = 20
Wp = W1-α/2 = W1-0,05/2 = W0,975 = 0,4451
|rs| ≤ W 1- α/2 : Ho tidak dapat ditolak
|rs|> W 1- α/2 : Ho ditolak
Ternyata 0,535338 > 0,4451 atau |rs| > W 1- α/2 maka H0 ditolak
Dengan tingkat signifikansi 5% maka ada hubungan antara harga produk dan permintaan
konsumen.
2. Berikut ini adalah data mengenai pendapatan dari pegawai di PT Telephone Indonesia
yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri.
Univ. DN Univ. LN
85 79
78 68
83 85
80 82
74 80
65 75
88 81
79 64
69 65
71
Dengan menggunakan taraf nyata 5%,tentukanlah apakah terdapat perbedaan pendapatan
yang signifikan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar
Negeri !
210
Ho : Tidak terdapat perbedaan pendapatan antara pegawai yang merupakan lulusan
Universitas Dalam Negeri dan Luar Negeri
Ha : Terdapat perbedaan pendapatan antara pegawai yang merupakan lulusan Universitas
Dalam Negeri dan Luar Negeri
S = ∑ R(1) = 105
T = 105 - 10 (10+1)
2
T = 60
Wα/2 = 21
W1-α/2 = 69
Kriteria T < Wα/2 Ho ditolak
T > W1-α/2 Ho ditolak
Ternyata, 60 < 21 maka Ho tidak dapat ditolak
Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa tidak terdapat perbedaan
pendapatan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar
Negeri.
3. Tabel dibawah ini merupakan tabel yang berisikan data mengenai pendapatan dari
Manajer Sumber Daya Manusia di kota Medan dan Makassar. Hitunglah apakah
pendapatan di Medan lebih besar daripada di Makassar ? (dalam ribuan Rupiah )
Medan Makassar
4500 4300
6000 5200
5750 4900
7000 5700
5400 6000
5400 6200
Univ. DN Ranking Univ. LN Ranking
85 17.5 79 10.5
78 9 68 4
83 16 85 17.5
80 12.5 82 15
74 7 80 12.5
65 2.5 75 8
88 19 81 14
79 10.5 64 1
69 5 65 2.5
71 6
N1 = 10 R1 = 105 N2 = 9 R2 = 85
211
6300 5400
5800 4700
7150 6400
4500
6500
Ho : Pendapatan Manajer Sumber Daya Manusia di Medan tidak lebih besar dari Manajer
Sumber Daya Manusia di Makassar
Ha : Pendapatan Manajer Sumber Daya Manusia di Medan lebih besar dari Manajer
Sumber Daya Manusia di Makassar
Medan Ranking Makassar Ranking
4500 2.5 4300 1
6000 13.5 5200 6
5750 11 4900 5
7000 19 5700 10
5400 8 6000 13.5
5400 16 6200 15
6300 12 5400 8
5800 20 4700 4
7150 18 6400 17
4500 2.5
6500 8
N1 = 11 R1 = 130.5 N2 = 9 R2 = 79.5
S = ∑ R(1) = 130.5
T = 130.5 - 11(11+1)
2
T = 64.5
Wα = 28
Kriteria T > Wα Ho ditolak
Ternyata, 64.5 > 28 maka Ho ditolak
Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa pendapatan Manajer Sumber
Daya Manusia di Medan lebih besar dari Manajer Sumber Daya Manusia di Makassar.
4. University of England Research Center plans to conduct research about the score of
subject A and B in . Using 10 samples of students and the data they get is below :
Students Score of
Subject A
Score of
Subject B
1 90 89
2 85 85
3 87 92
212
4 83 90
5 76 91
6 78 76
7 81 80
8 94 82
9 98 81
10 79 75
Calculate :
a. Spearman rank coefficient of correlation
b. Are there any real correlation between the score of the subject A and subject B? Use
the significance level of 5%
Ho : there is no correlation between the score of the subject A and subject B
Ha : there is a correlation between the score of the subject A and subject B
rs = 1 - ( ∑
( ))
n = 10
Wp = W1-α/2 = W1-0,05/2 = W0,975 = 0,6364
|rs| ≤ W 1- α/2 : Ho tidak dapat ditolak
|rs|> W 1- α/2 : Ho ditolak
Ternyata 0,151515 < 0,6364 maka H0 tidak dapat ditolak ditolak
Kesimpulan :
Using 5% confidence level, there is no real correlation between subject A and B.
Score of
Subject A
Score of
Subject B
R Xi R Yi di di2
90 89 8 7 1 1
85 85 6 6 0 0
87 92 7 10 -3 9
83 90 5 8 -3 9
76 91 1 9 -8 64
78 76 2 2 0 0
81 80 4 3 1 1
94 82 9 5 4 16
98 81 10 4 6 36
79 75 3 1 2 4
Total 140
213
5. The Dean of Political Science in Political University apply two different methods to two
classes. Class A with e-learning method and class B with the conventional teaching
method. The Dean want to know whether there are differences in Final Exam Score
between the two classes.
Class A 80 70 83 85 75 95 84 60 75 65
Class B 70 75 80 90 55 65 85 72
With a 5% significance level, determine whether there is a difference in Final Exam Score
between the two classes ( class A has a higher score than class B) !
Ho : P (X) = P (Y) (score of the students in class A is same as the student in class B)
Ha : P (X) > P (Y) (score of the students in class A is higher than the student in class B)
Class A R (A) Class B R (B)
80 11.5 70 5.5
70 5.5 75 9
83 13 80 11.5
85 15.5 90 17
75 9 53 1
95 18 65 3.5
84 14 85 15.5
60 2 72 7
75 9
65 3.5
N1 = 10 R1=101 N2 = 8 R2 = 70
S = ∑ R(X) = 101
T = 101 - 10 (10+1)
2
T = 46
Lihat tabel:
Wα (n=10, m=8 α = 0,05 )( tabel mann whitney )
=21
W1-α = n(N+1)- Wα
= 8(10 +1) - 21 = 67
Kriteria T ≤ W1-α Ho tidak dapat ditolak
T > W1-α Ho ditolak
Ternyata, 46 < 67 atau T ≤ W1-α maka Ho tidak dapat ditolak
214
With a significant level 5%, we can conclude that score of the students in class A is same
as the student in class B.
6. The Ministry of Education make a hypothesis that students from high school in urban area
obtain a National Exam score higher than at high school students in the rural area. The
results obtained from the following tests.
Urban 43 56 31 30 41 38 53 32 45 33 41
Rural 47 68 39 42 33 54 40 24 30
With a 5% significance level, determine whether there is a difference between National
Examination scores in urban and rural (urban is higher than rural) !
Ho : P (X) = P (Y) (score of the students in urban is same as the student in rural)
Ha : P (X) > P (Y) (score of the students in urban is higher than the student in rural)
Urban R (1) Rural R (2)
43 14 47 16
56 19 68 20
31 4 39 9
30 2.5 42 13
41 11.5 33 6.5
38 8 54 18
53 17 40 10
32 5 24 1
45 15 30 2.5
33 6.5
41 11.5
N1 = 11 R1 = 114 N2 = 9 R2= 96
S = ∑ R(X) = 114
T = 114 - 11 (11+1)
2
T = 48
Lihat tabel:
Wα (n=11, m=9 α = 0,05 )( tabel mann whitney )
=28
W1-α = n(N+1)- Wα
= 9(11 +1) - 28 = 80
215
Kriteria T ≤ W1-α Ho tidak dapat ditolak
T > W1-α Ho ditolak
Ternyata, 48 < 80 atau T ≤ W1-α maka Ho tidak dapat ditolak
With a significant level 5%, we can conclude that score of the students in urban is same as
the student in rural
7. The following data concerning the relationship between the score of mathematical
economics and statistics subjects of the 10 students
Mathematical
economics
82 75 85 70 77 60 63 66 80 89
Statistics 79 80 89 65 67 62 61 68 81 84
Examine, if there is a real positive correlation between the score of mathematical economics
and statistics subjects ? ( significant level 5 % )
Answer ;
Mahasiswa Score of Mathematical
Economics
Score of Statistics d
( X-Y )
D2
X Urutan Y Urutan
1
2
3
4
5
6
7
8
9
10
82
75
85
70
77
60
63
66
80
89
8
5
9
4
6
1
2
3
7
10
79
80
89
65
67
62
61
68
81
84
6
7
10
3
4
2
1
5
8
9
2
-2
-1
1
2
-1
1
-2
-1
1
4
4
1
1
4
1
1
4
1
1
Jumlah 22
216
rs : 1 – ( )
( ) = 0,867
Hipotesis :
:
ρs tabel(dimana n = 10 dan α = 5 %) = 0,5315
Kriteria pengujian ; Ho tidak dapat ditolak apabila rs ≤ ρs tabel
Karena rs = 0,867> dari ρs tabel = 0,5315, maka Ho ditolak, jadi ada hubungan positif yang
nyata antara nilai matematika ekonomi dengan nilai statistika.