bhn ajar statdas
TRANSCRIPT
1
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
I. PENGANTAR STATISTIKA
1.1 Jenis-jenis Statistik
Secara umum, ilmu statistika dapat terbagi menjadi dua jenis, yaitu:
1. Statistika Deskriptif
2. Statistika Inferensial
Dalam sub bab ini akan dijelaskan mengenai pengertian dari kedua jenis statistika
tersebut.
a. Statistika Deskriptif
Statistika deskriptif dapat disebut juga sebagai statistika deduktif atau statistika
sederhana. Staistika deskriptif adalah statistika yang tingkat pengerjaanya mencakup cara-
cara menghitung, menyusun atau mengatur, mengolah, menyajikan data agar dapat
memberikan gambaran yang ringkas mengenai suatu keadaan, seperti teknik umum mencari
rata-rata, median, modus, kuartil dan lain sebagainya.
b. Statistika Inferensial
Statistika inferensial adalah statistika yang berhubungan dengan analisis data untuk
penarikan kesimpulan dari data. Misalnya, teknik uji hipotesa, analisis varians, teknik
korelasi, regresi dan lain-lain.
1.2 Jenis-jenis Data
Secara garis besar, data-data olahan dibagi menjadi 3 jenis data, yaitu:
1. Data Kuantitatif, yaitu data yang berupa angka-angka. Informasi yang dikandung data
berupa data angka. Contoh: data jumlah penduduk, jumlah pendapatan nasional, dan lain
sebagainya. Data kuantitatif dapat berupa:
a. Data Kontinu adalah data yang angka-angkanya merupakan deretan angka yang
sambung-menyambung atau berkelanjutan.
Contoh: tinggi badan, berat badan, dan lain-lain.
b. Data diskrit adalah data statistik yang tidak berkelanjutan.
Contoh: Jumlah penduduk, Jumlah anak dan lain-lain.
2. Data Kualitatif, yaitu data non-angka. Informasi yang dikandung bukan berupa angka.
Contoh: data jenis kelamin penduduk, tingkat pendidikan dan sebagainya. Data jenis ini harus
diubah terlebih dahulu menjadi data kuantitatif sebelum diolah.
2
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
1.3 Jenis-jenis Skala Pengukuran
Skala pengukuran yang dapat digunakan dalam pengolahan data statistik adalah
sebagai berikut:
1. Data Nominal
Data nominal adalah data statistik yang cara menyusunnya atas golongan atau klasifikasi
tertentu.
Contoh: Jumlah mahasiswa dari segi tingkat kelas dan kelamin.
2. Data Ordinal
Data ordinal adalah data statistik yang cara menyusunnya didasarkan pada urutan,
kedudukan dan rangking/tingkatan data.
Contoh: Pandai, kurang pandai dan tidak pandai.
3. Data Interval
Data interval adalah data statistik dimana terdapat jarak yang sama. Dari satu data ke data
yang lain intervalnya sama.
Contoh: Mahasiswa yang mendapat nilai 1 sampai 10, petani yang mempunya hasil panen
antara 2 sampai 15 kwintal, dan sebagainya.
4. Data Rasio
Data rasio adalah data yang tergolong dalam data kontinum tapi mempunyai ciri (syarat)
tertentu.
Contoh: Berat badan Paman 60 Kg, Berat badan Sagung 15 Kg. Dengan demikian, berat
badan Ibu adalah 4 kali berat badan Ani.
1.4 Populasi dan Sampel
Populasi adalah sekumpulan objek yang akan dijadikan sebagai bahan penelitian
dengan ciri mempunyai karakteristik yang sama. Populasi selalu memiliki sifat-sifat yang
serupa. Beberapa macam populasi didasarkan pada jumlah anggotanya adalah sebagai
berikut:
a. Populasi berhingga
Populasi berhingga adalah sekumpulan objek yang akan dijadikan sebagai kajian yang
jumlahnya tertentu.
Contoh: Populasi mahasiswa fakultas ekonomi, jumlah kendaraan bermotor dari merk
tertentu yang beredar di jalan, jumlah siswa kelas III dari suatu Sekolah Dasar, dan lain
sebagainya.
3
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
b. Populasi tak berihingga
Populasi tak berhingga adalah sekumpulan objek yang akan diteliti berjumlah tidak
terhingga banyak.
Contoh: Populasi amoeba dalam suatu parit, jumlah pelanggan supermarket, jumlah
partikel di udara, dan lain-lain.
4
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
II. STATISTIKA DESKRIPTIF
2.1 Daftar Distribusi Frekuensi
Dafatr distribusi frekuensi adalah penyusunan urutan data ke dalam kelas-kelas
interval, untuk kemudian ditentukan jumlah frekuensinya berdasarkan data yang sesuai
dengan batas-batas interval kelasnya. Tahap penyusunan data menjadi daftar distribusi
frekuensi antara lain adalah:
1. Menghitung jumlah data
2. Mencari data tertinggi dan terendah
3. Menetapkan range
minmax)( Range XXR
4. Merencanakan jumlah kelas
Jumlah kelas dihitung dengan menggunakan kaedah Sturges:
nb log3,31 , dimana n adalah jumlah data
5. Menentukan panjang kelas
Panjang kelas ditentukan dengan persamaan berikut:
b
R
b
xxp
minmax
6. Menentukan ujung bawah pada kelas interval
Ujung bawah kelas interval ditentukan dengan cara menjumlahkan data terkecil
yang ditetapkan sebagai ujung bawah kelas interval pertama dengan nilai panjang
kelas (p).
Contoh 2.1:
Jumlah kelas: 8
P=9
Data terkecil=22
Maka ujung bawah interval adalah:
22, 31, 40, ….dan seterusnya.
7. Menetapkan nilai ujung atas kelas interval
Ujung atas kelas interval dimulai dengan interval kelas pertama sampai dengan
kelas terakhir.
5
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
a. Jika ujung-ujung bawah adalah bilangan bulat, maka nilai-nilai dari ujung
atas pada interval kelas pertama, kedua dan seterusnya mempunyai selisih 1
dengan nilai ujung bawah berikutnya.
Contoh 2.2:
Perhatikan kembali Contoh 2.1, maka ujung atas intervalnya adalah:
30, 39, 48, …..dan seterusnya.
b. Jika ujung-ujung bawah adalah bilangan 1 desimal, maka nilai ujung-ujung
atas pada interval kelas pertama, kedua dan seterusnya mempunyai seliisih
0,1 dengan nilai ujung bawah berikutnya.
Contoh 2.3:
Misalkan ujung atas interval kelas data adalah:
25,0
31,5
38,0
44,5
dan seterusnya.
Sehingga diperoleh ujung atas intervalnya adalah:
31,4
37,9
44,4
dan seterusnya.
Begitu seterusnya untuk bilangan 2 desimal , 3 desimal dan selanjutnya.
8. Menetukan batas bawah dan batas atas kelas interval
Batas bawah interval dapat dihitung dengan persamaan berikut:
seterusnyadan
desimal) 2bilangan berupa yang ujung(untuk 0.005-bawah ujungintervalbawah Batas
desimal) 1bilangan berupa yang ujung(untuk 0.05-bawah ujungintervalbawah Batas
bulat)bilangan berupa yang ujung(untuk 0.5-bawah ujungintervalbawah Batas
sedangkan batas atas dapat dihitung dengan persamaan berikut:
6
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
seterusnyadan
desimal) 2bilangan berupa yang ujung(untuk 0.005atas ujunginterval atas Batas
desimal) 1bilangan berupa yang ujung(untuk 0.05atas ujunginterval atas Batas
bulat)bilangan berupa yang ujung(untuk 0.5atas ujunginterval atas Batas
9. Menentukan nilai tengah
Nilai tengah dapat ditentuan sebagai berikut:
2
atas ujung bawah ujung ix
10. Frekuensi
Banyak data dalam setiap interval kelas yang diperoleh dari himpunan data
disesuaikan dengan batas-batas interval kelas.
Adapun macam-macam distribusi frekuensi adalah:
a. Distribusi frekuensi relatif
Distribusi frekuensi relatif dapat dinyatakan dalam bentuk relatif (persentase).
Frekuensi relatif kadang-kadang dinyatakan dalam bentuk perbandingan ataupun desimal.
Contoh 2.4:
Misalkan jumlah seluruh data adalah 125, maka diperoleh:
21 – 30 12 %6,9%100125
12
31 – 40 10 %8%100125
10
dan seterusnya. Sehingga diperoleh tabel distribusi berikut ini:
Tabel 2.1 Distribusi frekuensi relatif dari Contoh 2.4
No. Interval Frekuensi Frekuensi relatif
1. 21 – 30 12 %6,9
2. 31 – 40 10 %8
dan seterusnya dan seterusnya
b. Distribusi frekuensi kumulatif
Distribusi frekuensi kumulatif adalah distribusi yang berisikan frekuensi kumulatif.
Frekuensi kumulatif adalah frekuensi yang dijumlahkan. Ada dua macam distribusi frekuensi
kumulatif, yaitu distribusi frekuensi kumulatif kurang dari dan lebih dari.
7
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
a. Distribusi Frekuensi Kumulatif kurang dari, adalah distribusi frekuensi yang memuat
jumlah frekuensi yang memiliki nilai kurang dari nilai batas kelas suatu interval tertentu.
b. Distribusi Frekuensi Kumulatif lebih dari, adalah distribusi frekuensi yang memuat jumlah
frekuensi yang memiliki nilai lebih dari nilai batas kelas suatu interval tertentu.
Contoh 2.5:
Berikut ini adalah data 50 mahasiswa dalam perolehan nilai statistik pada Pendidikan
Matematika Universitas “T” semester II tahun 2010:
70 91 93 82 78 70 71 92 38 56
79 49 48 74 81 95 87 80 80 84
35 83 73 74 43 86 68 92 93 76
81 70 74 97 95 80 53 71 77 63
74 73 68 72 85 57 65 93 83 86
Nyatakan data-data tersebut ke dalam bentuk tabel distribusi frekuensi kurang dari dan lebih
dari!
Penyelesaian:
Tabel 3.2 Tabel distribusi frekuensi kurang dari dan lebih dari
No. Interval Frekuensi
Frekuensi kumulatif ( kf )
Nilai kf Kurang dari
<35 0
1. 35 – 43 3 < 44 3
2. 44 – 52 2 < 53 5
3. 53 – 61 3 < 62 8
4. 62 – 70 7 < 71 15
5. 71 – 79 13 < 80 28
6. 80 – 88 13 < 89 41
7. 89 – 97 9 < 98 50
(a) Tabel distribusi frekuensi kumulatif kurang dari
No. Interval Frekuensi
Frekuensi kumulatif ( kf )
Nilai kf Kurang dari
> 35 50
1. 35 – 43 3 > 44 41
8
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
2. 44 – 52 2 > 53 28
3. 53 – 61 3 > 62 15
4. 62 – 70 7 > 71 8
5. 71 – 79 13 > 80 5
6. 80 – 88 13 > 89 3
7. 89 – 97 9 > 98 0
(b) Tabel distribusi frekuensi kumulatif lebih dari
Contoh Soal 2.1:
Misalkan terdapat sekelompok data berikut ini:
10 20 14 15 21 25 27 15 13 12
17 14 16 28 22 21 22 23 25 20
Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi!
Penyelesaian:
1. Jumlah data = 20
2. 10dan 28 minmax xx
3. 181028)( Range minmax xxR
4. Jumlah kelas:
29,5301,13,3120log3,31log3,31 nb
Pembulatan dilakukan ke bawah sehingga diperoleh:
529,5 b
5. Panjang interval
6667,35
18
b
Rp
Pembulatan dilakukan ke atas sehingga diperoleh:
46667,3 p
Dari informasi-informasi yang diperoleh tersebut, maka didapatkan daftar distribusi sebagai
berikut:
Tabel 2.3 Daftar distribusi frekuensi dari Contoh Soal 2.1
No. Interval Kelas Frekuensi
1. 10 – 13 3
2. 14 – 17 6
9
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
3. 18 – 21 4
4. 22 – 25 5
5. 26 – 29 2
20
Latihan Soal 2.1
1. Misalkan terdapat sekelompok data berikut ini:
20 22 25 32 18 24 15 30 29 28
30 26 31 23 30 34 27 20 32 34
Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi, distribusi frekuensi
relatif, distribusi frekuensi kumulatif kurang dari dan lebih dari!
2. Misalkan terdapat sekelompok data berikut ini:
25 32 40 33 26 34 45 58 97 68
65 70 98 55 58 53 86 97 64 34
29 30 45 54 66 76 75 88 48 38
44 48 74 43 42 58 55 30 31 51
87 67 68 75 54 65 89 93 94 76
66 69 70 79 37 38 66 87 50 25
36 39 64 60 69 70 71 72 75 80
86 83 82 98 61 73 82 86 44 42
35 38 42 49 44 75 77 79 81 52
28 43 55 83 66 69 70 73 52 39
Kelompokkan data-data tersebut ke dalam suatu tabel distribusi frekuensi, distribusi
frekuensi relatif, distribusi frekuensi kumulatif kurang dari dan lebih dari!
2.2 Ukuran Kepusatan
Ukuran kepusatan suatu kelompok data terdiri atas:
1. Bagaimana tingkat penyimpangan data terhadap rata-rata datanya
2. Bagaimana variasi data yang dimiliki
3. Seberapa besar kemiringan kurvanya terhadap nilai rata-rata
4. Bagaimana ukuran keruncingan kurva (menunjukkan kondisi penyebaran data terhadap
nilai rata-rata)
Terdapat beberapa ukuran kepusatan yang akan dibahas dalam sub bab ini, yaitu:
1. Rata-rata data baik yang belum maupun yang sudah dikelompokkan
10
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
2. Modus dari data baik yang belum maupun yang sudah dikelompokkan
3. Median dari data yang belum maupun yang sudah dikelompokkan
4. Kuartil dari data yang belum maupun yang sudah dikelompokkan
5. Desil dari data yang belum maupun yang sudah dikelompokkan
2.2.1 Rata-rata
Dalam sub bab ini terdapat beberapa macam rata-rata yang akan dijelaskan,
diantaranya adalah:
a. Rata-rata Hitung
Rata-rata hitung sesungguhnya merupakan hasil jumlah semua data dibagi dengan banyak
data. Rata-rata hitung biasa dilambangkan dengan x .
Misalkan suatu kelompok data dapat dinyatakan dalam barisan nxxx ,,, 21 . Maka rata-
rata hitung dari data yang belum dikelompokkan (data tunggal) tersebut dapat dinyatakan
dengan persamaan:
n
xxx
n
x
x n
n
i
i
211 .
Sedangkan untuk data yang sudah dikelompokkan ke dalam suatu tabel distribusi
frekuensi, rata-rata hitungnya dapat dinyatakan ke dalam persamaan berikut:
i
ii
f
xfx ……………………….(2.1)
atau dapat juga digunakan persamaan:
i
ii
f
Cfpxx 0 ……………………….(2.2)
dimana:
dasardijadikan yangbukan dan tertentu -ke kelas tengah)(nilai
dasardijadikan yang kelas interval tengah)(nilai
data rata-Rata
0
iPoint Midx
Point Midx
x
i
p
xxCiC
p
if
iii
i
0 ,-ke kelas (coding) skala
dasar kelas pada interval kelas panjang
-ke kelas Frekuensi
11
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Penentuan kelas dasar dalam mencari rata-rata hitung dapat dilakukan secara random.
Setiap orang dapat menentukan nilai 0x yang berbeda-beda.
Contoh soal 2.2
Perhatikan kembali Contoh 2.1. Carilah rata-rata hitung data tersebut baik sebelum
maupun sesudah dikelompokkan ke dalam tabel distribusi frekuensi seperti tampak pada
Tabel 2.3.
Penyelesaian:
Diketahui: 20n
1920
380
20
20252327252115142010
20
20
11
i
i
n
i
i x
n
x
x
Selanjutnya, perhatikan Tabel 2.3 data-data tersebut dinyatakan ke dalam suatu tabel
distribusi frekuensi. Dari Tabel 2.3 diperoleh beberapa informasi yang dapat disajikan dalam
Tabel 2.4.
Tabel 2.4. Informasi dari data berkelompok Contoh Soal 2.1 (a)
No. Interval Kelas Frekuensi
if ix
ii xf
1. 10 – 13 3 11,5 34,5
2. 14 – 17 6 15,5 93
3. 18 – 21 4 19,5 78
4. 22 – 25 5 23,5 117,5
5. 26 – 29 2 27,5 55
20 378
Sehingga jika rata-rata hitung ditentukan dengan menggunakan Persamaan 2.1, maka
diperoleh:
9,1820
380
i
ii
f
xfx
12
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Kemudian, jika rata-rata hitung dicari dengan menggunakan Persmaan (2.2) dan jika
diambil nilai 5,150 x maka diperlukan pula beberapa informasi seperti yang tampak pada
Tabel 2.5 berikut:
Tabel 2.5. Informasi dari data berkelompok Contoh Soal 2.1(b)
No. Interval Kelas Frekuensi
if ix iC
ii Cf
1. 10 – 13 3 11,5 -1 -3
2. 14 – 17 6 15,5 0 0
3. 18 – 21 4 19,5 1 4
4. 22 – 25 5 23,5 2 10
5. 26 – 29 2 27,5 3 6
20 17
Sehingga diperoleh rata-rata hitung:
9,18
4,35,15
20
1745,15
0
i
ii
f
Cfpxx
b. Rata-rata Ukur
Rata-rata ukur biasa digunakan pada kumpulan data yang mempunyai sifat berurutan
tetap arau hampir tetap. Dengan kata lain, rata-rata ukur dapat digunakan untuk menghitung
rata-rata data yang bersifat kelipatan tetap (hampir tetap.
Misalkan terdapat sekumpulan data yang memenuhi sifat-sifat di atas, yaitu
nxxx ,,, 21 . Maka rata-rata ukur dapat dihitung dengan menggunakan persamaan berikut:
nnxxxU 21 ……………………..(2.3)
dengan n adalah jumlah data. Persamaan (2.3) dapat diturunkan sebagai berikut:
nn
nn
xxxU
xxxU
1
21
1
21
loglog
nxxxn
U 21log1
log …………………………………….(2.4)
13
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Sehingga untuk data yang telah dikelompokkan dapat digunakan persamaan berikut:
i
ii
f
xfU
loglog ………………………….(2.5)
Contoh 2.3
Misalkan sekelompok data:
85 75 70 80 90 45 50 65 35 40
Data tersebut dapat dinyatakan ke dalam tabel distribusi frekuensi berikut:
Tabel 2.6 Tabel distribusi frekuensi Contoh 2.3
No. Interval Frekuensi ix log ix ii xf log
1 35 – 48 3 41,5 1,61805 4,85414
2 49 – 62 1 55,5 1,74429 1,74429
3 63 – 76 3 69,5 1,84199 5,52595
4 77 – 90 3 83,5 1,92165 5,76506
10 17,88945
Cari rata-rata ukurnya!
Penyelesaian:
51,60
105786,6
40.35.65.50.45.90.80.70.75.85
10 17
10
U
Atau dapat dihitung dengan menggunakan Persamaan (2.4) seperti tampak di bawah ini:
51,607818,1log
7818,1
818,1710
1
40.35.65.50.45.90.80.70.75.85log10
1log
1
U
U
Untuk data yang telah dikelompokkan dalam Tabel 2.3 dapat diperleh rata-rata ukur berikut:
5,6178895,1log
78895,110
88945,17loglog
1
U
f
xfU
i
ii
14
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
c. Rata-rata Untuk Suatu Data Yang Bersifat Tumbuh
Nilai rerata untuk suatu data yang bersifat tumbuh dapat diperoleh dengan menggunakan
persamaan:
t
t
xPP
10010
Keterangan:
waktuSelang
data rata-Rata
awal Data
akhir Data
0
t
x
P
Pt
Contoh data yang bersifat tumbuh adalah perkembangan modal usaha selama kurun
waktu tertentu atau perkembangan jumlah penduduk suatu daerah dalam kurun waktu
tertentu.
Contoh 2.4
Jumlah penduduk suatu daerah pada tahun 1998 adalah 3,2 juta dan pada tahun 2011
jumlahnya bertambah menjadi 132,5 juta. Berapakah pertambahan rata-rata penduduk setiap
tahunnya?
Penyelesaian:
t
t
xPP
10010
15
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
3416,33
331649,0100
331649,1100
1
6170659,150515,61222,8100
1log
1001log133200000log132500000log
1001loglog
1001loglog
1001loglog
0
0
0
x
x
x
x
x
xtP
xP
xPP
t
t
t
Jadi, rata-rata pertambahan penduduk per tahunnya adalah 34 jiwa.
2.2.2 Modus
Modus adalah besaran yang menyatakan keterpusatan data didasarkan pada frekuensi
paling sering munculnya data. Selanjutnya, data yang mempunyai lebih dari satu nilai modus
disebut data multimodal.
Untuk data yang telah dikelompokkan menjadi tabel distribusi frekuensi, modus dapat
dihitung dengan menggunakan persamaan berikut:
21
1
bb
bpbM o
Keterangan:
sesudahnya frekuensidengan modus frekuensi antaraselisih
sebelumnya frekuensidengan modus frekuensi antaraselisih
interval panjang
terdapatmodus dimanabawah Batas
modus Nilai
2
1
b
b
p
b
M o
Contoh 2.5
1. Misalkan sekelompok data: 12, 24, 23, 12, 31, 42
Maka modus dari data tersebut adalah 12 (muncul 2 kali).
16
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
2. Lihat kembali data dalam Contoh 2.1. Tampak bahwa frekuensi tertinggi ada pada kelas
kedua. Sehingga diperoleh informasi sebagai berikut:
9,1523
35,13
2
3
5,13
2
1
oM
b
b
b
Hal ini mengandung arti bahwa nilai-nilai data terletak paling banyak di sekitar nilai 15,9.
2.2.3 Median
Median adalah nilai data tengah (sekelompok data dibagi menjadi 2 bagian yang
sama). Ingat bahwa median dicari setelah data diurutkan terlebih dahulu.
Untuk data yang belum dikelompokkan, penghitungan median dapat dilakukan
dengan 2 cara, yaitu:
a. Untuk data ganjil
Contoh 2.6
Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8
Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16
Sehingga diperoleh median data adalah: 7eM
b. Untuk data genap
Contoh 2.7
Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8, 17
Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16, 17
Sehingga diperoleh median data adalah: 5,72
87
eM .
Selanjutnya, untuk kumpulan data yang telah dikelompokkan ke dalam distribusi
frekuensi, median data tersebut dapat ditentukan dengan persamaan di bawah ini:
f
Fn
pbM e2
Keterangan:
17
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
median kelas frekuensi
median kelas sebelum kumulatif frekuensi
datajumlah
berada)median (dimanamedian kelas kelas panjang
berada)median (dimanamedian kelasbawah Batas
f
F
n
p
b
Contoh 2.8
Misalkan terdapat sekelompok data yang telah disajikan dalam tabel distribusi frekuensi
berikut ini:
Tabel 2.7. Tabel distribusi frekuensi data Contoh 2.8
No. Interval Frekuensi (f) frekuensi kumulatif
(F)
1 31 – 40 4 4
2 41 – 50 6 10
3 51 – 60 8 18
4 61 – 70 14 32
5 71 – 80 26 58
6 81 – 90 12 70
7 91 – 100 20 90
90
Median terletak pada data ke:
452
90
Karena data ke 45 terletak pada kelas ke-5, maka diperoleh informasi berikut:
26
32
10
5,705,071
f
F
p
b
5,7526
3245105,70
eM
2.2.4 Kuartil
Kuartil adalah nilai sekumpulan data yang dibagi 4 bagian yang sama. Oleh sebab itu,
terdapat 3 kuartil, yaitu: 321 ,, KKK .
Untuk data yang belum dikelompokkan ke dalam tabel distribusi frekuensi, maka
kuartil data dapat dihitung sesuai dengan langkah-langkah berikut:
18
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
1. Urutkan data dari data terkecil ke data terbesar
2. Tentukan letak kuartil dengan persamaan:
databanyak ,4
)1(
n
niK i
3. Tentukan nilai kuartil yang diminta tersebut
Contoh 2.9
1. Misalkan diketahui data ganjil sebagai berikut: 12,8, 10, 22, 18, 4, 9
Sehingga diperoleh data setelah diurutkan: 4, 8, 9, 10, 12, 18, 22
Letak kuartil:
24
)17(11
K maka, kuartil pertama (
1K ) terletak pada data ke-2, yaitu: 8
44
)17(22
K maka, kuartil pertama (
2K ) terletak pada data ke-4, yaitu: 10
64
)17(33
K maka, kuartil pertama (
1K ) terletak pada data ke-6, yaitu: 18
2. Misalkan diketahui data genap: 8, 12, 5, 3, 7, 2, 3, 8
Sehingga data terurut: 2, 3, 3, 5, 7, 8, 8, 12
Letak kuartil:
25,24
)18(11
K
Nilai 1K Data ke-2+(0,25(data ke-3 – data ke-2))
3+(0,25(3-3))
3
5,44
)18(22
K
Nilai 1K Data ke-4+(0,5(data ke-5 – data ke-4))
5+(0,5(7-5))
6
25,64
)18(33
K
Nilai 3K Data ke-6+(0,25(data ke-7 – data ke-6))
8+(0,25(8-8))
8
19
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Sedangkan untuk data yang telah dikelompokkan ke dalam tabel distribusi frekuensi,
kuartil data dapat dihitung dengan menggunakan langkah-langkah berikut:
1. Tentukan letak kuartil dengan persamaan:
databanyak ,4
nin
K i
2. Menentukan nilai kuartil dengan persamaan berikut:
f
Fin
pbK i4 Nilai
Keterangan:
kuartil kelas frekuensi
kuartil kelas sebelum kumulatif frekuensi
datajumlah
interval panjang
kuartil kelasbawah batas
f
F
n
p
b
Contoh 2.10
Perhatikan Tabel 2.7. Tentukan nilai kuartil ketiganya ( 3K )!
Letak kuartil kedua ( 3K ):
5,674
9033
K , maka kuartil ketiga terletak pada kelas ke-6
Sehingga diperoleh informasi berikut:
12
58
10
5,805,081
f
F
p
b
42,8812
584
903
105,80 Nilai 3
K
Latihan Soal
Misalkan terdapat sekumpulan data berikut:
10 20 14 15 21 25 27 15 13 12
20
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
17 14 16 28 22 21 22 23 25 20
Carilah modus, median dan ketiga kuartil dari data tersebut baik sebelum maupun sesudah
dikelompokkan ke dalam tabel distribusi frekuensi!
21
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
III. ANALISA KORELASI LINEAR SEDERHANA
Analisis korelasi adalah metode statistik yang digunakan untuk menentukan kuat
tidaknya (derajat) hubungan linier antara 2 variabel atau lebih. Analisa korelasi sederhana,
meneliti hubungan dan bagaimana eratnya itu, tanpa melihat bentuk hubungan. Jika kenaikan
didalam suatu variabel diikuti dengan kenaikan variabel yang lain, maka dapat dikatakan
bahwa kedua variabel tersebut mempunyai “korelasi”yang positif. Tetapi jika kenaikan
didalam suatu variabel diikuti penurunan variabel yang lain maka kedua variabel tersebut
mempunyai korelasi negatif. Jika tidak ada perubahan pada suatu variabel ,meskipun variabel
yang lain mengalami perubahan, maka kedua variabel tersebut, tidak mempunyai hubungan
(uncorrelated).
Ilmu ekonomi dan pendidikan banyak mempelajari hubungan antar berbagai variabel.
Dari adanya hubungan tersebut digunakan untuk memprediksi pengaruh satu variabel
terhadap variabel lainnya. Misalnya, hubungan antara jumlah permintaan suatu barang
terhadap besarnya harga yang dapat dinyatakan dengan (f(p)). Fungsi tersebut menunjukkan
fakta yang muncul sebagai akibat atau disebabkan munculnya suatu yang lain. Hal ini
menghadapkan kita pada fakta kausalitas. Dari contoh tersebut dapat dijelaskan bahwa
jumlah barang yang diminta akan berubah sebagai akibat adanya perubahan harga.
Hubungan-hubungan fungsional tersebut menjelaskan ketergantungan variabel terikat
(dependent variable) pada variabel-variabel bebas (independent variable) dalam bentuk yang
spesifik. Hubungan fungsional ini bisa jadi merupakan hubungan yang sederhana antar
variabel. Pada kenyataannya, lebih sering dijumpai hubungan fungsional yang rumit dan sulit
untuk dijelaskan. Alat yang sering digunakan untuk mendekati kejadian tersebut adalah
regresi, baik regresi linear sederhana maupun regresi berganda.
Langkah awal yang harus dilakukan (sebelum menganalisis regresi) adalah mengetahui
bahwa dua variabel yang akan dianalisis memiliki hubungan yang kuat. Hal ini dapat
dilakukan dengan melakukan analisis korelasi. Analisis korelasi adalah sekumpulan teknik
statistika yang dapat digunakan untuk mengukur keeratan hubungan (korelasi) antara dua
variabel. Misalkan suatu perusahaan berpendapat bahwa dengan mendemonstrasikan cara
pemakaian produk akan dapat meningkatkan angka penjualan. Dari contoh tersebut, maka
dapat dikatakan bahwa demonstrasi pemakaian produk disebut variabel bebas, sedangkan
angka penjualan disebut variabel terikat.
22
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Hubungan antara dua variabel jika ditinjau dari segi arahnya dapat dibedakan menjadi 2
jenis, yaitu:
1. Hubungan searah (korelasi positif)
Dua variabel (atau lebih) dikatakan memunyai hubungan searah jika dua variabel (atau
lebih) berjalan secara paralel. Hal ini mengandung makna bahwa hubungan antara dua
variabel (atau lebih) menunjukkan arah yang sama.
Jadi apabila variabel X meningkat (bertambah) maka variabel Y juga mengalami
peningkatan. Sebaliknya, apabila variabel X menurun (berkurang) maka variabel Y juga
menurun.
Contoh 3.1
Berikut ini adalah beberapa contoh hubungan searah antara dua variabel:
1. Kenaikan harga BBM akan diikuti dengan kenaikan harga sembako
2. Naiknya frekuensi pemberian tugas akan menyebabkan naiknya hasil belajar
3. Naiknya kedisiplinan anak didik diikuti dengan meningkatnya hasil belajar anak didik
bersangkutan.
Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1
berikut:
Gambar 3.1 Arah Korelasi positif
2. Hubungan berlawanan arah (korelasi negatif)
Dua variabel (atau lebih) dikatakan mempunyai hubungan yang berlawanan arah jika
kedua variabel (atau lebih) tersebut bergerak dengan arah yang berlawanan. Hal ini
mengandung makna bahwa hubungan antara dua variabel (atau lebih) menunjukkan arah
yang berkebalikan.
Jadi, apabila variabel X meningkat (bertambah) maka variabel Y juga mengalami
penurunan. Sebaliknya, apabila variabel X menurun (berkurang) maka variabel Y juga
menigkat.
X Y
(a)
X Y (b)
23
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Contoh 3.2
Berikut ini adalah beberapa contoh hubungan antara dua variabel yang berlawanan arah:
1. Semakin meningkatnya kedisiplinan dalam berkendara akan diikuti dengan
berkurang/menurunnya angka kecelakaan lalu lintas.
2. Semakin menurunnya harga buku pelajaran akan meningkatkan tingkat pengetahuan
siswa.
Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1
berikut:
Gambar 3.1 Arah Korelasi positif
Positif atau negatifnya korelasi antara dua variabel dapat juga dilihat dari angka
korelasinya. Angka korelasi (koefisien korelasi) adalah koefisien yang dapat digunakan untuk
melihat besar-kecilnya, tinggi-rendah atau kuat-lemahnya suatu korelasi. Jadi, koefisien
korelasi adalah sebuah angka yang dapat dijadikan petunjuk untuk mengetahui seberapa besar
kekuatan korelasi di antara variabel yang sedang diselidiki korelasinya.
Lambang koefisien korelasi berbeda-beda sesuai dengan teknik korelasi yang
digunakan, yaitu:
biserialpoint korelasikoefisien
phi korelasikoefisien
spearmann korelasikoefisien
momentproduct korelasikoefisien
pbi
xy
r
r
Besarnya nilai mutlak angka korelasi berada dalam interval 1,0 . “0” menandakan
tidak ada korelasi di antara variabel-variabel yang diselidiki dan angka “1” menunjukkan
adanya korelasi yang maksimal. Jika diperoleh angka korelasi yang lebih dari 1 atau kurang
dari -1, maka dalam perhitungan pasti terjadi kesalahan.
(a)
X Y
(b)
X Y
24
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Jika tanda koefisien korelasi adalah positif („plus‟) maka korelasi yang terjadi adalah
korelasi positif. Sedangkan jika tanda angka/koefisien korelasi adalah negatif („minus‟) maka
korelasi antara variabel-variabel yang diselidiki adalah korelasi negatif.
Terdapat beberapa teknik korelasi yang dapat digunakan untuk mencari angka/koefisien
korelasi antar variabel, diantaranya adalah:
1. Teknik korelasi product moment (pearson)
Teknik korelasi product moment digunakan untuk mencari koefisien korelasi untuk data
kontinu, populasinya bersifat homogen atau mendekati homogen dan regresinya adalah
regresi linear.
2. Teknik korelasi tata jenjang (rank spearman)
Teknik korelasi rank spearmann digunakan untuk mencari koefisien korelasi untuk data
ordinal (berjenjang).
3. Teknik korelasi phi
Teknik korelasi phi digunakan untuk mencari koefisien korelasi untuk data diskrit.
4. Teknik korelasi point biserial
Teknik korelasi point biserial digunakan untuk mencari koefisien korelasi untuk data
kontinu dan diskrit.
Dalam bab ini hanya akan dibahas mengenai teknik korelasi product moment. Seperti
yang telah disebutkan sebelumnya bahwa lambang untuk angka korelasi product moment
adalah xyr , yang dapat ditentukan dengan persamaan berikut:
2222 YYnXXn
YXXYn
xyr ………..(3.1)
Keterangan:
momentproduct korelasikoefisien
dataJumlah
terikatVariabel
bebas Variabel
xyr
n
Y
X
Koefisien ini dapat diinterpretasi dengan 2 cara, yaitu:
1. Dengan cara kasar menggunakan tabel penentu
Jika koefisien yang diperoleh dari Persmaan (3.1) diinterpretasikan dengan menggunakan
cara kasar (tabel penentu) maka digunakan Tabel 3.1 berikut:
25
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
Tabel 3.1 Tabel interpretasi koefisien korelasi dengan cara kasar
Nilai koefisien
korelasi Interpretasi
0 – 0,2
Antara variabel X dan Y terdapat korelasi yang sangat lemah sehingga
korelasi tersebut dapat diabaikan (dianggap tidak ada korelasi antara
variabel X dan Y)
0,2 – 0,4 Antara variabel X dan Y terdapat korelasi yang lemah
0,4 – 0,7 Antara variabel X dan Y terdapat korelasi yang sedang
0,7 – 0,9 Antara variabel X dan Y terdapat korelasi yang kuat
0,9 – 1 Antara variabel X dan Y terdapat korelasi yang sangat kuat
Interpretasi dari koefisien korelasi dapat diambil dengan menggunakan Tabel 3.1 sesuai
dengan nilai yang diperoleh dan disesuaikan dengan interval yang ada di dalam tabel.
2. Dengan menggunakan uji-r
Jika interpretasi dilakukan dengan menggunakan uji-r, maka terdapat beberapa langkah
yang harus ditempuh, yakni:
a). Membuat hipotesa nol 0H dan hipotesa alternatif ( aH )
aH = Terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
0H = Tidak terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
b). Menguji kebenaran hipotesa
Dengan menggunakan tabel r product moment dengan menggunakan ketentuan sebagai
berikut:
1%atau 5%sisignifikan taraf
kandikorelasi yang variabelbanyaknya
datajumlah
kebebasanderajat
k
n
kndf
dimana kriteria ujinya adalah:
ditolak dan diterima maka Jika
diterima dan ditolak maka Jika
0
0
atxy
atxy
HHrr
HHrr
26
STATISTIKA DASAR
ZUMROTUS SYA’DIYAH,S.Si, M.Si
3. Dengan menggunakan uji-t
Seperti pada interpretasi dengan uji-r, dalam interpretasi uji-t juga diperlukan beberapa
langkah berikut:
a). Membuat hipotesa nol 0H dan hipotesa alternatif ( aH )
aH = Terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
0H = Tidak terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
b). Menguji kebenaran hipotesa
Dengan menggunakan tabel t dengan menggunakan ketentuan sebagai berikut:
1%atau 5%sisignifikan taraf
kandikorelasi yang variabelbanyaknya
datajumlah
kebebasanderajat
k
n
kndf
Dan t hitung ditentukan dengan persamaan berikut:
21
2
xy
xy
hit
r
nrt
dimana kriteria ujinya adalah:
ditolak dan diterima maka Jika
diterima dan ditolak maka Jika
0hit
0hit
at
at
HHtt
HHtt