estimasi nilai parameter - usd

53
29 BAB II ESTIMASI NILAI PARAMETER A. Deskripsi Pada bab ini akan dibahas suatu metode untuk mengestimasi parameter suatu populasi dengan menggunakan data sampel. Parameter-parameter tersebut adalah proporsi, mean, variansi, dan simpangan baku. Untuk melakukan estimasi tersebut, prosedur standar yang digunakan adalah dengan mengkonstruksi selang kepercayaan yang akan dijelaskan dalam bab ini. Selain itu, bab ini juga akan membahas bagaimana menentukan ukuran sampel yang diperlukan untuk memperkirakan parameter-parameter populasi tersebut. B. Relevansi Salah satu tujuan statistika inferensial adalah untuk mengestimasi nilai parameter suatu populasi dengan menggunakan data sampel. Untuk itu, bab ini akan menjelaskan metode untuk melakukan estimasi tersebut. Meskipun metode yang akan dibahas dalam bab ini mungkin tergolong baru bagi Anda, tetapi Anda sudah familier dengan jajak pendapat atau hitung cepat pemilu yang marak di media massa. Metode-metode yang akan dijelaskan dalam bab ini sama dengan yang digunakan oleh lembaga-lembaga survei pelaksana jajak pendapat dan hitung cepat pemilu tersebut. C. Capaian Pembelajaran Membuat selang kepercayaan untuk mengestimasi proporsi, mean, variansi, dan simpangan baku suatu populasi, serta menginterpretasikan selang kepercayaan tersebut. Mengidentifikasi persyaratan yang diperlukan untuk membuat selang kepercayaan, dan memeriksa apakah persyaratan tersebut terpenuhi. Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Upload: others

Post on 24-Nov-2021

19 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimasi Nilai Parameter - USD

29

BAB II ESTIMASI NILAI PARAMETER

A. DeskripsiPada bab ini akan dibahas suatu metode untuk mengestimasiparameter suatu populasi dengan menggunakan data sampel.Parameter-parameter tersebut adalah proporsi, mean, variansi, dansimpangan baku. Untuk melakukan estimasi tersebut, prosedurstandar yang digunakan adalah dengan mengkonstruksi selangkepercayaan yang akan dijelaskan dalam bab ini. Selain itu, bab inijuga akan membahas bagaimana menentukan ukuran sampel yangdiperlukan untuk memperkirakan parameter-parameter populasitersebut.

B. RelevansiSalah satu tujuan statistika inferensial adalah untuk mengestimasi nilaiparameter suatu populasi dengan menggunakan data sampel. Untukitu, bab ini akan menjelaskan metode untuk melakukan estimasitersebut. Meskipun metode yang akan dibahas dalam bab ini mungkintergolong baru bagi Anda, tetapi Anda sudah familier dengan jajakpendapat atau hitung cepat pemilu yang marak di media massa.Metode-metode yang akan dijelaskan dalam bab ini sama dengan yangdigunakan oleh lembaga-lembaga survei pelaksana jajak pendapat danhitung cepat pemilu tersebut.

C. Capaian Pembelajaran· Membuat selang kepercayaan untuk mengestimasi proporsi,

mean, variansi, dan simpangan baku suatu populasi, sertamenginterpretasikan selang kepercayaan tersebut.

· Mengidentifikasi persyaratan yang diperlukan untuk membuatselang kepercayaan, dan memeriksa apakah persyaratan tersebutterpenuhi.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 2: Estimasi Nilai Parameter - USD

30

· Menentukan ukuran sampel yang diperlukan untuk mengestimasi proporsi, mean, variansi, dan simpangan baku suatu populasi.

· Terampil menggunakan teknologi informasi untuk menyelesaikan permasalahan statistik terkait selang kepercayaan.

· Merefleksikan hasil analisis data, dan berdasarkan hasil analisis tersebut memberikan tindak lanjut untuk kepentingan bersama.

2.1 Estimasi Proporsi Populasi Bayangkan bahwa kita ingin mengetahui proporsi penduduk Indonesia yang miskin. Penduduk miskin di sini artinya adalah penduduk yang memiliki rata-rata pengeluaran per kapita per bulan di bawah garis kemiskinan. Akan tidak masuk akal ketika kita berharap bisa mensurvei seluruh penduduk Indonesia. Untuk itu, kita bisa menggunakan sampel penduduk Indonesia yang diperoleh secara acak untuk kemudian ditentukan proporsi sampelnya. Proporsi sampel p̂ inilah yang bisa kita gunakan untuk mengestimasi proporsi populasi p. Karena p̂ hanya berupa satu nilai, maka nilai ini selanjutnya disebut dengan estimasi titik.

DEFINISI

Suatu estimasi titik adalah nilai atau titik tunggal yang digunakan untuk mengestimasi nilai parameter.

Di awal telah disampaikan bahwa proporsi sampel bisa digunakan untuk mengestimasi proporsi populasi. Hal ini bisa dilakukan karena alasan berikut.

Proporsi sampel p̂ merupakan estimasi titik terbaik untuk proporsi populasi p.

Proporsi sampel p̂ merupakan estimasi titik terbaik untuk proporsi populasi p karena nilai ini adalah nilai yang paling tidak bias dan paling konsisten untuk mengestimasi p. Nilai p̂ tidak bias karena

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 3: Estimasi Nilai Parameter - USD

31

distribusi samplingnya memiliki pusat di p (lihat kembali subbab 1.3). Nilai ini juga konsisten karena simpangan bakunya cenderung lebih kecil daripada estimasi titik yang mungkin lainnya.

CONTOH 1—Menentukan Estimasi Titik untuk Proporsi Populasi

Badan Pusat Statistik melakukan survei secara acak kepada 300.000 rumah tangga yang tersebar di 34 provinsi dan 511 kabupaten/kota di Indonesia pada tahun 2016 untuk mengetahui proporsi penduduk Indonesia yang miskin. Dengan asumsi bahwa rata-rata banyaknya anggota rumah tangga adalah 3,8, maka banyak penduduk yang disurvei adalah 1,14 juta. Survei ini menemukan bahwa 121.980 rumah tangga masuk dalam golongan penduduk miskin. Tentukan estimasi titik untuk proporsi penduduk miskin Indonesia.

PEMBAHASAN Karena proporsi sampel adalah estimasi titik terbaik untuk proporsi populasi, maka kita hitung proporsi sampelnya.

121.980 0,107 10,7%1.140.000

p = = =

Dengan demikian, kita memperkirakan bahwa 10,7% penduduk Indonesia masuk dalam katagori miskin.

Kerjakan Latihan 2 n

2.1.1 Selang Kepercayaan Pada Contoh 1, dengan menggunakan satu sampel, kita bisa memperkirakan bahwa proporsi penduduk miskin Indonesia adalah 10,7%. Sekarang coba pikirkan bagaimana jika BPS pada tahun yang sama memilih sampel acak yang memuat 300.000 rumah tangga lagi? Apakah masih akan menghasilkan p̂ = 10,7%? Tentu saja jawabannya

adalah tidak karena nilai p̂ akan berbeda dari sampel ke sampel. Karena perbedaan proporsi sampel tersebut, kita perlu melaporkan suatu selang beserta dengan seberapa besar kemungkinan selang

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 4: Estimasi Nilai Parameter - USD

32

tersebut memuat proporsi populasi yang tidak diketahui. Selang seperti ini disebut dengan selang kepercayaan.

DEFINISI

Selang kepercayaan (atau estimasi selang) adalah suatu selang nilai-nilai yang digunakan untuk mengestimasi nilai sebenarnya dari parameter populasi.

Untuk lebih memahami selang kepercayaan, perhatikan ilustrasi berikut. Misalkan Anda diminta untuk memperkirakan persentase mahasiswa di kampus Anda yang menggunakan Twitter. Untuk memperkirakannya, Anda melakukan survei terhadap 80 mahasiswa secara acak dan diperoleh 60 mahasiswa menggunakan Twitter. Dengan demikian, proporsi sampelnya adalah p̂ = 0,75 atau 75%. Dengan menggunakan hasil ini, Anda bisa memperkirakan bahwa 75% dari semua mahasiswa di kampus Anda menggunakan Twitter.

Karena dalam survei tersebut Anda tidak menanyai semua mahasiswa di kampus Anda, maka perkiraan yang telah Anda lakukan mungkin salah. Untuk mengurangi kesalahan tersebut, Anda bisa membuat selang untuk memperkirakan di mana proporsi populasi yang sebenarnya berada, misalkan 0,75 ± 0,05 atau di antara 0,70 dan 0,80. Ketika Anda ditanya seberapa yakin Anda bahwa proporsi populasi berada di antara 0,70 dan 0,80, mungkin jawaban Anda adalah, “Saya 70% yakin bahwa proporsi mahasiswa di kampus saya yang menggunakan Twitter adalah di antara 0.70 dan 0,80.” Jika Anda ingin agar keyakinan Anda naik, misalkan 95%, apa yang bisa Anda lakukan terhadap selang tersebut? Anda harus memperlebar estimasi selang Anda, misalkan 0,65 sampai 0,85, agar keyakinan Anda naik. Dengan demikian, hubungan antara besarnya keyakinan dengan lebar estimasi selang Anda bisa digambarkan pada Gambar 2-1.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 5: Estimasi Nilai Parameter - USD

33

Gambar 2-1 Tingkat kepercayaan dan lebar selang

Seberapa besar keyakinan tersebut selanjutnya disebut dengan tingkat kepercayaan.

DEFINISI

Tingkat kepercayaan adalah peluang bahwa selang kepercayaan yang terbentuk benar-benar memuat parameter populasi jika proses estimasinya dilakukan secara berulang-ulang. Tingkat kepercayaan dinotasikan dengan (1 – α) ∙ 100%.

Tingkat kepercayaan yang sering digunakan adalah 90% (dengan α = 0,1), 95% (dengan α = 0,05), dan 0,99 (dengan α = 0,01). Dari ketiga pilihan tersebut, selang kepercayaan yang paling sering digunakan adalah 95% karena nilai ini memberikan keseimbangan antara presisi (yang ditunjukkan dengan lebar selang kepercayaan) dan reliabilitas (yang ditunjukkan dengan tingkat kepercayaan).

2.1.2 Interpretasi Selang Kepercayaan Melanjutkan ilustrasi yang dijelaskan sebelumnya, berikut ini adalah contoh selang kepercayaan yang memperkirakan proporsi mahasiswa di kampus Anda yang menggunakan Twitter.

Selang kepercayaan 0,95 (95%) mengestimasi bahwa proporsi populasi p berada pada selang 0,655 < p < 0,845.

Kita harus ekstra hati-hati dalam melakukan interpretasi terhadap selang kepercayaan tersebut. Berikut ini contoh interpretasi yang benar dan beberapa kemungkinan interpretasi yang salah.

) ( ( )

Tingkat kepercayaan lebih tinggi

Tingkat kepercayaan lebih rendah

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 6: Estimasi Nilai Parameter - USD

34

Benar: “Kita 95% yakin bahwa selang di antara 0,655 dan 0,845 benar-benar memuat nilai sebenarnya dari proporsi populasi.” Hal ini berarti bahwa jika kita memilih banyak sampel-sampel berukuran 80 yang berbeda dan membuat selang kepercayaannya, 95% dari selang-selang tersebut akan benar-benar memuat proporsi populasi. Nilai 95% di sini merupakan persentase keberhasilan dari proses yang digunakan untuk memperkirakan proporsi populasi.

Salah: “Terdapat kemungkinan 95% bahwa nilai sebenarnya p berada di antara 0,655 dan 0,845.” Kita juga tidak benar jika mengatakan “Dalam 95% sampel, proporsinya terletak di antara 0,655 dan 0,845.”

Untuk lebih memahami interpretasi yang benar dan salah terhadap selang kepercayaan di atas, perhatikan ilustrasi berikut. Misalkan dosen Anda akan mengumumkan nilai kuis Anda. Tidak benar jika Anda mengatakan bahwa peluang untuk mendapatkan nilai di atas 50 adalah 0,5. Nilai Anda akan lebih dari 50 atau tidak, tidak ada hubungannya dengan peluang karena nilai Anda sudah ada sebelumnya. Proporsi populasi p serupa dengan hasil kuis Anda yang sudah memiliki nilai tertentu. Proporsi p adalah nilai yang sudah pasti, sehingga selang kepercayaan yang terbentuk bisa memuat ataupun tidak memuat p. Dengan demikian salah jika kita mengatakan bahwa terdapat peluang 95% bahwa nilai sebenarnya p berada di antara 0,655 dan 0,845.

Kita juga harus mengingat bahwa selang kepercayaan berhubungan dengan nilai sebenarnya dari parameter populasi. Dengan demikian, pernyataan seperti, “Dalam 95% sampel, proporsinya terletak di antara 0,655 dan 0,845” adalah pernyataan yang salah. Selang kepercayaan tidak membahas proporsi sampel, melainkan proporsi populasi.

Selang kepercayaan 95% menyatakan bahwa jika kita melakukan pemilihan sampel-sampel dengan ukuran yang sama dan membuat

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 7: Estimasi Nilai Parameter - USD

35

selang kepercayaan untuk masing-masing sampel tersebut, maka 95% dari selang-selang tersebut akan benar-benar memuat proporsi populasi. Misalkan nilai sebenarnya dari proporsi semua mahasiswa di kampus Anda yang menggunakan Twitter adalah 0,85. Dengan demikian, selang kepercayaan yang telah kita buat sebelumnya tidak memuat proporsi populasi karena 0,85 tidak berada di antara 0,655 dan 0,845. Gambar 2-2 menunjukkan selang kepercayaan yang dihasilkan dari 20 sampel. Dengan tingkat kepercayaan 95%, kita menduga bahwa akan ada 19 dari 20 sampel yang menghasilkan selang kepercayaan yang benar-benar memuat nilai sebenarnya dari proporsi populasi.

Gambar 2-2 Selang kepercayaan dari 20 sampel

2.1.3 Nilai-Nilai Kritis Banyak prosedur-prosedur statistika (termasuk prosedur untuk membuat selang kepercayaan) menggunakan skor z yang memisahkan statistik-statistik sampel yang sangat mungkin terjadi dan statistik-statistik yang sangat mungkin tidak terjadi. Skor z ini disebut dengan nilai kritis.

DEFINISI

Nilai kritis adalah suatu nilai yang menjadi batas antara statistik-statistik sampel yang sangat mungkin terjadi dan statistik-statistik

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 8: Estimasi Nilai Parameter - USD

36

yang sangat mungkin tidak terjadi. Bilangan zα/2 merupakan nilai kritis yang memisahkan daerah di ujung kanan kurva normal baku yang memiliki luas α/2. Perhatikan gambar di bawah.

Untuk mengetahui bagaimana menentukan nilai kritis, perhatikan Contoh 2 berikut.

CONTOH 2—Menentukan Nilai Kritis

Tentukan nilai kritis zα/2 yang bersesuaian dengan tingkat kepercayaan 95%.

PEMBAHASAN Karena tingkat kepercayaan 95% sama dengan 1 – α, maka α = 1 – 0,95 = 0,05 dan akibatnya α/2 = 0,025. Gambar 2-3 menunjukkan kurva normal baku yang daerah di ujung kanannya (dan kirinya) yang memiliki luas 0,025 diarsir. Karena luas daerah di kanan zα/2 sama dengan 0,025, maka luas daerah di kirinya sama dengan 0,975. Dengan menggunakan Excel [dengan rumus =NORM.S.INV(0.975)] , kita peroleh nilai kritis tersebut adalah zα/2 = 1,96.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 9: Estimasi Nilai Parameter - USD

37

Gambar 2-3 Menentukan nilai kritis

Kerjakan Latihan 3 n

Pada Contoh 2 kita telah mencari nilai kritis zα/2 yang bersesuaian dengan tingkat kepercayaan 95%. Nilai kritis untuk tingkat-tingkat kepercayaan lainnya dirangkum dalam tabel berikut.

Tingkat Kepercayaan α Nilai Kritis, zα/2

90% 0,10 1,645

95% 0,05 1,96

99% 0,01 2,576

2.1.4 Batas Galat Kembali ke ilustrasi mengenai penggunaan Twitter di kalangan mahasiwa, kita 95% yakin bahwa proporsi p berada pada selang di antara 0,655 dan 0,845. Dengan kata lain, kita 95% percaya bahwa 0,75 ± 0,095 dari seluruh mahasiswa di kampus Anda menggunakan Twitter. Bilangan 0,095 ini disebut batas galat.

DEFINISI

Ketika data dari sampel acak sederhana digunakan untuk mengestimasi parameter suatu populasi, batas galat atau margin of error, yang dinotasikan dengan E, adalah selisih maksimum yang

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 10: Estimasi Nilai Parameter - USD

38

mungkin (dengan peluang 1 – α) antara statistik sampel dan nilai sebenarnya dari parameter populasi yang diestimasi.

Batas galat untuk mengestimasi proporsi populasi dapat ditentukan dengan mengalikan nilai kritis dan simpangan baku proporsi sampel, seperti yang ditunjukkan Rumus 2-1.

Rumus 2-1 ( )

2

ˆ ˆ1p pE z

na

-= Batas galat proporsi

Dalam Rumus 2-1 di atas, kita menggati p dengan p̂ dalam rumus

simpangan baku. Hal ini dikarenakan p tidak diketahui dan p̂ merupakan estimasi titik terbaik untuk p.

Berdasarkan definisi batas galat di atas, maka dalam selang kepercayaan 95%, α = 0,05, terdapat peluang 0,05 bahwa proporsi sampel memiliki galat lebih dari E. Setelah kita bisa menentukan batas galat E, selanjutnya kita bisa membuat selang kepercayaan yang bisa dirangkum sebagai berikut.

Selang Kepercayaan untuk Mengestimasi Proporsi Populasi

Tujuan Membuat selang kepercayaan untuk mengestimasi proprosi suatu populasi.

Persyaratan 1. Sampel merupakan sampel acak sederhana. 2. Syarat-syarat distribusi binomial terpenuhi, yaitu banyaknya

percobaan atau ukuran sampel sudah pasti, percobaan-percobaan tersebut saling bebas, terdapat dua kategori hasil, dan peluang hasil tersebut selalu tetap untuk masing-masing percobaan.

3. Terdapat paling tidak 10 sukses dan 10 gagal. Dengan kata lain, kita harus memeriksa apakah ˆnp ≥ 10 dan ˆ(1 )n p- ≥ 10.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 11: Estimasi Nilai Parameter - USD

39

Selang Kepercayaan Dengan nilai batas galat

( )

2

ˆ ˆ1p pE z

na

-=

Selang kepercayaan yang digunakan untuk mengestimasi proporsi populasi adalah sebagai berikut.

ˆ ˆp E p p E- < < +

Selang kepercayaan tersebut juga bisa dituliskan dalam bentuk ekuivalen seperti berikut.

p̂ E± atau ( )ˆ ˆ,p E p E- +

Pembulatan: Nilai-nilai dalam selang kepercayaan dibulatkan sampai tiga angka di belakang koma.

Banyak konsep yang telah kita pelajari sebelum sampai kepada bagaimana cara membuat selang kepercayaan. Secara ringkas, prosedur dalam membuat selang kepercayaan dapat dilakukan sebagai berikut.

Prosedur Membuat Selang Kepercayaan untuk p

1. Tentukan nilai proporsi sampel p̂ . 2. Periksa apakah semua persyaratan terpenuhi. 3. Tentukan nilai kritis zα/2, dengan menggunakan teknologi

ataupun tabel, yang sesuai dengan tingkat kepercayaan yang diinginkan.

4. Hitung batas galat E dengan Rumus 2-1. 5. Substitusikan nilai proporsi sampel p̂ dan batas galat E untuk

membuat salah satu dari bentuk-bentuk selang kepercayaan berikut. ˆ ˆp E p p E- < < + ,

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 12: Estimasi Nilai Parameter - USD

40

p̂ E± , atau

( )ˆ ˆ,p E p E- +

6. Bulatkan batas-batas selang kepercayaan sampai tiga angka di belakang koma.

7. Interpretasikan hasilnya.

Tentu saja prosedur mulai nomor 1 sampai 7 tidak harus ditulis secara eksplisit langkah-langkahnya. Prosedur tersebut hanya kita gunakan sebagai panduan untuk membuat selang kepercayaan. Akan tetapi, karena baru pertama kali kita berlatih untuk membuat selang kepercayaan, maka pada Contoh 3 berikut akan ditunjukkan bagaimana menggunakan prosedur tersebut secara jelas langkah-langkahnya.

CONTOH 3—Menentukan Selang Kepercayaan

Pada Contoh 1 dijelaskan bahwa Badan Pusat Statistik melakukan survei pada 1,14 juta penduduk Indonesia dan diperoleh bahwa terdapat 121.980 penduduk miskin. Carilah selang kepercayaan 99% untuk mengestimasi proporsi penduduk Indonesia yang miskin.

PEMBAHASAN Kita gunakan langkah-langkah dalam prosedur membuat selang kepercayaan untuk p.

1. Terdapat 121.980 penduduk miskin dari n = 1.140.000 penduduk yang disurvei. Dengan menggunakan hasil dari Contoh 1, kita peroleh proporsi sampel p̂ = 0,107.

2. Selanjutnya kita periksa apakah semua persyaratan terpenuhi. (1) Metode survei yang digunakan Badan Pusat Statistik untuk memilih sampel dilakukan secara acak. (2) Semua persyarata distribusi binomial terpenuhi karena banyaknya percobaan sudah pasti (n = 1,14 juta), semua percobaan saling bebas (jawaban seorang responden tidak mempengaruhi responden lainnya), terdapat dua kategori hasil dalam masing-masing percobaan (penduduk miskin dan tidak), dan peluangnya tetap konstan. (3)

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 13: Estimasi Nilai Parameter - USD

41

Karena ˆ 0,107p = , maka banyaknya penduduk yang miskin dan yang tidak secara berturut-turut adalah ˆnp = 1.140.000(0,107) = 121.980 ≥ 10, dan

ˆ(1 )n p- = 1.140.000(1 – 0,107) = 1.018.020 ≥ 10. Dengan demikian, semua persyaratan terpenuhi.

3. Karena kita ingin tingkat kepercayaan 99%, maka dengan menggunakan Excel [dengan rumus =NORM.S.INV(0.995)] kita peroleh nilai kritisnya adalah zα/2 = 2,576.

4. Dengan mensubstitusikan nilai p̂ dan zα/2 yang telah dihitung pada langkah 1 dan 3, serta n = 1.140.000 ke dalam Rumsu 2-1, kita peroleh

( ) ( )

2

ˆ ˆ1 0,107 1 0,1072,576 0,000746

1.140.000p p

E zna

- -= = =

5. Setelah kita tahu nilai p̂ dan E, maka dengan mudah kita dapat membuat selang kepercayaan sebagai berikut.

p̂ E- < p p̂ E< + 0,107 – 0,000746 < p < 0,107 + 0,000746

0,106254 < p < 0,107746 6. Setelah dibulatkan sampai tiga angka di belakang koma, kita

peroleh selang kepercayaan 0,106 < p < 0,108. Jika dituliskan ke dalam persentase, kita peroleh 10,6% < p < 10,8%.

INTERPRETASI Kita 99% percaya bahwa proporsi penduduk Indonesia yang miskin adalah di antara 10,6% dan 10,8%.

Kerjakan Latihan 6 n

2.1.5 Menentukan Ukuran Sampel untuk Mengestimasi p Pertanyaan tentang seberapa besar ukuran sampel yang harus kita pilih merupakan langkah penting dalam pelaksanaan penelitian. Misalkan kita berencana melakukan survei dan ingin mengestimasi proporsi populasi dengan batas galat 3% dan tingkat kepercayaan 95%, maka dengan menggunakan Rumus 2-1 kita dapatkan

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 14: Estimasi Nilai Parameter - USD

42

E ( )

2

ˆ ˆ1p pz

na

-=

0,03 ( )ˆ ˆ11,96

p pn-

=

Untuk menentukan ukuran sampel n, kita perlu nilai p̂ . Kita belum

tahu p̂ karena kita belum memiliki sampelnya. Bagaimana cara mengatasi masalah ini? Terdapat dua kemungkinan solusi: (1) kita bisa menentukan p̂ berdasarkan penelitian pilot atau penelitian yang pernah dilakukan sebelumnya, atau (2) kita gunakan kemungkinan terburuk, yaitu ketika ˆ ˆ(1 )p q- menghasilkan nilai yang paling besar dan akibatnya n juga besar, tetapi yang paling aman dengan memilih p̂ = 0,5. Karena kita belum tahu proporsi sampelnya, maka kita pilih

kemungkinan yang kedua. Dengan demikian,

0,03 (0,5)(0,5)1,96n

=

0,03 n 1,96 (0,5)(0,5)=

n 1,96 (0,5)(0,5)

0,03=

n 2

1,96 (0,5)(0,5) 1067,110,03

æ ö= =ç ÷ç ÷

è ø

Agar aman, kita bulatkan ke atas nilai n yang kita peroleh menjadi 1068. Dengan demikian, kita perlu 1068 responden agar selang kepercayaan yang akan kita buat memiliki batas galat 3% dan tingkat kepercayaan 95%.

Berdasarkan ilustrasi di atas, ukuran sampel yang digunakan untuk membuat selang kepercayaan dapat ditentukan sebagai berikut.

Mencari Ukuran Sampel untuk Mengestimasi Proporsi Populasi

Tujuan

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 15: Estimasi Nilai Parameter - USD

43

Menentukan seberapa besar ukuran sampel yang diperlukan untuk mengestimasi proporsi populasi p.

Notasi p = proporsi populasi p̂ = proporsi sampel n = ukuran sampel E = batas galat yang diinginkan zα/2 = Nilai kritis

Persyaratan Sampel harus sampel acak sederhana dari subjek-subjek yang saling bebas.

Ukuran Sampel

Ketika p̂ diketahui: ( )

2

2

2

ˆ ˆ1z p pn

Ea

é ù -ë û= Rumus 2-2

Ketika p̂ tidak diketahui:

2

2

2

0,25zn

Ea

é ùë û= Rumus 2-3

Peran Ukuran Populasi Rumus 2-2 dan 2-3 membuka mata kita bahwa seberapa besar ukuran sampel yang perlu kita pilih tidak bergantung pada ukuran populasi N. Ukuran sampel tersebut hanya tergantung pada tingkat kepercayaan dan batas galat yang kita inginkan, serta kadang-kadang proporsi sampel p̂ yang telah diketahui.

CONTOH 4—Menentukan Ukuran Sampel

Sebuah lembaga peduli pendidikan internasional akan memberikan bantukan kepada negara Chad agar banyaknya penduduk yang bisa baca tulis dalam negara tersebut meningkat. Oleh karena itu, lembaga tersebut ingin mencari proporsi penduduk Chad berusia 15 – 24 tahun yang bisa baca tulis. Tentukan banyaknya sampel yang diperlukan

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 16: Estimasi Nilai Parameter - USD

44

agar tingkat kepercayaannya 95% dan batas galatnya tidak lebih dari 2%.

(a) Gunakan hasil survei UNESCO: Pada tahun 2016, proporsi penduduk Chad dengan usia 15 – 24 tahun yang bisa baca tulis adalah 30,8%.

(b) Asumsikan bahwa tidak ada informasi yang tersedia terkait kemungkinan nilai dari proprosi.

PEMBAHASAN Dalam soal diketaui bahwa batas galat E = 0,02 dan tingkat kepercayaan 95%. Dengan demikian, nilai kritisnya adalah zα/2 = 1,96.

(a) Dari survei sebelumnya yang dilakukan UNESCO pada tahun 2016, diketahui p̂ = 0,308. Dengan demikian, kita gunakan Rumus 2-2 untuk menentukan ukuran sampel.

n ( )2

2

2

ˆ ˆ1z p p

Ea

é ù -ë û=

2

2

[1,96] (0,308)(0,692)0,02

=

2045= (dibulatkan ke atas) Lembaga tersebut memerlukan sampel dengan ukuran paling tidak 2045.

(b) Dengan asumsi tidak ada informasi terkait proporsi sebelumnya, maka kita gunakan Rumus 2-3 pada bagian ini.

n 2

2

2

0,25z

Ea

é ùë û=

2

2

[1,96] 0,250,02

=

2401= Lembaga tersebut memerlukan sampel berukuran sedikitnya 2401.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 17: Estimasi Nilai Parameter - USD

45

INTERPRETASI Agar lembaga tersebut memiliki tingkat kepercayaan 95% dan batas galat maksimal 2%, maka mereka harus mendapatkan sampel acak sederhana dengan ukuran minimal 2045 ketika mereka menggunakan hasil survei UNESCO dan paling tidak 2401 jika mereka tidak memiliki informasi mengenai proporsi sebelumnya. Kita bisa melihat bahwa ketika kita tidak mengetahui hasil penelitian sebelumnya, kita memerlukan ukuran sampel yang lebih besar untuk memperoleh hasil yang sama.

Kerjakan Latihan 6 n

2.2 Estimasi Mean Populasi Sebelumnya kita telah membuat selang kepercayaan untuk mengestimasi proporsi populasi. Pada subbab ini, kita akan melakukan prosedur yang serupa tetapi tujuannya adalah untuk mengestimasi mean populasi. Untuk melakukannya kita menggunakan mean sampel x sebagai estimasi titik dengan alasan sebagai berikut.

Mean sampel x merupakan estimasi titik terbaik untuk mean populasi μ.

Untuk membuat selang kepercayaan, kita akan membagi prosedurnya menjadi dua bagian, yaitu ketika simpangan baku populasi σ diketahui dan ketika simpangan baku populasi σ tidak diketahui.

2.2.1 Simpangan Baku Populasi σ Diketahui Terdapat beberapa persyaratan jika kita ingin membuat selang kepercayaan untuk mengestimasi mean populasi ketika simpangan baku populasi tersebut diketahui. Pertama, sampel yang kita miliki haruslah sampel acak sederhana. Kedua, populasi yang akan kita estimasi meannya harus berdistribusi normal atau sampel yang kita miliki berukuran paling tidak 30. Kondisi ini menjamin kita untuk bisa menggunakan model distribusi normal sebagai distribusi sampling dari mean sampel.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 18: Estimasi Nilai Parameter - USD

46

Metode untuk membuat selang kepercayaan sebagai estimasi mean populasi ketika simpangan baku populasi tersebut diketahui dapat dirangkum sebagai berikut.

Selang Kepercayaan untuk Mengestimasi Mean Populasi (σ Diketahui)

Tujuan Membuat selang kepercayaan untuk mengestimasi mean populasi ketika simpangan baku populasi tersebut diketahui.

Notasi μ = mean populasi σ = simpangan baku populasi x = mean sampel n = ukuran sampel E = batas galat 2za = nilai kritis yang sesuai dengan tingkat kepercayaan

Persyaratan 1. Sampel merupakan sampel acak sederhana. 2. Simpangan baku populasi σ diketahui. 3. Salah satu atau kedua kondisi berikut terpenuhi: Populasi

berdistribusi normal atau n ≥ 30.

Selang Kepercayaan Selang kepercayaan bisa dituliskan ke dalam tiga bentuk, yaitu

x E x Em- < < + ,

x E± , atau

( ),x E x E- +

dengan E ditentukan dengan rumus berikut.

2E zna

s= Rumus 2-4

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 19: Estimasi Nilai Parameter - USD

47

Pembulatan: Gunakan aturan pembulatan berikut dalam membuat selang kepercayaan.

· Ketika data mentah atau data asli yang digunakan, bulatkan selang kepercayaan sampai 1 angka di belakang koma lebihnya dari nilai-nilai dalam data mentah tersebut.

· Ketika ringkasan statistik (n, x , s) yang diketahui, bulatkan selang kepercayaan agar memiliki angka di belakang koma yang sama dengan nilai mean sampel.

Mengapa Rumusnya Seperti Itu? Rumus untuk membuat selang kepercayaan tersebut didasarkan pada karakteristik distribusi sampling mean (lihat Subbab 1.1). Karakteristiknya mengatakan bahwa distribusi sampling dari mean sampel-sampel berukuran n akan berdistribusi normal dan berpusat di mean μ dan memiliki

simpangan baku ns . Padahal ketika kita mentransformasi

sembarang distribusi normal menjadi distribusi normal baku, kita menggunakan rumus

x

x

xz

ms-

=

Padahal xm m= dan x ns s= . Dengan demikian, kita bisa

memperoleh

x zn

sm = -

Dalam persamaan terakhir ini, setelah kita gunakan skor z yang bisa positif dan negatif, serta suku yang paling kanan kita ganti menjadi E, maka kita peroleh selang kepercayaan x E± .

Setelah mengetahui bagaimana cara membuat selang kepercayaan untuk mengestimasi mean populasi, maka langkah-langkah dalam

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 20: Estimasi Nilai Parameter - USD

48

menyusun selang kepercayaan tersebut dapat dibagi menjadi beberapa langkah berikut.

1. Periksa apakah semua persyaratan terpenuhi. 2. Tentukan nilai mean sampel x . 3. Tentukan nilai kritis zα/2 yang sesuai dengan tingkat kepercayaan

yang telah ditentukan. Nilai kritis ini bisa ditentukan dengan menggunakan teknologi atau tabel.

4. Hitung batas galat E dengan rumus berikut.

2E zna

s=

5. Buat selang kepercayaan dengan mensubstitusi nilai mean sampel x dan batas galat E pada salah satu dari bentuk-bentuk berikut. x E x Em- < < + , x E± , atau

( ),x E x E- +

6. Bulatkan selang kepercayaan sesuai dengan kesepakatan pembulatan.

7. Interpretasikan hasilnya. Interpretasi selang kepercayaan yang diperoleh bisa dilakukan dengan cara yang serupa dengan selang kepercayaan untuk proporsi populasi.

Untuk lebih memahami bagaimana mengkonstruksi selang kepercayaan untuk mengestimasi mean populasi, perhatikan Contoh 5 berikut.

CONTOH 5—Kecakapan Matematika Siswa Indonesia

Banyak pihak yang mengklaim bahwa kecakapan matematika siswa Indonesia bisa dikatakan di atas rata-rata dengan memberikan bukti bahwa banyak siswa Indonesia yang menjuarai olimpiade matematika tingkat internasional. Akan tetapi, apakah kecakapan matematika siswa Indonesia merata? Untuk menjawab pertanyaan ini, gunakan

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 21: Estimasi Nilai Parameter - USD

49

hasil TIMSS dalam Data 1 (tersedia daring) dan asumsikan simpangan baku populasi σ = 90.

(a) Tentukan estimasi titik terbaik untuk kecapakan matematika dari populasi seluruh siswa Indonesia.

(b) Buatlah selang kepercayaan 95% untuk mengestimasi kecakapan matematika seluruh siswa Indonesia.

(c) Dari semua negara-negara yang mengikuti TIMSS pada tahun 2015, kecakapan matematika siswanya memiliki mean 500. Bagaimana posisi Indonesia terhadap mean tersebut?

PEMBAHASAN Data 1 dari hasil TIMSS tahun 2015 bisa diasumsikan sebagai sampel acak sederhana. Dari soal diketahui bahwa simpangan baku populasi σ = 90. Ukuran sampel dalam Data 1 adalah n = 576 ≥ 30. Semua persyaratan terpenuhi.

(a) Dari Data 1, kita bisa mencari bahwa mean sampel dari kecakapan matematika siswa Indonesia adalah 398,46. Mean sampel inilah yang menjadi estimasi titik terbaik untuk mean populasi. Dari sini apakah kita sudah bisa menyimpulkan bahwa kecakapan matematika siswa Indonesia di bawah rata-rata, yaitu 500? Belum, kita harus membuat selang kepercayaan terlebih dahulu.

(b) Dengan tingkat kepercayaan 0,95, kita peroleh α = 0,05 dan dengan demikian zα/2 = 1,96 (lihat kembali Contoh 2 tentang bagaimana menentukan nilai kritis). Selanjutnya karena σ = 90 dan dari Data 1 kita memiliki sampel dengan ukuran n = 576, maka batas galatnya bisa ditentukan sebagai berikut.

2901,96 7,35576

E zna

s= = × =

Dengan x = 398,46 dan E = 7,35, maka selang kepercayaannya adalah

x E- < μ x E< + 398, 46 7,35- < μ 398, 46 7,35< +

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 22: Estimasi Nilai Parameter - USD

50

391,1 < μ 405,8< (c) Berdasarkan selang kepercayaan yang telah terbentuk, skor 500

terletak jauh di atas selang tersebut. Dengan demikian, kecapakan matematika siswa Indonesia secara signifikan berada di bawah rata-rata kecakapan matematika siswa dari negara-negara yang mengikuti TIMSS.

INTERPRETASI Dengan selang kepercayaan pada bagian (b), kita 95% yakin bahwa selang kepercayaan tersebut memuat skor sebenarnya dari mean kecakapan matematika seluruh siswa Indonesia. Artinya, jika kita memilih lagi sampel-sampel berukuran 576 secara berulang-ulang dan kita buat selang kepercayaan untuk masing-masing sampel tersebut, maka 95% dari selang kepercayaan tersebut akan memuat nilai sebenarnya dari mean populasi.

Kerjakan Latihan 9 n

Menentukan Ukuran Sampel. Pada Contoh 5 kita sudah bisa membuat selang kepercayaan untuk mengestimasi mean populasi. Sekarang, misalkan Anda akan mengestimasi kecakapan seluruh siswa di Indonesia di bidang matematika dengan tingkat kepercayaan 95%. Agar batas galatnya tidak lebih dari 5, seberapa besar sampel yang Anda butuhkan? Untuk menjawab ini, kita bisa menyelesaikan n dari Rumus 2-4 untuk mendapatkan Rumus 2-5 berikut.

Menentukan Ukuran Sampel untuk Mengestimasi Mean Populasi

Tujuan Menentukan seberapa besar sampel yang dibutuhkan untuk melakukan estimasi mean dari suatu populasi, μ.

Notasi μ = mean populasi σ = simpangan baku populasi E = batas galat yang diinginkan zα/2 = nilai kritis z yang luas daerah di sebelah kanannya α/2.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 23: Estimasi Nilai Parameter - USD

51

Persyaratan Sampel harus berupa sampel acak sederhana.

Ukuran Sampel

2

2zn

Ea sé ù

= ê úê úë û

Rumus 2-5

Serupa dengan Rumus 2-2 dan 2-3 untuk menentukan ukuran sampel ketika kita ingin mengestimasi proporsi populasi, Rumus 2-5 juga tidak bergantung pada ukuran populasi yang nilai meannya akan kita estimasi. Seberapa besar ukuran sampel untuk mengestimasi mean populasi tersebut hanya dipengaruhi oleh tingkat kepercayaan (yang menghasilkan nilai zα/2), batas galat E, dan simpangan baku populasi σ. Masalahnya adalah bagaimana kita bisa tahu simpangan baku populasi? Nilai simpangan baku populasi tersebut bisa kita dekati dengan simpangan baku sampel s, atau jika tersedia, kita bisa menggunakan simpangan baku populasi berdasarkan penelitian yang telah dilakukan sebelumnya.

CONTOH 6—Menentukan Ukuran Sampel

Sebuah perusahaan perangkat lunak komputer mengklaim bahwa perangkat lunaknya dapat mempercepat proses pengunduhan film. Dengan memanfaatkan versi uji coba terbatas perangkat lunak tersebut, kita menggunakannya untuk mengunduh sebuah film berulang kali dan berharap mendapatkan batas galat 3 menit. Kita menduga bahwa simpangan baku populasi durasi pengunduhan video tersebut adalah 8 menit. Berapa kali pengunduhan yang harus kita lakukan agar mendapatkan selang kepercayaan 95%?

PEMBAHASAN Diketahui bahwa E = 3 menit, σ = 8 menit, dan tingkat kepercayaan 0,95, sehingga α = 0,05. Dengan demikian zα/2 = 1,96. Ukuran sampel yang dibutuhkan bisa ditentukan sebagai berikut.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 24: Estimasi Nilai Parameter - USD

52

2 2

2 1,96 8 283

zn

Ea sé ù ×é ù= = =ê ú ê úë ûê úë û

(dibulatkan ke atas)

INTERPRETASI Kita memerlukan 28 kali pengunduhan film yang sama secara acak sederhana agar kita 95% yakin bahwa mean sampel x berada dalam selang 3 menit kurang atau lebihnya dari mean populasi μ sebenarnya.

Kerjakan Latihan 10 n

2.2.2 Simpangan Baku Populasi σ Tidak Diketahui Metode yang digunakan untuk mengestimasi mean populasi pada pembahasan sebelumnya membutuhkan σ, yang sangat jarang ditemui pada permasalahan sehari-hari, khususnya permasalahan yang melibatkan sampel-sampel berukuran kecil. Untuk itu, kita bisa menggunakan simpangan baku s. Akan tetapi masalahnya adalah nilai s tersebut bisa bervariasi dari sampel ke sampel. Akibat dari ketidakpastian nilai s tersebut, maka kita perlu melonggarkan selang kepercayaan kita (yang mengakibatkan bertambahnya batas galat E). Bahkan orang pertama yang menyelidiki masalah ini, yaitu William Gosset, telah menunjukkan bahwa tidak hanya bertambahnya batas galat, tetapi penggunaan s tersebut juga mengubah keseluruhan keluarga distribusi sampling yang bisa digunakan.

Berdasarkan temuan Gosset, distribusi sampling yang dimaksud masih memiliki bentuk yang sama dengan distribusi normal, yaitu berbentuk lonceng yang simetris, akan tetapi detailnya berbeda. Perbedaan detail tersebut tergantung pada suatu nilai yang disebut dengan derajat bebas dan distribusi yang ditemukan oleh Gosset tersebut dinamakan distribusi t Student.

DEFINISI

Derajat bebas dari kumpulan data sampel adalah banyaknya nilai-nilai dalam sampel yang bisa bervariasi setelah batasan tertentu

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 25: Estimasi Nilai Parameter - USD

53

diberikan kepada semua nilai dalam sampel. Derajat bebas dinotasikan dengan df.

Untuk lebih memahami derajat bebas, perhatikan ilustrasi berikut. Misalkan Anda diberitahu bahwa mean dari skor kuis 5 orang mahasiswa adalah 60. Mean skor kuis yang sama dengan 60 tersebut membatasi semua nilai dalam sampel. Meskipun demikian, Anda masih bisa membuat 4 skor kuis tersebut bebas, baru kemudian skor kuis sisanya Anda tentukan agar meannya menjadi 60. Dengan demikian, data sampel ini memiliki df = 4.

Setelah Anda memahami derajat bebas, sekarang mari kita bahas lebih lanjut mengenai distribusi t Student. Perhatikan definisi berikut.

DEFINISI

Misalkan sebuah sampel acak sederhana berukuran n dipilih dari suatu populasi. Jika populasi tersebut berdistribusi normal, maka distribusi dari

xtsn

m-=

merupakan distribusi t Student dengan derajat bebas yang bersesuaian. Dalam persamaan tersebut, x dan s secara berturut-turut merupakan mean dan simpangan baku sampel.

Dalam pembahasan ini, derajat bebas dapat ditentukan dengan cukup sederhana, yaitu sama dengan satu kurangnya ukuran sampel.

Derajat bebas: df = n – 1

Sampai sini mungkin Anda masih bertanya-tanya, bagaimana bentuk dari distribusi t Student? Detail apa yang berbeda dari distribusi tersebut dengan distribusi normal? Untuk menjawab pertanyaan ini, perhatikan Contoh 7 berikut.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 26: Estimasi Nilai Parameter - USD

54

CONTOH 7—Distribusi Normal Baku dan Distribusi t Student

Diberikan suatu populasi berdistribusi normal dengan mean dan simpangan bakunya secara berturut-turut μ = 50 dan σ = 10.

(a) Gunakan perangkat lunak, Minitab misalnya, untuk mendapatkan 1500 sampel acak sederhana berukuran n = 5 dari populasi tersebut.

(b) Hitunglah mean dan simpangan baku untuk masing-masing sampel.

(c) Untuk masing-masing sampel, hitunglah nilai-nilai berikut.

xz

n

ms-

= dan xtsn

m-=

(d) Gambarlah histogram untuk distribusi z dan t. (e) Ulangi langkah (a) – (d) untuk 1500 sampel berukuran n = 10.

PEMBAHASAN Kita gunakan Minitab untuk memperoleh 1500 sampel acak sederhana berukuran n = 5, dan kemudian kita hitung mean dan simpangan baku sampel-sampel tersebut. Setelah itu, kita hitung juga nilai z dan t untuk masing-masing sampel tersebut untuk kemudian kita gambarkan histogram dari distribusi kedua nilai tersebut. Gambar 2-4(a) dan (b) berikut secara berturut-turut menunjukkan histogram dari z dan t.

(a) (b)

Gambar 2-4

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 27: Estimasi Nilai Parameter - USD

55

Sekarang kita cermati kedua histogram tersebut. Distribusi z pada Gambar 2-4(a) berbentuk seperti lonceng dan simetris dengan pusat di 0 dan grafiknya merentang dari –3,25 sampai 3,25. Dengan demikian, nilai-nilai z dengan n = 5 berdistribusi normal baku. Pada Gambar 2-4(b), kita melihat distribusi t juga berbentuk seperti lonceng dan simetris di 0, tetapi lebih menyebar, yaitu dari –7,5 sampai 7,5. Dengan demikian, nilai-nilai t ini kemungkinan besar tidak berdistribusi normal baku. Nilai-nilai t yang lebih menyebar ini

karena kita membagi dengan s n untuk mendapatkan nilai

tersebut.

Untuk distribusi z dan t pada sampel-sampel berukuran n = 10 yang terlihat di Gambar 2-5(a) dan (b), kita masih bisa melihat bahwa kedua histogram tersebut menyerupai lonceng dan simetris, tetapi histogram t lebih menyebar. Dengan demikian, histogram t untuk n = 10 masih belum berdistribusi normal baku.

(a) (b)

Gambar 2-5

Meskipun sama-sama lebih menyebar daripada distribusi z, kita bisa melihat bahwa distribusi t untuk n = 10 kurang menyebar jika dibandingkan dengan distribusi t untuk n = 5.

INTERPRETASI Dari simulasi tersebut, kita bisa menyimpulkan bahwa terdapat distribusi t yang berbeda untuk sampel dengan ukuran yang berbeda. Ketika ukuran sampel bertambah, maka penyebaran

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 28: Estimasi Nilai Parameter - USD

56

distribusi t semakin berkurang. Jika ukuran sampel semakin besar, makan distribusi t akan mendekati distribusi normal baku.

Kerjakan Latihan 11 n

Berdasarkan Contoh 7, kita memperoleh karakteristik distribusi t Student sebagai berikut.

Karakteristik Distribusi t Student

1. Distribusi t Student akan memiliki bentuk yang berbeda untuk ukuran sampel yang berbeda (misalnya, lihat Gambar 2-6 untuk n = 3 dan n = 10).

2. Distribusi t Student memiliki bentuk menyerupai lonceng dan simetris seperti distribusi normal baku, tetapi lebih menyebar.

3. Luas daerah di bawah kurva sama dengan 1. 4. Distribusi t Student memiliki mean t = 0 (serupa dengan

distribusi normal baku dengan meannya z = 0). 5. Simpangan baku distribusi t Student berbeda untuk ukuran

sampel yang berbeda, tetapi selalu lebih dari 1 (berbeda dengan distribusi normal baku yang memiliki simpangan baku σ = 1).

6. Ketika ukuran sampel n semakin besar, bentuk distribusi t Student akan semakin mendekati distribusi normal baku.

Gambar 2-6 Distribusi normal baku dan distribusi t Student dengan n = 3 dan n = 10

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 29: Estimasi Nilai Parameter - USD

57

Setelah kita mengetahui karakteristik dari kurva distribusi t Student, selanjutnya kita akan berlatih menemukan nilai kritis tα/2 yang luas daerah di kanannya sama dengan α/2 (serupa dengan nilai zα/2 pada distribusi normal baku). Teknologi atau tabel bisa digunakan untuk menentukan nilai tα/2 tersebut.

CONTOH 8—Menentukan Nilai t

Sebuah sampel acak sederhana berukuran n = 5 dipilih dari populasi yang berdistribusi normal. Tentukan nilai kritis tα/2 yang bersesuaian dengan tingkat kepercayaan 95%.

PEMBAHASAN Dalam soal diberikan informasi ukuran sampel n = 5, sehingga derajat bebasnya df = 5 – 1 = 4. Tingkat kepercayaan 95% atau 0,95 bersesuaian dengan α = 0,05, yaitu luas yang dibagi sama rata oleh dua daerah di ujung kiri dan kanan distribusi t, lihat Gambar 2-7. Dengan demikian, luas masing-masing daerah tersebut adalah 0,025. Karena tabel distribusi t Student menunjukkan luas daerah di kiri nilai t tertentu, maka untuk menentukan nilai tα/2, kita tentukan nilai t pada derajat bebas df = 4 yang luas daerah di kirinya sama dengan 0,975. Dari tabel, kita menemukan nilai ini adalah tα/2 = 2,776. Kita dapat mengkonfirmasi nilai ini dengan menggunakan Excel, yaitu dengan menginputkan rumus =T.INV(0.975,4) untuk mendapatkan nilai tα/2 = 2,776445.

Gambar 2-7

Perhatikan bahwa nilai kritis z yang daerah di kirinya sama dengan 0,975 lebih kecil daripada nilai t yang baru saja kita temukan, yaitu

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 30: Estimasi Nilai Parameter - USD

58

1,96. Hal ini dikarenakan distribusi t Student lebih menyebar daripada distribusi normal baku.

Kerjakan Latihan 12 n

Sampai di sini kita telah mengenail distribusi t Student, mengidentifikasi karakteristik-karakteristiknya, serta menentukan nilai kritisnya pada tingkat kepercayaan tertentu. Sekarang kita sudah siap untuk mengkonstruksi selang kepercayaan mean suatu populasi.

Selang Kepercayaan untuk Mengestimasi Mean Suatu Populasi Ketika σ Tidak Diketahui

Tujuan Mengkonstruksi selang kepercayaan untuk mengestimasi mean suatu populasi, yaitu μ, ketika simpangan baku σ tidak diketahui.

Notasi μ = mean populasi x = mean sampel s = simpangan baku sampel n = ukuran sampel E = batas galat tα/2 = nilai kritis t yang luas daerah di kanannya α/2

Persyaratan 1. Sampel merupakan sampel acak sederhana. 2. Salah satu kondisi berikut terpenuhi: Sampel berasal dari

populasi yang berdistribusi normal atau n ≥ 30.

Selang Kepercayaan Dengan batas galat berikut,

2sE tna=

dan dengan derajat bebas df = n – 1, selang kepercayaan mean populasi adalah

x E x Em- < < + ,

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 31: Estimasi Nilai Parameter - USD

59

x E± , atau ( ),x E x E- +

Selang kepercayaan mean populasi yang akan kita buat membutuhkan mean sampel x dan batas galat E, dan untuk menentukan nilai E tersebut kita harus terlebih dahulu menentukan simpangan baku sampel s, nilai kritis tα/2, dan n. Untuk itu, secara sistematis, selang kepercayaan untuk mengestimasi mean populasi ketika simpangan baku populasi tersebut tidak diketahui dapat dikonstruksi dengan mengikuti prosedur berikut.

1. Periksa semua persyaratan apakah terpenuhi atau tidak. Periksalah apakah sampel yang diberikan merupakan sampel acak sederhana. Selain itu, kita juga harus melihat ukuran sampelnya karena jika sampel tersebut berukuran kecil, maka kita harus menguji apakah sampel tersebut berasal dari populasi yang berdistirbusi normal. Metode yang paling mudah untuk menguji normalitas sampel tersebut adalah dengan menggunakan diagram Q-Q normal.

2. Hitung nilai mean sampel x dan simpangan baku sampel s. 3. Tentukan nilai kritis tα/2 sesuai dengan tingkat kepercayaan yang

diinginkan. 4. Hitung batas galat E dengan rumus berikut.

2sE tna=

5. Buat selang kepercayaan dengan mensubstitusi nilai mean sampel x dan batas galat E yang telah dihitung sebelumnya pada salah satu dari bentuk-bentuk berikut. x E x Em- < < + , x E± , atau

( ),x E x E- +

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 32: Estimasi Nilai Parameter - USD

60

6. Bulatkan selang kepercayaan sesuai dengan kesepakatan pembulatan. Jika data berasal dari data mentah, bulatkan selang kepercayaan sampai satu angka di belakang koma lebihnya dari data mentah. Jika rangkuman statistik-statistik yang diberikan (n, x , s) bulatkan selang kepercayaan agar banyaknya angka di belakang koma sama dengan angka di belakang koma milik x .

7. Interpretasikan hasilnya.

CONTOH 9—Membuat Selang Kepercayaan

IMDb merupakan situs web yang menyediakan data film-film dari studio dan para penggemar. Berikut ini merupakan durasi (dalam menit) 10 film yang dipilih secara acak dari data mentah yang disediakan oleh IMDb (datasets.imdbws.com).

97 100 95 105 93 87 79 130 90 85

Konstruksilah selang kepercayaan 95% untuk mengestimasi mean durasi semua film.

PEMBAHASAN Berdasarkan informasi soal, sampel merupakan sampel acak sederhana. Karena n = 10 yang kurang dari 30, maka kita perlu menguji normalitas data tersebut. Gambar 2-8 menunjukkan diagram peluang dari data tersebut yang dibuat di Minitab.

Gambar 2-8

Dari diagram peluang, kita bisa melihat bahwa semua data berada di dalam batas. Dengan demikian, data tersebut berasal dari populasi berdistribusi normal. Semua persyaratan terpenuhi.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 33: Estimasi Nilai Parameter - USD

61

Pertama, kita tentukan mean dan simpangan baku sampel yang diberikan. Dengan menggunakan teknologi, kita peroleh nilai kedua statistik ini adalah sebagai berikut.

96,1x = dan s = 14,11

Tingkat kepercayaan 95% mengakibatkan α = 0,05, sehingga dengan df = 10 – 1 = 9, kita peroleh nilai kritis tα/2 = 2,262. Selanjutnya kita tentukan batas galat sebagai berikut.

214,112,262 10,10

10sE tna= = × =

Jadi, selang kepercayaan 95% yang terbentuk setelah dilakukan pembulatan adalah 96,1 ± 10,1 menit.

INTERPRETASI Kita 95% yakin bahwa mean durasi dari semua film berada pada selang 96,1 ± 10,1 menit.

Kerjakan Latihan 14 n

2.3 Estimasi Variansi Populasi Pada bahasan terakhir di Bab 2 kita akan mempelajari bagaimana mengkonstruksi selang kepercayaan untuk mengestimasi variansi atau simpangan baku. Selain itu, nanti kita juga akan membahas bagaimana menentukan ukuran sampel yang digunakan untuk mengestimasi variansi atau simpangan baku suatu populasi.

Pertanyaannya sekarang, mengapa kita perlu mengestimasi nilai variansi suatu populasi? Banyak permasalahan sehari-hari yang tidak hanya memerlukan nilai proporsi atau mean yang akurat, tetapi juga memerlukan konsistensi. Bayangkan sebuah mesin kopi di swalayan yang sering menuangkan kopi ke dalam gelas pelanggan secara berlebih atau kurang, tetapi secara rata-rata volumenya tepat. Tentu saja pelanggan akan merasa kecewa jika kopi mereka kurang atau tumpah karena berlebih. Oleh karena itu, maka swalayan tersebut

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 34: Estimasi Nilai Parameter - USD

62

harus mengestimasi variansi atau simpangan baku dari volume kopi yang dituangkan mesin tersebut untuk mengetahui konsistensinya.

Pertama-tama kita akan selidiki distribusi sampling variansi sampel s2 melalui simulasi. Misalkan kita mendapatkan 3000 sampel acak sederhana berukuran n = 15 dari suatu populasi dengan mean μ = 50 dan simpangan baku σ = 10. Selanjutnya, kita lakukan langkah-langkah berikut.

1. Hitung variansi masing-masing sampel. 2. Untuk masing-masing sampel, hitung nilai berikut.

( ) 2 2

2

1 14100

n s ss-

=

3. Gambar histogram dari distribusi nilai-nilai yang telah ditentukan pada langkah 2. Histogram ini diperlihatkan pada Gambar 2-9.

Gambar 2-9

Tidak seperti distribusi-distribusi sampling sebelumnya, distribusi data pada Gambar 2-9 tidaklah berdistribusi normal. Distribusi data tersebut condong ke kanan dan tidak pernah negatif. Distribusi semacam ini dinamakan distribusi chi-square.

DEFINISI

Jika sebuah sampel acak sederhana berukuran n diperoleh dari populasi yang berdistribusi normal dengan mean μ dan simpangan baku σ, maka

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 35: Estimasi Nilai Parameter - USD

63

( ) 2

22

1n sc

s-

=

memiliki distribusi chi-square.

Nilai-nilai kritis distribusi chi-square bisa ditentukan dengan teknologi ataupun tabel. Distribusi chi-square tersebut ditentukan oleh derajat bebas (serupa dengan distribusi t Student). Dalam pembahasan ini, kita gunakan derajat bebas n – 1.

Derajat bebas: df = n – 1

Sebelumnya kita sedikit mengetahui karakteristik dari distribusi chi-square berdasarkan apa yang yang tampak di Gambar 2-9. Lebih lengkapnya, karakteristik-karakteristik distribusi chi-square dijelaskan sebagai berikut.

Karakteristik Distribusi Chi-Square

1. Distribusi chi-square tidak simetris. Ketika derajat bebasnya bertambah, maka distribusi tersebut semakin simetris (lihat Gambar 2-10).

2. Nilai-nilai chi-square tidak negatif. 3. Distribusi chi-square berbeda jika derajat bebasnya berbeda,

perhatikan Gambar 2-10. Derajat bebasnya adalah df = n – 1.

Gambar 2-10 Distribusi chi-square dengan n = 5, 10, dan 20

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 36: Estimasi Nilai Parameter - USD

64

Karena distribusi chi-square tidak simetris, maka selang kepercayaan untuk mengestimasi σ2 tidak berbentuk s2 ± E, tetapi kita harus mencari batas-batas galat kanan dan kirinya secara terpisah dengan menggunakan nilai-nilai kritis yang berbeda. Bagaimana menentukan nilai-nilai kritis pada distribusi chi-square? Perhatikan Contoh berikut.

CONTOH 10—Menentukan Nilai-Nilai Kritis untuk χ2

Tentukan nilai-nilai kritis yang digunakan untuk mengkonstruksi selang kepercayaan variansi populasi dengan tingkat kepercayaan 95% dan ukuran sampel n = 15.

PEMBAHASAN Dengan ukuran sampel n = 15, maka derajat bebasnya df = n – 1 = 14. Karena tingkat kepercayaan 95%, maka α = 0,05. Nilai ini merupakan luas daerah yang dibagi sama besar di ujung kiri dan kanan distribusi chi-square. Luas masing-masing daerah ini adalah 0,25. Untuk menentukan nilai-nilai kritisnya, kita sketsa distribusi chi-square terlebih dahulu, seperti pada Gambar 2-11 berikut.

Gambar 2-11 Nilai-nilai kritis distribusi chi-square

Jika kita menggunakan tabel, catat bahwa badan tabel tersebut memuat nilai-nilai χ2 yang bersesuaian dengan luas daerah yang diberikan pada kepala kolomnya, dan luas ini merupakan luas kumulatif sebelah kanan χ2 tersebut. Dengan demikian, nilai kritis yang di sebelah kanan, yaitu 2

Ac , dapat ditentukan dengan melihat

kepala kolom 0,025, sedangkan nilai kritis sebelah kiri 2Ic dapat

ditentukan dengan melihat kepala kolom 0,975 (diperoleh dari 1 –

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 37: Estimasi Nilai Parameter - USD

65

0,025) yang semuanya dilihat pada baris df = 14. Setelah melihat tabel, kita peroleh nilai-nilai kritisnya adalah 2

Ic = 5,629 dan 2Ac = 26,119.

Selain dengan menggunakan tabel, kita bisa memanfaatkan teknologi (seperti Excel dan Minitab) untuk menentukan nilai-nilai kritis dengan mudah. Selain itu, teknologi dapat digunakan untuk sembarang derajat bebas dan tingkat kepercayaan.

Kerjakan Latihan 16 n

Estimasi Titik untuk σ2. Untuk mengestimasi variansi populasi σ2, kita gunakan variansi sampel s2 karena variansi sampel merupakan estimasi titik terbaik untuk variansi populasi.

Variansi sampel s2 merupakan estimasi titik terbaik untuk variansi populasi σ2.

Variansi sampel menjadi estimasi titik terbaik untuk variansi sampel karena nilai tersebut tidak bias. Artinya, variansi sampel akan cenderung berpusat ke variansi populasi.

Meskipun variansi sampel menjadi estimasi titik yang tidak bias untuk variansi populasi, tidak demikian dengan simpangan baku sampel. Simpangan baku sampel s merupakan estimasi titik yang bias untuk simpangan baku populasi σ. Akan tetapi, pada prakteknya simpangan baku sampel tersebut sering digunakan sebagai estimasti titik simpangan baku populasi. Dengan demikian, untuk kepentingan praktis, dalam pembahasan selanjutnya kita gunakan simpangan baku sampel untuk mengestimasi simpangan baku populasi.

Simpangan baku sampel s biasa digunakan sebagai estimasi titik simpangan baku populasi σ meskipun nilai tersebut menghasilkan estimasi yang bias.

Walaupun variansi sampel merupakan estimasi titik terbaik untuk variansi populasi, kita tidak tahu seberapa baik estimasinya. Oleh

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 38: Estimasi Nilai Parameter - USD

66

karena itu, sekarang kita akan menemukan suatu metode untuk membuat selang kepercayaan dari variansi populasi.

Misalkan kita memilih suatu sampel acak sederhana berukuran n dari populasi berdistribusi normal dengan mean μ dan simpangan baku σ, maka 2 2 2( 1)n sc s= - berdistribusi chi-square dengan derajat bebas

df = n – 1. Dengan demikian, terdapat peluang 1 – α bahwa nilai χ2 terletak di antara 2

Ic dan 2Ac . Artinya, terdapat 1 – α kemungkinan

bahwa pernyataan berikut benar.

2

2 22

( 1)I A

n sc cs-

< <

Pertidaksamaan terakhir ini ekuivalen dengan pertidaksamaan berikut.

2 2

22 2

( 1) ( 1)

A I

n s n ssc c- -

< <

Pertidaksamaan di atas merupakan selang kepercayaan untuk mengestimasi variansi populasi.

Selang Kepercayaan untuk Mengestimasi Variansi atau Simpangan Baku Populasi

Tujuan Mengkonstruksi selang kepercayaan untuk mengestimasi variansi atau simpangan baku populasi.

Notasi σ = simpangan baku populasi σ2 = variansi populasi s = simpangan baku sampel s2 = variansi sampel n = ukuran sampel 2

Ic = nilai kritis ujung kiri dari χ2

2Ac = nilai kritis ujung kanan dari χ2

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 39: Estimasi Nilai Parameter - USD

67

Persyaratan 1. Sampel merupakan sampel acak sederhana. 2. Populasi harus berdistribusi normal.

Selang Kepercayaan untuk Variansi Populasi

2 2

22 2

( 1) ( 1)

A I

n s n ssc c- -

< <

Selang Kepercayaan untuk Simpangan Baku Populasi

2 2

2 2

( 1) ( 1)

A I

n s n ssc c- -

< <

Agar konstruksi selang kepercayaan variansi atau simpangan baku yang kita lakukan sistematis, kita bisa mengikuti langkah-langkah berikut dalam membuat selang kepercayaan tersebut.

1. Periksa semua persyaratan apakah terpenuhi atau tidak. Untuk menguji normalitas populasi, kita bisa menggunakan metode grafik atau uji normalitas formal.

2. Hitung nilai variansi sampel s2, nilai kritis ujung kiri 2Ic , dan

nilai kritis ujung kanan 2Ac dengan derajat bebas df = n – 1.

3. Konstruksilah selang kepercayaan dengan mensubstitusikan nilai pada langkah 2 ke dalam bentuk berikut.

2 2

22 2

( 1) ( 1)

A I

n s n ssc c- -

< <

4. Hitunglah akar kuadrat dari batas atas dan batas bawah selang kepercayaan pada langkah 3 untuk mendapatkan selang kepercayaan simpangan baku populasi.

5. Bulatkan batas atas dan batas bawah selang kepercayaan. Aturan pembulatan sama dengan aturan ketika kita mengkonstruksi selang kepercayaan mean populasi.

6. Interpretasikan hasilnya.

CONTOH 11—Mengkonstruksi Selang Kepercayaan

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 40: Estimasi Nilai Parameter - USD

68

Berikut ini adalah kekuatan gempa (dalam SR) yang dipilih secara acak dari Data 3 (tersedia daring). Data 3 merupakan data gempa bumi di Inonesia pada kuartal pertama tahun 2018 yang diperoleh dari BMKG.

2,4 3,1 3,4 2,9 4,9 3 3 4,3 3,6 3,8 4,6 2,5 3,1 3,5 2,5 Konstruksilah selang kepercayaan untuk mengestimasi variansi dan simpangan baku dari kekuatan gempa bumi di Indonesia pada kuartal pertama tahun 2018. PEMBAHASAN Pertama kita periksa persyaratan untuk membuat selang kepercayaan variansi dan simpangan baku populasi. Seperti yang dikatakan dalam soal, sampel tersebut merupakan sampel acak sederhana. Untuk memeriksa apakah sampel tersebut berasal dari populasi yang berdistribusi normal, kita gunakan uji normalitas formal dan diagram Q-Q normal melalui SPSS, perhatikan Gambar 2-12(a) dan (b).

(a)

(b)

Gambar 2-12

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 41: Estimasi Nilai Parameter - USD

69

Dari uji normalitas formal dan diagram Q-Q normal tersebut, kita bisa menyimpulkan bahwa sampel tersebut berasal dari populasi yang berdistribusi normal. Dengan demikian, semua persyaratan terpenuhi.

Selanjutnya kita tentukan variansi sampel s2, nilai kritis kiri 2Ic dan

nilai kritis kanan 2Ic berderajat bebas df = n – 1 = 14 dengan

menggunakan teknologi, sehingga diperoleh

s2 = 0,58, 2Ic = 5,629, 2

Ac = 26,119

Kita substitusi nilai-nilai tersebut pada selang kepercayaan seperti berikut.

2

2

( 1)

A

n sc-

< 2s 2

2

( 1)

I

n sc-

<

(15 1) 0,5826,119- ×

< 2s (15 1) 0,58

5,629- ×

<

0,3109 < 2s 1, 4425<

Dengan mengakarkan semua ruas, kita peroleh selang kepercayaan untuk simpangan baku.

0,5576 1,2011s< <

Berikutnya kita bulatkan selang kepercayaan tersebut menjadi dua angka di belakang koma (karena data aslinya memuat satu angka di belakang koma) untuk mendapatkan

20,31 1, 44s< < dan 0,56 1,20s< <

INTERPRETASI Berdasarkan hasil ini, kita 95% yakin bahwa variansi populasi berada di antara 0,31 dan 1,44, sedangkan simpangan baku populasi bernilai di antara 0,56 dan 1,20.

Kerjakan Latihan 17 n

Menentukan Ukuran Sampel. Tidak seperti ketika kita menentukan ukuran sampel untuk mengestimasi proporsi atau mean populasi,

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 42: Estimasi Nilai Parameter - USD

70

penentuan ukuran sampel untuk mengestimasi variansi atau simpangan baku populasi lebih kompleks. Akan tetapi kita bisa menggunakan Minitab untuk menentukan ukuran sampel. Untuk melakukannya, pada baris menu klik Stat, Power and Sample Size, kemudian pilih Sample Size for Estimation, dan pilih Standard Deviation (normal) atau Variance (normal). Untuk menentukan ukuran sampel dalam Minitab tersebut, kita akan diminta untuk memasukkan perkiraan simpangan baku (atau variansi) dan batas galat yang diinginkan. Sebagai contoh, kita dapat menentukan ukuran sampel untuk mengestimasi simpangan baku dengan menginginkan batas galat 5 dan perkiraan simpangan bakunya 50. Gambar 2-13 berikut menampilkan hasil perhitungan yang dilakukan Minitab.

Gambar 2-13

Dengan demikian, kita memerlukan sampel dengan ukuran sekitar 234 untuk mengestimasi simpangan baku yang nilai diperkirakan 50 dengan batas galat 5.

2.4 Metode Estimasi dengan Teknologi: Bootstrap Metode-metode konstruksi selang kepercayaan yang telah dibahas sebelumnya memerlukan persyaratan terkait normalitas data. Konstruksi selang kepercayaan untuk proporsi dan mean memerlukan sampel yang berasal dari populasi berdistribusi normal atau sampel yang berukuran cukup besar, yaitu n ≥ 30. Persyaratan yang lebih ketat muncul ketika kita membuat selang kepercayaan variansi atau simpangan baku, yaitu sampel yang digunakan harus berasal dari populasi yang berdistribusi normal, meskipun sampel tersebut berukuran besar.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 43: Estimasi Nilai Parameter - USD

71

Masalah muncul ketika data sampel yang kita miliki tidak memenuhi persyaratan-persyaratan yang telah disebutkan. Untuk mengatasi permasalahan ini, kita bisa menggunakan metode bootstrap, yaitu metode simulasi pensampelan ulang dari data yang telah kita miliki. Metode ini tidak memerlukan sampel yang berasal dari distribusi normal ataupun distribusi tertentu lainnya. Oleh karena itu, metode ini disebut metode nonparametrik atau metode bebas distribusi. Seperti yang telah disebutkan, metode ini melakukan pensampelan ulang dari data awal untuk mendapatkan sampel-sampel bootstrap.

DEFINISI

Diberikan sampel acak sederhana berukuran n, sampel bootstrap adalah sampel berukuran n yang nilai-nilai di dalamnya diperoleh dengan mengambil secara acak dengan pengembalian dari nilai-nilai dari sampel awal.

Ada dua catatan penting terkait bagaimana membuat sampel bootstrap. Pertama, ukuran sampel bootstrap sama dengan ukuran sampel awal, yaitu n. Kedua, proses pengambilan dilakukan secara acak dan dengan pengembalian. Dengan demikian, ketika suatu nilai sampel dipilih, maka nilai tersebut dikembalikan terlebih dahulu sebelum proses pengambilan berikutnya. Untuk lebih memahami sampel bootstrap, perhatikan Contoh 12 berikut.

CONTOH 12—Sampel Bootstrap

Demi kesederhanaan dan kepraktisan, misalkan suatu sampel memuat nilai-nilai 1, 2, 3, dan 4. Susunlah satu sampel bootstrap dari sampel awal tersebut.

PEMBAHASAN Sampel bootstrap harus berukuran sama dengan sampel awal, sehingga ukurannya adalah n = 4. Setelah dilakukan pemilihan secara acak dengan pengembalian, salah satu kemungkinan sampel bootstrap adalah {3, 1, 3, 4}.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 44: Estimasi Nilai Parameter - USD

72

Sampel Awal Sampel Bootstrap

1 3

2 1

3 3

4 4

Perhatikan bahwa nilai 3 bisa muncul dua kali karena setelah terpilih pada pengambilan pertama, nilai tersebut dikembalikan lagi. Oleh karena itu, pada pengambilan berikutnya nilai ini ada kemungkinan terpilih kembali.

Kerjakan Latihan 18 n

Setelah memahami bagaimana menentukan sampel bootstrap, sekarang kita sudah siap untuk membuat selang kepercayaan dengan metode bootstrap. Prosedur untuk membuat selang kepercayaan tersebut bisa dilakukan dengan langkah-langkah berikut.

1. Diberikan sampel acak sederhana berukuran n, buatlah banyak sampel bootstrap (1000 atau lebih) dengan ukuran yang sama dengan sampel awal, yaitu n.

2. Tentukan statistik dari masing-masing sampel bootstrap yang bersesuaian dengan parameter populasi yang akan diestimasi.

3. Urutkan statistik-statistik tersebut dari yang paling kecil sampai yang paling besar.

4. Dengan menggunakan statistik-statistik yang sudah terurut, buatlah selang kepercayaan dengan menentukan nilai-nilai persentil yang sesuai.

Contoh 13 berikut mendemonstrasikan bagaimana menggunakan metode bootstrap untuk mengkonstruksi selang kepercayaan simpangan baku populasi.

CONTOH 13—Membuat Selang Kepercayaan

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 45: Estimasi Nilai Parameter - USD

73

Sebuah perusahaan air minum melakukan kontrol kualitas berkala terkait volume air minum dalam setiap botolnya. Dalam kontrol kualitas tersebut, mereka mengukur volume air minum dalam 10 botol secara acak dan diperoleh data sebagai berikut.

150,0 150,2 150,6 149,7 151,3 149,8 149,7 148,5 150,4 150,6

Buatlah selang kepercayaan untuk mengestimasi simpangan baku dari volume air minum dalam semua botol dengan menggunakan metode bootstrap.

PEMBAHASAN Pertama, kita buat 100.000 sampel bootstrap dengan menggunakan Minitab. Tabel berikut menunjukkan 3 sampel bootstrap pertama. Mungkin 3 sampel pertama Anda berbeda.

Sampel-Sampel Bootstrap

1 150,2 148,5 149,7 149,7 150,2 149,7 151,3 150,6 149,7 149,7

2 150,2 148,5 149,8 150,2 148,5 150,2 151,3 150,6 150,0 149,7

3 151,3 148,5 150,2 151,3 150,0 149,8 149,8 150,6 150,6 150,4

Karena kita akan mengestimasi simpangan baku populasi, maka kita tentukan simpangan baku untuk setiap sampel-sampel bootstrap yang terbentuk. Untuk melakukannya, kita bisa menggunakan Minitab dan sekaligus menggambarkan histogram dari distribusi simpangan-simpangan baku tersebut. Perhatikan Gambar 2.14.

Sekarang kita identifikasi 95% nilai yang terletak di tengah-tengah distribusi dari 100.000 simpangan baku sampel. Dari distribusi tersebut, dengan menggunakan Minitab kita bisa menemukan persentil ke-2,5 adalah 0,32 dan persentil ke-97,5 adalah 1,03. Dengan kata lain, 95% semua sampel-sampel bootstrap tersebut memiliki simpangan baku di antara 0,32 dan 1,03. Inilah yang menjadi selang kepercayaan simpangan baku populasi.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 46: Estimasi Nilai Parameter - USD

74

Gambar 2-14 Histogram simpangan baku sampel-sampel bootstrap

INTERPRETASI Kita 95% yakin bahwa simpangan baku volume air dalam semua botol berada di antara 0,32 dan 1,03.

Kerjakan Latihan 19 n

2.5 Rangkuman 1. Selang kepercayaan

digunakan untuk mengestimasi parameter suatu populasi dengan tingkat kepercayaan tertentu. Tingkat kepercayaan tersebut menyatakan peluang bahwa selang kepercayaan tersebut memuat nilai parameter yang sebenarnya.

2. Beberapa persyaratan harus terpenuhi untuk mengkonstruksi selang kepercayaan. Sampel acak sederhana merupakan syarat yang selalu muncul. Selain itu,

untuk membuat selang kepercayaan mean proporsi dan mean, sampel tersebut harus berukuran cukup besar, n ≥ 30, atau berasal dari populasi yang berdistribusi normal. Syarat yang lebih ketat muncul dalam membuat selang kepercayaan variansi atau simpangan baku, yaitu bahwa sampel harus berasal dari populasi yang berdistribusi normal, meskipun ukuran sampel besar.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 47: Estimasi Nilai Parameter - USD

75

3. Ukuran sampel penting dipertimbangkan untuk mengestimasi nilai parameter populasi dengan selang kepercayaan karena ukuran

sampel tersebut berhubungan erat dengan tingkat kepercayaan, batas galat, dan perkiraan nilai parameter.

Glosarium Batas galat. Selisih maksimum yang mungkin antara statistik sampel dengan nilai parameter sebenarnya dari populasi yang diperkiran.

Derajat bebas. Banyaknya nilai-nilai dalam suatu sampel yang bisa bervariasi setelah batasan tertentu diberikan kepada semua nilai dalam sampel tersebut.

Estimasi titik. Suatu nilai yang digunakan untuk memperkirakan parameter suatu populasi.

Nilai kritis. Suatu nilai yang membatasi statistik-statistik sampel yang sangat mungkin terjadi dengan yang sangat tidak mungkin terjadi.

Selang kepercayaan. Suatu selang yang berisi nilai-nilai yang mungkin menjadi nilai sebenarnya dari parameter populasi.

Tingkat kepercayaan. Peluang bahwa suatu selang kepercayaan benar-benar memuat nilai sebenarnya dari parameter populasi.

Pustaka Agresti, A., & Coull, B. A. (1998). Approximate is better than “exact”

for interval estimation of binomial proportions. The American Statistician, 52(2), 119-126.

Bonett, D. G. (2006). Approximate confidence interval for standard deviation of nonnormal distributions. Computational Statistics & Data Analysis, 50(3), 775-782.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 48: Estimasi Nilai Parameter - USD

76

Degree of Freedom. (2008). In The Concise Encyclopedia of Statistics. New York, NY: Springer.

International Association for the Evaluation of Educational Achievement (IEA). (2015). [International Database]. Unpublished raw data.

Schenker, N., & Gentleman, J. F. (2001). On judging the significance of differences by examining the overlap between confidence intervals. The American Statistician, 55(3), 182-186.

Sub Direktorat Statistik Rumah Tangga. (2016). Indonesia – Survei Sosial Ekonomi Nasional 2016 Maret (KOR). Retrieved March 25, 2018, from https://microdata.bps.go.id/mikrodata/index.php/catalog/769/

Tate, R. F., & Klett, G. W. (1959). Optimal confidence intervals for the variance of a normal distribution. Journal of the American statistical Association, 54(287), 674-682.

UNESCO Institute for Statistics. (2016). [Youth literacy rate, population 15-24 years, both sexes (%)]. Unpublished raw data.

Latihan 1. Ketika memperkirakan parameter suatu populasi, apa yang Anda

pilih agar peluang Anda untuk benar semakin tinggi? Estimasi titik atau selang keperayaan? Jelaskan.

2. Kepuasan Kerja. Anda ingin mengetahui kepuasan kerja sopir-sopir angkutan umum di kota Anda. Anda menanyai 63 sopir angkutan umum secara acak dan diperoleh 48 di antaranya puas terhadap perkerjaan mereka. Tentukan estimasi titik terhadap proporsi sopir-sopir angkutan umum di kota Anda yang puas terhadap perkerjaan mereka.

3. Bagaimana Anda menentukan nilai kritis zα/2 pada tingkat kepercayaan 99% dengan menggunakan tabel?

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 49: Estimasi Nilai Parameter - USD

77

4. Untuk statistik-statistik sampel yang sama, tingkat kepercayaan mana yang menghasilkan selang kepercayaan yang paling lebar? 90%, 95%, atau 99%? Jelaskan.

5. Membuat Kesimpulan. Tim peneliti ingin mengetahui pengaruh suplemen makanan terhadap peningkatan berat badan sapi. Dari 89 sapi yang diteliti, mean peningkatan berat badannya adalah 25 kg, dan dengan tingkat kepercayaan 95%, diperoleh batas galat ±5 kg. Berdasarkan penelitian ini, beberapa mahasiswa menuliskan kesimpulan berikut. Adakah mahasiswa yang membuat kesimpulan dengan tepat? Jelaskan mengapa. (a) 95% dari semua sapi yang diteliti mengalami kenaikan berat

badan 20 kg sampai 25 kg. (b) Kita 95% yakin bahwa seekor sapi yang diberi suplemen

makanan tersebut berat badannya naik antara 20 kg sampai 25 kg.

(c) Kita 95% yakin bahwa mean kenaikan berat badan semua sapi yang diteliti tersebut di antara 20 kg sampai 25 kg.

(d) Jika suplemen makanan tersebut diujikan pada sampel sapi lain, peluangnya 95% bahwa berat badan sapi-sapi dalam sampel tersebut naik antara 20 kg sampai 25 kg.

6. Koneksi Internet. Tim peneliti dari International Association for Evaluation of Educational Achievement (IEA) pada tahun 2015 melakukan survei secara acak kepada siswa-siswa dari beberapa negara. Berikut ini adalah banyaknya responden dalam negara-negara tersebut yang memiliki koneksi internet di rumahnya. Konstruksilah selang kepercayaan 95% untuk mengestimasi proporsi populasi.

Negara Banyak Siswa yang

Memiliki Koneksi Internet Ukuran Sampel

Finlandia 4799 4973

Indonesia 834 3894

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 50: Estimasi Nilai Parameter - USD

78

Jepang 3004 4355

Kuwait 2634 3268

7. Belanja Daring. Sebelum Anda memutuskan untuk membuat toko daring, Anda ingin tahu berapa persentase orang-orang yang telah belanja secara daring. Untuk itu, Anda akan melakukan survei terhadap hal tersebut. Jika Anda menginginkan tingkat kepercayaan 95% dan batas galat yang tidak lebih dari 3%, berapa banyak orang yang harus Anda survei? (a) Asumsikan bahwa ada survei sebelumnya yang

menunjukkan bahwa 80% orang sudah pernah belanja secara daring.

(b) Asumsikan tidak ada informasi terkait kemungkinan proporsi populasinya.

8. Gambar berikut adalah tampilan Minitab menunjukkan statistik deskriptif dari suatu sampel.

(a) Identifikasi estimasi titik terbaik untuk μ dan batas galat E

dari gambar tersebut. (b) Dalam membuat selang kepercayaan untuk mengestimasi μ,

Apakah Anda perlu memeriksa apakah sampel tersebut berasal dari populasi yang berdistribusi normal? Jelaskan.

9. Tekanan Darah. Empat belas mahasiswa kedokteran mengukur tekanan darah satu orang pada waktu yang berbeda-beda. Hasil pengukurannya sebagai berikut. 143 140 135 140 120 125 120 130 130 144 138 130 130 150

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 51: Estimasi Nilai Parameter - USD

79

Dengan mengasumsikan simpangan baku populasi diketahui 10 mmHg, buatlah selang kepercayaan 95% yang mengestimasi mean populasi. Idealnya, seperti apakah selang kepercayaan dalam permasalahan ini?

10. Media Sosial. Misalkan Anda ingin mengetahui rata-rata berapa kali seorang remaja memeriksa akun media sosialnya dalam sehari. Berapa remaja yang secara acak harus dipilih agar Anda bisa membuat selang kepercayaan 95% dengan batas galat tidak lebih dari 5. Asumsikan simpangan baku populasinya 20.

11. Deskripsikan bagaimana bentuk, pusat, dan penyebaran distribusi t Student ketika derajat bebasnya bertambah.

12. Dengan menggunakan tabel atau teknologi, tentukan (a) Nilai kritis tα/2 untuk selang kepercayaan 95% dengan derajat

bebas df = 7. (b) Nilai kritis tα/2 untuk selang kepercayaan 99% dengan derajat

bebas df = 102. 13. Deskripsikan bagaimana perubahan nilai kritis tα/2 untuk tingkat

kepercayaan 95% ketika derajat bebasnya semakin besar. 14. Gempa Bumi. Berikut ini adalah kedalaman (dalam meter) titik

pusat gempat bumi yang dipilih secara acak dari Data 3. Gempa bumi tersebut tercatat pada bulan Januari – Maret 2018. 10 50 10 20 67 10 49 47 14 Buatlah selang kepercayaan 95% untuk mengestimasi kedalaman pusat gempa dalam kuartal pertama tahun 2018.

15. Gempa Bumi, Ditinjau Kembali. Bukalah situs web BMKG dan carilah data mengenai gempa bumi yang disediakan situs tersebut. Pada periode dasawarsa terakhir, pilihlah 20 kejadian gempa bumi secara acak untuk membuat selang kepercayaan 95% untuk mengestimasi mean kedalaman pusat gempa bumi pada periode tersebut. Bandingkan jawabanmu dengan hasil pada latihan nomor 14.

16. Gunakan tabel atau teknologi untuk menentukan

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 52: Estimasi Nilai Parameter - USD

80

(a) Nilai-nilai kritis χ2 untuk selang kepercayaan 95% jika ukuran sampelnya 7.

(b) Nilai-nilai kritis χ2 untuk selang kepercayaan 99% jika derajat bebasnya 116.

17. Telepon Pintar. Berikut ini adalah daftar harga (dalam jutaan rupiah) dua merek telepon pintar yang dipilih secara acak dari berbagai toko daring. iPhone 6S: 7,56 8,05 11,5 5,8 8,35 8,2 5,7 7,55 Samsung S6: 7,15 10,99 5,51 6,4 5,4 4 7,95 6,6 (a) Buatlah selang kepercayaan 95% untuk mengestimasi

simpangan baku harga iPhone 6S. (b) Buatlah selang kepercayaan 95% untuk mengestimasi

simpangan baku harga Samsung S6. (c) Apa yang bisa Anda katakan setelah membandingkan hasil

pada bagian (a) dan (b)? 18. Dalam membuat sampel-sampel bootstrap yang ukurannya sama

dengan sampel awal, pemilihan nilai-nilainya dilakukan secara acak dan dengan pengembalian. Bagaimana jika pemilihan nilai-nilai dari sampel awal tersebut dilakukan tanpa pengembalian?

19. Kuliah Daring. Dalam sebuah survei, delapan mahasiswa dipilih secara acak dan ditanya apakah mereka pernah mengikuti kuliah daring di luar kampusnya, dan hasilnya adalah sebagai berikut: 0, 0, 1, 0, 0, 0, 1, 0 (0 = tidak pernah, 1 = pernah). Gunakan metode bootstrap untuk mengestimasi proporsi populasi p, proporsi banyaknya mahasiswa yang pernah mengikuti kuliah daring di luar kampusnya.

Umpan Balik dan Tindak Lanjut Dalam Bab 2 kita telah mempelajari berbagai macam metode untuk mengkonstruksi selang kepercayaan yang digunakan untuk mengestimasi proporsi, mean, variansi, dan simpangan baku suatu populasi. Untuk melakukan hal tersebut, kita menggunakan distribusi

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.

Page 53: Estimasi Nilai Parameter - USD

81

sampling untuk statistik-statistik tersebut. Ada tiga distribusi sampling yang kita gunakan dalam bab ini, yaitu distribusi normal, distribusi t Student, dan distribusi chi-square.

Bagaimana mengkonstruksi selang kepercayaan untuk mengestimasi proporsi populasi sudah kita bahas dalam Subbab 2.1, khususnya dalam Contoh 3. Pada Contoh 5 dan 9 dalam Subbab 2.2 kita telah belajar mengkonstruksi selang kepercayaan untuk memperkirakan nilai mean suatu populasi, baik ketika simpangan baku populasi tersebut diketahui atau tidak. Pada Subbab 2.3 kita telah membahas bagaimana mengkonstruksi selang kepercayaan variansi atau simpangan baku populasi. Selain selang kepercayaan, ketiga subbab tersebut juga menjelaskan bagaimana cara menentukan ukuran sampel jika kita ingin membuat selang kepercayaan dengan tingkat kepercayaan dan batas galat tertentu. Contoh 4 dan 6 mendemonstrasikan hal tersebut.

Salah satu tujuan statistika inferensial untuk mengestimasi parameter suatu populasi sudah kita lakukan dalam bab ini. Pada bab berikutnya, kita akan mencapai tujuan lain dari statistika inferensial, yaitu menguji suatu hipotesis atau klaim tentang suatu parameter populasi.

Naskah ini masih berupa draf. Beritahu dosen Anda jika Anda menemukan beberapa saltik atau kesalahan lainnya.