ch.8 sampling methods and the central limit theorem
TRANSCRIPT
CH.8 Sampling Methods and the Central Limit Theorem
STATISTIKA BISNIS
FEB UNS
1. LO8-1 Menjelaskan mengapa populasi diambil sampelnyadan empat metode untuk mengambil sampel dari suatupopulasi.
2. LO8-2 Mendefinisikan sampling error.
3. LO8-3 Mendemonstrasikan konstruksi distribusi samplingmean sampel.
4. LO8-4 Menjelaskan kembali the central limit theorem dantentukan mean dan kesalahan standar dari distribusidistribusi rata-rata sampel.
5. LO8-5 Menerapkan the central limit theorem untukmenghitung probabilitas.
Pertemuan 12 2
3
Menjelaskan mengapa populasi diambil sampelnya dan empat metode untuk mengambilsampel dari suatu populasi
➢ Bab ini membahas mengenai pengambilan sampel. Sampling adalah proses pemilihan
item dari suatu populasi sehingga kita dapat menggunakan informasi ini untuk membuat
penilaian atau kesimpulan tentang populasi tersebut.
➢ Bab ini meliputi metode pemilihan sampel dari suatu populasi, distribusi mean sampel
untuk memahami bagaimana mean sampel cenderung mengelompok di sekitar mean
populasi.
➢ Setiap populasi, bentuk distribusi sampling ini cenderung mengikuti distribusi probabilitas
normal.
Presentation Title 4
✓ Tujuan statistik inferensial adalah untuk menemukan sesuatu tentang suatu populasi berdasarkan sampel.
✓ Sampel adalah sebagian atau sebagian dari populasi yang menjadi focus/interest.
✓ Dalam banyak kasus, pengambilan sampel lebih memungkinkan daripada mempelajari seluruh populasi.
Presentation Title 5
ALASAN PENGGUNAAN SAMPEL
1. Untuk menghubungi seluruh populasi akan memakan waktu.
2. Biaya meneliti semua item dalam suatu populasi bisa jadi mahal
3. Ketidakmungkinan secara fisik untuk memeriksa semua item dalam populasi.
4. Sifat destruktif dari beberapa tes → nature produk yang tidak mungkin diuji semuanya
5. Hasil sampelnya memadai
1. Simple Random Sampling
2. Systematic Random Sampling
3. Stratified Random Sampling
4. Cluster Sampling
Presentation Title 6
1. Simple Random Sampling
✓ Definisi: Sampel dipilih sehingga setiap item atau orang dalam populasi memiliki kesempatan yang samauntuk dimasukkan.
✓ Misal: populasi =Terdapat 750 Liga Utama pemain bisbol (30 tim) di akhir musim 2017. Ketua serikatpekerja ingin membentuk komite yang terdiri dari 10 pemain untuk mempelajari masalah kecelakaandalam pertandingan. Salah satu cara untuk memastikan bahwa setiap pemain dalam populasi tersebutmemiliki kesempatan yang sama untuk terpilih menjadi anggota Komite tsb.
✓ Masing-masing nama dari 750 pemain ditulis pada secarik kertas ditempatkan pada sebuah kotak.Setelah potongan kertas tercampur rata, seleksi pertama dibuat dengan mengambil secarik kertas darikotak yang mengidentifikasi pemain pertama.
✓ Sobekan kertas tidak dikembalikan ke kotak. Proses ini diulang sembilan kali lagi untuk membentukpanitia. (Perhatikan bahwa probabilitas setiap pemilihan meningkat sedikit karena slip tidak diganti.Namun, perbedaannya sangat kecil karena populasinya 750. Probabilitas setiap pemilihan adalahsekitar 0,0013, dibulatkan menjadi empat tempat desimal.)
Presentation Title 7
Prosedur pengambilan sampel acak sederhana tidak selalu tepat dalam beberapa situasi penelitian.
✓ Misalnya, Stood’s Grocery Market perlu mengambil sampel pelanggan mereka untuk mempelajari lamanya waktu yangdihabiskan pelanggan di toko. Pengambilan sampel acak sederhana bukanlah metode yang efektif. Toko tidak memilikidaftar pelanggan, jadi menetapkan nomor acak kepada pelanggan tidak mungkin dilakukan.
✓ Kita dapat menggunakan systematic random sampling untuk memilih sampel yang representatif.
✓ Dengan menggunakan metode ini untuk Stood’s Grocery Market → memilih 100 pelanggan selama 4 hari, Senin-Kamis. 25 pelanggan dipilih setiap hari dan waktu pengambilan sampel yang berbeda setiap harinya yaitu: 8 pagi, 11pagi, 4 sore, dan 7 malam.
✓ Kami menulis 4 kali dan selama 4 hari di atas secarik kertas dan menaruhnya dalam dua topi — satu topi untuk hariitu dan topi lain untuk waktu yang lain.
✓ Kami memilih satu slip dari setiap topi. Hal ini memastikan bahwa waktu pada hari itu ditentukan secara aca. Misalkankita memilih jam 4 sore untuk waktu mulai pada hari Senin.
✓ Selanjutnya kami memilih nomor acak antara 1 dan 10 dapat 6. Proses seleksi kami dimulai pada hari Senin jam 4sore dengan memilih pelanggan keenam yang memasuki toko. Kemudian, kami memilih setiap pelanggan ke-10 (16,26, 36) hingga kami mencapai tujuan 25 pelanggan. Untuk setiap pelanggan sampel ini, kami mengukur lamanyawaktu yang dihabiskan pelanggan di toko.
Presentation Title 8
✓ Sebelum menggunakan pengambilan sampel acak sistematis, kita harus mengamati dengan cermat urutan fisik
populasi. Jika tatanan fisik dikaitkan dengan karakteristik populasi, maka pengambilan sampel secara acak
sistematik tidak boleh digunakan karena sampel dapat menjadi bias.
✓ Misalnya, jika kita ingin mengaudit faktur di laci file yang diurutkan berdasarkan jumlah dolar → maka
systematic random sampel tidak akan menjamin sampel acak yang tidak bias. Metode pengambilan sampel
lainnya harus digunakan.
Presentation Title 9
SAMPEL ACAK SISTEMATIS pengambilan sampel dengan memilih titik awal secaraacak, dan kemudian setiap anggota populasi ke-k dipilih.
▪ Ketika suatu populasi dapat secara jelas dibagi menjadi beberapa kelompok berdasarkan
beberapa karakteristik, kita dapat menggunakan pengambilan sampel acak bertingkat. Hal ini
menjamin setiap kelompok terwakili dalam sampel. Kelompok tersebut disebut strata
▪ Misalnya, mahasiswa dapat dikelompokkan sebagai penuh waktu atau paruh waktu; sebagai pria
atau wanita; atau sebagai mahasiswa baru, mahasiswa tingkat dua, junior, atau senior.
▪ Biasanya strata dibentuk berdasarkan atribut atau karakteristik yang dimiliki anggota. Sampel acak
dari setiap lapisan diambil dalam jumlah yang sebanding dengan ukuran lapisan tersebut jika
dibandingkan dengan populasi. Setelah strata ditentukan, kami menerapkan pengambilan sampel
acak sederhana dalam setiap kelompok atau strata untuk mengumpulkan sampel.
Presentation Title 10
Presentation Title 11
Presentation Title 12
Suatu populasi dibagi menjadi kelompok-kelompok menggunakan batas-batas geografis atau lainnya yang terjadi secara alami. Kemudian, cluster dipilih secara acak dan sampel dikumpulkan dengan memilihsecara acak dari setiap cluster.
LO2-SAMPLING ERROR
Presentation Title 13
▪ Metode pengambilan sampel → representasi populasi yang tidak bias
▪ Dalam setiap metode, pemilihan setiap sampel pada ukuran tertentu dari suatu populasi
memiliki peluang atau probabilitas yang diketahui.
▪ Sampel digunakan untuk memperkirakan karakteristik populasi. Misalnya, mean sampel
digunakan untuk memperkirakan mean populasi. Namun, karena sampel adalah
sebagian atau sebagian dari populasi, kecil kemungkinan mean sampel akan sama
persis dengan rata-rata populasi. Demikian pula, kecil kemungkinannya simpangan baku
sampel akan persis sama dengan simpangan baku populasi. Oleh karena itu kita dapat
mengharapkan perbedaan antara statistik sampel dan parameter populasi yang sesuai.
▪ Perbedaan ini disebut kesalahan pengambilan sampel (sampling error).
Presentation Title 14
Penelitian megenai jumlah kamar
yang disewa Foxtrot Inn bed and
breakfast di Tryon, Carolina Utara.
Populasi adalah jumlah kamar
yang disewa selama 30 hari pada
bulan Juni 2017. Hitung mean
populasinya. Pilih tiga sampel acak
selama 5 hari. Hitung rata-rata
kamar yang disewa untuk setiap
sampel dan bandingkan dengan
rata-rata populasi. Apa kesalahan
pengambilan sampel (sampling
error) dalam setiap kasus?
Presentation Title 15
Presentation Title 16
17
✓ Ketika kita menggunakan mean sampel untuk memperkirakan mean populasi, bagaimana kita dapat
menentukan seberapa akurat estimasi tersebut?
✓ Misal: Bagaimana seorang supervisor quality assurance memutuskan apakah sebuah mesin mengisi botol 20
ons dengan 20 ons cola hanya berdasarkan sampel 10 botol terisi?
✓ FiveThirtyEight.com atau Gallup membuat pernyataan akurat tentang demografi pemilih dalam pemilihan
presiden berdasarkan sampel yang relatif kecil dari populasi pemilih yang hampir 90 juta?
✓ Untuk menjawab pertanyaan ini, pertama-tama kami mengembangkan distribusi sampling mean sampel.
Sarana sampel dalam contoh / solusi sebelumnya bervariasi dari satu sampel ke sampel berikutnya. Rata-rata
sampel pertama 5 hari adalah 3,80 kamar, dan sampel kedua rata-rata adalah 3,40 kamar. Rata-rata populasi
adalah 3,13 kamar.
✓ Jika kita mengatur mean dari semua sampel yang mungkin dari 5 hari ke dalam distribusi probabilitas, hasilnya
disebut distribusi sampling mean sampel.
Presentation Title 18
Example
Presentation Title 19
Pembahasan
Presentation Title 20
Presentation Title 21
Presentation Title 22
✓ Central Limit Theorem → menyatakan bahwa, untuk sampel acak yang besar, bentuk distribusi sampling
mean mendekati distribusi probabilitas normal.
✓ Perkiraannya lebih akurat untuk sampel besar daripada sampel kecil. Ini adalah salah satu kesimpulan paling
berguna dalam statistik. Kita dapat bernalar tentang distribusi rata-rata sampel tanpa informasi sama sekali
tentang bentuk distribusi populasi dari mana sampel diambil. dengan kata lain, Central Limit Theorem berlaku
untuk semua distribusi populasi.
Presentation Title 23
Central Limit Theorem → Jika semua sampel dengan ukuran tertentu dipilih daripopulasi mana pun, distribusi sampel rata-rata sampel kurang-lebih berdistribusi
normal. Perkiraan ini meningkat dengan sampel yang lebih besar.
Ed Spence memulai bisnis sproketnya 20 tahun lalu. Bisnis ini telah berkembang selama bertahun-tahun dan sekarang
mempekerjakan 40 orang. Spence Sprockets Inc. menghadapi beberapa keputusan besar terkait perawatan kesehatan
untuk karyawan ini. Sebelum membuat keputusan akhir tentang rencana perawatan kesehatan apa yang akan dibeli, Ed
memutuskan untuk membentuk komite yang terdiri dari lima karyawan perwakilan. Tahun-tahun layanan (dibulatkan ke
tahun terdekat) dari 40 karyawan yang saat ini berada dalam daftar gaji Spence Sprockets Inc. adalah sebagai berikut.
Presentation Title 25
Bagan 8–4 menunjukkan histogram untuk distribusi frekuensi masa kerja untuk
populasi 40 karyawan saat ini.
Distribusi ini miring positif. Mengapa? Karena bisnis telah berkembang dalam
beberapa tahun terakhir, distribusi menunjukkan bahwa 29 dari 40 karyawan telah
telah bekerja di perusahaan kurang dari 6 tahun. Selain itu, terdapat 11 karyawan
yang telah bekerja di Spence Sprockets selama lebih dari 6 tahun. Secara
khusus, empat karyawan telah bekerja di perusahaan selama 12 tahun atau lebih
(hitung frekuensi di atas 12). Jadi, ada ekor panjang dalam distribusi tahun kerja
ke kanan, yaitu distribusinya miring secara positif
Ed menulis tahun-tahun pengabdianuntuk masing-masing dari 40 karyawandi selembar kertas dan menaruhnya ditopi bisbol tua. Selanjutnya, diamengocok potongan-potongan kertasdan secara acak memilih lima lembarkertas. Masa kerja kelima karyawan iniadalah 1, 9, 0, 19, dan 14 tahun. Jadi,rata-rata masa kerja untuk limakaryawan sampel ini adalah 8,60 tahun.Bagaimana jika dibandingkan denganpopulasi artinya?
Saat ini Ed belum mengetahui rata-ratapopulasi, namun jumlah karyawandalam populasi hanya 40, maka diamemutuskan untuk menghitung rata-rata masa kerja untuk semuakaryawannya. Itu 4,8 tahun,
Presentation Title 26
Presentation Title 27
Di bagian ini, kami juga sampai pada kesimpulan penting lainnya.
1. Rata-rata distribusi mean sampel akan sama persis dengan mean populasi jika kita dapat memilih
semua sampel yang mungkin dengan ukuran yang sama dari populasi tertentu. Itu adalah:
μ = μ x
Bahkan jika kita tidak memilih semua sampel, kita dapat mengharapkan mean dari distribusi mean
sampel mendekati mean populasi.
2. Akan ada lebih sedikit dispersi dalam distribusi sampling dari rata-rata sampel dibandingkan dalam
populasi. Jika deviasi standar populasi adalah σ, deviasi standar distribusi mean sampel adalah σ ∕
√n. Perhatikan bahwa ketika kita meningkatkan ukuran sampel, kesalahan standar mean
berkurang.Presentation Title 28
LO 5-USING THE SAMPLING DISTRIBUTION OF THE SAMPLE MEANApply the central limit theorem to calculate probabilities.
Presentation Title 29
Pembahasan sebelumnya penting karena sebagian besar keputusan bisnis dibuat berdasarkan informasi sampel. Berikut
ini beberapa contohnya
1. Arm & Hammer Company ingin memastikan bahwa deterjen cuciannya benar-benar mengandung 100 ons cairan,
seperti yang ditunjukkan pada label. Ringkasan sejarah dari proses pengisian menunjukkan jumlah rata-rata per
wadah adalah 100 ons cairan dan deviasi standar adalah 2 ons cairan. Pada pukul 10 pagi, teknisi berkualitas
mengukur 40 kontainer dan menemukan jumlah rata-rata per kontainer adalah 99,8 ons cairan. Haruskah teknisi
menghentikan operasi pengisian?
2. A. C. Nielsen Company memberikan informasi kepada organisasi yang beriklan di televisi. Penelitian sebelumnya
menunjukkan bahwa orang dewasa Amerika menonton televisi rata-rata 6,0 jam per hari. Deviasi standar adalah 1,5
jam. Berapa probabilitas bahwa kita dapat secara acak memilih sampel dari 50 orang dewasa dan menemukan
bahwa mereka menonton televisi rata-rata selama 6,5 jam atau lebih per hari?
Presentation Title 30
Dalam setiap kasus, kami memiliki populasi dengan informasi tentang mean dan deviasistandarnya. Dengan menggunakan informasi dan ukuran sampel ini, kita dapat menentukandistribusi mean sampel dan menghitung probabilitas mean sampel akan berada dalamkisaran tertentu.
Distribusi pengambilan sampel akan didistribusikan secara normal dalam dua kondisi:
1. Bila sampel diambil dari populasi diketahui mengikuti distribusi normal. Dalam hal ini,ukuran sampel bukan merupakan faktor.
2. Jika bentuk distribusi populasi tidak diketahui, ukuran sampel menjadi penting. Secaraumum, distribusi sampling akan terdistribusi normal saat ukuran sampel mendekati takterhingga. Dalam praktiknya, distribusi sampling akan mendekati distribusi normaldengan sampel minimal 30 observasi.
Presentation Title 31
Presentation Title 32
Presentation Title 34