ch.8 sampling methods and the central limit theorem

CH.8 Sampling Methods and the Central Limit Theorem

STATISTIKA BISNIS

FEB UNS

1. LO8-1 Menjelaskan mengapa populasi diambil sampelnyadan empat metode untuk mengambil sampel dari suatupopulasi.

2. LO8-2 Mendefinisikan sampling error.

3. LO8-3 Mendemonstrasikan konstruksi distribusi samplingmean sampel.

4. LO8-4 Menjelaskan kembali the central limit theorem dantentukan mean dan kesalahan standar dari distribusidistribusi rata-rata sampel.

5. LO8-5 Menerapkan the central limit theorem untukmenghitung probabilitas.

Pertemuan 12 2

3

Menjelaskan mengapa populasi diambil sampelnya dan empat metode untuk mengambilsampel dari suatu populasi

➢ Bab ini membahas mengenai pengambilan sampel. Sampling adalah proses pemilihan

item dari suatu populasi sehingga kita dapat menggunakan informasi ini untuk membuat

penilaian atau kesimpulan tentang populasi tersebut.

➢ Bab ini meliputi metode pemilihan sampel dari suatu populasi, distribusi mean sampel

untuk memahami bagaimana mean sampel cenderung mengelompok di sekitar mean

populasi.

➢ Setiap populasi, bentuk distribusi sampling ini cenderung mengikuti distribusi probabilitas

normal.

Presentation Title 4

✓ Tujuan statistik inferensial adalah untuk menemukan sesuatu tentang suatu populasi berdasarkan sampel.

✓ Sampel adalah sebagian atau sebagian dari populasi yang menjadi focus/interest.

✓ Dalam banyak kasus, pengambilan sampel lebih memungkinkan daripada mempelajari seluruh populasi.


ALASAN PENGGUNAAN SAMPEL

1. Untuk menghubungi seluruh populasi akan memakan waktu.

2. Biaya meneliti semua item dalam suatu populasi bisa jadi mahal

3. Ketidakmungkinan secara fisik untuk memeriksa semua item dalam populasi.

4. Sifat destruktif dari beberapa tes → nature produk yang tidak mungkin diuji semuanya

5. Hasil sampelnya memadai

1. Simple Random Sampling

2. Systematic Random Sampling

3. Stratified Random Sampling

4. Cluster Sampling


1. Simple Random Sampling

✓ Definisi: Sampel dipilih sehingga setiap item atau orang dalam populasi memiliki kesempatan yang samauntuk dimasukkan.

✓ Misal: populasi =Terdapat 750 Liga Utama pemain bisbol (30 tim) di akhir musim 2017. Ketua serikatpekerja ingin membentuk komite yang terdiri dari 10 pemain untuk mempelajari masalah kecelakaandalam pertandingan. Salah satu cara untuk memastikan bahwa setiap pemain dalam populasi tersebutmemiliki kesempatan yang sama untuk terpilih menjadi anggota Komite tsb.

✓ Masing-masing nama dari 750 pemain ditulis pada secarik kertas ditempatkan pada sebuah kotak.Setelah potongan kertas tercampur rata, seleksi pertama dibuat dengan mengambil secarik kertas darikotak yang mengidentifikasi pemain pertama.

✓ Sobekan kertas tidak dikembalikan ke kotak. Proses ini diulang sembilan kali lagi untuk membentukpanitia. (Perhatikan bahwa probabilitas setiap pemilihan meningkat sedikit karena slip tidak diganti.Namun, perbedaannya sangat kecil karena populasinya 750. Probabilitas setiap pemilihan adalahsekitar 0,0013, dibulatkan menjadi empat tempat desimal.)


Prosedur pengambilan sampel acak sederhana tidak selalu tepat dalam beberapa situasi penelitian.

✓ Misalnya, Stood’s Grocery Market perlu mengambil sampel pelanggan mereka untuk mempelajari lamanya waktu yangdihabiskan pelanggan di toko. Pengambilan sampel acak sederhana bukanlah metode yang efektif. Toko tidak memilikidaftar pelanggan, jadi menetapkan nomor acak kepada pelanggan tidak mungkin dilakukan.

✓ Kita dapat menggunakan systematic random sampling untuk memilih sampel yang representatif.

✓ Dengan menggunakan metode ini untuk Stood’s Grocery Market → memilih 100 pelanggan selama 4 hari, Senin-Kamis. 25 pelanggan dipilih setiap hari dan waktu pengambilan sampel yang berbeda setiap harinya yaitu: 8 pagi, 11pagi, 4 sore, dan 7 malam.

✓ Kami menulis 4 kali dan selama 4 hari di atas secarik kertas dan menaruhnya dalam dua topi — satu topi untuk hariitu dan topi lain untuk waktu yang lain.

✓ Kami memilih satu slip dari setiap topi. Hal ini memastikan bahwa waktu pada hari itu ditentukan secara aca. Misalkankita memilih jam 4 sore untuk waktu mulai pada hari Senin.

✓ Selanjutnya kami memilih nomor acak antara 1 dan 10 dapat 6. Proses seleksi kami dimulai pada hari Senin jam 4sore dengan memilih pelanggan keenam yang memasuki toko. Kemudian, kami memilih setiap pelanggan ke-10 (16,26, 36) hingga kami mencapai tujuan 25 pelanggan. Untuk setiap pelanggan sampel ini, kami mengukur lamanyawaktu yang dihabiskan pelanggan di toko.


✓ Sebelum menggunakan pengambilan sampel acak sistematis, kita harus mengamati dengan cermat urutan fisik

populasi. Jika tatanan fisik dikaitkan dengan karakteristik populasi, maka pengambilan sampel secara acak

sistematik tidak boleh digunakan karena sampel dapat menjadi bias.

✓ Misalnya, jika kita ingin mengaudit faktur di laci file yang diurutkan berdasarkan jumlah dolar → maka

systematic random sampel tidak akan menjamin sampel acak yang tidak bias. Metode pengambilan sampel

lainnya harus digunakan.


SAMPEL ACAK SISTEMATIS pengambilan sampel dengan memilih titik awal secaraacak, dan kemudian setiap anggota populasi ke-k dipilih.

▪ Ketika suatu populasi dapat secara jelas dibagi menjadi beberapa kelompok berdasarkan

beberapa karakteristik, kita dapat menggunakan pengambilan sampel acak bertingkat. Hal ini

menjamin setiap kelompok terwakili dalam sampel. Kelompok tersebut disebut strata

▪ Misalnya, mahasiswa dapat dikelompokkan sebagai penuh waktu atau paruh waktu; sebagai pria

atau wanita; atau sebagai mahasiswa baru, mahasiswa tingkat dua, junior, atau senior.

▪ Biasanya strata dibentuk berdasarkan atribut atau karakteristik yang dimiliki anggota. Sampel acak

dari setiap lapisan diambil dalam jumlah yang sebanding dengan ukuran lapisan tersebut jika

dibandingkan dengan populasi. Setelah strata ditentukan, kami menerapkan pengambilan sampel

acak sederhana dalam setiap kelompok atau strata untuk mengumpulkan sampel.



Suatu populasi dibagi menjadi kelompok-kelompok menggunakan batas-batas geografis atau lainnya yang terjadi secara alami. Kemudian, cluster dipilih secara acak dan sampel dikumpulkan dengan memilihsecara acak dari setiap cluster.

LO2-SAMPLING ERROR


▪ Metode pengambilan sampel → representasi populasi yang tidak bias

▪ Dalam setiap metode, pemilihan setiap sampel pada ukuran tertentu dari suatu populasi

memiliki peluang atau probabilitas yang diketahui.

▪ Sampel digunakan untuk memperkirakan karakteristik populasi. Misalnya, mean sampel

digunakan untuk memperkirakan mean populasi. Namun, karena sampel adalah

sebagian atau sebagian dari populasi, kecil kemungkinan mean sampel akan sama

persis dengan rata-rata populasi. Demikian pula, kecil kemungkinannya simpangan baku

sampel akan persis sama dengan simpangan baku populasi. Oleh karena itu kita dapat

mengharapkan perbedaan antara statistik sampel dan parameter populasi yang sesuai.

▪ Perbedaan ini disebut kesalahan pengambilan sampel (sampling error).


Penelitian megenai jumlah kamar

yang disewa Foxtrot Inn bed and

breakfast di Tryon, Carolina Utara.

Populasi adalah jumlah kamar

yang disewa selama 30 hari pada

bulan Juni 2017. Hitung mean

populasinya. Pilih tiga sampel acak

selama 5 hari. Hitung rata-rata

kamar yang disewa untuk setiap

sampel dan bandingkan dengan

rata-rata populasi. Apa kesalahan

pengambilan sampel (sampling

error) dalam setiap kasus?


✓ Ketika kita menggunakan mean sampel untuk memperkirakan mean populasi, bagaimana kita dapat

menentukan seberapa akurat estimasi tersebut?

✓ Misal: Bagaimana seorang supervisor quality assurance memutuskan apakah sebuah mesin mengisi botol 20

ons dengan 20 ons cola hanya berdasarkan sampel 10 botol terisi?

✓ FiveThirtyEight.com atau Gallup membuat pernyataan akurat tentang demografi pemilih dalam pemilihan

presiden berdasarkan sampel yang relatif kecil dari populasi pemilih yang hampir 90 juta?

✓ Untuk menjawab pertanyaan ini, pertama-tama kami mengembangkan distribusi sampling mean sampel.

Sarana sampel dalam contoh / solusi sebelumnya bervariasi dari satu sampel ke sampel berikutnya. Rata-rata

sampel pertama 5 hari adalah 3,80 kamar, dan sampel kedua rata-rata adalah 3,40 kamar. Rata-rata populasi

adalah 3,13 kamar.

✓ Jika kita mengatur mean dari semua sampel yang mungkin dari 5 hari ke dalam distribusi probabilitas, hasilnya

disebut distribusi sampling mean sampel.


Example


Pembahasan


✓ Central Limit Theorem → menyatakan bahwa, untuk sampel acak yang besar, bentuk distribusi sampling

mean mendekati distribusi probabilitas normal.

✓ Perkiraannya lebih akurat untuk sampel besar daripada sampel kecil. Ini adalah salah satu kesimpulan paling

berguna dalam statistik. Kita dapat bernalar tentang distribusi rata-rata sampel tanpa informasi sama sekali

tentang bentuk distribusi populasi dari mana sampel diambil. dengan kata lain, Central Limit Theorem berlaku

untuk semua distribusi populasi.


Central Limit Theorem → Jika semua sampel dengan ukuran tertentu dipilih daripopulasi mana pun, distribusi sampel rata-rata sampel kurang-lebih berdistribusi

normal. Perkiraan ini meningkat dengan sampel yang lebih besar.

Ed Spence memulai bisnis sproketnya 20 tahun lalu. Bisnis ini telah berkembang selama bertahun-tahun dan sekarang

mempekerjakan 40 orang. Spence Sprockets Inc. menghadapi beberapa keputusan besar terkait perawatan kesehatan

untuk karyawan ini. Sebelum membuat keputusan akhir tentang rencana perawatan kesehatan apa yang akan dibeli, Ed

memutuskan untuk membentuk komite yang terdiri dari lima karyawan perwakilan. Tahun-tahun layanan (dibulatkan ke

tahun terdekat) dari 40 karyawan yang saat ini berada dalam daftar gaji Spence Sprockets Inc. adalah sebagai berikut.


Bagan 8–4 menunjukkan histogram untuk distribusi frekuensi masa kerja untuk

populasi 40 karyawan saat ini.

Distribusi ini miring positif. Mengapa? Karena bisnis telah berkembang dalam

beberapa tahun terakhir, distribusi menunjukkan bahwa 29 dari 40 karyawan telah

telah bekerja di perusahaan kurang dari 6 tahun. Selain itu, terdapat 11 karyawan

yang telah bekerja di Spence Sprockets selama lebih dari 6 tahun. Secara

khusus, empat karyawan telah bekerja di perusahaan selama 12 tahun atau lebih

(hitung frekuensi di atas 12). Jadi, ada ekor panjang dalam distribusi tahun kerja

ke kanan, yaitu distribusinya miring secara positif

Ed menulis tahun-tahun pengabdianuntuk masing-masing dari 40 karyawandi selembar kertas dan menaruhnya ditopi bisbol tua. Selanjutnya, diamengocok potongan-potongan kertasdan secara acak memilih lima lembarkertas. Masa kerja kelima karyawan iniadalah 1, 9, 0, 19, dan 14 tahun. Jadi,rata-rata masa kerja untuk limakaryawan sampel ini adalah 8,60 tahun.Bagaimana jika dibandingkan denganpopulasi artinya?

Saat ini Ed belum mengetahui rata-ratapopulasi, namun jumlah karyawandalam populasi hanya 40, maka diamemutuskan untuk menghitung rata-rata masa kerja untuk semuakaryawannya. Itu 4,8 tahun,


Di bagian ini, kami juga sampai pada kesimpulan penting lainnya.

1. Rata-rata distribusi mean sampel akan sama persis dengan mean populasi jika kita dapat memilih

semua sampel yang mungkin dengan ukuran yang sama dari populasi tertentu. Itu adalah:

μ = μ x

Bahkan jika kita tidak memilih semua sampel, kita dapat mengharapkan mean dari distribusi mean

sampel mendekati mean populasi.

2. Akan ada lebih sedikit dispersi dalam distribusi sampling dari rata-rata sampel dibandingkan dalam

populasi. Jika deviasi standar populasi adalah σ, deviasi standar distribusi mean sampel adalah σ ∕

√n. Perhatikan bahwa ketika kita meningkatkan ukuran sampel, kesalahan standar mean

berkurang.Presentation Title 28

LO 5-USING THE SAMPLING DISTRIBUTION OF THE SAMPLE MEANApply the central limit theorem to calculate probabilities.


Pembahasan sebelumnya penting karena sebagian besar keputusan bisnis dibuat berdasarkan informasi sampel. Berikut

ini beberapa contohnya

1. Arm & Hammer Company ingin memastikan bahwa deterjen cuciannya benar-benar mengandung 100 ons cairan,

seperti yang ditunjukkan pada label. Ringkasan sejarah dari proses pengisian menunjukkan jumlah rata-rata per

wadah adalah 100 ons cairan dan deviasi standar adalah 2 ons cairan. Pada pukul 10 pagi, teknisi berkualitas

mengukur 40 kontainer dan menemukan jumlah rata-rata per kontainer adalah 99,8 ons cairan. Haruskah teknisi

menghentikan operasi pengisian?

2. A. C. Nielsen Company memberikan informasi kepada organisasi yang beriklan di televisi. Penelitian sebelumnya

menunjukkan bahwa orang dewasa Amerika menonton televisi rata-rata 6,0 jam per hari. Deviasi standar adalah 1,5

jam. Berapa probabilitas bahwa kita dapat secara acak memilih sampel dari 50 orang dewasa dan menemukan

bahwa mereka menonton televisi rata-rata selama 6,5 jam atau lebih per hari?


Dalam setiap kasus, kami memiliki populasi dengan informasi tentang mean dan deviasistandarnya. Dengan menggunakan informasi dan ukuran sampel ini, kita dapat menentukandistribusi mean sampel dan menghitung probabilitas mean sampel akan berada dalamkisaran tertentu.

Distribusi pengambilan sampel akan didistribusikan secara normal dalam dua kondisi:

1. Bila sampel diambil dari populasi diketahui mengikuti distribusi normal. Dalam hal ini,ukuran sampel bukan merupakan faktor.

2. Jika bentuk distribusi populasi tidak diketahui, ukuran sampel menjadi penting. Secaraumum, distribusi sampling akan terdistribusi normal saat ukuran sampel mendekati takterhingga. Dalam praktiknya, distribusi sampling akan mendekati distribusi normaldengan sampel minimal 30 observasi.


ch.8 sampling methods and the central limit theorem

Documents