presentasi bab3-4 statekbis
Post on 23-Jun-2015
135 Views
Preview:
TRANSCRIPT
Describing DataNumerical Measures,
Displaying, and Exploring Data
Marissa PutriMuhammad SalmanAliya Izet
Goals
MEAN
Mean
Arithmetic Mean
Weighted Mean
Population Mean
Sample MeanGeometric
Mean
Population Mean is...Jumlah dari semua nilai populasi yang belum
dikelompokan ke dalam distribusi frekuensi populasi.
= X N
: meanX : jumlah dari nilai XN : jumlah populasi
Hal-hal yang terukur dan terhitung dari sebuah populasi disebut parameter. Mean dari populasi merupakan salah satu contoh dari parameter.
Sample Mean is...Jumlah dari seluruh nilai sampel dibagi dngan total sampel yang ada.
= n
: meanx : jumlah dari nilai xn : jumlah sampel
Semua nilai dan ukuran yang menggunakan sampel disebut sebagai statistik. Sample Mean adalah salah satu contoh statistik.
Weighted Mean is...
Sebenarnya adalah perluasan dari bentuk umum Mean. Yakni, dengan teknik pengalian. Mengalikan tiap nilai dengan angka sesuai kemunculan dalam observasi.
xw = w1x1 + w2x2 + w3x3 + ... + wnxn
w1 + w2 + w3 + ... + wn
Xw : Weighted meanw : kemunculan dalam observasiX : nilai
Essential properties of the Arithmetic Mean! 1. Setiap data dalam bentuk Interval atau Ratio, memiliki
Mean.2. Semua nilai termasuk dalam komputasi Mean. Artinya,
tiap nilai yang terdapat baik dalam populasi atau sampel harus diikutsertakan dalam penghitungan.
3. Nilai Mean sifatnya unik. Hanya ada 1 dalam 1 set data
4. Hasil penjumlahan dari Deviasi tiap nilai dengan Mean adalah 0 (Nol)
(X – ) = 0X : nilai
: Mean
(X – ) : Hasil penjumlahan deviasi nilai dengan mean
Overall...
Mean as a balance point for a set of data
Weakness...
Apabila ada satu atau dua nilai yang terlalu besar atau terlalu kecil dibandingkan dengan nilai yang lainnya.
Data tersebut lebih dapat dideskripsikan
oleh metode Median
MEDIANMedian adalah titik tengah dari nilai-nilai dalam data setelah mereka diurutkan dari terkecil ke terbesar atau sebaliknya.
Pada dasarnya median dengan jumlah data ganjil atau genap sama saja. Hanya proses mendapatkan hasilnya yang berbeda. Pada data genap, memerlukan beberapa langkah tambahan.
Pada Median dengan jumlah data genap kita harus:
1. Identifikasi dua buah titik tengah setelah data diurutkan2. Cari Mean dari dua titik tengah tersebut.
Median
Even Number
Odd Number
Essential properties of Median!
1. Tidak terpengaruh oleh besar sekali atau kecil sekali sebuah nilai dalam data yang mempengaruhi nilai Mean.
2. Jenis level data Ordinal juga dapat menggunakan Median. Sedangkan Mean hanya dapat memproses level data Interval dan Ratio saja
3. Level data Nominal hanya dapat
menggunakan sistem persebaran Modus
MODUS Modus adalah nilai yang paling banyak muncul (frekuensi
banyak/tinggi) dalam sebuah observasi
Merupakan bentuk paling sederhana dibandingkan dengan Mean atau Median
Tidak terpengaruh oleh besar sekali atau kecil sekali sebuah nilai dalam data yang mempengaruhi nilai Mean
Jenis level data Nominal juga dapat menggunakan Modus.
Digunakan dalam merangkum sebuah data
Penggunaannya paling sedikit dibanding Mean dan Median dikarenakan tidak semua data memiliki modus.
The Relative Positions of Mean, Median, and Modus
2 th 3 th 4 th 5 th 6 th0
2
4
Tahun 2009
Tahun 2009
Symetric Distribution
Mean, Median, dan Modus terletak di tengah dan nilainya selalu sama.
Dari grafik disamping dapat dilihat bahwa Mean umur adalah 4 tahun, Median 4 tahun, dan Modus 4 tahun
2 th3 th4 th5 th6 th0
2
4
Tahun 2008
Tahun 2008
Positively Skewed Distribution
Nilai Mean akan lebih tinggi dibanding Median dan Modus.
Dari grafik disamping dapat dilihat bahwa Mean umur adalah 3,56 tahun, Median 3 tahun, dan Modus 3 tahun.
2 th 3 th 4 th 5 th 6 th0
2
4
Tahun 2007
Tahun 2007
Negatively Skewed Distribution
Nilai Modus akan lebih tinggi dibanding Median dan Mean
Dari grafik disamping dapat dilihat bahwa Mean umur adalah 4,44 tahun, Median 5 tahun, dan Modus 5 tahun
Geometric MeanGeometric Mean biasa digunakan dalam Ilmu ekonomi dan Bisnis. Seperti mencari rata-rata persentase perubahan sebuah nilai, rasio, pertumbuhan, dan lainnya.
GM =
Nilainya akan lebih kecil sedikit atau sama dengan nilai Arithmetic Mean. Seluruh nilai data harus dipastikan positif karena formula matematika yang digunakan adalah pengakaran.
Average percent change over a period time
Rate of increase over a time =
DispersionMengapa penting mempelajari Dispersi?
Karena dispersi tidak hanya menyajikan penjelasan pusat data seperti nilai mean dan median. Nilai dispersi menunjukan seberapa representatifnya statistik. Dispersi juga dapat digunakan untuk membandingkan dua distribusi atau lebih.
Ukuran-ukuran Dispersi
Jangkauan (range) Deviasi rata-rata (mean deviation) Variansi dan standar deviasi ( variance and standard
deviation)
JangkauanJangkauan merupakan ukuran dispersi yang paling sederhana. Jangkauan adalah selisih nilai terbesar dan nilai terkecil dari sebuah pengamatan.
Jangkauan = nilai terbesar – nilai terkecil
Deviasi rata-rata Deviasi rata-rata adalah rata rata hitung dari nilai absolut sebuah deviasi terhadap nilai rata-rata hitung.
Berbeda dengan jangkauan yang hanya menggunakan dua nilai, yaitu yang terbesar dan yang terkecil. Deviasi rata-rata mengukur jumlah rata-rata berdasarkan bagaimana nilai-nilai pada populasi, atau sampel, bervariasi dari nilai rata-ratanya.
MD =
X: nilai untuk setiap observasi: Rata-rata hitungn: jumlah observasi : absolut
VariansiVariansi rata-rata hitung dari kuadrat deviasi rata-rata
Untuk menghindari nilai absolut pada deviasi rata-rata, maka digunakan variansi.
Variansi bersifat non-negatif dan bernilai nol hanya jika seluruh pengamatannya sama.
Variansi
Variansi Populasi
Variansi Sampel
Variansi Populasi
2 : Variansi PopulasiX : Nilai observasi dari populasi : Rata-rata hitung populasiN : jumlah observasi
Langkah-langkah:1. Mencari nilai Mean2. Cari perbedaan nilai antara masing-masing observasi
dengan rata-ratanya (Deviasi) lalu kuadratkan3. Jumlahkan hasil langkah kedua4. Lalu bagi dengan total observasi
Untuk populasi yang memiliki nilai mendekati nilai rata-rata maka variansi nya akan semakin kecil dan begitu pula sebaliknya.
Variansi Sampel
S2 : Variansi sampelX : Nilai tiap observasi pada sampel : Rata-rata sampeln : Jumlah observasi
Catatan: Penggunaan (n-1) di penyebut memberikan koreksi yang tepat untuk kecenderungan kesalahan pada komputasi. Karena penggunaan utama dari statistik sampel seperti adalah untuk memperkirakan parameter-parameter populasi seperti variansi populasi, (n-1) lebih disukai untuk menyatakan nilai n dalam mendefinisikan varians sampel.
Standard DeviationDeviasi Standarakar kuadrat dari variansi.Muncul untuk mengembalikan satuan unit variansi yang dikuadratkan. Sehingga Deviasi Standar memiliki unit yang sama dengan data.
Deviasi Standar
Deviasi Standar Populasi
Deviasi Standar Sampel
Deviasi Standar Populasi
Deviasi Standar Sampel
Penggunaan Deviasi StandarDalam ukuran dispersi dari sekumpulan data dari rata-rata, semakin menyebar datanya, makin tinggi nilai deviasinya. Dalam keuangan, deviasi standar mempengaruhi investor dalam berinvestasi.
Teorema Chebyshev
P.L. Chebyshev mengembangkan sebuah teorema yang memungkinkan kita menentukan proporsi minimal dari banyaknya nilai yang berada dalam jumlah deviasi standar spesifik rata-rata.
“Untuk sampel maupun populasi. Proporsi nilai yang berada dalam kisaran k deviasi standar rata-rata, paling sedikit adalah 1 – 1/k2,
dimana k adalah konstanta yang lebih besar dari 1”
Mean and Standard Deviation of Grouped DataArithmetic Mean : Sample MeanM : Titik tengah tiap kelasf : Frekuensi tiap kelasn : jumlah frekuensi
Deviasi Standars : Deviasi standar sampelM : Titik tengah kelasf : Frekuensi kelasn : jumlah sampel : Sample mean
Dot Plots1. Dot plot mengelompokkan data sekecil mungkin dan
identitas mengenai observasi individu tidak hilang
2. Untuk mengembangkan dot plot, setiap observasi hanya ditampilkan dengan titik sepanjang garis bilangan horizontal yang menunjukkan nilai yang mungkin dari data.
3. Jika terdapat hasil observasi identik atau berbeda sangat tipis untuk ditampilkan sendiri, maka titik ditumpuk diatas yang lain.
Dot plot memungkinkan kita untuk melihat bentuk distribusi, data dan nilai mengenai kecenderungan kelompok, serta observasi yang terbesar dan terkecil.
Contoh Dot PlotsDilaporkan dibawah ini adalah jumlah kendaraan yang dijual di 24 bulan terakhir di Smith Food Mercury Jeep, Inc. dan Brophy Honda Volkswagen di Kuala Lumpur, Malaysia.
Stem-and-Leaf Display
Stem-and-leaf adalah teknik statistik untuk menyajikan suatu set data. Setiap nilai numerik dibagi menjadi dua bagian. Angka utama bisa diibaratkan sebagai batang dan angka yang mengikuti diibaratkan sebagai daun. Batang terletak di sepanjang sumbu vertikal, dan nilai-nilai daun ditumpuk satu sama lain sepanjang sumbu horisontal.
Penggunaan distribusi frekuensi mempunyai beberapa kelemahan. Dua kelemahan untuk mengatur data ke dalam distribusi frekuensi:
1. Kita kehilangan identitas tepat dari setiap nilai2. Sulit untuk mengetahui bagaimana nilai-nilai dalam setiap kelas didistribusikan
Dengan penggunaan teknik stem-and-leaf, kerugian diatas bisa diatasi.
Contoh Stem-and-LeafTercantum dalam Tabel 4-1 adalah titik-titik iklan radio yang dibeli oleh masing-masing dari 45 anggota Greater Buffalo Automobile Dealer Association tahun lalu.
Aturlah data menjadi tampilan stem-and-leaf. Sekitar angka berapa kecenderungan orang mengiklankan produk? Titik paling sedikit yang dibeli oleh dealer? Titik terbesar yang dibeli?
Kuartil, desil, dan persentil
Kuartil membagi satu set observasi menjadi empat bagian sama besar
Desil membagi satu set observasi menjadi sepuluh bagian sama besar
Persentil membagi satu set observasi menjadi seratus bagian sama besar
Contoh PersentilTercantum di bawah ini adalah komisi yang diterima bulan lalu oleh sebuah sampel dari 15 pialang di Kantor Salomon Smith Barney's Oakland, California.
$2,038 $1,758 $1,721 $1,637 $2,097 $2,047 $2,205$2,287
$1,940 $2,311 $2,054 $2,406 $1,471 $1,460 $1,787
Cari median, kuartil pertama, dan kuartil ketiga dari komisi yang didapatkan
Langkah 1: Atur data dari yang terkecil sampai dengan yang terbesarLangkah 2: Hitunglah kuartil pertama dan ketiga. Cari L25 dan L75
menggunakan:
205,2$
721,1$
belas. keduadan keempat data pada
terletak ketiga kuartildan pertama kuartil itu, karenaOleh
12100
75)115( 4
100
25)115(
75
25
7525
L
L
LL
Box PlotBox plot adalah penampilan grafis berdasarkan kuartil yang membantu kita menggambarkan suatu data. Untuk membuat box plot, kita hanya membutuhkan lima statistik; nilai minimum, Q1, median, Q3, dan nilai maksimum.
Langkah 1: Buat skala yang sesuai sepanjang sumbu horisontal.
Langkah 2: Buatlah sebuah kotak yang dimulai pada Q1 (15 menit) dan berakhir di Q3 (22 menit). Di dalam kotak kita tempati garis vertikal untuk mewakili median (18 menit).
Langkah 3: Perpanjang garis horizontal dari kotak ke nilai minimum (13 menit) dan nilai maksimum (30 menit)
top related