nonpar_tgs

9
Sulis Harmamik 0710953004 Tugas Statistika Non Parametrik Dosen : Adji Achmad Rinaldo Fernandes, S.Si., M.Sc. 1. Cara-cara menguji data menyebar normal dan tidak normal : 1. Anderson-Darling test Metode ini termasuk dalam salah satu uji kenormalan yang mengukur penyimpangan dari empirical distribution function (EDF) terhadap cumulative distribution function (CDF) yang diasumsikan, dalam hal ini adalah distribusi normal. Bila ada n pengamatan diurutkan x( i ), maka EDF F n (x) didefinisikan sebagai: F n (x) = Nx ( i ) ≤x ¿ ¿ n , i= 1, 2, 3, …, n dimana N(x(i) x ) adalah jumlah pengamatan berurut yang kurang dari atau sama dengan x.Untuk n pengamatan diurutkan x(i), statistik uji Anderson-Darling adalah: A 2 = - n - 1 n i=1 n ( 2 i1 ) {lnF o (x (i) ) + ln [1-F o (x (n+1-i) )]} Nilai A 2 hasil perhitungan dibandingkan nilai kritis untuk α sebesar 1%, 5%, dan 10% dengan scaling factor (1 + 4/n – 25/n2), dimana n adalah jumlah pengamatan. Untuk pengujian dengan metode Anderson-Darling, penulis memakai software Minitab yang akan memberikan informasi mengenai nilai A 2 hitung dan p-value. Cara Running Program (Minitab) : stat – basic statistics – normality test > masukkan variabel yang ingin diuji kenormalannya (ex : X1, X2, dll), pada test for normality pilih yang Anderson Darling. Apabila output perhitungan menghasilkan p-value yang sangat kecil yaitu kurang dari 0.005 atau lebih kecil dari α = 5%, maka data tidak mengikuti sebaran normal. 2. Kolmogorov-Smirnov test Metode Kolmogorov-Smirnov, yang merupakan uji kenormalan paling populer, didasarkan pada nilai D yang didefinisikan sebagai berikut: D = sup x [| Fn ( x ) Fo ( x) |] 1 | Page

Upload: robby-kurniawan

Post on 04-Jul-2015

356 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: nonpar_tgs

Sulis Harmamik0710953004Tugas Statistika Non ParametrikDosen : Adji Achmad Rinaldo Fernandes, S.Si., M.Sc.

1. Cara-cara menguji data menyebar normal dan tidak normal :1. Anderson-Darling test

Metode ini termasuk dalam salah satu uji kenormalan yang mengukur penyimpangan dari empirical distribution function (EDF) terhadap cumulative distribution function (CDF) yang diasumsikan, dalam hal ini adalah distribusi normal. Bila ada n pengamatan diurutkan x(i), maka EDF Fn(x) didefinisikan sebagai:

Fn(x) = Nx( i)≤ x ¿ ¿n , i= 1, 2, 3, …, n

dimana N(x(i) ≤ x) adalah jumlah pengamatan berurut yang kurang dari atau sama dengan x.Untuk n pengamatan diurutkan x(i), statistik uji Anderson-Darling adalah:

A2 = - n - 1n

∑i=1

n

(2 i−1) {lnFo(x(i)) + ln [1-Fo(x(n+1-i))]}

Nilai A2 hasil perhitungan dibandingkan nilai kritis untuk α sebesar 1%, 5%, dan 10% dengan scaling factor (1 + 4/n – 25/n2), dimana n adalah jumlah pengamatan. Untuk pengujian dengan metode Anderson-Darling, penulis memakai software Minitab yang akan memberikan informasi mengenai nilai A2 hitung dan p-value.Cara Running Program (Minitab) :

stat – basic statistics – normality test > masukkan variabel yang ingin diuji kenormalannya (ex : X1, X2, dll), pada test for normality pilih yang Anderson Darling.

Apabila output perhitungan menghasilkan p-value yang sangat kecil yaitu kurang dari 0.005 atau lebih kecil dari α = 5%, maka data tidak mengikuti sebaran normal.

2. Kolmogorov-Smirnov testMetode Kolmogorov-Smirnov, yang merupakan uji kenormalan paling populer,

didasarkan pada nilai D yang didefinisikan sebagai berikut:

D = supx [|Fn ( x )−Fo(x)|]D adalah nilai deviasi absolut maksimum antara Fn (x) dan F0 (x). Nilai D ini selanjutnya dibandingkan dengan nilai D kritis untuk ukuran tes α. Software Minitab dapat dipakai untuk melakukan pengujian kenormalan data. Output dari Minitab memberikan nilai statistik D, yang dituliskan sebagai KS, dan p-value.

Langkah-langkah dengan software SPSS :Analyze ⇒ descriptive statistic ⇒ ExplorerPengisian:

Dependent List : diisi Factors List : diisi List cases by : kosongkan

Pilih statistic

1 | P a g e

Page 2: nonpar_tgs

Pengisian: Centang (v) Descriptive

Klik ContinueKlik PlotsPengisian:

Aktifkan Pilihan Normality Plots with test Pilih power estimation (menguji kesamaan varians)

Klik Continue kemudian OK.

Jika hasil output nilai signifikan lebih besar dari 0,05 maka data berdistribusi normal, sedangkan nilai signifikan lebih kecil dari 0,05 maka data tidak berdistribusi normal.

3. Jarque-Bera (JB)Untuk mengetahui data normal atau tidak dapat digunakan uji statistik Jarque-Bera

(JB). Data disebut normal apabila nilai Jarque-Bera lebih rendah atau sama dengan nilai kritis tabel Chie Square dengan derajat bebas 2, α= 1% (9,2). Rumus perhitungannya adalah sebagai berikut:

JB = n |S 26

+(k−3 ) 2

24 |Jika ternyata Jarque-Bera lebih besar dari tabel berarti data tidak normal. Tahap uji statistik Jarque-Bera dengan menggunakan software Eviews secara ringkas adalah sebagai berikut :a. Formulasi hipotesis

Ho = distribusi ut normalH1 ≠ distribusi ut normal

b. Menentukan tingkat signifikansi (α)c. Menentukan kriteria pengujian

Ho ditolak jika prob. JB < α , Ho diterima jika prob. JB > αd. kesimpulan

4. Skewness dan KurtosisUji normalitas dengan Skewness dan Kurtosis memberikan kelebihan tersendiri, yaitu

bahwa akan diketahui grafik normalitas menceng ke kanan atau ke kiri, terlalu datar atau mengumpul di tengah. Oleh karena itu, uji normalitas dengan Skewness dan Kurtosis juga sering disebut dengan ukuran kemencengan data. Skewness berkaitan dengan lebar kurve, sedangkan Kurtosis berkaitan dengan tinggi kurve.

Pengujian dengan SPSS dilakukan dengan menu Analyze, lalu klik Descriptive Statistics, pilih menu Descriptives. Data yang akan diuji normalitasnya dipindah dari kotak kiri ke kanan, lalu tekan Options. Klik pada Distribution yaitu Skewness dan Kurtosis, tekan Continue, lalu tekan OK.

Pada output akan tampak nilai Statistic Skewness dan Statistic Kurtosis. Lalu hitunglah Zskew dengan persamaan Statistik : (√6/ N ), dengan N adalah jumlah observasi. Persamaan yang sama juga dipakai untuk menghitung Zkurt (√24 /N ). Misalnya nilai statistik skewness adalah 0,5 dan statistic kurtosis adalah 0,9; dan jumlah data adalah 100, maka nilai Zskew adalah sebesar 2,041 dan nliai Zkurt adalah sebesar 3,674. Nilai tersebut kemudian

2 | P a g e

Page 3: nonpar_tgs

dibandingkan dengan + 1,96 pada signifikansi 0,05 dan sebesar + 2,58 pada signifikansi 0,01. Jadi tampak bahwa Zskew (2,041 > 1,96 dan Zkurt (3,674) > 1,96.

Syarat data yang normal adalah nilai Zskew dan Zkurt < + 1,96 (signifikansi 0,05). Jadi data di atas dinyatakan tidak normal karena Zkurt tidak memenuhi persyaratan, baik pada signifikansi 0,05 maupun signifikansi 0,01. Kelebihan dari uji Skewness dan Kurtosis adalah bahwa kita dapat mengetahui kemencengan data, di mana data yang normal akan menyerupai bentuk lonceng. Kemungkinan yang ada adalah menceng ke kiri, jika nilai Zskew positif dan di atas 1,96; atau menceng ke kanan jika Zskew bernilai negatif dan di bawah 1,96. Berdasarkan nilai Kurtosis maka dapat ditentukan bahwa data mempunyai nilai puncak yang terlalu tinggi jika Zkurt bernilai positif dan di atas 1,96; jika nilai puncak tidak ada atau data relatif datar maka nilai Zkurt adalah negatif dan di bawah 1,96.

5. Pearson Chi-square testMetode Pearson Chi-square termasuk uji kenormalan yang berbasis statistik uji X2.

Statistik X2 diberikan oleh persamaan:

dimana Ei adalah frekuensi pengamatan sampel yang diharapkan berada dalam kelas i bila frekuensi sampel dalam setiap kelas interval mengikuti distribusi yang diduga. Sementara, Oi frekuensi pengamatan yang terjadi dalam kelas i. Bila H0 benar, distribusi yang membatasi statistik uji X2 adalah distribusi χ2 dengan derajat kebebasan (k-c-1), dimana k adalah jumlah kelas interval yang tidak kosong dan c adalah jumlah parameter yang akan diestimasi. Dalam eksperimen ini, penulis memakai c = 2 karena ada dua parameter yang akan diestimasi, yaitu mean dan standar deviasi dari distribusi yang diduga. Uji kenormalan dengan metode Pearson Chi-square dapat dikerjakan dengan bantuan software Microsoft Excel.

2. Tujuan utama dari taransformasi data adalah untuk mengubah skala pengukuran data asli menjadi bentuk lain sehingga data dapat memenuhi asumsi-asumsi yang mendasari analisis ragam. Yang perlu diperhatikan adalah data yang ditampilkan pada laporan tetap data aslinya sedangkan data transformasi hanya untuk membantu untuk membuat data asli memenuhi asumsi-asumsi analisis ragam dan biasanya diletakkan di bagian lampiran.Tiga jenis transformasi data yang sering digunakan yaitu :a) Transformasi akar, b) Tansformasi Logaritma, dan c) Transformasi Arcsin.

a) Transformasi akarBeberapa buku ada yang menyebutnya dengan transformasi akar kuadrat. Transformasi

akar digunakan apabila data anda tidak memenuhi asumsi kehomogenen ragam. Dengan kata lain transformasi akar berfungsi untuk membuat ragam menjadi homogen. Kalau X adalah data asli, maka X’ (X aksen) adalah data hasil transformasi anda. Jadi X = X’.

Apabila data asli menunjukkan sebaran nilai antara 0–10, maka gunakan transfromasi akar X + 0,5. Dan apabila nilai ragam data lebih kecil gunakan transformasi akar X + 1. Transformasi akar ini dapat juga digunakan untuk data persentase apabila nilainya antara 0–

3 | P a g e

Page 4: nonpar_tgs

30%. Jika kebanyakan nilainya adalah kecil, khususnya jika ada nilai 0, maka digunakan transformasi akar X + 0,5 daripada akar X.

Jenis transformasi ini sering digunakan pada data-data hasil pengamatan mengenai banyaknya tanaman yang abnormal, banyaknya serangga yang tertangkap oleh perangkap. Data-data yang seperti ini umumnya menyebar mengikuti pola sebaran poisson. Sebaran poisson ini adalah sebaran dari data percobaan yang menghasilkan peubah acak X yang bernilai numerik misalnya banyak tikus sawah per hektar, banyaknya bakteri dalam suatu kultur biakan, banyaknya tanaman yang abnormal, dll, yang biasanya melibatkan jumlah n yang besar. Sebaran poisson dapat juga diartikan sebagai sebaran peluang yang kemungkinan terjadinya suatu kejadian kecil sekali terjadi atau faktor kebetulannya sangat besar.

Contoh penggunaan transformasi akar ini merupakan data hasil pengamatan dari percobaan pengendalian Helicoverta armigera dengan parasit Trichogrammatoide armigera pada tanaman kapas. Hasil percobaan berupa populasi H. armigera pada tanaman umur 90 hari seperti pada tabel berikut ini :

Perlakuan I II III IV Total Rerata sA 3 5 3 4 15 3.75 0.96B 2 3 2 3 10 2.50 0.58C 4 5 6 7 22 5.50 1.29D 5 7 8 9 29 7.25 1.71

Total 14 20 19 23 76 - -Dan hasil analisis ragam data asli adalah berikut ini :

SK db JK KT F hitung F. tabel 5% F. tabel 1%Kelompok 3 10.50 3.50 4.50* 3.86 6.99Perlakuan 3 51.50 17.17 22.07**

Galat 9 7.00 0.78Total 15 69.00

Hasil pengujian BNT5% terhadap data asli sebagai berikut:

Perlakuan Rata-rataA 3.75aB 2.50aC 5.50bD 7.25c

BNT 5% 1.41

Kemudian lakukan transformasi akar dengan rumus akar X + 0,5. Hal ini karena sebaran data tersebut kurang dari 10. Misalnya untuk data perlakuan A kelompok I, X = 3, maka hasil transformasinya adalah akar 3 + 0,5 = 3,5 = 1,87. Dan selanjutnya hingga data pada perlakuan D kelompok IV. Berikut ini adalah data hasil transformasi akar dari data asli:

Perlakuan I II III IV Total Rerata sA 1.87 2.35 1.87 2.12 8.21 2.05 0.23B 1.58 1.87 1.58 1.87 6.90 1.73 0.17C 2.12 2.35 2.55 2.74 9.75 2.44 0.27

4 | P a g e

Page 5: nonpar_tgs

D 2.35 2.74 2.92 3.08 11.08 2.77 0.32Total 7.92 9.30 8.92 9.81 35.95 - -

Dan hasil analisis ragam dari data transformasi adalah berikut ini :

SK db JK KT F hitung F. tabel 5% F. tabel 1%Kelompok 3 0.4817 0.1606 5.34* 3.86 6.99Perlakuan 3 2.4805 0.8268 27.52**

Galat 9 0.2704 0.0300Total 15 3.2326

Hasil pengujian BNT5% terhadap data transformasi sebagai berikut :

Perlakuan Rata-rataA 2.25bB 1.73aC 2.44cD 2.77d

BNT 5% 0.28

Hasil analisis pengujian dari kedua data tersebut seperti berikut ini :

Data asli Data transformasiPerlakuan Rata-rata Perlakuan Rata-rata

A 3.75a A 2.25bB 2.50a B 1.73aC 5.50b C 2.44cD 7.25c D 2.77d

BNT 5% 1.41 BNT 5% 0.28

Dari tabel di atas terlihat adanya perbedaan hasil pengujian antara data asli dengan data transformasi dimana perlakuan A dan B yang tadinya tidak berbeda nyata tetapi setelah data memenuhi asumsi analisis ragam terlihat semua perlakuan berbeda nyata satu sama lainnya.

b) Tansformasi LogaritmaBeberapa buku ada yang menyebutnya dengan transformasi Log X. Transformasi

Logaritma digunakan apabila data tidak memenuhi asumsi pengaruh aditif. Kalau X adalah data asli anda, maka X’ (X aksen) adalah data hasil transformasi dimana X’ = Log X. Jadi X = X’. Ada beberapa hal yang perlu diperhatikan dalam penggunaan transformasi logaritma ini yaitu : Apabila data asli menunjukkan sebaran nilai kurang dari 10 atau nilai mendekati nol,

maka gunakan transfromasi log X + 1. Apabila data banyak mengandung nilai nol, maka sebaiknya gunakan transformasi yang

lain, misalnya transformasi akar. Apabila data banyak mendekati nol (misalnya bilangan desimal), maka semua data

dikalikan 10 sebelum dijadikan ke logaritma. Jadi X’ = log (10X). Misalnya X = 0,12 setelah di taransformasikan X’ akan menjadi X’ = log (10 x 0,12) = 0,079.

5 | P a g e

Page 6: nonpar_tgs

c) Transformasi Arcsin. Transformasi Arcsin digunakan apabila data dinyatakan dalam bentuk persentase atau

proporsi. Umumnya data yang demikian mempunyai sebaran binomial. Bentuk transformasi arcsin ini biasa disebut juga transformasi kebalikan sinus atau transformasi arcus sinus. Kalau X adalah data asli, maka X’ (X aksen) adalah data hasil transformasi dimana X’ = Arcsin X. Jadi X = X’. Namun, data dalam bentuk persentase tidak mesti harus menggunakan transformasi arcsin.

Ada beberapa hal yang perlu anda perhatikan dalam penggunaan transformasi arcsin ini yaitu :

Apabila data asli menunjukkan sebaran nilai antara 30% - 70%, tidak memerlukan transformasi.

Apabila data asli menunjukkan sebaran nilai antara 0% - 30% dan 70% - 100%, maka lakukan transformasi arcsin.

Apabila data banyak yang bernilai nol, maka gunakan transformasi arcsin akar (% + 0,5).

3. Cara menguji 1 populasi, 2 populasi, dan > 2 populasi adalah : 1 populasi :

Digunakan jika peneliti merasa tertarik untuk menguji hipotesis keseragaman variansi dari suatu populasi atau mungkin dalam membandingkan keseragaman suatu populasi dengan populasi yang lain. Statistik yang digunakan adalah Chi-Square :

X2 = (n−1 ) S 2

σ 2, dengan derajad kebebasan (v) = n-1

dan daerah kritisnya : X2 < X2

1-α :v untuk hipotesis alternatif α 2 < α 2o

X2 > X2α ;v untuk hipotesis alternatif α 2 > α 2o

X2 < X21-α /¿2:v dan X2 > X2

1-α /¿2:v untuk hipotesis alternatif α 2 ≠ α 2o

2 populasi :Untuk menguji dua variansi, maka yang diperhatikan adalah rasio dari variansi dua

populasi yang independen yang diasumsikan berdistribusi normal dengan standard deviasi yang berdistribusi Chi-Square. Perbandingan ini akan berdistribusi Fisher (f) = (S2

1) / (S2 2) dengan derajat kebabasan ν1 = n1 – 1 dan ν2 = n2 – 1 dan daerah kritisnya :

f2 < f21-α ;(v1,v2) untuk hipotesis alternatif α 2

1 < α 2

2

f2 > f2α ;(v1,v2) untuk hipotesis alternatif α 21 > α 2

2

f2 < f21-α ;(v1,v2) dan f2 > f2α ;(v1,v2) untuk hipotesis alternatif α 2

B ≠ α 2

b

> 2 populasi :

6 | P a g e