lkp8 lab1 klp8

16
Lembar Kerja Pratikum 8 Hari/Tanggal : Selasa/15 April 2014 Lab : 1 Kelompok : 8 Anggota : - Rudi Hartomo (G64110013) - Weni Handayani (G64110058) - Albert Sebastian (G64110075) - M. Fuad Makarim (G64110113) 1. Buka fail iris.arff

Upload: weni-handayani

Post on 22-Jun-2015

251 views

Category:

Education


4 download

TRANSCRIPT

Page 1: Lkp8 lab1 klp8

Lembar Kerja Pratikum 8

Hari/Tanggal : Selasa/15 April 2014

Lab : 1

Kelompok : 8

Anggota : - Rudi Hartomo (G64110013)

- Weni Handayani (G64110058)

- Albert Sebastian (G64110075)

- M. Fuad Makarim (G64110113)

1. Buka fail iris.arff

Page 2: Lkp8 lab1 klp8

2. Lakukanlah klasifikasi dengan menggunakan J48 tree

a. Jelaskan hasil klasifikasinya

Persentase Data di klasifikasikan secara benar adalah 98% dan persentase data di

klasifikasikan secara tidak benar adalah 2%. Berdasarkan klasifikasi menggunakan J48

Tree, didapatkan hasil klasifikasinya seperti pada gambar 2.1.

Hasil klasifikasi pada class iris-setosa memiliki nilai yang sangat baik, karena hasil akurasi dari nilai precision, recall, dan F-Measure-nya mendekati 1 (satu) serta akurasi dari True Positive (TP)-nya bernilai 1 (satu) dan False Positive (FP) Rate-nya bernilai 0 (nol).

Hasil klasifikasi pada class iris-versicolor memiliki nilai yang baik, karena hasil akurasi dari nilai precision, recall, dan F-Measure-nya mendekati 1 (satu) serta akurasi dari True Positive (TP)-nya bernilai 0,98 dan False Positive (FP) Rate-nya bernilai 0,02.

Hasil klasifikasi pada class iris-virginica memiliki nilai yang baik, karena hasil akurasi dari nilai precision, recall, dan F-Measure-nya mendekati 1 (satu) serta True Positive (TP)-nya bernilai 0,96 dan False Positive (FP) Rate-nya bernilai 0,01.

Jadi akurasi data iris dapat dikatakan bagus, berdasarkan weighted average-nya.

Gambar 2.1 Hasil Klasifikasi

Page 3: Lkp8 lab1 klp8

b. Jelaskan hasil dari tree yang terbentuk

Gambar 2.2 Visualisasi Tree

Hasil tree dari klasifikasi data iris.arff dapat dilihat pada gambar 2.2 di atas.

Petalwidth sebagai root, kemudian nodes-nya yaitu petalwidth, petallength.

Terdapat 5 leaf pada tree di atas, yaitu iris-setosa (50.0), iris-versicolor (48.0/1.0), iris-

virginica (3.0), iris-versicolor (3.0/1.0), dan iris-virginica (46.0/1.0).

Berdasarkan tree yang dibentuk, terdapat :

a. 50 instance yang memiliki petalwidth <= 0,6 diklasifikasikan sebagai iris-

setosa.

b. 46 instance yang petalwidth-nya > 1,7 diklasifikasikan sebagai iris-virginica.

Namun terdapat 1 instance yang salah dalam pengklasifikasiannya.

c. 48 instance yang petallength-nya <=4,9 diklasifikasikan sebagai iris-versicolor

dan petalwidth-nya <=1,7. Namun terdapat 1 instance yang salah dalam

pengklasifikasiannya.

Page 4: Lkp8 lab1 klp8

d. 3 instance yang petalwidth-nya <=1,5 diklasifikasikan sebagai iris-virginica dan

petalwidth-nyam >4,9.

e. 3 instance yang petalwidth-nya >1,5 diklasifikasikan sebagai iris-versicolor,

dan 1 instance yang salah dalam pengklasifikasiannya, serta petalwidth-nyam

>4,9.

c. Jelaskan hasil dari Confusion Matrix dan visualisasi classifier errors

(i) Confusion Matrix

Berdasarkan hasil confusion matrix pada klasifikasi data iris.arff dapat disimpulkan bahwa :

- a di identifikasi sebagai class iris-setosa, karena a memiliki nilai 50, sementara b dan c bernilai 0 (nol).

- Sedangkan untuk b dan c terdapat kesalahan data. Karena pada class iris-versicolor a bernilai nol, b bernilai 49, dan c bernilai 1. Pada data iris-virginica yaitu a bernilai 0, b bernilai 2, dan c bernilai 48.

Gambar 2.3 Confusion matrix

(ii) Visualisasi Clasifier errors

Terdapat visualisasi kesalahan pada pengklasifikasian data iris.arff tersebut.

Terlihat pada gambar 2.4 bahwa ada kesalahan, yaitu pada class iris-versicolor (berwarna

merah) dan class iris-virginica (berwarna hijau).

Page 5: Lkp8 lab1 klp8

Gambar 2.4 Visualisasi Clasifier errors

Page 6: Lkp8 lab1 klp8

3. Lakukanlah klasifikasi dengan menggunakan Ibk

a. Jelaskan hasil klasifikasinya

Page 7: Lkp8 lab1 klp8

Dengan menggunakan klasifikasi ibk dengan jumlah KNN = 3 didapatkan akurasi klasifikasi sebesar 96.6667% atau 145 instance dari 150 instance.

- Class iris-setosa sudah benar dalam klasifikasi, ditunjukkan denga true-positif bernilia 1 (100%) dan false positif bernilai 0(0%) atau semua instancenya memang masuk dalam class iris-setosa - Class iris-versicolor terdapat instance yang dianggap class tersebut tetapi sebenarnya ukan terdapat 3 % , sedangkan instance yang memang class iris-versicolor sebesar 96%, dan - Class iris-virginica terdapat instance yang dianggap class tersebut tetapi sebenarnya ukan terdapat 2 % , sedangkan instance yang memang class iris-versicolor sebesar 94%.

Namun hasil klasifikasi ini sudah tergolong baik karena Precision, Recall, F-Measure, Roc Area sumuanya mendekati nilai 1.

b. Jelaskan hasil dari Confusion Matrix dan visualisasi classifier errors

Sebanyak 50 instance masuk class a atau iris-setosa, sebanyak 48 instance masuk ke class b atau iris-versicolor, 47 instance masuk ke class c atau iris-virginica, sebanyak 3 instance masuk class b seharusnya class c dan 2 instance seharusnya masuk class b tetapi masuk class c

Page 8: Lkp8 lab1 klp8

Gambar diatas menunjukkan adanya instance yang salah klasifikasi, hal ini ditunjukkan dengan tanda kotak pada hasil visualisasi

4. Apakah perbedaan klasifikasi J48 tree dengan Ibk? Jelaskan secara umum!

J-48 adalah teknik klasifikasi unsupervised sedangkan ibk adalah teknik klasifikasi supervised.

Perbedaan antara supervised learning dengan unsupervised learning adalah pada supervised learning bertujuan untuk menemukan pola baru dalam data dengan menghubungkan pola data yang sudah ada dengan data yang baru. Sedangkan pada unsupervised learning, data belum memiliki pola apapun, dan tujuan unsupervised learning untuk menemukan pola dalam sebuah data.

Tujuan dari algoritma ibk/KNN adalah untuk mengklasifikasi objek baru berdasarkan atribut dan training samples. Dimana hasil dari sampel uji yang baru diklasifikasikan berdasarkan mayoritas dari kategori pada k-NN. Sedangkan tujuan dari algoritma j-48 adalah untuk menentukan pola yang sebelumnya tidak terlihat yang dapat dijadika pola untuk menentukan kelas.

Page 9: Lkp8 lab1 klp8

5. Diketahui suatu dataset seperti berikut:

Dengan menggunakan KNN (K=3 dan fungsi jarak euclidian), tentukanlah class

dari

a. X1= 80.0 dan X2=92.0

b. X1=70.0 dan X2=83.0

c. X1=86.0 dan X2=85.0

d. X1=76.0 dan X2=91.0

e. X1=61.0 dan X2=82.0

f. X1=83.0 dan X2=69.0

Page 10: Lkp8 lab1 klp8

Berikut langkah-langkah KNN menggunakan WEKA.

1. Buat datauji.arff dan dataset.arff

Page 11: Lkp8 lab1 klp8

2. Buka dataset.arff dengan weka, pilih classify, pilih Clissifiernya. Pilih Classifier IbK dengan KNN=3.

Page 12: Lkp8 lab1 klp8
Page 13: Lkp8 lab1 klp8

3. Klik supply test set sebagai test option. Lalu open datauji.arff

4. Close, lalu klik Start.5. Klik kanan pada hasil pengujian lalu pilih Visualize Classifier Error kemudian save.

6. Kembali ke Weka GUI Chooser, pilih tools>ArffViewer> lalu pilih file hasil save tadi.

Page 14: Lkp8 lab1 klp8

7. Selesai.

Jadi, Berdasarkan perhitungan KNN dengan menggunakan WEKA diperoleh Hasil KNN

sebagai berikut:

a. X1= 80.0 dan X2=92.0 : No

b. X1=70.0 dan X2=83.0 : Yes

c. X1=86.0 dan X2=85.0 : No

d. X1=76.0 dan X2=91.0 : No

e. X1=61.0 dan X2=82.0 : No

f. X1=83.0 dan X2=69.0 : Yes