analisis data iklim indonesia menggunakan aplikasi weka

12
Aswendy, Analisis Data ... 217 ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA DENGAN METODE KLASIFIKSI NAIVE BAYES Aswendy Jurusan Teknik Informatika, Universitas Gunadarma [email protected] Abstrak Penulisan ini membahas tentang analisis data iklim Indonesia menggunakan aplikasi weka dengan metode naive bayes.Naive Bayes merupakan metode klasifikasi dalam data mining yang mengklasifikasikan statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Data mining merupakan serangkaian proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Dalam data mining terdapat banyak teknik dalam pengerjaannya, diantaranya yaitu algoritma naïve bayes, decision tree, jaringan saraf tiruan dan masih banyak lainnya. Proses analisis ini menggunakan aplikasi weka yang merupakan salah satu aplikasi pengolah data mining dan merupakan suatu perangkat lunak yang berisikan koleksi dari perangkat visualisasi dan algoritma untuk analisis data dan predictive modelling, termasuk dengan tampilan antar muka yang mudah diakses oleh pengguna. Dari hasil analisis sangat diharapkan dapat membantu memberi peringatan atas iklim ekstrim yang ada di Indonesia. Kata kunci : Analisis, Data Iklim Indonesia, Aplikasi Weka, Klasifikasi Naive Bayes INDONESIAN CLIMATE DATA ANALYSIS USING WEKA APPLICATIONAND NAÏVE BAYES CLASSIFICATION METHOD Abstract This research discussed Indonesian climatic data analysis using weka application with Naive Bayes method. Naive Bayes is a classification method in data mining that classifies statistics that used to predict membership probability of a class. Data mining is a series of processes to obtain useful information from large database. Data mining can also define as the extraction of new information from a piece of large database that can help us in decision-making. There are many techniques in doing data mining, such as naïve bayes algorithm, decision tree, artificial neural network, and many more. This analysis process using wekaapplication, which is one of data mining processor application, software that contains collections of visualization tools, algorithm for data analysis and predictive modeling, including an simple interface display for the users easy accessibility. The analysis result expected to be an early warning upon the extreme climate in Indonesia. Keywords : Analysis, Data climate Indonesia, WekaApplication, Naive BayesClassification

Upload: others

Post on 25-Oct-2021

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

Aswendy, Analisis Data ... 217

ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA DENGAN METODE KLASIFIKSI NAIVE BAYES

Aswendy

Jurusan Teknik Informatika, Universitas Gunadarma

[email protected]

Abstrak

Penulisan ini membahas tentang analisis data iklim Indonesia menggunakan aplikasi weka dengan metode naive bayes.Naive Bayes merupakan metode klasifikasi dalam data mining yang mengklasifikasikan statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Data mining merupakan serangkaian proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Dalam data mining terdapat banyak teknik dalam pengerjaannya, diantaranya yaitu algoritma naïve bayes, decision tree, jaringan saraf tiruan dan masih banyak lainnya. Proses analisis ini menggunakan aplikasi weka yang merupakan salah satu aplikasi pengolah data mining dan merupakan suatu perangkat lunak yang berisikan koleksi dari perangkat visualisasi dan algoritma untuk analisis data dan predictive modelling, termasuk dengan tampilan antar muka yang mudah diakses oleh pengguna. Dari hasil analisis sangat diharapkan dapat membantu memberi peringatan atas iklim ekstrim yang ada di Indonesia. Kata kunci : Analisis, Data Iklim Indonesia, Aplikasi Weka, Klasifikasi Naive Bayes

INDONESIAN CLIMATE DATA ANALYSIS USING WEKA APPLICATIONAND NAÏVE BAYES CLASSIFICATION METHOD

Abstract

This research discussed Indonesian climatic data analysis using weka application with Naive Bayes method. Naive Bayes is a classification method in data mining that classifies statistics that used to predict membership probability of a class. Data mining is a series of processes to obtain useful information from large database. Data mining can also define as the extraction of new information from a piece of large database that can help us in decision-making. There are many techniques in doing data mining, such as naïve bayes algorithm, decision tree, artificial neural network, and many more. This analysis process using wekaapplication, which is one of data mining processor application, software that contains collections of visualization tools, algorithm for data analysis and predictive modeling, including an simple interface display for the users easy accessibility. The analysis result expected to be an early warning upon the extreme climate in Indonesia.

Keywords : Analysis, Data climate Indonesia, WekaApplication, Naive BayesClassification

Page 2: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

218 Jurnal Teknologi Rekayasa Volume 21 No.3, Desember 2016

PENDAHULUAN

Data mining merupakan serang-kaian proses untuk mendapatkan infor-masi yang berguna dari gudang basis data yang besar [6]. Data mining juga dapat diartikan sebagai pengekstrakan infor-masi baru yang diambil dari bongkahan data besar yang membantu dalam pe-ngambilan keputusan. Dalam data mining terdapat banyak teknik dalam pengerja-annya, diantaranya yaitu algoritma naïve bayes, decision tree, jaringan saraf tiruan dan masih banyak lainnya.

Tehnik data mining secara garis besar dapat dibagi dalam dua kelompok yaitu verifikasi dan discovery. Metode verifikasi umumnya meliputi tehnik-tehnik statistik seperti goodness of fit, dan analisis variansi. Metode discovery lebih lanjut dapat dibagi atas model prediktif dan model deskriptif. Tehnik prediktif melakukan prediksi terhadap data dengan menggunakan hasil-hasil yang telah diketahui dari data yang berbeda. Model ini dapat dibuat berdasarkan penggunaan data historis lain. Sementara itu, model deskriptif bertujuan mengidentifikasi pola-pola atau hubungan antar data dan memberikan cara untuk mengeksplorasi karakteristik data yang diselidiki [9].

Berbagai tools komersial maupun non-komersial beredar dan digunakan untuk berbagai tujuan yang berkaitan dengan data mining. Salah satunya adalah WEKA, yang merupakan alat bantu dalam data mining, terutama dalam penerapan untuk menyelesaikan masalah klasifikasi.

Sebagian besar penelitian terbaru pada data spasial menggunakan tehnik klasifikasi dikarenakan oleh sifat dari data tersebut, algoritma yang digunakan dalam penelitian yakni algoritma naive bayes. Algoritma Naive Bayes adalah pengkla-sifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keang-gotaan suatu class. Naive Bayes didasar-kan pada teorema Bayes yang memiliki

kemampuan klasifikasi serupa dengan decision tree dan neural network. Naive Bayes terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar [13].

Berdasarkan uraian diatas, maka akan dilakukan penelitian tentang klasifi-kasi data dengan mengimplementasikan algoritma naivebayes pada pengolahan data iklim seluruh wilayah indonesia. METODE PENELITIAN

Merupakan sebuah metoda klasi-fikasi dengan menggunakan metode probabilitas dan statistik, yaitu mem-prediksi peluang dimasa depan berdasar-kan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes.

Salah satutugas Data Mining adalah klasifikasi data, yaitu memetakan (meng-klasifikasikan) data kedalam satu atau beberapa kelas yang sudah didefinisikan sebelumnya.Salah satu metoda dalam klasifikasi data adalahnaive bayes.

Naïve Bayes merupakan salah satu metode machine learning yang meng-gunakan perhitungan probabilitas. Algo-ritma ini memanfaatkan metode proba-bilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya. Dasar dari teorema naïve bayes yang dipakai dalam pemrograman adalah rumus Bayes: Dasar dari Naïve Bayes yang dipakai dalam pemrograman adalah rumus Bayes: P (A|B) = (P(B|A) * P(A))/P(B) ............ (1) Peluang kejadian A sebagai B ditentukan dari peluang B saat A, peluang A, dan peluang B. Pada pengaplikasiannya nanti rumus ini berubah menjadi : P(Ci|D) = (P(D|Ci)*P(Ci)) / P(D) ......... (2)

Page 3: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

Aswendy, Analisis Data ... 219

Naïve Bayes Classifier atau bisa disebut sebagai Multinomial Naïve Bayes merupakan model penyederhanaan dari Metoda Bayes yang cocok dalam pengklasifikasian teks atau dokumen. Persamaannya adalah: VMAP = arg max P(Vj | a1 , a2 ,.......an) ...... (3) Menurut persamaan (3), maka persamaan (1) dapat ditulis:

P(a1, a2,.......an) konstan, sehingga dapat dihilangkan menjadi

Keterangan :

Dimana untuk: • P(vj) : Probabilitas setiap dokumen

terhadap sekumpulan dokumen. • P(wk|vj) : Probabilitas kemunculan

kata wk pada suatu dokumen dengan kategori class vj

• |docs| : Frekuensi dokumen pada setiap kategori.

• |Contoh| : Jumlah dokumen yang ada • Nk : Frekuensi kata ke-k pada setiap

Kategori • Kosakata : Jumlah kata pada

dokumen test.

Pada persamaan (8) terdapat suatu penambahan 1 pada pembilang, hal ini dilakukan untuk mengantisipasi jika terdapat suatu kata pada dokumen uji

yang tidak ada pada setiap dokumen data training. Cara kerja Navie Bayes Classifier melalui dua tahapan, yaitu: 1. Learning (Pembelajaran)

Naïve Bayes adalah suatu metoda yang termasuk kedalam unsupervised lear-ning, maka akan dibutuhkan penge-tahuan awal untuk dapat mengambil keputusan. Langkah-langkah ; • Step 1 : Bentuk vocabulary pada

setiap dokumen data BMKG • Step 2 : Hitung probabilitas pada

setiap kategori P(vj) Step 3 : Tentukan frekuensi setiap kata wk pada setiap kategori P(wk|vj).

2. Classify (Pengklasifikasian) • Step 1: Hitung P(vj)II P(wk|vj)

untuk setiap kategori • Step 2: Tentukan kategori dengan

nilai P(vj)IIP(wk|vi) maksimal. Pada tahap pre-processing ini data

masih berekstensi .xlsx, data .xlsx ini didapat dari BMKG dan masih berda-sarkan stasiun per provinsi. Data yang didapat dari BMKG kemudian di ga-bungkan menjadi satu data dan kemudian diubah menjadi data yang berekstensi .csv yang selanjutnya dapat diproses pada tahap uji coba. Gambar 1 memperlihatkan data yang didapat dari BMKG terdapat field-field.

Field terdiri dari : nama_provinsi, kd_provinsi_nama_stasiun, WMO_ID, tanggal, suhu_minimum, suhu_maksimum, suhu_rata-rata, kelembaban rata-rata, curah_hujan, serta lama_penyinaran.

Pada tahap pre-procesing ini data yang digabungkan secara manual serta setiap field harus didalam satu cell dan dibatsi dengan“, dan _”agar dapat dilanjutkan pada tahap uji coba serta dapat diinput kedalam WEKA.

Page 4: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

220 Jurnal Teknologi Rekayasa Volume 21 No.3, Desember 2016

Gambar 1. Data BMKG

HASIL DAN PEMBAHASAN

Data yang diperoleh melalui Badan Meteorologi, Klimatologi dan Geofisika dapat diakses melalui website BMKG http://dataonline.bmkg.go.id/data_iklim..

Proses mining menggunakan apli-kasi weka perlu dilakukan tranformasi karena weka hanyadapatmembaca file yang memiliki format .csv, sedangkan data BMKG yang diunduh berformat .xlsx. Maka perlu dilakukan transformasi data, agar proses mining dapat berjalan dengan lancar. Mining merupakan proses mencari sebuah informasi yang terkan-dung dalam sebuah kumpulan data yang berjumlah banyak. Penjabaran proses mining data iklim dengan aplikasi Weka akan dilakukan pada tahap ini.

Tahap awal yaitu membuka aplikasi Weka. Kemudian dipilih menu explorer selanjutnya dimasukan file data yang sudah ditransformasikan ke dalam apli-kasi weka. Selanjutnya pada tahap beri-kutnya akan muncul jendela menu

explore untuk memulai klasifikasi dengan memilih menu open file dan selanjutnya dimasukan file dengan ekstensi csv kemudian masuk kedalam menu browse komputer lalu dipilih lokasi keberadaan file .csv, lalu membuka file tersebut. File dinamakan 33 provinsi CSV.csv.

Pada tahap ini merupakan tahap persiapan untuk data dioalah oleh aplikasi weka yang nantinya akan menggunakan metode naive bayes dan pada tahap ini data masih dalam perhitungan kasar serta belum menggunakan metode naive bayes sehingga belum menghasilkan perhi-tungan yang akurat.

Pada tahap ini memlihi untuk menen-tukan menggunakan Numeric to Nominal untuk mengubah data yang berbentuk string (karakter) ke dalam bentuk integer atau nominal, yang akan mempermudah dalam mengklasifikasikan data kedalam algoritma naive bayes. Gambar 2 adalah hasilvisualisasinaive bayes menurut suhu minimum.

Gambar 2. Tampilan Visualisasi Naive Bayes Menurut Suhu Minimum

Page 5: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

Aswendy, Analisis Data ... 221

Hasil dari visualisasi didapat dari

sumbu x dan y, sumbu x dan y dapat ditentukan dari suhu minimum, suhu maksimum, suhu rata-rata, dan sebagai-nya. Pemetaan visual grafik didasarkan nilai prediksi yang telah di hitung menggunakan algoritma naïve bayes. Nilai prediksi yang hanya selisih 0.01 yang membuat dua titik ini berdekatan.

Untuk diketahui bahwa hasil dari titik-titik tersebut ditentukan dari jumlah instance yang berdekatan juga, sehingga titik-titik tersebut saling berhimpitan antara satu dengan yang lainnya namun jika instance tersebut memiliki jumlah yang cukup jauh maka hasil dari titik tersebut tidak saling berhimpitan.

Pada bar sumbu x dan y yang berwarna hijau didapat dari hasil per-hitungan klasifikasi naive bayes yang berupa kelas-kelas untuk menentukan titik visual grafik prediksi suhu minimum. Berdasarkan visualisasi pada gambar sudah menggunakan hasil prediksi suhu minimum sehingga hasil yang didapat berdasarkan klasifikasi suhu minimum.

Pada grafik terdapat titik-titik ber-warna yang merupakan nilai class dari hasil visualisasi yang didapat dari hasil klasifikasi class perhitungan naive bayes,

class tersebut berfungsi mengelompokan suatu nilai hasil klasifikasi.

Hasil dari prediksi tersebut dapat dijelaskan bahwa pada tiap hasil prediksi memiliki instance sebagai nomor id dari setiap titik, setiap titik memiliki hasil yang berbeda. Klasifikasi berdasarkan naïve bayes merupakan hasil mengum-pulkan berbagai nilai data yang sama kemudian diklasifikasikan dan kemudian dihitung dengan rumus naïve bayes.

Padahasil visualisasi dan prediksi terdapat beberapa kelas klasifikasi ber-dasarkan suhu minimum, setelah memi-lih titik koordinat maka detail akan menampilkan gambar dengan penjelasan dan juga detailnya. Gambar 2 menun-jukan instance 157822 dan 157933 yang setelahmelewatihasilprediksinilai yang sama adalah suhu minimumsebanyak 242, dengan predicted 242 data yang sama di kelas suhu minimum.

Pada Gambar 3 menampilakan hasil prediksi suhu minimum dari setiap provinsi yang apabila semakin tinggi maka akan semakin ekstrim suhu yang ada didaerah tersebut. Dalam grafik visual tersebut sudah menggunakan prediksi suhu minimum sehingga hasil yang didapat dari grafik tersebut sudah menampilkan hasil suhu minimum teresktrim pada provinsi yang berpotensi.

Gambar 3. Tampilan Visualisasi Hasil Prediksi Naive Bayes (Suhu Minimum)

Page 6: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

222 Jurnal Teknologi Rekayasa Volume 21 No.3, Desember 2016

Gambar 4.Tampilan Visualisai Suhu Maksimum

Gambar 4 menunjukkan hasil dari visualisasi didapat dari sumbu x dan y, sumbu x dan y dapat ditentukan dari suhu minimum, suhu maksimum, suhu rata-rata, dan sebagainya. Pemetaan visual grafik didasarkan nilai prediksi yang telah di hitung menggunakan algoritma naïve bayes. Nilai prediksi yang hanya selisih 0.01 yang membuat dua titik ini berdekatan. Untuk diketahui bahwa hasil dari titik-titik tersebut ditentukan dari jumlah instance yang berdekatan juga, sehingga titik-titik tersebut saling berhimpitan antara satu dengan yang lainnya namun jika instance tersebut memiliki jumlah yang cukup jauh maka hasil dari titik tersebut tidak saling berhimpitan.

Pada bar sumbu x dan y yang berwarna hijau didapat dari hasil perhitungan klasifikasi naive bayes yang berupa kelas-kelas untuk menentukan

titik visual grafik prediksi suhu maksi-mum. Berdasarkan visualisasi pada gam-bar sudah menggunakan hasil prediksi suhu maksimum sehingga hasil yang didapat berdasarkan klasifikasi suhu maksimum.

Pada grafik terdapat titik-titik ber-warna yang merupakan nilai class dari hasil visualisasi yang didapat dari hasil klasifikasi class perhitungan naive bayes, class tersebut berfungsi mengelompokan suatu nilai hasil klasifikasi.

Untuk dapat melihat detail, klik salah satu titik koordinat kemudian klik 2 kali pada titik koordiant tersebut maka akan muncul table prediksi atau hasil klasifikasi dari metode naive bayes.

Pada Gambar 5 menampilakan hasil prediksi suhu maksimum dari setiap provinsi yang apabila semakin tinggi maka akan semakin ekstrim suhu yang ada didaerah tersebut.

Gambar 5. Tampilan Visualisasi Hasil Prediksi Naive Bayes (Suhu Maksimum)

Page 7: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

Aswendy, Analisis Data ... 223

Gambar 6. Tampilan Visualisasi Suhu Rata-Rata

Hasil dari visualisasi didapat dari

sumbu x dan y, sumbu x dan y dapat ditentukan dari suhu minimum, suhu maksimum, suhu rata-rata, dan seba-gainya. Pemetaan visual grafik didasar-kan nilai prediksi yang telah di hitung menggunakan algoritma naïve bayes. Nilai prediksi yang hanya selisih 0.01 yang membuat dua titik ini berdekatan.

Untuk diketahui bahwa hasil dari titik-titik tersebut ditentukan dari jumlah instance yang berdekatan juga, sehingga titik-titik tersebut saling berhimpitan antara satu dengan yang lainnya namun jika instance tersebut memiliki jumlah yang cukup jauh maka hasil dari titik tersebut tidak saling berhimpitan.

Pada bar sumbu x dan y yang berwarna hijau didapat dari hasil perhitungan klasifikasi naive bayes yang berupa kelas-kelas untuk menentukan titik visual grafik prediksi suhu rata-rata.

Berdasarkan visualisasi pada gambar su-dah menggunakan hasil prediksi suhu rata-rata sehingga hasil yang didapat berdasarkan klasifikasi suhu rata-rata.

Pada grafik terdapat titik-titik berwarna yang merupakan nilai class dari hasil visualisasi yang didapat dari hasil klasifikasi class perhitungan naive bayes, class tersebut berfungsi mengelompokan suatu nilai hasil klasifikasi.

Untuk dapat melihat detail dari titik koordinat, klik salah satu titik koordinat kemudian klik 2 kali pada titik koordiant tersebut maka akan muncul table prediksi atau hasil klasifikasi dari metode naive bayes.

Pada gambar 7 menggunakan algorit-ma naive bayes yang menampilakan hasil prediksi suhu rata-rata dari setiap provinsi yang apabila semakin tinggi maka akan semakin ekstrim suhu yang ada didaerah tersebut.

Gambar 7. Tampilan Visualisasi Hasil Prediksi Naive Bayes (Suhu Rata-Rata)

Page 8: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

224 Jurnal Teknologi Rekayasa Volume 21 No.3, Desember 2016

Gambar 8. Tampilan Visualisasi Rata-Rata

Hasil dari visualisasi didapat dari

sumbu x dan y, sumbu x dan y dapat ditentukan dari suhu minimum, suhu maksimum, suhu rata-rata, kelembaban rata-rata dan sebagainya. Pemetaan visual grafik didasarkan nilai prediksi yang telah di hitung menggunakan algoritma naïve bayes. Nilai prediksi yang hanya selisih 0.01 yang membuat dua titik ini berdekatan.

Untuk diketahui bahwa hasil dari titik-titik tersebut ditentukan dari jumlah instance yang berdekatan juga, sehingga titik-titik tersebut saling berhimpitan antara satu dengan yang lainnya namun jika instance tersebut memiliki jumlah yang cukup jauh maka hasil dari titik tersebut tidak saling berhimpitan.

Pada bar sumbu x dan y yang berwarna hijau didapat dari hasil perhitungan klasifikasi naive bayes yang berupa kelas-kelas untuk menentukan titik visual grafik prediksi kelembaban

rata-rata. Berdasarkan visualisasi pada gambar sudah menggunakan hasil prediksi kelembaban rata-rata sehingga hasil yang didapat berdasarkan klasifikasi kelembaban rata-rata.

Pada grafik terdapat titik-titik berwarna yang merupakan nilai class dari hasil visualisasi yang didapat dari hasil klasifikasi class perhitungan naive bayes, class tersebut berfungsi mengelompokan suatu nilai hasil klasifikasi.

Untuk dapat melihat detail, klik salah satu titik koordinat kemudian klik 2 kali pada titik koordiant tersebut maka akan muncul table prediksi atau hasil klasifikasi dari metode naive bayes.

Pada gambar 9 menggunakan algo-ritma naive bayes yang menampilakan hasil prediksi kelembaban rata-rata dari setiap provinsi yang apabila semakin tinggi maka akan semakin ekstrim suhu yang ada didaerah tersebut.

Gambar 9. Tampilan Visualisasi Hasil Prediksi Naive Bayes (Kelembaban Rata-Rata)

Page 9: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

Aswendy, Analisis Data ... 225

Gambar 10. Tampilan Visualisasi Lama Penyinaran

Hasil dari visualisasi didapat dari

sumbu x dan y, sumbu x dan y dapat ditentukan dari suhu minimum, suhu maksimum, suhu rata-rata, lama penyinaran dan sebagainya. Pemetaan visual grafik didasarkan nilai prediksi yang telah di hitung menggunakan algoritma naïve bayes. Nilai prediksi yang hanya selisih 0.01 yang membuat dua titik ini berdekatan.

Untuk diketahui bahwa hasil dari titik-titik tersebut ditentukan dari jumlah instance yang berdekatan juga, sehingga titik-titik tersebut saling berhimpitan antara satu dengan yang lainnya namun jika instance tersebut memiliki jumlah yang cukup jauh maka hasil dari titik tersebut tidak saling berhimpitan.

Pada bar sumbu x dan y yang ber-warna hijau didapat dari hasil perhitungan klasifikasi naive bayes yang berupa kelas-kelas untuk menentukan titik visual grafik prediksi lama penyinaran. Berdasarkan visualisasi pada gambar sudah menggunakan hasil prediksi lama penyinaran sehingga hasil yang didapat berdasarkan klasifikasi lama penyinaran.

Untuk dapat melihat detail, klik salah satu titik koordinat kemudian klik 2 kali pada titik koordiant tersebut maka akan muncul table prediksi atau hasil klasifikasi dari metode naive bayes.

Pada gambar 11 menggunakan algoritma naive bayes yang menampilakan hasil prediksi lama penyinaran dari setiap provinsi yang apabila semakin tinggi maka akan semakin ekstrim suhu yang ada didaerah tersebut.

Gambar 11. Tampilan Visualisasi Hasil Prediksi Naive Bayes (Lama Penyinaran)

Page 10: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

226 Jurnal Teknologi Rekayasa Volume 21 No.3, Desember 2016

Gambar 12. Tampilan Visualisasi Nama Provinsi

Gambar13. Tampilan Visualisasi Hasil Prediksi Naive Bayes (Nama Provinsi)

Hasil dari visualisasi didapat dari sumbu x dan y, sumbu x dan y dapat ditentukan dari suhu minimum, suhu maksimum, suhu rata-rata, dan seba-gainya. Untuk diketahui bahwa hasil dari titik-titik tersebut ditentukan dari jumlah instance yang berdekatan sehingga titik-titik tersebut saling berhimpitan antara satu dengan yang lainnya namun jika instance tersebut memiliki jumlah yang cukup jauh maka hasil dari titik tersebut tidak saling berhimpitan.

Pada bar sumbu x dan y yang berwana hijau didapat dari hasil perhitungan klasifikasi naive bayes yang berupa kelas-kelas untuk menentukan titik visual grafik prediksi nama provinsi. Berdasarkan visualisasi pada gambar sudah menggunakan hasil prediksi nama provinsi sehingga hasil yang didapat berdasarkan klasifikasi nama provinsi.

Pada grafik terdapat titik-titik ber-warna yang merupakan nilai class dari hasil visualisasi yang didapat dari hasil klasifikasi class perhitungan naive bayes,

class tersebut berfungsi mengelompokan suatu nilai hasil klasifikasi.

Untuk dapat melihat detail, klik salah satu titik koordinat kemudian klik 2 kali pada titik koordiant tersebut maka akan muncul table prediksi atau hasil klasifikasi dari metode naive bayes.

Pada gambar 13 menggunakan algoritma naive bayes yang menam-pilkan hasil prediksi dari nama provinsi yang apabila semakin tinggi maka akan semakin ekstrim suhu yang ada diprovinsi tersebut. SILMPULAN DAN SARAN

Berdasarkan pengolahan data pada penulisan ini, wilayah Papua memiliki prediksi suhu minimum yang paling tinggi yakni 242. Untuk suhu maksimum yang tertinggi masih pada provinsi Papua dengan 322. Suhu rata-rata yang tertinggi pada provinsi Papua dengan 282 dan untuk prediksi kelembaban rata-rata yang memiliki intensitas tertinggi pada pro-

Page 11: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

Aswendy, Analisis Data ... 227

vinsi Jawa Barat dan Sulawesi Selatan dengan 100 predicted kelembaban. Untuk lama penyinaran yang memiliki prediksi tertinggi yakni pada provinsi DI Yogyakarta dengan prediksi sebesar 17.1. DAFTAR PUSTAKA [1] Ahmad.Basuki.

MetodeBayes.PENS-ITS. Sutamto, 2007. ModulDiklatKlimatologidanKualitasUdara. BadanMeteorologidanGeofisika. Jakarta. 2006. (diakses: 13 Juni 2016)

[2] Aksenova, Svetlana S. Mechine Learning with WEKA – WEKA Tutorial – Explore Tutorial for WEKA Version 3.4.3. California:California State University. 2004.

[3] Anonim.BMKG.TentangBMKG. http://www.bmkg.go.id/BMKG_Pusat/Profil/Sejarah.bmkg.2016. (tgl akses 07 Juni 2016)

[4] Anonim.BMKG.DataBMKG. http://www.bmkg.go.id/BMKG_Pusat/Informasi_Iklim/Informasi_Perubahan_Iklim/Informasi_Proyeksi_Perubahan_Iklim.bmkg.2016. (tgl akses 07 Juni 2016)

[5] Anonim.BMKG.Data BMKG. http://www.bmkg.go.id/BMKG_Pusat/Informasi_Iklim/Informasi_Perubahan_Iklim/Informasi_Indeks_Ekstrim_Perubahan_Iklim.bmkg. 2016. (tgl akses 07 Juni 2016)

[6] Han, J., &Kamber, M. Data mining Concepts and Techniques Second Edition. San Fransisco: Morgan Kauffman. 2006.

[7] HariadiMochammad, RatnasariDwi, Sumpeno Surya. Klasifikasi Text Mining Dalam Game Tutor Cerdas “DasarListrik” MenggunakanMetode Naïve Bayes Classifier. Surabaya: Seminar NasionalPascasarjana XI Program

PascaSarjanaInstitutSepuluh November. 2011.

[8] Kusrini,&EmhaTaufikLuthfi. Algoritma Data mining. Yogyakarta: Andi. 2009. Nuryani, A., Susanto, B., danProboyekti, U. Implementasi Naive Bayes Classifier pada Program Bantu PenentuanBukuReferensi Mata Kuliah, JurnalInformatikaVol 3 No. 2, 32-36. 2007.

[9] Larose, Daniel T. Data Mining Methods and Models. Wiley-IEEE Press. December 2005.

[10] MacLennan, J., Zhao Hui Tang, Bog, Crivat, “Data Mining with Microsoft® SQL Server® 2008”, Wiley Publishing, Inc., Indianapolis, Indiana. 2009.

[11] Nuryani, A., Susanto, B., dan Proboyekti, U. Implementasi Naive Bayes Classifier pada Program Bantu Penentuan Buku Referensi Mata Kuliah, Jurnal Informatika Vol 3 No. 2, 32-36. 2007.

[12] PrasetyoEko. Data Mining Konsep Dan AplikasiMenggunakan MATLAB, Ed. 1, Andi Offset, Yogyakarta. ISBN: 978-979-29-3282-9. Hal: 36-39. 2012.

[13] Rish, I.An empirical study of the Naive Bayes Classifier, International Joint Conference on Artificial Intelegence, California, 41-46. 2006.

[14] Shadiq M. Ammar. Keoptimalan Naïve Bayes DalamKlasifikasi. UniversitasPendidikan Indonesia. 2009.

[15] Shrivastava, Ajay Kumar & Panda, R.N. Implementation of Apriori Algorithm using WEKA. KIET International Journal of Intelligent Computing and Informatics Vol. 1, Issue 1. 2014.

[16] Susanto, Sani, Ph.D, Suryadi, Dedy, Pengantar Data Mining: MenggaliPengetahuandariBongkahan Data, Andi, Yogyakarta.2010.

Page 12: ANALISIS DATA IKLIM INDONESIA MENGGUNAKAN APLIKASI WEKA

228 Jurnal Teknologi Rekayasa Volume 21 No.3, Desember 2016

[17] Tan, P. N., Stenbach, M., dan Kumar, V. Introduction to Data Mining,Pearson Education, Boston. ,2006.

[18] Tjasyono, Bayong “Klimatologi / Bayong Tjasyono” . Bandung : Penerbit ITB, 2004.

[19] Turban, Efraim et al. Introduction to Information Technology, 3rd Edition. John Wiley & Sons, Inc. New York. USA. 2005.