jurnal km

Upload: siskaandini

Post on 01-Mar-2018

239 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 Jurnal KM

    1/4

    Pengujian Data Latih Produksi Sayur Mayur di Indonesia

    Menggunakan Naive Bayes Classifier

    Asep Hermawan1) Rachmat Robertto2)

    Program Studi/Jurusan Informatika

    akultas Matematika dan Ilmu Pengetahuan !lam

    "niversitas Jenderal !#hmad $aniJl% &erusan Jendral Sudirman' Cimahi' Ja(a Barat )*+,-

    Abstrak Indonesia meru.akan negara yang kaya akan .roduksi sayurmayur' rem.ah

    rem.ah' 0uah0uahan' .adi' dan lain se0againya% Se0agian 0esar rakyat Indonesia 0er.rofesise0agai .etani sehingga menjadikan Negara Indonesia se0agai negara agraris% Semua komoditiyang dihasilkan dari .ertanian Indonesia tidak hanya dikonsumsi oleh masyarakat dalam negeri'akan teta.i hasil .anen adakalanya dieks.or ke luar negeri% Menurut estimasi 0ank dunia'konsumsi sayuran dan 0uah0uahan di Indonesia akan meningkat ratarata 1'23 .er tahun selama

    .eriode 422-+*4*' dalam artian .rediksi .eluang .roduksi sayurmayur akan mem.engaruhistrategi dasar untuk .roduksi .ertanian di Indonesia% Beranjak dari hal terse0ut' maka di0utuhkanse0uah informasi yang 0erisi klasifikasi terhada. .eluang .roduksi sayurmayur di Indonesiauntuk mengetahui .er0andingan hasil .roduksi yang telah terjadi di masa lam.au dan saat ini%5leh karena itu untuk mengetahui klasifikasi terhada. .eluang .roduksi sayurmayur di Indonesiadalam .enelitian ini digunakanlah Naive Bayes Classifi#ation yang terda.at dalam a.likasi

    678!% 8onse. dasar yang digunakan oleh Naive Bayes adalah teorema 0ayes' yaitu teoremayang digunakan dalam statistika untuk menghitung suatu .eluang%

    Kata kunci9sayur-mayur, Naive Bayes, Naive Bayes Classification, aplikasi WEKA

    I. PENDAHUUAN

    Sayurmayur meru.akan 0ahan .okok

    yang 0iasa dikonsumsi oleh masyarakatIndonesia% Semua komoditi yang dihasilkandari .ertanian Indonesia tidak hanyadikonsumsi oleh masyarakat dalam negeri'akan teta.i hasil .anen adakalanya diesk.orke luar negeri% &entunya hal terse0ut mema#u

    .roduksi .ertanian di Indonesia dalam rangka

    memenuhi .ermintaan yang semakinmeningkat% Menurut estimasi 0ank dunia'konsumsi sayuran dan 0uah0uahan diIndonesia akan meningkat ratarata 1'23 .er

    tahun selama .eriode 422-+*4*' dalamartian .rediksi .eluang .roduksi sayurmayurakan mem.engaruhi strategi dasar untukmema#u .roduksi .ertanian di Indonesia%

    Se0agian 0esar rakyat Indonesia0er.rofesi se0agai .etani sehingga

    menjadikan Negara Indonesia se0agai negaraagraris% Namun .eluang usaha tani diIndonesia tidak menentu' hal ini dise0a0kan

    karena faktor im.or 0ahan .okok yang ikut

    0ersaing dengan .roduksi lokal% Para .etanidi Indonesia terkadang mengeluh terhada.daya jual dari hasil .anen yang dilakukansetia. .eriodenya% &entunya hal ini

    mengaki0atkan se0agian 0esar sektor.ertanian di Indonesia lum.uh aki0atkerugian yang mesti ditanggung oleh .ara.etani% 5leh karena itu di0utuhkan se0uahinformasi yang 0erisi klasifikasi terhada..eluang .roduksi sayurmayur di Indonesia

    untuk mengetahui .er0andingan hasil.roduksi yang telah terjadi di masa lam.au%

    Dalam .enelitian ini akan menggunakan

    dataset yang di.eroleh dari data 8ementrian

    Pertanian Indonesia mengenai .roduksi

    sayurmayur tahun 422)+*4)% :+;

    Perhitungan data set terse0ut dilakukan

    dengan menggunakan algoritma naive 0ayes

    yang telah tersedia dalam a.likasi 678!

    % 8eluaran dari .enelitian ini

    meru.akan hasil .erhitungan statistik dari

    Informatika UNJANI|2015 1

  • 7/25/2019 Jurnal KM

    2/4

    .enera.an algoritma naive 0ayes .ada dataset

    yang ada%

    II. !IN"AUAN #U$!AKA

    Pada .enelitian terdahulu yang dilakukandi "niversitas Stiku0ank' denganmenggunakan teknik data mining khususnyaklasifikasi untuk .rediksi dengan algoritma

    naive 0ayes da.at dilakukan .rediksiterhada. kete.atan (aktu studi darimahasis(a 0erdasarkan data training yangada% Data training dan testing yang digunakandiam0il se#ara random .ada ta0el data masteryang digunakan% !lgoritma naive 0ayes

    menghitung .er0andingan .eluang antarajumlah dari masingmasing kriteria nilai terhada. nilai hasil .rediksisesungguhnya% Dari hasil uji #o0a di.erolehtingkat kesalah .rediksi 0erkisar +*3 sam.aidengan -*3 dari data training dan testing

    yang diam0il se#ara random% Sedangkan ratarata tingkat kesalahan 0erkisar +*3 hingga1)3% &inggi atau rendahnya tingkatkesalahan da.at dise0a0kan oleh jumlahre#ord data dan tingkat konsistensi dari datatraining yang digunakan% :1;

    Selain itu .enelitian lain juga

    menera.kan algoritma naive 0ayes untukmem.rediksi mahasis(a non aktif% Data yangdigunakan se0anyak 1,=4 yang terdiri darimahasis(a .rogram studi teknik informatika'sistem informasi' dan desain komunikasi

    visual .ada "niversitas Dian Nus(antoro%?asil dari .roses klasifikasi dievaluasidengan menggunakan #ross validation'#onfusion matri@' A5C#urve dan &testuntuk mengetahui tingkat keakuratan dalammem.rediksi mahasis(a non aktif% :4;

    Penelitian lain juga dilakukan untukmengevaluasi kinerja akademik mahasis(a

    dengan menggunakan naive 0ayes #lassifier%Dengan melakukan 1 0uah .er0andinganterhada. jumlah data yang 0er0edadida.atkan hasil akurasi tertinggi .ada

    .engujian ke1 se0anyak 4** data% :);

    III. %E!&DE #ENEI!IAN

    A. A'(oritma Naie *a+es

    Bayesian #lassifi#ation adalah.engklasifikasian statistik yang da.at

    digunakan untuk mem.rediksi .ro0a0ilitas

    keanggotaan suatu #lass% Bayesian#lassifi#ation didasarkan .ada teorema Bayesyang memiliki kemam.uan klasifikasi seru.adengan de#ision tree dan neural net(ork%

    &eorema 0ayes memiliki 0entuk umumse0agai 0erikut

    P(HX)=

    P (X|H) .P (H)P(X)

    8eterangan Data dengan #lass yang 0elum diketahui? ?i.otesis data meru.akan suatu #lasss.esifikP Pro0a0ilitas hi.otesis ? P Pro0a0ilitas 0erdasarkan kondisi.ada hi.otesis ?

    P Pro0a0ilitas

    *. ,ross -a'iation

    Meru.akan .engujian standar yangdilakukan untuk mem.rediksi error rate%

    Setia. kelas .ada data set harus di(akilidalam .ro.orsi yang te.at antara data training

    dan data testing% Data di0agi se#ara a#ak .adamasingmasing kelas dengan .er0andinganyang sama%

    ,. Detai'e Accurac+ *+ ,'ass

    Pada 0agian ini terda.at 0e0era.a hasil.erhitungan statistik yang dida.at dari

    .engujian data set menggunakan algoritmanaive 0ayes% Nilai .erhitungan statistik yangdida.at dari hasil .engujian data set yaitu

    1. #recision

    Presisi meru.akan .er0andingan jumlah

    data relevan yang diam0il' dengan jumlahseluruh data yang diam0il dalam sistem%

    Presisi juga 0ermaksud menunjukan tingkatkete.atan antara informasi yang diminta oleh.engguna dengan ja(a0an yang di0erikanoleh sistem% Nilai .resisi dida.at dari jumlahsam.el 0erkategori .ositif diklasifikasi 0enardi0agi dengan total sam.el yang diklasifikasi

    se0agai sam.el .ositif' atau dengan rumus

    Presisi= TP

    TP+FP

    Informatika UNJANI|2015 2

  • 7/25/2019 Jurnal KM

    3/4

    2. Reca''

    Ae#all adalah .er0andingan antara

    jumlah data relevan yang diam0il se#ara a#akdengan jumlah data relevan yang 0erada dikoleksi data set% Nilai re#all dida.at darijumlah sam.el diklasifikasi .ositif di0agitotal sam.el dalam testing set 0erkategori.ositif' atau dengan rumus

    Recall= TP

    TP+FN

    /. 0%easure

    measure atau dise0ut juga fs#ore

    adalah ukuran dalam tes akurasi data% measure mem.ertim0angkan .resisi danre#all dalam melakukan .erhitungan% Nilaimeasure dida.at dari hasil .erhitungan

    menggunakan rumus

    Fmeasure=2. Presisi .Recall

    Presisi+Recall

    measure dinilai 0aik jika mem0erikan nilai4' dan dinilai 0uruk ketika mem0erikan nilai*%

    D. ,onusion %atri3

    7valuasi model klasifikasi didasarkan.ada .engujian untuk mem.erkirakan o0yekyang 0enar dan salah' urutan .engujiandita0ulasikan dalam #onfusion matri@ dimana

    kelas yang di.rediksi ditam.ilkan di 0agianatas matriks dan kelas yang diamati 0erada disisi kiri% Setia. sel 0erisi angka yangmenunjukan 0era.a 0anyak kasus yangse0enarnya dari kelas yang diamati untukdi.rediksi%

    I-. HA$I DAN #E%*AHA$AN

    Data set yang digunakan dalam.enelitian ini di.eroleh dari data 8ementrianPertanian Indonesia mengenai .roduksisayurmayur tahun 422)+*4)% Pelatihan datadan .engujian dilakukan denganmenggunakan a.likasi 678! %

    8lasifikasi yang digunakan dalam .elatihanserta .engujian terhada. data set yaitu naive0ayes #lassifier

    A. #e'atihan Data

    ?asil dari .elatihan data terhada. dataset yang ada ditunjukan .ada gam0ar )%a%

    4ambar 5.a

    Hasil Pelatihan Dataset

    Dari 11-, data set yang dilatih denganmenggunakan naive 0ayes #lassifier'dida.atkan hasil akurasi kete.atan se0esar

    2E'1)2= 3 untuk 1+=2 data yang dilatih danakurasi kesalahannya se0esar +'=-*) 3 untuk,2 data yang dilatih dengan (aktu eksekusiselama *'*1 detik untuk .engklasifikasianterhada. kelas kategori nilai%

    *. #en(u6ian Data atih

    Sementara hasil dari .engujian data latih'menggunakan cross-valiation se0anyak +*folds da.at dilihat .ada gam0ar )%0%

    4ambar 5.b

    Hasil !"i Data #atih

    Dari hasil uji data latih se0anyak 11-, dataset yang telah dilatih dengan menggunakan

    naive 0ayes #lassifier' untuk .engklasifikasian terhada. kelas kategorinilai dida.atkan hasil akurasi kete.atanse0esar 2E'142, 3 untuk 1+=, data yangdiuji dan akurasi kesalahannya se0esar+'=,*+ 3 untuk 2* data dengan (aktueksekusi selama *'*4 detik% Per0edaan hasil

    data latih se0elumnya dengan data uji saat initidak terlalu signifikan% ?al ini dise0a0kanoleh 0anyaknya data yang diuji dan jumlahkelas yang diklasifikasikan%

    Sementara hasil dari etaile accuracy $y

    class ditunjukan .ada gam0ar )%#

    4ambar 5.c

    Detaile Accuracy By Class

    Berdasarkan gam0ar )%# da.at diketahui0ah(a nilai .resisi' re#all' dan fmeasureyang dida.at untuk kelas angka teta. ham.irmendekati angka 4' dengan nilai ratarata

    se0esar *'2,=% Sementara untuk kelas angka

    sementara' nilai yang dida.at ham.ir

    Informatika UNJANI|2015 3

  • 7/25/2019 Jurnal KM

    4/4

    mendekati angka *' yaitu dengan rataratanilai se0esar *'*=+% ?al terse0ut menunjukan0ah(a kelas angka teta. dinilai 0aik karenaham.ir mendekati angka 4' sementara kelas

    angka sementara dinilai 0uruk karena ham.irmendekati angka *%Confussion matri@ yang dida.at dari hasil.engujian data latih ditunjukan .ada gam0ar)%d

    4ambar 5. Confussion %atri&

    Berdasarkan .ada gam0ar )%d yang

    ditunjukan' 0aris .ertama 1+==FE-menunjukan 0ah(a ada instan#e#lass angka teta. di dalam data set dan E-diantaranya diklasifikasikan .ada kelasangka sementara% Sedangkan .ada 0aris

    kedua 4-F+ menunjukan 0ah(a ada instan#e #lass angka sementara di dalam dataset dan 4- diantaranya diklasifikasikan .adakelas angka teta.%

    -. KE$I%#UAN

    Dari hasil dan .em0ahasan yang ada'

    maka da.at ditarik kesim.ulan 0ah(a tingkatakurasi kete.atan yang dida.at menggunakannaive 0ayes #lassifier terhada. data latih yangdiuji adalah se0esar 2E'142, 3 untuk 1+=,data dari total keseluruhan se0anyak 11-,%?al terse0ut menunjukan 0ah(a .enggunaan

    naive 0ayes #lassifier .ada jumlah data yangsemakin 0anyak dan .engklasifikasian kelas

    yang sedikit da.at menghasilkan tingkatakurasi kete.atan yang #uku. tinggi' sertamenghasilkan nilai measure yang ham.irmendekati angka 4 atau 0ernilai 0aik%

    A77A7NSI

    :4;8hafiiHh ?astuti' !nalisis 8om.arasi

    !lgoritma 8lasifikasi Data Mining "ntuk

    Prediksi Mahasis(a Non !ktif'

    'emantik ()*(' ..% +)4+)2' Juni +*4+%

    :+;8ementrian Pertanian Indonesia%