analisis kinerja algoritma naÏve bayes classifier...
TRANSCRIPT
ANALISIS KINERJA ALGORITMA NAÏVE BAYES
CLASSIFIER DENGAN SELEKSI FITUR CHI-SQUARE DAN
CONFIX STRIPPING STEMMER PADA SISTEM
KLASIFIKASI TERJEMAHAN HADITS
SKRIPSI
Oleh:
Nichyta Dian Ramadhani
11150910000009
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2019 M / 1441 H
ANALISIS KINERJA ALGORITMA NAÏVE BAYES
CLASSIFIER DENGAN SELEKSI FITUR CHI-SQUARE DAN
CONFIX STRIPPING STEMMER PADA SISTEM
KLASIFIKASI TERJEMAHAN HADITS
Skripsi
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer
(S.Kom)
Oleh:
Nichyta Dian Ramadhani
11150910000009
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2019 M / 1441 H
v
KATA PENGANTAR
Segala puji bagi Allah, Rabb semesta alam. Shalawat dan salam kepada
Nabi kita Muhammad, keluarga, sahabatnya, serta orang-orang yang mengikuti
mereka hingga akhir zaman.
Penyusunan skripsi ini adalah salah satu syarat untuk memperoleh gelar
Sarjana Komputer (S.Kom) pada program studi Teknik Informatika, Fakultas Sains
dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta. Adapun
bahan penulisan skripsi ini adalah berdasarkan hasil penelitian, pengembangan
aplikasi, dan beberapa sumber literatur.
Dalam penyusunan skripsi ini, telah banyak bimbingan dan bantuan yang
didapatkan dari berbagai pihak sehingga skripsi ini dapat berjalan dengan lancar.
Oleh karena itu, penulis ingin mengucapkan banyak terima kasih kepada :
1. Ibu Prof Dr. Lily Surayya Eka Putri M.Env.Stud, selaku Dekan Fakultas
Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta.
2. Bapak Imam Marzuki Shofi, M.T. selaku Ketua Program Studi Teknik
Informatika.
3. Ibu Siti Ummi Masruroh, M.Sc. dan Ibu Luh Kesuma Wardhani, S.T., M.T.
selaku Dosen Pembimbing I dan II yang senantiasa meluangkan waktu dan
memberikan bimbingan, bantuan, semangat dan motivasi dalam
menyelesaikan skripsi ini.
4. Seluruh Dosen dan Staff UIN Jakarta, khususnya Fakultas Sains dan
Teknologi yang telah memberikan ilmu dan pengalaman yang berharga.
5. Kedua Orang Tua tercinta, yaitu Bapak Paimin, dan Ibu Jeny Herawati yang
selalu menyayangi, mendidik, mendo’akan, serta memberikan dukungan
baik moril dan materil kepada penulis, terima kasih ibu dan ayah, semoga
Allah selalu melindungi dan menyayangi
vii
Nama : Nichyta Dian Ramadhani (11150910000009)
Program Studi : Teknik Informatika
Judul : Analisis Kinerja Algoritma Naïve Bayes Classifier Dengan Seleksi
Fitur Chi-Square Dan Confix Stripping Stemmer Pada Sistem
Klasifikasi Terjemahan Hadits
ABSTRAK
Salah satu pemanfaatan teknologi untuk mengolah data berupa teks adalah metode
text mining dan klasifikasi merupakan salah satu teknik dalam text mining. Salah
satu algoritma klasifikasi text mining adalah Naïve Bayes Classifier. Pada penelitian
ini, peneliti melakukan simulasi kombinasi algoritma Naïve Bayes Classifier
dengan Confix Stripping Stemmer untuk stemming, dan Chi-Square sebagai
algoritma seleksi fitur untuk mengklasifikasi terjemahan hadits Shahih Bukhari
kedalam tiga kelas yaitu anjuran, larangan, dan informasi dengan jumlah data 300
data training, dan 30 data testing. Pengujian kinerja sistem menggunakan confusion
matrix dengan menghitung nilai akurasi, presisi, recall, dan f-measure. Hasil
pengujian menunjukkan bahwa skenario yang memiliki performa terbaik adalah
kombinasi Algoritma Naïve Bayes Classifier dan Confix Stripping Stemmer dengan
nilai akurasi, presisi, recall, dan f-measure berturut-turut sebesar 84,44%, 80,19%,
76,67% dan 76,21%.
Kata Kunci : Klasifikasi, Text Mining, Naïve Bayes Classifier,
Confix Stripping Stemmer, Chi-Square
Daftar Pustaka : 5 Buku, 27 Jurnal
Jumlah Halaman : VI Bab + xv halaman + 179 halaman
viii
Name : Nichyta Dian Ramadhani (11150910000009)
Study Program : Informatics Engineering
Title : Implementation of Naïve Bayes Classifier Algorithm with
Chi-Square Feature Selection and Confix Stripping
Stemmer in Hadith Translation Classification System
ABSTRACT
One of the use of technology to process data text is the method of text mining and
classification is one of the techniques in text mining. One of the text mining
classification algorithms is Naïve Bayes Classifier. In this research, Naïve Bayes
Classifier algorithms was combined with Confix Stripping Stemmer for stemmed,
and Chi-Square as a feature selection algorithm to classified the translation of Sahih
Bukhari's hadith into three classes, namely suggestions, prohibitions, and
information with a total data of 300 trained data, and 30 tested data. System
performance tested used confusion matrix by calculated the value of accuracy,
precision, recall, and f-measure. The test results showed that the scenarios that had
the best performance was a combination of Naïve Bayes Classifier and Confix
Stripping Stemmer Algorithm with accuracy, precision, recall, and f-measure
respectively 84.44%, 80.19%, 76.67% and 76.21%.
Keyword : Classification, Text Mining, Naïve Bayes
Classifier, Confix Stripping Stemmer, Chi-Square
Bibliography : 5 Books, 27 Journals
Number of Pages : VI Chapters + xv pages + 179 pages
ix
ix
DAFTAR ISI
LEMBAR PERSETUJUAN .................................................................................... i
HALAMAN PENGESAHAN UJIAN .................................................................... ii
HALAMAN PERNYATAAN ORISINALITAS ................................................... iii
KATA PENGANTAR ............................................................................................. v
ABSTRAK ............................................................................................................ vii
ABSTRACT ......................................................................................................... viii
DAFTAR ISI .......................................................................................................... ix
DAFTAR GAMBAR ........................................................................................... xiii
DAFTAR TABEL .................................................................................................. xv
BAB I PENDAHULUAN ....................................................................................... 1
1.1 Latar Belakang .................................................................................................. 1
1.2 Tujuan Penelitian .............................................................................................. 4
1.3 Manfaat Penelitian ............................................................................................ 5
1.3.1 Bagi Pengguna ...................................................................................... 5
1.3.2 Bagi Mahasiswa .................................................................................... 5
1.3.3 Bagi Universitas .................................................................................... 5
1.4 Rumusan Masalah ............................................................................................. 5
1.5 Batasan Masalah ............................................................................................... 6
1.6 Metodologi Penelitian ....................................................................................... 7
1.6.1. Metode Pengumpulan Data ................................................................... 7
1.6.2. Metodologi Pengembangan Sistem ....................................................... 7
1.7 Sistematika Penulisan ....................................................................................... 7
BAB II LANDASAN TEORI ................................................................................. 9
2.1 Klasifikasi ......................................................................................................... 9
x
x
2.1.1 Algoritma Klasifikasi .................................................................................... 10
2.2 Text Mining ..................................................................................................... 11
2.2.1 Text Preprocessing ........................................................................................ 13
2.2.2 Text Transformation ...................................................................................... 13
2.2.3 Pattern Discovery.......................................................................................... 13
2.3 Naïve Bayes Classifier (NBC) ........................................................................ 14
2.4 Confix Stripping Stemmer ............................................................................... 15
2.5 Seleksi Fitur (Feature Selection) .................................................................... 19
2.6.1 Chi-Square (x2) ...................................................................................... 19
2.6 Studi Pustaka .................................................................................................. 20
2.7 Metode Simulasi ............................................................................................. 20
2.8 Confusion Matrix ............................................................................................ 22
2.9 PHP ................................................................................................................. 24
2.10 XAMPP .......................................................................................................... 24
2.11 MySQL ........................................................................................................... 25
2.14 Studi Literatur Sejenis .................................................................................... 26
BAB III METODOLOGI PENELITIAN ............................................................. 30
3.1 Metode Pengumpulan Data ........................................................................... 30
3.1.1. Studi Pustaka ....................................................................................... 30
3.1.2. Pengumpulan Data .............................................................................. 30
3.2 Metode Simulasi ........................................................................................... 31
3.2.1 Formulasi Masalah (Problem Formulation) .......................................... 31
3.2.2 Model Pengkonsepan (Conseptual Model) ............................................ 31
3.2.3 Data Masukan/Keluaran (Input/Output Data)..................................... 32
3.2.4 Pemodelan (Modelling) .......................................................................... 32
3.2.5 Simulasi (Simulation) ............................................................................. 32
3.2.6 Verifikasi dan Validasi (Verification and Validation) ........................... 33
xi
xi
3.2.7 Eksperimentasi (Experimentation) ......................................................... 33
3.2.8 Analisis keluaran (Output Analysis) ....................................................... 33
3.3 Metode Pengujian ......................................................................................... 33
3.4 Kerangka Berpikir ......................................................................................... 35
BAB IV IMPLEMENTASI SIMULASI DAN EKSPERIMEN ........................... 36
4.1 Formulasi Masalah (Problem Formulation) ................................................... 36
4.2 Model Pengkonsepan (Conceptual Model) .................................................... 36
4.2.1 Model pengkonsepan text mining ........................................................ 37
4.2.2 Model pengkonsepan tahap training dan testing ................................ 39
4.2.3 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)
tanpa stemming dan tanpa seleksi fitur ................................................ 44
4.2.4 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)
dengan Chi-Square dan tanpa stemming ............................................. 46
4.2.5 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)
dengan Confix Stripping Stemmer dan tanpa seleksi fitur .................. 48
4.2.6 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)
dengan Confix Stripping Stemmer dan Chi-Square ............................ 50
4.3 Data Masukan/Keluaran (Input/Output Data) ................................................ 51
4.3.1 Data Masukan (Input) ......................................................................... 51
4.3.2 Data Keluaran (Output) ....................................................................... 52
4.4 Pemodelan (Modelling) .................................................................................. 52
4.4.1 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) tanpa
stemming dan tanpa seleksi fitur) ........................................................ 52
4.4.2 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan
Chi-Square dan tanpa stemming .......................................................... 62
4.4.3 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan
Confix Stripping Stemmer dan tanpa seleksi fitur ............................... 74
4.4.4 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan
Confix Stripping Stemmer dan Chi-Square ........................................ 86
4.5 Simulasi (Simulation) ................................................................................... 100
4.5.1 Pembangunan Server ......................................................................... 101
4.5.2 Flowchart Simulasi ............................................................................ 101
xii
xii
4.6 Verifikasi dan Validasi (Verification and Validation ) ................................ 107
4.7 Eksperimentasi (Experimentation) ............................................................... 107
4.8 Analisis Keluaran (Output Analysis) ............................................................ 107
BAB V HASIL DAN PEMBAHASAN .............................................................. 108
5.1 Verifikasi dan Validasi (Verification and Validation) ................................. 108
5.2 Eksperimentasi (Experimentation) ............................................................... 109
5.3 Analisis Keluaran (Output Analysis) ............................................................ 109
5.3.1 Skenario 1 ............................................................................................. 110
5.3.2 Skenario 2 ............................................................................................. 116
5.3.3 Skenario 3 ............................................................................................. 139
5.3.4 Skenario 4 ............................................................................................. 145
5.3.5 Analisis Perbandingan Hasil Seluruh Pengujian .................................. 169
BAB VI PENUTUP ............................................................................................ 173
6.1 Kesimpulan ................................................................................................... 173
6.2 Saran ............................................................................................................. 173
DAFTAR PUSTAKA .......................................................................................... 174
xiii
DAFTAR GAMBAR
Gambar 3.1 Kerangka Berpikir ............................................................................. 35
Gambar 4.1 Flowchart Preprocessing .................................................................. 37
Gambar 4.2 Flowchart Transforming ................................................................... 38
Gambar 4.4 Flowchart Training ........................................................................... 40
Gambar 4.5 Flowchart Testing ............................................................................. 42
Gambar 4.6 Flowchart Skenario 1 ........................................................................ 44
Gambar 4.7 Flowchart Naïve Bayes Classifier ..................................................... 45
Gambar 4.8 Flowchart Skenario 2 ........................................................................ 46
Gambar 4.9 Flowchart Chi-Square ....................................................................... 47
Gambar 4.10 Flowchart Skenario 3 ...................................................................... 48
Gambar 4.11 Flowchart Skenario 4 ...................................................................... 50
Gambar 4.0.12 Flowchart Simulasi .................................................................... 101
Gambar 5.1 Hasil Confusion Matrix Skenario 1 ................................................. 115
Gambar 5.2 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,05 ..................... 121
Gambar 5.3 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,005 ................... 127
Gambar 5.4 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,01 ..................... 133
Gambar 5.5 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,001 ................... 139
Gambar 5.6 Hasil Confusion Matrix Skenario 3 ................................................. 145
Gambar 5.7 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,05 ..................... 151
Gambar 5.8 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,005 ................... 157
xiv
Gambar 5.9 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,01 ..................... 163
Gambar 5.10 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,001 ................. 169
Gambar 5.11 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,05), 3
dan 4 (taraf nyata 0,05) ................................................................. 170
Gambar 5.12 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,005),
3 dan 4 (taraf nyata 0,005) ............................................................ 170
Gambar 5.13 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,01), 3
dan 4 (taraf nyata 0,01) ................................................................. 170
Gambar 5.14 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,001),
3 dan 4 (taraf nyata 0,001) ............................................................ 171
xv
DAFTAR TABEL
Tabel 2.1 Perbandingan Algoritma Klasifikasi Teks ........................................... 10
Tabel 2.2 Kombinasi Prefiks Dan Sufiks Yang Tidak Diperbolehkan ................ 17
Tabel 2.3 Aturan Peluruhan Kata Dasar .............................................................. 17
Tabel 2.4 Confusion Matrix Dari Classifier ......................................................... 22
Tabel 2.5 Studi Literatur Sejenis .......................................................................... 26
Tabel 5.1 Hasil Pengujian Skenario 1 …………………………………………..110
Tabel 5.2 Hasil Pengujian Skenario 2 Taraf Nyata 0,05 ..................................... 116
Tabel 5.3 Hasil Pengujian Skenario 2 Taraf Nyata 0,005 ................................... 122
Tabel 5.4 Hasil Pengujian Skenario 2 Taraf Nyata 0,01 ..................................... 128
Tabel 5.5 Hasil Pengujian Skenario 2 Taraf Nyata 0,001 ................................... 134
Tabel 5.6 Hasil Pengujian Skenario 3 ................................................................. 140
Tabel 5.7 Hasil Pengujian Skenario 4 Taraf Nyata 0,05 ..................................... 146
Tabel 5.8 Hasil Pengujian Skenario 4 Taraf Nyata 0,005 ................................... 152
Tabel 5.9 Hasil Pengujian Skenario 4 Taraf Nyata 0,01 ..................................... 158
Tabel 5.10 Hasil Pengujian Skenario 4 Taraf Nyata 0,001 ................................. 164
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kemajuan teknologi informasi yang terus berkembang semakin
mempermudah masyarakat dalam mendapatkan berbagai informasi khususnya
di media online. Sebagian besar dari informasi yang didapatkan di internet
adalah berupa data teks. Pertumbuhan data teks yang semakin pesat mendorong
para peneliti membangun sebuah sistem untuk melakukan pengolahan terhadap
kumpulan data teks tersebut (Kusumaningrum, Al-faraby, & Adiwijaya, 2017).
Text mining secara umum adalah teori tentang pengolahan koleksi
dokumen dalam jumlah besar yang ada dari waktu ke waktu dengan
menggunakan beberapa analisis, tujuan pengolahan data teks tersebut adalah
mengetahui dan mengekstrak informasi yang berguna dari sumber data dengan
identifikasi dan eksplorasi pola menarik. Dalam kasus text mining, sumber data
yang dipergunakan adalah kumpulan atau koleksi dokumen tidak terstuktur dan
memerlukan adanya pengelompokan (klasifikasi) untuk diketahui informasi
sejenis (Somantri, Wiyono, & Dairoh, 2017).
Klasifikasi merupakan salah satu teknik dalam text mining dan data
mining yang digunakan dalam proses mencari model atau fungsi yang
menjelaskan atau membedakan kelas-kelas pada data dan konsep yang
bertujuan untuk menggunakan model tersebut dalam melakukan prediksi
terhadap data testing (Fauzan, Al-faraby, & Adiwijaya, 2018). Teknik ini sudah
banyak digunakan pada banyak penelitian dengan berbagai domain, namun
masih sedikit yang melakukan penelitian dengan mengangkat domain teks kitab
agama, salah satunya adalah terjemahan Hadits (Kusumaningrum et al., 2017).
Pada dewasa ini metode klasifikasi telah banyak dikembangkan, antara
lain Support Vector Machine (SVM), Naïve Bayessian Classifier (NBC),
Decision Tree (DT), K-Nearest Neighbour (KNN) dan metode klasifikasi
lainnya (Fauzan et al., 2018).
2
UIN Syarif Hidayatullah Jakarta
Algoritma Naive Bayes Classifier merupakan salah satu algoritma
yang terdapat pada teknik klasifikasi. Naïve Bayes Classifier (NBC) merupakan
pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan
oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan
berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai
Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana
diasumsikan kondisi antar atribut saling bebas (Nofriansyah, Erwansyah, &
Ramadhan, 2016). Selain itu, NBC memiliki komputasi yang mudah, serta
memiliki tingkat akurasi tinggi dan error rate yang minimum. Algoritma NBC
juga mampu menggenerasikan token dengan pengenalan karakter sehingga
mampu diimplementasikan pada token dengan bahasa Indonesia (Widodo &
Pratiwi, 2017). Sehingga cocok pada kasus klasifikasi dokumen hadits yang
menggunakan terjemahan Bahasa Indonesia sebagai data penelitian.
Sebelumnya terdapat beberapa penelitian yang menerapkan
algoritma Naïve Bayes Classifier dalam proses klasifikasi. Pertama penelitian
yang dilakukan oleh (Septiani, 2017) yang melakukan perbandingan metode
klasifikasi data mining Algoritma C4.5 dengan Algoritma Naïve Bayes
Classifier dalam memprediksi penyakit hepatitis dan mendapati hasil Naïve
Bayes Classifier lebih unggul berdasarkan akurasi yaitu mencapai 83,71%.
Penelitian kedua yaitu penelitian yang menerapkan Algoritma Naïve Bayes
Classifier untuk klasifikasi bakteri gram-negatif yang dilakukan oleh (Priyanti,
2017). Penelitian tersebut mendapatkan nilai akurasi 80,93%. Penelitian lainnya
yang menerapkan Algoritma Naïve Bayes Classifier dalam proses klasifikasi
dilakukan oleh (Saputra, 2018) untuk pemetaan mahasiswa yang membutuhkan
bimbingan dan konseling dengan hasil akurasi 81%.
Penelitian berikutnya mengklasifikasikan data teks berupa surat
menggunakan Algoritma Multinomial Naïve Bayes dan mengimplementasikan
Algotima Confix Stripping Stemmer pada tahapan stemming. Penelitian yang
dilakukan oleh (Kalokasari, Setianingrum, & Shofi, 2018) tersebut
mendapatkan hasil Accuracy, Precission, Recall, dan F-measure secara
3
UIN Syarif Hidayatullah Jakarta
berurutan sebesar 89,58%, 79,17%, 78,72%, dan 77,05%. Stemming merupakan
salah satu tahapan preprocessing pada text mining setelah tokenizing, case
folding, stopwords. Diantara keempat langkah tersebut yang paling penting
adalah proses stemming yang merupakan proses menghilangkan imbuhan pada
suatu kata untuk mendapatkan kata dasar dari kata tersebut. Confix-stripping
stemmer merupakan penyempurnaan oleh Jelita Asian yang berawal dari nazief
stemmer yang dibuat oleh Nazief dan Adriani (Ariadi & Fithriasari, 2015).
Menurut Chen dkk. (dalam Ernawati, 2016) masalah utama dalam
klasifikasi teks adalah dimensi tinggi dari ruang fitur, hal ini sering terjadi pada
teks yang memiliki puluhan ribu fitur. Sebagian besar fitur ini tidak relevan dan
tidak bermanfaat bagi klasifikasi teks bahkan dapat mengurangi tingkat akurasi,
maka dari itu pemilihan fitur yang sesuai sangat diperlukan. Seleksi fitur
merupakan langkah penting dalam klasifikasi teks dan mempengaruhi secara
langsung terhadap performa klasifikasi (Ernawati, 2016).
Sun dkk. (dalam Rahmad & Pribadi, 2015) menyebutkan sebelumnya
telah didapatkan beberapa teknik yang digunakan untuk melakukan pemilihan
fitur dokumen antara lain Document Frequency Thresholding (DF),
Information Gain, Mutual Information (MI), Term Strength (TS) dan Chi-
Square testing (X2). Dan dalam pengklasifikasian sebuah dokumen, Chi-Square
adalah salah satu supervised feature selection yang mampu menghilangkan
banyak fitur tanpa mengurangi tingkat akurasi.
Penelitian sejenis lainnya yang menerapkan feature selection Chi-
Square dilakukan oleh (Sacra, Faraby, & Triantoro, 2017) membuktikan bahwa
penerapan feature selection memberi pengaruh terhadap hasil klasifikasi.
Performansi terbaik dari penelitian tersebut didapatkan pada pengujian data
dengan kelas imbang dan menerapkan feature selection Chi-Square yaitu
mendapatkan nilai F-Measure sebesar 94,62%.
Berdasarkan beberapa penelitian diatas, Confix Stripping Stemmer
merupakan penyempurnaan dari agloritma stemming sebelumnya, maka pada
penelitian ini peneliti mencoba melakukan simulasi dengan mengkombinasikan
4
UIN Syarif Hidayatullah Jakarta
algoritma tersebut dengan algoritma Naïve Bayes Classifier dan Chi-Square.
Maka berdasarkan latar belakang yang telah penulis paparkan, penulis
melakukan penelitian mengenai implementasi Algoritma Naïve Bayes
Classifier untuk mengklasifikasi terjemahan hadits kedalam tiga kelas yaitu
anjuran, larangan dan informasi dengan feature selection Chi-Square dan
menerapkan Algoritma Confix Stripping Stemmer pada tahapan stemming.
Data yang digunakan sebanyak 300 hadits sebagai data training yang
sudah diklasifikasi secara manual kedalam tiga kelas yaitu anjuran, larangan,
dan informasi, dan 30 hadits sebagai data testing . Kitab hadits yang digunakan
adalah Shahih Bukhari yang diambil dari Aplikasi LIDWA “Kitab 9 Imam”
Penentuan kelas manual data hadits tersebut dilakukan berdasarkan hasil saran
dari narasumber yang expert di bidangnya yaitu Bapak Danial,Lc.M.Th.I, yang
merupakan Dosen Prodi Ilmu Alquran dan Tafsir IAIN Kendari dengan
berdasarkan melihat kombinasi kata dari kalimat hadits tersebut, seperti hadits
kelas anjuran pada umumnya terdapat kata hendaklah/hendaknya maupun kata
kerja+lah, kemudian janganlah/jangan/dilarang/melarang/larang untuk kalimat
pada kelas hadits larangan, serta sisanya dianggap masuk ke kelas informasi.
Berdasarkan latar belakang, maka penulis memberi judul penelitian ini
“ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER DENGAN
SELEKSI FITUR CHI-SQUARE DAN CONFIX STRIPPING STEMMER
PADA SISTEM KLASIFIKASI TERJEMAHAN HADITS”
1.2 Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk mengetahui bagaimana kinerja
Algoritma Naïve Bayes Classifier dengan seleksi fitur Chi-Square dan Confix
Stripping Stemmer dapat diterapkan pada pengklasifikasian terjemahan hadits
berdasarkan tiga kelas yaitu anjuran, larangan, dan informasi.
5
UIN Syarif Hidayatullah Jakarta
1.3 Manfaat Penelitian
1.3.1 Bagi Pengguna
Dengan penelitian ini diharapkan dapat memudahkan pengguna
untuk mempelajari hadits-hadits Nabi, dan dapat memandu kita dengan
mudah dalam mencari tahu sebuah hadits berdasarkan klasifikasi,
khususnya Shahih Bukhari.
1.3.2 Bagi Mahasiswa
1. Sebagai media pembelajaran dalam mengetahui hadits-hadits Nabi
berdasarkan klasifikasi khususnya Shahih Bukhari.
2. Memberikan pengetahuan kepada penulis dalam membangun
sebuah sistem dengan menggunakan metode Naïve Bayes Classifier,
Seleksi fitur Chi-Square, dan Confix Stripping Stemmer.
3. Dapat menerapkan ilmu dan pengetahuan yang diperoleh selama
masa perkuliahan.
4. Untuk memenuhi salah satu syarat dalam meraih gelar sarjana dalam
Fakultas Sains dan Teknologi jurusan Teknik Informatika
Universitas Islam Negeri Syarif Hidayatullah Jakarta.
1.3.3 Bagi Universitas
1. Mengetahui kemampuan mahasiswa dalam menerapkan ilmu yang
diperoleh selama perkuliahan.
2. Menjadikan penelitian ini sebagai referensi untuk penelitian
selanjutnya.
1.4 Rumusan Masalah
Berdasarkan uraian latar belakang diatas, maka rumusan masalah
yang ada pada penelitian ini adalah bagaimana kinerja Algoritma Naïve Bayes
Classifier dengan seleksi fitur Chi-Square dan Confix Stripping Stemmer
dalam mengklasifikasikan terjemahan hadits Shahih Bukhari?
6
UIN Syarif Hidayatullah Jakarta
1.5 Batasan Masalah
Di dalam melakukan suatu penelitian diperlukan adanya pembatasan
suatu masalah agar penelitian tersebut lebih terarah dan memudahkan dalam
pembahasan sehingga tujuan penelitian akan tercapai. Beberapa Batasan
masalah dalam penelitian ini adalah sebagai berikut:
1. Metode pengumpulan data yang digunakan dalam penelitian ini adalah
metode studi pustaka.
2. Metode pengembangan sistem yang digunakan adalah metode Simulasi
yang terdiri dari tahapan problem formulation, conceptual model, input
and output data, modelling, simulation, verification and validation,
experimentation dan output analysis.
3. Penelitian ini menggunakan kombinasi Algoritma Naïve Bayes Classifier
untuk mengklasifikasikan hadits, seleksi fitur dengan Chi-Square, dan
stemming dengan Confix Stripping Stemmer yang dibagi menjadi 4
skenario.
4. Kitab hadits yang digunakan adalah Shahih Bukhari yang diambil dari
Aplikasi LIDWA “Kitab 9 Imam”.
5. Klasifikasi hadits dibagi menjadi tiga kelas yaitu anjuran/perintah,
larangan, dan informasi.
6. Penentuan kelas data hadits tersebut dilakukan berdasarkan hasil saran
dari narasumber yang expert di bidangnya yaitu Bapak
Danial,Lc.M.Th.I, yang merupakan Dosen Prodi Ilmu Alquran dan Tafsir
IAIN Kendari.
7. Aplikasi ini menggunakan bahasa pemrograman PHP sebagai interface
dan MySQL sebagai database.
8. Jumlah data set pada penelitian ini adalah 300 data training dan 30 data
testing.
9. Pengujian dilakukan dengan jumlah data set seimbang pada setiap kelas.
7
UIN Syarif Hidayatullah Jakarta
1.6 Metodologi Penelitian
1.6.1. Metode Pengumpulan Data
Adapun metode pengumpulan data-data informasi yang dilakukan
adalah melakukan studi pustaka untuk mengumpulkan data dengan mencari
informasi lewat buku, jurnal, e-book, dan sumber-sumber tertulis lainnya baik
tercetak maupun elektronik yang bertujuan untuk mendukung sebuah
penelitan.
1.6.2. Metodologi Pengembangan Sistem
Dalam pembuatan aplikasi ini menggunakan metode Simulasi.
1.7 Sistematika Penulisan
Dalam penyusunan tugas akhir ini penulis menggunakan sistematika
penulisan sebagai berikut:
BAB I PENDAHULUAN
Pada bab ini berisi latar belakang masalah, rumusan masalah,
batasan masalah, tujuan penulisan, manfaat penulisan,
metodologi penulisan dan sistematika penulisan.
BAB II LANDASAN TEORI
Pada bab ini berisi tentang landasan teori dari studi literatur yang
digunakan penulis dalam penelitian.
BAB III METODOLOGI PENELITIAN
Pada bab ini membahas tentang metodologi yang digunakan yaitu
metodologi pengumpulan data dan metodologi pengembangan
sistem.
BAB IV ANALISA DAN PERANCANGAN SISTEM
Pada bab ini membahas perancangan dan pengujian sesuai
dengan metode yang digunakan pada sistem yang dibuat
BAB V HASIL DAN PEMBAHASAN
Pada bab ini dijelaskan mengenai hasil dari penelitian beserta
penjelasan dari aplikasi yang dibuat
8
UIN Syarif Hidayatullah Jakarta
BAB VI PENUTUP
Pada bab ini dijelaskan mengenai kesimpulan dari hasil penelitian
dan saran yang dapat digunakan untuk pengembangan sistem
masa yang akan datang agar lebih baik
9
BAB II
LANDASAN TEORI
2.1 Klasifikasi
Menurut KBBI klasifikasi merupakan penyusunan bersistem dalam
kelompok atau golongan menurut kaidah atau standar yang berasal dari kata serapan
bahasa Belanda, classificatie, yang sendirinya berasal dari bahasa Prancis
classification. Istilah ini menunjuk kepada sebuah metode untuk menyusun data
secara sistematis atau menurut beberapa aturan atau kaidah yang telah ditetapkan.
Secara harafiah bisa pula dikatakan bahwa klasifikasi adalah pembagian sesuatu
menurut kelas-kelas. Sedangkan menurut Ilmu pengetahuan, klasifikasi adalah
proses pengelompokkan benda berdasarkan ciri-ciri persamaan dan perbedaan
(Sacra et al., 2017).
Menurut (Faisal & Nugrahadi, 2019) klasifikasi adalah salah satu teknik
machine learning. Istilah klasifikasi didapat dari tujuan utama teknik ini untuk
memprediksi suatu kelas dari input data. Sebelum melakukan proses prediksi,
terlebih dahulu dilakukan proses pembelajaran. Proses pembelajaran memerlukan
data. Data yang digunakan pada proses pembelajaran disebut data latih atau data
training, sedangkan data yang digunakan pada proses predeksi disebut data uji atau
data testing.
Kasus klasifikasi dapat dibedakan berdasarkan tipe masalah yang umumnya
ditemui, yaitu (Faisal & Nugrahadi, 2019):
1. Klasifikasi 1 class.
2. Klasifikasi 2 class (binary).
3. Klasifikasi multiclass, berada lebih dari 2 class
Dalam text mining, klasifikasi mengacu kepada aktifitas menganalisis atau
mempelajari himpunan dokumen teks pre-classified untuk memperoleh suatu
model atau fungsi yang dapat digunakan untuk mengelompokkan dokumen teks lain
yang belum diketahui kelasnya ke dalam satu atau lebih kelas kelas predefined
tersebut (Darujati et al., 2012).
10
UIN Syarif Hidayatullah Jakarta
2.1.1 Algoritma Klasifikasi
Algoritma klasifikasi yang banyak digunakan secara luas, yaitu
Decision / Classification Trees, Bayesian Classifiers / Naive Bayes
Classifiers, Neural Networks, Analisa Statistik, Algoritma Genetika, Rough
Sets, K-Nearest Neighbor, Metode Rule Based, Memory Based Reasoning
dan Support Vector Machines (SVM) (Susandi & Sholahudin, 2016) .
Klasifikasi terdapat beberapa implementasi algoritma yang
merupakan kajian di bidang statistika dan machine learning yang dapat
diterapkan pada fase ini, di antaranya adalah Naive Bayesian, Decision Tree,
k-Nearest Neighbor, Neural Network, dan Support Vector Machines
(Darujati et al., 2012).
Tabel 2.1 Perbandingan Algoritma Klasifikasi Teks
(Sumber : Darujati et al., 2012)
No Classifier Metode
1. Naive Bayes Classifier Menghitung probabilitas dari suatu
dokumen untuk ikut ke suatu kelas
berdasarkan pada kehadiran dari kata
yang sama didalam dokumen lain
yang telah ada di dalam kelas
tersebut.
2. K-Nearest Neighbor Mencari sebanyak k dokumen paling
mirip dan menempatkan dokumen ke
kelas dimana k dokumen tersebut
ditempatkan sebelumnya. Namun
memiliki kinerja lambat karena setiap
dokumen harus dibandingkan ke
semua dokumen lain
11
UIN Syarif Hidayatullah Jakarta
3. Decision Tree Memisahkan dokumen - dokumen
secara hirarki di dalam struktur
pohon, dimana setiap node merupakan
term yang relevan dan ujung setiap
cabang adalah kelas. Decision tree
memerlukan optimisasi untuk
menyelesaikan overfitting.
4. Support Vector Machine Menggambar antara term yang
berkontribusi dan tidak terhadap suatu
dokumen yang akan ditempatkan ke
suatu kelas tertentu. Kelas didasarkan
pada kehadiran dari term yang
berkontribusi.
SVM mudah terjadi error dalam data
training.
Menurut Diandra, Naïve Bayes Classifier seringkali bekerja jauh
lebih baik dan memiliki tingkat kesalahan yang minimum dibandingkan
dengan metode klasifikasi yang lain meskipun dengan menggunakan
rancangan yang “naive” dan dengan asumsi yang disederhanakan. Naïve
Bayes Classifier bekerja dengan mengestimasi peluang kelas bersyarat
dengan mengasumsikan bahwa setiap atribut saling bebas antara atribut lain
terhadap kelas yang diberikan (Darujati et al., 2012).
2.2 Text Mining
Text mining adalah bidang interdisipliner yang mengacu pada information
retrival, data mining, machine learning, statistik, dan komputasi linguistik.
Sebagian besar informasi disimpan sebagai teks seperti artikel berita, makalah
teknik, buku, perpustakaan digital, pesan email, blog, dan halaman web. Oleh
karena itu, penelitian mengenai text mining telah banyak dilakukan. Tujuan
utamanya adalah memperoleh informasi berkualitas tinggi dari teks. Ini biasanya
12
UIN Syarif Hidayatullah Jakarta
dilakukan melalui penemuan pola dan tren dengan cara seperti pembelajaran pola
statistik, pemodelan topik, dan pemodelan bahasa statistik (Jiawei Han, Micheline
Kamber, 2011).
Tipe tugas text mining yang umum biasanya seperti kelassasi teks,
pengelompokan teks, ekstraksi konsep / entitas, produksi taksonomi granular,
analisis sentimen, peringkasan dokumen, dan pemodelan entitas-hubungan (mis.,
hubungan pembelajaran antara entitas yang disebutkan). Contoh lain termasuk data
mining multibahasa, analisis teks multidimensi, kontekstual text mining, dan
analisis kepercayaan dan evolusi dalam data teks, serta text mining aplikasi
keamanan, analisis literatur biomedis, analisis media online, dan analitik
pengelolaan hubungan pelanggan. Berbagai macam text mining dan analisis
perangkat lunak dan alat tersedia di lembaga akademik, forum open-source, dan
industri. Text mining sering juga menggunakan WordNet, Web Sematic, Wikipedia,
dan lainnya sumber informasi untuk meningkatkan pemahaman dan mining pada
data teks (Jiawei Han, Micheline Kamber, 2011).
Menurut Sihombing (Aprilianti P, 2015) secara umum teks mining
bertujuan untuk menggali informasi dari sekumpulan dokumen teks dalam ukuran
besar dan dalam format yang tidak terstruktur. Secara khusus, tujuan dari text
mining dapat dibagi menjadi dua:
1. Pengkelassasian data teks (text categorization)
Dalam pengkelassasian, text mining dipergunakan sebagai alat untuk
menemukankelas yang sesuai dengan kelas yang telah ditentukan (supervised
learning).
2. Pengelompokan data teks (text clustering)
Pada pengelompokan, text mining berfungsi sebagai alat untuk
mengelompokkan data teks berdasarkan kesamaan karakteristik, dan clustering
dapat digunakan untuk memberikan label pada kelas yang belum diketahui
(unsupervised learning).
Menurut (Andini, 2013), Proses Text Mining dibagi menjadi 3 tahap utama
yaitu text preprocessing, text transforming, dan pattern discovery.
13
UIN Syarif Hidayatullah Jakarta
2.2.1 Text Preprocessing
Pada tahap ini dilakukan proses tokenizing yaitu tahap pemotongan
string input berdasarkan tiap kata yang menyusunnya dan menghilangkan
delimiter-delimiter seperti tanda titik(.), koma(,), spasi, dan karakter angka
yang ada pada kata tersebut. Selain itu pada tahapan ini biasanya juga
dilakukan case folding, yaitu pengubahan karakter huruf besar menjadi huruf
kecil (Andini, 2013).
2.2.2 Text Transformation
Text transformation disebut juga proses filtering. Pada tahap ini
tindakan yang dilakukan adalah menghilangkan stopword (stopword
removal) dan stemming terhadap kata yang berimbuhan (Andini, 2013).
Stopword removal merupakan proses untuk menghilangkan
stopwords (kata-kata yang tidak deskriptif yang dapat dibuang dalam
pendekatan bag-of-words). Proses ini bertujuan untuk mengurangi jumlah
kata (Rahman, Wiranto, & Doewes, 2017).
Stemming adalah tahap mencari root kata atau kata dasar dari tiap kata
hasil filtering. Stemming merupakan suatu proses yang terdapat dalam sistem
IR yang mentransformasikan kata-kata yang terdapat dalam suatu dokumen
ke kata-kata akar atau dasarnya (root word) dengan menggunakan aturan-
aturan tertentu (Widodo & Pratiwi, 2017).
2.2.3 Pattern Discovery
Tahap ini berusaha menemukan pola atau pengetahuan dari
keseluruhan teks. Dalam text mining terdapat dua teknik pembelajaran pada
tahap pattern discovery ini, yaitu unsupervised dan supervised learning.
Adapun perbedaan antara keduanya adalah pada supervised learning terdapat
label atau nama kelas pada data latih (supervisi) dan data baru
diklasifikasikan berdasarkan data latih. Sedangkan pada unsupervised
learning tidak terdapat label atau nama kelas pada data latih, data latih
14
UIN Syarif Hidayatullah Jakarta
dikelompokkan berdasarkan ukuran kemiripan pada suatu kelas (Andini,
2013).
2.3 Naïve Bayes Classifier (NBC)
Naïve Bayes Classifier merupakan metode probabilistik yang
mengasumsikan bahwa keberadaan atribut sebuah kelas tertentu tidak memiliki
keterkaitan dengan atribut-atribut lain. Asumsi tersebut dikenal dengan class
conditional independence yang dibuat untuk memudahkan perhitungan-
perhitungan, sehingga perhitungan tersebut dianggap “naive”, dalam
implementasinya maksud naïve tersebut adalah bahwa kemunculan suatu term kata
dalam suatu kalimat tidak dipengaruhi kemungkinan kata – kata yang lain dalam
kalimat padahal dalam kenyataanya bahwa kemungkinan kata dalam kalimat sangat
dipengaruhi kemungkinan keberadaan kata-kata yang dalam kalimat (Sacra et al.,
2017).
Salah satu kelebihan penggunaan Naive Bayes adalah metode ini hanya
membutuhkan jumlah data latih yang sedikit untuk menentukan estimasi parameter
yang diperlukan dalam proses klasifikasi serta menghasilkan akurasi yang tinggi.
Sehingga membuat klasifikasi ini prosesnya menjadi cepat dan sederhana (Pattekari
& Parveen, 2012).
Naïve Bayes menggunakan konsep dasar teorema Bayes, yaitu melakukan
klasifikasi dengan melakukan nilai probabilitas, berikut adalah persamaan dari
naïve bayes (Sacra et al., 2017):
p(wkj | ci) = 𝑓(𝑤𝑘𝑗,𝐶𝑖)+1
𝑓(𝑐𝑖)+|𝑤| (2.1)
Dimana :
𝑓(w𝑘𝑗, 𝑐𝑖) adalah nilai kemunculan kata W𝑘𝑗 pada kelas 𝑐𝑖
𝑓(𝑐𝑖) adalah jumlah keseluruhan kata pada kelas 𝑐𝑖
|𝑤| adalah jumlah keseluruhan fitur/kata yang digunakan
15
UIN Syarif Hidayatullah Jakarta
Dan persamaan berikut untuk penentuan hasil klasifikasi dengan menghitung
perkalian nilai probabilitas setiap kata pada setiap kelas dan menentukan nilai
tertinggi dari semua kelas :
𝑐∗ = 𝑎𝑟𝑔𝑚𝑎𝑥
𝑐 ∈𝐶𝑃 ∏ 𝑃(𝑊𝑘|𝑐) × 𝑃(𝑐)𝑘 (2.2)
dengan 𝑃(𝑐) = 𝑁𝑐
𝑁 (2.3)
P(c) adalah nilai probabilitas setiap kelas c
Nc adalah jumlah kelas c
N adalah jumlah seluruh kelas.
2.4 Confix Stripping Stemmer
Pada tahun 2007 algoritma nazief stemmer kemudian dikembangkan lagi
oleh Jelita Asian, dengan menambahkan beberapa perbaikan yang bertujuan untuk
meningkatkan hasil stemming yang diperoleh. Algoritma ini kemudian dikenal
sebagai confix-stripping stemmer (Ariadi & Fithriasari, 2015). Algoritma confix-
stripping stemmer adalah algoritma yang digunakan untuk melakukan proses
stemming terhadap kata-kata berimbuhan (Adriani, Asian, Nazief, Williams, &
Tahaghoghi, 2007).
Algoritma Confix-stripping stemmer mempunyai aturan imbuhan sendiri
dengan model sebagai berikut :
(2.4)
Keterangan :
AW : Awalan
AK : Akhiran
KK : Kata ganti kepunyaan
P : Partikel
[[[AW + ]AW +]AW +] Kata-Dasar [[+AK][+KK][+P]
16
UIN Syarif Hidayatullah Jakarta
Langkah-langkah algoritma confix-stripping stemmer adalah sebagai berikut
(Kurniawan, Effendi, & Sitompul, 2012) :
1) Kata yang belum di-stemming dibandingkan ke dalam database kamus kata
dasar. Jika ketemu, maka kata tersebut diasumsikan sebagai kata dasar dan
algoritma berhenti. Jika kata tidak sesuai dengan kata dalam kamus, lanjut
ke langkah 2.
2) Jika kata di-input memiliki pasangan awalan-akhiran “be-lah”,”be-
an”,”me-i”,”di-i”,”pe-i”, atau “te-i” maka langkah stemming selanjutnya
adalah 5, 3, 4, 5, 6, tetapi jika kata yang di-input tidak memiliki pasangan
awalan-akhiran tersebut, langkah stemming berjalan normal yaitu 3, 4, 5, 6.
3) Hilangkan partikel dan kata ganti kepunyaan. Pertama hilangkan partikel
(“-lah”, “-kah”, “-tah”, “-pun”). Setelah itu hilangkan juga kata ganti
kepunyaan (“-ku”, “-mu”, atau “-nya”). Contoh : kata “bajumulah”, proses
stemming pertama menjadi “bajumu” dan proses stemming kedua menjadi
“baju”. Jika kata “baju” ada di dalam kamus maka algoritma berhenti.
Sesuai dengan model imbuhan, menjadi :
[[[AW+]AW+]AW+] Kata Dasar [+AK]
4) Hilangkan juga Akhiran (“-i”,”-an”, dan “-kan”), sesuai dengan model
imbuhan, maka menjadi :
[[[AW+]AW+]AW+] Kata Dasar
Contoh : kata “membelikan” di-stemming menjadi ”membeli”, jika tidak
ada dalam database kata dasar maka dilakukan proses penghilangan awalan.
5) Penghilangan awalan (“be-“, ”di-“, ”ke-“, ”me-”, ”pe-”, ”se-”,
dan “te-“) mengikuti langkah-langkah berikut :
a. Algoritma akan berhenti jika :
i. Awalan diidentifikasi bentuk sepasang imbuhan yang tidak
diperbolehkan dengan akhiran (berdasarkan tabel 1) yang
dihapus pada langkah 4.
ii. Diidentifikasi awalan yang sekarang identik dengan awalan
yang telah dihapus sebelumnya atau,
17
UIN Syarif Hidayatullah Jakarta
iii. Kata tersebut sudah tidak memiliki awalan.
b. Identifikasi jenis awalan dan peluruhannya bila diperlukan.jenis
awalan ditentukan dengan aturan dibawah ini.
i. Jika awalan dari kata adalah “di-”, “ke-”, atau “se-” maka
awalan dapat langsung dihilangkan.
ii. Hapus awalan “te-”, “be-”, “me-”, atau “pe-” yang
menggunakan aturan peluruhan yang dijelaskan pada tabel 2.4.
Sebagai contoh kata “menangkap”, setelah menghilangkan awalan “me-“
maka kata yang didapat adalah “nangkap”. Karena kata “nangkap” tidak
ditemukan dalam database kata dasar maka karakter “n” diganti dengan
karakter “t” sehingga dihasilkan kata “tangkap” dan kata “tangkap”
merupakan kata yang sesuai dengan kata yang ada di database kata dasar,
maka algoritma berhenti.
6) Jika semua langkah gagal, maka kata yang diuji pada algoritma ini dianggap
sebagai kata dasar.
Tabel 2.2 Kombinasi Prefiks Dan Sufiks Yang Tidak Diperbolehkan
(Sumber : Adriani et al., 2007)
Awalan ( Prefiks) Akhiran (Suffiks)
be- -i
di- -an
ke- -i –kan
me- -an
se- -i –kan
te- -an
Berikut merupakan tabel aturan peluruhan imbuhan pada algoritma confix-
stripping stemmer.
Tabel 2.3 Aturan Peluruhan Kata Dasar
(Sumber : Adriani et al., 2007)
18
UIN Syarif Hidayatullah Jakarta
Aturan Bentuk Awalan Peluruhan
1 berV… ber-V… | be-rV…
2 belajar… bel-ajar
3 beC1erC2… be-C1erC2…dimana C1!={'r'|'l'}
4 terV… ter-V…|te-rV…
5 terCer… ter-Cer…dimana C!='r'
6 teC1erC2 te-C1erC2…dimana C1!='r'
7 me{l|r|w|y}V… me-{l|r|w|y}V…
8 mem{b|f|v}… mem-{b|f|v}…
9 mempe… Me m-pe…
10 mem{rV|V}… me-m{rV|V}…|me-p{rV|V}…
11 men{c|d|j|z}… men-{c|d|j|z}…
12 menV… me-nV…|me-tV…
13 meng{g|h|q|k}… meng-{g|h|q|k}…
14 mengV… meng-V…|meng-kV…
15 mengeC menge-C
16 menyV… me-ny…| meny-sV…
17 mempV… mem-pV…
18 pe{w|y}V… pe-{w|y}V…
19 perV… per-V…|pe-rV…
20 pem{b|f|v}… pem-{b|f|v}…
21 pem{rV|V}… pe-m{rV|V}…|pe-p{rV|V}
22 pen{c|d|j|z}… pen-{c|d|j|z}…
23 penV… pe-nV…|pe-tV…
24 peng{g|h|q} peng-{g|h|q}
25 pengV peng-V|peng-kV
26 penyV… pe-nya|peny-sV
27 pelV.. pe-lV…; kecuali untuk kata "pelajar"
19
UIN Syarif Hidayatullah Jakarta
menjadi "ajar"
28 peCP pe-CP…dimana C!={r|w|y|l|m|n} dan
P!='er'
29 perCerV Per-CerV… dimana C!={r|w|y|l|m|n}
2.5 Seleksi Fitur (Feature Selection)
Seleksi fitur (kata) merupakan tahap lanjut dari pengurangan dimensi
pada proses transformasi teks. Walaupun tahap sebelumnya sudah melakukan
penghapusan kata-kata yang tidak deskriptif (stopwords), namun tidak semua kata-
kata di dalam dokumen memiliki arti penting. Oleh karena itu, untuk mengurangi
dimensi, seleksi dilakukan terhadap kata-kata yang relevan atau kata-kata yang
benar-benar merepresentasikan isi dari suatu dokumen (Sanjaya & Absar, 2015).
2.6.1 Chi-Square (x2)
Chi-square (𝑥2) merupakan suatu perhitungan distribusi dalam statistika
yang mengukur nilai ketergantungan antara term dan kelas. Manning et al
menyatakan bahwa Chi-square (𝑥2) digunakan untuk menguji independensi antara
dua kejadian yaitu kejadian kemunculan kata unuk dan kejadian kemunculan kelas.
Hal ini disesuaikan dengan persamaan dibawah ini (Sacra et al., 2017) :
x2(wk , ci)=𝑁(𝑡𝑟)(𝐴𝐷−𝐶𝐵)2
(𝐴+𝐶)(𝐵+𝐷)(𝐴+𝐵)(𝐶+𝐷) (2.5)
Dimana:
N (𝑡𝑟) : jumlah dokumen dalam training set
A : jumlah dokumen dalam 𝑐𝑖 yang mengandung 𝑤𝑘
B : jumlah dokumen yang bukan kelas 𝑐𝑖, tapi mengandung 𝑤𝑘
C : jumlah dokumen dalam 𝑐𝑖 yang tidak mengandung 𝑤𝑘
D : jumlah dokumen yang tidak dalam 𝑐𝑖 dan tidak mengandung 𝑤𝑘
20
UIN Syarif Hidayatullah Jakarta
Kemudian diambil kata-kata yang memiliki nilai chi square lebih besar dari
nilai kritis pada taraf nyata α 0.05, 0.01, 0.005, dan 0.001 yaitu 3.84, 6.63, 7.83, dan
10.83. Semakin kecil taraf nyata α dan semakin besar nilai kritis, maka jumlah
feature yang dihasilkan akan semakin sedikit dan akan mengurangi beban database.
Sehingga menghasilkan kata-kata yang merupakan ciri dari suatu kategori tertentu
yang selanjutnya akan digunakan dalam proses klasifikasi (Rahmad & Pribadi,
2015).
2.6 Studi Pustaka
Menurut Sugiyono, studi kepustakaan merupakan studi terhadap kajian
teoritis dan referensi lain yang berkaitan dengan nilai, budaya dan norma yang
berkembang pada situasi sosial yang diteliti, selain itu studi kepustakaan sangat
penting dalam melakukan penelitian, hal ini dikarenakan penelitian tidak akan lepas
dari literatur-literatur ilmiah. Penulis menggunakan metode studi pustaka dalam
pengumpulan data karena metode ini sangat cocok dilakukan untuk mengumpulkan
data dan informasi sebagai bahan dasar peneliti dan acuan dalam penelitian
(Sugiyono, 2012).
2.7 Metode Simulasi
Metode Simulasi adalah suatu metode untuk melakukan simulasi dan
pemodelan yang diadaptasi dari sebuah penelitian berjudul “Wireless Sensor
Networks: Modeling and Simulation” yang dilakukan oleh Sajjad A. Madani, Jawad
Kazmi, dan Stefan Mahlknecht pada tahun 2010. Pada penelitian tersebut metode
simulasi digunakan untuk melakukan pemodelan dan simulasi terhadap penelitian
Wireless Sensor Network (WSN).
Metode Simulasi merupakan metode pelatihan yang meragakan sesuatu
dalam bentuk tiruan yang mirip dengan keadaan yang sesungguhnya dengan
penggambaran suatu sistem atau proses dengan peragaan berupa model statistik
atau pemeranan. Metode simulasi terdiri dari atas beberapa tahapan, yaitu (Madani,
Kazmi, & Mahlknecht, 2010):
a. Problem Formulation
21
UIN Syarif Hidayatullah Jakarta
Proses simulasi dimulai dengan merumuskan masalah yang memerlukan
pemecahan dan pemahaman. Pada tahap ini, Anda harus memahami perilaku
sistem (sistem natural atau pun sistem buatan), mengatur operasi sistem sebagai
objek yang akan diteliti dengan menganalisis berbagai solusi alternatif dan
menyelidiki hasil yang sudah ada sebelumnya dengan permasalahan yang sama.
b. Conceptual Model
Langkah ini dimulai dengan mendeskripsikan struktur dan perilaku sistem serta
mengidentifikasi semua objek dengan atribut. Anda juga harus menentukan
variabel dan hubungan sistem dengan penelitian.
c. Input & Output Data
Pada tahap ini, Anda harus mempelajari sistem untuk mendapatkan data input
dan output. Anda harus mengamati dan mengumpulkan atribut yang dipilih
dalam tahap sebelumnya. Pemilihan ukuran sampel yang valid secara statistik
dan format data yang dapat diproses dengan komputer sangat penting.
d. Modeling
Pada tahap pemodelan, Anda harus membangun representasi dari sistem
berdasarkan model konseptual dan input & output data yang dikumpulkan
secara rinci. Model ini dibangun dengan mendefinisikan objek, atribut, dan
metode menggunakan paradigma yang dipilih.
e. Simulation
Selama tahap simulasi, Anda harus memilih mekanisme untuk menerapkan
model simulasi yang akan dibangun. Mungkin perlu untuk mendefinisikan
flowchart simulasi dan menerjemahkannya ke dalam model simulasi.
f. Verification and Validation
Verifikasi terkait dengan konsistensi, sedangkan validasi difokuskan pada
korespondensi antara model dan realitas. Berdasarkan hasil yang diperoleh
selama tahap ini, model dan implementasinya mungkin perlu disempurnakan.
Proses verifikasi dan validasi bukan merupakan fase yang menentukan berhasil
atau tidaknya simulasi dilakukan, tetapi merupakan fase yang tak terpisahkan
dengan fase yang lain.
g. Experimentation
22
UIN Syarif Hidayatullah Jakarta
Anda harus mengevaluasi output dari simulasi, menggunakan korelasi statistik
untuk menentukan tingkat presisi yang mewakilkan kinerja dari simulasi
tersebut. Fase ini dimulai dengan membuat desain eksperimen, menggunakan
teknik yang berbeda. Beberapa teknik tersebut meliputi, analisis sensitivitas,
optimasi, pengurangan varian (untuk mengoptimalkan hasil dari sudut pandang
statistik), dan ranking serta penyeleksian.
h. Output Analysis
Output simulasi dianalisis untuk memahami perilaku sistem. Output ini
digunakan untuk mendapatkan respon tentang perilaku sistem yang asli. Pada
tahap ini, alat visualisasi dapat digunakan untuk membantu proses tersebut.
Tujuan dari visualisasi adalah untuk memberikan pemahaman yang lebih dalam
mengenai sistem yang sedang diteliti serta membantu dalam mengeksplorasi
data numerik yang dihasilkan oleh simulasi.
2.8 Confusion Matrix
Pada data mining untuk mengukur atau ada beberapa cara untuk mengukur
kinerja dari model yang dihasilkan salah satunya menggunakan confusion matriks
(akurasi). Confusion matrix adalah suatu metode yang digunakan untuk melakukan
perhitungan akurasi pada konsep data mining (Rosandy, 2016).
Tabel 2.4 Confusion Matrix Dari Classifier
(Sumber : Liu, 2011)
Actual Positive Actual Negative
Classified Positive TP FP
Classified Negative FN TN
Dimana :
1. True Positive (TP) : Nilai yang akan didapat ketika hasil prediksi true(bernilai 1)
dan nilai sebenarnya true(bernilai 1).
23
UIN Syarif Hidayatullah Jakarta
2. True Negative (TN) : Nilai yang akan didapat ketika hasil prediksi false(bernilai
0) dan nilai sebenarnya false(bernilai 0).
3. False Positive (FP) : Nilai yang akan didapat ketika hasil prediksi true(bernilai
1) dan nilai sebenarnya false(bernilai 0).
4. False Negative (FN) : Nilai yang akan didapat ketika hasil prediksi false(bernilai
0) dan nilai sebenarnya true(bernilai 1).
Selanjutnya dari Tabel 2.4 tersebut dapat ditarik beberapa kesimpulan
performansi dari hasil klasifikasi berupa (Liu, 2011) :
• Precision
Precision adalah perhitungan yang digunakan untuk mengetahui seberapa
banyak persentase prediksi klasifikasi yang di prediksi true dan terbukti true
(TP) dibandingkan dengan jumlah keseluruhan prediksi bernilai true.
Persamaan (2.6) merupakan persamaan untuk menghitung precision:
Precision = 𝑇𝑃
𝑇𝑃+𝐹𝑃 ( 2.6 )
• Recall
Recall adalah perhitungan yang digunakan untuk mengetahui seberapa banyak
persentase prediksi klasifikasi yang di prediksi true dan terbukti true (TP)
dibandingkan dengan keseluruhan jumlah data aktual bernilai true. Persamaan
(2.7) merupakan persamaan untuk menghitung recall :
Recall = 𝑇𝑃
𝑇𝑃+𝐹𝑁 ( 2.7 )
• F-Measure (F1)
F-Measure adalah perhitungan terhadap penggabungan nilai precision dan
recall. Nilai yang dihasilkan pada perhitungan F-Measure ini merupakan nilai
yang mewakili keseluruhan kinerja sistem. Semakin besar nilai F-Measure
yang dihasilkan maka semakin baik performansinya. Persamaan (2.8)
merupakan persamaan untuk menghitung nilai F-Measure :
F-Measure = 2 𝑥𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑥 𝑅𝑒𝑐𝑎𝑙𝑙
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑅𝑒𝑐𝑎𝑙𝑙 ( 2.8 )
• Accuracy
Accuracy adalah jumlah dokumen yang diklasifikasikan dengan benar, baik
24
UIN Syarif Hidayatullah Jakarta
itu true positive maupun true negative. Persamaan (2.9) merupakan
deskripsi dari perhitungan Accuracy.
Accuracy = 𝑇𝑃+𝑇𝑁
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 ( 2.9 )
2.9 PHP
Menurut Wahana Komputer (2015), Bahasa pemrograman PHP merupakan
bahasa pemrograman untuk membuat website yang bersifat server side scripting.
PHP memungkinkan anda untuk membuat halaman website yan bersifat dinamis.
PHP dapat dijalankan pada berbagai macam sistem operasi (OS) seperti Windows,
Linux, dan Mac OS. Selain Apache, PHP juga mendukung beberapa web server
lain, seperti Microsoft IIS, Caudium, PWS, dan lain sebagainya.
PHP dapat memanfaatkan database untuk menghasilkan halaman web yang
dinamis. Sistem manajemen database yang sering digunakan bersama PHP adalah
MySQL. Namun, PHP juga mendukung Database Oracle, Microsoft Acces,
Interbase, d-Base, PostgreSQL, dan sebagainya.
Hingga kini PHP telah berkembang hingga versi ke 5.4.16. PHP 5xxx
mendukung penuh Object Oriented Programming (OOP), integrasi ML,
mendukung semua ekstensi terbaru MySQL, pengembangan web services dengan
SOAP dan REST, serta ratusan peningkatan kemampuan lainnya dibandingkan
versi sebelumnya. Sama dengan web server lainnya, PHP juga bersifat open source
sehingga setiap orang dapat menggunakannya dengan gratis (Komputer, 2015).
2.10 XAMPP
Menurut Wahana Komputer (2015), XAMPP merupakan singkatan dari X
(empat sistem operasi apapun), Apache, MySQL, PHP, Perl. XAMPP adalah tool
yang menyediakan paket perangkat lunak dalam satu buah paket.
Pada paket XAMPP telah terdapat Apache (web server), MySQL
(database), PHP (server side scripting), Pearl, FTP server, PHPMyAdmin, dan
berbagai pustaka bantu lainnya. Jika anda memiliki XAMPP, maka Anda tidak
25
UIN Syarif Hidayatullah Jakarta
perlu lagi melakukan instalasi dan melakukan konfigurasi web server Apache, PHP,
dan MySQL secara manual. XAMPP akan otomatis menginstalasi dan konfigurasi
untuk anda (Komputer, 2015).
2.11 MySQL
Menurut Wahana Komputer (2015), MySQL disebut SQL yng merupakan
kepanjangan dari Structured Query Language, SQL merupakan bahasa terstuktur
yang khusus digunakan untuk mengolah database . SQL pertama kali didefinisikan
oleh American National Standards Institute (ANSI) pada tahun 1986. MySQL
adalah sebuah sistem manajemen database yang bersifat open source.
MySQL merupakan pasangan serasi dengan PHP. MySQL disebut dan
dikembangkan oleh MySQL AB yang berada di Swedia. MySQL dapat digunakan
untuk membuat dan mengolah database beserta isinya. Anda dapat memanfaatkan
MySQL untuk menambahkan , mengubah dan menghapus data yang berada dalam
database.
My SQL merupakan sistem manajemen database yang bersifat relational.
Hal ini berarti semua data yang dikelola dalam database akan diletakkan pada
beberapa tabel yang terpisah, sehingga manipulasi data akan menjadi jauh lebih
cepat. MySQL dapat digunakan untuk mengelola database mulai dari yang kecil
sampai dengan yang sangat besar.
MySQL juga dapat menjalankan perintah-perintah Structured Query
Language (SQL) untuk mengelola semua database yang ada didalamnya. Hingga
kini MySQL telah berkembang hingga versi 7. MySQL 7 sudah mendukung trigger
untuk memudahkan pengelolaan tabel dalam database (Komputer, 2015).
26
UIN Syarif Hidayatullah Jakarta
2.14 Studi Literatur Sejenis
Tabel 2.5 Studi Literatur Sejenis dan Peneliti
No. Judul Text Mining Stemming Seleksi
Fitur
Klasifikasi Pengujian
Hasil
Objek
1. Klasifikasi Dokumen Karya Akhir Mahasiswa
menggunakan NBC Berdasarkan Abstrak
karya akhir di jurusan elektro UNJ (2017)
• case folding
• tokenizing,
• filtering,
• stemming
• remove
duplicate
Tidak
dijelaskan
- Naïve Bayes
Classifier
(NBC)
K-Fold Cross
Validation
Abstrak Karya
Akhir Mhs
2. Analisis Data Mining Untuk Pemetaan
Mahasiswa Yang Membutuhkan Bimbingan
Dan Konseling Menggunakan Algoritma
Naïve Bayes Classifier (2018)
Tidak
dijelaskan
Tidak
dijelaskan
-
Naïve Bayes
Classifier
(NBC)
K-Fold Cross
Validation
dengan F1-
Score
• Precision
• Recall
Data Akademik
Mahasiswa
27
UIN Syarif Hidayatullah Jakarta
• F1 score
3. 4 Komparasi Metode Klasifikasi Data Mining
Algoritma C4.5 Dan Naive Bayes Untuk
Prediksi Penyakit Hepatitis (2017)
Tidak
dijelaskan
- - Naïve Bayes
Classifier
(NBC) dan
C4.5
Confusion
Matrix Dan
Kurva ROC
Data penyakit
hepatitis dari
Machine
Learning
Repository UCI
(Universitas
California
Invene)
4. Klasifikasi Anjuran, Larangan, Dan Informasi
Pada Hadits Shahih
Bukhari Menggunakan Naïve Bayes
Classifier (2017)
• case folding
• filtering
• stopword
removal
• stemming
• tokenization
Tidak
dijelaskan
Chi-
Square
Naïve Bayes
Classifier
(NBC)
-
• Precision
• Recall
• F-measure
Hadits Bukhari
28
UIN Syarif Hidayatullah Jakarta
5. Implementasi Algoritma Multinomial Naïve
Bayes Pada Sistem Klasifikasi Surat Keluar
(2017)
• Tolowercas
e
• Tokenizing
• Stopword
removal
• stemming
Confix
Stripping
Stemmer
- Multinomial
NBC
Confusion
Matrix
• Accuracy
• Precission
• Recall
• F-Measure
Surat Keluar
6. Analisis Kinerja Algoritma Naïve Bayes
Classifier dengan Seleksi Fitur Chi Square
dan Confix Stripping Stemmer Pada Sistem
Klasifikasi Teks (2019)
• case
folding/toL
owerCase
• filtering
• stopword
removal
• stemming
tokenization
Confix
Stripping
Stemmer
Chi-
Square
Naïve Bayes
Classifier
Confusion
Matrix
• Accuracy
• Precission
• Recall
• F-Measure
Hadits Shahih
Bukhari
Berdasarkan beberapa penelitian diatas, belum ada yang melakukan penelitian mengenai klasifikasi teks dengan objek
terjemahan hadits menggunakan kombinasi Algoritma Naïve Bayes Classifier (NBC) sebagai algoritma klasifikasi, seleksi fitur dengan
29
UIN Syarif Hidayatullah Jakarta
Chi-Square, dan stemming dengan Confix Stripping Stemmer. Maka berdasarkan studi literatur yang telah dipaparkan di atas, penulis
melakukan penelitian mengenai implementasi Algoritma Naïve Bayes Classifier (NBC) pada tahapan klasifikasi dengan menambahkan
tahapan seleksi fitur sebelum proses klasifikasi menggunakan Algoritma Chi-Square dan menerapkan Algoritma Confix Stripping
Stemmer pada tahapan stemming dan data teks yang akan diklasifikasi menjadi tiga kelas yaitu Anjuran, Larangan dan Informasi adalah
terjemahan Hadits Shahih Bukhari.
30
BAB III
METODOLOGI PENELITIAN
Bab ini akan membahas tentang metode penelitian yang penulis gunakan
dalam menyusun skripsi ini. Metode penelitian yang digunakan terbagi menjadi dua
yaitu metode pengumpulan data dan metode pengembangan sistem. Penjelasan
lebih lanjutnya adalah sebagai berikut :
3.1 Metode Pengumpulan Data
Dalam penyusunan penelitian ini, dibutuhkan beberapa data dan informasi
yang relevan terkait penelitian yang dilakukan sebagai bahan pendukung kebenaran
materi uraian pembahasan. Metode pengumpulan data yang diterapkan pada
penelitian ini yaitu studi pustaka dan pengumpulan data.
3.1.1. Studi Pustaka
Pada tahapan pengumpulan data dengan cara studi pustaka, penulis
mencari referensi – referensi yang relevan dengan objek yang akan diteliti.
Pencarian referensi dilakukan di perpustakaan, toko buku, maupun secara
online melalui internet. Setelah mendapatkan referensi – referensi yang
relevan, kemudian penulis mencari berbagai informasi yang dibutuhkan
dalam penelitian ini. Adapun informasi yang didapat digunakan dalam
penyusunan landasan teori, metodologi penelitian serta pengembangan
aplikasi secara langsung. Pustaka-pustaka yang dijadikan acuan dapat dilihat
di daftar pustaka sebanyak 32 studi pustaka yang terdiri 5 buku dan 27 jurnal.
3.1.2. Pengumpulan Data
Data yang digunakan dalam penelitian ini adalah kumpulan hadits
shahih Bukhari yang bersumber dari Aplikasi LIDWA “Kitab Hadits 9 Imam”
yang kemudian akan diklasifikasi menjadi tiga kelas yaitu perintah/anjuran,
larangan, dan informasi. Dalam melakukan klasifikasi dokumen hadits,
penulis membutuhkan beberapa dokumen training (hadits yang telah
dikelaskan) dan dokumen testing (hadits yang belum memiliki kelas). Pada
31
UIN Syarif Hidayatullah Jakarta
penelitian ini digunakan 300 dokumen terjemahan hadits sebagai data
training dan 30 dokumen hadits sebagai data testing.
3.2 Metode Simulasi
Dalam penelitian ini, penulis menggunakan metode simulasi untuk melihat
hasil klasifikasi data teks terjemahan hadits menggunakan algoritma Naïve Bayes
Classifier (NBC) dengan seleksi fitur Chi-Square dan Confix Stripping Stemmer.
Metode simulasi ini dibagi menjadi delapan tahapan yang terdiri dari Problem
Formulation, Conseptual Model, Input/Output Data, Modelling, Simulation,
Verification and Validation, Experimentation, dan Output Analysis.
3.2.1 Formulasi Masalah (Problem Formulation)
Pada tahap ini dilakukan pemilihan suatu permasalahan yang penting
untuk dianalisis dan diselesaikan. Setelah melakukan studi literatur penulis
dapat memformulasikan sebuah masalah mengenai implementasi algoritma
Naïve Bayes Classifier (NBC) untuk mengklasifikasikan terjemahan hadits
Shahih Bukhari kedalam tiga kelas yaitu anjuran, larangan dan informasi
dengan seleksi fitur Chi-Square dan menerapkan algoritma Confix Stripping
Stemmer pada tahapan stemming.
3.2.2 Model Pengkonsepan (Conseptual Model)
Pada tahap ini penulis membuat model konsep yang akan dilakukan
yaitu membahas keseluruhan penelitian ini. Konsep pertama yaitu membuat
konsep pada proses text mining yang digunakan. Kedua, membuat konsep pada
data training dan data testing. Ketiga, membuat konsep untuk yaitu dengan
melihat hasil klasifikasi dan nilai presisi, recall, f-measure dan akurasi dengan
tahap uji pada skenario 1 yaitu menggunakan algoritma Naïve Bayes Classifier
(NBC) tanpa stemming dan tanpa seleksi fitur. Keempat tahap uji pada skenario
2 yaitu menggunakan algoritma Naïve Bayes Classifier (NBC) dengan seleksi
fitur Chi-Square dan tanpa stemming. Kelima tahap uji pada skenario 3 yaitu
menggunakan algoritma Naïve Bayes Classifier (NBC) dengan stemming
menggunakan Confix Stripping Stemmer dan tanpa seleksi fitur. Keenam tahap
uji pada scenario 4 yaitu menggunakan algoritma Naïve Bayes Classifier (NBC)
32
UIN Syarif Hidayatullah Jakarta
dengan stemming menggunakan Confix Stripping Stemmer dan seleksi fitur Chi-
Square.
3.2.3 Data Masukan/Keluaran (Input/Output Data)
Data masukan seperti kamus kata dasar KBBI, kamus stopword dan data
teks terjemahan hadits menjadi input pada penelitian ini. Data yang digunakan
sebanyak 300 hadits sebagai data training yang sudah diklasifikasi secara
manual kedalam tiga kelas yaitu anjuran, larangan, dan informasi, dan 30 hadits
sebagai data testing . Kitab hadits yang digunakan adalah Shahih Bukhari yang
diambil dari Aplikasi LIDWA “Kitab 9 Imam”. Data pada aplikasi ini diolah
menggunakan algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-
Square dan Confix Stripping Stemmer untuk menghasilkan output berupa hasil
klasifikasi dan nilai presisi, recall, f-measure dan akurasi dari skenario 1 yaitu
hanya menggunakan Algoritma Naïve Bayes Classifier (NBC), skenario 2 yaitu
kombinasi Naïve Bayes Classifier (NBC) dan Chi-Square, skenario 3 yaitu
kombinasi Naïve Bayes Classifier (NBC) dan Confix Stripping Stemmer, dan
skenario 4 yaitu kombinasi Naïve Bayes Classifier (NBC), Chi-Square dan
Confix Stripping Stemmer.
3.2.4 Pemodelan (Modelling)
Pada tahap ini penulis melakukan pemodelan dalam membuat
rancangan sistem yang akan dibuat secara manual. Pemodelan atau skenario
yang dibuat yaitu skenario menggunakan algoritma Naïve Bayes Classifier
(NBC) tanpa stemming dan tanpa seleksi fitur, skenario kombinasi antara
algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-Square dan
tanpa stemming, skenario kombinasi antara algoritma Naïve Bayes Classifier
(NBC) dengan Confix Stripping Stemmer dan tanpa seleksi fitur, dan skenario
terakhir yaitu kombinasi ketiga algoritma tersebut.
3.2.5 Simulasi (Simulation)
Pada tahapan ini, sisem akan dijalankan untuk mensimulasikan kinerja
masing-masing algoritma sesuai dengan konsep dan skenario yang telah
ditentukan sebelumnya. Simulasi yang akan dilakukan adalah dengan
33
UIN Syarif Hidayatullah Jakarta
melakukan input dataset latih dan uji, melakukan pelabelan terhadap data latih
secara manual untuk diklasifikasi kelasnya, melakukan pelatihan terhadap data
latih dan melakukan klasifikasi data uji. Hasil simulasi berupa perbandingan
akurasi dari algoritma yang dijadikan penelitian, kemudian akan dicatat dan
kemudian dilakukan tahap verifikasi.
3.2.6 Verifikasi dan Validasi (Verification and Validation)
Pada tahapan ini penulis melakukan verifikasi dan validasi dari tahapan
sebelumnya. Verifikasi dilakukan untuk memastikan adanya kesalahan atau
tidak yang terjadi ketika perhitungan nilai presisi, recall, f-measure dan akurasi
pada algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-Square
dan Confix Stripping Stemmer. Validasi dilakukan untuk memastikan
kesesuaian proses simulasi yang dibuat berdasarkaan model pengkonsepan
dengan formulasi masalah yang dibuat. Jika validasi tidak terpenuhi, maka
peneliti kembali ketahap conceptual model untuk membuat model
pengkonsepan yang baru.
3.2.7 Eksperimentasi (Experimentation)
Pada tahapan ini, penulis melakukan eksperimentasi sesuai dengan
model yang dibuat pada saat tahapan pemodelan. Eksperimen disini bertujuan
untuk mengevaluasi hasil simulasi aplikasi.
3.2.8 Analisis keluaran (Output Analysis)
Pada tahap terakhir ini, penulis menganalisis output simulasi yang
dilakukan pada saat eksperimentasi. Output tersebut direpresentasikan dalam
bentuk tabel dan grafik yang menyatakan nilai presisi, recall, f-measure dan
akurasi dari masing-masing skenario.
3.3 Metode Pengujian
Metode pengujian yang digunakan pada penelitian ini adalah confusion
matrix yang bertujuan untuk mengukur kinerja dari model simulasi pada sistem.
Nilai yang di hitung pada pengujian confusion matrix ini adalah nilai akurasi,
presisi, recall, dan f-measure.
34
UIN Syarif Hidayatullah Jakarta
Setelah simulasi dari setiap skenario sudah dilakukan, maka hasil
klasifikasi yang dilakukan sistem akan dibandingkan dengan klasifikasi yang
dilakukan secara manual seperti pada tabel 2.4. Kemudian hitung nilai-nilai
berikut :
1. Akurasi, bertujuan untuk mengetahui tingkat kedekatan antara nilai
prediksi dengan nilai aktual. Perhitungan nilai akurasi menggunakan
persamaan 2.9.
2. Presisi, bertujuan untuk mengetahui tingkat ketepatan antara informasi
yang diminta oleh user dengan jawaban yang diberikan oleh sistem.
Perhitungan nilai presisi menggunakan persamaan 2.6.
3. Recall, bertujuan untuk mengetahui tingkat keberhasilan sistem dalam
menemukan kembali sebuah informasi. Perhitungan nilai recall
menggunakan persamaan 2.7.
4. F-Measure, merupakan nilai yang mewakili keseluruhan kinerja sistem.
Perhitungan nilai f-measurel menggunakan persamaan 2.8.
35
UIN Syarif Hidayatullah Jakarta
3.4 Kerangka Berpikir
Gambar 3.1 Kerangka Berpikir
36
BAB IV
IMPLEMENTASI SIMULASI DAN EKSPERIMEN
4.1 Formulasi Masalah (Problem Formulation)
Pada tahap awal di metode simulasi ini yaitu formulasi masalah, penulis
melakukan identifikasi masalah berdasarkan studi literatur sejenis. Setelah
melakukan studi literatur, terdapat beberapa algoritma yang dapat digunakan dalam
pembuatan sistem klasifikasi teks salah satunya Naïve Bayes Classifier. Sebelum
proses pengklasifikasian, terdapat tahapan stemming. Salah satu metode stemming
yaitu Confix Stripping Stemmer. Tetapi, dengan banyaknya fitur dalam klasifikasi
teks dapat mengurangi performa klasifikasi, maka dari itu pemilihan fitur yang tepat
sangat diperlukan. Salah satu teknik pemilihan fitur adalah dengan teknik Chi-
Square. Implementasi dari kombinasi ketiga Algoritma/metode tersebut akan diuji
performansinya berdasarkan akurasi, presisi, recall, dan f-measure pada sistem
yang dibangun.
Dokumen teks yang akan diklasifikasi berupa terjemahan matan (isi) hadits.
Klasifikasi dibuat menjadi tiga kelas, hadits berisi perintah/anjuran, hadits larangan,
dan hadits yang hanya berisi informasi. Dokumen hadits yang digunakan adalah
terjemahan hadits shahih Imam Bukhari yang diambil dari aplikasi LIDWA “Kitab
Hadits 9 Imam”. Data training yang digunakan berjumlah 300 dengan masing-
masing 100 dokumen hadits per kelas yang telah dikelaskan sebelumnya. Dan 30
dokumen hadits sebagai data testing yang akan diimplementasi pada sistem.
4.2 Model Pengkonsepan (Conceptual Model)
Pada tahap conceptual model ini dilakukan pengkonsepan sistem yang akan
dibangun dan membahas alur keseluruhan dari penelitian ini yang berkaitan dengan
input, proses dan output. Berikut ini merupakan konsep alur keseluruhan dari sistem
yang dibangun oleh peneliti.
37
UIN Syarif Hidayatullah Jakarta
4.2.1 Model pengkonsepan text mining
Pada penelitian ini proses text mining yang digunakan yaitu
preprocessing dan transforming data. Preprocessing dan transforming data
dilakukan dengan menggunakan Bahasa pemrograman PHP. Tahap
preprocessing meliputi Case folding dan tokenizing. Sedangkan tahap
transforming meliputi stopword removal dan stemming. Tahapan stemming
hanya digunakan pada skenario 3 dan 4, dan algoritma yang digunakan untuk
stemming yaitu Confix Stripping Stemmer.
Tahap preprocessing dapat dilihat pada diagram alur gambar 4.1
berikut:
Gambar 4.1 Flowchart Preprocessing
Berikut ini penjelesan dari tahapan preprocessing :
1. Tahap pertama yaitu case folding, merupakan tahap penyeragaman dari
huruf besar menjadi huruf kecil serta menghilangkan seluruh tanda baca
pada kalimat. Berikut contoh hasil case folding :
38
UIN Syarif Hidayatullah Jakarta
Teks Case folding
Janganlah kalian berdusta
terhadapku (atas namaku), karena
barangsiapa berdusta terhadapku
dia akan masuk neraka.
janganlah kalian berdusta
terhadapku atas namaku karena
barangsiapa berdusta terhadapku
dia akan masuk neraka
2. Tahap kedua tokenizing yaitu proses pemecahan kalimat menjadi beberapa
kata (token). Berikut contoh hasil tokenizing :
Teks Tokenizing
janganlah kalian berdusta
terhadapku atas namaku karena
barangsiapa berdusta terhadapku
dia akan masuk neraka
[janganlah], [kalian], [berdusta],
[terhadapku], [atas], [namaku],
[karena], [barangsiapa], [berdusta],
[terhadapku], [dia], [akan],
[masuk], [neraka]
Tahap transforming dapat dilihat pada diagram alur gambar 4.2 berikut :
Gambar 4.2 Flowchart Transforming
39
UIN Syarif Hidayatullah Jakarta
Berikut ini penjelesan dari tahapan transforming :
1. Tahap pertama yaitu stopword removal, merupakan proses menghapus
token yang tidak memiliki makna atau tidak relevan pada suatu dataset
berdasarkan database kamus stopword yang dibentuk. Berikut contoh hasil
stopword removal :
Teks Stoword Removal
[janganlah], [kalian], [berdusta],
[terhadapku], [atas], [namaku],
[karena], [barangsiapa], [berdusta],
[terhadapku], [dia], [akan],
[masuk], [neraka]
[janganlah], [kalian], [berdusta],
[terhadapku], [namaku],
[barangsiapa], [berdusta],
[terhadapku], [neraka]
2. Tahap kedua stemming yaitu tahap pengubahan kata berimbuhan menjadi
kata dasar. tahapan ini dapat mengurangi jumlah kandungan kata. Pada
penelitian ini, metode yang digunakan untuk proses stemming adalah Confix
Stripping Stemmer. Proses peluruhan konfiks beserta penggambarannya
dijelaskan sebagai berikut :
A. Menghapus prefix I (“me-”, ”pe-”, “di-”, “te-”, “ke-”)
B. Menghapus prefix II (“be-”, “pe-”, “se-”, “ke-”)
C. menghapus suffix (“-i”, “-an”, “-kan”)
D. menghapus possessive pronoun (“-ku”, “-mu”, “-nya”)
E. menghapus partikel (“-kah”, “-lah”, “-pun”)
4.2.2 Model pengkonsepan tahap training dan testing
Pada penelitian ini data yang telah dikelaskan sebelumnya akan melalui
tahap training, sedangkan data yang belum dikelaskan akan melalui tahapan
testing.
40
UIN Syarif Hidayatullah Jakarta
Terdapat beberapa proses yang akan dilalui pada tahap training, antara
lain pengumpulan dokumen training, text preprocessing, text transforming,
seleksi fitur dan pattern discovery. Tetapi tahapan tersebut menyesuaikan pada
skenario yang digunakan. Alur proses training secara umum dapat dilihat pada
gambar 4.4 berikut :
Gambar 4.3 Flowchart Training
41
UIN Syarif Hidayatullah Jakarta
Penjelasan setiap proses yang dilakukan pada tahap training adalah
sebagai berikut :
1. Masukkan dokumen training sesuai klasifikasi yang sudah
diidentifikasi sebelumnya dan simpan dalam database.
2. Sistem menjalankan tahap text preprocessing terhadap dokumen
training.
3. Hasil tahapan text preprocessing kemudian di proses di tahap text
transforming. Pada tahap transforming
4. Kemudian sistem melakukan feature selection menggunakan Chi-
Square.
5. Setelah melewati tahap feature selection, selanjutnya sistem
melakukan proses penemuan pola (pattern discovery)
menggunakan Algoritma Naïve Bayes Classifier.
6. Sistem mendapatkan hasil probabilitas setiap kelas.
42
UIN Syarif Hidayatullah Jakarta
Secara garis besar, proses pada tahapan training dan testing sama, yaitu
pengumpulan dokumen testing, text preprocessing, text transforming, dan
pattern discovery. Tetapi pada tahap testing tidak ada proses seleksi fitur, dan
penggunaan stemming menyesuaikan pada skenario yang digunakan. Alur
proses testing secara umum dapat dilihat pada gambar 4.5 berikut :
Gambar 4.4 Flowchart Testing
43
UIN Syarif Hidayatullah Jakarta
Penjelasan setiap proses yang dilakukan pada tahap training adalah
sebagai berikut :
1. Masukkan dokumen testing yang akan diklasifikasi dan simpan
dalam database.
2. Sistem menjalankan tahap text preprocessing terhadap dokumen
training.
3. Hasil tahapan text preprocessing kemudian di proses di tahap text
transforming.
4. Setelah melewati tahap text transforming, selanjutnya sistem
melakukan proses penemuan pola (pattern discovery) menggunakan
Algoritma Naïve Bayes Classifier.
5. Sistem mendapatkan hasil klasifikasi terpilih terhadap data testing.
44
UIN Syarif Hidayatullah Jakarta
4.2.3 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier
(NBC) tanpa stemming dan tanpa seleksi fitur
Skenario pertama pada penelitian ini adalah klasifikasi menggunakan
Algoritma Naïve Bayes Classifier (NBC) tanpa melalui stemming pada tahap
text transforming dan tanpa melalui proses seleksi fitur. Alur skenario pertama
ini dapat dilihat pada gambar 4.6 berikut :
Gambar 4.5 Flowchart Skenario 1
45
UIN Syarif Hidayatullah Jakarta
Berikut penjelasan dari setiap tahapan pada proses klasifikasi
menggunakan skenario 1 :
1. Masukkan dataset (berupa dokumen training atau testing) yang akan
di proses di sistem dan simpan dalam database.
2. Sistem menjalankan tahap text preprocessing (case folding dan
tokenizing) terhadap dataset.
3. Hasil tahapan text preprocessing kemudian di proses di tahap text
transforming (stopword removal, tanpa stemming).
4. Setelah melewati tahap text transforming , selanjutnya sistem
melakukan proses penemuan pola (pattern discovery) menggunakan
Algoritma Naïve Bayes Classifier. Data yang digunakan adalah data
token hasil dari tahap transforming yaitu stopword removal. Alur
proses dengan menggunakan Naïve Bayes Classifier dapat dilihat
pada gambar 4.7 berikut:
Gambar 4.6 Flowchart Naïve Bayes Classifier
46
UIN Syarif Hidayatullah Jakarta
5. Sistem mendapatkan hasil klasifikasi.
6. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.
7. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-
measure untuk skenario 1.
4.2.4 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier
(NBC) dengan Chi-Square dan tanpa stemming
Skenario kedua pada penelitian ini adalah klasifikasi menggunakan
Algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-Square dan
tanpa melalui stemming pada tahap text transforming. Alur skenario kedua ini
dapat dilihat pada gambar 4.8 berikut :
Gambar 4.7 Flowchart Skenario 2
47
UIN Syarif Hidayatullah Jakarta
Berikut penjelasan dari setiap tahapan pada proses klasifikasi
menggunakan skenario 2 :
1. Masukkan dataset (berupa dokumen training atau testing) yang akan
di proses di sistem dan simpan dalam database.
2. Sistem menjalankan tahap text preprocessing (case folding dan
tokenizing) terhadap dataset.
3. Hasil tahapan text preprocessing kemudian di proses di tahap text
transforming (stopword removal, tanpa stemming).
4. Setelah melewati tahap text transforming , selanjutnya sistem
melakukan proses seleksi fitur dengan Chi-Square sesuai taraf nyata
(0.05, 0.01, 0.005, 0.001) yang sudah dipilih sebelumnya. Data
testing tidak melalui proses seleksi fitur. Alur proses seleksi fitur
dapat dilihat pada gambar 4.9 berikut :
Gambar 4.8 Flowchart Chi-Square
48
UIN Syarif Hidayatullah Jakarta
5. Setelah melewati tahap seleksi fitur , selanjutnya sistem melakukan
proses penemuan pola (pattern discovery) menggunakan Algoritma
Naïve Bayes Classifier. Proses penemuan pola mengambil data
token hasil dari Chi-Square.
6. Sistem mendapatkan hasil klasifikasi.
7. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.
8. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-
measure untuk skenario 2.
4.2.5 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier
(NBC) dengan Confix Stripping Stemmer dan tanpa seleksi fitur
Skenario ketiga pada penelitian ini adalah klasifikasi menggunakan
Algoritma Naïve Bayes Classifier (NBC) dengan Algoritma Confix Stripping
Stemmer untuk proses stemming dan tanpa melalui proses seleksi fitur. Alur
skenario ketiga ini dapat dilihat pada gambar 4.10 berikut :
Gambar 4.9 Flowchart Skenario 3
49
UIN Syarif Hidayatullah Jakarta
Berikut penjelasan dari setiap tahapan pada proses klasifikasi
menggunakan skenario 3 :
1. Masukkan dataset (berupa dokumen training atau testing) yang akan
di proses di sistem dan simpan dalam database.
2. Sistem menjalankan tahap text preprocessing (case folding dan
tokenizing) terhadap dataset.
3. Hasil tahapan text preprocessing kemudian di proses di tahap text
transforming (stopword removal dan stemming dengan Confix
Stripping Stemmer).
4. Setelah melewati tahap text transforming, selanjutnya sistem
melakukan proses penemuan pola (pattern discovery) menggunakan
Algoritma Naïve Bayes Classifier. Data yang digunakan adalah data
token hasil Confix Stripping Stemmer.
5. Sistem mendapatkan hasil klasifikasi.
6. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.
7. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-
measure untuk skenario 3.
50
UIN Syarif Hidayatullah Jakarta
4.2.6 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier
(NBC) dengan Confix Stripping Stemmer dan Chi-Square
Skenario keempat pada penelitian ini adalah klasifikasi menggunakan
Algoritma Naïve Bayes Classifier (NBC) dengan Algoritma Confix Stripping
Stemmer untuk proses stemming dan menggunakan seleksi fitur Chi-Square.
Alur skenario keempat ini dapat dilihat pada gambar 4.11 berikut :
Gambar 4.10 Flowchart Skenario 4
51
UIN Syarif Hidayatullah Jakarta
Berikut penjelasan dari setiap tahapan pada proses klasifikasi
menggunakan skenario 4 :
1. Masukkan dataset (berupa dokumen training atau testing) yang akan
di proses di sistem dan simpan dalam database.
2. Sistem menjalankan tahap text preprocessing (case folding dan
tokenizing) terhadap dataset.
3. Hasil tahapan text preprocessing kemudian di proses di tahap text
transforming (stopword removal, dan stemming dengan Confix
Stripping Stemmer).
4. Setelah melewati tahap text transforming , selanjutnya sistem
melakukan proses seleksi fitur dengan Chi-Square sesuai taraf nyata
(0.05, 0.01, 0.005, 0.001) yang sudah dipilih sebelumnya. Data
testing tidak melalui proses seleksi fitur.
5. Setelah melewati tahap seleksi fitur , selanjutnya sistem melakukan
proses penemuan pola (pattern discovery) menggunakan Algoritma
Naïve Bayes Classifier.
6. Sistem mendapatkan hasil klasifikasi.
7. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.
8. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-
measure untuk skenario 4.
4.3 Data Masukan/Keluaran (Input/Output Data)
4.3.1 Data Masukan (Input)
Data masukan seperti kamus kata dasar KBBI, kamus stopword dan
data teks terjemahan hadits menjadi input pada penelitian ini. Kitab hadits yang
digunakan adalah Shahih Bukhari yang diambil dari Aplikasi LIDWA “Kitab
9 Imam”. Data yang digunakan sebanyak 300 hadits sebagai data training dan
30 hadits sebagai data testing . Data training sebelumnya sudah diklasifikasi
secara manual kedalam tiga kelas yaitu anjuran, larangan, dan informasi,
dengan jumlah 100 hadits tiap kelas.
.
52
UIN Syarif Hidayatullah Jakarta
4.3.2 Data Keluaran (Output)
Data keluaran (output) dari simulasi ini adalah hasil klasifikasi dari 30
data testing dan nilai akurasi, presisi, recall, dan f-measure dari skenario 1,
skenario 2, skenario 3, dan skenario 4.
4.4 Pemodelan (Modelling)
4.4.1 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) tanpa
stemming dan tanpa seleksi fitur)
Skenario pertama pada penelitian ini yaitu konstruksi klasifikasi text
terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi
dengan menggunakan algoritma Naïve Bayes Classifier (NBC). Pada skenario
ini, tidak digunakan proses stemming pada tahap transforming. Proses training
dan testing pada skenario ini melalui tahapan-tahapan yang sama. Berikut
penjelasan keseluruhan konstruksi klasifikasi terjemahan hadits pada skenario
1 :
1. Mengumpulkan data training dan data testing kemudian siapkan
masing-masing dalam file dengan format .csv. Data training terlebih
dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,
larangan, dan informasi.
2. Melakukan proses text mining untuk data training sesuai dengan
tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan
masing-masing kelas berjumlah 3 terjemahan hadits.
Contoh data training terjemahan hadits
No. Teks Kelas
1. "Jika anjing menjilat bejana seorang
dari kalian, maka hendaklah ia cuci
hingga tujuh kali."
anjuran
2. "Hendaklah kalian mulai dari yang
sebelah kanan dan anggota wudhunya."
anjuran
53
UIN Syarif Hidayatullah Jakarta
3. "Barangsiapa berwudhu hendaklah
mengeluarkan (air dari hidung), dan
barangsiapa beristinja' dengan batu
hendaklah dengan bilangan ganjil."
anjuran
4. "Janganlah kalian kembali menjadi
kafir, sehingga kalian saling
membunuh satu sama lain."
larangan
5. "Janganlah salah seorang dari kalian
sengaja shalat ketika matahari sedang
terbit dan atau ketika saat terbenam."
larangan
6. “Janganlah kalian larang para wanita
mendatangi masjid-masjid Allah."
larangan
7. "Iman memiliki lebih dari enam puluh
cabang, dan malu adalah bagian dari
iman".
informasi
8. "Sesungguhnya ada orang-orang yang
mendistribusikan harta Allah dengan
jalan yang tidak benar, maka bagi
mereka neraka pada hari qiyamat"
informasi
9. "Sungguh celaka aku bila tidak berbuat
adil"
informasi
a. Tahap preprocessing data training
1) Case folding
No. Case folding
1. jika anjing menjilat bejana seorang dari kalian maka
hendaklah ia cuci hingga tujuh kali
2. hendaklah kalian mulai dari yang sebelah kanan dan
anggota wudhunya
54
UIN Syarif Hidayatullah Jakarta
3. barangsiapa berwudhu hendaklah mengeluarkan air
dari hidung dan barangsiapa beristinja dengan batu
hendaklah dengan bilangan ganjil
4. janganlah kalian kembali menjadi kafir sehingga
kalian saling membunuh satu sama lain
5. janganlah salah seorang dari kalian sengaja shalat
ketika matahari sedang terbit dan atau ketika saat
terbenam
6. janganlah kalian larang para wanita mendatangi
masjid-masjid allah
7. iman memiliki lebih dari enam puluh cabang dan malu
adalah bagian dari iman
8. sesungguhnya ada orang-orang yang
mendistribusikan harta allah dengan jalan yang tidak
benar maka bagi mereka neraka pada hari qiyamat
9. sungguh celaka aku bila tidak berbuat adil
2) Tokenizing
No. Tokenizing
1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]
[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]
[tujuh] [kali]
55
UIN Syarif Hidayatullah Jakarta
2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]
[kanan] [dan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [dari] [hidung] [dan]
[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]
[dengan] [bilangan] [ganjil]
4. [janganlah] [kalian] [kembali] [menjadi] [kafir]
[sehingga] [kalian] [saling] [membunuh] [satu]
[sama] [lain]
5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]
[shalat] [ketika] [matahari] [sedang] [terbit] [dan]
[atau] [ketika] [saat] [terbenam]
6. [janganlah] [kalian] [larang] [para] [wanita]
[mendatangi] [masjid] [masjid] [allah]
7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]
[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]
8. [sesungguhnya] [ada] [orang] [orang] [yang]
[mendistribusikan] [harta] [allah] [dengan] [jalan]
[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]
[pada] [hari] [qiyamat]
9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]
b. Tahap transforming data training
1) Stopword removal
No. Stopword removal
1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]
56
UIN Syarif Hidayatullah Jakarta
2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [hidung] [barangsiapa]
[beristinja] [batu] [hendaklah] [bilangan] [ganjil]
4. [janganlah] [kafir] [saling] [membunuh]
5. [janganlah] [sengaja] [shalat] [matahari] [terbit]
[terbenam]
6. [janganlah] [larang] [wanita] [mendatangi] [masjid]
[masjid] [allah]
7. [iman] [enam] [puluh] [cabang] [malu] [iman]
8. [sesungguhnya] [mendistribusikan] [harta] [allah]
[neraka] [qiyamat]
9. [sungguh] [celaka] [berbuat] [adil]
3. Token-token hasil stopword removal selanjutnya diproses ke tahap
pattern discovery. Berikut proses perhitungan pada tahapan pattern
discovery dengan menggunakan algoritma Naïve Bayes Classifier :
Hitung probabilitas kemunculan tiap kata dengan menggunakan
persamaan 2.1.
Sebagai contoh, hitung probabilitas kata “janganlah” pada setiap kelas.
P(janganlah|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
21+54
= 1
75
= 0.013333333
P(janganlah|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
57
UIN Syarif Hidayatullah Jakarta
= 3+1
17+54
= 4
71
= 0.056338028
P(janganlah|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
16+54
= 1
70
= 0.014285714
Hasil probabilitas semua kata pada data training:
No. Kata Anjuran Larangan Informasi
1 anjing 0.026666667
0.014084507 0.014285714
2 menjilat 0.026666667
0.014084507 0.014285714
3 bejana 0.026666667
0.014084507 0.014285714
4 hendaklah 0.066666667
0.014084507 0.014285714
5 cuci 0.026666667
0.014084507 0.014285714
6 tujuh 0.026666667
0.014084507 0.014285714
7 sebelah 0.026666667
0.014084507 0.014285714
8 kanan 0.026666667
0.014084507 0.014285714
9 anggota 0.026666667
0.014084507 0.014285714
10 wudhunya 0.026666667
0.014084507 0.014285714
11 berwudhu 0.026666667
0.014084507 0.014285714
12 mengeluarkan 0.026666667
0.014084507 0.014285714
13 air 0.026666667
0.014084507 0.014285714
58
UIN Syarif Hidayatullah Jakarta
14 hidung 0.026666667
0.014084507 0.014285714
15 beristinja 0.026666667
0.014084507 0.014285714
16 batu 0.026666667
0.014084507 0.014285714
17 bilangan 0.026666667
0.014084507 0.014285714
18 ganjil 0.026666667
0.014084507 0.014285714
19 janganlah 0.013333333
0.056338028 0.014285714
20 kafir 0.013333333
0.028169014 0.014285714
21 saling 0.013333333
0.028169014 0.014285714
22 membunuh 0.013333333
0.028169014 0.014285714
23 sengaja 0.013333333
0.028169014 0.014285714
24 shalat 0.013333333
0.028169014 0.014285714
25 matahari 0.013333333
0.028169014 0.014285714
26 terbit 0.013333333
0.028169014 0.014285714
27 terbenam 0.013333333
0.028169014 0.014285714
28 larang 0.013333333
0.028169014 0.014285714
29 wanita 0.013333333
0.028169014 0.014285714
30 mendatangi 0.013333333
0.028169014 0.014285714
31 masjid 0.013333333
0.042253521 0.014285714
32 allah 0.013333333
0.028169014 0.028571429
33 iman 0.013333333 0.014084507 0.042857143
34 enam 0.013333333 0.014084507 0.028571429
35 puluh 0.013333333 0.014084507 0.028571429
36 cabang 0.013333333 0.014084507 0.028571429
59
UIN Syarif Hidayatullah Jakarta
37 malu 0.013333333 0.014084507 0.028571429
38 sesungguhnya 0.013333333 0.014084507 0.028571429
39 mendistribusikan 0.013333333 0.014084507 0.028571429
40 harta 0.013333333 0.014084507 0.028571429
41 neraka 0.013333333 0.014084507 0.028571429
42 qiyamat 0.013333333 0.014084507 0.028571429
43 sungguh 0.013333333 0.014084507 0.028571429
44 celaka 0.013333333 0.014084507 0.028571429
45 berbuat 0.013333333 0.014084507 0.028571429
46 adil 0.013333333 0.014084507 0.042857143
4. Setelah semua kata pada data training mendapatkan nilai
probabilitasnya, maka selanjutnya data testing yang diproses mulai dari
preprocessing, transforming, dan pattern discovery.
Contoh data testing terjemahan hadits :
“Janganlah kalian mengangkat kepala kalian hingga para laki - laki
telah duduk.”
a. Tahap preprocessing data testing
1) Case folding
Teks Hasil Case folding
“Janganlah kalian mengangkat
kepala kalian hingga para laki
- laki telah duduk.”
janganlah kalian
mengangkat kepala kalian
hingga para laki laki telah
duduk
2) Tokenizing
Teks Hasil Tokenizing
60
UIN Syarif Hidayatullah Jakarta
janganlah kalian mengangkat
kepala kalian hingga para laki
laki telah duduk
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para]
[laki] [laki] [telah] [duduk]
b. Tahap transforming data testing
1) Stopword removal
Teks Hasil Stopword removal
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para] [lak]I
[laki] [telah] [duduk]
[janganlah] [mengangkat]
[kepala] [lak]I [laki] [duduk]
5. Pada tahap pattern discovery data testing, proses yang pertama yaitu
pengecekan apakah kata yang di proses sesuai atau sama dengan daftar
kata pada data training yang sudah memiliki nilai probabilitas
sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada
tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika
tidak ada yang sesuai dengan daftar kata pada data training maka
hitung nilai probabilitas kata tersebut dengan menggunakan persamaan
2.1.
Contoh kata “duduk” Tidak ada yang sama pada daftar kata data
training maka dihitung nilai probabilitasnya :
P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
21+54
= 1
75
= 0.013333333
P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
61
UIN Syarif Hidayatullah Jakarta
= 0+1
17+54
= 1
71
= 0.014084507
P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
16+54
= 1
70
= 0.014285714
Hasil probabilitas data testing:
No. Kata anjuran larangan informasi
1. janganlah 0.013333333 0.056338028 0.014285714
2. mengangkat 0.013333333 0.014084507 0.014285714
3. kepala 0.013333333 0.014084507 0.014285714
4. laki 0.013333333 0.014084507 0.014285714
5. duduk 0.013333333 0.014084507 0.014285714
6. Jika semua kata pada data testing sudah mendapatkan nilai
probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu
penentuan hasil klasifikasi dengan cara berikut :
Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3,
contoh hitung nilai probabilitas kelas “anjuran” :
P(anjuran) = 1
3
= 0.333333333
Hasil nilai probabilitas tiap kelas :
Kelas P (c)
62
UIN Syarif Hidayatullah Jakarta
Anjuran 0.333333333
Larangan 0.333333333
Informasi 0.333333333
Kemudian untuk menentukan hasil klasifikasi dari data testing maka
dihitung perkalian dari nilai probabilitas semua kata pada data testing
dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2 .
Perhitungan tersebut dilakukan terhadap semua kelas. Contoh :
Anjuran = 0.013333333 x 0.013333333 x 0.013333333 x 0.013333333
x 0.013333333 x 0.333333333
=0.00000000014047
Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :
Anjuran Larangan Informasi
0.00000000014047 0.00000000073900 0.0000000001983
Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang
tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai
paling tinggi. Pada contoh pemodelan skenario 1 ini hasil
klasifikasinya adalah “Larangan” dengan nilai 0.00000000073900.
4.4.2 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan
Chi-Square dan tanpa stemming
Skenario kedua pada penelitian ini yaitu konstruksi klasifikasi teks
terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi
dengan menggunakan algoritma Naïve Bayes Classifier (NBC) dan
menggunakan seleksi fitur Chi-Square. Pada skenario ini, tidak digunakan
proses stemming pada tahap transforming. Proses training dan testing pada
skenario ini melalui tahapan-tahapan yang sama pada preprocessing dan
transforming seperti pada skenario 1. Tetapi pada skenario ini, data training
akan melalui tahapan seleksi fitur, sedangkan data testing tidak melalui tahap
seleksi fitur karena jumlah fitur yang sedikit dan belum adanya pengkelasan.
63
UIN Syarif Hidayatullah Jakarta
Berikut penjelasan keseluruhan konstruksi klasifikasi terjemahan hadits pada
skenario 2 :
1. Mengumpulkan data training dan data testing kemudian siapkan
masing-masing dalam file dengan format .csv. Data training terlebih
dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,
larangan, dan informasi.
2. Melakukan proses text mining untuk data training sesuai dengan
tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan
masing-masing kelas berjumlah 3 terjemahan hadits.
Contoh data training terjemahan hadits
No. Teks Kelas
1. "Jika anjing menjilat bejana seorang
dari kalian, maka hendaklah ia cuci
hingga tujuh kali."
anjuran
2. "Hendaklah kalian mulai dari yang
sebelah kanan dan anggota wudhunya."
anjuran
3. "Barangsiapa berwudhu hendaklah
mengeluarkan (air dari hidung), dan
barangsiapa beristinja' dengan batu
hendaklah dengan bilangan ganjil."
anjuran
4. "Janganlah kalian kembali menjadi
kafir, sehingga kalian saling
membunuh satu sama lain."
larangan
5. "Janganlah salah seorang dari kalian
sengaja shalat ketika matahari sedang
terbit dan atau ketika saat terbenam."
larangan
6. 'Janganlah kalian larang para wanita
mendatangi masjid-masjid Allah."
larangan
64
UIN Syarif Hidayatullah Jakarta
7. "Iman memiliki lebih dari enam puluh
cabang, dan malu adalah bagian dari
iman".
informasi
8. "Sesungguhnya ada orang-orang yang
mendistribusikan harta Allah dengan
jalan yang tidak benar, maka bagi
mereka neraka pada hari qiyamat"
informasi
9. "Sungguh celaka aku bila tidak berbuat
adil"
informasi
a. Tahap preprocessing data training
1) Case folding
No. Case folding
1. jika anjing menjilat bejana seorang dari kalian maka
hendaklah ia cuci hingga tujuh kali
2. hendaklah kalian mulai dari yang sebelah kanan dan
anggota wudhunya
3. barangsiapa berwudhu hendaklah mengeluarkan air
dari hidung dan barangsiapa beristinja dengan batu
hendaklah dengan bilangan ganjil
4. janganlah kalian kembali menjadi kafir sehingga
kalian saling membunuh satu sama lain
5. janganlah salah seorang dari kalian sengaja shalat
ketika matahari sedang terbit dan atau ketika saat
terbenam
6. janganlah kalian larang para wanita mendatangi
masjid-masjid allah
65
UIN Syarif Hidayatullah Jakarta
7. iman memiliki lebih dari enam puluh cabang dan malu
adalah bagian dari iman
8. sesungguhnya ada orang-orang yang
mendistribusikan harta allah dengan jalan yang tidak
benar maka bagi mereka neraka pada hari qiyamat
9. sungguh celaka aku bila tidak berbuat adil
2) Tokenizing
No. Tokenizing
1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]
[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]
[tujuh] [kali]
2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]
[kanan] [dan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [dari] [hidung] [dan]
[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]
[dengan] [bilangan] [ganjil]
4. [janganlah] [kalian] [kembali] [menjadi] [kafir]
[sehingga] [kalian] [saling] [membunuh] [satu]
[sama] [lain]
5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]
[shalat] [ketika] [matahari] [sedang] [terbit] [dan]
[atau] [ketika] [saat] [terbenam]
6. [janganlah] [kalian] [larang] [para] [wanita]
[mendatangi] [masjid] [masjid] [allah]
66
UIN Syarif Hidayatullah Jakarta
7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]
[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]
8. [sesungguhnya] [ada] [orang] [orang] [yang]
[mendistribusikan] [harta] [allah] [dengan] [jalan]
[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]
[pada] [hari] [qiyamat]
9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]
b. Tahap transforming data training
1) Stopword removal
No. Stopword removal
1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]
2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [hidung] [barangsiapa]
[beristinja] [batu] [hendaklah] [bilangan] [ganjil]
4. [janganlah] [kafir] [saling] [membunuh]
5. [janganlah] [sengaja] [shalat] [matahari] [terbit]
[terbenam]
6. [janganlah] [larang] [wanita] [mendatangi] [masjid]
[masjid] [allah]
7. [iman] [enam] [puluh] [cabang] [malu] [iman]
8. [sesungguhnya] [mendistribusikan] [harta] [allah]
[neraka] [qiyamat]
9. [sungguh] [celaka] [berbuat] [adil]
67
UIN Syarif Hidayatullah Jakarta
3. Token atau kata-kata hasil transforming selanjutnya di proses kedalam
seleksi fitur untuk mengurangi dimensi dengan menyeleksi kata-kata
yang memiliki nilai chi-square (x2) lebih besar atau sama dengan nilai
kritis pada taraf nyata α 0.05, 0.01, 0.005, dan 0.001 yaitu 3.84, 6.63,
7.83, dan 10.83, maka kata yang tidak memenuhi syarat tersebut tidak
digunakan lagi untuk proses selanjutnya. Berikut proses seleksi fitur
dengan algoritma Chi-square :
Pilih taraf nyata. Contoh memilih taraf nyata 0.05 dengan nilai kritis
3.84.
Setelah itu hitung nilai chi-square (x2) untuk setiap kata dengan
menggunakan persamaan 2.5. Contoh hitung nilai x2 dari kata
“hendaklah” pada tiap kelas:
x2 (“hendaklah”,anjuran) = 9(3.6−0.0)2
(3+0)(0+6)(3+0)(0+6)
= 9 . 324
324
= 9
x2 (“hendaklah”,larangan) = 9(0.3−3.3)2
(0+3)(3+3)(0+3)(3+3)
= 9 . 81
324
= 2,25
x2 (“hendaklah”,informasi) = 9(0.3−3.3)2
(0+3)(3+3)(0+3)(3+3)
= 9 . 81
324
= 2,25
Hasil beberapa nilai chi-square (x2) :
No. Kata kelas A B C D Ntr
x2
1 anjing 1
1 0 2 6 9 2.25
68
UIN Syarif Hidayatullah Jakarta
2 menjilat 1
1 0 2 6 9 2.25
3 bejana 1
1 0 2 6 9 2.25
4 hendaklah 1
3 0 0 6 9 9
5 cuci 1
1 0 2 6 9 2.25
6 tujuh 1
1 0 2 6 9 2.25
7 sebelah 1
1 0 2 6 9 2.25
8 kanan 1
1 0 2 6 9 2.25
9 anggota 1
1 0 2 6 9 2.25
10 wudhunya 1
1 0 2 6 9 2.25
11 Berwudhu 2
0 1 3 5 9 0.5625
12 Mengeluarkan 2
0 1 3 5 9 0.5625
13 Air 2
0 1 3 5 9 0.5625
14 Hidung 2
0 1 3 5 9 0.5625
15 Beristinja 2
0 1 3 5 9 0.5625
16 Batu 2
0 1 3 5 9 0.5625
17 Bilangan 2
0 1 3 5 9 0.5625
18 Ganjil 2
0 1 3 5 9 0.5625
19 Janganlah 2
3 0 0 6 9 9
20 kafir 2
1 0 2 6 9 2.25
21 saling 3 0 1 3 5 9 0.5625
22 membunuh 3 0 1 3 5 9 0.5625
23 sengaja 3 0 1 3 5 9 0.5625
24 shalat 3 0 1 3 5 9 0.5625
69
UIN Syarif Hidayatullah Jakarta
25 matahari 3 0 1 3 5 9 0.5625
26 terbit 3 0 1 3 5 9 0.5625
27 terbenam 3 0 1 3 5 9 0.5625
28 larang 3 0 1 3 5 9 0.5625
29 wanita 3 0 1 3 5 9 0.5625
30 mendatangi 3 0 1 3 5 9 0.5625
Setelah mendapatkan nilai chi-square (x2) dari semua kata maka
dilakukan penyeleksian, yaitu mengambil kata-kata yang memiliki
nilai x2 lebih besar atau sama dengan nilai yang sudah dipilih.
Kata-kata yang terpilih :
taraf nyata nilai kritis kata x2
0.05 3.84 hendaklah
9
janganlah
9
sungguh
5.14
0.01 6.63 hendaklah
9
janganlah
9
0.005 7.83 hendaklah
9
janganlah
9
0.001 10.83 NULL
NULL
Karena di awal taraf nyata yg di pilih 0.05 maka kata yang di ambil
adalah kata yang memiliki nilai x2 lebih besar atau sama dengan nilai
kritis yaitu 3.84. Kata yang di ambil yaitu “hendaklah”, “janganlah”,
dan “sungguh’ Dari hasil proses seleksi fitur dengan chi-square,
jumlah kata yang tadinya berjumlah 54 menjadi berjumlah 8
(hendaklah = 4, janganlah = 3, sungguh = 1) dan akan diproses ke
tahapan pattern discovery.
70
UIN Syarif Hidayatullah Jakarta
4. Kata yang telah diseleksi dari hasil seleksi fitur kemudian di proses
pada tahapan pattern discovery menggunakan algoritma Naïve Bayes
Classifier (NBC). Berikut proses pattern discovery :
Hitung probabilitas kemunculan tiap kata dengan menggunakan
persamaan 2.1.
Sebagai contoh, hitung probabilitas kata “janganlah” pada setiap kelas.
P(janganlah|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
4+8
= 1
12
= 0.083333333
P(janganlah|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 3+1
3+8
= 4
11
= 0.363636364
P(janganlah|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
1+8
= 1
9
= 0.111111111
Hasil probabilitas semua kata pada data training:
Kata P(Wkj=Anjuran P(Wkj=Larangan P(Wkj=informasi
hendaklah 0.416666667 0.090909091 0.111111111
71
UIN Syarif Hidayatullah Jakarta
janganlah 0.083333333 0.363636364 0.111111111
sungguh 0.083333333 0.090909091 0.222222222
5. Setelah semua kata pada data training mendapatkan nilai
probabilitasnya, maka selanjutnya data testing yang diproses mulai dari
preprocessing, transforming, dan pattern discovery.
Contoh data testing terjemahan hadits :
“Janganlah kalian mengangkat kepala kalian hingga para laki - laki
telah duduk.”
a. Tahap preprocessing data testing
1) Case folding
Teks Hasil Case folding
“Janganlah kalian mengangkat
kepala kalian hingga para laki
- laki telah duduk.”
janganlah kalian
mengangkat kepala kalian
hingga para laki laki telah
duduk
2) Tokenizing
Teks Hasil Tokenizing
janganlah kalian mengangkat
kepala kalian hingga para laki
laki telah duduk
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para]
[laki] [laki] [telah] [duduk]
b. Tahap transforming data testing
1) Stopword removal
Teks Hasil Stopword removal
72
UIN Syarif Hidayatullah Jakarta
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para] [lak]I
[laki] [telah] [duduk]
[janganlah] [mengangkat]
[kepala] [lak]I [laki] [duduk]
6. Pada tahap pattern discovery data testing, proses yang pertama yaitu
pengecekan apakah kata yang di proses sesuai atau sama dengan daftar
kata pada data training yang sudah memiliki nilai probabilitas
sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada
tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika
tidak ada yang sesuai dengan daftar kata pada data training maka
hitung nilai probabilitas kata tersebut dengan menggunakan persamaan
2.1.
Contoh kata “duduk” Tidak ada yang sama pada daftar kata data
training maka dihitung nilai probabilitasnya :
P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
4+8
= 1
12
= 0.083333333
P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
3+8
= 1
11
= 0.090909091
P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
1+8
= 1
9
73
UIN Syarif Hidayatullah Jakarta
= 0.111111111
Hasil probabilitas data testing:
No. Kata anjuran larangan informasi
1. janganlah 0.08333333 0.363636364 0.11111111111
2. mengangkat 0.083333333 0.090909091 0.111111111
3. kepala 0.083333333 0.090909091 0.111111111
4. laki 0.083333333 0.090909091 0.111111111
5. duduk 0.083333333 0.090909091 0.111111111
7. Jika semua kata pada data testing sudah mendapatkan nilai
probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu
penentuan hasil klasifikasi dengan cara berikut :
Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3.
Contoh hitung nilai probabilitas kelas “anjuran” :
P(anjuran) = 1
3
= 0.333333333
Hasil nilai probabilitas tiap kelas :
Kelas P (c)
Anjuran 0.333333333
Larangan 0.333333333
Informasi 0.333333333
Kemudian untuk menentukan hasil klasifikasi dari data testing maka
dihitung perkalian dari nilai probabilitas semua kata pada data testing
dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2.
Perhitungan tersebut dilakukan terhadap semua kelas. Contoh :
Anjuran = 2.25 x 0.083333333 x 0.083333333 x 0.083333333
74
UIN Syarif Hidayatullah Jakarta
x 0.083333333 x 0.333333333
= 0.00003616898148
Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :
Anjuran Larangan Informasi
0.00000133959191 0.00000827895097 0.0000056450293
Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang
tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai
paling tinggi. Pada contoh pemodelan skenario 2 ini hasil
klasifikasinya adalah “Larangan” dengan nilai 0.00000827895097.
4.4.3 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan
Confix Stripping Stemmer dan tanpa seleksi fitur
Skenario ketiga pada penelitian ini yaitu konstruksi klasifikasi teks
terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi
dengan menggunakan algoritma Naïve Bayes Classifier (NBC) dan
menggunakan Confix Stripping Stemmer pada tahap stemming saat
transforming data. Proses training dan testing pada skenario ini melalui
tahapan-tahapan yang sama. Berikut penjelasan keseluruhan konstruksi
klasifikasi terjemahan hadits pada skenario 3 :
1. Mengumpulkan data training dan data testing kemudian siapkan
masing-masing dalam file dengan format .csv. Data training terlebih
dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,
larangan, dan informasi.
2. Melakukan proses text mining untuk data training sesuai dengan
tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan
masing-masing kelas berjumlah 3 terjemahan hadits.
Contoh data training terjemahan hadits
No. Teks Kelas
75
UIN Syarif Hidayatullah Jakarta
1. "Jika anjing menjilat bejana seorang
dari kalian, maka hendaklah ia cuci
hingga tujuh kali."
anjuran
2. "Hendaklah kalian mulai dari yang
sebelah kanan dan anggota wudhunya."
anjuran
3. "Barangsiapa berwudhu hendaklah
mengeluarkan (air dari hidung), dan
barangsiapa beristinja' dengan batu
hendaklah dengan bilangan ganjil."
anjuran
4. "Janganlah kalian kembali menjadi
kafir, sehingga kalian saling
membunuh satu sama lain."
larangan
5. "Janganlah salah seorang dari kalian
sengaja shalat ketika matahari sedang
terbit dan atau ketika saat terbenam."
larangan
6. 'Janganlah kalian larang para wanita
mendatangi masjid-masjid Allah."
larangan
7. "Iman memiliki lebih dari enam puluh
cabang, dan malu adalah bagian dari
iman".
informasi
8. "Sesungguhnya ada orang-orang yang
mendistribusikan harta Allah dengan
jalan yang tidak benar, maka bagi
mereka neraka pada hari qiyamat"
informasi
9. "Sungguh celaka aku bila tidak berbuat
adil"
informasi
a. Tahap preprocessing data training
1) Case folding
No. Case folding
76
UIN Syarif Hidayatullah Jakarta
1. jika anjing menjilat bejana seorang dari kalian maka
hendaklah ia cuci hingga tujuh kali
2. hendaklah kalian mulai dari yang sebelah kanan dan
anggota wudhunya
3. barangsiapa berwudhu hendaklah mengeluarkan air
dari hidung dan barangsiapa beristinja dengan batu
hendaklah dengan bilangan ganjil
4. janganlah kalian kembali menjadi kafir sehingga
kalian saling membunuh satu sama lain
5. janganlah salah seorang dari kalian sengaja shalat
ketika matahari sedang terbit dan atau ketika saat
terbenam
6. janganlah kalian larang para wanita mendatangi
masjid-masjid allah
7. iman memiliki lebih dari enam puluh cabang dan malu
adalah bagian dari iman
8. sesungguhnya ada orang-orang yang
mendistribusikan harta allah dengan jalan yang tidak
benar maka bagi mereka neraka pada hari qiyamat
9. sungguh celaka aku bila tidak berbuat adil
2) Tokenizing
No. Tokenizing
1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]
[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]
[tujuh] [kali]
77
UIN Syarif Hidayatullah Jakarta
2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]
[kanan] [dan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [dari] [hidung] [dan]
[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]
[dengan] [bilangan] [ganjil]
4. [janganlah] [kalian] [kembali] [menjadi] [kafir]
[sehingga] [kalian] [saling] [membunuh] [satu]
[sama] [lain]
5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]
[shalat] [ketika] [matahari] [sedang] [terbit] [dan]
[atau] [ketika] [saat] [terbenam]
6. [janganlah] [kalian] [larang] [para] [wanita]
[mendatangi] [masjid] [masjid] [allah]
7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]
[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]
8. [sesungguhnya] [ada] [orang] [orang] [yang]
[mendistribusikan] [harta] [allah] [dengan] [jalan]
[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]
[pada] [hari] [qiyamat]
9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]
b. Tahap transforming data training
1) Stopword removal
No. Stopword removal
1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]
78
UIN Syarif Hidayatullah Jakarta
2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [hidung] [barangsiapa]
[beristinja] [batu] [hendaklah] [bilangan] [ganjil]
4. [janganlah] [kafir] [saling] [membunuh]
5. [janganlah] [sengaja] [shalat] [matahari] [terbit]
[terbenam]
6. [janganlah] [larang] [wanita] [mendatangi] [masjid]
[masjid] [allah]
7. [iman] [enam] [puluh] [cabang] [malu] [iman]
8. [sesungguhnya] [mendistribusikan] [harta] [allah]
[neraka] [qiyamat]
9. [sungguh] [celaka] [berbuat] [adil]
2) Stemming
Proses stemming dilakukan dengan menggunakan algoritma
Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan
pada poin 2.5.
Sebagai contoh kata “mendistribusikan” akan di stemming
dengan algoritma Confix Stripping Stemmer. Tahapannya adalah
sebagai berikut :
1. Bandingkan dengan kamus kata dasar. Kata
“mendistribusikan” tidak ada pada kamus kata dasar, maka
lanjut ke langkah 2.
2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.
3. Hilangkan awalan “me-“ dengan menggunakan aturan
peluruhan pada tabel 2.3 nomor 11 yaitu :
men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…
maka kata “men-distribusi” berubah menjadi “distribusi”.
79
UIN Syarif Hidayatullah Jakarta
Kata “distribusi” merupakan kata yang ada di database kata
dasar, maka algoritma berhenti.
Hasil stemming :
No. Hasil stemming
1. [anjing] [jilat] [bejana] [hendak] [cuci] [tujuh]
2. [hendak] [sebelah] [kanan] [anggota] [wudhu]
3. [wudhu] [hendak] [keluar] [air] [hidung] [istinja]
[batu] [hendak] [bilang] [ganjil]
4. [jangan] [kafir] [saling] [bunuh]
5. [jangan] [sengaja] [shalat] [matahari] [terbit]
[benam]
6. [jangan] [larang] [wanita] [datang] [masjid] [masjid]
[allah]
7. [iman] [enam] [puluh] [cabang] [malu] [iman]
8. [sungguh] [distribusi] [harta] [allah] [neraka]
[qiyamat]
9. [sungguh] [celaka] [berbuat] [adil]
3. Token-token hasil stemming selanjutnya diproses ke tahap pattern
discovery. Berikut proses perhitungan pada tahapan pattern discovery
dengan menggunakan algoritma Naïve Bayes Classifier :
Hitung probabilitas kemunculan tiap kata dengan menggunakan
persamaan 2.1. Contoh hitung probabilitas kata “jangan” pada tiap
kelas:
P(jangan|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
21+54
80
UIN Syarif Hidayatullah Jakarta
= 1
75
= 0.013333333
P(jangan|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 3+1
17+54
= 4
71
= 0.056338028
P(jangan|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
16+54
= 1
70
= 0.014285714
Hasil probabilitas semua kata pada data training:
No. Kata Anjuran Larangan Informasi
1 anjing 0.026666667
0.014084507 0.014285714
2 jilat 0.026666667
0.014084507 0.014285714
3 bejana 0.026666667
0.014084507 0.014285714
4 hendak 0.066666667
0.014084507 0.014285714
5 cuci 0.026666667
0.014084507 0.014285714
6 tujuh 0.026666667
0.014084507 0.014285714
7 sebelah 0.026666667
0.014084507 0.014285714
8 kanan 0.026666667
0.014084507 0.014285714
9 anggota 0.026666667
0.014084507 0.014285714
81
UIN Syarif Hidayatullah Jakarta
10 wudhu 0.04
0.014084507 0.014285714
11 keluar 0.026666667
0.014084507 0.014285714
12 air 0.026666667
0.014084507 0.014285714
13 hidung 0.026666667
0.014084507 0.014285714
14 istinja 0.026666667
0.014084507 0.014285714
15 batu 0.026666667
0.014084507 0.014285714
16 bilang 0.026666667
0.014084507 0.014285714
17 ganjil 0.026666667
0.014084507 0.014285714
18 jangan 0.013333333
0.056338028 0.014285714
19 kafir 0.013333333
0.028169014 0.014285714
20 saling 0.013333333
0.028169014 0.014285714
21 bunuh 0.013333333
0.028169014 0.014285714
22 sengaja 0.013333333
0.028169014 0.014285714
23 shalat 0.013333333
0.028169014 0.014285714
24 matahari 0.013333333
0.028169014 0.014285714
25 terbit 0.013333333
0.028169014 0.014285714
26 benam 0.013333333
0.028169014 0.014285714
27 larang 0.013333333
0.028169014 0.014285714
28 wanita 0.013333333
0.028169014 0.014285714
29 datang 0.013333333
0.028169014 0.014285714
30 masjid 0.013333333
0.042253521 0.014285714
31 allah 0.013333333
0.028169014 0.028571429
82
UIN Syarif Hidayatullah Jakarta
32 iman 0.013333333 0.014084507 0.042857143
33 enam 0.013333333 0.014084507 0.028571429
34 puluh 0.013333333 0.014084507 0.028571429
35 cabang 0.013333333 0.014084507 0.028571429
36 malu 0.013333333 0.014084507 0.028571429
37 sungguh 0.013333333 0.014084507 0.042857143
38 distribusi 0.013333333 0.014084507 0.028571429
39 harta 0.013333333 0.014084507 0.028571429
40 neraka 0.013333333 0.014084507 0.028571429
41 qiyamat 0.013333333 0.014084507 0.028571429
42 celaka 0.013333333 0.014084507 0.028571429
43 buat 0.013333333 0.014084507 0.028571429
44 adil 0.013333333 0.014084507 0.028571429
4. Setelah semua kata pada data training mendapatkan nilai
probabilitasnya, maka selanjutnya data testing yang diproses mulai dari
preprocessing, transforming, dan pattern discovery.
Contoh data testing terjemahan hadits :
“Janganlah kalian mengangkat kepala kalian hingga para laki - laki
telah duduk.”
a. Tahap preprocessing data testing
1) Case folding
Teks Hasil Case folding
83
UIN Syarif Hidayatullah Jakarta
“Janganlah kalian mengangkat
kepala kalian hingga para laki
- laki telah duduk.”
janganlah kalian
mengangkat kepala kalian
hingga para laki laki telah
duduk
2) Tokenizing
Teks Hasil Tokenizing
janganlah kalian mengangkat
kepala kalian hingga para laki
laki telah duduk
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para]
[laki] [laki] [telah] [duduk]
b. Tahap transforming data testing
1) Stopword removal
Teks Hasil Stopword removal
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para] [lak]I
[laki] [telah] [duduk]
[janganlah] [mengangkat]
[kepala] [laki] [laki] [duduk]
2) Stemming
Proses stemming dilakukan dengan menggunakan algoritma
Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan
pada poin 2.5.
Sebagai contoh kata “mendistribusikan” akan di stemming
dengan algoritma Confix Stripping Stemmer. Tahapannya
adalah sebagai berikut :
1. Bandingkan dengan kamus kata dasar. Kata
“mendistribusikan” tidak ada pada kamus kata dasar, maka
lanjut ke langkah 2.
84
UIN Syarif Hidayatullah Jakarta
2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.
3. Hilangkan awalan “me-“ dengan menggunakan aturan
peluruhan pada tabel 2.3 nomor 11 yaitu :
men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…
maka kata “men-distribusi” berubah menjadi “distribusi”.
Kata “distribusi” merupakan kata yang ada di database kata
dasar, maka algoritma berhenti.
Hasil stemming :
Teks Hasil stemming
[janganlah] [mengangkat]
[kepala] [laki] [laki] [duduk]
[jangan] [angkat] [kepala]
[laki] [laki] [duduk]
7. Pada tahap pattern discovery data testing, proses yang pertama yaitu
pengecekan apakah kata yang di proses sesuai atau sama dengan daftar
kata pada data training yang sudah memiliki nilai probabilitas
sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada
tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika
tidak ada yang sesuai dengan daftar kata pada data training maka
hitung nilai probabilitas kata tersebut dengan menggunakan persamaan
2.1.
Contoh kata “duduk” Tidak ada yang sama pada daftar kata data
training maka dihitung nilai probabilitasnya :
P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
21+54
85
UIN Syarif Hidayatullah Jakarta
= 1
75
= 0.013333333
P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
17+54
= 1
71
= 0.014084507
P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
16+54
= 1
70
= 0.014285714
Hasil probabilitas data testing:
No. Kata anjuran larangan informasi
1. jangan 0.013333333 0.056338028 0.014285714
2. angkat 0.013333333 0.014084507 0.014285714
3. kepala 0.013333333 0.014084507 0.014285714
4. laki 0.013333333 0.014084507 0.014285714
5. duduk 0.013333333 0.014084507 0.014285714
8. Jika semua kata pada data testing sudah mendapatkan nilai
probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu
penentuan hasil klasifikasi dengan cara berikut :
Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3.
Contoh hitung nilai probabilitas kelas “anjuran” :
P(anjuran) = 1
3
86
UIN Syarif Hidayatullah Jakarta
= 0.333333333
Hasil nilai probabilitas tiap kelas :
Kelas P (c)
Anjuran 0.333333333
Larangan 0.333333333
Informasi 0.333333333
Kemudian untuk menentukan hasil klasifikasi dari data testing maka
dihitung perkalian dari nilai probabilitas semua kata pada data testing
dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2.
Perhitungan tersebut dilakukan terhadap semua kelas. Contoh :
Anjuran = 0.013333333 x 0.013333333 x 0.013333333 x 0.013333333
x 0.013333333 x 0.333333333
=0.00000000014047
Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :
Anjuran Larangan Informasi
0.00000000014047 0.00000000073900 0.0000000001983
Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang
tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai
paling tinggi. Pada contoh pemodelan skenario 3 ini hasil
klasifikasinya adalah “Larangan” dengan nilai 0.00000000073900.
4.4.4 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan
Confix Stripping Stemmer dan Chi-Square
Skenario keempat pada penelitian ini yaitu konstruksi klasifikasi teks
terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi
dengan menggunakan algoritma Naïve Bayes Classifier (NBC), algoritma
Confix Stripping Stemmer pada proses stemming dan menggunakan seleksi
87
UIN Syarif Hidayatullah Jakarta
fitur Chi-Square. Proses training dan testing pada skenario ini melalui tahapan-
tahapan yang sama pada preprocessing dan transforming. Tetapi pada skenario
ini, data training akan melalui tahapan seleksi fitur, sedangkan data testing
tidak melalui tahap seleksi fitur karena jumlah fitur yang sedikit dan belum
adanya pengkelasan. Berikut penjelasan keseluruhan konstruksi klasifikasi
terjemahan hadits pada skenario 4 :
1. Mengumpulkan data training dan data testing kemudian siapkan
masing-masing dalam file dengan format .csv. Data training terlebih
dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,
larangan, dan informasi.
2. Melakukan proses text mining untuk data training sesuai dengan
tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan
masing-masing kelas berjumlah 3 terjemahan hadits.
Contoh data training terjemahan hadits
No. Teks Kelas
1. "Jika anjing menjilat bejana seorang
dari kalian, maka hendaklah ia cuci
hingga tujuh kali."
anjuran
2. "Hendaklah kalian mulai dari yang
sebelah kanan dan anggota wudhunya."
anjuran
3. "Barangsiapa berwudhu hendaklah
mengeluarkan (air dari hidung), dan
barangsiapa beristinja' dengan batu
hendaklah dengan bilangan ganjil."
anjuran
4. "Janganlah kalian kembali menjadi
kafir, sehingga kalian saling
membunuh satu sama lain."
larangan
5. "Janganlah salah seorang dari kalian
sengaja shalat ketika matahari sedang
terbit dan atau ketika saat terbenam."
larangan
88
UIN Syarif Hidayatullah Jakarta
6. 'Janganlah kalian larang para wanita
mendatangi masjid-masjid Allah."
larangan
7. "Iman memiliki lebih dari enam puluh
cabang, dan malu adalah bagian dari
iman".
informasi
8. "Sesungguhnya ada orang-orang yang
mendistribusikan harta Allah dengan
jalan yang tidak benar, maka bagi
mereka neraka pada hari qiyamat"
informasi
9. "Sungguh celaka aku bila tidak berbuat
adil"
informasi
a. Tahap preprocessing data training
1) Case folding
No. Case folding
1. jika anjing menjilat bejana seorang dari kalian maka
hendaklah ia cuci hingga tujuh kali
2. hendaklah kalian mulai dari yang sebelah kanan dan
anggota wudhunya
3. barangsiapa berwudhu hendaklah mengeluarkan air
dari hidung dan barangsiapa beristinja dengan batu
hendaklah dengan bilangan ganjil
4. janganlah kalian kembali menjadi kafir sehingga
kalian saling membunuh satu sama lain
5. janganlah salah seorang dari kalian sengaja shalat
ketika matahari sedang terbit dan atau ketika saat
terbenam
89
UIN Syarif Hidayatullah Jakarta
6. janganlah kalian larang para wanita mendatangi
masjid-masjid allah
7. iman memiliki lebih dari enam puluh cabang dan malu
adalah bagian dari iman
8. sesungguhnya ada orang-orang yang
mendistribusikan harta allah dengan jalan yang tidak
benar maka bagi mereka neraka pada hari qiyamat
9. sungguh celaka aku bila tidak berbuat adil
2) Tokenizing
No. Tokenizing
1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]
[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]
[tujuh] [kali]
2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]
[kanan] [dan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [dari] [hidung] [dan]
[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]
[dengan] [bilangan] [ganjil]
4. [janganlah] [kalian] [kembali] [menjadi] [kafir]
[sehingga] [kalian] [saling] [membunuh] [satu]
[sama] [lain]
5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]
[shalat] [ketika] [matahari] [sedang] [terbit] [dan]
[atau] [ketika] [saat] [terbenam]
90
UIN Syarif Hidayatullah Jakarta
6. [janganlah] [kalian] [larang] [para] [wanita]
[mendatangi] [masjid] [masjid] [allah]
7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]
[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]
8. [sesungguhnya] [ada] [orang] [orang] [yang]
[mendistribusikan] [harta] [allah] [dengan] [jalan]
[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]
[pada] [hari] [qiyamat]
9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]
b. Tahap transforming data training
1) Stopword removal
No. Stopword removal
1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]
2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]
3. [barangsiapa] [berwudhu] [hendaklah]
[mengeluarkan] [air] [hidung] [barangsiapa]
[beristinja] [batu] [hendaklah] [bilangan] [ganjil]
4. [janganlah] [kafir] [saling] [membunuh]
5. [janganlah] [sengaja] [shalat] [matahari] [terbit]
[terbenam]
6. [janganlah] [larang] [wanita] [mendatangi] [masjid]
[masjid] [allah]
7. [iman] [enam] [puluh] [cabang] [malu] [iman]
91
UIN Syarif Hidayatullah Jakarta
8. [sesungguhnya] [mendistribusikan] [harta] [allah]
[neraka] [qiyamat]
9. [sungguh] [celaka] [berbuat] [adil]
2) Stemming
Proses stemming dilakukan dengan menggunakan algoritma
Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan
pada poin 2.5.
Sebagai contoh kata “mendistribusikan” akan di stemming
dengan algoritma Confix Stripping Stemmer. Tahapannya
adalah sebagai berikut :
1. Bandingkan dengan kamus kata dasar. Kata
“mendistribusikan” tidak ada pada kamus kata dasar, maka
lanjut ke langkah 2.
2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.
3. Hilangkan awalan “me-“ dengan menggunakan aturan
peluruhan pada tabel 2.3 nomor 11 yaitu :
men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…
maka kata “men-distribusi” berubah menjadi “distribusi”.
Kata “distribusi” merupakan kata yang ada di database kata
dasar, maka algoritma berhenti.
Hasil stemming :
No. Hasil stemming
1. [anjing] [jilat] [bejana] [hendak] [cuci] [tujuh]
2. [hendak] [sebelah] [kanan] [anggota] [wudhu]
92
UIN Syarif Hidayatullah Jakarta
3. [wudhu] [hendak] [keluar] [air] [hidung] [istinja]
[batu] [hendak] [bilang] [ganjil]
4. [jangan] [kafir] [saling] [bunuh]
5. [jangan] [sengaja] [shalat] [matahari] [terbit]
[benam]
6. [jangan] [larang] [wanita] [datang] [masjid] [masjid]
[allah]
7. [iman] [enam] [puluh] [cabang] [malu] [iman]
8. [sungguh] [distribusi] [harta] [allah] [neraka]
[qiyamat]
9. [sungguh] [celaka] [berbuat] [adil]
3. Token atau kata-kata hasil transforming selanjutnya di proses kedalam
seleksi fitur untuk mengurangi dimensi dengan menyeleksi kata-kata
yang memiliki nilai chi-square (x2) lebih besar atau sama dengan nilai
kritis pada taraf nyata α 0.05, 0.01, 0.005, dan 0.001 yaitu 3.84, 6.63,
7.83, dan 10.83, maka kata yang tidak memenuhi syarat tersebut tidak
digunakan lagi untuk proses selanjutnya. Berikut proses seleksi fitur
dengan algoritma Chi-square :
Pilih taraf nyata. Contoh memilih taraf nyata 0.05 dengan nilai kritis
3.84.
Setelah itu hitung nilai chi-square (x2) untuk setiap kata dengan
menggunakan persamaan 2.5. Contoh hitung nilai x2 dari kata
“hendaklah” pada tiap kelas:
x2 (“hendaklah”,anjuran) = 9(3.6−0.0)2
(3+0)(0+6)(3+0)(0+6)
= 9 . 324
324
93
UIN Syarif Hidayatullah Jakarta
= 9
x2 (“hendaklah”,larangan) = 9(0.3−3.3)2
(0+3)(3+3)(0+3)(3+3)
= 9 . 81
324
= 2,25
x2 (“hendaklah”,informasi) = 9(0.3−3.3)2
(0+3)(3+3)(0+3)(3+3)
= 9 . 81
324
= 2,25
Hasil beberapa nilai chi-square (x2) :
No. Kata kelas A B C D Ntr
x2
1 anjing 1
1 0 2 6 9 2.25
2 jilat 1
1 0 2 6 9 2.25
3 bejana 1
1 0 2 6 9 2.25
4 hendak 1
3 0 0 6 9 9
5 cuci 1
1 0 2 6 9 2.25
6 tujuh 1
1 0 2 6 9 2.25
7 sebelah 1
1 0 2 6 9 2.25
8 kanan 1
1 0 2 6 9 2.25
9 anggota 1
1 0 2 6 9 2.25
10 wudhu 1
2 0 1 6 9 5.142
11 keluar 2
0 1 3 5 9 0.5625
12 air 2
0 1 3 5 9 0.5625
13 hidung 2
0 1 3 5 9 0.5625
94
UIN Syarif Hidayatullah Jakarta
14 istinja 2
0 1 3 5 9 0.5625
15 batu 2
0 1 3 5 9 0.5625
16 bilang 2
0 1 3 5 9 0.5625
17 ganjil 2
0 1 3 5 9 0.5625
18 jangan 2
3 0 0 6 9 9
19 kafir 2
1 0 2 6 9 2.25
20 saling 3 0 1 3 5 9 0.5625
21 bunuh 3 0 1 3 5 9 0.5625
22 sengaja 3 0 1 3 5 9 0.5625
23 shalat 3 0 1 3 5 9 0.5625
24 matahari 3 0 1 3 5 9 0.5625
25 sungguh 3 2 0 1 6 9 5.1428
Setelah mendapatkan nilai chi-square (x2) dari semua kata maka
dilakukan penyeleksian, yaitu mengambil kata-kata yang memiliki
nilai x2 lebih besar atau sama dengan nilai yang sudah dipilih.
Kata-kata yang terpilih :
taraf nyata nilai kritis kata x2
0.05 3.84 hendak
9
wudhu 5.1428
95
UIN Syarif Hidayatullah Jakarta
jangan
9
sungguh
5.1428
0.01 6.63 hendak
9
jangan
9
0.005 7.83 hendak
9
jangan
9
0.001 10.83 NULL
NULL
Karena di awal taraf nyata yg di pilih 0.05 maka kata yang di ambil
adalah kata yang memiliki nilai x2 lebih besar atau sama dengan nilai
kritis yaitu 3.84. Kata yang di ambil yaitu “hendak”, “jangan”,
“wudhu” dan “sungguh’ Dari hasil proses seleksi fitur dengan chi-
square, jumlah kata yang tadinya berjumlah 54 menjadi berjumlah 11
(hendak = 4, wudhu = 2, jangan = 3, sungguh = 2) dan akan diproses
ke tahapan pattern discovery.
4. Kata yang telah diseleksi dari hasil seleksi fitur kemudian di proses
pada tahapan pattern discovery menggunakan algoritma Naïve Bayes
Classifier (NBC). Berikut proses pattern discovery :
Hitung probabilitas kemunculan tiap kata dengan menggunakan
persamaan 2.1.
Sebagai contoh, hitung probabilitas kata “jangan” pada tiap kelas:
P(jangan|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
6+11
= 1
17
= 0.058823529
96
UIN Syarif Hidayatullah Jakarta
P(jangan|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 3+1
3+11
= 4
14
= 0.285714286
P(jangan|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
2+11
= 1
13
= 0.07692307692
Hasil probabilitas semua kata pada data training:
No. Kata Anjuran Larangan Informasi
1. Hendak 0.294117647 0.071428571 0.07692307692
2. Wudhu 0.176470588 0.071428571 0.07692307692
3. Jangan 0.058823529 0.142857143 0.07692307692
4. sungguh 0.058823529 0.071428571 0.230769231
5. Setelah semua kata pada data training mendapatkan nilai
probabilitasnya, maka selanjutnya data testing yang diproses mulai dari
preprocessing, transforming, dan pattern discovery.
Contoh data testing terjemahan hadits :
“Janganlah kalian mengangkat kepala kalian hingga para laki - laki
telah duduk.”
a. Tahap preprocessing data testing
1) Case folding
Teks Hasil Case folding
97
UIN Syarif Hidayatullah Jakarta
“Janganlah kalian mengangkat
kepala kalian hingga para laki
- laki telah duduk.”
janganlah kalian
mengangkat kepala kalian
hingga para laki laki telah
duduk
2) Tokenizing
Teks Hasil Tokenizing
janganlah kalian mengangkat
kepala kalian hingga para laki
laki telah duduk
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para]
[laki] [laki] [telah] [duduk]
b. Tahap transforming data testing
1) Stopword removal
Teks Hasil Stopword removal
[janganlah] [kalian]
[mengangkat] [kepala]
[kalian] [hingga] [para] [lak]I
[laki] [telah] [duduk]
[janganlah] [mengangkat]
[kepala] [laki] [laki] [duduk]
2) Stemming
Proses stemming dilakukan dengan menggunakan algoritma
Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan
pada poin 2.5.
Sebagai contoh kata “mendistribusikan” akan di stemming
dengan algoritma Confix Stripping Stemmer. Tahapannya
adalah sebagai berikut :
1. Bandingkan dengan kamus kata dasar. Kata
“mendistribusikan” tidak ada pada kamus kata dasar, maka
lanjut ke langkah 2.
98
UIN Syarif Hidayatullah Jakarta
2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.
3. Hilangkan awalan “me-“ dengan menggunakan aturan
peluruhan pada tabel 2.3 nomor 11 yaitu :
men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…
maka kata “men-distribusi” berubah menjadi “distribusi”.
Kata “distribusi” merupakan kata yang ada di database kata
dasar, maka algoritma berhenti.
Hasil stemming :
Teks Hasil stemming
[janganlah] [mengangkat]
[kepala] [laki] [laki] [duduk]
[jangan] [angkat] [kepala]
[laki] [laki] [duduk]
6. Pada tahap pattern discovery data testing, proses yang pertama yaitu
pengecekan apakah kata yang di proses sesuai atau sama dengan daftar
kata pada data training yang sudah memiliki nilai probabilitas
sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada
tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika
tidak ada yang sesuai dengan daftar kata pada data training maka
hitung nilai probabilitas kata tersebut dengan menggunakan persamaan
2.1.
Contoh kata “duduk” Tidak ada yang sama pada daftar kata data
training maka dihitung nilai probabilitasnya :
P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
6+11
99
UIN Syarif Hidayatullah Jakarta
= 1
17
= 0.058823529
P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
3+11
= 1
14
= 0.071428571
P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1
𝑓(𝐶𝑖)+|𝑤|
= 0+1
2+11
= 1
13
=0.076923077
Hasil probabilitas data testing:
No. Kata anjuran larangan informasi
1. jangan 0.058823529 0.285714286 0.076923077
2. angkat 0.058823529 0.071428571 0.076923077
3. kepala 0.058823529 0.071428571 0.076923077
4. laki 0.058823529 0.071428571 0.076923077
5. duduk 0.058823529 0.071428571 0.076923077
7. Jika semua kata pada data testing sudah mendapatkan nilai
probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu
penentuan hasil klasifikasi dengan cara berikut :
Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3,
contoh hitung nilai probabilitas kelas “anjuran” :
P(anjuran) = 1
3
100
UIN Syarif Hidayatullah Jakarta
= 0.333333333
Hasil nilai probabilitas tiap kelas :
Kelas P (c)
Anjuran 0.333333333
Larangan 0.333333333
Informasi 0.333333333
Kemudian untuk menentukan hasil klasifikasi dari data testing maka
dihitung perkalian dari nilai probabilitas semua kata pada data testing
dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2.
perhitungan tersebut dilakukan terhadap semua kelas. Contoh :
Anjuran = 0.058823529 x 0.058823529 x 0.058823529 x 0.058823529
x 0.058823529 x 0.333333333
= 0.00000023476543
Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :
Anjuran Larangan Informasi
0.00000023476543 0.00000247912576 0.0000008977636
Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang
tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai
paling tinggi. Pada contoh pemodelan skenario 3 ini hasil
klasifikasinya adalah “Larangan” dengan nilai 0.00000247912576.
4.5 Simulasi (Simulation)
Penulis memakai windows 8.1 Pro sebagai sistem operasi yang digunakan
untuk seluruh proses simulasi. Dan menggunakan notepad++ dalam proses coding.
Berikut tahapan-tahapan yang penulis lakukan untuk mempersiapkan proses
simulasi yaitu pembangunan server dan flowchart simulasi.
101
UIN Syarif Hidayatullah Jakarta
4.5.1 Pembangunan Server
Dalam tahap simulasi penulis menggunakan windows 8.1 Pro sebagai
sistem operasi. Secara garis besar, berikut langkah-langkah yang penulis
lakukan :
1. Melakukan instalasi appserver, dalam hal ini penulis menggunakan
XAMPP
2. Melakukan instalasi editor yang digunakan untuk membuat kode
script, dalam hal ini penulis menggunakan notepad++
4.5.2 Flowchart Simulasi
Flowchart simulasi perbandingan kinerja keempat skenario yang
diimplementasikan pada klasifikasi terjemahan hadits Bukhari yaitu pada
gambar 4.12 berikut :
Gambar 4.11 Flowchart Simulasi
Berikut contoh simulasi yang dilakukan oleh penulis dengan
menggunakan keempat skenario :
• Skenario 1
102
UIN Syarif Hidayatullah Jakarta
• Skenario 2
103
UIN Syarif Hidayatullah Jakarta
104
UIN Syarif Hidayatullah Jakarta
• Skenario 3
105
UIN Syarif Hidayatullah Jakarta
• Skenario 4
106
UIN Syarif Hidayatullah Jakarta
107
UIN Syarif Hidayatullah Jakarta
4.6 Verifikasi dan Validasi (Verification and Validation )
Penjelasan dan pemaparan mengenai verifikasi dan validasi akan dijelaskan
pada BAB V skripsi ini, yaitu bab yang membahas hasil pembahasan.
4.7 Eksperimentasi (Experimentation)
Penjelasan dan pemaparan mengenai eksperimentasi akan dijelaskan pada
BAB V skripsi ini, yaitu bab yang membahas hasil pembahasan.
4.8 Analisis Keluaran (Output Analysis)
Penjelasan dan pemaparan mengenai analisis keluaran akan dijelaskan pada
BAB V skripsi ini, yaitu bab yang membahas hasil pembahasan.
108
BAB V
HASIL DAN PEMBAHASAN
5.1 Verifikasi dan Validasi (Verification and Validation)
Verifikasi dilakukan untuk memastikan bahwa setiap tahapan pada bab-bab
sebelumnya saling memiliki hubungan, dalam hal ini setiap tahapan pada bab 4
diulas kembali untuk memastikan tiap tahap tersebut saling terkait. Verifikasi juga
memastikan bahwa input dan output sesuai dengan yang diharapkan dimulai dari
tahap problem formulation (formulasi masalah) hingga simulation (simulasi).
Dari tahapan problem formulation (formulasi masalah) dilakukan
pembahasan mengenai masalah terpenting dengan cara identifikasi masalah untuk
dirumusakan dalam penulisan skripsi ini, sehingga dari permasalahan tersebut dapat
dikembangkan suatu pemodelan konsep sebagai solusi. Selanjutnya pada tahapan
conceptual model (model pengkonsepan), dilakukan pembahasan konsep secara
keseluruhan pada sistem klasifikasi terjemahan hadits meliputi input, proses,
eksperimen dan output yang diharapkan. Pada tahapan collection input/output data,
membahasa input dan output data dengan menyebutkan atribut-atribut data yang
akan disimpan kedalam database Mysql. Berlanjut ke tahapan Modelling
(pemodelan) yaitu berkaitan dengan mengolah data input dan output yang telah
dibuat pada tahapan sebelumnya. Pada tahapan ini dilakukan konstruksi klasifikasi
terjemahan hadits menggunakan Naïve Bayes Classifier, konstruksi klasifikasi
terjemahan hadits menggunakan kombinasi algoritma Naïve Bayes Classifier, Chi-
Square dan Confix Stripping Stemmer yang dilakukan secara manual untuk dapat
dijadikan acuan dalam pembuatan aplikasi pada skripsi ini. Berikutnya pada
tahapan terkahir adalah simulation (simulasi), yaitu dengan melakukan simulasi
pada sistem klasifikasi terjemahan hadits yang fungsinya mengimplementasikan
pemodelan-pemodelan manual sebelumnya. Oleh karena itu, setiap tahapan dapat
dipastikan memiliki keterkaitan, karena setiap tahapan yang dibuat akan
berpengaruh untuk membuat tahapan selanjutnya.
109
UIN Syarif Hidayatullah Jakarta
Dalam proses validasi dilakukan pengujian kebenaran sistem yaitu dengan
melakukan perbandingan hasil klasifikasi dengan kombinasi Naïve Bayes
Classifier, Chi-Square dan Confix Stripping Stemmer yang dihitung secara manual
dengan hasil pada sistem klasifikasi terjemahan hadits sehingga menghasilkan
keakuratan sistem.
5.2 Eksperimentasi (Experimentation)
Proses eksperimentasi adalah proses membandingkan hasil skenario yaitu
hasil klasifikasi terjemahan hadits menggunakan algoritma Naive Bayes Classifier,
kombinasi Naïve Bayes Classifier dan seleksi fitur Chi-Square dengan empat nilai
taraf nyata yaitu 0.05, 0.01, 0.005, dan 0.001, kombinasi Naïve Bayes Classifier dan
Confix Stripping Stemmer, dan kombinasi Naïve Bayes Classifier, Chi-Square dan
Confix Stripping Stemmer dengan empat nilai taraf nyata yaitu 0.05, 0.01, 0.005,
dan 0.001.
Dari eksperimen tersebut dilakukan analisis outputnya yang akan dibahas
pada tahapan analisis keluaran (Outpu Analysis).
5.3 Analisis Keluaran (Output Analysis)
Dalam melakukan analisis keluaran, dilakukan analisis terhadap hasil
klasifikasi terjemahan hadits Bukhari dengan menggunakan kombinasi algoritma
Naïve Bayes Classifier, Chi-Square dan Confix Stripping Stemmer dengan empat
nilai taraf nyata yaitu 0.05, 0.01, 0.005, dan 0.001 dan hasil tingkat akurasi dari
algoritma tersebut.
110
UIN Syarif Hidayatullah Jakarta
5.3.1 Skenario 1
Hasil pengujian dari skenario 1 yaitu klasifikasi teks terjemahan hadits
dengan menggunakan algoritma Naïve Bayes Classifier tanpa stemming dan
tanpa seleksi fitur dengan jumlah data training sebanyak 300 hadits dan data
testing sebanyak 30 hadits adalah pada tabel 5.1 berikut :
Tabel 5.1 Hasil Pengujian Skenario 1
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian
ini dan tanah kalian ini. (Maka) hendaklah yang
hadir menyampaikan kepada yang tidak hadir,
karena orang yang hadir semoga dapat
menyampaikan kepada orang yang lebih paham
darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan
bila telah berakhir maka bersihkanlah darah darimu
lalu shalatlah.
Anjuran Anjuran
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika
rukuk maka rukuklah kalian, jika sujud maka
sujudlah kalian, dan jika ia shalat dengan berdiri
maka shalatlah kalian dengan berdiri.
Anjuran Larangan
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Anjuran
111
UIN Syarif Hidayatullah Jakarta
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di
masjid atau pasar kita, maka hendaklah dipegang
ujung panahnya dengan tangannya agar tidak
melukai seorang muslim.
Anjuran Anjuran
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka
hendaklah salah seorang dari kalian
mengumandangkan adzan dan hendaklah yang
mengimami shalat kalian adalah yang paling tua di
antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Anjuran
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki
sepasang sandal hendaklah dia memakai sepatunya.
Dan barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Anjuran
11. Sungguh kalian telah mengerjakan suatu shalat
(yang dilarang). Kami telah mendampingi
Rasulullah shallallahu 'alaihi wasallam, dan kami
tidak pernah melihat beliau melaksanakannya.
Beliau telah melarang keduanya, yaitu dua rakaat
setelah shalat 'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
112
UIN Syarif Hidayatullah Jakarta
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
14. Setelah tahun ini tidak boleh seorang musyrikpun
ang melaksanakan haji dan tidak boleh thawaf di
Ka'bah dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Larangan
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Informasi
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-
bapak kalian, dan barangsiapa bersumpah,
hendaklah bersumpah dengan nama Allah.
Larangan Informasi
21. Kami melindungi seseorang yang kau lindungi
wahai Ummu Hani'". Ummu Hani' berkata: "Saat
itu adalah waktu dhuha
Informasi Informasi
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika Informasi Informasi
113
UIN Syarif Hidayatullah Jakarta
berbicara dusta, jika berjanji mengingkari, jika
diberi amanat dia khiyanat dan jika berseteru dia
curang dan barangsiapa yang ada padanya salah
satu sifat itu, dia punya sifat nifaq hingga dia
meninggalkannya
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-
Nya di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Informasi
25. Sesungguhnya setiap orang dari kalian
dikumpulkan dalam penciptaannya ketika berada di
dalam perut ibunya selama empat puluh hari,
kemudian menjadi 'alaqah (zigot) selama itu pula
kemudian menjadi mudlghah (segumpal daging),
selama itu pula kemudian Allah mengirim malaikat
yang diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya
dan sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian
akan ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni neraka dan ada
juga seseorang yang beramal hingga dirinya berada
dekat dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Anjuran
114
UIN Syarif Hidayatullah Jakarta
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala
pasti akan menelungkupkan wajahnya ke tanah
selama mereka (Quraisy) menegakkan ad-din
(agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan
manusia dari perkataan (yang disepakati) para Nabi
adalah; "Jika kamu tidak malu, berbuatlah
sesukamu
Informasi Anjuran
Tabel di atas menunjukkan hasil pengujian data testing yaitu 22 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 8 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.1
berikut :
115
UIN Syarif Hidayatullah Jakarta
Gambar 5.1 Hasil Confusion Matrix Skenario 1
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, presisi, dan f-measure paling tinggi yaitu 86,67%, 80%, dan 80%. Dan
nilai rata-rata keseluruhan kelas pada skenario 1 ini adalah akurasi 82,22%,
presisi 73,89%, recall 73,33%, dan f-measure 73,13%.
116
UIN Syarif Hidayatullah Jakarta
5.3.2 Skenario 2
Hasil pengujian dari skenario 2 yaitu klasifikasi teks terjemahan hadits
dengan menggunakan algoritma Naïve Bayes Classifier dan seleksi fitur Chi-
Square dengan jumlah data training sebanyak 300 hadits dan data testing
sebanyak 30 hadits adalah sebagai berikut :
a. Pengujian pada taraf nyata 0,05
Tabel 5.2 Hasil Pengujian Skenario 2 Taraf Nyata 0,05
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Anjuran
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Anjuran
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
Anjuran Anjuran
117
UIN Syarif Hidayatullah Jakarta
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung
panahnya dengan tangannya agar tidak melukai
seorang muslim.
Anjuran Anjuran
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Anjuran
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Larangan
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
118
UIN Syarif Hidayatullah Jakarta
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Larangan
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Larangan
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Informasi
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Informasi
119
UIN Syarif Hidayatullah Jakarta
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Informasi
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Informasi
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
Informasi Anjuran
120
UIN Syarif Hidayatullah Jakarta
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Anjuran
Tabel di atas menunjukkan hasil pengujian data testing yaitu 23 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 7 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.2
berikut :
121
UIN Syarif Hidayatullah Jakarta
Gambar 5.2 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,05
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, presisi, dan f-measure paling tinggi yaitu 90%, 88,89%, dan 84,21%.
Dan nilai rata-rata keseluruhan kelas pada skenario 2 dengan taraf nyata 0,05
ini adalah akurasi 84,44%, presisi 77,71%, recall 76,67%, dan f-measure
76,38%.
122
UIN Syarif Hidayatullah Jakarta
b. Pengujian pada taraf nyata 0,005
Tabel 5.3 Hasil Pengujian Skenario 2 Taraf Nyata 0,005
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Anjuran
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Anjuran
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Anjuran
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran
123
UIN Syarif Hidayatullah Jakarta
panahnya dengan tangannya agar tidak melukai
seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Anjuran
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Anjuran
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
124
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Larangan
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Larangan
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Anjuran
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Larangan
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Larangan
125
UIN Syarif Hidayatullah Jakarta
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Larangan
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Larangan
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
126
UIN Syarif Hidayatullah Jakarta
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Anjuran
Tabel di atas menunjukkan hasil pengujian data testing yaitu 21 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 9 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.3
berikut :
127
UIN Syarif Hidayatullah Jakarta
Gambar 5.3 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,005
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Anjuran memiliki nilai
akurasi, recall, dan f-measure paling tinggi yaitu 83,33%, 70%, dan 73,68%.
Dan nilai rata-rata keseluruhan kelas pada skenario 2 dengan taraf nyata 0,005
ini adalah akurasi 80%, presisi 78,01%, recall 70%, dan f-measure 69,86%.
128
UIN Syarif Hidayatullah Jakarta
c. Pengujian pada taraf nyata 0,01
Tabel 5.4 Hasil Pengujian Skenario 2 Taraf Nyata 0,01
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Larangan
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Larangan
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Larangan
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung Anjuran Larangan
129
UIN Syarif Hidayatullah Jakarta
panahnya dengan tangannya agar tidak melukai
seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Anjuran
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Larangan
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
130
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Anjuran
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Informasi
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Larangan
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Informasi
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Informasi
131
UIN Syarif Hidayatullah Jakarta
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Larangan
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Larangan
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Larangan
132
UIN Syarif Hidayatullah Jakarta
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Larangan
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Informasi
Tabel di atas menunjukkan hasil pengujian data testing yaitu 16 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 14 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.4
berikut :
133
UIN Syarif Hidayatullah Jakarta
Gambar 5.4 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,01
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, presisi, dan f-measure paling tinggi yaitu 83,33%, 85,71%, dan
70,59%. Dan nilai rata-rata keseluruhan kelas pada skenario 2 dengan taraf
nyata 0,01 ini adalah akurasi 68,89%, presisi 64,13%, recall 53,33%, dan f-
measure 51,56%.
134
UIN Syarif Hidayatullah Jakarta
d. Pengujian pada taraf nyata 0,001
Tabel 5.5 Hasil Pengujian Skenario 2 Taraf Nyata 0,001
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Larangan
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Larangan
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Anjuran
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran
135
UIN Syarif Hidayatullah Jakarta
panahnya dengan tangannya agar tidak melukai
seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Larangan
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Anjuran
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
136
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Larangan
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Larangan
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Anjuran
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Informasi
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Anjuran
137
UIN Syarif Hidayatullah Jakarta
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Anjuran
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Anjuran
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Anjuran
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Anjuran
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
138
UIN Syarif Hidayatullah Jakarta
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Larangan
Tabel di atas menunjukkan hasil pengujian data testing yaitu 17 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 13 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.5
berikut :
139
UIN Syarif Hidayatullah Jakarta
Gambar 5.5 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,001
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, dan presisi paling tinggi yaitu 80%, dan 100%. Dan nilai rata-rata
keseluruhan kelas pada skenario 2 dengan taraf nyata 0,001 ini adalah akurasi
71,11%, presisi 65,42%, recall 56,67%, dan f-measure 55,46%.
5.3.3 Skenario 3
Hasil pengujian dari skenario 3 yaitu klasifikasi teks terjemahan hadits
dengan menggunakan algoritma Naïve Bayes Classifier dan Confix Stripping
Stemmer dengan jumlah data training sebanyak 300 hadits dan data testing
sebanyak 30 hadits adalah pada tabel 5.6 berikut :
140
UIN Syarif Hidayatullah Jakarta
Tabel 5.6 Hasil Pengujian Skenario 3
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian
ini dan tanah kalian ini. (Maka) hendaklah yang
hadir menyampaikan kepada yang tidak hadir,
karena orang yang hadir semoga dapat
menyampaikan kepada orang yang lebih paham
darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan
bila telah berakhir maka bersihkanlah darah darimu
lalu shalatlah.
Anjuran Anjuran
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika
rukuk maka rukuklah kalian, jika sujud maka
sujudlah kalian, dan jika ia shalat dengan berdiri
maka shalatlah kalian dengan berdiri.
Anjuran Larangan
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Anjuran
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di
masjid atau pasar kita, maka hendaklah dipegang Anjuran Anjuran
141
UIN Syarif Hidayatullah Jakarta
ujung panahnya dengan tangannya agar tidak
melukai seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka
hendaklah salah seorang dari kalian
mengumandangkan adzan dan hendaklah yang
mengimami shalat kalian adalah yang paling tua di
antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Anjuran
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki
sepasang sandal hendaklah dia memakai sepatunya.
Dan barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Anjuran
11. Sungguh kalian telah mengerjakan suatu shalat
(yang dilarang). Kami telah mendampingi
Rasulullah shallallahu 'alaihi wasallam, dan kami
tidak pernah melihat beliau melaksanakannya.
Beliau telah melarang keduanya, yaitu dua rakaat
setelah shalat 'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
142
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun
ang melaksanakan haji dan tidak boleh thawaf di
Ka'bah dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Informasi
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Informasi
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-
bapak kalian, dan barangsiapa bersumpah,
hendaklah bersumpah dengan nama Allah.
Larangan Informasi
21. Kami melindungi seseorang yang kau lindungi
wahai Ummu Hani'". Ummu Hani' berkata: "Saat
itu adalah waktu dhuha
Informasi Informasi
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika
diberi amanat dia khiyanat dan jika berseteru dia
curang dan barangsiapa yang ada padanya salah
Informasi Informasi
143
UIN Syarif Hidayatullah Jakarta
satu sifat itu, dia punya sifat nifaq hingga dia
meninggalkannya
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-
Nya di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Informasi
25. Sesungguhnya setiap orang dari kalian
dikumpulkan dalam penciptaannya ketika berada di
dalam perut ibunya selama empat puluh hari,
kemudian menjadi 'alaqah (zigot) selama itu pula
kemudian menjadi mudlghah (segumpal daging),
selama itu pula kemudian Allah mengirim malaikat
yang diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya
dan sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian
akan ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni neraka dan ada
juga seseorang yang beramal hingga dirinya berada
dekat dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Informasi
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
144
UIN Syarif Hidayatullah Jakarta
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala
pasti akan menelungkupkan wajahnya ke tanah
selama mereka (Quraisy) menegakkan ad-din
(agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan
manusia dari perkataan (yang disepakati) para Nabi
adalah; "Jika kamu tidak malu, berbuatlah
sesukamu
Informasi Informasi
Tabel di atas menunjukkan hasil pengujian data testing yaitu 23 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 7 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.6
berikut :
145
UIN Syarif Hidayatullah Jakarta
Gambar 5.6 Hasil Confusion Matrix Skenario 3
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, recall, dan f-measure paling tinggi yaitu 90%, 100%, dan 86,96%. Dan
nilai rata-rata keseluruhan kelas pada skenario 3 ini adalah akurasi 84,44%,
presisi 80,19%, recall 76,67%, dan f-measure 76,21%.
5.3.4 Skenario 4
Hasil pengujian dari skenario 4 yaitu klasifikasi teks terjemahan hadits
dengan menggunakan algoritma Naïve Bayes Classifier, Confix Stripping
Stemmer dan seleksi fitur Chi-Square dengan jumlah data training sebanyak
300 hadits dan data testing sebanyak 30 hadits adalah sebagai berikut :
146
UIN Syarif Hidayatullah Jakarta
a. Pengujian pada taraf nyata 0,05
Tabel 5.7 Hasil Pengujian Skenario 4 Taraf Nyata 0,05
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Larangan
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Larangan
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Anjuran
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran
147
UIN Syarif Hidayatullah Jakarta
panahnya dengan tangannya agar tidak melukai
seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Anjuran
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Larangan
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
148
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Informasi
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Larangan
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Informasi
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Informasi
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Informasi
149
UIN Syarif Hidayatullah Jakarta
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Informasi
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Larangan
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
150
UIN Syarif Hidayatullah Jakarta
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Informasi
Tabel di atas menunjukkan hasil pengujian data testing yaitu 21 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 9 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.7
berikut :
151
UIN Syarif Hidayatullah Jakarta
Gambar 5.7 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,05
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, recall, dan f-measure paling tinggi yaitu 90%, 90%, dan 85,71%. Dan
nilai rata-rata keseluruhan kelas pada skenario 4 dengan taraf nyata 0,05 ini
adalah akurasi 80%, presisi 78,38%, recall 70%, dan f-measure 68,95%.
152
UIN Syarif Hidayatullah Jakarta
b. Pengujian pada taraf nyata 0,005
Tabel 5.8 Hasil Pengujian Skenario 4 Taraf Nyata 0,005
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Larangan
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Larangan
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Informasi
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran
153
UIN Syarif Hidayatullah Jakarta
panahnya dengan tangannya agar tidak melukai
seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Larangan
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Anjuran
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
154
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Larangan
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Larangan
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Larangan
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Informasi
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Anjuran
155
UIN Syarif Hidayatullah Jakarta
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Informasi
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Larangan
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
156
UIN Syarif Hidayatullah Jakarta
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Informasi
Tabel di atas menunjukkan hasil pengujian data testing yaitu 21 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 9 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.8
berikut :
157
UIN Syarif Hidayatullah Jakarta
Gambar 5.8 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,005
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, presisi, dan f-measure paling tinggi yaitu 90%, 88,89%, dan 84,21%.
Dan nilai rata-rata keseluruhan kelas pada skenario 4 dengan taraf nyata 0,005
ini adalah akurasi 80%, presisi 74,24%, recall 70%, dan f-measure 67,05%.
158
UIN Syarif Hidayatullah Jakarta
c. Pengujian pada taraf nyata 0,01
Tabel 5.9 Hasil Pengujian Skenario 4 Taraf Nyata 0,01
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Larangan
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Larangan
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Informasi
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Anjuran
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran
159
UIN Syarif Hidayatullah Jakarta
panahnya dengan tangannya agar tidak melukai
seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Larangan
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Anjuran
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
160
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Larangan
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Larangan
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Larangan
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Larangan
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Larangan
161
UIN Syarif Hidayatullah Jakarta
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Informasi
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Informasi
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Larangan
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Informasi
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
162
UIN Syarif Hidayatullah Jakarta
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Informasi
Tabel di atas menunjukkan hasil pengujian data testing yaitu 20 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 10 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.9
berikut :
163
UIN Syarif Hidayatullah Jakarta
Gambar 5.9 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,01
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, dan f-measure paling tinggi yaitu 86,67% dan 77,78%. Dan nilai rata-
rata keseluruhan kelas pada skenario 4 dengan taraf nyata 0,01 ini adalah
akurasi 77,78%, presisi 80,04%, recall 66,67%, dan f-measure 64,30%.
164
UIN Syarif Hidayatullah Jakarta
d. Pengujian pada taraf nyata 0,001
Tabel 5.10 Hasil Pengujian Skenario 4 Taraf Nyata 0,001
No. Terjemahan Hadits Kelas
Aktual
Kelas
Prediksi
1. Sesungguhnya darah kalian, harta kalian dan
kehormatan kalian sesama kalian haram (suci)
sebagaimana sucinya hari kalian ini, bulan kalian ini
dan tanah kalian ini. (Maka) hendaklah yang hadir
menyampaikan kepada yang tidak hadir, karena
orang yang hadir semoga dapat menyampaikan
kepada orang yang lebih paham darinya.
Anjuran Anjuran
2. Jika datang haid maka tinggalkanlah shalat, dan bila
telah berakhir maka bersihkanlah darah darimu lalu
shalatlah.
Anjuran Larangan
3. Sesungguhnya dijadikannya imam itu untuk diikuti.
Jika imam bertakbir maka takbirlah kalian, jika rukuk
maka rukuklah kalian, jika sujud maka sujudlah
kalian, dan jika ia shalat dengan berdiri maka
shalatlah kalian dengan berdiri.
Anjuran Larangan
4. Shalatlah di tempat tinggal kalian. Ia melanjutkan
perkataannya, "Jika malam sangat dingin dan hujan
Rasulullah shallallahu 'alaihi wasallam
memerintahkan seorang mu'adzin untuk
mengucapkan: "Hendaklah kalian shalat di tempat
tinggal kalian."
Anjuran Anjuran
5. Jika salah seorang dari kalian masuk masjid, maka
hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan
6. Barangsiapa lewat dengan membawa panah di masjid
atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran
165
UIN Syarif Hidayatullah Jakarta
panahnya dengan tangannya agar tidak melukai
seorang muslim.
7. Kembalilah kalian kepada mereka, bergabunglah
bersama mereka, ajari mereka dan shalat bersama
mereka. Jika waktu shalat telah tiba, maka hendaklah
salah seorang dari kalian mengumandangkan adzan
dan hendaklah yang mengimami shalat kalian adalah
yang paling tua di antara kalian.
Anjuran Larangan
8. Jika kalian berdua sudah keluar, maka (bila hendak
shalat) adzan dan iqamatlah. Dan yang menjadi
Imam hendaklah yang paling tua di antara kalian.
Anjuran Larangan
9. Jika salah seorangii kalian mendatangi shalat jum'at
hendaklah ia mandi. Anjuran Larangan
10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang
sandal hendaklah dia memakai sepatunya. Dan
barangsiapa yang tidak memiliki kain sarung
hendaklah dia memakai celana untuk ihram".
Anjuran Anjuran
11. Sungguh kalian telah mengerjakan suatu shalat (yang
dilarang). Kami telah mendampingi Rasulullah
shallallahu 'alaihi wasallam, dan kami tidak pernah
melihat beliau melaksanakannya. Beliau telah
melarang keduanya, yaitu dua rakaat setelah shalat
'Ashar.
Larangan Larangan
12. Kami dilarang mengantar jenazah namun Beliau
tidak menekankan hal tersebut kepada kami. Larangan Larangan
13. Telah dilarang berpuasa dan berjual beli pada hari
Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang
jual beli tanpa mengetahui barang yang dijual dan
juga jual beli tanpa memeriksa barang yang dijual.
Larangan Larangan
166
UIN Syarif Hidayatullah Jakarta
14. Setelah tahun ini tidak boleh seorang musyrikpun ang
melaksanakan haji dan tidak boleh thawaf di Ka'bah
dengan telanjang.
Larangan Larangan
15. "Jika kalian mendengar wabah berada di suatu
kawasan, janganlah kalian datang kesana, dan jika
terjadi di suatu kawasan yang kalian diami, jangan
kalian meninggalkannya."
Larangan Larangan
16. Janganlah kalian sepeninggalku menjadi kafir,
sebagian kalian memenggal leher sebagian yang
lainnya.
Larangan Larangan
17. Seorang hakim dilarang memutuskan antara dua
orang ketika marah. Larangan Larangan
18. Jangan kalian mengharapkan bertemu musuh, dan
mintalah keselamatan kepada Allah. Larangan Larangan
19. Jangan kalian benarkan ahli kitab, dan jangan pula
kalian mendustakannya, dan katakan saja '(Kami
beriman kepada Allah, dan apa yang diturunkan
kepada kami dan yang diturunkan kepadamu) '.
Larangan Larangan
20. Jangan kalian bersumpah dengan nama bapak-bapak
kalian, dan barangsiapa bersumpah, hendaklah
bersumpah dengan nama Allah.
Larangan Anjuran
21. Kami melindungi seseorang yang kau lindungi wahai
Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah
waktu dhuha
Informasi Informasi
22. Empat hal bila ada pada seseorang maka dia adalah
seorang munafiq tulen yaitu orang yang jika
berbicara dusta, jika berjanji mengingkari, jika diberi
amanat dia khiyanat dan jika berseteru dia curang dan
barangsiapa yang ada padanya salah satu sifat itu, dia
punya sifat nifaq hingga dia meninggalkannya
Informasi Anjuran
167
UIN Syarif Hidayatullah Jakarta
23. Bagi setiap pengkhiyanat akan diberikan bendera
pada hari qiyamat yang ditegakkan sesuai kadar
pengkhiyanatannya
Informasi Anjuran
24. Ketika Allah menetapkan penciptaan makhluq, Dia
menulis di dalam Kitab-Nya, yang berada di sisi-Nya
di atas ai-'Arsy (yang isinya): "Sesungguhnya
rahmat-Ku mengalahkan kemurkaan-Ku
Informasi Anjuran
25. Sesungguhnya setiap orang dari kalian dikumpulkan
dalam penciptaannya ketika berada di dalam perut
ibunya selama empat puluh hari, kemudian menjadi
'alaqah (zigot) selama itu pula kemudian menjadi
mudlghah (segumpal daging), selama itu pula
kemudian Allah mengirim malaikat yang
diperintahkan empat ketetapan dan dikatakan
kepadanya, tulislah amalnya, rezekinya, ajalnya dan
sengsara dan bahagianya lalu ditiupkan ruh
kepadanya. Dan sungguh seseorang dari kalian akan
ada yang beramal hingga dirinya berada dekat
dengan surga kecuali sejengkal saja lalu dia didahului
oleh catatan (ketetapan taqdir) hingga dia beramal
dengan amalan penghuni neraka dan ada juga
seseorang yang beramal hingga dirinya berada dekat
dengan neraka kecuali sejengkal saja lalu dia
didahului oleh catatan (ketetapan taqdir) hingga dia
beramal dengan amalan penghuni surga
Informasi Anjuran
26. Tidak akan terjadi hari qiyamat hingga muncul
seorang laki-laki dari suku Qahthan menggiring
manusia dengan tongkatnya
Informasi Anjuran
27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib
adalah kedudukannya sama (satu) . Informasi Informasi
168
UIN Syarif Hidayatullah Jakarta
28. Sesungguhnya urusan (khilafah/pemerintahan) ini
berada pada suku Quraisy dan tidak ada seorangpun
yang menentang mereka melainkan Allah Ta'ala pasti
akan menelungkupkan wajahnya ke tanah selama
mereka (Quraisy) menegakkan ad-din (agama)
Informasi Informasi
29. Dan Kami jadikan kalian berbangsa-bangsa dan
bersuku-suku Informasi Informasi
30. Sesungguhnya diantara apa yang didapatkan manusia
dari perkataan (yang disepakati) para Nabi adalah;
"Jika kamu tidak malu, berbuatlah sesukamu
Informasi Larangan
Tabel di atas menunjukkan hasil pengujian data testing yaitu 17 data
yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,
dan 13 data yang tidak sesuai.
Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan
perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil
perhitungan tersebut juga ditampilkan di sistem seperti padagambar 5.10
berikut :
169
UIN Syarif Hidayatullah Jakarta
Gambar 5.10 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,001
Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,
dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.
Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai
akurasi, dan presisi paling tinggi yaitu 80% dan 83,33%. Dan nilai rata-rata
keseluruhan kelas pada skenario 4 dengan taraf nyata 0,001 ini adalah akurasi
71,11%, presisi 58,89% recall 56,67%, dan f-measure 55,36%.
5.3.5 Analisis Perbandingan Hasil Seluruh Pengujian
Setelah keempat skenario mendapatkan nilai akurasi, presisi, recall,
dan f-measure, selanjutnya dilakukan perbandingan hasil untuk mengetahui
skenario yang paling baik dalam mengklasifikasikan terjemahan hadits.
Berikut adalah nilai rata-rata akurasi, presisi, recall dan f-measure dari tiap
skenario :
170
UIN Syarif Hidayatullah Jakarta
Gambar 5.11 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,05), 3
dan 4 (taraf nyata 0,05)
Gambar 5.12 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,005),
3 dan 4 (taraf nyata 0,005)
Gambar 5.13 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,01), 3
dan 4 (taraf nyata 0,01)
171
UIN Syarif Hidayatullah Jakarta
Gambar 5.14 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,001),
3 dan 4 (taraf nyata 0,001)
Dari keempat gambar diatas dapat dilihat bahwa skenario yang
memiliki nilai rata-rata akurasi tertinggi adalah skenario 2 (taraf nyata 0,05)
dan skenario 3 yaitu 84,44%, nilai rata-rata presisi tertinggi adalah skenario 3
yaitu 80,19%, nilai rata-rata recall tertinggi adalah skenario 2 (taraf nyata 0,05)
dan skenario 3 yaitu 76,67%, dan nilai rata-rata f-measure tertinggi adalah
skenario 3 yaitu 76,21%. Dari perbandingan keseluruhan nilai rata-rata dari
semua skenario dapat ditarik kesimpulan bahwa skenario yang paling baik
dalam mengklasifikasikan terjemahan hadits adalah skenario 3 yaitu
kombinasi Algoritma Naïve Bayes Classifier dan Confix Stripping Stemmer
dengan nilai rata-rata akurasi, presisi, recall, dan f-measure berturut-turut yaitu
84,44%, 80,19%, 76,67% dan 76,21%.
Skenario 2 (taraf nyata 0,05) dan 3 memiliki nilai akurasi dan recall
yang sama karena jumlah klasifikasi data testing yang dihasilkan oleh sistem
dan sesuai dengan aktual sama-sama berjumlah 23, dan yang tidak sesuai
berjumlah 7. Hal itu dikarenakan penggunaan taraf nyata 0,05 dengan nilai
kritis yang kecil yaitu 3,84 sehingga tidak banyak mengurangi fitur/kata yang
membuat kecil kemungkinan kata yang merupakan ciri khas suatu kelas ikut
terhapus. Seperti pada penelitian (Rahmad & Pribadi, 2015) bahwa semakin
kecil taraf nyata α dan semakin besar nilai kritis, maka jumlah feature yang
dihasilkan akan semakin sedikit begitupun sebaliknya.
Skenario 3 merupakan skenario terbaik dalam penelitian ini karena
memiliki nilai rata-rata akurasi, presisi, recall, dan f-measure tertinggi diantara
172
UIN Syarif Hidayatullah Jakarta
skenario lainnya. Skenario terbaik ini yaitu kombinasi Naïve Bayes Classifier
dan Confix Stripping Stemmer, sejalan dengan penelitian yang dilakukan oleh
(Ariadi & Fithriasari, 2015) mengenai klasifikasi berita Indonesia
menggunakan metode Naive Bayesian Classification dan Support Vector
Machine dengan algoritma stemming yaitu Confix Stripping Stemmer yang
merupakan perkembangan dari algoritma nazief stemmer yang dilakukan oleh
Jelita Asian, dengan menambahkan beberapa perbaikan yang bertujuan untuk
meningkatkan hasil stemming yang diperoleh. Penelitian tersebut
menghasilkan nilai akurasi, presisi, recall, dan f-measure diatas 80% pada
kedua algoritma yang dikombinasi dengan Confix Stripping Stemmer. Begitu
juga penelitian yang dilakukan (Kurniawan et al., 2012) yaitu membangun
sistem klasifikasi konten berita dalam bentuk web menggunakan algoritma
Naïve Bayes Classifier yang dikombinasi dengan Confix Stripping Stemmer.
Penelitian tersebut menunjukkan bahwa berita testing berhasil terklasifikasi
secara otomatis seluruhnya.
173
BAB VI
PENUTUP
6.1 Kesimpulan
Hasil analisis kinerja Algoritma Naïve Bayes Classifier dengan seleksi
fitur Chi-Square dan Confix Stripping Stemmer dalam mengklasifikasikan
hadits Shahih Bukhari dengan menggunakan metode simulasi yang terdiri
dari tahapan problem formulation, conceptual model, input and output data,
modelling, simulation, verification and validation, experimentation dan
output analysis dan setelah melakukan perhitungan Confusion Matrix yaitu
accuracy, precision, recall dan f-measure menunjukkan bahwa kinerja yang
memiliki nilai terbaik adalah kinerja Algoritma Naïve Bayes Classifier dan
Confix Stripping Stemmer.
6.2 Saran
Setelah melakukan penelitian ini, ada beberapa hal yang kedepannya
dapat dikembangkan guna proses pengembangan selanjutnya. Adapun saran
dari penulis antara lain :
1. Dapat menggunakan algoritma seleksi fitur yang lain untuk dikombinasi
dengan algoritma Naïve Bayes Classifier seperti Mutual Information
(MI), Information Gain (IG), atau Term Strength (TS).
2. Dapat melakukan klasifikasi multi-class karena dalam satu hadits bisa
mengandung dua atau lebih makna (anjuran, larangan, dan informasi).
3. Dapat menggunakan variasi jumlah data misal jumlah data tidak
seimbang pada setiap kelas.
4. Untuk mengetahui hasil pembanding yang lebih luas dapat menggunakan
Bahasa pemrograman berbeda dengan implementasi ke objek lainnya
dari yang penulis gunakan.
174
UIN Syarif Hidayatullah Jakarta
DAFTAR PUSTAKA
Adriani, M., Asian, J., Nazief, B., Williams, H. E., & Tahaghoghi, S. M. M. (2007).
Stemming Indonesian: A confix-stripping approach. Conferences in Research
and Practice in Information Technology Series, 38(September 2018), 307–
314. https://doi.org/10.1145/1316457.1316459.
Andini, S. (2013). Klasifikasi Dokumen Teks Menggunakan Algoritma Naive
Bayes dengan Bahasa Pemrograman Java. Jurnal Teknologi Informasi &
Pendidikan ISSN: 2086-4981, 6 No. 2(September), 140–147. Retrieved from
http://www.jurnal-tip.net/jurnal-resource/file/13-Vol6No2Sep2013-Silfia
Andini.pdf
Aprilianti P, A. (2015). Sentiment Analysis Dengan Naive Bayes Untuk Melihat
Persepsi Masyarakat Terhadap Batik Pada Jejaring Sosial Twitter. Seminar
Nasional Matematika Dan Pendidikan Matematika UMS Tahun 2015, 1, 833–
839. https://doi.org/10.1007/978-1-4614-1557-2_10
Ariadi, D., & Fithriasari, K. (2015). Klasifikasi Berita Indonesia Menggunakan
Metode Naive Bayesian Classification dan Support Vector Machine dengan
Confix Stripping Stemmer. JURNAL SAINS DAN SENI ITS Vol. 4, No.2, 4(2),
248–253.
Baqi, M. F. A. (2012). Al-lu’lu’ wal Marjan Mutiara Hadits Shahih Bukhari dan
Muslim. Jakarta Timur: Ummul Quro.
Darujati, C., Gumelar, A. B., Informasi, S., Komputer, F. I., Surabaya, U. N., Bayes,
N., … Learning, S. (2012). Pemanfaatan Teknik Supervised Untuk Klasifikasi
Teks Bahasa Indonesia. Jurnal LINK, 16(1), 1–8.
Ernawati, S. (2016). Penerapan Particle Swarm Optimization Untuk Seleksi Fitur
Pada Analisis Sentimen Review Perusahaan Penjualan Online Menggunakan
Naïve Bayes. IOSR Journal of Economics and Finance, 3(1), 56.
Faisal, R., & Nugrahadi, D. T. (2019). Belajar Data Science: Klasifikasi dengan
175
UIN Syarif Hidayatullah Jakarta
Bahasa Pemrograman R. Banjarbaru: Scripta Cendekia.
Fauzan, H., Al-faraby, S., & Adiwijaya. (2018). Pengklasifikasian Topik Hadits
Terjemahan Bahasa Indonesia Menggunakan Latent Semantic Indexing dan
Support Vector Machine. Media Informatika Budidarma (MIB), 2(4), 131–
139.
Jiawei Han, Micheline Kamber, J. P. (2011). Data Mining – Concepts &
Techniques. https://doi.org/10.1016/B978-0-12-381479-1.00001-0
Kalokasari, D. H., Setianingrum, A. H., & Shofi, I. M. (2018). Implementasi
Algoritma Multinomial Naive Bayes Classifier Pada Sistem Klasifikasi Surat
Keluar (Studi Kasus : DISKOMINFO Kabupaten Tangerang). Jurnal Teknik
Informatika, 10(2). https://doi.org/10.15408/jti.v10i2.6822
Komputer, W. (2015). Membangun Sistem Informasi dengan Java Netbeans dan
MySQL. Yogyakarta: ANDI.
Kurniawan, B., Effendi, S., & Sitompul, O. S. (2012). Klasifikasi Konten Berita
Dengan Metode Text Mining. Jurnal Dunia Teknologi Informasi, 1(2), 14–19.
Kusumaningrum, A., Al-faraby, S., & Adiwijaya. (2017). Klasifikasi Informasi ,
Anjuran dan Larangan pada Hadits Shahih Bukhari menggunakan Metode
Support Vector Machine . E-Proceeding of Engineering :, 4(3), 5014–5023.
Liu, B. (2011). Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data
Second Edition. In Computer Knowledge and Technology (Academic …
(second). https://doi.org/10.1007/978-3-642-19460-3
Madani, S. A., Kazmi, J., & Mahlknecht, S. (2010). Wireless sensor networks:
modeling and simulation. (January), 1–16.
Nofriansyah, D., Erwansyah, K., & Ramadhan, M. (2016). Penerapan Data Mining
dengan Algoritma Naive Bayes Clasifier untuk Mengetahui Minat Beli
Pelanggan terhadap Kartu Internet XL ( Studi Kasus di. Saintikom, 15(1978–
6603), 81–92.
176
UIN Syarif Hidayatullah Jakarta
Pattekari, S. A., & Parveen, A. (2012). Prediction system for heart disease using
Naive Bayes. International Journal of Advanced Computer and Mathematical
Sciences, 3(3), 2230–9624. Retrieved from http://bipublication.com
Priyanti, E. (2017). Penerapan algoritma naïve bayes untuk deteksi bakteri e-coli.
8(1), 17–23. https://doi.org/10.1016/j.joen.2010.01.012
Rahmad, A. N., & Pribadi, F. S. (2015). PEMILIHAN FEATURE DENGAN CHI
SQUARE DALAM ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI
BERITA. 5(1), 33–43.
Rahman, A., Wiranto, & Doewes, A. (2017). Online News Classification Using
Multinomial Naive Bayes. Itsmart, 6(1), 32–38.
https://doi.org/10.1177/1096348015584441
Riviera, E., Jasin, R., & Al-faraby, S. (2017). Klasifikasi Anjuran , Larangan dan
Informasi pada Hadis Sahih Al-Bukhari berdasarkan Model Unigram
menggunakan Artificial Neural Network ( ANN ). 4(3), 4683–4694.
Rosandy, T. (2016). PERBANDINGAN METODE NAIVE BAYES CLASSIFIER
DENGAN METODE DECISION TREE (C4.5) UNTUK MENGANALISA
KELANCARAN PEMBIAYAAN (Study Kasus : KSPPS / BMT AL-
FADHILA). Jurnal Teknologi Informasi Magister, 2(01), 52–62.
Sacra, S. A. L., Faraby, S. Al, & Triantoro, D. (2017). KLASIFIKASI ANJURAN,
LARANGAN, DAN INFORMASI PADA HADITS SHAHIH BUKHARI
MENGGUNAKAN NAÏVE BAYES CLASSIFIER. 4(3), 4794–4802.
Sanjaya, S., & Absar, E. A. (2015). Pengelompokan Dokumen Menggunakan
Winnowing Fingerprint dengan Metode K - Nearest Neighbour. Jurnal
CoreIT, 1(2), 50–56.
Saputra, H. K. (2018). Analisis Data Mining Untuk Pemetaan Mahasiswa Yang
Membutuhkan Bimbingan dan Konseling Menggunakan Algoritma Naive
Bayes Classifier. Jurnal Teknologi Informasi & Pendidikan, 11(1), 14–26.
177
UIN Syarif Hidayatullah Jakarta
Septiani, W. D. (2017). Komparasi metode klasifikasi data mining algoritma c4.5
Dan Naive Bayes Untuk Prediksi Penyakit Hepatitis. Jurnal Pilar Nusa
Mandiri, 13(1), 76–84.
Somantri, O., Wiyono, S., & Dairoh. (2017). Metode K-Means untuk Optimasi
Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector
Machine (SVM). Scientific Journal of Informatics, 3(1), 34–45.
https://doi.org/10.15294/sji.v3i1.5845
Sugiyono. (2012). Statistika untuk Penelitian. Bandung: Alfabeta.
Susandi, D., & Sholahudin, U. (2016). Pemanfaatan Vector Space Model pada
Penerapan Algoritma Nazief Adriani , KNN dan Fungsi Similarity Cosine
untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks
Bahasa Indonesia. Jurnal ProTekInfo, 3(1), 22–29.
Widodo, & Pratiwi, N. I. (2017). Klasifikasi Dokumen Karya Akhir Mahasiswa
Menggunakan Naive Bayes Classifier (NBC) Berdasarkan Abstrak Karya
Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta. (September).
https://doi.org/10.21009/pinter.1.1.5
Zuhri, M. (2011). Hadis Nabi Telaah Historis dan Metodologis. Yogyakarta: Tiara
Wacana Yogya.