prediksi penyakit kanker payudara denganrepository.upnvj.ac.id/1392/1/awal.pdf · payudara dengan...
TRANSCRIPT
PREDIKSI PENYAKIT KANKER PAYUDARA DENGAN
METODE NAÏVE BAYES
SKRIPSI
NINA PARAMITHA SALSABILA
1510511037
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” JAKARTA
FAKULTAS ILMU KOMPUTER
PROGRAM STUDI INFORMATIKA
2019
ii
PREDIKSI PENYAKIT KANKER PAYUDARA DENGAN
METODE NAÏVE BAYES
SKRIPSI
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Sarjana Komputer
NINA PARAMITHA SALSABILA
1510511037
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” JAKARTA
FAKULTAS ILMU KOMPUTER
PROGRAM STUDI INFORMATIKA
2019
vi
PREDIKSI PENYAKIT KANKER PAYUDARA DENGAN
METODE NAÏVE BAYES
Nina Paramitha Salsabila
Abstrak
Kanker payudara merupakan salah satu penyakit yang sangat mengkhwatirkan
bagi masyarakat karena sulit untuk deteksi sejak dini dan kurangnya keakuratan
pada diagnosa seorang dokter sehingga membuat penanganan awal menjadi
kurang tepat. Hal ini menjadi sesuatu yang sangat diperhatikan karena tingkat
kematian pada penyakit ini semakin tinggi. Penelitian ini dilakukan untuk
membuat prediksi yang nantinya dapat membantu seorang dokter dalam
menentukan diagnosa secara tepat dan penanganan lebih awal pada penyakit
kanker payudara. Penelitian ini menggunakan data pasien pada pemeriksaan dini.
Metode yang digunakan merupakan metode klasifikasi Naïve Bayes yang
merupakan sebuah metode untuk melakukan klasifikasi terhadap objek
berdasarkan perhitungan probabilitas. Sistem pada penelitian ini dibuat
menggunakan PHP. Hasil keluaran dari sistem yang dibangun dapat dijadikan
acuan untuk membantu seorang dokter dalam memprediksi seorang pasien. Dalam
penelitian ini dilakukan tiga percobaan dengan membagi data latih dan data uji.
Pada percobaan pertama data latih dan data uji sebesar 60% dan 40%, pada
percobaan kedua data latih dan data uji sebesar 70% dan 20%, sedangkan pada
percobaan ketiga data latih dan data uji sebesar 80% dan 20%. Hasil yang
diperoleh pada percobaan ketiga memiliki akurasi paling tinggi yaitu sebesar
76,08%.
Kata kunci: Kanker Payudara, Prediksi, Naïve Bayes.
vii
PREDICTION OF BREAST CANCER DISEASE WITH NAÏVE
BAYES METHOD
Nina Paramitha Salsabila
Abstract
Breast cancer is a disease that is very worrying for the community because it is
difficult to detect early and lack accuracy in the diagnosis of a doctor, making
early treatment less appropriate. This is something that very much noticed because
the mortality rate in this disease is getting higher. This research was conducted to
make predictions that could later assist a doctor in determining the correct
diagnosis and early treatment of breast cancer. This study used patient data on
early examination. The method used is the Naïve Bayes classification method
which is a method for classifying objects based on probability calculations. The
system in this study was made using PHP. The output of the system built can be
used as a reference to help a doctor predict a patient. In this study three
experiments were conducted by dividing training data and test data. In the first
experiment the training data and test data were 60% and 40%, in the second
experiment the training data and test data were 70% and 20%, while in the third
experiment the training data and test data were 80% and 20%. The results
obtained in the third experiment have the highest accuracy of 76.08%.
Keywords: Breast Cancer, Prediction, Naïve Bayes.
viii
KATA PENGANTAR
Dengan memanjatkan puji syukur ke hadirat Allah SWT atas segala
rahmat dan hidayah-Nya, Shalawat serta salam tak lupa tercurahkan kepada Nabi
Muhammad SAW, keluarga serta sahabatnya sehingga penulis dapat
menyelesaikan Tugas Akhir ini yang berjudul ”Prediksi Penyakit Kanker
Payudara Dengan Metode Naïve Bayes.
Penulisan Tugas Akhir ini merupakan salah satu syarat untuk memperoleh
gelar sarjana Informatika, Fakultas Ilmu Komputer, Universitas Pembangunan
Nasional “Veteran” Jakarta. Rasa terimakasih penulis ucapkan kepada:
1. Kepada Papa, Mama, serta adik-adik ku tersayang yang telah memberikan
dukungan yang tiada henti-hentinya dan menenangkan penulis selama
masa pengerjaan Skripsi ini.
2. Ibu Dr. Ermatita, M.Kom selaku Dekan Fakultas Ilmu Komputer
3. Ibu Anita Muliawati, S.Kom., MTI sebagai Ketua Program Studi
Informatika
4. Bapak Ridwan Raafi’udin, S.Kom., M.Kom selaku dosen pembimbing
skripsi yang membantu penulis dalam penyusunan skripsi sehingga dapat
menyelesaikan skripsi ini dengan baik.
5. Ibu Vini Indriasari, ST., M.Sc., Ph.D selaku dosen pembimbing
akademik
6. Ibu dan Bapak Dosen Informatika UPN “Veteran” Jakarta atas segala
ilmu-ilmu bermanfaat yang telah diberikan.
7. Kepada Pihak Rumah Sakit Kanker “Dharmais” yang telah memberikan
izin untuk melakukan penelitian.
8. Kepada Wisnu Arditya Maulana yang juga tiada hentinya memberikan
semangat dan dukungan.
9. Kepada teman-teman Informatika angkatan 2015 yang telah memberikan
dukungan.
Jakarta, 21 Juni 2019
Penulis
Nina Paramitha Salsabila
ix
DAFTAR ISI
HALAMAN JUDUL ............................................................................................... ii
PERNYATAAN ORISINALITAS ........................................................................ iii
PERNYATAAN PERSETUJUAN PUBLIKASI .................................................. iv
PENGESAHAN ...................................................................................................... v
ABSTRAK ............................................................................................................. vi
ABSTRACT .......................................................................................................... vii
KATA PENGANTAR ......................................................................................... viii
DAFTAR ISI .......................................................................................................... ix
DAFTAR TABEL ................................................................................................. xii
DAFTAR GAMBAR ........................................................................................... xiii
DAFTAR LAMPIRAN ........................................................................................ xiv
DAFTAR SIMBOL ............................................................................................... xv
BAB I PENDAHULUAN ....................................................................................... 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Rumusan Masalah .................................................................................... 2
1.3 Ruang Lingkup ......................................................................................... 3
1.4 Tujuan Penelitian ...................................................................................... 3
1.5 Manfaat Penelitian .................................................................................... 3
1.6 Luaran yang Diharapkan .......................................................................... 4
1.7 Sistematika Penulisan ............................................................................... 4
BAB II TINJAUAN PUSTAKA ............................................................................. 6
2.1 Kanker Payudara ...................................................................................... 6
2.2 Data Mining ............................................................................................. 8
2.2.1 Definisi Data Mining ........................................................................ 8
2.2.2 Tahapan Data Mining ....................................................................... 9
2.3 Klasifikasi ............................................................................................... 10
x
2.4 Naïve Bayes ............................................................................................ 12
2.5 Matriks untuk Mengevaluasi Kinerja Pengklasifikasian ........................ 15
2.6 PHP (Hypertext Preprocessor) ............................................................... 17
2.7 MySQL ................................................................................................... 17
2.7 UML (Unified Modeling Language) ...................................................... 17
2.8 Studi Literatur ......................................................................................... 18
BAB III METODOLOGI PENELITIAN.............................................................. 22
3.1 Kerangka Pikir ........................................................................................ 22
3.2 Metode Pengumpulan Data .................................................................... 23
3.2.1 Studi Pustaka ................................................................................... 23
3.2.2 Observasi ......................................................................................... 23
3.3 Pemahaman Data .................................................................................... 23
3.4 Pengolahan Data (Praprocessing) .......................................................... 24
3.5 Transformasi Data .................................................................................. 24
3.6 Pembagian Data ...................................................................................... 26
3.7 Pemodelan Data ...................................................................................... 26
3.8 Evaluasi .................................................................................................. 26
3.9 Alat Bantu Penelitian .............................................................................. 27
3.10 Jadwal Penelitian .................................................................................... 27
BAB IV HASIL DAN PEMBAHASAN .............................................................. 29
4.1 Analisis dan Implementasi Naïve Bayes ................................................ 29
4.1.1 Use Case Diagram .......................................................................... 29
4.1.2 Activity Diagram ............................................................................. 30
4.1.3 Sequence Diagram .......................................................................... 31
4.1.4 Class Diagram ................................................................................ 33
4.1.5 Rancangan Basis Data ..................................................................... 34
4.1.6 Tampilan Sistem ............................................................................. 35
4.2 Praproses Data ........................................................................................ 37
4.2.1 Reduksi Data ................................................................................... 38
4.2.2 Transformasi Data ........................................................................... 39
4.3 Pengujian Metode Naïve Bayes .............................................................. 40
4.3.1 Perhitungan Manual Metode Naïve Bayes ...................................... 40
4.3.2 Hasil Prediksi dan Analisis Pengujian ............................................ 44
xi
BAB V PENUTUP ................................................................................................ 46
5.1 Kesimpulan ............................................................................................. 46
5.2 Saran ....................................................................................................... 46
DAFTAR PUSTAKA ........................................................................................... xii
RIWAYAT HIDUP
LAMPIRAN
xii
DAFTAR TABEL
Tabel 1. Pengukuran Evaluasi .......................................................................... 15
Tabel 2. Confusion Matrix................................................................................ 16
Tabel 3. Kategori Umur.................................................................................... 24
Tabel 4. Kategori Umur Pertama Haid ............................................................. 25
Tabel 5. Kategori Umur Menopause ................................................................ 25
Tabel 6. Kategori Penggunaan KB ................................................................... 25
Tabel 7. Kategori Laktasi ................................................................................. 25
Tabel 8. Kategori Ukuran Tumor ..................................................................... 26
Tabel 9. Jadwal Penelitian ................................................................................ 27
Tabel 10. Tabel Data_Pasien .............................................................................. 34
Tabel 11. Tabel Input ......................................................................................... 34
Tabel 12. Data Awal ........................................................................................... 38
Tabel 13. Hasil Reduksi Data ............................................................................. 38
Tabel 14. Hasil Transformasi Data..................................................................... 39
Tabel 15. Contoh Uji Data ................................................................................. 39
Tabel 16. Confusion Matrix Percobaan Pertama ................................................ 44
Tabel 17. Confusion Matrix Percobaan Kedua .................................................. 45
Tabel 18. Confusion Matrix Percobaan Ketiga .................................................. 45
Tabel 19. Hasil Percobaan .................................................................................. 45
xiii
DAFTAR GAMBAR
Gambar 1. Klasifikasi dan Prediksi pada Data Mining ..................................... 11
Gambar 2. Metodologi Penelitian ...................................................................... 22
Gambar 3. Use Case Diagram ........................................................................... 29
Gambar 4. Activity Diagram Data Pasien .......................................................... 30
Gambar 5. Activity Diagram Pengujian Data .................................................... 31
Gambar 6. Sequence Diagram pada Data Pasien .............................................. 32
Gambar 7. Sequence Diagram pada Pengujian Data ......................................... 32
Gambar 8. Class Diagram pada Sistem ............................................................. 33
Gambar 9. Halaman Utama ............................................................................... 35
Gambar 10. Halaman Data Pasien ....................................................................... 36
Gambar 11. Halaman Pengujian Data ................................................................. 36
Gambar 12. Halaman Hasil Prediksi ................................................................... 37
xiv
DAFTAR LAMPIRAN
Lampiran 1 Data Awal RM Pasien
Lampiran 2 Hasil Reduksi Data
Lampiran 3 Hasil Transformasi Data
Lampiran 4 Hasil Prediksi dengan data uji 40%
Lampiran 5 Hasil Prediksi dengan data uji 30%
Lampiran 6 Hasil Prediksi dengan data uji 20%
Lampiran 7 Script Proses Naïve Bayes
Lampiran 8 Similarity Index Skripsi
xv
DAFTAR SIMBOL
Simbol Nama Simbol Keterangan
Simbol Proses Menggambarkan Proses
Simbol Dokumen
Dokumen yang
dibutuhkan dalam proses
sistem
Simbol arah data atau
arus data
Sebagai petunjuk arah
data dan arus data pada
proses
Simbol Terminator
Simbol untuk permulaan
atau akhir dari suatu
kegiatan