prediksi penyakit kanker payudara denganrepository.upnvj.ac.id/1392/1/awal.pdf · payudara dengan...

15
PREDIKSI PENYAKIT KANKER PAYUDARA DENGAN METODE NAÏVE BAYES SKRIPSI NINA PARAMITHA SALSABILA 1510511037 UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” JAKARTA FAKULTAS ILMU KOMPUTER PROGRAM STUDI INFORMATIKA 2019

Upload: others

Post on 08-Mar-2020

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

PREDIKSI PENYAKIT KANKER PAYUDARA DENGAN

METODE NAÏVE BAYES

SKRIPSI

NINA PARAMITHA SALSABILA

1510511037

UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” JAKARTA

FAKULTAS ILMU KOMPUTER

PROGRAM STUDI INFORMATIKA

2019

Page 2: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

ii

PREDIKSI PENYAKIT KANKER PAYUDARA DENGAN

METODE NAÏVE BAYES

SKRIPSI

Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar

Sarjana Komputer

NINA PARAMITHA SALSABILA

1510511037

UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” JAKARTA

FAKULTAS ILMU KOMPUTER

PROGRAM STUDI INFORMATIKA

2019

Page 3: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk
Page 4: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk
Page 5: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk
Page 6: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

vi

PREDIKSI PENYAKIT KANKER PAYUDARA DENGAN

METODE NAÏVE BAYES

Nina Paramitha Salsabila

Abstrak

Kanker payudara merupakan salah satu penyakit yang sangat mengkhwatirkan

bagi masyarakat karena sulit untuk deteksi sejak dini dan kurangnya keakuratan

pada diagnosa seorang dokter sehingga membuat penanganan awal menjadi

kurang tepat. Hal ini menjadi sesuatu yang sangat diperhatikan karena tingkat

kematian pada penyakit ini semakin tinggi. Penelitian ini dilakukan untuk

membuat prediksi yang nantinya dapat membantu seorang dokter dalam

menentukan diagnosa secara tepat dan penanganan lebih awal pada penyakit

kanker payudara. Penelitian ini menggunakan data pasien pada pemeriksaan dini.

Metode yang digunakan merupakan metode klasifikasi Naïve Bayes yang

merupakan sebuah metode untuk melakukan klasifikasi terhadap objek

berdasarkan perhitungan probabilitas. Sistem pada penelitian ini dibuat

menggunakan PHP. Hasil keluaran dari sistem yang dibangun dapat dijadikan

acuan untuk membantu seorang dokter dalam memprediksi seorang pasien. Dalam

penelitian ini dilakukan tiga percobaan dengan membagi data latih dan data uji.

Pada percobaan pertama data latih dan data uji sebesar 60% dan 40%, pada

percobaan kedua data latih dan data uji sebesar 70% dan 20%, sedangkan pada

percobaan ketiga data latih dan data uji sebesar 80% dan 20%. Hasil yang

diperoleh pada percobaan ketiga memiliki akurasi paling tinggi yaitu sebesar

76,08%.

Kata kunci: Kanker Payudara, Prediksi, Naïve Bayes.

Page 7: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

vii

PREDICTION OF BREAST CANCER DISEASE WITH NAÏVE

BAYES METHOD

Nina Paramitha Salsabila

Abstract

Breast cancer is a disease that is very worrying for the community because it is

difficult to detect early and lack accuracy in the diagnosis of a doctor, making

early treatment less appropriate. This is something that very much noticed because

the mortality rate in this disease is getting higher. This research was conducted to

make predictions that could later assist a doctor in determining the correct

diagnosis and early treatment of breast cancer. This study used patient data on

early examination. The method used is the Naïve Bayes classification method

which is a method for classifying objects based on probability calculations. The

system in this study was made using PHP. The output of the system built can be

used as a reference to help a doctor predict a patient. In this study three

experiments were conducted by dividing training data and test data. In the first

experiment the training data and test data were 60% and 40%, in the second

experiment the training data and test data were 70% and 20%, while in the third

experiment the training data and test data were 80% and 20%. The results

obtained in the third experiment have the highest accuracy of 76.08%.

Keywords: Breast Cancer, Prediction, Naïve Bayes.

Page 8: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

viii

KATA PENGANTAR

Dengan memanjatkan puji syukur ke hadirat Allah SWT atas segala

rahmat dan hidayah-Nya, Shalawat serta salam tak lupa tercurahkan kepada Nabi

Muhammad SAW, keluarga serta sahabatnya sehingga penulis dapat

menyelesaikan Tugas Akhir ini yang berjudul ”Prediksi Penyakit Kanker

Payudara Dengan Metode Naïve Bayes.

Penulisan Tugas Akhir ini merupakan salah satu syarat untuk memperoleh

gelar sarjana Informatika, Fakultas Ilmu Komputer, Universitas Pembangunan

Nasional “Veteran” Jakarta. Rasa terimakasih penulis ucapkan kepada:

1. Kepada Papa, Mama, serta adik-adik ku tersayang yang telah memberikan

dukungan yang tiada henti-hentinya dan menenangkan penulis selama

masa pengerjaan Skripsi ini.

2. Ibu Dr. Ermatita, M.Kom selaku Dekan Fakultas Ilmu Komputer

3. Ibu Anita Muliawati, S.Kom., MTI sebagai Ketua Program Studi

Informatika

4. Bapak Ridwan Raafi’udin, S.Kom., M.Kom selaku dosen pembimbing

skripsi yang membantu penulis dalam penyusunan skripsi sehingga dapat

menyelesaikan skripsi ini dengan baik.

5. Ibu Vini Indriasari, ST., M.Sc., Ph.D selaku dosen pembimbing

akademik

6. Ibu dan Bapak Dosen Informatika UPN “Veteran” Jakarta atas segala

ilmu-ilmu bermanfaat yang telah diberikan.

7. Kepada Pihak Rumah Sakit Kanker “Dharmais” yang telah memberikan

izin untuk melakukan penelitian.

8. Kepada Wisnu Arditya Maulana yang juga tiada hentinya memberikan

semangat dan dukungan.

9. Kepada teman-teman Informatika angkatan 2015 yang telah memberikan

dukungan.

Jakarta, 21 Juni 2019

Penulis

Nina Paramitha Salsabila

Page 9: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

ix

DAFTAR ISI

HALAMAN JUDUL ............................................................................................... ii

PERNYATAAN ORISINALITAS ........................................................................ iii

PERNYATAAN PERSETUJUAN PUBLIKASI .................................................. iv

PENGESAHAN ...................................................................................................... v

ABSTRAK ............................................................................................................. vi

ABSTRACT .......................................................................................................... vii

KATA PENGANTAR ......................................................................................... viii

DAFTAR ISI .......................................................................................................... ix

DAFTAR TABEL ................................................................................................. xii

DAFTAR GAMBAR ........................................................................................... xiii

DAFTAR LAMPIRAN ........................................................................................ xiv

DAFTAR SIMBOL ............................................................................................... xv

BAB I PENDAHULUAN ....................................................................................... 1

1.1 Latar Belakang ......................................................................................... 1

1.2 Rumusan Masalah .................................................................................... 2

1.3 Ruang Lingkup ......................................................................................... 3

1.4 Tujuan Penelitian ...................................................................................... 3

1.5 Manfaat Penelitian .................................................................................... 3

1.6 Luaran yang Diharapkan .......................................................................... 4

1.7 Sistematika Penulisan ............................................................................... 4

BAB II TINJAUAN PUSTAKA ............................................................................. 6

2.1 Kanker Payudara ...................................................................................... 6

2.2 Data Mining ............................................................................................. 8

2.2.1 Definisi Data Mining ........................................................................ 8

2.2.2 Tahapan Data Mining ....................................................................... 9

2.3 Klasifikasi ............................................................................................... 10

Page 10: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

x

2.4 Naïve Bayes ............................................................................................ 12

2.5 Matriks untuk Mengevaluasi Kinerja Pengklasifikasian ........................ 15

2.6 PHP (Hypertext Preprocessor) ............................................................... 17

2.7 MySQL ................................................................................................... 17

2.7 UML (Unified Modeling Language) ...................................................... 17

2.8 Studi Literatur ......................................................................................... 18

BAB III METODOLOGI PENELITIAN.............................................................. 22

3.1 Kerangka Pikir ........................................................................................ 22

3.2 Metode Pengumpulan Data .................................................................... 23

3.2.1 Studi Pustaka ................................................................................... 23

3.2.2 Observasi ......................................................................................... 23

3.3 Pemahaman Data .................................................................................... 23

3.4 Pengolahan Data (Praprocessing) .......................................................... 24

3.5 Transformasi Data .................................................................................. 24

3.6 Pembagian Data ...................................................................................... 26

3.7 Pemodelan Data ...................................................................................... 26

3.8 Evaluasi .................................................................................................. 26

3.9 Alat Bantu Penelitian .............................................................................. 27

3.10 Jadwal Penelitian .................................................................................... 27

BAB IV HASIL DAN PEMBAHASAN .............................................................. 29

4.1 Analisis dan Implementasi Naïve Bayes ................................................ 29

4.1.1 Use Case Diagram .......................................................................... 29

4.1.2 Activity Diagram ............................................................................. 30

4.1.3 Sequence Diagram .......................................................................... 31

4.1.4 Class Diagram ................................................................................ 33

4.1.5 Rancangan Basis Data ..................................................................... 34

4.1.6 Tampilan Sistem ............................................................................. 35

4.2 Praproses Data ........................................................................................ 37

4.2.1 Reduksi Data ................................................................................... 38

4.2.2 Transformasi Data ........................................................................... 39

4.3 Pengujian Metode Naïve Bayes .............................................................. 40

4.3.1 Perhitungan Manual Metode Naïve Bayes ...................................... 40

4.3.2 Hasil Prediksi dan Analisis Pengujian ............................................ 44

Page 11: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

xi

BAB V PENUTUP ................................................................................................ 46

5.1 Kesimpulan ............................................................................................. 46

5.2 Saran ....................................................................................................... 46

DAFTAR PUSTAKA ........................................................................................... xii

RIWAYAT HIDUP

LAMPIRAN

Page 12: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

xii

DAFTAR TABEL

Tabel 1. Pengukuran Evaluasi .......................................................................... 15

Tabel 2. Confusion Matrix................................................................................ 16

Tabel 3. Kategori Umur.................................................................................... 24

Tabel 4. Kategori Umur Pertama Haid ............................................................. 25

Tabel 5. Kategori Umur Menopause ................................................................ 25

Tabel 6. Kategori Penggunaan KB ................................................................... 25

Tabel 7. Kategori Laktasi ................................................................................. 25

Tabel 8. Kategori Ukuran Tumor ..................................................................... 26

Tabel 9. Jadwal Penelitian ................................................................................ 27

Tabel 10. Tabel Data_Pasien .............................................................................. 34

Tabel 11. Tabel Input ......................................................................................... 34

Tabel 12. Data Awal ........................................................................................... 38

Tabel 13. Hasil Reduksi Data ............................................................................. 38

Tabel 14. Hasil Transformasi Data..................................................................... 39

Tabel 15. Contoh Uji Data ................................................................................. 39

Tabel 16. Confusion Matrix Percobaan Pertama ................................................ 44

Tabel 17. Confusion Matrix Percobaan Kedua .................................................. 45

Tabel 18. Confusion Matrix Percobaan Ketiga .................................................. 45

Tabel 19. Hasil Percobaan .................................................................................. 45

Page 13: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

xiii

DAFTAR GAMBAR

Gambar 1. Klasifikasi dan Prediksi pada Data Mining ..................................... 11

Gambar 2. Metodologi Penelitian ...................................................................... 22

Gambar 3. Use Case Diagram ........................................................................... 29

Gambar 4. Activity Diagram Data Pasien .......................................................... 30

Gambar 5. Activity Diagram Pengujian Data .................................................... 31

Gambar 6. Sequence Diagram pada Data Pasien .............................................. 32

Gambar 7. Sequence Diagram pada Pengujian Data ......................................... 32

Gambar 8. Class Diagram pada Sistem ............................................................. 33

Gambar 9. Halaman Utama ............................................................................... 35

Gambar 10. Halaman Data Pasien ....................................................................... 36

Gambar 11. Halaman Pengujian Data ................................................................. 36

Gambar 12. Halaman Hasil Prediksi ................................................................... 37

Page 14: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

xiv

DAFTAR LAMPIRAN

Lampiran 1 Data Awal RM Pasien

Lampiran 2 Hasil Reduksi Data

Lampiran 3 Hasil Transformasi Data

Lampiran 4 Hasil Prediksi dengan data uji 40%

Lampiran 5 Hasil Prediksi dengan data uji 30%

Lampiran 6 Hasil Prediksi dengan data uji 20%

Lampiran 7 Script Proses Naïve Bayes

Lampiran 8 Similarity Index Skripsi

Page 15: PREDIKSI PENYAKIT KANKER PAYUDARA DENGANrepository.upnvj.ac.id/1392/1/AWAL.pdf · Payudara Dengan Metode Naïve Bayes. Penulisan Tugas Akhir ini merupakan salah satu syarat untuk

xv

DAFTAR SIMBOL

Simbol Nama Simbol Keterangan

Simbol Proses Menggambarkan Proses

Simbol Dokumen

Dokumen yang

dibutuhkan dalam proses

sistem

Simbol arah data atau

arus data

Sebagai petunjuk arah

data dan arus data pada

proses

Simbol Terminator

Simbol untuk permulaan

atau akhir dari suatu

kegiatan