implementasi data mining untuk memprediksi

16
i IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS MENGGUNAKAN METODE NAIVE BAYES SKRIPSI Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I pada Program Studi Teknik Informatika Fakultas Komunikasi dan Informatika Universitas Muhammadiyah Surakarta Oleh : AHMAD FIKRI MAURIZA L200100123 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA 2014

Upload: vuxuyen

Post on 21-Jan-2017

250 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

i

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN

MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS

MENGGUNAKAN METODE NAIVE BAYES

SKRIPSI

Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I

pada Program Studi Teknik Informatika Fakultas Komunikasi dan Informatika

Universitas Muhammadiyah Surakarta

Oleh :

AHMAD FIKRI MAURIZA

L200100123

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS KOMUNIKASI DAN INFORMATIKA

UNIVERSITAS MUHAMMADIYAH SURAKARTA

2014

Page 2: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

ii

Page 3: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

iii

Page 4: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

iv

DAFTAR KONTRIBUSI

Dengan ini saya menyatakan bahwa skripsi ini tidak terdapat karya yang

pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi,

dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang

pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu

dalam naskah ini dan disebutkan dalam daftar pustaka.

Berikut saya sampaikan daftar kontribusi dalam penyusunan skripsi:

1. Mas Setiawan sebagai rekan untuk pencarian data sebagai bahan olah data

mining.

2. Saya sendiri yang mengolah data dan penghitungan metode naive bayes

berdasarkan sumber-sumber pada buku, literatur dan internet..

3. Aplikasi yang saya gunakan untuk membantu skripsi ini yaitu.

a. WEKA 3.7.10.

b. Microsoft Excel 2007.

c. Excel2Arrf Converter V.1.0-Beta.

d. Notepad ++

4. Laptop yang digunakan memiliki spesifikasi Processor Intel Dual-Core

2,30 GHz, Ram 3,00 GB, Hardisk 250 GB, VGA mobile Intel (R) 45

Express Chipset Family dengan ukuran memori 1341 MB.

5. Laporan diketik menggunakan software Microsoft Office 2007.

6. Yusuf Sulistyo Nugroho, S.T., M.Eng, selaku dosen pembimbing yang

memberikan masukan dan arahan dalam penyusunan skripsi ini.

Page 5: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

v

Demikian pernyataan dan daftar kontribusi ini saya buat dengan sejujurnya.

Saya bertanggungjawab atas isi dan kebenaran daftar diatas.

Surakarta, Desember 2013

Ahmad Fikri Mauriza

Mengetahui :

Pembimbing

Yusuf Sulistyo Nugroho, S.T,. M.Eng

NIK : 100.1197

Page 6: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

vi

MOTTO DAN PERSEMBAHAN

MOTTO :

“Manfaatkan waktu dan kesempatan mu dengan sebaik-baiknya sebelum

rasa penyesalan itu datang menghantuimu”

-Ibu-

“Bismillah, semua hal itu pasti dapat kita taklukan dengan tangan kita

bermodal niat dan usaha”

-Penulis-

“Harapan besar membuat segala yang besar jadi mungkin”

-Benjamin Franklin-

Page 7: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

vii

PERSEMBAHAN :

Dengan mengucap syukur Alhamdulillah atas rahmad dan hidayah

Allah SWT, akan kupersembahkan karya ini kepada orang-orang saya sayangi:

1. Bapak - Ibuku tercinta yang tak pernah lelah dalam memotifasiku dan

mendoakan untuk meraih kesuksesan di dunia dan akhirat.

2. Nada dan Irsya sebagai adik, penghibur dan teman saat dirumah.

3. Keluarga besar H. Abdullah Syafii (mbah kakung) yang telah mendukung

dan mendoakan di setiap langkahku agar dapat menyelesaikan kuliah lebih

cepat dan menuju kesuksesan setiap lulus.

4. Devi, Asri, Nurul dan Lukman yang telah bersedia menjadi teman,

sahabat, dan keluarga yang menemani hari-hari dengan keceriaan dan

kebahagiaan.

5. Pak Nursito (Pak kost) dan teman-teman kost AL-FIKR yang sudah

menemani mulai awal kuliah sampai lulus.

6. Teman-teman Teknik Informatika angkatan 2010 terutama teman-teman

gembel dan kepompong yang telah menemaniku mulai semester 1 sampai

semester 7 dan berjuang menempuh gelar sarjana bersama-sama.

7. Keluarga besar Teknik Informatika UMS yang telah banyak memberikan

ilmu dan pengalamannya.

8. Semua pihak yang tidak dapat saya sebutkan satu persatu atas semua hal

yang telah diberikan.

Page 8: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

viii

KATA PENGANTAR

Assalamu’alaikum warohmatullohi Wabarakatuh

Puji syukur kehadirat Allah SWT, yang telah melimpahkan nikmat dan

anugerah yang sangat luar biasa sehingga saya dapat menyelesaikan skripsi

dengan baik yang berjudul “Implementasi Data Mining Untuk Memprediksi

Kelulusan Mahasiswa Fakultas Komunikasi Dan Informatika Ums

Menggunakan Metode Naive Bayes”.

Skripsi ini disusun sebagai syarat wajib untuk menyelesaikan pendidikan

jenjang Strata 1 pada Program Studi Teknik Informatika Universitas

Muhammadiyah Surakarta. Atas selesainya skripsi ini tidak lepas dari dukungan

dan bantuan dari berbagai pihak sehingga dapat berjalan dengan lancar dan sesuai

harapan, oleh karena itu pada kesempatan ini penulis ingin menyampaikan banyak

terima kasih kepada :

1. Allah SWT yang telah memberikan nikmat dan hidayahnya kepada

penulis sehingga diizinkan untuk menyelesaikan skripsi ini.

2. Orang tua dan keluarga besar penulis yang telah memberikan segala

dukungan berupa doa, moral dan materi.

3. Bapak Husni Thamrin, S.T, M.T., Ph.D selaku dekan Fakultas Komunikasi

Dan Informatika Universitas Muhammadiyah Surakarta.

4. Bapak Dr. Heru Supriyono, M.Sc selaku ketua Program Studi Teknik

Informatika.

Page 9: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

ix

5. Bapak Yusuf Sulistyo Nugroho, S.T, M.Eng selaku pembimbing skripsi

yang telah banyak membantu dalam memberikan petunjuk dan saran-saran

dalam penyusunan skripsi ini.

6. Mas Setiawan sebagai partner dalam kolaborasi skripsi ini yang telah

menemani mengerjakan skripsi dan membantu dalam pencarian data-data

yang diperlukan dalam penyusunan skripsi.

7. Bapak dan ibu dosen pengampu mata kuliah pada Program studi teknik

informatika yang telah memberikan ilmu serta pengalamannya kepada

penulis.

8. Teman-teman Teknik Informatika khususnya angkatan 2010 kelas E yang

telah mendukung dan menjadi teman yang sama-sama berjuang meraih

gelar sarjana.

9. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang berperan

dan membantu dalam penyelesaian skripsi ini.

Semoga Allah SWT selalu melimpahkan nikmat dan hidayahnya kepada

orang-orang yang telah membantu dalam kelacaran penyusunan ini. Penulis

berharap semoga skripsi ini dapat bermanfaat bagi penulis dan orang lain untuk

dikembangkan sehingga akan dapat menghasilkan penelitian-penelitan yang lebih

baik lagi dari sebelum-sebelumnya.

Wassalamu’alaikum Warohmatullohi Wabarokatuh.

Surakarta, 20 Desember 2013

Penulis

Page 10: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

x

DAFTAR ISI

HALAMAN JUDUL ................................................................................... i

HALAMAN PERSETUJUAN ..................................................................... ii

HALAMAN PENGESAHAN ...................................................................... iii

DAFTAR KONTRIBUSI ............................................................................. iv

MOTTO DAN PERSEMBAHAN ................................................................ vi

KATA PENGANTAR ................................................................................. viiii

DAFTAR ISI ............................................................................................... x

DAFTAR TABEL ........................................................................................ xiii

DAFTAR PERSAMAAN ............................................................................ xiii

DAFTAR GAMBAR ................................................................................... xiv

ABSTRAKSI ............................................................................................... xvi

BAB I PENDAHULUAN .................................................................... 1

A. Latar Belakang .................................................................... 1

B. Rumusan Masalah ............................................................... 4

C. Batasan Masalah ................................................................. 4

D. Tujuan Masalah .................................................................. 5

E. Manfaat Penelitian .............................................................. 5

F. Sistematika Penulisan ......................................................... 6

BAB II TINJAUAN PUSTAKA ............................................................ 8

A. Telaah Penelitian ................................................................ 8

B. Landasan Teori ................................................................... 11

Page 11: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

xi

1. Prediksi ......................................................................... 11

2. Kelulusan Mahasiswa .................................................... 12

3. Data Mining .................................................................. 12

4. Proses Data Mining ....................................................... 13

5. Naive Bayes .................................................................. 15

6. Weka ............................................................................. 15

BAB III METODOLOGI PENELITIAN ................................................ 17

A. Waktu Dan Tempat Penelitian ............................................. 17

B. Peralatan Utama Dan Pendukung ........................................ 17

C. Alur Penelitian .................................................................... 18

D. Langkah Penelitian ............................................................. 21

1. Identifikasi Masalah ...................................................... 21

2. Pengumpulan Data ........................................................ 21

3. Kelengkapan Data Dan Kebutuhan ................................ 24

a. Cleaning Data .......................................................... 24

b. Penentuan Sampel ................................................... 25

4. Implementasi Data Mining ............................................ 25

a. Pengubahan Format Arff ......................................... 25

b. Menentukan Metode ................................................ 26

BAB IV HASIL DAN PEMBAHASAN ................................................. 28

A. Hasil Penelitian ................................................................... 28

B. Analisis Dan Pembahasan ................................................... 28

1. Menentukan Atribut ...................................................... 28

Page 12: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

xii

2. Penentuan Sampel ......................................................... 29

3. Pengolahan Data ........................................................... 30

4. Pengubahan Data Dalam Arff ........................................ 31

5. Implementasi Dengan Naive Bayes ............................... 32

6. Implementasi Dalam Weka 3.7.10 ................................. 36

7. Membandingkan Metode Naive Bayes .......................... 57

BAB V PENUTUP ................................................................................. 61

A. Kesimpulan ......................................................................... 61

B. Saran ................................................................................... 61

1. Bagi Peneliti Berikutnya ............................................... 61

2. Bagi Fakultas ................................................................ 62

DAFTAR PUSTAKA .................................................................................. 63

LAMPIRAN ................................................................................................ 66

Page 13: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

xiii

DAFTAR TABEL

Tabel 3.1 Daftar Atribut .............................................................................. 22

Tabel 3.2 Daftar Atribut Beserta Isinya ....................................................... 24

Tabel 4.1 Perbandingan dari Naive Bayes, J48 dan OneR ............................ 55

DAFTAR PERSAMAAN

Persamaan (3.1) Metode Slovin .................................................................. 25

Persamaan (3.2) Irisan (X|Y) ...................................................................... 27

Persamaan (3.3) Naive Bayes ..................................................................... 27

Page 14: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

xiv

DAFTAR GAMBAR

Gambar 2.1 Tahap-Tahap Data Mining ....................................................... 13

Gambar 3.1 Diagram Alir Penelitian ........................................................... 19

Gambar 3.2 Diagram Ven ........................................................................... 27

Gambar 4.1 Data Asal Sebelum Dikelompokkan ........................................ 30

Gambar 4.2 Hasil Data Yang Sudah Dikodekan .......................................... 30

Gambar 4.3 Jendela Excel2Arrf Converter V.1.0-Beta ................................ 31

Gambar 4.4 Cara Upload .Xls Pada Converter ............................................ 31

Gambar 4.5 Hasil Converter ....................................................................... 32

Gambar 4.6 Data Training .......................................................................... 33

Gambar 4.7 Data Praproses ........................................................................ 36

Gambar 4.8 Jurusan Pada Lama Studi ......................................................... 37

Gambar 4.9 Gender Pada Lama Studi ......................................................... 38

Gambar 4.10 Daerah Pada Lama Studi ....................................................... 39

Gambar 4.11 Asal Sekolah Pada Lama Studi .............................................. 40

Gambar 4.12 Jumlah SKS Pada Lama Studi ............................................... 41

Gambar 4.13 Jumlah MK Pada Lama Studi ................................................ 42

Gambar 4.14 Asisten Pada Lama Studi ....................................................... 43

Gambar 4.15 Penyebaran Jurusan dan Gender ............................................ 44

Gambar 4.16 Penyebaran Jurusan dan Daerah ............................................. 45

Gambar 4.17 Penyebaran Gender dan Daerah ............................................. 46

Gambar 4.18 Penyebaran Jurusan dan SKS.................................................. 47

Page 15: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

xv

Gambar 4.19 Penyebaran Jurusan dan MK ................................................. 48

Gambar 4.20 Penyebaran Jurusan dan Gender ............................................ 49

Gambar 4.21 Penyebaran Gender dan SKS ................................................ 44

Gambar 4.22 Hasil Klasifikasi Naive Bayes ............................................... 47

Gambar 4.23 Hasil Evaluasi ....................................................................... 48

Gambar 4.24 Detail Akurasi Dan Confusion Matrix ................................... 49

Gambar 4.25 Memasukkan Data Uji ........................................................... 50

Gambar 4.26 Pencarian File Data Uji .......................................................... 50

Gambar 4.27 Hasil Evaluasi Akurasi Data Uji ............................................ 51

Gambar 4.28 Visualiza Classifier Errors ..................................................... 51

Gambar 4.29 Hasil Prediksi Data Uji .......................................................... 52

Gambar 4.30 Evaluasi J48 .......................................................................... 53

Gambar 4.31 Evaluasi Oner ........................................................................ 54

Page 16: IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI

xvi

ABSTRAKSI

Fakultas Komunikasi dan Informatika Universitas Muhammadiyah

Surakarta memiliki jumlah 2358 mahasiswa dengan jumlah lulusan 388

mahasiswa, Dengan bertambah pesatnya jumlah mahasiswa baru setiap tahunnya

dengan demikian secara otomatis akan terciptanya data-data yang sangat banyak

dan akan menambah melimpahnya data yang tersimpan tapi minim informasi.

Agar data yang awalnya tidak terpakai tersebut dapat diubah menjadi suatu

informasi data yang sangat bermanfaat dengan menggunakan teknik data mining.

Salah satunya dapat untuk memprediksi lama studi mahasiswa apakah dapat lulus

kurang dari 4 tahun atau lebih dari 4 tahun dengan berdasarkan atribut-atribut

yang digunakan.

Metode Naive Bayes digunakan untuk menganalisis data dalam

pengenalan pola dan memprediksi kelulusan mahasiswa. Data yang diperlukan

yaitu data-data mahasiswa yang sudah lulus sebagai data training sedangkan

data-data mahasiswa yang masih menempuh studi kuliah sebagai data uji.

Dengan adanya penelitian ini dapat memberikan informasi yang berguna

sehingga dapat meningkatkan kualitas atau dijadikan suatu acuan bagi

mahasiswa untuk memprediksi kelulusan dengan tepat waktu. Berdasarkan hasil

prediksi dari jumlah 342 data sampel yang diuji hanya 86 mahasiswa yang akan

lulus tepat waktu atau hanya sekitar 25,15 %, sedangkan mahasiswa yang akan

lulus terlambat berjumlah 256 mahasiswa mencapai 74,85% dari jumlah data

sampel.

Kata kunci : Data Mining, Naive Bayes, Prediksi