lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/halaman awal.pdf ·...

15
Team project ©2017 Dony Pratidana S. Hum | Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis dan melisensikan ciptaan turunan dengan syarat yang serupa dengan ciptaan asli. Copyright and reuse: This license lets you remix, tweak, and build upon work non-commercially, as long as you credit the origin creator and license it on your new creations under the identical terms.

Upload: vankhuong

Post on 23-Mar-2019

224 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

Team project ©2017 Dony Pratidana S. Hum | Bima Agus Setyawan S. IIP 

 

 

 

 

 

Hak cipta dan penggunaan kembali:

Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis dan melisensikan ciptaan turunan dengan syarat yang serupa dengan ciptaan asli.

Copyright and reuse:

This license lets you remix, tweak, and build upon work non-commercially, as long as you credit the origin creator and license it on your new creations under the identical terms.

Page 2: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI

RELEVANSI KATA DALAM DOKUMEN DIGITAL

SKRIPSI

diajukan guna memenuhi sebagian persyaratan memperoleh

gelar Sarjana Komputer (S.Kom)

Diajukan oleh :

Paulus Maria Bodhi Dirma Kusumadi

10110110040

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNOLOGI INFORMASI DAN KOMUNIKASI

UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2014

Page 3: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

ii

HALAMAN PERSETUJUAN

Skripsi dengan judul

IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA

APLIKASI RELEVANSI KATA DALAM DOKUMEN DIGITAL

Oleh

Paulus Maria Bodhi Dirma Kusumadi

10110110040

telah disetujui untuk diajukan pada

Sidang Ujian Skripsi Universitas Multimedia Nusantara

Tangerang , 7 Juli 2014

Menyetujui,

Dosen Pembimbing Ketua Program Studi

Adhi Kusnadi, S.T., M.Si. Maria Irmina P. S.Kom, M.T.

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 4: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

iii

HALAMAN PERSEMBAHAN

“Manusia tak selamanya benar dan tak selamanya salah, kecuali ia

yang selalu mengoreksi diri dan membenarkan kebenaran orang lain

atas kekeliruan diri sendiri”

PERSEMBAHAN :

Karya Tulis ini kupersembahkan kepada :

1. Bapak dan Ibu tercinta

2. Teman-teman seperjuangan

3. Almamater

4. Semua pembaca yang budiman

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 5: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

iv

PERNYATAAN TIDAK MELAKUKAN PLAGIAT

Dengan ini saya:

Nama : Paulus Maria Bodhi Dirma Kusumadi

NIM : 10110110040

Fakultas : Teknologi Informasi dan Komunikasi

Program Studi : Teknik Informatika

Menyatakan bahwa skripsi ini adalah karya ilmiah saya sendiri, bukan hasil

plagiat dari karya ilmiah yang ditulis oleh orang lain atau lembaga lain, dan

semua karya ilmiah orang lain atau lembaga lain yang dirujuk dalam skripsi

ini telah disebutkan sumber kutipannya seta dicatumkan di Daftar Pustaka

Tangerang, 7 Juli 2014

Paulus M. Bodhi

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 6: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

v

IMPLEMENTASI ALGORITMA NAZIEF-ADRIANI PADA APLIKASI

RELEVANSI KATA DALAM DOKUMEN DIGITAL

ABSTRAKSI

Skripsi ini memaparkan pengembangan dari penggunaan Algoritma Nazief

Adriani sebagai algoritma stemming yang berguna untuk mengubah bentuk kata

berimbuhan menjadi kata dasar yang digabungkan dengan aturan Cosine

Similaritydan digunakan untuk menghitung persentase kemiripan dari dokumen

digital yang akan dibandingkan berdasarkan susunan kata didalamnya. Dalam

aplikasi ini algoritma ini digunakan untuk meningkatkan hasil relevansi isi dari

kedua dokumen digital yang akan dihitung persentasi kemiripan isinya

berdasarkan kata dasarnya. Algoritma ini berdasarkan pada aturan morfologi

Bahasa Indonesia yang merupakan bagian dari Information Retrieval. Dokumen

yang akan dihitung relevansinya dapat berupa dokumen yang berbeda tipe /

ekstensi seperti dokumen berekstensi txt, docx dan rtf. Konten yang akan dinilai

relevansi nya dari dokumen digital tersebut ialah konten teks dan hasil relevansi

nya ialah berupa persentase dan statistik kata dasar yang telah di stemm.Setelah

dilakukan ujicoba, relevansi antar dua dokumen digital dapat dihitung

relevansinya dalam satuan presentase, serta algoritma stemming yang digunakan

berhasil melakukan stemming dengan index Understemming sebesar 13.5 x

dan Overstemming sebesar 2.473 x .

Kata kunci : stemming, Cosine Similarity, Evaluasi Paice ,algoritma Nazief-

Adriani.

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 7: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

vi

IMPLEMENTATION OF NAZIEF-ADRIANI ALGORITHM AT

RELEVANCE WORDS APPLICATION ON DIGITAL

DOCUMENT

ABSTRACT

This thesis describes development of the use of Nazief Adriani Algorithm as a

useful stemming algorithm for translating words to its root words and combined

with Cosine Similarity Rules that used to calculate relevance percentage of two

digital documents. This algorithm in this application used to improve relevance

result from those both digital document that will be calculated based from its root

words. This algorithm based on morphology of Indonesian language, which its

part of Information Retrieval. Digital Documents that will be calculate its

relevance is document can be different document type such as txt, docx and rtf

files. Content which will be calculate its relevance is a text type and its relevance

result is a percentage and root words statistics as a result of stemming process.

After testing period, digital documents relevance can be calculated in percentage.

Stemming algorithm that used has 13.5 x understemming index and 2.473 x

of overstemming index

Keywords : stemming, Cosine Similarity, Paice Evaluation , Nazief-Adriani

algorithm.

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 8: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

vii

KATA PENGANTAR

Segala pengetahuan yang ada di dunia ini berasal dari Tuhan Yang

Mahakasih, dan hal tersebut telah menjadikan suatu sumber inspirasi yang

membantu penulis dalam menyelesaikan laporan tugas akhir. Laporan tugas akhir

yang berjudul “IMPLEMENTASI ALGORITMA NAZIEF-ADRIANI PADA

APLIKASI RELEVANSI KATA DALAM DOKUMEN DIGITAL” diajukan

kepada Program Studi Teknik Informatika, Fakultas Teknologi Informatika dan

Komunikasi, Universitas Multimedia Nusantara.

Selama penulis melaksanakan tugas akhir, tentunya tidak pernah terlepas

daripada semua orang-orang yang berada di sekitar penulis. Rasa terima kasih

penulis ditujukan kepada:

1. Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara,

2. Dr. Rer. Nat. P. Y. Topo Suprihadi, Dipl. Phys., selaku Wakil Rektor I,

3. Ir. Andrey Andoko, M.Sc., selaku Wakil Rektor II,

4. Hira Meidia, B.Eng., Ph.D., selaku Wakil Rektor III,

5. Prof. Dr. Muliawati G. Siswanto, M.Eng.Sc., selaku Wakil Rektor IV,

6. Maria Irmina Prasetiyowati, S.Kom., M.T. selaku Ketua Program Studi

Teknik Informatika di Universitas Multimedia Nusantara,

7. Adhi Kusnadi, S.T., M.Si.. selaku Dosen Pembimbing,

8. Jansen yang senantiasa membantu penulis dalam memahami dan

memberikan pengetahuan-pengetahuan dalam pembuatan laporan tugas

akhir,

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 9: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

viii

9. Yansen, Hadi Hartono, Kencana Wulan, Jeffry Steward dan kerabat

penulis lainnya yang telah mendukung penulis untuk menyelesaikan

laporan tugas akhir,

10. Keluarga penulis yang senantiasa menyokong dan mendukung penulis

dalam menyelesaikan proses pembuatan laporan skripsi ini,

Semoga laporan tugas akhir karya penulis ini dapat bermanfaat sebagai

sumber informasi maupun sumber inspirasi bagi para pembaca, terutama para

mahasiswa UMN dalam mengembangkan fakultas teknologi informasi dan

komunikasi.

Tangerang, 7 Juli2014

Paulus M. Bodhi

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 10: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

ix

DAFTAR ISI

HALAMAN PERSETUJUAN ................................................................................ ii

HALAMAN PERSEMBAHAN ............................................................................ iii

PERNYATAAN TIDAK MELAKUKAN PLAGIAT .......................................... iv

ABSTRAKSI .......................................................................................................... v

ABSTRACT ............................................................................................................. vi

KATA PENGANTAR .......................................................................................... vii

DAFTAR ISI .......................................................................................................... ix

DAFTAR TABEL .................................................................................................. xi

DAFTAR GAMBAR ............................................................................................ xii

DAFTAR RUMUS .............................................................................................. xiv

BAB I PENDAHULUAN ....................................................................................... 1

1.1 Latar Belakang ......................................................................................... 1

1.2 Rumusan Masalah .................................................................................... 3

1.3 Batasan Masalah ....................................................................................... 3

1.4 Tujuan Penelitian ...................................................................................... 3

1.5 Manfaat Penelitian .................................................................................... 4

BAB IILANDASAN TEORI .................................................................................. 5

2.1 Dokumen Digital ...................................................................................... 5

2.2 Information Retrieval (IR) ........................................................................ 6

2.3 Stemming .................................................................................................. 7

2.4 Pencarian / Searching ............................................................................... 7

2.5 Algoritma Stemming Nazief Adriani ....................................................... 9

2.6 Relevansi ................................................................................................ 13

2.6 .1 Cosine Similarity .................................................................................... 13

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 11: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

x

2.7 Metode Evaluasi Paice ........................................................................... 14

BAB III METODE PENELITIAN........................................................................ 20

3.1 Metode Penelitian ................................................................................... 20

3.2 Perancangan ............................................................................................ 21

3.2.1 Diagram Sistem / Flowchart .................................................................. 22

3.2.2 Flowchart Algoritma Nazief – Adriani .................................................. 23

3.2.3 Data Flow Diagram ............................................................................... 23

3.2.4 Struktur Tabel ......................................................................................... 26

3.2.5 Fungsionalitas Sistem ............................................................................. 27

3.2.6 Masukkan dan keluaran sistem ............................................................... 27

3.2.7 Hierarki Menu Aplikasi .......................................................................... 28

3.3 Desain Tampilan Antar Muka ................................................................ 29

BAB IV IMPLEMENTASI DAN UJI COBA ...................................................... 34

4.1 Implementasi Sistem .............................................................................. 34

4.1.1 Hierarki Menu Aplikasi .......................................................................... 34

4.1.2 Hasil Implementasi ................................................................................. 35

4.2 Uji Coba ................................................................................................. 41

BAB V SIMPULAN DAN SARAN ..................................................................... 54

5.1 Simpulan ................................................................................................. 54

5.2 Saran ....................................................................................................... 55

DAFTAR PUSTAKA ........................................................................................... 56

LAMPIRAN .......................................................................................................... 56

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 12: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

xi

DAFTAR TABEL

Tabel 2.1 : Kombinasi Awalan Akhiran yang tidak diijinkan .............................. 11

Tabel 2.2 : Aturan pemenggalan Awalan Stemmer Nazief Adriani ...................... 12

Tabel 2.3 Contoh kelompok kata semantik ........................................................... 18

Tabel 2.4 Hasil setelah proses stemming, UI = 0,6 ............................................... 19

Tabel 3.1 Tabel Entitas DFD ................................................................................ 24

Tabel 3.1 Tabel Entitas DFD (Lanjutan)............................................................... 25

Tabel 3.2 Proses Dalam Level 1 ........................................................................... 26

Tabel 3.3 Tabel Database Kata Dasar ................................................................... 26

Tabel 4.1 Tabel Bobot Vektor ............................................................................... 44

Tabel 4.2 Tabel Ujicoba Relevansi ....................................................................... 49

Tabel 4.3 Semantik group dan hasil stemming ..................................................... 50

Tabel 4.4 Tabel stemmed words hasil susun ulang ............................................... 52

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 13: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

xii

DAFTAR GAMBAR

Gambar 3.1 FlowChart Aplikasi RelevanceDoc ................................................... 22

Gambar 3.3 FlowChart Algoritma Nazief - Adriani ............................................. 23

Gambar 3.2 Diagram Context atau Diagram Level 0 ............................................ 24

Gambar 3.2 Diagram Level 1 ................................................................................ 25

Gambar 3.4 Hierarki Menu Aplikasi ..................................................................... 28

Gambar 3.5 Wellcome Screen ............................................................................... 29

Gambar 3.6 Menu Utama Program Relevance Doc .............................................. 30

Gambar 3.7 Tampilan Hasil Relevansi ................................................................. 31

Gambar 3.8 Statistik Kata ..................................................................................... 32

Gambar 3.9 Statistik Perbandingan ....................................................................... 33

Gambar 4.1 Jendela Wellcome Screen .................................................................. 35

Gambar 4.2 Jendela Utama Program Relevance Doc ........................................... 36

Gambar 4.3 Jendela Program Utama Tersambung ............................................... 37

Gambar 4.4 Jendela Program Utama Preview ...................................................... 37

Gambar 4.5 Jendela Program Utama Stemm ......................................................... 38

Gambar 4.6 Jendela Hasil Relevansi ..................................................................... 39

Gambar 4.7 Jendela Statistik Dokumen ................................................................ 39

Gambar 4.8 Jendela Statistik Relevansi ................................................................ 40

Gambar 4.9 Jendela Stemmer ................................................................................ 41

Gambar 4.10 Ujicoba Dokumen Manual .............................................................. 42

Gambar 4.11 Statistik Ujicoba Manual ................................................................. 42

Gambar 4.12 Hasil Ujicoba Manual...................................................................... 43

Gambar 4.13 Hasil Statistik Manual ..................................................................... 43

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 14: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

xiii

Gambar 4.14 Ujicoba Dokumen ........................................................................... 47

Gambar 4.15 Ujicoba Relevansi ........................................................................... 47

Gambar 4.16 Ujicoba statistik hasil ...................................................................... 48

Gambar 4.17 Uji coba stemm kata ‟terprosesnyalah‟ ........................................... 51

Gambar 4.18 Uji coba stemm kata „bersekolah‟ ................................................... 51

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014

Page 15: Lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/HALAMAN AWAL.pdf · IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI RELEVANSI KATA DALAM DOKUMEN

xiv

DAFTAR RUMUS

Rumus 2.1 Cosine Similarity ........................................................................................ 14

Rumus 2.2 DMT / Desired Merge Total ..................................................................... 16

Rumus 2.3 GDMT / Global Desired Merge Total ..................................................... 16

Rumus 2.4 UMT / Unachieved Merge Total .............................................................. 16

Rumus 2.5GUMT / Global Unachieved Merge Total ............................................... 17

Rumus 2.6 UI / UnderStemming Index ....................................................................... 17

Rumus 2.8GWMT / Global Wrongly Merge Total .................................................... 17

Rumus 2.9DNT / Desired Non Merge Total .............................................................. 18

Rumus 2.10GDNT / Global Desired Non Merge Total ............................................ 18

Rumus 2.11OI / Overstemming Index ......................................................................... 18

Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014