perbandingan algoritma cosine similarity dan · menggunakan teknik analisa data untuk membantu...

14
perpustakaan.uns.ac.id digilib.uns.ac.id commit to user PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Jurusan Informatika Disusun Oleh: SIGIT ANGGA PRASETYO NIM. M0509065 JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2013

Upload: buinhu

Post on 07-Mar-2019

232 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN

CONFIDENCE PADA SISTEM REKOMENDASI DENGAN

METODE ITEM BASED COLLABORATIVE FILTERING

SKRIPSI

Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu

Jurusan Informatika

Disusun Oleh:

SIGIT ANGGA PRASETYO NIM. M0509065

JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2013

Page 2: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

i

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN

CONFIDENCE PADA SISTEM REKOMENDASI DENGAN

METODE ITEM BASED COLLABORATIVE FILTERING

SKRIPSI

Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu

Jurusan Informatika

Disusun Oleh:

SIGIT ANGGA PRASETYO NIM. M0509065

JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2013

Page 3: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ii

SKRIPSI

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN

CONFIDENCE PADA SISTEM REKOMENDASI DENGAN

METODE ITEM BASED COLLABORATIVE FILTERING

Disusun oleh :

SIGIT ANGGA PRASETYO

NIM. M0509065

Skripsi ini telah disetujui untuk dipertahankan di hadapan Dewan Penguji

pada tanggal: 7 November 2013

Pembimbing I

Ristu Saptono, S.Si., M.T. NIP. 19790210 200212 1 001

Pembimbing II

Rini Anggrainingsih, M.T.

NIP. 19780909 200812 2 002

Page 4: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

iii

SKRIPSI

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN

CONFIDENCE PADA SISTEM REKOMENDASI DENGAN

METODE ITEM BASED COLLABORATIVE FILTERING

HALAMAN PENGESAHAN

Disusun oleh :

SIGIT ANGGA PRASETYO

NIM. M0509065

Telah dipertahankan di hadapan Dewan Penguji

Pada tanggal : 7 November 2013

Susunan Dewan Penguji

1. Ristu Saptono, S.Si., M.T.

NIP. 19790210 200212 1 001 ( )

2. Rini Anggrainingsih, M.T.

NIP. 19780909 200812 2 002 ( )

3. Sari Widya Sihwi, S.Kom., M.T.I.

NIP. 19830412 200912 2 003 ( )

4. Abdul Azis S.Kom., M.Cs.

NIP. 19810413 200501 1 001 ( )

Disahkan oleh

Dekan FMIPA UNS

Prof.Ir.Ari Handono Ramelan,M.Sc.(Hons),Ph.D

NIP. 19610223 198601 1 001

Ketua Jurusan Informatika

Umi Salamah, S.Si., M.Kom

NIP. 19700217 199702 2 001

Page 5: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

iv

MOTTO

“Maka sesungguhnya bersama kesulitan ada kemudahan. Sesungguhnya bersama

kesulitan ada kemudahan. Maka apabila engkau telah selesai (dari sesuatu

urusan), tetaplah bekerja keras (untuk urusan yang lain)”

(Q.S Al Insyirah : 5-7)

“Mimpi-mimpi kamu, cita-cita kamu, keyakinan kamu, apa yang kamu

mau kejar, biarkan ia menggantung, mengambang 5 centimeter di depan

kening kamu. Jadi dia nggak akan pernah lepas dari mata kamu. Dan kamu

bawa mimpi dan keyakinan kamu itu setiap hari, kamu lihat setiap hari, dan

percaya bahwa kamu bisa”

(5cm)

“Aku Selalu percaya jika kau mengerjakan sesuatu maka hasilnya akan kau

dapatkan. Aku tidak melakukan sesuatu dengan setengah hati. Karena aku

tahu jika aku begitu, maka aku akan mendapatkan hasil yang

setengah-setengah.”

(Michael Jordan)

“Kesuksesan adalah puncak dari kemampuan mengendalikan kegagalan”

(Sylvester Stallone)

Page 6: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

v

PERSEMBAHAN

Kupersembahkan karya ini kepada :

-Orang tuaku tercinta dan sang motivator, Bunda Iis dan Ayah Giyanto- -Ade kecil ku, Anggita Rahkma W-

-Sahabat-Sahabat ‘Independent Pember*ntak’- -Dea, atas transferan inspirasi dan semangatnya-

-Semua teman Informatika UNS khususnya IF09- -Bangsa Indonesia-

Page 7: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

vi

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN

CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE

ITEM BASED COLLABORATIVE FILTERING

SIGIT ANGGA PRASETYO Jurusan Informatika. Fakultas MIPA. Universitas Sebelas Maret.

ABSTRAK

Sistem rekomendasi merupakan metode penyaringan informasi

menggunakan teknik analisa data untuk membantu pengguna menemukan item

yang diinginkan. Salah satu metode yang digunakan pada sistem rekomendasi

yaitu item-based collaborative filtering. Metode ini merupakan teknik untuk

menghitung nilai item similarity. Algoritma yang dapat digunakan untuk

menghitung nilai item similarity, yaitu cosine similarity dan confidence.

Permasalahannya yaitu belum diketahui algoritma item similarity yang lebih

akurat antara hasil rekomendasi menggunakan cosine similarity dan confidence.

Tujuan dari penelitian ini yaitu untuk mengetahui algoritma item similarity

yang lebih akurat antara cosine similarity dan confidence. Untuk mengukur hasil

rekomendasi digunakan receiver operating characteristic.

Pada pengujian dengan mengosongkan rating dari 10% hingga 40%,

metode item-based collaborative filtering menggunakan algoritma confidence

akan menghasilkan rekomendasi yang lebih akurat dibandingkan dengan

algoritma cosine similarity berdasarkan rata-rata nilai accuracy yang lebih tinggi.

Metode item-based collaborative filtering menggunakan algoritma confidence

akan menghasilkan kesesuaian antara hasil prediksi dengan rating asli positif yang

lebih baik berdasarkan rata-rata nilai sensitivity yang lebih tinggi, dan

menghasilkan kesesuaian antara rating asli dengan hasil prediksi positif yang

lebih baik berdasarkan rata-rata nilai positive predictive value yang lebih stabil.

Kata Kunci: Confidence, Cosine Similarity, Item Based, Receiver Operating

Characteristic.

Page 8: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

vii

COMPARISON COSINE SIMILARITY AND CONFIDENCE

ALGORITHM IN RECOMMENDER SYSTEM USING ITEM BASED

COLLABORATIVE FILTERING METHOD

SIGIT ANGGA PRASETYO Department of Informatics. Mathematic and Natural Science Faculty.

Sebelas Maret University

ABSTRACT

Recommendation system is a method of information filtering using data

analysis technic to help users finds the desired items. One of the method which

used in recommendation system is item-based collaborative filtering. This method

is a technic to calculate the item similarity values. The algorithm which can be

used to calculate the value of item similarity are cosine similarity and confidence.

The problem is not known more accurate item similarity algorithm between

recommendation using cosine similarity and confidence.

The purpose of this research is to know item similarity algorithm which is

more accurate between cosine similarity and confidence. To measure the

recommendation used receiver operating characteristic.

On testing with emptying the rating from 10% until 40%, item-based

collaborative filtering method using confidence algorithm produces

recommendation which is more accurate than cosine similarity algorithm based on

higher average accuracy value.Item-based collaborative filtering method using

confidence algorithm produces the suitability of the results predicted by the

original positives rating which is better based on higher average sensitivity value,

and suitability of the original rating with positives prediction result which is better

based on average positive prediction value that more stable.

Keywords: Confidence, Cosine Similarity, Item Based, Receiver Operating

Characteristic.

Page 9: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

viii

KATA PENGANTAR

Bismillahirrahmaanirrahiim

Puji dan syukur penulis panjatkan kehadirat Alloh Subhanahu Wa Ta’ala

yang senantiasa memberikan nikmat dan karunia-Nya sehingga penulis dapat

menyelesaikan skripsi dengan judul “Perbandingan Algoritma Cosine Similarity

dan Confidence Pada Sistem Rekomendasi dengan Metode Item Based

Collaborative Filtering”, yang menjadi salah satu syarat wajib untuk memperoleh

gelar Sarjana Informatika di Universitas Sebelas Maret (UNS) Surakarta.

Penulis menyadari akan keterbatasan yang dimiliki, begitu banyak

bimbingan, bantuan, motivasi, serta semangat yang diberikan dalam proses

penyusunan skripsi ini. Oleh karena itu, ucapan terima kasih penulis sampaikan

kepada :

1. Bunda Iis dan Ayah Giyanto serta semua keluarga besar penulis di Tegal

Kota Bahari, yang telah memberikan doa, semangat, dukungan, nasihat,

energi positif dan motivasi kepada penulis selama proses penyusunan

skripsi ini.

2. Bapak Ristu Saptono, S.Si., M.T selaku Dosen Pembimbing I yang penuh

kesabaran membimbing, mengarahkan, dan memberi motivasi dan nasihat

kepada penulis selama proses penyusunan skripsi ini.

3. Ibu Rini Anggrainingsih, M.T. selaku Dosen Pembimbing II yang penuh

kesabaran membimbing, mengarahkan, dan memberi motivasi dan nasihat

kepada penulis selama proses penyusunan skripsi ini.

4. Ibu Umi Salamah,S.Si.,M.Kom, selaku Ketua Jurusan S1 Informatika

Universitas Sebelas Maret Surakarta.

5. Ibu Esti Suryani, S.Si., M.Kom. selaku Pembimbing Akademik yang telah

banyak memberi bimbingan dan pengarahan selama penulis menempuh

studi di Jurusan Informatika FMIPA Universitas Sebelas Maret Surakarta,

6. Bapak dan Ibu dosen serta karyawan di Jurusan Informatika FMIPA

Universitas Sebelas Maret Surakarta yang telah mengajar penulis selama

masa studi dan membantu dalam proses penyusunan skripsi ini,

7. Teman–teman Informatika khususnya IF09, Sahabat-sahabat “Independent

Pember*ntak”, dan Anak Kost “Setia Darma” yang telah memberikan

semangat kepada penulis selama ini.

Penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak

yang berkepentingan.

Surakarta, November 2013

Penulis

Page 10: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ix

DAFTAR ISI

HALAMAN PENGESAHAN ................................................................................ iii

MOTTO ................................................................................................................. iv

PERSEMBAHAN ................................................................................................... v

ABSTRAK ............................................................................................................. vi

ABSTRACT .......................................................................................................... vii

KATA PENGANTAR ......................................................................................... viii

DAFTAR ISI .......................................................................................................... ix

DAFTAR GAMBAR ............................................................................................. xi

DAFTAR TABEL ................................................................................................. xii

DAFTAR LAMPIRAN ....................................................................................... xiii

BAB 1 PENDAHULUAN ...................................................................................... 1

1.1. Latar Belakang ............................................................................................ 1

1.2. Rumusan Masalah ....................................................................................... 3

1.3. Batasan Masalah.......................................................................................... 3

1.4. Tujuan Penelitian ........................................................................................ 3

1.5. Manfaat Penelitian ...................................................................................... 4

1.6. Sistematika Penulisan ................................................................................. 4

BAB 2 TINJAUAN PUSTAKA ............................................................................. 5

2.1. Dasar Teori .................................................................................................. 5

2.1.1. Konsep Sistem Rekomendasi ............................................................. 5

2.1.2. Representasi Pengguna ...................................................................... 7

2.1.3. Inisialisasi Profile Generation ........................................................... 8

2.1.4. Metode Sistem Rekomendasi ............................................................. 9

2.1.5. Collaborative Filtering .................................................................... 15

2.1.6. Item-based Collaborative Filtering ................................................. 21

2.1.7. Tolak Ukur Pengujian Akurasi ........................................................ 23

2.2. Penelitian Terkait ...................................................................................... 24

2.3. Rencana Penelitian .................................................................................... 27

BAB 3 METODOLOGI PENELITIAN................................................................ 28

3.1. Tahap Persiapan ........................................................................................ 28

3.1.1. Studi Literatur .................................................................................. 28

3.1.2. Pengumpulan Data ........................................................................... 28

Page 11: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

x

3.2. Tahap Pemodelan ...................................................................................... 29

3.2.1. Pemodelan Data ............................................................................... 29

3.2.2. Penerapan Metode Collaborative Filtering ..................................... 29

3.2.3. Pemodelan Masalah ......................................................................... 29

3.3. Tahap Konstruksi ...................................................................................... 31

3.3.1. Implementasi Basis Data ................................................................. 32

3.3.2. Pengujian Perangkat Lunak ............................................................. 32

3.4. Tahap Pengujian Metode........................................................................... 32

BAB 4 PEMBAHASAN ....................................................................................... 35

4.1. Pemodelan Masalah .................................................................................. 35

4.1.1. Representasi User Profile ................................................................ 35

4.1.2. Contoh Kasus ................................................................................... 36

4.2. Hasil Pengujian ......................................................................................... 43

4.2.1. Pengujian dengan receiver operating characteristic (ROC) ........... 43

4.2.2. Pengosongan rating 10% ................................................................. 46

4.2.3. Pengosongan rating 20% ................................................................. 47

4.2.4. Pengosongan rating 30% ................................................................. 48

4.2.5. Pengosongan rating 40% ................................................................. 49

4.2.6. Perbandingan Hasil Pengujian ......................................................... 50

4.3. Pembahasan Hasil Pengujian .................................................................... 54

BAB 5 PENUTUP ................................................................................................ 58

5.1. Kesimpulan ............................................................................................... 58

5.2. Saran .......................................................................................................... 59

DAFTAR PUSTAKA ........................................................................................... 60

LAMPIRAN .......................................................................................................... 62

Page 12: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xi

DAFTAR GAMBAR

Gambar 2. 1 Ilustrasi Sistem Rekomendasi ............................................................. 6 Gambar 2. 2 Proses Collaborative Filtering .......................................................... 16 Gambar 2. 3 Konsep Item-based Collaborative Filterng....................................... 22 Gambar 2. 4 Konsep Receiver Operating Characteristic (ROC) .......................... 23

Gambar 4. 1 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 10% ........................................................................................ 46

Gambar 4. 2 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 20% ........................................................................................ 47 Gambar 4. 3 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 30% ........................................................................................ 48

Gambar 4. 4 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 40% ........................................................................................ 49 Gambar 4. 5 Perbandingan nilai accuracy keseluruhan pengujian ........................ 50 Gambar 4. 6 Perbandingan nilai sensitivity keseluruhan pengujian ....................... 51

Gambar 4. 7 Perbandingan nilai positive predictive value keseluruhan

pengujian ........................................................................................... 52 Gambar 4. 8 Screenshoot top-3 recommendation untuk salah satu user dengan

algoritma cosine similarity ................................................................ 53

Gambar 4. 9 Screenshoot top-3 recommendation untuk salah satu user dengan

dengan algoritma confidence ............................................................ 53

Page 13: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xii

DAFTAR TABEL

Tabel 2. 1 User-item rating matriks ....................................................................... 17

Tabel 3. 1 User-item rating matrix dengan m pengguna dan n tempat wisata ...... 30

Tabel 4. 1 Representasi matriks user-item rating .................................................. 35 Tabel 4. 2 Representasi matriks user-item ratings untuk contoh kasus ................. 36 Tabel 4. 3 Tabel data rating ................................................................................... 36

Tabel 4. 4 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 10% ............................................................................................. 46 Tabel 4. 5 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 20% ............................................................................................. 47 Tabel 4. 6 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 30% ............................................................................................. 48 Tabel 4. 7 Rata-rata hasil pengujian menggunakan ROC pada pengosongan

rating 40% ............................................................................................. 49 Tabel 4. 8 Perbandingan nilai accuracy keseluruhan pengujian ............................ 50

Tabel 4. 9 Perbandingan nilai sensitivity keseluruhan pengujian .......................... 51 Tabel 4. 10 Perbandingan nilai positive predictive value ...................................... 52

Page 14: PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN · menggunakan teknik analisa data untuk membantu pengguna menemukan item ... algoritma cosine similarity berdasarkan rata-rata nilai

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xiii

DAFTAR LAMPIRAN

LAMPIRAN A ..................................................................................................... 63 LAMPIRAN B ..................................................................................................... 67 LAMPIRAN C ..................................................................................................... 83