tugas akhir implementasi algoritma k-means...

i

TUGAS AKHIR

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING

UNTUK MENENTUKAN TATA LETAK MERK PRODUK BERDASARKAN

JENIS PRODUK DI SWALAYAN LARISSO AMBULU-JEMBER

Di Susun Oleh :

Indri Dwi Rukmana

1210652018

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH JEMBER

2015

ii

TUGAS AKHIR




Disusun Untuk Melengkapi dan Memenuhi Syarat Kelulusan Program Strata 1

Jurusan Teknik Informatika Fakultas Teknik

Universitas Muhammadiyah Jember

Disusun Oleh :

Indri Dwi Rukmana

1210652018

Dosen Pembimbing :

1. Daryanto, S.Kom., M.Kom

2. Lutfi Ali Muharom, S.Si

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH JEMBER

2015

iii

HALAMAN PENGESAHAN




Oleh :

Indri Dwi Rukmana

1210652018

Tugas Akhir Ini Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar

Sarjana Komputer (S.Kom)

di

Universitas muhammadiyah Jember

Telah diuji dan disahkan dihadapan tim penguji sidang tugas akhir, pada :

Hari : Jumat

Tanggal : 30 Januari 2015

Ruangan : Ruang Sidang Fakultas Teknik

Disetujui oleh :

Dosen Penguji I Dosen Pembimbing I

Yeni Dwi Rahayu, M.Kom Daryanto, S.Kom., M.Kom

NPK. 11 03 590 NPK. 11 03 589

Dosen Penguji II Dosen Pembimbing II

Yulio Rahmadi, S,Kom Lutfi Ali Muharom, S.Si

NPK. 10 03 545 NPK. 10 09 550

Jember,

Mengesahkan,

Dekan Fakultas Teknik

Ir. Rusgianto, MM

NIP. 131 863 867

Ketua Jurusan Teknik Informatika

Agung Nilogiri S.T., M.Kom

NIP. 19770330 200501 1002

iv

PERNYATAAN

Yang bertanda tangan di bawah ini :

Nama : Indri Dwi Rukmana

Nim : 1210652018

Jurusan : Teknik Informatika

Tempat dan Tanggal Lahir : Jember, 27 Juni 1989

Agama : Islam

Alamat : Perumahan Bumi Ambulu Permai blok AA.4

Ambulu - Jember

Dengan ini menyatakan dengan sesungguhmya bahwa saya benar-benar membuat

Tugas Akhir ini sebagai syarat kelulusan program Sarjana (S1) untuk memperoleh gelar

“S.Kom” Jurusan Teknik Informatika Fakultas Teknik, Universitas Muhammadiyah Jember

dengan judul “Implementasi Algoritma K-Means Clustering Untuk Menentukan Tata

Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu - Jember”.

Demikian pernyataan ini saya buat dengan sesungguhnya, apabila terungkap suatu

jiplakan maka saya bersedia menerima akibat berupa sangsi akademis dan sangsi lain yang

diberikan oleh yang berwenang.

Jember, 21 Januari 2015

Indri Dwi Rukmana

1210652018

v

PERSEMBAHAN

Alhamdulillahirabbil alamin, akhirnya aku sampai ke titik ini. Segala puji dan syukur

kepada ALLAH SWT atas segala rakhmat dan hidayahnya yang telah memberikan

kekuatan, kesehatan dan kesabaran untuk ku dalam mengerjakan skripsi ini. Terima kasih

ku juga kepada :

1. Ayah dan Ibu tercinta yang selalu memberikanku motivasi, inspirasi, semangat dan

kasih sayangnya yang tak terhingga dalam menjalani kehidupan ini.

2. Kakak dan adikku yang telah sama-sama kita berjuang atas kehidupan yang kita

tempuh ini, teruslah berjuang untuk mencapai cita-cita kita.

3. My Dear yang selalu ada di sampingku, mendengarkan semua keluh kesahku,

memberikan support, doa dan rasa cintanya yang tulus kepadaku.

4. Para dosen-dosen ku, terutama pembimbingku di Universitas Muhammadiyah Jember

yang tak pernah lelah dan sabar memberikan bimbingan dan arahan kepada ku.

5. Teman – teman seperjuanganku yang selalu memberiku semangat.

6. Teman – teman kostan Greendland Cluster GO.20 yang super kocak dan konyol,

terimakasih atas canda tawa kalian serta supportnya selama ini.

vi

MOTTO

“ Dia memberikan hikmah (ilmu yang berguna) kepada siapa yang dikehendaki-Nya.

Barang siapa yang mendapat hikmah itu, sesungguhnya ia telah mendapat kebajikan yang

banyak. Dan tiadalah yang menerima peringatan melainkan orang- orang yang berakal ”.

(Q.S. Al-Baqarah: 269)

“ Sesungguhnya bersama kesukaran itu ada keringanan. Karena itu bila kau sudah

selesai (mengerjakan yang lain). Dan berharaplah kepada Tuhanmu ”. (Q.S Al Insyirah : 6-8)

“ Bersabar, Berusaha, dan Bersyukur. Bersabar dalam berusaha, berusaha dengan

pantang menyerah dan bersyukur atas apa yang telah diperoleh ”. (Indri)

“ Jadilah seperti karang di lautan yang selalu kuat meskipun terus dihantam ombak

dan lakukanlah hal yang bermanfaat untuk diri sendiri dan juga untuk orang lain, karena hidup

tidak abadi ”. (Indri)

“ Kaki yang akan berjalan lebih jauh, tangan yang akan berbuat lebih banyak, mata

yang akan menatap lebih lama, leher yang akan lebih sering melihat ke atas, lapisan tekad

yang seribu kali lebih keras dari baja, dan hati yang akan bekerja lebih keras, serta mulut yang

akan selalu berdoa ”. -5cm

vii

KATA PENGANTAR

Alhamdulillahirabbil alamin, segala puji bagi Allah SWT Tuhan semesta alam atas

segala berkat, rahmat, taufik, serta hidayah-Nya sehingga penulis dapat menyelesaikan skripsi

ini dengan baik dan tepat waktu.

Tugas Akhir yang berjudul “ Implementasi Algoritma K-means Clustering Untuk

Menetukan Tata Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu-

Jember ” ini dilakukan untuk memenuhi salah satu persyaratan pendidikan di Universitas

Muhammadiyah Jember Jurusan Teknik Informatika, Fakultas Teknik.

Dalam kesempatan ini, penulis menyampaikan rasa terima kasih kepada:

1. Bapak Daryanto S.Kom., M.Kom selaku dosen pembimbing 1.

2. Bapak Lutfi Ali Muharom, S.Si selaku dosen pembimbing 2.

3. Ibu Yeni Dwi Rahayu, M.Kom selaku dosen penguji 1.

4. Bapak Yulio Rahmadi, S.Kom selaku dosen penguji 2.

5. Para Dosen Fakultas Teknik Informatika, terima kasih atas semua ilmu yang telah

diberikan.

6. Keluarga penulis yang telah memberikan do’a dan juga bantuan secara moril dan materil.

7. Teman-teman yang telah mendukung dan memberi semangat kepada penulis.

8. Serta pihak-pihak yang telah membantu dan tidak dapat penulis sebutkan satu persatu.

Penulis menyadari bahwa masih banyak kekurangan dan kelemahan dalam

penyusunan skripsi ini. Oleh karena itu, kami mengharapkan kritik dan saran yang

membangun dan menambah wawasan dan wacana ilmu kami.

Akhir kata penulis berharap kerangka acuan skripsi ini dapat memberikan wawasan

dan pengetahuan kepada para pembaca pada umumnya dan pada penulis pada khususnya.

Jember, 21 Januari 2014

Penulis

viii



JENIS PRODUK DI SWALAYAN LARISSO DI AMBULU – JEMBER

1. Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si

Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember

[email protected]

ABSTRAK

Swalayan adalah salah satu tempat berbelanja yang dapat memberikan kenyamanan,

kebersihan, kecepatan dan kerapian produk untuk konsumennya. Banyak konsumen yang

lebih memilih berbelanja di swalayan daripada di pasar tradisional karena swalayan dapat

memberikan kenyamanan dan kerapian produknya, akan tetapi tidak sedikit dari konsumen

yang mengeluhkan masalah tata letak produk yang ada di swalayan.

Penentuan tata letak produk pada swalayan merupakan hal penting yang harus

diperhatikan oleh pihak manajemen swalayan. Pada tugas akhir ini akan dijelaskan bagaimana

implementasi algoritma k-means clustering berdasarkan kebiasaan konsumen berbelanja

untuk menghasilkan suatu model tata letak merk produk berdasarkan jenis produknya.

Penelitian ini menggunakan data yang diperoleh dari struk-struk belanja pada

swalayan larisso di Ambulu - Jember. Algoritma k-means clustering digunakan untuk

mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama

dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang

berbeda dikelompokkan ke dalam kelompok lain. Hasil dari penelitian ini menghasilkan

sebuah model tata letak merk produk berdasarkan jenis produknya yang dapat memudahkan

konsumen dalam mendapatkan barang yang dibutuhkan.

Kata Kunci: tata letak merk produk ; algoritma k-means clustering.

ix

IMPLEMENTATION OF K-MEANS CLUSTERING ALGORITHM

TO DETERMINE THE LAYOUT OF THE BRANDS PRODUCT BY

TYPES PRODUCT IN LARISSO SUPERMARKET AMBULU JEMBER

1. Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si

Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember

[email protected]

ABSTRACT

Supermarket is one place that can provide comfort, cleanliness, speed and neatness of

products for consumers. Many consumers who prefer to shop in supermarkets than in

traditional markets because supermarkets can provide comfort and neatness of its products,

but not a bit of consumers who complained about the layout of the existing products in

supermarkets.

Determining the layout of the product at the supermarket is an important thing that

must be considered by the management of self-service. In this final project will be explained

how the implementation of k-means clustering algorithm based on consumer shopping habits

to generate a model layout of the brands products by type product.

This study uses data obtained from the receipt at the larisso supermarket in Ambulu -

Jember. K-means clustering algorithm is used to partition the data into clusters so that the data

which have similar characteristics are grouped into the same cluster and the data that have

different characteristics are grouped into another group. The results of this study resulted in a

model of the brands products layout based on the types of products that can enable customers

to obtain needed goods.

Keywords: brands product layout; k-means clustering algorithm.

x

DDAAFFTTAARR IISSII

Halaman

HALAMAN SAMPUL ................................................................................. i

HALAMAN PENGESAHAN ....................................................................... iii

PERNYATAAN ........................................................................................... iv

PERSEMBAHAN ......................................................................................... v

MOTTO ....................................................................................................... vi

KATA PENGANTAR .................................................................................. vii

ABSTRAK ................................................................................................... viii

ABSTRACT ................................................................................................. ix

DAFTAR ISI ................................................................................................ x

DAFTAR GAMBAR .................................................................................... xii

DAFTAR TABEL......................................................................................... xiv

DAFTAR LAMPIRAN ................................................................................. xvi

BAB 1. PENDAHULUAN ....................................................................... 1

1.1 Latar Belakang ............................................................................ 1

1.2 Perumusan Masalah ..................................................................... 2

1.3 Batasan Masalah .......................................................................... 2

1.4 Tujuan Penelitian ......................................................................... 2

1.5 Manfaat Penelitian ....................................................................... 2

BAB 2. TINJAUAN PUSTAKA .............................................................. 3

2.1 Definisi Swalayan ........................................................................ 3

2.2 Profil Swalayan Larisso Ambulu ................................................. 3

2.3 Tata Letak ................................................................................... 5

2.4 Data Mining ............................................................................... 6

2.4.1 Tahapan Data Mining ......................................................... 8

2.4.2 Pengelompokan Data Mining................................................ 9

2.5 Clustering .................................................................................... 12

2.5.1 Partitioning Clustering ........................................................ 14

2.6 Algoritma K-Means ..................................................................... 15

2.7 Microsoft Visual Basic.Net .......................................................... 16

xi

BAB 3. METODOLOGI PENELITIAN ................................................... 18

3.1 Data Yang Digunakan .................................................................. 18

3.2 Praproses Data ............................................................................. 18

3.2.1 Penentuan Kelompok Jenis Produk...................................... 18

3.2.2 Penentuan Kelompok Berdasarkan Record .......................... 20

3.3 Cleaning Data .............................................................................. 24

3.4 Uji Coba Dengan Algoritma K-Means Clustering ........................ 26

3.4.1 Perhitungan Jarak Berdasarkan Parameter Produk ............... 30

3.4.2 Pengelompokkan Jarak Terkecil atau Minimum .................. 38

3.5 Perancangan Antar Muka Sistem ................................................. 42

3.5.1 Perancangan Flowchart Sistem ............................................ 42

3.5.2 Perancangan Tampilan Sistem............................................. 44

BAB 4. HASIL DAN PEMBAHASAN .................................................... 46

4.1 Spesifikasi Sistem ........................................................................ 46

4.2 Implementasi Sistem .................................................................... 46

4.2.1 Pengujian Sistem................................................................. 47

4.2.2 Hasil Clustering ................................................................... 69

4.2.3 Denah Tata Letak Awal dan Setelah Clustering ................... 71

BAB 5. KESIMPULAN DAN SARAN .................................................... 74

5.1 Kesimpulan ................................................................................. 74

5.2 Saran ........................................................................................... 74

DAFTAR PUSTAKA ................................................................................... 75

xii

DDAAFFTTAARR GGAAMMBBAARR

HHaallaammaann

2.1 Struktur Organisasi Swalayan Larisso Ambulu ........................................ 4

2.2 Kajian Umum Data Mining ..................................................................... 7

2.3 Tahapan Data Mning ............................................................................... 8

3.1 Contoh Struk Belanja .............................................................................. 19

3.2 Flowchart Sistem..................................................................................... 43

3.3 Tampilan Praposes Data .......................................................................... 44

3.4 Tampilan Proses K-Means....................................................................... 44

3.5 Tampilan Hasil ........................................................................................ 45

3.6 Tampilan Sorting Kelompok ................................................................... 45

4.1 Tampilan Proses K-Means Parameter Produk Makanan Ringan............... 47

4.2 Tampilan Hasil Pengujian Parameter Produk Makanan Ringan ............... 48

4.3 Tampilan Hasil Sorting Kelompok Parameter Produk Makanan Ringan... 49

4.4 Tampilan Proses K-Means Parameter Produk Minuman .......................... 50

4.5 Tampilan Hasil Pengujian Parameter Produk Minuman ........................... 51

4.6 Tampilan Hasil Sorting Kelompok Parameter Produk Minuman .............. 51

4.7 Tampilan Proses K-Means Parameter Produk Buah-buahan .................... 52

4.8 Tampilan Hasil Pengujian Parameter Produk Buah-buahan ..................... 53

4.9 Tampilan Hasil Sorting Kelompok Parameter Produk Buah-buahan ........ 54

4.10 Tampilan Proses K-Means Parameter Produk Perawatan ....................... 55

4.11 Tampilan Hasil Pengujian Parameter Produk Perawatan ........................ 56

4.12 Tampilan Hasil Sorting Kelompok Parameter Produk Perawatan ........... 56

4.13 Tampilan Proses K-Means Parameter Produk Bahan Dapur ................... 57

4.14 Tampilan Hasil Pengujian Parameter Produk Bahan Dapur ................... 58

4.15 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Dapur ...... 59

4.16 Tampilan Proses K-Means Parameter Produk Bahan Makanan .............. 60

4.17 Tampilan Hasil Pengujian Parameter Produk Bahan Makanan ............... 61

4.18 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Makanan .. 61

4.19 Tampilan Hasil Proses K-Means Produk Perlengkapan .......................... 62

4.20 Tampilan Hasil Pengujian Parameter Produk Perlengkapan ................... 63

xiii

4.21 Tampilan Hasil Sorting Kelompok Parameter Produk Perlengkapan ...... 64

4.22 Tampilan Proses K-Means Parameter Produk Obat-obatan .................... 65

4.23 Tampilan Hasil Pengujian Parameter Produk Obat-obatan ..................... 66

4.24 Tampilan Hasil Sorting Kelompok Parameter Produk Obat-obatan ........ 66

4.25 Tampilan Proses K-Means Parameter Produk Rokok ............................. 67

4.26 Tampilan Hasil Pengujian Parameter Produk Rokok .............................. 68

4.27 Tampilan Hasil Sorting Kelompok Parameter Produk Rokok................. 69

4.28 Denah Tata Letak Awal Produk ............................................................. 71

4.29 Denah Tata Letak Merk Produk Setelah Clustering ............................... 71

xiv

DDAAFFTTAARR TTAABBEELL

HHaallaammaann

3.1 Dataset Merk Produk ............................................................................... 21

3.2 Dataset Penentuan Jenis Produk .............................................................. 24

3.3 Dataset Yang Telah di Cleaning .............................................................. 26

3.4 Centroid Produk Makanan Ringan .......................................................... 27

3.5 Centroid Produk Minuman ...................................................................... 27

3.6 Centroid Produk Buah-buahan ................................................................ 27

3.7 Centroid Produk Perawatan ..................................................................... 28

3.8 Centroid Produk Bahan Dapur ................................................................ 28

3.9 Centroid Produk Bahan Makanan ........................................................... 28

3.10 Centroid Produk Perlengkapan .............................................................. 29

3.11 Centroid Produk Obat-obatan ................................................................ 29

3.12 Centroid Produk Rokok......................................................................... 29

3.13 Hasil Penghitungan Jarak Dengan Paramater Produk Makanan Ringan

Masing-Masing cluster............................................................................. 30

3.14 Hasil Penghitungan Jarak Dengan Paramater Produk Minuman


3.15 Hasil Penghitungan Jarak Dengan Paramater Produk Buah-buahan


3.16 Hasil Penghitungan Jarak Dengan Paramater Produk Perawatan


3.17 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Dapur


3.18 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Makanan


3.19 Hasil Penghitungan Jarak Dengan Paramater Produk Perlengkapan


3.20 Hasil Penghitungan Jarak Dengan Paramater Produk Obat-obatan


3.21 Hasil Penghitungan Jarak Dengan Paramater Produk Rokok

xv


3.22 Anggota Data Masing-Masing Cluster Produk Makanan Ringan ........... 38

3.23 Anggota Data Masing-Masing Cluster Produk Minuman ....................... 39

3.24 Anggota Data Masing-Masing Cluster Produk Buah-buahan ................. 39

3.25 Anggota Data Masing-Masing Cluster Produk Perawatan ...................... 40

3.26 Anggota Data Masing-Masing Cluster Produk Bahan Dapur ................. 40

3.27 Anggota Data Masing-Masing Cluster Produk Bahan Makanan ............. 41

3.28 Anggota Data Masing-Masing Cluster Produk Perlengkapan ................. 41

3.29 Anggota Data Masing-Masing Cluster Produk Obat-obatan ................... 42

3.30 Anggota Data Masing-Masing Cluster Produk Rokok ........................... 42

4.1 Hasil Clustering ...................................................................................... 70

xvi

DDAAFFTTAARR LLAAMMPPIIRRAANN

HHaallaammaann

Biodata Penulis ............................................................................................. 77

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Seiring dengan pertumbuhan ekonomi Indonesia yang maju dan berkembang pesat

khususnya di kota besar maupun kota kecil, telah terjadi perubahan diberbagai sektor,

termasuk dibidang industri dan produksi serta pada kegiatan eceran di Indonesia yang telah

berkembang menjadi usaha yang berskala besar. Perkembangan bisnis eceran yang pesat ini

tidak lepas dari faktor meningkatnya jumlah penduduk Indonesia dan juga meningkatkan

jumlah pendapatan perkapita penduduk Indonesia yang menyebabkan taraf hidup masyarakat

Indonesia semakin meningkat. Hal ini membawa dampak kepada pola perilaku belanja

seseorang, dimana semakin meningkatnya taraf hidup seseorang maka tuntutan akan tempat

berbelanja yang nyaman dan dapat menyediakan segala kebutuhan konsumen dalam satu

lokasi semakin dibutuhkan. Swalayan adalah salah satu tempat berbelanja yang dapat

memberikan kenyamanan, kebersihan, kecepatan dan kerapian produk untuk konsumennya.

Banyak konsumen yang lebih memilih berbelanja di swalayan daripada di pasar

tradisional, alasannya swalayan dapat memberikan kenyamanan dan kerapian dalam

berbelanja. Namun tidak sedikit dari para konsumen yang mengeluhkan tentang kerapian

merk produk pada swalayan, dimana tata letak merk produknya tidak strategis dan tepat,

sehingga membuat konsumen sulit untuk mendapatkan merk produk yang mereka butuhkan,

juga akan menghabiskan waktu yang cukup lama hanya untuk menemukan merk produk

tersebut. Tata letak merk produk yang strategis dan tepat dalam penataanya akan lebih mudah

dijangkau oleh konsumen dan tidak akan menghabiskan waktu. Untuk itu perlu dibuat sebuah

sistem yang dapat menentukan pola tata letak merk produk pada swalayan, yaitu dengan

dibuatnya suatu teknik clustering.

Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah

clustering K-Means (Santosa, 2007). K-Means merupakan salah satu metode data clustering

non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik

yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai

karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007).

2

Berdasarkan uraian diatas, penulis berkeinginan untuk membuat suatu implementasi

algoritma K-Means Clustering untuk menentukan tata letak merk produk berdasarkan jenis

produk di swalayan Larisso Ambulu - Jember.

1.2 Perumusan Masalah

Berdasarkan uraian diatas, perumusan masalah dalam Tugas Akhir ini, yaitu

bagaimana mengimplementasikan algoritma K-Means Clustering untuk menentukan tata letak

merk produk berdasarkan jenis produk di swalayan Larisso Ambulu – Jember.

1.3 Batasan Masalah

Batasan masalah dari Tugas Akhir yang berjudul Implementasi algoritma K-Means

Clustering untuk menetukan tata letak merk produk berdasarkan jenis produk di swalayan

Larissso Ambulu - Jember , antara lain :

1. Data yang dianalisis adalah data struk, berisi merk produk yang diperoleh dari swalayan

Larisso di Ambulu – Jember dari bulan Januari - September 2014.

2. Algoritma yang digunakan adalah algortima K-Means Clustering.

3. Perancangan program menggunakan bahasa pemrograman VB.NET.

1.4 Tujuan Penelitian

Tujuan dari Tugas Akhir ini adalah :

1. Membuat sebuah model untuk menentukan tata letak merk produk berdasarkan jenis

produk pada swalayan.

2. Menerapkan K-Means Clustering dalam menentukan tata letak merk produk berdasarkan

jenis produk pada swalayan.

1.5 Manfaat Penelitian

Manfaat dari penelitian ini adalah didapatkan sebuah model tata letak merk produk

berdasarkan jenis produk di swalayan Larisso Ambulu – Jember yang dapat memudahkan

3

bagi konsumen dalam menemukan merk produk yang dibutuhkan sehingga tidak

membutuhkan waktu lama untuk mencarinya

4

BAB II

TINJAUAN PUSTAKA

2.1 Defenisi Swalayan

Supermarket atau pasar swalayan menurut Marwan Asri (1991 : 289) adalah salah satu

bentuk usaha eceran yang menyediakan beraneka macam kebutuhan konsumen. Satu

Supermarket mungkin menjual pakaian wanita, pria, anak-anak, alat rumah tangga, alat olah

raga, perhiasan serta alat rumah tangga lainnya dan alat tulis.

Swalayan adalah sebuah toko yang menjual segala kebutuhan sehari-hari. Barang-

barang yang dijual di swalayan biasanya adalah barang-barang kebutuhan sehari-hari. Seperti

bahan makanan, minuman dan barang kebutuhan seperti tissue dan sebagainya.

Biasanya setelah berbelanja di swalayan, konsumen akan menerima struk belanjaan

dari pihak swalayan. Struk belanja digunakan oleh swalayan untuk diberikan kepada

konsumen seberapa banyak produk yang dibeli serta jumlah harga produk per unitnya serta

total dari keseluruhannya. Struk belanja ini juga merupakan bukti transaksi konsumen kepada

swalayan terhadap produk-produk apa saja yang telah dibeli.

2.2 Profil Swalayan Larisso Ambulu

Ambulu adalah sebuah kecamatan di Kabupaten Jember, Provinsi Jawa Timur,

Indonesia. Wilayah selatan kecamatan ini berbatasan dengan Samudra Hindia. Kecamatan

Ambulu mempunyai luas wilayah 104,56 km2 dengan ketinggian rata-rata 18 m dari atas

permukaan laut.

Di kecamatan Ambulu terdapat salah satu pusat perbelanjaan/swalayan yang menjadi

tempat favorit masyarakat sekitar maupun masyarakat dari luar kecamatan untuk berbelanja,

yaitu Swalayan Larisso yang berlokasi di Jl. Watu Ulo no.21 Ambulu, sekitar ± 30 km atau 30

menit dari pusat kota Jember. Swalayan ini didirikan pertengahan tahun 2010, dan sekarang

ini telah berkembang pesat karena merupakan satu-satunya tempat perbelanjaan yang

memiliki harga relatif murah dibanding dengan supermarket lainnya. Di Swalayan ini

menyediakan berbagai macam kebutuhan konsumen mulai dari bahan makanan, minuman dan

5

bahan kebutuhan lainnya, dimana pembeli mengambil sendiri barang yang dibutuhkan dari

rak-rak yang disediakan dan nantinya membayar dikasir dan akan mendapatkan struk belanja.

Di Swalayan Larisso Ambulu memiliki ± 70 Karyawan yang terdiri dari supervisor,

bagian keuangan, personalia, dan bagian gudang. Untuk Jam kerja di Swalayan Larisso yaitu

setiap hari senin – minggu mulai pukul 09.00 – 21.00.

Struktur organisasi di Swalayan Larisso Ambulu – Jember dapat digambarkan sebagai

berikut:

Gambar 2.1 Struktur Organisasi Swalayan Larisso Ambulu

Jobdesk masing – masing bagian yaitu :

1. Direktur : Bertugas memimpin dan menjalankan Swalayan, mengangkat dan

memberhentikan karyawan, serta bertanggung jawab terhadap keuntungan dan

kerugian perusahaan.

2. Supervisor Swalayan : Bertugas mengatur kerjanya para bawahannya, membuat job

desk para bawahanya (staf), bertanggung jawab atas hasil kerja bawahanya (staf),

memberi motivasi ke bawahanya (staf), memberikan breafing, serta membuat rencana

pekerjaan untuk kedepannya yaitu rencana kerja harian,mingguan,bulanan,dan

tahunan.

3. Junior Supervisor : Mengawasi, mengarahkan dan membimbing seluruh divisi / bagian

yang menjadi tanggung jawabnya agar dapat melaksanakan tugas dengan baik.

6

4. Pramuniaga : Melakukan kelancaran operasional counter seperti display barang,

mengisi barang yang telah kosong ataupun barang yang baru, dan

menjaga kebersihan area kerja, kebersihan dan kerapian barang.

5. Manajer Keuangan : Bertugas mengelola keuangan swalayan (penerimaan dan

pengeluaran keuangan) seperti penggajian karyawan.

6. Staf Administrasi : Melakukan kegiatan yang berhubungan dengan kegiatan

administrasi.

7. Kepala Kasir : Memonitoring kegiatan kasir setiap harinya dan membuat laporan

keuangan.

8. Kasir : Melayani pembayaran konsumen setiap hari dan bertanggung jawab terhadap

uang setoran.

9. Personalia / umum : Melakukan kegiatan umum seperti mencatat kehadiran dan

lembur kerja karyawan, menyediakan dan mengatur jumlah tenaga kerja yang

dibutuhkan swalayan.

10. Divisi Teknik / Maintenence : Bertanggung jawab terhadap kelancaran operasional

swalayan.

11. Satpam : Bertugas menjaga keamanan swalayan.

12. Cleaning Service : Bertugas membersihkan seluruh ruangan yang ada di swalayan.

13. Kepala Gudang : Menerima barang baik dari supplier, mengecek jumlah barang yang

dikirim dan disesuaikan dengan dokumen, mengecek kebersihan dan keamanan barang

yang ada, dan mengeluarkan barang yang dibutuhkan oleh swalayan.

14. Staf Bag.EDP : Bertugas mengawasi dan melakukan kegiatan Electronic Data

Processing yaitu memasukkan atau menginput data barang-barang baru dan perubahan

harga, memasukkan data jadwal promosi berkaitan dengan barang yang dijual, serta

merapikan ulang data yang ada dikomputer.

2.3 Tata Letak

Tata letak adalah suatu rancangan fasilitas, menganalisis, membentuk konsep, dan

mewujudkan sistem pembuatan barang atau jasa. Rancangan ini pada umumnya digambarkan

sebagai rancangan lantai, yaitu satu susunan fasilitas fisik (perlengkapan, tanah, bangunan,

dan sarana lain) untuk mengoptimalkan hubungan antara petugas pelaksana, aliran barang,

7

aliran informasi, dan tata cara yang diperlukan untuk mencapai tujuan usaha secara ekonomis

dan aman.

Tata letak merupakan satu keputusan penting yang menentukan efisiensi sebuah

operasi dalam jangka panjang. Tata letak memiliki banyak dampak strategis karena tata letak

menentukan daya saing perusahaan dalam kapasitas, proses, fleksibilitas, dan biaya, serta

kualitas lingkungan kerja, kontak pelangga, dan citra perusahaan. Tata letak yang efektif

dapat membantu organisasi mencapai sebuah strategi yang menunjang diferensiasi, biaya

rendah, atau respon cepat. Tujuan strategi tata letak adalah untuk membangun tata letak yang

ekonomis yang memenuhi kebutuhan persaingan perusahaan.

2.4 Data Mining

Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu

kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut

diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga

dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki akar yang

panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning,

statistik dan database. Dengan arti lain data mining adalah proses untuk penggalian pola-pola

dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut

menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran,

pengawasan, penipuan deteksi dan penemuan ilmiah. Data mining telah digunakan selama

bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti

catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk

menghasilkan laporan riset pasar.

Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis

koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui

keterkaitan. Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang

dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-

contoh hubungan kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk

mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan

dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia. Dalam

8

situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali,

selama konstruksi desain eksperimental.

Beberapa teknik yang sering disebut-sebut dalam literatur data mining dalam

penerapannya antara lain: clustering, classification, association rule mining, neural network,

genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap data mining adalah

perkembangan teknik-teknik data mining untuk aplikasi pada database skala besar. Sebelum

populernya data mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil

saja.

Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu

kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual (Moertini,

2002). Secara umum data mining memiliki beberapa kajian. Seperti yang dapat dilihat pada

Gambar 2.2, data mining merupakan pusat dari beberapa kajian. Diantaranya adalah estimasi,

seleksi variabel, clustering, visualisasi, market basket analysis dan klasifikasi. Semua kajian

tersebut termasuk ke dalam data mining.

Gambar 2.2 Kajian Umum Data Mining

( Sumber : Santosa 2007 )

Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan

teknik dari pembelajaran mesin, pengenalan pola, statistik, database dan visualisasi untuk

penanganan permasalahan pengambilan informasi dari database yang besar (Larose, 2005).

Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan

tujuan untuk menemukan pola atau kecendrungan yang penting yang biasanya tidak disadari

keberadaannya (Moertini, 2002). Hal-hal penting yang terkait dengan data mining adalah

(Luthfi & Kusrini, 2009):

9

1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.

2. Data yang akan diproses berupa data yang sangat besar.

3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin

memberikan indikasi yang bermanfaat.

Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih

objek dalam satu dimensi yang sama. Misalnya dalam dimensi produk dapat melihat

keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat

dilihat antara dua atau lebih atribut dan dua atau lebih objek (Ponniah, 2001). Masalah-

masalah yang sesuai untuk diselesaikan dengan teknik data mining dapat dicirikan dengan

(Piatetsky & Shapiro, 2006):

1. Memerlukan keputusan yang bersifat knowledge-based.

2. Mempunyai lingkungan yang berubah.

3. Metode yang ada sekarang bersifat sub-optimal.

4. Tersedia data yang bisa diakses, cukup dan relevan.

5. Memberikan keuntungan yang tinggi jika keputusan yang diambil tepat.

Kata mining mempunyai arti yaitu usaha untuk mendapatkan sedikit barang berharga

dari sejumlah besar material dasar. Data mining memiliki akar yang panjang dari bidang ilmu

seperti kecerdasan buatan (artificial intelegent), machine learning, statistik dan database.

Beberapa metode yang sering disebut-sebut dalam literatur data mining antara lain clustering,

classification, association rules mining, neural network, genetic algorithm dan lain-lain

(Moertini, 2002).

2.4.1 Tahapan Data Mining

Di dalam tahapan data mining, data yang ada, tidak dapat langsung diolah dengan

menggunakan sistem data mining. Data tersebut harus dipersiapkan terlebih dahulu agar hasil

yang diperoleh dapat lebih maksimal, dan waktu komputasinya lebih minimal. Proses

persiapan data ini sendiri dapat mencapai 60 % dari keseluruhan proses dalam data mining.

Proses data mining secara garis besar terdiri dari 5 tahapan yaitu data selection, pre-

processing/cleaning, transformation, data mining dan interpretation/evaluation. Proses data

mining digambarkan pada Gambar 2.3 berikut:

10

Gambar 2.3 Tahapan Data Mining

(Sumber : Fayyad 1996)

Berikut ini merupakan tahapan dari proses data mining (Fayyad, 1996):

1. Data Selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum

tahap penggalian informasi dalam data mining dimulai. Data hasil seleksi yang akan

digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data

operasional.

2. Pre-processing/Cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada

data yang menjadi fokus. Proses cleaning mencakup antara lain membuang duplikasi data,

memeriksa data yang inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan

cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang

sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk data mining,

seperti data atau informasi eksternal.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut

sesuai untuk proses data mining. Proses coding dalam data mining merupakan proses

kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis

data.

4. Data Mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih

dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam

11

data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat

bergantung pada tujuan dan proses data mining secara keseluruhan.

5. Interpretation/Evaluation

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam

bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan

bagian dari proses data mining yang disebut interpretation. Tahap ini mencakup

pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau

hipotesis yang ada sebelumnya.

2.4.2 Pengelompokan Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat

dilakukan, yaitu (Larose, 2005):

1. Deskripsi

Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk

menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh,

petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta

bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan

presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan

penjelasan untuk suatu pola atau kecenderungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah

numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang

menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada

peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel

prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien

rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level

sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam

proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan

dapat digunakan untuk kasus baru lainnya.

12

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi

nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan penelitian

adalah:

1. Prediksi harga beras dalam tiga bulan yang akan datang.

2. Prediksi presentase kenaikan kecelekaan lalu lintas tahun depan jika batas

bawah kecepatan dinaikkan.

Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula

digunakan (untuk keadaan yang tepat) untuk prediksi.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan

pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan

sedang, dan pendapatan rendah.

Contoh lain klasifikasi dalam bisnis dan penelitian adalah :

1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau

bukan.

2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit

yang baik atau buruk.

3. Mendiagnosis penyakit seorang pasien untuk mendapatkan kategori penyakit apa.

5. Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan

dan membentuk kelas objek-objek yang memiliki kemiripan. Cluster adalah kumpulan

record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan

dengan record-record dalam cluster lain.

Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam

pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi,

atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran

mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-

kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu

kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok

lain akan bernilai minimal.

Contoh pengklusteran dalam bisnis dan penelitian adalah:

13

1. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan

perilaku dari gen dalam jumlah besar.

2. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu

produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.

3. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial

dalam baik dan mencurigakan.

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu

waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.

Contoh asosiasi dalam bisnis dan penelitian adalah :

1. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang

tidak pernah dibeli secara bersamaan.

2. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan

untuk memberikan respons positif terhadap penawaran upgrade layanan yang

diberikan.

2.5 Clustering

Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai salah

satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data dengan

karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang

berbeda ke ‘wilayah’ yang lain.

Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering.

Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan

pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut

dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang

dianalisa ke dalam cluster-cluster yang ada.

Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical

clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana

data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki

yang berjauhan. Di samping kedua pendekatan tersebut, ada juga clustering dengan

pendekatan automatic mapping (Self – Organising Map/SOM).

14

Clustering (pengelompokan data) mempertimbangkan sebuah pendekatan penting

untuk mencari kesamaan dalam data dan menempatkan data yang sama ke dalam kelompok-

kelompok. Clustering membagi kumpulan data ke dalam beberapa kelompok dimana

kesamaan dalam sebuah kelompok adalah lebih besar daripada diantara kelompok-kelompok

yang lain (Rui Xu & Donald 2009). Gagasan mengenai pengelompokan data, atau clustering,

memiliki sifat yang sederhana dan dekat dengan cara berpikir manusia kapanpun kepada kita

dipresentasikan jumlah data yang besar, kita biasanya cenderung merangkumkan jumlah data

yang besar ini ke dalam sejumlah kecil kelompok-kelompok atau kategori-kategori untuk

memfasilitasi analisanya lebih lanjut. Selain dari itu, sebagian besar data yang dikumpulkan

dalam banyak masalah terlihat memiliki beberapa sifat yang melekat yang mengalami

pengelompokan-pengelompokan natural (Hammouda & Karray, 2003).

Namun demikian, penemuan pengelompokan-pengelompokan ini atau upaya untuk

mengkategorikan data adalah bukan sebuah tugas yang sederhana bagi manusia kecuali data

memiliki dimensionalitas rendah (dua atau tiga dimensi paling banyak). Inilah sebabnya

mengapa beberapa metode dalam soft computing telah dikemukakan untuk menyelesaikan

jenis masalah ini. Metode ini disebut “Metode-Metode Pengelompokan Data” (Hammouda &

Karray, 2003).

Algoritma-algoritma clustering digunakan secara ekstensif tidak hanya untuk

mengorganisasikan dan mengkategorikan data, akan tetapi juga sangat bermanfaat untuk

kompresi data dan konstruksi model. Melalui pencarian kesamaan dalam data, seseorang

dapat merepresentasikan data yang sama dengan lebih sedikit simbol. Dan juga, jika kita

dapat menemukan kelompok-kelompok data, kita dapat membangun sebuah model masalah

berdasarkan pengelompokan-pengelompokan ini (Dubes & Jain, 1988).

Clustering menunjuk pada pengelompokan record, observasi-observasi, atau kasus-

kasus ke dalam kelas-kelas objek yang sama. Cluster adalah sekumpulan record yang sama

dengan satu sama lain dan tidak sama dengan record dalam cluster lain. Clustering berbeda

dari klasifikasi dimana tidak ada variabel target untuk clustering. Tugas clustering mencoba

untuk tidak mengklasifikasikan, mengestimasi, atau memprediksi nilai variabel target (Larose,

2005). Bahkan, algoritma clustering berusaha mensegmentasikan seluruh kumpulan data ke

dalam subkelompok-subkelompok atau cluster-cluster homogen secara relatif. Dimana

kesamaan record dalam cluster dimaksimalkan dan kesamaan dengan record diluar cluster ini

diminimalkan.

15

Clustering sering dilaksanakan sebagai langkah pendahuluan dalam proses

pengumpulan data, dengan cluster-cluster yang dihasilkan digunakan sebagai input lebih

lanjut ke dalam sebuah teknik yang berbeda, seperti neural network. Karena ukuran yang

besar dari banyak database yang dipresentasikan saat ini, dapat membantu untuk

menggunakan analisa clustering terlebih dahulu, untuk mengurangi ruang pencarian untuk

algoritma-algoritma downstream. Aktivitas clustering pola khusus meliputi langkah-langkah

berikut (Dubes & Jain, 1988) :

1. Representasi pola (secara opsional termasuk ekstraksi dan/atau seleksi sifat.

2. Defenisi ukuran kedekatan pola yang tepat untuk domain data.

3. Clustering pengelompokan.

4. Penarikan data (jika dibutuhkan).

5. Pengkajian output (jika dibutuhkan).

Representasi pola merujuk pada jumlah kelas, jumlah pola-pola yang ada, dan jumlah,

tipe dan skala fitur yang tersedia untuk algoritma clustering. Beberapa informasi ini dapat

tidak bisa dikontrol oleh praktisioner. Seleksi sifat (fitur) adalah proses pengidentifikasian

subset fitur original yang paling efektif untuk digunakan dalam clustering. Ekstraksi fitur

adalah penggunaan satu atau lebih transformasi dari sifat-sifat input untuk menghasilkan sifat-

sifat baru yang lebih baik.

Secara garis besar, terdapat beberapa metode clustering data. Pemilihan metode

clustering bergantung pada tipe data dan tujuan clustering itu sendiri. Metode-metode beserta

algortima yang termasuk didalamnya adalah sebagai berikut:

1. Partitioning Methdos

Metode yang membangun berbagai partisi dan kemudian mengevaluasi partisi tersebut

dengan beberapa kriteria. Algoritma yang dipakai pada metode ini adalah K-Means, K-

Medoid, PROCLUS, CLARA, CLARANS dan PAM.

2. Hierarchical Methods

Metode yang membuat suatu penguraian secara hierarchical dari himpunan data

dengan menggunakan beberapa kriteria. Metode ini terdiri atas dua jenis, yaitu

Agglomerative yang menggunakan strategi bottom-up dan Disisive yang menggunakan

strategi top-down. Metode ini meliputi algoritma BIRCH, AGNES, DIANA, CURE dan

CHAMELEON.

16

3. Density-Based Methods

Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini meliputi

algoritma DBSCAN, OPTICS dan DENCLU.

4. Grid-Based Methods

Metode ini berdasarkan suatu struktur granularitas multi-level. Metode clustering ini

meliputi algoritma STING, WaveCluster dan CLIQUE.

5. Model-Based Methods

Suatu model dihipotesakan untuk masing-masing cluster dan ide untuk mencari best

fit dari model tersebut untuk masing-masing yang lain. Metode clustering ini meliputi

pendekatan statistik, yaitu algoritma COBWEB dan jaringan syaraf tiruan SOM.

2.5.1 Partitioning Clustering

Partitioning Clustering merupakan salah satu metode data mining yang bersifat tanpa

arahan (unsupervised). Konsep dasar dari partitioning clustering adalah membagi n jumlah

cluster ke dalam k cluster. Metode ini merupakan metode pengelompokan yang bertujuan

mengelompokkan objek sehingga jarak antara setiap objek ke pusat kelompok di dalam satu

kelompok adalah minimum.

Metode Pengelompokan :

Cluster adalah kumpulan data dimana jika objek data yang terletak didalam cluster

harus memiliki kemiripan sedangkan yang tidak berada dalam suatu cluster tidak mempunyai

kemiripan.

Jika ada n objek penelitian dengan p variabel maka sebelum dilakukan

pengelompokan data atau objek terlebih dahulu menentukan ukuran kedekatan sifat antar

data. Ukuran data yang bisa digunakan adalah jarak euclidius (euclidean distance), antara dua

objek dari p dimensi pengamatan. Jika objek pertama yang diamati adalah 𝑥= 𝑥1 ,𝑥2,…,𝑥𝑝

dan 𝑦= 𝑦1 ,𝑦2,…,𝑦𝑝 maka rumus euclidean distance adalah sebagai berikut:

(2.1)

17

dimana:

d : distance

x : 𝑥1,𝑥2,𝑥3,…,𝑥𝑝

y : 𝑦1,𝑦2,𝑦3,…,𝑦𝑝

j : merepresentasikan nilai atribut

p : dimensi data

2.6 Algoritma K-Means

K-Means (MacQueen, 1967) adalah salah satu dari algoritma unsupervised learning

yang paling sederhana untuk menyelesaikan masalah clustering yang telah dikenal. Prosedur

ini mengikuti cara sederhana dan mudah untuk mengklasifikasikan kumpulan data tertentu

melalui jumlah cluster tertentu (menganggap k cluster) yang telah ditetapkan sebelumnya.

Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah

clustering k-means (Santosa, 2007). K-Means merupakan salah satu metode data clustering

non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik

yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai

karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007). Adapun

tujuan dari data clustering ini adalah untuk meminimalisasikan objective function yang diset

dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam

suatu cluster dan memaksimalkan variasi antar cluster.

Pada dasarnya penggunaan algoritma dalam melakukan proses clustering tergantung

dari data yang ada dan konklusi yang ingin dicapai. Untuk itu digunakan algoritma K-Means

yang didalamnya memuat aturan sebagai berikut:

1. Jumlah cluster perlu diinputkan.

2. Hanya memiliki atribut bertipe numerik.

Untuk tahapannya, algoritma k-means memilih secara acak k buah data sebagai

centroid. Kemudian, jarak antara data dan centroid dihitung dengan menggunakan Euclidean

Distance. Data dikelompokkan dalam cluster yang terkecil / berdasarkan jarak minimum

dihitung dari titik semua cluster.

18

Algoritma K-Means pada dasarnya melakukan dua proses, yaitu proses pendeteksian

lokasi pusat tiap cluster dan proses pencarian anggota dari tiap-tiap cluster. Cara kerja

algoritma K-Means:

1. Tentukan k sebagai jumlah cluster yang ingin dibentuk.

2. Bangkitkan k centroid (titik pusat cluster) secara random.

3. Hitung jarak setiap data ke masing-masing centroid.

4. Kelompokkan masing-masing objek ke dalam cluster berdasarkan jarak

minimum.

2.7 Microsoft Visual Basic.NET

Microsoft Visual Basic. NET adalah sebuah alat untuk mengembangkan dan

membangun aplikasi yang bergerak diatas sistem NET Framework, dengan menggunakan

bahasa basic. Dengan menggunakan alat ini, para programmer dapat membangun aplikasi

windows form, aplikasi web berbasis ASP.NET, dan juga aplikasi command-line.

Alat ini dapat diperoleh secara terpisah dari beberapa produk lainnya (seperti

Microsoft Visual C++, Visual C#, atau Visual J#) atau juga dapat diperoleh secara terpadu

dalam Microsoft Visual Studio.NET. Bahasa Visual Basic.NET sendiri menganut paradigma

bahasa pemrograman berorientasi objek yang dapat dilihat sebagai evolusi dari Microsoft

Visual Basic versi sebelumnya yang diimplementasikan diatas .NET Framework.

NET Framework adalah landasan kerja bagi aplikasi – aplikasi net yang dibuat dalam

bahasa pemrograman berbasis net tanpa terpengaruh oleh bahasa pemrograman yang

digunakan didalam NET Framework ini karena semua coding yang telah dikembangkan

dalam programmer akan dieksekusi berdasarkan urutan-urutan proses bekerja yang saling

melengkapi.

Komponen – komponen pada NET.Framework adalah :

1. Common Language Runtime

Merupakan jembatan antara aplikasi net dengan sistem operasi.

2. Microsoft Intermediate Language

Merupakan bahasa program yang tidak diterjemahkan langsung kedalam bahsa biner

namun terlebih dahulu di terjemahkan kedalam bahasa Common Language Runtime

19

kemudian diterjemahkan kembali kedalam bahasa Microsoft Intermediate Language yang

baru akhirnya menghasilkan bahasa biner yang siap dijalankan.

3. Just in Time Complier

Just in Time Complier hanya melakukan komplikasi kode yang hanya dibutuhkan saja

sehingga lebih efisien.

4. Framework Class Library

Merupakan kumpulan class – class yang berjumlah ribuan didalam NET Framework.

Microsoft Visual Basic.NET terdiri dari 5 komponen utama yang tersusun dalam tiga lapisan

(layer) yaitu :

1. Visual Studio.NET

Microsoft Visual Studio.NET merupakan kumpulan perkembangan tools untuk

membangun aplikasi Web ASP, Xml Web Service, Aplikasi desktop dan Aplikasi Mobile.

Pada Aplikasi Visual Studio.NET ini bahasa-bahsa pemrograman yang digunakan seperti

Visual Basic, Visual C ++, dan Visual C.

2. Visual Basic.NET (VB NET)

Merupakan salah satu bahasa pemrograman yang bisa digunakan untuk membangun

aplikasi – apliaksi NET di Platform.

3. IDE Visual Basic

IDE (Integrated Development Environment) adalah perangkat lunak komputer yang

berfungsi untuk membantu pemrograman dalam mengembangkan perangkat lunak (tools

pendukung).

20

BAB III

METODOLOGI PENELITIAN

3.1 Data yang Digunakan

Pada penelitian ini data yang digunakan adalah dataset yang bertipe record,

berupa data struk belanja yang berisi merk produk pada swalayan Larisso di Ambulu –

Jember yang diperoleh mulai bulan Januari s/d September 2014. Data awal yang didapat

yaitu berupa data mentah sebanyak 16 struk belanja (120 dataset). Pada Gambar 3.1 dapat

dilihat salah satu contoh dari struk belanja. Data mentah tersebut akan diubah kedalam

bentuk record yang akan menjadi dataset sebanyak 16 record. Dataset ini terdiri dari 7

atribut. Adapun atribut-atribut yang dimaksud yaitu kode produk, nama produk, jumlah

produk, harga produk, total harga, tunai dan kembalian. Seluruh atribut pada dataset

selanjutnya akan diseleksi pada tahapan praproses data.

3.2 Praproses Data

Tahap praproses data merupakan tahap seleksi data yang bertujuan untuk

mendapatkan data yang bersih dan siap untuk digunakan dalam penelitian. Tahapan yang

dikerjakan adalah menentukan kelompok jenis produk dan menentukan kelompok

berdasarkan record dengan tujuan untuk mempermudah pemahaman terhadap isi record. Dan

juga melakukan seleksi dengan memperhatikan konsistensi data, missing value dan redundant

data.

3.2.1 Penentuan Kelompok Jenis Produk

Seperti yang dapat dilihat pada Gambar 3.1, terdapat beberapa atribut yaitu kode

produk, nama produk, jumlah produk, harga produk, total harga, tunai dan kembalian. Dari

semua atribut tersebut hanya beberapa yang akan digunakan dan dianggap cukup memenuhi

untuk dilakukannya penelitian. Adapun atribut tersebut yaitu nama produk dan jumlah

produk.

21

Gambar 3.1 Contoh Struk Belanja

Pada swalayan banyak sekali terdapat nama-nama produk ataupun merk-merk produk

yang tidak bisa disebutkan satu-satu. Mulai dari jenis produk sampai kegunaan produk

tersebut. Oleh karena itu penulis akan membuat pengelompokkan produk berdasarkan jenis-

jenisnya. Adapun pengelompokkan jenis produk sebagai berikut:

1. Makanan Ringan

Disini semua jenis makanan ringan seperti Salt Chesee, Krupuk, Permen, Koko

Krunch, Oreo dan lain-lain akan dikelompokkan ke dalam atribut makanan ringan.

2. Minuman

Semua jenis minuman mulai dari minuman botol, minuman kaleng, sirup dan juga

termasuk semua jenis susu dikelompokkan ke dalam atribut minuman.

3. Buah-buahan

Atribut ini berisi semua jenis buah-buahan.

22

4. Perawatan

Yang termasuk pada atribut ini yaitu perawatan rambut seperti shampoo, conditioner,

vitamin rambut dan lain-lain. Perawatan kulit seperti lotion, lulur, dan lain-lain.

Perawatan mandi atau peralatan mandi seperti sabun, sikat gigi, pasta gigi dan lain-lain.

5. Bahan Dapur

Bahan dapur seperti semua jenis indomie. Bumbu-bumbu dapur seperti kecap,

saos/sambal, merica, sasa, sajiku nasigoreng, gula, garam dan lain-lain dikelompokkan

ke dalam atribut bahan dapur.

6. Bahan Makanan

Semua jenis bahan makanan mulai dari sayur-sayuran, ayam, sarden, ikan, nugget dan

juga sossis termasuk ke dalam atribut bahan makanan.

7. Perlengkapan

Jenis produk yang termasuk pada atribut ini seperti pewangi baju, pewangi lantai, sabun

pencuci piring, pengharum ruangan, baygon dan lain-lain.

8. Obat-obatan

Segala jenis obat-obatan termasuk ke dalam atribut ini.

9. Rokok

Pada atribut ini berisi semua jenis rokok.

3.2.2 Penentuan Kelompok Berdasarkan Record

Tahap selanjutnya adalah mengubah data mentah (struk belanja) menjadi dataset

yang berisikan semua merk produk barang yang dibeli dalam bentuk record. Semua data

mentah merk produk barang sebanyak 16 struk belanja (120 dataset) dimasukkan dengan

jumlahnya dan kemudian dikelompokkan berdasarkan jenis produknya sehingga hasilnya

dapat dilihat pada Tabel 3.1 dan Tabel 3.2 berikut :

23

Tabel 3.1 Dataset Merk Produk

NO STRUK MERK PRODUK JUMLAH

1 Struk 1 Gula 6

2 Struk 1 Aqua Botol 1

3 Struk 1 Pocari Sweat 900 ML 1

4 Struk 1 Pocari Sweat 500 ML 1

5 Struk 1 Sprite 2

6 Struk 1 Frestea Botol 1

7 Struk 1 Salt Cheese 1

8 Struk 1 Kecap Bango 1

9 Struk 1 Hello Krupuk 1

10 Struk 1 Hello Stick Tahu 1

11 Struk 1 Butter Keju 1

12 Struk 1 Yupi Gummy 1

13 Struk 1 Sasa Tepung 1

14 Struk 1 Royco Bumbu Tempe 2

15 Struk 1 Laurier Maxi 1

16 Struk 1 Royco Bumbu Ayam 1

17 Struk 1 Antimo Cair 4

18 Struk 1 Tissue 1

19 Struk 1 Butter Coconut 1

20 Struk 1 Master Kids 1


22 Struk 1 Hers Protex 1

23 Struk 2 Zee Susu Bag 1

24 Struk 2 Zee Susu Sachet 10

25 Struk 3 Hers Protex 1

26 Struk 3 Tepung Vergo 1



29 Struk 3 Sajiku Nasgor 2

30 Struk 3 Baby Shampoo 1

31 Struk 3 Clear Shampoo 1

32 Struk 4 Koko Krunch 1

33 Struk 4 Handbody Marina 1

34 Struk 5 Susu Milo 1

35 Struk 5 Softener 1


24

37 Struk 5 Oreo 1

38 Struk 5 Gery Saluut 1

39 Struk 5 Nissin Wafer 1

40 Struk 5 Beng-beng 1

41 Struk 5 Fenesia Wafer 1

42 Struk 5 Molto 2

43 Struk 5 Lifebuoy 1

44 Struk 5 Pepsodent 1

45 Struk 5 Lux 1

46 Struk 6 Kecap Bango 1




50 Struk 6 Pucelle 1



53 Struk 7 Kayu Putih 2


55 Struk 7 Wismilak 3

56 Struk 7 ABC Saos 2

57 Struk 7 ABC Sambal 1

58 Struk 7 Champ Seafood 1

59 Struk 8 Gula 2

60 Struk 8 Champ Sosis 1

61 Struk 8 Fenesia Wafer 1

62 Struk 8 Sarimie Goreng 5

63 Struk 8 Indomie Goreng 1

64 Struk 8 Sasa Tepung 1

65 Struk 8 Yupi Gummy 1


67 Struk 9 Oreo 1

68 Struk 9 Nutrijel 1

69 Struk 9 Agarasa 2

70 Struk 10 Kayu Putih 2

71 Struk 10 Gula 2

72 Struk 10 Malkis Abon 1

73 Struk 10 Melon 1

74 Struk 10 ABC Sambal 1

25

75 Struk 10 Handbody Marina 2

76 Struk 11 Apel 10


78 Struk 11 G-Mild 1

79 Struk 11 Top Kopi 48

80 Struk 11 Mama Lemon 2

81 Struk 11 Jeruk 5

82 Struk 11 Dji Sam Soe 2

83 Struk 12 Strowbery 35

84 Struk 12 G-Mild 6

85 Struk 12 Nissin Wafer 10

86 Struk 12 Mizone 25

87 Struk 12 Apel 25

88 Struk 12 Anggur 35

89 Struk 12 Nivea 30


91 Struk 12 Mama Lemon 19

92 Struk 13 Sunlight 10

93 Struk 13 So Nice 10

94 Struk 13 Baygon 10

95 Struk 13 Mixagrip 8

96 Struk 13 Casablanca Parfum 52

97 Struk 13 Beng-beng 97


99 Struk 13 Jeruk 10

100 Struk 13 Nuvo 8

101 Struk 14 Apel 6

102 Struk 14 Kelengkeng 10


104 Struk 14 Nugget 5

105 Struk 14 Panadol 23

106 Struk 14 Lux 12

107 Struk 14 Djarum 17

108 Struk 15 Koyo Cabe 5

109 Struk 15 Djarum 10

110 Struk 15 Konimex 13

111 Struk 15 Superpel 19

112 Struk 15 Stella 29

26

113 Struk 15 Melon 10

114 Struk 16 Energen 2

115 Struk 16 Promild 5

116 Struk 16 Sarden 8


118 Struk 16 Bodrex 16

119 Struk 16 Belimbing 29


Tabel 3.2 Dataset Penentuan Jenis Produk

No

Struk

Ke-

Makanan

Ringan

Minu

man

Buah-

buahan

Pera

watan

Bahan

Dapur

Bahan

Makanan

Perleng

kapan

Obat-

obatan

Rokok

1 Struk 1 6 8 0 1 11 0 4 4 0

2 Struk 2 0 11 0 0 0 0 0 0 0

3 Struk 3 0 0 0 2 5 0 2 0 0

4 Struk 4 1 0 0 1 0 0 0 0 0

5 Struk 5 5 3 0 3 0 0 3 0 0

6 Struk 6 0 4 0 3 3 0 0 0 0

7 Struk 7 0 3 0 0 3 1 2 0 3

8 Struk 8 2 0 0 0 9 1 0 0 0

9 Struk 9 1 0 0 0 3 0 1 0 0

10 Struk 10 1 0 1 2 3 0 2 0 0

11 Struk 11 0 48 15 3 0 0 2 0 4

12 Struk 12 10 25 95 30 43 0 19 0 12

13 Struk 13 97 10 10 60 0 10 20 8 0

14 Struk 14 0 0 16 12 20 5 0 23 17

15 Struk 15 0 0 10 0 0 0 48 18 10

16 Struk 16 0 2 29 7 15 8 0 16 5

Dari tabel diatas dapat dilihat dataset berjumlah 16 record struk belanja dengan 9 jenis

produk. Dataset yang dimasukkan berupa merk produk apa saja yang dibeli dan berapa

jumlah merk produk yang dibeli oleh konsumen didalam satu struk kemudian di kelompokkan

berdasarkan jenis produknya.

27

3.3 Cleaning Data

Tahap selanjutnya adalah melakukan cleaning data terhadap data yang memiliki

missing value dan redundant data. Dikatakan missing value jika atribut- atribut dalam

dataset tidak berisi nilai atau kosong, sementara itu data dikatakan redundant jika

dalam satu dataset yang sama terdapat lebih dari satu record yang berisi nilai yang sama.

Pada dataset penjualan produk ini tidak banyak terdapat data yang missing value dan

redundant, jadi penulis melakukan pembersihan data seperti:

1. Dataset yang memiliki jumlah produk diatas 40 item.

Struk Ke-

Makanan

Ringan

Minu

man

Buah-

buahan

Pera

watan

Bahan

Dapur

Bahan

Makanan

Perleng

kapan

Obat-

obatan Rokok

Struk 11 0 48 15 3 0 0 2 0 4

Struk 12 10 25 95 30 43 0 19 0 12

Struk 13 97 10 10 60 0 10 20 8 0

Struk 15 0 0 10 0 0 0 48 18 10

2. Pada dataset hanya terdapat satu produk saja yang dibeli.

Struk Ke-

Makanan

Ringan

Minu

man

Buah-

buahan

Pera

watan

Bahan

Dapur

Bahan

Makanan

Perleng

kapan

Obat-

obatan Rokok

Struk 2 0 11 0 0 0 0 0 0 0

3. Pada dataset hanya terdapat dua produk saja yang dibeli

Struk Ke-

Makanan

Ringan

Minu

man

Buah-

buahan

Pera

watan

Bahan

Dapur

Bahan

Makanan

Perleng

kapan

Obat-

obatan Rokok

Struk 4 1 0 0 1 0 0 0 0 0

4. Pada dataset hanya terdapat tiga produk saja yang dibeli

Struk Ke-

Makanan

Ringan

Minu

man

Buah-

buahan

Pera

watan

Bahan

Dapur

Bahan

Makanan

Perleng

kapan

Obat-

obatan Rokok

Struk 3 0 0 0 2 5 0 2 0 0

28

Struk 6 0 4 0 3 3 0 0 0 0

Struk 8 2 0 0 0 9 1 0 0 0

Struk 9 1 0 0 0 3 0 1 0 0

Setelah dilakukannya tahapan cleaning data terhadap dataset, maka didapat hasil

akhir sebanyak 6 record dengan 9 jenis produk dan mempunyai isi data yang relevan yang

dapat dilihat pada Tabel 3.3 berikut:

Tabel 3.3 Dataset yang telah di cleaning

3.4 Uji Coba dengan Algoritma K-Means Clustering

K-Means adalah salah satu metode data clustering non hirarki yang berusaha

mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi

data ke dalam cluster sehingga data yang memiliki karakteristik yang sama

dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang

berbeda dikelompokkan ke dalam cluster yang lain.

Tahapan clustering dengan menggunakan K-Means dimulai dengan pembentukan

cluster dimana penulis di sini membagi cluster maksimal sesuai dengan jumlah dataset,

karena nantinya setiap cluster yang diinputkan dapat memilih data sheet untuk menentukan

nilai centroid akan tetapi dengan syarat nilai centroid tidak dapat muncul dengan nilai yang

sama. Kemudian dilakukan proses penghitungan jarak dari centroid dengan menggunakan

Euclidean Distance, di mana centroid diperoleh dari objek dataset yang telah diinputkan.

No Struk

Ke-

Makanan

Ringan

Minu

man

Buah-

buahan

Pera

watan

Bahan

Dapur

Bahan

Makanan

Perleng

kapan

Obat-

obatan Rokok

1 Struk 1 6 8 0 1 11 0 4 4 0

2 Struk 5 5 3 0 3 0 0 3 0 0

3 Struk 7 0 3 0 0 3 1 2 0 3

4 Struk 10 1 0 1 2 3 0 2 0 0

5 Struk 14 0 0 16 12 20 5 0 23 17

6 Struk 16 0 2 29 27 15 8 0 16 5

29

Adapun hasil dari centroid dari masing-masing cluster yang telah diinputkan ( misal

penginputan 3 cluster) berdasarkan pengelompokkan jenis produk dapat dilihat pada tabel

berikut ini.

1. Parameter Produk Makanan Ringan

Tabel 3.4 Centroid Produk Makanan Ringan

2. Parameter Produk Minuman

Tabel 3.5 Centroid Produk Minuman

3. Parameter Produk Buah-buahan

Tabel 3.6 Centroid Produk Buah-buahan

Cluster

Centroid

C1

6

C2

5

C3

0

Cluster

Centroid

C1

8

C2

3

C3

2

Cluster

Centroid

C1

0

C2

16

C3

29

30

4. Parameter Produk Perawatan

Tabel 3.7 Centroid Produk Perawatan

5. Parameter Produk Bahan Dapur

Tabel 3.8 Centroid Produk Bahan Dapur

6. Parameter Produk Bahan Makanan

Tabel 3.9 Centroid Produk Bahan Makanan

Cluster

Centroid

C1

1

C2

3

C3

2

Cluster

Centroid

C1

11

C2

3

C3

20

Cluster

Centroid

C1

1

C2

5

C3

8

31

7. Parameter Produk Perlengkapan

Tabel 3.10 Centroid Produk Perlengkapan

8. Parameter Produk Obat-obatan

Tabel 3.11 Centroid Produk Obat-obatan

9. Parameter Produk Rokok

Tabel 3.12 Centroid Produk Rokok

Setelah diketahui nilai centroid pada masing-masing cluster, tahap selanjutnya adalah

melakukan penghitungan untuk menentukan jarak setiap data dengan centroid yang telah

dibentuk dengan menggunakan rumus euclidiance distance. Hasil dari penghitungan jarak

dengan rumus euclidiance distance ini akan berpengaruh pada penempatan setiap merk

Cluster

Centroid

C1

4

C2

3

C3

2

Cluster

Centroid

C1

4

C2

23

C3

16

Cluster

Centroid

C1

3

C2

17

C3

5

32

produk ke cluster tertentu. Setelah hasil dari jarak setiap data diperoleh tahapan selanjutnya

adalah mengelompokkan jarak data minimum atau terkecil dari masing-masing cluster

berdasarkan parameter jenis produknya.

3.4.1 Penghitungan jarak berdasarkan parameter jenis produk

Penghitungan jarak berdasarkan parameter produk antara jarak data terhadap nilai

centroid masing-masing cluster menggunakan rumus euclidiance distance (2.1) yaitu:

A. Parameter Produk Makanan Ringan

1. Jarak antara struk pertama dengan centroid pertama (C1)

d (1,1) = √(6 - 6) 2 = √ (0) 2 = 0

2. Jarak antara struk pertama dengan centroid kedua (C2)

d (1,2) = √(6 -5) 2 = √ (1) 2 = 1

3. Jarak antara struk pertama dengan centroid ketiga (C3)

d (1,3) = √(6 - 0) 2 = √ (6) 2 = 6

Penghitungan jarak data berdasarkan paramater produk makanan ringan dengan

centroid masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk Tabel

3.13 berikut :

Tabel 3.13 Hasil Penghitungan Jarak Dengan Paramater

Produk Makanan Ringan Masing-Masing cluster

No Struk

Ke- C1 C2 C3

1 Struk 1 0 1 6

2 Struk 5 1 0 5

3 Struk 7 6 5 0

4 Struk 10 5 4 1

5 Struk 14 6 5 0

6 Struk 16 6 5 0

33

B. Parameter Produk Minuman


d (1,1) = √(8 - 8) 2 = √ (0) 2 = 0


d (1,2) = √(8 - 3) 2 = √ (5) 2 = 5


d (1,3) = √(8 - 2) 2 = √ (6) 2 = 6

Penghitungan jarak data berdasarkan paramater produk minuman dengan centroid

masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk Tabel 3.14

berikut :


Produk Minuman Masing-Masing cluster

C. Parameter Produk Buah - buahan


d (1,1) = √(0 - 0) 2 = √ (0) 2 = 0


d (1,2) = √(0 - 16) 2 = √ (-16) 2 = 16


d (1,3) = √(0 - 29) 2 = √ (-29) 2 = 29

No Struk

Ke- C1 C2 C3

1 Struk 1 0 5 6

2 Struk 5 5 0 1

3 Struk 7 5 0 1

4 Struk 10 8 3 2

5 Struk 14 8 3 2

6 Struk 16 6 1 0

34

Penghitungan jarak data berdasarkan paramater produk buah - buahan dengan

centroid masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk Tabel

3.15 berikut :


Produk Buah - buahan Masing-Masing cluster

No Struk

Ke- C1 C2 C3

1 Struk 1 0 16 29

2 Struk 5 0 16 29

3 Struk 7 0 16 29

4 Struk 10 0 16 29

5 Struk 14 16 0 13

6 Struk 16 29 13 0

D. Parameter Produk Perawatan


d (1,1) = √(1 - 1) 2 = √ (0) 2 = 0


d (1,2) = √(1 - 3) 2 = √ (-2) 2 = 2


d (1,3) = √(1 - 2) 2 = √ (-1) 2 = 1

Penghitungan jarak data berdasarkan paramater produk perawatan dengan centroid


berikut :

35


Produk Perawatan Masing-Masing cluster

E. Parameter Produk Bahan Dapur


d (1,1) = √(11 - 11) 2 = √ (0) 2 = 0


d (1,2) = √(11 - 3) 2 = √ (8) 2 = 8


d (1,3) = √(11 - 20) 2 = √ (-9) 2 = 9

Penghitungan jarak data berdasarkan paramater produk bahan dapur dengan

centroid masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk

Tabel 3.17 berikut :

No Struk

Ke- C1 C2 C3

1 Struk 1 0 2 1

2 Struk 5 2 0 1

3 Struk 7 1 3 2

4 Struk 10 1 1 0

5 Struk 14 11 9 10

6 Struk 16 6 4 5

36


Produk Bahan Dapur Masing-Masing cluster

No

Struk

Ke- C1 C2 C3

1 Struk 1 0 8 9

2 Struk 5 11 3 20

3 Struk 7 8 0 17

4 Struk 10 8 0 17

5 Struk 14 9 17 0

6 Struk 16 4 12 5

F. Parameter Produk Bahan Makanan


d (1,1) = √(0 - 1) 2 = √ (-1) 2 = 1


d (1,2) = √(0 - 5) 2 = √ (-5) 2 = 5


d (1,3) = √(0 - 8) 2 = √ (-8) 2 = 8

Penghitungan jarak data berdasarkan paramater produk bahan makanan dengan



37


Produk Bahan Makanan Masing-Masing cluster

G. Parameter Produk Perlengkapan


d (1,1) = √(4 - 4) 2 = √ (0) 2 = 0


d (1,2) = √(4 - 3) 2 = √ (1) 2 = 1


d (1,3) = √(4 - 2) 2 = √ (2) 2 = 2

Penghitungan jarak data berdasarkan paramater produk perlengkapan dengan



No Struk

Ke- C1 C2 C3

1 Struk 1 1 5 8

2 Struk 5 1 5 8

3 Struk 7 0 4 7

4 Struk 10 1 5 8

5 Struk 14 4 0 3

6 Struk 16 7 3 0

38


Produk Perlengkapan Masing-Masing cluster

No Struk

Ke- C1 C2 C3

1 Struk 1 0 1 2

2 Struk 5 1 0 1

3 Struk 7 2 1 0

4 Struk 10 2 1 0

5 Struk 14 4 3 2

6 Struk 16 4 3 2

H. Parameter Produk Obat - obatan


d (1,1) = √(4 - 4) 2 = √ (0) 2 = 0


d (1,2) = √(4 - 23) 2 = √ (-19) 2 = 19


d (1,3) = √(4 - 16) 2 = √ (-12) 2 = 12

Penghitungan jarak data berdasarkan paramater produk obat - obatan dengan



39


Produk Obat - obatan Masing-Masing cluster

No Struk

Ke- C1 C2 C3

1 Struk 1 0 19 12

2 Struk 5 4 23 16

3 Struk 7 4 23 16

4 Struk 10 4 23 16

5 Struk 14 19 0 7

6 Struk 16 12 7 0

I. Parameter Produk Rokok


d (1,1) = √(0 - 3) 2 = √ (-3) 2 = 3


d (1,2) = √(0 - 17) 2 = √ (-17) 2 = 17


d (1,3) = √(0 - 5) 2 = √ (-5) 2 = 5

Penghitungan jarak data berdasarkan paramater produk rokok dengan centroid


berikut :

40


Produk Rokok Masing-Masing cluster

No Struk

Ke- C1 C2 C3

1 Struk 1 3 17 5

2 Struk 5 3 17 5

3 Struk 7 0 14 2

4 Struk 10 3 17 5

5 Struk 14 14 0 12

6 Struk 16 2 12 0

3.4.2 Pengelompokkan Jarak Terkecil atau Minimum

Setelah melakukan penghitungan jarak data dengan masing-masing cluster, tahapan

selanjutnya adalah mengelompokkan jarak terkecil atau minimum disetiap masing-masing

cluster. Seperti pada Tabel 3.14, untuk data yang pertama atau struk pertama jarak yang

terkecil yaitu 0 dan terletak pada (C1). Maka data pertama akan menjadi anggota dari

cluster pertama. Untuk lebih jelasnya anggota data awal untuk masing-masing cluster

akan disajikan pada Tabel - tabel berikut:

Tabel 3.22 Anggota Data Masing-Masing Cluster

Produk Makanan Ringan

No Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

41


Produk Minuman


Produk Buah - buahan

No Struk Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

No Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

42


Produk Perawatan


Produk Bahan Dapur

No

Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

No Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

43


Produk Bahan Makanan


Produk Perlengkapan

No Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

No Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

44


Produk Obat –obatan

No Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16


Produk Rokok

No Struk

Ke- C1 C2 C3

1 Struk 1

2 Struk 5

3 Struk 7

4 Struk 10

5 Struk 14

6 Struk 16

3.5 Perancangan Antarmuka Sistem

Pada perancangan antarmuka sistem ini akan dibahas bagaimana perancangan

flowchart sistem dan perancangan tampilan sistem.

3.5.1 Perancangan Flowchart Sistem

Flowchart sistem dibuat untuk menggambarkan bagaimana proses alur keseluruhan sistem

bekerja. Flowchart sistem dapat dilihat pada Gambar 3.2 berikut:

45

START

TENTUKAN

CENTROID

HITUNG JARAK OBJEK

DATA KE CENTROID

UPLOAD DATA STRUK

CLEANING DATA

KELOMPOKKAN OBJEK

DATA BERDASARKAN

JARAK MIINIMUN KE

CENTROID

END

INPUT JUMLAH

CLUSTER K

INPUT PER

PARAMETER

Gambar 3.2 Flowchart Sistem

46

3.5.2 Perancangan Tampilan Sistem

Perancangan tampilan digunakan untuk menggambarkan aplikasi yang sebenarnya.

Beberapa model tampilan implementasi dalam penelitian ini sebagai berikut :

1. Tampilan Praposes Data

Gambar 3.3 Tampilan Praposes Data

2. Tampilan Proses K-Means

Gambar 3.4 Tampilan Proses K-Means

CARI LOKASI DATASET

CARI KATEGORI DATASET

KATEGORI

DATASET

JUMLAH

PRODUK

TAMPILAN PRAPOSES DATA

TAMPILAN PROSES K-MEANS

TAMPILAN CLEANING DATA

BANYAK CLUSTER PILIH PARAMETER

TAMPILAN CLUSTER

PROSES

47

3. Tampilan Hasil

Gambar 3.5 Tampilan Hasil

4. Tampilan Sorting Kelompok

Gambar 3.6 Tampilan Sorting Kelompok

TAMPILAN HASIL

HASIL

PERHITUNGAN

CLUSTER

HASIL

PENGKLUSTERAN

TAMPILAN HASIL AKHIR

JUMLAH CLUSTER

HASIL PENGELOMPOKAN STRUK

48

BAB IV

HASIL DAN PEMBAHASAN

Pada bab ini akan dibahas hasil yang diperoleh dari pengujian yang telah dilakukan.

Data – data yang telah diperoleh, akan diolah untuk mendapatkan hasil pengelompokan merk

produk berdasarkan jenis produk yang dibeli dengan menggunakan algoritma K-Means.

Implementasi aplikasi pengelompokan merk produk dengan algoritma K-Means ini dibuat

menggunakan bahasa pemograman Visual Basic .Net. Pengujian kinerja sistem yang telah

dilakukan dengan menggunakan algoritma K-Means, yaitu penyelesaian clustering dengan

menghasilkan merk produk berdasarkan jenis produk pada cluster-nya.

4.1 Spesifikasi Sistem

Spesifikasi minimum sistem Hardware dan Software yang dibutuhkan untuk

menjalankan aplikasi sistem pengelompokan merk produk berdasarkan jenis produk dengan

menggunakan algoritma K-Means antara lain:

1. Hardware dan Software untuk pembuatan aplikasi :

a. Hardware :

1. Notebook Acer Intel Duel Core 2.66 HZ

2. Memory 1024 GB

b. Software :

1. Windows 7 Home Basic

2. Net Framework 4

3. DotnetBar 10.04

4.2 Implementasi Sistem

Inputan data berupa data struk yang berisi merk produk dari bulan Januari s/d

September tahun 2014. Sedangkan Output yang diperoleh berupa pengelompokan merk

produk berdasarkan jenis produknya.

49

4.2.1 Pengujian Sistem

A. Pengujian Menggunakan Parameter Produk Makanan Ringan

Dari hasil pengujian dengan menggunakan parameter Produk Makanan Ringan, maka

didapat gambaran sebagai berikut.

Gambar 4.1 Tampilan Proses K-Means Parameter


Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk makanan ringan

ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi

merk produk makanan ringan. Setelah penginputan cluster tahapan selanjutnya adalah

menentukan nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 6, nilai

centroid C2 = 5, dan nilai centroid C3 = 0. Sehingga nanti akan dilakukan penghitungan dari

masing-masing merk produk makanan ringan dengan nilai centroid yang didapatkan

menggunakan rumus jarak euclidean distance (jarak kedekatan antar data). Hasil dari

penghitungan jarak dengan menggunakan rumus euclidean distance ini akan berpengaruh

pada penempatan setiap merk produk makanan ringan ke cluster tertentu, yang nantinya akan

dapat dilihat hasilnya di interface hasil pengujian jenis produk makanan ringan.

50

Gambar 4.2 Tampilan Hasil Pengujian Parameter


Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan

jarak euclidean distance dari merk produk makanan ringan dengan centroid telah didapatkan

nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai

cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk

mengelompokkan merk produk makanan ringan, sehingga dapat diketahui pada cluster ke

berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat

dilihat di interface sorting kelompok berdasarkan jenis produk makanan ringan.

51

Gambar 4.3 Tampilan Hasil Sorting Kelompok Parameter


Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk

berdasarkan jenis produk makanan ringan yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk makanan ringan sebanyak 6 item yaitu

Salt Cheese, Hello Krupuk, Hello Stick Tahu, Butter Keju, Butter Coconut dan Yupi

Gumi.


oreo, gery salut, Nissin wafer, Fenesia wafer, dan Beng-beng.


Malkis Abon.

B. Pengujian Menggunakan Parameter Produk Minuman

Dari hasil pengujian dengan menggunakan parameter Produk Minuman, maka didapat

gambaran sebagai berikut.

52


Produk Minuman

Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk minuman ada

penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi

merk produk minuman. Setelah penginputan cluster tahapan selanjutnya adalah menentukan

nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 8, nilai centroid C2 = 3,

dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan penghitungan dari masing-masing

merk produk minuman dengan nilai centroid yang didapatkan menggunakan rumus jarak

euclidean distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan

menggunakan rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk

produk minuman ke cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface

hasil pengujian jenis produk minuman

53


Produk Minuman

Keterangan :


jarak euclidean distance dari merk produk minuman dengan centroid telah didapatkan nilai

masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai cluster

C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk mengelompokkan

merk produk minuman, sehingga dapat diketahui pada cluster ke berapa penempatan merk

produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat di interface sorting

kelompok berdasarkan jenis produk minuman.

54


Produk Minuman

Keterangan :


berdasarkan jenis produk minuman yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk minuman sebanyak 5 item yaitu Aqua

Botol, Pocari Sweat 900 ml, Pocari Sweat 500 ml, Sprite, dan Frestea.

2. Dalam cluster C2 terdapat jumlah merk produk minuman sebanyak 2 item yaitu Susu

Milo dan Zee Susu Bag.

3. Dalam cluster C3 terdapat jumlah merk produk minuman sebanyak 1 item yaitu

Energen.

C. Pengujian Menggunakan Parameter Produk Buah-buahan

Dari hasil pengujian dengan menggunakan parameter Produk Buah-buahan, maka


55


Produk Buah-buahan

Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk buah-buahan


merk produk buah-buahan. Setelah penginputan cluster tahapan selanjutnya adalah


centroid C2 = 16, dan nilai centroid C3 = 29. Sehingga nanti akan dilakukan penghitungan

dari masing-masing merk produk buah-buahan dengan nilai centroid yang didapatkan



pada penempatan setiap merk produk buah-buahan ke cluster tertentu, yang nantinya akan

dapat dilihat hasilnya di interface hasil pengujian jenis produk buah-buahan.

56


Produk Buah-buahan

Keterangan :


jarak euclidean distance dari merk produk buah-buahan dengan centroid telah didapatkan



mengelompokkan merk produk buah-buahan, sehingga dapat diketahui pada cluster ke berapa

penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat

di interface sorting kelompok berdasarkan jenis produk buah-buahan.

57


Produk Buah-buahan

Keterangan :


berdasarkan jenis produk buah-buahan yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk buah-buahan sebanyak 1 item yaitu

Melon.


Apel dan Kelengkeng.


Belimbing.

D. Pengujian Menggunakan Parameter Produk Perawatan

Dari hasil pengujian dengan menggunakan parameter Produk Perawatan, maka didapat


58


Produk Perawatan

Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk perawatan ada


merk produk perawatan. Setelah penginputan cluster tahapan selanjutnya adalah menentukan

nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 1, nilai centroid C2 = 3,

dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan penghitungan dari masing-masing

merk produk perawatan dengan nilai centroid yang didapatkan menggunakan rumus jarak

euclidean distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan

menggunakan rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk

produk perawatan ke cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface

hasil pengujian jenis produk perawatan.

59


Produk Perawatan

Keterangan :


jarak euclidean distance dari merk produk perawatan dengan centroid telah didapatkan nilai



merk produk perawatan, sehingga dapat diketahui penempatan pada cluster ke berapa merk


kelompok berdasarkan jenis produk perawatan.

60


Produk Perawatan

Keterangan :


berdasarkan jenis produk perawatan yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk perawatan sebanyak 1 item yaitu Master

Kids.

2. Dalam cluster C2 terdapat jumlah merk produk perawatan sebanyak 3 item yaitu

Pepsodent, Lux, dan Lifebuoy.

3. Dalam cluster C3 terdapat jumlah merk produk perawatan sebanyak 1 item yaitu

Handbody Marina.

E. Pengujian Menggunakan Parameter Produk Bahan Dapur

Dari hasil pengujian dengan menggunakan parameter Produk Bahan Dapur, maka


61


Produk Bahan Dapur

Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan dapur ada


merk produk bahan dapur. Setelah penginputan cluster tahapan selanjutnya adalah



masing-masing merk produk bahan dapur dengan nilai centroid yang didapatkan



pada penempatan setiap merk produk bahan dapur ke cluster tertentu, yang nantinya akan

dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan dapur.

62


Produk Bahan Dapur

Keterangan :


jarak euclidean distance dari merk produk bahan dapur dengan centroid telah didapatkan nilai



merk produk bahan dapur, sehingga dapat diketahui pada cluster ke berapa penempatan merk


kelompok berdasarkan jenis bahan dapur.

63


Produk Bahan Dapur

Keterangan :


berdasarkan jenis produk bahan dapur yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk bahan dapur sebanyak 3 item yaitu

Gula, Royco Bumbu Tempe, dan Royco Bumbu Ayam.

2. Dalam cluster C2 terdapat jumlah merk produk bahan dapur sebanyak 2 item yaitu ABC

Saos dan ABC Sambal.

3. Dalam cluster C3 terdapat jumlah merk produk bahan dapur sebanyak 1 item yaitu

Indomie Goreng.

F. Pengujian Menggunakan Parameter Produk Bahan Makanan

Dari hasil pengujian dengan menggunakan parameter Produk Bahan Makanan, maka


64

Gambar 4.16 Tampilan Proses K-Means Paramater


Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan makanan


merk produk bahan makanan. Setelah penginputan cluster tahapan selanjutnya adalah



masing-masing merk produk bahan dapur dengan nilai centroid yang didapatkan



pada penempatan setiap merk produk bahan makanan ke cluster tertentu, yang nantinya akan

dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan makanan.

65



Keterangan :


jarak euclidean distance dari merk produk bahan makanan dengan centroid telah didapatkan



mengelompokkan merk produk bahan makanan, sehingga dapat diketahui pada cluster ke

berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat

dilihat di interface sorting kelompok berdasarkan jenis bahan makanan.

66



Keterangan :


berdasarkan jenis produk bahan makanan yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk bahan makanan sebanyak 1 item yaitu

Cham Seafood.


Nugget.


Sarden.

G. Pengujian Menggunakan Parameter Produk Perlengkapan

Dari hasil pengujian dengan menggunakan parameter Produk Perlengkapan, maka


67


Produk Perlengkapan

Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan

perlengkapan ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang

didalamnya berisi merk produk bahan perlengkapan. Setelah penginputan cluster tahapan

selanjutnya adalah menentukan nilai centroid secara random, yaitu didapatkan nilai centroid

C1 = 4, nilai centroid C2 = 3, dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan

penghitungan dari masing-masing merk produk bahan perlengkapan dengan nilai centroid

yang didapatkan menggunakan rumus jarak euclidean distance (jarak kedekatan antar data).

Hasil dari penghitungan jarak dengan menggunakan rumus euclidean distance ini akan

berpengaruh pada penempatan setiap merk produk bahan perlengkapan ke cluster tertentu,

yang nantinya akan dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan

perlengkapan.

68


Produk Perlengkapan

Keterangan :


jarak euclidean distance dari merk produk bahan perlengkapan dengan centroid telah

didapatkan nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-

masing nilai cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum

untuk mengelompokkan merk produk bahan perlengkapan, sehingga dapat diketahui pada

cluster ke berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk

produk dapat dilihat di interface sorting kelompok berdasarkan jenis bahan perlengkapan.

69


Produk Perlengkapan

Keterangan :


berdasarkan jenis produk bahan perlengkapan yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk perlengkapan sebanyak 3 item yaitu

Laurier Maxi, Hers Protex, dan Tissue.


Molto dan Softener.


Kayu Putih.

H. Pengujian Menggunakan Parameter Produk Obat-obatan

Dari hasil pengujian dengan menggunakan parameter Produk Obat-obatan, maka


70


Produk Obat-obatan

Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk obat-obatan ada


merk produk obat-obatan. Setelah penginputan cluster tahapan selanjutnya adalah


centroid C2 = 23, dan nilai centroid C3 = 16. Sehingga nanti akan dilakukan penghitungan

dari masing-masing merk produk obat-obatan dengan nilai centroid yang didapatkan



pada penempatan setiap merk produk obat-obatan ke cluster tertentu, yang nantinya akan

dapat dilihat hasilnya di interface hasil pengujian jenis produk obat-obatan.

71


Produk Obat-obatan

Keterangan :


jarak euclidean distance dari merk produk obat-obatan dengan centroid telah didapatkan nilai



merk produk obat-obatan, sehingga dapat diketahui pada cluster ke berapa penempatan merk


kelompok berdasarkan jenis obat-obatan.

72


Produk Obat-obatan

Keterangan :


berdasarkan jenis produk obat-obatan yaitu sebagai berikut :


Antimo Cair.


Panadol.


Bodrex.

I. Pengujian Menggunakan Parameter Produk Rokok

Dari hasil pengujian dengan menggunakan parameter Produk Rokok, maka didapat


73


Produk Rokok

Keterangan :

Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk rokok ada


merk produk rokok. Setelah penginputan cluster tahapan selanjutnya adalah menentukan nilai

centroid secara random, yaitu didapatkan nilai centroid C1 = 3, nilai centroid C2 = 17, dan

nilai centroid C3 = 5. Sehingga nanti akan dilakukan penghitungan dari masing-masing merk

produk rokok dengan nilai centroid yang didapatkan menggunakan rumus jarak euclidean

distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan menggunakan

rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk produk rokok

cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface hasil pengujian jenis

produk rokok.

74


Produk Rokok

Keterangan :


jarak euclidean distance dari merk produk rokok dengan centroid telah didapatkan nilai



merk produk rokok, sehingga dapat diketahui pada cluster ke berapa penempatan merk


kelompok berdasarkan jenis rokok.

75


Produk Rokok

Keterangan :


berdasarkan jenis produk rokok yaitu sebagai berikut :

1. Dalam cluster C1 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Wismilak.

2. Dalam cluster C2 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Djarum.

3. Dalam cluster C3 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Promild

4.2.2 Hasil Clustering

Berdasarkan pengujian yang telah dilakukan dalam menentukan tata letak merk produk

berdasarkan jenis produknya di swalayan Larisso Ambulu-Jember, maka dapat diperoleh hasil

sebanyak 3 cluster yaitu cluster C1, cluster C2, dan cluster C3. Dan dari masing-masing merk

produk berdasarkan jenis produknya nantinya akan menempati cluster yang telah ditentukan.

Dan untuk lebih jelasnya, hasil clustering merk produk berdasarkan jenis produknya akan

disajikan pada tabel 4.1 berikut ini :

76

Tabel 4.1 Hasil Clustering

JENIS PRODUK CLUSTER C1 CLUSTER C2 CLUSTER C3

Makanan Ringan

Salt Cheese Oreo Malkis Abon

Hello Krupuk Gery Salut

Hello Stick Tahu Nissin Wafer

Butter Keju Fenesia Wafer

Butter Coconut Beng-beng

Yupi Gumi

Minuman

Aqua Botol Susu Milo Energen

Pocari Sweat 900 ml Zee Susu Bag

Pocari Sweat 300 ml

Sprite

Frestea

Buah-Buahan Melon Apel Belimbing

Kelengkeng

Perawatan

Master Kids Pepsodent Handbody Marina

Lux

Lifebuoy

Bahan Dapur

Gula ABC Saos Indomie Goreng

Royco Bumbu Tempe ABC Sambal

Royco Bumbu Ayam

Bahan Makanan Champ Seafood Nugget Sarden

Perlengkapan

Laurier Maxi Molto Kayu Putih

Hers Protex Softener

Tissue

Obat-obatan Antimo Cair Panadol Bodrex

Rokok Wismilak Djarum Promild

77

4.2.3 Denah Tata Letak Awal dan Setelah Clustering

A. Tata Letak Awal Produk

Gambar 4.28 Denah Tata Letak Awal Produk

Keterangan :

Dari gambar diatas dapat di peroleh gambaran tata letak awal di Swalayan Larisso Ambulu-

Jember yaitu sebagai berikut :

1. Di dalam Rak 1 berisi semua jenis produk makanan ringan dan minuman.

2. Di dalam Rak 2 berisi semua jenis produk obat-obatan dan rokok.

3. Di dalam Rak 3 berisi semua jenis produk bahan dapur dan bahan makanan.

4. Di dalam Rak 4 berisi semua jenis produk perlengkapan dan perawatan.

5. Di dalam Rak 5 berisi semua jenis produk buah-buahan.

B. Tata Letak Merk Produk Setelah Clustering

Rak 1

Makanan Ringan

Minuman

Cluster C1

Merk Produk :

Salt Cheese, Hello Krupuk Tahu, Hello Stick

Tahu, Butter Keju, Butter Coconut, Yupi

Gumi

Cluster C2

Merk Produk :

Oreo, Gery Salut, Nissin Wafer, Fenesia

Wafer, Beng-beng

Cluster C3

Merk Produk :

Malkis Abon

Rak 2

Obat-obatan

Rokok

Rak 3

Bahan Dapur

Bahan Makanan

Rak 4

Perlengkapan

Perawatan

Rak 5

Buah-buahan

Jenis Produk :

Makanan Ringan

78

Jenis Produk :

Minuman

Cluster C1

Merk Produk :

Aqua Botol, Pocari Sweat 900 ml, Pocari

Sweat 300 ml, Sprite, Frestea

Cluster C2

Merk Produk :

Susu Milo, Zee Susu Bag

Cluster C3

Merk Produk :

Energen

Jenis Produk :

Buah-buahan

Cluster C1

Merk Produk :

Melon

Cluster C2

Merk Produk :

Apel, Kelengkeng

Cluster C3

Merk Produk :

Belimbing

Jenis Produk :

Perawatan

Cluster C1

Merk Produk :

Master Kids

Cluster C2

Merk Produk :

Pepsodent, Lux, Lifebuoy

Cluster C3

Merk Produk :

Handbody Marina

Jenis Produk :

Bahan Dapur

Cluster C1

Merk Produk :

Gula, Royco Bumbu Tempe, Royco Bumbu

Ayam

Cluster C2

Merk Produk :

ABC Saos, ABC Sambal

Cluster C3

Merk Produk :

Indomie Goreng

Handbody Marina

79

Gambar 4. 29 Denah Tata Letak Merk Produk Setelah Clustering

Jenis Produk :

Bahan Makanan

Cluster C1

Merk Produk :

Champ Seafood

Cluster C2

Merk Produk :

Nugget

Cluster C3

Merk Produk :

Sarden

Jenis Produk :

Perlengkapan

Cluster C1

Merk Produk :

Laurier Maxi, Hers Protex, Tissue

Cluster C2

Merk Produk :

Molto, Softener

Cluster C3

Merk Produk :

Kayu Putih

Jenis Produk :

Obat-obatan

Cluster C1

Merk Produk :

Antimo Cair

Cluster C2

Merk Produk :

Panadol

Cluster C3

Merk Produk :

Bodrex

Jenis Produk :

Rokok

Cluster C1

Merk Produk :

Wismilak

Cluster C2

Merk Produk :

Djarum

Cluster C3

Merk Produk :

Promild

80

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan Uraian dari bab – bab sebelumnya dan pengujian yang telah dilakukan

maka dapat diambil kesimpulan sebagai berikut :

1. Dengan menerapkan algoritma K-Means Clustering didapatkan sebuah model tata letak

merk produk berdasarkan jenis produk di Swalayan Larisso Ambulu-Jember, sehingga

dapat memudahkan konsumen dalam menemukan merk produk yang akan dibelinya.

2. Penentuan tata letak merk produk berdasarkan jenis produknya terbagi menjadi 3 cluster,

yaitu cluster C1, cluster C2, dan cluster C3, yang telah dilakukan penghitungan dengan

menggunakan algoritma K-Mens Clustering, sehingga dapat diketahui pada cluster ke

berapa penempatan merk produk berdasarkan jenis produknya di Swalayan Larisso

Ambulu-Jember.

5.2 Saran

Mengingat masih banyaknya hal-hal yang belum dapat diimplementasikan pada

penelitian ini, maka penulis mempertimbangkan beberapa saran untuk perbaikan dalam

skripsi ini, yaitu :

1. Untuk mendapatkan hasil yang lebih variatif penelitian ini dapat juga dikembangkan

dengan teknik data mining yang lain seperti algoritma Hierarchical Clustering,

algoritma K-Nearest Neighbor atau algoritma Fuzzy Clustering.

2. Untuk mendapatkan akurasi nilai yang lebih akurat, dapat digunakan algoritma K-

Nearest Neighbor. Karena algoritma ini memiliki keakuratan yang lebih tinggi

dibandingkan dengan algoritma K-Means

81

DAFTAR PUSTAKA

Asri, Marwan. Marketing, Edisi 2. Yogyakarta : AMP YKPN, 1991.

Agusta, Y. 2007. K-means penerapan, permasalahan dan metode terkait. Jurnal Sistem dan

Informatika Vol.3 : 47-60.

Dubes, R. C. & Jain, A. K. 1988. Algorithms For Clustering Data. New Jersey: Prentice

Hall

Fayyad, U. M. 1996. Advances In Knowledge Discovery and Data Mining. Camberidge.

MA: The MIT Press.

Hammouda, K. & Karray, F. 2003. A Comparative Study of Data Clustering Techniques.

Canada: University of Waterloo.

Han, J. and Kamber, M, 2006. Data Mining Concepts and Techniques Second Edition.

Morgan Kauffman, San Francisco.

http://analisis-proses-bisnis-koperasi.blogspot.com/2013/04/pengertian-data-mining-text-

mining-dan.html (diakses tanggal 27 maret 2014)

http://frestiaannurjanah.blogspot.com/2013/01/tata-letak-proses-produk.html (diakses tanggal

19 Desember 2014)

http://pojokambulu.wordpress.com/2012/08/05/ambulu-jember/ (diakses tanggal 19 Desember

2014 )

http://romisatriawahono.net/2012/08/07/kiat-menyusun-kerangka-pemikiran-penelitian/

(diakses tanggal 20 Desember 2014)

http://yudiagusta.wordpress.com/clustering/ (diakses tanggal 27 maret 2014)

Kusrini & Luthfi, E. T. 2009. Algoritma Data Mining. Yogyakarta: Andi.

Larose, D. T. 2005. Discovering Knowledge In Data: An Introduction To Data Mining. Jhon

Willey & Sons, Inc.

MacQueen, J.B. 1967. Some Methods For Classification and Analysis of Multivariate

Observations. 5-th Berkeley Symposium on Mathematical Statistics and Probability.

Berkeley, University of California Press. (pp. 1:281-297).

Moertini, V. S. 2002. Data mining sebagai solusi bisnis. Integral, vol 7 no.1. 87

Piatetsky, G. & Shapiro. 2006. An Introduction Machine Learning, data mining, and

Knowledge discovery, Course in data mining Kdnuggets.

Ponniah, P. 2001. Datawarehouse Fundamentals: A Comprehensive Guide For IT

http://frestiaannurjanah.blogspot.com/2013/01/tata-letak-proses-produk.html

http://pojokambulu.wordpress.com/2012/08/05/ambulu-jember/%20(diakses

http://romisatriawahono.net/2012/08/07/kiat-menyusun-kerangka-pemikiran-penelitian/

http://yudiagusta.wordpress.com/clustering/

82

Professional. Jhon Willey & Sons, Inc.

roinahsmart.blogspot.com/2012/11/pengertian-microsoft-visual-basic-net.html

(diakses tanggal 27 maret 2014)

RuiXu & Donald, C.W. 2009. Clustering. John Wiley & Sons, Inc.

Santosa, B. 2007. Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis.

Yogyakarta:Graha Ilmu.

.

83

Biodata Penulis

NIM : 1210652018

Nama : Indri Dwi Rukmana

Judul TA : IMPLEMENTASI ALGORITMA

K-MEANS CLUSTERING UNTUK MENENTUKAN TATA

LETAK MERK PRODUK BERDASARKAN JENIS PRODUK

DI SWALAYAN LARISSO AMBULU - JEMBER

Tempat Lahir : Jember

Tanggal Lahir : 27/06/1989

Jenis Kelamin : Perempuan

Alamat : Perum Bumi Ambulu Permai Blok AA.4 Ambulu

No. Telepon : 085236131539

Angkatan : 2012

Fakultas : Teknik

Jurusan : S1-Teknik Informatika

Dosen Pembimbing I : Daryanto S.Kom.,M.Kom

Dosen Pembimbing II : Lutfi Ali Muharom, S.Si

tugas akhir implementasi algoritma k-means...

Documents