penerapan algoritma frequent pattern growth untuk ......penerapan algoritma frequent pattern growth...

Penerapan Algoritma Frequent Pattern Growth Untuk Menganalisis

Pola Pembelian Konsumen

Artikel Ilmiah

Peneliti:

Dita Dwi Sapitri (672015167)

Hindriyanto Dwi Purnomo , S.T., MIT., Ph.D.

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Salatiga

2018

1

Penerapan Algoritma Frequent Pattern Growth Untuk Menganalisis

Pola Pembelian Konsumen

Artikel Ilmiah

Diajukan kepada


untuk memperoleh Gelar Sarjana Komputer

Peneliti:

Dita Dwi Sapitri (672015167)

Hindriyanto Dwi Purnomo , S.T., MIT., Ph.D.

Program Studi Teknik Informatika


Universitas Kristen Satya Wacana

Salatiga

2018

1

1. Latar Belakang Masalah

Dalam menghadapi persaingan bisnis yang tumbuh dengan pesat, kemampuan

dalam mempertahankan dan mengembangkan eksistensi suatu bisnis menjadi hal

yang sangat penting yang harus diperhatikan oleh setiap pelaku bisnis. Para pelaku

bisnis harus memiliki pandangan kedepan dalam menentukan langkahnya dan

bagaimana usaha untuk mencapainya. Banyak permasalahan yang sering dihadapi

oleh para pelaku bisnis, seperti kurangnya persediaan produk, adanya produk yang

tidak laku terjual dan masih banyak lagi. Jika jumlah persedian produk kurang dapat

menyebabkan permintaan tidak dapat terpenuhi sehingga mengakibatkan konsumen

kecewa dan dapat membuat konsumen tidak akan kembali lagi. Begitu pula jika

terdapat produk yang tidak laku terjual maka akan menyebabkan kerugian dan harus

menyediakan tempat untuk menyimpan produk yang tidak laku terjual. Berdasarkan

permasalahan yang ada, diperlukan usaha untuk meminimalisir terjadinya masalah

tersebut. Salah satu usaha yang dapat dilakukan adalah mengolah data yang ada

sebagai sumber informasi yang digunakan untuk memperoleh pengetahuan dan

pengambilan keputusan. Tanpa pengolahan data, para pelaku bisnis akan menghadapi

kesulitan untuk menjual barang yang diinginkan oleh konsumen. Dengan pelaku

bisnis memanfaatkan data yang ada, dari hasil pengolahan data tersebut dapat

digunakan para pelaku bisnis untuk menyusun strategi penjualan sehingga dapat

mendongkrak barang yang tidak laku supaya menjadi laku terjual dan meningkatkan

persediaan barang yang paling sering di beli.

Salah satu cara pengolahan data sebagai sumber informasi adalah dengan

meggunakan teknologi yaitu Data Mining. Teknologi data mining adalah proses

mencari pola atau informasi menarik dalam data terpilih menggunakan teknik atau

metode tertentu [1]. Tujuan dari data mining yaitu untuk menemukan hubungan atau

pola-pola yang memberikan manfaat pada pelaku bisnis. Data mining menggunakan

pendekatan discovery based yaitu dimana pencocokan pola (pattern-matching) dan

algoritma digunakan untuk menemukan relasi-relasi kunci didalam data yang

dieksplorasi.

Association rule adalah teknik data mining untuk menemukan aturan asosiasi

antara suatu kombinasi item[2]. Association rule merupakan salah satu metode yang

bertujuan mencari pola yang sering muncul di antara banyak transaksi, dimana setiap

transaksi terdiri dari beberapa item [3]. Pada metode ini memiliki beberapa algoritma,

salah satunya adalah Algoritma Frequent Pattern-Growth (FP-Growth). FP-Growth

merupakan salah satu alternatif algoritma yang dapat digunakan untuk menentukan

himpunan data yang paling sering muncul (frequent itemset) dalam sekumpulan data

[4]. Algoritma FP-Growth merupakan algoritma yang sangat efisien dalam pencarian

frequent itemset. FP-Growth menggunakan pendekatan yang berbeda dari algoritma

yang selama ini sering digunakan yaitu algoritma apriori. Algoritma ini menyimpan

informasi mengenai frequent itemset dalam bentuk FP-Tree. Pada FP-Tree yang

terbentuk dapat memanfaatkan data transaksi yang memiliki item yang sama sehingga

2

dapat mengurangi scan database secara berulang dalam proses mining dan dapat

berlangsung lebih cepat [5].

Pada Toko Mainan Ananda memiliki beberapa transaksi penjualan barang yang

terus bertambah dan data - data transaksi penjualan pada toko tersebut hanya

disimpan untuk pembukuan dan belum diketahui manfaat data - data tersebut untuk

hal lainnya. Oleh karena itu diperlukan sebuah algoritma untuk menfaatkan data-data

yang sudah ada menjadi sebuah informasi dan informasi yang didapat akan digunakan

untuk pengambilan suatu keputusan.

Penelitian ini bertujuan untuk menganalisis pola pembelian barang yang sering

di beli menggunakan Algoritma FP-Growth untuk merancang bagaimana strategi

penjualan yang baik di Toko Mainan Ananda.

2. Tinjauan Pustaka

Penelitian yang menggunakan Algoritma FP-Growth sudah banyak di lakukan.

Seperti penilitian yang dilakukan oleh Ali, Dicky dan Sriani pada tahun 2015 yang

menerapkan Algoritma FP-Growth menggunakan konsep pembangunan FP-Tree

dalam mencari Frequent Itemset untuk menemukan data variabel yang akan dijadikan

stretegi dalam promosi pendidikan pada Perguruan Tinggi. Dengan proses

pembentukan FP-Tree dari penelitian ini menghasilkan rule dari data sampel

mahasiswa baru. Penentuan data variabel sangat menentukan tingkat akurasi FP-

Growth yang dibuat dan besarnya presentase dalam menentukan minimum support

dan minimum confidence. Minimun support dan minimum confidence diguanakan

unruk mencari frequent itemset yang saling berhubungan untuk menemukan data

variabel yang akan dijadikan stretegi dalam promosi pendidikan. Adapun Informasi

yang berkaitan dengan pelaksanaan promosi dapat tersedia dengan cepat. Contohnya

dalam pemilihan tempat yang akan dijadikan promosi pendidikan sehingga pihak

manajemen dari kampus sendiri dapat melakukan pengambilan keputusan dengan

cepat [6].

Penelitian yang dilakukan oleh Asrul Abdullah pada tahun 2018 menerapkan

metode FP-Growth untuk menyusun rekomendasi paket produk untuk meningkatkan

penjualan. Pokok permasalahan didalam penelitian ini adalah kesulitan penjual untuk

menentukan paket produk yang akan ditawarkan kepada konsumen. Sebelum

melakukan proses perhitungan dengan menggunakan metode FP-Growth, data

transaksi penjualan minimarket XYZ harus dilakukan pra-proses berupa mengisi

missing value. Kemudian dilakukan transformasi data. Peneliti mengembangkan

aplikasi berbasis desktop untuk memberikan rekomendasi yang tepat bagi para

penjual atau para penentu keputusan. Penentuan rekomendasi paket produk dihitung

berdasarkan tingkat frekuensi item yang dibeli oleh konsumen dengan

memperhatikan minimum support yang telah ditetapkan. Hasil dari penelitian ini

adalah ditemukan dua pasangan item barang yaitu kopi, gula dan teh, susu yang

memiliki support sebesar 30% dan confidence sebesar 70%. Dari hasil yang didapat

yaitu dua pasangan item tersebut bisa direkomendasikan untuk dijual secara bersama-

sama[7].

3

Ririanti (2014) menyajikan penelitian dengan mengimplementasikan algoritma

FP-Growth pada aplikasi prediksi persediaan sepeda motor dengan memanfaatkan

data laporan penjualan PT. Pilar Deli Labumas. Dengan memanfaatkan laporan

penjualan yang ada, peneliti dapat memprediksi banyaknya persediaan sepeda motor

yang harus disediakan kedepannya berdasarkan banyaknya sepeda motor yang terjual.

Peneliti melakukan implementasi algoritma FP-Growth pada aplikasi persediaan

sepeda motor dengan melihat dari banyaknya item yang dijual, kemudian membuat

rangkaian tree dengan fp-tree untuk mengetahui banyaknya frequent itemset yang

terjadi. Dari frequent itemset yang didapat maka dapat dihitung nilai Support dan

Confidence nya. Hasil dari penelitian ini adalah sebuah sistem prediksi persediaan

motor. Dengan menginputkan data-data penjualan seperti jenis sepeda motor, warna

sepeda motor, jenis roda sepeda motor, banyak penjualan perbulan nya dan

persediaan awalannya kemudian menginputkan minimum support count nya maka

akan menghasilkan informasi banyaknya jumlah persediaan sepeda motor. Informasi

yang diperoleh dapat digunakan untuk mengambil sebuah keputusan untuk

menentukan persediaan sepeda motor yang ada di PT. Pilar Deli Labumas [8].

Dalam penelitian ini dilakukan analisis pola pembelian konsumen

menggunakan Algoritma FP-Growth untuk merancang bagaimana strategi penjualan

yang baik di Toko Mainan Ananda. Algoritma FP-Growth dipilih karena dalam

mendapatkan frequent itemsets tidak memerlukan waktu yang lama sehingga waktu

yang yang dibutuhkan menjadi relatif singkat dan efisien. Manfaat dari penelitian

yang dilakukan adalah memberikan solusi dalam hal merancang strategi untuk

meningkatkan pendapatan di Toko Mainan Ananda.

Data Mining adalah kegiatan yang meliputi pengumpulan, pemakaian data

historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran

besar [9]. Berdasarkan tugas yang dapat dilakukan, data mining dibagi menjadi

beberapa kelompok yaitu [10] :

1. Deskripsi

Terkadang peniliti dan analis secara sederhana ingin mencoba mencari cara

untuk menggambarkan pola dan kecenderungan yang terdapat dalam data.

Sebagai contoh: petugas pengumpulan suara mungkin tidak dapat

menemukan keterangan atau fakta bahwa siapa yang tidak cukup

professional akan sedikit didukung dalam pemilihan presiden. Deskripsi

dari pola dan kecenderungan sering memberikan kemungkinan penjelasan

untuk suatu pola atau kecenderungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi

lebih ke arah numerik daripada ke arah kategori. Model dibangun

menggunakan record lengkap yang menyediakan nilai dari variabel target

sebagai nilai prediksi. Selanjutnya pada peninjauan berikutnya, estimasi

nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai

contoh: estimasi nilai indeks prestasi kumulatif mahasiswa program

4

pascasarjana dengan melihat nilai indeks prestasi mahasiswa tersebut pada

saat mengikuti program sarjana.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam

prediksi nilai dari hasil akan ada di masa mendatang. Contoh lain klasifikasi

dalam bisnis dan penelitian adalah :

Prediksi harga beras dalam tiga bulan yang akan datang.

Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika

batas bawah kecepatan dinaikkan.

Beberapa metode dan teknik yang akan digunakan dalan klasifikasi dan

estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori. Contoh: penggolongan

pendapatan, dapat dipisahkan dalam 3 kategori yaitu pendapatan tinggi,

pendapatan sedang dan pendapatan rendah.

5. Pengklusteran

Pengklusteran merupakan pengelompokkan record, pengamatan atau

memperhatikan dan membentuk kelas obyek-obyek yang memiliki

kemiripan. Kluster adalah kumpulan dari record yang memiliki kemiripan

satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-

record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu

tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak

mencoba untuk melakukan klasifikasi, mengestimasi atau memprediksi niali

dari variabel target. Akan tetapi algoritma pengklusteran mencoba untuk

melakukan pembagian terhadap keseluruhan data menjadi kelompok-

kelompok yang memiliki kemiripan (homogen), yang mana kemiripan

record dalam satu kelompok akan bernilai maksimal sedangkan kemiripan

dengan record dalam kelompok lain akan bernilai minimal. Contoh

pengklusteran dalam bisnis dan penelitian adalah:

Mendapatkan kelompok-kelompok konsumen untuk target pemasaran

dari suatu produk nagi perusahaan yang tidak memiliki dana

pemasaran yang besar.

Untuk tujuan audit akuntasi, yaitu melakukan pemisahan terhadap

perilaku financial dalam baik dan mencurigakan.

Melakukan pengklusteran terhadap ekspresi dari gen, untuk

mendapatkan kemiripan perilaku dari gen dalam jumlah besar.

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul

dalam satu waktu. Dalam dunia bisnis lebih umum disebut sebagai analisis

keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah:

5

Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler

yang diharapkan untuk memberikan respon positif terhadap penawan

upgrade layanan yang diberikan.

Menemukan barang dalam supermarket yang dibeli secara bersamaan

dan barang yang tidak pernah dibeli secara bersamaan.

Association rule adalah teknik data mining untuk menemukan aturan asosiasi

antara suatu kombinasi item [11]. Association rule merupakan salah satu metode yang

bertujuan mencari pola yang sering muncul di antara banyak transaksi, dimana setiap

transaksi terdiri dari beberapa item [4]. Dalam analisa asosiasi mempunyai

metodologi dasar yang terbagi menjadi dua tahap yaitu [2]:

a. Analisa Pola Frekuensi Tinggi

Pada tahap ini untuk mencari kombinasi item yang memenuhi syarat

minimum dari nilai support dalam database.

b. Pembentukan Aturan Asosiasi

Setelah semua pola frekuensi tinggi ditemukan, kemudian di cari aturan

asosiasi yang memenuhi syarat minimum untuk confidence.

Algoritma Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif

algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering

muncul (frequent itemset) dalam sebuah kumpulan data [12]. Penggalian itemset yang

frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara

membangkitkan struktur data tree (FP-Tree). Metode FP-Growth dapat dibagi

menjadi 3 tahapan utama yaitu sebagai berikut [11]:

a. Tahap pembangkitan Conditional Pattern Base

Conditional Pattern Base merupakan subdatabase yang berisi lintasan

prefix dan suffix pattern. Pembangkitan conditional pattern base

didapatkan melalui FP-Tree yang telah dibangun sebelumnya.

b. Tahap pembangkitan Conditional FP-Tree

Support count dari setiap item pada setiap conditional pattern base

dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih

besar sama dengan minimum support count ξ akan dibangkitkan dengan

conditional FP-Tree.

c. Tahap pencarian Frequent Itemset

Apabila Conditional FP-Tree merupakan lintasan tunggal, maka

didapatkan frequent itemset dengan melakukan kombinasi item untuk

setiap conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan

pembangkitan FP-Growth secara rekursif.

3. Penerapan Algoritma FP-Growth

Untuk menganalisis pola pembelian konsumen di Toko Mainan Ananda

menggunakan algoritma FP-Growth yang diawali dengan pembentukan FP-Tree dari

transaksi pembelian. FP-Growth dipilih karena merupakan perkembangan terhadap

6

algoritma apriori, dimana terdapat perbedaan dalam scanning database. FP-Growth

lebih memberikan keuntungan karena hanya dilakukan satu atau dua kali saja

scanning database sedangkan algoritma Apriori perlu melakukan scanning database

berulang-ulang sehingga cenderung memakan waktu lebih lama.

Data yang digunakan pada penelitian ini adalah data transaksi yang terdiri dari

1158 transaksi selama 3 bulan yaitu bulan April 2018, Mei 2018 dan Juni 2018. Data

transaksi Toko Mainan Ananda seperti yang terlihat pada Tabel 1.

Tabel 1 Data Transaksi Toko Mainan Ananda

Sebelum proses data mining dimulai, dilakukan proses preprocessing sehingga

di dapatkan dataset seperti pada Tabel 2.

Tabel 2 Dataset yang dihasilkan setelah melalui Preprocessing

Dari dataset yang diperoleh setelah tahap preprocessing pada tabel 2, kemudian

selanjutnya menentukan frekuensi setiap item dari keseluruhan transaksi.

Tanggal ID Transaksi Transaksi Jumlah Harga

01/04/2018 0001 110 1 Rp. 30.000

01/04/2018 0001 213 1 Rp. 60.000

01/04/2018 0001 197 1 Rp. 11.000

01/04/2018 0002 140 1 Rp. 17.000

01/04/2018 0002 085 1 Rp. 40.000

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

30/06/2018 1158 073 1 Rp 60.000

30/06/2018 1158 171 1 Rp. 18.000

ID Transaksi Transaksi

0001 110, 213, 197

0002 140, 085

0003 034, 090

0004 001

0005 033, 061

. . . . . .

. . . . . .

1158 073, 171

7

Tabel 3 Frekuensi semua item barang untuk semua transaksi

Data yang sudah melalui proses preprocessing kemudian dilakukan proses

pengubahan data kedalam bentuk tabular. Data dirubah ke dalam bentuk tabular agar

dapat diproses di algoritma FP-Growth.

Tabel 4 Data dirubah ke format tabular

ID Transaksi 001 002 003 004 005 . . . . . . 241

0001 0 0 0 0 0 . . . . . . 0

0002 0 0 0 0 0 . . . . . . 0

0003 0 0 0 0 0 . . . . . . 0

0004 1 0 0 0 0 . . . . . . 0

0005 0 0 0 0 0 . . . . . . 0

. . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

1158 0 0 0 0 0 . . . . . . 0

Setelah data dirubah kedalam bentuk tabular seperti yang tertera di tabel 4,

kemudian data di implementasikan ke dalam algoritma FP-Growth.

Dalam menentukan suatu aturan asosiasi, terdapat suatu ukuran ketertarikan

(interestingness measure) yang didapatkan dari hasil pengolahan data dengan data

perhitungan tertentu. Pada umumnya terdapat dua ukuran ketertarikan dalam aturan

asosiasi, yaitu [12] :

a. Support adalah probabilitas konsumen membeli beberapa produk secara

bersamaan dari jumlah seluruh transaksi (misal dari keseluruhan transaksi

yang ada, seberapa besar tingkat dominasi yang menunjukkan bahwa item

A dan B dibeli bersamaan). Support merupakan kemungkinan A dan B

muncul bersamaan yang dinotasikan:

Support (A→B) = ( 1 )

b. Confidence merupakan probabilitas kejadian beberapa produk yang dibeli

bersamaan dimana salah satu produk sudah pasti dibeli (misal, seberapa

ID Barang Frekuensi

001 12

002 0

003 0

004 6

005 8

. . . . . .

. . . . . .

241 6

8

sering item B dibeli apabila konsumen membeli item A). Confidence

merupakan kemungkinan munculnya B ketika A juga muncul, dinotasikan:

Confidence (A→B) = ( 2 )

Setelah frekuensi setiap item diperoleh, dilakukan filter pada data yang

memiliki support diatas minimum support yang telah ditentukan yaitu 0.01. Jika

frekuensi item tidak kurang dari support count, maka item tersebut akan dihapus dan

tidak dipakai dalam proses data mining. Seperti yang tertera pada tabel 4 merupakan

hasil perhitungan dataset dengan item yang memenuhi minimum support yang telah

ditentukan dan diurutkan berdasarkan jumlah frekuensi terbanyak.

Tabel 5 Frekuensi item dengan minimum support ≥ 0,01

Dari Tabel 5 diatas, jumlah item yang memenuhi minimum support adalah 78

item. Setelah di dapatkan hasil item yang memiliki nilai support count lebih dari

nilai minimum support yang ditentukan, maka dari data transaksi awal dapat di filter

dengan menghilangkan item yang tidak memenuhi minimum support dan

mengurutkan susunan item berdasarkan pada Tabel 5. Seperti yang tertera pada Tabel

6 merupakan data transaksi yang didapat dari hasil filter.

Tabel 6 Transaksi yang telah diurutkan sesuai frekuensi item

ID Barang Nama Barang Frekuensi Nilai Support

085 Racing_Car_Tamiya 68 0.06

061 Gitar_Ding_Dong_Polos 34 0.03

009 RC_Racer_Car 32 0.03

177 Papan_Tulis_Magnet 29 0.03

088 Super Car Set 28 0.03

. . . . . . . . . . . .

. . . . . . . . . . . .

193 Masak – Masakan Set + Stroller 11 0.01

ID Transaksi ID Barang

0001 110, 213, 197

0002 085,140

0003 034,090

0004 001

0005 061,033

. . . . . .

. . . . . .

1158 073, 171

9

Dari hasil data yang terdapat pada Tabel 3, diambil sample data berjumlah 5

item yang akan digunakan untuk contoh pembuatan FP-Tree. Dari Table 5 yaitu

daftar transaksi yang telah diurutkan sesuai frekuensi item akan menjadi acuan dalam

membangun FP-Tree.

Gambar 1 Hasil Pembentukan FP-Tree dari 5 sample item

Hasil pengambilan sample 5 item yang terdapat dari Tabel 3 kemudian dengan

seluruh transaksi yang terdapat di Tabel 4 di bentuk satu persatu FP-Tree sampai

selesai sehingga menjadi FP-Tree seperti yang tertera pada Gambar 1.

Setelah pembuatan FP-Tree selesai, algoritma FP-Growth mencari semua

subsets yang memungkinkan dengan cara membangkitkan conditional FP-Tree dan

mencari frequent itemset. Dalam mencari frequent itemset, algoritma FP-Growth

menggunakan struktur data yang didapatkan dari perluasan FP-Tree. Dari FP-Tree

didapatkan hasil extract frequent itemset menggunakan prinsip divide dan conquer

yang memecah masalah menjadi sub-sub masalah sehingga permasalahan tersebut

lebih efisien dan akses memori lebih cepat [13]. Metode FP-Growth dapat dibagi

menjadi 3 tahapan utama yaitu [11]:

1. Tahap pembangkitan conditional pattern base

Pada tahap pembangkitan conditional pattern base dilakukan scan pada

FP-Tree dengan awalan path dari bawah ke atas. Contohnya untuk item

177 seperti yang tertera pada Gambar 4 .

10

Gambar 2 FP-Tree yang diakhiri item 177

Dari FP-Tree yang berakhir dengan item 177 berdasarkan yang tertera pada

Tabel 5 dapat diambil sebagai conditional pattern base.

Tabel 7 Conditional Pattern Base

2. Tahap pembangkitan conditional FP-Tree

Pada tahap ini, support count dari setiap item pada setiap conditional

pattern base di jumlahkan, lalu setiap item yang memiliki jumlah support

count lebih besar sama dengan minimum support count akan dibangkitkan

dengan conditional FP-Tree.

Dari Gambar 2 untuk menentukan conditional FP-Tree, langkah pertama

adalah menghapus item 177 dan menghitung ulang support count seperti

Gambar 3.

Gambar 3 FP-Tree setelah item 177 dihilangkan

Selanjutnya menghilangkan item yang memiliki support count tidak

memenuhui minimum support seperti pada Gambar 3 item 061 hanya

memiliki 1 kali kemunculan bersama item 177 sehingga dapat dihilangkan

Id Barang Conditional Pattern Base

177 {085:57}, {085,061:1}, {085,185:6}

11

dan menghasilkan conditional FP-Tree pada seperti pada Tabel 7. Untuk

item yang lain dapat menggunakan cara yang sama untuk menentukan

conditional pattern base dan conditional FP-Tree seperti contoh

sebelumnya. Tabel 8 Conditional Pattern Base

3. Tahap pencarian frequent itemset

Pada tahap ini, apabila Conditional FP-Tree merupakan single path maka

akan didapatkan frequent itemsets dengan melakukan kombinasi item

untuk setiap Conditional FP-Tree. Jika bukan single path maka akan

dilakukan pembangkitan FP-Growth secara rekursif [14]. Adapun

algoritma FP-Growth ditunjukkan pada Gambar 4.

Input: FP-tree Tree

Output: Rt sekumpulan lengkap pola frequent

Method: FP-growth (Tree,null)

Procedure: FP-growth (Tree,α)

{

01:if Tree mengandung single path P;

02:then untuk tiap kombinasi (dinotasikan β) dari node-

node dalam path P do

03:bangkitkan pola β α dengan support = minimum support

dari node-node dalam β;

04:else untuk tiap ai dalam header dari Tree do {

05:bangkitkan pola

06:bangun β= ai α dengan support = ai . support

07:if Tree β=

08:then panggil FP-growth (Tree, β) }

} Gambar 4 Pseudocode dari Algoritma FP-Growth [14].

Dari algoritma yang ada pada gambar 4, kemudian dilakukan pencarian

frequent itemset. Hasil frequent itemset dari data keseluruhan seperti pada

Tabel 9. Tabel 9 Hasil Frequent Itemsets

ID Barang Frequent Item Sets

085 {085}

061 {061}

009 {009}

177 {177}, {177,085}, {177,185}

088 {088}

. . . . . .

. . . . . .

193 {193},{193,098}

Id Barang Conditional FP-Tree

177 {085,185:6}

12

Dari hasil frequent itemset seperti yang tertera pada tabel 9 akan digunakan

untuk menemukan Association rule untuk mencari keterkaitan antar

barang.

Dalam menemukan Association rule parameter yang harus diperhatikan

adalah support dan confidence. Nilai minimum support pada penelitian ini

adalah 0.01 dan item pada dataset yang memenuhi minimum support telah

tertera pada tabel 5. Item yang memenuhi minimum support akan

dikombinasikan menjadi 2 item dengan nilai minimum support yang sama.

Dari hasil tabel 5, terdapat 78 item yang memenuhi minimum support.

Mencari nilai support 2 item dengan menggunakan persamaan rumus 1

dengan jumlah transaksi yang mengandung A dan B dibagi dengan total

transaksi yang ada pada dataset. Transaksi yang mengandung Mainan

Pedang dan Ultraman Topeng berjumlah 9 sedangkan total transaksi 1158,

maka 9/1158 = 0.007772 jadi nilai support Mainan Pedang dan Ultraman

Topeng adalah 0.77 % dan seterusnya.

Setelah mengetahui nilai support pada itemset dengan minimum support

yang sudah ditentukan, kemudian dibentuk aturan asosiasi yang

menyatakan hubungan kombinasi itemset pada transaksi, yaitu confidence.

Untuk menentukan aturan asosiasi yang terbentuk, minimal itemset harus

memiliki kandidat A dan B dan pada percobaan yang telah dilakukan

menghasilkan 2 kombinasi 2 item maka 2 kombinasi yang memenuhi untuk

pembentukan asosiasi ditetapkan minimum confidence 1%.

Tabel 10 Hasil Akhir dengan Nilai Support dan Nilai Confidence dari sample

Hasil Akhir Jumlah Nilai Support Nilai Confidence

Jika 147 Maka 219 9/21 0.077% 1%

Hasil akhir dari perhitungan seperti yang tertera pada tabel 10 dengan

perhitungan nilai support dan nilai confidence.

4. Hasil dan Pembahasan

Untuk membuktikan kebenaran hasil analisa dilakukan sebuah proses pengujian

untuk menguji kebenaran dari hasil pengolahan data yang dikerjakan secara manual

sebelumnya. Untuk proses pengujian tersebut digunakan software aplikasi

Rapidminer.

13

Tabel 11 Hasil rule dari perhitungan pada Rapidminer

Jika Maka Support Confidence Lift Ratio

105 103 0.006 0.130 4.549

103 105 0.006 0.212 4.549

147 219 0.008 0.429 29.193

219 147 0.008 0.529 29.193

225 221 0.007 0.533 61.760

221 225 0.007 0.800 61.760

Pada proses implementasi FP-Growth yang dilakukan di software Rapidminer,

menghasilkan rule seperti yang tertera pada tabel 11. Pada saat pengolahan

menggunakan FP-Growth perlu mengatur minimum support dan minimum confidence

pada Rapidminer agar mendapatkan hasil yang sesuai.

Setelah hasil rule didapat kita juga dapat melihat hasil association rules pada

description di Rapidminer.

Gambar 5 Description Association Rule

Berdasarkan hasil description association rules pada gambar 5 dihasilkan

sebanyak 6 rule. Adapun penjelasan dari association rule pada gambar 5 adalah

sebagai berikut:

Rule 1 : if membeli item dengan id 105 then juga membeli item dengan id 103 dan

didukung oleh 1% dari data keseluruhan dengan nilai confidence 0.130.






didukung oleh 1% dari data keseluruan dengan nilai confidence 0.529.





14

Setelah diuraikan rule yang ada, dapat diambil beberapa kesimpulan

diantaranya: konsumen cenderung membeli item yang saling berhubungan seperti

pada if membeli item dengan id 225 then juga membeli item dengan id 221. Dimana

id 225 dan id 221 merupakan Bola Basket Plastik dan Ring Bola Basket Plastik.

Kesimpulan yang lain adalah konsumen cenderung membeli item yang beragam

namun sama jenisnya seperti pada if membeli item dengan id 105 then juga membeli

item dengan id 103. Dimana id 105 dan id 103 adalah Truck Molen dan Bego Besar.

Truck Molen dan Bego besar memiliki jenis mainan yang sama yaitu mainan Truck

tanpa baterai tapi memiliki ragam yang berbeda.

Kemudian hasil akhir yang diperoleh didapat dari rule adalah sebuah

pengetahuan baru tentang pola pembelian konsumen yang selama ini jarang

diketahui. Hal itu dapat dimanfaatkan untuk membantu membuat strategi bisnis,

diantaraya: mengatur penempatan item agar memudahkan konsumen dalam membeli

kedua item tersebut sehingga dapat meningkatkan penjualan. Pengetahuan ini juga

dapat digunakan dalam membantu pelaku bisnis dalam menentukan keputusan

persediaan barang, bisa juga dengan memberikan paket diskon terhadap pola

pembelian item yang memiliki confidence tinggi. Dengan memanfaatkan pengetahuan

pengetahuan tersebut untuk menyusun strategi penjualan diharapkan dapat

meningkatkan keuntungan dan menjaga eksistensi bisnis.

5. Kesimpulan

Penentuan data variabel sangat menentukan tingkat akurasi dalam menganalisis.

Besarnya presentase dalam menentukan minimum support dan minimum confidence

dipengaruhi oleh data variabel yang digunakan untuk mencari frequent itemset yang

saling berhubungan untuk menemukan data variabel yang akan dijadikan usulan atau

gagas untuk menganalisis pola pembelian konsumen. Pemilihan atribut di dalam

dataset juga berpengaruh sehingga atribut yang tidak digunakan dapat dihilangkan.

Pada penelitian ini ditemukan sebanyak 6 hubungan dan keterkaitan antar

barang yang dibeli oleh konsumen dengan nilai support lebih dari sama dengan 0.01.

Pada penelitian ini pun ditemukan bahwa barang yang sering dibeli oleh konsumen

secara bersamaan adalah item yang memiliki id 105 dan 103, item yang memiliki id

147 dan 219, dan item yang memiliki id 225 dan 221.

Berdasarkan uraian rule yang diperoleh, dapat diambil beberapa kesimpulan,

diantaranya: konsumen cenderung membeli item yang saling berhubungan dan

konsumen cenderung membeli item yang beragam namun sama jenisnya.

Dari rule yang diperoleh juga didapatkan sebuah pengetahuan baru tentang pola

pembelian konsumen. Dari pengetahuan tersebut bisa di gunakan untuk mengatur

tempat item yang saling berhubungan agar dapat memudahkan konsumen dalam

membeli, bisa juga digunakan untuk menentukan keputusan persediaan barang dan

memberikan paket diskon terhadap pola pembelian item yang memiliki nilai

confidence tinggi.

15

6. Daftar Pustaka

[1] Lestari, D. Yuyun., 2015, Penerapan Data Mining Menggunakan Algoritma

FP-Tree dan FP-Growth Pada Data Transasksi Penjualan Obat, Seminar

Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2015), 60-65.

[2] Kusrini, E, L., 2009, Algorita Data Mining. Yogyakarta: Penerbit Andi.

[3] S. Zhang, C. Z., 2003, Data Preparation For Data Mining : Applied Artificial

Intelligence, 375-381.

[4] Fajrin, A. A. & Maulana, A., 2018, Penerapan Data Mining Untuk Analisa

Pola Pembelian Konsumen Dengan Algoritma FP-Growth Pada Data

Transaksi Penjualan Spare Part Motor, Kumpulan Jurnal Ilmu Komputer

(KLIK), Vol. 05, No.01 : 28-36.

[5] Arifin, N. Rizka., 2015, Implementasi Algoritma Frequent Pattern Growth (FP-

Growth) Menentukan Asosiasi Antar Produk (Study Kasus Nadia Mart).

[6] Ikhwan, Ali., Nofriansyah, D., & Sriani, 2015, Penerapan Data Mining Dengan

Algoritma FP-Growth Untuk Mendukung Strategi Promosi Pendidikan, Jurnal

Ilmiah Saintikom, Vol.14 No. 3 : 211-226.

[7] Abdullah, A., 2018, Rekomendasi Paket Produk Guna Meningkatkan

Penjualan Dengan Metode FP-Growth, Khazanah Informatika, 21-26.

[8] Ririanti, 2014, Implementasi Algoritma FP-Growth Pada Aplikasi Prediksi

Persediaan Sepeda Motor (Studi Kasus PT. Pilar Deli Labumas), Pelita

Informatika Budi Darma, Vol. VI No. 1 : 139 - 144.

[9] Santosa, B., 2007, Data Mining Teknik Pemanfaatan Data Untuk Keperluan

Bisnis, Yogyakarta: Graha Ilmu.

[10] Larose, Daniel. T., 2005, Discovering Knowledge in Data: An Introduction to

Data Mining, John Willey & Sons. Inc

[11] Han, J. & Kamber, M., 2006, Data Mining: Concepts and Techniques 2nd ed.

Elsevier Science, San Fransisco: Morgan Kauffman.

[12] Wandi, Nugroho., Hendrawan, Rully., & Mukhlason, Ahmad, 2012,

Pengembangan Sistem Rekomendasi Penelusuran Buku dengan Penggalian

Association Rule Menggunakan Algoritma Apriori (Studi Kasus Badan

Perpustakaan dan Kearsipan Provinsi Jawa Timur), Jurnal Teknik ITS, Vol. 1 :

445 - 449.

[13] Ardani, Nur. R. & Fitrina, Nur, 2016, Sistem Rekomendasi Pemesanan

Sparepart Dengan Algoritma FP-Growth (Studi Kasus PT. Rosalia Surakarta),

Seminar Nasional Teknologi dan Multimedia 2016, 97-102.

[14] Mahmudah, Ratih. R. & Aribowo, Eko, 2014, Penggunaan Algoritma FP-

Growth Untuk Menemukan Aturan Asosiasi Pada Data Transaksi Penjualan

Obat Di Apotek (Studi Kasus : Apotek UAD), Jurnal Sarjana Teknik

Informatika, Vol.2 No.3 : 130-139.

16

Lampiran

penerapan algoritma frequent pattern growth untuk ......penerapan algoritma frequent pattern growth...

Documents