penerapan algoritma frequent pattern growth untuk ......penerapan algoritma frequent pattern growth...
TRANSCRIPT
Penerapan Algoritma Frequent Pattern Growth Untuk Menganalisis
Pola Pembelian Konsumen
Artikel Ilmiah
Peneliti:
Dita Dwi Sapitri (672015167)
Hindriyanto Dwi Purnomo , S.T., MIT., Ph.D.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
2018
1
Penerapan Algoritma Frequent Pattern Growth Untuk Menganalisis
Pola Pembelian Konsumen
Artikel Ilmiah
Diajukan kepada
Fakultas Teknologi Informasi
untuk memperoleh Gelar Sarjana Komputer
Peneliti:
Dita Dwi Sapitri (672015167)
Hindriyanto Dwi Purnomo , S.T., MIT., Ph.D.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
2018
2
3
4
5
1
1. Latar Belakang Masalah
Dalam menghadapi persaingan bisnis yang tumbuh dengan pesat, kemampuan
dalam mempertahankan dan mengembangkan eksistensi suatu bisnis menjadi hal
yang sangat penting yang harus diperhatikan oleh setiap pelaku bisnis. Para pelaku
bisnis harus memiliki pandangan kedepan dalam menentukan langkahnya dan
bagaimana usaha untuk mencapainya. Banyak permasalahan yang sering dihadapi
oleh para pelaku bisnis, seperti kurangnya persediaan produk, adanya produk yang
tidak laku terjual dan masih banyak lagi. Jika jumlah persedian produk kurang dapat
menyebabkan permintaan tidak dapat terpenuhi sehingga mengakibatkan konsumen
kecewa dan dapat membuat konsumen tidak akan kembali lagi. Begitu pula jika
terdapat produk yang tidak laku terjual maka akan menyebabkan kerugian dan harus
menyediakan tempat untuk menyimpan produk yang tidak laku terjual. Berdasarkan
permasalahan yang ada, diperlukan usaha untuk meminimalisir terjadinya masalah
tersebut. Salah satu usaha yang dapat dilakukan adalah mengolah data yang ada
sebagai sumber informasi yang digunakan untuk memperoleh pengetahuan dan
pengambilan keputusan. Tanpa pengolahan data, para pelaku bisnis akan menghadapi
kesulitan untuk menjual barang yang diinginkan oleh konsumen. Dengan pelaku
bisnis memanfaatkan data yang ada, dari hasil pengolahan data tersebut dapat
digunakan para pelaku bisnis untuk menyusun strategi penjualan sehingga dapat
mendongkrak barang yang tidak laku supaya menjadi laku terjual dan meningkatkan
persediaan barang yang paling sering di beli.
Salah satu cara pengolahan data sebagai sumber informasi adalah dengan
meggunakan teknologi yaitu Data Mining. Teknologi data mining adalah proses
mencari pola atau informasi menarik dalam data terpilih menggunakan teknik atau
metode tertentu [1]. Tujuan dari data mining yaitu untuk menemukan hubungan atau
pola-pola yang memberikan manfaat pada pelaku bisnis. Data mining menggunakan
pendekatan discovery based yaitu dimana pencocokan pola (pattern-matching) dan
algoritma digunakan untuk menemukan relasi-relasi kunci didalam data yang
dieksplorasi.
Association rule adalah teknik data mining untuk menemukan aturan asosiasi
antara suatu kombinasi item[2]. Association rule merupakan salah satu metode yang
bertujuan mencari pola yang sering muncul di antara banyak transaksi, dimana setiap
transaksi terdiri dari beberapa item [3]. Pada metode ini memiliki beberapa algoritma,
salah satunya adalah Algoritma Frequent Pattern-Growth (FP-Growth). FP-Growth
merupakan salah satu alternatif algoritma yang dapat digunakan untuk menentukan
himpunan data yang paling sering muncul (frequent itemset) dalam sekumpulan data
[4]. Algoritma FP-Growth merupakan algoritma yang sangat efisien dalam pencarian
frequent itemset. FP-Growth menggunakan pendekatan yang berbeda dari algoritma
yang selama ini sering digunakan yaitu algoritma apriori. Algoritma ini menyimpan
informasi mengenai frequent itemset dalam bentuk FP-Tree. Pada FP-Tree yang
terbentuk dapat memanfaatkan data transaksi yang memiliki item yang sama sehingga
2
dapat mengurangi scan database secara berulang dalam proses mining dan dapat
berlangsung lebih cepat [5].
Pada Toko Mainan Ananda memiliki beberapa transaksi penjualan barang yang
terus bertambah dan data - data transaksi penjualan pada toko tersebut hanya
disimpan untuk pembukuan dan belum diketahui manfaat data - data tersebut untuk
hal lainnya. Oleh karena itu diperlukan sebuah algoritma untuk menfaatkan data-data
yang sudah ada menjadi sebuah informasi dan informasi yang didapat akan digunakan
untuk pengambilan suatu keputusan.
Penelitian ini bertujuan untuk menganalisis pola pembelian barang yang sering
di beli menggunakan Algoritma FP-Growth untuk merancang bagaimana strategi
penjualan yang baik di Toko Mainan Ananda.
2. Tinjauan Pustaka
Penelitian yang menggunakan Algoritma FP-Growth sudah banyak di lakukan.
Seperti penilitian yang dilakukan oleh Ali, Dicky dan Sriani pada tahun 2015 yang
menerapkan Algoritma FP-Growth menggunakan konsep pembangunan FP-Tree
dalam mencari Frequent Itemset untuk menemukan data variabel yang akan dijadikan
stretegi dalam promosi pendidikan pada Perguruan Tinggi. Dengan proses
pembentukan FP-Tree dari penelitian ini menghasilkan rule dari data sampel
mahasiswa baru. Penentuan data variabel sangat menentukan tingkat akurasi FP-
Growth yang dibuat dan besarnya presentase dalam menentukan minimum support
dan minimum confidence. Minimun support dan minimum confidence diguanakan
unruk mencari frequent itemset yang saling berhubungan untuk menemukan data
variabel yang akan dijadikan stretegi dalam promosi pendidikan. Adapun Informasi
yang berkaitan dengan pelaksanaan promosi dapat tersedia dengan cepat. Contohnya
dalam pemilihan tempat yang akan dijadikan promosi pendidikan sehingga pihak
manajemen dari kampus sendiri dapat melakukan pengambilan keputusan dengan
cepat [6].
Penelitian yang dilakukan oleh Asrul Abdullah pada tahun 2018 menerapkan
metode FP-Growth untuk menyusun rekomendasi paket produk untuk meningkatkan
penjualan. Pokok permasalahan didalam penelitian ini adalah kesulitan penjual untuk
menentukan paket produk yang akan ditawarkan kepada konsumen. Sebelum
melakukan proses perhitungan dengan menggunakan metode FP-Growth, data
transaksi penjualan minimarket XYZ harus dilakukan pra-proses berupa mengisi
missing value. Kemudian dilakukan transformasi data. Peneliti mengembangkan
aplikasi berbasis desktop untuk memberikan rekomendasi yang tepat bagi para
penjual atau para penentu keputusan. Penentuan rekomendasi paket produk dihitung
berdasarkan tingkat frekuensi item yang dibeli oleh konsumen dengan
memperhatikan minimum support yang telah ditetapkan. Hasil dari penelitian ini
adalah ditemukan dua pasangan item barang yaitu kopi, gula dan teh, susu yang
memiliki support sebesar 30% dan confidence sebesar 70%. Dari hasil yang didapat
yaitu dua pasangan item tersebut bisa direkomendasikan untuk dijual secara bersama-
sama[7].
3
Ririanti (2014) menyajikan penelitian dengan mengimplementasikan algoritma
FP-Growth pada aplikasi prediksi persediaan sepeda motor dengan memanfaatkan
data laporan penjualan PT. Pilar Deli Labumas. Dengan memanfaatkan laporan
penjualan yang ada, peneliti dapat memprediksi banyaknya persediaan sepeda motor
yang harus disediakan kedepannya berdasarkan banyaknya sepeda motor yang terjual.
Peneliti melakukan implementasi algoritma FP-Growth pada aplikasi persediaan
sepeda motor dengan melihat dari banyaknya item yang dijual, kemudian membuat
rangkaian tree dengan fp-tree untuk mengetahui banyaknya frequent itemset yang
terjadi. Dari frequent itemset yang didapat maka dapat dihitung nilai Support dan
Confidence nya. Hasil dari penelitian ini adalah sebuah sistem prediksi persediaan
motor. Dengan menginputkan data-data penjualan seperti jenis sepeda motor, warna
sepeda motor, jenis roda sepeda motor, banyak penjualan perbulan nya dan
persediaan awalannya kemudian menginputkan minimum support count nya maka
akan menghasilkan informasi banyaknya jumlah persediaan sepeda motor. Informasi
yang diperoleh dapat digunakan untuk mengambil sebuah keputusan untuk
menentukan persediaan sepeda motor yang ada di PT. Pilar Deli Labumas [8].
Dalam penelitian ini dilakukan analisis pola pembelian konsumen
menggunakan Algoritma FP-Growth untuk merancang bagaimana strategi penjualan
yang baik di Toko Mainan Ananda. Algoritma FP-Growth dipilih karena dalam
mendapatkan frequent itemsets tidak memerlukan waktu yang lama sehingga waktu
yang yang dibutuhkan menjadi relatif singkat dan efisien. Manfaat dari penelitian
yang dilakukan adalah memberikan solusi dalam hal merancang strategi untuk
meningkatkan pendapatan di Toko Mainan Ananda.
Data Mining adalah kegiatan yang meliputi pengumpulan, pemakaian data
historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran
besar [9]. Berdasarkan tugas yang dapat dilakukan, data mining dibagi menjadi
beberapa kelompok yaitu [10] :
1. Deskripsi
Terkadang peniliti dan analis secara sederhana ingin mencoba mencari cara
untuk menggambarkan pola dan kecenderungan yang terdapat dalam data.
Sebagai contoh: petugas pengumpulan suara mungkin tidak dapat
menemukan keterangan atau fakta bahwa siapa yang tidak cukup
professional akan sedikit didukung dalam pemilihan presiden. Deskripsi
dari pola dan kecenderungan sering memberikan kemungkinan penjelasan
untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi
lebih ke arah numerik daripada ke arah kategori. Model dibangun
menggunakan record lengkap yang menyediakan nilai dari variabel target
sebagai nilai prediksi. Selanjutnya pada peninjauan berikutnya, estimasi
nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai
contoh: estimasi nilai indeks prestasi kumulatif mahasiswa program
4
pascasarjana dengan melihat nilai indeks prestasi mahasiswa tersebut pada
saat mengikuti program sarjana.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
prediksi nilai dari hasil akan ada di masa mendatang. Contoh lain klasifikasi
dalam bisnis dan penelitian adalah :
Prediksi harga beras dalam tiga bulan yang akan datang.
Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika
batas bawah kecepatan dinaikkan.
Beberapa metode dan teknik yang akan digunakan dalan klasifikasi dan
estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Contoh: penggolongan
pendapatan, dapat dipisahkan dalam 3 kategori yaitu pendapatan tinggi,
pendapatan sedang dan pendapatan rendah.
5. Pengklusteran
Pengklusteran merupakan pengelompokkan record, pengamatan atau
memperhatikan dan membentuk kelas obyek-obyek yang memiliki
kemiripan. Kluster adalah kumpulan dari record yang memiliki kemiripan
satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-
record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu
tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak
mencoba untuk melakukan klasifikasi, mengestimasi atau memprediksi niali
dari variabel target. Akan tetapi algoritma pengklusteran mencoba untuk
melakukan pembagian terhadap keseluruhan data menjadi kelompok-
kelompok yang memiliki kemiripan (homogen), yang mana kemiripan
record dalam satu kelompok akan bernilai maksimal sedangkan kemiripan
dengan record dalam kelompok lain akan bernilai minimal. Contoh
pengklusteran dalam bisnis dan penelitian adalah:
Mendapatkan kelompok-kelompok konsumen untuk target pemasaran
dari suatu produk nagi perusahaan yang tidak memiliki dana
pemasaran yang besar.
Untuk tujuan audit akuntasi, yaitu melakukan pemisahan terhadap
perilaku financial dalam baik dan mencurigakan.
Melakukan pengklusteran terhadap ekspresi dari gen, untuk
mendapatkan kemiripan perilaku dari gen dalam jumlah besar.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul
dalam satu waktu. Dalam dunia bisnis lebih umum disebut sebagai analisis
keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah:
5
Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler
yang diharapkan untuk memberikan respon positif terhadap penawan
upgrade layanan yang diberikan.
Menemukan barang dalam supermarket yang dibeli secara bersamaan
dan barang yang tidak pernah dibeli secara bersamaan.
Association rule adalah teknik data mining untuk menemukan aturan asosiasi
antara suatu kombinasi item [11]. Association rule merupakan salah satu metode yang
bertujuan mencari pola yang sering muncul di antara banyak transaksi, dimana setiap
transaksi terdiri dari beberapa item [4]. Dalam analisa asosiasi mempunyai
metodologi dasar yang terbagi menjadi dua tahap yaitu [2]:
a. Analisa Pola Frekuensi Tinggi
Pada tahap ini untuk mencari kombinasi item yang memenuhi syarat
minimum dari nilai support dalam database.
b. Pembentukan Aturan Asosiasi
Setelah semua pola frekuensi tinggi ditemukan, kemudian di cari aturan
asosiasi yang memenuhi syarat minimum untuk confidence.
Algoritma Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif
algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering
muncul (frequent itemset) dalam sebuah kumpulan data [12]. Penggalian itemset yang
frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara
membangkitkan struktur data tree (FP-Tree). Metode FP-Growth dapat dibagi
menjadi 3 tahapan utama yaitu sebagai berikut [11]:
a. Tahap pembangkitan Conditional Pattern Base
Conditional Pattern Base merupakan subdatabase yang berisi lintasan
prefix dan suffix pattern. Pembangkitan conditional pattern base
didapatkan melalui FP-Tree yang telah dibangun sebelumnya.
b. Tahap pembangkitan Conditional FP-Tree
Support count dari setiap item pada setiap conditional pattern base
dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih
besar sama dengan minimum support count ξ akan dibangkitkan dengan
conditional FP-Tree.
c. Tahap pencarian Frequent Itemset
Apabila Conditional FP-Tree merupakan lintasan tunggal, maka
didapatkan frequent itemset dengan melakukan kombinasi item untuk
setiap conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan
pembangkitan FP-Growth secara rekursif.
3. Penerapan Algoritma FP-Growth
Untuk menganalisis pola pembelian konsumen di Toko Mainan Ananda
menggunakan algoritma FP-Growth yang diawali dengan pembentukan FP-Tree dari
transaksi pembelian. FP-Growth dipilih karena merupakan perkembangan terhadap
6
algoritma apriori, dimana terdapat perbedaan dalam scanning database. FP-Growth
lebih memberikan keuntungan karena hanya dilakukan satu atau dua kali saja
scanning database sedangkan algoritma Apriori perlu melakukan scanning database
berulang-ulang sehingga cenderung memakan waktu lebih lama.
Data yang digunakan pada penelitian ini adalah data transaksi yang terdiri dari
1158 transaksi selama 3 bulan yaitu bulan April 2018, Mei 2018 dan Juni 2018. Data
transaksi Toko Mainan Ananda seperti yang terlihat pada Tabel 1.
Tabel 1 Data Transaksi Toko Mainan Ananda
Sebelum proses data mining dimulai, dilakukan proses preprocessing sehingga
di dapatkan dataset seperti pada Tabel 2.
Tabel 2 Dataset yang dihasilkan setelah melalui Preprocessing
Dari dataset yang diperoleh setelah tahap preprocessing pada tabel 2, kemudian
selanjutnya menentukan frekuensi setiap item dari keseluruhan transaksi.
Tanggal ID Transaksi Transaksi Jumlah Harga
01/04/2018 0001 110 1 Rp. 30.000
01/04/2018 0001 213 1 Rp. 60.000
01/04/2018 0001 197 1 Rp. 11.000
01/04/2018 0002 140 1 Rp. 17.000
01/04/2018 0002 085 1 Rp. 40.000
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
30/06/2018 1158 073 1 Rp 60.000
30/06/2018 1158 171 1 Rp. 18.000
ID Transaksi Transaksi
0001 110, 213, 197
0002 140, 085
0003 034, 090
0004 001
0005 033, 061
. . . . . .
. . . . . .
1158 073, 171
7
Tabel 3 Frekuensi semua item barang untuk semua transaksi
Data yang sudah melalui proses preprocessing kemudian dilakukan proses
pengubahan data kedalam bentuk tabular. Data dirubah ke dalam bentuk tabular agar
dapat diproses di algoritma FP-Growth.
Tabel 4 Data dirubah ke format tabular
ID Transaksi 001 002 003 004 005 . . . . . . 241
0001 0 0 0 0 0 . . . . . . 0
0002 0 0 0 0 0 . . . . . . 0
0003 0 0 0 0 0 . . . . . . 0
0004 1 0 0 0 0 . . . . . . 0
0005 0 0 0 0 0 . . . . . . 0
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
1158 0 0 0 0 0 . . . . . . 0
Setelah data dirubah kedalam bentuk tabular seperti yang tertera di tabel 4,
kemudian data di implementasikan ke dalam algoritma FP-Growth.
Dalam menentukan suatu aturan asosiasi, terdapat suatu ukuran ketertarikan
(interestingness measure) yang didapatkan dari hasil pengolahan data dengan data
perhitungan tertentu. Pada umumnya terdapat dua ukuran ketertarikan dalam aturan
asosiasi, yaitu [12] :
a. Support adalah probabilitas konsumen membeli beberapa produk secara
bersamaan dari jumlah seluruh transaksi (misal dari keseluruhan transaksi
yang ada, seberapa besar tingkat dominasi yang menunjukkan bahwa item
A dan B dibeli bersamaan). Support merupakan kemungkinan A dan B
muncul bersamaan yang dinotasikan:
Support (A→B) = ( 1 )
b. Confidence merupakan probabilitas kejadian beberapa produk yang dibeli
bersamaan dimana salah satu produk sudah pasti dibeli (misal, seberapa
ID Barang Frekuensi
001 12
002 0
003 0
004 6
005 8
. . . . . .
. . . . . .
241 6
8
sering item B dibeli apabila konsumen membeli item A). Confidence
merupakan kemungkinan munculnya B ketika A juga muncul, dinotasikan:
Confidence (A→B) = ( 2 )
Setelah frekuensi setiap item diperoleh, dilakukan filter pada data yang
memiliki support diatas minimum support yang telah ditentukan yaitu 0.01. Jika
frekuensi item tidak kurang dari support count, maka item tersebut akan dihapus dan
tidak dipakai dalam proses data mining. Seperti yang tertera pada tabel 4 merupakan
hasil perhitungan dataset dengan item yang memenuhi minimum support yang telah
ditentukan dan diurutkan berdasarkan jumlah frekuensi terbanyak.
Tabel 5 Frekuensi item dengan minimum support ≥ 0,01
Dari Tabel 5 diatas, jumlah item yang memenuhi minimum support adalah 78
item. Setelah di dapatkan hasil item yang memiliki nilai support count lebih dari
nilai minimum support yang ditentukan, maka dari data transaksi awal dapat di filter
dengan menghilangkan item yang tidak memenuhi minimum support dan
mengurutkan susunan item berdasarkan pada Tabel 5. Seperti yang tertera pada Tabel
6 merupakan data transaksi yang didapat dari hasil filter.
Tabel 6 Transaksi yang telah diurutkan sesuai frekuensi item
ID Barang Nama Barang Frekuensi Nilai Support
085 Racing_Car_Tamiya 68 0.06
061 Gitar_Ding_Dong_Polos 34 0.03
009 RC_Racer_Car 32 0.03
177 Papan_Tulis_Magnet 29 0.03
088 Super Car Set 28 0.03
. . . . . . . . . . . .
. . . . . . . . . . . .
193 Masak – Masakan Set + Stroller 11 0.01
ID Transaksi ID Barang
0001 110, 213, 197
0002 085,140
0003 034,090
0004 001
0005 061,033
. . . . . .
. . . . . .
1158 073, 171
9
Dari hasil data yang terdapat pada Tabel 3, diambil sample data berjumlah 5
item yang akan digunakan untuk contoh pembuatan FP-Tree. Dari Table 5 yaitu
daftar transaksi yang telah diurutkan sesuai frekuensi item akan menjadi acuan dalam
membangun FP-Tree.
Gambar 1 Hasil Pembentukan FP-Tree dari 5 sample item
Hasil pengambilan sample 5 item yang terdapat dari Tabel 3 kemudian dengan
seluruh transaksi yang terdapat di Tabel 4 di bentuk satu persatu FP-Tree sampai
selesai sehingga menjadi FP-Tree seperti yang tertera pada Gambar 1.
Setelah pembuatan FP-Tree selesai, algoritma FP-Growth mencari semua
subsets yang memungkinkan dengan cara membangkitkan conditional FP-Tree dan
mencari frequent itemset. Dalam mencari frequent itemset, algoritma FP-Growth
menggunakan struktur data yang didapatkan dari perluasan FP-Tree. Dari FP-Tree
didapatkan hasil extract frequent itemset menggunakan prinsip divide dan conquer
yang memecah masalah menjadi sub-sub masalah sehingga permasalahan tersebut
lebih efisien dan akses memori lebih cepat [13]. Metode FP-Growth dapat dibagi
menjadi 3 tahapan utama yaitu [11]:
1. Tahap pembangkitan conditional pattern base
Pada tahap pembangkitan conditional pattern base dilakukan scan pada
FP-Tree dengan awalan path dari bawah ke atas. Contohnya untuk item
177 seperti yang tertera pada Gambar 4 .
10
Gambar 2 FP-Tree yang diakhiri item 177
Dari FP-Tree yang berakhir dengan item 177 berdasarkan yang tertera pada
Tabel 5 dapat diambil sebagai conditional pattern base.
Tabel 7 Conditional Pattern Base
2. Tahap pembangkitan conditional FP-Tree
Pada tahap ini, support count dari setiap item pada setiap conditional
pattern base di jumlahkan, lalu setiap item yang memiliki jumlah support
count lebih besar sama dengan minimum support count akan dibangkitkan
dengan conditional FP-Tree.
Dari Gambar 2 untuk menentukan conditional FP-Tree, langkah pertama
adalah menghapus item 177 dan menghitung ulang support count seperti
Gambar 3.
Gambar 3 FP-Tree setelah item 177 dihilangkan
Selanjutnya menghilangkan item yang memiliki support count tidak
memenuhui minimum support seperti pada Gambar 3 item 061 hanya
memiliki 1 kali kemunculan bersama item 177 sehingga dapat dihilangkan
Id Barang Conditional Pattern Base
177 {085:57}, {085,061:1}, {085,185:6}
11
dan menghasilkan conditional FP-Tree pada seperti pada Tabel 7. Untuk
item yang lain dapat menggunakan cara yang sama untuk menentukan
conditional pattern base dan conditional FP-Tree seperti contoh
sebelumnya. Tabel 8 Conditional Pattern Base
3. Tahap pencarian frequent itemset
Pada tahap ini, apabila Conditional FP-Tree merupakan single path maka
akan didapatkan frequent itemsets dengan melakukan kombinasi item
untuk setiap Conditional FP-Tree. Jika bukan single path maka akan
dilakukan pembangkitan FP-Growth secara rekursif [14]. Adapun
algoritma FP-Growth ditunjukkan pada Gambar 4.
Input: FP-tree Tree
Output: Rt sekumpulan lengkap pola frequent
Method: FP-growth (Tree,null)
Procedure: FP-growth (Tree,α)
{
01:if Tree mengandung single path P;
02:then untuk tiap kombinasi (dinotasikan β) dari node-
node dalam path P do
03:bangkitkan pola β α dengan support = minimum support
dari node-node dalam β;
04:else untuk tiap ai dalam header dari Tree do {
05:bangkitkan pola
06:bangun β= ai α dengan support = ai . support
07:if Tree β=
08:then panggil FP-growth (Tree, β) }
} Gambar 4 Pseudocode dari Algoritma FP-Growth [14].
Dari algoritma yang ada pada gambar 4, kemudian dilakukan pencarian
frequent itemset. Hasil frequent itemset dari data keseluruhan seperti pada
Tabel 9. Tabel 9 Hasil Frequent Itemsets
ID Barang Frequent Item Sets
085 {085}
061 {061}
009 {009}
177 {177}, {177,085}, {177,185}
088 {088}
. . . . . .
. . . . . .
193 {193},{193,098}
Id Barang Conditional FP-Tree
177 {085,185:6}
12
Dari hasil frequent itemset seperti yang tertera pada tabel 9 akan digunakan
untuk menemukan Association rule untuk mencari keterkaitan antar
barang.
Dalam menemukan Association rule parameter yang harus diperhatikan
adalah support dan confidence. Nilai minimum support pada penelitian ini
adalah 0.01 dan item pada dataset yang memenuhi minimum support telah
tertera pada tabel 5. Item yang memenuhi minimum support akan
dikombinasikan menjadi 2 item dengan nilai minimum support yang sama.
Dari hasil tabel 5, terdapat 78 item yang memenuhi minimum support.
Mencari nilai support 2 item dengan menggunakan persamaan rumus 1
dengan jumlah transaksi yang mengandung A dan B dibagi dengan total
transaksi yang ada pada dataset. Transaksi yang mengandung Mainan
Pedang dan Ultraman Topeng berjumlah 9 sedangkan total transaksi 1158,
maka 9/1158 = 0.007772 jadi nilai support Mainan Pedang dan Ultraman
Topeng adalah 0.77 % dan seterusnya.
Setelah mengetahui nilai support pada itemset dengan minimum support
yang sudah ditentukan, kemudian dibentuk aturan asosiasi yang
menyatakan hubungan kombinasi itemset pada transaksi, yaitu confidence.
Untuk menentukan aturan asosiasi yang terbentuk, minimal itemset harus
memiliki kandidat A dan B dan pada percobaan yang telah dilakukan
menghasilkan 2 kombinasi 2 item maka 2 kombinasi yang memenuhi untuk
pembentukan asosiasi ditetapkan minimum confidence 1%.
Tabel 10 Hasil Akhir dengan Nilai Support dan Nilai Confidence dari sample
Hasil Akhir Jumlah Nilai Support Nilai Confidence
Jika 147 Maka 219 9/21 0.077% 1%
Hasil akhir dari perhitungan seperti yang tertera pada tabel 10 dengan
perhitungan nilai support dan nilai confidence.
4. Hasil dan Pembahasan
Untuk membuktikan kebenaran hasil analisa dilakukan sebuah proses pengujian
untuk menguji kebenaran dari hasil pengolahan data yang dikerjakan secara manual
sebelumnya. Untuk proses pengujian tersebut digunakan software aplikasi
Rapidminer.
13
Tabel 11 Hasil rule dari perhitungan pada Rapidminer
Jika Maka Support Confidence Lift Ratio
105 103 0.006 0.130 4.549
103 105 0.006 0.212 4.549
147 219 0.008 0.429 29.193
219 147 0.008 0.529 29.193
225 221 0.007 0.533 61.760
221 225 0.007 0.800 61.760
Pada proses implementasi FP-Growth yang dilakukan di software Rapidminer,
menghasilkan rule seperti yang tertera pada tabel 11. Pada saat pengolahan
menggunakan FP-Growth perlu mengatur minimum support dan minimum confidence
pada Rapidminer agar mendapatkan hasil yang sesuai.
Setelah hasil rule didapat kita juga dapat melihat hasil association rules pada
description di Rapidminer.
Gambar 5 Description Association Rule
Berdasarkan hasil description association rules pada gambar 5 dihasilkan
sebanyak 6 rule. Adapun penjelasan dari association rule pada gambar 5 adalah
sebagai berikut:
Rule 1 : if membeli item dengan id 105 then juga membeli item dengan id 103 dan
didukung oleh 1% dari data keseluruhan dengan nilai confidence 0.130.
Rule 2 : if membeli item dengan id 103 then juga membeli item dengan id 105 dan
didukung oleh 1% dari data keseluruhan dengan nilai confidence 0.212.
Rule 3 : if membeli item dengan id 147 then juga membeli item dengan id 219 dan
didukung oleh 1% dari data keseluruhan dengan nilai confidence 0.429.
Rule 4 : if membeli item dengan id 219 then juga membeli item dengan id 147 dan
didukung oleh 1% dari data keseluruan dengan nilai confidence 0.529.
Rule 5 : if membeli item dengan id 225 then juga membeli item dengan id 221 dan
didukung oleh 1% dari data keseluruhan dengan nilai confidence 0.533.
Rule 6 : if membeli item dengan id 221 then juga membeli item dengan id 225 dan
didukung oleh 1% dari data keseluruhan dengan nilai confidence 0.800.
14
Setelah diuraikan rule yang ada, dapat diambil beberapa kesimpulan
diantaranya: konsumen cenderung membeli item yang saling berhubungan seperti
pada if membeli item dengan id 225 then juga membeli item dengan id 221. Dimana
id 225 dan id 221 merupakan Bola Basket Plastik dan Ring Bola Basket Plastik.
Kesimpulan yang lain adalah konsumen cenderung membeli item yang beragam
namun sama jenisnya seperti pada if membeli item dengan id 105 then juga membeli
item dengan id 103. Dimana id 105 dan id 103 adalah Truck Molen dan Bego Besar.
Truck Molen dan Bego besar memiliki jenis mainan yang sama yaitu mainan Truck
tanpa baterai tapi memiliki ragam yang berbeda.
Kemudian hasil akhir yang diperoleh didapat dari rule adalah sebuah
pengetahuan baru tentang pola pembelian konsumen yang selama ini jarang
diketahui. Hal itu dapat dimanfaatkan untuk membantu membuat strategi bisnis,
diantaraya: mengatur penempatan item agar memudahkan konsumen dalam membeli
kedua item tersebut sehingga dapat meningkatkan penjualan. Pengetahuan ini juga
dapat digunakan dalam membantu pelaku bisnis dalam menentukan keputusan
persediaan barang, bisa juga dengan memberikan paket diskon terhadap pola
pembelian item yang memiliki confidence tinggi. Dengan memanfaatkan pengetahuan
pengetahuan tersebut untuk menyusun strategi penjualan diharapkan dapat
meningkatkan keuntungan dan menjaga eksistensi bisnis.
5. Kesimpulan
Penentuan data variabel sangat menentukan tingkat akurasi dalam menganalisis.
Besarnya presentase dalam menentukan minimum support dan minimum confidence
dipengaruhi oleh data variabel yang digunakan untuk mencari frequent itemset yang
saling berhubungan untuk menemukan data variabel yang akan dijadikan usulan atau
gagas untuk menganalisis pola pembelian konsumen. Pemilihan atribut di dalam
dataset juga berpengaruh sehingga atribut yang tidak digunakan dapat dihilangkan.
Pada penelitian ini ditemukan sebanyak 6 hubungan dan keterkaitan antar
barang yang dibeli oleh konsumen dengan nilai support lebih dari sama dengan 0.01.
Pada penelitian ini pun ditemukan bahwa barang yang sering dibeli oleh konsumen
secara bersamaan adalah item yang memiliki id 105 dan 103, item yang memiliki id
147 dan 219, dan item yang memiliki id 225 dan 221.
Berdasarkan uraian rule yang diperoleh, dapat diambil beberapa kesimpulan,
diantaranya: konsumen cenderung membeli item yang saling berhubungan dan
konsumen cenderung membeli item yang beragam namun sama jenisnya.
Dari rule yang diperoleh juga didapatkan sebuah pengetahuan baru tentang pola
pembelian konsumen. Dari pengetahuan tersebut bisa di gunakan untuk mengatur
tempat item yang saling berhubungan agar dapat memudahkan konsumen dalam
membeli, bisa juga digunakan untuk menentukan keputusan persediaan barang dan
memberikan paket diskon terhadap pola pembelian item yang memiliki nilai
confidence tinggi.
15
6. Daftar Pustaka
[1] Lestari, D. Yuyun., 2015, Penerapan Data Mining Menggunakan Algoritma
FP-Tree dan FP-Growth Pada Data Transasksi Penjualan Obat, Seminar
Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2015), 60-65.
[2] Kusrini, E, L., 2009, Algorita Data Mining. Yogyakarta: Penerbit Andi.
[3] S. Zhang, C. Z., 2003, Data Preparation For Data Mining : Applied Artificial
Intelligence, 375-381.
[4] Fajrin, A. A. & Maulana, A., 2018, Penerapan Data Mining Untuk Analisa
Pola Pembelian Konsumen Dengan Algoritma FP-Growth Pada Data
Transaksi Penjualan Spare Part Motor, Kumpulan Jurnal Ilmu Komputer
(KLIK), Vol. 05, No.01 : 28-36.
[5] Arifin, N. Rizka., 2015, Implementasi Algoritma Frequent Pattern Growth (FP-
Growth) Menentukan Asosiasi Antar Produk (Study Kasus Nadia Mart).
[6] Ikhwan, Ali., Nofriansyah, D., & Sriani, 2015, Penerapan Data Mining Dengan
Algoritma FP-Growth Untuk Mendukung Strategi Promosi Pendidikan, Jurnal
Ilmiah Saintikom, Vol.14 No. 3 : 211-226.
[7] Abdullah, A., 2018, Rekomendasi Paket Produk Guna Meningkatkan
Penjualan Dengan Metode FP-Growth, Khazanah Informatika, 21-26.
[8] Ririanti, 2014, Implementasi Algoritma FP-Growth Pada Aplikasi Prediksi
Persediaan Sepeda Motor (Studi Kasus PT. Pilar Deli Labumas), Pelita
Informatika Budi Darma, Vol. VI No. 1 : 139 - 144.
[9] Santosa, B., 2007, Data Mining Teknik Pemanfaatan Data Untuk Keperluan
Bisnis, Yogyakarta: Graha Ilmu.
[10] Larose, Daniel. T., 2005, Discovering Knowledge in Data: An Introduction to
Data Mining, John Willey & Sons. Inc
[11] Han, J. & Kamber, M., 2006, Data Mining: Concepts and Techniques 2nd ed.
Elsevier Science, San Fransisco: Morgan Kauffman.
[12] Wandi, Nugroho., Hendrawan, Rully., & Mukhlason, Ahmad, 2012,
Pengembangan Sistem Rekomendasi Penelusuran Buku dengan Penggalian
Association Rule Menggunakan Algoritma Apriori (Studi Kasus Badan
Perpustakaan dan Kearsipan Provinsi Jawa Timur), Jurnal Teknik ITS, Vol. 1 :
445 - 449.
[13] Ardani, Nur. R. & Fitrina, Nur, 2016, Sistem Rekomendasi Pemesanan
Sparepart Dengan Algoritma FP-Growth (Studi Kasus PT. Rosalia Surakarta),
Seminar Nasional Teknologi dan Multimedia 2016, 97-102.
[14] Mahmudah, Ratih. R. & Aribowo, Eko, 2014, Penggunaan Algoritma FP-
Growth Untuk Menemukan Aturan Asosiasi Pada Data Transaksi Penjualan
Obat Di Apotek (Studi Kasus : Apotek UAD), Jurnal Sarjana Teknik
Informatika, Vol.2 No.3 : 130-139.
16
Lampiran
17
18