chapter 10 algoritme for association rules

22
Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Chapter 10 ALGORITME for ASSOCIATION RULES Sulidar Fitri, M.Sc Market Basket Apriori Case

Upload: lars-rollins

Post on 01-Jan-2016

36 views

Category:

Documents


1 download

DESCRIPTION

Chapter 10 ALGORITME for ASSOCIATION RULES. Market Basket Analysis. Apriori. Case. Sulidar Fitri , M.Sc. REFERENCES. Budi Santosa . Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis . 2007. Graha Ilmu Yogyakarta - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Chapter 10

ALGORITME for

ASSOCIATION RULES

Sulidar Fitri, M.Sc

Market Basket AnalysisMarket Basket AnalysisAprioriAprioriCaseCase

Page 2: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

REFERENCES• Budi Santosa. Data Mining: Teknik

Pemanfaatan Data Untuk Keperluan Bisnis. 2007. Graha Ilmu Yogyakarta

• Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques. 2006. Department of Computer Science University of Illinois at Urbana-Champaign. www.cs.uiuc.edu/~hanj

• Ian H. Witten, Eibe Frank, Mark A. Hall. Data Mining Practical Machine Learning Tools and Techniques Third Edition.2011. Elsevier

• WEKA

Page 3: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

INTNRODUCTION

• DATA MINING– Proses untuk menemukan dataset baru pada

dataset yang sangat besar.

• TOPIK– ASSOCIATION RULES (ATURAN ASOSIASI)– FREQUENT ITEMSETS

Page 4: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

• Menggunakan algoritme klasik : IF - THEN

ATURAN ASOSIASI

Page 5: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

ATURAN ASOSIASI

• Analisis Afinitas = “apa bersama apa”• Bisa digunakan untuk menentukan kebiasaan “

suatu produk apa akan dibeli bersama apa”• Market Basket Analysis• Contoh: – Studi transaksi di supermarket– Jika membeli Susu Bayi makan akan membeli

Sabun Mandi

Page 6: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

ATURAN ASOSIASI DALAM TRANSAKSI• Menemukan asosiasi produk dalam database

transaksi suatu supermarket. (database Market Basket)

• Contoh Kasus:– Para manajer ingin mengetahui kelompok items apa yang

sering dibeli untuk membuat layout katalog belanja.

• Solusi:– Gunakan aturan asosiasi dalam hubungan “if-then” atau

“jika-maka”.– Aturan tersebut dihitung dari data yang sifatnya

probabilistic berdasarkan data market basket

Page 7: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

KASUS

• Suatu toko yang menjual pakaian olah raga, sedang melakukan promosi padapenjualan topi. Jika seorang pelanggan membeli lebih dari satu macam topi dari 6 pilihan yang ada akan mendapat diskon.

• Manajer toko tersebut ingin melihat warna apa yang dibeli bersama oleh pelanggan, mengumpulkan data dan menyimpan dalam database.

Page 8: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Data items Topi tersebut berupa:

• Catatan transaksi pembelian

Transaksi1 merah putih hijau2 putih orange3 putih biru4 merah putih orange5 merah biru6 putih biru7 putih orange8 merah putih biru hijau9 merah putih biru10 kuning

Warna

Page 9: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM YogyakartaIde dari Aturan Asosiasi:

• Periksa semua kemungkinan “IF - THEN”• Pilih yang paling mungkin (most likely) sebagai

indicator dari hubungan ketergantungan antar item.

• Antecedent =“Jika” dan consequent = “maka”• Kemungkinan aturan:– “Jika Merah, maka Putih ”– {Merah, Putih} = {Biru}

Page 10: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Secara praktis,Hanya kombinasi yang terjadi dengan frekuensi yang sangat tinggi yang akan diperhatikan

itu yang disebut:FREQUENT ITEM SET

Page 11: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

FREQUENT ITEM SET• Berhubungan dengan SUPPORT• SUPPORT: jumlah transaksi yang mengandung

item• Support digunakan untuk mengukur seberapa

tingkat dukungan data terhadap validitas aturan yang dikembangkan.

• Dinyatakan dalam prosentase (%)• Contoh:– {Merah, Putih} adalah 4/10 atau 40%

Page 12: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Mengukur Aturan yang Kuat

Page 13: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Contoh Confidence• Suatu supermarket memiliki 100.000

titik transaksi. Dari jml tersebut ada 1000 transaksi yang mengandung jeruk dan obat flu. Dari 1000 transaksi ada 800 yang mengandung mie instant.

• Aturan asosiasi jika jeruk dan obat flu dibeli maka mie instant juga dibeli pada belanja yang bersamaan => – Support= 800/100.000– Confidence = 800/1000

Page 14: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

• SUPPORT: Peluang transaksi yang dipilih secara random dari database akan mengandung semua item dalam antecendent maupun consequent atau P (antecedent dan consequent).

Page 15: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

P (consequent | antecedent)P (consequent | antecedent)

Page 16: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Lift Ratio

Page 17: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Susunlah aturan asosiasi dari set item {merah, putih, hijau} !!

Transaksi1 merah putih hijau2 putih orange3 putih biru4 merah putih orange5 merah biru6 putih biru7 putih orange8 merah putih biru hijau9 merah putih biru10 kuning

Warna

Page 18: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM Yogyakarta

Jika kita Terapkan syarat minimum confidence 75%, maka hanya aturan 2,3, dan 6 yang akan memenuhi

Jika kita Terapkan syarat minimum confidence 75%, maka hanya aturan 2,3, dan 6 yang akan memenuhi

Page 19: Chapter 10 ALGORITME  for  ASSOCIATION RULES

Data Mining © Sulidar Fitri, Ms.C

STMIK AMIKOM YogyakartaAda beberapa algoritme yang sudah

dikembangkan mengenai aturan asosiasi, namun

ada satu algoritme klasik yang sering dipakai yaitu

algoritma apriori (Shmueli et al., 2007)

Page 20: Chapter 10 ALGORITME  for  ASSOCIATION RULES

April 20, 2023 Data Mining: Concepts and Techniques 20

Apriori: A Candidate Generation-and-Test Approach

Apriori pruning principle: If there is any itemset which is infrequent, its superset should not be generated/tested! (Agrawal & Srikant @VLDB’94, Mannila, et al. @ KDD’ 94)

Method: Initially, scan DB once to get frequent 1-itemset Generate length (k+1) candidate itemsets from

length k frequent itemsets Test the candidates against DB Terminate when no frequent or candidate set can

be generated

Page 21: Chapter 10 ALGORITME  for  ASSOCIATION RULES

April 20, 2023 Data Mining: Concepts and Techniques 21

The Apriori Algorithm—An Example

Database TDB

1st scan

C1L1

L2

C2 C2

2nd scan

C3 L33rd scan

Tid Items

10 A, C, D

20 B, C, E

30 A, B, C, E

40 B, E

Itemset sup

{A} 2

{B} 3

{C} 3

{D} 1

{E} 3

Itemset sup

{A} 2

{B} 3

{C} 3

{E} 3

Itemset

{A, B}

{A, C}

{A, E}

{B, C}

{B, E}

{C, E}

Itemset sup{A, B} 1{A, C} 2{A, E} 1{B, C} 2{B, E} 3{C, E} 2

Itemset sup{A, C} 2{B, C} 2{B, E} 3{C, E} 2

Itemset

{B, C, E}

Itemset sup

{B, C, E} 2

Supmin = 2

Page 22: Chapter 10 ALGORITME  for  ASSOCIATION RULES