fast algorithm for mining association rules oliver müller künstliche intelligenz ii ws09/10...
TRANSCRIPT
![Page 1: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/1.jpg)
Fast Algorithm for Mining Association Rules
Oliver MüllerKünstliche Intelligenz II WS09/10 Leibniz Universität Hannover
![Page 2: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/2.jpg)
Inhalt
Fast Algorithm for Mining Association Rules
2
Problemstellung Formalisierung Algorithmus Apriori Algorithmus AprioriTid Algorithmus AprioriHybrid Ergebnisse Zusammenfassung
![Page 3: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/3.jpg)
Problemstellung
Fast Algorithm for Mining Association Rules
3
Verkaufs-Transaktionen aufzeichnen Mittels Barcode-Technologie Großer Datenbestand Einzelner Datensatz bestehend aus Datum,
gekaufte Artikel
![Page 4: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/4.jpg)
Problemstellung
Fast Algorithm for Mining Association Rules
4
Verkaufs-Transaktionen aufzeichnen Mittels Barcode-Technologie Großer Datenbestand Einzelner Datensatz bestehend aus Datum,
gekaufte Artikel Interesse von Firmen meist für Marketing-
Zwecke Kundenspezifische Vermarktungs-Strategien
(Cross-Marketing, Attached Mailing, Katalog Design, etc.)
![Page 5: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/5.jpg)
Problemstellung
Fast Algorithm for Mining Association Rules
5
Verkaufs-Transaktionen aufzeichnen Mittels Barcode-Technologie Großer Datenbestand Einzelner Datensatz bestehend aus Datum,
gekaufte Artikel Interesse von Firmen meist für Marketing-
Zwecke Kundenspezifische Vermarktungs-Strategien
(Cross-Marketing, Attached Mailing, Katalog Design, etc.)
Ziel: Mining von Assoziations-Regeln im Datenbestand
![Page 6: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/6.jpg)
Problemstellung
Fast Algorithm for Mining Association Rules
6
Verkaufs-Transaktionen aufzeichnen Mittels Barcode-Technologie Großer Datenbestand Einzelner Datensatz bestehend aus Datum, gekaufte
Artikel Interesse von Firmen meist für Marketing-Zwecke
Kundenspezifische Vermarktungs-Strategien (Cross-Marketing, Attached Mailing, Katalog Design, etc.)
Ziel: Mining von Assoziations-Regeln im Datenbestand
Beispiel: Reifen ^ Zubehör Kfz-Dienstleistung
Zu 98% Sicherheit (Confidence)
![Page 7: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/7.jpg)
Notation
Fast Algorithm for Mining Association Rules
7
Menge von Items ( -Itemset)
![Page 8: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/8.jpg)
Notation
Fast Algorithm for Mining Association Rules
8
Menge von Items ( -Itemset)
Transaktion ist eine Menge von Items mit
![Page 9: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/9.jpg)
Notation
Fast Algorithm for Mining Association Rules
9
Menge von Items ( -Itemset)
Transaktion ist eine Menge von Items mit Menge von Transaktionen: TID = Unique Identifier für jede Transaktion
Lexikographische Sortierung
![Page 10: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/10.jpg)
Notation
Fast Algorithm for Mining Association Rules
10
Menge von Items ( -Itemset)
Transaktion ist eine Menge von Items mit Menge von Transaktionen: TID = Unique Identifier für jede Transaktion
Lexikographische Sortierung Assoziations-Regel:
wenn gilt: und
![Page 11: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/11.jpg)
Notation
Fast Algorithm for Mining Association Rules
11
Menge von Items ( -Itemset)
Transaktion ist eine Menge von Items mit Menge von Transaktionen: TID = Unique Identifier für jede Transaktion
Lexikographische Sortierung Assoziations-Regel:
wenn gilt: und Confidence : aller Transaktionen in die
enthalten, enthalten auch
![Page 12: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/12.jpg)
Notation
Fast Algorithm for Mining Association Rules
12
Menge von Items ( -Itemset) Transaktion ist eine Menge von Items mit Menge von Transaktionen: TID = Unique Identifier für jede Transaktion
Lexikographische Sortierung Assoziations-Regel:
wenn gilt: und Confidence : aller Transaktionen in die
enthalten, enthalten auch Support : aller Transaktionen in
enthalten
![Page 13: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/13.jpg)
Formale Definition des Problems
Fast Algorithm for Mining Association Rules
13
Generierung einer Liste aller Assoziations-Regeln mit und
![Page 14: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/14.jpg)
Formale Definition des Problems
Fast Algorithm for Mining Association Rules
14
Generierung einer Liste aller Assoziations-Regeln mit und
Achtung: Probabilistische Eigenschaft der Assoziations-
Regeln beachten: nicht unbedingt eingehalten
nicht unbedingt eingehalten
![Page 15: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/15.jpg)
Andere Algorithmen
Fast Algorithm for Mining Association Rules
15
AIS SETM
Knowledge Discovery Klassifikations Regeln Kausale Regeln Function fitting KID3
![Page 16: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/16.jpg)
Ablauf
Fast Algorithm for Mining Association Rules
16
1. Finden von Itemsets mit SupportDiese werden groß genannt, alle anderen klein
![Page 17: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/17.jpg)
Ablauf
Fast Algorithm for Mining Association Rules
17
1. Finden von Itemsets mit SupportDiese werden groß genannt, alle anderen klein
2. Nutze große Itemsets zur Generierung der Regeln:
![Page 18: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/18.jpg)
Ablauf
Fast Algorithm for Mining Association Rules
18
1. Finden von Itemsets mit SupportDiese werden groß genannt, alle anderen klein
2. Nutze große Itemsets zur Generierung der Regeln:
Sei ein großes Itemset Für jedes erzeuge Regel ,
wenn
![Page 19: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/19.jpg)
Finden großer Itemsets
Fast Algorithm for Mining Association Rules
19
Mehrere Durchläufe von
![Page 20: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/20.jpg)
Finden großer Itemsets
Fast Algorithm for Mining Association Rules
20
Mehrere Durchläufe von 1. Durchlauf:
Zähle Support von einzelnen Items
![Page 21: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/21.jpg)
Finden großer Itemsets
Fast Algorithm for Mining Association Rules
21
Mehrere Durchläufe von 1. Durchlauf:
Zähle Support von einzelnen Items k-ter Durchlauf:
Erzeuge neue Kandidaten aus großen Itemsets von vorherigen Durchläufen
Verwerfe Kandidaten mit zu geringem Support
![Page 22: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/22.jpg)
Finden großer Itemsets
Fast Algorithm for Mining Association Rules
22
Mehrere Durchläufe von 1. Durchlauf:
Zähle Support von einzelnen Items k-ter Durchlauf:
Erzeuge neue Kandidaten aus großen Itemsets von vorherigen Durchläufen
Verwerfe Kandidaten mit zu geringem Support Terminiere, wenn keine großen Itemsets mehr
gefunden werden
![Page 23: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/23.jpg)
Idee
Fast Algorithm for Mining Association Rules
23
Intuition: Jedes Subset eines großen Itemsets ist groß
![Page 24: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/24.jpg)
Idee
Fast Algorithm for Mining Association Rules
24
Intuition: Jedes Subset eines großen Itemsets ist groß
Finde Kandidaten für große k-Itemsets durch Kombination großer (k-1)-Itemsets
![Page 25: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/25.jpg)
Idee
Fast Algorithm for Mining Association Rules
25
Intuition: Jedes Subset eines großen Itemsets ist groß
Finde Kandidaten für große k-Itemsets durch Kombination großer (k-1)-Itemsets
Entferne alle Kandidaten, welche kleine Subsets enthalten
![Page 26: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/26.jpg)
Algorithmus Apriori
Fast Algorithm for Mining Association Rules
26
1. Schritt: Zähle Support 1-Items
![Page 27: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/27.jpg)
Algorithmus Apriori
Fast Algorithm for Mining Association Rules
27
1. Schritt: Zähle Support 1-Items
k-ter Schritt
![Page 28: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/28.jpg)
Algorithmus Apriori
Fast Algorithm for Mining Association Rules
28
1. Schritt: Zähle Support 1-Items
k-ter Schritt: Erzeuge neue
Kandidaten
![Page 29: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/29.jpg)
Algorithmus Apriori
Fast Algorithm for Mining Association Rules
29
1. Schritt: Zähle Support 1-Items
k-ter Schritt: Erzeuge neue
Kandidaten Durchsuche alle
Transaktionen Alle Kandidaten aus t Zähle den Support
hoch
![Page 30: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/30.jpg)
Algorithmus Apriori
Fast Algorithm for Mining Association Rules
30
1. Schritt: Zähle Support 1-Items
k-ter Schritt: Erzeuge neue Kandidaten Durchsuche alle
Transaktionen Alle Kandidaten aus t Zähle den Support hoch
Übernehme nur die mit genügend
Support
![Page 31: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/31.jpg)
Algorithmus Apriori
Fast Algorithm for Mining Association Rules
31
1. Schritt: Zähle Support 1-Items
k-ter Schritt: Erzeuge neue Kandidaten Durchsuche alle
Transaktionen Alle Kandidaten aus t Zähle den Support hoch
Übernehme nur die mit genügend
Support
![Page 32: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/32.jpg)
Algorithmus Apriori – Apriori-Gen
Fast Algorithm for Mining Association Rules
32
Besteht aus 2 Schritten 1. Schritt: Join (Kombination von zwei -
Itemsets)
und sind in den ersten Einträgen identisch
![Page 33: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/33.jpg)
Algorithmus Apriori – Apriori-Gen
Fast Algorithm for Mining Association Rules
33
Besteht aus 2 Schritten 1. Schritt: Join (Kombination von zwei -
Itemsets)
2. Schritt: Prune
und sind in den ersten Einträgen identisch
Entferne alle Kandidaten, welche kleine Subsets enthalten
![Page 34: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/34.jpg)
Algorithmus Apriori – Apriori-Gen
Fast Algorithm for Mining Association Rules
34
Beispiel:
Join:
Prune:
, da nicht in
![Page 35: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/35.jpg)
Algorithmus Apriori - Subset
Fast Algorithm for Mining Association Rules
35
Benutzt Hash-Tree
Hash-Wert in i-ter Ebene berechnet sich durch i-ten Item aus c
Laufzeit O(max(k, size(t)))
Wichtig:Items lexikographisch sortiert.
![Page 36: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/36.jpg)
Algorithmus Apriori - Problem
Fast Algorithm for Mining Association Rules
36
In jeder Iteration wird die gesamte Datenbank durchsucht!
![Page 37: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/37.jpg)
Modifikation - Algorithmus AprioriTid
Fast Algorithm for Mining Association Rules
37
Durchsucht die Datenbank nur einmal
![Page 38: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/38.jpg)
Modifikation - Algorithmus AprioriTid
Fast Algorithm for Mining Association Rules
38
Durchsucht die Datenbank nur einmal
Kandidaten werden auch hier mit apriori-gen erzeugt.
Zur Berechnung des Supports wird dann jedoch die Menge statt benutzt
![Page 39: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/39.jpg)
Modifikation - Algorithmus AprioriTid
Fast Algorithm for Mining Association Rules
39
Durchsucht die Datenbank nur einmal
Kandidaten werden auch hier mit apriori-gen erzeugt.
Zur Berechnung des Supports wird dann jedoch die Menge statt benutzt
Einträge von haben die Form <TID, > Idee: Speichere zu jeder Transaktion eine
Liste aller potentiell großen -Itemsets entspricht dabei der Datenbank
![Page 40: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/40.jpg)
Algorithmus AprioriTid - Beispiel
Fast Algorithm for Mining Association Rules
40
TID Items
100 1 3 4
200 2 3 5
300 1 2 3 5
400 2 5
TID Set-of-Itemsets
100 { {1}, {3}, {4} }
200 { {2}, {3}, {5} }
300 { {1}, {2}, {3}, {5} }
400 { {2}, {5} }
Minimum support = 2
Itemset Support
{1} 2
{2} 3
{3} 3
{5} 3
Itemset Support
{1 2} 1
{1 3} 2
{1 5} 1
{2 3} 2
{2 5} 3
{3 5} 2
TID Set-of-Itemsets
100 { {1 3} }
200 { {2 3}, {2 5}, {3 5} }
300 { {1 2}, {1 3}, {1 5}, {2 3}, {2 5}, {3 5} }
400 { {2 5} }
Itemset Support
{1 3} 2
{2 3} 2
{2 5} 3
{3 5} 2
Itemset Support
{2 3 5} 1
TID Set-of-Itemsets
200 { {2 3 5} }
300 { {2 3 5} }
Itemset Support
{2 3 5} 2
![Page 41: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/41.jpg)
Ergebnisse
Fast Algorithm for Mining Association Rules
41
Vergleich von Apriori und AprioriTid mit den Algorithmen AIS (Kandidaten für große Itemsets on-the-fly
erzeugen) SETM (on-the-fly, SQL optimiert)
![Page 42: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/42.jpg)
Ergebnisse
Fast Algorithm for Mining Association Rules
42
Vergleich von Apriori und AprioriTid mit den Algorithmen AIS (Kandidaten für große Itemsets on-the-fly
erzeugen) SETM (on-the-fly, SQL optimiert) AIS und SETM erzeugen sehr viel mehr Kandidaten
![Page 43: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/43.jpg)
Ergebnisse
Fast Algorithm for Mining Association Rules
43
Vergleich von Apriori und AprioriTid mit den Algorithmen AIS (Kandidaten für große Itemsets on-the-fly
erzeugen) SETM (on-the-fly, SQL optimiert) AIS und SETM erzeugen sehr viel mehr Kandidaten
Wie vergleichen? Mit synthetisch generierten Daten (welches
Modell?) (Reale Daten)
![Page 44: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/44.jpg)
Synthetische Daten
Fast Algorithm for Mining Association Rules
44
Gutes Modell für reales Käufer-Verhalten: Tendenz zum Kauf mehrerer Artikel gleichzeitig. Transaktionen haben eine typische Größe (Parameter
|T| ) Große Itemsets haben eine typische Größe
(Parameter |I|) Große Itemsets haben oft gemeinsame Items Nicht alle Artikel eines großen Itemsets werden
immer zusammen gekauft Weitere Parameter:
|D| Anzahl der Transaktionen N Anzahl Items (hier: N =1000) ...
![Page 45: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/45.jpg)
Ergebnisse
Fast Algorithm for Mining Association Rules
45
SETM Zeiten für T>5 sind sehr viel höher
![Page 46: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/46.jpg)
Ergebnisse
Fast Algorithm for Mining Association Rules
46
![Page 47: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/47.jpg)
Ergebnisse
Fast Algorithm for Mining Association Rules
47
Apriori ist bei großen Problemen besser als AprioriTid
![Page 48: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/48.jpg)
Vergleich Apriori – AprioriTid
Fast Algorithm for Mining Association Rules
48
AprioriTid benutzt statt . Passt in den Speicher, so ist AprioriTid
schneller als Apriori.
![Page 49: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/49.jpg)
Vergleich Apriori – AprioriTid
Fast Algorithm for Mining Association Rules
49
AprioriTid benutzt statt . Passt in den Speicher, so ist AprioriTid
schneller als Apriori. Wenn zu groß wird, passt es nicht in den
Speicher und die Ladezeiten erhöhen sich sehr (Schreiben/Lesen auf Festplatte).
![Page 50: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/50.jpg)
AprioriHybrid
Fast Algorithm for Mining Association Rules
50
Verwende Apriori in den ersten Iterationen Wenn als klein genug angenommen wird,
wechsle zu AprioriTid
![Page 51: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/51.jpg)
AprioriHybrid
Fast Algorithm for Mining Association Rules
51
Verwende Apriori in den ersten Iterationen Wenn als klein genug angenommen wird,
wechsle zu AprioriTid Verwende dazu eine Heuristik:
![Page 52: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/52.jpg)
AprioriHybrid
Fast Algorithm for Mining Association Rules
52
Verwende Apriori in den ersten Iterationen Wenn als klein genug angenommen wird,
wechsle zu AprioriTid Verwende dazu eine Heuristik:
Umschaltung verbraucht Zeit Ist meistens immer noch besser
![Page 53: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/53.jpg)
AprioriHybrid – Ergebnisse
Fast Algorithm for Mining Association Rules
53
AprioriHybrid ist meist noch besser als Apriori und AprioriTid
![Page 54: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/54.jpg)
Zusammenfassung
Fast Algorithm for Mining Association Rules
54
Assoziationsregeln sind ein wichtiges Werkzeug zur Analyse von Datenbeständen
![Page 55: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/55.jpg)
Zusammenfassung
Fast Algorithm for Mining Association Rules
55
Assoziationsregeln sind ein wichtiges Werkzeug zur Analyse von Datenbeständen
Es wurden Algorithmen vorgestellt, welche schneller und Ressourcensparender arbeiten als bisherige Ansätze
![Page 56: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/56.jpg)
Zusammenfassung
Fast Algorithm for Mining Association Rules
56
Assoziationsregeln sind ein wichtiges Werkzeug zur Analyse von Datenbeständen
Es wurden Algorithmen vorgestellt, welche schneller und Ressourcensparender arbeiten als bisherige Ansätze
AprioriHybrid schlägt AIS und SETM dabei um Größenordnungen bei großen Datenbeständen
![Page 57: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/57.jpg)
Zusammenfassung
Fast Algorithm for Mining Association Rules
57
Assoziationsregeln sind ein wichtiges Werkzeug zur Analyse von Datenbeständen
Es wurden Algorithmen vorgestellt, welche schneller und Ressourcensparender arbeiten als bisherige Ansätze
AprioriHybrid schlägt AIS und SETM dabei um Größenordnungen bei großen Datenbeständen
Aber: Was ist mit hierarchisch sortierten Daten? Beispiel: is-a-Beziehung (Spülmaschine ist ein
Küchengerät …) Regeln nicht immer sinnvoll (Rückgang #Piraten
Zunahme globale Erwärmung)
![Page 58: Fast Algorithm for Mining Association Rules Oliver Müller Künstliche Intelligenz II WS09/10 Leibniz Universität Hannover](https://reader034.vdocuments.mx/reader034/viewer/2022051819/55204d6949795902118be9b5/html5/thumbnails/58.jpg)
Fast Algorithm for Mining Association Rules
58