collaborative filtering.. für automatische empfehlungen
DESCRIPTION
Collaborative Filtering (kurz CF) beschreibt die Technologie um aus Präferenzen Vieler auf das Interesse des Einzelnen zu schließen. Dazu werden die gesammelten Informationen korreliert um Ähnlichkeiten zwischen Benutzern (\"User Based CF\") oder Items (\"Item Based CF\") zu ermitteln. Aus diesen Ähnlichkeiten werden Vorhersagen zur potentiellen \"Likeliness\" getroffen. Das ist die Bewertung, die ein Benutzer dem Item vermutlich geben würde.TRANSCRIPT
![Page 1: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/1.jpg)
1
![Page 2: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/2.jpg)
2
![Page 3: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/3.jpg)
3Definition
● Collaborative Filtering schneidet Informationen automatisch auf den Betrachter zu
● Zeit der Informationsbeschaffung wächst im Alltag durch Menge verfügbarer Informationen
● Aussagen basieren auf Wissen über Ähnlichkeit zwischen Benutzern oder zwischen Items
● Genutzt zur Minimierung ungewollter oder zur Empfehlung neuer Items
![Page 4: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/4.jpg)
4Informationsfilter
![Page 5: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/5.jpg)
5Aggregation
![Page 6: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/6.jpg)
6Funktionsweise
![Page 7: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/7.jpg)
7Aggregation
● Aggregieren Daten sammeln≈
● Explizit durch Abgabe einer Bewertung
– zum Beispiel durch Sterneleiste– Mehraufwand für Anwender
● Implizit durch Kauf oder Weblog
– Komfortabel für Benutzer– Vertrauen in System? Transparenz?
AggregationKorrelationEmpfehlung
![Page 8: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/8.jpg)
8Korrelation
● Korrelation ≈ Beziehung zwischen Präferenzen● Amazon Paradigma: „Ähnliche Produkte“
AggregationKorrelationEmpfehlung
![Page 9: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/9.jpg)
9Korrelation
AggregationKorrelationEmpfehlung
![Page 10: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/10.jpg)
10Korrelation
AggregationKorrelationEmpfehlung
![Page 11: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/11.jpg)
11Korrelation
AggregationKorrelationEmpfehlung
![Page 12: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/12.jpg)
12Empfehlungen
AggregationKorrelationEmpfehlung
![Page 13: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/13.jpg)
13Empfehlungen
AggregationKorrelationEmpfehlung
![Page 14: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/14.jpg)
14Empfehlungen
AggregationKorrelationEmpfehlung
![Page 15: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/15.jpg)
15Modellierung
● Grundsätzliche Unterscheidung:● Memory Based: Alle Bewertungen live● Model Based: Verschiedene Abstraktionen
● Clusterverfahren● Singulärwertzerlegung (SVD)
● Vergleich verschiedener Ansätze durch Prognosefehler
![Page 16: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/16.jpg)
16Model Based CF
● Clusterverfahren● KMeans = „partitionierendes Verfahren“
1) Clusterzentren werden zufällig platziert2) Bei jeder Iteration werden sie verschoben
![Page 17: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/17.jpg)
17Model Based CF
● Singulärwertzerlegung
1) Zerlegung in 3 spezielle Matrizen
2) Ränge eliminieren
„S“ Matrix als Gewichtung absteigend sortiert
![Page 18: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/18.jpg)
18Model Based CF
● Singulärwertzerlegung
![Page 19: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/19.jpg)
19
![Page 20: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/20.jpg)
20Normierung
● Mehrzahl der Bewertungen orientieren sich am Durchschnitt
● Normierung = Näherung an Durchschnittswerte
– Benutzerdurchschnitt (+6.6% Optimierung)– Itemdurchschnitt (+6.8 % Optimierung)– usw...
![Page 21: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/21.jpg)
21Nachbarschaft
● weniger Nachbarn = weniger Verschwimmen● Auswahl nach Mindestähnlichkeit oder Grenze
Quelle: HERL02, 235
![Page 22: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/22.jpg)
22Nachbarschaft
● Bestes Resultat: Sortierte Liste mit Limit=60
![Page 23: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/23.jpg)
23Varianz
Item Varianz (0.4%)● hohe Kontroverse =
hohe Aussage
Benutzer Varianz (+0.7%)● hohe Varianz einer
Bewertung = ...
a) hohe Aussage?
b) Manipulation?
![Page 24: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/24.jpg)
24Cross Domain
● Korrelation einer Domain (z.B. „News“) nutzen, um in anderer Domain (z.B. „Sport“) Empfehlungen zu geben
● Zentrale Plattform im Hintergrund● Domains besitzen getrennte Items● Überschneidungen nur bei Benutzern● Konfiguration je Domain möglich (z.B. Zeitlimit)
![Page 25: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/25.jpg)
25Cross Domain
![Page 26: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/26.jpg)
26Schlussbetrachtung
● plista!
BASIS
Test am MovieLens Datensatz [ML]
Normierung auf Schnittmenge
Limit auf 60 Nachbarn Vektoren
Distanz
Normierung an Skala
Nischenproduktezur Usersim
Anzahl gemeinsamerBewertungen als Faktor
● Normierung auf Schnittmenge● Limit auf 60 Nachbarn● Anzahl gemeinsamer Bewertungen als Auswahl
![Page 27: Collaborative Filtering.. für automatische Empfehlungen](https://reader034.vdocuments.mx/reader034/viewer/2022052120/558de5301a28abe7428b46a9/html5/thumbnails/27.jpg)
27Quellen
● [HERL02] Jonathan L. Herlocker, Joseph A. Konstan, Al Borchers, John Riedl, 1999, http://portal.acm.org/citation.cfm?id=312624.312682
● [ML] MovieLensProjekt, Universität Minnesota (USA), Datensatz mit 1 Mio Bewertungen, http://www.movielens.org (Stand 12.09.2008)
● [BELL2] Robert M. Bell and Yehuda Koren, 2007, http://www.cs.uic. edu/liub/KDDcup2007/proceedings/NeighborKoren.pdf
● [RESNICK] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, J. Riedl An Open Architecture for Collaborative Filtering of Netnews, 1994
● [BREESE] John S. Breese, David Heckerman, Carl Kadie, 1998, http://research.microsoft.com/research/pubs/view.aspx?tr_id=166 (Stand: 29.09.2008)