sisteme de recomandare 1

24
Sisteme de recomandare Lupuleţ Corneliu Neculciu Filip Velişcu Ovidiu Ţambrea Constantin Tăbărana Cristian

Upload: doinny

Post on 08-Nov-2015

60 views

Category:

Documents


2 download

DESCRIPTION

vcc

TRANSCRIPT

  • Sisteme de recomandareLupule CorneliuNeculciu FilipVelicu Ovidiuambrea ConstantinTbrana Cristian

  • Un sistem de recomandare este un instrument care ncearc s prezinte utilizatorilor, obiecte i noiuni de interes pentru acetia (filme, muzic, tiri, imagini, persoane).

    Sisteme de recomandare Recomandarea se face pe baza cunoaterii (explicit sau implicit) a profilului utilizatorului (modelul depreferine)

  • Descriere formalU mulimea utilizatorilorA mulimea articolelor cunoscute de sistem (i care pot fi recomandate) funcie care msoar interesul unui utilizator pentru un anumit articol

    Scopul

    De a estima ct mai bine aceast funcie npunctele n care nu este definit, adic de a prezice ce anume este posibil s-i plac (i ctde mult) unui utilizator ale crui gusturi apreciem c sistemul le cunoate.

  • Clasificare Construirea profilului utilizatorului se poate face n mod:explicit - sistemul cere informaii de la utilizatori (ex: note acordate filmelor)implicit -prin analiza articolelor sau paginilor web vizitate

    n funcie de tehnica de estimare folosit, existrecomandri bazate pe coninutrecomandri colaborative

    Filtrare colaborativ:utilizatorarticolatribut

  • ProblemeLa sistemele bazate pe filtrare colaborativ centrat pe utilizatori exist douprobleme bine-cunoscute:

    First-Rater Problem - Problema articolelor nou introduse n baza de date;

    Cold-StartProblem - Problema utilizatorilor nou venii n sistem

  • Item-based filteringFiltrare user-based- probleme de scalabilitate

    Item-based- avantaj -procesul de determinare a similaritii ntre articole poate fi independent decel de prezicere (recomandare)i poate fi realizat offline.

    Poate fi mbuntit cu informaiisemantice provenite din alte surse (ex: ontologii specifice domeniului)

    Se poate folosi tehnica "Latent Semantic Indexing" (LSI)pentru reducerea dimensiunii matricii iniiale(item, item) la un grup restrns de atribute strns corelate.

  • - Google News - Amazon - Yahoo Movies! - iTunes - Youtube - StumbleUpon - Photoree - BookLamp

    Exemple de Sisteme

  • Crearea unui profilProbleme:sistemul are nevoie de multe informaii pentru a funciona cu o precizie acceptabil

    utilizatorul nu are: timpuldorinacunotineles dea explicit toate informaiile de care sistemul are nevoie

  • Solutia Google: Web History Web History este o facilitate introdus de Google pentru a reine ce pagini a vizitat utilizatorul.

  • Avantaje/DezavantajeAvantaje:adun date foarte repedeodat format, sistemul este foarte stabil - anomaliile de comportament cauzate de curiozitate, greeli, etc. au efect neglijabil

    Dezavantaje:cold-start - sunt prezentate subiectele cele mai populare, nu neaprat cele mai interesante pentru utilizatorul curentfuncioneaz doar dac utilizatorul e logat pe contul de google i a activat Web Historypoate fi lent in detectarea schimbrilor de preferine

  • StumbleUponcomunitate Webfaciliteaz descoperirea de site-urisistem de recomandare bazat pe utilizatorpeers (utilizatori cu "gusturi" similare)friends (alei de utilizator)filtrare colaborativ (eng. "colaborative filtering")automatizeaz "word of mouth"

  • Principiile sistemului

  • Filtrare colaborativ bazat pe utilizator

  • Avantaje / dezavantajeAvantaje:vitezapractic pentru numr uria de site-uri comparativ cu analiza de coninut

    Dezavantaje:"First-Rater" problem"Cold-Start" problemrating-uri subiective

  • Exemplu de utilizare

  • Yahoo Movies! Industria filmelor este foarte vast. Din acest motiv, a fost necesar un algoritm de recomandare diferit, optimizat i pentru filme vizionate de ctre puini utilizatori. Sistemul folosit de Yahoo Movies! se bazeaz pe motorul de recomandare fcut de Choice Stream: Modelarea bayesian a preferinelor pe baza atributelor (eng. Attributed Bayesian Choice Modelling).

  • Attributed Bayesian Choice Modelling

  • Avantaje/dezavantajeAvantaje:"First-Rater" Problem dispare"Cold-Start" Problem este atenuat Eficienta recomandrilorDezavantaje:Alegerea valorilor atributelor este subiectiv

  • Exemple de utilizare - Yahoo Movies!

  • Genius Genius este un feature introdus n aplicaia iTunes ncepnd cu versiunea 8genereaz automat o list de melodii similare cu melodia curentpentru utilizare este nevoie de cont iTunesGenius va colecta periodic informaiile legate de utilizator i bibliotecile personale de melodii i le va trimite n mod anonim la baza de date Apple Genius analizeaz metadatele melodiilor(ritmul, ratingurile, poziia n playlisturi)se presupune ca Genius creeaz amprenta acustic a melodiilorstrategie comercial

  • Mod de Utilizare

  • Avantaje/DezavantajeAvantaje:Genius este un feature util userilor care vor s asculte melodii "nrudite" sau chiar s le cumpereDezavantaje:trimiterea datelor n anonimat reduce Genius doar la un sistem bazat pe iteminclinatie spre comercial i nu spre utilizator

  • BibliografieSemantically Enhanced Collaborative Filtering on the Web:http://maya.cs.depaul.edu/~mobasher/papers/ewmf04-web/ewmf04.htmlItem based collaborative filtering recommendation algorithms:http://www.cs.tau.ac.il/~fiat/dmsem03/ItemBasedCollaborativeFilteringRecommendationAlgorithms.pptStumbleUpon's recommendation technology:http://www.stumbleupon.com/technology/

    Google Newshttp://www.searchenginejournal.com/google-news-adds-most-popular-recommended-sections/2809/

    Collaborative Filtering vs Attributed Bayesian Choice Modellinghttp://behavioraltargeting.info/downloadattachment.php?aId=cf74d490a8b97edd535b4ccdbfd0df55&articleId=31

  • V Mulumim!ntrebri ?

    Un exemplu de sistem bazat pe atribut este Yahoo Movies!. Un anumit obiect, in acest caz un film, este notat pe baza unor atribute precum nivel de umor, actiune, emotie etc. Aceste atribute vor fi folosite pentru a vedea daca un film/obiect se potriveste profilului utilizatoruluiProblema articolelor nou introduse n baza de date (First-Rater Problem).Pentruacestea nu exist la momentul introducerii lor un numr minim de calificativeacordate de utilizatori, pentru a putea face recomandri pe baza acestora.

    n mod similar apare problema utilizatorilor nou venii n sistem (Cold-StartProblem), despre care nu exist, la nceput, suficient de multe informaii pentru aputea determina preferinele si face recomandriObservm principiul general de funcionare al motorului de recomandare: - Se ia un set complet de date clasificate pe baza atributelor; - Se face o analiz a preferinelor utilizatorului, prin lista sa de filme favorite, notele date, chestionare sau alegeri fcute de utilizatori cu profil similar; - Se realizeaz profilul utilizatorului; - Se dau note la fiecare obiect din setul de date i le ordoneaz pe baza preferinelor utilizatorului (n exemplul anterior, vor fi recomandate filme precum Bridget Jones Diary, When Harry Met Sally, The Usual Suspects, Memento, deoarece utilizatorul are preferine pentru filme romantice sau filme pline de mister);