search engines and web advertising

90
Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Upload: walker-clay

Post on 31-Dec-2015

28 views

Category:

Documents


0 download

DESCRIPTION

Search Engines and Web Advertising. Antonio Panciatici ISTI-CNR. The Advertising market. Internet 2006: first half 2006 vs. first half 2005 (+18.9%). The Advertising market. Tecniche di Advertising. Flash Richiedono Flash Player Immagini GIFs animate, JPEGs Sponsored links - PowerPoint PPT Presentation

TRANSCRIPT

Search Engines and Web Advertising

Antonio PanciaticiISTI-CNR

The Advertising market

Internet 2006: first half 2006 vs. first half 2005 (+18.9%)

The Advertising market

Tecniche di Advertising

Flash Richiedono Flash Player

Immagini GIFs animate, JPEGs

Sponsored links Text Based Ads (Search-Based

Advertising or Content-Targeted Advertising)

Our Focus

Search-Based Advertising: ogni volta che l’utente immette una query, il motore di ricerca mostra gli Ads più rilevanti nella pagina dei risultati Le keywords contenute nella query vengono confrontate

con quelle selezionate dall’advertiser

Content-Targeted Advertising: ogni volta che l’utente visita una pagina di contenuto (trigger page), il motore di ricerca mostra gli Ads più rilevanti nella pagina stessa Il contenuto della pagina visitata viene confrontato con

keywords selezionate dall’advertiser

Search-Based Advertising

AdvertisementKeyword

Advertisementspiù rilevanti

Content-Targeted Advertising

Ad

Key Points

Punto di vista dell’advertiser Quali keyword comprare (problema del

matching) ? Quanto pagare (problema del pricing) ?

Punto di vista del motore di ricerca Come suggerire buone keyword (problema del

matching) ? Come far pagare le keyword (problema del

pricing) ? Come mostrare gli advertisers più rilevanti

(problema del ranking) ?

Key Points

Se l’advertisement è rilevante il motore di ricerca guadagna, sia da un punto di vista economico sia dal punto di vista della credibilità

Se l’advertisement è rilevante aumenta la probabilità che anche l’advertiser guadagni

Il problema del matching

Il problema del matching varia in base al tipo di advertising che si adotta Search-based Advertising Content-targeted Advertising

Search-Based Advertising

Advertisement = (Keywords, titolo, descrizione, URL)

Query = (Search keywords, contesto)

Il processo di matching è keyword-driven

Search-Based Advertising

AdvertisementKeyword

Advertisementspiù rilevanti

Titolo

Descrizione

URL

Content-Targeted Advertising

Advertisement = (Keywords, titolo, descrizione, URL)

Query = (Triggering page, contesto)

Il processo di matching riguarda il contenuto di una pagina (molte keywords)

Search-Based Advertising

Problema principale: poche informazioni (sostanzialmente solo le kewords)

Ranking dipende anche da quanto hanno offerto gli advertisers

Content-Targeted Advertising

Problema principale: gap semantico Linguaggi differenti (esempio bottiglia,

bottle, contesti diversi) Sinonimi Matching approssimato ?

Algoritmi per il matching (Content-Targeted Advertising)

Impedance Coupling in Content-tergeted Advertising(Berthier Ribero-Neto, Paulo B. Golpher, Marco Cristo, Edleno Silva de Moura)

Impedance Coupling in Content-targeted Advertising

Due diversi insiemi di algoritmi matching diretto tra il contenuto della pagina

(trigger page) il testo dell’advertisement e le keywords associate

matching tra il contenuto della pagina arricchita con nuove keywords. Approccio giustificato dal fatto che spesso I vocabolari della pagina e dell’advertisement sono diversi (Vocabulary impedance)

Impedance Coupling in Content-targeted Advertising

Advertisement composto da un titolo, una descrizione e un URL

p trigger page A insieme di advertisements ai si vuole effettuare il ranking degli

advertisements ai rispetto a p

Impedance Coupling in Content-targeted Advertising

Vector Space Model Vettori dei pesi della query e del documento q = (w1q,…,wiq,…,wnq)

dj = (w1j,…,wij,…,wnj)

wiq = peso associato al termine ti nella query q

wij = peso associato al termine ti nel documento dj I pesi sono calcolati utilizzando tf-idf (prodotto

term frequency, inverse document frequency) (tf = importanza del termine nel documento, idf =

rarity del termine nel documento)

Il ranking della query q rispetto al documento dj è il seguente (cosine similarity formula)

Impedance Coupling in Content-targeted Advertising

Impedance Coupling in Content-targeted Advertising

Primo algoritmo (AD) Matching contenuto dell’ advertisement (titolo +

descrizione) e il contenuto della trigger page

AD(p, ai) = sim(p, ai)

Impedance Coupling in Content-targeted Advertising

Secondo algoritmo (KW) Matching keyword (può essere composta

da più termini) associate all’advertisement e il contenuto della pagina p

KW(p, ai) = sim(p, ki)

Impedance Coupling in Content-targeted Advertising

Terzo algoritmo (AD_KW) Molte volte le keyword scelte

dall’advertiser sono presenti anche nell’advertisement. Si può usare questa informazione per migliorare AD.

Matching dell’advertisement e le sue keyword con il contenuto della pagina p

AD_KW(p, ai) = sim(p, ai ki)

Impedance Coupling in Content-targeted Advertising Quarto algoritmo (ANDKW)

Molte volte le keyword scelte dall’advertiser non sono presenti nella pagina p anche se l’advertisement può avere un rank alto. Si può pensare che la presenza delle keyword nella pagina p fornisca un indicatore della rilevanza dell’advertisement (le keyword danno una sintesi dell’advertisement)

Matching dell’advertisement forzando la presenza delle keyword nella pagina p

sim(p, ai) se ki pANDKW(p, ai) =

0 altrimenti

Impedance Coupling in Content-targeted Advertising Quinto algoritmo (AD_ANDKW)

Matching dell’advertisement e delle sue keyword forzando la loro presenza nella pagina p

sim(p, ai ki ) se ki p

AD_ANDKW(p, ai) =

0 altrimenti

Algoritmo migliore tra tutti quelli visti fino ad ora

Impedance Coupling in Content-targeted Advertising

Problemi La trigger page appartiene ad un

contesto più ampio di quello relativo all’advertisement

La correlazione tra l’advertisement e la trigger page può essere legato a topic che non compaiono esplicitamente nel contenuto della pagina

Impedance Coupling in Content-targeted Advertising

Il primo problema è dovuto al fatto che il contenuto delle pagine può riguardare qualsiasi argomento. L’advertisement è molto coinciso e mirato per sua natura

Il secondo problema è dovuto al fatto che molte volte gli advertiser scelgono keyword generiche che non coincidono con i termini specifici contenuti nella pagina (vino, chianti)

Impedance Coupling in Content-targeted Advertising

Algoritmi Impedance Coupling per ridurre i problemi esposti sopra Idea di base: aggiungere nuove parole

(termini) più generali alla trigger page Per farlo analizza i vocabolari di

documenti simili alla ricerca di termini generali che possano caratterizzare meglio il contenuto della pagina p

Impedance Coupling in Content-targeted Advertising

Bayesian Network Model per determinare la probabilità che un termine ti sia un buon candidato a rappresentare il contenuto della pagina p

Impedance Coupling in Content-targeted Advertising P(Ti | R) probalità che il termine ti sia un buon candidato

a rappresentare il contenuto della pagina p R nodo nella Bayesian Network rappresentante la

nuova pagina r (pagina p con nuovi termini) 0 ≤ ≤ 1 ( = 0 R = p) constante di normalizzazione wij peso associato al termine ti nel documento dj (dj

documento simile a p) d0 = p

Impedance Coupling in Content-targeted Advertising

Si effettua il ranking dei termini ti in base alla loro bontà ttop quello per cui vale maxt P(Ti | R)

(quello con il rank più alto) Aggiunge alla pagina p (trasformandola nella

pagina r) tutti i termini per cui P(Ti | R) / P(Ttop | R) ≥ (in questo caso = 0.05)

Impedance Coupling in Content-targeted Advertising

Sesto algoritmo (AAK_T) Matching dell’advertisement e keywords

solo rispetto al set e dei nuovi termini

AAK_T(p, ai) = AD_ANDKW (e, ai)

Impedance Coupling in Content-targeted Advertising

Settimo algoritmo (AAK_EXP) Matching dell’advertisement e keywords

rispetto alla pagina estesa r (termini in p + termini in e)

AAK_EXP(p, ai) = AD_ANDKW (p e, ai)

Impedance Coupling in Content-targeted Advertising

Ottavo algoritmo (H) Matching della landing page

dell’advertisement rispetto alla pagina p. Giustificato dal fatto che landing page (hyperlink della landing page hi) dell’advertiser descrive il target reale dell’advertisement

H(p, ai) = sim (p, hi)

Impedance Coupling in Content-targeted Advertising

Nono algoritmo (AAK_H) Combinazione di AD_ANDKW con H Matching dell’advertisement, delle keyword,

della landing page rispetto alla pagina p forzando la presenza delle keyword nella pagina p

sim(p, ai hi ki) se ki p

AAK_H(p, ai) =

0 altrimenti

Impedance Coupling in Content-targeted Advertising

Decimo algoritmo (AAK_EXP_H) Combinazione di AD_EXP con H Matching dell’advertisement, delle keyword, della

landing page rispetto alla pagina p forzando la presenza delle keyword nella pagina p e

sim(p e, ai hi ki) se ki p e

AAK_H(p, ai) =

0 altrimenti

Impedance Coupling in Content-targeted Advertising

AAK_EXP_H ottiene i risultati migliori (tra tutti gli algoritmi), abbastanza naturale dato che utilizza tutte le possibili fonti di informazioni

Performance

Nel content-targeted advertising gli advertisements sono associati alle pagine quando le pagine vengono pubblicate

Tutte le informazioni (landing pages, triggering page, etc..) sono ottenute tramite page crawling, link crawling, sono ottenibili off-line

Gli advertisement che arrivano a run-time possono essere assegnati alle pagine già pubblicate in modo off-line

Se ne deduce che il problema della performance non è critico

Algoritmi per Search-Based Advertising

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

(Paat Rusmevichientong, David P. Williamson)

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Il problema: dato un budget giornaliero e una probabilità di click-through non conosciuta, fornire un algoritmo in grado di selezionare le keyword da acquistare in modo da massimizzare il guadagno medio

Punto di vista dell’advertiser

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Supponendo di avere N keywords rappresentate dai numeri {1, 2, 3,…, N}

Per ogni A {1, 2, 3,…, N} , sia ZA la variabile aleatoria (v.a) che indica il profitto che si ottiene se si seleziona l’insieme di keyword da A

Sia = (A1, A2,…) una politica, cioè una sequenza di v.a. At indica l’insieme di keyword che l’advertiser seleziona nel periodo t. At può dipendere dalle osservazioni al tempo t-1

Per tutti i T ≥ 1 quello che si vuole trovare è una politica = (A1, A2,…) tale che sia massimo:

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Alcune osservazioni Il costo totale dipende dal numero di click Massimizzare il guadagno, dato un certo budget,

richiede la conoscenza della probabilità di click-through dell’advertisement associato ad una data keyword.

La probabilità di click-through non è conosciuta (si può determinare osservando il comportamento delle keyword per un dato periodo, però può avere un costo notevole)

La maggior parte degli algoritmi assume la conoscenza di una stima della probabilità di click-through

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

L’approccio seguito dagli autori è quello di trovare un trade-off tra le keyword selezionate basandosi sulle performance passate, e le keyword selezionate tra quelle mai usate

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

L’algoritmo parte dal caso in cui si conosce la probabilità di click-through e poi fornisce anche una tecnica che elimina questa restrizione

Noi vedremo solo il caso in cui si conosce la probabilità di click-through, il modello che definiremo in realtà vale per entrambi i casi

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello: Spazio di probabilità (, F, P) N keyword {1, 2, 3,…, N}

Per ogni t ≥ 1 sia St una v.a rappresentante il numero totale di search query arrivate nel periodo t

S1 , S2, … sono indipendenti ed identicamente distribuite con media 1 < < ∞

Supponiamo di conoscere St

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello (continua): In ogni periodo, le query arrivano in modo

sequenziale ed ogni query può essere una delle N keyword {1, 2, 3,…, N}

Per ogni t ≥ 1 e r ≥ 1 sia Qtr una v.a

rappresentante la keyword associata alla query r arrivata nel periodo t

Qtr sono indipendenti ed identicamente distribuite

e P{ Qtr = i } = i con i {1, 2, 3,…, N} e i =1

Supponiamo di conoscere i

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello (continua): Il budget in ogni periodo è 1€ (non si perde di

generalità) pi probabilità di click-through per keyword i {1,

2, 3,…, N}, con 0 pi 1

ci (CPC) cost per click

Supponiamo di conoscere ci rimane costante

i guadagno per click con la keyword i

Supponiamo di conoscere i rimane costante

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello (continua): At indica l’insieme di keyword che l’advertiser

seleziona nel periodo t Br

At budget rimanente al periodo t quando la query r viene immessa e l’advertiser ha scelto di selezionare le keywords in At

Xtri variabile aleatoria di Bernulli con parametro pi

(probabilità di click-through) P{Xtri = 1} = pi

Per ogni i con t ≥ 1 e r ≥ 1 vale che Xtri sono

indipendenti ugualmente distribuite Xt

ri indipendenti dall’arrivo delle query

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Dato il modello visto si ha che

1(.) funzione indicatrice i At (l’advertiser effettua un offerta sulla keyword i all’inizio

del periodo t) Qt

r = i (la query r-esima corrisponde alla keyword i)

BrAt ≥ ci (c’è abbstanza budget per pagare il costo della

keyword i se l’utente va sull’advertisement) Xt

ri = 1 (l’utente effettivamente va sull’advertisement)

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Supponendo di conoscere pi il problema diventa(static binding problem)

Non è più dipendente dal tempo ! S numero di query Br

A budget rimasto quando la query r-esima viene immessa e l’advertiser ha scelto di selezionare le keywords in A

Xri variabile di Bernulli (indica se l’utente va sull’advertisement relativo alla keyword i durante l’arrivo della query r-esima)

Così formulato, il problema è NP-completo (stochastic knapsack problem) se pi = 1 per ogni i il problema dello zaino standard

Gli autori forniscono un algoritmo approssimato (trova soluzione near-optimal) sotto alcune ipotesi

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Ipotesi Le keyword sono ordinate in modo discendente

secondo il rapporto profitto/costo 1/c1≥ 2/c2 ≥… ≥ N/cN

icipii > 1 (i probabilità query che r-esima contenga la keyword i) si possono aggiungere keyword fittizie con = 0 in modo da ottenere questa disequazione

Esistono k ≥1 e 0 ≤ < 1 tali che ci ≤ 1/k e i ≤ k per tutti gli i (i = numero medio di query contenenti la keyword i)

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Le ipotesi sopra sono derivate da esperimenti su dati reali Teorema: siano k e definiti secondo le ipotesi, supponendo di

conoscere pi e supponendo anche che 1/k + 1/k1- + 1/k(1-)/3 ≤ 1

si definisce

Intuitivamente significa cercare il valore l tale che il costo delle prime {1,...,l} keyword ordinate secondo le ipotesi non ecceda il budget

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Se = E[min {S,}] / (misura quanto la distribuzione del numero delle query è vicina alla propria media)

Se P = {1,2,…,Iu} e Z* il profitto ottimo abbiamo

Il problema del Pricing(Search-based Advertising)

Ogni keyword è un mercato nel quale gli advertisers competono per avere la posizione migliore

Il mercato varia in base alle keywords Per ogni keyword competono molti

advertisers, quali di questi devono essere visualizzati ?

Il motore di ricerca utilizza uno schema di pagamento PPC (Pay per Click). Quanto devono pagare per ogni click ?

Il problema del Pricing(Search-based Advertising)

Scenario Una keyword (un mercato) Un insieme di compratori (Advertisers) Un venditore (motore di ricerca) Ogni compratore ha una sua funzione di pay-off

Come organizzare il pricing in modo che tutti siano soddisfatti ?

Game Theory

“Game Theory is a bag of analytical tools designed to help us understand the phenomena that observe when decision-makers interact”. (Martin J. Osborne, Ariel Rubistain, A Course in Game Theory)

Game Theory

Alcuni concetti importanti Gioco strategico Equilibrio di Nash

Giochi legati al Web Advertising Aste generalizzate di secondo prezzo

(GSP)

Game Theory

Ipotesi I giocatori hanno un comportamento razionale e sfruttano

le loro conoscenze su strategie e comportamenti (conosciuti) degli altri giocatori

Non c’è cooperazione tra giocatori (Giochi non cooperativi)

Strategic Game: Ogni giocatore sceglie la sua strategia una volta per tutte, tutti i giocatori prendeno le loro decisioni simultaneamente (dal punto di vista del gioco). Quando un giocatore adotta una strategia non è informato della strategia adottata dagli avversari

Strategic Game (due giocatori)

Due giocatori Il giocatore i-esimo adotta un insieme di

strategie Ai non vuoto, con ai Ai strategia pura Il giocatore i-esimo è rappresentato da una

funzione di pay-off ui : A -> R dove A = A1 x A2

Nota: ui dipende anche da ciò che fanno gli altri giocatori

Game Theory

Chiameremo profilo il vettore a = (a1 , a2) con a1 A1 e a2 A2

Diremo che una strategia aj è weakly-dominant per il giocatore i-esimo se

ui(aj,*) ≥ ui(ak,*) per ogni ak Ai indipendentemente da quale sia la strategia degli altri giocatori

Diremo che una strategia aj è strongly- dominant per il giocatore i-esimo se

ui(aj,*) > ui(ak,*) per ogni ak Ai indipendentemente da quale sia la strategia degli altri giocatori

Equilibrio di Nash

Un equilibrio di Nash in un gioco strategico<N=(1,2), (A1 , A2), (u1 , u2)> con due giocatori, è un profilo a* = (a*

1 , a*2) tale che

u1 (a*1 , a*

2 ) ≥ u1(ai , a*2 ) for all ai A1

u2 (a*1 , a*

2 ) ≥ u2(a*1 , aj ) for all aj A2

Intuitivamanente: fissate le strategie degli altri giocatori, nessun giocatore è incentivato a cambiare la propria

Game Theory

Esempi di giochi strategici con strategie pure Due giocatori

Dilemma del Prigioniero, Back o Stravinsky, etc..

Aste Aste di secondo prezzo (Vickrey Auction) Generalized Second Price Auction (GSP) Vickrey

(Aste legate al Web Advertising)

Il Dilemma del Prigioniero

Due sospetti sono messi in due celle diverse Se confessano entrambi vengono

condannati entrambi a tre anni Se uno solo di essi confessa, questo viene

liberato e la sua testimonanzia viene utilizzata per condannare a quattro anni l’altro

Se nessuno dei due confessa vengono entrambi condannati ad un anno

Il Dilemma del Prigioniero

3 4

0 1

3 0

4 1

Confessa

Non confessaConfessa

Non confessa

Confessa Non confessa

Confessa

Non confessa

Esiste un solo equilibrio di Nash (Confessa, Confessa), non è l’ottimo Confessare è una strategia strongly-dominant L’ottimo è (Non confessa, Non confessa) ma non è un equilibrio !

Nash Equilibrium

Un equilibrio di Nash in un gioco strategico <N, (Ai), (≥i)> è un profilo a* in A di azioni con la proprietà che per ogni giocatore i N vale

(a*-i , a*

i ) ≥i (a*-i , ai) for all ai Ai

Dove Per ogni giocatore i N esiste una relazione di

preferenza ≥i definita su A = Xj NAj

a-i = (aj) j N/i

Nash Equilibrium

Per giochi strategici con un numero qualsiasi di partecipanti (N ≥ 2) può esistere un equilibrio di Nash, più di uno, o anche nessuno

Equilibrio di Nash (generale) Se per ogni giocatore i l’insieme Ai è compatto e convesso, e ≥I è

continua e quasi concava allora il gioco strategico <N, (Ai), (≥i)> ha un equilibrio di Nash

Ogni gioco strategico finito (se ogni Ai finito) con strategie miste ha un equilibrio di Nash

Asta di primo prezzo

Asta di primo prezzo Lo scopo è assegnare un oggetto ad uno tra N possibili compratori Ogni giocatore i ha una sua stima (privata) vi del valore

dell’oggetto vi > 0 per ogni i Simultaneamente, ogni giocatore i fa un offerta bi

privata (offerta strategia) L’oggetto viene assegnato al giocatore che offre di più

(se ce ne è più di uno, in modo random) Per avere l’oggetto, il vincitore paga la sua offerta

Dire la verità non è una strategia dominante !

Asta di secondo prezzo

Asta di secondo prezzo (Asta di Vickrey) Lo scopo è assegnare un oggetto ad uno tra N possibili

compratori Ogni giocatore i ha una sua stima (privata) vi del valore

dell’oggetto vi > 0 per ogni i Simultaneamente, ogni giocatore i fa un offerta bi

privata (offerta strategia) L’oggetto viene assegnato al giocatore che offre di più

(se ce ne è più di uno, in modo random) Per avere l’oggetto, il vincitore paga la seconda offerta

più alta

Per ogni giocatore i, offrire il massimo possibile (bi = vi) è una strategia weakly-dominant. Infatti, posto ri = max(bj) per ogni j ≠ i si ha

0 se bi ≤ ri

ui = vi - ri se bi > ri

Supponiamo bi > vi allora

Se ri ≥ bi ui = 0 lo stesso guadagno ottenibile offrendo vi

Se ri ≤ vi ui = vi - ri lo stesso guadagno ottenibile offrendo vi

Se vi < ri < bi ui = vi - ri < 0 offrendo vi ui = 0

Asta di secondo prezzo

Per ogni giocatore i, offrire il massimo possibile (bi = vi) è una strategia weakly-dominant. Infatti, posto ri = max(bj) per ogni j ≠ i si ha

0 se bi ≤ ri

ui = vi - ri se bi > ri

Supponiamo bi < vi allora

Se ri ≥ vi ui = 0 lo stesso guadagno ottenibile offrendo vi

Se ri ≤ bi ui = vi - ri lo stesso guadagno ottenibile offrendo vi

Se bi < ri < vi ui = 0 se il giocatore avesse offerto vi ui = vi - ri

Asta di secondo prezzo

Asta di secondo prezzo

Esiste un equilibrio di Nash in cui tutti i giocatori offrono la loro stima del valore dell’oggetto

Asta generalizzata di secondo prezzo (GSP)

Asta generalizzata di secondo prezzo (Vickrey) Lo scopo è assegnare simultaneamente 0 < M < N di

oggetti tutti uguali ad un sottoinsieme degli N possibili compratori

Ogni giocatore desidera un oggetto Ogni giocatore i ha una sua stima (privata) vi del

valore dell’oggetto vi > 0 per ogni i Per il giocatore i, ogni oggetto ha lo stesso valore vi Simultaneamente, ogni giocatore i fa un offerta bi

privata Gli M giocatori che hanno offerto di più si aggiudicano

gli oggetti Il giocatore che ha offerto di più paga la seconda

offerta più alta, il secondo la terza, e così via

Per ogni giocatore i, offrire il massimo possibile (bi = vi) non è una strategia weakly-dominant. Infatti, date (r1 > r2 >….> rM) le M offerte più alte

0 se bi rM

ui = vi - rh se bi = rh-1 con h = {2,…,M}

Supponiamo rM < bi = rM -1< r1 < vi allora ui = vi – rM

Se il giocatore i-esimo avesse offerto bi allora ui = vi – r1 < vi – rM offrire il massimo possibile (bi = vi) non è una strategia dominante

Asta generalizzata di secondo prezzo

GSP e Web Advertising

Modello GSP applicato al Web Advertising Google, Yahoo utilizzano GSP Google adotta alcune modifiche che rendono

l’asta ancora più complicata (CTRi = expected click-through rate dell’advertiser i-esimo)

Yahoo (CTR non dipende dall’advertisement)

How to price keywords

Advertisers preferiscono questo slot

Click through rate 200 per ora

Click through rate 150 per ora

GSP e Web Advertising (Yahoo)

N slots nella pagina di ricerca K advertisers interessati ad una keyword ci numero medio di click per periodo per un

advertiser nello slot i Ogni advertiser desidera un solo slot vk valore del click per l’advertiser k uk = ci vk – pij guadagno advertiser k in

posizione i (strategia del giocatore) Advertisers sono risk neutral (tendono a

massimizzare uk)

GSP e Web Advertising

Alcune considerazioni ci non dipende dall’advertiser, ma solo

dalla posizione vk non dipedende dallo slot

pij dipende dagli altri advertisers

GSP e Web Advertising

Pay-off del giocatore i-esimo nella posizione j-esima ui = cj (vi – bj+1)

Il giocatore che ha acquistato lo slot N-esimo in teoria non paga (in realtà i motori di ricerca impongono un prezzo minimo)

GSP e Web Advertising

Anche in questo caso dire il vero non è una strategia dominante Tre giocatori, con v rispettivamente uguale a 17€, 12€, 3€

per click Due slots Click-through rates per la prima posizione 250, per la

seconda 248 (quasi gli stessi) Se tutti I giocatori dicono il vero e offrono la loro stima del

valore, il pay-off del giocatore che vince la prima posizione è:

(17 - 12) * 250 = 1250€ Se solo il giocatore che ha vinto avesse offerto 11€

(mentendo) avrebbe avuto un pay-off maggiore: (17 - 3) * 240 = 3360€ > 1250€

GSP e Web Advertising

Nel caso reale di Google o Yahoo, l’asta è ripetuta continuamente: le assunzioni sulla riservatezza di alcune

informazioni (v, b) possono non essere più vere. I giocatori imparano (v, b) giocando

Cambiano gli equilibri Minimo prezzo di entrata,…

GSP e Web Advertising

Equilibri simmetrici: un dato advertiser non è interessato ad uno slot più in alto se deve pagare di più

Equilibri asimmetrici: un dato advertiser può essere interessato ad uno slot più in alto anche se deve pagare di più

Ci possono essere diversi equilibri di Nash (simmetrici, non simmetrici)

Il problema del ranking (Search-based Advertising)

In che ordine visualizzare gli advertisments ? Yahoo ordina solo rispetto al prezzo

pagato Google ordina rispetto al prezzo pagato

ed ad un fattore legato alla rilevanza dell’advertisement (CTRi)

Pagamento è sempre secondo il modello GSP

Il problema del ranking

Yahoo (solo prezzo) apprezzato dagli advertisers per la

trasparenza presenta qualche problema legato alla

rilevanza dei risultati Chi ha pagato di più non è detto che sia

quello più rilevante !

Il problema del ranking

Google (prezzo e rilevanza) Forse meno apprezzato dagli advertisers

(meno trasparenza) Aumenta la rilevanza dei risultati

È in testa chi ha il miglior trade-off tra l’offerta e la rilevanza !

Il problema del ranking

(Google) Ri = bi x CTRi dove CTRi = expected click-through rate

dell’advertiser i-esimo (misura rilevanza dell’advertisement i-esimo)

bi = pagamento dell’advertiser i-esimo

Gli advertisements sono ordinati secondo il loro Ri

Alcuni problemi aperti

Granularità del mercato Ferrari e Red Ferrari devono essere due

mercati diversi ? Utilizzo di robots per effettuare il bidding

Attualmente I motori di ricerca lo permettono

Quali nuovi meccanismi (incentivi) introdurre ?

Alcuni problemi aperti

Che modello di costo adottare se il numero di slot è variabile Cosa succede se il numero di slot a

disposizione cambia ?

Bach o Stravinsky ?

Due persone desiderano andare insieme ad un concerto di musica classica. Una preferisce Bach, l’altra Stravinsky

Bach o Stravinsky ?

1 0

0 2

2 0

0 1

Bach

StravinskyBach

Stravinsky

Bach Stravinsky

Bach

Stravinsky

Ci sono due equilibri di Nash (Bach, Bach), (Stravinsky, Stravinsky)

Non ci sono strategie dominanti