tokyo...
TRANSCRIPT
インターネット広告代理店の現場におけるデータ分析探訪
岡川宏之 2014/5/24
第 36 回 TokyoWebmining
1
自己紹介
• 岡川宏之 , Hiroyuki Okagawa• Twitter: hokagawa• 経歴 : 大学院博士号を取得後に総合電機メーカに就職して、半導体フラッシュメモリのエンジニアや研究開発など約 3 年間勤務。 その後、株式会社サイバーエージェントに転職して、インターネット広告事業本部のデータアナリストとして現在に至る。 大学院では理論物理 ( 素粒子物理学 / 超ひも理論 ) を研究していました。
会社の様子が分かる参考リンク・恋するフォーチュンクッキーhttp://www.youtube.com/watch?v=lXs96toe-B8・【サンテ PC 】 IT 系女子「 Check! コメントリレー(クリック)」篇http://www.youtube.com/watch?v=OMlIqiARmTQ
2
目次
• 広告代理店でのデータ分析対象• オンライ広告の運用の仕組み• インターネット広告の現場におけるデータ分析– 実験計画法– 回帰分析– 数理計画法– 時系列分析– アソシエーション分析– マルコフ連鎖
3
オンライン広告 ( 一例 )
オフライン広告 ( 一例 )
検索連動型広告
ディスプレイ広告
動画広告・リッチ広告
レコメンドバナー
ソーシャルネットワーク
純広告
広告代理店でのデータ分析対象
4
オンライン広告の運用の仕組み
4 位
1 位
2 位
3 位
5 位
7 位
6 位
\100
\200
\80
\120
Google で“賃貸”で検索した場合
様々な広告代理店が広告主から予算を預かり、目標売上達成のために日々入札調整や広告コピーの改善などを行っています。
代理店 A
代理店 B
代理店 C
代理店 D
入札( クリック単
価 )
5
実験計画法 : 広告のデザイン検証への応用
因子No
因子名 水準名 1 水準名 2
1 メインコピー 恋愛 結婚2 サブコピー 第一歩 サブコピー無3 アイコンの色味 緑 ピンク4 上部の企業ロゴ 有 無
クリエイティブ名
メインコピー サブコピー アイコンの色味 上部の企業ロゴ 申込率
1 恋愛 第一歩 緑 有 0.25%
2 恋愛 第一歩 ピンク 無 0.30%
3 恋愛 サブコピー無 緑 無 0.20%
4 恋愛 サブコピー無 ピンク 有 0.32%
5 結婚 第一歩 緑 無 0.34%
6 結婚 第一歩 ピンク 有 0.30%
7 結婚 サブコピー無 緑 有 0.35%
8 結婚 サブコピー無 ピンク 無 0.20%
バナー広告をそれを構成する要素 ( 因子 ) に分けて、因子の水準を変化させて、各因子の寄与度を定量化して、バナー広告の改善のヒントにします。
因子に分解
直交表実験計画による検証
※1) 各列をベクトルとすると、すべてのベクトルは互いに相関がゼロ└ 各因子を説明変数とすると、重回帰は目的変数 ( 申込率 ) に対して単回帰に帰着して、各因子の効果が独立に評価できる。※2) 分析データとして全パターン組合せは必要ないため、効率的に検証ができる。※3) 上記バナー広告は、スピーカがリタゲされて出現しただけで、実データ・実施策ではありません。 6
恋愛
結婚
第一
歩
サブ
コピ
ー無
恋愛
×第
一歩
(or)結婚
×サ
ブコ
ピー無
恋愛
×サ
ブコ
ピー無
(or)結婚
×第
一歩 緑
ピン
ク
恋愛
×緑
(or)結婚
×ピ
ンク
恋愛
×ピ
ンク
(or)結婚
×緑
第一
歩×緑
(or)
サブ
コピ
ー無
×ピ
ンク
第一
歩×
ピン
ク(o
r)サ
ブコ
ピー無
×緑 有 無
メインコピー サブコピー メインコピー × サブコピー
アイコンの色味 メインコピー × アイコンの色味
サブコピー × アイコンの色味
上部の企業ロゴ
0.20%0.22%0.24%0.26%0.28%0.30%0.32%0.34%
申込率
実験計画法 : 検証結果と考察の例
結果 : メインコピーとアイコンの色味の組合せが重要└ 恋愛コピーのときはピンク、結婚コピーのときは緑
定性的意味付け 恋愛は派手な色味が好まれ、結婚は落ち着いた色味が好まれる。
└ 次回広告コピー改善のヒントにする。
要因効果図 ( 回帰係数を傾きにした表 )
7
実験計画法 : キラキラ女子編 ( 実データ )
結果 : 年収が最も重要、次は身長と性格が続く、顔はあまり気にしない。
定性的意味付け 年収が高ければキラキラ女子との結婚も夢じゃない。身長による減点は、性格でカバーできる。
要因効果図 ( 回帰係数を傾きにした表 )福山
岡川
180cm
160cm
福山
×180cm
(or)岡
川×160cm
福山
×160cm
(or)岡
川×180cm
ベス
トマ
ッチ
普通
福山
×ベ
スト
マッ
チ(o
r)岡
川×普通
福山
×普通
(or)岡
川×
ベス
トマ
ッチ
180cm
×ベ
スト
マッ
チ(o
r)160cm
×
普通
180cm
×普通
(or)160cm
×ベ
スト
マッ
チ
2000万円
300万円
顔 身長 顔 ×身長 性格 顔 ×性格 身長 ×性格 年収
50
60
70
80
90
100
アイスブレー
ク
8
回帰分析 : 予算シミュレーションへの応用
入札単価( クリック単価 )
順位 クリック率表示回数
クリック数
購入数
メモ : 変数間の関係式①コスト=クリック数 × クリック単価 ②購入数=クリック数 ×購入率③クリック数=表示回数 × クリック率
コスト
購入数
回帰分析に使う最小限の変数を決定
予測に適した回帰式を選択
コスト表示回数クリック数購入数
xfy コスト購入数 f
運用型広告の変数は複数あって、それらの間には因果関係があります。因果関係をヒントにして、目的変数と説明変数、その間の関係 (線形 or非線形 ) を決定して、回帰分析を行います。
9
数理計画法 : 予算ポートフォリオへの応用
検索連動型広告
コスト
購入数
111 コスト購入数 f
コスト
購入数
コスト
購入数
222 コスト購入数 f
333 コスト購入数 f
最大化購入数
予算コスト
全メニュー
全メニュー
ii
ii
数理最適化法で解くの条件ディスプレイ広告
ソーシャルネットワーク
各オンライン広告で予算シミュレーションを行って、広告主の予算内で、購入数が最大化するように数理計画法を活用して予算ポートフォリオを行います。
10
ベクトル自己回帰分析 :オフライン広告の定量評価
検索連動型広告
ソーシャルネットワーク
テレビ
時間
GRP
時間
クリック数
時間
クリック数
tx1
tx2
tx3
txtxtxtX 321 ,,
ttXMtXMtX
21 21
tNtx
IRFi
j
Nji
,, 10 jijiji IRFIRFIRF
時間
IRF
オフライン広告 ( テレビなど ) とオンライン広告はデータが連携していないため、各時系列データを活用して、影響度を定量化するために、時系列分析の方法、例えばベクトル自己回帰分析などを活用します。
例 ) ベクトル自己回帰 (VAR(2))
インパルス応答関数
11
アソシエーション分析 : 動画広告の評価
他広告
他広告
他広告 他広告
他広告
他広告 他広告
他広告
他広告 他広告
%13333.1
63
32|
P
Pリフト値
動画広告や純広告などは直接購入を即すためだけではなく、企業のブランディングのために行うこともあり、購入一歩手前の指標で分析する事が必要になります。この場合、特定の行動、例えば検索行動、の増幅率 ( リフト値 ) を評価します。ユーザー行動データ
12
マルコフ連鎖モデル : 予算ポートフォリオへの応用
ユーザーは複数の広告に接触して購入する事が多いため、広告間の”相関を考慮して、予算配分を行いたいと考えます。ユーザー行動に対して、マルコフ性を仮定して、数学的にモデル化する。
ユーザー行動データ
マルコフ性を仮定した可視化
マルコフ性・ユーザーは直前に接触した広告の種類だけに依存して次の広告へある確率で移動する。 13
マルコフ連鎖モデル : 次回の予告
モデリングに必要な量 マルコフ連鎖モデルの母関数表現
ユーザー行動データからモデリングに必要な物理量を構成することにより、マルコフ連鎖モデルの母関数表現を構成できます。
クリック単価
購入率
初期流入数
推移確率 ※来月の TokyoWebmining では、このモデルが必要になった背景このモデルの導出の考え方、そして現在弊社でこのモデルを活用していない理由まで説明します。
14