ドワンゴ勉強会 090731
DESCRIPTION
TRANSCRIPT
サイエンス と エンジニアリング
“探す”“出くわす”
んじゃなくて,
─という体験
サイジニアの独自開発技術
ディスカバリーエンジン
「デクワス」TM
サイジニアのアプローチ
複雑ネットワーク理論で
膨大なデータから
価値を創造する
ネットワーク複雑
Complex Network
ネットワークとはたくさんのノードが、たくさんのリンクでつながっているもの
リンクノード
「『点と線』だけで考える」
Albert-László Barabási
Duncan J. Watts
M.E.J. Newman
スケールフリーネットワーク
スモールワールドネットワーク
コミュニティ構造分析
Albert-László Barabási
スケールフリーネットワーク
What’sスケールフリー
?
バブル崩壊の法則経済物理学 Econophysics
バブル崩壊
日常の値動き
右図は両対数グラフ(log-log scale)
Zipf 則
学習コストと文化レベルのtrade-off による自己組織化
言語発達の法則
図は両対数グラフ(log-log scale)
組曲『ニコニコ動画』
新・豪血寺一族 -煩悩解放 -レッツゴー!陰陽師
遊戯王AIBOvs王様・社長・凡骨・顔芸
【初音ミク】みくみくにしてあげる♪【してやんよ】
魔理沙は大変なものを盗んでいきました
クラッシャーは大変なキーボードを破壊していきました
1人で同時に情熱大陸を演奏してみた
ニコニコ動画の法則
図は両対数グラフ(log-log scale)
スケールフリー=
システムの一貫性を説明する
モデル
成長と優先的選択1.新しいノードを生成し、既存ノードとリンクをつなげる
2.リンクをつなげる相手は、多くのリンクを持っているノードを優先する
「金持ちはもっと金持ちに」
!(ki) =
ki + 1"j(kj + 1)
リンク数の分布がスケールフリー性を持つハブ(極端に多くのリンクを持つノード)が存在する
スケールフリーとハブの存在
「実世界との相似」
感染者数
メキシコ
スペイン
豚インフルの国別感染者数
Albert-László Barabási
Duncan J. Watts
M.E.J. Newman
スケールフリーネットワーク
スモールワールドネットワーク
コミュニティ構造分析
Duncan J. Watts
スモールワールドネットワーク
What’sスモールワールド
?
It’s a “Small World!!”
1. ケビン・ベーコンと共演した俳優のベーコン数は”1”2. ケビン・ベーコンと共演したことがなくても、以前共演した俳優の誰かがケビン・ベーコンと共演したことがある場合、ベーコン数は”2”
3. 以下、ケビン・ベーコンとの関係がみつかるまでこの作業を続ける
「ケビン・ベーコンゲーム」“The Oracle of Bacon”http://oracleofbacon.org
スモールワールド=
予想外な世界の狭さを説明するモデル
強いクラスタ性と狭い世界
「秩序と無秩序の共存」
1.格子状のネットワークをつくる2.ランダムにリンクを選び、どれかのノードにつなぎかえる
3.少数のリンクをつなぎかえた時のみ、スモールワールド性が現れる
弱い紐帯の力
「クラスタ間の架け橋」
1970年代に、人的ネットワークを介して 転職をした約200人に調査ちょっとした知り合い(弱い紐帯)から得た情報で転職した人のほうが、満足度が高い
マーク・グラノヴェッター“Strength of Weak Tie”
Albert-László Barabási
Duncan J. Watts
M.E.J. Newman
スケールフリーネットワーク
スモールワールドネットワーク
コミュニティ構造分析
M.E.J. Newmanコミュニティ構造
分析
What’sコミュニティ
?
明示的、暗黙的なコミュニティ明示的なコミュニティ
暗黙的なコミュニティ
コミュニティ=
社会が生み出す普遍の構造
コミュニティ構造を取り出す実世界を複雑ネットワークとしてモデル化し暗黙的なコミュニティを調査するコミュニティ構造は、密なリンクを持つノード群ととらえられる
「似た人・アイテムを抽出」
Modularityコミュニティのつながり度合い1.コミュニティ内部へのリンクの密度からModularityを計算する
2.Modularityが最も高くなる部分で、コミュニティを切り出す
「自然なつながり」
Albert-László Barabási
Duncan J. Watts
M.E.J. Newman
スケールフリーネットワーク
スモールワールドネットワーク
コミュニティ構造分析
柔軟な拡張何をノードにするか、何をリンクにするかによって、柔軟にネットワークをカスタマイズできる
サイジニアのアプローチ
複雑ネットワーク理論で
膨大なデータから
価値を創造する
複雑ネットワーク理論で
膨大なデータから
価値を創造する
膨大なデータ
Staggering Amount of Data
What’sデータ
?
集めるのは、ユーザの行動履歴現実世界の行動は、記録しづらい•視聴率調査•無作為抽出したアンケート
Web上の行動は、ログとして残る•全てのアクションを記録•無意識下の行動
データ=
Webによって獲得可能になった
財産
11,687,011Scigineer
月次取扱 unique user 数
Google Japan
34,526,000=34%
たくさんのユーザの行動履歴を収集し、データ解析の精度を向上させる
データの増大による学習効果
「正のフィードバックループ」
アルゴリズムを変更することなく、ユーザからのフィードバックデータの蓄積のみで、精度が向上する
0.00%
2.00%
4.00%
6.00%
8.00%
10.00%
12.00%
1 31 61 91 121
151
181
211
241
271
301
331
361
391
421
451
481
17ヶ月間
20万アイテム20万ユーザ
複雑ネットワーク理論で
膨大なデータから
価値を創造する
複雑ネットワーク理論で
膨大なデータから
価値を創造する
レコメンデーション
Recommendation
What’sレコメンデーション
?
善し悪しはエンジンだけではない
WhatWhyWhere
WhoWhenHow
情報ナビゲーションの5W1H
Whatこの商品には
このアイテムがオススメ
Where情報ナビゲーションの5W1H
ページの一番目立つ場所に商品紹介の下に
Why情報ナビゲーションの5W1H
最新型TVだから対応ケーブルあなたが買うべき理由
When情報ナビゲーションの5W1H
コンテンツを見終わった時ユーザの興味が移る前
情報ナビゲーションの5W1H
友人からのオススメで購入紹介者の信用
Who
How情報ナビゲーションの5W1H
商品画像を表示しアピールインタラクティブなデザイン
レコメンデーション=理想の
ナビゲーションの追求
並び順によるクリック率
「人間の特性を知る」
提示する商品をランダムに配置し、どの位置がクリック率が高いか調査する
並び順によるクリック率
「データは答えを知っている」
商品の内容によらず、左に位置するものほどクリックされやすい5個表示すると、左から4番目はクリック率が下がる
サイトB
サイトA
サイトC
サイトD
P1 P2 P3 P4
P1 P2 P3 P4 P5
サイジニアのアプローチ
複雑ネットワーク理論で
膨大なデータから
価値を創造する
Webは21世紀に生まれた Natureなのだ
by
サイエンスとエンジニアリング
提 供