mlct勉強会 by カメリオ

13
Copyright 2014 Shiroyagi Corporation. All rights reserved. クラウドワークスとScipyを使って カメリオの記事精度を「機械学習」したお話 白ヤギコーポレーション CEO 柴田暁 ([email protected])

Upload: shiroyagi

Post on 10-Jun-2015

573 views

Category:

Internet


2 download

DESCRIPTION

8/26に行われたMachine Learning Casual Talkでのプレゼンです。白ヤギコーポレーションより、カメリオの精度向上のために行われたパラメーター最適化についてお話しました。

TRANSCRIPT

Page 1: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

クラウドワークスとScipyを使って カメリオの記事精度を「機械学習」したお話 !

白ヤギコーポレーション CEO 柴田暁 ([email protected])

Page 2: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

Page 3: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

追いたい情報を あなたに代って収集する フォローメディア

こだわりの情報 が見つかる

キュレーションアプリ

Page 4: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

The Problem

Page 5: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

The Data

Page 6: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

Page 7: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

あまりはっきり区別できていなかった

Page 8: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

#filreq(#datebetween( 08/19/2014 08/27/2014 ) !#weight( !!1.0 #weight[text]( 0.76 #syn( #1( Virtual reality ) Virtualreality ヴァーチャルリアリティ 仮想現実 人工現実 バーチャルリアリティ ヴァーチャルリアリティー 疑似体験 バーチャルリアリティー #1( バーチャル リアリティ ) バーチャルリアリティ #1( Virtual Reality ) VirtualReality じつ現実 #1( ヴァーチャル リアリティ ) ヴァーチャルリアリティ 仮想現実感 人工現実感 ) !!0.24 #weight( 0.181455949551 バーチャルリアリティ 0.0676355699611 Virtual 0.0647270262872 仮想 0.0632592879725 現実 0.0627517974489 en 0.048662413307 VR 0.0473383780023 語 0.0472636426187 ユーザ 0.0431593203971 バーチャル 0.0387111721324 テレイグジスタンス 0.0387111721324 舘暲 0.0387111721324 複合現実 0.0384194809382 仮想現実 0.0340522516003 知覚 0.0331368157741 提示 0.0327887328629 コンピュータ 0.0326059815089 学会 0.0291637310257 応用 0.0290265869801 仮想敵国 0.0284195173671 実質 ) ) 10.0 #weight[summary]( 0.76 #syn( #1( Virtual reality ) Virtualreality ヴァーチャルリアリティ ・・・)

パラメーター: テーマ名と、同義語の重み テーマ名と関連単語の重みの割合 使う関連単語数・・・

The Model

Page 9: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

Page 10: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

Downhill Simplex Method (Heuristic)

Page 11: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

• 全パラメーターで最適化 • 特に重要なパラメーターを特定

• 前々日より良ければ前日の値を初期値に新しいデータで最適化(2時間)

• 毎日結果を確認しながら最適化

Page 12: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.

Page 13: MLCT勉強会 by カメリオ

Copyright 2014 Shiroyagi Corporation. All rights reserved.