人工知能特論 ii 　第 10 回

人工知能特論 II 　第 10 回二宮　崇

今日の講義の予定

HMM の前向き後向きアルゴリズムによるパラメータ学習

生成モデルと識別モデル教科書

北研二 ( 著 ) 辻井潤一 ( 編 ) 言語と計算 4 確率的言語モデル東大出版会

Christopher M. Bishop “PATTERN RECOGNITION AND MACHINE LEARNING” Springer, 2006

HMM の教師無し学習Unsupervised Learning of HMMs

パラメータ推定訓練データ ( 入力 )

パラメータ ( 出力 )

i QqQqQqiTTii

oqoqoqp

1 ,,2211

)(maxarg

)(maxarg,,

の記号列長

とする。。単語列文を表す記号列

訓練データ

iTiiiii

ooooxx

HMM の EM アルゴリズム

ooqqqp

qqooqqp

i QqQqTT

となる回数の期待値先頭が

1 ,,12

1 ,,111

])[;|(

パラメータ更新式π, a, b を π’, a’, b’ に更新

に遷移する回数からの中で rqqqqqrqC TT 11 );,(

待値から遷移する回数の期状態値へ遷移する回数の期待から状態状態

qqrqCooqqp

qrqqooqqp

i QqQqTTT

i QqQq

1 ,,111

1 ,, 2111

);,();|(

]][[);|(

を出力する回数からの中で oqooqqooqqoqC TTTT 1111 ),;,(

が出現した回数の中でqqqqqqC TT 11 );(

値に滞在する回数の期待状態値を出力する回数の期待に滞在し記号状態

qqqCooqqp

ooqqoqCooqqp

ooqqooqqp

i QqQqTTT

i QqQqTTTT

i QqQq

1 ,,111

1 ,,1111

1 ,, 111

);();|(

),;,();|(

]][[);|(

HMM のための EM アルゴリズムの問題点

期待値を計算するために全ての可能な隠れ状態を列挙すると文長に対し、指数爆発的計算量が必要

解決策：前向き後向きアルゴリズム。隠れ状態を列挙することなく、この期待値を計算する動的計画法。

前向きアルゴリズムと後ろ向きアルゴリズム

前向きアルゴリズム (1/3)

動的計画法

状態 1

o1 o2 oT

トレリス

状態 2

状態 3

状態 4

α(t, q): o1 … ot を出力し、 ot が出力される時 ( 時刻 t) に状態 q である確率

全ての t,q に対し、 α(t, q) を求めれば良い

時刻 1 2 3 T出力記号

QqQqoqqq

uoqqqoqq

ttuuuubababqt

11111,,

2,,,),(

o1 o2 oTot-1

状態 q

Qqoqqqt

Qq QqQqoqqqoqqq

uoqqqoqq

QqQqoqqq

uoqqqoqq

ttttttuuuu

ttuuuu

bababab

bababqt

111121111

,,,,,,

状態 1

状態 2

全ての遷移確率の和

α[1,q] := π[q]b[q,o1] (for all q)

for t =2 to T for q ∈ Q α[t, q] := Σq’∈Q {α[t-1, q’]a[q’,q]b[q, ot]}

後ろ向きアルゴリズム (1/3)

前向きアルゴリズムを逆方向に適用文末から文頭に向かって実行向きが逆になることを除けば前向きアルゴリズムと

まったく同じ β(t, q) : 時刻 t に状態 q から始める状態遷移に

よって ot+1…oT まで出力する確率

tuoqqqoqqq

uuuutttbabaqt

,, 2,,,,

1111),(

o1 o2 oTot

状態 q

状態 1

状態 2

全ての遷移確率の和

Qqtoqqq

Qq QqQq

tuoqqqoqqqoqqq

tuoqqqoqqq

uuuuttttttt

uuuuttt

bababa

babaqt

12221111

,, 3,,,,,,

,, 2,,,,

β[T,q] := 1 (for all q)for t := T-1 to 1 for q ∈ Q β[t, q] := Σq’∈Q {a[q, q’]b[q’, ot+1]β[t+1, q’]}

前向き後ろ向きアルゴリズムの導出

前向き後ろ向きアルゴリズム : 生成確率

生成確率

TTT qToqoqpoopiT

iii),()()(

前向き後ろ向きアルゴリズム : π’

i QqQq

tqqoqqqoqq

i QqQqTTq

qboopn

bababoopn

qqooqqpn

1 ,, 3,

1 ,,111

),1(),1(1

),1();(

])[;|(1

前向き後ろ向きアルゴリズム : π’

o1 o2 oT

状態 q

後向き確率

oopni 1

,1 )',(

),1(),1(1),1(

前向き後ろ向きアルゴリズム : a’

t QqQqoqqq

uoqqqoqqorrq

t QqQqorrqoqqq

uoqqqoqq

t QqQq QqQq

tuoqqqoqqrorrqoqqq

uoqqqoqq

t QqQq QqQq

tuoqqqoqqrorrqoqqq

uoqqqoqq

t QqQqtt

tuoqqqoqqqoqqqoqqq

uoqqqoqq

t QqQqtt

i QqQq

tttTTrq

ttuuuut

tttuuuu

uuuuttttttuuuu

uuuuttttttttttttuuuu

rtbaqtoop

bababrtbaoop

rtbabababoop

babababababoop

qrqqbabababababoop

qrqqbaoop

qrqqooqqpa

1 2 ,,,,

2,,,,,

1 2 ,,,,,,

1 2 ,, ,, 2,,,,,,,,

1 2 ,,1

2,,,,,,,,

1 2 ,,1

1 ,, 21

1 ,, 2111,

),(),1();(

),();(

]][[);(

]][[);|(

121111

1111121111

1111111121111

の分子部分

γ(t,q,r): 記号列 o1…oT に対し、時刻 t － 1 から時刻 t に状態q から状態 r に遷移する確率

rtbaqtrqt t

),(),1(),,(

o1 o2 oTot-1

状態 q

……

…状態 r

前向き確率後向き確率

i QqQq

qrqqooqqp

1 ,, 2111

]][[);|(

前向き後ろ向きアルゴリズム : b’

t QqQq

uoqqqoqqt

t QqQqtoqqq

uoqqqoqq

t QqQq QqQq

utoqqqoqqqtoqqq

uoqqqoqq

t QqQq QqQqt

utoqqqoqqqoqqq

uoqqqoqq

t QqQqtt

utoqqqoqqqoqqq

uoqqqoqq

t QqQqtt

i QqQq

tttTToq

ttuuuu

tttttttttuuuu

ttttttttttttuuuu

qtqtoooop

bababqtoooop

qtoobababoop

babaoobababoop

oobababababoop

ooqqbababababoop

ooqqbaoop

ooqqooqqpb

,,1 1 ,,

1 1 ,,,,

1 1 ,, ,, 2,,,,,,

1 1 ,, 2,,,,,,

1 1 ,, 1,

1 ,, 111,

),(),(][);(

),(][);(

]][[);(

]][[);|(

111111111

の分子部分

γ(t,q): 記号列 o1…oT に対し、時刻 t に状態 q に滞在する確率

qtqtqt

),(),(),(

o1 o2 oTot

状態 q

……

前向き確率後向き確率

i QqQq

ooqqooqqp

1 ,, 111

]][[);|(

ちなみに、 ),1(1

),1(),1(1

前向き後向きアルゴリズムまとめ (1/2)

α(t, q): o1 … ot を出力し、 ot が出力される時 ( 時刻 t) に状態 q である確率

β(t, q) : 時刻 t に状態 q から始める状態遷移によって ot+1…oT まで出力する確率

Qqoqqqt

QqQqoqqq

uoqqqoqq

ttuuuu

bababqt

Qqtoqqq

tuoqqqoqqq

uuuuttt

babaqt

,, 2,,,,

rtbaqtrqt t

),(),1(),,(

qtqtqt

),(),(),(

前向き後向きアルゴリズムまとめ (2/2)

あるパラメータ π,a,b が与えられているとする α を求める ( 前向きアルゴリズム ) β を求める ( 後向きアルゴリズム )

それぞれ動的計画法。計算量は O(T) ※ ビタビアルゴリズムも計算量は O(T) 。ビタビアルゴリズムのおよそ 3 倍の計算量。

次のように π, a, b を更新する

),(]['

値に滞在する回数の期待状態値を出力する回数の期待に滞在し記号状態

待値から遷移する回数の期状態値へ遷移する回数の期待から状態状態

となる回数の期待値先頭が

生成モデルと識別モデルGenerative Model and Discriminative Model

生成モデルから識別モデルへ

生成モデルHMM

状態遷移による生成状態遷移の確率は一つ前の状態のみに依存任意の文 s と状態列 q に対する同時確率 p(s,q) を計算

できるPCFG

CFG による生成のステップ（書換規則の適用 A → B C ）の確率を p(B C| A) とする

CFG による生成の過程の確率を、独立な事象の ( 条件付き ) 確率の積とする

任意の文 s と構文木 t に対する同時確率 p(s, t) を計算できる

生成モデルの改良の先に

構文木の分岐の外の情報を条件部に導入PCFG: p(BC|A, hw) [Ahw→BhwC] (hw: 主辞 )HMM: p(qj|qj-1, qj-2)

素性（特徴）という考え方条件部をどんどんリッチにして線形補間をとれ

ばよいのでは？→構文木のノード x の確率p(x)=p(x|x 周辺の状況 )

生成モデルの問題点独立性の仮定

PCFG では、各構文木ノードは独立な ( 条件付き）試行により生成されていると仮定している

例えば、 (S (NP John) (VP eats (NP apples))) という構文木は、以下の独立な（条件付き）事象に分解されている

S から NP VP を生成 NP から John を生成 VP から eats NP を生成 NP から apples を生成

結果、上記の NP の文脈 (S→NP VP) から導出された NPか (VP→eats NP) から導出された NP かわからなくなっている→主語の NP なのか目的語の NP なのかわからない。

生成モデルの問題点

生成モデル

しかし、

　であるから p (s;θ) が計算できてしまう分、冗長なモデルになっている。間接的に分類問題を解いている。

独立性を仮定した事象に分解しないと同時確率を計算することができない

);,(maxarg);|(maxarg~ tspstpttt

);();|();,( spstptsp

識別モデル

識別モデル直接

を解く独立な事象を仮定しない「条件部の確率」をモデルにいれない

);|(maxarg~ stptt

生成モデルと識別モデル( イメージ )

生成モデル識別モデル

生成モデルと識別モデル（イメージ２）

生成モデル絵を描いて全体像の比較

識別モデルそれぞれの特徴を比較

鼻の位置耳の形体の大きさ舌の表面

識別するための訓練

教師付学習良い例と悪い例を与えて、どこに注目すれば

より良く識別出来るのか学習good examples

bad examples

識別モデル

)|( stp s = “A blue eye girl with white hair and skin walked”

t1 t2 t3 t4

文法 G により s から導出出来る全ての構文木集合

p(t3|s) は t1,t2,t3,..,tn から t3 を選択する確率

素性ベクトル( 特徴ベクトル )

(0,0,1,0) (1,0,1,0) (1,1,1,0) (0,0,1,1) (1,0,0,0)

生成モデルと識別モデル

生成モデル識別モデル

),( 1yxp

),( 2yxp

)|( 1 xyp

)|( 2 xyp

どちらが優秀なのか？

Tom Minka (2005) Discriminative models, not discriminative training, MSR-TR-2005-144, 1 p.

x を入力 ( 文 ) 、 y を出力 ( 構文木 ) としたときのパラメータ推定

生成モデル

識別モデル

一般モデル

);();|();,( ypyxpyxp

);|( xyp

);();|(),;,( xpxypyxp

θ = θ’

まとめ

HMM の前向き後向きアルゴリズム前向き後向きアルゴリズム

動的計画法計算量は O(T) ※ ビタビアルゴリズムも計算量は O(T) 。ビタビアルゴリズムの

およそ 3 倍の計算量。隠れ状態を全て並べあげることなく、トレリス上で期待値を計算できる

ある状態からある状態への遷移回数の期待値ある状態からある記号を出力する回数の期待値

生成モデルと識別モデル

今までの講義資料http://aiweb.cs.ehime-u.ac.jp/~ninomiya/ai2/

人工知能特論 ii 　第 10 回

Documents

情報セキュリティ特論（ 3 ）

vygotsky 的認知發展論

知能情報システム特論...

ゲームグラフィックス特論第５回

コンピュータビジョン特論 b － graph cuts －...

平成 19 年度大学院　知識システム特論...

人工知能特論 2011 資料 no.6

人工知能特論 ii 　第 5 回

ゲームグラフィックス特論第２回

人工知能特論 ii 　第 3 回

画像情報特論 (9)

情報セキュリティ特論（ 7 ）

ゲームグラフィックス特論第１１回

ゲームグラフィックス特論第３回

ゲームグラフィックス特論第１回

システム理工学専攻...

『マクロ金融特論』( ２ )

人工知能特論 2011...

ゲームグラフィックス特論第１０回

プログラム理論特論第７回

人工知能特論 ii 第 10 回

人工知能特論 ii 　第 10 回