最尤系統樹推定 と系統樹の信頼性評価 - …...1 10 回のコイントスで裏 1...

Post on 03-Jul-2020

1 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

最尤系統樹推定       と系統樹の信頼性評価

田辺晶史

講義編

最尤法って何?

最大尤度法

って何?

コイントスの例

11

11コイントスで裏が出る確率はXである

11コイントスで裏が出る確率はXである

X はいくつ?

11 0.1

11

10回のコイントスで裏 1回表 9回が出る確率

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル– (1/10)×(9/10)9

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル– (1/10)×(9/10)9=0.03874205

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル– (1/10)×(9/10)9=0.03874205

● 裏が出る確率は 0.5 であるというモデル

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル– (1/10)×(9/10)9=0.03874205

● 裏が出る確率は 0.5 であるというモデル– (1/2)10

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル– (1/10)×(9/10)9=0.03874205

● 裏が出る確率は 0.5 であるというモデル– (1/2)10=0.0009765625

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル– (1/10)×(9/10)9=0.03874205

● 裏が出る確率は 0.5 であるというモデル– (1/2)10=0.0009765625

11

10回のコイントスで裏 1回表 9回が出る確率

● 裏が出る確率は 0.1 であるというモデル– (1/10)×(9/10)9=0.03874205

● 裏が出る確率は 0.5 であるというモデル– (1/2)10=0.0009765625

尤度

11あるモデルを仮定したとき、データが実現する確率

11あるモデルを仮定したとき、データが実現する確率

尤度||

尤度が最大になるようにパラメータ値を決める

尤度が最大になるようにパラメータ値を決める

最尤法||

系統樹推定の場合

樹形間の比較では分子進化モデルは固定(パラメータ値は推定 )

樹形間の比較では分子進化モデルは固定(パラメータ値は推定 )

||パラメータ数 (K)は全樹形で等しい

樹形間の比較では分子進化モデルは固定(パラメータ値は推定 )

||パラメータ数 (K)は全樹形で等しい

||最大尤度樹形はAICも最小

最尤系統樹推定

最尤系統樹推定||

尤度が最大になる系統樹を採用する

問題

尤度最大な樹形

をどう決める?

総当たり

総当たり

総当たり無理

そこで、

局所探索

初期樹形

初期樹形樹形改変によって探索される範囲

初期樹形樹形改変によって探索される範囲

初期樹形樹形改変によって探索される範囲

さらに周囲を探索

初期樹形樹形改変によって探索される範囲

仮の最尤系統樹を更新していく

初期樹形樹形改変によって探索される範囲

仮の最尤系統樹を更新していく

それ以上尤度が高いものが見つからない

初期樹形樹形改変によって探索される範囲

仮の最尤系統樹を更新していく

それ以上尤度が高いものが見つからない 終了

局所探索って不安だなぁ

・・・

気休め

沢山の初期樹形から局所探索を繰り返す

無作為配列付加による初期樹形生成

無作為配列付加による初期樹形生成

● 無作為に選んだ 3OTU で系統樹生成 ( 樹形 1 つ )

無作為配列付加による初期樹形生成

● 無作為に選んだ 3OTU で系統樹生成 ( 樹形 1 つ )● 無作為に選んだ 1OTU の枝を最適な場所へ付ける

無作為配列付加による初期樹形生成

● 無作為に選んだ 3OTU で系統樹生成 ( 樹形 1 つ )● 無作為に選んだ 1OTU の枝を最適な場所へ付ける● さらに 1OTU 足す、を繰り返す

無作為配列付加による初期樹形生成

● 無作為に選んだ 3OTU で系統樹生成 ( 樹形 1 つ )● 無作為に選んだ 1OTU の枝を最適な場所へ付ける● さらに 1OTU 足す、を繰り返す● 全 OTU の系統樹を得る

無作為配列付加による初期樹形生成

● 無作為に選んだ 3OTU で系統樹生成 ( 樹形 1 つ )● 無作為に選んだ 1OTU の枝を最適な場所へ付ける● さらに 1OTU 足す、を繰り返す● 全 OTU の系統樹を得る

反復すれば多数の樹形が得られる

はたして

その系統樹は

信頼できるのか?

どれくらい

OTU4

OTU5

OTU1

OTU2

OTU3

OTU4

OTU5

OTU1

OTU2

OTU3

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU4

OTU5

OTU1

OTU2

OTU3

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU4

OTU5

OTU1

OTU2

OTU3

系統樹は多数の系統仮説の

集合体

はたして

その系統樹は

信頼できるのか?

どれくらい

はたして

各系統仮説は

信頼できるのか?

どれくらい

ブートストラップ

解析

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCTTTTTT

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCTTTTTT

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

CCCTTTTTT

TAACCCGGG

TAACCCGGG

CCCCCCCCC

TTTTTTTTT

TAACCCGGG

CCCTTTTTT

CCCCCCCCC

TTTTTTTTT

CCCTTTTTT

CCCCCCCCC

TAACCCGGG

AATTTTTTT

TTTTTTTTT

AAAAAAAAA

TAACCCGGG

AAAAAAAAA

AAAAAAAAA

TTTTTTTTT

CCCTTTTTT

CCCCCCCCC

CCCTTTTTT

CCCCCCCCC

GGCCCAAAA

CCCTTTTTT

CCCCCCCCC

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCTTTTTT

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

CCCTTTTTT

TAACCCGGG

TAACCCGGG

CCCCCCCCC

TTTTTTTTT

TAACCCGGG

CCCTTTTTT

CCCCCCCCC

TTTTTTTTT

CCCTTTTTT

CCCCCCCCC

TAACCCGGG

AATTTTTTT

TTTTTTTTT

AAAAAAAAA

TAACCCGGG

AAAAAAAAA

AAAAAAAAA

TTTTTTTTT

CCCTTTTTT

CCCCCCCCC

CCCTTTTTT

CCCCCCCCC

GGCCCAAAA

CCCTTTTTT

CCCCCCCCC

データからデータを作る

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCTTTTTT

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

CCCTTTTTT

TAACCCGGG

TAACCCGGG

CCCCCCCCC

TTTTTTTTT

TAACCCGGG

CCCTTTTTT

CCCCCCCCC

TTTTTTTTT

CCCTTTTTT

CCCCCCCCC

TAACCCGGG

AATTTTTTT

TTTTTTTTT

AAAAAAAAA

TAACCCGGG

AAAAAAAAA

AAAAAAAAA

TTTTTTTTT

CCCTTTTTT

CCCCCCCCC

CCCTTTTTT

CCCCCCCCC

GGCCCAAAA

CCCTTTTTT

CCCCCCCCC

リサンプリング

リサンプル

リサンプル

最尤系統樹推定

リサンプル

最尤系統樹推定

ひたすら

反復

D

A

C

B

D

A

C

B

D

A

C

B

A

B

C

D

D

A

C

B

D

A

C

B

D

A

C

B

A

B

C

D

D

A

C

B

D

A

C

B

D

A

C

B

A

B

C

D

75%

25%

D

A

C

B

D

A

C

B

D

A

C

B

A

B

C

D

75%

25%

出現頻度を信頼性の指標に

top related