sci13 招待講演

43
立命館大学情報理工学部 知能情報学科 准教授 谷口忠大 SCI2013@神戸 1 2013/6/14

Upload: tadahiro-taniguchi

Post on 15-Nov-2014

1.974 views

Category:

Documents


0 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Sci13 招待講演

立命館大学情報理工学部 知能情報学科 准教授 谷口忠大

SCI2013@神戸 1 2013/6/14

Page 2: Sci13 招待講演

Contents 1. 記号創発システム 2. マルチモーダルカテゴリ形成 3. ノンパラメトリックベイズ二重分節解析 4. まとめ

2013/6/14 SCI2013@神戸 2

Page 3: Sci13 招待講演

発達する知能 環境に適応し多様な概念や行動を獲得する知能

人間は生まれた時,未分化な認識世界の中で活動を始める.

環境適応の中で様々な概念や行動を獲得していく.

そして言語を用いたコミュニケーションをも可能にする.

その構造,計算論的プロセスを知りたい.

2013/6/14 SCI2013@神戸 3

Page 4: Sci13 招待講演

コミュニケーションするロボット ロボットがつけるテレビと人間が押すリモコンでつくテレビ

言葉の意味ってなんですか?

谷口忠大, 「コミュニケーショ

ンするロボットは創れるか」(NTT出版)より

Page 5: Sci13 招待講演

記号接地問題 ロボットがいかに自らの身体を通して記号を意味づけるか?という問題.[Harnad ‘90] 人間が設計した記号に対して,ロボットがセンサ・モータ系を通して意味づける.

記号の恣意性 (記号論より) ラベル付けの恣意性 範疇化・分節化の恣意性

人間が作った恣意的な記号系を真なるものとして用いている. ロボットにとっての記号系と人間にとっての記号系は同じか?

2013/6/14 SCI2013@神戸 7

Page 6: Sci13 招待講演

記号系を創発的にとらえる理解 ロボットから見た世界

生物から見た世界 (ユクスキュル) それぞれの動物が知覚し作用する世界の総体がその動物にとっての環世界である.

センサ・モータ系で閉じた身体から得られる情報の中で如何に,記号系が組織化されていくのか.

自らの環世界に立脚して,多様な行動や概念を獲得し,それに基づいて記号論的相互作用(コミュニケーション)を行なう知能を探求する必要がある. 記号創発システムへの

構成論的アプローチ エルンスト・マッハ「感覚の分析」

環境身体

記号 他者

Bottom-up

Top-down

2013/6/14 SCI2013@神戸 8

Page 7: Sci13 招待講演

創発システムとは? 創発

システム構成要素間の局所的な相互作用を通じ、大域的な秩序がボトムアップ的に発現し、こうしてできる大域的な秩序が境界条件として要素間の局所的相互作用をトップダウン的に支配するという双方向の過程により、新しい機能、形質、行動などの獲得をもたらすこと.

2013/6/14 SCI2013@神戸 9

Page 8: Sci13 招待講演

記号創発システムとミクロ・マクロループ

コミュニケーションの為の 用法や意味の制約

環境との相互作用に基づく 記憶システムの組織化

記号的相互作用

物理的相互作用

Symbolic System Emergence

谷口忠大. 「コミュニケーションするロボットは創れるか-記号創発システムへの構成論的アプローチ」( 2010). 2013/6/14 SCI2013@神戸 10

Page 9: Sci13 招待講演

記号創発ロボティクス

人工知能学会誌 特集号 2012/11 「記号創発ロボティクス」 2013/6/14 SCI2013@神戸 11

Page 10: Sci13 招待講演

記号創発ロボティクス 記号を操る知能への2つの「構成」 構成論的アプローチ (constructive approach)

知能を構成することによって理解する. 構成主義 (constructivism)

世界を構成する知能を理解する.

(c) 電通大 長井研究室

モデルを通した理解 • 対象を理解するアナロジーを提供する. • 実験科学に仮説を提供する. • 自然言語によらない,ダイナミクスの記述

2013/6/14 SCI2013@神戸 12

Page 11: Sci13 招待講演

記号創発システムの 計算知能による表現可能性 20世紀: 不確実性,言語を操る情報技術の不足

’90年代までの人工知能と認知科学の歴史は一旦忘れましょう. 「人工知能が表象主義」だとか,「コネクショニズム」なんて言葉を使っている情報科学者は死滅している.

21世紀: 革命の素地 現実の知能が扱う程度に複雑な大量データ

WEB, クラウド,安価なセンサ,広大なメモリ空間,計算資源 確率的情報処理の進化:

ベイズ理論(グラフィカルモデル,ノンパラメトリックベイズ理論),マルコフ連鎖モンテカルロ法,など

安価で統合的なオープンソース知能情報処理環境の充実 OPEN-CV, JUILIUS, 各種Google API, ROS, など

記号創発ロボティクスは,もはや極めて現実的な研究分野 2013/6/14 SCI2013@神戸 13

Page 12: Sci13 招待講演

記号創発ロボティクス

人工知能学会誌 特集号 2012/11 「記号創発ロボティクス」 2013/6/14 SCI2013@神戸 14

Page 13: Sci13 招待講演

Contents 1. 記号創発システム 2. マルチモーダルカテゴリ形成 3. ノンパラメトリックベイズ二重分節解析 4. まとめ

2013/6/14 SCI2013@神戸 15

Page 14: Sci13 招待講演

マルチモーダル情報統合とカテゴリ形成 人は物体をカテゴリに分けて記憶している

物体概念を形成 全ての物体を個別に覚える事なく様々な物体に対応

カテゴリを通した様々な予測 未知の物体にも柔軟に対応

単語はカテゴリに基づいている 人と対話するために必要

マルチモーダル情報統合 カテゴリ形成には複数の感覚系の情報が利用されている.

身体性に基づくボトムアップな マルチモーダルカテゴリ形成 2013/6/14 SCI2013@神戸 16

Page 15: Sci13 招待講演

マルチモーダルカテゴリゼーション MHDP-LDA [Nakamura ‘11]

視覚・聴覚・触覚情報を用いた物体のカテゴリゼーション 確率モデルLatent Dirichlet Allocation (LDA)のマルチモーダル拡張 => MLDA

教師なしでカテゴリ分類しロボットの物体概念を形成 ノンパラメトリックべイズに基づくカテゴリ数の自動推定

=> MHDP-LDA

物体カテゴリ

LDAからMLDAへ Nakamura, T. et. al. "Multimodal categorization by hierarchical dirichlet process" IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp.1520- 1525. (2011) 2013/6/14 SCI2013@神戸 17

Page 16: Sci13 招待講演

18

実験[Nakamura ‘11]

マルチモーダル情報は 全てロボットにより取得

見る

握る

振る

• 視覚情報 PCA SIFT (36次元) 500次元のHG • 聴覚情報 MFCC (13次元) 50次元のHG • 触覚情報 センサー値の変化情報(2次元) 15次元HG

2013/6/14 SCI2013@神戸

Page 17: Sci13 招待講演

ロボットに扱わせた物体

Objects used in the experiment and their categories Graphical model of MHDP-LDA 2013/6/14 SCI2013@神戸 19

Page 18: Sci13 招待講演

マルチモーダル情報統合に基づく カテゴリ分類結果

ぬいぐるみ 野菜のおもちゃ

鈴入り人形 マラカス スポンジボール ガラガラ

カップ 積み木 ペットボトル ゴム製人形

マルチモーダルな情報の統合によって 多くの被験者と同様なカテゴリ分類を自動的に形成した. 2013/6/14 SCI2013@神戸 20

Page 19: Sci13 招待講演

単一モダリティの分類 視覚情報のみによる分類

分類精度:79.6% 推定カテゴリ数:12

聴覚情報のみによる分類 分類精度:38.4% 推定カテゴリ数:3

触覚情報のみによる分類 分類精度:53.8% 推定カテゴリ数:12

モダリティを制限すると、人間の物体カテゴリと同様な形成はできていない

2013/6/14 SCI2013@神戸 21

カテゴリの 身体依存性

Page 20: Sci13 招待講演

Contents 1. 記号創発システム 2. マルチモーダルカテゴリ形成 3. ノンパラメトリックベイズ二重分節解析 4. まとめ

2013/6/14 SCI2013@神戸 22

Page 21: Sci13 招待講演

明示的な分節化の無い行動系列から 模倣学習を通して様々な動作を学習する幼児

人間の子供は親の日常的な行動を観察し,またインタラクションすることで模倣すべきセグメントを抽出し自律的に(勝手に)真似る.

これを通じて,明示的な教示なしに子供は様々な動作パターンを獲得する.

彼らは日常のインタラクションの中に埋め込まれた何らかの構造を利用して,それらを行っているはずである.

bowing

Bye-bye!! Cleaning

(1 year 8 month old) presenter’s son

2013/6/14 SCI2013@神戸 23

Page 22: Sci13 招待講演

記号論における二重分節構造概念 (音声言語に含まれている構造)

二重分節と意味のある分節 音声信号は高次の連続した時系列情報である. 音声信号は音素(phoneme)の系列として捉えられる. 人々は通常,音素には意味を与えず,ひとまとまりの音素列である単語(word)に意味を与える.

h a u m ʌ́ tʃ I z ð í s

[h a u ] [m ʌ́ tʃ] [ i z ] [ð í s]

How much is this? 意味あり

意味なし

非分節

2013/6/14 SCI2013@神戸 24

Page 23: Sci13 招待講演

1 2 46 1 27 8 5 10 11 13 14 7

[Basic Idea] 人間動作における二重分節構造

Unsegmented human motion

Unit motion

W H A T I S T H I S T H I S I S A P E N Letter

Word

Label of Hidden states

[1 2 7 6 4] [8 5 10] [11 13] [1 2 7 6 4] [14]

[WHAT] [IS] [THIS] [THIS] [IS] [A] [PEN]

Audio Data

Elemental motion

2013/6/14 SCI2013@神戸 25

Page 24: Sci13 招待講演

音声認識における言語モデルと音響モデル

w ta

遷移則

記号化

•一つの単語は複数の隠れ状態をもつleft-to-right型のHMM • 単語N-gramモデルで単語間の遷移則を記憶 • 音響モデルと結合させることで音声認識を行う事が出来る.

二重分節に基づく単位動作の獲得 は言語モデルの学習に対応

2013/6/14 SCI2013@神戸 26

Page 25: Sci13 招待講演

Double Articulation Structure 観測された時系列情

報だけから,背後に潜む語彙知識,二重分節構造を獲得する.

条件 単語数未知 文字数(隠れ状態数)未知

出力分布パラメータ未知

Language Model

Segment

Chunk

afa?

fd

Tadahiro Taniguchi, Shogo Nagasaka “Double Articulation Analyzer for Unsegmented Human Motion using Pitman-Yor Language model and Infinite Hidden Markov Model” 2011 IEEE/SICE International Symposium on System Integration, .(2011) 2013/6/14 SCI2013@神戸 27

Page 26: Sci13 招待講演

High-dimensional motion data

motion data

5213….4213….321….02131341415 ….Document

5213 … . 4213 … . 321 … . [0] ,[2,1,3],[1],[3,4], … Segmented document

Modeling & Encoding

Chunking & Extraction

NPYLM

Sticky HDP-HMM

Unit motions Unit motions

Unit motion [2,1,3]

[3,4]

Elemental motion

Approximate Inference Procedure of Double Articulation Analyzer

Tadahiro Taniguchi, Shogo Nagasaka “Double Articulation Analyzer for Unsegmented Human Motion using Pitman-Yor Language model and Infinite Hidden Markov Model” 2011 IEEE/SICE International Symposium on System Integration, .(2011) 2013/6/14 SCI2013@神戸 28

Page 27: Sci13 招待講演

sticky HDP-HMM 可変個(潜在的に無限個)の隠れ状態を持つHMM [Teh ‘06]

遷移行列を複数の多項分布と見なしてモデル化

基本的にergodic HMMとなる. 自己遷移確率を高くなるようにバイアスしたSticky Hierarchical Dirichlet Process-HMM (sHDP-HMM) を用いる.[Fox ‘09]

出力分布に多次元ガウス分布を仮定する.

β

z1

γ

λ θk∞

πkα

y1

z2

y2

z3

y3

zT

yT

β

z1

γ

λ θk∞

πkα

y1

z2

y2

z3

y3

zT

yT

κ

2013/6/14 SCI2013@神戸 29

Page 28: Sci13 招待講演

教師無し形態素解析 形態素解析

日本語のような単語間の区切りのない言語では,単語の切れ目を解析することが重要になる.「分かち書き」

離散文字列から言語モデルを作るためには,この形態素解析ができる必要がある.

しかし,通常,形態素解析自体が「辞書」の存在を前提とする. 鶏が先か卵が先か・・・

教師無し形態素解析 辞書を使わずN-gram統計量のみを用いて,未知のテキストから単語・キーワードを抽出する手法が開発されてきている. 多くはヒューリスティック,もしくはMDLを基準にして計算量が重い.

ノンパラメトリックベイズ理論に基づく教師無し形態素解析 [持橋’09]

2013/6/14 SCI2013@神戸 30

Page 29: Sci13 招待講演

NPYLM (Nested Pitman-Yor Language Model) 階層ディリクレ過程の拡張であるPitman-Yor過程によりスムージングを行い,単語Ngramモデル,文字Ngramモデルをiterativeに構成することで,教師無し形態素解析を実現した.[持橋’09]

完全にベイズ理論的な教師無し形態素解析

2013/6/14 SCI2013@神戸 31

Page 30: Sci13 招待講演

[持橋 発表資料より] http://chasen.org/~daiti-m/paper/jfssa2009segment.pdf 2013/6/14 SCI2013@神戸 32

Page 31: Sci13 招待講演

ドライバーの運転行動予測

未来の具体的な時系列情報を予測するのは困難 予測した具体的情報でドライバを支援するのは困難. 文脈情報はより長時間の情報とドライバの意図を表現している. ドライバ支援の上でも有用と考える.

具体的な運転行動データの時系列予測

文脈情報の予測 hidden states

Language Modeafa

?fd

2013/6/14 SCI2013@神戸 33

Page 32: Sci13 招待講演

運転行動への適用実験 デンソー構内で2種類のコースを5週づつ走る. 特徴量 : 車速(+d.f.),ステアリング角(+d.f.),ブレーキ圧,アクセル開度

1st course

2nd course

Start/Goal

(1st -5th track)

(6th ~10th track)

Kazuhito Takenaka, Takashi Bando, Shogo Nagasaka, Tadahiro Taniguchi, Kentaro Hitomi, “Contextual Scene Segmentation of Driving Behavior based on Double Articulation Analyzer, “, IROS 2012 (2012) to appear 2013/6/14 SCI2013@神戸 34

Page 33: Sci13 招待講演

二重分節結果の経路へのマッピング

Track 1 Track 6 2013/6/14 SCI2013@神戸 35

Page 34: Sci13 招待講演

被験者3人のつけたタグと二重分節解析の分節点を比較した. 赤:走行状態 緑:移動方向 青:周辺状況 ピンク:運転状況 (人間の自然な判断)

2013/6/14 SCI2013@神戸 36

Page 35: Sci13 招待講演

隠れ状態系列予測問題への拡張

Language Model

Segment

Chunk

afa?

fd

Double articulation analysis and prediction of hidden states 2013/6/14 SCI2013@神戸 37

Page 36: Sci13 招待講演

不完全文へのベイズ教師なし形態素解析の拡張

Prediction of hidden states sequence Giving theoretical probability to incomplete hidden words

Tadahiro Taniguchi, Shogo Nagasaka, Kentarou Hitomi, Naiwala P. Chandrasiri, and Takashi Bando Semiotic Prediction of Driving Behavior using Unsupervised Double Articulation Analyzer 2012 IEEE Intelligent Vehicles Symposium, 849 - 854 .(2012)

2013/6/14 SCI2013@神戸 38

Page 37: Sci13 招待講演

二重分節解析器を用いた運転状態系列の予測 Collaborative work with DENSO

Published in Intelligent Vehicle 2012

View from driver’s seat

Averaged number of correctly predicted hidden states Histogram

1st course

2nd course

Start/Goal

(1st -5th track)

(6th ~10th track)

2013/6/14 SCI2013@神戸 39

Page 38: Sci13 招待講演

Drive Video Summarization based on Double Articulation Structure of Driving Behavior

Kazuhito Takenaka, Takashi Bando, Shogo Nagasaka, Tadahiro Taniguchi, "Drive Video Summarization based on Double Articulation Structure of Driving Behavior", ACM multim media 2012, to appear

Tadahiro Taniguchi, Shogo Nagasaka “Double Articulation Analyzer for Unsegmented Human Motion using Pitman-Yor Language model and Infinite Hidden Markov Model” 2011 IEEE/SICE International Symposium on System Integration, .(2011) 2013/6/14 SCI2013@神戸 40

Page 39: Sci13 招待講演

Contents 1. 記号創発システム 2. マルチモーダルカテゴリ形成 3. ノンパラメトリックベイズ二重分節解析 4. まとめ

2013/6/14 SCI2013@神戸 41

Page 40: Sci13 招待講演

記号創発ロボティクスは・・・ × 記号を創発させる研究をする.

○ 記号系が創発的な存在であることを認めた上で,それを支える認知・運動・言語の学習機構について研究を行う.

マルチモーダル対話 相互信念モデル / コンテキストに依存した意味処理 / 言語・運動・画像の統一的処理 概念獲得 予測モデルと概念分化 / 身体性依存の概念形成 / マルチモーダル概念獲得 / 概念獲得とバイアス

言語獲得と発達 教師なし形態素解析 / 教師なし音韻獲得 / 未知語の学習

対話戦略 対話戦略の能動学習 / ターンテイクの学習 / 発話生成 / 自然文生成

動作や行為の学習 非分節動作からの模倣学習 / 行為の汎化 / 運動と言語の相互変換 / 大規模の動作データの学習

コミュニケーション・記号過程の創発 サインの自己組織化 / コミュニケーションの創発 / 言語の超越性 / 比喩・オノマトペ

Keywords for Symbol Emergence in Robotics

2013/6/14 SCI2013@神戸 42

Page 41: Sci13 招待講演

「知能研究」のために

言語獲得を始め不確実性を含んだ環境下での知能発達のダイナミクスの記述のためには「自然言語」では役不足,

確率モデル,ダイナミカルシステムを含んだ数理的・計算論的な「実際に動作する」記述様式が必要. 種々の実験結果を統一的に議論する際にも.

「実際に言語が獲得できる」,「実世界で活動できる」モデルを提供することは,知能理解への大きな示唆となる.

2013/6/14 SCI2013@神戸 43

Page 42: Sci13 招待講演

Information 谷口忠大. 「記号創発の意味がわからなくて困っています.」(アイ・サイ問答教室). システム/制御/情報, Vol. 54, No. 5, pp. 214-215, 2010

谷口忠大. 「コミュニケーションするロボットは創れるか-記号創発システムへの構成論的アプローチ」(叢書コムニス13). エヌティティ出版, 2010.

twitter: @tanichu facebook: 実名で検索

【大学院生の募集】 ・谷口研究室では記号創発ロボティクスについて研究する 大学院生を募集しております.

2013/6/14 SCI2013@神戸 44

Page 43: Sci13 招待講演

Special thanks 立命館大学

長坂翔吾,濱畑慶太 電気通信大学

長井隆行,中村友昭,荒木孝弥 NICT

岩橋直人 京都大学

椹木哲夫

2013/6/14 SCI2013@神戸 45