非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの...

8
-1/8- 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの影響 米澤朋子 *1 ,鈴木紀子 *2 ,間瀬健二 *3 *1 ,小暮潔 *1 *1 ATR 知能ロボティクス研究所,*2 ATR メディア情報科学研究所,*3 名古屋大学 概要 本稿では,人と人のコミュニケーションに対し,既存のコミュニケーションチャンネルと並行した, ぬいぐるみの新しい表現形式としての可能性に着目し,ぬいぐるみロボットの動きと音声を通じた会 話による非対面コミュニケーションを観察する.そして,ぬいぐるみの実体性や外観がユーザの発話 および意識的・無意識的ノンバーバル表現に及ぼす影響について実験的に分析する.そのため,1) 存するぬいぐるみを用いた場合と二次元画面上に現れるぬいぐるみを用いた場合, 2) ぬいぐるみを用 いた場合とむき出しのロボットを用いた場合をそれぞれ対比較する.その結果, ぬいぐるみの実体性 や外観が,それぞれユーザの発話や動作に作用することが確認された. Non-verbal Expression in Non-face-to-face Communication using a Puppet-Robot Tomoko Yonezawa *1 Noriko Suzuki *2 Kenji Mase *3 *1 Kiyoshi Kogure *1 *1 ATR Intelligent Robotics and Communication Laboratories, *2 ATR Media Information Sci- ence Laboratories, *3 Nagoya University abstract Puppets could become a new tool for expressive communication, parallel to traditional communication channels in human-human interaction. A puppet-robot was used in a non-face-to-face communication experiment, which allowed expression via motion and vo- cal cues. Two conditions were explored, one in which the subject could see the real pup- pet-robot and the other in which the user viewed the puppet-robot via a video link. The re- sults demonstrated the importance of the physical presence of the puppet-robot for commu- nication. We also explored the effect of the appearance of the puppet-robot. In one condition, the puppet-robot was placed inside a stuffed bear, whereas in the other condition a skeleton robot was used. Based on analysis of the subject’s movements and utterances, we found that the appearance of the stuffed bear puppet-robot was more effective for communication. We conclude the physical presence and appearance of the puppet-robot play an important role in non-verbal communication with the robot. 1. はじめに 人と人の対面コミュニケーションではさまざまなノ ンバーバル表現が交わされる.その一方で電話などの 即時性のある非対面コミュニケーションでは,対面の 場合と比べて,伝えることのできるノンバーバル情報 は通常減少すると考えられる. しかし,昨今遠隔コミュニケーションにおける視覚 情報の共有や新しいグループウェアの形態が提案され, 対面コミュニケーションに類似したノンバーバル情報 を提供することや,これまでにない新しいコミュニケ ーション形態を実現するものが出現している.遠隔で 同じ室内にいるような感覚を共有するシステム[1]や, 仮想キャラクタを用いたアバターチャットシステムさ ぱり(Sony) [2]なども,ノンバーバル情報を導入した遠 隔コミュニケーション支援といえるが,個々の没入感 の度合に依存する.それに対しより直感的なコミュニ ケーションのために実体性を伴ったノンバーバル擬人 化表現が有効だと考えた. 我々はぬいぐるみの情操性を活かしたコミュニケー ションを狙いとし,これまでに既存のコミュニケーシ ョンチャンネルと並行した,ぬいぐるみを用いた新し い表現を提案してきた[3].この過程においてぬいぐる み(図 1 左)と音楽表現を用いた対面対話実験を行い, ぬいぐるみを用いると会話の主導権が不規則に変化す

Upload: others

Post on 15-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-1/8-

非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの影響

米澤朋子*1,鈴木紀子*2,間瀬健二*3 *1,小暮潔 *1

*1 ATR 知能ロボティクス研究所,*2 ATR メディア情報科学研究所,*3 名古屋大学

概要 本稿では,人と人のコミュニケーションに対し,既存のコミュニケーションチャンネルと並行した,

ぬいぐるみの新しい表現形式としての可能性に着目し,ぬいぐるみロボットの動きと音声を通じた会

話による非対面コミュニケーションを観察する.そして,ぬいぐるみの実体性や外観がユーザの発話

および意識的・無意識的ノンバーバル表現に及ぼす影響について実験的に分析する.そのため,1) 実存するぬいぐるみを用いた場合と二次元画面上に現れるぬいぐるみを用いた場合,2) ぬいぐるみを用

いた場合とむき出しのロボットを用いた場合をそれぞれ対比較する.その結果,ぬいぐるみの実体性

や外観が,それぞれユーザの発話や動作に作用することが確認された.

Non-verbal Expression in Non-face-to-face Communication using a Puppet-Robot

Tomoko Yonezawa*1,Noriko Suzuki*2,Kenji Mase*3 *1,Kiyoshi Kogure*1

*1 ATR Intelligent Robotics and Communication Laboratories, *2 ATR Media Information Sci-ence Laboratories, *3 Nagoya University

abstract

Puppets could become a new tool for expressive communication, parallel to traditional communication channels in human-human interaction. A puppet-robot was used in a non-face-to-face communication experiment, which allowed expression via motion and vo-cal cues. Two conditions were explored, one in which the subject could see the real pup-pet-robot and the other in which the user viewed the puppet-robot via a video link. The re-sults demonstrated the importance of the physical presence of the puppet-robot for commu-nication. We also explored the effect of the appearance of the puppet-robot. In one condition, the puppet-robot was placed inside a stuffed bear, whereas in the other condition a skeleton robot was used. Based on analysis of the subject’s movements and utterances, we found that the appearance of the stuffed bear puppet-robot was more effective for communication. We conclude the physical presence and appearance of the puppet-robot play an important role in non-verbal communication with the robot.

1. はじめに

人と人の対面コミュニケーションではさまざまなノ

ンバーバル表現が交わされる.その一方で電話などの

即時性のある非対面コミュニケーションでは,対面の

場合と比べて,伝えることのできるノンバーバル情報

は通常減少すると考えられる. しかし,昨今遠隔コミュニケーションにおける視覚

情報の共有や新しいグループウェアの形態が提案され,

対面コミュニケーションに類似したノンバーバル情報

を提供することや,これまでにない新しいコミュニケ

ーション形態を実現するものが出現している.遠隔で

同じ室内にいるような感覚を共有するシステム[1]や,

仮想キャラクタを用いたアバターチャットシステムさ

ぱり(Sony) [2]なども,ノンバーバル情報を導入した遠

隔コミュニケーション支援といえるが,個々の没入感

の度合に依存する.それに対しより直感的なコミュニ

ケーションのために実体性を伴ったノンバーバル擬人

化表現が有効だと考えた. 我々はぬいぐるみの情操性を活かしたコミュニケー

ションを狙いとし,これまでに既存のコミュニケーシ

ョンチャンネルと並行した,ぬいぐるみを用いた新し

い表現を提案してきた[3].この過程においてぬいぐる

み(図 1 左)と音楽表現を用いた対面対話実験を行い,

ぬいぐるみを用いると会話の主導権が不規則に変化す

Page 2: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-2/8-

図 2: 実験システム(被験者側)

る現象が確認された[4].ぬいぐるみによるコミュニケ

ーションを精密に設計するには,この不規則な変化の

要因を明らかにすることが望まれる. そこで本研究では,ぬいぐるみの特性を形成する要

素として 1) 実体性,2) 外観が重要であると仮定し,

それぞれの影響を,非対面コミュニケーションにおい

て確認することを目的として実験を行った. まず,ぬいぐるみを通じた動作と音声の通信を行う

ことのできるシステム IPRobotPhone™[5]を用い非対面

対話実験を行い,実験の過程を録音・録画した.デー

タに対し発話や動作が行われた時間区間をラベル付与

した.1) 実体性の異なる条件間:ぬいぐるみと対面した

場合と,ぬいぐるみが映された二次元画面と対面した

場合と,2) 外観の異なる条件間: ぬいぐるみと対面し

ながら人対人の非対面対話を行った場合と,ロボット

と対面しながら非対面対話を行った場合のそれぞれに

おいて被験者の行動を比較する.そして,ぬいぐるみ

の持つ要素としての外観と実体性の影響について個別

に考察し,それぞれの有効性を確かめる.

2. 関連研究

擬人化システムとして,Robovie[6]など社会的反応を

するよう設計されたシステムが多く発表されている.

一方で,ネコロ[7]他多数のペットロボットシステムも,

ぬいぐるみを用いた擬人化表現を行っている.これら

は擬人化表現を用いて人を惹きつけたり癒したりする

目的が主である. それに対し,Actimate-burney[8]のようにぬいぐるみ

を通じた教育など「ぬいぐるみとの接触」以外に目的

を持たせたシステムがある.ぬいぐるみの役割を愛玩

の対象から擬人化できる部分を別の目的に活かしてい

るといえる. MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

いぐるみ電話である.留守電の機能に擬人化要素が付

加したものと考えられる.このような従来の電話機能

の一部としてぬいぐるみをとらえているものから,

RobotPhone[10]のようにぬいぐるみに動きを取り込み,

ぬいぐるみをアバター/アクチュエータとしての両面

で擬人化してコミュニケーションのツールとして用い

るものもある.これはぬいぐるみの内部にセンサとロ

ボットを埋め込み,ユーザの動作入力をもう一方のユ

ーザがもつぬいぐるみ動作に反映するシステムである. 我々はぬいぐるみの擬人性を用いて音楽コミュニケ

ーションを行うために Com-music[3]を提案した.この

システムは多種多様なセンサを内包し,ぬいぐるみの

状況に応じた音楽生成を行うシステムである.そして,

対面コミュニケーションでの Com-music システムにお

ける「ぬいぐるみというデバイス」の効果について分

析するため,ピアノ・ぬいぐるみ・何も持たないとい

う表現デバイスの異なる条件で対面対話実験を行い,

ユーザの音声対話を観察した[4].その結果,ぬいぐる

みという対象を持つことによる影響は対話ペアにより

異なる影響を受け,会話の主導権が不規則に変化する

ことがわかった(図 1 右グラフ参照).この結果は,ぬ

いぐるみが持ついくつかの要素が影響したためと考え

られる. 本稿ではぬいぐるみのもつ外観と実体性に着目して,

ぬいぐるみを用いた非対面対話におけるユーザの行動

を観察し,ぬいぐるみの実世界における実体性の影響

を調べるために,ぬいぐるみ自身による場合とぬいぐ

るみの映像が二次元の画面上に表示される,いわば実

世界での実体性がないぬいぐるみによる場合との比較

を行う.また,やわらかい表面素材で覆われているぬ

いぐるみの外観の影響を調べるために,ぬいぐるみの

内部のロボットによる場合との比較も行う. 神田ら[11]はロボットと人とのコミュニケーション

を量的に観察し,モーションキャプチャシステムを利

用して身体動作を測定し,人-ロボット間の相互作用に

おけるユーザの主観的評価と身体動作の関連を示して

いる.このように,音声による対話の様子だけではな

く,ユーザの身体動作を観察するため,対話と身体動

作の両方を比較する実験を設計した.

audio L:ぬいぐるみ音声 R: 被験者音声

タイミング制御Wizard of Oz

ぬいぐるみ音声出力 PC

LAN

from microphone to headphone from 3 cameras

mixer

ぬいぐるみコントロール信号送信 PC

video unit

DV recorder

図 3: 実験システム(実験者側)

ball

正面カメラ

左カメラ

microphoneLAN

ぬいぐるみコントロール信号受信 PC

puppet, monitor or robot

上カメラ

headphone

図 1: ぬいぐるみを用いた対面実験の結果

y = 0.5212x + 0.4506R2 = 0.801

y = 0.0953x + 0.9249R2 = 0.0225

0

1

2

0 0.5 1 1.5 2 2.5

no-d

evic

e

piano(x), no-device(y)doll(x), no-device(y)piano, no_dev EXdoll, no_dev EXline(piano(x), no_device(y))line(doll(x), no_device(y))

· Pressure sensor *2 · Bend sensor *4

会話のバランス(話者 A の発話量/話者 B の発話量)

x 軸:デバイスあり y 軸:デバイスなし

Page 3: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-3/8-

3. 実験

これまでに,音楽的な表現を伴う対面対話実験にお

いてぬいぐるみが人同士の会話の主導権に不規則な影

響を与えることがわかっている[4].その不規則性の要

因を明らかにするために,非対面状況下の対話実験を

設定した.人と人のコミュニケーションを前提とし,

ぬいぐるみの要素としての概観,実体性と接触の影響

がどのような影響を及ぼすかに焦点を当てた. ぬいぐるみの動作表現を含めたコミュニケーション

を考慮し,本実験では,動作表現と音声の両チャンネ

ルでのコミュニケーションを可能とするロボットが必

要である.そこで,この条件を満足する RobotPhone[9]の製品版である IPRobotPhone を使用する.このシステ

ムは,ぬいぐるみの首,腕(x2)の 3 関節がそれぞれ

2 自由度,計 6 自由度の制御が可能なロボット内蔵型

ぬいぐるみである.

目的: ぬいぐるみの外観と実体性が非対面対話に与える影

響があるのか,条件比較を行う. 被験者:

20 代-30 代前半までの 21 名(男 15 名女 6 名) 実験条件: 実験条件は対話する際の対面する対象を a) ぬいぐ

るみ,b) 画面の中のぬいぐるみ,c)ロボットの 3 種類

とした.これらを以後対面対象と呼ぶ.以下に示す条

件で対面対象を設定した.そして,puppet 条件と

monitor 条件の間,また puppet 条件と robot 条件の間で

比較を行った. puppet 条件‥‥ぬいぐるみ monitor 条件‥‥ぬいぐるみを映した画面 robot 条件‥‥ぬいぐるみを剥いだ内部のロボット

実験システム: 対話相手との相互作用によって様々な影響を受ける

ことを考慮し,人対人のコミュニケーションを想定し

た,実験者によってコントロールされ,あらかじめ決

められたあらすじ通りに反応を返すシステムを,以下

のように設定した. 被験者は,防音設備のある部屋で 1) 対話音声情報と

2) ネットワークで実験者の IPRobotPhone と接続され

た IPRobotPhone の動作情報の二つを得る.音声による

対話は,あらかじめ決められた対話の流れ(付録 A に

示す)にそって対話実験を行うものとした.対話相手

の台詞部分は同じ抑揚になるよう,ナレーターではな

い 20 代女性の音声をあらかじめ録音し,ピッチ加工

(1.3 倍,時間長は元音声のまま)したものを用いた.

以降ぬいぐるみ音声と呼ぶ. 対話内容(ぬいぐるみ音声の台詞のみ)を被験者に

紙面で提示し,対話ストーリーの大枠をつかませてか

ら対話実験を開始し,自由に返答するよう指示した.

ぬいぐるみ音声の出力タイミングは被験者の発話終了

から 2秒後とした.ただし,発話 08は 0.5sec後とした.

同時に,Wizard of Oz 法によって付録 A のぬいぐるみ

音声と同期させて付録 B の動作情報を再現した. 被験者にロボットの作動音が聞こえにくくするため,

ヘッドセットを介して対話音声を通信した.ぬいぐる

み音声をヘッドフォンへ送り,ヘッドセットのマイク

から被験者の音声を録音した.音声・ぬいぐるみコン

トロール信号の送受信システム全体を図 2, 3 に示す. monitor条件の場合図2の中の対面対象はカラーモニタ

ーであり,そこに見かけ上等身大のぬいぐるみの映像

が映す.このぬいぐるみの映像は他の部屋に設置され

た IPRobotPhone を他の条件と同様に外部から操作し,

その映像を映したものである. 被験者の様子は,頭上,正面,左真横からカメラで

記録し,被験者の発話音声も同期させて録音した. 教示内容:

知人との人対人のコミュニケーションを想定させ

るため,「対話の相手は声の高さを変えてあるが被験

者の知人であり,対話と同時にぬいぐるみを操作して

いる」と設定し説明した.対話内容(付録 A)を示し,

対話が限定されたストーリーに沿っていると同時に,

被験者は自由な内容の返答ができることを教示した. 観察(観測)内容:

WaveSurfer[12]を用い,以下に記載するラベルについ

て,視認によるハンドラベリングによって各ラベルを

付与した(図 4 参照).その後ラベリング結果を条件ご

とにまとめた.

A. 聴取,音声波形視認による発話ラベリング 各ぬいぐるみ音声に対する被験者の返答の発話タイ

ミングをラベル付与した.発話中は付録 A の番号に応

じ返答部分に番号ラベルを付与した.発話区間外は[#]を付与した.また,これらの発話を書き起こした.こ

れらにより,以下のデータを得た. (1) 発話時間:被験者の各返答の時間長を発話タイミ

ングより算出 (2) 発話遅延:ぬいぐるみ音声の発話終了時間から被

験者の発話開始区間までの時間差を計測 (3) 発話モーラ数:被験者の各発話におけるモーラ数

を計測 今回の実験ではフィラーに別ラベルを付与しなかっ

た.これは,通常ではフィラーと考えられる発話が返

答そのものになるケースが目立ち,フィラーと意味の

ある発話の分別が難しいためである.

B. 視認による動作ラベリング 下記のラベルについて,開始時と終了時にマークを

つけた.動作回数を計測するものは対話実験の時間長

にかかわらず回数をそのまま使用し,時間長を計測す

るものは対話実験の時間長で正規化した.

Page 4: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-4/8-

(1) 視線 [look] 対面対象を見ている [look-ball] ボールを見ている [switch] 視線の対象の切り替わりをカウント

(2) 表情 [smiling] 声を出す出さないにかかわらず,笑ってい

る状態 (3) 対面対象の存在が前提で出現しやすい動作

[hands-wave] 対面対象に向かって手を挙げる,振る

[mimicry] 対面対象の動作を真似る (4) 非対面対話でも使う可能性のある動作

[nod] うなづく [make-a- bow] お辞儀や会釈をする [head-incline] 首を曲げる動作 [body-incline] 胴体を移動させる動作

(5) 対話への関連性の低い動作 [touch-ball] ぬいぐるみ音声 04 以降の ball への接触

C. 簡易主観アンケート ぬいぐるみもしくはロボットへの意識や,コミュニ

ケーションの相手への意識について主観的意見を調べ

るため,以下の三つの簡単なアンケートを行った.ま

た,対話実験についての自由回答を求め,本実験にお

けるコミュニケーションの形態について感じることを

主題とし,全員から回答を得た. Q-A) 相手の人を想像したか Q-B) 対面対象に愛着を感じたか Q-C) 会話している間,コミュニケーションの相手

の人,もしくは,対面対象のどちらを(どちらかと

いえば)意識したか

4. 実験結果

4.1. 観察例 各条件における実験風景を図 5,6,7 に示す. puppet条件の実験の様子を主に観察したところ,被験者が片

手を挙げて呼びかけや挨拶に返答したり,視線を合わ

せながら笑いかけるなどの対面対話でも見られる種類

の行動が見られた.特に手を振る,挙げるなどは電話

での非対面コミュニケーションではあまり見られない

ため,対面対象の存在が対話に及ぼす影響が存在する

と考えられる.

4.2. アンケート結果 アンケート項目のうち,Q-A と Q-B はそれぞれ独立

事項であり,Q-C は二者択一である.そのため,まず

Q-A と Q-B の回答の組み合わせを集計した(表 1).Q-A と Q-B の回答の相関は-0.61 である.これは,全条

件を通して,対面対象と対話相手のいずれかを意識す

る傾向があることを示している.しかし,個別の条件

に関しては興味深い傾向が見られた.puppet 条件以外

ではQ-AとQ-BともにYesと回答した被験者はいなか

ったが,puppet 条件では 8 人中 3 人が両者を Yes とし

た.一方,monitor 条件において Q-B のみに Yes と回答

した被験者が多かった.robot 条件では被験者全員 Q-Aと Q-B どちらかにのみ Yes と回答していた.ここで,

puppet 条件では,ぬいぐるみ音声を発している「相手」

のアバターになる対象(ぬいぐるみ)に対し親しみを

感じるとともに対話相手とのコミュニケーションにも

意識がある被験者が数人見られたが,他の条件では見

られなかったことを示している.robot 条件では特に被

被験者の音声

ぬいぐるみ側音声

被験者側発話タイミングラベル

ぬいぐるみ側発話タイミングラベル

被験者動作情報ラベル

図 4:発話タイミングおよび動作情報のラベリング

Page 5: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-5/8-

験者は対面対象と対話相手のどちらかに意識が集中し

たと推測する.monitor 条件では Q-B のみを Yes とした

割合が高く,二次元画面上であってもぬいぐるみの映

像に興味を惹かれた人が多かったことを示している. Q-C において,puppet 条件と monitor 条件においては

各一人ずつが対話相手を意識したのに対し,robot 条件

では 6 人中 3 人が対面対象を意識した.この 3 人は全

員 Q-A が No,Q-B が Yes であった.この結果は上で

述べた robot における意識の対象が集中したという推

測を裏付けている.

表 1: Q-A と Q-B の回答パターン集計 condition Q-A&Q-B Q-A only Q-B only none (all) puppet 3 2 3 0 8 monitor 0 1 5 1 7 robot 0 3 3 0 6

自由回答(付録 C)では,ぬいぐるみ音声に関する

感想が monitor 条件で 2 人(7 人中),robot 条件で 2人(6 人中)から得られた.対話を通じたコミュニケ

ーションにおいて,対面対象が新規のものであっても

音声のモダリティが重要であることが伺える.相槌や

うなずきがよかったとする意見がすべての条件におい

て見られた.puppet 条件と robot 条件では動作やジェス

チャに対する感想が見られたのに対し,monitor 条件で

は実体が存在したらよかったという感想が見られた.

その他否定的な回答としては,puppet 条件で,ぬいぐ

るみと向かい合う形態のコミュニケーションに抵抗を

示す回答が一点あった.monitor 条件ではつかみどころ

がない感覚だったという回答があった.

4.3. ユーザ動作の分析 被験者の動作分析では,look,smiling,touch-ball によって実験全体におけるユーザの関心について分析す

る.また,対面対象の存在が前提で出現しやすい動作

と,非対面対話でも出現する可能性のある動作の出現

回数を比較する.有意差の検定を行う際にはサンプル

数などを考慮し,F 検定により分散の検定を行い,そ

れに適した T 検定(α=0.05)を行った.look,smiling,touch-ball については,全体の時間で正規化したものを

それぞれ looking-rate,smiling-rate,touch-ball-rate とし

て図 8 に示す. 動作分析 1: touch-ball の割合では,puppet 条件と robot条件の間で T(7)=-2.60, p<.05 と有意差があったが, puppet 条件と monitor 条件の間では T(9)= -1.92,p=0.09と有意傾向にとどまった.実際 touch-ball を行った被験

者数は, puppet 条件で 1 人(8 人中), monitor 条件で

4 人(7 人中), robot 条件で 5 人(6 人中)であった.

touch-ball は対話とは直接関係せず無意識的な「手癖」

であり,対面コミュニケーションでは減少すると推測

した.そして,上記の結果はぬいぐるみが実体である

ことが手癖を減少させた,また,ぬいぐるみの外見が

ロボットのままと比較して手癖を減少させると考える. 動作分析 2: smiling-rate の puppet 条件と monitor 条件間

で T(8)=1.95, p=0.09 と有意傾向にとどまったが,puppet条件と robot 条件間では T(7)=2.53, p<.05 となり,有意

差が確認された.また,looking-rate は puppet - monitor条件間ではT(13)=-0.17, p= 0.86 で有意差はなく,puppet - robot 条件間では T(12)=2.32, p<.05 となり有意差が認

められた.ユーザの笑う表情は画面の中のぬいぐるみ

より実体性を伴った対面対象のほうが比較的出やすい

が,注視率は変わらなかった.つまり,実体性が視線

をひきつけるとは限らず,二次元画面でも視線をひき

つけると考えられる.一方外見の差については,ぬい

ぐるみの外観によりユーザが笑顔を見せ,ぬいぐるみ

を注視し,楽しんで集中したことを示唆している.

左カメラ 左カメラ 上カメラ上カメラ

正面カメラ 正面カメラ

図 5: 実験風景 [puppet]

左カメラ 左カメラ 上カメラ上カメラ

正面カメラ 正面カメラ モニタ上の ぬいぐるみ映像 モニタ上の ぬいぐるみ映像

図 6: 実験風景 [monitor]

左カメラ 左カメラ 上カメラ上カメラ

正面カメラ 正面カメラ

図 7: 実験風景 [robot]

Page 6: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-6/8-

動作分析 3: 図 9 で looking, smiling の散布図では robot条件と monitor 条件は puppet 条件に比べて左右下方に

分布している.ぬいぐるみの外観/実体性のそれぞれ

が及ぼす影響は異なるベクトルである可能性がある. 動作分析 4: 対面対象の存在が前提で出現すると考え

られる動作の回数を集計し図 10 に示す.観測回数が少

なかったため分散が大きくなったが,puppet 条件と比

べ robot 条件で対面対象の存在が前提で出現する動作

の出現が少なかった.有意差は確認できなかったが,

ぬいぐるみの外観が人と対面したときのように親しみ

やすく,これらの表現がなされたとも考えられる. 動作分析 5: 非対面対話でも出現する可能性がある動

作の集計を図 11 に示す.head-incline と body-incline は被験者の意思表示とは限らず,結果でも有意な差は見

られなかった.nod と make-a-bow は電話など非対面状

況においても無意識的にも行われる挨拶や意思表示行

動だと考えられる.この二種類の表現が robot において

少なかったため(puppet - robot 条件間において nod と

make -a-bow の回数の和を検定,T(8)=3.11, p<.05 で有意

差あり),外観の違いによりコミュニケーションに対す

る関心が低下したと予想される. 動作分析 6: 視点のスイッチのタイミングをA: ぬいぐ

るみ音声発話中,A’: ぬいぐるみ音声終了後から被験

者発話までの間,B: 被験者発話中,B’: 被験者発話終

了後とし,A または B のタイミングで視点がスイッチ

した回数と A’または B’のタイミングで視点がスイッ

チした回数を散布図に示す(図 12 参照).視点スイッ

チ回数の合計では各条件間で大きな差は見られなかっ

たが,図 12 の散布図は線形近似すると puppet 条件の

R2値が も高かった(0.80).これについて対話時の視

点スイッチが落ち着きを示すものだと仮定すると,発

話時と非発話時の落ち着きの程度が変化せず,他の条

件では少々変化したということができる.

4.4. 発話分析 被験者の発話分析は,ぬいぐるみ音声に応じた返答

ごとの 1) 発話量(時間長),2) 発話遅延(ぬいぐるみ

音声の発話終了から被験者の発話開始までの時間長),

3) 発話モーラ数を用いた.ぬいぐるみ音声 01, 09, 10に対応する被験者の発話を「定型挨拶」に対する発話

とし,03, 08 に対応する被験者の発話を「相槌反応」,

02, 04, 07 に対応する被験者の発話を「質問」,05, 06 に

対する被験者の発話を「主張」に対する発話として,

それぞれ被験者ごとに平均値を出した. 条件ごとの平

均値を図 13, 14, 15 に示す.これらのデータの検定でも,

動作の分析と同様に F 検定により分散の検定を行い,

適した T 検定(α=0.05)を行った. 発話分析 1: 特に発話の多かった「質問」と「主張」に

対応する被験者の発話量を散布図に示した(図 16).ここでは puppet 条件を基準としてみると monitor 条件

では右下のほうに集中しているといえる.robot 条件は

ほとんど同様に分布している.また,「質問」に対応す

る被験者の発話量において puppet - monitor 条件間では

monitor 条件の発話量が比較的多く,検定の結果は

T(10)=-2.53, p<.05 となり有意差が認められた.そのほ

かの返答では各条件間(puppet - monitor 条件間,puppet - robot 条件間)で有意差は見られなかった.質問に対

0

0.2

0.4

0.6

0.8

1

1.2

1.4

looking-rate smiling-rate touch-ball-rate

puppet

monitor

robot

looking-rate vs smiling-rate

00.10.20.30.40.50.6

0 0.2 0.4 0.6 0.8 1looking

smili

ng

puppet

monitor

robot

AB vs A'B' in switch

0

5

10

15

20

25

0 5 10 15 20 25 30

AB (times)

A'B

' (tim

es) puppet

monitorrobot

図 10: 対面対象の存在が前提で出現しやすい動作回数

図 11: 非対面対話でも使う可能性のある動作回数

図 9: looking-rate と smiling-rate の関係

図 8: 各ラベルの全体に対する時間長の割合

図 12:視点スイッチのタイミング(発話中,非発話中)

0

2

4

6

8

10

head-incline body-incline nod make-a-bow

tim

es

puppet

monitor

robot

0

1

2

3

4

5

6

hand-wave mimicry

tim

es

puppet

monitor

robot

Page 7: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-7/8-

する応答では,Yes, No の返答以外に様々な応答を行う

可能性が考えられる.ぬいぐるみが対面対象であると

きよりも,画面の中のぬいぐるみが対面対象であると

きのほうがより多くの Yes, No 以外の応答が得られた

と考えられる. 発話分析 2: 発話遅延では親しみやすさや会話への没

入が現れると考えたが,どのデータも各条件間で有意

差は見られなかった.これは,同日中事前にテスト対

話を行ってはいたが,実験当日がこの形態での対話が

始めてであった事と,ぬいぐるみ音声が誰のものか分

からなくなっているため,没入までいたらなかったと

考えられる. 発話分析 3: 発話モーラ数では,「定型挨拶」に対する

応答で puppet - monitor 条件間で T(13)=2.13, p=0.05 と

なり有意傾向がみられ,puppet 条件がやや多く応答し

ているといえる(図 15).さらに挨拶に対する応答は

ある程度定型であることが多いため,対面対象が画面

上のぬいぐるみになると挨拶が簡素化したと考えられ

る.また,発話量で有意差のあった「質問」に対する

応答で,puppet - monitor 条件間で発話モーラ数も有意

差があった(T(13)=-2.57, p=.05).このことから,画面

上のぬいぐるみが対面対象であるとき,発話時間だけ

でなく発話内容も増加する傾向があるといえる.

5. 考察

まず,主観評価の分析より,ユーザはぬいぐるみに

対して親しみを感じると同時に対話相手とのコミュニ

ケーションにも意識を持ちやすいという可能性が考え

られる. さらにユーザ動作の分析において,ぬいぐる

みの外観が手癖を減少させていたことから,非対面状

況下であっても,ぬいぐるみが人と対面したときのよ

うな対面状況を想定させ,ユーザの無意識的な行動に

反映されたとも考えられる. それに対して外観が無機質なロボットでは,主観評

価においてユーザの意識の対象が対話相手かロボット

かに分かれていた.発話の比較においては puppet - robot 条件間で有意な差は認められなかったが,動作の

分析より,外観がぬいぐるみである時に比べ,笑顔に

なる率が低く,視線も向けていないことが分かった.

これらのことから,外観がぬいぐるみであることで,

より楽しみ集中できると考える. 一方,ぬいぐるみの実体性は,動作分析において,

touch-ball の手癖を減少させていた.また,発話分析に

おいて,挨拶や質問に対する応答を増加させた.対面

対象が画面上であると返答が簡素化していたと考える

と,実体性を持つことでユーザが積極的に対話に参加

できる可能性がある. ぬいぐるみの要素を削減した各条件で,図 9,16 の

散布図において近い箇所に集中する傾向があった.こ

のことから,ぬいぐるみという対面対象を介した発話

が不規則に変化したこと[4]は,各要素による異なる影

響が加わったことが原因だと推測される. 主観評価の自由回答や発話遅延の結果から,聴取さ

れる対話音声による影響が大きいと考えられ,今後の

実験の構成を検討する必要がある.また,擬人化を用

いたコミュニケーションシステムを設計する際,音声

対話に偏ったコミュニケーションとならないよう,実

体性を強調するデザインが重要である.その際ぬいぐ

るみの実体性は有効であると考える.

6. おわりに

本稿ではぬいぐるみの新しい表現形式としての可能

性に着目し,ぬいぐるみロボットの動きと音声を通じ

た会話による非対面対話を観察した.そして,ぬいぐ

るみの実体性や外観の影響が,いくつかのユーザの動

作や発話にそれぞれ作用したことを発見し,ぬいぐる

みの持つ要素として外観と実体性が個別に影響してい

utterance

0

1

2

3

4

5

定型挨拶 相槌反応 質問 主張

sec.

puppet

monitor

robot

delay

00.5

11.5

22.5

3

定型挨拶 相槌反応 質問 主張

sec.

puppet

monitor

robot

発話モーラ数

05

1015202530

定型挨拶 相槌反応 質問 主張

モー

ラ数

puppet

monitor

robot

図 15: 各条件における発話モーラ数

図 13: 各条件における発話時間長

図 14: 各条件における発話遅延

図 16: 「質問」「主張」に対する発話時間長の散布図

utterance 質問vs主張

01234567

0 1 2 3 4

質問(sec.)

主張

(sec

.)

puppet

monitor

robot

Page 8: 非対面状況下のノンバーバル表現に対する ぬいぐるみロボットの …yone/research/pdf... · MTC「おかえりぷるる」[9]は,メッセージ内蔵型ぬ

-8/8-

ると考察した. 今後は,対話ラベルと同時に動作ラベルを複合的に

ラベル付けし,ユーザ傾向を測定する手法を検討して

いきたい.また,ぬいぐるみの存在そのものだけでは

なく,ユーザによるぬいぐるみとの接触や制御などの

行動を観察する必要があると考えている.今回の実験

では音声の重要性を指摘するユーザもいたことから,

ぬいぐるみを用いたコミュニケーションにおける音声

表現について別途検討する必要があると考えている. 謝辞

本研究は情報通信研究機構の研究委託により実施し

たものである.研究の機会を下さった ATR IRC 所長萩

田紀博氏に感謝する.また,実験にご協力いただいた

ATR IRC/ATR MIS の皆様に感謝する. 参考文献

[1] 原田康徳,“同室感通信”,インタラクティブシステ

ムとソフトウェア 6,日本ソフトウェア学会, pp. 53-60, 1999. [2] SONY, さぱりミレニアム, http://sapacafe.sub.jp/sa-pari.htm, 2000. [3] Yonezawa, T., Clarkson, B., Yasumura, M., and Mase, K., “Context-aware Sensor-doll as a Music Expression De-vice,” CHI2001 Extended Abstracts, pp. 307-308, ACM SIGCHI, 2001. [4] Yonezawa, T. and Mase, K., “Musically Expressive Doll in Face-to-face Communication,” IEEE International Con-ference of Multimodal Interfaces Proceedings, pp. 417-422, 2002. [5] イワヤ株式会社,IPRobotPhone, http://www.iwaya.co. jp/ Files/phone-j.html, 2002. [6] 小野哲雄,今井倫太,石黒浩,中津良平, “身体表

現を用いた人とロボットの共創対話,” 情報処理学会

論文誌,Vol. 42, NO. 6, pp. 1348-1358, 2001. [7] SONY, “ネコロ,” http://pcweb.mycom.co.jp/news/2001 /news/2001/12/11/10.html [8] Strommen, E., “When the Interface is a Talking Dino-saur: Lerning across Media with ActiMates Barney,” CHI98 Proceedings, pp. 288-295, 1998. [9] MTC, “おかえりぷるる ,” http://ktai.impress.co.jp/ cda/article/news_toppage/16832.html, http://suntec.scn-net. ne.jp/~mtc/pururu/pururu.htm [10] Sekiguchi, D., Inami, M., and Tachi, S., “Robot-PHONE:RUI for Interpersonal Communication,” CHI2001 Extended Abstracts, pp. 277-278, 2001. [11] 神田崇行,今井倫太,小野哲雄,石黒浩,“人-ロボット相互作用における身体動作の数値解析,” 情報

処理学会論文誌,Vol. 41, No. 6, 2000. [12] Sjölander, K., and Beskow, J., WaveSurfer, http://www. speech.kth.se/wavesurfer/

付録 A: ぬいぐるみ音声台詞 01:ただいまー。 02:なんか 近、いいことない? 03:そっかー。 04:あ,それ,そこの青いボール、やわらかい? 05:そのボールこのくらいの大きさでしょ、このくらい

大きいのも欲しい。 06:私はネット三昧で暮らしてるから、楽しいよー。 07:そうそう、ネットに『○○(Web サイト名)は頭に

良くない』っていうのが載ってたの。 08:うんうん。 09:今日は、ありがとう。 10:また、こうやって話しようよ。 付録 B: ぬいぐるみ音声対応動作 01-M: 両手をあげる 02-M: 首をひねる 03-M: うなずく 04-M: 左手で示す 05-M: 前に手をそろえて出し,下げてから,横に出す 06-M: 軽くうなづく 07-M: 両手を前後に動かす 08-M: 2 回うなづく 09-M: 右手を挙げる 10-M: 両手を前後に動かす 付録 C: 自由回答

-puppet- ・あいづちが重要 ・音声だけより親近感が生まれた. ・電話より実態があってコミュニケーションしやすい ・声が聞こえるとぬいぐるみを思わず見てしまう. ・知らない人かすごく仲がいい人が相手だといい ・慣れたら楽しめそう ・指差し動作は理解できたがジェスチャ解釈が難しい ・動作がもっとほしい ・一人で話している感じがして,恥ずかしい -monitor- ・うなずきが重要 ・人と話している感覚はないが孤独感はなくなる ・つかみ所がない,画面を見て話すのには慣れない ・実体があるといい ・実体があえば目が合う向きに変えた ・声の質がキャラクタ的 ・声が気になる -robot- ・あいづちが重要 ・うなずき,大きさ指示が電話よりよい ・人間の存在は意識しなかった ・もし操作するなら逆向きにしたい ・ロボットの動きが怖い ・動作が大きいほどよい ・ロボットとは別の存在として声を意識 ・声の影響(かわいい)