玉岡賀津雄・松下達彦・元田静(2005)「日本語版 can-do scale...

14
日本 語 版 Can― do Scaleは どれ く らい 正 確 に 日本 語 能 力 を測 定 し うるか How accurately does a Japanese versio measure JaPanese language abⅡ ? 玉岡賀津雄 (TAMAOKA,Katsuo) 松下達彦 (MATSUSHITA,Tatsuh 元 田 静 (MOTODA,Shizuka) 日本語 の 要旨 :日 本語版 Can do Scaleが ,どれ くらい正確に外国人 日本語学習者の 日本 語能力を測定 しうるかを検討 した。その結果,「聞 く」 話す」 読む」 書 く」 の4技 能 か らなる 20項目の 質問す てについて,項 目間に有意な相関が得 られた。また,ク ンバ ックのアル ファ係数 も極 めて高 数値であつた。 しか し,因子分析 の結 果 , 「聞 く」 話す」 書 く」 群と 読む」 の群 の 2 つの 囚子にしか分けられないことがわかつた。 また、日本語能カテス トの得点 と日本語版 Can一 do Scaleで 測定した4技能の間には、有 意な相関はみ られなかつた。 さらに,4技能か ら日本語能力を予測する重回帰分析を行つ たが、どの技能も日本語能力を予測する有意な変数ではなかつた。 つまり,自己評価型の 質問紙は,日本語 の能力を予測できないとい う結果であつた。 これは個人 社会 文化的 背景,言語不安や性格要因などから,自己の 言語能力を過大あるいは過小に自己評価 して しま うためで ある と考 え られ よ う。 日本語のキ :日 本語版 Can一 do Scale, 日 本語能力の 測定, 自 己評価,質問紙法, 信 頼性 と妥 当性 英語の要旨 :The present smdy exalnttd how accumtely do Scalc measures actual Japanese languageお nⅢ ofintemational students.Twcnt lated tt th four categories of`listenmg',`speaking',化 配ing'and`wittg'had si抑 温Cantly high corre h every possiblc cottbination.A Cronback's alpha c 20 items.However9 the factor analysis identifled only rega耐 `1lstening',`speaking'and`wit理 ',and a grouP of 5 questiorls `reading'. Correlations betwccn the four caに gOries measured by dle Japanesc vers do Scale and a total scorc ofa Japancse langu4ge ability tett we -65-一

Upload: u-tokyo

Post on 26-Nov-2023

2 views

Category:

Documents


0 download

TRANSCRIPT

日本語版 Can―do Scaleは どれ くらい正確に 日本語能力 を測定 しうるか

How accurately does a Japanese version of a CaEHIO SCale

measure JaPanese language abⅡ守?

玉 岡賀津雄 (TAMAOKA,Katsuo)

松 下達彦 (MATSUSHITA,Tatsuhiko)

元 田 静 (MOTODA,Shizuka)

日本語の要旨:日 本語版 Can do Scaleが,ど れくらい正確に外国人 日本語学習者の日本

語能力を測定しうるかを検討 した。その結果,「 聞く」 「話す」 「読む」 「書く」の4技

能からなる 20項 目の質問すべてについて,項 目間に有意な相関が得られた。また,ク ロ

ンバックのアルファ係数も極めて高い数値であつた。 しかし,因 子分析の結果,「 聞く」

「話す」 「書く」の群と 「読む」の群の2つ の囚子にしか分けられないことがわかつた。

また、日本語能カテス トの得点と日本語版 Can一do Scaleで測定した4技 能の間には、有

意な相関はみられなかつた。さらに,4技 能から日本語能力を予測する重回帰分析を行つ

たが、どの技能も日本語能力を予測する有意な変数ではなかつた。つまり,自 己評価型の

質問紙は,日 本語の能力を予測できないとい う結果であつた。これは個人の社会 ・文化的

背景,言 語不安や性格要因などから,自 己の言語能力を過大あるいは過小に自己評価 して

しまうためであると考えられよう。

日本語のキーワー ド:日 本語版 Can一do Scale, 日本語能力の測定, 自己評価,質 問紙法,

信頼性 と妥当性

英語の要旨:The present smdy exalnttd how accumtely a Japanese verslon of a Can‐do Scalc

measures actual Japanese languageおnⅢ ofintemational students.Twcnty questionsにlated tt the

four categories of`listenmg',`speaking',化配ing'and`wittg'had si抑温Cantly high correlations

h every possiblc cottbination.A Cronback's alpha coettcient indicated a very high consistency of

20 items.However9 the factor analysis identifled only two factorsi a group of 15 questions

rega耐唯`1lstening',`speaking'and`wit理',and a grouP of 5 questiorls regadi鴫̀reading'.

Correlations betwccn the four caにgOries measured by dle Japanesc version ofthe Can‐do Scale and

a total scorc ofa Japancse langu4ge ability tett were not signincant.In addMon,muttiple regression

-65-一

analysis prcdicting the JaPanese languageおilⅢ by the fOur catcgoncs dd not reveal any

signiflcallt predic鉱 コlus,it is concluded that the Japallese verslon of the Can―do Scale callnot

properly measure actual Japaneseお1liけ 血 断Mttnal students leamitt Japanese are likcly的

overestimate or undere胡mate their Japanese abiliけdependtt on ther culturaysocial backgrounds,

lanwge allxiety and PttonaHけ施飯臣

英語のキーワー ド:Japanese version of Can‐dO Scaに,measumg Japanese language abiliけself―

assessment quesdomaitt methods,reliability and validity

l.研 究の目的

『日本語のラジオのニュースがわかりますか。」のような Can―do形 式の質問によって

日本語能力を測定しようとするのが Can一do Scaleで ある。この種の質問紙には、二つの

目的がある(Leblanc&Painchaud,1985)。 それ らは、言語能力試験を行 う費用の削減 と

時間の効率性である。仮に、学習者が正確に言語能力を自己判断できるのであれば、Can一

do Scaleは 、能力別クラス配置や進路指導などにも役立つであろう。 日本語教育学会

(1999)は,日 本語版の Can一do Scaleを 開発 してきた。 しかし、報告によると日本語能力

とCan―do形 式の質問の回答との相関は必ず しも高くないようである。

日本語版 Can do Scaleの ような自己評価型の質問紙の良さを発揮させるには、回答時

間を5分 から 10分 以内におさめなくてはならない。一つの質問に対 して 30秒 を要すると

すれば、20間 で 10分 となる。つまり、多くとも20問 くらいの質問数で測定の目的が達せ

られるような質問紙を作成 しなくてはならないのである。これを超えて 10分 以上の時間

を要するようであれば、むしろ日本語能カテス トを実施する方が効果的であろう。そこで、

本研究では、日本語版 Can一do Scaleの質問数を 20間 に限定した。その上で、このような

時間効率のよい質問紙が,ど のくらい正確に外国人日本語学習者の日本語能力を測定しう

るか。つまり, 日本語版 Can―do Scaleの信頼性 (reliability)と妥当性 (validity)を検討

した。

2.調 査 1

信頼性 とは、質問項目が一貫してお り、また安定して同じように測定 していることの程

度を示 している(ブラウン,1999,日 本語教育学会,1991)。 日本語版 Can―do Scaleに つ

いては、質問項 目が一貫して同じように測定していることを検討するために、質問項目全

-66-―

体について、ピアノンの相関係数、クロンバックのアルファ係数を算出した。また,こ れ

は妥当性に属する分析であるが,20の 質問項目の因子構造を因子分析で検討 した。さらに,

「開くJ「 話す」 「読む」 「書く」に関連 した言語技能について,そ の難易度を分散分析

で検討 した。

2.1被 調査者

日本の大学 。大学院で学んでいる 193名 の留学生(平均年齢が 29歳 と2カ 月,標 準偏差

が6カ 月;女 性 96名 ,男 性 97名 )に日本語版 Cardo Scale(英語の翻訳を併記 した)を実

施 した。これ らの留学生の日本語能力は,初 級 レベルから超上級 レベルまでで,専 門分野

は多岐にわたつている。出身国は,中 国が 82名 ,韓 国が 26名 ,イ ン ドネシアが9名 ,台

湾が 8名 ,マ レイシアが4名 ,そ の他 64名 である。また,学 籍は,学 部生が 12名 ,大 学

院生が 110名,研 究生が 51名 ,そ の他が 20名 であつた。

2.2日 本語版 Can―do Scaleの 質問項 目

質問項目の選択には,ま ず Maclntyre,Noels&C16ment(1997)の 改訂版の質問項目を翻

訳 した。 しかし,カ ナダの文化的環境で作 られた質問であるため, 日本の状況に当てはま

らない質問がかなりの数あることが分かつた。そこで,単 純な翻訳では使えないと判断し

て,元 田(2000)が用いた Cardo Scaleを 参照 した。 さらに, 日本語教育学会(1999)の質

問項 目を参照したが, 日本語能力試験との相関が低いため,質 問で開いている日本語能力

の内容が簡単すぎて,天丼効果が出てしまつたのではないかと思われた。そこで,平 均値

の高い順 (易しい順)に並べ,50項 目以上の質問から, 日本の大学 。大学院で通常の授業を

受講している学生を想定して,あ る程度難易度が高く, 日本での生活環境や大学での学習

環境に合 うと思われる質問項 目を日本語版 CardO Scaleと して選んだ。その際,「 聞

くJ「 話す」 「読む」 「書く」に関連 した4つ の技能について 5つ ずつ,合 計 20項 目と

した(質問項 目の詳細は表 1を 参照)。そして,そ れぞれの質問について, 5(非 常によく

できる),4(よ くできる), 3(あ る程度できる), 2(あ まりできない), 1(ぜ んぜんでき

ない)の 5段 階評価でたずねた。質問項目の平均と標準偏差は表 1に 報告 したとおりであ

る。

一-67-

.命Φ【“ミ れ̈ヽ

い0∞. 

     【」

い」      選嬰延中国

い謡≡!   中一中一   中いい一一   いやや一”                          ″汗い岬やわ軍眼紙mい蕪 一幹破難”帥出品斎町鎌鞭帥拭育洋本鵡ギ将

登苺一 

 

【さ.―

  督0。「

  館?い                              。穐

■村ぶミ牟穐熊玉

〔や食塩抱重擦

【あ

.   卜ご.1

  母へ.【

  望ヽい                              。穐

■村ぶ穐牟終態電

(や食温抱おそ

”黙一   袈撃一   や”W一  謡域や                       。ミ+”杓津怒伸

帥m仰線辛州(ほ貯勲紳軸神報撚翻〉

0尽. 

 

おSi   ω8

.【  ωR

革              。ミ

小”拘ヤ穐対”〉中V二Q逆知や建津G□G念皿

、Vミ”軽翌ミミ役

【8. 

  卜置. 

  露0.【

  温【.0 

                   。ミ

■村和ャ穐対”〉伸抱裏仲Gギ程

▲逆く捉Q禅望準翠報

―剣「―

述科―

酎剰■H訓引―――――――――――――ゴ料掛聞郵引樹劉期剖醐掛判引割鍋剣―

黙す‐  鉄募一   いいず一  郷智い            。ミ.村和ゃ終押御蜘恥ぶ端鯉娘明い悼い帥限珊は魚抑」幹鰍懇峡彫や時燃組小

トヨ

. 

 

宮器≡   ゆ畳

.【  o協

ヽ            。穐

■村拘ャ絶対”や■ぷ想

〉D牟

〉や!

(―二K

AV二Q望回窓把暉G念皿

トト【. 

     0一0一     卜00.【

    0∞側.Φ

【卜〇. 

    一〓ヽ一     〇〇【.【 

   田【ω.0

oヨ

.   器≡一一 一

畳「.【

  8貿∞                                。糸

■村ぶ穐牟終け卜とG御ふ卜

∞さ

. 

 

岳卜!‘   盟【.【

  露騨い           。ミ

+村s穐食逆杉■糸や二VQM抱E

、つVれVQ穐穐終緯ぱd穐く二程0最

い臨韓眠 い酪弛眠 釈撃計賠

費併

ぐミG皿暉延恵

軽軍延中国わヽ報Rにヽ―ふK中国G巡距回Kふホけ出卜怒蕪わヽ母搬讐紺蟹

〔軍併G〓S∽宅Lさ裏稚終匝

【穏

T

3.調 査 1の 分析結果

3.1質 問紙の信頼性

ピアノンの相関係数を算出した結果,20の 質問項目間の 180種類の組み合わせすべてに

ついて, F.50以 上の有意な相関(すべての相関係数が メ.01)が得られた。すべての質問

項 目がお互いに強い関係を持つことが分かつた。また,ク ロンバックのアルファ係数は,

「聞くJ技 能についての質問項 目がα=.94,「 話す」がα=.95,「 読む」がα=.96,「 書

く」がα=.94で ,全 体ではα=.98と いう極めて高い数値であつた。これは,20項 目の質

問には内的な一貫性があり,信 頼性が高いことを示している。

3.2質 問紙の因子構造

20の 質問項 目の因子構造を調べるために,因 子分析 (最尤法による因子抽出法で,

Kaiserの 正規化を伴 うプロマックス法による斜交回転)を行つた.そ の結果,表 1に 示 し

たように,わ ずか 2つ の因子群 しか抽出されなかった。第 1因 子は,「 聞く」 「話す」

「書く」についての 15項 目であり,第 2因 子は 「読む」の 5項 目であつた。つまり,

「読む」ことが他の言語活動と異なる以外は,音 声言語に関する 「問く」 「話す」と文字

言語に関する 「書く」ことが一つの因子として見いだされた。これは、 「読む」ことが異

なる能力として意識されている以外は、 「聞く」 「話す」 「書く」がほぼ類似 した能力と

して測定されていることを意味している。さらに,第 1と 第 2因 子間の因子相関が F.802

と高かつた。

3.3言 語技能に関する分析

本研究で使用 した日本語版 Can―do Scaleは ,4つ の言語技能から構成されている。さ

らにこれらの技能は,情 報の媒介とい う観点から,「 聞く」と 「話す」を併せて 「音声言

語」,「 読む」と 「書く」を併せて 「文字言語」に分けられる。 さらに,情 報の入力とい

う意味での知覚(perception)に関連する 「開く」と 「読む」を併せて 「知覚言語」,情 報

の出力とい う意味での産出(prOduction)に関連する 「話す」と 「書く」を併せて 「産出言

語」という2種 類の言語技能に分けられる。 4技 能をこれ らの分類で計算した平均および

標準偏差は表 2に 示 した。これ らの技能分類から, 2(音 声 ・文字)X2(知 覚 ・産出)の分

散 分析 を行 つた。 そ の結果 ,知 覚言語 (卜31.16, S D = 1 0 . 5 0 )か産 出言語 (M-29. 6 5 ,

S D = 1 0。50)かの変数に有意な主効果がみられた[爪1,192) = 1 9 . 1 6 ,メ.001]。さらに,産 出

言語のなかの比較も行つたが,「 話すJ技 能 m=14.4 9 , S卜5。19)の方が,「書 く」技能

(M-15。18,SD = 5 . 2 7 )よりも難 しい と感 じているとい う結果であつた[爪1,192) = 1 1 . 7 2 ,

メ.001]。一方,音 声言語 (M-30.48,Sい 9.84)か文字言語 (M-30。34,SD=10.61)か には有意

な主効果はみられなかつた[爪1,192)=0。149,″ .700]。両主効果の交互作用は有意であつ

た[爪1,192)=27.06,メ.001]。以上の分析結果をまとめると,本 研究の被調査者である留

学生は,知 党言語よりも産出言語を難 しいと,ま たさらに 「書く」技能よりも 「話 す」

技能の方が難 しいと感 じていた。ただし,言 語の媒介が音声であるか文字であるかについ

ては難易度に違いはなかった。

4.調 査 2

妥当性 とは,質 問項 目が意図した内容を正確に測定しているかの指標である(日本語教

育学会,1991;プ ラウン,1999)。 日本語版 Can―do Scaleと 日本語能カテス トを同一の被

調査者に実施 し、ピアノンの相関係数を算出した。さらに、日本語版 Can一do Scaleで 測

定した 「開く」 「話す」 「読む」 「書く」の4つ の技能得点が、日本語能力を適切に予測

しうるかどうかを重回帰分析で検討 した。 さらに,調 査 1と 同様に,「 開く」 「話す」

「読む」 「書く」に関連 した技能について,そ の難易度を分散分析で検討 した。

4.1被 調査者

日本の大学の学部課程で学んでいる 34名 (平均年齢が 23歳 9カ 月,標 準偏差が4歳 0

カ月;女 性 23名 ,男 性 11名 )の留学生が調査 2に 参加 した。調査 1の 被調査者は、調査

2に は参加 していない。出身国 。地域の内訳は,中 国が 20名 で圧倒的に多く,台 湾が 7

名,韓 国が3名 ,ア メリカ,オ ース トラリア,ペ ルー,ロ シアがそれぞれ 1名 である。

4.2 日 本語版 Can―do Scale

調査 1と 同様に表 1の 20項 目からなる日本語版 Can一do Scaleを使用 した。

4,3日 本語能カテス ト

日本語版 CardO Scaleの 妥当性の基準として,文 字 ・語彙 ・文法力を合わせて 22問 の

58点満点(M-37.21,SD-9.35)と読解力が 14間 の 42点満点(M-26.74,SD=8.07)からなる総

合 日本語能力(100点満点,M-63.94,S悌 14.87)テス トを,全 被調査者の 34名 に実施 した。

100点 満点のテス トに対 して平均が 63,94点 で,標 準偏差が 14.87点 であった。63.94パ

ーセン トの被調査者(約 23名 )が平均から± 1の 標準偏差である 49.07点 から 78.81点 の

間に入 り,残 りの約 11名 がこの範囲から外れている。分散の広がりから考えて,こ のテ

ス トはかなり弁別力があると判断されよう。また,文 字 ・語彙 ・文法力と読解力のピアノ

ンの相関も有意である(F.454,メ .01)。

―-70-―

5.調 査 2の 分析結果

5.1日 本語能力 と言語技能の相関

表 2に 示 したように, 日本語能カテス トの文字,語 彙,文 法を合わせた得点,読 解の得

点,全 体の得点と4技 能に関する質問の間のピアノンの相関係数を算出した。その結果,

どの組み合わせも有意な相関とはならなかった。とりわけ,日 本語能カテス トが文字を媒

介とした問題であつたので,Can一do Scaleの 「読み」との相関が高くなると予想 していたが,

実際には,文 字 ・語彙 。文法力 との相関係数が F.235(几 ュ),読 解力 との相関係数が

F.279(几 ュ),合計との相関係数が F.299(几 ュ)に留まった。また,文 字言語 (「読む」と

「書く」を合わせた技能)でも,文 字 ・語彙 ・文法力との相関係数が F.032伍 ュ),読 解

力との相関係数が F.205(″.ュ),合計とめ相関係数が F.132(″.ュ)であつた。このように,

被調査者 34名 についての日本語版 Can―do Scaleと 日本語能カテス トのピアノンの相関係

数はすべて有意ではなく,Cardo Scaleの 自己評価の結果が、実際の日本語能カテス トの

得点を具現化 していないことを示唆 した。

5.2日 本語能力を予測す る言語技能

相関係数だけでは, 2つ の変数間の関係を調べたに過ぎない。そこで,4つ の言語技能

(説明変数)から日本語能力を予測する重回帰分析(強制投入法およびステップワイズ法)を

行つた。その結果,強 制投入法では表 3に 示 したように,読 解の得点を予測する技能とし

て 「話すJ技 能が有意な説明変数となった。 しかし,こ の結果もステップワイズ法では,

有意に読解を予測する変数とはならなかった。ステップワイズ法では,Cardo Scaleで 測

定したどの技能の自己評価も,文 字 ・語実 ・文法力,読 解力,合 計の3種 類の日本語能力

得点を予測する有意な変数 とはならなかった。これ らの結果は, 日本語版 Can一do Scale

が,日 本語能力を予測 しうるものではないことを示している。

5。3言 語技能に関する分析

調査 1と 同様に, 2(音 声対文字)× 2(知 党対産出)の分散分析を行つた。その結果,音

声言語 (M-32.09,SD=4.85)か 文字言語 (卜32.28,S卜 5.58)かには有意な主効果はな く

[メ(1,33)=0.095, p序.760], タコ拶き惇計蔚吾(M■34.00, SD=5.23)か酒巨と日惇計高吾(M■30.37, SD=5.50)

かについては,有 意な主効果がみられた[瓜1,33)=23.29,メ.001]。両主効果の交互作用

は有意ではなかつた[爪1,33)=2.57,ガ.119]。また調査 1と は異な り,「 話す」 と 「書

く」技能を比較 した結果には有意な違いはなかった。これらを要約すると,調 査 1の 結果

そ禅連超理や担やつ逆ミ勾 .料H、

∞トギ.

COH.

∞H田.

田”H.

OOH.

COO.1

卜O【.

00田.

田 0 0 C ∞ 崎 0 0 0 0 いH 卜 H C H 0 0 0 ωO 側 ∞ 〇 田 い H い い

寸∞〇.

HHO.―

∞CH.

側∞〇.

0「「.

CCO.‥

OWO.

0”べ.

〇∞.O

Oゆ.0

∞ド.0

∞崎.ゆ

ゆ∞.寸

C卜.側

CO.∞

00.”

寸ゆ.ω

卜∞.寸

卜命.〇

〇〇.寸

∞田.べ

〇〇.側

【ゆ.0

ゆ∞.寸

C卜.C

G禅部雑M

黙普遜控GヽヽトコG対たヽ卜R饗離終回対投枯耐皿やヽ逆豊S∽8Lさ婆確終皿 困穏

禅部(「〉伸」

翠部(「約絹」

禅部(「〉榊」

避部(「■緯」

読範G翠部

「■継」)購価ヨ慨

「〉歴」)確M想景

「ね絹」)雑加■棋

「〉歴」)賠Mよ枷

饗部

「〉伸」

理部

「■緯」

翠部

「ね絹」

対 A J A J A J

一-72-一

.黙懸撃回嘩難難理こ .8.〉、キ専〒ミ

.連く革再ぷ延芸念撃回凹G穏

ooHド

ヽ叱

.崎

.ミ

 

側OC

.HI

.崎

.ミ  H卜寸

.H

.崎

.ミ

 

00卜

.H

.01

【∞寸.01

卜H寸.〇

ゆ0い。〇

寸卜〇.03

.〇‥   H∞H.

寸0ベ

ヽ単

.崎.ミ

  守ω卜.H!   ∞∞ヾ.〇―

去】 ∞∞側.ω

    H∞C,O

.崎

.ミ  側Hド

.一    0寸ω

.〇

畳ずせヽ      黙懸投基劇

6.ミ

 c営

.Ht 

寸料

さ‥ 禅部

「〉神」

巧.、

魯受o  費ずo  禅部

「■緯」

ぢ.ミ

 ミc.H 

 露宅o  禅部

「ね穏」

寸〇〇.〇‥

翠遇牌加G出Sの増Lさ姿確終

皿や■裏い抱ミ饗牌終

匝 ∞照

一-73-一

と類似 してお り,「 話す」(M-14.85,SD=3,06)と 「書く」(M=15.51,SD=2.76)に関連 した

産出言語を,「 聞く」(M=17.24,S卜 2.54)と 「読む」(M-16.76,SDi3.60)に関連 した知覚

言語よりも難 しいと感 じているが,言 語の媒介が音声か文字かについては難易度に違いは

ないと感 じていることを示 している。

5.4日 本語版 Can―do Scaleで みる自己の過大および過小評価

Taylor&Brom(1994)に よると,第 二言語学習者は,基 本的に自己を肯定的に見る傾

向があり,第 二言語習得について自己の言語能力を非現実的なほどに過大評価するようだ,

と述べている。また,逆 に 「言語の学習や表現に対する不安」(language anxiety)などか

ら自己の言語能力を低く見積もり,適 切な自己評価ができない場合もあるという報告や議

論もある(e.g.,Ferguson, 1978:Horwitz,Horwitz&Cope,1986)。 そこで,ま ず, 日

本語能カテス トの総合得点(lllax=100,昨63.94,S卜 14.87)を日本語版 Can一do Scaleの 総

合得点 (Max=100,卜64.37,S卜 9.80)で予測する単回帰分析を行つた。その結果,重 決定

係数 (または,寄 与率ともいい だで示す)は 0.030と極めて低かつた。両変数のピアソンの

相関係数もF.173伍 ュ)で,有 意ではない。Y軸 に日本語能力の総合得点を取り,X軸 に

Can一do Scaleの 総合得点を取つて,34名 の被調査者を図 1の ようにプロッティングして,

日本語能力を日本語版 CardO Scaleで 予測する線形近似直線を描いた。

図 1の 線形近似直線は,最 小 2乗 法(least squares)で両変数の得点の残差 (または誤

差)が最小になるように計算 したものであり,両 変数のデータの最も近い距離に位置する

直線である。プロットから過小評価だと思われるのは,図 1に 示 したように4名 で,全 員

が中国または台湾出身である。一方,Taylor&Brown(1994)が 報告 しているように,本

調査でも極端に過大評価 しているのではないかと思われる被調査者が 3名 みられる。これ

ら3名 は, 日本語能力が近似直線よりも 30点 以上も下回つていた。その 1名 はアメリカ

の出身で, 日本語能力の合計得点が 23点 と極めて低いにも拘らず,自 己評価は 49点 であ

った。また,他 の 1名 はオース トラリア出身で, 日本語能力が 35点 で自己評定が 66点 で

あつた。もう1名 は韓国出身で, 日本語能力が 29点 で,自 己評価が 63点 であつた。図 1

に示 したように過大評価と思われる被調査者が 2名 いたが,い ずれも中国出身者であつた。

これらの自己の過大 ・過小評価は,や はり性格,文 化的背景,言 語に対する不安などから

くるのであろうが,本 研究のデータは,こ れらの条件を統制していないため,傾 向を示唆

するくらいしか語れない。

―-74-一

00

導枯冬瑠めヽ報く瑠GR謎継終匝やもやヽヽゃトホ出卜 召図

好、建

矩縫G出S∽宅Lさ姿牌終回

00    〇一    0卜    OC    Oい    0寸    00    0N    O一     〇

日本語能力の総合得点

一 ■

一電

βヽ\

ヘ百枯<導AA

導枯く瑠禅番蝉

――

上 地|

t々 !Ⅵi \

導枯章瑠も

々部+ぽ

く  一

ゝ 一     一

 .o

卜寸+XOヘ

∞o

ヽ熊

Cへ

.〇=弟

0 0 0 0 0 0 0 0 0 0 00 0 ∞ 卜 0 ゆ 寸 O N ャ

6.絡 合考察

当初, 日本語版 Can一do Scaleは ,適 切な質問紙を作成すれば,学 習者は正確に日本語

能力を自己評価できると考えられてきた。外国語技能に関する先行研究(e.g.,Blanche&

Merino, 1989; Leblanc&Painchaud, 1985)では, 言語技能 と自己評価に全体としてかな

りの関連があるとされてきた。 しかし,本 研究は,質 問紙形式で測定した日本語版 Can―dO

Scaleが ,テ ス ト形式で測定した日本語能力とほとんど関係のない指標であるという結果

を示 した。実際,自 己評価 と言語能力 とが一致 しないとい う報告は少なくない(e.g.,

Dieten, 1990, Gardner, Lalonde, Mborcroft & Evers, 1987; Kraemer & ZiSenwine,

1989, Maclntyre, Noels &Cl● Inent, 1997)。 と りわけ, Maclntyre et al. (1997)て 討ま,

言語能カテス トの内容と Can―do Scaleの 自己評定項目を合わせて測定しているが,結 果

にかなりのズレがみられたことは,実 際の言語能力と自己評定との違いを頭著に示してい

る。このような他言語についての先行研究を加味して考えると, 日本語版のCan―do Scale

の自己評価であつても, 日本語能力を測定するには 「本質的に妥当でない (inherently

unreliable)」(OskarsOn,1984,1990;Holec,1988)と 結論づけるのが適切ではないかと

思われる。少なくとも,学 生の選抜,授 業の成績,履 修の証明など,直 接 日本語能力を評

価するような目的には使 うべきではないといえよう。言い換えれば,学 習者間の日本語能

力の比較評価には使 うべきではないであろう。

確かに調査 1で は, 日本語版 Can―do Scaleは ,質 問紙調査として高い信頼性を示 した。

しかし,日 本語能力を構成する下位カテゴリーとして,「 開く」 「話す」 「書く」の 3技

能が一つの因子となり,こ れらは本研究の質問項目では区別できない技能であつた。 「読

む」技能については,単 独で一つの因子となつた。この結果は,た とえ 20項 目の質問が

同じ内容を一貫して測定しているとしても,そ の測定結果は,質 問の意図に反 して,4つ

の言語技能を区別 しうるようなものではないことを意味している。先行研究のMaclntyre,

et al.(1997)の26項 目からなる英語版 Cardo SCaleで も,「 読む」能力が他の 「聞く」

「話す」 「書く」能力と異なる要素を含んでいることが示されてお り,英 語および日本語

で類似 した因子構造を示した。

調査 2で は,日 本語版 Can―do Scaleは 日本語能力を測定するとい う意味での妥当性が

低いことが分かつた。 日本語版 Can一do Scaleで測定した4技 能と日本語能カテス トの得

点との相関が 「聞く」 「話す」 「読む」 「書く」のすべての指標できわめて低かつた。さ

らに, 日本語能カテス トの結果を日本語版 Can一do Scaleの 4技 能で予測する重回帰分析

を行つた。その結果、日本語版 Can一do Scaleで尋ねた日本語能力に対する自己評価は,

実際の日本語能力(少なくとも本研究でテス トした文字言語を媒介 とした総合 日本語能力)

L

一-76十 一

席イ

を予測できなかつた。これには, 日本語版 Can一do Scaleと 日本語能力試験 とが測定して

いる内容が違つていることが予想される。

日本語版 Can―do Scaleが 日本語能力を具現化 していないという本研究の結果は,個 人

の社会 ・文化的背景,性 格要因,言 語に対する学習 ・表現不安など多様な要因によつて,

日本語学習者が自己を過大あるいは過小に評価 してしまうことから生じたのではないかと

思われる。本研究の調査はこれ らの要因について議論するだけのデータではないが,図 1

が示すように,あ る程度の性格や文化要因が影響 している傾向がみられた。第二言語に対

する不安についての研究はすでに進んでお り,第 二言語の成績や課題遂行得点との間に負

の相関がみ られ ることが報告 されている(e.g。, Horwitz, 1986;Horwitz, Horvritz&

Cope,1986;Maclntyre&Gardner,1989)。 近年は, 日本語の第二言語不安についての研

究も行われている(e,g,,元 田,1999,2000;刀 河ヽ原,2001)。 今後,こ うした要因を含ん

だ日本語能力の自己評価に関する研究が進めば,Cardo Scaleが 測定している内容につい

ての議論が深められ,言 語能力試験の代替としてではなく,教 授 ・学習過程での学習目標

や成果,自 己フィー ドバックとして利用する可能性も明らかになるのではないかと期待さ

れる。

引用文献

J.D.ブラウン著 ・和田稔訳 (1999)『言語テストの基礎知識』大修館書店.

元田静(1999)「初級日本語学習者の第二言語不安についての基礎的調査」 『日本教科教育

学会誌』21(4),45-52.

元田静(2000)「日本語不安尺度の作成とその検討一目標言語使用環境における第二言語不

安の測定一」 『教育心理学研究』48,422-432.

日本語教育学会(1999)『Can―do―statements調査報告一日本語能力試験の妥当性を検証す

る試み』日本語教育学会.

日本語教育学会(1991)『日本語テストハンドブック』大修館書店.

小河原義朗(2001)「外国人日本語学習者の日本語発音不安尺度作成の試み―タイ人大学生

の場合」 『世界の日本語教育』11,3労53.

Blanche, P., & Merino, B. J。 (1989). Self一assessttent of foreign-language skills:

Implication for teachers and researchers。 とク とθ2r,F軽、 39, 313-340.

Dieten, A. J。 (1990). The development of a test of Dutch as a second language:

The validity of self― assessment by inexperienced subjects. 二 2■ョgィど, resを,.ぁ

6, 30-46.

-77-一

Ferguson, N。 (1978)。 Self一 assesstllent of listening comprehension. ゴ カを9r22をゴθ″2ゴ

押ど/2iθ7 οF/ppFゴ θどとinguttsをゴcs F,と a兜算たど,と a列比だ■島 16, 149-156.

Gardner, R, C., Lalonde, R. M., M6orcroft, R., & Evers, F. Tt (1987). Second

language attritioni The role of IIlotivation and use. プ し肋 οfと … 2'ど

5bσゴ2ゴ r,/cヵθゴリ 6, 29-47.

Holec, H. ed. (1988). ガ ″をο″a″/ 2″ ど rbrθ】g, ゴ 2■どUαどθ ゴθ2r〃rng、 Strasbourg:

Council of Europea

Horwitz, E. K. (1986). Prellminary evidence for the reliability and validity of

a foreign language anxiety scale. 冗 冨SθL 9J2rを 3r■y、 20, 559-562.

Horwitz, E. K., Horwitz, M. B., & Cope, J. (1986). Foreign language classroom

anxiety. 肋 」しr,と 2■gu″どっとeamゴ 唱、 70, 125-132.

Kraemler, R., & Zisenwine, D。 (1989). Changes in attitude toward learning Hebrew

in a South African setting. と 申 とearnf略 ヽ39, 1-14.

Lcblanc, R., & Painchaud, G。 (1985). Self一 assessmlent as a second-language

placement instrument. 互 畷Sθし 0比arを3riv、 19, 673-686.

Maclntyre, P.D。 , & Gardner, R. C。 (1989). Anxiety and second-language learning.

と2■ョ宮々どθとearnr″ぁ 39, 251-275.

Maclntyre, P.D。 , Noels, K.A., & Cl● ment, R, (1997). Biases in self― ratings of

second language proficiency: The rolo of language anxiety. 五 2■ョ宮々ョθとearnヱ軽、

47, 265-287.

Oskarsson, M。 (1984). /ppro2c力 es をθ sθFF assess級 鋼 を ゴ″ rbrθゴど″ ゴ2■ョ宮々どθ Fearnゴzra

London. Pergatton.

Oskarsson, M_ (1990). Self一 assesslnent of language proficiency: Rationale and

applications。 とa g々uaョθ ダbSをど,互 6, 1-13.

Taylor, S. E., & Brown, J. D。 (1994). Positive illusions and vell― being

rev■slted:

Separating fact frorl fiction. Psychθ ゴぅ思■caF別 ゴθをin、 116, 21-27.

一-78-