三島の自己改造の文体は計量できるか? - fc2textdata.web.fc2.com/nishimoto2.pdf ·...
TRANSCRIPT
2010/8/19
1
三島の自己改造の文体は計量できるか?
同志社大学大学院 文化情報学研究科
西本薫
2010/8/231
発表概要
2010/8/232
本研究の概要
分析対象作品
データ作成
分析事例紹介の前に
分析 読点を打つ位置に関する分析
助詞の使用頻度に関する分析
各品詞の使用頻度に関する分析
文の長さに関する分析
結果
まとめ
今後の予定
本研究の概要
2010/8/233
三島由紀夫(1925-1970)は『自己改造の試み』(1956)の中で「自ら意識的に文体を変化させた(改造した)」「森鴎外の文体模写を行った」と述べている
この点は評論家に広く一般的に認められている Ex. 「意志と鍛錬によって文体も改造できるというこの考え方」は三島文学の特徴のひとつである(神谷,1977)
ところが、三島が他の作家、特に理想とした鴎外から受けた影響をどのように自身の文章に反映させ、文体を変化させたかという研究はあまり多くない。このような研究は評論家の主観的判断に留まっている。 Ex.越次(1992) は三島による「鴎外の文体の導入と構築」が成功かどうかは、読者の判断に委ねられると結論付けている。
本研究の概要
2010/8/234
本研究の目標
①三島のいう「意識的な改造」が計量的観点からも実際に見られるのかを検証することで、三島の作品研究に新たな視点を加える
②森鴎外作品との比較を計量的に行うことで、具体的にどのような影響を受けたかを明らかにする
分析対象作品
2010/8/235
三島作品 『自己改造の試み』(1956)で取り上げられている9作品
文壇デビュー(1947)以降の作品を対象に
上記の記述に基づき、以下の3グループに分類
1. 鴎外の影響なし(鴎外以外の作家の影響あり)
2. 鴎外の影響あり3. 特殊な例
鴎外作品 三島が『鴎外の短編小説』
(1957)や『楽屋で書かれた演劇論』(1957)で取り上げた、好んだとされる鴎外作品8作品
データ作成
2010/8/236
分析対象作品のうち、電子化・販売されているものは『金閣寺』のみなので、残りは自分で作成する必要がある
データの出典元は以下に基づく
三島作品→決定版 三島由紀夫全集(新潮社, 2000-2006)
鴎外作品→鴎外全集(岩波書店,1972)
2010/8/19
2
データ作成
2010/8/237
データ作成手順
1. OCR(光学式文字読み取り装置)で出典元の本から見開き1ページずつ読み込み
2. 読み込んだ画像データをOCRソフトで読み取り、間違って読み取られた部分を修正
3. 読み取り結果をテキストデータに起こし、原本と照らし合わせて、間違いがないか確認し、修正
4. 作品ごとに①から③を行い、作品ごとに1つのファイルにまとめる
5. 分析しやすいように一文ごとに改行を入れ、会話文ありデータと会話文なしデータを作成する
6. 形態素解析を行い、MLTPでタグつきデータを作成する
分析
2010/8/238
分析手順
1. 作成したデータをMLTPに読み込み、集計を行う
2. 集計結果をRに読み込み、分析を行う
本研究では主に主成分分析を行い、以下のプロットを行っている
各主成分の主成分得点
各主成分の主な項目
主成分のバイプロット
分析事例紹介の前に
2010/8/239
主成分分析とは
多くの量的変数が存在する場合、それらの間の相関を考慮して、低い次元の合成変数(主成分)に変換し、データが持っている情報をより解釈しやすくするための手法
相関係数行列を用いる方法と、分散共分散行列を用いる方法の2種類がある
読点を打つ位置に関する分析
2010/8/2310
テキストデータをMLTPに読み込む
Markタブで「、」の前のbigramを集計
読点を打つ位置の集計結果(抜粋)
読点を打つ位置に関する分析
2010/8/2311
集計結果を相対頻度に直す
分散共分散行列による分析を行う
第3主成分で累積寄与率が80%を超えた
読点を打つ位置に関する分析
2010/8/2312
各主成分と、上位下位10変数をプロット
赤→鴎外以外の影響を受けたグループ、黄→鴎外の影響を受けたグループ、青→特例のグループ、緑→鴎外作品
三島は「は」、「が」のあと、鴎外は特に「て」のあとに多く読点を打つという特徴がみられる
2010/8/19
3
読点を打つ位置に関する分析
2010/8/2313
読点を打つ位置に関する分析
2010/8/2314
読点を打つ位置に関する分析
2010/8/2315
三島は赤で囲ったところに集中、鴎外はちらばっている
読点を打つ位置に関する分析
2010/8/2316
鴎外の影響を受けた三島作品が集中。 一部鴎外作品とも重なっている。
助詞の使用頻度に関する分析
2010/8/2317
タグつきデータをMLTPに読み込む
N-gramタブで助詞を選択し、助詞のunigramを求める
助詞の使用頻度の集計結果(抜粋)
助詞の使用頻度に関する分析
2010/8/2318
集計結果を相対頻度に直す
分散共分散行列による分析を行う
第3主成分で累積寄与率が80%を超えた
2010/8/19
4
助詞の使用頻度に関する分析
2010/8/2319
三島は「の」「は」、鴎外は「て」を多く使う傾向がみられる
助詞の使用頻度に関する分析
2010/8/2320
助詞の使用頻度に関する分析
2010/8/2321
助詞の使用頻度に関する分析
2010/8/2322
読点を打つ位置の分析時と同様、三島作品はほぼ集まっている
助詞の使用頻度に関する分析
2010/8/2323
第2、第3主成分をプロットすると、三島作品、鴎外作品は
各品詞の使用頻度に関する分析
2010/8/2324
タグつきデータをMLTPに読み込む
N-gramタブでPOSを選択し、各品詞の使用頻度を集計する
品詞タグはUnidic辞書の第1層までを使用品詞の使用頻度の集計結果(抜粋)
2010/8/19
5
各品詞の使用頻度に関する分析
2010/8/2325
集計結果を相対頻度に直す
分散共分散行列による分析を行う
第3主成分で累積寄与率が80%を超えた
各品詞の使用頻度に関する分析
2010/8/2326
各品詞の使用頻度に関する分析
2010/8/2327
各品詞の使用頻度に関する分析
2010/8/2328
各品詞の使用頻度に関する分析
2010/8/2329
各品詞の使用頻度に関する分析
2010/8/2330
2010/8/19
6
文の長さに関する分析
2010/8/2331
テキストデータをMLTPに読み込み
MLTPのLengthタブで5文字を1つの単位として、文の長さの分布を集計
Cutoff値=100
文の終わりの識別記号は「。」「?」「!」「.」「!」
文章の長さの分布集計結果(抜粋)
文の長さに関する分析
2010/8/2332
集計結果を相対頻度に直す
分散共分散行列による分析を行う
第4主成分で累積寄与率が80%を超えた
文の長さに関する分析
2010/8/2333
文の長さに関する分析
2010/8/2334
文の長さに関する分析
2010/8/2335
文の長さに関する分析
2010/8/2336
2010/8/19
7
文の長さに関する分析
2010/8/2337
文の長さに関する分析
2010/8/2338
文の長さに関する分析
2010/8/2339
まとめ
2010/8/2340
このほかにも、助詞のbigram、trigram、品詞のbigramなどを集計してそれぞれ分析を行っている
現段階では三島が言う「自己改造」が文章のどこに特徴として現れているかはまだあきらかではない
これまでの分析では、三島と鴎外は別々の特徴がみられることから、三島の自己改造による文体模写は本人が言うほど成功していないのではないかと考えられる
今後の予定
2010/8/2341
三島関連の参考文献を読み、「どのように文体を変化させたか」という点に関する資料がないか探す
様々な指標でのさらに詳しい分析を試みる
これまでに行った分析結果の詳しい考察を行う
参考文献
2010/8/2342
決定版 三島由紀夫全集/新潮社,2000-2006.
三島由紀夫文学論集 / 三島由紀夫 ; 虫明亜呂無編. -- 講談社, 1970.
三島由紀夫 : 文芸読本. -- 新装版 / 河出書房新社, 1975.
自殺者の近代文学 / 山崎国紀編 / 世界思想社, 1986.
資料三島由紀夫 / 福島鑄郎/ 朝文社, 1992.
三島由紀夫論 : 命の形 / 小杉英了/ 三一書房, 1997.
三島由紀夫 虚無の光と闇 /井上隆史/ 試論社,2006. 計量言語学入門 / 伊藤雅光 / 大修館書店, 2002.
テキストデータの統計科学入門 / 金明哲 / 岩波書店, 2009. 文章の計量 文学研究のための計量文体学入門 /アンソニー・ケイ著、吉岡健一訳 / 南雲堂, 1996
文体論 –ことばのスタイル / ピエール・ギロー/白水社,1959.
文体論 –方法と問題-/ 山本忠雄 / ゆまに書房, 2001