第4回結合価パターンを用いた動詞句の翻訳可能性の調査

22
ー文献紹介ー 結合価パターンを用いた 動詞句の翻訳可能性の調査 長岡技術科学大学 自然言語処理研究室 高橋寛治

Upload: takahashi-kanji

Post on 04-Jul-2015

52 views

Category:

Education


2 download

TRANSCRIPT

Page 1: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

ー文献紹介ー

結合価パターンを用いた動詞句の翻訳可能性の調査

長岡技術科学大学 自然言語処理研究室 高橋寛治

Page 2: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

2

文献について●結合価パターンを用いた動詞句の翻訳可能性の調査

●石上 真理子、徳久 雅人、村上 仁一、池原 悟●言語処理学会 第11回年次大会 発表論文集

Page 3: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

3

はじめに●言語表現の非線形性に対する機械翻訳の方式

●文型パターンを用いる方法●線形要素は変数で表し、変数に対する訳出表現を組み合わせて全体の英文を作成する

●仮説●線形要素の翻訳が、代入された日本語だけで可能である

Page 4: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

4

はじめに●動詞句の翻訳可能性について調査●1.局所翻訳の可能性

●仮説の検証●2.動詞句の非線形性

●動詞句に含まれる非線形な部分の検証

Page 5: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

5

結合価パターン●用言と格要素(名詞+格助詞)の意味的関係を記述(約15000件)

N1(3主体)が N2(3主体)を 援助する N1 help N2

N1(838食料)が 口に合う N1 taste good

Page 6: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

6

翻訳プロトタイプ「queen」●翻訳手順

●1.日本語の動詞句の入力●2.結合価パターンとの照合●3.照合の結果の選択●4.名詞変数への訳語の挿入●5.英語の動詞句の形成●6.句形成した英文を出力

Page 7: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

7

翻訳プロトタイプ「queen」●翻訳手順

●1.日本語の動詞句の入力●2.結合価パターンとの照合●3.照合の結果の選択●4.名詞変数への訳語の挿入●5.英語の動詞句の形成●6.句形成した英文を出力

●入力する動詞句の例●パソコンを使う

Page 8: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

8

翻訳プロトタイプ「queen」●翻訳手順

●1.日本語の動詞句の入力●2.結合価パターンとの照合●3.照合の結果の選択●4.名詞変数への訳語の挿入●5.英語の動詞句の形成●6.句形成した英文を出力

●条件●(a)

●格要素の省略、格要素の順序変更、修飾語句の挿入、任意追加の各要素を許可

●(b)●意味属性制約、必修の述語付属語の条件を必須とする

Page 9: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

9

翻訳プロトタイプ「queen」●翻訳手順

●1.日本語の動詞句の入力●2.結合価パターンとの照合●3.照合の結果の選択●4.名詞変数への訳語の挿入●5.英語の動詞句の形成●6.句形成した英文を出力

●慣用句表現を優先的に選択●最も広範囲に入力文と一致するパターンを選択

Page 10: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

10

翻訳プロトタイプ「queen」●翻訳手順

●1.日本語の動詞句の入力●2.結合価パターンとの照合●3.照合の結果の選択●4.名詞変数への訳語の挿入●5.英語の動詞句の形成●6.句形成した英文を出力

●既存の日英辞書引きプログラムを用い、入力動詞句と適合する変数に訳語を代入

Page 11: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

11

翻訳プロトタイプ「queen」●翻訳手順

●1.日本語の動詞句の入力●2.結合価パターンとの照合●3.照合の結果の選択●4.名詞変数への訳語の挿入●5.英語の動詞句の形成●6.句形成した英文を出力

●主語に該当する変数を削除し、句を形成

●use personal computer

Page 12: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

12

翻訳プロトタイプ「queen」●翻訳手順

●1.日本語の動詞句の入力●2.結合価パターンとの照合●3.照合の結果の選択●4.名詞変数への訳語の挿入●5.英語の動詞句の形成●6.句形成した英文を出力

●主動詞と格要素の訳出構造を捉えることが目的●以下は問わない

●名詞訳語の選択●任意の格要素の訳語挿入●副詞の挿入●冠詞・数の問題

Page 13: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

13

結合価パターンの変形●文でなく動詞句を扱うため、変形●変更前:N1 use N2 as N3●変更後: use N2 as N3

Page 14: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

14

動詞句の翻訳実験●一般の翻訳システム

●システム1とシステム2●翻訳プロトタイプqueen

●動詞句のそれぞれの訳出を出力し、評価値を付与

Page 15: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

15

翻訳対象●日本文

●大勢の前で話すときは多くの人があがるものだ。●対訳英語文

●Many people have stage fright when they have to give a speech in front of a large audience.

Page 16: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

16

訳文の評価●評価◎:主動詞と主名詞が理想解と完全一致○:理想解と異なる構文だが、意味はOK△:基本的な構造はいいが、出力結果の字面の一部を変形する必要あり☓:訳出が間違いー:出力パターンが1つもない

●評価方法●再現率R:

●全入力事例数における、出力パターンが1つでもある事例数Nの割合

●適合率P:●Nにおける、総合評価が または◎

○である事例数(スコア)の割合

Page 17: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

17

実験結果評価(個数)

◎ ○ △ ☓ ー

queen 86 135 36 34 34

システム1 74 156 24 69 0

システム2 84 162 25 54 0

Page 18: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

18

考察●2単語から7単語に近づくにつれ、スコアが減少する傾向あり

●7単語を過ぎると、0.5~0.8の範囲に収まる

●主動詞と主名詞の構造を中心に評価したため

Page 19: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

19

動詞句の非線形性の検証(queen)●格要素と動詞の関係だけでは判断できないもの●1.格要素が複雑である場合

●入力:異なる字体の文字やグラフィックスまでも出力できる。●理想解:are capable of producting characters in different type fonts and even graphic output

●Aを出力できる=are capable of producting Aがあっても格要素が複雑で、訳出は難しい

Page 20: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

20

動詞句の非線形性の検証(queen)●格要素と動詞の関係だけでは判断できないもの●2.入力文に目的語がない場合

●入力:型紙に合わせる。●理想解:fit the pattern●適合パターン:N1 match N2 with N3

●英語の動詞が他動詞だが、入力に該当格要素が存在しなかった

Page 21: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

21

動詞句の非線形性の検証(queen)●格要素と動詞の関係だけでは判断できないもの●3.再帰代名詞の変数が残っている場合

●入力:人間に化ける●理想解:take the shape of a human being●出力:disguise (N1)-self as human being●代入値:N2=人間→human being

●格要素と述語の関係だけで決定できない

Page 22: 第4回結合価パターンを用いた動詞句の翻訳可能性の調査

結合価パターンを用いた動詞句の翻訳可能性の調査

22

おわりに●主動詞と主名詞の構造に関して、翻訳の可能性70%

●文全体から見て線形要素とする動詞句について●動詞句の中の非線形性

●格要素と動詞の共起から生じるもの●副詞との共起、格要素自体の複雑さ