the structure of interlingua in translator

50
THE STRUCTURE OF INTERLINGUA IN TRANSLATOR SERGEI NIRENBURG, VICTOR RASKIN AND ALLEN B. TUCKER :םםםםםם ןןןןן ןןןןןןן ןןןןן ןןןןןןןןן7.2.12 ןןן ןן ןןINTERLINGUA ןןןןן ןןןןןן "ןןןןןןןן"1 םםםםם םםםםםםם םםםםםםם, 236817 ןןןןןןן ןןןןן ןןןןן, ןןןןןןן םםםם : ןןןן ןןןןן

Upload: adila

Post on 23-Feb-2016

66 views

Category:

Documents


0 download

DESCRIPTION

The Structure of Interlingua in TRANSLATOR. מבנה שפת Interlingua בתכנת התרגום "טרנסלטור". Sergei Nirenburg , Victor Raskin and Allen B. Tucker . סמינר בבלשנות חישובית , 236817 הפקולטה למדעי המחשב, הטכניון מנחה : עוזי אורנן. מציגים:. נורית שוובסקי ובועז גולדשטיין 7.2.12. מוטיבציה. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: The Structure of Interlingua in TRANSLATOR

THE STR

UCTURE O

F

INTERLINGUA IN

TRANSLATOR

S E R G E I N I R E N B U R G , V I C T O R R A S K I N A N D A L L E N B . T U C K E R

:מציגיםנורית שוובסקי ובועז גולדשטיין

7.2.12

שפתמבנה

INTERLINGUA

"

"

טורטרנסל

תרגוםה תכנת

ב

1

236817, סמינר בבלשנות חישוביתהפקולטה למדעי המחשב, הטכניון

: עוזי אורנןמנחה

Page 2: The Structure of Interlingua in TRANSLATOR

מוטיבציה

אנו רוצים לתרגם באופן מכני בין שפות•

כמו מתכנתים טובים, נרצה פיתרון כללי•

בהרצאה זו נרצה להציג כיצד נראה יצוג מופשט של שפה, שאינו •

מבוסס על אף שפה טבעית.

בנוסף נראה שמספיק לתרגם את הרעיון שמאחורי הטקסט, ולא את •

המבנה שלו.

2

Page 3: The Structure of Interlingua in TRANSLATOR

בעיה 

3

Page 4: The Structure of Interlingua in TRANSLATOR

הפתרון הכללי

להשתמש ב-"שפה" שאינה מבוססת על שפה טבעית.•

. Interlinguaהשפה תיקרא •

אינו שפה בפועל, אלא מבנה נתונים.•

אינו מחזיק את הטקסט, אלא הרעיון המופשט מאחרי הטקסט.•

מורכב מאוסף מידע על תתי-עולמות מהעולם האמיתי, לפי נושאים•

לדוגמא: מאמרים טכניים במדעי המחשב, אילוף כלבים וכו.•

4

Page 5: The Structure of Interlingua in TRANSLATOR

דוגמא

אכל ילדהפיצה

Definite - מיודע

Object(Creature(boy))

Action(ingestion(ate))

Object(food(pizza))

Patient - – Agentמופעל

ל-יוזםפוע

5

Sentence Contains -

מכיל

Page 6: The Structure of Interlingua in TRANSLATOR

TRANSLATORמבנה

6

Analysisמנתח

Augmentationמגביר

Synthesisמיצר

טקסט :קלטבשפת המקור

טקסט :פלטבשפת היעד

טקסט

Interlingua ב-

טקסטמשופר

Interlinguaב-

מילונים בשפת המקור מילון תרגום

משפת מקורinterlinguל-a

GRL

DRL

מילונים בשפת היעד

מילון תרגום interlinguמ-aלשפת היעד

Page 7: The Structure of Interlingua in TRANSLATOR

יצוג שפות

שפות יצוג מידע. 2 מוגדרת ומיוצגת ע"י Interlinguaשפת ה-•

•DRL (Dictionary Representation Language) המילון –

•GRL (Grammar Representation Language)התחביר –

.XMLשפות במובן המחשבי, כמו •

בעצם אנו בונים סוג של גרף שצמתיו הם מונחים וקשתותיו קשרים •

תחביריים.

7

Page 8: The Structure of Interlingua in TRANSLATOR

דוגמא למסגרת

Dog ::= (‘Dog’,

(‘isa’, Creature),

(‘agent-of’, +(bark,dig,sniff,…))

(‘consists-of’,+(tail,ears,feet,…))

(‘breed’,(dalmation|corgi|labrador|…))

)

8

Page 9: The Structure of Interlingua in TRANSLATOR

?DRLלמה צריך

•DRL.הוא מילון

מהווה כלי לפתרון דו משמעויות.•

דוגמא: לדני יש כלב. הוא נבח.•

צריך לדעת שכלב יכול לנבוח ודני לא.•

לצורך כך נשמור את כל המאפיינים ההגיוניים עבור מונח.•

התכונה "צבע" עבור פרח תכיל ורוד, אדום, צהוב, כחול,לבן וכו•

התכונה "צבע עבור שלג תכיל רק לבן )וצהוב(•

9

Page 10: The Structure of Interlingua in TRANSLATOR

DRLמבנה היררכי של

10

הכל

אובייקטמאור

עתהלי

ךדיבור פיזי

בקשה הצהרה

חי דומם

צמח

בעל חיים

חתולכלב

מוחשי לא מוחשי

מידע רגשמצב

...אדם

... ... ...

......

... ...תכונות:

ממי?למי?

נושא?...

...

Page 11: The Structure of Interlingua in TRANSLATOR

DRL ב-מונחים למילה( שמביע שם עצם interlingua הוא אובייקט )שקול במונח•

או פועל.

מרכיב את הצמתים בעץ המילון•

בתכנותclassדומה ל-•

מכיל ירושה וסט מאפיינים•

דוגמא: הולך, כלב, לנוע•

11

Page 12: The Structure of Interlingua in TRANSLATOR

DRL ב-תכונות מגדירות תארים, שמות מספר, תואר הפועל, וכותכונות•

מונחיםנמצאים רק מתחת ל•

ניתנים להורשה.•

דוגמא: שחור, מאוחר, חלק, איטי, מעייף•

12

Page 13: The Structure of Interlingua in TRANSLATOR

DRLמסגרות , ואת המאפיינים שלו.מונחמשמשת ליצוג •

מונחיורשת מאפיינים מטיפוס האב של ה•

מחזיקה את כל הערכים האפשריים עבור כל מאפיין•

מונח. או תכונהמאפיין יכול להיות •

מטיפוסים יורשיםמונחים ניתן להשתמש גם במונחכאשר מדובר ב•

13

Page 14: The Structure of Interlingua in TRANSLATOR

דוגמא למסגרת

Creature ::= (‘creature’,

(‘isa’, alive),

(‘agent-of’, (eat,drink,ingest,

…))

(‘consists-of’,(head,body))

)

14

Page 15: The Structure of Interlingua in TRANSLATOR

דוגמא למסגרת

Dog ::= (‘Dog’,

(‘isa’, Creature),

(‘agent-of’, +(bark,dig,sniff,…))

(‘consists-of’,+(tail,ears,feet,…))

(‘breed’,(dalmation|corgi|labrador|…))

)

15

Page 16: The Structure of Interlingua in TRANSLATOR

דוגמא למסגרת עברית

kelb ::= (‘kelb’,

(‘yore$ mi-’, ycur),

(‘yakol lbace&a’, +(linbox,laxpor,leraxreyx,

…))

(‘murkab mi-’,+(zanab,’oznaym,ragglaym,…))

)

16

Page 17: The Structure of Interlingua in TRANSLATOR

GRLמוטיבציה מאחורי לא כל המידע בטקסט כתוב באופן מפורש ולינארי.•

.מונחיםכמות גדולה של טקסט יכולה לתאר מספר קטן של •

דוגמא: הבית הוא ירוק. הוא גם גדול ויפה.•

כדי להבין את כל הטקסט, יש להבין את הקשרים הכלליים בין •

המונחים

17

Page 18: The Structure of Interlingua in TRANSLATOR

GRLהצדקה ל-לכאורה, מניחים שקיים דקדוק אוניברסלי והוא מספיק לכל שפה •

שהיא.

לכל שפה יש נושא, נשוא, תארים, ועוד כמה כלים אוניברסליים. •

בלעדיהם לא נצליח לתרגם.

נועם חומסקי טוען שמבנים דקדוקיים מופשטים מובנים במוח •

האנושי, ולכן יופיעו בכל שפה אנושית. )תאורית הדקדוק

האוניברסאלי של חומסקי(.

18

Page 19: The Structure of Interlingua in TRANSLATOR

GRLמבנה ה-בנוי ממבנים הנקראים מסגרות•

DRL מסגרות אלו שונות מהמסגרות של ה-•

"חבילות", GRLהחל מרגע זה, אנחנו החלטנו לקרוא למבנים של ה•

כדי למנוע בלבול.

" עבור שני המבנים.frameבמאמר משתמשים במושג "•

בחרנו במושג "חבילה" מתחום הרשתות כמשלימה למסגרת.•

19

Page 20: The Structure of Interlingua in TRANSLATOR

GRLדוגמא – חבילת

20

1)משפט_(2)פסוקית-ראשית: פסוקית (3, פסוקית 1)פסוקיות-משנה: פסוקית

(3)הדגשה: שם-עצם )תת-עולם: בעלי חיים(

)...

Page 21: The Structure of Interlingua in TRANSLATOR

בניית החבילה

החבילה נבנית באופן רקורסיבי, מחבילה שמייצגת את הטקסט כולו, •

עד למטה לחבילות שמייצגות תתי רעיונות שמהם מורכבת משמעות

הטקסט.

מכילות מאפיינים, כמו המסגרת. המאפיינים מקבלים את הערך •

(.DRLהכתוב בטקסט בלבד )שלא כמו ב-

חלקם כתובים מפורשות בטקסט המקור•

חלקם מוסקים מאנליזה של טקסט המקור, או מידע המוגדר •

DRLב-

21

Page 22: The Structure of Interlingua in TRANSLATOR

טקסטהיררכיית בניה -

. מכילה בתוכה interlinguaהחבילה הראשית של המבנה בשפת •

את כל מבנה הטקסט המתורגם.

יחיד או להכיל משפטיכולה להיות ריקה, להכיל חבילה המייצגת •

המרכיבים את משפטיםאוסף חבילות הקשורות ביניהן ומייצגות

הטקסט.

22

Page 23: The Structure of Interlingua in TRANSLATOR

משפטהיררכיית בניה - .פסוקיותמורכב מחבילות המייצגות •

מאפיינים: מודליות, הדגשה, פעולת דיבור, תת-עולם•

ניתן לראות שמאפיינים אלו הם שונים מהמאפיינים של המילון, הם מאפיינים •

של דקדוק ולא של מושגים.

יכול להכיל מידע מוסק.•Sentence ::= (‘sentence-token,’

(‘clauses’ Clause*)(‘subworld’ sub-world)(‘modality’ modality)(‘focus’ focus)(‘speech-act’ speech-act))

23

Page 24: The Structure of Interlingua in TRANSLATOR

משפט – פעולות דיבור

לכל משפט מוגדרת פעולת דיבור•

תלונה, בקשה, דרישה, דיבור, התנצלות, הצהרה וכו.•

כתבו/אמרו את המשפט.לאיזה צורךמסביר •

לפעמים לא כתוב באופן מפורש ויש להסיק אותו. •

שונה בין שתי שפות, הרבה מאודהיות והניסוח של פעולת דיבור יכול להיות •יותר חשוב לשמר את קיומה של פעולת הדיבור, ולא את הנוסח שלה.

24

Page 25: The Structure of Interlingua in TRANSLATOR

דוגמאות לפעולות דיבור

העבר את המלח

מאדם ב' להעביר את המלח.ביקשנבין בתור: אדם א' •

התור הזה איטי מידי

על התור.מתלונןנבין בתור: הכותב •

הכלב אכל פיצה

על עובדה.מצהירנבין בתור: הכותב •

25

Page 26: The Structure of Interlingua in TRANSLATOR

היררכית בניה - פסוקית

כל המידע בפסוקית מגיעה מטקסט המקור. •

מהווה יחידה בסיסית של הבנה. •

יכול להיות מחובר סינטקטית לכל חלק אחר בטקסט, ע"י מבנה •

השיח.

26

Clause := (‘Clause’

(‘Discourse-structure’ discourse structure)

(‘Event’ event)

(‘Focus’ focus)

(‘Modality’ Modality)

…)

Page 27: The Structure of Interlingua in TRANSLATOR

מבנה השיח

מגדיר קשר בין פסוקיות שונות, ובין פסוקיות למשפטים וטקסטים שלמים•

מגדיר את סוג הקשר. לדוגמא:•

שקילות•

דוגמא•

הרחבה•

דימיון•

תנאי•

• ...

27

Page 28: The Structure of Interlingua in TRANSLATOR

דומגא לפסוקית מקושרת

נמרים הם חיות נקיות, בעוד שכלב עלול לעשות את צרכיו •

בבית. על אף זאת, השני יהיה חיית מחמד מוצלחת יותר

מהראשון.

28

Page 29: The Structure of Interlingua in TRANSLATOR

מידע נוסף שיש לשמר

מצב•

מיקום•

זמן•

כמתים•

יחסים•

מודליות•

הדגשה•

29

Page 30: The Structure of Interlingua in TRANSLATOR

הדגשה

water eroded stonesמים שחקו אבנים ----

stones were eroded by waterאבנים שחקו מים ----

the erosion of stones was caused byשחקו אבנים מים ---- water

ניתן לשים הדגשה על שם עצם, פועל, צירוף שמני או פעלי, פסוקית, •

וכו.

30

Page 31: The Structure of Interlingua in TRANSLATOR

מודליות

מודליות מראה את היחס של הכותב לנאמר בתוך הפסוקית•

הבית חייב לקרוס•

הבית עלול לקרוס•

הבית עשוי לקרוס•

הבית יקרוס•

הבית צריך לקרוס•

כדאי שהבית יקרוס•

31

Page 32: The Structure of Interlingua in TRANSLATOR

יחסים

משמים להגדרת יחס בין חלקי הפסוקיות•

מהווים רכיב תחבירי•

דוגמא:•

הכוס על השולחן•

הילד הוא תלמיד•

הקינוח אחרי האוכל•

32

Page 33: The Structure of Interlingua in TRANSLATOR

ידע

דרוש המון ידע על העולם, ועל שפת המקור, כדי להפיק את •

המשמעות מהטקסט

אנחנו מניחים את קיומו של הידע הזה, היות ובניית מילון אינו נושא •

שמכוסה במאמר

33

Page 34: The Structure of Interlingua in TRANSLATOR

הבה נרכיב הכל

ישנו אוסף מודלים שמנתחים את שפת המקור.•

מזהים תלויות בין משפטים )משפט א' דרוש להבנת משפט ב'(•

Interlingua כדי לתרגם את המילים ל-DRLמשתמשים במילון •תוך שימוש במספר מקורות ידע, מתרגמים מתחביר שפת המקור •

GRLל-מפעילים מודולים לגלות מידע כמו מודליות, הדגשה, פעולות דיבור, •

וכו.

וההקשר שנבנה ע"י DRLפותרים משמעויות כפולות ע"י המידע מה-•

GRLה-

34

Page 35: The Structure of Interlingua in TRANSLATOR

דוגמא

כלב שגר בבית הוא חיית מחמד.•

לצורך נוחות והבנה נראה את הדוגמא בעברית.•

פסוקיות2המשפט מורכב מ-•

כלב גר בבית•

כלב הוא חיית מחמד•

35

Page 36: The Structure of Interlingua in TRANSLATOR

אילו מילות יחס קיימות במשפט?

36

1)יחס_)סוג-היחס: המצאות-בתוך(

)זמן: ?()מופעל: ?(

)מופעל משלים: ?()תת-עולם: ?(

)...

2)יחס_)סוג-היחס: הגדרה(

)זמן: ?()מופעל: ?(

)מופעל משלים: ?()תת-עולם: ?(

)...

חיית מחמדהואבית בכלב שגר

Page 37: The Structure of Interlingua in TRANSLATOR

37

1)שם-עצם_)מקרה-של: כלב(

)תת-עולם: בעלי חיים()תכונות: אין(

)...

2)שם-עצם_)מקרה-של: בית(

)תת-עולם: בעלי חיים()תכונות: אין(

)...

3)שם-עצם_)מקרה-של: חיית

מחמד()תת-עולם: בעלי חיים(

)תכונות: אין()...

אילו שמות עצם יש במשפט?

חיית מחמד הוא בית שגר בכלב

Page 38: The Structure of Interlingua in TRANSLATOR

הגדרה

תמיד )כלב(1שם-עצם_

)חיית 3שם-עצם_ מחמד(

בעלי חיים

1יחס_))סוג-היחס: (

)זמן: ()מופעל: (

( )מופעל-משלים: )תת-עולם: (

)...

המצאות-בתוך

תמיד )כלב(1שם-עצם_

)בית(2שם-עצם_ בעלי חיים

2)יחס_)סוג-היחס: (

)זמן: (( )מופעל:

)מופעל-משלים: )

)תת-עולם: ()...

38

נמלא את החוסרים...חיית מחמד הוא ביתב שגר כלב

Page 39: The Structure of Interlingua in TRANSLATOR

39

נגדיר פסוקיות

חיית מחמד הוא

1)פסוקית_)מרחיב את פסוקית )מבנה-השיח:

2))( )נמצא בתוך(1יחס_)מאורע:

)הדגשה: זמן()מודליות: התנייה(

)תת-עולם: בעלי חיים()...

2)פסוקית_)מבנה-השיח: אין(

( )הגדרה(2יחס_)מאורע: ( )חיית מחמד(3שם-עצם_)הדגשה:

)מודליות: אמיתי()תת-עולם: בעלי חיים(

)...

ביתבשגר כלב

Page 40: The Structure of Interlingua in TRANSLATOR

40

חיית מחמדהוא כלב שגר בבית

1)משפט_(2פסוקית )פסוקית-ראשית:

(1: פסוקית )פסוקיות-משנה( )חיית מחמד(3שם-עצם_)הדגשה:

)תת-עולם: בעלי חיים()פעולת-דיבור:

)סוג: הגדרהדובר: הכותב

מאזין: הקורא ()...

נרכיב משפט:

Page 41: The Structure of Interlingua in TRANSLATOR

41

חיית מחמדהוא כלב שגר בבית

1)משפט_(2פסוקית )פסוקית-ראשית:

(1: פסוקית )פסוקיות-משנה( )חיית מחמד(3שם-עצם_)הדגשה:

)תת-עולם: בעלי חיים()פעולת-דיבור:

)סוג: הגדרהדובר: הכותב

מאזין: הקורא ()...

עכשיו מהסוף להתחלה...

Page 42: The Structure of Interlingua in TRANSLATOR

42

נגדיר פסוקיות

חיית מחמד הוא

1)פסוקית_)מרחיב את פסוקית )מבנה-השיח:

2))( )נמצא בתוך(1יחס_)מאורע:

)הדגשה: זמן()מודליות: התנייה(

)תת-עולם: בעלי חיים()...

2)פסוקית_)מבנה-השיח: אין(

( )הגדרה(2יחס_)מאורע: ( )חיית מחמד(3שם-עצם_)הדגשה:

)מודליות: אמיתי()תת-עולם: בעלי חיים(

)...

ביתבשגר כלב

Page 43: The Structure of Interlingua in TRANSLATOR

43

נמלא את החוסרים...חיית מחמד הוא ביתב שגר כלב

1יחס_))סוג-היחס: המצאות-בתוך(

)זמן: תמיד(( )כלב(1שם-עצם_)מופעל:

2שם-עצם_: )מופעל-משלים()בית(

)תת-עולם: בעלי חיים()...

2)יחס_)סוג-היחס: הגדרה(

)זמן: תמיד(( )כלב(1שם-עצם_)מופעל:

)חיית 3שם-עצם_)מופעל-משלים: (מחמד(

)תת-עולם: בעלי חיים()...

Page 44: The Structure of Interlingua in TRANSLATOR

44

1)שם-עצם_)מקרה-של: כלב(

)תת-עולם: בעלי חיים()תכונות: אין(

)...

2)שם-עצם_)מקרה-של: בית(

)תת-עולם: בעלי חיים()תכונות: אין(

)...

3)שם-עצם_)מקרה-של: חיית

מחמד()תת-עולם: בעלי חיים(

)תכונות: אין()...

אילו שמות עצם יש במשפט?

חיית מחמד הוא בית שגר בכלב

Page 45: The Structure of Interlingua in TRANSLATOR

סיכום הדוגמא

הטקסט )החבילה העליונה ביותר( הוא משפט יחיד, ולכן בניית •

החבילה פשוטה.

הצלחנו לייצג את משמעות המשפט בצורת מבנה נתונים, כלומר •

interlinguaב-

אם יש עוד משפטים, נתרגם אותם ונקשר בין המשפטים במידת •

הצורך

45

כלב שגר בבית הוא חיית מחמד.

Page 46: The Structure of Interlingua in TRANSLATOR

המשך התהליך

נעביר לשלב השני, שתפקידו להשלים את המידע interlinguaאת הטקסט ב-•

שיש להסיק מהטקסט.

) המאמר אינו דן בסינטזה(. לבסוף הפלט יועבר לסינטזה בשפת היעד.•

ישנם מספר פלטים סבירים בשפת היעד, כמו•

• A dog is called a pet if it lives in a house

• A dog, living in a house, is a pet

• A pet is defined as a dog which lives in a house.

46

כלב שגר בבית הוא חיית מחמד.

Page 47: The Structure of Interlingua in TRANSLATOR

סיכום: יתרונות וחסרונות

יתרונות:

יעיל במספר המודולים הדרושים•

משמר משמעות היטב גם בין שפות רחוקות•

חסרונות:

קשה לביצוע•

מסיר כל סממן סגנוני ותרבותי מהטקסט•

47

Page 48: The Structure of Interlingua in TRANSLATOR

המצב כיום

, אבדה במשך TRANSLATORהתוכנה שעליה הייתה ההרצאה, •

השנים.

Interlinguaקיימות מספר קטן של תוכנות שמתעסקות ב-••KANT-מתרגם מסמכים טכניים.89, פעיל כיום, נוסד ב ,'

•OntoSem-2004 נכתב ע"י נירנבורג ורסקין )מחברי מאמר זה(, מ ,

משמש למנועי חיפוש סמנטיים.

ישנן מספר תוכנות אקדמיות•

48

Page 49: The Structure of Interlingua in TRANSLATOR

סיכום

interlinguaהראינו את המבנה הכללי של ה•DRLGRLחבילות ומסגרות

הדרוש כדי לייצג את כל מה GRLחשוב לציין שלא הראינו אל כל ה•

שעשויים לכתוב בשפה אמיתית

49

Page 50: The Structure of Interlingua in TRANSLATOR

ביבליוגרפיה

• The Structure of Interlingua in TRANSLATOR: Nirenburg, Raskin, and Tucker (c. 1986)

• Evaluating the Peformance of the OntoSem Semantic Analyzer: Nirenburg, Beale, McShane (c.)

• Machine Translation: Interlingual Methods: Dorr, Hovy , and Levin (c. 2001)

• Natural Language Processing and Machine Translation: Dorr, Hovy and Levin

50