Übersetzung - iks.hs-merseburg.deuheuert/pdf/anwendung rechnernetze/vortraege... · programm...
TRANSCRIPT
Übersetzung
»Übersetzen ist ein schwieriges Problem. Computer besitzen nun mal keinerlei Intelligenz. Ein Mensch kann eine Sprache schon mit tausend Wörtern sprechen. Wir haben Computermodelle mit über einer Million Wörtern - und trotzdem können sie nicht mit einem Menschen mithalten.«
(Systran-Chef Dimitris Sabatakakis )
Alexander Brunsbach Anwendung Rechnernetze
0. Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 2
1. Wozu maschinelle Übersetzung?
� viele Texte sind digital verfügbar � einfache Übersetzung möglich
� Globalisierung
� Wirtschaftlich wichtige, schwer erlernbare Sprachen� Wirtschaftlich wichtige, schwer erlernbare Sprachen� chinesisch, japanisch, koreanisch, usw.
� Militärisch wichtige, schwer erlernbare Sprachen� arabisch, paschtu, usw.
06.12.2007 Alexander Brunsbach 3
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 4
2. Idee
� Verstehen einer Sprache, ohne sie selbst zu beherrschen
� Erfordert� Künstliche Intelligenz� Künstliche Intelligenz
� Computerlinguistik
� Mathematik
� Informatik
06.12.2007 Alexander Brunsbach 5
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 6
3. Geschichte
� Erstes große Projekt vom US-Militär� Russisch-Englisch-Übersetzungsprogramm
� 1966: Pentagon bescheinigt grundsätzliche Unrealisierbarkeit der maschinellen ÜbersetzungUnrealisierbarkeit der maschinellen Übersetzung
� 1980: Siemens AG greift MÜ – Forschung wieder auf
� 1980er: Japan entwickelt erstes kommerzielle MÜ –Programm (in Prolog)
06.12.2007 Alexander Brunsbach 7
3. Geschichte
� 1990er: „Verbmobil“ wird von deutscher Industrie und Akademik entwickelt (Spracherkennung, Direktübersetzung, Satzgenerierung)
� 2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen � 2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen melden Konkurs an
� 2007: nur 1% des Gesamtumsatzes auf dem Übersetzungsmarkt durch MÜ
„Die maschinelle Übersetzung befindet sich in Kinderschuhen“
(google)
06.12.2007 Alexander Brunsbach 8
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 9
4. Übersetzungsmethoden
� Datei / Datenbank mit „Vokabel-“ Einträgen
� Direkte MÜ� Wort-für-Wort-Übersetzung
� Anschließende Satzgenierung� Anschließende Satzgenierung
� Robust und schnell
06.12.2007 Alexander Brunsbach 10
Quelltext Morphologische Analyse
Wortstellungs-korrektur
ZieltextBilinguales Wörterbuch
4. Übersetzungsmethoden
� Transfer� Satzanalyse (Baumstruktur)
� Transfer (Übersetzung)
� Generierung (Satzbildung nach grammatikalischen � Generierung (Satzbildung nach grammatikalischen Regeln der Zielsprache)
06.12.2007 Alexander Brunsbach 11
Quelltext Analyse Transfer Generierung Zieltext
4. Übersetzungsmethoden
� Interlingua� Grammatische Information der Quellsprache, wird in
neutraler Zwischensprache ausgedrückt
� Erzeugung grammatischer Information der � Erzeugung grammatischer Information der Zielsprache
� „einfache“ Übersetzung komplexer Ausdrücke
06.12.2007 Alexander Brunsbach 12
Quelltext Analyse Generierung Zieltext
4. Übersetzungsmethoden
� Example-Based Machine Translation (EBMT)� Speicherung von häufig vorkommenden Sätzen
� Ableitung ähnlicher Sätze
� Statistics-Based Machine Translation (SBMT)� Statistics-Based Machine Translation (SBMT)� Einlesen von zweisprachigem Textfundus
� Vergleich mit Quelltext
06.12.2007 Alexander Brunsbach 13
4. Übersetzungsmethoden
� Human-Aided Machine Translation (HAMT) � Programm fordert Benutzer zur Teilübersetzung auf
Die meisten Systeme in der Praxis sind eine Mischung aus
mehreren Methoden (oft Dominanz des Transfersystems mit
Interlingua und EBMT-Elementen)
06.12.2007 Alexander Brunsbach 14
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 16
5. Übersetzungsprogramme
� Systran übersetzt täglich 30 Millionen Web-Seiten
06.12.2007 Alexander Brunsbach 17
5. Übersetzungsprogramme
Test diverser, freier Übersetzungstools, anhand des Beispielsatzes:anhand des Beispielsatzes:
„John lässt sich einen Bart wachsen“
Deutsch → Englisch → Deutsch
06.12.2007 Alexander Brunsbach 18
5. Übersetzungsprogramme
� Google überzeugt beim Wettbewerb automatischer Dolmetscher� Google verzichtet auf linguistische Regeln und setzt
auf Statistikauf Statistik
� 1000 Rechner mit einem Sprachschatz von 200 Milliarden Wörtern
� »das größte Sprachmodell in der Geschichte der Menschheit« (Franz Och)
06.12.2007 Alexander Brunsbach 23
5. Übersetzungsprogramme
� Beispielübersetzung einer arabischen Zeitungsschlagzeile� Google: »ElBaradei: Inspektoren brauchen ›einige
Monate‹, um ihre Aufgabe zu erfüllen«,Monate‹, um ihre Aufgabe zu erfüllen«,
� Systran: »Der Bradi: Die Inspektoren brauchen zu ›einige Monate‹ für Ende wichtige ihr.«
»Die Infrastruktur ist fantastisch. Hier werden acht
Milliarden Web-Seiten erfasst und ständig
aktualisiert. Die liegen einfach da, und mit denen
kann man dann rechnen.« Franz Och (google)
06.12.2007 Alexander Brunsbach 24
5.1 Verbmobil
� Sprachübersetzung für deutsch, englisch und japanisch
� Sprecherunabhängig
� „Echtzeit“ – Berechnung� „Echtzeit“ – Berechnung
� Beschränkung auf� Terminabsprache
� Reiseplanung
� Hotelreservierung
� Forschungsgelder von 170 000 000 DM
06.12.2007 Alexander Brunsbach 25
5.1 Verbmobil
� Gleichzeitige Anwendung von fünf Übersetzungsverfahren
� Über stochastisches Verfahren, wird die wahrscheinlichste Übersetzung gewähltwahrscheinlichste Übersetzung gewählt
� Wortschatz von 10 000 Wörtern
� Umgang mit „Spontansprache“� „Ja, ich weil also würde mal sagen äh vorschlagen,
wir könnten uns am äh 7. treffen so im Mai“
� „How about the seventh of May?“
06.12.2007 Alexander Brunsbach 27
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 29
6. Statistics-Based Machine Translation
� Statistischer Ansatz� Maschinelle Sprachverarbeitung = statistische
Entscheidungstheorie + linguistische Modellierung
� 1989-1994: IBM forscht an statistischen � 1989-1994: IBM forscht an statistischen Übersetzungsmethoden, als Textfundus dienten die kanadischen Parlamentsaufzeichnungen
(bilingual: englisch – französisch)
06.12.2007 Alexander Brunsbach 30
6. Statistics-Based Machine Translation
� Language Modell: syntaktische / semantische Struktur der möglichen Sätze der Zielsprache
� Übersetzungsmodell: Zusammenhang zwischen Quell –und Zielsatz
06.12.2007 Alexander Brunsbach 31
Inhalt
1. Wozu maschinelle Übersetzung?
2. Idee
3. Geschichte
4. Übersetzungsmethoden4. Übersetzungsmethoden
5. Übersetzungsprogramme
1. Verbmobil
6. Statistics-Based Machine Translation
7. Fazit
06.12.2007 Alexander Brunsbach 32
7. Fazit
� Heutige maschinelle Übersetzungssysteme sind sehr unvollkommen
� Abstraktionsfähigkeit ist beschränkt
� „Gesprochene und geschriebene Sprache hat es � „Gesprochene und geschriebene Sprache hat es schon gegeben, lange bevor es Grammatiker, Linguisten und Informatiker gab.“
06.12.2007 Alexander Brunsbach 34
Quellen
� Grundlagen der Computerlinguistik (Roland Hausser)
� Computerlinguistik und Sprachtechnologie (K.-U. Carstensen)
� http://zeus.zeit.de/text/zeit-wissen/2006/03/Maschinelle_Uebersetzung.xml
� http://www.ifi.unizh.ch/groups/ailab/teaching/semi2000/sprachverarbeitung.pdf
� Informatik – Spektrum (Mai 2003)Informatik – Spektrum (Mai 2003)
� http://server02.is.uni-sb.de/courses/wiki/index.php/Maschinelle_%C3%9Cbersetzung
� http://de.wikipedia.org/wiki/Maschinelle_%C3%9Cbersetzung
� http://server02.is.uni-sb.de/courses/wiki/index.php/Verbmobil
06.12.2007 Alexander Brunsbach 35