entwicklung und einsatz von lokalisierungswerkzeugen (web-tcm) informatik-, computerlinguistik-,...
TRANSCRIPT
![Page 1: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/1.jpg)
Entwicklung und Einsatz vonLokalisierungswerkzeugen
(Web-TCM)
Informatik-, Computerlinguistik-, Fachsprachenkompetenz
Uta Seewald-Heeg
„Interdisziplinäre Zusammenarbeit in der Medieninformatik“Kolloquium zu Ehren von Prof. Dr.-Ing. Detlef Klöditz
Köthen, 22. November 2001
![Page 2: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/2.jpg)
Entwicklung und Einsatz vonLokalisierungswerkzeugen
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
![Page 3: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/3.jpg)
Lokalisierung
• Anpassung, d.h. Übersetzung eines Software-Produkts an einen lokalen Markt mit seinen sprachlichen und kulturellen Besonderheiten
• Anpassung, d.h. Übersetzung eines Software-Produkts an einen lokalen Markt mit seinen sprachlichen und kulturellen Besonderheiten
• Sprachliche und kulturelle Anpassung vonWeb-Seiten
![Page 4: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/4.jpg)
Entwicklung und Einsatz vonLokalisierungswerkzeugen
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
![Page 5: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/5.jpg)
Lokalisierungsprozess(nach Microsoft)
![Page 6: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/6.jpg)
Kompetenzen bei derEntwicklung von Software und
Lokalisierungswerkzeugen
• Internationalisierung (I18N)• Globalisierung (G11N)
– (Sprach-, Kultur- und Plattform-Unabhängigkeit von Produkten)
• Lokalisierung (L10N)
• Internationalisierung (I18N)• Globalisierung (G11N)
– (Sprach-, Kultur- und Plattform-Unabhängigkeit von Produkten)
• Lokalisierung (L10N)
![Page 7: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/7.jpg)
Internationalisierung
Bsp.: SortierroutinenBsp.: Sortierroutinen
![Page 8: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/8.jpg)
Codierungssysteme
Codepages• Zuordnung von Byte-Werten auf Buchstaben eines
Alphabets• Byte-Werte (auch: Code-Points) sind Indizes in einer
Codepage• Bis zum Code 0x7F (127) werden Code-Points von allen
Codepages auf die gleichen Buchstaben abgebildet (ASCII-7-Bit-Zeichensatz)
• Unterscheidung in der Zuordnung der Buchstaben für Codes zwischen 0x80 (128) und 0xFF (255)
Codepages• Zuordnung von Byte-Werten auf Buchstaben eines
Alphabets• Byte-Werte (auch: Code-Points) sind Indizes in einer
Codepage• Bis zum Code 0x7F (127) werden Code-Points von allen
Codepages auf die gleichen Buchstaben abgebildet (ASCII-7-Bit-Zeichensatz)
• Unterscheidung in der Zuordnung der Buchstaben für Codes zwischen 0x80 (128) und 0xFF (255)
Byte String Windows Codepage 1252 Windows Codepage 1253Hex Dez (W. European) (Cyrillic)0xD6 214 Ö Ц0xFF 252 ü ь
![Page 9: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/9.jpg)
encoding: #UTF_8catalog: #labelscacheSize: 113 Hardcopy = 'Печатать'Cancel = 'Прерывание'Help = 'Помощь'tryAgain = 'Новая попытка'Icon = 'Пиктограмма'inspect = 'Исследовать'
Action = 'Окно переключить'
encoding: #UTF_8catalog: #labelscacheSize: 113 Hardcopy = 'Печатать'Cancel = 'Прерывание'Help = 'Помощь'tryAgain = 'Новая попытка'Icon = 'Пиктограмма'inspect = 'Исследовать'
Action = 'Окно переключить'
Locales(Variablen mit sprach- bzw. marktabhängig
unterschiedlichen Werten)
• Zeichenketten• Datumsformate• Kalender, Zeitformate• Währungsformate• Maßeinheiten• Grafiken• Farben• Schreibstile• Produktverpackung
• Zeichenketten• Datumsformate• Kalender, Zeitformate• Währungsformate• Maßeinheiten• Grafiken• Farben• Schreibstile• Produktverpackung
encoding: #UTF_8catalog: #labelscacheSize: 113 Hardcopy = 'Drucken'Cancel = 'Abbruch'Help = 'Hilfe'tryAgain = 'Neuer Versuch'Icon = 'Ikone'inspect = 'Untersuchen'
Action = 'Fenster umschalten'
encoding: #UTF_8catalog: #labelscacheSize: 113 Hardcopy = 'Drucken'Cancel = 'Abbruch'Help = 'Hilfe'tryAgain = 'Neuer Versuch'Icon = 'Ikone'inspect = 'Untersuchen'
Action = 'Fenster umschalten'
encoding: #UTF_8catalog: #labelscacheSize: 113 Hardcopy = 'Print'Cancel = 'Cancel'Help = 'Help'tryAgain = 'Retry'Icon = 'Button'inspect = 'Inspect'Action = 'Switch Window'
encoding: #UTF_8catalog: #labelscacheSize: 113 Hardcopy = 'Print'Cancel = 'Cancel'Help = 'Help'tryAgain = 'Retry'Icon = 'Button'inspect = 'Inspect'Action = 'Switch Window'
VisualWorks 5.i
![Page 10: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/10.jpg)
Datumsformate
22. November 200122.11.200122/11/2001
2001-11-22
11/22/2001November 22, 200122 November 2001
22/11/200122 novembre 2001
22. November 200122.11.200122/11/2001
2001-11-22
11/22/2001November 22, 200122 November 2001
22/11/200122 novembre 2001
Deutsch
EU
Amerikanisch
Französisch
![Page 11: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/11.jpg)
Feldlängen
!
![Page 12: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/12.jpg)
Entwicklung und Einsatz vonLokalisierungswerkzeugen
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
![Page 13: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/13.jpg)
Kompetenz beim Einsatz von Lokalisierungswerkzeugen
MaschinelleÜbersetzungssysteme
Translation-Memory-Systeme
Programme zur Bearbeitungvon Online-Hilfen
Programme zur Lokalisierungvon Software-Quelldateien
![Page 14: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/14.jpg)
Kompetenz beim Einsatz von Lokalisierungswerkzeugen
• Kulturkompetenz• Textsortenkompetenz• IT-Kompetenz
• Kulturkompetenz• Textsortenkompetenz• IT-Kompetenz
![Page 15: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/15.jpg)
Kulturkompetenz
„Laufschrift“von links nach rechts laufend
„Laufschrift“von links nach rechts laufend
NavigationsleisteNavigationsleiste
DatumsangabenDatumsangaben
![Page 16: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/16.jpg)
Textsortenkompetenz
• Textsorten– Handbücher– Online-Hilfe-Texte (i.d.R. HTML-Dateien)– Benutzerschnittstelle (Menüs, Benutzerdialoge,
Schaltflächen, Fensterinhalte, Icons)– Fehlermeldungen– Schulungsmaterial– Lizenzverträge
• Textsorteneigenschaften• Technische Realisierung, Formate
• Textsorten– Handbücher– Online-Hilfe-Texte (i.d.R. HTML-Dateien)– Benutzerschnittstelle (Menüs, Benutzerdialoge,
Schaltflächen, Fensterinhalte, Icons)– Fehlermeldungen– Schulungsmaterial– Lizenzverträge
• Textsorteneigenschaften• Technische Realisierung, Formate
![Page 17: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/17.jpg)
BenutzerschnittstelleInterne Repräsentation von Textelementen
Menü in einem Entsprechung in der QuelldateiWindows-Programm (Resource File)
6 MENU FIXED IMPUREBEGINPOPUP "&DATEI"BEGINMENUITEM "&NEU...\tSTRG+N"MENUITEM "Ö&ffnen...\tSTRG+O"MENUITEM "S&chließen"MENUITEM SEPARATORMENUITEM "S&peichern\tSTRG+S"MENUITEM "&Speichern &unter..."MENUITEM "Als Websei&te
speichern..."MENUITEM "Pac&k & Go..."MENUITEM SEPARATORMENUITEM "&Webseitenvorschau"MENUITEM SEPARATORMENUITEM "Seite einr&ichten"
![Page 18: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/18.jpg)
Tastenkombinationen
![Page 19: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/19.jpg)
IT-KompetenzAufbau und Funktionsweise von
Lokalisierungswerkzeugen
PASSOLO erkennt typische Lokalisierungs-fehler wie abgeschnittene Beschriftungen von Schaltflächen
PASSOLO erkennt typische Lokalisierungs-fehler wie abgeschnittene Beschriftungen von Schaltflächen
![Page 20: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/20.jpg)
Entwicklung und Einsatz vonLokalisierungswerkzeugen
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
![Page 21: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/21.jpg)
Entwicklung desLokalisierungswerkzeugs
Web-TCM
• Web-TCM: Web Translation & Content Management • Kooperationsprojekt
– Fachbereich Informatik der Hochschule Anhalt (Studiengang Fachübersetzen)
– Firma Georg Heeg
• Web-TCM: Web Translation & Content Management • Kooperationsprojekt
– Fachbereich Informatik der Hochschule Anhalt (Studiengang Fachübersetzen)
– Firma Georg Heeg
Web-TCM
![Page 22: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/22.jpg)
SmalltalkProgrammier-werkzeug des
Web-TCM
![Page 23: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/23.jpg)
Web Translation& Content Management
• Web Translation– Lokalisieren, Übersetzen
• Content Management– Verwalten von Inhalten bzw. Änderungen
auf einer WWW-Seite (in einer beliebigen Sprache)
• Web Translation– Lokalisieren, Übersetzen
• Content Management– Verwalten von Inhalten bzw. Änderungen
auf einer WWW-Seite (in einer beliebigen Sprache)
Web-TCM
![Page 24: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/24.jpg)
<!doctype ....><html><head>
<title> Fachübersetzen</title></head><body> ...<body></html>
Fachübersetzen
Extraktion derTextblöckeNummerierung derTextblöcke
Segmentierung
123....n
Deutsch
FachübersetzenEnglish
FrançaisTraduction specialisée
Русский технический перевод
HTML-Seite mitZugriffsfunktionüber die Nummernder Textblöcke
Memory
Web-TCM
![Page 25: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/25.jpg)
Memory (TM)
Nr. DE EN FR RU
1 Sprache language langue язык
2Fachüber-
setzenTraduction spécialisée
3
.
.
n
HTML-Seite mitZugriffsfunktionüber die Nummernder Textblöcke
<!doctype ....><html><head>
<title><%=tm at: 2%></title></head><body> ...<body></html>
Sprachparameter (lang=de) in der URL
de fr
Web-TCM
![Page 26: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/26.jpg)
<!doctype ....><html><head>
<title>Fachübersetzen</title></head><body> <h1>Fachübersetzen</h1> <body></html>
<!doctype ....><html><head>
<title>Traduction spécialisée</title></head><body> <h1>Traduction spécialisée</h1><body></html>
Fachübersetzen Traduction spécialisée
http://fue.htm?lang=deURL http://fue.htm?lang=frURL
Fachübersetzen Traduction spécialisée
Web-TCM
![Page 27: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/27.jpg)
Workfloweinsprachig → mehrsprachig
1. HTML-Dateien bereitstellen– HTML Tidy (www.w3.org)
2. HTML-Dateien in XHTML-Dateien konvertieren– Jede Datei beginnt mit einer DTD– Jedes Tag muss beendet werden, z.B. <br></br>,
kurz: <br />– Alle HTML-Bestandteile werden klein geschrieben.– Substitution bestimmter Tags, z.B. <b> <strong>
Web-TCM
![Page 28: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/28.jpg)
XHTML
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta name="generator" content="HTML Tidy, see www.w3.org" />
<meta http-equiv="Content-Type"
content="text/html; charset=utf-8" />
<title>Fachübersetzen</title>
</head>
...
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta name="generator" content="HTML Tidy, see www.w3.org" />
<meta http-equiv="Content-Type"
content="text/html; charset=utf-8" />
<title>Fachübersetzen</title>
</head>
...
Web-TCM
![Page 29: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/29.jpg)
Workfloweinsprachig → mehrsprachig
1. HTML-Dateien bereitstellen– HTML Tidy (www.w3w.org)
2. HTML-Dateien in XHTML-Dateien konvertieren– Jede Datei beginnt mit einer DTD– Jedes Tag muss beendet werden, z.B. <br></br>, kurz: <br />– Alle HTML-Bestandteile werden klein geschrieben.– Substitution bestimmter Tags, z.B. <b> <strong>
3. Segmentierung der HTML-Dateien– *.htm (XHTML)– XML-Parser in Smalltalk (Parse-Tree)– Segmentierer in Smalltalk (Baumtransformation, TM-
Segmente)– Generierung der ssp-Dateien (*.ssp)– Ablegen der AS-Segmente (hier: deutsch) in das TM
Web-TCM
![Page 30: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/30.jpg)
SSPSmalltalk Server Pages
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<%lang := request anyParameterValueAt: 'lang'.
tm := Heeg.Translator.TM new: lang.%>
<html>
<head>
<meta name="generator" content="HTML Tidy, see www.w3.org"/>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>
<title>
<%=tm at: 158%>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<%lang := request anyParameterValueAt: 'lang'.
tm := Heeg.Translator.TM new: lang.%>
<html>
<head>
<meta name="generator" content="HTML Tidy, see www.w3.org"/>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>
<title>
<%=tm at: 158%>
Web-TCM
![Page 31: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/31.jpg)
Workfloweinsprachig → mehrsprachig
1. HTML-Dateien bereitstellen– HTML Tidy (www.w3w.org)
2. HTML-Dateien in XHTML-Dateien konvertieren– Jede Datei beginnt mit einer DTD– Jedes Tag muss beendet werden, z.B. <br></br>, kurz: <br />– Alle HTML-Bestandteile werden klein geschrieben.– Substitution bestimmter Tags, z.B. <b> <strong>
3. Segmentierung der HTML-Dateien– *.htm (XHTML)– XML-Parser in Smalltalk (Parse-Tree)– Segmentierer in Smalltalk (Baumtransformation, TM-
Segmente)– Generierung der ssp-Dateien (*.ssp)– Ablegen der AS-Segmente (hier: deutsch) in das TM
4. ResegmentierenWeb-TCM
![Page 32: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/32.jpg)
![Page 33: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/33.jpg)
![Page 34: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/34.jpg)
![Page 35: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/35.jpg)
![Page 36: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/36.jpg)
![Page 37: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/37.jpg)
Workfloweinsprachig → mehrsprachig
1. HTML-Dateien bereitstellen– HTML Tidy (www.w3w.org)
2. HTML-Dateien in XHTML-Dateien konvertieren– Jede Datei beginnt mit einer DTD– Jedes Tag muss beendet werden, z.B. <br></br>, kurz: </br>– Alle HTML-Bestandteile werden klein geschrieben.– Substitution bestimmter Tags, z.B. <b> <strong>
3. Segmentierung der HTML-Dateien– *.htm (XHTML)– XML-Parser in Smalltalk (Parse-Tree)– Segmentierer in Smalltalk (Baumtransformation, TM-Segmente)– Generierung der ssp-Dateien (*.ssp)– Ablegen der AS-Segmente (hier: deutsch) in das TM
4. Resegmentieren5. Übersetzen
– Translation Memory in allen Zielsprachen
Web-TCM
![Page 38: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/38.jpg)
![Page 39: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/39.jpg)
![Page 40: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/40.jpg)
![Page 41: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/41.jpg)
![Page 42: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/42.jpg)
![Page 43: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/43.jpg)
![Page 44: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/44.jpg)
Export in kommerzielle TM-SystemeTMX-Austauschformat
<?xml version="1.0"?>
<!DOCTYPE tmx PUBLIC "-//LISA OSCAR:1997//DTD for Translation Memory eXchange//EN" "http://www.lisa.org/tmx/tmx11.dtd">
<tmx version="1.1">
<header
creationtool="Web-TCM"
creationtoolversion="0.55"
datatype="HTML"
o-tmf="Web-TCM"
segtype="sentence"
adminlang="en-us"
srclang="DE"
o-encoding="utf-8">
</header>
<?xml version="1.0"?>
<!DOCTYPE tmx PUBLIC "-//LISA OSCAR:1997//DTD for Translation Memory eXchange//EN" "http://www.lisa.org/tmx/tmx11.dtd">
<tmx version="1.1">
<header
creationtool="Web-TCM"
creationtoolversion="0.55"
datatype="HTML"
o-tmf="Web-TCM"
segtype="sentence"
adminlang="en-us"
srclang="DE"
o-encoding="utf-8">
</header>
<body><tu tuid="1"><tuv lang="de"><seg>Sprach- und Sachfachangebot</seg></tuv><tuv lang="en"><seg>Languages and application domains</seg></tuv><tuv lang="fr"><seg>Langues et disciplines spécialisées</seg></tuv><tuv lang="ru"><seg>Языка и дисциплина</seg></tuv></tu>... </body>
<body><tu tuid="1"><tuv lang="de"><seg>Sprach- und Sachfachangebot</seg></tuv><tuv lang="en"><seg>Languages and application domains</seg></tuv><tuv lang="fr"><seg>Langues et disciplines spécialisées</seg></tuv><tuv lang="ru"><seg>Языка и дисциплина</seg></tuv></tu>... </body>
![Page 45: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/45.jpg)
Entwicklungsaufwand
• Zwei Arbeitswochen• Interaktive Weiterentwicklung während der
Nutzung
• Zwei Arbeitswochen• Interaktive Weiterentwicklung während der
Nutzung
Web-TCM
ROBUSTROBUST
![Page 46: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/46.jpg)
Web-TCMVergleich mit kommerziellen TM-basierten
Lokalisierungswerkzeugen
• Erstes Lokalisierungswerkzeug, das virtuelle Team-Arbeit real unterstütztBei verfügbaren kommerziellen Systemen müssen TMs importiert bzw. exportiert werden und erfordern immer einen Abgleich der TMs verschiedener Übersetzer
• Passwort-geschützter Zugang• https (http mit Verschlüsselung)• Kombiniert Translation-Memory-Technologie mit Content-
Management• Unterstützt Export in kommerzielle TM-Systeme
(TMX-Austauschformat)• Unterstützt Export statischer Web-Seiten in allen
verfügbaren Sprachen
• Erstes Lokalisierungswerkzeug, das virtuelle Team-Arbeit real unterstütztBei verfügbaren kommerziellen Systemen müssen TMs importiert bzw. exportiert werden und erfordern immer einen Abgleich der TMs verschiedener Übersetzer
• Passwort-geschützter Zugang• https (http mit Verschlüsselung)• Kombiniert Translation-Memory-Technologie mit Content-
Management• Unterstützt Export in kommerzielle TM-Systeme
(TMX-Austauschformat)• Unterstützt Export statischer Web-Seiten in allen
verfügbaren Sprachen
![Page 47: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/47.jpg)
Kompetenz für das Lokalisierungsprojektund den Einsatz von Web-TCM
Sprachdatenverarbeitung„Grundlagen der Lokalisierungstechnologie“
• Codierungssysteme• Lokalisierung von Schulungsmaterial (Text und Grafik) mit TM• Dynamische Web-Seiten, HTML, XML• Lokalisierungsprojekt: Web-Site-Lokalisierung (D E, F, R)
– Projektorganisation• Projektmanager• Übersetzungsteams• „Proofreading”, Qualitätskontrolle
– Arbeitsschritte• Extraktion von Textelementen aus Grafiken• Vorbereitung der Terminologie• Übersetzung der Webseiten• „Proofreading“• Übergabe
• Lokalisierungswerkzeug (Web-TCM)
• Codierungssysteme• Lokalisierung von Schulungsmaterial (Text und Grafik) mit TM• Dynamische Web-Seiten, HTML, XML• Lokalisierungsprojekt: Web-Site-Lokalisierung (D E, F, R)
– Projektorganisation• Projektmanager• Übersetzungsteams• „Proofreading”, Qualitätskontrolle
– Arbeitsschritte• Extraktion von Textelementen aus Grafiken• Vorbereitung der Terminologie• Übersetzung der Webseiten• „Proofreading“• Übergabe
• Lokalisierungswerkzeug (Web-TCM) SS 2001
![Page 48: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/48.jpg)
Entwicklung und Einsatz vonLokalisierungswerkzeugen
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Softwareund Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Softwareund Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
![Page 49: Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre](https://reader036.vdocuments.mx/reader036/viewer/2022081518/55204d6849795902118bdf22/html5/thumbnails/49.jpg)
Resümee
• Sowohl Entwicklung als auch Einsatz von Lokalisierungswerkzeugen erfordern Kompetenzen aus den drei Bereichen:– Informatik– Computerlinguistik– Sprachmittlung, Fachsprachen
• Einrichtung der Vertiefungsrichtung „Softwarelokalisierung“ im Diplomstudiengang Fachübersetzen am Fachbereich Informatik trägt dieser Interdisziplinarität Rechnung
• FB Informatik der HS Anhalt (FH) damit in der Hochschulausbildung wegweisend
• Sowohl Entwicklung als auch Einsatz von Lokalisierungswerkzeugen erfordern Kompetenzen aus den drei Bereichen:– Informatik– Computerlinguistik– Sprachmittlung, Fachsprachen
• Einrichtung der Vertiefungsrichtung „Softwarelokalisierung“ im Diplomstudiengang Fachübersetzen am Fachbereich Informatik trägt dieser Interdisziplinarität Rechnung
• FB Informatik der HS Anhalt (FH) damit in der Hochschulausbildung wegweisend