2009 proz conference barcelona: overview of machine translation

Post on 18-May-2015

122 Views

Category:

Technology

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Presentation by Diego Bartolome, tauyou language technology CEO at the annual conference. It presents an overview of machine translation for freelance translators.

TRANSCRIPT

www.tauyou.com

info@tauyou.com

Enjoy the world!

Communication is not a problem anymore

Human quality machine translation solutions© 2009 Ta with you

Conferencia ProZ

Octubre 2009

© 2009 Ta with you Conferencia ProZ, Octubre 2009 2

Introducción

¿De dónde vengo?

¿Dónde estoy?

¿Adónde voy?

© 2009 Ta with you Conferencia ProZ, Octubre 2009 3

¿Para qué traducción automática?

Usuario final

Información web

Cliente corporativo

Documentación corporativa interna

Traductores

Herramienta de productividad (?)

© 2009 Ta with you Conferencia ProZ, Octubre 2009 4

Provocación

© 2009 Ta with you Conferencia ProZ, Octubre 2009 5

Pregunta

¿Cuántos quieren a la traducción automática?

¿Cuántos la odian?

Otras respuestas ...

© 2009 Ta with you Conferencia ProZ, Octubre 2009 6

Objetivos de la charla

Dar una perspectiva histórica de la TA

Explicar brevemente los sistemas más habituales

Generar discusión / ideas para mejorar

... aprender todos de todos ...

© 2009 Ta with you Conferencia ProZ, Octubre 2009 7

El problema esencial

Comprender el texto

(a veces también por causa del creador)

© 2009 Ta with you Conferencia ProZ, Octubre 2009 8

Con modestia

La traducción automática es complicada

Las máquinas no son personas

No es lucha persona contra máquina

Ayudarse y avanzar

Escuchemos a ...

© 2009 Ta with you Conferencia ProZ, Octubre 2009 9

Los inicios

Años 30: primeras patentes sistemas de reglas

1949: Informe de Warren Weaver

Años 50: Experimento Georgetown – IBM

Traducción 60 frases Ruso – Inglés

6 reglas + 250 unidades en vocabulario

En 5 años, problema resuelto ...

Reglas manuales + diccionarios bilingües

© 2009 Ta with you Conferencia ProZ, Octubre 2009 10

La realidad

Sistemas instalados

Objetivo: rapidez

Mejoras basadas en Chomsky

Lingüística generativa

Gramática transformacional

Pero las conclusiones es que nunca sería posible

Por la ambigüedad

Lo que lleva al ALPAC ...

© 2009 Ta with you Conferencia ProZ, Octubre 2009 11

Los años 60

Automatic Lang. Processing Advisory Committee

Creado en 1964, liderado por John R. Pierce

Informe en 1966

Conclusión básica

Investigar más en lingüística computacional

Dominios e idiomas limitados – herramientas

Consecuencia

Reducción de la inversión en TA

© 2009 Ta with you Conferencia ProZ, Octubre 2009 12

Un pequeño lapso

¡De sólo 10 años!

Con alguna excepción

1968: Systran para los EEUU y la UE

1970: Logos

1977: Méteo en Canada

Sistemas low cost

Para documentos técnicos y comerciales

Interlingua y transferencia

© 2009 Ta with you Conferencia ProZ, Octubre 2009 13

Finales de los 80 / principios de los 90

3 sistemas principales: Systran, Logos, Metal

Interés renovado por 3 motivos principales

Aumento de la capacidad computacional

Reducción del coste de hardware y software

Aparición de los modelos estadísticos (IBM)

Métodos basados en ejemplos

Principalmente en Japón

Proyecto de S2S: Verbmobil

© 2009 Ta with you Conferencia ProZ, Octubre 2009 14

Detalle proyecto Verbmobil

Traducción voz a voz en dominios controlados

8 años de investigación – década de los 90

86 millones de Euros invertidos

31 partners

Varias spin-offs lanzadas – casos de éxito

... pero Mariño os explicará más

© 2009 Ta with you Conferencia ProZ, Octubre 2009 15

¿Qué está pasando en 2009?

Plena efervescencia de sistemas

Reglas

Basados en ejemplos

Estadísticos

Basados en contexto

Alternativas: crowdsourcing

Importantes compañías involucradas

IBM, SAP, Google, Microsoft ...

© 2009 Ta with you Conferencia ProZ, Octubre 2009 16

Detalle de sistemas

Directa

Transferencia

Interlingua

Basados en ejemplos

En contexto

Estadísticos

© 2009 Ta with you Conferencia ProZ, Octubre 2009 17

Pregunta

¿Cuál es el objetivo de la traducción?

¿Cuál es el objetivo de la traducción automática?

© 2009 Ta with you Conferencia ProZ, Octubre 2009 18

El proceso es sencillo ...

Elegir las palabras adecuadas

Ordenarlas correctamente

Problemas

Gramática/sintaxis

Traducción literal

Terminología / palabras desconocidas

Adiciones / omisiones

Ortografía / puntuación / may. / min.

© 2009 Ta with you Conferencia ProZ, Octubre 2009 19

Traducción directa

De origen a destino

Mediante diccionarios y gramáticas

Proceso

Traducción palabra a palabra

Reglas de reordenación

Conclusión

Frases sin sentido

Puede ser útil en lenguaje controlado

© 2009 Ta with you Conferencia ProZ, Octubre 2009 20

Por transferencia (I)

Análisis morfológico

Categorización léxica

Transferencia léxica = traducción

Transferencia estructural

Generación morfológica

Exactitud cercana al 90% o superior ...

© 2009 Ta with you Conferencia ProZ, Octubre 2009 21

Por transferencia (II)

Fuente: Linguatec

© 2009 Ta with you Conferencia ProZ, Octubre 2009 22

Sistema basado en interlingua (I)

Análisis de los idiomas

Se crea una entidad común abstracta

Idioma pivote

A partir de ella, se genera la salida

Ventaja: No reglas uno a uno

Inconveniente: Creación interlingua (semántica)

DLT en Utrecht, Fujitsu ..

Antes METAL, Stanford ...

© 2009 Ta with you Conferencia ProZ, Octubre 2009 23

Sistema basado en interlingua (II)

Diccionarios, léxicos, reglas, gramáticas, ...

Sólo para lenguaje controlado o muy complicado

© 2009 Ta with you Conferencia ProZ, Octubre 2009 24

Traducción basada en ejemplos

Objetivo: obtener la traducción en base a previas

P.ej. memorias de traducción

Nació a mediados de los 80 en Japón

La clave

Combinación de segmentos

Técnicas optimizadas

Uso de patrones - reglas

© 2009 Ta with you Conferencia ProZ, Octubre 2009 25

Traducción basada en el contexto

Fuente: Meaningful Machines

© 2009 Ta with you Conferencia ProZ, Octubre 2009 26

Traducción estadística

Modelo más realista

Fuente: POSTECH, Intelligent Software Lab.

© 2009 Ta with you Conferencia ProZ, Octubre 2009 27

Más sobre la SMT

Ventajas

Rapidez de desarrollo de idiomas y dominios

Superioridad en aplicaciones acotadas

Alto volumen de texto multilingüe disponible

No necesita intervención lingüística

Inconvenientes

Metodología estadística

Cómo particularizar

© 2009 Ta with you Conferencia ProZ, Octubre 2009 28

Comparativa de métodos

tesaurusrepresentación

universal

otros

XXdatos

paralelos

Xanalizador

semántico

XXXparser

Xreglas de

transferencia

XXXdiccionarios

SMTEBMTInterlinguaTransferencia

© 2009 Ta with you Conferencia ProZ, Octubre 2009 29

¿Qué hacen bien las máquinas?

Ayudar al traductor

Corrección en dominios limitados

Amplitud de textos traducidos

Velocidad de traducción

Aprendizaje continuo

© 2009 Ta with you Conferencia ProZ, Octubre 2009 30

Pregunta

Dudas

Preguntas

Comentarios

¿Es útil combinar tecnología y lenguaje?

© 2009 Ta with you Conferencia ProZ, Octubre 2009 31

Y el futuro ...

Traducción clásica

Traducción automática

Traducción automática + postedición

Crowdsourcing

© 2009 Ta with you Conferencia ProZ, Octubre 2009 32

Retos de la traducción automática

Disponibilidad de corpus – lenguas minoritarias

Combinación sistemas estadísticos y por reglas

Unir de forma eficiente traductor y máquina

Evaluación de la calidad

© 2009 Ta with you Conferencia ProZ, Octubre 2009 33

Conclusiones

La TA es una herramienta útil para los traductores

Incremento productividad

Disminución costes y tiempos de entrega

También tiene inconvenientes

No sirve para todo

El futuro es híbrido y amplio

© 2009 Ta with you Conferencia ProZ, Octubre 2009 34

Crisis ... ¡pues innovemos!

© 2009 Ta with you Conferencia ProZ, Octubre 2009 35

¡ Gracias !

Diego Bartolomé, PhD

Director Ejecutivo, Ta with you

C/Ferrer de Blanes 25

08203 Sabadell

Tel. +34 937 11 29 96

Móvil +34 670 33 12 25

info@tauyou.com

top related