2009 proz conference barcelona: overview of machine translation

35
www.tauyou.com [email protected] Enjoy the world! Communication is not a problem anymore Human quality machine translation solutions © 2009 Ta with you Conferencia ProZ Octubre 2009

Upload: tauyou

Post on 18-May-2015

122 views

Category:

Technology


0 download

DESCRIPTION

Presentation by Diego Bartolome, tauyou language technology CEO at the annual conference. It presents an overview of machine translation for freelance translators.

TRANSCRIPT

Page 1: 2009 ProZ Conference Barcelona: Overview of Machine Translation

www.tauyou.com

[email protected]

Enjoy the world!

Communication is not a problem anymore

Human quality machine translation solutions© 2009 Ta with you

Conferencia ProZ

Octubre 2009

Page 2: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 2

Introducción

¿De dónde vengo?

¿Dónde estoy?

¿Adónde voy?

Page 3: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 3

¿Para qué traducción automática?

Usuario final

Información web

Cliente corporativo

Documentación corporativa interna

Traductores

Herramienta de productividad (?)

Page 4: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 4

Provocación

Page 5: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 5

Pregunta

¿Cuántos quieren a la traducción automática?

¿Cuántos la odian?

Otras respuestas ...

Page 6: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 6

Objetivos de la charla

Dar una perspectiva histórica de la TA

Explicar brevemente los sistemas más habituales

Generar discusión / ideas para mejorar

... aprender todos de todos ...

Page 7: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 7

El problema esencial

Comprender el texto

(a veces también por causa del creador)

Page 8: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 8

Con modestia

La traducción automática es complicada

Las máquinas no son personas

No es lucha persona contra máquina

Ayudarse y avanzar

Escuchemos a ...

Page 9: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 9

Los inicios

Años 30: primeras patentes sistemas de reglas

1949: Informe de Warren Weaver

Años 50: Experimento Georgetown – IBM

Traducción 60 frases Ruso – Inglés

6 reglas + 250 unidades en vocabulario

En 5 años, problema resuelto ...

Reglas manuales + diccionarios bilingües

Page 10: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 10

La realidad

Sistemas instalados

Objetivo: rapidez

Mejoras basadas en Chomsky

Lingüística generativa

Gramática transformacional

Pero las conclusiones es que nunca sería posible

Por la ambigüedad

Lo que lleva al ALPAC ...

Page 11: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 11

Los años 60

Automatic Lang. Processing Advisory Committee

Creado en 1964, liderado por John R. Pierce

Informe en 1966

Conclusión básica

Investigar más en lingüística computacional

Dominios e idiomas limitados – herramientas

Consecuencia

Reducción de la inversión en TA

Page 12: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 12

Un pequeño lapso

¡De sólo 10 años!

Con alguna excepción

1968: Systran para los EEUU y la UE

1970: Logos

1977: Méteo en Canada

Sistemas low cost

Para documentos técnicos y comerciales

Interlingua y transferencia

Page 13: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 13

Finales de los 80 / principios de los 90

3 sistemas principales: Systran, Logos, Metal

Interés renovado por 3 motivos principales

Aumento de la capacidad computacional

Reducción del coste de hardware y software

Aparición de los modelos estadísticos (IBM)

Métodos basados en ejemplos

Principalmente en Japón

Proyecto de S2S: Verbmobil

Page 14: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 14

Detalle proyecto Verbmobil

Traducción voz a voz en dominios controlados

8 años de investigación – década de los 90

86 millones de Euros invertidos

31 partners

Varias spin-offs lanzadas – casos de éxito

... pero Mariño os explicará más

Page 15: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 15

¿Qué está pasando en 2009?

Plena efervescencia de sistemas

Reglas

Basados en ejemplos

Estadísticos

Basados en contexto

Alternativas: crowdsourcing

Importantes compañías involucradas

IBM, SAP, Google, Microsoft ...

Page 16: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 16

Detalle de sistemas

Directa

Transferencia

Interlingua

Basados en ejemplos

En contexto

Estadísticos

Page 17: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 17

Pregunta

¿Cuál es el objetivo de la traducción?

¿Cuál es el objetivo de la traducción automática?

Page 18: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 18

El proceso es sencillo ...

Elegir las palabras adecuadas

Ordenarlas correctamente

Problemas

Gramática/sintaxis

Traducción literal

Terminología / palabras desconocidas

Adiciones / omisiones

Ortografía / puntuación / may. / min.

Page 19: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 19

Traducción directa

De origen a destino

Mediante diccionarios y gramáticas

Proceso

Traducción palabra a palabra

Reglas de reordenación

Conclusión

Frases sin sentido

Puede ser útil en lenguaje controlado

Page 20: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 20

Por transferencia (I)

Análisis morfológico

Categorización léxica

Transferencia léxica = traducción

Transferencia estructural

Generación morfológica

Exactitud cercana al 90% o superior ...

Page 21: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 21

Por transferencia (II)

Fuente: Linguatec

Page 22: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 22

Sistema basado en interlingua (I)

Análisis de los idiomas

Se crea una entidad común abstracta

Idioma pivote

A partir de ella, se genera la salida

Ventaja: No reglas uno a uno

Inconveniente: Creación interlingua (semántica)

DLT en Utrecht, Fujitsu ..

Antes METAL, Stanford ...

Page 23: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 23

Sistema basado en interlingua (II)

Diccionarios, léxicos, reglas, gramáticas, ...

Sólo para lenguaje controlado o muy complicado

Page 24: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 24

Traducción basada en ejemplos

Objetivo: obtener la traducción en base a previas

P.ej. memorias de traducción

Nació a mediados de los 80 en Japón

La clave

Combinación de segmentos

Técnicas optimizadas

Uso de patrones - reglas

Page 25: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 25

Traducción basada en el contexto

Fuente: Meaningful Machines

Page 26: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 26

Traducción estadística

Modelo más realista

Fuente: POSTECH, Intelligent Software Lab.

Page 27: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 27

Más sobre la SMT

Ventajas

Rapidez de desarrollo de idiomas y dominios

Superioridad en aplicaciones acotadas

Alto volumen de texto multilingüe disponible

No necesita intervención lingüística

Inconvenientes

Metodología estadística

Cómo particularizar

Page 28: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 28

Comparativa de métodos

tesaurusrepresentación

universal

otros

XXdatos

paralelos

Xanalizador

semántico

XXXparser

Xreglas de

transferencia

XXXdiccionarios

SMTEBMTInterlinguaTransferencia

Page 29: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 29

¿Qué hacen bien las máquinas?

Ayudar al traductor

Corrección en dominios limitados

Amplitud de textos traducidos

Velocidad de traducción

Aprendizaje continuo

Page 30: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 30

Pregunta

Dudas

Preguntas

Comentarios

¿Es útil combinar tecnología y lenguaje?

Page 31: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 31

Y el futuro ...

Traducción clásica

Traducción automática

Traducción automática + postedición

Crowdsourcing

Page 32: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 32

Retos de la traducción automática

Disponibilidad de corpus – lenguas minoritarias

Combinación sistemas estadísticos y por reglas

Unir de forma eficiente traductor y máquina

Evaluación de la calidad

Page 33: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 33

Conclusiones

La TA es una herramienta útil para los traductores

Incremento productividad

Disminución costes y tiempos de entrega

También tiene inconvenientes

No sirve para todo

El futuro es híbrido y amplio

Page 34: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 34

Crisis ... ¡pues innovemos!

Page 35: 2009 ProZ Conference Barcelona: Overview of Machine Translation

© 2009 Ta with you Conferencia ProZ, Octubre 2009 35

¡ Gracias !

Diego Bartolomé, PhD

Director Ejecutivo, Ta with you

C/Ferrer de Blanes 25

08203 Sabadell

Tel. +34 937 11 29 96

Móvil +34 670 33 12 25

[email protected]