la comunicaci ón desde 1882
TRANSCRIPT
La comunicación desde 1882
14 de junio de 2007
La Voz de Galicia Lavozdegalicia.es
Diario de LeónDiariodeleon.es
ADN-Galicia
Radio Voz
Voz AudiovisualTDT Galicia
La Corporación Voz
Datos económicos 2005
Ranking España
Sobre lectores prensa en España, en Galicia 12% 8
Lectores de La Voz de Galicia 590.000 6
Venta ejemplares 104.000 8
Facturación 78.000.000 € 6
Facturación a p.c. 90,5% 83,8%
EBITDA 13.000.000 € 5
Clientes 36.400
Suscriptores 20.000 4
Empleados 604 4
Nuestro negocio es la comunicación:
recoger, elaborar y distribuir
información...
Por eso invertimos en …
...RRHH para recoger y elaborar la información...
§ 21 centros de trabajo§ 300 Periodistas§ 25 Fotógrafos § 36 Diseñadores gráficos§ 80 Comerciales§ 32 Sistemas de Información
§ Además§ 12 Corresponsales Galicia§ 6 Corresponsales extranjeros
… Sistemas de impresión y empaquetado...
§ Imprimimos:
§ 10 millones de páginas§ Para 120.000 ejemplares.§ En 14 ediciones personalizadas
con 20 páginas diferentes § Y utilizamos:§ 200 m2 de aluminio§ 400 kilos de tinta
§ 40.000 kilos de papel que, en línea, equivalen a 2.200 km.
§ Procesamos§ 9 ejemplares/segundo para
realizar 7.200 paquetes y 15.000 embolsados
… en distribución... sobre papel
§ Cargamos cada día:
§ 90 camiones de 0.30 a 4.00
§ Para que recorran:§ 17.000 km.§ En 90 rutas§ Antes de las 6.00 a.m.
§ Y lleguen a:§ 4.260 puntos de venta§ 685.000 lectores
…y sobre medios electrónicos...
§ Cada día...
§ Recibimos 75.000 visitas a las que entregamos 580.000 páginas
§ Crecimiento en usuarios únicos al mes (OJD):
2004/mayo: 282.5822005/mayo: 351.215(+24%)2006/mayo: 534.917(+52%)
... y en las TIC que nos ayudan a realizar estos procesos...
§ Cada día: § Vemos 3.000 fotografías§ De las cuales 900 proceden de
nuestros fotoperiodistas.§ Seleccionamos 700.
§ Leemos 4.000 piezas de texto§ Seleccionamos 1.200§ 1.000 provienen de nuestros
periodistas
§ Procesamos 930 órdenes publicitarias
§ Enviamos a planchas: 450 páginas diferentes
§Intercambiamos:
§35.000 minutos de conversación telefónica
§116 GB de información editorial
Sistemas de Información
La producción editorial
“El hombre razonable se adapta al mundo que le rodea; el irrazonable intenta adaptar el mundo a si mismo. Así pues, el progreso depende del hombre irrazonable”
George Bernard Shaw
Financiero
Control de Gestión
RR. HH. TIC
Proveedores
Puntos Venta
Agencias Noticias
Colaboradores
Redacción
Materias Primas. planchas. tinta. papel
Distribución
PublicidadCentrales
Agencias
Producción IndustrialSuscriptores
Public. Web Internet
Anunciantes
ClientesProcesos de un diario impreso
Traductor
ØEl proyecto de traducción automática Castellano Gallego en la web de La Voz de Galicia
1. Requerimientos iniciales.2. Análisis de traductores3. Traductor automático. Nuevos requerimientos.4. Integración y adaptación. 5. Puesta en producción.6. Optimización.7. Revisiones.
El traductor de La Voz de Galicia Fases del proyecto
1. Requerimientos iniciales
Ø Añadir al sistema editorial correctores ortográficos gallego y español edición impresa
Ø Versión en gallego edición electrónica y artículos y suplementos de la impresa.
Ø Utilización de la herramienta como traductor de documentos. (contratos)
.
2. Análisis de traductores
Ø2004-05 Traductores basados en análisis sintáctico
Ø2005-06 Opentrad§ Mejor velocidad de respuesta§ Análisis morfológico§ Mayor porcentaje de error§ Capacidad para ‘intervenir’ en la herramienta§ Adaptable al libro de estilo de La Voz de Galicia§ Integración con diccionarios Corrector
ortográfico
3. Nuevos requerimientos
Ø Traducción automática página webØ Corrección online
es ga
Navegación URL
Volcado de texto
Subir documento
Traductor online
Funcionalidad a modificar
•Entrenar•Listados exclusión•Particularidades HTML•Busca y reemplaza
4. Integración
Opentrades ga
D1 D2 D3
XESDIC
Traductor de La Voz
•D1 monolingüe gallego•D2 bilingüe es-ga•D3 monolingüe español
4. Integración. Cronología
1. Instalación motor base de OpenTrad sin personalizar.2. Entrega diccionarios con 25.000 lemas. Versión
definitiva de diccionarios monolingües y bilingües del VozOpenTrad.
3.Definición y diseño del gestor de diccionarios (XESDIC)4.Creación sistema de detección de Nombres propios.5.Adaptación del sistema de traducción automático
personalizado a la publicación HTML de la edición digital de La Voz de Galicia (SEDVOZ).
6. Entrega de los desarrollos beta de la aplicación de administración de los diccionarios XESDIC.
7. Implantación final del sistema XESDIC. 8. Formación de los lingüístas de la Voz para el
mantenimiento de los diccionarios.
Diseño sistema
•Etiquetas HTML•Códigos propios
Listados nombres propiosListados topónimosMultiexpresiones
Busca y reemplaza
Diseño sistema. Dificultades
•Primera experiencia de dificultades en la implantación en un dominio tan variable como el periodístico.•Problemas en la auditoría web: heterogeneidad de los sistemas web dentro de la VOZ.•Adaptación al manual de estilo de la VOZ en las eleccionesnormativas.•Carga de datos•Dificultad en la programación del motor de traducción y del gestor de diccionarios (XESDIC).•Errores lingüísticas en la versión inicial de los diccionarios•Indefinición terminológica y normativa por parte del cliente (el libro de estilo estaba sin actualizar a la nueva normativa yel nuevo estaba en proceso de elaboración).•Demasiada carga de trabajo en otros asuntos para los lingüistas que tardaban en responder y falta de planificación antes de iniciar el proceso de personalización.
4. Integración
XESDIC
XESDIC
XESDIC
Lista de nombres
Busca y reemplaza
5. Puesta en producción.
Ø Complejidad webØ Demasiada carga de usuarios onlineØ Fallos inesperadosØ ‘Entender’ la traducción automática
Abono mensual Fertilizante mensualLa revista The Times A revista The EstafesPilar del Castillo Alicerce do Castelo<traducción del texto en gallego>Peces Barba Peixes Barba“í” en lenguaje HTMLShakira comienza la gira comenza a viraa
6. Optimización
§ ‘Pasar’ a C lo hecho en Perl§ Disminuir las listas§ Reducir el busca y reemplaza
Revisión diaria de los listados y adaptación de los procesos
7. Revisiones
ØEvolución de Opentrad§ 0.9 (pruebas iniciales)§ 1.0.1 (productivo)§ 1.0.3 (evaluando para
productivo)
Arquitectura