estudio de la sÍntesis de voz y su aplicaciÓn al software educativo autor: felipe fernández...

Post on 06-Feb-2015

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE

EDUCATIVO

Autor: Felipe Fernández DomínguezTutores: Miguel Ángel Laguna SerranoBruno González Baixauli

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Objetivos

Comprender el proceso de síntesis de voz desde un punto de vista teórico y los sintetizadores disponibles.

Estudio en profundidad de las interfaces animadas, centrándonos en Microsoft Agent.

Realización de una aplicación que sirva como introducción al mundo del PC para niños de educación primaria.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Software educativo

Diferentes enfoques dependiendo del alumno al que vaya dirigido

– Educación infantil: estimulación sensorial y conocimiento del entorno

– Educación primaria: basado en el desarrollo de capacidades como memoria, concentración, razonamiento lógico

– Educación especial: Proyecto Fressa

Proyecto Fressa

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Síntesis de voz

Visión teórica Alternativas disponibles

Visión teórica

Front-end– Toma como entrada un texto y produce una

representación lingüística fonética– Normalizacion de texto o preprocesado– Texto a fonema

Back-end– Toma como entrada la representación lingüística

y produce una forma de onda sintetizada

Síntesis de voz

Visión teórica Alternativas disponibles

Alternativas disponibles

Festival Flite FreeTTS MBROLA

Festival

El proyecto de Festival comenzó en 1994 en el centro de tecnologías del habla de la universidad de Edimburgo.

Festival esta diseñado para permitir añadir nuevos módulos, fácil y eficientemente, sin que el desarrollador tenga que recorrer camino ya andado

Flite

Flite fue diseñado como una alternativa a Festival que mejorara cuestiones claves para su uso en dispositivos móviles.

Mejor portabilidad, tamaño y velocidad, al estar escrito completamente en C(no en C++ o Scheme)

FreeTTS

Supera los problemas de Flite de dependencia con las plataformas y sus compiladores.

Reescrito totalmente en Java, mantiene la arquitectura de Flite.

MBROLA

El proyecto MBROLA tiene un sintetizador de voz basado en la concatenación de difonos.

Una de las bases de datos de difonos disponibles en español fue desarrollada por profesores de la UVA.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Interfaces de Usuario con personajes animados

– Los agentes animados con interfaces conversacionales proporcionan un paradigma intuitivo de interacción ya que el usuario no necesita adquirir nuevos conocimientos.

– Los usuarios encuentran estos sistemas más amigables y cooperativos.

Características de Microsoft Agent

Está disponible en la red para descargarlo gratuitamente y puede ser empleado por los desarrolladores en sus aplicaciones sin coste de derechos de autor.

Características de Microsoft Agent

La interfaz de programación de aplicación (API) de Microsoft Agent proporciona servicios de programación entre los que destacan: la habilidad de cargar un personaje, ejecutar una animación, hablar usando un sintetizador de voz y aceptar entrada de voz del usuario.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Desarrollo de la aplicación

Análisis del sistema. Definición del Análisis del sistema. Definición del problemaproblema

Diseño Implementación Pruebas

Resultados de las entrevistas

Los entrevistados fueron estudiantes de la facultad de Magisterio y monitores de ocio y tiempo libre.

Necesidad de una aplicación amena e intuitiva.

Diagrama general de casos de uso

Diagrama inicial de clases

Jugar cuento

Jugar imágenes

Desarrollo de la aplicación

Análisis del sistema. Definición del problema Diseño Diseño Implementación Pruebas

Diagrama de clases final

Jugar ingles

Demostración de gestos

Desarrollo de la aplicación

Análisis del sistema. Definición del problema Diseño Implementación Pruebas

Implementación

Entorno de desarrollo: Microsoft Visual Studio.Net

Lenguaje de programación:C# Paquete de servicios:Microsoft Agent 2.0

Microsoft Agent 2.0

Character.Show(null); Character.MoveTo(50,50,null); Character.Speak("Hola buenas tardes",null ); Character.Hide(5);

Desarrollo de la aplicación

Análisis del sistema. Definición del problema Diseño Implementación Pruebas

Pruebas

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Dificultades encontradas

Las opciones disponibles en síntesis de voz no son tantas.

Si encima añades idioma español,bajo Windows y libre las dificultades son mayores.

La portabilidad de sistemas desarrollados en Linux a Windows no es trivial.

Posibles mejoras

Reconocimiento del habla Desarrollo en aplicaciones web Introducción de nuevo elementos.

top related