informador parlante minuto a minuto

18

Upload: others

Post on 06-Jul-2022

18 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: INFORMADOR PARLANTE MINUTO A MINUTO
Page 2: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

2 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

Page 3: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

3 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

Page 4: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

4 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

Contenido

PARTICIPANTES ........................................................................................................................................ 5

OBJETIVOS .............................................................................................................................................. 11

PRESUPUESTO SOLICITADO ................................................................................................................... 12

METODOLOGÍA ...................................................................................................................................... 13

CALENDARIO .......................................................................................................................................... 15

VENTAJAS Y CONCLUSIONES .................................................................................................................. 15

IMPACTO ................................................................................................................................................ 16

FUENTES DE INFORMACIÓN .................................................................................................................. 17

Page 5: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

5 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

PARTICIPANTES

Líder del Proyecto

M.C. Rosa María Ortega Mendoza

Docentes

M.C.C. René Cruz Guerrero

M.C.C. Lauro Vargas Ruiz

Alumnos

YANIN GUADALUPE HERNÁNDEZ

Page 6: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

6 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

RESUMEN

La web se ha consolidado como una fuente valiosa de información, ya que podemos

encontrar textos digitales donde los usuarios expresan, en lenguaje natural, sus

sentimientos, conocimientos e intereses, entre otras cosas. Esta disponibilidad de

información ha motivado la creación de herramientas basadas en técnicas de

minería de texto para extraer información específica proveniente de la web.

Asimismo, se buscado que las herramientas brinden una interacción amigable con

el usuario. Precisamente, la interacción usando el habla ha ganado mucha

popularidad.

Por ello, el prototipo propuesto corresponde a una aplicación que define términos

especificados por el usuario e interactuando a través del habla. Básicamente, se

propone que el usuario ingrese una petición en habla y la herramienta consulte varias

definiciones en la web de diferentes sitios. Posteriormente, mediante técnicas de

minería de texto, recupere las definiciones más populares. Finalmente, la

herramienta devolverá la respuesta, también en habla.

Page 7: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

7 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

ESTADO DEL ARTE

Con el nacimiento de la computación y sobre todo del internet, han surgido varias

líneas de investigación y desarrollo para crear aplicaciones de computadora que

busquen interactuar con el usuario a través del habla. En este contexto, el prototipo

propuesto busca extraer información de la web, ya que ese encuentra actualizada y

a su vez, mostrarla al usuario en una forma de comunicación natural como el habla

o la visualización de imágenes.

Actualmente, existen unas herramientas conocidas como screen readers (lectores

de pantalla), los cuales transforman la información mostrada en la pantalla en formas

no visuales como el habla. Un ejemplo es el sistema llamado JAWS1, realizado por

la compañía Freedom Scientific de San Petersburg, Florida, Estados Unidos. Hoy en

día, ya existe una versión en español. Por otro lado, WebbIE [8] es un sistema

enfocado a interpretar el formato de una página web para que, posteriormente, un

lector de pantalla ofrezca la información de manera auditiva.

Estas herramientas buscan facilitar la interacción con el usuario pero se limitan a leer

contenidos. La herramienta propuesta, mina la información de la web para extraer

información específica para atender necesidades de los usuarios. En otras palabras,

se utilizan técnicas de minería de texto para procesar los contenidos fuente

provenientes de la web y de esta manera, atender peticiones de los usuarios tales

como definiciones o imágenes alusivas a término.

Page 8: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

8 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

La ventaja más importante de nuestra propuesta es el soporte de interacción por

medio del habla para obtener información específica del usuario a través de minar

contenidos web y no sólo leerlos.

Las tecnologías de voz cada vez son más importantes tanto en la informática

personal y como empresarial, principalmente, porque mejoran la interacción humana

con los ordenadores. Existen diversas aplicaciones dirigidas a usar síntesis y otras

que se complementan con el reconocimiento de voz [4]:

• Enciclopedias multimedia: Diseñadas para personas con algún tipo de

discapacidad, ya sea auditiva, motora o visual. Por ejemplo, el Diccionario

para Invidentes Larousse Electrónico DILE [2] es una enciclopedia

hipertextual, la información se suministra a través de la síntesis de voz.

• Aplicaciones usadas para personas con discapacidades visuales: Proyecto

CANAIMA [6] que es enfocado al aprendizaje de personas con distintas

discapacidades.

• Anotaciones parlantes: Como el Braille’n speack (Ministerio de Educación,

Cultura y Deporte). Es un aparato para personas con discapacidad visual con

funciones de lectura y escritura, la entrada de datos es mediante un teclado

en braile y la salida es por medio de una voz sintética.

• Guías de museos: como el robot realizado en el proyecto ROBINT [7]. Es un

robot autónomo concebido como elemento interactivo en un museo capaz de

realizar visitas guiadas usando el reconocimiento de voz para recibir

preguntas de los visitantes. A su vez, integra la síntesis de voz con emociones

que humanizan su intervención.

Por otro lado, existe un sistema similar al que se presenta en esta propuesta, el

proyecto fue realizado por la Universidad de Guayaquil en Ecuador [1]. Ese sistema

Page 9: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

9 Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

usa el reconocimiento y síntesis de voz, así como un diccionario de datos donde se

encuentra almacenada la información sobre temas específicos. Sin embargo, el uso

de un diccionario de datos local propicia que la búsqueda de la información sea

limitada, ya que sólo podremos encontrar resultados de los términos que se

encuentren en dicho diccionario. En contraste, la aplicación propuesta hace uso de

la web para obtener información específica de lo que busca un usuario. De esta

forma, se asegura que se obtendrán definiciones para casi cualquier término y sobre

todo, de cualquier dominio.

Page 10: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

0

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

JUSTIFICACIÓN

Actualmente, la información más actualizada que refleja las variaciones

generacionales del uso de las palabras, la encontramos en la web. En este contexto,

se propone en el desarrollo de una herramienta de software que automáticamente

extraiga definiciones para un término especificado por el usuario y que sean

provenientes de la web para que con ello, se refleje el contexto actual de la sociedad.

Asimismo, el software ofrecerá una interacción en habla constituyéndolo como una

herramienta de gran ayuda tanto para personas con discapacidad visual, como para

personas con poca disponibilidad de tiempo para estar frente a una computadora

leyendo la información en la web. Así también, podría ser usada por niños, evitando

que se expongan a consultar páginas con contenidos no adecuados.

Page 11: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

1

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

OBJETIVOS

A continuación se muestran los objetivos del prototipo de investigación

Objetivo general

Desarrollar una aplicación de escrito que recupere y lea definiciones para un término

especificado por el usuario mediante habla.

Objetivos particulares

• Realizar reconocimiento de voz para traducir una petición del usuario a texto

• Extraer definiciones provenientes de la web para un término especificado por el

usuario.

• Realizar síntesis de voz para traducir el resultado del procesamiento a habla.

Page 12: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

2

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

PRESUPUESTO SOLICITADO

Este prototipo recibirá financiamiento interno, requiriendo los siguientes recursos y

materiales:

• Una computadora con por lo menos 1GB de memoria,

• Licencia de Microsoft Visual Studio

• Una diadema con micrófono

• Bocinas usb

• Tarjeta de conexión inalámbrica

• Conexión a internet

con

Page 13: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

3

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

METODOLOGÍA

Las etapas de desarrollo se describen a continuación:

1. Análisis

Se analizarán principales tecnologías de síntesis y reconocimiento de voz para

seleccionar la más adecuada.

2. Diseño. Se diseñará una arquitectura que involucre:

a. Reconocimiento de voz. Se desarrollará un módulo que permita tomar

la definición que indique el usuario mediante el habla y la convierta en

texto para su posterior procesamiento.

b. Recuperación de información web. Se realizará un módulo que

recupere contenidos fuente que provengan de la web que contengan

posibles definiciones para el término indicado por el usuario.

c. Módulo de minería de texto para extraer las definiciones provenientes

de la web que correspondan al término indicado por el usuario. Se

analizarán los contenidos fuente de los diferentes sitios seleccionados

para establecer patrones que permitan minar el código con la finalidad

de extraer la definición deseada.

d. Síntesis de voz. Se implementará un módulo para traducir la

información obtenida a habla

e. Diseño de la interfaz. Se diseñará y desarrollará un interfaz de software

para interactuar con el usuario. Será una interfaz que integre todos los

módulos mencionados

Page 14: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

4

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

3. Programación. Se analizarán diversos lenguajes de programación según las

necesidades de los módulos planeados (java, C#, perl, etc) y se programarán

todos los módulos. A su vez, se realizará la programación correspondiente para

integrar todos los módulos en un solo sistema.

4. Pruebas del sistema. Se realizarán diversos casos de prueba para validar el

correcto funcionamiento del sistema.

Page 15: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

5

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

CALENDARIO

Las actividades necesarias para desarrollar el proyecto tienen una duración de

aproximadamente 1 año y 2 meses, desde abril 2015 hasta junio 2016. Dichas

actividades se muestran en la tabla 1.

Tabla 1. Calendario del proyecto

Actividad ENE MAR 2015

ABR JUN 2015

JUL SEP 2015

OCT DIC 2015

ENE MAR 2016

ABR JUN 2016

Análisis

Diseño

Reconocimiento de voz

Recuperación de información

Minería de texto

Síntesis de voz

Diseño de la interfaz

Programación

Pruebas

VENTAJAS Y CONCLUSIONES

• El sistema a construir será usado para encontrar definiciones de términos de

forma más rápida, fácil y sobre todo, interactiva mediante habla.

• Se atenderán peticiones del usuario mediante el lenguaje hablado. En

consecuencia, las aplicaciones derivadas de este proyecto pueden ser

Page 16: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

6

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

utilizadas por personas con alguna discapacidad visual incluso hasta

totalmente invidentes.

• La aplicación también puede ser usada académicamente por niños.

Básicamente, la búsqueda de una definición se facilita evitando que los

pequeños indaguen por la web visitando sitios con contenidos no adecuados.

• Se recuperará información proveniente de la web, la cual refleja la variación

del uso del lenguaje. Por lo tanto, las herramientas creadas tendrán una

amplia vida útil.

IMPACTO

Académicamente, el prototipo permitirá el desarrollo de una tesis de licenciatura.

A continuación, se presenta una lista de los posibles usos del prototipo que reflejan el

impacto del mismo

• Uso por personas con discapacidad visual

• Uso por niños delimitando su navegación en internet

• Uso por cualquier persona para facilitar búsquedas en diccionarios

Page 17: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

7

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

FUENTES DE INFORMACIÓN

1. Alarcón Acosta, D.P. (2016). Sistema que simule conocimiento humano con

voz "SEUZ". Manual Técnico. http://repositorio.cisc.ug.edu.ec/handle/123/71

2. Alonso A. F., Jiménez, A., Fuentes Castro, J., Martínez, L., & Montes Gracia,

C. (1996). El Diccionario para Invidentes Larousse Electrónico (DILE): una

aplicación de la enciclopedia parlante hipertextual (EPA). Integración. Revista

sobre ceguera y deficiencia visual, 47-60

3. Eíto Brun, R. y Senso, J. A. (2004). Minería textual. El profesional de la

información, 2004, v. 13, n. 1, 11-27

4. Fernández R., E. (1999). Tecnologías del habla y síntesis de voz en gallego.

Volumen Monográfico, 103-116. Obtenido de

https://dialnet.unirioja.es/descarga/articulo/227027.pdf

5. Hailpern, J. et al. (2009). Web 2.0: blind to an accessible new world.

Proceedings of the 18th international Conference on World Wide Web New

York, NY.

6. González, M. (2014). La CANAIMA educativa una herramienta tecnológica de

enseñanza en educación primaria bolivariana. Revista Electrónica Campus

Virtual de la Universidad Fermín Toro, 40-73.

Page 18: INFORMADOR PARLANTE MINUTO A MINUTO

Prototipo: Sistema lector de definiciones en español provenientes de la web

interactuando con voz

1

8

Ingeniería en Sistemas Computacionales

Aplicación e Investigación en Tecnologías de Cómputo

7. Lucas Cuesta, J., Alcázar, R., Montero, J., Fernández, F., Barra-Chicote, R.,

D'Haro, L., Pardo Muñoz, J. (2008). Desarrollo de un Robot-Guía con

Integración de un Sistema de Diálogo y Expresión de Emociones: Proyecto

ROBINT. Procesamiento del Lenguaje Natural, Revista nº 40, 51-58.

8. King, A. et al. (2004).Web Browser for Visually Impaired People. Cam-bridge

Workshop on Universal Access and Assistive Technology (CWUAAT),

Cambridge, UK