modelando los hábitos de consumo televisivo usando tecnología semántica mauricio espinoza-mejía,...

38
Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía , Víctor Saquicela Departamento de Ciencias de la Computación Grupo de Investigación en Gestión del Conocimiento Universidad de Cuenca, Ecuador IX Congreso de Ciencia y Tecnología ESPE 2014, 28 -30 Mayo, 2014

Upload: nilda-gonzalez

Post on 28-Jan-2016

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Modelando los Hábitos de Consumo Televisivo

usando Tecnología Semántica

Mauricio Espinoza-Mejía, Víctor Saquicela

Departamento de Ciencias de la ComputaciónGrupo de Investigación en Gestión del Conocimiento

Universidad de Cuenca, Ecuador

IX Congreso de Ciencia y Tecnología ESPE 2014, 28 -30 Mayo, 2014

Page 2: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

2

Contenido

• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro

Page 3: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

3

Motivación

• Migración de la TV analógica a digital• Más canales en el mismo ancho de

banda.• Aplicaciones mezcladas con contenido

audiovisual.

Sobrecarga de información

“exceso de información sobre un tema genera dificultades para comprenderlo”

Ejemplo: Web

Page 4: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

4

Motivación

• Meta: Sistemas de recomendación

• facilite la selección de contenidos• provea interfaces fáciles de usar

• Sistemas de recomendación para TV• técnicas de minería de datos• basados en contenidos• filtrado colaborativo• técnicas de la Web semántica, etc.

Page 5: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

5

Motivación

• Dificultades de las propuestas • recomendaciones limitadas

• requiere información histórica

• recomendaciones se basan en las elecciones pasadas

• dependen exclusivamente de los recursos disponibles a priori

Page 6: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

6

Contenido

• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro

Page 7: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

7

Contribución de nuestra propuesta

• Uso de tecnología semántica para razonar:

• Programación TV• Preferencias Usuarios

• Ontologías dominio creadas a propósito o descubiertas en línea

• Recursos externos• redes sociales• bases de datos de películas• repositorios de guías de programación• SPARQL endpoints

Page 8: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Contribución de nuestra propuesta

8

Víctor Saquicela, Mauricio Espinoza-Mejía, Jezreel Mejía,Boris Villazón-Terrazas, Reduciendo la Sobrecarga de Información en Usuarios de Televisión Digital, ENC 2013, Workshop on Semantic Web and Linked Open Data,

México, octubre 2013

Page 9: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

9

Contenido

• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro

Page 10: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Qué es una ontología?

10

commonly accepted understanding

conceptual model of a domain

(ontological theory)

unambiguous terminology definitions

machine-readability with computational

semantics

[Gruber93]

Formal, explicit specification of a shared conceptualization

[Gruber93]

Page 11: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Estructura de una Ontología

Conceptos Entidad conceptual del dominio

Atributos Propiedad de un concepto

Relaciones Relaciones entre conceptos o propiedades

Axiomasdescripción coherente entre Conceptos / Propiedades / Relaciones través de expresiones lógicas

11

Person

Student Professor

Lecture

isA – hierarchy (taxonomy)

name email

studentnr.

researchfield

topiclecture

nr.

attends holds

holds(Professor, Lecture) Lecture.topic Professor.researchField

Page 12: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

12

Contenido

• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro

Page 13: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Retos de la Modelación Semántica: Preferencias Usuarios

Tres aspectos:

• la identificación de los datos a ser modelados y su formato de representación,

• la determinación de las fuentes de información más apropiadas para la extracción de las preferencias

• el uso adecuado de este conocimiento para filtrar la información más relevante para el usuario.

13

Page 14: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Modelación del Perfil del Usuario

Dos desafíos principales• la necesidad de conocimiento predefinido del dominio

• correspondencias entre la descripción del contenido y la información semántica en la ontología

14

Qué peliculas ha visto?Qué observa los fines de semana?

Qué edad tiene?Cuáles son su habilidades?

…..

Cuáles con sus intereses?Qué edad tiene?

Cuáles son su habilidades?…..

Page 15: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

15

Contenido

• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro

Page 16: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: IS

• Uno de los procesos clave en el desarrollo de software es la especificación del software• Entender y definir las funcionalidades de un producto de software

• Documento de especificación de requisitos• acuerdo entre los clientes y proveedores sobre lo que el

software va a hacer

• reducción del esfuerzo de desarrollo

• base para estimación de costos y cronogramas

• línea de base para la validación y verificación.

16

Page 17: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: Estado del Arte

• Estado del arte en ingeniería ontológica • Mayoría metodologías proponen una fase de especificación de

requisitos.• METHONTOLOGY• On-To-Knowledge• Grüninger and Fox’s methodology

» No proveen guías detalladas sobre qué realizar en cada paso

» Qué es necesario para un buen documento de espeficicacion de requisitos

• Neon Methodology• Filling card: definición, meta, entrada, salida, cuándo y quién • Workflow: entradas, salidas, actores• ORSD

17

Page 18: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: NeOn Methdology

18

Page 19: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: Secciones 1-3 del ORSD

• Posibles usuarios y expertos del dominio

• Lluvia de ideas miembros del equipo de trabajo.

19

Page 20: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: Secciones 4-5 del ORSD

• Entrevistas con los posibles usuarios y expertos del dominio.

• Los casos de uso identificados para el desarrollo del sistema de recomendación.

20

Page 21: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: Sección 6 del ORSD

• futuros usuarios del sistema de recomendación y no expertos del dominio

• técnica de preguntas de competencia• preguntas en

lenguaje natural que la ontología debe ser capaz de responder

21

Page 22: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: Sección 7 del ORSD

Pre-glosario de términos • términos extraídos de las preguntas de competencia

• términos de las respuestas a las preguntas

• términos identificados como nombres de entidades (objetos)

• Técnicas heurísticas de extracción de terminología• nombres, adjetivos y verbos

• conceptos, atributos, relaciones o instancias (en el caso de nombres de entidades).

22

Page 23: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Especificación de Requisitos: Sección 7 del ORSD

Metodología• usar los términos con la frecuencia más

alta• dirigir la búsqueda de recursos

existentes

Categorías• Información del Televidente

• información básica del usuario • información profesional• características propias del usuario• habilidades

• Tópicos de Preferencias• diferentes dominios

• Intereses• rock, videojuegos

• Actividades• Interacción televidente

• Tiempo y Lugares• contexto espacio-temporal

23

Page 24: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

24

Contenido

• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro

Page 25: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Modelamiento del Perfil de Usuario

No se puede hablar de una ontología estándar

Las ontologías son específicas a la aplicación

Proceso de Construcción de la Ontología• Top-Down

• independientes del dominio (usando ontologías de alto nivel)• ser reutilizables en múltiples sistemas

• Neon Methodology: escenario seis - reusando, fusionando y ejecutando reingeniería de recursos ontológicos

• Premisa: desarrolladores tienen recursos ontológicos a reusar • Los recursos son fusionados para crear un nuevo modelo• La fusión no es suficiente, proceso de reingenería es requerido

25

Page 26: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Modelamiento del Perfil de Usuario: Escenario Seis

• Búsqueda de Ontologías

• Comparación de las Ontologías

• Selección de las Ontologías

• Personalización e Integración de las Ontologías Seleccionadas

• Evaluación de la Ontología Resultante

26

Page 27: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Búsqueda de Ontologías

• Búsqueda de Ontologías• ontologías que reunan los requisitos del ORSD

• Watson (http://watson.kmi.open.ac.uk/)

• Swoogle (http://swoogle.umbc.edu/)

• Sindice (http://sindice.com/)

• librerías de ontologías• Protégé Ontology Library

(http://protegewiki.stanford.edu/wiki/Protege Ontology Library)

• estándares que definan tipos de competencia e intereses de un usuario en sitios Web de alta fiabilidad.

27

Page 28: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Búsqueda de Ontologías

28

Page 29: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Comparación de las ontologías

• Ontologías no apropiadas a ser reutilizadas• Comprobar el alcance y propósito establecido en el ORSD• Los requisitos no funcionales estén cubiertos• Los requisitos funcionales en forma de preguntas de competencia

incluidos en ORSD son cubiertas (total o parcialmente)

• Heurísitica• Si el desarrollador contestó No a los criterios

• “Alcance similar” y/o “Propósito similar” y/o “Requerimientos Funcionales cubiertos”

• Ontología considerada no útil

29

Page 30: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Selección de las ontologías

Analizaron cuatro dimensiones

• Costo de Reutilización.• Esfuerzo de Comprensión. • Esfuerzo de Integración. • Confiabilidad.

cada una de las dimensiones tiene un conjunto de criterios que permiten obtener un puntaje para cada ontología

candidata

30

Page 31: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Selección de las ontologías

Los pesos • definidos por el equipo de

trabajo• símbolos (+) y (-) criterio se

cuenta de manera positiva o negativa

31

Page 32: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Personalización e Integración de las Ontologías

• Algunas actividades fueron ejecutadas en los recursos ontológicos seleccionados

• Podar las ontologías de acuerdo a las necesidades• GUMO personality

• Enriquecer la ontología a ser reusada• Agregar conceptos

• Adaptar las ontologías seleccionadas• convenciones de nombrado de términos

• Incluir conexiones a través de relaciones entre clases• ontología sobre la información básica de la persona con

la ontología que describe la localidad de residencia del usuario se usó la propiedad viveEn (liveIn).

32

Page 33: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Evaluación de la Ontología

• Comprobar la calidad técnica de la ontología construída.

• Únicamente se ha comprobado que la ontología no contenga errores de sintaxis.

• Trabajo en ejecución la evaluación de posibles errores de • diseño, • estructura y • calidad semántica.• localización de la ontología

• LabelTranslator Neon Toolkit

33

Page 34: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Retos de la Modelación Semántica: Preferencias Usuarios

Tres aspectos:

• la identificación de los datos a ser modelados y su formato de representación,

• la determinación de las fuentes de información más apropiadas para la extracción de las preferencias

• el uso adecuado de este conocimiento para filtrar la información más relevante para el usuario.

34

Page 35: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Captura del Perfil

• la determinación de las fuentes de información más apropiadas para la extracción de las preferencias

• implícitos • seguimiento del comportamiento del usuario -interacción

con el televisor• captura de las anotaciones efectuadas en redes sociales

• explícitos• aplicación Web

35

Page 36: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Uso del Perfil

• el uso adecuado de este conocimiento para filtrar la información más relevante para el usuario.

Base de Conocimiento• Mauricio; gusta; Adam Sandler• Mauricio; ha_visto; ‘Una esposa de mentira‘• ‘Una esposa de mentira‘; dirigida_por; Dennis Dugan

Recomendador• Mauricio se_recomienda_ver “Jack y Jill” dirigida_por

Dennis Dugan y protagonizada_por Adam Sandler.

Resultado • presentado al usuario mediante una aplicación

interactiva que haga uso del canal de retorno

36

Page 37: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Conclusiones y Trabajos Futuros

• Tecnologías Web Semántica pueden ser usados en el contexto de TV.

• Ontologías son útiles para compartir y reutilizar conocimiento.

• Disminuir el arranque en frío del sistema de recomendación• mediante inferencia

• Enriquecer la experiencia del usuario

• ofreciendo información adicional del tema tratado

• Localizar Ontología Labeltranslator NeOnToolkit

• Medir la usabilidad y la calidad de la modelación

• Usar la Web social como fuente de información para capturar el perfil de un usuario

37

Page 38: Modelando los Hábitos de Consumo Televisivo usando Tecnología Semántica Mauricio Espinoza-Mejía, Víctor Saquicela Departamento de Ciencias de la Computación

Gracias por su atención

Mauricio Espinoza Mejía

[email protected]

Universidad de Cuenca

Cuenca, Ecuador

38