pucp - análisis de los resultados del proceso de ...¡ctica-pucp-expuesta-2014.pdf · etl diseño...

12
PUCP – Buena práctica: Uso de una base de datos robusta que ayuda en la toma de decisiones (Data Warehouse), como fuente principal del Sistema de apoyo a la gestión (SAG) y de estudios estadísticos requeridos por la PUCP 3ra reunión técnica - CINDA Barcelona – España – Octubre 2014

Upload: vominh

Post on 03-Jul-2018

219 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

PUCP – Buena práctica:Uso de una base de datos robusta

que ayuda en la toma de decisiones (Data Warehouse), como fuente

principal del Sistema de apoyo a la gestión (SAG) y de estudios

estadísticos requeridos por la PUCP

3ra reunión técnica - CINDA

Barcelona – España – Octubre 2014

Page 2: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Año de inicio de la Buena Práctica: 2003

• 2003-2004: Piloto de Indicadores de calidad, herramientas disponibles gratuitas.

• 2004: Diseño de primer alcance del Data Warehouse (DWH), obtención de respaldo de autoridades, selección y adquisición de herramientas a usarse en el desarrollo.

• 2005: Puesta en producción inicial del SAG-PUCP: indicadores de calidad de las carreras de pregrado así como información de graduados y titulados.

• 2006-2007: alumnos, postulantes, ingresantes a una unidad, egresados, docentes, cursos y notas.

• 2008: Ingresantes a una especialidad; Dashboard de un alumno.• 2010: Estadísticas de Colegios; Dashboards para Facultades y Departamentos

académicos.• 2014: Encuestas de Egresados, Dashboards a nivel Universidad de acceso

directo a través del campus virtual, incorporación de informes de tipo “Self-BI”, incorporación de informes para dispositivos móviles

Page 3: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Metodología:

• Definición de la infraestructura y las herramientas de desarrollo.

• Definición de requerimientos• Diseño dimensional y análisis de fuentes de datos.• Diseño físico e implementación de base de datos.

Desarrollo e implementación de los procesos de extracción, transformación y carga de datos (ETLs).

• Análisis, diseño y desarrollo de aplicaciones para la explotación de la base de datos.

• Implementación, mantenimiento y crecimiento.

Page 4: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Recursos humanos, técnicos y materiales involucrados en la Buena Práctica

Personal capacitado en diseño de DWH, técnicas BI y estadística.Personal con conocimiento de la institución (know-how durante proceso de autoevaluación e indicadores de calidad)Software:

Manejador de Base de DatosHerramienta para facilitar el poblamiento de la nueva base de datos (Herramienta ETL)Herramienta de Desarrollo de Aplicaciones de Usuario Final

Hardware:Servidor para la Base de DatosServidor de AplicacionesServidor para la Herramienta ETL

Page 5: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Replicabilidad de la Buena Práctica

• La metodología es replicable en cualquier otra universidad.

• Se debe contar con el respaldo de las altas autoridades y con un equipo que domine el know-how de la institución.

• Contar con una sólida base de datos transaccional que guarde información histórica.

• Hacer una buena limpieza de los datos y que la información que se muestre sea confiable. No solo por las decisiones que se pueden tomar a partir de ellos sino porque de eso dependerá la confianza que genere y el uso que se le dé.

Page 6: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Originalidad

Es original porque que cuando se puso en marcha no habíamos visto en ninguna otra universidad el uso de metodologías propias del ámbito empresarial (BI).

Hemos hecho diversas presentaciones a nivel nacional e internacional del SAG-PUCP

Page 7: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Generación de valor

• Provee información a todas las autoridades académicas y analistas de la información en la universidad.

• Colegios: Información de indicadores de calidad de sus egresados en la universidad.

• Alumnos: Seguimiento de su desempeño ciclo a ciclo.

• Docentes: Seguimiento de su desempeño ciclo a ciclo.

• Institucional: Plataforma para poder hacer un seguimiento de los principales indicadores de la institución para efectos de evaluación, acreditación y comparación. Por ejemplo, indicadores de calidad de la docencia (proyecto CINDA).

Page 8: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Etapas y productos de un proyecto de BIEtapa Productos

Análisis del requerimiento institucional Objetivos en términos de BI

Poblaciones a estudiar (Unidades de observación)

Relación preliminar de indicadores y dimensiones a estudiar

Relación preliminar de informes, aplicaciones o técnicas a usar

Exploración de fuentes de datos disponibles Descripción y modelos de datos disponibles (de bases de datos

transaccionales, de encuestas, etc.)

Informe de diagnóstico de calidad de los datos disponibles

ETL Diseño Modelos de datos a generar (DW, DM u otra base con los

indicadores y dimensiones en estructura apropiada para

procesamiento analítico)

Especificaciones para ETC

Desarrollo Programas o jobs ETC

Puesta en producción Manuales de uso

Ejecución Base de datos a ser usada en el procesamiento analítico

Procesamiento

analítico

Diseño Prototipos de informes y aplicaciones o Relación de técnicas a

usar

Desarrollo Programas o aplicaciones de procesamiento analítico

Puesta en producción Manuales de uso

Ejecución

(a cargo de personal BI

especializado o del

usuario)

Resultados del procesamiento analítico

Análisis de resultados Informe con Conclusiones y Recomendaciones (a cargo de

personal BI especializado o del usuario)

Decisiones (a cargo del usuario)

Page 9: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

Proyecto BI no estándarFicha resumen

Objetivo institucional Mejorar la calidad de los admitidos

Objetivo en términos de BI Mejorar la capacidad que tienen los procesos de admisión de predecir el rendimiento en la universidad.

Población a estudiar Admitidos a la PUCP de los últimos n años

Relación preliminar de

indicadores y

dimensiones a

estudiar

Indicadores de rendimiento en el colegio (Promedios de notas escolares por área, por año y total,

condición de haber tenido buen rendimiento en el colegio)

Indicadores de rendimiento en las pruebas de admisión (Puntajes parciales y final)

Indicador de rendimiento académico en la universidad (Coeficiente de rendimiento académico

estandarizado en la PUCP)

Descripción de datos

disponibles y su

calidad

Existe información de buena calidad de:

Notas en los cursos llevados en el colegio en secundaria

Puntajes parciales y final en las pruebas de admisión

Notas en los cursos llevados en la PUCP

de los admitidos a la PUCP de los últimos n años

Modelo de datos a generar El modelo E-R de los datos a generar se encuentra en…

Relación de técnicas a usar Análisis factorial considerando los indicadores de rendimiento en el Colegio y en las Pruebas de

admisión

Análisis de correlación bivariados del rendimiento en la Universidad versus cada indicador de

rendimiento en el Colegio y en las Pruebas de admisión

Análisis de regresión considerando como variable dependiente al rendimiento en la Universidad y

como variables independientes a las variables que mostraron buena correlación

Conclusiones y decisiones Conclusiones

El rendimiento escolar es una dimensión importante y diferente a la de las partes de las pruebas de

admisión

Existe una muy buena correlación entre el rendimiento en el colegio y el rendimiento académico en la

universidad.

El rendimiento en el colegio debe tener un peso igual a p% para maximizar la capacidad predictiva de

los procesos de admisión masivos.

Decisiones

Usar un peso igual a p% en las fórmulas de los procesos masivos de admisión

Crear modalidades de admisión para los alumnos con buen rendimiento escolar:

o Para el 1/3 superior de los mejores colegios (ITS)

o Para el 1/5 superior de todos los colegios (PAEE)

Hacer otro estudio para seleccionar a los mejores colegios.

Page 10: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento
Page 11: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento
Page 12: PUCP - Análisis de los resultados del proceso de ...¡ctica-PUCP-Expuesta-2014.pdf · ETL Diseño Modelos de datos a generar (DW, DM u otra base con ... los alumnos con buen rendimiento

DEMO