universidad tecnolÓgica de panamÁ · desarrollada para la formulación del proyectos tic-data...

7
UNIVERSIDAD TECNOLÓGICA DE PANAMÁ INFORME DE VIAJE El presente formato tiene el objetivo de consolidar toda la información obtenida por los colaboradores, que de una u otra forma se hayan beneficiado para realizar viaje al exterior, el cual, a la vez será reportado al Ministerio de la Presidencia para justificar la gestión realizada, en correlación con el presupuesto ejecutado. TIPO Y NOMBRE DE LA ACTIVIDAD Reunión con el Grupo de Investigación (Dame: Ingeniería para la Mineria de Datos, Universidad Politécnica de Madrid, Madrid España) LUGAR Y FECHA (Duración) Madrid, España del 11 al 17 de Septiembre del 2011 OBJETIVOS Colaboración UPM (Universidad Politécnica de Madrid (DAME) — CIDITIC ( Centro de investigación y desarrollo en TIC) Panamá (Universidad Tecnológica de Panamá) PARTICIPANTE (S) Prof. Miguel Vargas Lombardo ASPECTOS RELEVANTES EN EL DESARROLLO DE LA ACTIVIDAD Se concreta el desarrollo de un macro proyecto TIC, sobre aspectos de mineria de Datos aplicado a la toma de desiciones en sector Salud, primordialmente a las enfermedades no transmisibles. RESULTADOS OBTENIDOS (Contacto con futuros expositores, becas, firma de convenio, etc.) Visita de la Dra. Ernestina Menasalvas Rúiz, Directora del grupo de Investigación (Dame-UPM, Madrid), para un Taller sobre DataMlning, fecha de la visita febrero-marzo del 2012. Se elaborá un primer borrador de Proyecto de proyecto sobre Minieria de datos para el sector salud en Panamá (se adjunta). CONCLUSIONES Se formula un proyecto para el desarrollo de un macro proyecto TIC, sobre aspectos de mineria de Datos aplicado a la toma de desiciones en sector Salud, primordialmente a las enfermedades no transmisibles, con una duyración de 24 meses. Además de contar con la disposición para realizar pasantias en el grupo de investigación o hasta ser asesorados por la Dra Menasalvas en tesis de Maestría o Doctorado (UPM, de Madrid). RECOMENDACIONES Agradecer a la Universidad Tecnológica de Panamá, la gestión desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas Ruíz. /1 Firma y cédula del participante: Miguel Varg. s-Lombardo 2-137-62 Fecha de entrega del informe: 23 de septiembre del 2011.

Upload: others

Post on 08-Jul-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDAD TECNOLÓGICA DE PANAMÁ · desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas

UNIVERSIDAD TECNOLÓGICA DE PANAMÁ

INFORME DE VIAJE El presente formato tiene el objetivo de consolidar toda la información obtenida por los colaboradores, que de una u otra forma se hayan beneficiado para realizar viaje al exterior, el cual, a la vez será reportado al Ministerio de la Presidencia para justificar la gestión realizada, en correlación con el presupuesto ejecutado.

TIPO Y NOMBRE DE LA ACTIVIDAD Reunión con el Grupo de Investigación (Dame: Ingeniería para la Mineria de Datos, Universidad Politécnica de Madrid, Madrid España)

LUGAR Y FECHA (Duración) Madrid, España del 11 al 17 de Septiembre del 2011

OBJETIVOS Colaboración UPM (Universidad Politécnica de Madrid (DAME) —CIDITIC ( Centro de investigación y desarrollo en TIC) Panamá (Universidad Tecnológica de Panamá)

PARTICIPANTE (S) Prof. Miguel Vargas Lombardo

ASPECTOS RELEVANTES EN EL DESARROLLO DE LA ACTIVIDAD

Se concreta el desarrollo de un macro proyecto TIC, sobre aspectos de mineria de Datos aplicado a la toma de desiciones en sector Salud, primordialmente a las enfermedades no transmisibles.

RESULTADOS OBTENIDOS (Contacto con futuros expositores, becas, firma de convenio, etc.)

Visita de la Dra. Ernestina Menasalvas Rúiz, Directora del grupo de Investigación (Dame-UPM, Madrid), para un Taller sobre DataMlning, fecha de la visita febrero-marzo del 2012. Se elaborá un primer borrador de Proyecto de proyecto sobre Minieria de datos para el sector salud en Panamá (se adjunta).

CONCLUSIONES

Se formula un proyecto para el desarrollo de un macro proyecto TIC, sobre aspectos de mineria de Datos aplicado a la toma de desiciones en sector Salud, primordialmente a las enfermedades no transmisibles, con una duyración de 24 meses. Además de contar con la disposición para realizar pasantias en el grupo de investigación o hasta ser asesorados por la Dra Menasalvas en tesis de Maestría o Doctorado (UPM, de Madrid).

RECOMENDACIONES Agradecer a la Universidad Tecnológica de Panamá, la gestión desarrollada para la formulación del proyectos TIC-DATA MINING.

ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas Ruíz.

/1

Firma y cédula del participante: Miguel Varg. s-Lombardo 2-137-62

Fecha de entrega del informe: 23 de septiembre del 2011.

Page 2: UNIVERSIDAD TECNOLÓGICA DE PANAMÁ · desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas

I .1.1,c,Iírta Meruls,111i, Ruiz

POLITÉCNICA

Dña, ERNESTINA MENASALVAS RUIZ, Vicerrectora de Doctorado y

Postgrado de la Universidad Politécnica de Madrid,

HACE CONSTAR:

Que D. MIGUEL VARGAS ha visitado nuestra universidad y en concreto ha

realizado reuniones de trabajo con el Grupo de Investigación DAME.

Madrid, 16 de septiembre de 2011

Ernestina Menasalvas

Vicerrectora de Doctorado y Postgrado

Page 3: UNIVERSIDAD TECNOLÓGICA DE PANAMÁ · desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas

Colaboración UPM (DAME) — CIDITIC ( centro de investigación y desarrollo en TIC)

Panamá (Universidad Tecnológica de Panamá)

1. Preámbulo: En Panamá el Ministerio de Salud ha identificado la necesidad de manejo integral de las

enfermedades NO transmisibles (ENT) con prioridad en cáncer, cardiovascular y pulmonares

crónicas puesto que afectan a gran parte de su población siendo la primera causa de muerte,

dolor y sufrimiento.

Consiguientemente como una de las líneas para afrontar este problema se plantea la

colaboración con la Universidad Politécnica de Madrid y en concreto con el grupo de

investigación DAME de minería de datos con el fin de poder analizar los datos que se han

recogido de estas enfermedades y poder establecer decisiones en base a los resultados del los

análisis.

2. Objetivos de la colaboración: Establecer líneas conjuntas de investigación en las áreas de análisis de datos concernientes a

enfermedades:

• Cáncer

• Cardiovascular

• Pulmonar crónica

El objetivo es el análisis de los datos que se puedan extraer de manera que se pueda en un

futuro:

1. Prevenir

2. Promocionar su cuidado por medio de TIC

2.1 Tareas

1. Definición del grupo de trabajo tanto en la UPM como en el CIDTIC

a. UPM: Ernestina Menasalvas, Santiago Eibe

b. CIDTIC: a determinar

Además se contará con investigadores junior en formación por parte de de CIDTIC.

Estos investigadores serán financiados por el CDTIC. Obsérvese que los perfiles de los

investigadores en formación o de los senior tendrán que ser acordes a las tareas que a

continuación se detallarán

2. Definición del proyecto que será el hilo conductor de la investigación (ver sección XX)

3. Establecimiento del cronograma de trabajo

Page 4: UNIVERSIDAD TECNOLÓGICA DE PANAMÁ · desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas

3. Objetivos La línea estratégica que guía las actuaciones propuestas es:

Análisis de las enfermedades no tranmisibles (ENT) en Panamá

No obstante esto se trata de un proyecto ambicioso que se dilatará en el tiempo. Para

conseguir tener éxito en esta línea estratégica se proponen actuaciones tácticas en el corto

plazo:

1. Establecimiento de un proyecto de data mining que permita esclarecer los primeros

patrones acerca de las enfermedades de estudio (18 meses). Estos primeros patrones

serán la base para la toma de decisión. El proyecto tendrá subproyectos para cada una

de las enfermedades que se analizarán

2. Desarrollo de una base de datos (datamart de ENT) de soporte a los procesos de toma

de decisión. Del desarrollo del primer proyecto se conseguirá información que

permitirá poder desarrollar una base de datos que en el futuro sea la base de los

análisis

3. Institucionalización de los procesos de descubrimiento de datos en bases de datos de

ENT. Nuevamente el KnowHow adquirido en el primer proyecto permite poder

establecer en la organización los procesos que permiten que el descubrimiento de

conocimiento se institucionalice y pase a ser uno de los procesos de la organización

4. Establecimiento de los procesos de toma de decisión basados en los patrones

descubiertos por los procesos de análisis sobre el datamart de ENT.

Las figuras (1 y 2) muestras respectivamente los módulos del sistema que se pretende

implantar a largo plazo y la arquitectura de procesos del sistema resultante

En la figura de los módulos claramente se destacan los módulos que se tendrán que

desarrollar a lo largo del tiempo

1. El módulo de adquisición de datos será el encargado de integrar las fuentes de datos

de las distintas enfermedades en estos datos se integrarán los datos de la clínica

(hospitales, clínicas, etc. ) así como, los datos que disponga el ministerio de salud, la

caja de seguros social ... Este módulo solo se podrá diseñar una vez que en el proceso

de minería de datos se haya realizado la fase de "comprensión de los datos" .

obsérvese también que la correcta implantación de este módulo supone el desarrollo

del mencionado datamart de ENT

2. El módulo de soporte a la decisión es el encargado de la aplicación de todas las

técnicas y métodos de data mining. Obsérvese también que en una primera instancia

se aplicarán los métodos y del conocimiento extraído estaremos preparados para el

diseño e implementación del modulo que se integrará en la organización para el

descubrimiento de conocimiento

3. El modulo de "acción" es el encargado de la toma de decisión basándose en los

patrones del modulo de soporte a la decisión.

4. Para terminar un módulo de extremada importancia dado el nivel de confidencialidad

de los datos que se tratan es el modulo de seguridad y privacidad

Page 5: UNIVERSIDAD TECNOLÓGICA DE PANAMÁ · desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas

Data Acquisition Modules Privac and Securit Modules

Decision Support System Modules Action Modules

ClInIcal data

-

Sensor data

acquisition

medical Data Layer medIcal

behavloral data J medical data,

I 1

Integration

( aegulaltion

Analysis Layer

Integrated data

Ubiquitoul Mine!'

temporal mining

trajectory mining

Profiling

alert mechanism

dashboard

Action Layer

Con todo ello se diseñaría un sistema con el propuesto en la figura 2

A continuación detallamos los pasos para conseguir este sistema

En primer lugar se detalla el proyecto que se tendría que llevar a cabo en primera instancia

que es el de data mining sobre datos de ENT. Como resultados de este proyecto se tendría:

1. Los patrones obtenidos con los datos usados

2. Knowhow para empezar el diseño del módulo de adquisición de datos

Page 6: UNIVERSIDAD TECNOLÓGICA DE PANAMÁ · desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas

3. Knowhow para empezar el diseño del módulo de soporte a la decisión

4. Knowhow para el diseño del módulo de acción

Obsérvese también que las tareas no tienen por qué ser secuenciales y que en principio se

podrían intercalar en el tiempo tan pronto se disponga de la información necesaria

Para terminar el módulo de privacidad se debería empezar a diseñar desde las primeras fases

de análisis de los datos donde se establecerán los requisitos de privacidad y seguridad de los

datos tratados.

3.1 Definición del proyecto de minería de datos

Metodología que se aplica: CRISP-DM

FASE 1: Establecimiento del Problema de negocio:

En esta fase el objetivo que se buscará será el establecer indicadores que ayuden a la toma de

decisión a los responsables de salud en Panamá en los temas concernientes a las ENT

En concreto se buscará:

• Variables que permitan predecir las probabilidades de riesgo coronario en la población

• Variables que permitan predecir las probabilidades de éxitos de ciertos tratamientos

• Establecer segmentos de población donde una cierta patología tiene una mayor

incidencia

El éxito del proyecto radica en gran parte en la correcta definición de los indicadores clave

para el éxito del proyecto

En esta fase se realizará también un análisis de la viabilidad del proyecto para cada una de las

enfermedades objeto del análisis

FASE 2: Análisis de los Datos disponibles

En esta fase se tendrán que analizar las fuentes de datos que se tienen disponibles para poder

analizar. Se identifican al menos las siguientes sub fases

• Identificación de las fuentes

• Análisis de cada una de las fuentes y viabilidad

• Estudio de la calidad de los datos para los objetivos marcados

• Análisis de los datos que faltan y análisis de las posibilidades de su obtención

en un corto plazo de tiempo

FASE 3: Transformación de los datos disponibles

En esta fase los datos se prepararán para el proceso de minería de los datos.

Page 7: UNIVERSIDAD TECNOLÓGICA DE PANAMÁ · desarrollada para la formulación del proyectos TIC-DATA MINING. ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas

El proceso de limpieza de los datos tendrá lugar también en esta fase

Como consecuencia de la finalización de las fases 2 y 3 se podría plantear un proyecto de

construcción de una base de datos corporativa ( data mart) de soporte a los procesos de

toma de decisión

FASE 4: modelado, minería y extracción de patrones y modelos

Se aplicarán las técnicas apropiadas para obtener los modelos necesarios para la toma de

decisión

FASE 5: evaluación de los modelos obtenidos

FASE 6: Implantación.

FASE 7: Mantenimiento de los modelos obtenidos

Una vez finalizado este proyecto y aprovechando el KnowHow generado se debería empezar

el proyecto de :

Automatimatización del proceso de la toma de decisión basada en modelos de minería de

datos . Se trataría de un segundo proyecto en el que las técnicas y métodos aprendidos en las

fases 1-7 se automatizan para que los procedimientos de toma de decisión se institucionalicen

en la organización.

Como se ha comentado todos los subproyectos derivados del conocimiento acerca del proceso

de descubrimiento de conocimiento que se ha realizado se podrían comenzar a partir de que la

fase requerida ha teminado.

Por ejemplo una vez concluida fase 3 se podría empezar con el proyecto de diseño del modulo

de adquisición de datos.

4. Financiación El CIDITC buscará la manera de poder financiar las estadías de sus investigadores en la UPM