universidad tecnolÓgica de panamÁ · desarrollada para la formulación del proyectos tic-data...
Post on 08-Jul-2020
6 Views
Preview:
TRANSCRIPT
UNIVERSIDAD TECNOLÓGICA DE PANAMÁ
INFORME DE VIAJE El presente formato tiene el objetivo de consolidar toda la información obtenida por los colaboradores, que de una u otra forma se hayan beneficiado para realizar viaje al exterior, el cual, a la vez será reportado al Ministerio de la Presidencia para justificar la gestión realizada, en correlación con el presupuesto ejecutado.
TIPO Y NOMBRE DE LA ACTIVIDAD Reunión con el Grupo de Investigación (Dame: Ingeniería para la Mineria de Datos, Universidad Politécnica de Madrid, Madrid España)
LUGAR Y FECHA (Duración) Madrid, España del 11 al 17 de Septiembre del 2011
OBJETIVOS Colaboración UPM (Universidad Politécnica de Madrid (DAME) —CIDITIC ( Centro de investigación y desarrollo en TIC) Panamá (Universidad Tecnológica de Panamá)
PARTICIPANTE (S) Prof. Miguel Vargas Lombardo
ASPECTOS RELEVANTES EN EL DESARROLLO DE LA ACTIVIDAD
Se concreta el desarrollo de un macro proyecto TIC, sobre aspectos de mineria de Datos aplicado a la toma de desiciones en sector Salud, primordialmente a las enfermedades no transmisibles.
RESULTADOS OBTENIDOS (Contacto con futuros expositores, becas, firma de convenio, etc.)
Visita de la Dra. Ernestina Menasalvas Rúiz, Directora del grupo de Investigación (Dame-UPM, Madrid), para un Taller sobre DataMlning, fecha de la visita febrero-marzo del 2012. Se elaborá un primer borrador de Proyecto de proyecto sobre Minieria de datos para el sector salud en Panamá (se adjunta).
CONCLUSIONES
Se formula un proyecto para el desarrollo de un macro proyecto TIC, sobre aspectos de mineria de Datos aplicado a la toma de desiciones en sector Salud, primordialmente a las enfermedades no transmisibles, con una duyración de 24 meses. Además de contar con la disposición para realizar pasantias en el grupo de investigación o hasta ser asesorados por la Dra Menasalvas en tesis de Maestría o Doctorado (UPM, de Madrid).
RECOMENDACIONES Agradecer a la Universidad Tecnológica de Panamá, la gestión desarrollada para la formulación del proyectos TIC-DATA MINING.
ANEXOS Se Anexa documento borrador de proyecto y carta de parte de la Dra Menasalvas Ruíz.
/1
Firma y cédula del participante: Miguel Varg. s-Lombardo 2-137-62
Fecha de entrega del informe: 23 de septiembre del 2011.
I .1.1,c,Iírta Meruls,111i, Ruiz
POLITÉCNICA
Dña, ERNESTINA MENASALVAS RUIZ, Vicerrectora de Doctorado y
Postgrado de la Universidad Politécnica de Madrid,
HACE CONSTAR:
Que D. MIGUEL VARGAS ha visitado nuestra universidad y en concreto ha
realizado reuniones de trabajo con el Grupo de Investigación DAME.
Madrid, 16 de septiembre de 2011
Ernestina Menasalvas
Vicerrectora de Doctorado y Postgrado
Colaboración UPM (DAME) — CIDITIC ( centro de investigación y desarrollo en TIC)
Panamá (Universidad Tecnológica de Panamá)
1. Preámbulo: En Panamá el Ministerio de Salud ha identificado la necesidad de manejo integral de las
enfermedades NO transmisibles (ENT) con prioridad en cáncer, cardiovascular y pulmonares
crónicas puesto que afectan a gran parte de su población siendo la primera causa de muerte,
dolor y sufrimiento.
Consiguientemente como una de las líneas para afrontar este problema se plantea la
colaboración con la Universidad Politécnica de Madrid y en concreto con el grupo de
investigación DAME de minería de datos con el fin de poder analizar los datos que se han
recogido de estas enfermedades y poder establecer decisiones en base a los resultados del los
análisis.
2. Objetivos de la colaboración: Establecer líneas conjuntas de investigación en las áreas de análisis de datos concernientes a
enfermedades:
• Cáncer
• Cardiovascular
• Pulmonar crónica
El objetivo es el análisis de los datos que se puedan extraer de manera que se pueda en un
futuro:
1. Prevenir
2. Promocionar su cuidado por medio de TIC
2.1 Tareas
1. Definición del grupo de trabajo tanto en la UPM como en el CIDTIC
a. UPM: Ernestina Menasalvas, Santiago Eibe
b. CIDTIC: a determinar
Además se contará con investigadores junior en formación por parte de de CIDTIC.
Estos investigadores serán financiados por el CDTIC. Obsérvese que los perfiles de los
investigadores en formación o de los senior tendrán que ser acordes a las tareas que a
continuación se detallarán
2. Definición del proyecto que será el hilo conductor de la investigación (ver sección XX)
3. Establecimiento del cronograma de trabajo
3. Objetivos La línea estratégica que guía las actuaciones propuestas es:
Análisis de las enfermedades no tranmisibles (ENT) en Panamá
No obstante esto se trata de un proyecto ambicioso que se dilatará en el tiempo. Para
conseguir tener éxito en esta línea estratégica se proponen actuaciones tácticas en el corto
plazo:
1. Establecimiento de un proyecto de data mining que permita esclarecer los primeros
patrones acerca de las enfermedades de estudio (18 meses). Estos primeros patrones
serán la base para la toma de decisión. El proyecto tendrá subproyectos para cada una
de las enfermedades que se analizarán
2. Desarrollo de una base de datos (datamart de ENT) de soporte a los procesos de toma
de decisión. Del desarrollo del primer proyecto se conseguirá información que
permitirá poder desarrollar una base de datos que en el futuro sea la base de los
análisis
3. Institucionalización de los procesos de descubrimiento de datos en bases de datos de
ENT. Nuevamente el KnowHow adquirido en el primer proyecto permite poder
establecer en la organización los procesos que permiten que el descubrimiento de
conocimiento se institucionalice y pase a ser uno de los procesos de la organización
4. Establecimiento de los procesos de toma de decisión basados en los patrones
descubiertos por los procesos de análisis sobre el datamart de ENT.
Las figuras (1 y 2) muestras respectivamente los módulos del sistema que se pretende
implantar a largo plazo y la arquitectura de procesos del sistema resultante
En la figura de los módulos claramente se destacan los módulos que se tendrán que
desarrollar a lo largo del tiempo
1. El módulo de adquisición de datos será el encargado de integrar las fuentes de datos
de las distintas enfermedades en estos datos se integrarán los datos de la clínica
(hospitales, clínicas, etc. ) así como, los datos que disponga el ministerio de salud, la
caja de seguros social ... Este módulo solo se podrá diseñar una vez que en el proceso
de minería de datos se haya realizado la fase de "comprensión de los datos" .
obsérvese también que la correcta implantación de este módulo supone el desarrollo
del mencionado datamart de ENT
2. El módulo de soporte a la decisión es el encargado de la aplicación de todas las
técnicas y métodos de data mining. Obsérvese también que en una primera instancia
se aplicarán los métodos y del conocimiento extraído estaremos preparados para el
diseño e implementación del modulo que se integrará en la organización para el
descubrimiento de conocimiento
3. El modulo de "acción" es el encargado de la toma de decisión basándose en los
patrones del modulo de soporte a la decisión.
4. Para terminar un módulo de extremada importancia dado el nivel de confidencialidad
de los datos que se tratan es el modulo de seguridad y privacidad
Data Acquisition Modules Privac and Securit Modules
Decision Support System Modules Action Modules
ClInIcal data
-
Sensor data
acquisition
medical Data Layer medIcal
behavloral data J medical data,
I 1
Integration
( aegulaltion
Analysis Layer
Integrated data
Ubiquitoul Mine!'
temporal mining
trajectory mining
Profiling
alert mechanism
dashboard
Action Layer
Con todo ello se diseñaría un sistema con el propuesto en la figura 2
A continuación detallamos los pasos para conseguir este sistema
En primer lugar se detalla el proyecto que se tendría que llevar a cabo en primera instancia
que es el de data mining sobre datos de ENT. Como resultados de este proyecto se tendría:
1. Los patrones obtenidos con los datos usados
2. Knowhow para empezar el diseño del módulo de adquisición de datos
3. Knowhow para empezar el diseño del módulo de soporte a la decisión
4. Knowhow para el diseño del módulo de acción
Obsérvese también que las tareas no tienen por qué ser secuenciales y que en principio se
podrían intercalar en el tiempo tan pronto se disponga de la información necesaria
Para terminar el módulo de privacidad se debería empezar a diseñar desde las primeras fases
de análisis de los datos donde se establecerán los requisitos de privacidad y seguridad de los
datos tratados.
3.1 Definición del proyecto de minería de datos
Metodología que se aplica: CRISP-DM
FASE 1: Establecimiento del Problema de negocio:
En esta fase el objetivo que se buscará será el establecer indicadores que ayuden a la toma de
decisión a los responsables de salud en Panamá en los temas concernientes a las ENT
En concreto se buscará:
• Variables que permitan predecir las probabilidades de riesgo coronario en la población
• Variables que permitan predecir las probabilidades de éxitos de ciertos tratamientos
• Establecer segmentos de población donde una cierta patología tiene una mayor
incidencia
•
El éxito del proyecto radica en gran parte en la correcta definición de los indicadores clave
para el éxito del proyecto
En esta fase se realizará también un análisis de la viabilidad del proyecto para cada una de las
enfermedades objeto del análisis
FASE 2: Análisis de los Datos disponibles
En esta fase se tendrán que analizar las fuentes de datos que se tienen disponibles para poder
analizar. Se identifican al menos las siguientes sub fases
• Identificación de las fuentes
• Análisis de cada una de las fuentes y viabilidad
• Estudio de la calidad de los datos para los objetivos marcados
• Análisis de los datos que faltan y análisis de las posibilidades de su obtención
en un corto plazo de tiempo
FASE 3: Transformación de los datos disponibles
En esta fase los datos se prepararán para el proceso de minería de los datos.
El proceso de limpieza de los datos tendrá lugar también en esta fase
Como consecuencia de la finalización de las fases 2 y 3 se podría plantear un proyecto de
construcción de una base de datos corporativa ( data mart) de soporte a los procesos de
toma de decisión
FASE 4: modelado, minería y extracción de patrones y modelos
Se aplicarán las técnicas apropiadas para obtener los modelos necesarios para la toma de
decisión
FASE 5: evaluación de los modelos obtenidos
FASE 6: Implantación.
FASE 7: Mantenimiento de los modelos obtenidos
Una vez finalizado este proyecto y aprovechando el KnowHow generado se debería empezar
el proyecto de :
Automatimatización del proceso de la toma de decisión basada en modelos de minería de
datos . Se trataría de un segundo proyecto en el que las técnicas y métodos aprendidos en las
fases 1-7 se automatizan para que los procedimientos de toma de decisión se institucionalicen
en la organización.
Como se ha comentado todos los subproyectos derivados del conocimiento acerca del proceso
de descubrimiento de conocimiento que se ha realizado se podrían comenzar a partir de que la
fase requerida ha teminado.
Por ejemplo una vez concluida fase 3 se podría empezar con el proyecto de diseño del modulo
de adquisición de datos.
4. Financiación El CIDITC buscará la manera de poder financiar las estadías de sus investigadores en la UPM
top related