tesis que para obtener el grado de maestria en ingenieria electrica presenta joel loaeza valerio

26
TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio Dr. Juan José Flores Romero Director de Tesis HERRAMIENTA DE MINERÍA DE DATOS BASADA EN C4.5 Y SU APLICACION AL INVENTARIO MULTIFASICO DE LA PERSONALIDAD MINNESOTA 2 UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO FACULTAD DE INGENIERÍA ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO

Upload: hall

Post on 16-Jan-2016

54 views

Category:

Documents


0 download

DESCRIPTION

UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO FACULTAD DE INGENIERÍA ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO. HERRAMIENTA DE MINERÍA DE DATOS BASADA EN C4.5 Y SU APLICACION AL INVENTARIO MULTIFASICO DE LA PERSONALIDAD MINNESOTA 2. TESIS Que para obtener el grado de - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

TESIS

Que para obtener el grado de

MAESTRIA EN INGENIERIA ELECTRICA

presenta

Joel Loaeza Valerio

Dr. Juan José Flores Romero

Director de Tesis

HERRAMIENTA DE MINERÍA DE DATOS BASADA EN C4.5

Y SU APLICACION AL INVENTARIO MULTIFASICO DE LA

PERSONALIDAD MINNESOTA 2

UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO

FACULTAD DE INGENIERÍA ELÉCTRICA

DIVISIÓN DE ESTUDIOS DE POSGRADO

Page 2: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

ContenidoJustificaciónObjetivos GeneralesAlcances y limitacionesAgentes InteligentesAprendizaje Humano y Aprendizaje ComputacionalÁrboles de DecisiónMinería de DatosInventario Multifásico de la Personalidad

Minnesota 2Ambiente de Descubrimiento con C4.5WebConclusiones

Page 3: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

MMPI-2

El MMPI-2 está compuesto por un conjunto de 567 reactivos, con este material se forman los indicadores de validez, las escalas clínicas, de contenido y suplementarias, dichos reactivos deben ser respondidos como verdadero o falso en la aplicación de la prueba para poder evaluar, interpretar y emitir un reporte que permita detectar si el paciente padece alguna psicopatología y para conocer algunas características de la personalidad del individuo en cuestión.

Page 4: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

MMPI-2

Page 5: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

MMPI-2

Page 6: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

MMPI-2

Page 7: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

MMPI-2

Page 8: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de Decisión

Page 9: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de DecisiónPara que el algoritmo de aprendizaje genere adecuadamente un Árbol de Decisión, se recomienda adoptar la siguiente metodología:1. Reunir una gran cantidad de ejemplos.2. Dividirla aleatoriamente en dos conjuntos: el conjunto de entrenamiento y el conjunto de prueba.3. Emplear el algoritmo de aprendizaje con el conjunto de entrenamiento como ejemplo base para producir un Árbol de Decisión (Modelo o Representación de la regularidad existente en los datos).

Page 10: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de Decisión

4. Medir el porcentaje de ejemplos del conjunto de prueba clasificados correctamente con el Árbol de Decisión.5. Repetir los pasos 2 a 4 en conjuntos de entrenamiento de diverso tamaño.6. Si no se logra un entrenamiento satisfactorio del algoritmo se recomienda revisar los datos o aumentar el volumen de éstos.

Page 11: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio
Page 12: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de DecisiónPrimero se calcula la información I obtenida con cada elemento del dominio de cada atributo y enseguida se calcula la entropía E correspondiente al atributo.Para el atributo L se tiene:

Page 13: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de Decisión

Page 14: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de Decisión

Page 15: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de DecisiónPor lo tanto, el algoritmo de aprendizaje del árbol de decisión escogerá al atributo con mayor ganancia que en este caso es F, como nodo raíz y procederá a realizar el mismo proceso con losejemplos de cada rama.

Page 16: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de DecisiónConstrucción de un Árbol de Decisión con C4.5

La explicación continúa con un ejemplo simple ValidaciónTest extraído del ambiente del MMPI-2.Se trata de clasificar como válida o no válida la aplicación del test a un paciente.Los ejemplos se describen mediante los valores de los atributos y el valor del predicado meta o clase.

Page 17: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Árboles de DecisiónSe dispone de la siguiente lista de atributos y

sus dominios:1. L : escala de la mentira, tendencia del

paciente a mentir al contestar el test (Bajo, Medio, Moderado, Alto).

2. F: escala de la infrecuencia, tendencia del paciente al contestar el test en forma inconsistente (Bajo, Medio, Moderado, Alto).

3. K: escala de negación de problemas, tendencia del paciente a negar sus problemas al contestar el test (Bajo, Medio, Moderado).

Page 18: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Minería de Datos

Page 19: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Minería de DatosCada reactivo posee un contenido (una afirmación).

Page 20: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Ambiente de Descubrimiento con C4.5WebConjunto de datos de entrenamiento

Page 21: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Ambiente de Descubrimiento con C4.5WebPrimero, se genera la cabecera

Page 22: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Ambiente de Descubrimiento con C4.5WebSegundo, se genera una o más traducciones

ASCII de un Árbol de Decisión

Page 23: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Ambiente de Descubrimiento con C4.5WebTercero, el Árbol de Decisión sin podar y el Árbol de Decisión podado son evaluados con los datos de entrenamiento para verificar la eficiencia de cada uno.

Page 24: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Ambiente de Descubrimiento con C4.5WebCuarto, evaluación del modelo generado con una matriz de confusión.

Page 25: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

Ambiente de Descubrimiento con C4.5WebY en forma gráfica:

Page 26: TESIS Que para obtener el grado de MAESTRIA EN INGENIERIA ELECTRICA presenta Joel Loaeza Valerio

ConclusionesAgente Inteligente DescubreconocimientoTécnica de Minería de DatosAlgoritmo de referencia de mineríaConocimiento obtenidoAportacionesResultadosTrabajos futuros