propuesta de sistema para el diagn Óstico...

150
PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DE EPILEPSIA CON T ÉCNICAS DE CLASIFICACI ÓN maría camila guerrero giraldo juan sebastian parada celis Proyecto de grado para optar por el título de Ingenieros de Sistemas Proyecto Curricular de Ingeniería de Sistemas Facultad de Ingeniería Universidad Distrital Francisco José de Caldas Julio 2020

Upload: others

Post on 06-Oct-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

P R O P U E S TA D E S I S T E M A PA R A E L D I A G N Ó S T I C O D EE P I L E P S I A C O N T É C N I C A S D E C L A S I F I C A C I Ó N

mar ía camila guerrero giraldojuan sebastian parada celis

Proyecto de grado para optar por el título de Ingenieros de Sistemas

Proyecto Curricular de Ingeniería de SistemasFacultad de Ingeniería

Universidad Distrital Francisco José de Caldas

Julio 2020

Page 2: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMAPARA EL DIAGNÓSTICO DE EPILEPSIA CON TÉCNICAS DE CLASIFICACIÓN, Proyectode grado para optar por el título de Ingenieros de Sistemas,� Julio 2020

Page 3: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

Claro que creo en los sueños.Soñar es esencial, puede ser la única cosa real que exista.

— Jorge Luis Borges

Dedico este trabajo a mi familia, especialmente a mis padres que son las personas quemás creen en mí y en todos los sueños que he tenido, gracias por su amor, constante

apoyo e innumerables esfuerzos. A los seres queridos que ya no están, especialmente a miabuela y a mi madrina, que me vieron crecer y me dieron los principios y valores parallegar a convertirme en quien soy. A cada uno de los docentes y compañeros que tuve

durante esta etapa universitaria, siempre dispuestos a compartir el conocimiento, graciasporque sin duda ha sido la experiencia más enriquecedora para mi crecimiento

profesional y personal.María Camila

Estamos vivos porque estamos, en movimiento.

— Jorge Drexler

Dedico este trabajo a mi mamá, que luchó por mí y mis hermanos desde sus máquinas decoser. Mi heroína. A mi padre, por inculcarme el anhelo de nunca parar de soñar. A mis

hermanos, sobre todo a Mireya, que me ha apoyado durante toda mi vida y ha sidosiempre un ejemplo a seguir. A mis compañeros y profesores, porque son ellos los que

realmente hacen grande a la Universidad Distrital.Juan Sebastian

Page 4: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 5: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

R E C O N O C I M I E N T O S

Un agradecimiento especial para :

El Ingeniero Helbert Espitia Cuchango, docente de la Facultad de Ingeniería de la Univer-sidad Distrital Francisco José de Caldas y director de esta tesis, a quien quisiéramos darun reconocimiento por su trabajo y dedicación permanente durante el desarrollo de estainvestigación, así como también por sus sugerencias y observaciones, siempre oportunas.Sobre todo por su generosidad al guiarnos y acompañarnos en la consecución de esteproyecto.

A los integrantes de la Universidad Distrital, compañeros y docentes. Por ser una fuenteenriquecedora de curiosidad y conocimiento, lo que hoy nos permite presentar esteproyecto.

vii

Page 6: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 7: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

Í N D I C E G E N E R A L

� ����������� ��� �������� �

�� ����� ����������� ��

��� ���������� ��� �������� ��

1 exploraci ón de datos 351.1 Selección y preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

1.1.1 Recolección de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351.1.2 Formato de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361.1.3 Etiquetas de los canales . . . . . . . . . . . . . . . . . . . . . . . . . . 361.1.4 Montaje bipolar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361.1.5 Selección de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

1.2 Extracción de características . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381.3 Paciente no epiléptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

1.3.1 Canal F7 Frontal exterior izquierdo . . . . . . . . . . . . . . . . . . . 401.3.2 Canal T4 Medial exterior derecho . . . . . . . . . . . . . . . . . . . . 421.3.3 Canal F3, C3, P3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

1.4 Paciente epiléptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451.4.1 Canal F7, C4, T5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461.4.2 Canal F3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471.4.3 Canal P4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2 regresi ón log ística 512.1 Potencia relativa de las bandas de frecuencia . . . . . . . . . . . . . . . . . . 512.2 Media aritmética de las bandas de frecuencia . . . . . . . . . . . . . . . . . . 58

3 redes neuronales 693.1 Potencia relativa de las bandas de frecuencia . . . . . . . . . . . . . . . . . . 693.2 Media aritmética de las bandas de frecuencia . . . . . . . . . . . . . . . . . . 79

4 m áquinas de soporte vectorial 914.1 Potencia relativa de las bandas de frecuencia . . . . . . . . . . . . . . . . . . 914.2 Media aritmética de las bandas de frecuencia . . . . . . . . . . . . . . . . . . 97

5 an álisis por componentes principales 103

ix

Page 8: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

x índice general

5.1 Visualización de PCA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1035.2 Aplicación de PCA a modelos de clasificación . . . . . . . . . . . . . . . . . 105

�� �������� �� ���������� ���

6 an álisis de resultados 1116.1 Regresión Logística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1126.2 Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1136.3 Maquinas de Soporte Vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7 aportes originales y discusi ón 1177.1 Aporte original . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1177.2 Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

8 conclusiones y trabajos futuros 1218.1 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1218.2 Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

� �������� ���

a descripci ón paciente 127a.1 Detalle de Pacientes Epilépticos . . . . . . . . . . . . . . . . . . . . . . . . . . 127a.2 Detalle de Pacientes No Epilépticos . . . . . . . . . . . . . . . . . . . . . . . 130

bibliografía 133

Page 9: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

Í N D I C E D E F I G U R A S

Figura 1 Grabación de un EEG obtenido por Hans Berger en 1924 comparadocon una señal de tiempo de 10Hz . . . . . . . . . . . . . . . . . . . . 22

Figura 2 Distancia entre los electrodos del sistema 10/20. . . . . . . . . . . . 23Figura 3 Ilustración de la extracción de caracterisiticas y posterior clasifica-

ción de un figura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27Figura 4 Gráfica de ls función sigmoide . . . . . . . . . . . . . . . . . . . . . . 28Figura 5 Esquema de conexiones cerebrales entre neuronas . . . . . . . . . . 29Figura 6 Comparación entre redes neuronales naturales y artificiales . . . . 30Figura 7 Esquema de red neuronal Feed-Forward . . . . . . . . . . . . . . . 30Figura 8 Hiperplano, márgenes máximos y una máquina de vectores de

soporte lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Figura 9 Montaje bipolar para EEGs . . . . . . . . . . . . . . . . . . . . . . . . 37Figura 10 Exploración de datos de pacientes (Edades) . . . . . . . . . . . . . . 37Figura 11 Exploración de datos de pacientes (Sexo) . . . . . . . . . . . . . . . 38Figura 12 Comparación entre la señal de un paciente epiléptico y un paciente

no epiléptico en el dominio del tiempo . . . . . . . . . . . . . . . . . 39Figura 13 Comparación entre la señal de un paciente epiléptico y un paciente

no epiléptico en el dominio de la frecuencia . . . . . . . . . . . . . . 39Figura 14 Canales analizados del paciente no epiléptico . . . . . . . . . . . . . 41Figura 15 Paciente no epiléptico. Canal F7 en dominio de tiempo . . . . . . . 41Figura 16 Paciente no epiléptico. Canal F7 en dominio de frecuencia . . . . . 42Figura 17 Paciente no epiléptico. Canal T4 en dominio de tiempo . . . . . . . 43Figura 18 Paciente no epiléptico. Canal T4 en dominio de frecuencia . . . . . 43Figura 19 Canales analizados del paciente epiléptico . . . . . . . . . . . . . . . 45Figura 20 Paciente epiléptico. Canal F7 en dominio de frecuencia . . . . . . . 46Figura 21 Paciente epiléptico. Canal C4 en dominio de frecuencia . . . . . . . 47Figura 22 Paciente epiléptico. Canal T5 en dominio de frecuencia . . . . . . . 47Figura 23 Paciente epiléptico. Canal F3 en dominio de frecuencia . . . . . . . 48Figura 24 Paciente epiléptico. Canal P4 en dominio de frecuencia . . . . . . . 49Figura 25 Matriz de confusión Modelo REG-LOG-01 . . . . . . . . . . . . . . . 52Figura 26 Matriz de confusión Modelo REG-LOG-02 . . . . . . . . . . . . . . . 53Figura 27 Matriz de confusión Modelo REG-LOG-03 . . . . . . . . . . . . . . . 55Figura 28 Matriz de confusión Modelo REG-LOG-04 . . . . . . . . . . . . . . . 56Figura 29 Matriz de confusión Modelo REG-LOG-05 . . . . . . . . . . . . . . . 57Figura 30 Matriz de confusión Modelo REG-LOG-06 . . . . . . . . . . . . . . . 58Figura 31 Matriz de confusión Modelo REG-LOG-07 . . . . . . . . . . . . . . . 59Figura 32 Matriz de confusión Modelo REG-LOG-08 . . . . . . . . . . . . . . . 61Figura 33 Matriz de confusión Modelo REG-LOG-09. . . . . . . . . . . . . . . 61

xi

Page 10: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

xii Índice de figuras

Figura 34 Matriz de confusión Modelo REG-LOG-10 . . . . . . . . . . . . . . . 62Figura 35 Matriz de confusión Modelo REG-LOG-11 . . . . . . . . . . . . . . . 64Figura 36 Matriz de confusión Modelo REG-LOG-12 . . . . . . . . . . . . . . . 65Figura 37 Matriz de confusión Modelo REG-LOG-13 . . . . . . . . . . . . . . . 65Figura 38 Matriz de confusión Modelo REG-LOG-14 . . . . . . . . . . . . . . . 66Figura 39 Modelo Perceptrón Multicapa . . . . . . . . . . . . . . . . . . . . . . 70Figura 40 Precisión del modelo NN-FF-01 . . . . . . . . . . . . . . . . . . . . . 70Figura 41 Matriz de confusión Modelo NN-FF-01 . . . . . . . . . . . . . . . . 71Figura 42 Matriz de confusión Modelo NN-FF-02 . . . . . . . . . . . . . . . . 72Figura 43 Precisión del modelo NN-FF-03 . . . . . . . . . . . . . . . . . . . . . 73Figura 44 Matriz de confusión Modelo NN-FF-03 . . . . . . . . . . . . . . . . 74Figura 45 Precisión y pérdida del modelo NN-FF-04 . . . . . . . . . . . . . . . 75Figura 46 Precisión y pérdida del modelo NN-FF-05 . . . . . . . . . . . . . . . 75Figura 47 Precisión y pérdida del modelo NN-FF-06 . . . . . . . . . . . . . . . 76Figura 48 Precisión y pérdida del modelo NN-FF-07 . . . . . . . . . . . . . . . 77Figura 49 Precisión y pérdida del modelo NN-FF-08 . . . . . . . . . . . . . . . 77Figura 50 Distribución datos experimento NN-FF-09 . . . . . . . . . . . . . . . 78Figura 51 Precisión y pérdida del modelo NN-FF-09 . . . . . . . . . . . . . . . 78Figura 52 Matriz de confusión del modelo NN-FF-10 . . . . . . . . . . . . . . 80Figura 53 Precisión y pérdida del modelo NN-FF-10 . . . . . . . . . . . . . . . 80Figura 54 Matriz de confusión del modelo NN-FF-11 . . . . . . . . . . . . . . 81Figura 55 Precisión y pérdida del modelo NN-FF-11 . . . . . . . . . . . . . . . 81Figura 56 Matriz de confusión del modelo NN-FF-12 . . . . . . . . . . . . . . 82Figura 57 Precisión y pérdida del modelo NN-FF-12 . . . . . . . . . . . . . . . 83Figura 58 Matriz de confusión del modelo NN-FF-13 . . . . . . . . . . . . . . 84Figura 59 Precisión y pérdida del modelo NN-FF-13 . . . . . . . . . . . . . . . 84Figura 60 Precisión y pérdida del modelo NN-FF-14 . . . . . . . . . . . . . . . 85Figura 61 Matriz de confusión del modelo NN-FF-14 . . . . . . . . . . . . . . 85Figura 62 Matriz de confusión del modelo NN-FF-15 . . . . . . . . . . . . . . 86Figura 63 Precisión y pérdida del modelo NN-FF-15 . . . . . . . . . . . . . . . 87Figura 64 Matriz de confusión del modelo NN-FF-16 . . . . . . . . . . . . . . 88Figura 65 Precisión y pérdida del modelo NN-FF-16 . . . . . . . . . . . . . . . 88Figura 66 Precisión y pérdida del modelo NN-FF-17 . . . . . . . . . . . . . . . 89Figura 67 Matriz de confusión del modelo NN-FF-17 . . . . . . . . . . . . . . 89Figura 68 Matriz de confusión del modelo SVM-02 . . . . . . . . . . . . . . . . 93Figura 69 Matriz de confusión del modelo SVM-03 . . . . . . . . . . . . . . . . 94Figura 70 Matriz de confusión del modelo SVM-04 . . . . . . . . . . . . . . . . 95Figura 71 Matriz de confusión del modelo SVM-05 . . . . . . . . . . . . . . . . 96Figura 72 Matriz de confusión del modelo SVM-06 . . . . . . . . . . . . . . . . 97Figura 73 Matriz de confusión del modelo SVM-07 . . . . . . . . . . . . . . . . 98Figura 74 Matriz de confusión del modelo SVM-08 . . . . . . . . . . . . . . . . 99Figura 75 Matriz de confusión del modelo SVM-09 . . . . . . . . . . . . . . . . 100Figura 76 Matriz de confusión del modelo SVM-10 . . . . . . . . . . . . . . . . 101

Page 11: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

Índice de figuras xiii

Figura 77 Matriz de confusión del modelo SVM-11 . . . . . . . . . . . . . . . . 102Figura 82 Curva AUC modelo REG-LOG-13 . . . . . . . . . . . . . . . . . . . . 115Figura 83 Curva AUC modelo NN-FF-04 . . . . . . . . . . . . . . . . . . . . . 115Figura 84 Curva AUC modelo SVM-11 . . . . . . . . . . . . . . . . . . . . . . . 115Figura 85 Curvas ROC-AUC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

Page 12: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

Í N D I C E D E TA B L A S

Tabla 1 Referencias de los electrodos del sistema 10/20. . . . . . . . . . . . 23Tabla 2 Paciente no epiléptico. Tabla de bandas de frecuencia del canal F7 . 42Tabla 3 Paciente no epiléptico. Tabla de bandas de frecuencia del canal T4 . 44Tabla 4 Paciente no epiléptico. Tabla de bandas de frecuencia de los canales

F3,C3 y P3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44Tabla 5 Paciente epiléptico. Tabla de bandas de frecuencia de los canales

F7,C4 y T5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46Tabla 6 Paciente epiléptico. Tabla de bandas de frecuencia del canal F3 . . 48Tabla 7 Paciente epiléptico. Tabla de bandas de frecuencia del canal P4 . . 49Tabla 8 Métricas Modelo REG-LOG-01 . . . . . . . . . . . . . . . . . . . . . 53Tabla 9 Métricas Modelo REG-LOG-02 . . . . . . . . . . . . . . . . . . . . . 54Tabla 10 Métricas Modelo REG-LOG-03 . . . . . . . . . . . . . . . . . . . . . 54Tabla 11 Métricas Modelo REG-LOG-04 . . . . . . . . . . . . . . . . . . . . . 55Tabla 12 Métricas Modelo REG-LOG-05 . . . . . . . . . . . . . . . . . . . . . 57Tabla 13 Métricas Modelo REG-LOG-06 . . . . . . . . . . . . . . . . . . . . . 58Tabla 14 Métricas Modelo REG-LOG-07 . . . . . . . . . . . . . . . . . . . . . 60Tabla 15 Métricas Modelo REG-LOG-08 . . . . . . . . . . . . . . . . . . . . . 60Tabla 16 Métricas Modelo REG-LOG-09 . . . . . . . . . . . . . . . . . . . . . 62Tabla 17 Métricas Modelo REG-LOG-10 . . . . . . . . . . . . . . . . . . . . . 63Tabla 18 Métricas Modelo REG-LOG-11 . . . . . . . . . . . . . . . . . . . . . 63Tabla 19 Métricas Modelo REG-LOG-12 . . . . . . . . . . . . . . . . . . . . . 64Tabla 20 Métricas Modelo REG-LOG-13 . . . . . . . . . . . . . . . . . . . . . 66Tabla 21 Métricas Modelo REG-LOG-14 . . . . . . . . . . . . . . . . . . . . . 66Tabla 22 Varianza PCA 3 Componentes . . . . . . . . . . . . . . . . . . . . . . 104Tabla 23 Resumen experimentos PCA Regresión Logística . . . . . . . . . . . 106Tabla 24 Resumen experimentos PCA Redes Neuronales . . . . . . . . . . . . 107Tabla 25 Resumen experimentos PCA Máquinas de Soporte Vectorial . . . . 107Tabla 26 Comparación modelos Regresión Logística . . . . . . . . . . . . . . 112Tabla 27 Comparación modelos Redes Neuronales . . . . . . . . . . . . . . . 113Tabla 28 Comparación modelos SVM . . . . . . . . . . . . . . . . . . . . . . . 113

xiv

Page 13: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

I N T R O D U C C I Ó N

Según la Organización Mundial de la salud, unos 50 millones de individuos padecende epilepsia, siendo uno de los transtornos neurológicos más comunes a nivel mun-dial; de esta cifra, se estima que un 70 % podría vivir sin convulsiones y ataques si sehiciera un diagnóstico a tiempo para aplicar un tratamiento correcto. Por tanto, el pre-sente proyecto tiene como finalidad diagnosticar a personas con el fin de determinar sisufren o no de epilepsia, aplicando algoritmos de clasificación como regresión logísti-ca, redes neuronales y máquinas de soporte vectorial, los cuales han sido utilizados eninvestigaciones recientes relacionadas con el análisis de datos y el aprendizaje de máquina.

Se propone analizar señales de electroencefalograma (EEG) para determinar si unpaciente sufre de epilepsia, este examen que mide la actividad eléctrica generalmentecomo voltaje en diferentes puntos del cerebro presenta cierta complejidad sobre todo ensu tamaño y características particulares que puedan aportar al diagnóstico y etiquetado [1].

Mediante el análisis de las señales provenientes del EEG en dominio de frecuencia,se obtienen las características principales que permiten diferenciar entre una personaque sufre epilepsia, de otra que no. Estos datos, previamente identificados de acuerdo ala condición del paciente al que pertenecen, se utilizan para entrenar los algoritmos declasificación previamente mencionados, cuyos resultados se utilizan para diagnosticar anuevos pacientes.

A través de este proceso de extracción de características y clasificación mediante lastécnicas mencionados se propone realizar una comparación y detectar cuales parámetrosy configuraciones permiten que el diagnóstico de epilepsia sea más preciso.

1

Page 14: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 15: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

����� �

����������� ��� ��������

3

Page 16: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 17: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

P L A N T E A M I E N T O

En esta sección se realiza el la descripción del proyecto para lo cual primero se efectúauna presentación del problema y luego la formulación de este.

descripci ón del problema

La epilepsia es un trastorno neurológico caracterizado por una actividad eléctrica anor-mal y rítmica del cerebro o partes del cerebro, que afecta a aproximadamente cincuentamillones de personas según la Organización Mundial de la Salud [2]. El término “epilep-sia” está reservado para enfermedades crónicas, mientras que una sola crisis aislada nojustifica el diagnóstico de epilepsia [3].

Por otra parte, un electroencefalograma (EEG) es una prueba que se usa para evaluar laactividad eléctrica en el cerebro. Las neuronas, se conectan entre sí a través de impulsoseléctricos. Esta prueba permite evaluar la actividad cerebral y las posibles anomalíasasociadas a la misma, como la epilepsia; además de rastrear y registrar patrones de ondascerebrales, a través de pequeños discos planos de metal llamados electrodos, que estánunidos al cuero cabelludo con cables. Los electrodos captan los impulsos eléctricos en elcerebro y envían señales a un computador que registra los resultados [4].

Además, un EEG se compone de 21 señales correspondientes a 21 electrodos que seconectan a la superficie del cráneo. Por lo general, este examen se practica de 20 a 30minutos. Esto implica que, si la unidad de tiempo es el segundo, un EEG se puede vercomo una matriz entre 25000 hasta 38000 datos aproximadamente, lo que puede derivaren un problema relacionado con el tamaño de los datos a analizar. A cada una de estasseñales tiene asociadas 5 bandas de frecuencias para su estudio: Delta (<4 Hz), Theta (4-8Hz), Alpha (8-13 Hz), Beta (13-30 Hz) y Gamma (30-60 Hz) [4].

Sin embargo, los datos provenientes de un EEG se encuentran dados en el dominiodel tiempo, puesto que se mide la diferencia de potencial o el voltaje en un intervalo detiempo. Así que, para analizar en el dominio de la frecuencia, es necesario realizar unatransformación del dominio del tiempo al dominio de la frecuencia. Esta transformaciónse logra aplicando la transformada de Fourier a los datos del EEG. Con el resultadoarrojado por esta transformación, se pueden analizar los datos obtenidos en el EEG.

En los últimos años, se ha aplicado la estadística a través de algoritmos de MachineLearning, con el objetivo de procesar grandes cantidades de datos. Esta no es una ideareciente, sin embargo, la posibilidad de tener acceso a mayores cantidades de datos en

5

Page 18: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

6

actualidad, y además, de tener una mayor capacidad de procesamiento con las maquinaactuales, permite llevar a cabo este tipo de aplicaciones.

Así mismo, las dos grandes ramas del Machine Learning son el aprendizaje supervi-sado y el no supervisado. En el primero, los datos o conjuntos de ejemplos, son asociadosa una etiqueta que los distingue de acuerdo a ciertas características. Por ejemplo, unconjunto de automóviles puede ser etiquetado como “A”, sí comparten un mismo motor,un mismo color de carrocería, etc.

Es importante mencionar una de las aplicaciones más importantes del Machine Lear-ning, la clasificación, la cual se refiere a separar datos de acuerdo a características quetengan en común. Por ejemplo, clasificar pacientes sanos de pacientes enfermos, de acuer-do a ciertas características que permitan diferenciar entre unos y otros.

De acuerdo a lo anterior, el Machine Learning se puede utilizar como una herramien-ta para hacer clasificación entre pacientes que sufren y que no sufren de epilepsia,clasificando exámenes de estos dos tipos de pacientes, utilizando las bandas de frecuenciamencionadas anteriormente como características para diferenciar entre pacientes sanos yenfermos.

formulaci ón del problema

¿Cómo determinar las características relevantes para el análisis de anomalías relaciona-das con la epilepsia en señales EEG?

¿Cual de las siguientes tres técnicas: regresión logística, redes neuronales y máquinas devectores de soporte ofrece los mejores resultados para el diagnóstico de la epilepsia enpacientes de acuerdo a métricas seleccionadas?

Page 19: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

J U S T I F I C A C I Ó N D E L P R O B L E M A

La epilepsia es un desorden neurológico, que se produce en el sistema nervioso centraly que puede llegar a influenciar el comportamiento diario de una persona, con el riesgode sufrir convulsiones [5]. La epilepsia afecta más del 2 % de la población mundial. Laepilepsia puede ser detectada a través de la electroencefalografía, la cual consiste en tomarseñales desde la superficie del cráneo, las cuales son clasificadas en 5 bandas de frecuenciacomo Delta, Theta, Alfa, Beta y Gamma. Dado que las neuronas se comunican entre sí através de impulsos eléctricos, estos impulsos conforman las señales que posteriormenteserán clasificadas.

Por otro lado, todo electroencefalógrafo (la persona que se encarga de leer un EEG)sabe que a veces es extremadamente difícil obtener mediciones exactas para situacionesque ocurren en un EEG tales como picos, ondas agudas u otros patrones que indiquenciertas características o anormalidades; el especialista experimentado solo puede detec-tarlos “a ojo” [6]. Cabe mencionar que un EEG es de naturaleza altamente estocástica,además de tener dificultades para obtener información útil de estas señales directamenteen el dominio del tiempo con solo observarlas. Lo anterior ocurre ya que estas señales sonde naturaleza no lineal y no estacionaria.

Así como se realiza al EEG estándar con el paciente en estado reposo y despierto, el EEGse suele tomar también con el paciente en estado dormido. En ambos casos, el examenviene acompañado de estímulos como apertura y cierre de los párpados, hiperventilacióny foto-estimulación a diferentes frecuencias [7]. Esto supone que los datos entre exámenesde un mismo paciente pueden cambiar entre una toma u otra, y por lo tanto, esto tambiénpuede dificultar el diagnóstico.

De acuerdo con lo anterior, dados los elementos que conforman una señal EEG (pi-cos y curvas), resulta ser un gran reto obtener resultados certeros realizando un análisisvisual debido a la naturaleza aleatoria de la señal. Esto implica que se deben tener encuenta varios elementos que son cambiantes de acuerdo a las circunstancias, que en estecaso son las diferentes maneras de practicar el examen, para obtener estos resultados.El presente trabajo propone, a partir de dos tareas principales, diagnosticar a una personaa partir de su EEG, comparándolo contra otros, considerando las características de estasseñales, que para este trabajo serán las bandas de frecuencias, extraídas a partir de latransformada de Fourier, para posteriormente aplicar sobre estas, un algoritmo de clasi-ficación basado en datos de pacientes anteriores que ya han sido clasificados. Esto, conel fin de obtener datos cuantificables, los cuales permiten entregar mejores diagnósticosbasados en análisis numéricos.

7

Page 20: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 21: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

O B J E T I V O S

objetivo general

Desarrollar un algoritmo que permita establecer la condición de epilepsia en un paciente.

objetivos espec íficos

Determinar las características a tener en cuenta para el entrenamiento de los algorit-mos de clasificación.

Determinar los algoritmos de clasificación que se pueden emplear en esta aplicación.

Lograr el entrenamiento de los algoritmos de clasificación utilizando las característi-cas extraídas de los datos de entrenamiento.

Obtener las métricas de los resultados obtenidos con cada algoritmo aplicándolos aconjuntos de datos de prueba.

Establecer cuál es la mejor opción entre los algoritmos aplicados para diagnosticarpacientes, de acuerdo a los resultados obtenidos.

9

Page 22: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 23: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

D E L I M I TA C I Ó N

alcances

El proyecto consiste en el diseño y la implementación de 3 modelos clasificadores deseñales electroencefalográficas a través del procesamiento de señales y la aplicación detécnicas y métodos que permitan extraer las características más relevantes para distinguirun paciente sano de un paciente epiléptico. Los modelos que se utilizaron son:

Regresión Logística

Es una técnica que provee el mecanismo de regresión lineal a problemas de clasifica-ción, utilizando un modelo de la forma: z = β0 + β1x1 + β2x2 + · · ·+ βnxn dondex1 a xn representa los valores de los n atributos y βo a βn representa los pesos [8].Se escoge esta técnica al presentar una facilidad para entrenar, rapidez al clasificarmuchos registros desconocidos y su resistencia a los sobreajustes.

Red Neuronal Artificial

Proveen algoritmos de aprendizaje que se basan en el funcionamiento del cere-bro humano. El “aprendizaje” se obtiene a través del ajuste de los pesos que hayentre los nodos o neuronas conectadas. Las principales ventajas que tienen son:Adaptación, auto-organización y la tolerancia a fallos [9].

Máquina de Soporte Vectorial

Funcionan como un hiperplano que separa dos clases de datos con el mayor margenposible. Presenta precisión en la generalización de datos desconocidos y admite mé-todos de optimización especializados que permiten el trabajo con una gran extensiónde datos [10].

A partir de la investigación realizada se tiene como referencia las técnicas como Trans-formada de Fourier y Wavelet para extraer características de cada uno de los canalespresentes en las señales EEG y utilizan estas herramientas para obtener indicadores o atri-butos que permitan etiquetar a los pacientes. Posteriormente, se aplicaron los 3 modelosmencionados previamente para evaluar su precisión y eficacia, y finalmente establecer lascaracterísticas y la técnica que proporciona una mejor clasificación de los individuos.

limitaciones

En la fase práctica del proyecto se trabajaron únicamente señales EEG en formato EDF(European Data Format) dado que presenta un formato simple y flexible para el trabajo de

11

Page 24: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

12

señales biológicas y físicas multicanal y de esta manera será óptimo el estudio de canalesparticulares.

Respecto a la elaboración e implementación de los clasificadores se utilizaron las he-rramientas MATLAB® en su versión R2019b y el lenguaje de programación Python,gracias a su potencia y condiciones favorables para implementar estos algoritmos. Porúltimo, sólo fue considerada la clasificación de pacientes sanos y pacientes epilépticos, sindistinguir en variaciones o enfermedades relacionadas a la epilepsia.

Page 25: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

E S TA D O D E L A RT E

En la actualidad se han realizado múltiples estudios e investigaciones alrededor de laclasificación de señales de EEG, con la finalidad de detectar anomalías, epilepsia, des-ordenes del sueño, entre otras condiciones especiales, orientados en su mayor parte ala integración con Interfaces Cerebro-Computador o Brain Computer Interface (BCI), unconcepto que ha sobresalido en los últimos años [11], al ser un sistema que lee e interpretalas señales directamente de un individuo, toma decisiones o ejecuta algunas instruccionesa partir de estos datos de entrada.

Sumado a esto, para desarrollar un modelo o un clasificador de estas señales y po-der incorporarlas a una BCI, es necesario entender que el objetivo de la clasificaciónes poder usar ciertas métricas para decidir el origen de las mismas y los factores queinciden en ciertos patrones. Escoger las métricas que se usarán siempre es la parte máscompleja y extensa del problema de estudio [12], a esta información se le denominarácomo características y su extracción también es un tema de investigación en desarrollo.

En primer lugar, es relevante mencionar que la señal de EEG es una señal que pre-senta dificultad para ser analizada y procesada por la cantidad de ruido que presenta.En muchos casos particulares, se deben usar características variadas para hacer unaclasificación eficiente, las técnicas más usadas en la extracción de características estánrelacionadas principalmente con transformaciones en dominio de tiempo-frecuencia, quepermiten encontrar las magnitudes de frecuencia en partes específicas de la señal, comopor ejemplo la Transformada de Fourier y relacionados tal como se puede observar en [13].

Por lo anterior, se puede evidenciar en [14], un enfoque de extracción de caracterís-ticas basado en bandas de frecuencia aplicado al análisis preictal e interictal, es decir, elperiodo antes de que inicien las convulsiones en el individuo y el periodo intermedio queexiste entre una serie de convulsiones, respectivamente. A través de la descomposición conTransformada Discreta Wavelet de las señales que se encuentran en la banda de frecuenciaGamma se realiza una clasificación y posteriormente predicción de epilepsia en individuos.

De manera similar, el uso de la transformada Wavelet interviene en [15], donde seconcluye que el análisis independiente por componentes Independent Component Analysis -(ICA) junto al algoritmo de separación de Gradiente Natural para apartar el ruido de unaseñal de EEG presenta un mejor desempeño que el análisis Wavelet.

En el marco de la extracción de características, está también el enfoque usado en [16], cuyopropósito es desarrollar un método eficiente basado en un parámetro de Hjorth: Movilidad.Con este parámetro se busca reducir la complejidad computacional y aumentar la preci-

13

Page 26: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

14

sión de la detección de epilepsia. Los parámetros de Hjorth son indicadores o métricas depropiedades estadísticas del procesamiento de la señal en el dominio de tiempo [17], elparámetro de movilidad usado representa una frecuencia media del espectro de potencia.

Por otro lado, se encuentran las técnicas de clasificación y las propuestas dirigidas aetiquetar y detectar epilepsia a través de las características extraídas. Se utilizan técnicasde aprendizaje de máquina para construir los clasificadores, por ejemplo, el caso del autorde [18] y [19] quien usa la regresión logística ya que facilita el análisis de los resultados entérminos explicativos y predictivos, dado que en estas investigaciones se pretende reducirlas dimensiones de las señales antes de aplicar la regresión logística y en los resultados seobtuvo que la precisión de clasificación es de 97.91 % con el modelo de regresión logísticagaussiana.

Las redes neuronales están presentes en muchos estudios debido a la sencillez de su imple-mentación, su ventaja al poder manejar grandes cantidades de datos y sobre todo por sucapacidad de aprender a partir de ejemplos. En los trabajos [20], [21], se implementa unared neuronal de retro propagación con el fin de clasificar ondas puntiagudas y agudas queson conocidas como descargas interictales epileptiformes, que son señales característicasde la epilepsia. De estas investigaciones vale resaltar que se clasifican concretamenteaquellas ondas con comportamientos anormales o irregulares en la señal, de cierta manerael análisis visual toma un papel importante, se obtiene una tasa de reconocimiento del93.75 % en individuos que presentan señales de epilepsia y la tasa de aprendizaje es del1 %.

En adición, un trabajo a mencionar es el realizado en [22] donde se construye un clasifica-dor con Máquinas de Soporte Vectorial para detectar actividad estrechamente relacionadacon ataques derivados de la epilepsia que fueron registrados en los electroencefalogramas.Este trabajo tuvo en cuenta 5 tipos diferentes de señales de EEG y se hizo descomposicióna través de la transformada Wavelet. Dentro de las características están la energía, entropíay desviación estándar, estas fueron computadas logrando un índice de precisión cercanoal 91.2 %.

A continuación, se consideran los estudios donde se hace una comparación entre di-versas técnicas de machine learning para la clasificación de pacientes con epilepsia, este esel caso de [23], cuyo trabajo se centra en la implementación de redes neuronales multicapade retro propagación, propagación resiliente y propagación rápida, todas estas variantesde redes neuronales comparadas a Máquinas de soporte vectorial con distintas funcioneskernel tales como el lineal, polinomial y Radial Basis Function - RDF, siendo este último elque provee mayor precisión de clasificación frente a los otros métodos mencionados.

En la anterior revisión se observa que las técnicas de extracción de características máscomunes involucran transformada de Fourier, transformada Wavelet y métricas estadísti-cas que pueden proporcionar información destacada sobre comportamientos que no son

Page 27: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

15

fáciles de identificar de forma visual, además de llegar a la conclusión que es importantereducir las dimensiones y la complejidad de estas señales dada la cantidad de canalesque poseen para poder aplicar clasificadores que contrasten las características y permitanetiquetar pacientes sanos y no sanos. Es por esto que la propuesta de este documento esdetectar características y factores que influyen en estos registros para diferenciar personasque padecen de epilepsia o podrían ser susceptibles de padecer a través de modelos declasificación que se acomoden a las características seleccionadas y brinden el indicador deprecisión más alto.

Page 28: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 29: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

E S Q U E M A M E T O D O L Ó G I C O

Se planteó la siguiente metodología para cumplir los objetivos del proyecto dentro deltiempo estimado. Las fases consideradas para su realización son las siguientes:

Planteamiento del proyecto: Consta de una investigación profunda sobre el contextode electroencefalogramas y detección de epilepsia, a partir de esta exploración, seformula el problema investigando y definiendo el estado actual de la detección deepilepsia a través de EEG.

Se puntualizan los objetivos y el alcance del proyecto teniendo en cuenta los recursosde los cuales se dispone para poder construir un modelo que permita clasificarpacientes epilépticos y no epilépticos a partir de registros de EEG extrayendo las ca-racterísticas que se consideren pertinentes para implementar técnicas de aprendizajede máquina.

Selección de las fuentes de información: A partir de la extensa revisión bibliográficarealizada en la fase anterior se consolidan ideas generales sobre los temas planteados.En especial se enfoca la selección y recolección de conocimiento al tipo de registros,los formatos en los que se obtienen estos registros y la organización o estándar bajoel cual se hace, que para este caso en particular son electroencefalogramas con unestándar 10/20.

Se realiza una búsqueda en distintos repositorios para encontrar conjuntos dedatos que proporcionen al estudio un conjunto grande de exámenes EEG cuyospacientes tengan características y atributos variados, tales como sus edades, sexos,antecedentes patológicos y medicaciones. Todo esto con el fin de poder mejorar lacalidad de los modelos y prototipos que se proponen.

Propuesta para extracción de características: Se prosigue con el diseño que va ligadoa la distinción entre las métricas o atributos que pueden dar un valor agregado a losmodelos que se construirán más adelante.

El primer acercamiento para extraer características es hacer un análisis de ban-das de frecuencia.

Construcción de modelos:

Implementación: Para realizar la implementación del modelo de clasificación seusará el software MATLAB R2019b dado que tiene un ambiente optimizado parael pre procesamiento y el análisis de datos. Además de contar con herramientasadicionales que facilitan las tareas habituales, exploración de los datos (importación,filtrado y representación) e iteraciones dada la capacidad de procesamiento.

17

Page 30: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

18

Asimismo, se harán implementaciones en el IDE Spyder para trabajo con libre-rías científicas especializadas del lenguaje de programación Python ya que estelenguaje ofrece algoritmos complejos y flujos de trabajo versátiles a través de uncódigo sencillo y simple. Se usarán puntualmente los siguientes paquetes y librerías:

• Numpy: Paquete de computación científica con Python. Soportando el manejode vectores y matrices.

• Pandas.

• SciPy.

• MNE: Ofrece exploración, visualización y análisis de datos neurofisiológicoscomo MEG, EEG, sEEG, ECoG, entre otros.

Se debe comprobar que el prototipo y las implementaciones cumplan con las ex-pectativas planteadas. Para validar el desempeño y calidad de los algoritmos omodelos planteados se hará uso de una matriz de confusión que permita cuantificarla precisión y el desempeño a través de métricas.

Análisis de resultados: En la última fase del proyecto se observará detalladamentelos resultados de cada una de las pruebas aplicadas y se construirán conclusionesbasadas en la efectividad de los algoritmos, los trabajos futuros y las mejoras que sepodrían hacer al diseño y prototipo planteado.

Page 31: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

����� ��

����� �����������

19

Page 32: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 33: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

M A R C O T E Ó R I C O

Resulta adecuado describir la teoría que fundamenta la propuesta para analizar electro-encefalogramas con el fin de clasificar y diagnosticar pacientes epilépticos antes de entraren detalle con la misma, por lo tanto, se tratará en la sección 8.1 el tema de los EEGs y elestándar que es común para la recolección y toma de información. Luego, en la sección8.2 se profundizará en el procesamiento de señales y el análisis de las mismas con el finde comprender la manera en que se deben manipular y trabajar estas señales con técnicascomo la transformada de Fourier .

En adición, la sección 8.3 aborda el tema de análisis por componentes principales yreducción de dimensiones, que se enfocan en la propuesta de extracción de característicasdel presente proyecto. Finalmente, se hablará de técnicas de Machine Learning que seusan comúnmente en la clasificación de estas señales teniendo en cuenta las ventajas y elpotencial que aportan al desarrollo de esta propuesta.

se ñal eeg

El electroencefalograma (EEG) es una colección o registro de los potenciales eléctricosdel cerebro realizado por medio de electrodos conectados al cuero cabelludo de un serhumano. Esta actividad eléctrica puede ser breve o por el contrario tener potencialeseléctricos más lentos y extendidos [24]. Es muy usado para temas como ingeniería neu-ronal, neurociencias, estudio de convulsiones, análisis del sueño, interfaces de computocerebrales (BCI), entre otros, debido a su costo económico relativamente bajo, carácter noinvasivo y alta resolución temporal.

El padre de los EEG’s de humanos fue Hans Berger, quien por medio de una exten-sa serie de estudios llevó a cabo en el año 1924 lo que sería el primer registro de lasoscilaciones rítmicas del cerebro de un hombre de 17 años. Para fines investigativos, reali-zó a lo largo de su vida muchos registros electroencefalográficos, utilizando distintos tiposde electrodos tales como agujas de platino, zinc, pomo, etc. Para el año 1929 publicó elhistórico artículo resumen de sus estudios que respaldaba la teoría de que existe actividadeléctrica espontánea en el cerebro del ser humano.

Para el año 1930, preparó un segundo artículo sobre 1133 registros de un grupo de76 personas, donde designó dos tipos de ondas observados en estos registros: Ondasde menor frecuencia y mayor voltaje que fueron nombradas ondas Alfa y las de mayorfrecuencia y menor voltaje denominadas ondas Beta [25].

21

Page 34: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

22

Figura 1: Grabación de un EEG obtenido por Hans Berger en 1924 comparado con una señal detiempo de 10Hz. Fuente: [26]

Para capturar y registrar esta actividad hay que comprender el proceso interno, dondelas neuronas, células eléctricamente activas que son responsables de controlar y llevar acabo las funciones cerebrales son quienes crean potenciales de acción que básicamente sonseñales eléctricas discretas que viajan por los axones y promueven la formación de neuro-transmisores químicos en la sinapsis, todo esto, en un área de contacto entre dos neuronas.

Los neurotransmisores activan un receptor situado en la dendrita o cuerpo de la otra neu-rona involucrada en el proceso de sinapsis y esta se denomina la neurona post-sináptica[27]. La suma de todas las corrientes de las dendritas de una sola neurona causa que estagenere un potencial de acción. Luego, esta neurona hace sinapsis con otras neuronas y asísucesivamente.

Para llevar a cabo un EEG se adhieren electrodos superficiales al cuero cabelludo conayuda de un gel conductor y estos se posicionan de acuerdo a un sistema en concreto.

Los tipos de electrodos superficiales son:

Adheridos

De Contacto

En Casco de malla

De aguja

Quirúrgicos

Aunque existen sistemas diferentes, por ejemplo: Illinois, Montreal, Lennox, Schwab,Cohn, etc. El más usado actualmente es el sistema internacional 10-20 Diez-Veinte.

Sistema Internacional 10/20

Este sistema está basado en la relación que existe entre la localización de un electrodoy el área de la corteza cerebral. Los números 10 y 20 se refieren a las distancias entre

Page 35: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

23

electrodos adyacentes que tienen una proporción de 10 % o 20 % del total de la partefrontal-trasera o izquierda-derecha del cráneo.

Figura 2: Distancia entre los electrodos del sistema 10/20. Fuente: Plass-Oude Bos, Danny. (2006).EEG-based Emotion Recognition. The Influence of Visual and Auditory Stimuli.

Cada posición tiene una letra que identifica el lóbulo y un número relacionado con lalocalización del hemisferio [28].

Electrodo Lóbulo

O Occipital

P Parietal

C Central

T Temporal

F Frontal

Tabla 1: Referencias de los electrodos del sistema 10/20. Fuente: Elaboración propia.

Existen parámetros y características que diferencian las ondas o grupos de ondas de unregistro de EEG como, por ejemplo:

Frecuencia: Los patrones cerebrales tienen forma de ondas que generalmente sonsinusoidales. Por medio de la transformada de Fourier se transforma una señal encrudo de EEG en un espectro de potencia, en este último, se puede visualizar que

Page 36: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

24

la frecuencia de las ondas seno son diferentes. La actividad cerebral del individuopuede hacer ciertas frecuencias más dominantes que otras [29]. Por tanto, se hancategorizado estas frecuencias en cuatro grupos básicos:

• Beta: >13 Hz

• Alpha: 8-13 Hz

• Theta: 4-8 Hz

• Delta: 0.5-4 Hz

Distribución Topográfica: Es la ubicación fisiológica que depende del área cerebralque presenta una determinada frecuencia.

Amplitud: Se mide en micro voltios, generalmente fluctuando entre 20 - 40 µV.

Reactividad: Capacidad de cambio de un conjunto de ondas ante la estimulacióndel individuo al que se le está registrando el EEG [30]. Tales estímulos pueden ser:apertura y cierre de ojos, estímulos eléctricos, alertas, proceso mental, etc.

procesamiento de se ñales

El análisis de un EEG en tiempo y en frecuencia es una cuestión esencial en estapropuesta, aporta información relevante y adicional a las interpretaciones visuales delregistro, se puede aplicar este tipo de análisis, debido a que es una señal no estacionaria,esto brinda la oportunidad de analizar los estados del cerebro en diferentes tareas y usarconceptos como la amplitud y la frecuencia para relacionarlos con ciertos desordenes oanomalías neurológicas.

Existen muchas representaciones en tiempo-frecuencia que proveen una herramientapoderosa para el análisis de señales en el tiempo. Algunas de estas representacionesbásicas son por ejemplo la Transformada de Fourier y la Transformada Wavelet.

Análisis Espectral y Densidad Espectral de Potencia (PSD)

El análisis espectral es un método de procesamiento de señales que caracteriza elcontenido frecuencial de una señal determinada [31]. Los enfoques para la estimación delespectro se clasifican generalmente en dos clases:

1. Los métodos clásicos de tipo no paramétricos que se valen de una estimación deauto correlación de un conjunto de datos dado.

2. Los métodos no clásicos de tipo paramétrico que usan modelos para estimar losespectros de potencia.

Page 37: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

25

Método de Welch

Se basa en la transformada de Fourier para obtener la densidad espectral de potenciaa través de un promedio de los periodogramas. Según [32] el i-ésimo periodogramamodificado es:

P(i)XX( f ) =

Ts

KM

�����M−1

∑n=0

xi(n)w(n) · ej2π f n

�����

2

(1)

Donde f = fs es la variable de frecuencia normalizada usando ciclos unitarios por cadamuestra. Está el factor T de escalamiento, que ayuda a ajustar la magnitud del espectrode la señal en tiempo discreto para que sea igual al espectro de la señal análoga. Estátambien w(n) que es la función de ventaneo, finalmente la constante K que se define como

K =1M

M−1

∑n=0

w2(n) (2)

Por su parte, la ecuación que define la estimación de la densidad espectral de potenciaes:

PWXX( f ) =

1L

L−1

∑i=0

P(i)XX( f ) (3)

Transformada de Fourier en tiempo discreto

Normalmente los datos se toman o se segmentan en tiempos de tipo entero tj =t0, t1, . . . , t(N−1), por tanto se considera una versión discreta de la transformada de Fourier.Para deducir la Transformada de Fourier en tiempo discreto (DFT) se toma como referenciael caso de N muestras de tiempos iguales, es decir:

tj = jΔt j = 0, 1, 2, . . . , N − 1 (4)

El tiempo entre dos puntos vecinos en la serie de tiempo se representa con Δt y coneste tiempo se puede obtener la frecuencia de muestreo correspondiente al número demuestras tomadas por segundo que está dada por:

fs =1

Δt(5)

Para un conjunto de datos en tiempo discreto la DFT para una longitud finita se expresaa través de una aproximación a la transformada de Fourier continua dada por:

X( f ) =N−1

∑j=0

X�tj�

e−i2π f tj (6)

Page 38: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

26

reducci ón de dimensiones y an álisis por componentes principales

La reducción de dimensiones es el proceso de tomar datos en un espacio de alta di-mensión y mapearlos en un nuevo espacio cuya dimensionalidad es mucho menor. Esteproceso está estrechamente relacionado con el concepto de compresión (con pérdida) en lateoría de la información. Hay varias razones para reducir la dimensionalidad de los datos.Primero, los datos de alta dimensión imponen desafíos computacionales. Además, en algu-nas situaciones, la alta dimensionalidad puede conducir a capacidades de generalizacióndeficientes del algoritmo de aprendizaje. Finalmente, la reducción de dimensionalidad sepuede usar para interpretar los datos, para encontrar una estructura significativa de losdatos y con fines ilustrativos [33].

Uno de los métodos utilizados en la reducción de dimensiones es el análisis de compo-nentes principales. En este método, tanto la compresión como la recuperación se realizanmediante transformaciones lineales y el método encuentra las transformaciones linealespara las cuales las diferencias entre los vectores recuperados y los vectores originales sonmínimas.

Para estudiar las relaciones que se presentan entre n variables correlacionadas (quemiden información común) se puede transformar el conjunto original de variables en otroconjunto de nuevas variables que no tengan repetición o redundancia en la informaciónentre sí. Este nuevo conjunto será llamado conjunto de componentes principales. Con estatécnica se busca que la cantidad de nuevas variables sea menor en relación a las variablesoriginales [34].

Además de lo ya mencionado, cabe resaltar que el análisis de componentes principalesconstruye una transformación lineal que escoge un nuevo sistema de coordenadas parael conjunto original de datos en el cual la varianza de mayor tamaño del conjunto dedatos es capturada en el primer eje (llamado el Primer Componente Principal), la segundavarianza más grande es el segundo eje, y así sucesivamente [34].

machine learning y algoritmos de clasificaci ón

El Machine Learning, o en español, el aprendizaje de máquina se refiere a la capacidad deun computador de aprender a realizar tareas tales como predecir el clima en los próximosdías, diagnosticar a pacientes enfermos de cáncer, clasificar vinos, etc. sin la necesidad deser programados especificamente para esto. Estas y muchas otras aplicaciones ponen demanifiesto la utilidad del Machine Learning para abordar los problemas diarios y ayudar alos especialistas a tomar decisiones, atrayendo a investigadores de diferentes áreas delconocimiento [35].

Teniendo en cuenta esto, una pregunta que puede surgir es: ¿cómo aprende un compu-

Page 39: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

27

tador? Por ejemplo, cuando a un niño, sus padres le dicen que determinado objeto es unamesa. Con esta información, el empieza a asociar ciertas características a la mesa, comosu material, su forma, el número de patas, etc. En ese sentido, hay una correspondenciaentre un grupo de características y un objeto. Así mismo, un computador, a partir de unabase de conocimiento, identificar objetos a partir de sus características.

El Machine Learning hace parte de la inteligencia artificial, señalan. La idea clave de-trás del Machine Learning es que se puedan crear algoritmos que aprendan y haganpredicciones sobre los datos [36]. Una definición más específica acerca de estos puntosanteriormente indicados es la siguiente: “Se dice que un computador aprende de laexperiencia E con respecto a alguna clase de tareas T y medida de desempeño P, si sudesempeño en tareas en T, medido por P, mejora con la experiencia E” [37].

Para que esta definición quede más clara, se plantea el siguiente ejemplo. Se construyeun algoritmo que clasifica imágenes entre perros y gatos, según corresponda. La tareaT en este caso, es la de clasificar, por otra parte, la experiencia E será representada porun conjunto de imágenes, las cuales pueden representarse como matrices cuyos valorescorresponden a los píxeles de la imagen. Estas imágenes deben estar etiquetadas deacuerdo a su clase, o sea, perro o gato. Por último, el desempeño del algoritmo, se calculade acuerdo a los aciertos o fallos que tenga el algoritmo a la hora de clasificar nuevasimágenes que pasen por él. Como ya se ha indicado antes, los píxeles de la imágen actúancomo la representación de la misma dentro del algoritmo. Dentro de este contexto, se lesllama características, y actúan como la entrada del algoritmo de clasificación. La salidadel mismo, o sea el resultado, será el etiquetado de gato o perro. Las figuras 3 y 4 ilustraneste proceso.

Figura 3: Ilustración de la extracción de características y posterior clasificación de un figura. Fuente:Elaboración propia.

Regresión logística

Los métodos de regresión se han convertido en un herramientas más utilizadas enel análisis de datos relacionado con la descripción de la relación entre una etiqueta yuna o más características. Muy a menudo la variable que representa la etiqueta, es decir,el resultado, es discreta, tomando dos o más valores posibles. El modelo de regresión

Page 40: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

28

logística es el modelo de regresión más utilizado para el análisis de estos datos [38].

En la regresión logística se parte de un conjunto de funciones h que pertenecen a Rd,donde d es el número de características del algoritmo, teniendo como resultado, algúnvalor dentro del intervalo [0, 1] . Sin embargo, la regresión logística se utiliza para lastareas de clasificación: donde h(x) como la probabilidad de que la etiqueta de x sea 1. Esdecir, volviendo al ejemplo anterior, que una foto sea la de un gato (o de un perro). Laclase de hipótesis asociada con la regresión logística está asociada a la función sigmoideaφ sig: R → [0, 1]. En particular, la función sigmoidea utilizada en la regresión logística esla función logística, definida como:

El nombre “sigmoide” significa en forma de S, que se refiere a la gráfica de esta función,que se muestra en la figura 5.

Figura 4: Gráfica de ls función sigmoide. Fuente: Shalev-Shwartz, Shai. (2014). UnderstandingMachine Learning: from theory to algorithms.

Redes Neuronales Artificiales

Las redes neuronales artificiales son técnicas populares de aprendizaje automático quesimulan el mecanismo de aprendizaje en organismos biológicos, inspirado en la estructurade las redes neuronales en el cerebro. El sistema nervioso humano contiene células, que sedenominan neuronas. Las neuronas están conectadas entre sí mediante el uso de axonesy dendritas, y las regiones de conexión entre axones y dendritas se denominan sinapsis.Estas conexiones se ilustran en la figura 6. Las fortalezas de las conexiones sinápticas amenudo cambian en respuesta a estímulos externos. Este cambio es cómo se lleva a caboel aprendizaje en los organismos vivos [39].

Page 41: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

29

Figura 5: Esquema de conexiones cerebrales entre neuronas. Fuente: Orodu, Oyinkepreye. (2012).Prediction of crude oil viscosity using feed-forward back-propagation neural network.

En los modelos simplificados del cerebro, consta de una gran cantidad de célulasnerviosas (neuronas) que están conectadas entre sí en una red de comunicación compleja,a través de la cual el cerebro puede realizar cálculos altamente complejos. Las redesneuronales artificiales son construcciones formales de cálculo que se modelan según esteparadigma de cálculo [33].

El aprendizaje con redes neuronales se propuso a mediados del siglo XX. Produce unparadigma de aprendizaje efectivo y recientemente se ha demostrado que logra un rendi-miento de vanguardia en varias tareas de aprendizaje. Una red neuronal puede describirsecomo un grafo dirigido cuyos nodos corresponden a neuronas y los bordes correspondena enlaces entre ellos. Cada neurona recibe como entrada una suma ponderada de lassalidas de las neuronas conectadas a sus bordes entrantes [33].

La red neuronal más simple es el perceptrón, que se aproxima a una sola neuronacon n entradas binarias. Calcula una suma ponderada de sus entradas, y la neurona será“activada” si la suma es mayor a cero.

Como se puede ver en la imagen de la parte de abajo de la siguiente figura, a tra-vés de una neurona pueden entrar varios datos, los cuales se computan en una función, ydependiendo de su resultado, la neurona será o no activada. Para conseguir resultadoscercanos a la forma en que el cerebro humano realiza operaciones, se conectan variosperceptrones dando paso a lo que se conoce como la red neuronal feed-forward.

La red neuronal feed-forward consiste en capas discretas de neuronas, cada una conectadaa la siguiente. Esto generalmente implica una capa de entrada (que recibe entradas y lasenvía hacia adelante sin cambios), una o más “capas ocultas” (cada una de las cualesconsiste en neuronas que toman las salidas de la capa anterior, realiza algunos cálculos ypasa el resultado al siguiente capa) y una capa de salida (que produce las salidas finales).

Page 42: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

30

Figura 6: Comparación entre redes neuronales naturales y artificiales. Fuente: Richárd, Nagyfi.(2018). The differences between Artificial and Biological Neural Networks.

Al igual que el perceptrón, cada neurona (sin entrada) tiene un peso correspondiente acada una de sus entradas y un sesgo.

Figura 7: Esquema de red neuronal Feed-Forward. Fuente: Arroyo Hernandez, José . (2013).Sistema de detección y clasificación automática de granos de polen mediante técnicas deprocesado digital de imágenes.

Maquinas de Soporte Vectorial

En muchas aplicaciones, el objetivo es separar algunos datos complejos en diferentes ca-tegorías. Por ejemplo, en el reconocimiento de patrones, es posible que se necesite separardiferentes imágenes en diferentes clases, es decir, etiquetarlas con valores categóricos. En

Page 43: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

31

otras aplicaciones, se responden preguntas de sí o no, esto es, una clasificación binaria.De forma matemática, para un conjunto dado de datos dispersos, el objetivo es separarlosen diferentes dominios o tipos categóricos. En el caso más simple, las salidas son solo declase A o B, es decir, +1 o −1 [40].

La idea básica de los algoritmos de clasificación es separar diferentes muestras en diferen-tes clases. Para la clasificación binaria, como los rombos y los círculos, que se muestranen la siguiente figura, se construye un hiperplano wx + b = 0 para que estas muestras sepuedan dividir en dos clases con todos los rombos en un lado y los círculos en el otro lado.

Los vectores de soporte serán los puntos más cercanos al hiperplano, y por lo tanto,son los puntos más difíciles de clasificar. El espacio entre los vectores de soporte yel hiperplano se conoce como margen. En la figura, corresponden a las líneas puntea-das. Este margen se define como la distancia mínima entre un punto en el conjunto deentrenamiento y el hiperplano [33].

Figura 8: Hiperplano, márgenes máximos y una máquina de vectores de soporte lineal. Fuente:Xin-She Yang. (2019). Introduction to Algorithms for Data Mining and Machine Learning.

El modelo más simple de máquina de soporte vectorial, que también fue el primeroen introducirse, es el denominado clasificador de margen máximo. Funciona solo paradatos que son linealmente separables en el espacio de características y, por lo tanto, no sepueden usar en muchas situaciones del mundo real. Sin embargo, es el algoritmo másfácil de entender y constituye el componente principal para las máquinas de vectores desoporte más complejas.

Page 44: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 45: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

����� ���

���������� ��� ��������

33

Page 46: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 47: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1E X P L O R A C I Ó N D E D AT O S

El mercado mundial de EEGs está creciendo sustancialmente a medida que estosregistros se utilizan cada vez más en el diagnóstico preventivo. Esto se debe a que eldiagnóstico de una enfermedad neurológica como la epilepsia es un evento que altera lavida y afecta la capacidad de una persona para vivir un vida normal y plena. Por tanto,contar con un recurso que provea la información y los registros de EEGs es sumamenteimportante en el desarrollo de este proyecto y se necesita de un análisis exploratorioprevio para obtener las características que servirán para la propuesta de clasificación.

1.1 selecci ón y preprocesamiento

Para el proyecto se trabajó con datos que provienen de un repositorio denominadoTUH EEG Corpus, con el fin de darle un enfoque orientado a los datos, que ha permitidoun gran avance actualmente en el campo de clasificación y predicción. El consorcio dedatos de Ingeniería Neuronal (Neural Engineering Data Consortium - NEDC) ha hechoesfuerzos junto al Hospital Temple University para proveer un conjunto de datos robustoque esté disponible para la comunidad. Este corpus contiene registros de electroencefalo-gramas clínicos que fueron tomados desde el año 2002 hasta el 2013 [41].

Los datos recolectados de cada sesión se presentan en formato de datos Europeo (Euro-pean Data Format - EDF) y un factor diferencial del corpus, es que cuenta con un archivoplano que contiene un reporte detallado sobre el paciente, su historia clínica y las me-dicaciones del mismo, además de dos atributos adicionales: impresión y correlación clínica.

1.1.1 Recolección de datos

La mayoría de los datos fueron recolectados usando el equipo de registros NicoletOnede la NMI, este sistema almacena los datos en un formato privativo desarrollado por Natus.

Estos datos almacenados no contienen en su totalidad el registro original ya que hasido podado, eliminando secciones de carácter no informativo por un técnico a cargo. Portanto está en área de investigación la evaluación de herramientas de código abierto quepermitan hacer ingeniería inversa a partir del formato privativo Natus para obtener elregistro original sin secciones eliminadas.

Los datos clínicos son de por sí desordenados, estos datos se recolectaron de varias áreasdel Hospital, tales como: Unidad de Cuidados Intensivos (UCI), la Unidad de Monitoreo

35

Page 48: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

36 exploraci ón de datos

de Epilepsia (EMU), emergencias y servicios ambulatorios [42].

1.1.2 Formato de los datos

El formato EDF en el que se encuentran los registros del corpus utiliza representaciónASCII para las cabeceras del archivo, por otro lado los datos de la señal se almacenancomo una señal multicanal en donde las muestras son codificadas como enteros de 16 bits[43].

En estos registros clínicos no hay garantía alguna de que los canales de la señal electro-encefalográfica aparezcan en el mismo orden en cada uno de los archivos. Cada canal estáetiquetado y la forma correcta de acceder a los mismos es por su etiqueta en vez de porsu posición en el archivo. En estos registros se usa el sistema 10/20.

1.1.3 Etiquetas de los canales

Cada EDF está etiquetado con un conjunto de etiquetas que no se encuentran estandari-zadas. Sin embargo, los nombres de estas etiquetas son descriptivos de forma tal que sepueda inferir su naturaleza y localización. Los números pares son usados para denotarelectrodos en el hemisferio derecho y los números impares se refieren a los del hemisferioizquierdo.

1.1.4 Montaje bipolar

Los pares de electrodos se combinan constituyendo el montaje bipolar, que registradiferencia de voltaje entre dos electrodos colocados en áreas de actividad cerebral. Estemontaje se usa para reducir el ruido y enfatizar en los eventos de interés, como los picos.En ocasiones estos resulta en una señal más clara y más fácil de interpretar. No obstante,hay combinaciones de electrodos que son mucho más vulnerables a artefactos específicos.

En el hospital Temple University se usan varios montajes, aunque uno de los montajesbipolares más populares entre los neurólogos es el parasagital central temporal (TemporalCentral Parasagittal - TCP) o también conocido como el montaje doble-banana.

1.1.5 Selección de datos

El subconjunto de datos seleccionado para el proyecto consiste en 20 pacientes sanos y20 pacientes enfermos de edades entre los 19 y los 81 años, con una edad promedio de 53años (desviación estándar de 17 años). De los sujetos, 22 son mujeres, 18 son hombres. En

Page 49: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1.1 selecci ón y preprocesamiento 37

Figura 9: Ubicación de los electrodos según el montaje bipolar o doble-banana. Fuente: Tomadode [44].

el ANEXO 1, se puede encontrar una tabla detallada con información relevante de cadasujeto.

Figura 10: Distribución de edades de los pacientes. Nótese que predominan los pacientes entre 62y 70 años. Fuente: Elaboración propia.

Page 50: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

38 exploraci ón de datos

�������� ���������

����

��

��

��

������

��������

���������

Figura 11: Conteo de pacientes según su sexo. Nótese que predominan las mujeres en la muestratomada. Fuente: Elaboración propia.

1.2 extracci ón de caracter ísticas

Para la extracción de características se realizó un análisis espectral de las señales,que consiste en una evaluación de un rango de cantidades relacionadas, para este casoespecífico el dominio que se evalúa es la frecuencia [45]. Para el análisis espectral, losinvestigadores han usado Transformada Wavelet y distribuciones tiempo-frecuencia conel fin de analizar los patrones en los EEG.

Uno de los métodos comunes para analizar la información de los EEG consiste endescomponer la señal en bandas de frecuencia. Esta descomposición se logra con laTransformada de Fourier. Para calcular la transformada de Fourier se recurre la mayoríade las veces a la transformada rápida de Fourier, la cual se emplea en este proyecto debidoa que permite extraer elementos característicos de la señal como patrones, picos, etc. Estodisminuye el tamaño de los datos, lo que implica un mejor desempeño en el análisis delos mismos.

Además la transformada rápida de Fourier es una operación que facilita convertir señalesdel dominio de tiempo a frecuencia. A partir de este dominio es que se pueden encontrarlas características mencionadas anteriormente. Esto último facilita la identificación y clasi-ficación entre personas enfermas y sanas. Como se aprecia en la figura 12 , en el dominiodel tiempo, no es posible encontrar diferencias evidentes entre las señales emitidas porun EEG de una persona enferma comparada con el de una persona sana.

Page 51: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1.2 extracci ón de caracter ísticas 39

������������

������

������

��������

�������������������������������������������������������

� ����� ������ ������ ������ ������ ������

������

������

������

��������

����������������������������������������������������

Figura 12: Comparación entre la señal de un paciente epiléptico y un paciente no epiléptico en eldominio del tiempo. No se puede encontrar diferencias a simple vista a través de unanálisis visual. Fuente: Elaboración propia.

Sin embargo, utilizando la Transformada Rápida de Fourier, se pueden identificardiferencias entre los exámenes. Esto es debido a que un daño severo en el cerebro produceuna actividad dominante de baja frecuencia [13].

Por ejemplo, en la parte inferior de la figura 13 se ilustra las componentes en domi-nio de frecuencia para un paciente enfermo, que como se puede ver son más bajas queaquellas de un paciente sano. Como se puede ver, el tamaño de las componentes para unpaciente enfermo es menor al de uno sano. La figura en la parte inferior de 13 correspondeal examen de una mujer de 46 años con un episodio de convulsiones que no sólo implicabasacudidas sino también mordeduras del lengua (Véase más información en el anexo A).

������������������

���

���

���

��������

�������������������������������������������������������������

� �� ��� ��� ��� ���

���������������

���

���

���

���

��������

����������������������������������������������������������

Figura 13: Comparación entre la señal de un paciente epiléptico y un paciente no epiléptico en eldominio de la frecuencia. Se observan menos componentes en frecuencia en la señal delpaciente epiléptico. Fuente: Elaboración propia.

Page 52: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

40 exploraci ón de datos

Siguiendo con el ejemplo anterior, en el gráfico superior de la figura 13 se puede observarel examen de una persona sana, que en este caso corresponde al de una mujer de 26 añoscon varios paros cardíacos 12 horas antes de ser tomado el examen, esta paciente nuncaha sido diagnosticada con epilepsia, lo anterior se puede validar en la sección de anexos A.

Asimismo, se debe mencionar que la Transformada Rápida de Fourier realiza un mues-treo sobre la señal, extrayendo información de acuerdo a ventanas determinadas por lafrecuencia de muestreo descrita en la sección dedicada a la presentación y limpieza de losdatos utilizados en las implementaciones del presente proyecto.

Lo anterior se lleva a cabo de la siguiente forma. Se toma la señal EEG en dominiodel tiempo transformándola al de frecuencia a través de la transformada de Fourier.Posteriormente, tomando como referencia la frecuencia de muestreo que para este caso esdada por la información del examen, se realiza el muestreo con el fin de cuantificar losdatos de la señal.

Por último, se calcula el valor absoluto de la transformación obtenida. Estos son losdatos que se muestran en los gráficos mencionados anteriormente. Así por ejemplo, sepuede identificar cuando un paciente tiene daños cerebrales.

1.3 paciente no epil éptico

El paciente del examen que se toma como referencia es un hombre de 75 años al que sele realiza el examen por cambios en el estado mental. Fue entubado y se le suministró unsedante llamado Midazolam1, a pesar de que el efecto del sedante se suspende rápida-mente el paciente no despierta, por lo tal este examen se toma en estado de somnolencia.El examen tiene un número de 21 canales.

Los canales seleccionados de acuerdo a un análisis morfológico o visual de este examenen particular son F3,C3,P3,T4 y F7.

1.3.1 Canal F7 Frontal exterior izquierdo

Se tiene la señal del canal frontal exterior izquierdo en el dominio del tiempo, se observaque alcanza valores de amplitud de 150 microvoltios y su comportamiento general poseevalores de amplitud entre 50 y -50 microvoltios.

Tomando la señal original en el dominio del tiempo y aplicando el análisis de Fourierpropuesto, se evidencia la existencia de un gran número de componentes frecuenciales conamplitudes que varían. En el canal F7 particularmente, las amplitudes de los componentes

1 El midazolam pertenece a una clase de medicamentos llamados benzodiazepinas. Actúa al hacer más lentala actividad del cerebro para facilitar el relajamiento y el sueño. Fuente: Tomado de [46].

Page 53: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1.3 paciente no epil éptico 41

0 50000 100000 150000 200000 250000 300000

0

5

1e−5 F3

0 50000 100000 150000 200000 250000 300000

0

5

1e−5 C3

0 50000 100000 150000 200000 250000 300000

0

5

1e−5 P3

0 50000 100000 150000 200000 250000 300000

0

5

1e−5 T4

0 50000 100000 150000 200000 250000 300000

0

5

1e−5 F7

Figura 14: Canales seleccionados en el dominio del tiempo para un paciente no epiléptico. Fuente:Elaboración propia.

0 50000 100000 150000 200000 250000 300000

Tiempo

0

1

2

3

4

5

6

7

8

Amplitud

1e−5 Señal en el dominio de tiempo

Figura 15: Canal F7 en el dominio del tiempo. Fuente: Elaboración propia.

no son muy altas pues su rango está entre 0 y 0,05 microvoltios, además de dos picosparticulares que tienen una amplitud de 0,15 microvoltios.

Page 54: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

42 exploraci ón de datos

� �� ��� ��� ��� ���

���������������

������

������

������

������

������

������

������

������

������

��������

���������������������������������

Figura 16: Canal F7 en el dominio de la frecuencia. Fuente: Elaboración propia.

Posteriormente, se realiza la primera técnica de extracción de características por canal,donde se hacen los cálculos pertinentes para obtener un único número que represente lacontribución de una banda de frecuencia particular al potencial total de la señal.

Como se observa en la tabla 2, la banda de frecuencia con mayor presencia en la señales la banda Delta. Se puede interpretar que la señal contiene un 95.6 % de potencial en labanda de frecuencia delta.

Banda de frecuencia Potencia relativa

Alpha 0.0069Beta 0.0062Delta 0.9561Gamma 0.0174Theta 0.0131

Tabla 2: Sumario de potencia relativa de las bandas de frecuencia del canal F7. Fuente: Elaboraciónpropia.

1.3.2 Canal T4 Medial exterior derecho

Para el caso del canal T4 se observa tambien que la banda Delta es la más presentecon un 91.8 % y le sigue la banda Theta con un 2.6 %, se puede examinar que el resto debandas están presentes en proporciones pequeñas en comparación con la banda Delta.

Page 55: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1.3 paciente no epil éptico 43

0 50000 100000 150000 200000 250000 300000

Tiempo

0

2

4

6

8

Amplitud

1e−5 Señal en el dominio de tiempo

Figura 17: Canal T4 en el dominio de la frecuencia. Fuente: Elaboración propia.

� �� ��� ��� ��� ���

���������������

������

������

������

������

������

������

������

������

������

��������

���������������������������������

Figura 18: Canal T4 en el dominio de la frecuencia. Fuente: Elaboración propia.

1.3.3 Canal F3, C3, P3

Para los canales frontal interno izquierdo (F3), medial interno izquierdo (C3) y elposterior interno izquierdo (P3) se tabula la información y se verifica que al igual que enlos canales F7 y T4, la banda con mayor valor relativo es la banda delta. La banda alphatiene poca presencia en los canales de este examen de acuerdo a la Tabla 4.

Page 56: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

44 exploraci ón de datos

Banda de frecuencia Potencia relativa

Alpha 0.0197Beta 0.0163Delta 0.9187Gamma 0.0186Theta 0.0264

Tabla 3: Sumario de potencia relativa de las bandas de frecuencia del canal T4. Fuente: Elaboraciónpropia.

Canal Alpha Beta Delta Gamma Theta

F3 0.0172 0.0132 0.9113 0.0306 0.0274C3 0.0185 0.0153 0.8738 0.0632 0.0287P3 0.0241 0.0183 0.7439 0.1764 0.0367

Tabla 4: Sumario de potencia relativa de las bandas de frecuencia de los canales F3,C3 y P3. Fuente:Elaboración propia.

Este análisis realizado coincide con la descripción del exámen, dado que las bandasDelta están relacionadas con un estado de sueño profundo inducido, en este caso porlos efectos del sedante, también puede indicar que el paciente tiene lesiones o dañoscerebrales [47].

Page 57: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1.4 paciente epil éptico 45

1.4 paciente epil éptico

Respecto al paciente enfermo, para este análisis se tuvo en cuenta una paciente 75 añoscon problemas de incontinencia urinaria. Los exámenes se le han realizado de mientrasla paciente estaba en estado de inconsciencia, siendo tratada con medicamentos anticonvulsivos como Dilantin y Lorazepam2.

Para este análisis, se tuvieron en cuenta 5 de los 21 canales que conforman la confi-guración 10-20 para la toma del EEG. Estos canales seleccionados destacan dadas suscaracterísticas visuales como picos, patrones y curvas en las señales. La figura 19 muestralos canales seleccionados para el siguiente análisis.

Los canales seleccionados de acuerdo a un análisis morfológico o visual de este examenen particular son F7, C4, T5, F3 Y P4.

��� ��� ��� ��� ���

���

�����

�������

��� ��� ��� ��� ���

���

�����

�������

��� ��� ��� ��� ���

���

�����

�������

��� ��� ��� ��� ���

���

�����

�������

��� ��� ��� ��� ���

���

�����

�������

Figura 19: Canales seleccionados en el dominio del tiempo para un paciente epiléptico. Fuente:Elaboración propia.

2 El Dilantin es un medicamento utilizado para prevenir las convulsiones. Fuente: Tomado de [48].

Page 58: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

46 exploraci ón de datos

1.4.1 Canal F7, C4, T5

El canal F7 hace parte del lóbulo frontal del cerebro; el canal C4 que se identifica comoel medial interno derecho y el canal T5 que se identifica como posterior exterior izquierdo.Como se puede ver en las figuras 20, 21 y 22, las bandas F7, C4 y T5 tienen muy pocaactividad en el dominio de la frecuencia, con una alta presencia de la banda delta (0-4Hz). Esto indica lesiones cerebrales según [47].

� �� ��� ��� ��� ���

���������������

���

���

���

���

���

���

��������

���������������������������������

Figura 20: Canal F7 en el dominio de la frecuencia. Fuente: Elaboración propia.

Por otra parte, en la tabla 5 se pueden ver los valores relativos de estos tres canales,dónde claramente se observa la predominancia de la banda delta, aunque con valoresmás bajos con respecto al paciente sano analizado anteriormente, lo que indica que eneste caso, la predominancia de la banda Delta corresponde a lesiones cerebrales como semencionó anteriormente.

Canal Alpha Beta Delta Gamma Theta

F7 0.0149 0.0484 0.4481 0.2237 0.0527C4 0.0279 0.0320 0.4599 0.0778 0.0872T5 0.0209 0.0182 0.5179 0.0451 0.0367

Tabla 5: Sumario de potencia relativa de las bandas de frecuencia de los canales F7,C4 y T5. Fuente:Elaboración propia.

Page 59: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1.4 paciente epil éptico 47

� �� ��� ��� ��� ���

���������������

���

���

���

���

���

���

��������

���������������������������������

Figura 21: Canal C4 en el dominio de la frecuencia. Fuente: Elaboración propia.

� �� ��� ��� ��� ���

���������������

���

���

���

���

���

���

��������

���������������������������������

Figura 22: Canal T5 en el dominio de la frecuencia. Fuente: Elaboración propia

1.4.2 Canal F3

El canal F3 pertenece al lóbulo frontal en su parte izquierda. En la figura 23, se puedeapreciar una amplitud baja y predominancia de la banda delta, lo que coincide con losanálisis previos ya realizados. Cabe destacar, que según los datos de la tabla 6, la bandagamma tiene una presencia de casi la tercera parte de la banda delta, por lo que se puede

Page 60: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

48 exploraci ón de datos

mencionar que la paciente tiene problemas con el pensamiento abstracto y de memoria[47].

� �� ��� ��� ��� ���

���������������

���

���

���

���

���

���

��������

���������������������������������

Figura 23: Canal F3 en el dominio de la frecuencia. Fuente: Elaboración propia.

Banda Potencia relativa

Alpha 0.0167Beta 0.0379Delta 0.4415Gamma 0.1481Theta 0.0636

Tabla 6: Sumario de potencia relativa de las bandas de frecuencia Canal F3. Fuente: Elaboraciónpropia.

1.4.3 Canal P4

El canal P4 pertenece al lóbulo parietal, ubicándose en la parte posterior derecha delcerebro. En la figura 24, se puede ver que como en los canales anteriormente analizados,existe una alta presencia de la banda delta en el canal. Además, según los datos de latabla 7, la banda delta contiene más de la mitad de componentes en el dominio de lafrecuencia, lo que refleja un gran daño en la zona posterior del cerebro [47].

Page 61: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

1.4 paciente epil éptico 49

� �� ��� ��� ��� ���

���������������

���

���

���

���

���

�����������

���������������������������������

Figura 24: Canal P4 en el dominio de la frecuencia. Fuente: Elaboración propia.

Banda Potencia relativa

Alpha 0.0253Beta 0.0185Delta 0.5307Gamma 0.0270Theta 0.0904

Tabla 7: Sumario de potencia relativa de las bandas de frecuencia Canal P4. Fuente: Elaboraciónpropia.

Page 62: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 63: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2R E G R E S I Ó N L O G Í S T I C A

Un primer enfoque para la clasificación de individuos en las clases propuestas fue laaplicación de un modelo de Regresión Logística, teniendo en consideración el hecho deque la clasificación de la variable dependiente es binaria (Epiléptico y No Epiléptico).

Por ende, se realizaron experimentos tomando dos datasets distintos generados a partirde las bandas de frecuencia y la información relacionada como se observó en la sección 1.El primero con valores de potencia relativa, representando así la proporción de la bandaen cada canal del electroencefalograma y el segundo, una media aritmética de cada bandapor canal.

2.1 potencia relativa de las bandas de frecuencia

En primer lugar, se definen las variables de entrada, estos coeficientes representan laproporción entre la potencia relativa de la banda de frecuencia sobre la potencia total delcanal que se está analizando, teniendo así:

logit (P1) = ln�

P1

1 − P1

�= β0 + β1x1 + · · ·+ β5x5 = β0 +

5

∑i=1

βixi (7)

Siendo:

βn =Potencia relativa

Potencia total de la señal(8)

El experimento base que se realizó no tuvo ajuste de parámetros particulares y seconstruyó el modelo con los parámetros por defecto que la librería ofrece. El método deoptimización quasi-Newton que se utilizó en el experimento base es el método “lbfgs”,una derivación del método Broyden-Fletcher-Goldfarb-Shanno (BFGS) con memoria limitada.Este método de optimización, es análogo al método de Newton, particularmente se usauna estimación de la matriz Hessiana inversa, se recomienda dado el ahorro de memoriade computo y su rendimiento cuando los conjuntos de datos son pequeños [49]. Laexactitud del modelo fue de 54 % que indica una mala clasificación de los pacientes, portanto en los siguientes experimentos se realiza un ajuste de los parámetros del modelopara obtener resultados más altos en torno a las métricas.

Modelo REG-LOG-01:El método solver que se tomó en este experimento fue “liblinear”, que es un clasifi-cador lineal, es conocida como una de las técnicas de aprendizaje más prometedoras

51

Page 64: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

52 regresi ón log ística

para altas cantidades de datos dispersos con muchas características. Este solver usaun algoritmo de descenso de coordenadas que resuelve problemas de optimizaciónrealizando sucesivamente la minimización aproximada a lo largo de direcciones decoordenadas o hiperplanos de coordenadas [50].

Aplica selección de parámetros automática, tambien conocida como regularizaciónL 1 y es un solver altamente recomendado cuando el dataset tiene una dimensiona-lidad alta.

Se hace uso de la regularización para combatir el sobreajuste del modelo. Para esteexperimento y con el fin de minimizar la magnitud de los pesos, se hace uso de lapenalización L 1 o tambien conocida como penalización Lasso que tiende a usarseen modelos dispersos y lo que hace es anular el peso de algunas características, deesta manera explicita qué características son irrelevantes para el modelo [51].

������������� ����������

����������

�������������

����������

������������

��� ��

��� ��

��

���

���

���

���

���

���

���

Figura 25: Matriz de confusión Modelo REG-LOG-01. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Como se observa en la matriz de confusión de la figura 25, la métrica derivada de estainformación que más alta está es la exhaustividad para la clase “No epiléptico”‘.Paraeste modelo en particular no se usó ninguna técnica de escalado de características,se seleccionó dado que tiene la métrica de exhausitividad más alta dentro de esteconjunto de experimentos.

Modelo REG-LOG-02:En este experimento se usa un solver denominado “saga”, que es una variante del

Page 65: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.1 potencia relativa de las bandas de frecuencia 53

Métrica Valor

Exactitud 0.549Precision 0.579Exhaustividad 0.33

Tabla 8: Métricas Modelo REG-LOG-01. Fuente: Elaboración propia.

algoritmo de gradiente promedio estocástico (SAG), su diferencia radica en que ad-mite la opción de penalización no uniforme L 1. Por lo tanto se aconseja su uso pararegresión logística multinomial dispersa y para el caso de conjuntos de datos muygrandes [52]. El parámetro de penalización que se usó fue elasticnet, este parámetroindica que se usará penalización Lasso (L 1) y Ridge (L 2), pero se debe dividir oponer más peso a una de las penalidades, por lo cual con el parámetro L 1_ratiose le indica que tanta penalización Lasso debe aplicar. Para este experimento se leindicó que un 40 % de la penalización debia hacerse con L 1.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

��

��

Figura 26: Matriz de confusión Modelo REG-LOG-02. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

En este experimento se seleccionó un parámetro C diferente al que viene por defectoC = 1. Este parámetro se denomina el Inverso de regularización y es una variablede control que desincentiva y regula el sobreajuste del modelo [53]. Entre menor seael parámetro C, la fuerza del regulador Lambda aumentará:

Page 66: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

54 regresi ón log ística

Métrica Valor

Exactitud 0.585Precisión 0.550Exhaustividad 0.377

Tabla 9: Métricas Modelo REG-LOG-02 Fuente: Elaboración propia.

C =1λ

(9)

En el experimento se usó un factor C = 0,1 por ende λ = 10. La exactitud del modelofue de 0, 585 que fue el valor más alto dentro de este conjunto de experimentos y laexhaustividad del modelo es bastante bajo ya que es de un 37.7 %.

Modelo REG-LOG-03:Para este experimento se usó el solver Limited BFGS (“lbfgs”), que es un métodoanálogo al método de Newton, sin embargo tiene una particularidad que consisteen el uso de una estimación de la inversa del Hessiano[54]. El término de memorialimitada significa que almacena sólo unos vectores que representan tal aproximación.Se dice que si el conjunto de datos es pequeño “lbfgs” funciona mejor que losotros métodos y ahorra mucha memoria, por lo tanto se toma este experimentocomo referencia, dado que el conjunto de datos es pequeño en comparación a otrosestudios relacionados [55].

Métrica Valor

Exactitud 0.519Precisión 0.549Exhaustividad 0.367

Tabla 10: Métricas Modelo REG-LOG-03. Fuente: Elaboración propia.

Para este solver se aplica una penalización L 2, esta tiende a dar como resultadotodos los coeficientes de las características pequeños pero distintos de cero, mientrasque la aplicación de una penalización L 1 tiende a generar muchas regresiones[56]. Como se observa en 10, la exactitud del modelo es bajo y una métrica que semantiene baja sigue siendo la exhaustividad.

Modelo REG-LOG-04:Para este experimento se tomaron 210 muestras: 105 muestras pertenecientes a la

Page 67: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.1 potencia relativa de las bandas de frecuencia 55

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

��

��

Figura 27: Matriz de confusión Modelo REG-LOG-03. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

clase “Epiléptico” y 105 muestras de la clase “No epiléptico”. Las característicasson las 5 bandas expresadas de manera porcentual de acuerdo a su presencia enla totalidad de la señal. El solver utilizado para este experimento es “lbfgs”, concoeficiente inverso de regularización C = 1 y el parámetro de penalización es RidgeL 2.

Aún cuando el tamaño de las muestras se reduce, las métricas se mantienen similaresy son bajas, como se observa en la tabla 11 y en la matriz de confusión de 28. Laprecisión de clasificación del modelo es 60 %.

Métrica Valor

Exactitud 0.72Precisión 0.60Exhaustividad 0.72

Tabla 11: Métricas Modelo REG-LOG-04. Fuente: Elaboración propia.

Debido a la reducción del conjunto de datos, la mejora que se observó en esteexperimento fue la exactitud del modelo, ya que esta incrementó a un 72 % un valorsignificativo tomando como referencia el valor más alto de la subsección 2.1 quecorresponde a un 58.5 %. Este valor es relevante dado que indica la capacidad de

Page 68: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

56 regresi ón log ística

������������� ����������

����������

�������������

����������

������������

�� ��

� ��

��

��

��

��

��

Figura 28: Matriz de confusión Modelo REG-LOG-04. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

predicción o proceso para generar valores basados en un modelo entrenado teniendodatos de entrada desconocidos para el mismo.

Modelo REG-LOG-05:En este modelo fueron seleccionados 210 datos del conjunto original, en contrastecon el modelo REG-LOG-04, fueron añadidas 3 features adicionales a los valoresporcentuales de las bandas de frecuencia:

• AlphaGamma: Producto entre las columnas Alpha y Gamma.

• BetaDelta: Producto entre las columnas Beta y Delta.

• Media: Valor medio de los coeficientes porcentuales de las 5 bandas.

El parámetro inverso de regularización no se modificó y se conserva en C = 1, el sol-ver bajo el cuál se hizo la optimización fue el algoritmo “liblinear” con un parámetrode penalización Lasso L 1. Dadas estas condiciones el modelo mejoró sus métricasen gran magnitud como se observa en la tabla 12. La métrica para el modelo es supe-rior al 73 % y la clasificación mejoró como se observa en la matriz de confusión de 29.

Con la finalidad de reducir el sobreajuste del modelo, lo que se realizó en esteexperimento fue un aumento de la información, en lugar de aumentar y recolectarmás datos (Agregar otros exámenes) se hace que la información existente sea másdiversa, por tanto se usan técnicas para incrementar los datos de forma que cada

Page 69: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.1 potencia relativa de las bandas de frecuencia 57

������������� ����������

����������

�������������

����������

������������

�� �

� ��

��

��

��

��

��

��

��

Figura 29: Matriz de confusión Modelo REG-LOG-05. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Métrica Valor

Exactitud 0.733Precisión 0.739Exhaustividad 0.68

Tabla 12: Métricas Modelo REG-LOG-05. Fuente: Elaboración propia.

que una muestra es procesada por el modelo esta se pueda diferenciar de la muestraanterior. Lo que se produce acá es una restricción para que al modelo le sea másdifícil aprender los parámetros por cada muestra [57].

REG-LOG-06:A pesar de que los resultados del experimento anterior son altos, se agregan 210muestras adicionales correspondientes a 10 examenes de los datos del conjuntooriginal con las 8 características usadas en el modelo REG-LOG-06 (5 bandas defrecuencia, Alpha*Gamma, Beta*Delta y Media) con el fin de evaluar el rendimientoy precisión del modelo para una cantidad de datos más extensa.Se segmentan losdatos en entrenamiento y pruebas, usando el método “saga”, penalización elasticnetcon una tasa de Lasso L 1 del 30 %.

Page 70: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

58 regresi ón log ística

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

��

��

��

Figura 30: Matriz de confusión Modelo REG-LOG-06. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Métrica Valor

Exactitud 0.675Precisión 0.61Exhaustividad 0.52

Tabla 13: Métricas Modelo REG-LOG-06 Fuente: Elaboración propia.

Tomando como referencia la tabla 13, se puede observar un descenso en las métricasy la exactitud del modelo. Por tanto se analizan otras técnicas para que estos indica-dores en la implementación de los modelos, que serán descritas a continuación en lasubsección 2.2.

2.2 media aritm ética de las bandas de frecuencia

Los experimentos realizados aplicando la media aritmética de las bandas se dividieronen dos grandes grupos. Se tuvieron en cuenta los datos de 20 pacientes sanos y 20 pacien-tes enfermos, para un total de 40 exámenes, cada uno de ellos con 21 canales, para untotal de 588 ejemplos para el conjunto de entrenamiento, y 252 ejemplos para el conjuntode prueba. Las características para el experimento serán cada uno de los promediosmencionados anteriormente, por lo tanto, cada ejemplo tendrá 5 características (5 bandas

Page 71: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.2 media aritm ética de las bandas de frecuencia 59

de frecuencia), y podrán tomar valores de clase de 0 si son sanos, o 1 si son pacientes quesufren de epilepsia.

Para los experimentos realizados se modificaron principalmente tres parámetros pa-ra el algoritmo de Regresión Logística, estos son el método de optimización, el coeficienteC que corresponde al inverso de la tasa de regularización λ, lo que significa que entre másbajo este valor, más alta será la regularización; y la regla de penalidad a ser utilizada porel algoritmo de optimización.

REG-LOG-07:

El primer modelo utilizó como algoritmo de optimización el “lbfgs” utilizado enfunciones con un gran número de parámetros o una gran complejidad, haciendouso limitado de la memoria [33]. La regla de penalidad es L 2, la cual agrega elcuadrado de la magnitud del coeficiente como término de penalización a la funciónde optimización [33]. Por su parte, el coeficiente inverso de regularización es C = 1.

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

��

��

��

���

Figura 31: Matriz de confusión Modelo REG-LOG-07. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

En la tabla 14 están los valores de las métricas obtenidas a partir de la matriz, estasson la exactitud que mide el total que coinciden entre las predicciones y los valoresreales sobre el total de datos, el valor de la precisión, que intenta resolver la siguientepregunta ¿Qué proporción de identificaciones positivas fue correcta? Por su parte laexhaustividad calcula la proporción de positivos reales identificados correctamente.

Page 72: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

60 regresi ón log ística

Métrica Valor

Exactitud 0.591Precisión 0.632Exhaustividad 0.355

Tabla 14: Métricas Modelo REG-LOG-07 Fuente: Elaboración propia.

Como se puede ver en la tabla 14, el experimento arrojó resultados pobres, dadoque la precisión está bastante alejada de 1. Se puede afirmar entonces que cuandopredice que un canal pertenece a un paciente con epilepsia, acierta el 65 % de lasveces. Por otra parte la exhaustividad indica que el modelo identifica correctamenteaproximadamente el 33 % de los canales de personas con epilepsia.

A partir de la información, se concluye que el modelo está su-entrenado. Una de lasestrategias para mejorar esa situación es añadir nuevas características.

REG-LOG-08:En el siguiente modelo se agregan tres nuevas características polinómicas, con baseen las existentes (BetaGamma, GammaDelta y BetaTheta) con el fin de mejorar losresultados anteriores. Para este modelo se aplico un coeficiente C = 10, utilizandocomo algoritmo de optimización “lbfgs” y como penalidad L 2. En la figura 32 y enla tabla 15 se ven los resultados de añadir nuevas características al modelo.

Métrica Valor

Exactitud 0.619Precisión 0.623Exhaustividad 0.520

Tabla 15: Métricas Modelo REG-LOG-08 Fuente: Elaboración propia.

Con base en los últimos resultados se observa el aumento de la exhaustividad yla exactitud, aunque disminuyó la precisión, todo esto comparado con el modeloREG-LOG-08.

REG-LOG-09:Dado que las métricas mejoraron en el modelo REG-LOG-10, para el este modelo seañadieron dos nuevas características correspondientes al promedio y la mediana delas 5 bandas de frecuencia. En la tabla 33 y en la matriz de confusión de la figura 16se ven los resultados con la adición de estas características, por lo que pasan a ser10.

Page 73: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.2 media aritm ética de las bandas de frecuencia 61

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

Figura 32: Matriz de confusión Modelo REG-LOG-08. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

Figura 33: Matriz de confusión Modelo REG-LOG-09. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Los resultados de la tabla 16 muestran la mejora de las métricas mediante el au-mento del número de características en el modelo. Como este, se realizaron más

Page 74: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

62 regresi ón log ística

Métrica Valor

Exactitud 0.630Precisión 0.637Exhaustividad 0.537

Tabla 16: Métricas Modelo REG-LOG-09. Fuente: Elaboración propia.

experimentos que serán descritos más adelante, pero cuyos resultados empeorarona medida que se añadieron nuevas características.

REG-LOG-10:

El modelo REG-LOG-10 es el primer modelo en el que se tomó una cantidad menorde muestras para entrenamiento. En total se tomaron 160 datos como y 40 restantespara pruebas. Al igual que en el primer grupo de experimentos, se varían parámetroscomo el algoritmo de optimización que para este modelo fue “newton-cg” y comopenalidad L 2. Entre tanto, el coeficiente C = 100.

������������� ����������

����������

�������������

����������

������������

�� �

� ��

��

��

��

��

��

Figura 34: Matriz de confusión Modelo REG-LOG-10. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Como se puede ver en la tabla 17, el experimento arrojó muy buenos resultadoscomparados con los de la sección anterior. Se puede afirmar entonces que cuandopredice que un canal pertenece a un paciente con epilepsia, acierta el 92 % de lasveces. Por otra parte la exhaustividad indica que el modelo identifica correctamente,

Page 75: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.2 media aritm ética de las bandas de frecuencia 63

Métrica Valor

Exactitud 0.841Precisión 0.875Exhaustividad 0.750

Tabla 17: Métricas Modelo REG-LOG-10. Fuente: Elaboración propia.

cerca del 74 % de los canales de personas con epilepsia. Pero 210 datos no sonsuficientes para concluir que este modelo hace una generalización eficaz en cuanto ala clasificación de canales.

REG-LOG-11:Debido a que la cantidad de datos de entrada en el modelo REG-LOG-10 no essuficiente para obtener conclusiones, se aumenta el número de ejemplos añadiendodos exámenes al conjunto de ejemplos. Para el modelo REG-LOG-11 se aumentó lacantidad de datos a 420, añadiendo 5 exámenes de cada tipo al conjunto de datos.Por lo tanto, ahora se tienen 294 datos para el entrenamiento y los restantes 126 paralas pruebas. En este modelo se empleó el algoritmo de “newton-cg” con penalidadL 2 y el coeficiente C = 10000.

Con base a los resultados obtenidos del modelo REG-LOG-11, se puede ver co-mo el aumento en la cantidad de datos disminuyó las métricas respecto al modeloREG-LOG-10.

Métrica Valor

Exactitud 0.603Precisión 0.631Exhaustividad 0.553

Tabla 18: Métricas Modelo REG-LOG-11. Fuente: Elaboración propia.

REG-LOG-12:Para ratificar la situación expuesta en el modelo anterior, el siguiente modelo cuentacon 15 exámenes de pacientes sanos y 15 de enfermos. Con esto se completan 630datos, de los cuales 441 se utilizaron para el entrenamiento del modelo y los 189restantes para el conjunto de pruebas. Para el modelo REG-LOG-11, se utilizó comoalgoritmo de optimización “newton-cg” con penalidad L 2, y el coeficiente C = 1000.

Page 76: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

64 regresi ón log ística

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

����

����

����

����

����

����

����

����

Figura 35: Matriz de confusión Modelo REG-LOG-11. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Los resultados del modelo REG-LOG-12 comprueban que a medida que se incremen-ta el número de datos utilizados en el modelo REG-LOG-10, las métricas empeoran,por lo tanto, el modelo REG-LOG-10 se sobre entrena al aumentar la cantidad dedatos.

Métrica Valor

Exactitud 0.550Precisión 0.542Exhaustividad 0.489

Tabla 19: Métricas Modelo REG-LOG-12. Fuente: Elaboración propia.

REG-LOG-13:Para el modelo REG-LOG-13 se utilizan los datos del modelo REG-LOG-08 a loscuales se les aplica discretización a través del algoritmo KBins. Esta aplicaciónproporciona una forma de dividir las características en valores discretos [33].

De acuerdo a los datos de la tabla 37 y de la matriz de confusión en la figura 20,el conjunto de datos se benefició de la discretización, ya que pasan de ser datoscontinuos a nominales, es decir, entre datos de categorías no se traslapan, ya quecada dato ha sido asignado a una categoría de acuerdo a la discretización. Porotra parte, se observa que el valor del coeficiente C = 1 no tiene mayor aporte la

Page 77: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.2 media aritm ética de las bandas de frecuencia 65

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

����

����

����

����

����

����

����

����

Figura 36: Matriz de confusión Modelo REG-LOG-12. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

��

Figura 37: Matriz de confusión Modelo REG-LOG-13. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

regularización de los datos cuando se incluye la discretización.

Page 78: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

66 regresi ón log ística

Métrica Valor

Exactitud 0.710Precisión 0.673Exhaustividad 0.768

Tabla 20: Métricas Modelo REG-LOG-13. Fuente: Elaboración propia.

REG-LOG-14:A partir de los resultados obtenidos en el modelo REG-LOG-13, para el modeloREG-LOG-14 se plantea utilizar los datos del modelo REG-LOG-09 con el fin deevidenciar si se observa la misma mejora en las métricas aplicando la estrategia dediscretización.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

Figura 38: Matriz de confusión Modelo REG-LOG-14. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Métrica Valor

Exactitud 0.630Precisión 0.637Exhaustividad 0.537

Tabla 21: Métricas Modelo REG-LOG-14. Fuente: Elaboración propia.

Page 79: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

2.2 media aritm ética de las bandas de frecuencia 67

Los resultados del modelo REG-LOG-14, evidencian que el aumento de las carac-terísticas junto con la discretización de las mismas no produce mejores resultados.De acuerdo con estos resultados, el mejor modelo es el REG-LOG-13, en el cual secombinan dos estrategias. La primera, adicionar nuevas características polinomicasal modelo base junto con la discretización de todas las características.

Page 80: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 81: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3R E D E S N E U R O N A L E S

La segunda técnica de clasificación empleada es la Red Neuronal, una arquitectura denodos conectados, cuya funcionalidad está basada en la neurona animal. La habilidad deprocesamiento de la red se almacena en las conexiones entre los nodos y se denominanpesos, estos se obtienen a través de un proceso de aprendizaje que se genera a partir delos patrones que son distinguibles en los datos de entrenamiento [58].

a = φ

�∑

jwjxj + b

�(10)

donde xj son las entradas de la unidad, wj son los pesos, b el bias, φ es la función deactivación no lineal y a es la activación de la unidad.

Al igual que en la sección 2 se realizó una serie de experimentos clasificados en lascaracterísticas: Potencia relativa y media aritmética de las bandas. Las técnicas y factoresusados en la construcción de estos modelos serán descritos a continuación.

3.1 potencia relativa de las bandas de frecuencia

Para los primeros experimentos se construyeron modelos de redes neuronales feed-forward en los cuales los nodos o neuronas están relacionados en el grafo sin ningún ciclo,de esta manera toda las operaciones y cálculos pueden realizarse de manera secuencial.El subtipo más simple es la red neuronal perceptrón multicapa (MLP), su arquitecturacomo se visualiza en la figura 39 consiste en neuronas agrupadas en capas y cada una deestas capas contiene cierto número idéntico de neuronas según [59].

Cada unidad de una capa está conectada a cada unidad de la siguiente capa, la primeracapa siempre es la capa de entrada y es quien recibe la información proveniente de lascaracterísticas, asimismo, las capas intermedias son conocidas como capas ocultas y laúltima capa es denominada la capa de salida y contiene una sola unidad para el caso deuna clasificación binaria, que es el caso que se presenta dado el problema del presenteproyecto.

69

Page 82: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

70 redes neuronales

Figura 39: Arquitectura de un perceptrón multicapa con n entradas y una capa oculta. Fuente:Elaboración propia.

Modelo NN-FF-01Para este modelo de perceptrón multicapa se toman 840 muestras con las 5 carac-terísticas que describen la potencia relativa de cada banda de frecuencia sobre loscanales del EEG. El optimizador usado es LBFGS, previamente usado para los experi-mentos de regresión logística teniendo en cuenta que converge más rápido que otrosmétodos y tiene un mejor rendimiento. En este primer experimento, los paráme-tros que se aplicaron fueron: un término de regularización para la penalización L 2se toma α = 0,00001, 5 entradas, 2 capas ocultas con 25 y 2 unidades respectivamente.

� �� �� �� ��� ��� ��� ��� ���

�������������

����

����

����

����

����

����

�����

����������������������������������������

�������������

����������

Figura 40: Precisión del modelo NN-FF-01 para los datos de entrenamiento y de validación en 200pasos temporales. Fuente: Elaboración propia.

Para este experimento se aplicó un escalado de las características del tipo Robusto,según [60] esto es una técnica de pre-procesamiento que escala las entradas usandoestadísticas que son “robustas” para los valores atípicos en los conjuntos de datos.

Page 83: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.1 potencia relativa de las bandas de frecuencia 71

Este elimina la mediana y escala los datos de acuerdo con el rango intercuantil (IQR)que en ocasiones da mejores resultados que otros datos estadísticos. La función deactivación usada fue la función ReLU (Rectified Linear Unit), que ha evidenciadomejor rendimiento y éxito en general para modelos de machine y deep learning encomparación con las funciones sigmoid y tanh [61].

El puntaje del modelo fue de 77,3 % y precisión del 80 % para la clase “No Epiléptico”y 75 % para la clase “Epiléptico”, si se toman en consideración los experimentosrealizados con regresión logística,este experimento evidencia una gran mejoríapara la clasificación de los pacientes. Se pueden detallar mejor los resultados delexperimento en la matriz de confusión de la figura 41.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

��

��

��

Figura 41: Matriz de confusión Modelo NN-FF-01. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Modelo NN-FF-02En este experimento el método de optimización seleccionado es Adam, un métodobasado en Gradiente Descendente y que generalmente funciona bien para datasetsgrandes (se habla de miles de muestras o más), por tanto es posible que al tenerun conjunto de datos pequeño, el rendimiento de este método sea inferior al delmétodo LBFGS. El número de capas ocultas son 2 y al igual que en el experimentoNN-FF-01, existen 25 y 2 unidades en cada una de las capas ocultas. El número depasos temporales para este modelo fue de 500.

A pesar de que también se aplicó un escalado de características, la técnica selecciona-da para este experimento fue la técnica estándar, cuyo trabajo se resume a eliminar

Page 84: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

72 redes neuronales

la media y escalar la varianza de la unidad. Teniendo que la puntuación estándar deuna muestra x se calcula como:

z =x − u

s(11)

Donde u es la media de las muestras de entrenamiento y s es la desviación estándarde las mismas [62].

La función de activación usada es ReLU y el puntaje del modelo fue de 75 % conuna precisión para clasificar pacientes epilépticos del 74 % y para pacientes noepilépticos del 76 %. Se observa que las métricas del modelo decrecen respectoal primer experimento. En la matriz de confusión de la figura 42 se observa laclasificación realizada por el modelo.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ���

��

��

��

��

��

��

��

���

Figura 42: Matriz de confusión Modelo NN-FF-02. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Modelo NN-FF-03En el tercer experimento seleccionado con perceptrón multicapa se optó por unaarquitectura mucho más profunda para la red neuronal. Las entradas son 5 caracte-rísticas, se aumentó el número de capas ocultas a 6, con 25, 10, 14, 15, 20, 10 unidadesrespectivamente y la capa de salida que clasifica las muestras con ayuda del métodode optimización LBFGS, penalización L 2 α = 0,00001 y función de activación ReLU.

Además del incremento del número de capas ocultas, fue necesario incrementarel número de iteraciones del modelo a 3500 para que el optimizador convergiera.

Page 85: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.1 potencia relativa de las bandas de frecuencia 73

El uso de un escalador de características tambien fue importante, se probó con elescalador estándar y con el escalador robusto, no obstante, fue el escalador estándarel que mejores resultados aportó al experimento. En la figura 43 se observa cual esel comportamiento del modelo respecto a la precisión de la clasificación.

� ��� ��� ��� ��� ���

�������������

����

����

����

����

����

����

�����

����������������������������������������

�������������

����������

Figura 43: Precisión del modelo NN-FF-03 para los datos de entrenamiento y de validación en 500pasos temporales. Fuente: Elaboración propia.

Los resultados tuvieron una alza importante, el puntaje del modelo quedó en un78 % y la precisión para clasificar pacientes epilépticos y no epilépticos fue del 76 %y 80 % concretamente. Esto da un indicio de que aumentar el número de capas de lared neuronal incide de manera positiva en las métricas del modelo de clasificación.Se puede ver en la figura 44 la matriz de confusión de la clasificación con datos deentrenamiento.

Modelo NN-FF-04Se construye un modelo multicapa y se definen ciertos parámetros de las capasde entradas, ocultas y de salida de la red neuronal. Además de los parámetrosanteriormente mencionados, tales como: método de optimización, cálculo de lapérdida y escalador de características. La configuración de las capas 5 capas de esteexperimento se describe a continuación:

• Capa de entrada, con una dimensión de 5 características en donde se aplica unafunción de activación aplicada al producto punto entre las características y unamatriz de pesos inicializada por la misma capa. En este experimento se aplicala función de activación ReLU, por tanto la salida de esta capa es la evaluaciónde esa función tomando como parámetro el producto entre las características ylos pesos.

• Capa oculta 2 y 4, para estas capas se aplica la técnica de Dropout o “Abandono”teniendo en cuenta que al ser un conjunto de datos pequeño los modelos puedenpresentar un sobre-ajuste. Esta técnica establece aleatoriamente unidades de la

Page 86: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

74 redes neuronales

������������� ����������

����������

�������������

����������

������������

�� ��

�� ���

��

��

��

��

��

��

��

���

Figura 44: Matriz de confusión Modelo NN-FF-03. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

entrada en 0, con cierta tasa de frecuencia durante el tiempo de entrenamientodel modelo y las otras entradas se amplían en un 1

1−tasa para no afectar la sumade todas las entradas.

• Capa oculta 3, para esta capa oculta de forma similar que en la capa de entradase aplica la función de activación ReLU.

• La capa de salida, responde a la transformación del producto entre las entradasy los pesos con una función sigmoide.

El método de optimización usado fue el método Adam, se aplicó un escalado decaracterísticas estándar y el proceso de optimización se hizo en 700 pasos temporales.La función para calcular la pérdida es la función binaria de entropía cruzada, lafunción de pérdida obtuvo mejores resultados con un 3,44 % y el puntaje del modelofue de 86,1 %. Se puede observar mejor en la figura 45 el cambio en el tiempo de lapérdida y la precisión del modelo.

Page 87: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.1 potencia relativa de las bandas de frecuencia 75

� ��� ��� ��� ��� ��� ��� ���

�������������

�����

�����

�����

�����

�����

�����

�����

�����

�����

����������������������������������������

�����

�������������

����������

� ��� ��� ��� ��� ��� ��� ���

�������������

�����

�����

�����

�����

�����

�����

�����

�����

�����

�����

��������������������������������������

�����

�������������

����������

Figura 45: Precisión y pérdida del modelo NN-FF-04 para los datos de entrenamiento y de valida-ción en 700 pasos temporales. Fuente: Elaboración propia.

Modelo NN-FF-05Tomando exactamente los mismos parámetros del experimento NN-FF-04 y variandola función de optimización a RMSProp, método que se encuentra en el ámbito delos métodos de tasa de aprendizaje adaptativo, con gran aceptación en los últimosaños, no ha sido oficialmente publicado sin embargo es muy conocido en imple-mentaciones de Machine Learning. De acuerdo con [63] este método divide la tasade aprendizaje para un peso por un promedio de las magnitudes de los gradientesrecientes de ese peso. Tambien se aumentó el número de pasos temporales a 500para que la red neuronal convergiera dado el método de optimización.

Estos cambios en la configuración disminuyeron un 0,009 el valor de la pérdidateniendo así un 45,9 % y el puntaje del modelo aumentó en un 0,008 para un valorde 74,2 %. En las gráficas de la figura 46 se puede observar el comportamiento delas métricas a través de los pasos temporales ajustados.

� ��� ��� ��� ��� ���

�������������

�����

�����

�����

�����

�����

�����

�����

�����

�����

����������������������������������������

�����

�������������

����������

� ��� ��� ��� ��� ���

�������������

����

����

����

����

����

�����

��������������������������������������

�����

�������������

����������

Figura 46: Precisión y pérdida del modelo NN-FF-05 del modelo para los datos de entrenamientoy de validación en 500 pasos temporales. Fuente: Elaboración propia.

Page 88: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

76 redes neuronales

Modelo NN-FF-06En este experimento se varía la función de pérdida, se alterna el cálculo binario deentropía cruzada por el error absoluto medio y se aplica un escalador de caracterís-ticas robusto.Se evidencia una mejora en la pérdida que está en un valor de 33 %y el modelo tiene un puntaje de 67, 8 %. Aunque la pérdida disminuyó tambien lohizo el puntaje, por tanto no es un experimento destacable y se plantea la adición decapas y normalizadores para los próximos experimentos.

� ��� ��� ��� ��� ���

�������������

����

����

����

����

����

����

����

����

�����

����������������������������������������

�����

�������������

����������

� ��� ��� ��� ��� ���

�������������

����

����

����

����

����

����

����

����

�����

��������������������������������������

�����

�������������

����������

Figura 47: Precisión y pérdida del modelo NN-FF-06 del modelo para los datos de entrenamientoy de validación en 500 pasos temporales. Fuente: Elaboración propia.

Modelo NN-FF-07Se considera la posibilidad de adicionar otras capas a la arquitectura que transformenlos pesos de los nodos aplicando otro tipo de transformaciones de forma que mejorelas métricas de precisión y pérdida de los modelos. El siguiente experimento cuentacon una capa de entrada, 4 capas ocultas y su capa de salida respectivamente. Dentrode las 4 capas ocultas se adicionó una capa que tiene la particularidad de aplicar unfunción Lambda sobre todas las entradas de esta capa. Específicamente la funciónaplicada fue una potencia cuadrada como se ve en la ecuación 12:

f (x) = x2 (12)

Los resultados para este modelo fueron favorables en cuanto a la precisión declasificación, así mismo la pérdida del modelo. La función usada para el cálculode la pérdida es el error cuadrado medio. Se observa que la precisión tiene unvalor alto (79,3 %) gracias al uso de la función de optimización RMSProp. Caberesaltar que el valor de pérdida es bajo (14,9 %) y esto indica que la predicción delmodelo sobre una sóla muestra es bastante buena. Se realizan 1000 iteraciones parael entrenamiento del modelo y los resultados se pueden detallar en la figura 48.

Page 89: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.1 potencia relativa de las bandas de frecuencia 77

� ��� ��� ��� ��� ����

�������������

�����

�����

�����

�����

�����

�����

�����

�����

�����

����������������������������������������

�����

�������������

����������

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

�����

��������������������������������������

�����

�������������

����������

Figura 48: Precisión y pérdida del modelo NN-FF-07 del modelo para los datos de entrenamientoy de validación en 1000 pasos temporales. Fuente: Elaboración propia.

Modelo NN-FF-08Tomando como referencia el experimento NN-FF-07, se hacen ajustes sobre esemodelo y se utiliza una función lambda del tipo f (x) = x4, el método de optimi-zación es el método Nadam y la función para el cálculo de la pérdida se alterna alerror absoluto medio en un total de 1000 iteraciones, logrando así una pérdida conun porcentaje del 30,1 % y una precisión del 70,6 % , esta última métrica decrecerespecto al experimento NN-FF-07.

� ��� ��� ��� ��� ����

�������������

�����

�����

�����

�����

�����

�����

�����

�����

�����

����������������������������������������

�����

�������������

����������

� ��� ��� ��� ��� ����

�������������

�����

�����

�����

�����

�����

�����

�����

�����

��������������������������������������

�����

�������������

����������

Figura 49: Precisión y pérdida del modelo NN-FF-08 del modelo para los datos de entrenamientoy de validación en 1000 pasos temporales. Fuente: Elaboración propia.

Modelo NN-FF-09Se construye otro modelo de red neuronal para clasificación binaria que tiene 2 capasocultas una de estas capas usa una función de activación denominada Rectificador yque se define como:

f (x) = max(0, x) (13)

Page 90: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

78 redes neuronales

Suele usarse esta función en redes neuronales profundas y en la práctica se usa por-que disminuye el error en comparación con una función logística. Permite a una redneuronal, obtener representaciones dispersas fácilmente despues de la inicializaciónuniforme de los pesos segun [64]. Además de usar el Rectificador, la segunda capaoculta aplica una normalización de lotes, la cual reduce la cantidad o la tasa decambio de los valores que están siendo procesados en la capa oculta (Covarianza)con el objetivo de mejorar la velocidad de entrenamiento de la red neuronal.

���� ����������

������

��

���

���

���

���

���

�����

���������������������������������������������������

�����

����

����������

���� ����������

������

��

��

��

��

��

��

�����

������������������������������������������������

�����

����

����������

���� ����������

������

��

��

��

��

��

��

��

��

�����

���������������������������������������������

�����

����

����������

Figura 50: Distribución de los datos en entrenamiento, pruebas y validación para el experimentoNN-FF-09. Fuente: Elaboración propia.

La distribución de los datos para el experimento se indican en la figura 50. El métodode optimización usado es el método Adam y la función de pérdida es la de EntropíaCruzada, para un número de 1000 iteraciones los resultados obtenidos son: un 52 %de pérdida, que es un indicador bastante alto y por ende indica que no es el mejorexperimento, por el lado de precisión para clasificar tiene un 71 % que a pesar deser un valor alto no compensa la pérdida obtenida.

� ��� ��� ��� ��� ����

����������������

��

��

��

��

�����

����������������������������������������

�������������

����������

� ��� ��� ��� ��� ����

����������������

����

����

����

����

����

����

�����

��������������������������������������

�������������

����������

Figura 51: Precisión y pérdida del modelo NN-FF-09 para los datos de entrenamiento y de valida-ción en 1000 pasos temporales. Fuente: Elaboración propia.

Page 91: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.2 media aritm ética de las bandas de frecuencia 79

3.2 media aritm ética de las bandas de frecuencia

Similar al trabajo realizado en el capítulo anterior con la técnica de regresión logística,en la presente sección se describen los resultados de múltiples experimentos realizadoscon Redes Neuronales Artificiales. Para esta sección se utilizaron los datos relacionadoscon los promedios de potencias dentro de cada banda de frecuencia de la señal EEG,partiendo de la observación de los resultados encontrados al efectuar experimentos sobre20 exámenes de pacientes sanos y 20 exámenes de pacientes diagnosticados con epilepsia,los cuales representan el total de la muestra de datos sobre los cuales se realizaron losexperimentos, lo que significa que sobre estos datos se realizaron modificaciones con elobjetivo de apreciar como varían los resultados de los experimentos entre sí y cuáles delos valores asignados a cada configuración mejoran o empeoran los resultados de losexperimentos.

Para los primeros experimentos de la sección utilizando el conjunto de datos completo, esdecir, los 840 datos correspondientes a los 21 canales de los 40 exámenes entre pacientessanos y enfermos. Como forma de exploración, los primeros experimentos se realizaroncon arquitecturas similares de entre 4 y 6 capas por modelo de red neuronal utilizandodiferentes cantidades de neuronas en cada capa, por ejemplo, el primer experimentorealizado tuvo en su configuración 30 neuronas en su capa inicial, pasando a 15 en lasegunda, 5 en la tercera y la última capa solo contiene la neurona de salida que arrojará elresultado de la clasificación.

Modelo NN-FF-10

En este experimento, se utilizó como optimizador el algoritmo de gradiente descen-diente, puesto que permite minimizar del modelo de la red neuronal, a través de laiteración hacia el mínimo global de la función [33]. Con base en los resultados dela matriz de confusión expuestos en la figura 52, el modelo tiene una precisión del70 % con una exactitud apenas del 59 %. La gráfica ilustra estos datos junto con laperdida del modelo.

Como se puede concluir de la gráfica 53, a mayor número de pasos en el tiempo,se obtiene una estabilización sobre el 70 % de precisión. Con el objetivo de mejorareste resultado, y utilizando el mismo número de pasos, para el siguiente modelo semodificó el algoritmo de optimización con el fin de aumentar esta métrica.

Modelo NN-FF-11

Para mejorar las métricas del modelo anterior, en el presente experimento se utilizóel algoritmo RMSProp, el cual es similar al algoritmo de descenso de gradiente, con ladiferencia de que restringe las oscilaciones en la dirección vertical de la optimizacióndel gradiente descendiente, por lo tanto permite llegar más rápido a un mínimo dela función [65]. En su capa inicial, esta red se conforma de 32 unidades, la segunda

Page 92: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

80 redes neuronales

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

���

Figura 52: Matriz de confusión del modelo NN-FF-10. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

�����

����������������������������������������

�������������

����������

� ��� ��� ��� ��� ����

�������������

�����

�����

�����

�����

�����

�����

��������������������������������������

�������������

����������

Figura 53: Precisión y pérdida del modelo NN-FF-10 para los datos de entrenamiento y de valida-ción en 1000 pasos temporales. Fuente: Elaboración propia.

capa de 64 y la tercera capa de 16. Estas tres capas tienen como función de activa-ción “ReLu” que ha demostrado tener mejor rendimiento a lo largo de este proyectocomparada con otras utilizadas como la función “Sigmoide” y Tangente Hiperbólica .

Este modelo tiene una precisión del 76 % con una exactitud del 74 %, que claramentemejora los resultados del modelo NN-FF-10. Estos datos son calculados a partir dela matriz de confusión de la figura 54. Como se puede apreciar en la figura 55 seconsiguen mejores resultados aplicando el optimizador RMSProp, que al ser más

Page 93: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.2 media aritm ética de las bandas de frecuencia 81

rápido en encontrar el mínimo del modelo, lo permite en el mismo número deiteraciones.

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

��

��

��

���

Figura 54: Matriz de confusión del modelo NN-FF-11. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

�����

����������������������������������������

�������������

����������

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

�����

��������������������������������������

�������������

����������

Figura 55: Precisión y pérdida del modelo NN-FF-11 para los datos de entrenamiento y de vali-dación en 1000 pasos temporales aplicando RMSProp como función de optimizaciónFuente: Elaboración propia.

Modelo NN-FF-12

Teniendo en cuenta los resultados mostrados por el anterior modelo y su aplicacióndel optimizador RMSProp, para este experimento se modificaron parámetros en la

Page 94: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

82 redes neuronales

configuración de ese modelo (NN-FF-11), así como la adición de nuevas neuronasen cada capa de la red neuronal, que para este caso fueron 6 capas. La primer capa,tuvo 128 neuronas, la segunda tuvo 64, la tercera contó con 32, a las capas cuarta yquinta se les asignaron 16 y 8 respectivamente. Finalmente, la ultima capa con laneurona de clasificación. En esta configuración de red neuronal se utilizaron comofunciones de activación la Tangente Hiperbólica y “ReLu” de forma intercalada,empezando por la primera para la capa No. 1.

Cabe destacar, que la adición de neuronas realizada en este modelo comparado conel modelo anterior permite un mejor rendimiento en el entrenamiento del modelo ypor ende mejores resultados [66]. Lo anterior se refleja en las métricas obtenidas dela gráfica 56, dónde se puede concluir que aunque la precisión empeoró un poco(75 % para este modelo) comparada con el del anterior, la exactitud mejoró con unresultado del 77 %. Además, se puede observar en la gráfica que cada vez las curvasde precisión y perdida arrojan mejores resultados.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

��

Figura 56: Matriz de confusión del modelo NN-FF-12. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Modelo NN-FF-13

Como se mencionó en su momento para el modelo NN-FF-11, la función de activa-ción “ReLu”, ha funcionado mucho mejor que Tangente Hiperbólico. Esta ultimase utilizó en el modelo anterior (NN-FF-12). Con la intención de mejorar los resul-tados anteriores, en este modelo se utilizó para todas las capas la función “ReLu”,utilizando los mismos valores de neuronas por cada capa. Los datos de exactitud

Page 95: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.2 media aritm ética de las bandas de frecuencia 83

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

�����

����������������������������������������

�������������

����������

� ��� ��� ��� ��� ����

�������������

�����

�����

�����

�����

�����

�����

�����

�����

�����

��������������������������������������

�������������

����������

Figura 57: Precisión y pérdida del modelo NN-FF-12 para los datos de entrenamiento y de va-lidación en 1000 pasos temporales. Se observan mejores resultados al añadir nuevasneuronas para evitar problemas en el entrenamiento del modelo. Fuente: Elaboraciónpropia.

y precisión obtenidos con base en los datos de la matriz de confusión de la figuramuestran una leve mejoría al obtener una precisión del 77 % y una exactitud del 81 %.

Con estos datos se confirma que efectivamente se mejoran los resultados utili-zando “ReLu” como función de activación. Otra forma de observar la mejoría enlos resultados consiste en identificar como aumentan los valores de las esquinassuperior-izquierda e inferior-derecha de la matriz de confusión, puesto que allí sealojan los resultados de los valores predichos comparadas con los resultados reales.El aumento de las cantidad de estas esquinas implica que cada vez los modelospredicen mejor los ejemplos de prueba. A su vez, en la figura 59, la curva de perdidapara los datos de validación se acerca al 15 %, lo que implica que el modelo hatenido un buen rendimiento comparado con los modelos hasta ahora expuestos enesta sección.

Modelo NN-FF-14

Tomando como base los resultados obtenidos en los experimentos de RegresiónLogística al aplicar un discretización en los datos de entrada de los modelos, eneste experimento se aplicó discretización sobre estos, esperando un buen resultadocombinado con la configuración del modelo NN-FF-13 que por ahora ha arrojado losmejores resultados con redes neuronales. Cabe recordar que al aplicar discretización,aumenta la dimensión en los datos de entrada para el modelo, dado que el algoritmoKBins divide datos continuos en grupos discretos.

En este caso, el modelo pasa de tener 5 características a evaluar (las 5 bandas defrecuencia) a 25. Al aplicar estos parámetros adicionales, se observa cierto sobre en-trenamiento del modelo comparado, con el anterior (NN-FF-13). Esto se evidencia en

Page 96: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

84 redes neuronales

������������� ����������

����������

�������������

����������

������������

��� ��

�� ���

��

��

��

��

��

��

��

��

���

Figura 58: Matriz de confusión del modelo NN-FF-13. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Los valores en las esquinas superior-izquierda e inferior-derecha son los quetienen la mayor cantidad de muestras, lo que ilustra la mejoría en la predicción delmodelo. Fuente: Elaboración propia.

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

�����

����������������������������������������

�������������

����������

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

�����

��������������������������������������

�������������

����������

Figura 59: Precisión y pérdida del modelo NN-FF-13 para los datos de entrenamiento y de valida-ción en 1000 pasos temporales. Fuente: Elaboración propia.

la figura 60, dónde las curvas de perdida para el conjunto de datos de entrenamientoy validación se encuentran bastante separadas desde un número pequeño de pasos.Las métricas de precisión y exactitud se ven afectadas, tal como se observa en lamatriz de confusión de la figura 61, los casos reales epilépticos pero predichos comono epilépticos aumentaron para este modelo en comparación del modelo NN-FF-13.Para este modelo, la precisión fue de 68 % y una exactitud del 71 %.

Page 97: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.2 media aritm ética de las bandas de frecuencia 85

� ��� ��� ��� ��� ����

�������������

����

����

����

����

���������

����������������������������������������

�������������

����������

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

����

�����

��������������������������������������

�������������

����������

Figura 60: Precisión y pérdida del modelo NN-FF-14 para los datos de entrenamiento y de valida-ción en 1000 pasos temporales, aplicando discretización a los datos de entrada. Fuente:Elaboración propia.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

Figura 61: Matriz de confusión del modelo NN-FF-14. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Se reduce la cantidad de muestras predichas de manera correcta. Fuente:Elaboración propia.

Como se ha mencionado a lo largo de este proyecto, la exactitud corresponde ala fracción de predicciones que el modelo realizó correctamente, por lo tanto, escoherente la reducción en el porcentaje de exactitud.

Page 98: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

86 redes neuronales

Modelo NN-FF-15

Dentro de las opciones que se pueden aplicar para mejorar los resultados de losmodelos se encuentra la adición de características, esto ya se hizo anteriormentepara los modelos de Regresión Logística. Para este modelo se añadieron nuevascaracterísticas polinómicas multiplicando los valores de las columnas ya existentes.Como se puede ver en la figura 62, la cantidad de valores reales no epilépticospredichos correctamente es igual a la obtenida en el modelo NN-FF-13, pero lacantidad de los mismos valores para epilépticos es menor en relación a ese modelo,por lo tanto, la precisión de NN-FF-15 es menor comparada con el modelo NN-FF-13.

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

��

��

��

���

Figura 62: Matriz de confusión del modelo NN-FF-15. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

La gráfica de perdida del modelo de la figura 63 ratifica las conclusiones obtenidasdel análisis de la matriz de confusión de la figura. Realizando estos cálculos, laprecisión es de 76 % y la exactitud de 78 %, lo que implica una mayor perdidacomparado con el modelo NN-FF-13.

Modelo NN-FF-16En este modelo se implementó un nuevo algoritmo de optimización, este es Nadam.Este algoritmo está basado en un método de descenso de gradiente estocástico que sebasa en la estimación adaptativa de los impulsos hacia el mínimo de la función [67].Este algoritmo funciona de forma similar a RMSProp, puesto que busca aumentarla rapidez para alcanzar el mínimo global de la función del modelo añadiendo unimpulso que ayuda a acelerar el descenso de gradiente en una dirección relevante y

Page 99: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.2 media aritm ética de las bandas de frecuencia 87

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

����

�����

����������������������������������������

�����

�������������

����������

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

�����

��������������������������������������

�����

�������������

����������

Figura 63: Precisión y pérdida del modelo NN-FF-15 para los datos de entrenamiento y de valida-ción en 1000 pasos temporales. Fuente: Elaboración propia.

amortigua las oscilaciones hacia aquellas que no lo son [68].

Basado en las anteriores afirmaciones, el presente modelo implementa el algo-ritmo Nadam, junto con la adición de nuevas características, en este caso el promediode los valores de las bandas de frecuencia sumado con las nuevas característicasañadidas desde el modelo NN-FF-17, para completar 9 características como los datosde entrada. Con estos ajustes, se consigue un aumento en el porcentaje la exactitud yla precisión, comparado con los modelos anteriores. En este caso la precisión fue de78 % y la exactitud de 81 %. Estos resultados son obtenidos de la matriz de confusiónde la figura 64.

Cabe resaltar que el número de pasos temporales permite ver cierta similitud entrelas graficas de perdida de los modelos que han sido expuestos en esta sección. Laperdida de este modelo fue del 17 %, una leve mejoría comparada con los demásmodelos de la sección. Esto ultimo reflejado en la figura 65.

Modelo NN-FF-17

Teniendo en cuenta los resultados hasta ahora expuestos en esta sección, a con-tinuación se propone la aplicación de regularizadores en una de las capas de laconfiguración de red neuronal con la que se ha trabajado hasta el momento. Similara su funcionamiento en el capítulo de Regresión Logística, en este oportunidad seutiliza con el fin de prevenir el sobre entrenamiento penalizando a un modelo portener grandes pesos [69].

En este caso, se aplicó regularizador a la segunda capa que contiene 64 neuronas.Esto permite minimizar la pérdida junto con la complejidad. Finalmente con estaaplicación, también se utiliza el algoritmo de optimización Nadam utilizado en elmodelo anterior. Como se puede apreciar en la figura 66, la curva de perdida para

Page 100: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

88 redes neuronales

������������� ����������

����������

�������������

����������

������������

��� ��

�� ���

��

��

��

��

��

��

��

��

���

Figura 64: Matriz de confusión del modelo NN-FF-16. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

����

�����

����������������������������������������

�����

�������������

����������

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

�����

��������������������������������������

�����

�������������

����������

Figura 65: Precisión y pérdida del modelo NN-FF-16 para los datos de entrenamiento y de vali-dación en 1000 pasos temporales, generando nuevas características como entrada delmodelo. Fuente: Elaboración propia.

los datos de validación tiene una leve reducción sobre los mil pasos temporales,aunque no representa mayor cambio en términos de porcentaje puesto que siguesiendo del 17 %. Por otra parte, se ve una leve mejoría en la cantidad de pacientesreales no epilépticos y que el modelo predijo como tal. Para este modelo se obtuvouna precisión del 79 % y una exactitud del 81 %.

Si bien es cierto, este es por ahora el mejor modelo de la sección, al menos para lasmétricas de precisión y exactitud, como se observa en la matriz de confusión de

Page 101: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

3.2 media aritm ética de las bandas de frecuencia 89

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

����

����

����

�����

����������������������������������������

�������������

����������

� ��� ��� ��� ��� ����

�������������

����

����

����

����

����

�����

��������������������������������������

�������������

����������

Figura 66: Precisión y pérdida del modelo para los datos de entrenamiento y de validación en 500pasos temporales Fuente: Elaboración propia.

la figura 67 no mejora los resultados del modelo NN-FF-16, esto se aprecia en lapredicción realizada por el modelo de los valores reales.

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

��

��

��

���

Figura 67: De izquierda a derecha y de arriba a abajo la cantidad de verdaderos negativos, falsospositivos, falsos negativos y verdaderos positivos. Fuente: Elaboración propia.

Page 102: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 103: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

4M Á Q U I N A S D E S O P O RT E V E C T O R I A L

Dentro de las técnicas de clasificación utilizadas en este proyecto, se encuentran lasMáquinas de Soporte Vectorial. En el presente capítulo, de la misma forma que en losanteriores, se explorarán los resultados hallados al entrenar modelos con los dos tiposde datos, la potencia relativa de las bandas de frecuencia y la media de las bandas defrecuencia.

4.1 potencia relativa de las bandas de frecuencia

De acuerdo al trabajo realizado previamente con técnicas de clasificación, para lasmáquinas de soporte vectorial se realizaron los experimentos con 840 datos, cada uno deestos utilizando las 5 características que se han mencionado a través de este documento.Debido a que las máquinas de soporte vectorial no son invariantes de escala, como primerapaso para llevar a cabo los experimentos de máquinas de soporte vectorial, los datosfueron procesados con escaladores [70]. Como su nombre lo indica, estos escaladorespermiten que los datos se encuentre en una misma escala, lo que permite que no hayandatos aislados [71].

Modelo SVM-01

Para el primer experimento, los datos fueron escalados de forma tal que la varianzade los datos sea igual a 1, utilizando un escalado estándar. Por otra parte, se utilizócomo kernel para la máquina de soporte vectorial una función lineal que comosu nombre lo indica traza una línea recta que separa los datos de acuerdo a lasclases, en este caso entre pacientes diagnosticados y no diagnosticados con epilepsia.Para este primer experimento se obtuvo una exactitud del 57 %, lo indica que nose realizó una buena clasificación de predicciones. Esto hace pensar que los datosno se encuentran ubicados en el espacio de forma tal que pueden ser clasificadossimplemente trazando una linea para separar las dos clases, es decir, entre aquellosque están diagnosticados con epilepsia y los que no.

Modelo SVM-02

En el segundo experimento se variaron dos parámetros con el fin de obtener mejoresresultados en relación a los obtenidos con el modelo SVM-01. En este caso, se optópor utilizar un escalador diferente, el cual escala los datos de acuerdo a los cuartilesen los cuales estén ubicados, teniendo en cuenta los valores atípicos.

De acuerdo a los resultados del modelo SVM-01 se puede deducir que no es posible

91

Page 104: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

92 m áquinas de soporte vectorial

encontrar una frontera lineal que permita separar las clases. Es por esta razón quepara este experimento se implementó como kernel la función de base radial (RadialBasis Function - RBF). Esta función procesa los datos generando nuevas característi-cas a partir del cálculo de la distancia entre puntos, y de esta forma encontrandocentroides. La ecuación 14 describe esto.

K(x, x�) = exp(−γ||x − x�||2) (14)

Dónde γ controla la influencia de centroides. Estos centroides definen ciertos límites,por lo tanto cuanto más alta sea el valor de γ, menor será la influencia de estoscentroides en el límite de decisión y por lo tanto este ultimo será menos amplio [72].El valor de γ (gamma) para este modelo está dado de acuerdo a la ecuación 15:

γ =1

m ∗ S2 (15)

Donde m es la cantidad de características, para este caso m = 5 y S2 es la varianzade los datos, que como se ha dicho antes, se ve afectada al aplicar escalamiento. Eneste caso, el valor de la varianza es de S2 = 0,976, por lo tanto el valor de γ es 0,204.

Para este modelo se obtuvieron mejores resultados comparado con el modelo SVM-01. La exactitud arrojó un porcentaje del 65 %. Esto significa que el modelo identificócomo verdaderos una mayor cantidad de muestras de manera correcta. Por otraparte, la precisión arrojó un valor del 83 %, sin embargo, la métrica de la exhausti-vidad no arroja un buen resultado, dado que es apenas del 39 %. Estos resultadosse ven ilustrados en la figura 68, puesto que como se puede ver, las prediccionespara pacientes que realmente son no epilépticos tienen la mayoría de muestras deacuerdo al dato de la esquina superior izquierda.

Modelo SVM-03

Con base a los resultados del modelo SVM-02, este experimento utilizó el mismovalor de gamma, al igual que el kernel y el escalador. Con el fin de encontrar mejoresresultados a comparación del modelo anterior, este modelo aplicó un cambio en laconstante C. Esta constante C es la misma constante que se aplicó en su momentopara los experimentos de regresión logística, por lo tanto es el inverso de la tasa depenalización. Cuanto más pequeño sea el valor de C mayor será la penalización.

Es de notar que para el modelo anterior, el valor de la constante C fue de 1, porlo cual este valor no influye en el modelo. Para este modelo, ese valor fue de 0.1.Teniendo en cuenta las consideraciones expuestas anteriormente se observó quedisminuye la exactitud, puesto que para este experimento tuvo un porcentaje del61 %, por lo tanto se redujo el número de predicciones correctas comparado con

Page 105: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

4.1 potencia relativa de las bandas de frecuencia 93

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

���

Figura 68: Matriz de confusión del modelo SVM-02. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

el modelo anterior. Por otra parte, el valor de la exhaustividad también se redujo,dado que fue solamente del 30 %, sin embargo el valor de la precisión se mantuvoestable. Teniendo en cuenta estos resultados, se puede concluir que el aumento enla constante C para la penalización resultó en un sobre entrenamiento, arrojandopeores resultados comparado con el modelo SVM-02.

La figura 69 ilustra lo descrito en el párrafo anterior, puesto que los valores más altosse encuentran ubicados para la columna de los que realmente son no epilépticos.Si bien es cierto, el modelo logró predecir una gran cantidad de pacientes comono epilépticos, o sea, la cantidad ubicada en la esquina superior izquierda, existetambién una cantidad alta de muestras ubicadas en la esquina inferior izquierda,donde se encuentra la cantidad de pacientes predichos como epilépticos pero querealmente no lo son. Estas dos situaciones describen de forma cualitativa las métricasarrojadas por el modelo.

Modelo SVM-04

Con el fin de explorar diferentes configuraciones con el fin de encontrar el me-jor resultado, el presente modelo utiliza un kernel la función polinomial, la cualgenera nuevas características aplicando la combinación polinómica de todas lascaracterísticas existentes, estrategia similar a la que se ha aplicado a lo largo de losdos anteriores capítulos cuando se agregaban nuevas características a partir de los

Page 106: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

94 m áquinas de soporte vectorial

������������� ����������

����������

�������������

����������

������������

��� �

�� ��

��

��

��

��

���

Figura 69: Matriz de confusión del modelo SVM-03. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

productos entre valores de bandas de frecuencia. La ecuación 16 define el kernelpolinomial:

K(x, x�) = �x, x��d (16)

Donde:

• x y x� representan características de entra para el modelo, en este caso, valoresde bandas de frecuencia.

• d es el grado del polinomio.

Para este modelo se utilizó el mismo escalado aplicado en el modelo SVM-01. Porotra parte, para este modelo la ecuación 17 define el valor de gamma.

γ =1m

(17)

Donde m es la cantidad de características, para este caso m = 5, por lo que γ esigual a 0,2.

Para este modelo, el polinomio es de grado 3. Este modelo obtuvo un mejor valoren la precisión comparado con los modelos SVM-02 y SVM-03, el cual está cercanoal 88 % de la precisión, con un valor de 62 % para la exactitud, lo que significa quemejoró apenas un punto porcentual comparado con el modelo SVM-03. Sin embargo,

Page 107: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

4.1 potencia relativa de las bandas de frecuencia 95

la exhaustividad se redujo al 29 %, apenas un punto porcentual, lo que no muestrauna mejoría en los experimentos con máquinas de soporte vectorial.

La situación expuesta anteriormente se ilustra a través de la matriz de confusiónpara el modelo, en la figura 70, donde se puede apreciar que se logró predecir demanera correcta a la gran mayoría de pacientes diagnosticados como no epilépticos.Sin embargo, como ya se comentó, el bajo valor para la exhaustividad se ve reflejadoen el alto numero de pacientes no epilépticos pero que el modelo predijo comoepilépticos.

������������� ����������

����������

�������������

����������

������������

��� �

�� ��

��

��

��

��

���

Figura 70: Matriz de confusión del modelo SVM-04. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Modelo SVM-05

Para el quinto modelo del capítulo se aplicó otra función kernel llamada sigmoide,que corresponde con la misma función de activación utilizada en varias ocasionespara los experimentos del capítulo de redes neuronales. En este caso la ecuación 18define la función sigmoide:

K(x, x�) = tanh(γ�x, x��) (18)

Esta implementación demostró ser hasta ahora la que mejores resultados arrojapara la métrica de la exhaustividad que hasta el momento había sido la que peoresresultados tenía. Aunque no es un valor lo bastante bueno, puesto que su valor fuedel 40 % es hasta el momento el mejor modelo comparado con los 4 anteriores. Esto

Page 108: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

96 m áquinas de soporte vectorial

significa que el modelo SVM-05 identifica correctamente el 40 % de los pacientesdiagnosticados con epilepsia.

Sin embargo, las métricas de exactitud y precisión se reducen bastante con laaplicación de este modelo. Sus resultados fueron 43 % y 44 % respectivamente. Estasituación se ilustra a través de los datos mostrados en la figura 71, donde los valoresmás altos se encuentran en las falsas predicciones realizadas por el modelo, esto es,las columnas superior derecha e inferior izquierda.

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

Figura 71: Matriz de confusión del modelo SVM-05. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Modelo SVM-06Para el ultimo modelo implementado en esta sección, se aplicó la función de baseradial (Radial Basis Function - RBF) como kernel, utilizando el mismo escaladorestándar utilizado en los modelos SVM-01 y SVM-04. Para este modelo la ecuación17 define el valor de gamma.

Como se aprecia en la figura 72, el cantidad de predicciones acerca de pacientes noepilépticos realizadas correctamente fue alta, esto es así puesto que para este modelose obtuvieron muy buenos resultados tanto para la exactitud como para la precisión.En este caso sus valores fueron del 64 % y 79 % respectivamente, lo que lo conviertehasta ahora en el mejor modelo para clasificación de pacientes no epilépticos.

Page 109: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

4.2 media aritm ética de las bandas de frecuencia 97

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

���

Figura 72: Matriz de confusión del modelo SVM-06. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Por su parte, la métrica de exhaustividad no varió mucho respecto al modelo SVM-05que hasta ahora ha mostrado el mejor valor para esta métrica. Para este modelo, laexhaustividad arrojó un resultado de 39 %, esto se ve reflejado en los valores bajosde las esquinas superior derecha e inferior derecha, cuyos valores son menores asus pares de la columna izquierda. Esto indica un bajo acierto en la predicción depacientes epilépticos.

4.2 media aritm ética de las bandas de frecuencia

En esta sección se presentan los experimentos utilizando el promedio de la potenciade las bandas de frecuencia. En estos experimentos se han aplicado, al igual que en lasección anterior, diferentes parámetros como la función kernel y el escalador, por lo quevarias definiciones como las funciones, escaladores y otros parámetros en común.

Modelo SVM-07

Al igual que la sección anterior, este primer experimento aplica el kernel lineal. Deacuerdo a las métricas obtenidas para este caso, se puede ver que con este tipo dedatos, o sea, el promedio de las potencias de las bandas de frecuencia, se observael mismo problema al utilizar este tipo de kernel, con este modelo se identifica aun paciente que sufre epilepsia un 62 % de las veces. Al igual que los resultadosobtenidos en los primeros experimentos aplicados en la sección anterior, obtuvo

Page 110: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

98 m áquinas de soporte vectorial

un rendimiento pobre respecto a la exhaustividad obteniendo el 20 %, es decir, estemodelo identifica correctamente el 20 % de los pacientes epilépticos.

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

���

Figura 73: Matriz de confusión del modelo SVM-07. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

La alta concentración de cantidades de muestra sobre la columna izquierda de lamatriz de confusión en la figura 73 ilustra que la clasificación de este modelo noha sido buena, lo que también permite concluir que debido a la distribución de losdatos de las bandas de frecuencia, no es posible separar los datos de forma lineal.

Modelo SVM-08

Aunque con el modelo SVM-01 y SVM-07 se notó que el kernel lineal no permite reali-zar una buena clasificación de los datos, para este experimento se aplicó este mismokernel utilizando un escalador estándar con el fin de identificar si se obtienen mejoresresultados para estos datos aplicándoles escalamiento previo a la clasificación. Lafigura 74 ilustra los resultados de este modelo en su matriz de confusión.

Si bien es cierto que las métricas de exactitud y precisión no crecieron mucho, puestoque fueron del 58 % y 65 % respectivamente, la exhaustividad creció hasta el 27 % polo que la identificación correcta de pacientes epilépticos creció, esto se ve reflejadoen la disminución de la cantidad de muestras para la esquina inferior izquierda enla figura 74.

Page 111: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

4.2 media aritm ética de las bandas de frecuencia 99

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

���

Figura 74: Matriz de confusión del modelo SVM-08. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Modelo SVM-09

Debido a que en el modelo anterior, las métricas mejoraron al añadir un escaladoprevio a la clasificación, en este modelo se aplicó la discretización de los datos comopreviamente se hizo para los experimentos de regresión logística y redes neuronales.Tal como ocurrió anteriormente, esta discretización toma los datos como variablecontinua y divide los datos en grupos discretos [73]. Al igual que en el modeloSVM-08 este preprocesamiento mejoró los resultados como también se ha visto encapítulos anteriores. Como se aprecia en la figura 75, la clasificación mejoró nota-blemente dado que las esquinas superior izquierda e inferior derecha son aquellasque contienen la mayoría de muestras, siendo estas esquinas las que reflejan laspredicciones correctas para el modelo.

Para este modelo, la exactitud es del 68 %, lo que presenta una mejoría respec-to a los modelos expuestos previamente en esta sección. El aspecto a resaltar deeste modelo, es que la exhaustividad aumentó hasta el 74 % lo que representa unaalta mejoría respecto al resto de los modelos. Por su parte, la precisión fue del 64 %.Este resultado demuestra que si bien es cierto, el objetivo de la función kernel esclasificar los datos, lo que hasta ahora no se había logrado con el kernel lineal, elpreprocesamiento por discretización permitió separar los datos de forma tal queahora es más sencillo para el kernel separar las muestras.

Page 112: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

100 m áquinas de soporte vectorial

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

Figura 75: Matriz de confusión del modelo SVM-09. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Modelo SVM-10

Si bien es cierto, en el modelo SVM-09 se muestra que se pueden separar los datos,en ese caso utilizando la técnica de discretización, para este modelo no se aplicópreprocesamiento, puesto que se utilizó directamente el kernel polinomial que sedefinió previamente en las ecuaciones 16 y 17. Para este modelo se implementó elkernel con polinomio de grado 5, logrando de nuevo una variación en las métricasrespecto al modelo SVM-09 que hasta ahora ha resultado ser el mejor.

Como se aprecia, la figura 76, la matriz de confusión de este modelo es bastantesimilar a la mostrada en la figura 75, lo que permite inferir que se logra un efectosimilar tanto con el preprocesamiento de los datos a través de la discretización comocon la aplicación del kernel polinomial. Para este modelo las métricas fueron del 70 %para la exactitud, 68 % para la precisión y un 72 % para la exhaustividad.

Modelo SVM-11Para este ultimo modelo se optó por combinar las dos estrategias que mejor resulta-do han demostrado, el preprocesamiento de los datos y el uso de un kernel que nosea lineal, lo que permite separar los datos. El preprocesamiento de los datos paraeste experimento se realizó utilizando un escalador por máximo absoluto, el cual,escala y traduce cada característica individualmente de modo que el valor absolutomáximo de cada característica en los datos de entrenamiento sea 1 [74].

Page 113: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

4.2 media aritm ética de las bandas de frecuencia 101

������������� ����������

����������

�������������

����������

������������

�� ��

�� ��

��

��

��

��

��

��

Figura 76: Matriz de confusión del modelo SVM-10. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Además, como kernel, se aplicó la función de base radial (Radial Basis Function - RBF),con un valor de C = 10000 como el inverso del valor de la regularización. Conesta configuración se obtienen los que son los mejores resultados en esta secciónobteniendo una exactitud del 78 %, una precisión del 76 % y exhaustividad del 78 %.La figura 77, demuestra que el modelo SMV-11 ha obtenido hasta ahora los mejoresresultados de los experimentos realizados con máquinas de soporte vectorial, siendohasta el momento la técnica de clasificación que más se acerca a las redes neuronalescomparándola con regresión lineal.

Page 114: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

102 m áquinas de soporte vectorial

������������� ����������

����������

�������������

����������

������������

��� ��

�� ��

��

��

��

��

��

��

��

���

Figura 77: Matriz de confusión del modelo SVM-11. De izquierda a derecha y de arriba a abajola cantidad de verdaderos negativos, falsos positivos, falsos negativos y verdaderospositivos. Fuente: Elaboración propia.

Page 115: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

5A N Á L I S I S P O R C O M P O N E N T E S P R I N C I PA L E S

El análisis por componentes principales (Principal Component Analysis - PCA) es unatécnica que se aplica para solucionar el problema de afinamiento del subespacio S dedimensión d � D a un conjunto de datos X1, X2, ..., Xn en un espacio de alta dimensiona-lidad RD [75]. Este análisis se aplica a partir de la necesidad de reconocer patrones quepermitan clasificar objetos pertenecientes a un patrón observado y también la compresiónde estos datos con la motivación de disminuir el número de bits necesarios para represen-tar los datos sin incurrir en la distorsión de su calidad [76].

Para este proyecto se usa el análisis por componentes principales principalmente comoherramienta para visualizar y preprocesar las características extraídas con transformadarápida de Fourier que se han utilizado para las propuestas de clasificación. Además, sedesea comparar si a través de este análisis el rendimiento de algunos de los experimentosrealizados mejora de forma significativa o si por el contrario degradan su rendimiento ydesempeño.

5.1 visualizaci ón de pca

Para muchas aplicaciones y problemas de tratamiento de datos, el PCA resulta útilen la visualización de los datos. Normalmente, la visualización de datos de dimensión2 o 3 no es un reto grande, sin embargo cuando se requiere visualizar información condimensionalidad mayor a 3 resulta todo un desafío, que es el caso particular para losdatos que se han venido trabajando en el proyecto, los datos poseen 5 dimensiones (deacuerdo a las 5 bandas en las que se clasificó la frecuencia de la señal).

El PCA se hace efectivo gracias al escalamiento, por tanto es importante resaltar quecuando se aplicó PCA se hizo uso de escaladores de características de tipo estándar (nor-malización) y robusto. Tanto para el caso de los datos con potencia relativa por banda y elcaso del promedio por banda de frecuencia se tienen 5 características: Alpha, Beta, Theta,Delta y Gamma, en el primer experimento con PCA se proyectan estas 5 características en2 dimensiones, después de la reducción, se observa que no hay un significado particularde cada componente, se puede ver más como un ajuste de los datos originales a dosdimensiones.

En las figuras 78 y 79 se puede evidenciar que la reducción de 5 a 2 dimensiones nopermite separar las clases entre sí de la mejor manera. Para el PCA de datos con promediopor banda de frecuencia la tasa de varianza indica que para el componente principal 1contiene el 89.7 % de la varianza y el segundo componente tiene el 0.5 %. Ahora bien, el

103

Page 116: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

104 an álisis por componentes principales

PCA en potencia relativa de las bandas resulta en una varianza del 59 % en el primercomponente y en el segundo componente del 21.2 %. Este análisis de la varianza se realizapara saber que tanta información se perdió de las 5 dimensiones originales.

−2 −1 0 1 2 3 4 5

Componente Principal 1

−2

0

2

4

6

8C

om

ponente

Pri

ncip

al 2

PCA (Dos componentes)

No epiléptico

Epiléptico

Figura 78: Descomposición en dos componentes de los datos de potencia relativa de las bandas defrecuencia. Nótese que no hay una separación clara entre las clases. Fuente: Elaboraciónpropia.

De acuerdo a los resultados con 2 componentes principales, se decide realizar el mismoejercicio con una transformación a 3 dimensiones, tal como se observa en la figura 80 y81. Dado el anterior análisis, las clases tampoco se logran separar completamente condimensión 3.

Varianza Componente 1 ( %) Componente 2 ( %) Componente 3 ( %)

Potencia relativa 80.7 13 4.3Promedio de bandas 98.5 1.1 0.015

Tabla 22: Varianzas de los componentes principales en 3 dimensiones para establecer que tantainformación se perdió en el proceso de análisis por componentes principales.

Page 117: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

5.2 aplicaci ón de pca a modelos de clasificaci ón 105

0 5 10 15 20

Componente Principal 1

−2

−1

0

1

2

3

4

5

Com

ponente

Pri

ncip

al 2

PCA (Dos componentes)

No epiléptico

Epiléptico

Figura 79: Descomposición en dos componentes de los datos de promedio de las bandas defrecuencia. Nótese que no hay una separación clara entre las clases. Fuente: Elaboraciónpropia.

�������������

����������

Figura 80: Descomposición en tres componentes de los datos de potencia relativa de las bandas defrecuencia. Fuente: Elaboración propia.

5.2 aplicaci ón de pca a modelos de clasificaci ón

El análisis por componentes principales es aplicado en la aceleración de algoritmos demachine learning y brindar un mejor desempeño para los experimentos de clasificación.Se seleccionaron los mejores experimentos de Regresión Logística, Redes neuronales yMáquinas de Soporte Vectorial con el fin de aplicar PCA previo al entrenamiento.

Page 118: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

106 an álisis por componentes principales

�������������

����������

Figura 81: Descomposición en tres componentes de los datos de promedio de las bandas defrecuencia. Fuente: Elaboración propia.

En las tablas 23, 24 y 25 se observan los resultados de tales experimentos con PCA.

Experimento Muestras # C.PSVD

’solver’Precisión Exhaustividad F1-Score

REG-LOG-02 840 4 arpack 0.47 0.61 0.53REG-LOG-02 840 4 randomized 0.51 0.69 0.59REG-LOG-05 210 7 arpack 0.73 0.79 0.76REG-LOG-05 210 7 randomized 0.73 0.79 0.76

Tabla 23: Resumen de experimentos PCA en los mejores dos experimentos de Regresión Logística.

Para todos los experimentos se evidencia la aplicación de PCA a través de variosmétodos solver, los que se usaron para estos experimentos fueron arpack y randomizedrespectivamente. El método arpack es una serie de subrutinas que resuelve problemas devalores propios a gran escala en varias áreas de aplicación, requiere estrictamente que elnúmero de componentes esté entre 0 y el número de características originales [77]. Porotro lado, el método randomized realiza la descomposición en valores singulares a travésdel método Halko et al, un método aleatorio famoso entre los de su tipo de acuerdo a [78].

En la tabla 23 se exponen los resultados al aplicar PCA sobre los experimentos REG-LOG-02 y REG-LOG-05. Una observación interesante que se puede hacer es que sobretodos los experimentos, el puntaje de tales modelos tiene una mejora respecto a losexperimentos originales, en términos de precisión y exhaustividad las métricas tienen undecremento porcentual bajo que a pesar de no ser lo más conveniente para el trabajo declasificación, por otro lado la métrica de F1-Score es otra que incrementa su valor tan solopara el experimento REG-LOG-05 en 1 punto porcentual para la clasificación de pacientesno epilépticos. Otra observación que se puede realizar a partir de los resultados, es quela aplicación del método SVD arpack y randomized parece tener el mismo efecto sobre el

Page 119: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

5.2 aplicaci ón de pca a modelos de clasificaci ón 107

experimento REG-LOG-05.

Experimento Muestras # C.P SVD Solver Exactitud Precisión

NN-FF-04 840 4 arpack 0.583 0.79NN-FF-04 840 4 randomized 0.681 0.82NN-FF-13 840 4 arpack 0.724 0.69NN-FF-13 840 4 randomized 0.744 0.71

Tabla 24: Resumen de experimentos PCA en los mejores dos experimentos de Redes Neuronales.

Tomando como referencia los experimentos de redes neuronales de la tabla 24 se notaque los nuevos modelos de redes neuronales no presentan mejoría con la aplicación dePCA respecto al puntaje ya quepierden una cantidad considerable porcentuales respecto alos experimentos originales.

Experimento Muestras # C.PSVD

SolverExactitud Precisión Exhaustividad

SVM-02 840 4 arpack 0.579 0.794 0.240SVM-02 840 4 randomized 0.570 0.796 0.231SVM-11 840 4 arpack 0.761 0.744 0.768SVM-11 840 4 randomized 0.777 0.764 0.776

Tabla 25: Resumen de experimentos PCA en los mejores dos experimentos de Máquinas de soportevectorial.

Por último, en los modelos de máquinas de soporte vectorial se visibiliza que paralos dos mejores experimentos (SVM-02 y SVM-11) la aplicación de PCA no mejora lasmétricas de los experimentos. Por el contrario, los puntajes de los modelos y su precisiónen la clasificación decrecen, a excepción del PCA realizado con método randomized en elexperimento SVM-11 donde los resultados son idénticos a los del experimento original.

Page 120: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 121: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

����� ��

�������� �� ����������

109

Page 122: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 123: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

6A N Á L I S I S D E R E S U LTA D O S

Dentro del proceso de extracción de características sobre los datos de electroencefalo-gramas a pacientes epilépticos y no epilépticos, se evidenció que un análisis de las señalesen el dominio de la frecuencia, facilita la identificación de diferencias entre pacientesepilépticos de aquellos que no lo son, puesto que visualmente se perciben diferencias entrelos dos casos. Por su parte, el análisis en el dominio del tiempo no permite determinartales diferencias.

Debido a que tales diferencias se logran visualizar, es posible llevar a cabo un análi-sis cuantitativo entre los valores en dominio de la frecuencia para pacientes epilépticosy no epilépticos. Por consiguiente, se realizó la extracción de características a través debandas de frecuencia, las cuales clasifican las frecuencias de la señal en los rangos ointervalos en el espectro electromagnético con los cuales se ha trabajado en este proyecto(Alfa, Beta, Delta, Gamma y Theta).

Para el desarrollo de la clasificación de pacientes, se aplicaron dos enfoques en la repre-sentación de los datos de las bandas de frecuencia. Estos dos enfoques fueron la potenciarelativa de la banda y la media aritmética de los valores de la banda. Estas representa-ciones pasan a ser las entradas de las técnicas de clasificación que se adelantaron en lassecciones previas (regresión logística, redes neuronales y maquinas de soporte vectorial),las cuales serán comparadas.

De esta forma, con los resultados de las técnicas de clasificación, se mide la eficaciade cada técnica en la clasificación de pacientes, entre aquellos que son epilépticos y losque no. Por esta razón, se consideraron las siguientes métricas [79]:

Exactitud: A través de esta métrica se evalua el modelo de clasificación ya que esuna fracción de predicciones que el modelo realizó de forma correcta. La ecuación19 define este valor.

Exactitud =VP + VN

VP + VN + FP + FN(19)

Precisión: Responde a la pregunta de ¿qué proporción de etiquetas positivas fuecorrecta. La precisión se define como lo muestra la ecuación 20.

Precisión =VP

VP + FP(20)

111

Page 124: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

112 an álisis de resultados

Exhaustividad: Es la proporción de positivos reales que se identificaron correctamen-te. En este caso es el número de pacientes epilépticos que fueron identificados por elmodelo como epilépticos. La exhaustividad es definida de acuerdo a la ecuación 21.

Exhaustividad =VP

VP + FN(21)

Donde:

• VP: Verdaderos positivos.

• FP: Falsos negativos.

• VN: Verdaderos negativos.

• FN: Falsos negativos.

F1-Score: Es la media armónica entre precisión y recuperación. Se obtiene a travésde la relación de la ecuación 22.

F1 =

�recall−1 + precision −1

2

�−1

= 2 · precision · recallprecision + recall

(22)

6.1 regresi ón log ística

Se realizaron 14 experimentos de regresión logística entre aquellos datos representadoscomo potencia relativa y media aritmética. La tabla 26 contiene los 4 mejores experimentosde acuerdo a sus métricas, para esta comparación la métrica que se toma como referenciaes el F1-Score ya que al ser una relación entre precisión y exhaustividad representa unindicador general de la calidad del modelo. Se observa por ejemplo que los modelosREG-LOG-05 y REG-LOG-13 tienen esta métrica más alta que los otros experimentos, sinembargo se descarta el modelo REG-LOG-13 puesto que la métrica de exactitud es menora pesar de haber usado un discretizador para el preprocesamiento.

Modelo Métrica Precisión Exactitud Exhaustividad F1-Score

REG-LOG-04 0.600 0.700 0.720 0.654REG-LOG-05 0.739 0.733 0.680 0.708REG-LOG-13 0.673 0.710 0.768 0.717REG-LOG-14 0.629 0.658 0.702 0.663

Tabla 26: Comparación de las métricas para los modelos seleccionados de Regresión Logística.Fuente: Elaboración propia.

Page 125: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

6.2 redes neuronales 113

6.2 redes neuronales

Para los clasificadores con redes neuronales perceptrón multicapa se visualiza en la tabla27 que el experimento NN-FF-04 tiene un desempeño muy sobresaliente en comparacióna los demás, todas las métricas de este experimento superan el 80 % representando laeficacia del etiquetado sobre los datos de prueba. La aplicación de un escalador estándarfue clave en este experimento para lograr estos resultados. También se puede destacar elexperimento NN-FF-13 que tiene un F1-Score del 77 % y es el mejor experimento para losdatos que se representan a través de media aritmética de las bandas de frecuencia.

ModeloMétrica Precisión Exactitud Exhaustividad F1-Score

NN-FF-03 0.781 0.765 0.820 0.800NN-FF-04 0.810 0.860 0.840 0.824NN-FF-11 0.759 0.742 0.677 0.715NN-FF-13 0.772 0.805 0.842 0.777

Tabla 27: Comparación de las métricas para los modelos seleccionados de Redes Neuronales.Fuente: Elaboración propia.

6.3 maquinas de soporte vectorial

Por otra parte, se realizaron 11 experimentos en los cuales se utilizó como clasificadorlas máquinas de soporte vectorial. En la tabla 28 se listan las métricas de los mejores 4experimentos de esta sección, seleccionando los dos mejores por cada uno de los enfoquespara representar los datos de entrada para los modelos. Teniendo en cuenta las métricasde F1-Score y exactitud se concluye que el mejor experimento fue el desarrollado para elmodelo SVM-11, el cual obtuvo valores de 77 % y 76 % respectivamente.

ModeloMétrica Precisión Exactitud Exhaustividad F1-Score

SVM-02 0.796 0.638 0.395 0.527SVM-06 0.793 0.643 0.387 0.520SVM-10 0.679 0.702 0.719 0.703SVM-11 0.775 0.773 0.743 0.758

Tabla 28: Comparación de las métricas para los modelos seleccionados de Maquinas de SoporteVectorial. Fuente: Elaboración propia.

Partiendo de las descripciones previas, se procede a comparar los tres mejores modelos,uno de cada técnica con el fin de decidir cuál es el mejor. Para tomar esta decisión, se hace

Page 126: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

114 an álisis de resultados

uso de la gráfica de curva de Característica Operativa del Receptor. Esta curva representala tasa de verdaderos positivos (TVP) frente a la tasa de falsos positivos (TFP) en diferentesumbrales de clasificación. Reducir el umbral de clasificación clasifica más elementos comopositivos, por lo que aumentarán tanto los falsos positivos como los verdaderos positivos.Las ecuaciones 23 y 24 definen respectivamente los valores de TVP y TFP [80].

TVP =VP

VP + FN(23)

TFP =FP

FP + VN(24)

Donde:

VP: Verdaderos positivos.

FP: Falsos negativos.

VN: Verdaderos negativos.

FN: Falsos negativos.

El área bajo la curva (Area Under Curve - AUC) indica la capacidad predictiva de losclasificadores [80], como se observa en la figura 85, el mejor valor para AUC es el delexperimento NN-FF-04 tomando un valor de 0.94 como se puede observar en el apartado(a) de la figura. Es de recordar que mientras más cercano sea el valor AUC a 1 la métricade separabilidad es mejor, por lo tanto se puede deducir que la Red Neuronal PerceptrónMulticapa es la técnica más eficaz frente a Regresión Logística y Máquinas de SoporteVectorial tomando como entradas características por bandas de frecuencia.

Page 127: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

6.3 maquinas de soporte vectorial 115

Figura 82: Curva AUC modelo REG-LOG-13

Figura 83: Curva AUC modelo NN-FF-04

��� ��� ��� ��� ��� ���

������������������������

���

���

���

���

���

���

����������������������������

�������������������������������������

����������

Figura 84: Curva AUC modelo SVM-11

Figura 85: Curvas AUC para los modelos seleccionados. Fuente: Elaboración propia.

Page 128: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 129: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

7A P O RT E S O R I G I N A L E S Y D I S C U S I Ó N

En el presente capítulo se describen aportes derivados del desarrollo de este proyectoque son aplicables en el campo de extracción de características para señales biológicas ytécnicas de clasificación.

7.1 aporte original

En este proyecto se realizó un estudio del estado del arte relacionado con el análisis deseñales electroencefalográficas, además de las técnicas de clasificación que se aplicaron alo largo del mismo. A partir de esta revisión, se plantearon una serie de procedimientospara dar solución al planteamiento del problema, cuyo desarrollo resultó en los siguientesaportes originales.

1. Dos planteamientos para representar las características por medio de ciertas ban-das de frecuencia: La técnica de bandas de frecuencia con Transformada Rápidade Fourier es una técnica bastante común en trabajos similares. No obstante, enesta investigación se propuso tomar dos representaciones para las característicasextraídas de cada examen de pacientes. En primer lugar, se optó por trabajar conla potencia relativa de cada banda de frecuencia y en segundo lugar, con la mediaaritmética de los valores de las bandas de frecuencia. El aporte original radica en eluso de estas dos representaciones como los datos de entrada para los clasificadoresy la evaluación de los resultados obtenidos para determinar cuál de estas represen-taciones agrega valor a la propuesta.

A partir de lo anterior, es relevante mencionar que para este proyecto fueron selec-cionados todos los canales (21 canales) presentes en cada EEG sin realizar algúntipo de procesamiento previo a la clasificación. Esto se traduce en más informacióndisponible para el aprendizaje de los modelos. Adicionalmente, se efectuaron expe-rimentos sobre estos modelos de clasificación procesando los datos de los exámenesmediante el análisis por componentes principales. Sin embargo este último enfoquede procesamiento no arrojó los mejores resultados.

2. Enfoque para realizar la comparación entre 3 técnicas de clasificación binaria co-munes: Con un análisis de los resultados de cada técnica de clasificación, se logradiferenciar cual es la manera más conveniente de etiquetar pacientes epilépticos yno epilépticos de acuerdo a las características que fueron extraídas en la sección 1.2y a la naturaleza de los exámenes que fueron seleccionados. Por tanto deducir cuales la mejor combinación de representación de datos y técnica de clasificación de

117

Page 130: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

118 aportes originales y discusi ón

acuerdo a las métricas obtenidas en los experimentos.

Partiendo de los resultados obtenidos en estos experimentos, algunos trabajosfuturos podrían partir de este proyecto para lograr avances en materia de extracciónde características y clasificación tomando fuentes de datos o tipos de señales distintasa las usadas en este proyecto.

7.2 discusi ón

Inicialmente para el desarrollo de este proyecto fue crucial la búsqueda de un conjuntode datos abierto y disponible que alojara información consistente de exámenes EEG sobreel cual partir. Una ventaja para la implementación de los experimentos, es el hecho deque el corpus utilizado como fuente de los exámenes, se actualiza constantemente y seencuentra documentado con la historia clínica de los pacientes, lo que permite relacionarcaracterísticas cualitativas y cuantitativas. Así mismo, el uso de este corpus posibilita lainteracción de este proyecto con un estado del arte amplio.

Es de señalar que a pesar de contar con una extensa base de datos se optó por construirun conjunto de datos pequeño de 20 pacientes que padecen epilepsia y 20 pacientesque no la padecen, tomando una sesión por cada uno de esos pacientes y obteniendo840 muestras que en comparación con otras investigaciones y proyectos, es un conjuntopequeño. Esto incide en la capacidad de aprendizaje de los modelos puesto que a mayorcantidad de datos los clasificadores tienen mayor oportunidad de generalizar y etiquetarcasos particulares.

Por otra parte, dentro del procesamiento de los datos se perciben diferencias entrelos conjuntos de datos en los que se aplicaron técnicas de escalado o discretización yaquellos conjuntos de datos que no tuvieron este preprocesamiento. Estas técnicas fueronútiles para lograr una normalización o agrupamiento según el caso, lo que resulta en unaseparación de los datos. Por lo tanto, para los modelos será más sencillo entrenarse yclasificar estas nuevas entradas. Tal es el caso de los experimentos en los que se utilizó laregresión logística. En estos se evidencian mejores resultados en los experimentos finales,a los cuales se les aplicaron estas técnicas a comparación de los iniciales que no contaroncon este preprocesamiento sobre los datos.

Igualmente se aplicó una técnica común de preprocesamiento a las características extraídasa partir de las bandas de frecuencia con el fin de reducir el número de dimensiones sinperder detalle de la información. Esta técnica es conocida como Análisis por ComponentesPrincipales. No obstante, la aplicación de esta técnica no dio lugar a resultados favorablesen comparación a los obtenidos sin este análisis. Esto se debe a que esta técnica estádirigida a un procesamiento a priori de los datos, que para este caso se hizo con lasbandas de frecuencia. También debe resaltarse que este análisis tiene un mejor desempeño

Page 131: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

7.2 discusi ón 119

sobre cantidades extensas de datos y con una mayor dimensión.

Dentro del estado del arte relacionado con el análisis de señales EEG, se encuentrandiferentes tipos de técnicas de clasificación que pueden resultar más útiles que las utiliza-das en este proyecto. Asimismo, este proyecto no contó con el acompañamiento de unespecialista en el campo de la neurología que puede validar la eficacia de la metodologíaaplicada.

Page 132: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 133: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

8C O N C L U S I O N E S Y T R A B A J O S F U T U R O S

8.1 conclusiones

Este proyecto tuvo como intención determinar cuáles características eran de relevanciapara analizar anomalías relacionadas con epilepsia a través del estudio de los EEGs.Basado en un análisis cualitativo de las señales en dominio de frecuencia se logró detectardiferencias clave entre pacientes que padecían epilepsia y pacientes que no sufrían estaenfermedad. Por consiguiente, se expresaron tales características de manera cuantitativaen términos de bandas de frecuencia y a partir de estos datos se pudo etiquetar unconjunto de datos base de forma binaria (para pacientes sanos se usó la clase 0 y para lospacientes epilépticos, la clase 1).

Partiendo de un estudio del estado del arte, se escogieron las tres técnicas de clasi-ficación aplicadas a los largo de este proyecto: Regresión Logística, Redes Neuronalesy Máquinas de Soporte Vectorial, puesto que cuentan con gran popularidad en inves-tigaciones relacionadas a los temas desarrollados en este trabajo. Por otra parte, existegran variedad de recursos tanto teóricos como prácticos que permiten un acercamientoe implementación sencillos para estos algoritmos. Este punto facilitó la ejecución de losexperimentos necesarios para evaluar qué elementos (representación de los datos y técnicade clasificación) generan los mejores resultados para esta investigación.

Ahora bien, en los procesos de entrenamiento de los modelos de clasificación quese realizaron se encontraron particularidades como la mejoría de métricas en aquellosmodelos donde fueron aplicadas técnicas de normalización y discretización de los datosde entrada. Para el caso de los experimentos de Regresión Logística, por ejemplo, laprecisión de los modelos sin normalizar la información rondaba en un 54 % a 62 %, noobstante, tras aplicar escaladores, se vio un aumento en algunos experimentos de hastade un 6 % en los indicadores de calidad de los modelos. Se exponen los experimentos deregresión logística, dado que fue el clasificador cuyas métricas no se interpretaban comosatisfactorias y representaban un entrenamiento fallido, pero que sin embargo tras unanormalización de los datos de entrada presentó un incremento notable en esos resultados.

Considerando los resultados y métricas utilizados para comparación en el capítulode análisis de resultados, se puede concluir que la mejor propuesta para sistema dediagnóstico de pacientes es aquel donde la señal EEG se representa a través de la potenciarelativa de las bandas de frecuencia y clasificando dichos datos aplicando la arquitecturade redes neuronales perceptrón multicapa descrita en el modelo NN-FF-04, teniendo encuenta que para este modelo los datos fueron preprocesados por medio de un escalador

121

Page 134: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

122 conclusiones y trabajos futuros

estándar, lo que influyó para lograr una precisión del 86 % y una exactitud del 81 %. Sibien es cierto que estos valores no representan una total eficacia para el diagnóstico depacientes, es un resultado sobresaliente comparado con los experimentos desarrolladospara este proyecto y teniendo en cuenta las condiciones descritas a lo largo del mismo.

8.2 trabajos futuros

La propuesta para un sistema de diagnóstico presentada en este proyecto, provee alos futuros investigadores en el campo un punto de partida en el área de extracciónde características de señales biológicas como EEG o ECG (Electrocardiograma) y declasificación de las mismas. Tales áreas son amplias y cuentan con muchas aplicacionesque pueden ser exploradas e investigadas con el fin de construir un sistema de diagnósticocuya precisión para etiquetar pacientes supere lo expuesto en este proyecto. Algunas deestas posibles aplicaciones pueden ser:

Aprobación de un profesional en neurología: Como se mencionó en la discusión,este proyecto no cuenta con la validación por parte de un profesional de la salud,por tanto se considera que un valor agregado para un proyecto derivado puede serla evaluación y aprobación de un neurologo que pueda poner a prueba el sistema dediagnóstico realizado con pacientes cuyas historias clínicas y condiciones de saludsean variadas. Esto es una forma de validar los indicadores de calidad obtenidoscon los modelos realizados.

Construir un conjunto de datos más extenso: El conjunto de datos que se trabajóen este proyecto fue pequeño, pues cuenta con 840 muestras divididas en 21 canalespor pacientes de los cuales 20 eran pacientes epilépticos y 20 pacientes no epilépticos.De esta forma, se considera la posibilidad de incrementar el número de pacientes,tomar más sesiones por pacientes y también aplicar técnicas de limpieza de datosen señales biológicas como por ejemplo la eliminación de canales “malos”, es decir,aquellos con daños e información inestable con respecto a los otros canales. Estoimplica un análisis visual de los exámenes EEG. Así pues, con un conjunto de datosmás diverso y limpio, el proceso de entrenamiento de los modelos puede mejorar.

Diagnóstico de varias enfermedades o anomalías: Aunque el enfoque de esteproyecto fue diagnosticar entre dos tipos de pacientes, entre aquellos que sonepilépticos y los que no, un enfoque que resulta interesante es el poder clasificary diagnosticar pacientes no para una sola enfermedad, sino hacerlo para variasenfermedades, por ejemplo: esquizofrenia, alzheimer, etc.

Exploración de otras técnicas para extracción de características: Se puede com-plementar el conjunto de datos de entrada para los modelos con característicasextraídas no solamente a partir de bandas de frecuencia, sino también con métricasestadísticas simples, Análisis por Componentes Principales, Parámetros de Hjorth

Page 135: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

8.2 trabajos futuros 123

y Transformada Wavelet [81], tomando en cuenta estos enfoques pueden lograrseresultados de clasificación superiores.

Aplicación de otros algoritmos para clasificación de datos: Dentro de las inves-tigaciones relacionadas con el propósito de este trabajo, se aplican otras técnicaspara la clasificación de datos además de las utilizadas aquí. Algunos de ellos sonRedes Neuronales Convolucionales o Recurrentes [82], clasificador bayesiano [83],etc. La aplicación de dichos algoritmos puede resultar en mejores resultados que losencontrados en este proyecto.

Pasar del diagnóstico a la predicción: De acuerdo con lo observado en el estadodel arte, muchas investigaciones tienen por objetivo encontrar patrones a lo largode un periodo de tiempo los cuales permiten predecir situaciones futuras. Para estecaso, se pueden explorar nuevos desarrollos, como partir de un análisis de señalesEEG de un paciente a lo largo del tiempo con el fin de identificar elementos quepermitan predecir si es susceptible o no de sufrir enfermedades cerebrales.

Page 136: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 137: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

����� �

��������

125

Page 138: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 139: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

AD E S C R I P C I Ó N PA C I E N T E

a.1 detalle de pacientes epil épticos

No. Descripción Examen

1

Mujer de 46 años traída por el primer episodio de convulsionesdescrito como sacudidas por todas partes, mordeduras de lengua,historia de malformación arteriovenosa del lado izquierdo conclips. EEG anormal debido a convulsiones electrográficas recu-rrentes en la parte posterior izquierda.

00008476_s003_t003

2Mujer de 66 años con metástasis posterior cerebelosa evaluada aprincipios de esta semana por convulsiones con desviación delojo hacia la derecha pero un EEG poco notable.

00006894_s003_t000

3

Hombre de 55 años con historia de estado anticoagulante despuésde una caída con traumatismo craneal, hematoma occipital derecho,parietal y epidural, fractura parietal izquierda y hematoma. Estees un electroencefalograma anormal debido a la sutil disminuciónfocal de la derecha, particularmente en la región frontocentral.

00009992_s002_t001

4Mujer de 41 años con un historial de esclerosis múltiple y ataquesrecurrentes. El propósito del registro a largo plazo era evaluarlos posibles ataques recurrentes.

00010052_s004_t002

5

Mujer de 63 años con un episodio reciente de visión borrosay afasia expresiva durante una hora, evaluada por una convulsiónparcial compleja. Se trata de un electroencefalograma ligeramenteanormal debido a la lentitud focal que se observa en la somnolenciaen la región frontocentral frontotemporal izquierda.

00010138_s001_t000

6

Mujer de 72 años encontrada confundida en el suelo con inconti-nencia de vejiga e intestinos, con hipertensión, diabetes, enfermedadrenal crónica en hemodiálisis. EEG anormal debido a una desacelera-ción generalizada de moderada a severa.

00010270_s003_t000

127

Page 140: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

128 descripci ón paciente

No. Descripción Examen

7

Hombre de 31 años con un historial de convulsiones hace 2 meses,el último evento hace 2 semanas. No registró el evento. Dijo queocurrió un día mientras dormía. Al despertar, estaba dolorido.Historial de asma y depresión.

00010347_s001_t000

8

Mujer de 25 años de edad con un historial de actividad similar a lasconvulsiones de nueva aparición, con escalofríos, ver colores ypatrones y mal olor seguido de 30 segundos de pérdida de conciencia.Un electroencefalograma repetido que capte las etapas más profundasdel sueño o un EEG ambulatorio de 24 horas puede ser útil paradetectar la epilepsia.

00010412_s001_t000

9Una mujer de 42 años con episodios recurrentes de pérdida deconciencia en los últimos 5 días, actividad convulsiva seguida deconfusión.

00010590_s001_t000

10

Mujer de 60 años con un historial de migrañas, taquicardia yantecedentes familiares de epilepsia. A menudo con 5 ataquesdiarios, caracterizados por actividad con pérdida de concienciae incontinencia. Las convulsiones ocurren fuera del sueño.

00010838_s001_t000

11

Hombre de 44 años con historia de epilepsia refractaria. Este elec-troencefalograma revela evidencia de disfunción cerebral focal enla región temporal media lateral, que es inespecífica en cuanto a laetiología.

00010590_s001_t000

12Mujer de 63 años con historial de convulsiones, que presenta aluci-naciones visuales. Un electroencefalograma normal no descarta eldiagnóstico de epilepsia.

00000592_s005_t000

13

Mujer de 53 años con epilepsia refractaria desde los 30 años. Enla vigilia máxima el EEG de fondo está bien organizado y al finaldel registro, la vigilia máxima se caracteriza por un ritmo alfade 10.5 Hz.

00000767_s002_t001

14

Mujer de 70 años con un historial de 1 a 2 días de exacerbación deconvulsiones parciales complejas. EEG anormal debido al estado epi-léptico parcial complejo temporal derecho y la desaceleración focaldel temporal derecho.

00000883_s002_t000

15Mujer de 70 años con epilepsia desde 1984. EEG anormal debido alligero exceso de theta temporal por la edad y sutiles ondas agudastemporales derechas.

00000930_s002_t000

Page 141: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

A.1 detalle de pacientes epil épticos 129

No. Descripción Examen

16

Hombre diestro de 64 años con historial de convulsiones. Estasección de monitoreo continuo de EEG es notable por un fondo lento,ondas agudas temporales izquierdas, y lo que parece ser emergente,complejos occipitales periódicos.

00001819_s004_t000

17Hombre de 57 años admitido con 4 convulsiones. EEG anormal debidoa zona focal disminuyendo la velocidad desde la derecha y un eventodurante el EEG sin deterioro de la conciencia.

00003005_s004_t001

18Hombre de 54 años con historial de epilepsia y una lesión traumáticaprevia en la cabeza. No se observaron convulsiones ni descargas deepileptiformes.

00003136_s004_t000

19

Hombre de 19 años con un historial médico de convulsiones desde los16 años. EEG anormal debido a ráfagas de picos y olas generalizadas.Este EEG es consistente con un diagnóstico de epilepsia generalizadaidiopática.

00003281_s002_t000

20Hombre de 62 años con un historial de cáncer de pulmón. Este es unEEG anormal despierto y somnoliento de 21 minutos debido a lacontinua desaceleración temporal izquierda de leve a moderada.

00003593_s004_t000

Page 142: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

130 descripci ón paciente

a.2 detalle de pacientes no epil épticos

No. Descripción Examen

1

Mujer de 43 años de edad que se presenta con estado post parocardíaco el 08/09/2013, caída por un tiempo desconocido con cracky heroína positivos, que fue encontrada en actividad eléctrica sinpulso con edema cerebral difuso.

00010617_s001_t002

2Este electroencefalograma revela pruebas de disfunción cerebralfocal en la región temporal anterior izquierda, que no es espe-cífica en cuanto a su etología.

00010736_s001_t000

3 Mujer de 73 años con un episodio de mareo y sensación de desmayo. 00002744_s002_t002

4Hombre de 61 años de edad admitido en el hospital el 18 de abrilde 2010 con un infarto en la zona izquierda caracterizado porla dificultad del lenguaje y una gran confusión.

00003612_s002_t001

5Mujer de 63 años de edad con un historial de enfermedad bipolary deterioro agudo de la cognición.

00007671_s001_t000

6

Hombre de 67 años de edad que tuvo un episodio de sacudida delabdomen izquierdo y del brazo izquierdo y antecedentes deaccidente cerebrovascular en el lado derecho en 1997, diabetesmellitus, hipertensión y aneurisma aórtico abdominal.

00007732_s001_t000

7Mujer de 81 años con antecedentes de accidente cerebrovascularderecho y estenosis carotídea derecha del 79 % que presenta pre-operatorio para una endarterectomía de la carótida derecha.

00009147_s001_t000

8 Electroencefalograma de rutina. 00009710_s001_t000

9Mujer de 70 años fue encontrada en el suelo, somnolienta,sin seguir órdenes, agitada, intubada con fiebre baja.

00009853_s001_t000

10Mujer de 34 años de edad con procesos cognitivos deterio-rados y entumecimiento progresivo del lado izquierdo.

00009910_s001_t000

Page 143: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

A.2 detalle de pacientes no epil épticos 131

No. Descripción Examen

11Mujer de 62 años con antecedentes de hipertensión, diabetes,apnea obstructiva del sueño grave y enfermedad pulmonar restri-ctiva.

00005459_s001_t000

12Mujer de 35 años con desmayos durante los últimos 2 años queocurren 1-3 veces al año y migrañas 2-4 veces por semana. Estees un EEG ambulatorio.

00006801_s001_t001

13Hombre de 33 años para evaluar la epilepsia y el deterioro dela memoria. Se trata de un hombre de 33 años con antecedentesde meningitis e hidrocefalia o hipoencefalitis.

00006906_s001_t001

14Mujer de 26 años admitida con estado de émbolo pulmonar trasmúltiples paros cardíacos el 19/04/2010, y más de 12 horas antesde este EEG el 20/04/2010. EEG de paciente interno.

00007331_s001_t000

15

Hombre de 72 años con ansiedad y un episodio de comporta-miento alterado después de usar marihuana envenenada, ahoracon episodios fluctuantes de alucinaciones, ansiedad, agitación.Dos posibles conmociones cerebrales con pérdida de con-ciencia mientras juega al fútbol.

00008249_s001_t000

16Hombre de 32 años con inicio abrupto de dolor torácico en ellado izquierdo y dificultad para hablar y discitis.

00008576_s001_t000

17Hombre de 57 años con estenosis de la carótida derecha, hiper-lipidemia, gota y enfermedad de las arterias coronarias.

00008950_s001_t001

18Hombre de 51 años con un derrame cerebral, hemiparesia izquierda,hepatitis B y hepatitis C. El paciente fue admitido con insufi-ciencia renal aguda y crónica y temblor de la pierna izquierda.

00009002_s001_t000

19Mujer de 75 años que depende de un respirador y se le hizo unatraqueotomía el día 21 de la biopsia de pulmón con un estado men-tal creciente y decreciente.

00009333_s001_t000

20

Hombre de 75 años que tiene un cambio en su estado mental. Elpaciente ha estado intubado desde el 28/06/2013. Recibió Versed.Desde entonces, el Versed ha sido desconectado pero el pacienteno se despierta.

00010501_s001_t001

Page 144: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA
Page 145: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

B I B L I O G R A F Í A

[1] J. Kaur y A. Kaur, «A review on analysis of EEG signals,» mar. de 2015, págs. 957-960.doi: ���������������������������.

[2] M. Zhou, C. Tian, R. Cao, B. Wang, Y. Niu, T. Hu, H. Guo y J. Xiang, «EpilepticSeizure Detection Based on EEG Signals and CNN.,» Frontiers in neuroinformatics,vol. 12, pág. 95, 2018, issn: 1662-5196. doi: ������������������������.

[3] «Epilepsy,» en Encyclopedic Reference of Molecular Pharmacology. Berlin, Heidelberg:Springer Berlin Heidelberg, 2004, págs. 347-347, isbn: 978-3-540-29832-8. doi: �������������������������.

[4] J. S. Kumar y P. Bhuvaneswari, «Analysis of Electroencephalography (EEG) Signalsand Its Categorization–A Study,» Procedia Engineering, vol. 38, págs. 2525 -2536,2012, INTERNATIONAL CONFERENCE ON MODELLING OPTIMIZATION ANDCOMPUTING, issn: 1877-7058. doi: ��������������������������������������������.

[5] Y. Paul, «Various epileptic seizure detection techniques using biomedical signals: areview,» Brain Informatics, vol. 5, n.o 2, pág. 6, 2018, issn: 2198-4026. doi: �������������������������.

[6] . Niedermeyer Ernst, Lopes da Silva F. H. e I. Ovid Technologies, Electroencep-halography : basic principles, clinical applications, and related fields, English, 5th ed.Philadelphia ; London : Lippincott Williams & Wilkins, 2005, Includes bibliographi-cal references and index, isbn: 0781751268.

[7] R. P. Loreto y A. D. Carolina, «Aporte de los distintos métodos electroencefalo-gráficos (eeg) al diagnóstico de las epilepsias,» Revista Médica Clínica Las Condes,vol. 24, n.o 6, págs. 953 -957, 2013, Tema central: Epilepsia, issn: 0716-8640. doi:���������������������������������������������.

[8] «Logistic Regression,» en Encyclopedia of Machine Learning and Data Mining, Boston,MA: Springer US, 2017, págs. 780-781. doi: �����������������������������.

[9] «Neural Networks,» págs. 898-899, 2017. doi: �����������������������������.

[10] E. Martin, S. Kaski, F. Zheng y col., «Support Vector Machines,» en Encyclopedia ofMachine Learning, Boston, MA: Springer US, 2011, págs. 941-946. doi: �����������������������������.

[11] S. N. Abdulkader, A. Atia y M.-S. M. Mostafa, «Brain computer interfacing: Applica-tions and challenges,» Egyptian Informatics Journal, vol. 16, n.o 2, págs. 213-230, 2015,issn: 11108665. doi: �������������������������.

[12] M. Heyden, «Classification of EEG data using machine learning techniques,» inf. téc.,2016. dirección: �����������������.

133

Page 146: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

134 bibliografía

[13] «Análisis del electroencefalograma con transformada de Fourier y modelos paramé-tricos,» inf. téc. dirección: ��������������������������������������������������������.

[14] M. Z. Parvez y M. Paul, «EEG signal classification using frequency band analysistowards epileptic seizure prediction,» 16th Int’l Conf. Computer and InformationTechnology, ICCIT 2013, n.o March, págs. 126-130, 2014. doi: ������������������������������.

[15] J. Haitao y L. Suiyuan, «Research of EEG Signal Feature Exaction Technology Basedon the Blind Signal Separation Algorithm,» inf. téc., 2013, págs. 253-256. dirección:����������������������������.

[16] J.-H. Kang, Y. G. Chung y S.-P. Kim, «An efficient detection of epileptic seizure bydifferentiation and spectral analysis of electroencephalograms,» 2015. doi: ��������������������������������.

[17] B. Hjorth, «EEG analysis based on time domain properties,» Electroencephalographyand Clinical Neurophysiology, vol. 29, n.o 3, págs. 306-310, 1970, issn: 0013-4694. doi:����������������������������.

[18] H. Rajaguru, «Logistic Regression Gaussian Mixture Model and Classification fromEEG Signals,» n.o Iccmc, págs. 985-988, 2017.

[19] H. Rajaguru y S. K. Prabhakar, «Non linear ICA and logistic regression for classifi-cation of epilepsy from EEG signals,» Proceedings of the International Conference onElectronics, Communication and Aerospace Technology, ICECA 2017, vol. 2017-Janua,págs. 577-580, 2017. doi: ��������������������������.

[20] J. W. Puspita, G Soemarno, A. I. Jaya y E Soewono, «Interictal Epileptiform Dischar-ges (IEDs) classification in EEG data of epilepsy patients,» J. Phys, pág. 12 030, 2017.doi: ������������������������������.

[21] A. I. Jaya, G. Soemarno y J. W. Puspita, «Classification of Epileptiform Waves Basedon Frequency by Using Backpropagation Neural Network,» J. Phys, pág. 12 048, 2018.doi: �������������������������������.

[22] R. Panda y P. Khobragade, «Classification of EEG signal using wavelet transformand support vector machine for epileptic seizure diction,» 2010. doi: ��������������������������.

[23] S. Kumar Satapathy, A. Kumar Jagadev y S. Dehuri, «Weighted Majority VotingBased Ensemble of Classifiers Using Different Machine Learning Techniques forClassification of EEG Signal to Detect Epileptic Seizure,» inf. téc., 2017, págs. 99-110.dirección: ���������������������������������������������������������������������������������������������������������������������������������.

[24] C. D. Binnie y P. F. Prior, «Electroencephalography.,» Journal of neurology, neurosurgery,and psychiatry, vol. 57, n.o 11, págs. 1308-19, 1994, issn: 0022-3050. doi: �����������������������.

Page 147: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

bibliografía 135

[25] D. Millett, «Hans Berger: From Psychic Energy to the EEG,» Perspectives in Biologyand Medicine, vol. 44, n.o 4, págs. 522-542, 2001. doi: ���������������������.

[26] File:1st-eeg.png - Wikipedia. dirección: ����������������������������������������������������������� (visitado 21-07-2020).

[27] E. K. St Louis y L. C. Frey, «An Introductory Text and Atlas of Normal and AbnormalFindings in Adults, Children, and Infants,» doi: �������������������������.

[28] A. Morley Andrew Morley Hons y L. Hill, «10-20 system EEG Placement,» RoyalHospital for Sick Children, Edinburgh, inf. téc., 2016. dirección: ���������������������������������������������������������.

[29] M Teplan, «FUNDAMENTALS OF EEG MEASUREMENT,» inf. téc. 2, 2002. direc-ción: ����������������������������������������������������������������������.

[30] T. Talamillo García, «Nociones elementales para la interpretación del EEG,» inf.téc. dirección: ���� � � � ��� � ���������������� � �� � ���������������������� �

����������������������������������������������.

[31] S. L. Marple, Digital spectral analysis : with applications. Englewood Cliffs N.J.: Prentice-Hall, 1987, pág. 492, isbn: 9780132141499. dirección: ����������������������������������������������������������������������������������������.

[32] A. Alkan, ·. M. K. Kiymik, A Alkan y M. K. Kiymik, «Comparison of AR and WelchMethods in Epileptic Seizure Detection,» J Med Syst, vol. 30, págs. 413-419, 2006.doi: �������������������������.

[33] S. Shalev-shwartz, C. Science, S. Ben-david y C. Science, vanHornWO084665A2_2007.pdf,isbn: 9781107057135.

[34] A. Mackiewicz y W. Ratajczak, «Principal components analysis (PCA),» Computers& Geosciences, vol. 19, n.o 3, págs. 303 -342, 1993, issn: 0098-3004. doi: ����� �

��������������������������������������.

[35] V. Boyarshinov, Machine Learning Machine Learning, April. 2005, vol. 2005, pág. 414,isbn: 0071154671. dirección: �����������������.

[36] F. F. Q. Xjui, P. O. B. O. E. Mpx y A. Gulli, Antonio Gulli Sujit Pal BIRMINGHAM-MUMBAI. 2017, isbn: 9781787128422.

[37] T. M. Mitchell, Machine Learning, 1.a ed. New York, NY, USA: McGraw-Hill, Inc.,1997, isbn: 0070428077, 9780070428072.

[38] D. W. Hosmer, S. Lemeshow y R. X. Sturdivant, Applied Logistic Regression: ThirdEdition. 2013, págs. 1-510, isbn: 9781118548387. doi: ���������������������.

[39] R. E. Neapolitan y R. E. Neapolitan, Neural Networks and Deep Learning. 2018,págs. 389-411, isbn: 9783319944623. doi: �����������������.

[40] X.-S. Yang, Introduction to Algorithms for Data Mining and Machine Learning, isbn:9780128172162.

Page 148: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

136 bibliografía

[41] Temple University EEG Corpus - Overview. dirección: ������������������������������������������������������������������������ (visitado 09-02-2020).

[42] S. Ferrell, V. Mathew, M. Refford, V. Tchiong, T. Ahsan, I. Obeid y J. Picone, «TheTemple University Hospital EEG Corpus: Electrode Location and Channel Labels,»2019.

[43] I. Obeid y J. Picone, «The Temple University Hospital EEG Data Corpus,» Frontiersin Neuroscience, vol. 10, n.o MAY, pág. 196, 2016, issn: 1662-453X. doi: ������������������������.

[44] A. o. A. Electroencephalography, Bipolar Montage. dirección: ����������������������������������������������������������������������� (visitado 15-04-2020).

[45] M. G. Tsipouras, «Spectral information of EEG signals with respect to epilepsyclassification,» doi: �������������������������.

[46] M. Medicinas, Midazolam. dirección: ������������������������������������������������������������� (visitado 15-04-2020).

[47] J. Demos., Getting Started with Neurofeedback, 2005. dirección: ���������������������������������������������������������������������������������������������������

������������ (visitado 28-03-2020).

[48] M. enciclopedia Médica, Sobredosis de Dilantin. dirección: ������������������������������������������������������� (visitado 15-04-2020).

[49] A. Skajaa y M. S. Student, «Limited Memory BFGS for Nonsmooth Optimization,»inf. téc., 2010.

[50] R.-E. Fan, K.-W. Chang, C.-J. Hsieh, X.-R. Wang y C.-J. Lin, «LIBLINEAR: A Libraryfor Large Linear Classification,» inf. téc., 2008, págs. 1871-1874. dirección: ���������������������������.

[51] J. Luis y R. Reina, «Complementos de aprendizaje automático,» inf. téc., 2016.

[52] A. Defazio Ambiata, F. Bach y S. Lacoste-Julien, «SAGA: A Fast Incremental GradientMethod With Support for Non-Strongly Convex Composite Objectives,» inf. téc.arXiv: �����������.

[53] K. Koh, S.-J. Kim y S. Boyd, «A Method for Large-Scale L1-Regularized LogisticRegression,» inf. téc. dirección: ������������.

[54] R. Bollapragada, D. Mudigere, J. Nocedal, H.-J. M. Shi, P. Tak y P. Tang, «A Progres-sive Batching L-BFGS Method for Machine Learning,» inf. téc. arXiv: ������������.

[55] S. Sugimoto y N. Yamashita, «A regularized limited-memory BFGS method forunconstrained minimization problems,» inf. téc., 2014.

[56] «Regularization with Ridge penalties, the Lasso, and the Elastic Net for Regressionwith Optimal Scaling Transformations,» inf. téc.

Page 149: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

bibliografía 137

[57] A. Sakai, Y. Minoda y K. Morikawa, «Data augmentation methods for machine-learning-based classification of bio-signals,» en BMEiCON 2017 - 10th BiomedicalEngineering International Conference, vol. 2017-January, Institute of Electrical y Elec-tronics Engineers Inc., 2017, págs. 1-4, isbn: 9781538608821. doi: ����������������������������.

[58] K. Gurney y N. York, «An introduction to neural networks,» inf. téc., 1997.

[59] R. Grosse, «Lecture 5: Multilayer Perceptrons,» inf. téc.

[60] P. J. Rousseeuw y M. Hubert, «Robust statistics for outlier detection,» Inc. WIREsData Mining Knowl Discov, vol. 1, págs. 73-79, 2011. doi: ��������������.

[61] C. Enyinna Nwankpa, W. Ijomah, A. Gachagan y S. Marshall, «Activation Functions:Comparison of Trends in Practice and Research for Deep Learning,» inf. téc. arXiv:������������.

[62] Standard Scaler. dirección: ������������������������������������������������������������������������������������������� (visitado 06-05-2020).

[63] G. Hinton, N. Srivastava y K. Swersky, «Neural Networks for Machine LearningLecture 6a Overview of mini--batch gradient descent,» inf. téc.

[64] X. Glorot, A. Bordes e Y. Bengio, «Deep Sparse Rectifier Neural Networks,» inf. téc.,2011.

[65] C. Nwankpa, W. Ijomah, A. Gachagan y S. Marshall, Activation Functions: Comparisonof trends in Practice and Research for Deep Learning, 2018. arXiv: ���������� �������.

[66] X. Ying, «An Overview of Overfitting and its Solutions,» Journal of Physics: ConferenceSeries, vol. 1168, pág. 022 022, 2019. doi: �������������������������������.

[67] N. Qian, «On the momentum term in gradient descent learning algorithms,» NeuralNetworks, vol. 12, n.o 1, págs. 145 -151, 1999, issn: 0893-6080. doi: ���������������������������������������������.

[68] Incorporating Nesterov Momentum into Adam, 2016. dirección: �������������������������������������������������.

[69] J. Kukacka, V. Golkov y D. Cremers, «Regularization for Deep Learning: A Taxo-nomy,» oct. de 2017.

[70] Support Vector Machines. dirección: ������������������������������������������������ (visitado 21-06-2020).

[71] S. Raschka, «About Feature Scaling and Normalization and the effect of standardiza-tion for machine learning algorithms,» jul. de 2014. doi: ����������������������.

[72] S. Panja, A. Chatterjee y G. Yasmin, «Kernel Functions of SVM: A Comparison andOptimal Solution,» en Advanced Informatics for Computing Research, A. K. Luhach,D. Singh, P.-A. Hsiung, K. B. G. Hawari, P. Lingras y P. K. Singh, eds., Singapore:Springer Singapore, 2019, págs. 88-97, isbn: 978-981-13-3140-4.

Page 150: PROPUESTA DE SISTEMA PARA EL DIAGN ÓSTICO DErepository.udistrital.edu.co/bitstream/11349/25527/1/Pa...María Camila Guerrero Giraldo, Juan Sebastian Parada Celis: PROPUESTA DE SISTEMA

138 bibliografía

[73] Discretization. dirección: ��������������������������������������������������������������������������������������� (visitado 24-06-2020).

[74] MaxAbsScaler. dirección: ���������������������������������������������������������������������������������������������� (visitado 24-06-2020).

[75] R. Vidal, Y. Ma y S. S. Sastry, «Generalized Principal Component Analysis,» inf. téc.dirección: �����������������������������������.

[76] X. Kong, C. Hu y Z. Duan, «Principal Component Analysis Networks and Algo-rithms,» inf. téc.

[77] R. B. Lehoucq, D. C. Sorensen y C. Yang, ARPACK Users’ Guide. Society for Industrialy Applied Mathematics, 1998. doi: �����������������������.

[78] N Halko, P. G. Martinsson y J. A. Tropp, «Finding Structure with Randomness:Probabilistic Algorithms for Constructing Approximate Matrix Decompositions *,»vol. 53, n.o 2, págs. 217-288, doi: �����������������.

[79] Evaluación de modelos. dirección: ������������������������������������������������������ (visitado 28-06-2020).

[80] K. Hajian-Tilaki, «Receiver Operating Characteristic (ROC) Curve Analysis forMedical Diagnostic Test Evaluation,» eng, Caspian journal of internal medicine, vol. 4,n.o 2, págs. 627-635, 2013, 24009950[pmid], issn: 2008-6164. dirección: ����������������������������������������.

[81] L. Hu y Z. Zhang, eds., EEG Signal Processing and Feature Extraction. SpringerSingapore, 2019. doi: �������������������������.

[82] I. Aliyu, Y. Lim y C. Lim, «Epilepsy Detection in EEG Signal using Recurrent NeuralNetwork,» mar. de 2019, págs. 50-53. doi: �����������������������.

[83] P. Fergus, A. Hussain, D. Hignett, D. Al-Jumeily, K. Abdel-Aziz y H. Hamdan, «Amachine learning system for automated whole-brain seizure detection,» AppliedComputing and Informatics, vol. 12, n.o 1, págs. 70 -89, 2016, issn: 2210-8327. doi:�����������������������������������������.