m1 - 6 · 2015-07-21 · 18 ejercicio variable tipo códigos definición sexo dicotómica 1 hombre...

39
Santiago Pérez Cachafeiro Metodólogo. Fundación I+D+i Complexo Hospitalario de Pontevedra 25 de Mayo de 2011

Upload: others

Post on 01-Jan-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

Santiago Pérez CachafeiroMetodólogo. Fundación I+D+iComplexo Hospitalario de Pontevedra25 de Mayo de 2011

Page 2: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

¿Cómo preparar una hoja de recogida de datos y gestionar los datos?

Page 3: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

3

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 4: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

4

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 5: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

5

1. Introducción a la Gestión de Datos en Biomedicina

• Aspectos Relevantes

Planificación: aspectos ético‐legales

Depuración y análisis: software/apoyo estadístico

Recogida de datos: estructura de las bases de datos

Page 6: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

6

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 7: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

7

2. Objetivos

• Aprender a definir las variables

• Importancia de la definición

• Importancia de los valores perdidos

• Importancia de la homogeneidad en la recogida de datos 

Page 8: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

8

2. Objetivos

• Conocer la organización interna de una base de datos

• Vista de variables

• Vista de datos

• Exportabilidad 

Page 9: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

9

2. Objetivos

• Aprender a diseñar una base  de datos

• Definir variables

• Diseñar hoja de recogida

• Diseñar control de calidad

• Cumplimiento de la legislación vigente

ANONIMIZADAS

Page 10: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

10

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 11: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

11

3. 1 Tipos de variables | Clasificación

• Cuantitativas– Contínuas

– Discretas

• Cualitativas– Categóricas

– Ordenadas o Graduadas

– Dicotómicas

• Temporales (contínuas)– Fecha

– Hora

• Textuales– Respuestas abiertas

Page 12: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

12

3. 1 Tipos de variables | Importancia de las definiciones

• Caso es el individuo que presenta un evento en la población de estudio– Caso episodio de enfermedad

– P.ej caso de gripe

• Definición 1. Síntomas + Fiebre>38– 1000 casos

• Definición 2. Síntomas + Fiebre>37,5– 1500 casos

• Casos diagnosticados en AP– 3000 episodios de gripe

Page 13: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

13

3. 1 Tipos de variables | Importancia de las definiciones

• Consumo de tabaco.

• Definición de no fumador

– No durante el último mes

– No durante el último año

– Nunca consumió

Page 14: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

14

3. 1 Tipos de variables | Definiciones estándar

• Clasificaciones internacionales– NYHA para Insuficiencia Cardíaca

– Katz, Barthel,… para independencia en actividades habituales

– ASA de riesgo quirúrgico

• Cuestionarios– Calidad de vida: EuroQoL 5, SF-36, SF-12, …

– Cuestionarios específicos de patologías concretas

• Dos formas de recogida– Preguntas por separado

– Índice conjunto

Page 15: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

15

3. 1 Tipos de variables | Definiciones estándar

• Fármacos– Clasificación Anatomoterapeútica

• Enfermedades– CIE-10

• CIE 9 Modificado

– CIAP-2

– Clasificaciones anatomopatológicas

Page 16: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

16

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 17: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

17

• Tenemos que describir el riesgo cardiovascular de una población (p.ej. la gente del departamento en que trabajamos). Para ello tenemos que:– Crear una estructura de base de datos con las variables que

consideremos oportunas

– Incluir definiciones operativas

Variable Tipo Códigos Definición

Sexo Dicotómica 1 Hombre2 Mujer

Se clasifican según fenotipo

Edad Numérica Contínua Según refiere el paciente

3. 2 Estructura de una base de datos | Ejercicio práctico

Page 18: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

18

Ejercicio

Variable Tipo Códigos DefiniciónSexo Dicotómica 1 Hombre

2 MujerSe clasifican según fenotipo

Edad Numérica Continua (días) Según refiere el paciente

Fecha Fecha/hora Continua (días) La del día de recogida

HDL Numérica Continua (mg/dl) UI, uso en fórmulas de la medida Regicor

LDL Numérica Continua (mg/dl) UI, uso en fórmulas de la medida Regicor

Colesterol Numérica Continua (mg/dl) UI, uso en fórmulas de la medida Regicor

Fumador Dicotómica 1 Sí 2 No Al menos 1 cigarrillo último mes (PAPPS)

DM Dicotómica 1 Sí 2 No Definición ADAHTA Categórica

ordenada1 Óptima (<120/80)2 Normal (<130/85)3 Normal alta (<140/90)4 Hipertenso I (<160/100)5 Hipertenso II-IV

Categorías AHA

Page 19: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

19

3. 2 Estructura de una base de datos | Vista de variables

Page 20: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

20

3. 2 Estructura de una base de datos | Vista de variables

Page 21: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

21

3. 2 Estructura de una base de datos | Vista de datos

Page 22: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

22

3. 2 Estructura de una base de datos | Vista de datos

Page 23: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

23

3. 2 Estructura de una base de datos | Software más empleado

• Microsoft Office®– Excel®

– Access®

• SPSS®– Statistical Package for

Social Sciences

• Stata®

• Freeware– R

– Openepi

– Epiinfo

– Epidat

– Epidata

– Weka

Page 24: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

24

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 25: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

25

3. 3 La hoja de recogida

Page 26: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

26

3. 3 La hoja de recogida | Formato papel

Page 27: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

27

3. 3 La hoja de recogida | Formato electrónico

Page 28: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

28

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 29: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

29

• Al definir las variables– Variables críticas

• No se puede incluir al paciente en el análisis si no está correctamente

recogida

– Variables no críticas

• La recogida de estas variables no afecta al objetivo principal, aunque puede

afectar a los secundarios

• En cualquier caso– Algunos pacientes van a tener campos vacíos o desconocidos

3.4 Depuración de los datos

Page 30: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

30

3.4 Depuración de los datos | Importancia de los desconocidos (missing)

Page 31: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

31

3.4 Depuración de los datos | Importancia de los desconocidos (missing)

Page 32: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

32

• Eliminar pacientes del análisis

• Análisis de sensibilidad– Incluyendo los desconocidos (missing) como la mejor de las opciones

– Incluyendo los desconocidos (missing) como la peor de las opciones

– Modelizando valores

• Un número elevado de datos no recogidos en una variable cuestiona– La validez y fiabilidad de la variable

– La representatividad de la muestra alcanzada de participantes

3.4 Depuración de los datos | Manejo de los desconocidos (missing)

Page 33: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

33

• Rango de valores aceptables– Hemoglobina (de 4 a 15)

• Paciente con Hb de 2

• ¿es real?

• Comprobar nuevamente– Corregir: es 12– Analizar como tal: realmente es 2 (outlier)– Poner como desconocido: no sabemos de dónde salió ese 2

– Si el valor es real, puede implicar que el paciente no cumple criterios de

inclusión y hay que eliminarlo de la base de datos

3.4 Depuración de los datos | Valores anómalos

Page 34: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

34

• En ocasiones se registra más de una vez la misma información– Varios investigadores recogen los datos de un mismo sujeto

– Un sujeto puede tener más de un número de Historia Clínica

– Se usan varias fuentes de información que pueden tener cierta

superposición

• Antes del análisis hay que localizar y eliminar los registros duplicados– Quedarse con el que proviene de la fuente de datos más fiable

3.4 Depuración de los datos | Registros duplicados

Page 35: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

35

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Resumen

5. Bibliografía

Page 36: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

36

4. Resumen

• Antes de comenzar a recoger los datos– Decidir qué variables queremos recoger

– Definir las variables que queremos recoger

• Nombre

• Tipo

• Códigos equivalentes si la variable no es numérica

• Rango aceptable si la variable es numérica

• Definición operativa justificada en los antecedentes

– Conseguir autorizaciones (CEIC, AEMPS, AEPD, Gerencia,…)

– No recoger nombre y apellidos

Page 37: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

37

4. Resumen

• Recogida de de datos– Primero formato papel y luego electrónico

– Directamente formato electrónico

• Depuración (control de calidad)– Pensar qué vamos a hacer con los desconocidos y valores perdidos

• Desconocido: lo he buscado y no lo tengo

• Perdido: no sé si lo he buscado, tengo que buscarlo para que sea desconocido

– Comprobar que los valores anómalos son reales

– Eliminar los registros duplicados

• Análisis estadístico

Page 38: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

38

Índice

1. Introducción

2. Objetivos

i. Aprender a definir las variables

ii. Conocer la organización interna de una base de datos

iii. Aprender a diseñar una base de datos

3. Desarrollo

i. Tipos de variables

ii. Estructura de una base de datos

iii. La hoja de recogida

iv. Depuración de los datos

4. Conclusión/Resumen

5. Bibliografía

Page 39: M1 - 6 · 2015-07-21 · 18 Ejercicio Variable Tipo Códigos Definición Sexo Dicotómica 1 Hombre 2 Mujer Se clasifican según fenotipo Edad Numérica Continua (días) Según refiere

39

5. Bibliografía

• Conceptos generales de investigación biomédica– Curso de Metodología de la Investigación Fisterra

• http://www.fisterra.com/mbe/investiga/index.asp

• Gestión y análisis estadístico de los datos– Material docente de la Unidad de Bioestadística Clínica

• http://www.hrc.es/investigacion/bioest/M_docente.html