46Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
La estadística se constituye como la herramienta necesaria
para el análisis de los datos producto de los estudios de eventos en
poblaciones de interés.
Los resultados de los estudios epidemiológicos realizados
en muestras poblacionales, permiten inferir los resultados a la
población blanco.
Las variables se clasifican de acuerdo a su naturaleza (cualitativa
y cuantitativa), escala de medición (nominal, ordinal, intervalo y
razón) y su interrelación (dependiente e independiente).
Las tablas de distribución de frecuencia incluyen la frecuencia
absoluta, frecuencia relativa, frecuencia acumulada y frecuencia
relativa acumulada.
Los gráficos se utilizan para describir las variables cualitativas
y cuantitativas. Entre ellos se encuentran los gráficos de sectores,
diagramas de barras, histogramas, entre otros.
Las medidas de resumen permiten analizar descriptivamente los
datos. Se encuentran las medidas de tendencia central, de dispersión,
de forma y de posición.
FUNDAMENTOSDE ESTADÍSTICA
47Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
48Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
2. FUNDAMENTOS DE ESTADÍSTICA
Se presentan conceptos referentes a la estadística descriptiva e
inferencial, así como a las poblaciones y muestras de estudio. Se rea-
liza una descripción de los datos continuos y discretos, además de las
tablas de distribución de frecuencia. Posteriormente se presentan los
tipos de gráficos más utilizados para la descripción de los resultados
en investigación, al igual que las recomendaciones para el tipo de va-
riable para las que estos son de utilidad. Por último se presentan las
principales medidas de resumen que permiten presentar unos datos
de una manera adecuada.
2.1. Generalidades
Teniendo en cuenta que desde el enfoque cuantitativo, el
estudio de los eventos en salud incluyen el estudio de la magnitud
de la observación y la variabilidad de esta; la estadística ofrece una
herramienta necesaria para la toma de decisiones. Martínez-Gonzáles,
Sánchez-Villegas, & Faullín-Fajardo, (2006). De esta forma, los estudios
se realizan en muestras de la población, con el objetivo de realizar
inferencia o extrapolación de los resultados a la población en general.
49Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
2.2. Poblaciones y Muestras
MuestreoInferenciaEstadistica
Población: conjunto de todos los individuos o elementos que
cumplen ciertas características. Ej: Estudiantes de pregrado de la
Universidad de Santander.
Muestra: Subconjunto de la población extraído mediante una
técnica de muestreo. Ej: 358 estudiantes mayores de 18 años escogidos
aleatoriamente.
Figura 7. Modelo de Indiferencia Estadística
Nota Fuente: Hernández, L. (2015). Estadística inferencial. Universo fórmulas. Recu-perado de: http://www.universoformulas.com/estadistica/inferencia/
Población
Muestra
50Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Nominal-ordinal-de intervalo (o intervalo igual)-de razón.
En el capítulo 2 se describieron los tipos de variables y las escalas
de medición. La escala de medición de las variables categóricas o
cualitativas puede ser nominal y ordinal, sin embargo, las categorías
dentro de cada una pueden ser dicotómicas y politómicas.
Dicotómicas: si/no, hombre/mujer
Politómicas: Se incluye más de dos posibles categorías. Ej: Grupo
sanguíneo (A, B, AB, O).
2.3. Estadística Descriptiva e Inferencial
Descriptiva: Incluye la recolección, clasificación, representación
y resumen de la información contenida en unos datos. Utiliza
el cálculo de índices estadísticos y representaciones gráficas.
Martínez-Gonzáles, Sánchez-Villegas, & Faullín-Fajardo, (2006).
Inferencial o Analítica: Pretende demostrar asociaciones o
relaciones entre las características observadas. Contempla la
comprobación de hipótesis y la estimación de intervalos de
confianza.Martínez-Gonzáles, Sánchez-Villegas, & Faullín-
Fajardo, (2006).
2.4. Escala de Medición
51Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
2.5. Datos Continuos y Discretos
Las variables cuantitativas o numéricas se agrupan de acuerdo a
su escala de medición en razón e intervalo, sin embargo, se pueden
encontrar de dos tipos:
Discretas: Valores numéricos finitos y enteros. Ej: número de hijos.
Continuas: Valores numéricos que incluyen o pueden incluir
decimales de acuerdo a la precisión de la medición. Ej: Peso
52Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
2.6. Distribuciones de Frecuencia
Hace referencia al número absoluto de datos cualitativos o
cuantitativos de cada categoría.
Ej: número de casos de malaria, número de casos de dengue, etc.
A continuación se presentan las principales medidas de distribución de
frecuencia.
Es el número de observaciones de un evento expresado en forma de
proporción respecto al total.
Ej: Proporción de casos de malaria respecto al total de la población.
Es el total de sujetos o frecuencia para la categoría sumado a las
frecuencias de las categorías anteriores.
Corresponde al porcentaje de frecuencia relativa de cada categoría
más el de las categorías anteriores.
2.6.1. Frecuencia absoluta
2.6.2. Frecuencia relativa.
2.6.3. Frecuencia acumulada.
2.6.4. Frecuencias realtiva acumulativa.
Tabla 2. Tabla de Frecuencia de la Variable Edad Nota Fuente: Elaboración Propia del Autor
53Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Se conoce también como gráfico de pastel, en el cual se representa
mediante una circunferencia en donde los 360° corresponden al 100% de
los datos y cada una de las categorías de las variables corresponderá a
una porción o a un sector del pastel.
Es de gran utilidad para describir datos cualitativos y no se
recomienda para variables con más de cinco categorías.
A continuación se presentan las principales gráficas para descripción de
datos cualitativos y cuantitativos.
FútbolTenisBaloncestoAtletismoNatación
Representa gráficamente la distribución de frecuencia de un
conjunto de datos y permite comparar dos o más valores. Se recomienda
para variables cualitativas nominales y ordinales. En este tipo de gráficos
el eje horizontal corresponde a cada una de las categorías de la variable y
en el eje vertical se grafican los valores de frecuencia de cada categoría.
Martínez-Gonzáles, Sánchez-Villegas, & Faullín-Fajardo, (2006).
2.7.1. Gráfico de sectores.
2.7.2. Diagrama de barras.
2.7. Gráficas
DEPORTES PRACTICADOS
EDAD AGRUPADA POR SEXO
Figura 9. Gráfico de Sectores para Representar la Frecuen-cia de Práctica de Deportes
Nota Fuente: Elaboración Propia del Autor
Figura 10. Diagrama de Barras
Nota Fuente: Elaboración Propia del Autor
54Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Tipo de gráfico parecido al diagrama de barras, que presenta las
barras de manera consecutiva. Es útil para variables cuantitativas de
intervalo o razón. En el eje vertical se debe iniciar siempre en cero y en
el eje horizontal se grafican los valores correspondientes a las categorías
de la variable a describir.
Tipo de gráfico en el que la representación se realiza mediante una
línea que une los puntos medios de las barras del histograma. Es útil
para variables numéricas.
2.7.3. Histogramas.
2.7.4. Polígonos de frecuencia.
Figura 11.Histograma
Nota Fuente: Romero, E. (2009). Un histograma con ta-bla dinámica en Excel. Recuperado de: http://excelforo.blogspot.com.co/2009/11/un-histograma-con-tabla-di-namica-en.html
Figura 12. Polígono de Frecuencia
Nota Fuente: Elaboración Propia del Autor
55Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Consiste en un tipo de gráfico que también brinda información de
la distribución de frecuencia de la variable. Se construye separando los
dígitos de cada número y colocando el primero como tallo y el último
dígito como hoja. Ej: para los datos 8, 10, 15, 15, 15, 15, 20, 20, 20, 20, 25,
30, 35, 40, 40 y 45.
2.7.5. Diagrama de Tallo y Hojas.
Figura 13. Diagrama de Tallo y Hojas
Nota Fuente: Martínez-Gonzáles, Sánchez-Villegas, &
Faullín-Fajardo, (2006).
56Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
2.8. Medidas de Resumen
Las medidas de tendencia central son útiles para la descripción
de datos numéricos y estiman el valor típico o representativo de la
muestra. Martínez-González, (2006).
Media: Se considera la principal medida de tendencia central y
refleja el promedio de los datos. Se obtiene sumando todos los datos y
dividiendo por el número total de datos u observaciones.
Mediana: Para obtener la mediana, se deben ordenar por orden
ascendente los datos a describir. Posteriormente se ubica el dato que se
encuentra en la posición central, es decir, el dato que permite separar la
mitad de los datos por debajo y por encima.
Moda: El dato que se encuentra con mayor frecuencia dentro de un
grupo de datos. En caso de que sean dos valores los que se repiten el
mismo número de veces, se considera que la distribución es bimodal.
Ejemplo:
De las siguientes edades correspondientes a 17 trabajadores,
calcular la moda, la media y la mediana.
Para calcular la mediana se ordenan los valores de menor a mayor
y se busca la posición que divide el 50% de la población. En este caso el
17 corresponde a un número impar y por tanto la posición 9 divide los
valores dejando 8 datos por debajo y 8 datos por encima.
Moda = 57 y 58 años
Es bimodal pues las edades de 57 y 58 años son las que se repiten con
mayor frecuencia.
A continuación se presentan las principales medidas de resumen:
Para calcular la media o promedio
se debe sumar cada uno de los valores
y dividir por el número total de datos:
50+51+51+52+52+54+55+55+56+56+5
7+57+57+58+58+58+59 = 936 / 17 = 55,06.
Promedio= 55,06 años
Mediana = 56 años.
Edad Frecuencia
50 151 252 254 155 256 257 358 3
59 1
2.8.1. Medidas de tendencia central.
57Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Desviación Estándar: Corresponde a la raíz cuadrada de la varianza
y permite evidenciar que tan dispersos están los valores respecto a la
media. Se calcula como la raíz cuadrada de la varianza.
Varianza: Corresponde al cuadrado de la desviación estándar y se
calcula como el promedio de las desviaciones de cada valor respecto a
la media, elevado al cuadrado. Martínez-González, (2006).
Son útiles para describir la posición de un valor respecto al total de
los datos. “Este puesto o posición se expresa como la proporción de los
datos que queda por debajo del valor que nos interesa. A esta cantidad se
le llama percentil” Martínez-González, (2006).
El conjunto de datos ordenados ascendentemente también se puede
dividir en cuatro grupos iguales y a cada grupo de datos se denomina
“Cuartil”. De esta forma, el primer cuartil comprende hasta el percentil
25 y el segundo cuartil hasta el percentil 50. Si el conjunto de datos se
divide en cinco grupos con el mismo número de observaciones, al
primer grupo se llamará “Primer Quintil” y corresponde al percentil 20.
2.8.2. Mediciones de dispersión. 2.8.3. Medidas de posición relativa.
A continuación se presentan las principales medidas de dispersión:
58Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Simetría: Se considera que la distribución de los datos es simétrica,
cuando se distribuyen de manera uniforme hacia la derecha y la izquierda
de la media; es decir, cuando la distribución de los datos se ajusta a
la distribución normal. Si los datos se distribuyen hacia la derecha o
izquierda, se considera que presenta asimetría hacia la derecha o hacia
la izquierda, según corresponda.
Curtosis o apuntamiento: Corresponde al achatamiento de la
curva de distribución de los datos, por tanto, se espera que la curtosis
no sea tan grande.
De esta forma, se encuentran las siguientes clases:
2.8.4. Medidas de la forma de una distribución.
Figura 14.Medida de Forma- Simetría
Nota Fuente: Elaboración Propia del Autor
Figura 15.Medidas de la Forma de una Distribución
Nota Fuente: Medidas de Distribución- Asimetría y Curtosis. Recuperado de: http://www.spssfree.com/curso-de-spss/analisis-descriptivo/medidas-de-dis-tribucion-curtosis-asimetria.html
A continuación se presentan las principales medidas de forma:
59Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Enfoque Cuantitativo
Datos
Discretos
Continuos
Frecuencia
Medidas Resumen
Medidas de Tendencia Central
FUNDAMENTOSDE ESTADÍSTICA
60Epidemiología, Biometría Y Estadística | www.cvudes.edu.co
Gordis, L. (2005). Epidemiología 3. Madrid, España: Elservier.
Martínez-Gonzáles, M. A., Sánchez-Villegas, A., & Faullín-Fa-
jardo, J. (2006). Bioestadística amigable. Madrid, España: Diaz de
Santos.FUNDAMENTOSDE ESTADÍSTICA