estadística descriptiva imatematicas.unex.es/~jmf/archivos/desciptiva_i_mui.pdf · tipos de...
TRANSCRIPT
Estadística Descriptiva IIniciación a la Investigación Ciencias de la Salud
Jesús Montanero Fernández
MUI Ciencias de la Salud, UEx
25 de octubre de 2010
Jesús Montanero Fernández Estadística Descriptiva I
¿De qué trata?
Descripción conjunto concreto de datos (sin generalizar)Clasificación Tablas de frecuenciaRepresentación GráficosResumen Valores típicos
Jesús Montanero Fernández Estadística Descriptiva I
Tipos de variables ¿?
Según SPSSCualitativas (factores)
Nominales: Grupo sanguíneoOrdinales: Grado enfermedad
Cuantitativas o de escala : Temperatura, estatura, glucemia,no hijos...
Jesús Montanero Fernández Estadística Descriptiva I
Problemas estadísticos: relación
Tipos de relacionesCualitativa (factor)↔ Cuantitativa (Comparación degrupos o tratamientos)Cuantitativa↔ Cuantitativa (Regresión)Cualitativa (factor)↔ Cuanlitativa (Tablas decontingencia)
Jesús Montanero Fernández Estadística Descriptiva I
Gráficos
Tipos de variables según gráficoCualitativas Diagrama sectoresCuantitativas discretas Diagrama barrasCuantitativas continuas Histograma
*Nota: estudiaremos ahora una sola variable
Jesús Montanero Fernández Estadística Descriptiva I
Variable cualitativa: diagrama de sectores
Grupo fi p̂i
0 2892 0,458A 2625 0,416B 570 0,090
AB 226 0,036Total 6313 1
Jesús Montanero Fernández Estadística Descriptiva I
Figura: Grupo sanguíneo
Jesús Montanero Fernández Estadística Descriptiva I
Variable cuantitativa discreta: diagrama de barras
Edad alumnos titulación universitaria
Edad fi p̂i
18 6 0.2419 5 0.2020 3 0.1221 3 0.1222 3 0.1223 3 0.1224 2 0.08
Total 25 1
Jesús Montanero Fernández Estadística Descriptiva I
18 19 20 21 22 23 24
Edad
Fre
quen
cia
01
23
45
6
Jesús Montanero Fernández Estadística Descriptiva I
Variable cuantitativa continua
Glucemia n=100: Diagrama de barras
71.43061 76.69276 78.97109 80.0199 80.63695 81.29456 82.48693 82.96681 83.49599 84.3332 85.12535 86.0123 86.63882 87.17015 87.55771 88.70981 89.46449 90.48297 91.60582 93.09123
cero
Fre
quen
cy
0.0
0.2
0.4
0.6
0.8
1.0
Agrupar datos por intervalos
Jesús Montanero Fernández Estadística Descriptiva I
Histograma
Glucemia k=6
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Estadística Descriptiva I
Otros gráficos para variables continuas
Tallo-hoja
Jesús Montanero Fernández Estadística Descriptiva I
Diagrama de caja o box-plot
Figura: Concentración ozono
Jesús Montanero Fernández Estadística Descriptiva I
Valores típicos
Resumir numéricamente la informaciónMedidas de centralizaciónMedidas de dispersiónMedidas de posiciónMedidas de forma
Jesús Montanero Fernández Estadística Descriptiva I
Medidas de centralización
Centro de los datos, número más representativoMedia aritmética (centro de gravedad):
x =
∑ni=1 xi
n
Mediana (orden): dato que queda en medio una vezordenados de menor a mayor.
Jesús Montanero Fernández Estadística Descriptiva I
La mediana es robusta: no se ve influenciada por la presencia devalores extremos
Ansiedad n=20
Datos$ham
freq
uenc
y
8 10 12 14 16 18 20
02
46
810
12
Jesús Montanero Fernández Estadística Descriptiva I
Otro caso de sesgo n=350
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Estadística Descriptiva I
Distribución normal: media
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Estadística Descriptiva I
Medidas de dispersión
Variabilidad de los datosVarizanza desviación típicaAmplitud (o rango) intercuartil
Jesús Montanero Fernández Estadística Descriptiva I
Resumen de la información
Centralización-dispersión¿media-desv. típica o mediana-rango inter.?
Jesús Montanero Fernández Estadística Descriptiva I
media-desviación típicaResumen perfectamente la información si la distribución de losdatos sigue un modelo normal
x± s 68%x± 2s 95%x± 3s 99%
Podemos construir la distribución partiendo exclusivamente dex y s.
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Estadística Descriptiva I
mediana-rango intercuartilEn aquellas situaciones en que la media sea poco representativa:fuerte sesgo + valores extremos.
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Estadística Descriptiva I
mediana-rango intercuartilEn aquellas situaciones en que la media sea poco representativa:fuerte sesgo + valores extremos.
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Estadística Descriptiva I
Problemas estadísticos: relación
Tipos de relacionesCuantitativa↔ Cuantitativa (Regresión-correlación)Cualitativa (factor)↔ Cualitativa (Tablas de contingencia)Cualitativa (factor)→ Cuantitativa (Comparación degrupos o tratamientos)Cualitativa (factor)← Cuantitativa (Reg logística, etc)
Jesús Montanero Fernández Estadística Descriptiva I