introduccion analisis
DESCRIPTION
intoducionTRANSCRIPT
Procesamiento y analisis
Tipos de análisis estadístico(según el número y tipo de variables)
Dependiente IndependienteUnivariado: 1 0
Bivariado: 1 1
Multivariado: 1 2 ó más
Procesamiento y analisis
Estrategias de análisis• Estrategia representativa: Estimación de parámetros
• Estrategia comparativa: Pruebas de hipótesis
• Verificar el ajuste a una distribución de probabilidad (prueba de normalidad)
1. Prueba de Kolmogorov−Smirnov2.Prueba de Shapiro−Wilks
Prueba de Shapiro−Wilks
• Aunque esta prueba es menos conocida es la que se recomienda para contrastar el ajuste de nuestros datos a una distribución normal, sobre todo cuando la muestra es pequeña (n<30).
• Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilístico normal. Este tipo de representación también lo proporcionan algunos programas de estadística, de tal manera que nos permite además apreciar el ajuste o desajuste de forma visual:
Prueba de Shapiro−Wilks
Ho , la variable continua sigue una distribucion normalH1, la variable no tiene una distribuion normal, P<0.005
Análisis con variables numéricas
Análisis Parámetros No parametrico
1 Describir un grupo μ, σ, σ2 Mediana, rango intercuartil
2 Comparar un grupo a un valor
T de student de una muestra
Prueba de Wilcoxon
3 Comparar media entre 2 grupos
T de student de 2 muestras Mann-Whitney
4 Comparar media en 2 grupos apareados
T de student apareados Prueba wilcoxon
5 Comparar media en 3 o mas grupos
ANOVA Kruskal-Wallis
6 Correlacion entre 2 variables
Pearson lineal Spearman (monotomica)
Pruebas de hipótesis
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
Aceptar No Rechazo H0
CorrectoEl tratamiento no tiene efecto y así se decide.
Error de tipo IIEl tratamiento si tiene efecto pero no lo percibimos.
Probabilidad β
Rechazo Ho
Acepto H1
Error de tipo IEl tratamiento no tiene efecto pero se decide que sí.
Probabilidad α
CorrectoEl tratamiento tiene efecto y el experimento lo confirma.
Dec
isió
n de
l inv
estig
ador
Conclusiones• Las hipótesis no se plantean después de observar los datos.
• En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:
– H0 : Hipótesis científicamente más simple.– H1 : El peso de la prueba recae en ella.
• α debe ser pequeño
• Rechazar una hipótesis consiste en observar si p < α
• Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I
• No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II
• Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos.
Distribución normalANALISIS PARAMETRICO
variable
continua cuantitativa categórica
2 variables continuas
Correlaciónpearson
t student
anova
2
+2
Distribución no normalANALISIS NO PARAMETRICO
variable
continua cuantitativa categórica
2 v. continuas o una ordinal
Correlaciónspearman
chi cuadrado
2 variables categóricas
U de Mann-Whitney
Kruskal- wallis
2
+2
INVESTIGACION EN ATENCION PRIMARIA DE SALUD
Procesamiento y analisisTipo de pruebas estadisticas
Parametricas:
Prueba t de StudentANOVA
No parametricas:P. Ji cuadrado (x2)P. de WilcoxonP. de Mann y WhitneyP. de Kruskal Wallis
11
REGRESION LINEAL SIMPLE
Datos Cuantitativos
NotaciónVariable Respuesta: yVariable Explicativa: x
Modelo de Regresión Lineal Simple: yi=+xi+ei
Intercepto: Pendiente: Error: e
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Modelo Estimado(recta de regresión)
bxay ˆ
xbya
2
11
2
111
n
ii
n
i
n
ii
n
ii
n
i
xxn
yxxynb
Método de Estimación: Mínimos Cuadrados
iii yye ˆResiduos o Errores
El modelo de regresión simple es, a priori, poco realista (parece poco probable que el nivel de satisfacción dependa de una única variable, más bien lo natural es que en él intervengan varias variables). En con-secuencia, ensayamos no con
sino con
Y=a+bX
Y=a+b1X1+ … +bnXn
Variable respuesta(en nuestro caso,“nivel de satisfacción”)
regresores
Modelo de regresión múltiple:
1.
2. Los residuos tienen media 0.3. La varianza de los residuos no depende de xi (homocedasticidad)4. Los residuos son normales.5. Los residuos son aleatorios.6. Las variables x1, x2, etc. no están linealmente correlacionadas entre sí.
inni xbxbay 11
residuo
14
)...( 221101
1)/(
nn XXXeXSP
)...( 22110
)/(
)/(nn XXXe
XSP
XSP
nn XXXXSP
XSPLog
...
)/(
)/(22110
},...,,{ 21 nXXXX
El modelo logístico multivariante
Estructura del informe final
ResumenIntroducciónMetodologíaConclusionesDeliberaciones y recomendaciones
Metodología
Se indican las metas y los objetivos de la investigación y la forma en que se alcanzarán
• Examen de la documentación • Criterios para su inclusión en el estudio • Procedimientos de muestreo • Lugar de las entrevistas y las reuniones
de grupos básicos • Problemas y éxitos • Instrumentos de investigación • Procedimientos de reunión de datos • Proceso de análisis de los datos
Edison Bedoya Y Diego Echavarria 18
Presentación de tablas
Ejemplo Tabla 1
Características N (%)Variable Categorica 1
Valor 1 x (X%)Valor 2 x (X%)Valor 3 x (X%)
Variable numérica (unidad)* Y ± Z
Variable Categorica 2Valor 1 x (X%)Valor 2 x (X%)
* Media ± desviación estándar
Ejemplo Tabla 2
Variables Grupo 1 (n=X) Grupo 2 (n=X) pVariable Categorica 1
Valor 1 x (X%) x (X%) 0.xxxValor 2 x (X%) x (X%) <0.001Valor 3 x (X%) x (X%) 0.xxx
Variable numérica (unidad)* Y ± Z Y ± Z 0.xxx
Variable Categorica 2Valor 1 x (X%) x (X%) 0.xxxValor 2 x (X%) x (X%) <0.001
* Media ± desviación estándar