pruebas de hipótesis (1)
DESCRIPTION
ESTADISTICASTRANSCRIPT
1
ESTADÍSTICA
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
(I)
Pruebas de hipótesis
para medias, varianzas y
proporciones
2
3
Pruebas de Hipótesis
Variables Atributos
Tablas de
Contingencia Chi Cuad.
Correlación
No Normal
Normal
Varianza Medianas
Variancia Medias
1- Población - Chi
2- Pob. F
Homogeneidad
de Varianzas
de Levene
Homogeneidad
de Varianzas
de Bartlett
Correlación
Prueba de signos
Wilcoxon
Mann-
Whitney
Kurskal-
Wallis
Prueba de Mood
Friedman
Pruebas Z, t
ANOVA
Correlación
Regresión
1- Población
2- Poblaciones
Una vía
Dos vías
Residuos
distribuidos
normalmente
Proporciones - Z
4
Pruebas de Medias
Prueba t de 1 población: Prueba si el promedio de la muestra es igual a un promedio conocido o meta conocida.
Prueba t de 2 poblaciones: Prueba si los dos promedios de las muestras son iguales.
ANOVA de un factor, dirección o vía: Prueba si más de dos promedios de las muestras son iguales.
ANOVA de dos vías: Prueba si los promedios de las muestras clasificadas bajo dos categorías, son iguales.
Resumen de pruebas de Hipótesis – Datos normales
5
Pruebas de VarianzasPrueba χ2: Compara la variancia de una muestra con una
variancia de un universo conocido.
Prueba F: Compara dos varianzas de muestras.Homogeneidad de la variancia de Bartlett: Compara dos o
más varianzas de muestras de la misma población.
Correlación : Prueba la relación lineal entre dos variables.
Regresión : Define la relación lineal entre una variabledependiente y una independiente. (Aquí la "normalidad" seaplica al valor residual de la regresión)
Resumen de pruebas de Hipótesis – Datos normales
6
Pruebas de Hipótesis
En cada prueba estadística, se comparan algunos valoresobservados con valores esperados de parámetros (media,desviación estándar, varianza)
Los ESTADÍSTICOS son calculados en base a la muestra y estiman alos parámetros VERDADEROS
La capacidad para detectar un diferencia entre lo que es observadoy lo que es esperado depende del tamaño de la muestra, alaumentar mejora la estimación y la confianza en las conclusionesestadísticas.
7
Pruebas de Hipótesis
Se trata de probar una afirmación sobre parámetros de la población en base a datos de estadísticos de una muestra:
Por ejemplo, probar las afirmaciones en los parámetros:
La media poblacional = 12;
La proporción poblacional = 0.3
La Media poblacional 1 = Media poblacional 2
Conceptos fundamentalesHipótesis nula Ho
◦ Es la hipótesis o afirmación a ser probada
◦ Puede ser por ejemplo ɸ = 5, ɸ ≥ 5, ó ɸ ≤ 5
◦ Sólo puede ser rechazada o no rechazada
Hipótesis alterna Ha◦ Es la hipótesis que se acepta como verdadera cuando se rechaza Ho, es su complemento
◦ Puede ser por ejemplo ɸ ≠ 5 para prueba de dos colas
◦ ɸ < 5 para prueba de cola izquierda
◦ ɸ > 5 para prueba de cola derecha
8
Conceptos fundamentales
Estadístico de prueba
◦ Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara con un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho
Error tipo I (alfa = nivel de significancia, normal=.05)
◦ Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor
Error tipo II (beta )
◦ Se comete cuando no se rechaza la hipótesis nula siendo en realidad falsa. Es el riesgo del consumidor
9
10
Conceptos fundamentalesPruebas de una cola
◦ Si la H0: ɸ = ɸ0 , la Ha : ɸ › ɸ0 , ɸ0 es un valor poblacional, entonces el riesgo alfa se coloca en el extremo derecho de la distribución. Por ejemplo si Ho: ɸ = 10 y Ha: ɸ >10 se tiene una prueba de cola derecha:
11
P(Z>= + Zexcel ) = alfa
Región de rechazo
Conceptos fundamentales
Pruebas de una cola
◦ Si la H1: ɸ˂ ɸ0 que un valor poblacional, entonces el riesgo alfa se coloca en el extremo
izquierdo de la distribución. Por ejemplo si Ho: ɸ = 10 y Ha: ɸ< 10 se tiene una prueba de cola izquierda:
12
Zexcel ( 0.01 )
P(Z<= - Zexcel ) = alfaRegión de
rechazo
Conceptos fundamentalesPruebas de dos colas
◦ Si la Ho: ɸ ≠ µ que es un valor poblacional, entonces el riesgo alfa se reparte en ambos
extremos de la distribución. Por ejemplo si Ha: ɸ≠ 10 se tiene:
13
P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2
Regiones de rechazo
Conceptos fundamentalesEl Tamaño de muestra requerido en función del error máximo E o Delta P intervalo proporcional esperado se determina como sigue:
14
2 2
/ 2
2
2
/ 2
2
( )(1 )
( )
Zn
E
Z p pn
p
Pasos en la Prueba de Hipótesis
15
1. Definir el Problema - Problema Práctico
2. Señalar los Objetivos - Problema Estadístico
3. Determinar tipo de datos - Atributo o Variable
4. Si son datos Variables - Prueba de Normalidad
5. Establecer las Hipótesis
- Hipótesis Nula (Ho) - Siempre tiene el signo igual
- Hipótesis Alterna (Ha) – Tiene signos diferentes, > o <.
6. Seleccionar el nivel de Alfa (normalmente 0,05 o 5%)
Pasos en la Prueba de Hipótesis
16
7. Establecer el tamaño de la muestra, n >= 10 y colectar datos.
8. Decidir la prueba estadística apropiada y calcular el estadístico de
prueba (Z, t, χ2 o F) a partir de los datos.
9. Obtener el percentil que define la zona de rechazo ya sea
mediante tablas, Excel o Centurión.
10.Comparar el estadístico calculado con el percentil de las tablas y
ver si cae en la región de rechazo o ver si la probabilidad es menor
a alfa, rechazar Ho y acepte Ha. En caso contrario no rechazar Ho.
11.Con los resultados interprete una conclusión estadística para la
solución práctica.
Estadísticos para medias, varianzas y proporciones
17
2
11 22
2
1 2
1 2
2 2
1 1 2 21
1 2
; . ; 30;/
; . ; 30;/
; 1, 1; . .var
; . ; ' . .1 1
/
( 1) ( 1);
2
p
p
XZ Una media n conocida
n
Xt Una media n desconocida
S n
SF DF n n prueba dos ianzas
S
X Xt dos medias s desconocidas pero
Sn n
n s n sS DF n
n n
2
1 2
2 2
1 2
1 2
2
; . ; ' .
.
n
X Xt dos medias s desconocidas diferentes
s s
n n
DF formula especial
Estadísticos para medias pareadas y varianzas
Para el caso de muestras pareadas se calculan las diferencias d individuales como sigue:
18
22
2
22
; . . ; . . ./
( 1); ( 1); . . ar
( ); ( 1)( 1); .
i
d
dt Pares de medias d para cada par
S n
n SX DF n prueba una v ianza
O EX DF r c bondad ajuste
E
Ejemplo de prueba de hipótesis
Probar la hipótesis de igualdad de una media u para n > 301) Ho: Ha:
2) Calcular el estadístico de prueba Zc con la fórmula
3) Determinar el percentil de las tablas Zt
4) Establecer la región de rechazo con Zt y ver si cae ahí ZcLas regiones de rechazo prueba de 2 colas: Zc › Z y Zc ˂ - Z
5) Determinar el Intervalo de confianza para la media y ver si incluye a lamedia de la hipótesis, si no rechazar Ho
6) Determinar el p- valor correspondiente a Zc y comparar contra Alfa/2, sies menor rechazar Ho
19
Ejemplo de prueba de hipótesis
Rechazar Ho si:◦ Zc se encuentra en la región de rechazo
◦ La media de la hipótesis no se encuentra en el intervalo de confianza
◦ El valor p de la Zc es menor que alfa/2 o Alfa para una cola
20
-Z
21
Ejemplo de prueba de hipótesis
Pregunta Práctica: ¿Ha cambiado el valor de la duración media de los
focos?
Pregunta estadística:
¿La vida media de los focos es significativamente diferente de 800 horas? o,
¿ su diferencia se da por casualidad en una variación del día a día?
22
23
24
SOLUCIÓN POR EL MÉTODO DE INTERVALOS DE CONFIANZA
Intervalos de confianza del 96,0 % para la media: 788,0 +/-14,9985 [773,002; 802,998]
25
773 803μ = 800
El valor de μ se encuentra dentro de los límites de confianza, por tanto, no se puederechazar la hipótesis nula, esto es, 800 h es la vida media de los focos.
26
Pruebas de HipótesisMedia muestral = 788,0Desviación estándar = 40,0Tamaño de muestra = 30Intervalos de confianza del 96,0 % para la media: 788,0 +/- 14,9985 [773,002; 802,998]
Hipótesis Nula: media = 800,0Alternativa: no igualEstadístico Z calculado = -1,64317
Valor-P = 0,100348No rechazar la hipótesis nula para alfa = 0,04.
SOLUCIÓN MEDIANTE EL EMPLEO DE STATGRAPHICS CENTURIÓN
27
El StatAdvisorEste análisis muestra los resultados de realizar una prueba de hipótesis relativa a la media (mu) de una distribución normal. Las dos hipótesis a ser evaluadas aquí son:
Hipótesis nula: mu = 800,0Hipótesis alterna: mu <> 800,0
Dada una muestra de 30 observaciones con una media de 788,0 y una desviación estándar de 40,0, el estadístico Z calculado es igual a -1,64317. Puesto que el valor-P para la prueba es mayor o igual que 0,04, no puede rechazarse la hipótesis nula con un 96,0% de nivel de confianza. El intervalo de confianza muestra que los valores de mu soportados por los datos caen entre 773,002 y 802,998.
Ejemplo para dos colasSupongamos que tenemos muestras de dos reactores que producen el mismoartículo. Se desea ver si hay diferencia significativa en el rendimiento de “Reactor a Reactor”.
28
Reactor A Reactor B
89.7 84.7
81.4 86.1
84.5 83.2
84.8 91.9
87.3 86.3
79.7 79.3
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5
Estadísticas Descriptivas
Variable Reactor N Media Desv.Std
Rendimiento A 10 84.24 2.90
B 10 85.54 3.65
¿Qué representa esto?
29
Reactor A Reactor B
80.0 82.5 85.0 87.5 90.0 92.5
A AA AAAA A AB B B B B BB B B B
¿Representan los reactores el mismo proceso básico?¿Representan los reactores dos procesos diferentes?
Prueba de Hipótesis
Pregunta Práctica: ¿Existe diferencia entre los reactores?
30
Pregunta estadística:
¿La media del Reactor B (85.54) es significativamente
diferente de la media del Reactor A (84.24)? o, ¿ su
diferencia se da por casualidad en una variación de día a día?
Prueba de Hipótesis
31
Debemos demostrar que los valores que observamos al parecer no
corresponden al mismo proceso, que la Ho debe estar equivocada
Ho:
Ha:
a
a
b
b
Ho: Hipótesis Nula:
No existe diferencia entre los Reactores
Ha: Hipótesis Alterna: Las medias de los Reactores son diferentes.
Desviaciones estándares muestrales = 2,9 y 3,65Tamaños de muestra = 10 y 10
Intervalos de confianza del 95,0% para el cociente de varianzas:[0,156797,2,54146]
Hipótesis Nula: cociente de varianzas = 1,0Alternativa: no igualEstadístico F calculado = 0,631263Valor-P = 0,503914No rechazar la hipótesis nula para alfa = 0,05.
Pruebas de Hipótesis
El StatAdvisorEste análisis muestra los resultados de realizar una prueba de hipótesis relativa delcociente de dos desviaciones estándar (sigma1/sigma2) de muestras provenientes dedistribuciones normales. Las dos hipótesis a ser evaluadas aquí son:
Hipótesis nula: sigma1/sigma2 = 1,0Hipótesis alterna: sigma1/sigma2 <> 1,0
Dada una muestra de 10 observaciones con una desviación estándar de 2,9 y una segundamuestra de 10 observaciones con una desviación estándar de 3,65, el estadístico Fcalculado es igual a 0,631263. Puesto que el valor-P para la prueba es mayor o igual que0,05, no puede rechazarse la hipótesis nula con un 95,0% de nivel de confianza. Elintervalo de confianza muestra que los valores de var1/var2 soportados por los datos caenentre 0,156797 y 2,54146.
Pruebas de Hipótesis
Medias muestrales = 84,24 y 85,54Desviaciones estándar muestrales = 2,9 y 3,65Tamaños de muestra = 10 y 10
Intervalos de confianza del 95,0% para la diferencia entre medias: -1,3 +/-3,09717 [-4,39717,1,79717]
Hipótesis Nula: diferencia entre medias = 0,0Alternativa: no igualEstadístico t calculado = -0,881837Valor-P = 0,389489No rechazar la hipótesis nula para alfa = 0,05.(Asumiendo varianzas iguales).
El Stat Advisor
Este análisis muestra los resultados de realizar una prueba de hipótesis relativa ala diferencia entre dos medias (mu1-mu2) de muestras provenientes dedistribuciones normales. Las dos hipótesis a ser evaluadas aquí son:
Hipótesis nula: mu1-mu2 = 0,0Hipótesis alterna: mu1-mu2 <> 0,0
Dada una muestra de 10 observaciones con una media de 84,24 y una desviaciónestándar de 2,9 y una segunda muestra de 10 observaciones con una media de85,54 y una desviación estándar de 3,65, el estadístico t calculado es igual a -0,881837. Puesto que el valor-P para la prueba es mayor o igual que 0,05, nopuede rechazarse la hipótesis nula con un 95,0% de nivel de confianza. Elintervalo de confianza muestra que los valores de mu1-mu2 soportados por losdatos caen entre -4,39717 y 1,79717.
37
NOTA: al realizar esta prueba, se ha asumido que las desviacionesestándares de las dos muestras son iguales. Se puede relajar estasuposición pulsando el botón secundario del ratón y eligiendoOpciones de Análisis.
38
39
40
41
42
43