pruebas de hipótesis (1)

1

ESTADÍSTICA

INFERENCIA ESTADÍSTICA

PRUEBAS DE HIPÓTESIS

(I)

Pruebas de hipótesis

para medias, varianzas y

proporciones

2

3

Pruebas de Hipótesis

Variables Atributos

Tablas de

Contingencia Chi Cuad.

Correlación

No Normal

Normal

Varianza Medianas

Variancia Medias

1- Población - Chi

2- Pob. F

Homogeneidad

de Varianzas

de Levene

Homogeneidad

de Varianzas

de Bartlett

Correlación

Prueba de signos

Wilcoxon

Mann-

Whitney

Kurskal-

Wallis

Prueba de Mood

Friedman

Pruebas Z, t

ANOVA

Correlación

Regresión

1- Población

2- Poblaciones

Una vía

Dos vías

Residuos

distribuidos

normalmente

Proporciones - Z

4

Pruebas de Medias

Prueba t de 1 población: Prueba si el promedio de la muestra es igual a un promedio conocido o meta conocida.

Prueba t de 2 poblaciones: Prueba si los dos promedios de las muestras son iguales.

ANOVA de un factor, dirección o vía: Prueba si más de dos promedios de las muestras son iguales.

ANOVA de dos vías: Prueba si los promedios de las muestras clasificadas bajo dos categorías, son iguales.

Resumen de pruebas de Hipótesis – Datos normales

5

Pruebas de VarianzasPrueba χ2: Compara la variancia de una muestra con una

variancia de un universo conocido.

Prueba F: Compara dos varianzas de muestras.Homogeneidad de la variancia de Bartlett: Compara dos o

más varianzas de muestras de la misma población.

Correlación : Prueba la relación lineal entre dos variables.

Regresión : Define la relación lineal entre una variabledependiente y una independiente. (Aquí la "normalidad" seaplica al valor residual de la regresión)

Resumen de pruebas de Hipótesis – Datos normales

6


En cada prueba estadística, se comparan algunos valoresobservados con valores esperados de parámetros (media,desviación estándar, varianza)

Los ESTADÍSTICOS son calculados en base a la muestra y estiman alos parámetros VERDADEROS

La capacidad para detectar un diferencia entre lo que es observadoy lo que es esperado depende del tamaño de la muestra, alaumentar mejora la estimación y la confianza en las conclusionesestadísticas.

7


Se trata de probar una afirmación sobre parámetros de la población en base a datos de estadísticos de una muestra:

Por ejemplo, probar las afirmaciones en los parámetros:

La media poblacional = 12;

La proporción poblacional = 0.3

La Media poblacional 1 = Media poblacional 2

Conceptos fundamentalesHipótesis nula Ho

◦ Es la hipótesis o afirmación a ser probada

◦ Puede ser por ejemplo ɸ = 5, ɸ ≥ 5, ó ɸ ≤ 5

◦ Sólo puede ser rechazada o no rechazada

Hipótesis alterna Ha◦ Es la hipótesis que se acepta como verdadera cuando se rechaza Ho, es su complemento

◦ Puede ser por ejemplo ɸ ≠ 5 para prueba de dos colas

◦ ɸ < 5 para prueba de cola izquierda

◦ ɸ > 5 para prueba de cola derecha

8

Conceptos fundamentales

Estadístico de prueba

◦ Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara con un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho

Error tipo I (alfa = nivel de significancia, normal=.05)

◦ Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor

Error tipo II (beta )

◦ Se comete cuando no se rechaza la hipótesis nula siendo en realidad falsa. Es el riesgo del consumidor

9

Conceptos fundamentalesPruebas de una cola

◦ Si la H0: ɸ = ɸ0 , la Ha : ɸ › ɸ0 , ɸ0 es un valor poblacional, entonces el riesgo alfa se coloca en el extremo derecho de la distribución. Por ejemplo si Ho: ɸ = 10 y Ha: ɸ >10 se tiene una prueba de cola derecha:

11

P(Z>= + Zexcel ) = alfa

Región de rechazo

Conceptos fundamentales

Pruebas de una cola

◦ Si la H1: ɸ˂ ɸ0 que un valor poblacional, entonces el riesgo alfa se coloca en el extremo

izquierdo de la distribución. Por ejemplo si Ho: ɸ = 10 y Ha: ɸ< 10 se tiene una prueba de cola izquierda:

12

Zexcel ( 0.01 )

P(Z<= - Zexcel ) = alfaRegión de

rechazo

Conceptos fundamentalesPruebas de dos colas

◦ Si la Ho: ɸ ≠ µ que es un valor poblacional, entonces el riesgo alfa se reparte en ambos

extremos de la distribución. Por ejemplo si Ha: ɸ≠ 10 se tiene:

13

P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2

Regiones de rechazo

Conceptos fundamentalesEl Tamaño de muestra requerido en función del error máximo E o Delta P intervalo proporcional esperado se determina como sigue:

14

2 2

/ 2

2

2

/ 2

2

( )(1 )

( )

Zn

E

Z p pn

p

Pasos en la Prueba de Hipótesis

15

1. Definir el Problema - Problema Práctico

2. Señalar los Objetivos - Problema Estadístico

3. Determinar tipo de datos - Atributo o Variable

4. Si son datos Variables - Prueba de Normalidad

5. Establecer las Hipótesis

- Hipótesis Nula (Ho) - Siempre tiene el signo igual

- Hipótesis Alterna (Ha) – Tiene signos diferentes, > o <.

6. Seleccionar el nivel de Alfa (normalmente 0,05 o 5%)

Pasos en la Prueba de Hipótesis

16

7. Establecer el tamaño de la muestra, n >= 10 y colectar datos.

8. Decidir la prueba estadística apropiada y calcular el estadístico de

prueba (Z, t, χ2 o F) a partir de los datos.

9. Obtener el percentil que define la zona de rechazo ya sea

mediante tablas, Excel o Centurión.

10.Comparar el estadístico calculado con el percentil de las tablas y

ver si cae en la región de rechazo o ver si la probabilidad es menor

a alfa, rechazar Ho y acepte Ha. En caso contrario no rechazar Ho.

11.Con los resultados interprete una conclusión estadística para la

solución práctica.

Estadísticos para medias, varianzas y proporciones

17

2

11 22

2

1 2

1 2

2 2

1 1 2 21

1 2

; . ; 30;/

; . ; 30;/

; 1, 1; . .var

; . ; ' . .1 1

/

( 1) ( 1);

2

p

p

XZ Una media n conocida

n

Xt Una media n desconocida

S n

SF DF n n prueba dos ianzas

S

X Xt dos medias s desconocidas pero

Sn n

n s n sS DF n

n n

2

1 2

2 2

1 2

1 2

2

; . ; ' .

.

n

X Xt dos medias s desconocidas diferentes

s s

n n

DF formula especial

Estadísticos para medias pareadas y varianzas

Para el caso de muestras pareadas se calculan las diferencias d individuales como sigue:

18

22

2

22

; . . ; . . ./

( 1); ( 1); . . ar

( ); ( 1)( 1); .

i

d

dt Pares de medias d para cada par

S n

n SX DF n prueba una v ianza

O EX DF r c bondad ajuste

E

Ejemplo de prueba de hipótesis

Probar la hipótesis de igualdad de una media u para n > 301) Ho: Ha:

2) Calcular el estadístico de prueba Zc con la fórmula

3) Determinar el percentil de las tablas Zt

4) Establecer la región de rechazo con Zt y ver si cae ahí ZcLas regiones de rechazo prueba de 2 colas: Zc › Z y Zc ˂ - Z

5) Determinar el Intervalo de confianza para la media y ver si incluye a lamedia de la hipótesis, si no rechazar Ho

6) Determinar el p- valor correspondiente a Zc y comparar contra Alfa/2, sies menor rechazar Ho

19


Rechazar Ho si:◦ Zc se encuentra en la región de rechazo

◦ La media de la hipótesis no se encuentra en el intervalo de confianza

◦ El valor p de la Zc es menor que alfa/2 o Alfa para una cola

20

-Z

21


Pregunta Práctica: ¿Ha cambiado el valor de la duración media de los

focos?

Pregunta estadística:

¿La vida media de los focos es significativamente diferente de 800 horas? o,

¿ su diferencia se da por casualidad en una variación del día a día?

24

SOLUCIÓN POR EL MÉTODO DE INTERVALOS DE CONFIANZA

Intervalos de confianza del 96,0 % para la media: 788,0 +/-14,9985 [773,002; 802,998]

25

773 803μ = 800

El valor de μ se encuentra dentro de los límites de confianza, por tanto, no se puederechazar la hipótesis nula, esto es, 800 h es la vida media de los focos.

26

Pruebas de HipótesisMedia muestral = 788,0Desviación estándar = 40,0Tamaño de muestra = 30Intervalos de confianza del 96,0 % para la media: 788,0 +/- 14,9985 [773,002; 802,998]

Hipótesis Nula: media = 800,0Alternativa: no igualEstadístico Z calculado = -1,64317

Valor-P = 0,100348No rechazar la hipótesis nula para alfa = 0,04.

SOLUCIÓN MEDIANTE EL EMPLEO DE STATGRAPHICS CENTURIÓN

27

El StatAdvisorEste análisis muestra los resultados de realizar una prueba de hipótesis relativa a la media (mu) de una distribución normal. Las dos hipótesis a ser evaluadas aquí son:

Hipótesis nula: mu = 800,0Hipótesis alterna: mu <> 800,0

Dada una muestra de 30 observaciones con una media de 788,0 y una desviación estándar de 40,0, el estadístico Z calculado es igual a -1,64317. Puesto que el valor-P para la prueba es mayor o igual que 0,04, no puede rechazarse la hipótesis nula con un 96,0% de nivel de confianza. El intervalo de confianza muestra que los valores de mu soportados por los datos caen entre 773,002 y 802,998.

Ejemplo para dos colasSupongamos que tenemos muestras de dos reactores que producen el mismoartículo. Se desea ver si hay diferencia significativa en el rendimiento de “Reactor a Reactor”.

28

Reactor A Reactor B

89.7 84.7

81.4 86.1

84.5 83.2

84.8 91.9

87.3 86.3

79.7 79.3

85.1 82.6

81.7 89.1

83.7 83.7

84.5 88.5

Estadísticas Descriptivas

Variable Reactor N Media Desv.Std

Rendimiento A 10 84.24 2.90

B 10 85.54 3.65

¿Qué representa esto?

29

Reactor A Reactor B

80.0 82.5 85.0 87.5 90.0 92.5

A AA AAAA A AB B B B B BB B B B

¿Representan los reactores el mismo proceso básico?¿Representan los reactores dos procesos diferentes?

Prueba de Hipótesis

Pregunta Práctica: ¿Existe diferencia entre los reactores?

30

Pregunta estadística:

¿La media del Reactor B (85.54) es significativamente

diferente de la media del Reactor A (84.24)? o, ¿ su

diferencia se da por casualidad en una variación de día a día?

Prueba de Hipótesis

31

Debemos demostrar que los valores que observamos al parecer no

corresponden al mismo proceso, que la Ho debe estar equivocada

Ho:

Ha:

a

a

b

b

Ho: Hipótesis Nula:

No existe diferencia entre los Reactores

Ha: Hipótesis Alterna: Las medias de los Reactores son diferentes.

Desviaciones estándares muestrales = 2,9 y 3,65Tamaños de muestra = 10 y 10

Intervalos de confianza del 95,0% para el cociente de varianzas:[0,156797,2,54146]

Hipótesis Nula: cociente de varianzas = 1,0Alternativa: no igualEstadístico F calculado = 0,631263Valor-P = 0,503914No rechazar la hipótesis nula para alfa = 0,05.


El StatAdvisorEste análisis muestra los resultados de realizar una prueba de hipótesis relativa delcociente de dos desviaciones estándar (sigma1/sigma2) de muestras provenientes dedistribuciones normales. Las dos hipótesis a ser evaluadas aquí son:

Hipótesis nula: sigma1/sigma2 = 1,0Hipótesis alterna: sigma1/sigma2 <> 1,0

Dada una muestra de 10 observaciones con una desviación estándar de 2,9 y una segundamuestra de 10 observaciones con una desviación estándar de 3,65, el estadístico Fcalculado es igual a 0,631263. Puesto que el valor-P para la prueba es mayor o igual que0,05, no puede rechazarse la hipótesis nula con un 95,0% de nivel de confianza. Elintervalo de confianza muestra que los valores de var1/var2 soportados por los datos caenentre 0,156797 y 2,54146.


Medias muestrales = 84,24 y 85,54Desviaciones estándar muestrales = 2,9 y 3,65Tamaños de muestra = 10 y 10

Intervalos de confianza del 95,0% para la diferencia entre medias: -1,3 +/-3,09717 [-4,39717,1,79717]

Hipótesis Nula: diferencia entre medias = 0,0Alternativa: no igualEstadístico t calculado = -0,881837Valor-P = 0,389489No rechazar la hipótesis nula para alfa = 0,05.(Asumiendo varianzas iguales).

El Stat Advisor

Este análisis muestra los resultados de realizar una prueba de hipótesis relativa ala diferencia entre dos medias (mu1-mu2) de muestras provenientes dedistribuciones normales. Las dos hipótesis a ser evaluadas aquí son:

Hipótesis nula: mu1-mu2 = 0,0Hipótesis alterna: mu1-mu2 <> 0,0

Dada una muestra de 10 observaciones con una media de 84,24 y una desviaciónestándar de 2,9 y una segunda muestra de 10 observaciones con una media de85,54 y una desviación estándar de 3,65, el estadístico t calculado es igual a -0,881837. Puesto que el valor-P para la prueba es mayor o igual que 0,05, nopuede rechazarse la hipótesis nula con un 95,0% de nivel de confianza. Elintervalo de confianza muestra que los valores de mu1-mu2 soportados por losdatos caen entre -4,39717 y 1,79717.

37

NOTA: al realizar esta prueba, se ha asumido que las desviacionesestándares de las dos muestras son iguales. Se puede relajar estasuposición pulsando el botón secundario del ratón y eligiendoOpciones de Análisis.

pruebas de hipótesis (1)

Documents