explica 16

27
Actividad 16 Distribuciones muestrales para la varianza En muchas áreas tales como producción, mercadotecnia, economía, etc. se desea comparar la media de 2 variables aleatorias, tales como: El efecto que se obtuvo en dos programas de ventas distintos (mercadotecnia). En una línea de producción se aplican 2 formas de operarla distintas y se desean comparar resultados (producción). Se desea comparar el Índice Nacional de Precios al Consumidor (INPC) de un año con otro año (economía). Para poder realizar o llevar a cabo este comparativo, se utiliza la distribución muestral para la diferencia de medias. Distribución muestral para la diferencia de medias Supongamos que se tienen 2 poblaciones distintas y que se sabe que la primera población tiene una media poblacional 1 y una desviación estándar 1 y que la segunda población tiene una media poblacional 2 y una desviación estándar 2 , y además se sabe que 1 X es la media muestral calculada utilizando una muestra de tamaño n 1 > 30 extraída de manear aleatoria de la primer población y que 2 X es la media muestral calculada a partir de una muestra n 2 > 30 extraída también de forma aleatoria de la segunda población. En base al teorema del límite central las distribuciones muestrales de las medias 1 X y 2 X se aproximan a una distribución normal con media 1 y 2 y desviación estándar 1 1 1 X n y 2 2 2 X n respectivamente. Esta aproximación mejora a medida que n 1 y n 2 se incrementan. Con lo que acabamos de mencionar, podemos concluir: Si se obtienen de manera aleatoria e independiente dos muestras, una de tamaño n 1 de la primer población con media 1 y desviación estándar 1 y otra muestra de tamaño n 2 de la segunda población con media 2 y desviación estándar 2 . Entonces la distribución muestral para la diferencia de medias 1 2 X X está distribuida aproximadamente en forma normal con media 1 2 1 2 X X y desviación estándar 1 2 2 2 1 2 1 2 X X n n Aplicando la fórmula de la variable estandarizada X Z

Upload: kevin-galloway

Post on 08-Nov-2015

29 views

Category:

Documents


2 download

DESCRIPTION

estadistica

TRANSCRIPT

  • Actividad 16 Distribuciones muestrales para la varianza

    En muchas reas tales como produccin, mercadotecnia, economa, etc. se desea comparar la

    media de 2 variables aleatorias, tales como:

    El efecto que se obtuvo en dos programas de ventas distintos (mercadotecnia).

    En una lnea de produccin se aplican 2 formas de operarla distintas y se desean comparar

    resultados (produccin).

    Se desea comparar el ndice Nacional de Precios al Consumidor (INPC) de un ao con otro

    ao (economa).

    Para poder realizar o llevar a cabo este comparativo, se utiliza la distribucin muestral para la

    diferencia de medias.

    Distribucin muestral para la diferencia de medias

    Supongamos que se tienen 2 poblaciones distintas y que se sabe que la primera poblacin tiene

    una media poblacional 1 y una desviacin estndar 1 y que la segunda poblacin tiene una

    media poblacional 2 y una desviacin estndar 2, y adems se sabe que 1X es la media

    muestral calculada utilizando una muestra de tamao n1 > 30 extrada de manear aleatoria de la

    primer poblacin y que 2X es la media muestral calculada a partir de una muestra n2 > 30

    extrada tambin de forma aleatoria de la segunda poblacin. En base al teorema del lmite

    central las distribuciones muestrales de las medias 1X y 2X se aproximan a una distribucin

    normal con media 1 y 2 y desviacin estndar 1

    1

    1

    Xn

    y

    2

    2

    2

    Xn

    respectivamente.

    Esta aproximacin mejora a medida que n1 y n2 se incrementan.

    Con lo que acabamos de mencionar, podemos concluir: Si se obtienen de manera aleatoria e

    independiente dos muestras, una de tamao n1 de la primer poblacin con media 1 y desviacin

    estndar 1 y otra muestra de tamao n2 de la segunda poblacin con media 2 y desviacin

    estndar 2. Entonces la distribucin muestral para la diferencia de medias 1 2X X est

    distribuida aproximadamente en forma normal con media 1 2

    1 2X X

    y desviacin

    estndar 1 2

    2 2

    1 2

    1 2

    X Xn n

    Aplicando la frmula de la variable estandarizada

    XZ

  • Donde: X = Es la variable aleatoria que se va a estudiar. = Es la media de la distribucin normal correspondiente a la variable aleatoria. = Es la desviacin estndar de la distribucin normal correspondiente a la variable aleatoria. Tenemos:

    1 2

    1 2

    1 2

    1 2 1 2

    2 2

    1 2

    1 2

    X X

    X X

    X XZ

    X XZ

    n n

    Donde:

    1 2X X = Variable aleatoria, Diferencia de medias muestrales

    1 = Media de la Poblacin 1.

    2 = Media de la Poblacin 2.

    1 = Desviacin estndar de la poblacin 1 (o varianza muestral en caso de que n1 > 30).

    2 = Desviacin estndar de la poblacin 2 (o varianza muestral en caso de que n2 > 30).

    n1 = Tamao de la muestra extrada de la poblacin 1 (n1 > 30).

    n2 = Tamao de la muestra extrada de la poblacin 2 (n2 > 30).

    La aproximacin a la normal de la distribucin muestral para la diferencia de medias se cumple

    siempre y cuando la aproximacin a la normal de las distribuciones muestrales de las medias

    1X y 2X lo cumplan.

    La grfica de la distribucin muestral para la diferencia de medias tiene las mismas propiedades

    que la grfica de la normal estndar. Se utilizan las mismas tablas.

    Ejemplo 1. Uno de los principales fabricantes de pelculas en DVD compra los DVD vrgenes a dos compaas. Los DVD de la compaa A tienen una vida media de 7.2 aos con una desviacin estndar de 0.8 aos, mientras que los de la compaa B tienen una vida media de 6.7 aos con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34

  • DVDs de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria de 40 DVDs de la compaa B. Datos de la compaa A

    A =7.2

    A = 0.8

    nA = 34 (n1 > 30).

    Datos de la compaa B

    B = 6.7

    B = 0.7

    nB = 40 (n2 > 30).

    Como se desea conocer la probabilidad de que una muestra aleatoria de 34 DVDs de la

    compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria

    de 40 DVDs de la compaa B, se tiene que calcular P( 1 2X X > 1).

    Aplicando la frmula de la estandarizacin, tenemos

    1 2 1( 1) ( )P X X P Z Z

    Donde

    Z1 se calcula utilizando los datos, entonces

    1 2 1 2

    12 2

    1 2

    1 2

    12 2

    1

    1

    1

    1

    1

    1 7.2 6.8

    (0.8) (0.7)

    34 40

    1 0.5

    0.64 0.49

    34 40

    0.5

    0.0188 0.0123

    0.5

    0.0311

    0.5

    0.1764

    2.83

    X XZ

    n n

    Z

    Z

    Z

    Z

    Z

    Z

    Entonces 1 2( 1) ( 2.83)P X X P Z

  • Utilizando las tablas de la normal estandarizada

    obtenemos que para ( 2.83)P Z = 0.9977 y

    sabemos que

    1 2

    1 2

    1 2

    1 2

    1 2

    ( 2.83) 1 ( 2.83);

    ( 1) ( 2.83)

    ( 1) 1 ( 2.83)

    ( 1) 1 0.9977

    ( 1) 0.0023

    ( 1) 0.23%

    P Z P Z y como

    P X X P Z entonces

    P X X P Z

    P X X

    P X X

    P X X

    Por lo tanto, la probabilidad de que una muestra aleatoria de 34 DVDs de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria de 40 DVDs de la compaa B es 0.0023 o bien 0.23%. Ejemplo 2. Una importante ensambladora de autos ubicada en el Edo. de Puebla utiliza 2 tipos diferentes de neumticos. Si se sabe que el tiempo de vida til del neumtico del Tipo 1 tiene una media de 60 000 kms. con una desviacin estndar de 7 500 kms. y que el tiempo de vida til del neumtico Tipo 2 tiene una media de 63 000 kms con una desviacin estndar de 8 700 kms. Si se toma de manera aleatoria una muestra de 35 neumticos del tipo 1 y 38 neumticos del tipo 2. Determina. a. Cul es la probabilidad de que los neumticos del Tipo 1 tengan un tiempo de vida de a lo

    mas 3 000 kms que los neumticos del Tipo 2? b. Cul es la probabilidad de que la diferencia de los tiempos de vidas se encuentre entre

    2 000 kms y 3 000 kms.? Solucin: Datos de los neumticos Tipo 1

    1 = 60 000

    1 = 7 500

    n1 = 35 (n1 > 30).

    Datos de los neumticos Tipo 2

    2 = 63 000

    2 = 8 700

    n2 = 38 (n2 > 30).

    a. Como se desea conocer la probabilidad de que los neumticos del Tipo 1 tengan un tiempo

    de vida de a lo mas 3 000 kms que los neumticos del Tipo 2, se tiene que calcular

    1 2( 3000)P X X

    Aplicando la frmula de la estandarizacin, tenemos

    1 2 1( 3000) ( )P X X P Z Z

  • Donde

    Z1 se calcula utilizando los datos, entonces

    1 2 1 2

    12 2

    1 2

    1 2

    12 2

    1

    1

    1

    1

    1

    3,000 60,000 63,000

    (7,500) (8,700)

    35 38

    3,000 3,000

    56;250,000 75;690,000

    35 38

    6,000

    1;607,142.86 1;991,842.11

    6,000

    3;598,984.96

    6,000

    1897.1

    3.16

    X XZ

    n n

    Z

    Z

    Z

    Z

    Z

    Z

    Entonces 1 2( 3,000) ( 3.16)P X X P Z

    Utilizando las tablas de la normal estandarizada

    obtenemos que para ( 3.16)P Z = 0.9992 y

    como sabemos que

    1 2

    1 2

    1 2

    ( 3,000) ( 3.16)

    ( 3,000) 0.9992

    ( 3,000) 99.92%

    P X X P Z entonces

    P X X

    P X X

    Por lo tanto, la probabilidad de que los 35 neumticos del Tipo 1 tengan un tiempo de vida de a lo mas 3 000 kms que los 38 neumticos del Tipo 2 es 0.9992 o bien 99.92%. b. Como se desea conocer la probabilidad de que la diferencia de los tiempos de vidas se

    encuentre entre 2 000 kms y 3 000 kms, se tiene que calcular

    1 2(2,000 3,000)P X X

    Aplicando la frmula de la estandarizacin, tenemos

    1 2 0 1(2,000 3000) ( )P X X P Z Z Z

  • Donde

    Z0 se calcula utilizando los datos y el Lmite inferior de la desigualdad y Z1 se calcula utilizando

    los datos y el Lmite superior de la desigualdad, entonces:

    1 2 1 2 1 2 1 2

    0 12 2 2 2

    1 2 1 2

    1 2 1 2

    0 12 2 2 2

    2,000 60,000 63,000 3,000 60,000 63,000

    (7,500) (8,700) (7,500) (8,700)

    35 38 35 38

    X X X XZ Z

    n n n n

    Z Z

    Z

    0 1

    0 1

    0

    2,000 3,000 3,000 3,000

    56;250,000 75;690,000 56;250,000 75;690,000

    35 38 35 38

    5,000 6,000

    1;607,142.86 1;991,842.11 1;607,142.86 1;991,842.11

    5,000

    3

    Z

    Z Z

    Z

    1

    0 1

    0

    6,000

    ;598,984.96 3;598,984.96

    5,000 6,000

    1897.1 1897.1

    2.64

    Z

    Z Z

    Z

    1 3.16Z

    Entonces 1 2(2,000 3,000) (2.64 3.16)P X X P Z

    Utilizando las tablas de la normal estandarizada obtenemos

    que para ( 3.16)P Z = 0.9992 y ( 2.64)P Z =0.9959.

    Observando la grfica, podemos deducir que

    1 2

    1 2

    1 2

    1 2

    (2,000 3,000) ( 3.16) ( 2.64)

    (2,000 3,000) 0.9992 0.9959

    (2,000 3,000) 0.0033

    (2,000 3,000) 0.33%

    P X X P Z P Z

    P X X

    P X X

    P X X

    Por lo tanto, conocer la probabilidad de que la diferencia de los tiempos de vidas se encuentre

    entre 2 000 kms y 3 000 kms es 0.0033 o bien 0.33%.

  • Distribucin muestral para la diferencias de medias con n1 < 30 y/o n2 < 30

    Existen casos en los que se desea estimar la diferencia de medias de 2 poblaciones la cual cuenta con muestras pequeas (n1 < 30 y/o n2 < 30) y la desviaciones estndar

    de las poblaciones no se conocen.

    Para estimar la diferencia de medias poblacionales con muestras pequeas se puede recurrir al

    uso de la distribucin t-Student o distribucin t, que resulta til cuando se trabaja con

    muestras pequeas y se sabe que la distribuciones de los datos es normal y se desconocen las

    desviaciones estndar poblacionales, las frmulas a utilizar son

    2 21 2 1 2 1 1 2 21 2

    1 2

    1 1;

    21 1p

    p

    X X n s n st S

    n nS

    n n

    Donde:

    1 2X X = Variable Aletoria, Diferencia de medias muestrales

    1 = Media de la Poblacin 1.

    2 = Media de la Poblacin 2.

    Sp = Desviacin estndar ponderada.

    s1 = Desviacin estndar de la muestra 1.

    s2 = Desviacin estndar de la muestra 2.

    n1 = Tamao de la muestra extrada de la poblacin 1.

    n2 = Tamao de la muestra extrada de la poblacin 2.

    La grfica de la distribucin muestral para la diferencia de medias con muestras pequeas y

    desviaciones poblacionales desconocidas tiene las mismas propiedades que la grfica de la

    distribucin t-student. Se usa la misma tabla de la t, pero en este caso los grados de libertad se

    calculan como = grados de libertad = n1 + n2 - 2.

  • Ejemplo 3. Una empresa fabricante de focos compra 2 tipos de resistencias, a la compaa A le compra un tipo de resistencia en la que se sabe que tienen un tiempo promedio de vida igual a 90 das, a la compaa B le compra el otro tipo de resistencia en la que se sabe que tienen un tiempo promedio de vida igual a 72 das. Si se toma una muestra de 15 resistencias de los comprados en la compaa A con una desviacin estndar de 15 das y se toma una muestra de 10 resistencias de los comprados en la compaa B con una desviacin estndar de 45 das. Determine: a) La probabilidad de que las resistencias de la compaa A tenga una vida promedio de al

    menos 30 ms que los de la compaa B. b) La probabilidad de que la diferencia de los tiempos promedios, se encuentre entre 20 y 25

    das. Solucin: Datos de la compaa A

    1 = 90

    n1 = 15 (n1 < 30).

    s1 = 15

    Datos de la compaa B

    2 = 72

    n2 = 10 (n2 < 30).

    s2 = 10

    a. Como se desea determinar la probabilidad de que las resistencias de la compaa A tenga

    una vida promedio de al menos 30 ms que los de la compaa B, entonces se tiene que

    calcular

    1 2( 30)P X X

    Aplicando la frmula de la estandarizacin, tenemos

    1 2 1( 30) ( )P X X P t t

    Donde

    t1 se calcula utilizando los datos, entonces

  • 2 2

    1

    1

    1

    1

    1

    1

    1

    30 90 72 15 1 (15) 10 1 (10);

    15 10 21 1

    15 10

    30 (18) 14 (225) 9 (100);

    230.07 0.1

    12; 13.26

    0.17

    12

    13.26 0.17

    12

    13.26(0.4123)

    12

    5.46

    2.20

    p

    p

    p

    p

    p

    p

    t S

    S

    t SS

    t SS

    t

    t

    t

    t

    Entonces 1 2 1( 30) ( )P X X P t t .

    Ya que los tamaos de las muestras son 15 y 10, significa que = grados de libertad =

    = n1 + n2 - 2= 15 + 10 2 = 23

    Como podemos observar, tenemos el valor de 1t y los grados de libertad , con estos valores y la

    tabla para la t-Student vamos a determinar el valor de

    Entonces =0.02, grficamente tenemos

  • Y como lo que nos interesa determinar es P(t > 2.20), observando la grfica concluimos que

    ( 2.2) 0.02P t

    Entonces

    1 2

    1 2

    1 2

    ( 30) ( 2.20)

    ( 30) 0.02

    ( 30) 2%

    P X X P t

    P X X

    P X X

    Por lo tanto la probabilidad de que las resistencias de la compaa A tenga una vida promedio de

    al menos 30 ms que los de la compaa B es 0.02 o bien 2%.

    b. Como se desea determinar la probabilidad de que la diferencia de los tiempos promedios, se

    encuentre entre 20 y 25 das, entonces se tiene que calcular

    1 2(20 25)P X X

    Aplicando la frmula de la estandarizacin, tenemos

    1 2 0 1(20 25) ( )P X X P t t t

    Donde

    t0 se calcula utilizando los datos y el valor del lmite inferior de la desigualdad y t1 se calcula

    utilizando los datos y el valor del lmite superior de la desigualdad, entonces:

    Del inciso anterior podemos tomar el valor de 13.26pS , por lo tanto

  • 0 1

    0 1

    0

    20 90 72 25 90 72

    1 1 1 1(13.26) (13.26)

    15 10 15 10

    20 18 25 18

    1 1 1 1(13.26) (13.26)

    15 10 15 10

    2

    5.46

    t t

    t t

    t

    1

    0 1

    7

    5.46

    0.3663 1.2821

    t

    t t

    Entonces 1 2(20 25) (0.3663 1.2821)P X X P t .

    Ya que los tamaos de las muestras son 15 y 10, significa que = grados de libertad =

    = n1 + n2 - 2= 15 + 10 2 = 23

    Como podemos observar, tenemos el valor de 1t y los grados de libertad , con estos valores y la

    tabla para la t-Student vamos a determinar el valor de

    Entonces =0.01 y =0.25, grficamente tenemos

  • Y como lo que nos interesa determinar (0.3663 1.2821)P t , observando la grfica

    concluimos que

    (0.3663 1.2821) ( 0.3663) ( 1.2821)

    (0.3663 1.2821) 0.25 0.10

    (0.3663 1.2821) 0.15

    (0.3663 1.2821) 15%

    P t P t P t

    P t

    P t

    P t

    Entonces

    1 2

    1 2

    (20 25) 0.15

    (20 25) 15%

    P X X

    P X X

    Por lo tanto la probabilidad de que la diferencia de los tiempos promedios, se encuentre entre 20

    y 25 das es 0.0.15 o bien 15%.

    Distribucin muestral para la varianza

    Es importante mencionar que la distribucin ji-cuadrada 2 , es la distribucin que se utiliza para

    crear la distribucin muestral de la varianza, es decir, si se extraen de una poblacin normal todas las muestras de tamao n posibles y a cada una de estas muestras se le determina su varianza S2 estamos obteniendo la distribucin muestral de varianzas. Para poder estimar la varianza poblacional 2 o la desviacin estndar , necesitamos conocer el

    estadstico 2 .

    Si se extrae una muestra de tamao n, de una poblacin normal con varianza 2 conocida, el estadstico

    22

    2

    ( 1)n S

    tiene una distribucin muestral la cual es una distribucin ji-cuadrada con grados de libertad = n 1. Donde:

  • n = Tamao de la muestra S2 = La varianza muestral de la muestra extrada. 2 = La varianza poblacional de la poblacin de la cual se extrajo la muestra.

    Otra manera de calcular el estadstico 2 , es

    2

    2 1

    2

    ( )n

    i

    i

    X X

    Donde: n = Tamao de la muestra Xi= Son cada uno de los elementos extrados de la muestra.

    X Es la media muestral de la muestra extrada. 2 = La varianza poblacional de la poblacin de la cual se extrajo la muestra.

    Grfica de la ji-cuadrada.

    Sus caractersticas principales son:

    Los valores de 2 son mayores o iguales a 0.

    La forma de la grfica de 2 , depende de los grados de libertad = n 1, entre mas

    pequeo sean los grados de libertad menos achatada (mas puntiaguda), entre mas grande los grados de libertad mas achatada, y debido a esto, existe un nmero infinito de distribuciones ji-cuadrada.

    El rea bajo la curva ji-cuadrada es igual a 1 (100%). Las distribuciones ji-cuadrada no son simtricas.

  • Existen tablas que nos proporcionan los valores ms comunes de un rea bajo la curva ji-

    cuadrada. El valor en esta tabla se obtiene utilizando una la pareja (, ), donde = n - 1

    (grados de libertad) y es un valor de probabilidad y representa un rea o probabilidad a la

    derecha del valor de 2 . Estas tablas, por lo general se encuentran al final de los libros de

    probabilidad y estadstica. Al calcular la probabilidad utilizando la distribucin muestral de la varianza, es porque en realidad estamos interesados en saber el comportamiento de la varianza o distribucin de una muestra extrada de una poblacin con distribucin normal. Ejemplo 4. Supongamos que los tiempos que requiere un vuelo de cierta lnea de aviacin para aterrizar completamente en el aeropuerto de la Cd. de Mxico forman una distribucin normal con una desviacin estndar =1 minuto. Si se eligen al azar una muestra de 17 tiempos, encuentre la

    probabilidad de que la varianza muestral sea mayor que 2. Solucin: En base al problema, los datos que nos estn dando son: n = 17 S2 = Es nuestra variable aleatoria.

    = 1, entonces 2 = 1.

    Dado que nos estn pidiendo que determinemos la probabilidad de que la varianza muestral sea

    mayor que 2, es decir, lo que nos piden es 2( 2)P S .

    Aplicando el estadstico de la ji-cuadrada tenemos entonces

    2 2 2

    1( 2) ( )P S P

    Donde: 2

    1 se calcula utilizando los datos 2

    2

    1 2

    2

    1 2

    2

    1

    2

    1

    ( 1)

    (17 1)(2)

    (1)

    16(2)

    1

    32

    n S

    Entonces2 2( 2) ( 32)P S P .

    Ya que el tamao de la muestra es de 17, significa que = grados de libertad = = n 1 = 17 1 = 16

    Como podemos observar, tenemos el valor de 2

    1 y los grados de libertad , con estos valores y

    la tabla para la ji-cuadrada vamos a determinar el valor de

  • Entonces el valor de = 0.01, grficamente tenemos

    Y como lo que nos interesa determinar2 2( 2) ( 32)P S P , observando la grfica

    concluimos que 2

    2

    ( 2) 0.01

    ( 2) 1%

    P S

    P S

    Por lo tanto, la probabilidad de que la varianza muestral sea mayor que 2 es 0.01 o bien 1%.

    Ejemplo 5. Supongamos que los tiempos que requiere el horneado de un pastel forman una distribucin normal con una varianza 2 = 6 minutos. Si se toman de los registros de manera aleatoria, 25

    de los tiempos anotados, determine a. La probabilidad de que la varianza muestral sea mayor que 9.1 minutos. b. La probabilidad de que la varianza muestral est entre 3.462 y 10.745. Solucin: En base al problema, los datos que nos estn dando son: n = 25 S2 = Es nuestra variable aleatoria. 2 = 6.

  • a. Dado que nos estn pidiendo que determinemos la probabilidad de que la varianza muestral

    sea mayor que 9.1, es decir, lo que nos piden es 2( 9.1)P S .

    Aplicando el estadstico de la ji-cuadrada tenemos entonces

    2 2 2

    1( 9.1) ( )P S P

    Donde: 2

    1 se calcula utilizando los datos 2

    2

    1 2

    2

    1

    2

    1

    2

    1

    ( 1)

    (25 1)(9.1)

    6

    24(9.1)

    6

    36.4

    n S

    Entonces2 2( 9.1) ( 36.4)P S P .

    Ya que el tamao de la muestra es de 25, significa que = grados de libertad = = n 1 = 25 1 = 24

    Como podemos observar, tenemos el valor de 2

    1 y los grados de libertad , con estos valores y

    la tabla para la ji-cuadrada vamos a determinar el valor de

    Entonces el valor de = 0.05, grficamente tenemos

  • Y como lo que nos interesa determinar2 2( 9.1) ( 36.4)P S P , observando la grfica

    concluimos que 2

    2

    ( 9.1) 0.05

    ( 9.1) 5%

    P S

    P S

    Por lo tanto, la probabilidad de que la varianza muestral sea mayor que 9.1 es 0.05 o bien 5%.

    b. Dado que nos estn pidiendo que determinemos la probabilidad de que la varianza muestral

    est entre 3.462 y 10.745, es decir, lo que nos piden es 2(3.462

  • Entonces el valor de = 0.95 y = 0.01, grficamente tenemos

    Y como lo que nos interesa determinar2 2(3.462

  • Distribucin muestral para la relacin de varianzas. Con frecuencia se requiere comparar la exactitud de un instrumento de medicin con la de otro, el rendimiento de una forma de trabajo con el de otro, la utilidad de un proceso de ventas con el de otro o hasta la forma en que vara la forma para calificar de un profesor universitario con la de otro.

    De inmediato, podramos comparar las varianzas de dos poblaciones, 2

    1 y2

    2 , utilizando la razn

    de las varianzas muestrales

    2

    1

    2

    2

    S

    S. Mas sin embargo si

    2

    1

    2

    2

    S

    S est muy prximo al valor de 1, se

    pudiera concluir que 2

    1 y2

    2 son iguales. De otra forma, si el valor que ofrece 2

    1

    2

    2

    S

    S es un valor

    muy grande o muy pequeo, este valor nos arrojar evidencia de una diferencia en las varianzas de las poblaciones.

    Para poder estimar la relacin entre varianzas poblacionales 2

    1 y2

    2 , necesitamos conocer el

    estadstico F .

    Si se extrae una muestra de tamao n1, de una poblacin 1 normal con varianza 2

    1 conocida y

    si se extrae una muestra de tamao n2, de una poblacin 2 normal con varianza 2

    2 conocida y

    adems se sabe que 2

    1S y 2

    2S son las varianzas muestrales independientes de tamao n1 y n2,

    entonces: 2 2

    1 2

    2 2

    2 1

    SF

    S

    tiene una distribucin muestral la cual es una distribucin F-Fisher con grados de libertad 1 = n1 1 y 2 = n2 1. Donde: n1 = Tamao de la muestra extrada de la Poblacin 1. n2 = Tamao de la muestra extrada de la Poblacin 2.

    2

    1S = La varianza muestral de la muestra extrada de la Poblacin 1. 2

    2S = La varianza muestral de la muestra extrada de la Poblacin 1. 2

    1 = La varianza poblacional de la poblacin 1. 2

    2 = La varianza poblacional de la poblacin 2.

  • Existen tablas que nos proporcionan los valores ms comunes de un rea bajo la curva F de

    Fisher. El valor en esta tabla se obtiene utilizando una coordenada (, 1, 2 ), donde 1 = n1 1

    y 2= n2 1 son los grados de libertad y es un valor de probabilidad (0.01 o 0.05) y

    representa un rea o probabilidad a la derecha del valor de aF . Estas tablas, por lo general se

    encuentran al final de los libros de probabilidad y estadstica. Un dato importante es saber que

    1 2

    2 1

    1 , ,

    , ,

    1a

    a

    FF

    Ejemplo 6. Los tiempos que requiere el horneado de un pastel forman una distribucin normal, este pastel

    es horneado por una empresa lder en el ramo con una varianza 2 = 10 minutos, mientras que

    otra empresa la cual es competencia de la primera, hornea el mismo pastel con una varianza de 2 = 15 minutos. Si de forma aleatoria se seleccionan 25 registros de la empresa lder y 31

    registros de la otra empresa, determine la probabilidad de que la relacin entre la varianza muestral de la empresa lder y la varianza muestral de la otra empresa sea mayor a 1.26. Solucin:

    En base a los datos que nos proporciona el problema tenemos 2 empresas las cuales fabrican el

    mismo pastel, a la empresa lder le llamaremos Empresa A y a la otra empresa le llamaremos

    Empresa B.

    Entonces: n1 = 25. n2 = 31.

    2

    AS = La varianza muestral de la muestra extrada de la Empresa A. 2

    BS = La varianza muestral de la muestra extrada de la Empresa B. 2

    A = 10. 2

    B = 15.

    Lo que nos piden que determinemos es

    2

    21.26A

    B

    SP

    S

    Aplicando el estadstico de la F-Fisher tenemos entonces 2

    121.26 ( )A

    B

    SP P F F

    S

    Donde:

    1F se calcula utilizando los datos

    2 2

    1 2 2

    1

    1

    1

    151.26

    10

    (1.26)(1.5)

    1.89

    A B

    B A

    SF

    S

    F

    F

    F

  • Entonces

    2

    21.26 ( 1.89)A

    B

    SP P F

    S

    .

    Ya que el tamao de la muestra de la empresa A es de 25, significa que 1 = n1 1 = 25 1 = 24 y el tamao de la muestra de la empresa B es 31, significa que 2= n2 1 = 31 1 = 30.

    Como podemos observar, tenemos el valor de 1F y los grados de libertad 1 y 2, con estos

    valores y la tabla para la F de Fisher vamos a determinar el valor de

    Entonces el valor de 0.01, entonces buscamos en la tabla para = 0.05

    Entonces el valor de = 0.05

  • Y como lo que nos interesa determinar

    2

    21.26 ( 1.89)A

    B

    SP P F

    S

    , observando la grfica

    concluimos que 2

    2

    2

    2

    2

    2

    1.26 ( 1.89)

    1.26 0.05

    1.26 5%

    A

    B

    A

    B

    A

    B

    SP P F

    S

    SP

    S

    SP

    S

    Por lo tanto, la probabilidad de que la relacin entre la varianza muestral de la empresa lder y la

    varianza muestral de la otra empresa sea mayor a 1.26 es 0.05 o bien 5%.

    Ejemplo 7. Dos atletas de talle internacional realizan pruebas de atletismo, se sabe que los tiempos de ejecucin de cada prueba forman una distribucin normal, Si se toman aleatoriamente 10 marcas del primer atleta y 20 marcas del 2do. Atleta . Determine la probabilidad de que la relacin entre la varianza muestral del primer atleta y la varianza muestral del segundo atleta sea menor o igual a 2.42. Solucin: En base a lo datos del problema y dado que no nos proporcionan los valores de las varianzas de los 2 atletas, supondremos que las 2 varianzas poblacionales son iguales. Entonces tenemos: n1 = 10. n2 = 20.

    2

    1S = La varianza muestral de la muestra extrada del Atleta 1. 2

    2S = La varianza muestral de la muestra extrada del Atleta 2. 2

    1 = 2

    2 .

  • Lo que nos piden que determinemos es 2

    1

    2

    2

    2.42S

    PS

    Aplicando el estadstico de la F-Fisher tenemos entonces 2

    112

    2

    2.42 ( )S

    P P F FS

    Donde:

    1F se calcula utilizando los datos

    2 22 21 2

    1 2 12 2

    1 1

    2 2

    1 11 2 2

    1 1

    2

    11 2

    1

    1

    ;

    2.42

    SF como

    S

    SF

    S

    SF

    S

    F

    Entonces. 2

    1

    2

    2

    2.42 ( 2.42)S

    P P FS

    Ya que el tamao de la muestra del atleta 1 es de 10, significa que 1 = n1 1 = 10 1 = 9 y el tamao de la muestra del atleta 2 es 20, significa que 2= n2 1 = 20 1 = 19.

    Como podemos observar, tenemos el valor de 1F y los grados de libertad 1 y 2, con estos

    valores y la tabla para la F de Fisher vamos a determinar el valor de

    Entonces el valor de 0.01, entonces buscamos en la tabla para = 0.05

  • Entonces el valor de = 0.05

    Y como lo que nos interesa determinar

    2

    1

    2

    2

    2.42 ( 2.42)S

    P P FS

    , observando la grfica

    concluimos que

  • 21

    2

    2

    2

    1

    2

    2

    2

    1

    2

    2

    2

    1

    2

    2

    2.42 ( 2.42)

    2.42 1 0.05

    2.42 0.95

    2.42 95%

    SP P F

    S

    SP

    S

    SP

    S

    SP

    S

    Por lo tanto, la probabilidad de que la relacin entre la varianza muestral del primer atleta y la

    varianza muestral del segundo atleta sea menor o igual a 2.42. es 0.95 o bien 95%.