planteamiento de hipótesis para dos poblaciones (word)

54
ESTADISTICA INFERENCIAL PLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES PARA LA PROPORCIÓN PLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES PARA LA PROPORCIÓN Mtra. A Elsa Retureta Álvarez 1

Upload: hoteles2

Post on 21-Jun-2015

19.170 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

PLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONESPARA LA PROPORCIÓN

Mtra. A Elsa Retureta Álvarez 1

Page 2: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

APLICACIÓN

Su aplicación determina si razonablemente puede pensarse que las mediciones muéstrales provengan de una población que tenga una normal distribución teórica.

En la prueba se compara la distribución de frecuencia acumulativa de la

distribución teórica con la distribución de frecuencia acumulativa observada. Se

determina el punto en el que estas dos distribuciones muestran la mayor

divergencia. Y a continuación presentamos el desarrollo del estudio acerca del

planteamiento de la hipótesis cuando existen dos poblaciones, y haciendo

mención, en lo referente a la proporción:

1. Estructura de la base de datos

Normalmente la estructura que tiene la base de datos es la de utilizar una

variable para entrar los resultados de la medición y la otra donde se particiona

estos resultados en los dos grupos.

2. Premisas

La única premisa que se necesita es que las mediciones se encuentren

al menos en una escala ordinal. Adicionalmente se necesita que la medición

considerada sea básicamente continua.

3. Potencia-Eficiencia

Comparada ante la alternativa paramétrica de la t de student para dos

muestras independientes (o el modelo de Análisis de Varianza clasificación

simple para dos muestras), cuando las premisas paramétricas se cumplen,

tiene una potencia eficiencia de cerca del 96%, que tiende a decrecer

ligeramente a medida que se aumentan los tamaños de muestra.

4. Hipótesis

Las hipótesis de esta dócima, expresadas en palabras son:

Ho: Las distribuciones poblacionales son iguales.

H1: Las distribuciones poblacionales son distintas.

Mtra. A Elsa Retureta Álvarez 2

Page 3: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Ahora bien se recomienda en general hacer el enunciado de las hipótesis

de forma tal que indique en un mayor grado la característica que va a ser

docimada.

5. Estadígrafo y distribución muestral.

Designemos por T1 y por T2 las tablas de distribución de frecuencias

relativas acumuladas, particionadas en k categorías. Donde el primer subíndice

corresponde al número de la muestra y el segundo al orden de la clase.

Se analiza entonces en la columna de las diferencias de las frecuencias,

en qué clases se obtiene el valor máximo. Se tendrá entonces en símbolos:

El estadígrafo de esta dócima se designa por χ2 y para tamaños

de muestra suficientemente grandes, está distribuido según chi-cuadrado con

dos grados los de libertad. En símbolos:

Goodman, ha demostrado que si los tamaños

de muestra son pequeños la dócima se

comporta conservadoramente.

6. Salidas de la dócima

Las salidas usuales de una dócima son tres:

Máxima diferencia negativa. Donde se muestra cuál es la mayor diferencia

negativa alcanzada.

Máxima diferencia positiva. Donde se muestra la mayor diferencia positiva

alcanzada.

Valor de la probabilidad para dos colas.

Mtra. A Elsa Retureta Álvarez 3

Page 4: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

GLOSARIO

CONCEPTO DEFINICIÓN TRADUCCIÓN

Dócima Es un procedimiento que nos permite contrastar 2 hipótesis bajo ciertas consideraciones y tomar una decisión respecto de ellas.

It is a procedure that allows to contrast 2 hypotheses under certain considerations and to make a decision regarding them.

Distribución Muestral

Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población

It's what results from considering all the possible samples that can be taken of a population. Their study allows calculating the probability that one has, given a single sample, of coming closer to the population's parameter.

Distribución ji-cuadrada Se genera al sumar variables normales independientes (0,1) elevadas al cuadrado. El parámetro que define la distribución se llama grados de libertad y es el número de variables normales que sumas.

It's generated when adding independent normal variables (0,1) high to the square. The parameter that defines the distribution is called grades of freedom and it's the number of normal variables that you add.

Prueba de Kolmogórov-Smirnov

La prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí.

The Kolmogorov–Smirnov test (K–S test) is a form of minimum distance estimation used as a nonparametric test used to compare a sample with a reference probability distribution or to compare two samples.

Mtra. A Elsa Retureta Álvarez 4

Page 5: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Distribución de frecuencia acumulativa

Es la frecuencia total de todas las clases menos que el límite de la clase superior de una clase determinada. Hay dos tipos de distribuciones de frecuencias acumuladas.

Menos de distribución de frecuencias acumuladas y Más de distribución de frecuencias acumuladas

It's the total frequency of all the classes less than the limit of the top class of a certain class. There are two types of distributions of accumulated frequencies:Less distribution of accumulated frequencies and more distribution of accumulated frequencies

Homocedástica La homocedasticidad es una propiedad fundamental del modelo de regresión lineal general y está dentro de sus supuestos clásicos básicos. Se dice que existe homocedasticidad cuando la varianza de los errores estocásticos de la regresión es la misma para cada observación i.

The homocedasticity is a fundamental property of the pattern of general lineal regression and it is inside its basic classic suppositions. It is said that homocedasticity exists when the variance of the stochastic errors of the regression is the same one for each observation i.

Particionada En teoría de números, una partición de un entero positivo n es una forma de descomponer n como suma de enteros positivos. Dos sumas se considerarán iguales si solo difieren en el orden de los sumandos. De modo más riguroso, una partición de un número entero positivo n es una secuencia de enteros positivos.

In theory of numbers, a partition of a positive integer "n" is a form of decomposing "n" like it adds of whole positive. Two sink they will consider same if alone they differ in the order of the adding-up. In a more rigorous way, a partition of a positive whole number n is a sequence of whole positive.

Estadígrafo Es la medida que en Estadística se aplica sobre una muestra. En general se utilizan dos tipos: Los de Tendencia Central y los de Dispersión.

It is the measure that is applied on a sample in Statistic. In general two types are used: Those of Central Tendency and those of Dispersion.

Mtra. A Elsa Retureta Álvarez 5

Page 6: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

FORMULARIO:

Mtra. A Elsa Retureta Álvarez 6

Planteamiento de Hipótesis

en Dos poblaciones para la

Proporción

Page 7: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

INTRODUCCIÓN

El uso de la Estadística es de gran importancia en la investigación. Casi

todas las investigaciones aplicadas requieren algún tipo de análisis estadístico

para que sea posible evaluar sus resultados. La elección de uno u otro tipo de

análisis estadístico depende del problema que se plantee en el estudio así

como de la naturaleza de los datos.

Dentro de la estadística se aplican en la investigación los test o décimas

paramétricos y no paramétricos, entre los test no paramétricos que

comúnmente se utilizan para verificar si una distribución se ajusta o no a una

distribución esperada, en particular a la distribución normal se encuentran el

test de Kolmogorov-Smirnov que es bastante potente con muestras grandes.

El nivel de medición de la variable y su distribución son elementos que

intervienen en la selección del test que se utilizará en el procesamiento

posterior. De hecho, si la variable es continua con distribución normal, se

podrán aplicar técnicas paramétricas. Si es una variable discreta o continua no

normal, solo son aplicables técnicas no paramétricas pues aplicar las primeras

arrojaría resultados de dudosa validez.

Mtra. A Elsa Retureta Álvarez 7

Page 8: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

TEORIA

En algunos diseños de investigación, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones muestrales y usar la diferencia de las dos proporciones para estimar o probar una diferencia entre las mismas.

Las aplicaciones son similares a la diferencia de medias, por ejemplo si dos empresas consultoras ofrecen datos de proporciones de personas que van a votar por el PRI y al hacer dos estudios diferentes salen resultados ligeramente diferentes ¿pero qué tanta diferencia se requiere para que sea estadísticamente significativo? De eso se tratan las pruebas estadísticas de diferencias de proporciones.

El estadístico Z para estos casos se calcula de la siguiente manera:

1 ˆp = proporción de la muestra 1.

2 ˆp = proporción de la muestra 2.

1 p = proporción de la población 1.

2 p = proporción de la población 2.

1 n = tamaño de la muestra 1.

2 n = tamaño de la muestra 2.

Contraste bilateral

El contraste bilateral sobre la diferencia de proporciones es

Mtra. A Elsa Retureta Álvarez 8

Page 9: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Entonces se define

y se rechaza la hipótesis nula si o si

Contrastes unilaterales

En el contraste

se rechazará H0 si . Para el test contrario

se rechaza H0 sí .

Mtra. A Elsa Retureta Álvarez 9

Page 10: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Mtra. A Elsa Retureta Álvarez 10

Page 11: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

SUPUESTOS

– La distribución de los datos tiene que ser normal (o cualquier distribución, en el caso de que los tamaños muestrales sean grandes, n>30)

– La distribución de la diferencia entre las dos mediciones realizadas tiene que ser normal (o cualquier distribución, en el caso de que los tamaños muestrales sean grandes, n>30)

– Las distribuciones son normales

– Las muestras se seleccionaron al azar

– Las poblaciones se distribuyen normalmente

– Las muestras han sido seleccionadas al azar

– Todas las observaciones son independientes entre sí

– Tamaño de muestra “grande” para que se cumpla el teorema del límite central

– En variables numéricas, no deben haber valores extremos o sesgos que limiten la representatividad del promedio como medida de tendencia central.

Mtra. A Elsa Retureta Álvarez 11

Page 12: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

RESTRICCIONES

En el caso concreto de comparar dos o más poblaciones existen cinco restricciones o condiciones que se deben cumplir estrictamente para realizar este tipo de análisis (1-3):

1) Las observaciones deben ser independientes entre si;

2) Las observaciones deben hacerse en poblaciones distribuidas normalmente;

3) Estas poblaciones tienen que tener homocedasticidad (igualdad de varianzas) (o, en casos especiales deben tener una proporción de varianzas conocidas)

4) Las variables correspondientes deben ser cuantitativas continuas y,

5) Cuando existen más de dos poblaciones comparadas, las medias de estas poblaciones normales y homocedásticas deben ser combinaciones lineales de efectos debidos a las columnas y a las filas o a ambos. Cuando estas condiciones se satisfacen, entonces se puede aplicar la prueba "t" o "F", según sea el caso.

GRAFICOS

Mtra. A Elsa Retureta Álvarez 12

Page 13: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

FORMULA

Para contrastar la Ho se utiliza la siguiente fórmula de (Zc) para calcular el tamaño de cada población de donde proceden las muestras, para comparar dos proporciones poblacionales, con la siguiente fórmula.

UTILIDAD

El concepto de prueba de hipótesis para proporción se puede utilizar para probar hipótesis en relación con datos cualitativos, dado que se desea llegar a conclusiones en cuanto a la proporción de los valores que tienen una característica particular.

…..En muchas ocasiones la toma de decisiones las personas necesitan

determinar si los parámetros de dos poblaciones son iguales o diferentes. En una empresa por ejemplo, puede tener la intención de probar si sus

empleadas reciben un salario medio que el de sus empleados varones, por realizar el mismo trabajo.

Un director de capacitación, puede querer determinar si la proporción de empleados que están listos para ascenso en una dependencia gubernamental es diferente al de la proporción de otra.

Un fabricante de medicina puede tener la necesidad de saber si un nuevo medicamento ocasiona una reacción en grupo de animales para experimentación y otra reacción distinta de otro grupo.

Mtra. A Elsa Retureta Álvarez 13

Page 14: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

TABLAS

Una tabla de contingencia es una herramienta que nos permite poner a prueba si dos criterios de clasificación de una misma muestra son independientes o no, por ejemplo:

EJEMPLOS DE RESOLUCIÓN

EJEMPLO 1

El tamaño de las muestras seleccionadas de Casos (630, que representó a toda la población) y de Controles (1005) se incrementó en relación al cálculo necesario para el estudio en los ocho hospitales de la ciudad de México, seguramente para obtener una mayor precisión en los resultados esperados.

Para la reconstrucción de cálculo necesario, como un ejercicio docente, se utilizan los siguientes criterios.

o El cálculo del tamaño de la muestra en estudios de dos poblaciones para comparar dos proporciones poblacionales, con el siguiente enfoque:

Mtra. A Elsa Retureta Álvarez 14

Población Criterio 1 Criterio 2

Ingenieros recién egresados

Salario inicial Institución de origen

Estudiantes Nivel Socioeconómico

Promedio académico

Número de fallas en un proceso

Maquinaria utilizada

Turno

Estudiantes Calif. en Materia 1 Calif. en Materia 2

Fallas en un transformador

Tipo de falla Ubicación

Etc...

Page 15: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Nd1 Grupo de Casos : Mujeres con CACU

Nd2 ----- Grupo de Controles : Mujeres sin CACU

El siguiente planteamiento de Hipótesis Estadística:

H0 = Hipótesis nula (niega) H0 : Õ 1 ≥ Õ 2

H1 = Hipótesis alternativa (afirma) H1 : Õ 1 < Õ 2

"En el grupo de Casos la asociación del CACU (No/Si) tendrá una diferencia estadísticamente significativa mayor con los factores de riesgo reproductivo e historia de vida sexual, que en el Grupo de Controles".

o Dirección de la hipótesis ---------- una sola cola derecha (unilateral).

Donde: za = 1.64 para un error a = 0.05 (5%) (una cola) zb = 0.84 para un error b de 0.20 (0.20) (una cola) p1 = 0.03 (1) p2 = 0.01 (1) q1 = 0.97 (1) q2 = 0.99 (1)

n1 = 600 mujeres para el Grupo de Casos

n2 = 600 mujeres para el Grupo de Controles

Al haberse utilizado 630 casos y 1005 controles, como tamaño muestral en los grupos, se logrará una mayor precisión en la estimación de los resultados esperados.

EJEMPLO 2

El cálculo del tamaño de la muestra en estudio de dos poblaciones para comparar dos proporciones poblacionales, con el siguiente enfoque:

Ns1 ® Grupo de intervención, 125 pares de madres e hijos (n1), con

Mtra. A Elsa Retureta Álvarez 15

Page 16: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

lactancia materna exclusiva

Nd2 ® Grupo testigo, 125 pares de madres e hijos (n2), con lactancia materna exclusiva

El siguiente planteamiento de Hipótesis Estadística:

Ho = Hipótesis nula (niega) ® Ho : p 1 ≥ p 2

Ha = Hipótesis alternativa (afirma) ® Ha : p 1<p 2

En el grupo de intervención (n1) que recibe orientación sobre la lactancia materna exclusiva (No/Si) tendrá una mayor diferencia estadísticamente significativa porque al momento del egreso el porcentaje de madres que alimenten a sus hijos exclusivamente al pecho, será mayor en comparación con el Grupo Testigo, que sólo recibe educación rutinaria.

Dirección de la hipótesis ® una sola cola derecha (unilateral)

Para contrastar la Ho se utiliza la siguiente fórmula de (n) para calcular el tamaño de cada población de donde proceden las muestras:

Donde:

za = 1.64 para un valor nivel error a = 0.05 (5%)

zb = 0.84 para un valor nivel error b = 0.20 (20%)

p1 = 63% menores de 3 meses que recibieron

Lactancia materna exclusiva (1)

q1 = 37% menores de 3 meses que no recibieron

Lactancia materna exclusiva

p2 = 28% menores de 3 meses que no fueron

Amamantados

Mtra. A Elsa Retureta Álvarez 16

Page 17: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

q2 = 72% menores de 3 meses que sí fueron

Amamantados

Reemplazando valores en la formula de (n)

n1 = 22 pares de madres e hijos (grupo de Intervención)

n2 = 22 pares de madres e hijos (grupo Testigo o Control)

Al haberse utilizado 125 pares de madres e hijos en cada grupo, como tamaño muestral, se ha logrado una mayor precisión en la estimación de los resultados esperados.

EJEMPLO 3

Se realizó un estudio para comparar los años promedio de servicio de quienes se retiraron en 1979 con los que se retiraron el año anterior en Delong Manufacturing Co. Con un nivel de significancia de .01 ¿podemos concluir que los trabajadores que se retiraron el año pasado trabajaron más años según la siguiente muestra? Nota: sea población #1= año anterior.

 Paso 1:

Paso 2: Rechace H0 si z > 2.33Paso 3:

Mtra. A Elsa Retureta Álvarez 17

Page 18: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

EJEMPLO 4

(Los exámenes de Estado- Pruebas del ICFES)Se desea comparar la preparación de los estudiantes de último año de bachillerato con base en las pruebas de estado (ICFES). Se desea estimar la diferencia de los puntajes medios μ.1 − μ2 para los estudiantes de colegios públicos μ1 y de colegios privados μ2.El puntaje de las pruebas de estado varía en una escala de 0 a 400 puntos.

Para desarrollar estos propósitos, se han tomado muestras al azar entre todos los inscritos, de tal manera que de los estudiantes de colegios públicos se ha tomado una muestra de 100 estudiantes, mientras que de los colegios privados se tomaron 81 estudiantes.

Para cada una de las muestras se calculó el puntaje promedio obtenido y su correspondiente desviación estándar, arrojando los siguientes resultados:

Los datos obtenidos retan la hipótesis de que los colegios privados preparan mejor a sus estudiantes para las pruebas de estado que los colegios públicos?

Bueno, manos a la obra. De acuerdo con el contexto del problema, tenemos un primer problema de estimación de la diferencia de puntajes medios en las dos poblaciones, lo cual puede hacersemediante la construcción de un intervalo de confianza.En segundo lugar está formulada una pregunta (hipótesis), la cual debe ser sometida a una prueba de significancia, es decir debe calcularse el valor P, que mide la compatibilidad entre los datos y la hipótesis planteada.

Mtra. A Elsa Retureta Álvarez 18

Page 19: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

EJERCICIOS DE RESOLUCIÓN

Ejemplo 5

¿Es más probable que los trabajadores solteros falten más que los trabajadores casados?

Una muestra de 250 trabajadores casados indicó que 22 faltaron más de 5 días el año pasado, mientras que una muestra de 300 trabajadores solteros indicó que 35 faltaron más de 5 días. Utilice .05 de nivel de significancia.

Nota: sea población #1 = trabajadores solteros.

Paso 4: H0 no se rechaza. No existe diferencia entre la proporción de trabajadores casados y solteros que faltan más de 5 días al trabajo.El valor p = P{ z > 1.1} = .1357

Ejemplo 1:

Unos grandes almacenes han instalado unas cajas de cobro automáticas. Durante los primeros meses, tan sólo las han usado un 8% de la clientela, por lo que deciden iniciar una campaña publicitaria a fin de incrementar ese uso en un 10%, y justificar así su instalación. Durante unos días, en horas elegidas aleatoriamente, han efectuado un recuento  y han descubierto que de un conjunto de 2340 clientes, tan sólo han usado las cajas 208. Después de desarrollar la campaña, han repetido el estudio, y esta vez, de 1978 clientes, han pasado por las nuevas cajas 395. ¿Justifican estos

Mtra. A Elsa Retureta Álvarez 19

Page 20: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

resultados, al 95% de nivel de confianza, que se ha logrado el incremento deseado del 10%?

En este caso aplicaremos el estadístico de contraste en el que las proporciones en la población son 8% y 18% respectivamente (si admitimos esto como hipótesis nula) y las de la muestra 208/2340=0,0889 y 395/1978=0,1887.

Como el error es pequeño, se toman aquí como parámetros de la población los mismos valores que en la muestra, y sólo hay que rellenar la diferencia de proporciones supuesta (aquí el 10%)

Suponemos contraste bilateral y fijamos el 95% de nivel de confianza:

El resultado del contraste será que se rechaza la hipótesis de un incremento del 10%. Si rellenas los datos observarás que ha subido un 11,1% de forma significativa.

Ejercicio 2:

Se desea establecer si la exigencia de ser libres de Leucosis Bovina para exportación en ganado lechero determinó un cambio en la prevalencia de esta enfermedad en una región. Para eso se tomaron dos muestras aleatorias de un banco de sueros. La primera correspondió a sueros extraídos entre 1970-1975 A y la segunda entre 1995-2000 B. En la muestra A de 144 sueros se encontraron 50 positivos y en la muestra B de 400 sueros se hallaron 188 positivos.

Mtra. A Elsa Retureta Álvarez 20

Page 21: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Hay alguna evidencia de que esta política afecto la prevalencia de la enfermedad con un nivel de significación de 0.05.

Ejercicio 3:

De 2.000 empresas muestreadas aleatoriamente en el año 2002, 58 tenían alguna anomalía en sus cuentas auditadas en EE.UU. mientras que en 2000, de otra muestra de 2.500 empresas, 61 tenían algún error en la contabilización de sus cuentas. , ¿La proporción de empresas con algún error en sus cuentas auditadas en 2002, fue significativamente distinta que la proporción de ellas en el año 2000?

Para realizar el contraste, vamos a calcular un intervalo de confianza para la diferencia de proporciones de empresas con algún error en sus cuentas de los dos años para poder comprobar si la diferencia entre los dos años es significativa o no.

El intervalo de confianza para la diferencia de proporciones, a nivel del 95%, está entre 0,0049 y 0,0141. Esto parece apuntar a que el porcentaje de empresas que tiene alguna anomalía en sus cuentas contables no es significativamente diferente en los dos años.

El estadístico de contraste es z = 0,96 cuyo p-valor es 0,339 que al ser menor que el nivel de significación del 5%, el p-valor resulta coherente con la impresión anterior, por lo que no rechazaremos la hipótesis nula.

Ejercicio 4:

En un anuncio publicitario de discos duros para ordenador, el fabricante asegura que sus precios son más económicos y que el porcentaje de sus discos defectuosos es igual al de la competencia. Para contrastar esta última afirmación hemos tomado dos muestras aleatorias, cada una de ellas compuesta por 150 unidades. Los resultados obtenidos se muestran en la tabla siguiente:

Es inmediato comprobar que se cumplen los supuestos para este caso, por lo que pasaremos a calcular un intervalo de confianza del 95% para la diferencia entre proporciones y a realizar el correspondiente test de hipótesis:

El intervalo de confianza para la diferencia de proporciones, a nivel del 95%, tiene por extremos los valores positivos 0,003 y 0,117 (observar que no

Mtra. A Elsa Retureta Álvarez 21

Page 22: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

contiene el valor 0, aunque por muy poco). Esto parece apuntar a que el porcentaje de defectos en los discos del anunciante es significativamente superior al porcentaje de la competencia. Para un nivel de significación del 0,05, el p-valor resulta coherente con la impresión anterior, por lo que resulta sensato rebatir la afirmación del anunciante (si bien las cosas cambiarían si tomásemos α = 0,01).

Ejercicio 5:

Oficiales escolares comparan el coeficiente intelectual entre niños de dos grupos.

De una muestra de 159 niños del grupo 1 78 califican con más de 100 puntos, de una muestra de 250 niños del grupo 2 123 califican con más de 100 puntos.

Construya un intervalo de confianza para la diferencia entre las dos proporciones del grupo 1 y 2 de los niños con califican con más de 100.

Mtra. A Elsa Retureta Álvarez 22

= - 2,55

50 + 188144 + 400= 0,4375

= 0,470= 0,347= 0,4375

= 0,5625

|Zc |> |Ztab|Rechazo Ho

1,96

Ho: P1=P2 H1: P1 = P2

Page 23: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

q1 = 50.95%

q2 = 50.8%

P1 – P2=

Se puede concluir que no hay un grupo mejor que el otro en ambos casos

Ejercicio 6:

Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.

Solución:

Datos:

PH = 0.12PM = 0.10nH = 100nM = 100p(pH-pM 0.03) = ? 

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está utilizando la distribución normal.

Mtra. A Elsa Retureta Álvarez 23

Page 24: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.

Ejercicio 7:

Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?

Solución:

En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una misma población.

Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un período de por lo menos dos años, sólo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción.

En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita saber las proporciones de las poblaciones, las

Mtra. A Elsa Retureta Álvarez 24

Page 25: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

cuales en este ejercicio las desconocemos, por lo que se utilizará el valor de 0.20 como una estimación puntual de P. En el siguiente tema se abordará el tema de estimación estadística y se comprenderá el porque estamos utilizando de esa manera el dato.

También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos áreas en la distribución y al final sumarlas.

Datos:

p1 = 0.20n1 = 320 trabajadoresn2 = 320 trabajadoresP1 = P2

Mtra. A Elsa Retureta Álvarez 25

Page 26: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o más es de 0.1260.

Ejercicio 8:

Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:

a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10?

Solución:

Datos:

P1 = 3/6 = 0.5

P2 = 2/5 = 0.4

n1 = 120 objetos

n2 = 120 objetos

a. p(p2-p1 0.10) = ?

Otra manera de hacer este ejercicio es poner P1-P2:

Mtra. A Elsa Retureta Álvarez 26

Page 27: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.

Ejercicio 9:

Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:

¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en por lo menos 0.15?

a. p(p1-p2

0.15)=?

Mtra. A Elsa Retureta Álvarez 27

Page 28: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.

Ejercicio 10:

Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales mostró que la cantidad promedio que pagan a un fondo de pensión privado el 5% de su sueldo. Una muestra de 76 hombres trabajadores profesionales muestra que la cantidad que paga a un fondo de pensión privado es el 6.1% de su sueldo. Un grupo activista de mujeres desea demostrar que las mujeres no pagan tanto como los hombres en fondos de pensión privados. Si se usa alfa = 0.01 ¿Se confirma lo que el grupo activista de mujeres desea demostrar o no?

Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”.

Nótese que este problema es de una cola.

Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor

a lo que pagan los hombres (algunos autores solo le colocan igual).

La hipótesis alternativa es lo que las mujeres del grupo activista desea demostrar.

Paso 2. Determinar el nivel de significancia. Definido por el analista,en este caso se desea usar α = 0.01

Gráficamente el nivel de significancia se distribuye en la curva de

Distribución normal tal como se muestra en la figura:

Mtra. A Elsa Retureta Álvarez 28

Page 29: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Paso 3. Calcular los intervalos que implican ese nivel de significancia.

Para dicho nivel de significancia el valor de Z es: Z=-2.326

Gráficamente queda de la siguiente manera:

Mtra. A Elsa Retureta Álvarez 29

Page 30: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

EJERCICIO 11:

Llamamos p1 a la incidencia de la osteoporosis en las mujeres de más de 50 años y p2 a la de los hombres. Calculemos un intervalo de confianza para la diferencia (p1 −p2). Si 0 no forma parte de dicho intervalo con una confianza del 95% podemos decir que p1 es diferente a p2 (con tal grado de confianza, por supuesto).

La estimación puntual insesgada que podemos hacer de ambos parámetros a partir de los datos muestrales son:

Es decir, Tenemos una confianza del 95% en la afirmación de que la diferencia entre la incidencia de osteoporosis en mujeres y hombres está entre 0,02 (2 %) y 0,18 (18 %).

Obsérvese que como 0% no es un valor de dicho intervalo puede concluirse con una confianza del 95% que hay diferente incidencia de osteoporosis en hombres que en mujeres para las personas de más de 50 años. Esta conclusión es algo más pobre de lo que hemos obtenido con el intervalo de confianza, pero visto de esta manera, este ejemplo puede considerarse como una introducción a los contrastes de hipótesis.

EJERCICIO 12:

Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo.

Mtra. A Elsa Retureta Álvarez 30

Page 31: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Solución:

Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente. De aquí, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.

-0.0017<P1-P2<0.0217

Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento producirá una disminución significativa en la proporción de artículos defectuosos comparado con el método existente.

EJERCICIO 13:

Un artículo relacionado con la salud, reporta los siguientes datos sobre la incidencia de disfunciones importantes entre recién nacidos con madres fumadoras de marihuana y de madres que no la fumaban:

  Usuaria No Usuaria

Tamaño Muestral 1246 11178

Número de disfunciones

42 294

Proporción muestral 0.0337 0.0263

Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.

Mtra. A Elsa Retureta Álvarez 31

Page 32: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Solución:

Representemos P1 la proporción de nacimientos donde aparecen disfunciones entre todas las madres que fuman marihuana y definamos P2, de manera similar, para las no fumadoras. El valor de z para un 99% de confianza es de 2.58.

-0.0064<P1-P2<0.0212

Este intervalo es bastante angosto, lo cual sugiere que P1-P2 ha sido estimado de manera precisa.

Determinación de Tamaños de Muestra para Estimaciones

Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con conceptos que ya se han visto a través de este material.

Mtra. A Elsa Retureta Álvarez 32

Page 33: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

EJEMPLO 14:

Mtra. A Elsa Retureta Álvarez 33

Page 34: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

EJEMPLO 15:

En un proceso de producción de botellas de vidrio se tomó una muestra de 400 de las cuales 28 estaban defectuosas, en otro proceso se tomaran 300 muestra de botellas de la cuales 15 estaban defectuosas. Demuestre la hipótesis nula p1= p2 de que los dos procesos generan proporciones iguales de unidades defectuosas, contra la hipótesis alternativa p1 ≠ p2 con un nivel de significancia de 0.05.

Datos:

Pr oporcion . .1 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . . Proporcion . . 2n1=400. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. ..n2=300

p1=28400

=0 .07 .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . p2=15300

=0 . 05

x1=28. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .x2=15

p=28+15400+300

=43700

=0 .061 , .. . .. .q=1−p=0 .939

El . .valor . .de . .Zα /2 ..al .. 0 . 05 .. . para . .una . .hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 96

SOLUCIÓN: Para resolver este problema se plantearán las hipótesis y luego se aplica la formula.

Hipótesis:

H0 : p1=p2

H1 : p1≠p2

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si

Zc<−Zα /2 ..o . .Zc>Zα /2 ,es decir, Zc<−1 .96 . . .o . . .Zc=1 . 96

.

Aplicando formula se tiene:

Zc=p1−p2

√ pq [ 1n1

+ 1n2

]= 0 . 07−0 . 05

√(0 . 061)(0 . 939 )[ 1400

+1

300 ]= 0 .02

√0 . 003334= 0 . 02

0 .0183→Zc=1. 09

Mtra. A Elsa Retureta Álvarez 34

Page 35: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Conclusión: Como

Zc es menor que

Zα /2

, es decir,

Zc=1 . 09<1. 96

, se acepta

H0 : p1=p2

con un nivel de significancia de 0.05. Esto se puede observar en la

grafica A en donde

Zc=1 . 09

cae dentro del área de aceptación, por lo tanto, no se puede concluir que exista diferencias reales entre las dos proporciones verdaderas de unidades defectuosas.

EJEMPLO 16:

Un fabricante de productos medicinales esta probando dos nuevos compuestos destinados a reducir los niveles de presión sanguínea los compuestos son suministrados a dos conjuntos diferentes de animales de laboratorio. En el grupo A, 71 de 100 animales probados respondieron al medicamento A con niveles menores de presión arterial. En el grupo B, de 90 animales 58 respondieron al medicamento B con menores niveles de presión sanguínea. El fabricante desea probar a un nivel de significancia de 0.05 si existe una diferencia entre la eficiencia de las dos medicinas. ¿De qué manera se debe proceder en este caso?

SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla

se busca el valor de Zα /2 al 5 % para una hipótesis alternativa bilateral que

según la tabla tienen un valor de Zα /2=±1 . 96

. Se plantean las reglas de decisión y finalmente se aplica la fórmula para el caso.

Datos:

Pr oporcion . . A . .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . Pr oporcion ..Bn1=100 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. .n2=90

p1=71100

=0. 71 .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . p2=5890

=0.644

x1=71 . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. x2=58

p=71+58100+90

=129190

=0. 6789 , .. .. . .q=1−p=0 .3211

El . .valor . .de . .Zα /2 ..al .. 0 . 05 .. . para . .una . .hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 96 Hipótesis:

Mtra. A Elsa Retureta Álvarez 35

Page 36: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

H0 : p1=p2

H1 : p1≠p2

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si

Zc<−Zα /2 ..o . .Zc>Zα /2 ,es decir, Zc<−1 .96 . . .o . . .Zc=1 . 96

.

Aplicando formula se tiene:

Zc=p1−p2

√ pq [ 1n1

+ 1n2

]= 0 . 71−0 . 644

√(0 . 6789(0 . 3211) [ 1100

+1

90 ]= 0 . 066

√0 .0046= 0 . 066

0. 0678→Zc=0 . 973

Conclusión: Como

Zc es menor que

Zα /2

, es decir,

Zc=0 . 973<1 . 96

, se

acepta

H0 : p1=p2

con un nivel de significancia de 0.05. Esto se puede observar en

la grafica A en donde

Zc=0 . 973

cae dentro del área de aceptación, por lo tanto, se puede concluir que no exista diferencias significativas reales entre las dos medicamentos lo que indica que los dos medicamentos producen efecto en la presión sanguínea que son significativamente iguales.

EJEMPLO 17:

En un sondeo de opinión en el IUTJAA, 60 de 200 estudiantes del sexo masculino han expresado su disgusto sobre la forma de dirigir el tren directivo la institución, de la misma forma han opinado 75 de 300 alumnos del sexo femenino. Se quiere saber si existe una diferencia real de opinión entre los alumnos y las alumnas del IUTJAA. Para realizar el contraste de hipótesis de las proporciones utilice un nivel de significancia de 0.10.

SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla se

busca el valor de Zα /2 al 5 % para una hipótesis alternativa bilateral que según

la tabla tienen un valor de Zα /2=±1 . 96

. Se plantean las reglas de decisión y finalmente se aplica la fórmula para el caso.

Mtra. A Elsa Retureta Álvarez 36

Page 37: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Datos:

Pr oporcion . .1 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . . Proporcion . . 2n1=200 . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. .n2=300x1=60. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .x2=75

p1=60200

=0 .30 . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. p2=75300

=0 .25

p=60+75200+300

=135500

=0 . 27 , .. .. . .q=1−p=0 . 73

El . .valor . .de . .Zα /2 ..al .. 0 . 10. . . para ..una ..hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 28

Hipótesis:

H0 : p1=p2

H1 : p1≠p2

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si

Zc<−Zα /2 ..o . .Zc>Zα /2 ,es decir, Zc<−1 .96 . . .o . . .Zc=1 . 96

.

Aplicando formula se tiene:

Zc=p1−p2

√ pq [ 1n1

+ 1n2

]= 0 .30−0 . 25

√(0 . 27 )(0.73 )[ 1200

+1

300 ]= 0 . 05

√0 . 001636= 0. 05

0.04045→Zc=1 .24 .

Conclusión: Como

Zc es menor que

Zα /2

, es decir,

Zc=1 .24<1 .28

, se acepta

H0 : p1=p2

con un nivel de significancia de 0.10. Esto se puede observar en la

grafica B en donde

Zc=1 .24

cae dentro del área de aceptación, por lo tanto, se

Mtra. A Elsa Retureta Álvarez 37

Page 38: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

puede concluir que no exista diferencias significativas reales entre las dos opiniones emitidas por los alumnos y alumnas lo que indica que los dos opiniones están en concordancia de que los directivos están dirigiendo mal a la institución.

EJEMPLO 18:

En el Departamento de Agropecuaria del IUTJAA se investiga si cierto tipo de fertilizante es efectivo. Para ello se deja sin fertilizar 100 plantas de tomate y de esas, 52 plantas tienen un crecimiento satisfactorio. De la misma forma se fertilizaron 400 plantas, y se detecto que 275 presentaron un crecimiento satisfactorio. ¿Qué conclusión pueden obtener los investigadores del Departamento de Agropecuaria si para contrastar la hipótesis utilizan un nivel de significancia de 0.05?

SOLUCIÓN: Se plantean las hipótesis la cual tendría como hipótesis

alternativa H1 : p1≠p2 ; luego se ordenan los datos y en la tabla se busca el

valor de Zα /2 al 5 % para una hipótesis alternativa bilateral. Se plantean las

reglas de decisión y finalmente se aplica la formula para el caso.

Datos:

Pr oporcion . .1 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . . Proporcion . . 2n1=100 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. .n2=400x1=52 . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. x2=275

p1=52100

=0. 52 .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. p2=275400

=0 . 6875

p=52+275100+400

=327500

=0 .654 , .. .. ..q=1−p=0 . 346

El . .valor . .de . .Zα /2 ..al .. 0 . 05 .. . para . .una . .hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 96

Hipótesis:

H0 : p1=p2

H1 : p1≠p2

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si

Zc<−Zα /2 ..o . .Zc>Zα /2 , es decir, Zc<−1 .96 . . .o . . .Zc>1 . 96

.

Mtra. A Elsa Retureta Álvarez 38

Page 39: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Aplicando formula se tiene:

Zc=p1−p2

√ pq [ 1n1

+ 1n2

]= 0. 52−0 . 6875

√(0 . 654 )(0 .346 )[ 1100

+1

400 ]=− 0 . 1675

√0 . 0028=− 0. 17

0. 0533→Zc=−3 .19 .

Conclusión: Como

Zc es menor que

Zα /2

, es decir,

Zc=−3 . 19<−1 .96

, se

rechaza

H0 : p1=p2

con un nivel de significancia de 0.05. Esto se puede observar

en la grafica B en donde

Zc=−3 . 19

cae fuera del área de aceptación, por lo tanto,

H1 : p1≠p2

se puede concluir que exista diferencias significativas reales entre el crecimiento de las plantas, por lo que hay razones para creer que el fertilizante sea realmente efectivo.

Ejercicio 19:

En una muestra aleatoria de 85 soportes para el cigüeñal de un motor de automóvil, 10 tienen un terminado que es más rugoso de los que las especificaciones permiten. Supóngase que se hace una modificación al proceso de acabado de la superficie y que, de manera subsecuente, se toma una segunda muestra de 85 ejes. El número de ejes defectuosos en esta segunda muestra es de 8. Obtengase un intervalo de confianza del 95% para la diferencia en la proporción de los soportes defectuosos producidos por ambos procesos y pruebe la hipótesis de que la proporción de soportes defectuosos producidos por ambos procesos es la misma.

Solución.

Mtra. A Elsa Retureta Álvarez 39

Page 40: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

De lo observado en las muestras se obtiene que y

. El interés es la diferencia en la proporción de los

soportes defectuosos entre :

Un intervalo de confianza del 95% para la diferencia en la resistencia a la tensión promedio es:

Este intervalo de confianza incluye al cero, así que, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de la superficie hayan reducido el número de soportes defectuosos para cigüeñal producidos por el proceso.

Si se utiliza el estadístico presentado en (1), se encuentra:

Rechazandose tambien la hipótesis nula, por lo tanto se concluye que los cambios hechos en el proceso de acabado de la superficie no han reducido el número de soportes defectuosos para cigüeñal producidos por el proceso.

Ejercicio 20:

Mtra. A Elsa Retureta Álvarez 40

Page 41: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Continuando con la investigación sobre tabaquismo, desea contrastarse si fuman más las chicas que los chicos. Se toma una muestra de 20 chicas y se encuentra que fuman 12. En una muestra de 18 chicos fuman 8.

Realizar el contraste con α=0,01.

1. Hipótesis

H0: π1 ≤ π2

H1: π1 > π2

2. Supuestos

Muestra aleatoria

π1 y π2 constantes en cada extracción

3. Estadístico de contraste

n1 = 20; P1 = 12/20 = 0,60

n2 = 18; P2 = 8/18 = 0,44

Mtra. A Elsa Retureta Álvarez 41

Page 42: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

4. Zona crítica: Z ≥ 0,99z = 2,33

5. Decisión: Mantener H0. No puede concluirse que las chicas fuman más.

- BIBLIOGRAFIA -

CONTRASTE DE HIPÓTESIS DE DOS POBLACIONES

Autores: Ángel A. Juan ([email protected]), Máximo Sedano ([email protected]), Alicia Vila

([email protected]), Anna López ([email protected])

EJERCICIOS RESUELTOS DE ESTADÍSTICA IIRESUMEN DE EJERCICIOS DADOS EN CLASES – PARTE II

POR:

EILEEN JOHANA ARAGONES GENEY

UNIVERSIDAD DE CARTAGENA

PROGRAMA DE ADMINISTRACIÓN INDUSTRIAL CARTAGENA

PRIMER SEMESTRE DE 2008

Estadística Inferencial 3.6. Prueba para diferencia de proporcionesElaboró: MC. Marcel Ruiz Martínez

Mtra. A Elsa Retureta Álvarez 42

Page 43: Planteamiento de Hipótesis para dos poblaciones (WORD)

ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES

PARA LA PROPORCIÓN

Levin, Richard I. Estadística para Administradores, Ed. Prentice Hall, Segunda Edición, México 1987.

www.itescam.edu.mx/principal/sylabus/fpdb/.../r16639.DOC

Mtra. A Elsa Retureta Álvarez 43