unidad 1 ingeniería de calidad

6
Unidad 1: Experimento con un solo factor. ANOVA Introducción 1.1 Conceptos Básicos de Prueba de Hipótesis Un estudio experimental o una investigación, por lo general tiene como último objetivo, responder en forma segura ciertas preguntas y/o tomar decisiones. En este contexto, el experimentador tiene a priori ciertas creencias o hipótesis que desea comprobar. Por ejemplo: Los tres proveedores del material x tienen el mismo nivel de calidad. El porcentaje de este ingrediente afecta el resultado de la mezcla. El tiempo de espera de esta operación es de tres horas, en promedio. Si aumentamos la cantidad de reactivo se elimina el problema. A continuación se describen los conceptos básicos de prueba de hipótesis, es decir, los pasos fundamentales de cualquier procedimiento de prueba de hipótesis, como son: planteamiento de la hipótesis, estadístico de prueba y criterio de rechazo. Planteamiento de una hipótesis estadística Una hipótesis estadística es una afirmación sobre los valores de los parámetros de una población o proceso, que es susceptible de probarse a partir de la información contenida en una muestra representativa que es obtenida de la población. Por ejemplo, la afirmación “este proceso produce menos de 8% de defectuosos” se puede plantear estadísticamente, en términos de la proporción p desconocida de artículos defectuosos que genera el proceso, como se hace a continuación. A la expresión H0 : p = 0.08 se le conoce como hipótesis nula y HA : p < 0.08 se le llama hipótesis alternativa. El nombre de hipótesis nula se deriva del hecho de que comúnmente se plantea como una igualdad, lo cual facilita el tener una distribución de probabilidad de referencia específica. En general, la estrategia a seguir para probar una hipótesis es suponer

Upload: andryw59

Post on 14-Dec-2015

39 views

Category:

Documents


0 download

DESCRIPTION

ingeniería de calidad

TRANSCRIPT

Page 1: Unidad 1 ingeniería de calidad

Unidad 1: Experimento con un solo factor. ANOVA

Introducción

1.1 Conceptos Básicos de Prueba de Hipótesis

Un estudio experimental o una investigación, por lo general tiene como último objetivo, responder en forma segura ciertas preguntas y/o tomar decisiones. En este contexto, el experimentador tiene a priori ciertas creencias o hipótesis que desea comprobar. Por ejemplo:

Los tres proveedores del material x tienen el mismo nivel de calidad. El porcentaje de este ingrediente afecta el resultado de la mezcla. El tiempo de espera de esta operación es de tres horas, en promedio. Si aumentamos la cantidad de reactivo se elimina el problema.

A continuación se describen los conceptos básicos de prueba de hipótesis, es decir, los pasos fundamentales de cualquier procedimiento de prueba de hipótesis, como son: planteamiento de la hipótesis, estadístico de prueba y criterio de rechazo.

Planteamiento de una hipótesis estadística

Una hipótesis estadística es una afirmación sobre los valores de los parámetros de una población o proceso, que es susceptible de probarse a partir de la información contenida en una muestra representativa que es obtenida de la población. Por ejemplo, la afirmación “este proceso produce menos de 8% de defectuosos” se puede plantear estadísticamente, en términos de la proporción p desconocida de artículos defectuosos que genera el proceso, como se hace a continuación.

A la expresión H0 : p = 0.08 se le conoce como hipótesis nula y HA : p < 0.08 se le llama hipótesis alternativa. El nombre de hipótesis nula se deriva del hecho de que comúnmente se plantea como una igualdad, lo cual facilita el tener una distribución de probabilidad de referencia específica. En general, la estrategia a seguir para probar una hipótesis es suponer que la hipótesis nula es verdadera, y que en caso de ser rechazada por la evidencia que aportan los datos, se estará aceptando la hipótesis alternativa. Así, en el caso de las proporciones, la afirmación que se desea probar se aceptará como cierta, sólo en caso de rechazar la hipótesis nula.

Supongamos ahora que la afirmación a probar es “este proceso produce 8% de defectuosos”. Observe que la afirmación señala que su falsedad se da, tanto si se observan menos de 8% de defectuosos como si se observan más de 8% de defectuosos. En este sentido, el planteamiento estadístico debe ser:

Page 2: Unidad 1 ingeniería de calidad

Ahora, lo que se desea concluir es la hipótesis nula. Nótese la diferencia entre las hipótesis alternativas en las expresiones (2.4) y (2.5). En (2.4) HA se conoce como hipótesis alternativa de un solo lado (unilateral), ya que la única manera de rechazar H0 es teniendo valores de la proporción muestral pˆ significativamente más pequeños que 0.08. Asimismo, en (2.5) HA se llama hipótesis alternativa de dos lados (bilateral), ya que la evidencia en contra de H0 se obtiene con valores pequeños o grandes de la proporción muestral pˆ. Así, la elección de la hipótesis alternativa en cuanto a si debe ser unilateral o bilateral depende de la afirmación que se quiera probar.

Otro aspecto importante es la selección del valor del parámetro que especifica la hipótesis nula, esto es, ¿por qué 0.08 en las hipótesis de las expresiones (2.4) y (2.5)? Este valor se elige de manera que separe dos situaciones que llevan a tomar diferentes acciones. Por ejemplo, en la hipótesis dada en (2.4) se eligió 0.08, porque ésta es la proporción de defectuosos reportada el mes anterior, y después de implementar un programa de mejora se quiere ver si dio el resultado esperado. En caso de no rechazar H0 se concluiría que el programa no funcionó y que se deben tomar medidas adicionales para bajar la proporción de defectuosos.

Estadístico de Prueba

Probar una hipótesis consiste en investigar si lo afirmado por la hipótesis nula es verdad o no. La estrategia de prueba parte del supuesto de que H0 es verdadera, y si los resultados de la investigación contradicen en forma suficiente dicho supuesto, entonces se rechaza H0 y se acepta la hipótesis alternativa. En caso de que los resultados de la investigación no demuestren claramente la falsedad de H0, ésta no se rechaza. Es decir, la hipótesis nula es verdadera mientras no se demuestre lo contrario.

Una vez planteada la hipótesis, se toma una muestra aleatoria de la población de estudio o se obtienen datos mediante un experimento planeado de acuerdo con la hipótesis. El estadístico de prueba es un número calculado a partir de los datos y la hipótesis nula, cuya magnitud permite discernir si se rechaza o no la hipótesis nula H0. Al conjunto de posibles valores del estadístico de prueba que llevan a rechazar H0, se le llama región o intervalo de rechazo para la prueba, y a los posibles valores donde no se rechaza H0 se les llama región o intervalo de aceptación. Por ejemplo, para las hipótesis planteadas en (2.4) y (2.5), el estadístico de prueba está dado por:

donde pˆ es la proporción de defectuosos que se encontró en una muestra de n artículos inspeccionados. Si H0 es verdad, el estadístico z0 sigue aproximadamente la distribución normal estándar; la aproximación es mejor mientras más grande es el valor de n. En general, se requiere np > 10 para una buena aproximación; en este caso, con np ≥ 120 unidades inspeccionadas sería suficiente.

Por ejemplo, supongamos que se toma una muestra de n = 150 piezas y de ellas x = 20 son defectuosas, entonces el valor de la proporción es pˆ = x/n = 0.13. Vamos a ver si esto implica una diferencia suficiente para rechazar que p = 0.08. Por lo pronto, el valor estadístico es z0 = 2.41.

Page 3: Unidad 1 ingeniería de calidad

Criterio de rechazo

El estadístico de prueba, construido bajo el supuesto de que H0 es verdad, es una variable aleatoria con distribución conocida. Si efectivamente H0 es verdad, el valor del estadístico de prueba debería caer dentro del rango de valores más probables de su distribución asociada, el cual se conoce como región de aceptación. Si cae en una de las colas de su distribución asociada, fuera del rango de valores más probables (en la región de rechazo), es evidencia en contra de que este valor pertenece a dicha distribución (véase figura 2.3). De aquí se deduce que debe estar mal el supuesto bajo el cual se construyó, es decir, H0 debe ser falsa.

Pruebas de una y dos colas (unilaterales y bilaterales). La ubicación de la región o intervalo de rechazo depende de si la hipótesis es bilateral o unilateral. Como se vio en el caso de las proporciones, una hipótesis es bilateral cuando la hipótesis alternativa (HA) es del tipo “no es igual” (π); y es unilateral cuando la alternativa es del tipo “mayor que” (>) o “menor que” (<). Cuando es bilateral, como en la expresión (2.5), la región de rechazo está repartida de manera equitativa entre ambas colas de la distribución del estadístico de prueba. Pero si la hipótesis es unilateral, como en la expresión (2.4), la evidencia en contra de la hipótesis nula se ubica en un solo lado de la distribución, esto es, la región de rechazo sólo se concentra en una de las colas. En la expresión (2.4) la región de rechazo se concentra en el lado izquierdo de la distribución del estadístico dado por (2.6) (véase figura 2.3).

Para probar la hipótesis sobre la proporción se calcula el estadístico de prueba z0 de la ecuación (2.6) y se verifica si cae en la región de rechazo o aceptación. Por ejemplo, si las hipótesis planteadas son las expresiones (2.4) se rechaza H0 si z0 < –za; si las hipótesis están dadas por las relaciones (2.5) se rechaza H0 si z0 < –za/2 o si z0 > za/2, o simplemente, si |z0| > za/2. En la figura 2.3 esto equivale a que z0 caiga en el rango de las áreas sombreadas, de acuerdo con la hipótesis de que se trate.

Si queremos probar la hipótesis bilateral con una confianza de 95%, entonces za/2 = 1.96; además, como pˆ = 0.13 y z0 = 2.41, entonces z0 > 1.96; por lo tanto, se rechaza H0 : p = 0.08. De alguna forma, esto ya se intuía, puesto que la proporción muestral había sido pˆ = 0.13.

Si en lugar de tener x = 20 defectos, se tuvieran x = 15, entonces pˆ = 0.10. Al sustituir esto en (2.6) con n = 150, se obtiene que z0 = 0.90 que no es mayor que Za/2 = 1.96. De aquí que no

Page 4: Unidad 1 ingeniería de calidad

se rechace H0 : p = 0.08. Es decir, en este caso pˆ = 0.10 no es evidencia suficiente contra H0 : p = 0.08.

El riesgo de una decisión equivocada: errores tipo I y tipo II

Probar una hipótesis estadística es una decisión probabilística, por lo que existe el riesgo de cometer un error tipo I o un error tipo II. El primero ocurre cuando se rechaza H0 cuando ésta es verdadera, y el error tipo II es cuando se acepta H0 y ésta es falsa. En toda prueba de hipótesis cada tipo de error tiene una probabilidad de ocurrir.

Con α y β se denotan las probabilidades de los errores tipo I y II, respectivamente. Así,

α = P{error tipo I} = probabilidad de rechazar H0 siendo verdaderaβ = P{error tipo II} = probabilidad de aceptar H0 siendo falsa

A 1 – β se le llama potencia de la prueba, y es la probabilidad de rechazar H0 cuando es falsa. A α también se le conoce como la significancia dada de la prueba y es la probabilidad de la región o intervalo de rechazo; su valor se especifica por parte del investigador desde que planea el estudio.

Por lo general se utilizan los valores α = 0.05 o 0.01, dependiendo del riesgo que se quiera admitir en la conclusión. Mientras más pequeño es el valor de α se requiere más evidencia en los datos para rechazar H0.

Por ejemplo, si la acción a tomar después de rechazar H0 implica una inversión fuerte de recursos, se recomienda utilizar α= 0.01 para tener mayor confianza de que la decisión será la adecuada. Si la decisión no implica una inversión fuerte, es suficiente trabajar con α = 0.05, que es el valor más utilizado para este riesgo.

Esto es, un valor más pequeño que α no necesariamente será mejor, ya que si se admite poco riesgo (α ≤ 0.01) se está truncando la posibilidad de muchos cambios que serían positivos para la empresa. Utilizar α = 0.05 significa que por cada 100 veces independientes que se aplica el procedimiento y se rechaza H0, se espera que en un promedio de 95 veces, tal decisión sea la correcta.

Por lo general, en las pruebas de hipótesis se especifica el valor de α y se diseña la prueba de tal forma que el valor de β sea pequeño. Esto es, la probabilidad del error tipo I se controla directamente, mientras que la probabilidad de error tipo II se controla de manera indirecta con el tamaño de la muestra, ya que a más datos β será menor. En otras palabras, con una muestra grande es mayor la potencia de la prueba, es decir, se incrementa la probabilidad de rechazar H0 si ésta es falsa.

En la práctica suele ser más delicado cometer el error tipo I que el error tipo II, debido a que en la mayoría de las hipótesis el rechazar H0 implica objetar algo que se acepta de manera convencional. No rechazar H0 implica, en muchos casos, seguir como hasta ahora. Por lo anterior, es común que se controle sólo el error tipo I, mientras que el error tipo II se deja libre como si su magnitud no importara.

Lo cierto es que el error tipo II también importa y la magnitud de su probabilidad debe ser pequeña (se recomienda β = 0.10). El problema es que controlar a β tiene varios problemas; por ejemplo, muchas veces se requieren grandes tamaños muestrales o se deben realizar muchas repeticiones en el experimento. Por ello, en este libro no enfatizamos el control del error tipo II,

Page 5: Unidad 1 ingeniería de calidad

pero damos las recomendaciones del número de repeticiones que deben obtenerse en cada experimento para tener un valor pequeño de β.