estimaciÓnasesorias.cuautitlan2.unam.mx/laboratoriovirtualdeestadistica... · la estimación puede...

31
Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Estimación http://www.cuautitlan.unam.mx Establecer generalizaciones acerca de una población a partir de una muestra es el campo de estudio de la inferencia estadística. La inferencia estadística se divide en estimación y prueba de hipótesis. ¿Cuál es el campo de estudio de la estimación? Estimar un valor desconocido de la población a partir de las observaciones de una muestra es el campo de estudio de la estimación. Supón que deseas conocer el gasto semanal promedio en telefonía celular de los estudiantes de tu facultad y con este objetivo obtienes una muestra. Es fácil darse cuenta que en este ejemplo, el objetivo de obtener la muestra, es el de estimar un valor poblacional desconocido que en este caso es µ. ¿Cuál es el campo de estudio de la prueba de hipótesis? Cuando el objetivo es probar si un valor poblacional desconocido es igual o no a un valor predeterminado, estamos en el campo de estudio de la prueba de hipótesis. Supón que una compañía de celulares con el fin de venderte una franquicia, te asegura que el gasto promedio semanal de los estudiantes es de $150. En este caso, estás interesado en probar si el valor del promedio poblacional desconocido,µ, es o no es igual a $150. ESTIMACIÓN

Upload: vonhan

Post on 19-Sep-2018

236 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Establecer generalizaciones acerca de una población a partir de una muestra es el campo de estudio de la inferencia estadística. La inferencia estadística se divide en estimación y prueba de hipótesis. ¿Cuál es el campo de estudio de la estimación?

Estimar un valor desconocido de la población a partir de las observaciones de una muestra es el campo de estudio de la estimación. Supón que deseas conocer el gasto semanal promedio en telefonía celular de los estudiantes de tu facultad y con este objetivo obtienes una muestra. Es fácil darse cuenta que en este ejemplo, el objetivo de obtener la muestra, es el de estimar un valor poblacional desconocido que en este caso es µ.

¿Cuál es el campo de estudio de la prueba de hipótesis? Cuando el objetivo es probar si un valor poblacional desconocido es igual o no a un valor predeterminado, estamos en el campo de estudio de la prueba de hipótesis. Supón que una compañía de celulares con el fin de venderte una franquicia, te asegura que el gasto promedio semanal de los estudiantes es de $150. En este caso, estás interesado en probar si el valor del promedio poblacional desconocido,µ, es o no es igual a $150.

ESTIMACIÓN

Page 2: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Cómo se puede realizar la estimación de un parámetro? La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La estimación puntual consiste en seleccionar una muestra al azar de tamaño de una población y con los valores de la muestra calcular un solo número, que aceptamos como una estimación del parámetro. Por ejemplo, para conocer la proporción de estudiantes de la facultad que llegan en automóvil, seleccionamos una muestra de tamaño y por lo general aceptamos, a la proporción de estudiantes que llegan en automóvil en la muestra, como un estimador de la proporción de estudiantes de la facultad que utilizan este medio de transporte. Si π es la proporción en la población, es decir en la facultad, de estudiantes que llegan en coche y es la proporción en la muestra de estudiantes que llegan en coche, decimos que es un estimador

puntual de π.

Supón que deseas conocer lo que gastan en promedio los asistentes al cine en la dulcería, durante un mes determinado. El gasto promedio de todos los asistentes es el valor del promedio poblacional µ que es desconocido. Decides establecer un plan de muestreo a fin de obtener las cantidades gastadas en la dulcería en diferentes días del mes y en diferentes horarios. El promedio de las cantidades gastadas por las personas que

forman la muestra, x , es un es timador puntual

del gasto promedio en la población, µ.

Page 3: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Cómo se puede describir la población y la muestra? La población se puede identificar mediante descripciones numéricas, conocidas como parámetros. Así, el gasto promedio en telefonía celular en la población conformada por los estudiantes de esa facultad, µ, es un parámetro; la variabilidad de este gasto medida como desviación estándar, , es también un parámetro de la población. Sí se conocieran las cantidades gastadas por todos y cada uno de los estudiantes, se podrían determinar los valores de los parámetros de la población, que son valores fijos para ésta, en contraste con los valores de la muestra, que son valores variables. Supón que seleccionas al azar una muestra y con los valores observados calculas sus descripciones numéricas, las cuales se conocen como estimaciones de los parámetros o simplemente estimaciones. Así en esta muestra puedes, por ejemplo, calcular como estimador de µ, s como estimador de , etc. Ahora supón que seleccionas al azar diferentes muestras del mismo tamaño, por ejemplo muestras de tamaño = 20 personas y para cada una de éstas calculas el valor de su media . Es claro, que cada muestra nos dará un valor diferente de estas , luego las son variables aleatorias y sí es un estimador de µ, entonces decimos que los estimadores son variables aleatorias.

Page 4: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

En la respuesta anterior se utilizó el término estimador y estimación, ¿Cuál es la diferencia? El estimador no es un valor específico sino una variable aleatoria, depende de los valores de la muestra y la selección de la muestra es un proceso aleatorio. Una vez que la muestra ha sido elegida, se denomina estimación al valor numérico que toma el estimador sobre esa muestra. Por ejemplo, , mientras no se especifique un valor, es un estimador de

µ; es una variable aleatoria ya que su valor depende de la muestra que se seleccione. Una vez seleccionada la muestra, con los valores de ella se calcula el valor de y este valor específico es una estimación de µ. Si se desea estimar la media de la población , ¿se puede utilizar a la mediana de la muestra , como estimador? El mejor estimador puntual de la media de la población , es la media

de la muestra , no la mediana . La media muestral , es el mejor estimador porque tiene ciertas propiedades que lo hacen adecuado para realizar inferencias apropiadas. ¿Qué propiedades debe tener un buen estimador? Un buen estimador debe ser insesgado, consistente, eficiente y suficiente.

Page 5: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Qué se entiende por estimador insesgado? Con una muestra de tamaño puedes calcular un estimador puntual del parámetro poblacional. Por ejemplo, con las observaciones de una primera muestra, se puede calcular la media de la muestra que es un estimador puntual de la media de la población . Ahora bien, si obtienes una segunda muestra del mismo tamaño , y calculas la media de esta muestra , esta media casi seguramente no va ser igual a la primera . Esto se debe como se ha mencionado, a que los estimadores son variables aleatorias. Si obtuvieras muchas muestras del mismo tamaño , y para cada una de estas calcularas su media , entonces tendrías medias. Sí el promedio de estas medias es igual al parámetro poblacional que se quiere estimar, que en este caso es µ, entonces se dice que el estimador es insesgado.

Supón que el verdadero valor del parámetro está representado por el centro del tiro al blanco y que cada muestra de tamaño te proporciona una munición. El sitio a donde llegue el tiro representa el valor del estimador de una muestra en particular. Entonces el estimador que se muestra en la figura 1a), es un estimador insesgado de , porque como se puede observar el promedio de los estimadores puntuales es igual al parámetro .

Figura. 1 a)

Page 6: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Ahora observa la figura 1b). El estimador , es un estimador sesgado de R, ya que el promedio de los , no es igual a R.

En general, se dice que un estimador , es un estimador insesgado de , si el valor esperado de es igual a . Es decir

Los estimadores , y , son estimadores insesgados de µ, π y , respectivamente. ¿Se debe entender que si se utiliza un estimador insesgado, entonces se tiene una alta probabilidad de aproximarse al valor del parámetro desconocido para cualquier muestra seleccionada? Si un estimador es insesgado, lo único que sostenemos es que el promedio de los valores que toma en un número grande de muestras se aproxima al parámetro poblacional, lo cual no quiere decir que el valor calculado para una muestra específica, tenga una alta probabilidad de aproximarse al parámetro desconocido.

Figura 1 b)

Page 7: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Entonces, ¿Cómo se consigue a partir de una muestra, que el valor del estimador calculado tenga una alta probabilidad de aproximarse al valor del parámetro desconocido? El estimador insesgado que tiene la mayor probabilidad de aproximarse al verdadero valor del parámetro desconocido, será aquel que tenga la menor variabilidad alrededor del valor del parámetro. Esta propiedad, mínima varianza, se conoce como eficiencia del estimador. ¿Qué es un estimador eficiente? Un estimador es más eficiente que un estimador para estimar el parámetro A, si el primero tiene una varianza menor que el segundo. Observa la gráfica 2 a), el centro representa el parámetro A y los tiros el estimador proporcionado por cada muestra. En la figura 2 b), se representa el mismo parámetro A, pero ahora los tiros representan al estimador . El estimador es un estimador eficiente del parámetro poblacional A, porque tiene menor variabilidad y por lo tanto menor varianza que el estimador .

Figura 2 a)

Figura 2 b)

Page 8: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Supón una distribución normal con µ = mediana = 16.0. Para estimar a

µ, se puede utilizar la media de la muestra ya que es un estimador

insesgado de µ, o se puede utilizar la mediana de la muestra ya que como la distribución es simétrica, también es un estimador insesgado de µ. ¿Cuál de las dos, o , debemos utilizar como

estimador de µ? La respuesta es utilizar el estimador que tenga menor varianza. En la figura 3, se muestra la gráfica de la distribución muestral de y de construidas con un número grande de muestras de tamaño = 20, extraídas de una población distribuida normalmente con = 16. Como se puede observar tanto la media como la mediana son estimadores insesgados de , ya que la media de sus distribuciones

muestrales son iguales a ; sin embargo la distribución muestral de tiene menor variabilidad que la distribución muestral de .

Figura 3

Page 9: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Se muestra una banda roja que representa una distancia de ± una desviación estándar, a partir de la media de cada distribución; observa que es más ancha la banda en la distribución muestral de , lo que significa que tiene mayor variabilidad. ¿Cómo se puede saber si no hay otro estimador de µ que tenga menor varianza que La desigualdad de Cramer-Rao establece que la varianza de un

estimador de la media no puede ser menor que y como sabemos que

la varianza de la distribución muestral de es igual a se concluye

que es el estimador de mínima varianza de . ¿Qué es un estimador consistente? Se dice que un estimador es consistente cuando se acerca al valor del parámetro a medida que aumenta el tamaño de la muestra. Se tiene una población de 1000 estudiantes y el promedio de calificaciones es µ= 8.0. Supón que se toma una muestra de tamaño n = 25 y la media de esta muestra es, x = 7.5. Resulta claro que si aumentas el tamaño de la muestra, por ejemplo, a n = 999 estudiantes, x se acercará más a 8.0. Entonces se dice que xes un estimador consistente de µ.

Page 10: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Ahora supón que la mediana de la población, = 7.8, cuando el tamaño de la muestra aumente hasta 999, el valor de la mediana de esta muestra tan grande se aproximará a 7.8, es decir a la mediana de la población y no a 8.0 que es el valor de la media. Lo que quiere decir que la mediana muestral, es un estimador consistente de la mediana poblacional, pero no es un estimador consistente de la

media poblacional µ.

Mediante una gráfica, ¿se puede observar la propiedad de consistencia? Si. La distribución muestral de un estimador consistente, conforme aumenta el tamaño de la muestra mostrará mayor acumulación alrededor del valor del parámetro. En la figura 4, observamos que la distribución muestral de la media construida con muestras de tamaño 5, muestra menor acumulación alrededor del valor de la media, en comparación a la distribución muestral de la media construida con muestras de tamaño , es decir, a medida que el tamaño de la muestra aumenta, las medias de las muestras se acumulan alrededor del valor de .

Figura 4

Page 11: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Con relación a las propiedades de insesgamiento y consistencia, ¿se puede decir que la mediana de la muestra , es un estimador de la media de la población , con el mismo desempeño que la media muestral, ?

La media y la mediana muestrales, tendrán el mismo desempeño en cuanto a estas dos propiedades siempre y cuando la distribución sea simétrica. Para una población asimétrica, cuando el tamaño de la muestra es muy grande, la media de la muestra se aproxima al valor

de µ y la mediana de la muestra se aproxima a la mediana de la

población La mediana no es un estimador consistente de µ en poblaciones sesgadas.

¿Qué es un estimador suficiente?

Un estimador es suficiente si utiliza tanta información de la muestra como sea posible para estimar al parámetro, de tal modo que ningún otro estimador calculado a partir de la muestra pueda proporcionar mayor información. Si se tiene un estimador suficiente, se trasmite toda la información que la muestra contiene en el cálculo de la estimación. ¿Cómo se puede evaluar la bondad de un estimador puntual? La bondad de un estimador puntual se puede evaluar mediante su lejanía con respecto al parámetro a estimar, es decir, es la distancia entre el estimador y el parámetro. A esta distancia se le conoce como error de estimación o error de muestreo.

Como se puede observar este error es también una variable aleatoria, ya que diferentes muestras del mismo tamaño, producirán distintos valores del error de estimación.

Page 12: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Para una estimación particular, ¿se puede determinar la magnitud del error de estimación? No. Como el valor del parámetro es desconocido no se puede determinar que tan cerca o lejos está la estimación de éste.

Por ejemplo, obtienes una muestra de 20 amas de casa con el fin de estimar la proporción de ellas que en una determinada ciudad, prefieren el detergente LimpiaMas. Obtienes un valor de la proporción muestral = 0.75, pero como el valor

de la proporción poblacional π es desconocido, de hecho es el parámetro que se quiere estimar, no se puede saber que tan cerca está 0.75 de él.

Aunque no se puede determinar el valor del error de estimación, sí se pueden hacer afirmaciones probabilísticas con respecto a él. ¿Qué tipo de afirmaciones probabilísticas se pueden hacer con respecto al error de estimación? Se pueden determinar las relaciones entre el error, la probabilidad o riesgo de exceder un determinado error y el tamaño de la muestra utilizada. Supón que es un estimador insesgado de y que tiene una distribución muestral normal, como la que se muestra en la figura 5. Sí se seleccionan dos puntos, y , la probabilidad de que el error de estimación sea menor que , corresponde al área sombreada de la figura. No se puede saber si una estimación específica produce un error menor que , pero mediante el área sombreada se puede evaluar si la probabilidad de que eso suceda es alta o baja.

Page 13: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Entonces la ( )P e a< es una medida de la bondad de una estimación en

particular. Sí la probabilidad es alta y desde un punto de vista práctico es pequeño, entonces la estimación es buena. Veamos el siguiente ejemplo para aclarar aún más lo anterior. Supón que deseas estimar el salario inicial de los auxiliares de contabilidad con una muestra de 36 personas, conoces que estos salarios tienen una desviación estándar σ = $300 y que para fines prácticos $100 es un error pequeño, entonces el cálculo de la probabilidad ( )100P e < , será una medida de la bondad de

una estimación en particular calculada a partir de una muestra de ese tamaño. Como la distribución de muestreo de , es normal tenemos

300 5036x n

σσ = = =

x x

x ez µσ σ−

= =

100 250

z = =

Observa que no conoces el valor de µ , pero la distancia

Figura 5

Page 14: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

El área sombreada es igual a 0.9544 y por lo tanto, la probabilidad de que el error de estimación supere los $100 es de 0.0456, cuando se selecciona una muestra de tamaño = 36. Esto se interpreta de la siguiente manera: hay aproximadamente 5 muestras de cada 100 que producen una estimación de que se aleja $100 o más del verdadero valor del parámetro, lo que implica que aproximadamente 95 de cada 100 muestras de este tamaño, seleccionadas al azar producen “buenas” estimaciones de , ya que se alejan del parámetro sea cual sea su valor, $100 o menos. ¿Cómo cambia el riesgo o probabilidad de exceder un determinado error de estimación, sí se cambia el tamaño de la muestra? Para un error de estimación dado, al aumentar el tamaño de la muestra el riesgo de exceder ese error disminuye. En el ejemplo anterior, el tamaño de la muestra fue de = 36, el error

y la probabilidad de cometer un error de $100 o más fue de 0.0456. Si aumentamos el tamaño de la muestra hasta = 60, el error estándar ahora es igual a:

El valor de z, ahora será:

El área correspondiente a la zona sombreada de la figura 6, es

Page 15: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Es decir, la probabilidad de que se cometa un error de estimación de $100 o más, es aproximadamente = 0.01, cuando se selecciona al azar una muestra de tamaño = 60. Es decir, una de cada 100 muestras produce estimaciones que se alejan del promedio desconocido de la población $ 100 o más en cualquier dirección. Observa que cuando el tamaño de la muestra aumentó de = 36 a = 60, la probabilidad de cometer el error de estimación disminuyó de 0.05 a 0.01. ¿Puedo calcular el tamaño de la muestra con el fin de mantener un error de estimación dado con un riesgo determinado? Si. Supón que deseas encontrar el tamaño de la muestra que mantenga el error de estimación sin excederse de $100, con una probabilidad o riesgo de cometerlo de 0.10. En la figura 7, se representa lo anterior.

Figura 6

Page 16: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

En la tabla de la distribución normal, encontramos que el valor de z que le corresponde a un área de 0.45 es igual a 1.64, entonces:

x x

x ez µσ σ−

= =

Es decir, se necesita una muestra de tamaño = 25, para mantener un error de estimación de $100 o menos, con un riesgo de sobrepasar los $100 del 10%.

Figura 7

Page 17: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

En general, se aplica la siguiente fórmula para calcular el tamaño de la muestra, cuando se fija el error de estimación y la probabilidad de mantenerlo

¿Cómo puedo aplicar la fórmula para calcular el tamaño de la muestra, si no conozco la varianza de la población ? Esta pregunta es clásica, porque quieres realizar un muestreo para conocer a la población y el cálculo del tamaño de muestra necesita un valor de la población, su varianza . Parece una pescadilla que se muerde la cola o un círculo vicioso. No es lo que parece, tenemos varias alternativas: Mu es desconocida, pero σ puede ser conocida por estudios anteriores. Esto se fundamenta, en la suposición de que los promedios pueden cambiar, si se modifican algunas condiciones, pero la variabilidad entre los elementos permanece inalterada. Sí se conoce que la distribución es normal, la amplitud o rango es aproximadamente igual a 6σ, por lo que un valor aproximado de σ será:

Se puede estimar el valor de σ, mediante un muestreo piloto que se realiza con el único fin de estimar la variabilidad

Page 18: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Se puede calcular el tamaño de la muestra con el fin de mantener un error de estimación dado, si lo que se desea estimar es la proporción poblacional? La proporción poblacional π, es desconocida; es justamente el parámetro que se desea estimar. El error estándar de la distribución muestral de viene dado por:

y como

Despejando , tenemos:

El problema que se presenta para calcular el tamaño de la muestra , a partir de esta expresión es que no conocemos el valor de π. Sí encontramos el valor de máximo, podemos estar seguros que el valor calculado será suficientemente grande para asegurar que el error de estimación dado se cometa con el riesgo especificado. Para encontrar el valor de máximo, realicemos los siguientes pasos.

Page 19: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

completando cuadrados en el segundo miembro, tenemos que restar ¼ y entonces también sumamos ¼ :

( ) 21 114 4

π π π π − = + − − +

entonces tenemos:

( ) 21 114 2

π π π − = + − −

Entonces, ( )1π π− es máximo, cuando el segundo término, ( )21 2 π− es

igual a cero, es decir ( )1 1 4π π− =

Entonces para calcular el tamaño de la muestra , para proporciones utilizamos la siguiente expresión:

( )2

2

1 4zn

e=

Por ejemplo, en el caso del estudio de preferencia de las amas de casa en relación a los detergentes, supón que se desea obtener un tamaño de la muestra que mantenga el error dentro del 5% con una probabilidad o riesgo de que se exceda este error de 0.05 Entonces la probabilidad o el riesgo de 0.05, nos indica que la probabilidad en cada cola debe ser 0.025 por lo que el área entre 0 y z es de 0.4750. Al valor de 0.4750 le corresponde un valor de z en la tabla normal de 1.96. Aplicando la fórmula para calcular el tamaño de la muestra, tenemos:

( ) ( )( )

22

2

11.96 4 3840.05

n = =

Page 20: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Cuáles son los estimadores puntuales insesgados más utilizados? A continuación se resumen en la Tabla 1, los estimadores más utilizados

Tabla 1. Estimadores más utilizados

Figura 8

Page 21: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Qué es un intervalo de confianza? Es una regla que nos dice como utilizar los datos de la muestra para calcular dos números que son los extremos del intervalo. Estos extremos reciben el nombre de límites de confianza. ¿Qué propiedades deseables debe tener un intervalo de confianza? Un intervalo de confianza debe de contener el valor del parámetro y debe tener una amplitud moderada que lo haga útil. ¿Puede variar el intervalo de confianza de muestra a muestra? Sí, ya que se calculan con los datos de la muestra por lo que los límites de confianza y la amplitud del intervalo son variables aleatorias. ¿A que se conoce como coeficiente de confianza? Se llama coeficiente de confianza a la probabilidad de que un intervalo de confianza incluya al parámetro.

¿Cómo se puede estimar a la media de la población µ, mediante un intervalo de confianza? Supongamos que seleccionamos una muestra al azar de una población con media µ y varianza . De acuerdo al teorema del límite central sabemos que la distribución muestral de , es aproximadamente normal

con una media igual a µ y un error estándar . En la tabla de la

distribución normal podemos encontrar el valor de que le corresponde a un área en las colas.

Page 22: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Entonces:

2 2 1x

xP z zα αµ α

σ −− ≤ ≤ = −

de donde:

( ) ( )2 2 1x xP x z x zα ασ µ σ α − ≤ ≤ + = −

Esta es una probabilidad porque es una variable aleatoria que depende de las observaciones o datos de la muestra.

Por ejemplo, supón que deseas estimar el tiempo promedio de uso de internet al día, que los empleados de una empresa determinada dedican con fines de ocio. Con este fin se toma una muestra aleatoria de 40 empleados encontrándose una media de 2.8 horas. Se conoce que la desviación estándar del tiempo dedicado al ocio en internet es de 1.0 hora. Un intervalo de confianza al 95% generado por esta muestra, se calcula de la siguiente manera:

Page 23: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Aseguramos con un 95% de confianza que el tiempo promedio de uso de internet que dedican los empleados de esta empresa al día con fines de ocio, se encuentra entre 2.49 y 3.11 horas. Esto se interpreta como sigue: Sí se seleccionan 100 muestras de tamaño = 40, se generarán 100 intervalos de confianza, esperamos que 95 de estos intervalos incluirán al valor µ desconocido; el intervalo que se calculó es uno de estos 100 intervalos. ¿Por qué en la estimación por intervalo de confianza se utiliza el término coeficiente o nivel de confianza y no el de probabilidad? En el ejemplo anterior, antes de seleccionar una muestra determinada, el estimador es una variable aleatoria y por lo tanto el intervalo de confianza también es una variable aleatoria y entonces es correcto decir que la probabilidad de que el intervalo incluya a µ es 1 – . Una vez que se ha seleccionado una muestra, el estimador es un valor determinado, es decir, es una estimación y por lo tanto el intervalo queda fijo, entonces la probabilidad de que µ se encuentre en el intervalo es 0 si no está incluido y 1 si sí lo está, situación que se desconoce, pero lo que no es correcto es afirmar que se tiene un 95% de probabilidad de que el verdadero valor está incluido entre estos dos números. El coeficiente de confianza representa la proporción de veces, que en un muestreo repetido, los intervalos calculados contienen al parámetro µ. Si se construyen intervalos con coeficientes de confianza altos, se tendrá la suficiente seguridad o confianza de que cualquier intervalo generado o construido con los resultados de una sola muestra, incluirá a µ. Para aclarar lo anterior, supón una población de tamaño N=4:

Page 24: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

La población que en este caso hipotético es conocida, tiene los siguientes parámetros:

Selecciona todas las muestras posibles de tamaño =2, con reemplazo y calculael intervalo de confianza al 90% generado por cada una de estas muestras:

Tabla 2. Intervalos de confianza al 90% para todas las muestras de tamaño 2

Page 25: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Como se puede ver en la tabla 2, el intervalo generado por la primera y por la última muestra no incluyen al valor de , pero los otros 14 intervalos si lo incluyen; es decir, aproximadamente el 90% de los intervalos calculados sí incluyen al valor de ¿Se pueden construir intervalos de confianza para otros parámetros de la población? Si. La forma general del intervalo de confianza será:

En la tabla 3, se muestra la expresión de los intervalos de confianza para su correspondiente estimador puntual ¿Se puede construir un intervalo de confianza para los parámetros indicados en la Tabla 3, si no se conoce el error estándar del estimador? Sí. Se pueden construir los intervalos de confianza con los estimadores de los errores estándar. Es decir, si no se conoce el error estándar

podemos utilizar su estimador . Utilizar este estimador puede implicar el uso de una distribución diferente a la normal. Si utilizamos un estimador del error estándar de la media, ¿Cuál es la distribución muestral de la media? Por el teorema del límite central sabemos que la distribución muestral de la media, es aproximadamente normal con media y error estándar

. Si utilizamos una estimación del error estándar , la distribución muestral de la media, tendrá una distribución de student

Page 26: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Tabl

a 3.

Inte

rval

os d

e co

nfia

nza

para

su

corr

espo

ndie

nte

estim

ador

pun

tual

Page 27: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Cuáles serán las características de una distribución de student?

• Es una distribución en forma de campana

• El área bajo la curva es igual a uno.

• Es simétrica con respecto a cero.

• Es asintótica con respecto al eje de las , es decir, se extiende de

a

• Es una distribución más aplastada que la distribución normal; es decir, el área en las colas es mayor para la distribución t que para la normal.

• Cuando el tamaño de la muestra es suficientemente grande se aproxima a una distribución normal.

• Para obtener las áreas o probabilidades con la tabla de se

necesitan los grados de libertad,

Figura 9

Page 28: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Cuándo podemos decir que la muestra es suficientemente grande? Para muestras de tamaño , se puede decir para fines prácticos, que la distribución se aproxima bien a una normal.

Entonces ¿sí tengo una muestra grande puedo utilizar la distribución normal, en lugar de la t, aunque no conozca el error estándar ? Estrictamente si no se conoce y lo estimamos con s, la distribución que se debe de utilizar es la t de student. Sin embargo, antes de que se contara con software estadístico, las tablas que se utilizaban no eran muy extensas y para fines prácticos el valor de a partir de . Hoy en día, con el uso del software no es necesario hacer esta aproximación. ¿Qué se entiende por grados de libertad? En general, se puede decir que los grados de libertad es el número de elementos que se pueden elegir libremente; o el número de variables que se pueden cambiar libremente; o el número de variables independientes. Por ejemplo, la varianza muestral S se calcula con n

Figura 10

Page 29: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

datos, pero dada la media quedan datos independientes; por lo tanto sus grados de libertad son igual a . Por ejemplo, si el parámetro objetivo es µ y no se conoce ¿cómo se puede construir un intervalo de confianza?

Utilizando el estimador del error estándar y usando la

distribución de student, la expresión del intervalo de confianza viene dada por:

En la tabla 4, se muestra la expresión de los intervalos de confianza a partir de los estimadores del error estándar

Figura 11

Page 30: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

Tabl

a 4.

Inte

rval

os d

e co

nfia

nza

a pa

rtir

de

los

estim

ador

es d

el e

rror

est

ánda

r

Page 31: ESTIMACIÓNasesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · La estimación puede ser puntual o por intervalo de confianza. ¿Qué es la estimación puntual? La

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Estimación http://www.cuautitlan.unam.mx

¿Por qué en el caso de los intervalos de confianza para proporciones se utiliza la distribución normal y no la , a pesar de que se utiliza un estimador del error estándar? Las proporciones siguen una distribución binomial y cuando es muy grande se aproximan a una distribución normal; luego estos intervalos de confianza se pueden construir sólo cuando es suficientemente grande, lo que justifica siempre el uso de la distribución normal. Una distribución binomial se aproxima bien mediante una normal, si y

Figura 11