estimacion puntual estimacion intervalica con respecto a la media poblacional diferencia de medias...

22
AÑO DE LA PROMOCION DE LA INDUSTRIA RESPONSABLE Y EL COMPROMISO CLIMATICOFacultad de Ciencias Biológicas Departamento de Matemática y Estadística Trabajo Monográfico Asignatura : Biometría Tema : Estimación Puntual, Estimación interválica, con respecto a la media poblacional, diferencia de medias poblacionales. Docente : Wilsón Ávila Zavaleta Alumna : Padilla Rimachi Roxana Gabriela Semestre académico : III- 2014 Fecha de entrega : 24/04/14 Iquitos – Perú 2014

Upload: independent

Post on 20-Feb-2023

3 views

Category:

Documents


0 download

TRANSCRIPT

“AÑO DE LA PROMOCION DE LA INDUSTRIA RESPONSABLE YEL COMPROMISO CLIMATICO”

Facultad de Ciencias Biológicas

Departamento de Matemática y Estadística

Trabajo Monográfico

Asignatura : Biometría

Tema : Estimación Puntual, Estimación interválica, con respecto a la media poblacional, diferencia de medias poblacionales.

Docente : Wilsón Ávila Zavaleta

Alumna : Padilla Rimachi RoxanaGabriela

Semestre académico : III- 2014

Fecha de entrega : 24/04/14

Iquitos – Perú

2014

INDICE

1. AGRADECIMIENTO…………………………………………pag.03

2. INTRODUCCION……………………………………………..pag.04

3. DESARROLLO DEL TEMA………………………………..pag.05 - 14

4. CASOS DE APLICACIÓN………………………………… pag.15 – 19

5. CONCLUSIONES………………………………………………pag.20

6. BIBLIOGRAFIA………………………………………………pag.21

AGRADECIMIENTO

Agradezco a usted por incentivarnos a seguir adelante connuestras metas y a mejorar cada día; también a mis padres porhaber inculcado buenos valores y así lograr ser una granprofesional.

INTRODUCCION

Puede decirse que la Estadística es la ciencia que se preocupa dela recogida de datos, su organización y análisis, así como de laspredicciones que, a partir de estos datos, pueden hacerse. Losaspectos anteriores hacen que pueda hablarse de dos tipos deEstadística: Descriptiva e Inferencial.

La Estadística Descriptiva se ocupa de tomar los datos de unconjunto dado, organizarlos en tablas o representaciones gráficasy del cálculo de unos números que nos informen de manera globaldel conjunto estudiado.

La Estadística Inferencial estudia cómo sacar conclusionesgenerales para toda la población a partir del estudio de unamuestra.

Existen dos formas de hacer Inferencia Estadística:

- La estimación de parámetros.

- Las pruebas de hipótesis.

En la Inferencia Estadística hay varios métodos, pero en cualquiercaso es necesario utilizar una muestra que represente a lapoblación, esto se consigue con las Técnicas de muestreo.

A partir de una muestra nos proponemos dos objetivos:

- Obtener valores aproximados de parámetros poblacionales:Estimación puntual.

- La estimación por intervalos de confianza tiene por objetoproporcionar, a partir de la información recogida en la muestra,un intervalo que contenga con alto nivel de confianza(probabilidad), al parámetro objeto de nuestro interés. A partirde dicho intervalo obtendremos una medida del error máximocometido al aproximar puntualmente el parámetro.

DESARROLLO DEL TEMA

ESTIMACION PUNTUAL:

Una estimación es puntual cuando se usa un solo valor extraído dela muestra para estimar el parámetro desconocido de la población.Al valor usado se le llama estimador.

La media de la población se puede estimar puntualmentemediante la media de la muestra:

La proporción de la población se puede estimar puntualmentemediante la proporción de la muestra:

La desviación típica de la población se puede estimarpuntualmente mediante la desviación típica de la muestra,aunque hay mejores estimadores:

En el caso de que investiguemos una variable cuantitativa:

a) Para la media de la población μ tomaremos comoaproximación la media de la muestra.

= b) Para la varianza de la población σ2 tomaremos la cuasivarianza de la muestra.

=

Si el estudio se centra en el estudio de un carácter cualitativoel parámetro de interés será la proporción de elementos de lapoblación que pertenecen a cierta categoría C que lo aproximaremoscon la correspondiente proporción en la muestra.

EL PROBLEMA DE LA ESTIMACIÓN: ESTIMACIÓN PUNTUAL

La estimación estadística se divide en dos grandes grupos: laestimación puntual y la estimación por intervalos. La estimaciónpuntual consiste en obtener un único número calculado a partir delas observaciones muestrales, y que es utilizado como estimacióndel valor del parámetro θ. Se le llama estimación puntual porquea ese número, que se utiliza como estimación del parámetro θ, sele puede asignar un punto sobre la recta real. En la estimaciónpor intervalos se obtienen dos puntos (un extremo inferior y unextremo superior) que definen un intervalo sobre la recta real, elcual contendrá con cierta seguridad el valor del parámetro θ.El estimador del parámetro poblacional θ es una función de lasvariables aleatorias u observaciones muestrales y se representapor =g (

) Para una realización particular de la muestra ( ) seobtiene un valor específico del estimador que recibe el nombre deestimación del parámetro poblacional θ y lo notaremos por = g (

)Vemos pues que existe diferencia entre estimador y estimación. Elestimador es un estadístico y, por tanto, una variable aleatoria yel valor de esta variable para una muestra concreta ( )será la estimación puntual. El estimador θ tendrá su distribuciónmuestral.

En la tabla expresamos diferentes parámetros poblacionales, susestimadores y sus estimaciones.

TABLA: Parámetros poblacionales, estimadores y estimaciones.

Para la elección de estos estimadores puntuales nos hemos basado,principalmente en la intuición y en la posible analogía de losparámetros poblacionales con sus correspondientes valoresmuestrales, pero éste no será el método más adecuado para laobtención de estimadores puntuales, aunque en este caso seobtienen estimadores satisfactorios para los parámetrospoblacionales. En general, el problema de obtener estimadorespuntuales no será tan sencillo, por ello tenemos que darpropiedades que serían deseables que se cumplieran por losdiferentes estimadores puntuales obtenidos, aunque no existe unmecanismo o método único que nos permita obtener el mejorestimador puntual en todas las circunstancias.Nuestro objetivo ahora será dar algunas propiedades deseables delos estimadores puntuales, con el fin de poder conocer la bondadde los mismos, pues cuantas más propiedades verifiquen losestimadores puntuales mejores serán.

PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES a) Estimador insesgado

Si tenemos un gran número de muestras de tamaño n y obtenemosel valor del estimador en cada una de ellas, sería deseable que lamedia de todas estas estimaciones coincidiera con el valor deμ .Se dice que un estimador es insesgado si su esperanzamatemática coincide con el valor del parámetro a estimar.

b) Estimador eficiente

Parámetropoblacional Estimador Estimación

Media μ̂=X̄=∑i=1

nXin

Varianza σ̂2=S2= 1n−1∑

i=1

n(Xi−X̄)2

Proporción p̂=Xn=

númeroéxitosnúmeropruebas

p̂=xn

Se dice que los estimadores son eficientes cuando generan unadistribución muestral con el mínimo error estándar, es decir,entre dos estimadores insesgado de un parámetro dado es máseficiente el de menor varianza. c) Estimador consistente Un estimador se dice consistente cuando su valor tiende hacia elverdadero valor del parámetro a medida que aumenta el tamaño de lamuestra. Es decir, la probabilidad de que la estimación sea elverdadero valor del parámetro tiende a 1.

d) Estimador suficiente

Se dice de un estimador que es suficiente cuando es capaz deextraer de los datos toda la información importante sobre elparámetro.

ESTIMACIÓN POR INTERVALOS

La estimación puntual es poco útil, pues solo obtenemos un valorcomo aproximación al que tratamos de estimar. Es mucho másinteresante obtener un intervalo dentro del cual se tiene unacierta confianza de que se encuentre el parámetro que tratamos deestimar.El objetivo que se pretende con los intervalos de confianza esobtener un intervalo de poca amplitud y con una alta probabilidadde que el parámetro θ se encuentre en su interior. Así pues,elegiremos probabilidades cercanas a la unidad, que se representanpor 1-α y cuyos valores más frecuentes suelen ser 0'90, 0'95 y0'99.Luego si deseamos obtener una estimación por intervalo delparámetro poblacional θ desconocido, tendremos que obtener dos

estadísticos y que nos darán losvalores extremos del intervalo, tales que

Al valor 1-α se le llama coeficiente de confianza, yAl valor 100(1-α) % se le llama nivel de confianza.

Intervalos para la diferencia de medias de dospoblaciones

Consideremos el caso en que tenemos dos poblaciones de modo que elcarácter que estudiamos en ambas (X1 y X2) es v.a. distribuidassegún leyes gaussianas

En cada una de estas poblaciones se extrae mediante muestreoaleatorio simple, muestras que no tienen por que sernecesariamente del mismo tamaño (respectivamente n1 y n2)

Podemos plantearnos a partir de las muestras el saber quédiferencias existen entre las medias de ambas poblaciones, o porejemplo estudiar la relación existente entre sus dispersionesrespectivas. A ello vamos a dedicar los siguientes puntos.

Intervalo para la diferencia de medias homocedáticas

Supongamos que dos poblaciones tengan varianzas idénticas

(homocedasticidad), . Es decir

Por razones análogas a las expuestas en el caso de una poblaciónuna población, se tiene que

Sea Z la v.a. definida como

Elsiguiente cociente se distribuye entonces como una de Student conn1+n2-2 grados de libertad

 

Donde se ha definido a como la cuasivarianza muestral ponderada

de y

Si es el nivel de significación con el que deseamos establecerel intervalo para la diferencia de las dos medias, calculamos el

valor que deja por encima de si de la masa deprobabilidad de Tn1+n2-2

Repitiendo un proceso que ya hemos realizado en ocasiones

anteriores, tenemos una probabilidad de de que a extraer unamuestra aleatoria simple ocurra:

Luego el intervalo de confianza al nivel para la diferencia deesperanzas de dos poblaciones con la misma varianza (aunque estasea desconocida) es:

ESTIMACIÓN DEL TAMAÑO MUESTRAL

Sabemos que si tomamos una muestra aleatoria simple de tamaño nprocedente de una población N (μ, σ), siendo σ conocida, elintervalo de confianza al nivel del 100(1-α) % para la mediapoblacional μ venía dado por:

Siendo la amplitud del intervalo

(*) Si, previamente, se fija la longitud del intervalo L y deseamosconocer el tamaño de la muestra para obtener ese intervalo alnivel de confianza del 100(1-α) %, bastará despejar n de laexpresión (*), pues L, y σ son conocidos, y tendremos queel tamaño de la muestra será:

El cual nos permitirá construir un intervalo al nivel de confianzadel 100(1-α) % y de amplitud L para la media de una poblaciónnormal con σ conocida. También podríamos hacer el siguiente razonamiento cuando σ seaconocido, si la media μ fuera el valor central del intervalo,entonces x estimaría puntualmente a μ sin error alguno,

μ

|---------------------------|----------------|---------------------------|

← Error →

Pero generalmente x no será exactamente igual a μ y entonces secomete un error, E=| -μ|, que como máximo será:

E= Entonces si queremos determinar el tamaño de muestra necesariopara obtener un intervalo de confianza para la media poblacionalμ, admitiendo un error E, tendremos que despejando de laexpresión anterior:

Igualmente se tendría para una proporción: n=4

zα/22 p̂ q̂L2 =

zα/22 p̂ q̂E2

CASOS DE APLICACIÓN

1)Como los gustos cambian con la edad y se sabe que en el barrioviven 2.500 niños, 7.000 adultos y 500 ancianos, posteriormentese decide elegir la muestra anterior utilizando un muestreoestratificado. Determinar el tamaño muestral correspondiente acada estrato.

Para efectuar un muestreo aleatorio estratificado, seránecesario que la muestra refleje fielmente los estratosexistentes en la población; deben considerarse los estratosformados por: niños, adultos y ancianos.

El tamaño muestral de cada estrato deberá ser proporcional a lapresencia del mismo en la población original:

Población total: 2500 + 7000 + 500 = 10 000.

2) Sea la población de elementos: {22,24, 26}.

Escriba todas las muestras posibles de tamaño dos, escogidas mediante muestreo aleatorio simple.

M1 = {22, 24},         M1 = {22, 26},         M1 = {24, 26}

Calcule la varianza de la población.

Calcule la varianza de las medias muestrales.

3)La variable altura de las alumnas que estudian en una escuela deidiomas sigue una distribución normal de media 1,62 m y la

desviación típica 0,12 m. ¿Cuál es la probabilidad de que la mediade una muestra aleatoria de 100 alumnas sea mayor que 1.60 m?

4)Se ha tomado una muestra de los precios de un mismo productoalimenticio en 16 comercios, elegidos al azar en un barrio de unaciudad, y se han encontrado los siguientes precios:

95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111,103, 110.

Suponiendo que los precios de este producto se distribuyen segúnuna ley normal de varianza 25 y media desconocida:

¿Cuál es la distribución de la media muestral?

Determine el intervalo de confianza, al 95%, para la mediapoblacional:

95%   →     zα/2 =1.96

(104 - 1.96 · 1. 25,  104 + 1.9 · 1.25) = (101.55; 106.45)

5)La media de las estaturas de una muestra aleatoria de 400 personasde una ciudad es 1,75 m. Se sabe que la estatura de las personas

de esa ciudad es una variable aleatoria que sigue una distribuciónnormal con varianza σ2 = 0,16 m2.

Construye un intervalo, de un 95% de confianza, para la media delas estaturas de la población.

RPTA: n=400       x =1.75        σ=0.4

1- α=0.95                    z α/2=1.96

(1.75 ± 1.96 · 0.4/20)     →   (1.7108, 1.7892)

¿Cuál sería el mínimo tamaño muestral necesario para que puedadecirse que la verdadera media de las estaturas está a menos de 2cm de la media muestral, con un nivel de confianza del 90%?

RPTA:

La muestra debe tener al menos 1083 personas.

6)Las ventas mensuales de una tienda de electrodomésticos sedistribuyen según una ley normal, con desviación típica 900 €. Enun estudio estadístico de las ventas realizadas en los últimosnueve meses, se ha encontrado un intervalo de confianza para lamedia mensual de las ventas, cuyos extremos son 4 663 € y 5 839 €.

¿Cuál ha sido la media de las ventas en estos nueve meses?

RPTA: n = 9         x = (4663 + 5839) / 2;                 x =5251

¿Cuál es el nivel de confianza para este intervalo?

RPTA: E= (5839 - 4663) / 2 = 588

588 = z α/2 · 900 / 3          z α/2 = 1.96

1-α = 0.95    →    95%

7)Se desea estimar la proporción, p, de individuos daltónicos de unapoblación a través del porcentaje observado en una muestra aleatoria de individuos, de tamaño n.

Si el porcentaje de individuos daltónicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimación sea inferior al 3,1%.

RPTA: 1- α=0.95                    z α/2=1.96

Al menos 840 individuos.

Si el tamaño de la muestra es de 64 individuos, y el porcentaje deindividuos daltónicos en la muestra es del 35%, determina, usando un nivel de significación del 1%, el correspondiente intervalo de confianza para la proporción de daltónicos de la población.

RPTA: α=0.01                    1- α=0.99                    z

α/2=2.575

8)En una población una variable aleatoria sigue una ley normal demedia desconocida y desviación típica 2.

Observada una muestra de tamaño 400, tomada al azar, se haobtenido una media muestra al igual a 50. ¿Calcule un intervalo,con el 97 % de confianza, para la media de la población.

RPTA:

Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener lamuestra para qué la amplitud del intervalo que se obtenga sea,como máximo, 1?

RPTA:

n ≥ 76

9)Una marca de nueces afirma que, como máximo, el 6% de las nuecesestán vacías. Se eligieron 300 nueces al azar y se detectaron 21vacías.

Con un nivel de significación del 1%, ¿se puede aceptar laafirmación de la marca?

RPTA: 1   Enunciamos las hipótesis nula y alternativa:

H0 : p ≤ 0.06     

H1 : p >0.06    

Zona de aceptación

α = 0.01      zα = 2.33.

Determinamos el intervalo de confianza:

Verificación.

Decisión

Aceptamos la hipótesis nula H0. Con un nivel de significación del1%

Si se mantiene el porcentaje muestral de nueces que están vacías y1-α = 0.95, ¿qué tamaño muestral se necesitaría para estimar laproporción de nueces con un error menor del 1% por ciento?

RPTA: 1 - α = 0, 9 5            z α/2 = 1, 96

10)La duración de las bombillas de 100 W que fabrica una empresasigue una distribución normal con una desviación típica de 120horas de duración. Su vida media está garantizada durante unmínimo de 800 horas. Se escoge al azar una muestra de 50bombillas de un lote y, después de comprobarlas, se obtiene unavida media de 750 horas. Con un nivel de significación de 0,01,¿habría que rechazar el lote por no cumplir la garantía?

Enunciamos las hipótesis nula y alternativa:

H0 : µ ≥ 800     

H1 : µ <800    

Zona de aceptación

α = 0.01;    zα = 2.33

Determinamos el intervalo de confianza:

Verificación.

x = 750

Decisión

Rechazamos la hipótesis nula H0. Con un nivel de significación del1%.

CONCLUSIONES

El objetivo básico de la inferencia estadística es hacerinferencias o sacar conclusiones sobre la población a partirde la información contenida en una muestra aleatoria de lapoblación.

La elección del estadístico apropiado dependerá de cuál seael parámetro poblacional que nos interese.

El valor verdadero del parámetro será desconocido y unobjetivo sería estimar su valor, por lo que tal estadísticose denomina estimador.

Ambos métodos de inferencia estadística utilizan las mismasrelaciones teóricas entre resultados muestrales y valorespoblacionales.

Cuando se utiliza la inferencia para estimar un parámetropoblacional debemos decir cómo de buena es esa inferencia, osea debemos dar una medida de su bondad.

La estimación puntual consiste en obtener un único númerocalculado a partir de las observaciones muestrales, y que esutilizado como estimación del valor del parámetro θ.

BIBLIOGRAFIA

http://es.wikipedia.org/wiki/Estimacion_estadistica.

http://www.slideshare.net/adriana0412/estimacion-puntual.

http://www.zalthen.com/estadistica-ii/72-estimacion-puntual-y-por-intervalo.