bernardo frontana de la cruz marco antonio gómez ramírez irene patricia valdez y alfaro junio de...

8
ESTIMACIÓN Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

Upload: ercilia-betancourt

Post on 28-Jan-2016

227 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

ESTIMACIÓN

Bernardo Frontana de la Cruz

Marco Antonio Gómez Ramírez

Irene Patricia Valdez y Alfaro

Junio de 2014

Page 2: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

El objetivo de la Estadística Inferencial es determinar con un alto nivel de confianza valores de los parámetros desconocidos de una población, utilizando los valores característicos de las muestras.

Hay dos procedimientos para hacer la inferencia sobre los parámetros: La Estimación y La Prueba de Hipótesis, aunque ambos hacen uso de la probabilidad, el primero es un proceso más directo y sencillo de entender que el segundo.

La Estimación como su nombre lo indica es un procedimiento que nos permite dar un valor aproximado de un parámetro poblacional desconocido, a partir de la información que nos proporcionan las muestras de la misma población.

Existen dos tipos de estimación: Puntual y Por intervalos. La puntual se refiere a un estadístico (una valor en la escala numérica) que sirve como una aproximación del valor exacto del parámetro poblacional desconocido.

Page 3: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

Propiedades de los estimadores, para cada parámetro θ pueden existir varios estimadores, en general se escogerá el que posea las mejores características:

Se llama estimador del parámetro desconocido θ a una función de los datos muestrales f(xi, θ). Si θ es el parámetro desconocido, el estimador se denota , entonces =h(x1, x2, x3,….. xn).

La estimación por intervalos, se refiere a un intervalo que contenga el valor del parámetro poblacional desconocido.

Iniciaremos con la estimación puntual

Un ejemplo de estimación puntual el promedio del recorrido útil de una muestra de diez neumáticos es de 40000 Km. Por otro lado una estimación por intervalos, es un intervalo que contenga el valor del parámetro [35000, 44500] Km.

Isesgamiento (centrado), se relaciona con el concepto de exactitud, es decir, el estimador es insesgado, cuando su valor esperado es igual al parámetro E = θ.

Page 4: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

En general la media de las muestras es un estimador insesgado de la media poblacional.

Por otra parte la media muestral =, aplicando las propiedades del valor esperado: E=E= = = = λ, se cumple E = λ.

Sea x1, x2, x3,….. xn una muestra aleatoria de una distribución de probabilidad de Piosson con parámetro λ. Consideremos la media muestral como un estimador de λ, por lo tanto debe satisfacer E=λ, para toda i=1, 2, 3…..n.

Eficiencia, se refiere a la precisión del estimador. Sean dos estimadores 1 y 2 del parámetro θ, se dice que 1 es más eficiente que 2 si el primero tiene menor variabilidad, es decir, la varianza de 1 es menor que la de 2, var(1) < var(2).

Page 5: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

En cambio el promedio de una muestra no es robusto, por que una medición muy grande o muy pequeña puede afectar significativamente su valor.

Robustez se refiere que la variabilidad no afecte la generación de estimadores.

Esto significa que cuando el tamaño de la muestra aumente el estimador se acerca más al valor poblacional, de acuerdo con el teorema del Límite Central, con una muestra de n>30 se puede considerar valida la estimación.

Consistencia, sea n una estimación del parámetro θ, donde n es el tamaño de la muestra, se dice que n es consistente si y sólo si para todo θ, se cumple n –θ|)=0.

La mediana es un estimador robusto, ya que se define en el 50% de los datos de una distribución.

Page 6: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

Ejemplo de Estimación por intervalos del coeficiente de correlación, .

Consideremos el intervalo de definición dado por

Tan h(zr- Tan h(zr+, donde zr=n() y

zq corresponde al nivel de confianza del intervalo.

Datos: r=0.6, n=20, nivel de confianza del 90%Cálculos: zr=n()=n()=0.6931, z0.9=1.645Tan h(0.6931-0.399) Tan h(0.6931+0.399)Tan h(0.2941) Tan h(1.0921) 0.7976

Conclusión: Con un nivel de confianza del 90% y con base en los datos de la muestra, el coeficiente de correlación de la población se encuentra en el intervalo [0.2859, 0.7976].

Intervalos de confianza del coeficiente de correlación. Determinación del tamaño de la muestra para la estimación del coeficiente de correlación ρ.

Page 7: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

Prueba de hipótesis del coeficiente de correlación ρ.

Prueba de Hipótesis (Spearman)- Facultad de Medicina, UNAM.

Examen de Medicina

Alumno

Aciertos Anatomía

Orden

AciertosEmbriología

Orden

d diferenciadel orden

d2

diferencia al cuadrado

A 65 2 74 4 -2 4

B 72 3 61 2 1 1

C 75 4 69 3 1 1

D 82 5 90 6 -1 1

E 50 1 51 1 0 0

F 95 7 79 5 2 4

G 87 6 95 7 1 1

Page 8: Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014

Hipótesis nula H0: ρ=0 Hipótesis alterna H1: ρ 0

Considerando la expresión de Spearman =1-=0.7857

Para un zona de aceptación de 95% y una zona de rechazo de 5%, P(|Z|<Zteórico)=0.95

Zteórico=Raiz(n*)= (7*0.7857)^0.5=2.0788

Como el intervalo de aceptación es de [-1.96, 1.96]

Conclusión: El valor obtenido de la muestra cae dentro de la zona de rechazo, por lo tanto se acepta la hipótesis alternativa, que nos indica la existencia de un correlación lineal entre las variables aleatorias.