50838728 muestreo con y sin reemplazo esta

Upload: rodriguez-isabel

Post on 29-Oct-2015

30 views

Category:

Documents


0 download

TRANSCRIPT

  • MUESTREO SIN REEMPLAZO

    Considere una poblacin de N elementos x1, x2, , xN a partir de la cual se seleccionan muestras de tamao n. Cul es la media de las medias de las muestras, en trminos de la media de la poblacin; esto es, cmo se puede expresar x en trminos de x? Considere primero, el nmero de muestras de tamao n que se forman a partir de la poblacin de N elementos.

    Para una poblacin de N elementos x1, x2, , xN a partir de la cual se escogen muestras de tamao n, la media de las medias de todas las muestras posibles de tamao n es igual a la media de la poblacin original. Esto es, x = x.

    Para la poblacin de N elementos . . . , a partir de la cual se seleccionan muestras de tamao n, la relacin entre la desviacin estndar x , de las medias de todas las muestras posibles de tamao n y la desviacin estndar, x, de la poblacin original es

    x = x

    1. Supongamos que la probabilidad de tener una unidad defectuosa en una lnea deensamblaje es de 0.05. Si el conjunto de unidades terminadas constituye un conjunto deensayos independientes:1. cul es la probabilidad de que entre diez unidades dos se encuentren defectuosas?2. y de que a lo sumo dos se encuentren defectuosas?3. cual es la probabilidad de que por lo menos una se encuentre defectuosa?SOLUCIN:Sea i una variable aleatoria que representa el estado de una unidad terminada en la lnea deensamblaje en el momento i, siendo i= 1 si la unidad es defectuosa y =0 en caso contrario.La variable sigue una distribucin Bernoulli con parmetro p=005, de acuerdo con el datoinicial del problema. Adems, ntese que un conjunto de unidades terminadas constituye unconjunto de ensayos independientes, por lo que el nmero de unidades defectuosas de un totalde n unidades terminadas ( 1. n), esto es, inin p ==1, , sigue una distribucin

  • binomial de parmetros n y p=0,05. Hechas estas consideraciones iniciales, procedemos aresolver el problema:1. Procedamos a calcular:* * 0,0476210( 2) 0'05 (1 0,05)2 810,0'05 = P = = 2. Se tiene que:* * 0,998410( 2) 0'05 (1 0,05)1010,0'05 = = i iiP 3. Por ltimo:* * 1 0,5987 0,4013010( 1) 1 ( 0) 1 0,05 (1 0,05) 0 10 010,0'005 10,0'05 = = = = = P P 2. El gerente de un restaurante que slo da servicio mediante reservas sabe, porexperiencia, que el 20% de las personas que reservan una mesa no asistirn. Si elrestaurante acepta 25 reservas pero slo dispone de 20 mesas, cul es la probabilidad deque a todas las personas que asistan al restaurante se les asigne una mesa?SOLUCIN:Representemos por la variable aleatoria la decisin de asistir ( = 0) o no ( = 1)finalmente al restaurante por parte de una persona que ha hecho una reserva. Esta variable sigue

  • una distribucin de Bernoulli de parmetro p = 0,2, de acuerdo con el enunciado del ejercicio.Suponiendo que las distintas reservas son independientes entre s, se tiene que, de un total de nreservas ( 1. n), el nmero de ellas que acuden finalmente al restaurante es una variablealeatoria Yn ==ni 1 1, con distribucin binomial de parmetros n y p=0,2. En el caso particulardel problema, n=25. Entonces, para aquellas personas que asistan al restaurante de las 25 quehan hecho la reserva puedan disponer de una mesa, debe ocurrir que acudan 20 o menos. As setiene que:*0,2 *(1 0,2) 0,579925( 20) 25200= = = i ii iP Y

    MUESTREO CON REEMPLAZO

    En muchos problemas de muestreo, el proceso tiene lugar como si una unidad fuera reemplazada una vez que se ha sacado. Por ejemplo, si un dado se tira, hay 6 resultados posibles (digamos 1, 2, 3, 4, 5 y 6). Si el dado se tira por segunda vez, hay tambin 6 resultados posibles. No se podra pensar en que si el resultado fue 1 la primera vez, es menos probable que aparezca la segunda. El mismo resultado se puede obtener si se sacaran bolas marcadas con los nmeros del 1 al 6 de una bolsa y se reemplazaran antes de sacar otra. Supongamos que se desea hacer varias mediciones de la longitud de un tablero para tomar el promedio de ellas como una mejor estimacin de la medida. Despus que se obtuviera una medicin 1.80 m, se podra pensar que esto reduce la probabilidad de obtener 1.80 m en el segundo intento?

    As, un muestreo de mediciones es una clase de muestreo con reemplazo. De estos ejemplos se puede ver que esta clase de muestreo se puede considerar cuando se trata de poblaciones indefinidamente grandes.

  • En el teorema 6-1 hemos demostrado que en el caso de muestras sin reemplazo, la media de las medias de todas las muestras posibles es igual a la media de la poblacin original. Un resultado semejante se cumple para la muestras con reemplazo. Consideremos una poblacin de N elementos x1, x2,, xN a partir de la cual se seleccionan muestras de tamao n, con la condicin de que despus de que cada elemento de la muestra se escoja, el elemento se reintegre a la poblacin. De esta manera hay N posibilidades de escoger el primer elemento de la muestra, N para el segundo, y as sucesivamente, hasta que los n elementos se hayan seleccionado. Por tanto, cuando el remplazo es permitido, se pueden formar muestras diferentes de tamao n a partir de una poblacin de tamao N.

    Ahora, vamos a deducir la relacin entre la media de la poblacin original, x, y la media de las medias de las muestras, x. Por definicin,

    En las diferentes muestras, cada elemento de la poblacin original aparece n veces.

    Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la proporcin correspondiente, que es 0.95. Lo que se buscara en seguida es el valor Z para la variable aleatoria z tal que el rea simtrica bajo la curva normal desde -Z hasta Z sea igual a 0.95, es decir, P(-Z

  • Primero habr que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir, buscar un valor de Z tal que P(-Z
  • Solo faltara muestrear 203 frascos, pues los datos de los 35 frascos del premuestreo siguen siendo vlidos.

    2. Una cantidad, con frecuencia, de inters para una clnica es el porcentaje de pacientes retrasados para su vacunacin. Algunas clnicas examinan cada registro para determinar el porcentaje; Sin embargo, en una clnica grande, la realizacin de un censo de los registros puede llevar mucho tiempo. Cullen (1994) realizo una muestra de los 580 nios a los que da servicio una clnica familiar, en Auckland para estimar la proporcin de inters.

    Que tamao de muestra seria necesario con una muestra aleatoria simple (sin reemplazo) para estimar la proporcin con el 95% de confianza y un margen de error de 0.10 .

    DATOS:

    N = 580 Nios

    En realidad, Cullen realizo una muestra aleatoria simple con reemplazo de tamao 120, de los cuales 27 resultaron como no retrasados para la vacuna. De un intervalo de confianza al 95% para la proporcin de nios no retrasados.

    Solucin:

    3. En un estudio, se desea determinar en que proporcin los nios de una regin toman incaparina en el desayuno. Si se sabe que existen 1,500 nios y deseamos tener una precisin del 10 porciento, con un nivel de significancia del 5%. De que tamao debe de ser la muestra?

    DATOS:

  • N = 1500 ; d = 10 % = 0.1 ; a = 5 %

    p = 0.5 y q = 0.5 (asumiendo varianza mxima).

    Za/2= 1.96

    Za/2 pq 1500 (1.96)(0.5)(0.5)

    n = ----------------- = ------------------------------- = 91

    d + Za/2 pq 1500(0.1) + (1.96)(0.5)(0.5)

    Se deben de muestrear 91 nios.

    DISTRIBUCION MUESTRAL DE MEDIA

    En estadstica, numerosos problemas estn relacionados con la estimacin de la media o la desviacin estndar de una poblacin dada, apartir del estudio de una muestra de tamao n. Por ejemplo, si a una empresa le puede interesar el nmero promedio de piezas defectuosas producidas por una cierta mquina; a un ingeniero especialista en cohetes le puede interesar la variabilidad en el funcionamiento de un tipo dado de proyectil.

    En las secciones anteriores se vio que si se supone que cada muestra de tamao n tiene la misma probabilidad de ser seleccionada, entonces la media de la distribucin de las medias de la muestra es la misma que la de la poblacin original, x = x. An ms, para poblaciones suficientemente grandes, o para muestreo con reemplazo, la desviacin estndar de la distribucin de las medias de la muestra, x, est relacionada con la desviacin

    estndar de la poblacin x, por la ecuacin x = .

    Si en una aplicacin particular fuera practico seleccionar todas las posibles muestras de tamao n, para determinar la media de cada una de ellas y, despus, calcular la media y la desviacin estndar de la distribucin de las medias de las muestras, las frmulas anteriores permitiran calcular x y x directamente. Por lo general, este procedimiento no es prctico. Lo que comnmente se hace es no estudiar todas las muestras de tamao n, sino nicamente una de ellas. La media, x, y la desviacin estndar, s, de esa muestra nicamente se toman como estimaciones de x y x, la media y la

  • desviacin estndar que corresponden a la poblacin original. Puesto que x =

    x y x = las estimaciones para x y x son x y respectivamente. En seguida se ilustra el procedimiento de estimacin con un ejemplo. Se escoge una muestra aleatoria de 36 nios de una guardera infantil. Las alturas (en cm) de los nios que constituyen la muestra son:

    63 64 64 65 65 6666 66 67 67 67 6767 68 68 68 69 6969 69 69 70 70 7071 72 72 72 72 7373 74 74 76 76 77

    La media de la muestra x es 69, (al cm ms prximo), y la desviacin estndar s, es 3.5. Utilizando x y s como estimaciones de x y x, podemos afirmar que la altura media de todos los nios de esa guardera es alrededor de 69 cm. An ms, podemos decir que la desviacin estndar de las alturas respecto a la media es, aproximadamente, 3.5 cm.

    1La media y los que de los pesos de 500 estudiantes de un colegio es 70 kg y la desviacin t p ica 3 kg.

    Suponiendo que los pesos se distr ibuyen normalmente,

    hal lar cuntos estudiantes pesan:

    1. Entre 60 kg y 65 kg.

    2. Ms de 90 kg.

    3. Menos de 64 kg.

    4. 64 kg.

    5. 64 kg o menos.

    La media y los que de los pesos de 500 estudiantes de

    un colegio es 70 kg y la desviacin t p ica 3 kg. Suponiendo

  • que los pesos se distr ibuyen normalmente, hal lar cuntos

    estudiantes pesan:

    1. Entre 60 kg y 65 kg.

    2.Ms de 90 kg.

    3.Menos de 64 kg.

    4.64 kg.

    5.64 kg o menos.

  • 2En una ciudad se est ima que la temperatura mxima en el mes

    de junio si una distr ibucin normal , con media 23 y desviacin

    t p ica 5. Calcular e l nmero de das del mes en los que se

    espera alcanzar mximas entre 21 y 27.

    En una ciudad se est ima que la temperatura mxima

    en el mes de junio si una distr ibucin normal , con media

    23 y desviacin t p ica 5. Calcular el nmero de das del

    mes en los que se espera alcanzar mximas entre 21 y

    27.

    TEOREMA DEL LIMITE CENTRAL

    La aproximacin anterior representa slo un caso especial de un resultado general. A fin de verificar esto, recordemos que la variable aleatoria X distribuida binomialmente se puede representar como la suma de las siguientes variables aleatorias independientes:

    Xi = 1 si el xito ocurre en la i-sima repeticin;

    = 0 si la falla ocurre en la i-sima repeticin.

  • Luego X = X1 + X2 + + Xn. Para esta variable aleatoria hemos demostrado que E(X) = np, V(X) = np(1 - p) y, adems. Que para un n grande, (X np)/

    tiene la distribucin aproximada N(0,1).

    Si una variable aleatoria X puede representarse como una suma de n variables aleatorias independientes cualesquiera (satisfaciendo ciertas condiciones que son validas en la mayor parte de las aplicaciones), entonces esta suma para un n suficientemente grande est distribuida aproximadamente normal. Este resultado notable se conoce como el teorema del lmite central.

    Sea X1, X2, . . . , Xn . . . una sucesin de variables aleatorias independientes con E(Xi) = i, y V(Xi) = , i = 1, 2, . . . Sea X = Xi + X2 + . . . + Xn. Luego bajo ciertas condiciones generales (que no se indicarn explcitamente aqu),

    Zn =

    Tiene aproximadamente la distribucin N (0, 1). Es decir, si es la fda dela variable aleatoria Zn tenemos limn Gn (z) = (z). Este teorema representa una generalizacin obvia de la aproximacin de DeMoivre-Laplace. Las variables aleatorias independientes Xi que toman slo los valores 1 y 0 han sido sustituidas por variables aleatorias que poseen cualquier clase de distribucin (mientras tengan esperanzas y varianzas finitas). El hecho de que las Xi pueden tener (evidentemente) cualquier clase de distribucin y an as la suma X = X1 + . . . + Xn puede ser aproximada por una variable aleatoria distribuida normalmente, representa la razn bsica para la importancia de la distribucin normal en la teora de probabilidades. Resulta que en muchos problemas, la variable aleatoria que se considera, puede ser representada como la suma de n variables aleatorias independientes y, por tanto, su distribucin puede aproximarse por la distribucin normal.

    1. Calcular la probabi l idad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g.

  • 2. Calcular la probabi l idad de que una caja 100 de bolsas pese ms de 51 kg.

    NOMBRE: CRISTIAN DE JESUS GALINDO LOPEZ

    Bibliografa:

    Probabilidad y estadstica. Autor Stephen S. Willoughby. Sexta reimpresin 1978 Mxico. Editorial CIA. Impresora Gutenberg Probabilidad y aplicaciones estadsticas. Autor Paul L. Meyer. 1989 Mxico. Editorial Impresora Azteca. http://www.uaq.mx/matematicas/estadisticas/xu5.html http://sitios.ingenieria-usac.edu.gt/estadistica/estadistica3/muestreosimplealeatorio.html http://www.mat.uda.cl/hsalinas/cursos/2009/estadistica/resueltos-probabilidades.pdf http://www.vitutor.com/pro/5/a_a.html