notas sobre pruebas

7
 PRUEBAS DE UNIFORMIDAD O ALEATORIEDAD Un generador de números seudoaleatorios debe producir números que posean las propiedades o características de los números realmente aleatorios: por eso es que antes de utilizarlo, es conveniente que sometamos algunas de sus muestras a pruebas estadísticas que verifiquen tales propiedades o características. El generador aleatorio de Excel es ALEATORIO() y volátil  (cambiante). Solamente en la  prueba de Kolmogórov-Smirnov  la muestra se fija con el pegado especial de valores. ! "#$%&' (% )' *'#+',-' !"#$%&'"' &'%()*+,(-. . / 01234056 1 73 89387 6 1  7: ;< !"#$"%&" ()*+,#"-  = /0%&,1(2. )& 45&#%(5"$06  '> / ?)@A+3BC )@A6DEF )@A+3B /  ! 1 04 " G1H 340 )@A6DE /  ! 1 " G1H 340 7,"%&,".6 6@ . ><7 73IJ7 )@A+3B K )@A6DEC 39 :7 ED787 J7>L<M<J ;< L@ENI7:@:O )< .#)*/" 0* -" 1"#$"%&" P7J@B@>< QD7 7; R737J<89J EJ98D>7 3SA7J9: >93 ;< A@:A< P<J@<T@;@8<8 QD7 ;9: <;7<I9J@9: J7<;7:O U V = )< P<J@<3M< 7: 0G01 U 0 = )< P<J@<3M< !" 7: 0G01 U V = # 1 / 0G01 U 0 = # 1 W 0G01 E7J>73I@;7: 87 ;< 8@:IJ@TD>@N3 XU+4 X$'(#'('   1 2 1 1 2 2 $ % & ' ( ) * $ = + +  = = n n  x  x S n i i n i i  !"#$%&' ()*(+,-.,/0 1231345 1246361 1247815 128194: 12849:4 12;1957 1246:75 1255666 1298543 1243:56 121:974 12:7975 123:;8; 1297743 129186; !"# %&'()*#&# #+,-  <'%=$ , . /0  123456789*#):"/; < =  . >? >@ 0=A  B56789*#):"/; #$%'<>?&'@= C . /D?E=D &#?ABC <# 'E#F%'EABC (E !&8F,G . ! = HI?0JK /D  . 0?A=H  L6MNO5?1PF?F3B7HI?0JQ /D; !&8<9' . ! = =?0JK /D  . =A?//H  L6MNO5?1PF?F3B7=?0JQ /D; <#EA$ABC N, R*,*:"SQ C *#)T *,):* !&8F,G U !&8<9'Q '+: S+ V9* !" #* '9*W* :*X%"Y": S" %&'()*#&#? <&8Z(S&X"8*,)*- C [ 5X \ ,+ 6P > N]*8'S+; 5 9," 89*#):" , . /0 W*S R*,*:"W+: "S*")+:&+ W* N^X*SQ "'S_X"S* S"  F&"#G' <# H' I'&A'CJ'? 5S G&,"SQ *#X:&Z&: S" X+,XS9#&(,? <+S9X&(, P > - " = . /`/= P / - " = a /`/= 1231!M<Fb3 NS R*,*:"W+: W* N^X*S '"#" S" ':9*Z" W* S" B":&",Y"K *# W*X&:Q V9* ':+W9X* ,c8*:+# X+, ':TX)&X"8*,)* S" 8&#8" d":&",Y" V9* S+# d*:W"W*:+# "S*")+:&+#?  

Upload: oswaldo-escudero-ornelas

Post on 03-Nov-2015

7 views

Category:

Documents


0 download

DESCRIPTION

es un documento sobre simulacion y estadistica

TRANSCRIPT

  • PRUEBAS DE UNIFORMIDAD O ALEATORIEDAD Un generador de nmeros seudoaleatorios debe producir nmeros que posean las propiedades o caractersticas de los nmeros realmente aleatorios: por eso es que antes de utilizarlo, es conveniente que sometamos algunas de sus muestras a pruebas estadsticas que verifiquen tales propiedades o caractersticas. El generador aleatorio de Excel es ALEATORIO() y voltil (cambiante). Solamente en la prueba de Kolmogrov-Smirnov la muestra se fija con el pegado especial de valores.

    l PRUEBA DE LA VARIANZA

    hiptesis

    estadgrafoJ = 12(n-1)S2 en donde S2 es la varianza muestral :

    Intervalo de Aceptacin: Ac = [LimInf, LimSup]

    LimInf = 21-/2; n-1

    LimSup = 2/2; n-1

    Criterio: Si J cae entre LimInf y LimSup, no se puede rechazar la hiptesis.

    La prueba de la Varianza verifica que el generador produce nmeros con la misma variabilidad que los aleatorios reales.

    H0: La varianza es 1/12H1: La varianza no es 1/12

    H0: 2 = 1/12H1: 2 1/12

    percentiles de la distribucin CHI-

    CUADRADA

    Ejemplo) A una muestra n = 15 del generador aleatorio de Excel, aplcale la prueba de la Varianza. Al final, escribir la conclusin.Solucin

    H0: 2 = 1/12H1: 2 1/12

    CONCLUSINEl generador de Excel pasa la

    prueba de la Varianza; es decir, que produce nmeros con

    prcticamente la misma varianza que los verdaderos aleatorios.

    La prueba del Promedio es para asegurarse que un generador aleatorio produce nmeros con la misma media que los aleatorios verdaderos.

    H0: El promedio es 1/2H1: El promedio no es 1/2

    H0: = 1/2H1: 1/2

    1

    2

    1

    1

    2

    2

    =

    ==

    nn

    xx

    S

    n

    iin

    ii

    muestra ALEATORIO()

    0.10149 0.45150 0.42809 0.80743 0.84734

    0.60792 0.45329 0.99555 0.78941 0.41395

    0.03724 0.32729 0.13686 0.72241 0.70856

    Las hiptesis son: datosn = 15 CONTAR(muestra1)S2 = 0.08526 VAR(muestra1)

    estadgrafoJ = 14.324

    regin de aceptacin AcLimInf = 297.5%; 14 = 5.629 PRUEBA.CHI.INV(97.5%, 14)

    LimSup = 22.5%; 14 = 26.119 PRUEBA.CHI.INV(2.5%, 14)decisin

    En general, J est entre LimInf y LimSup,por lo que no se puede rechazar la hiptesis.Simblicamente: J Ac no RH0

    Ejemplo) A una muestra n = 15 del generador aleatorio de Excel, aplcale la prueba de la Varianza. Al final, escribir la conclusin.Solucin

    H0: 2 = 1/12H1: 2 1/12

    CONCLUSINEl generador de Excel pasa la

    prueba de la Varianza; es decir, que produce nmeros con

    prcticamente la misma varianza que los verdaderos aleatorios.

    La prueba del Promedio es para asegurarse que un generador aleatorio produce nmeros con la misma media que los aleatorios verdaderos.

    H0: El promedio es 1/2H1: El promedio no es 1/2

    H0: = 1/2H1: 1/2

    percentiles de la distribucin NORMAL

    ESTNDAR

    Ejemplo) Aplicar la prueba del Promedio a la muestra del ejemplo previo.Solucin

  • l PRUEBA DEL PROMEDIO

    hiptesis

    estadgrafo

    Intervalo de Aceptacin: Ac = [LimInf, LimSup]

    LimInf = 1-/2 = -Z/2LimSup = /2

    Criterio: Si J cae entre LimInf y LimSup, no se puede rechazar la hiptesis.

    La prueba del Promedio es para asegurarse que un generador aleatorio produce nmeros con la misma media que los aleatorios verdaderos.

    H0: El promedio es 1/2H1: El promedio no es 1/2

    H0: = 1/2H1: 1/2

    percentiles de la distribucin

    NORMAL ESTNDAR

    Ejemplo) Aplicar la prueba del Promedio a la muestra del ejemplo previo.Solucin

    CONCLUSINDebemos aceptar que el generador aleatorio de Excel produce nmeros cuya media es la misma que la de los

    verdaderos aleatorios: 1/2

    La denominada prueba de Frecuencias verifica la uniformidad de los nmeros producidos por un generador.

    Resume una muestra en una distribucin de frecuencias de k clases del mismo ancho. Si la hiptesis de uniformidad es cierta esperamos la misma cantidad, n/k, de datos en cada clase. El conteo de datos de la muestra en cada clase se llama frecuencia observada.

    Las frecuencias observadas se comparan con las frecuencias esperadas: si son similares, tendemos a pensar que la hiptesis es correcta y que a medida que resultan muy diferentes sospecharemos que no lo es. Estadsticamente, la comparacin puede realizarse segn lo prescribe el procedimiento general de contraste conocido como prueba de Karl-Pearson.

    H0: La distribucin es UniformeH1: La distribucin no es Uniforme

    )5.0(12 = xnZ

    datos estadgrafo regin de aceptacin, Acn = 15 Z = 0.294 LimInf, -Z2.5% = -1.960x = 0.52189 LimSup, Z2.5% = 1.960

    Decisin : en gral. Z Ac no RH0

    Ejemplo) Aplicar la prueba del Promedio a la muestra del ejemplo previo.Solucin

    CONCLUSINDebemos aceptar que el generador aleatorio de Excel produce nmeros cuya media es la misma que la de los

    verdaderos aleatorios: 1/2

    La denominada prueba de Frecuencias verifica la uniformidad de los nmeros producidos por un generador.

    Resume una muestra en una distribucin de frecuencias de k clases del mismo ancho. Si la hiptesis de uniformidad es cierta esperamos la misma cantidad, n/k, de datos en cada clase. El conteo de datos de la muestra en cada clase se llama frecuencia observada.

    Las frecuencias observadas se comparan con las frecuencias esperadas: si son similares, tendemos a pensar que la hiptesis es correcta y que a medida que resultan muy diferentes sospecharemos que no lo es. Estadsticamente, la comparacin puede realizarse segn lo prescribe el procedimiento general de contraste conocido como prueba de Karl-Pearson.

    H0: La distribucin es UniformeH1: La distribucin no es Uniforme

    percentil 1- de la distribucin Chi-Cuadrada con k-1 grados de libertad

    Requisito: cada espi > 1. Si no se cumple, juntar las clases adyacentes necesarias.

    Ejemplo) Aplicar la prueba de frecuencias a una muestra de 150 nmeros del generador aleatorio de Excel. Dividir la distribucin de frecuencias en 8 clases.Solucin

    l PRUEBA DE FRECUENCIAS

    La denominada prueba de Frecuencias verifica la uniformidad de los nmeros producidos por un generador.

    Resume una muestra en una distribucin de frecuencias de k clases del mismo ancho. Si la hiptesis de uniformidad es cierta esperamos la misma cantidad, n/k, de datos en cada clase. El conteo de datos de la muestra en cada clase se llama frecuencia observada.

    Las frecuencias observadas se comparan con las frecuencias esperadas: si son similares, tendemos a pensar que la hiptesis es correcta y que a medida que resultan muy diferentes sospecharemos que no lo es. Estadsticamente, la comparacin puede realizarse segn lo prescribe el procedimiento general de contraste conocido como prueba de Karl-Pearson.

    H0: La distribucin es UniformeH1: La distribucin no es Uniforme

    percentil 1- de la distribucin Chi-Cuadrada con k-1 grados de libertad

    Requisito: cada espi > 1. Si no se cumple, juntar las clases adyacentes necesarias.

    Ejemplo) Aplicar la prueba de frecuencias a una muestra de 150 nmeros del generador aleatorio de Excel. Dividir la distribucin de frecuencias en 8 clases.Solucin

  • hiptesis

    estadgrafo

    Intervalo de Aceptacin: Ac = (LimInf, LimSup]LimInf = 0

    LimSup = 2; k-1

    Criterio: Si J 1. Si no se cumple, juntar las clases adyacentes necesarias.

    Ejemplo) Aplicar la prueba de frecuencias a una muestra de 150 nmeros del generador aleatorio de Excel. Dividir la distribucin de frecuencias en 8 clases.Solucin

    CONCLUSINDebemos aceptar que el generador aleatorio de

    Excel produce nmeros uniformemente distribuidos

    =

    =

    k

    i i

    ii

    espespobsJ

    1

    2)(

    muestra

    0.9953 n = 1500.4431

    0.5238 distrib. de frecuencias0.9271 Hasta obs esp0.8853 0.125 17 18.750.8703 0.250 10 18.750.9839 0.375 18 18.750.5509 0.500 23 18.750.4854 0.625 22 18.750.2914 0.750 16 18.750.6509 0.875 17 18.750.7811 1.000 27 18.750.5688 n = 150 1500.7500 estadgrafo0.7550 J = 10.000 SUMA( (Obs-Esp)^2/Esp)0.1242 valor crtico0.9087 25%; 7 = 14.067 PRUEBA.CHI.INV(5%, 7)0.0405 decisin0.4481 En gral. J

  • l PRUEBA DE KOLMOGROV-SMIRNOV

    muestra Paso 1 Paso 2 Paso 3 Paso 4: ABS(paso3-paso2)

    0.5034 ordenado Frec. relat. Probabilidad Diferencia con va- Diferencia con va-

    0.0198 ascendente acumulada acumulada lor anterior: Dif1 lor corresp.: Dif2

    0.1728 0.0198 0.0455 0.0198 0.0198 0.0256

    0.1709 0.0302 0.1364 0.0302 0.0153 0.1062

    0.9752 0.0875 0.2273 0.0875 0.0489 0.1398

    0.0302 0.1709 0.3182 0.1709 0.0564 0.1473

    0.8789 0.1728 0.4091 0.1728 0.1454 0.2363

    0.0875 0.5034 0.5000 0.5034 0.0943 0.0034

    0.7238 0.5423 0.5909 0.5423 0.0423 0.0486

    0.6312 0.6312 0.6818 0.6312 0.0403 0.0506

    0.5423 0.7238 0.7727 0.7238 0.0420 0.0489

    0.8789 0.8636 0.8789 0.1062 0.0153

    0.9752 0.9545 0.9752 0.1115 0.0206

    La prueba de Kolmogrov-Smirnov (KS) tiene la misma finalidad que la prueba de Frecuencias, pero mientras sta es paramtrica, la de KS no lo es. Se recomienda para muestras pequeas.

    La prueba de KS compara las frecuencias relativas acumuladas de la muestra con las probabilidades acumuladas en el supuesto de que es cierta la hiptesis de uniformidad.

    Ilustraremos con un ejemplo.

    Ejemplo ) Aplicar la prueba de KS a una muestra fija n=11 del generador de Excel.Solucin

    CONCLUSINLa muestra obtenida de Excel pasa la prueba de KS: el generador de Excel produce nmeros

    uniformes.

    Nota: Si se rechazara la hiptesis, es posible que se hubiera cometido el error del tipo I: tal vez el generador s produzca nmeros uniformes pero la prueba lo rechaza. Habra que probar algunas muestras ms: si sistemticamente la mayora no pasara la prueba entonces s habra que revisar el programa que usa Excel.

    Paso 5 Estadgrafo: Dmax = mayor de todas las diferencias

    Dmax = 0.236

    Paso 6 Valor crtico: D; n obtenido de la Tabla para Prueba de KSD5%; 11 = 0.391

    Paso 7 Decisin: Si Dmax < D; n no RH0Aqu: como Dmax = 0.236 < D5%;11 = 0.391 no RH0

    CONCLUSINLa muestra obtenida de Excel pasa la prueba de KS: el generador de Excel produce nmeros

    uniformes.

    Nota: Si se rechazara la hiptesis, es posible que se hubiera cometido el error del tipo I: tal vez el generador s produzca nmeros uniformes pero la prueba lo rechaza. Habra que probar algunas muestras ms: si sistemticamente la mayora no pasara la prueba entonces s habra que revisar el programa que usa Excel.

  • l PRUEBA DE SERIES

    H0: El generador produce nmeros uniformes y aleatoriosH1: El generador produce nmeros que no son uniformes o aleatorios

    2; mq-1

    La prueba de Series verifica la uniformidad y aleatoriedad de los nmeros producidos por un generador supuestamente aleatorio.

    Si de verdad hubiera comportamiento aleatorio entonces cualesquiera dos nmeros consecutivos deben se estadsticamente independientes.

    La prueba de Series distribuye los puntos (r1, r2), (r2, r3), (r3, r4), ..., (rn-1, rn) en una distribucin de frecuencias convenientemente dispuesta en un arreglo rectangular de m filas y q columnas. Las frecuencias observadas se comparan luego con las frecuencias esperadas de acuerdo con el procedimiento general de contraste conocido como prueba de Karl-Pearson(o prueba Chi-Cuadrada), ya aplicado en la prueba de frecuencias, cuyo estadgrafo es:

    La regin de aceptacin tiene lmite inferior cero y el superior se conoce como valor crtico:

    Si el estadgrafo resulta mayor que el valor crtico la hiptesis se debe rechazar.

    Ejemplo) Aplicar la prueba de Series a una muestra n = 121 seudoaleatorios de Excel. Utilizar un arreglo de 3x4 para la distribucin de frecuencias.Solucin

    esp = # pares/# clases = 120/12

    CONCLUSINEs razonable aceptar que el generador de

    Excel produce nmeros aleatorios y uniformes.

    SUMAPRODUCTO( (MuestraOrig>$C38)*(MuestraOrigC$38)*(MuestraDef$C38)*(MuestraOrigC$38)*(MuestraDef

  • l PRUEBA DE LA DISTANCIA Al igual que la Prueba de Series, la de la distancia es una prueba de aleatoriedad y uniformidad, por lo que las hiptesis de contraste son:

    H0: el generador produce nmeros uniformes e independientes en (0, 1) H1: el generador no produce nmeros uniformes o independientes en (0, 1)

    La prueba procede as: 1 Se establece un subintervalo [a, b] de (0, 1); 2 Cada seudoaleatorio de una muestra del generador se codifica 1 si est en [a, b], 0 en caso de no estarlo;

    por ejemplo: si a = 0.3 y b = 0.6, la secuencia 0.9813, 0.5673, 0.1764, 0.8621, 0.5259, 0.4872, ... se transfor-ma en la binaria 0, 1, 0, 0, 1, 1, ...

    3 Obtenemos la muestra de distancias asociada a la codificacin binaria. Definimos, distancia = # ceros entre dos unos. La secuencia 0, 1, 0, 0, 1, 1, ... de arrriba produce las distancias 2, 0, ... . Esta variable aleatoria (la distancia) se distribuye de acuerdo con un patrn geomtrico dado por:

    p(d) = (b-a) (1-b+a)d para d = 0, 1, 2, 3, ...

    4 A la muestra obtenida de observaciones sobre la distancia (en total habr n distancias) se le aplica la prueba de Karl-Pearson (KP); es decir, la misma de la prueba de Frecuencias y de la Prueba de Series: una compara-cin estadstica de las frecuencias de cada distancia en la muestra y de sus correspondientes frecuencias espe-radas.

    Estadgrafo:

    Valor crtico: 2; k-1

    Criterio: Si J 2; k-1 H0 no se puede rechazar

    Como la distancia tiene el dominio infinito contable 0, 1, 2, ..., la tabla de desglose de las frecuencias observadas y esperadas es finita, lo cual significa: hay que extenderla hasta el entero positivo q de modo que cada frecuen-cia esperada satisfaga el requisito de la prueba de KP de ser mayor que 1. Detalle: la ltima clase es q y as la frecuencia esperada de cada clase, excepto la ltima, es n*p(d) = n*(b-a)*(1-b+a)d; y, por lo tanto, la frecuencia

    esperada de la ltima clase es n*p(d q) = n (b a)(1 b+ a)kk=q

    = n*(1-b+a)q .

    Ejemplo ) Obtener una muestra de 500 seudoaleatorios de Excel y aplicarle la Prueba de la Distancia, con a = 0.25 y b = 0.80. Solucin: la hoja de clculo de la pgina siguiente contiene lo solicitado. Ntese que la muestra de 500 aleato-rios est en la columna B (a partir de la casilla B65) aunque no se muestra completa, y que la muestra de dis-tancias de la columna D solamente contiene n = 259 valores. Se proporciona tambin la documentacin de nom-bres y frmulas a fin de que el alumno pueda ejecutar por s mismo esta prueba.

    en donde: obsi = Frecuencia observada de la clase i espi = Frecuencia esperada de la clase i k = # clases finales (cada una con espi > 1)

    J = obsi espi( )2

    espii=1

    k