teoria unidad 6 2013

16
SIMULACIÓN UNIDAD 6 pág. 1 Unidad 6: planteo táctico y estratégico para simulación. Validación e implantación Introducción El análisis de las salidas de simulación es necesario para conocer el comportamiento del sistema o para comparar escenarios del sistema en estudio. Las salidas de las simulaciones de sistemas discretos son variables aleatorias por cuanto en la simulación se generaron variables con distribuciones de probabilidad dadas mediante generadores de números aleatorios. Un generador de variables aleatorias producirá salidas que difieren en sus valores porque se usan números aleatorios diferentes para obtenerlas. Si en el sistema se mide una variable y, se obtendrá el estimador ŷ de esa variable mediante varias corridas de simulación. La precisión del estimador ŷ puede determinarse mediante el error estándar o el intervalo de la confianza de y. Sea un sistema de inventario y su costo por semana es la variable Y, con distribución de probabilidad desconocida. Si se corre una simulación del sistema de inventario para 1 semana se obtiene una observación simple de una población de todas las posibles observaciones de Y. Si se quiere incrementar el número de observaciones se podrían correr n semanas para obtener Y 1 , Y 2 , Y 3 , …….Y n pero este conjunto no corresponde a una muestra aleatoria porque no son estadísticamente independientes. Es decir que el inventario del fin de una semana es el inicial de la semana siguiente, y así el valor de Y i influye en el valor de Y i+1 produciéndose una dependencia y la secuencia de variables aleatorias Y 1 , Y 2 , Y 3 , …….Y n es auto correlacionada. En ese caso no se pueden aplicar las inferencias de la estadística clásica a las salidas de simulación y por lo tanto se debe modificar la experimentación de la simulación. Las condiciones iniciales también pueden influir en las salidas y es importante especificarlas en el tiempo cero. Esto es, el valor inicial al comienzo de la simulación. Del ejemplo del inventario, la demanda en el día lunes al inicio de la semana puede afectar el costo del inventario de esa semana. Este comportamiento se tiene en cuenta en dos tipos de simulaciones según el tiempo de simulación: en estado estacionario y en estado transiente. En el primer caso, se toman las salidas de simulación para tiempos de corridas largos. En el estado transiente interesan las primeras observaciones o el tiempo inicial hasta que alcance un estado estable. Es el caso de clientes de un banco que ingresan cuando se abren las puertas para solicitar atención de empleados que recién inician el trabajo (encienden las máquinas, preparan los papeles, etc.). Luego de un período de tiempo el ingreso, egreso y atención alcanzan el estado estacionario, es decir, las salidas de simulación no difieren de un rango determinado. Por esta razón también hay que considerar los puntos finales de simulación y las variables de respuesta obtenidas, para lo cual hay métodos que intentan asegurar la validez de los resultados y minimizar los errores a la hora de la toma de decisiones. Una vez que se plantea y se programa un modelo de simulación para representar el comportamiento de un sistema es necesario comprobar que el programa realice lo correcto y que los resultados sean comparables con datos del sistema real. Entonces se debe verificar el programa atendiendo a las sentencias o comandos que se escribieron en el lenguaje seleccionado para la simulación, de manera que realice lo correcto. Y luego de verificado el programa, se deben validar los resultados con datos disponibles del sistema real o con elementos del mismo que hagan confiables a la simulación realizada. Para estas dos etapas presentes en todo esquema de simulación hay métodos que pueden aplicarse según el caso y la disponibilidad de información.

Upload: christiam-morales-alvarado

Post on 11-Nov-2015

224 views

Category:

Documents


2 download

DESCRIPTION

teorema

TRANSCRIPT

  • SIMULACIN UNIDAD 6 pg. 1

    Unidad 6: planteo tctico y estratgico para simulacin. Validacin e implantacin

    Introduccin El anlisis de las salidas de simulacin es necesario para conocer el comportamiento del sistema o para comparar escenarios del sistema en estudio.

    Las salidas de las simulaciones de sistemas discretos son variables aleatorias por cuanto en la simulacin se generaron variables con distribuciones de probabilidad dadas mediante generadores de nmeros aleatorios. Un generador de variables aleatorias producir salidas que difieren en sus valores porque se usan nmeros aleatorios diferentes para obtenerlas.

    Si en el sistema se mide una variable y, se obtendr el estimador de esa variable mediante varias corridas de simulacin. La precisin del estimador puede determinarse mediante el error estndar o el intervalo de la confianza de y. Sea un sistema de inventario y su costo por semana es la variable Y, con distribucin de probabilidad desconocida. Si se corre una simulacin del sistema de inventario para 1 semana se obtiene una observacin simple de una poblacin de todas las posibles observaciones de Y. Si se quiere incrementar el nmero de observaciones se podran correr n semanas para obtener Y1, Y2, Y3, .Yn pero este conjunto no corresponde a una muestra aleatoria porque no son estadsticamente independientes. Es decir que el inventario del fin de una semana es el inicial de la semana siguiente, y as el valor de Yi influye en el valor de Yi+1 producindose una dependencia y la secuencia de variables aleatorias Y1, Y2, Y3, .Yn es auto correlacionada. En ese caso no se pueden aplicar las inferencias de la estadstica clsica a las salidas de simulacin y por lo tanto se debe modificar la experimentacin de la simulacin. Las condiciones iniciales tambin pueden influir en las salidas y es importante especificarlas en el tiempo cero. Esto es, el valor inicial al comienzo de la simulacin. Del ejemplo del inventario, la demanda en el da lunes al inicio de la semana puede afectar el costo del inventario de esa semana. Este comportamiento se tiene en cuenta en dos tipos de simulaciones segn el tiempo de simulacin: en estado estacionario y en estado transiente. En el primer caso, se toman las salidas de simulacin para tiempos de corridas largos. En el estado transiente interesan las primeras observaciones o el tiempo inicial hasta que alcance un estado estable. Es el caso de clientes de un banco que ingresan cuando se abren las puertas para solicitar atencin de empleados que recin inician el trabajo (encienden las mquinas, preparan los papeles, etc.). Luego de un perodo de tiempo el ingreso, egreso y atencin alcanzan el estado estacionario, es decir, las salidas de simulacin no difieren de un rango determinado. Por esta razn tambin hay que considerar los puntos finales de simulacin y las variables de respuesta obtenidas, para lo cual hay mtodos que intentan asegurar la validez de los resultados y minimizar los errores a la hora de la toma de decisiones.

    Una vez que se plantea y se programa un modelo de simulacin para representar el comportamiento de un sistema es necesario comprobar que el programa realice lo correcto y que los resultados sean comparables con datos del sistema real.

    Entonces se debe verificar el programa atendiendo a las sentencias o comandos que se escribieron en el lenguaje seleccionado para la simulacin, de manera que realice lo correcto.

    Y luego de verificado el programa, se deben validar los resultados con datos disponibles del sistema real o con elementos del mismo que hagan confiables a la simulacin realizada.

    Para estas dos etapas presentes en todo esquema de simulacin hay mtodos que pueden aplicarse segn el caso y la disponibilidad de informacin.

  • SIMULACIN UNIDAD 6 pg. 2

    Datos de salida de simulacin: estimacin de medias, variancias y correlaciones, intervalos de confianza y test de hiptesis para las medias.

    Una salida de simulacin es una estimacin de la performance o desempeo de un sistema. El valor de este estimador cuantifica el comportamiento del sistema. Por ejemplo el tiempo de permanencia en un banco, desde el ingreso del cliente hasta su salida habiendo sido atendido es el estimador del desempeo del sistema Banco. Las salidas de simulacin son variables aleatorias porque se calculan a partir de generacin de otras variables

    aleatorias de las entradas del modelo de simulacin. Una salida tiene un punto de estimacin ( ) y un intervalo cuya longitud es una medida del error en la estimacin del punto.

    El parmetro es una media comn, mientras que es una media ponderada en el tiempo. Los datos de salida de la simulacin pueden ser de tiempo discreto, bajo la forma de { Y1, Y2, Y3, .Yn} para

    estimar siendo n un ndice con valor discreto. Por ejemplo Yi puede ser la demora de un cliente i o el costo total en la semana i. Tambin pueden ser datos de tiempo continuo si los datos de salida de simulacin tienen la forma {Y(t), 0tTE}

    para estimar debido a que t es un valor continuo. Por ejemplo Y(t) puede ser la longitud de cola en el tiempo t o el nmero de rdenes atrasadas en un tiempo t. Estimacin de medias

    El estimador puntual de , basado en los datos { Y1, Y2, Y3, .Yn} est definido como

    n

    i

    iYn 1

    1

    donde es la media muestral de una muestra de tamao n. En el lenguaje de simulacin puede referirse como estadstico observacional, de tiempo discreto.

    Se dice que el estimador puntual es insesgado para si su valor esperado es :

    E( ) = Sin embargo, en general sucede que

    E( )

    Y el sesgo del estimador es E( ) - . Si bien es deseable disponer de datos no sesgado no siempre es posible. El estimado puntual de sobre los datos {Y(t), 0tTE}, donde TE es el tiempo de la corrida de simulacin est definido como:

    ET

    E

    dttYT

    0

    )(1

    Y se llama promedio en el tiempo de Y(t) en el intervalo [0,TE]. Los lenguajes de simulacin lo refieren como estadstico de tiempo continuo, de cambio discreto o de tiempo persistente. Es deseable que sea un

    estimador insesgado pero en general E( )

  • SIMULACIN UNIDAD 6 pg. 3

    Generalmente y son considerados como medidas medios de performance del sistema que est siendo simulado. Tambin pueden aparecer otros estimadores particulares. Por ejemplo si se quiere estimar la proporcin de das que se pierden ventas por falta de stock, se puede plantear

    omodotrode

    idastockfaltasiYi

    0

    ,1

    Con n igual al nmero total de das estimado en la primera ecuacin (6.1) la proporcin de das sin stock, o de prdidas de ventas, es un estimador puntual de . Sea la proporcin de veces en que la longitud de cola es mayor de 10 clientes. Si LQ(t) representa la longitud de cola en el tiempo t, luego

    omodotrode

    tLsitY

    Q

    0

    10)(,1)(

    As es un estimador puntual de , la proporcin de veces en que la longitud de cola es mayor que 10 en el tiempo de simulacin. Las estimaciones de proporciones o probabilidades son casos especiales de estimadores de medias. Otras medidas de performance o desempeo son los percentiles o cuantiles. Los cuantiles describen el nivel de performance que puede ser entregados con una dada probabilidad p. por ejemplo supongamos que Y representa la demora en cola en minutos que experimenta un cliente en un sistema de servicios. Luego el p0,85

    cuantil de Y es el valor tal que

    Prob {Y } = 0,85

    es el 100 % o 85 percentil de demora de un cliente. En consecuencia el 85% de todos los clientes demorarn

    minutos o menos. De otra forma un cliente tiene solo un 15 % de probabilidad de experimentar una demora

    mayor de minutos. Una mediad ampliamente usada es la mediana que representa el 0,5 cuantil o 50 percentil. El problema de estimar un cuantil es lo inverso del problema de estimar una proporcin o probabilidad. Para

    estimar una proporcin est dado y la probabilidad p debe ser estimada. Sin embargo, para estimar un

    cuantil, p est dado y hay que estimar . El mtodo ms intuitivo para estimar un cuantil es formar un histograma de los datos observados de Y, y luego

    encontrar un valor tal que el 100 % del histograma est a la izquierda o sea menor que . Por ejemplo si se observan n=250 demoras de clientes luego un 85 percentil estimado se puede calcular como 0,85 x 250 213

    de los valores observados que son menores o iguales a . En el caso de datos continuos, el histograma brinda la fraccin de tiempo en que el proceso permanece en un cada nivel posible por ejemplo, posibles valores de longitudes de cola. El proceso es igual al de datos discretos. Estimacin del intervalo de confianza Un intervalo de confianza mide el error de una media. Sea la varianza de la muestra con R repeticiones.

    n

    i

    i YYn

    S1

    22 )(1

    1

    El intervalo de confianza usual asume que Yi est distribuida con una normal. Y el intervalo de confianza es:

    n

    StY n 1,2/

  • SIMULACIN UNIDAD 6 pg. 4

    Donde t/2, n-1 es el cuantil de la distribucin t con n-1 grados de libertad que corta /2 del rea de cada cola de la distribucin.

    El intervalo de confianza da los extremos o lmites donde puede estar Y . Mientras ms repeticiones se hagan

    ms pequeo es el intervalo de confianza y menos error tendr Y .

    Sea un ciclo de tiempo promedio en un da particular. Un buen estimador es Y pero no es precisamente exacto. Incluso , que es el centro de la distribucin no es probable que sea el real ciclo de tiempo de un da en particular, porque diariamente estos ciclos de tiempo varan. Un intervalo de prediccin est diseado por otra parte para contener el ciclo de tiempo de cualquier da en

    nStY n

    111,2/

    La longitud del intervalo no tiene a cero si n aumenta (no disminuye), y en el lmite se transforma en

    z/2 De esta forma, aunque se hagan muchas simulaciones, el ciclo de tiempo vara. As un intervalo de prediccin como el que se explica es una medida del riesgo, mientras que un intervalo de confianza es una medida del error. Se puede simular lejos del error con ms y ms corridas o repeticiones pero nunca se puede simular lejos del riesgo, que es una parte inherente del sistema. Sin embargo podemos hacer un mejor trabajo para evaluar riesgos con ms repeticiones.

    Ejemplo: suponer que el promedio general del ciclo de tiempo promedio sobre 120 repeticiones de una simulacin de manufactura es 5,8 horas, con una desviacin estndar muestral de 1,6 horas. Como t0,025, 119 es 1,98 un intervalo de confianza del 95 % para un ciclo de tiempo promedio diario esperado para una corrida

    larga es 5,8 1,98 (1,6 120 ) o 5,8 0,29 hs. De esta forma la mejor estimacin de un promedio de corrida larga para ciclo de tiempo diario promedio es 5,8 horas pero podra se en mas y en menos 0,29 hs de error en este estimado.

    Para un da particular y teniendo en cuenta el intervalo de prediccin es 5,8 1,98 (1,6 120/11 ) es 5,8 3,18 hs. Este ltimo valor refleja la variabilidad inherente en el ciclo de tiempo promedio diario y el hecho que se quiere un 95 % de confianza de cubrir el ciclo de tiempo promedio real en un da particular antes que considerar simplemente un promedio por corrida larga. Hay que tener la precaucin que el valor est estimado para un promedio diario, no para productos individuales.

  • SIMULACIN UNIDAD 6 pg. 5

    Principios de modelos de simulacin vlidos.

    El objetivo de la creacin de modelos es que estos sean vlidos y crebles para poder utilizarlos.

    Para la simulacin es importante la verificacin del modelo que permite determinar que el programa realiza lo que se propuso. Si no fuera as se realiza la correccin de los errores.

    La verificacin chequea el traslado del modelo de simulacin conceptual (diagrama de flujo e hiptesis) en un programa que ejecute correctamente lo pactado. El concepto es simple pero el trabajo es tedioso.

    La validacin es la determinacin si el modelo de simulacin conceptual representa exactamente al sistema en estudio

    Si un modelo est validado, las decisiones hechas con el modelo son similares a las de la experiencia fsica. Es necesario tener credibilidad en el modelo ya que el programa se usa con confianza en la toma de decisiones. Ambas validacin y verificacin se pueden realizar en las distintas etapas del desarrollo de un modelo de simulacin: Validacin Verificacin Validacin Credibilidad Sistema Modelo

    Conceptual Programa de

    Simulacin Resultados

    "correctos" disponibles

    Resultados implementados

    anlisis y datos programa corrida resultados vendidos al gerente

    Figura 6. 1: aplicacin de la validacin y verificacin en las etapas de la simulacin.

    La validacin implica el contraste de los datos reales con el anlisis de las salidas de simulacin. Busca la estimacin de las verdaderas medidas o respuestas. Se pretende aproximar el modelo lo que ms se pueda al sistema real representado. El problema es estadstico y depende de la longitud de la corrida (tiempo o nmero de entidades simuladas) y del nmero de repeticiones de cada corrida de simulacin. Cabe recordar que son necesarias como mnimo dos corridas de simulacin para obtener salidas de simulacin promediadas, considerando la caracterstica aleatoria de los sistemas discretos. La bondad del modelo debe aproximar su comparacin con el mundo real. Esto en general implica dos etapas:

    1. Que las hiptesis asumidas sean razonables (validacin). 2. Que las hiptesis estn correctamente implementadas en el modelo (verificacin).

    Hay distintas categoras de modelos:

    vlidos y no verificados

    invlidos y no verificados (las hiptesis estn lejos de la realidad)

    invlidos y verificados

    vlidos y verificados

  • SIMULACIN UNIDAD 6 pg. 6

    Verificacin de programas de simulacin.

    Hay distintas tcnicas para la verificacin de modelos de simulacin: Diseo modular top-down (completo) La modularidad es el modelado expresado en mdulos, que son subrutinas, subprogramas y procedimientos individuales comunicados por interfaces que son el nmero de entradas o salidas o estructura de datos.

    Interface + mdulo desarrollo y mantenimiento independientes. Son pequeos problemas a resolver.

    TOP-DOWN diseo jerrquico llevar el sistema a pequeos problemas. Los mdulos con distintas funciones se subdividen en otros mdulos ms pequeos hasta un punto en que sean simples de manejar. Ejemplo: sena mdulos de un simulador de red para estudiar congestin de trfico, con un nmero de nodos fuentes, un nmero de nodos intermedios y nodos destinos.

    Destino Dm

    Nodos intermedios

    Nodo Fuente S1

    R1 R2 Rm

    Nodo Fuente Si Destino Di

    Nodo Fuente Sn

    Destino D1

    Figura 6. 2: estructura de un sistema de red

    Los tamaos de paquetes y tiempos de servicio de varios nodos estn distribuidos aleatoriamente. Por ejemplo 2 LAN conectadas con m nodos intermedios.

    .....

    10 MB

    56 M B

    10 MB

    R 1

    S m S 1

    R m

    ..... D m D 1

    Figura 6. 3: representacin de mdulos de un sistema de red.

    Se puede subdividir cada nodo como una subrutina, de manera de poder hacer mejor la verificacin . Luego es ms fcil detectar los errores. Correccin de errores (Debugging)

    Hay varias formas de hacer la correccin de errores (debbuging):

    1. Realizar la construccin del programa con modelos. 2. Comparar las formas de pensar el modelo con distintas personas. 3. Correr varios valores de parmetros y chequear salidas razonables. 4. Correr por trazas: la traza es el estado del sistema en un tiempo dado de simulacin. Cada vez que

    ocurre un evento se imprime una lista para poder seguirla "a mano".

  • SIMULACIN UNIDAD 6 pg. 7

    5. Disponer de un modelo simplificado para chequear. 6. Observar una animacin de la salida del programa. 7. Escribir las salidas y comparar con datos histricos. 8. Usar un simulador en paralelo que ejecute el mismo modelo.

    Tcnicas de verificacin de modelos La inclusin de chequeos y salidas en el programa indican dnde est el error. Por ejemplo si la suma de las probabilidades da 1 para ciertos eventos, el programa chequea esta condicin e imprime un mensaje de error.

    Estructura caminar a travs de (walking through): Se explica el cdigo a otra persona o grupo. Si no lo entienden se observa cuidadosamente dnde est el error.

    Modelos determinsticos: Se usan funciones de distribucin conocidas para saber los resultados para su correccin.

    Casos simplificados de corridas: Se corren casos simples para saber si hay errores.

    Traza: es una lista ordenada en el tiempo de eventos y sus variables asociadas. El nivel de detalle puede ser la traza de eventos, de procedimientos, de variables. Las salidas de trazas son tiles para detectar errores pero causan mucho overhead en el procesamiento.

    Grficas on-line: Muestra lo que sucede durante la corrida. Demanda mucho tiempo pero es ms informativo que la traza.

    Test de continuidad: Se corre varias veces la simulacin para parmetros de entrada ligeramente diferentes. Normalmente un pequeo cambio en la entrada provoca un pequeo cambio en la salida. Si no se registra esto hay un error.

    Test de degeneracin: Chequean el modelo para valores de parmetros que producen resultados similares. Por ejemplo 2 fuentes con = 100 pps carga la red de la misma forma que 4 fuentes con = 50 pps. Si hay una diferencia debe explicarse o se debe a un error de programacin.

    Independencia de la semilla: Semillas distintas dan resultados aproximadamente diferentes. Si no fuera as, la semilla est afectando a la simulacin.

    Validacin de modelos de simulacin. Procedimientos para comparar el mundo real.

    En general no se necesita tener una correspondencia 1 a 1 entre el modelo y el sistema. Por ejemplo: Se producen 10

    6 latas de tomates al natural a velocidad constante. Cada lata es 1 entidad en el

    modelo. En este caso el modelo es costoso y poco til. En cambio, si se hace un flujo continuo se logra la optimizacin del modelo. Los principios bsicos de la validacin y la verificacin son:

    1. Una clara definicin de las entidades y salidas o respuestas (por ejemplo, si se calcula la velocidad de procesamiento pero no el espacio ocupado).

  • SIMULACIN UNIDAD 6 pg. 8

    2. El buen entendimiento de la configuracin del sistema. 3. Entender y comprender las necesidades del cliente. 4. Usar "expertos" (especialistas y gerentes) y realizar anlisis de sensibilidad (cmo impactan las

    variantes de los parmetros) para ayudar a determinar el nivel de detalle. 5. Seguir un nivel de detalle moderado. 6. Hacer el nivel de detalle consistente con el tipo de datos disponible. 7. Considerar que el nivel de detalle es funcin del tiempo y dinero, lo cual representa una restriccin. 8. Si el nmero de factores es grande es necesario contar con un modelo analtico para identificar

    factores importantes. Como tcnicas o mtodos para la validacin de un modelo de simulacin se mencionan las siguientes:

    Es importante hacer una experimentacin, si es factible. En el caso de un sistema real se pueden medir algunas de las variables de respuesta para comparar con los resultados del modelo de simulacin, por ejemplo, el tiempo de espera en cola de los clientes en una caja en un banco.

    La dificultad o facilidad de validacin depende de la disponibilidad de datos en el tiempo y en el espacio. No siempre es posible medir variables de respuesta como en el caso mencionado en el punto anterior.

    El modelo de un sistema complejo es una aproximacin al mundo real: a mayor detalle, mayor aproximacin. Sin embargo en algunas ocasiones los errores aumentan segn el grado de detalles del sistema modelado, como puede ser el de un modelo de demanda de transporte en una gran ciudad. En la medida que se plantee un modelo complejo, los errores en las predicciones pueden ser mayores en relacin a un modelo simple.

    Un modelo vlido para un propsito no lo es para otro.

    Se debe hacer la documentacin de las hiptesis del modelo. Aseguramiento de una validez alta. Para tener la seguridad de que el modelo tiene una validez alta se pueden hacer:

    1. Charlas con "expertos". Los especialistas pueden orientar a un modelo de mayor validez cuando aportan datos o conocimientos del sistema que despus se representan o se tienen en cuenta en el modelo de simulacin. Adems se produce la tormenta de ideas o brain storming, que permite aclarar en la mayora de los casos el estudio de un sistema. Por ejemplo se hacen simulaciones y se presentan resultados de la simulacin y datos histricos o mediciones reales del caso de estudio a los expertos sin que se distingan a priori cuales son unos y otros y ver si ellos pueden distinguir los resultados (de la simulacin respecto a los datos reales). Un caso puede ser la observacin del grfico de la velocidad de procesamiento de una red como una funcin de la probabilidad de prdida de paquetes obtenida de una versin no vlida del modelo de simulacin de la red. Se simularon dos alternativas y se mostraron en la figura. Para la alternativa 1 la velocidad decae cuando la probabilidad de prdida aumenta. Para la alternativa 2, la velocidad mejora inicialmente, alcanza un mximo de 0,2 y decae despus. Este ltimo caso es improbable porque la velocidad de la red no puede aumentar cuando la probabilidad de prdida de paquetes es del 20 %. Este resultado puede deberse tanto a un error en el programa de simulacin como a los datos de entrada. Por lo tanto el nico comportamiento razonable es la alternativa 1. Un experto debe darse cuenta del error cometido en la alternativa 2.

    2. Observaciones del sistema. Es indispensable observar el sistema tanto para saber representarlo en un

    modelo como para capturar la informacin que permitir obtener los parmetros necesarios para resolverlo. Asimismo luego de cumplidas estas etapas se vuelve a observar el sistema para chequear si las hiptesis asumidas o la informacin capturada son correctas, como tambin para comparar los resultados obtenidos del modelo.

    3. Consideraciones de la teora existente. Una herramienta valiosa es conocer las investigaciones o

    trabajos realizados sobre estudios de sistemas cuyos objetivos son comunes. Esto ayuda al ahorro de tiempo y esfuerzo en el planteo y resolucin de modelos, para lo cual es fundamental disponer de la bibliografa o publicaciones hechas sobre el tema.

  • SIMULACIN UNIDAD 6 pg. 9

    4. Resultados relevantes de modelos de simulacin similares. En este aspecto es importante el comentario hecho en el punto anterior. Las publicaciones previas al planteo y resolucin de un modelo de simulacin proveen de distintos enfoques, los cuales son factibles de adoptar para el caso del estudio, siempre y cuando las situaciones sean similares.

    5. Experiencia/intuicin. En la medida en que se trabaje y se avance en un modelo de simulacin se

    adquiere la prctica y la experiencia, que ayudan a resolver las dificultades que puedan presentarse. La intuicin tambin hace su aporte en la medida que se compruebe o se estudie con mayor profundidad su validez.

    Anlisis de los datos de salida de simulacin Cuando se dispone de un modelo de simulacin verificado y vlido se usa para realizar experimentos. Esto es, en lugar de producir cambios en el sistema real se los hace con los valores de los datos de entrada o parmetros del modelo para ver cmo varan las respuestas y aplicar as la pregunta que pasara si... (what if ). Por ejemplo, en un sistema de stock, se puede variar el punto de reorden o el parmetro de la distribucin de demanda para ver cmo vara el nivel de inventario. En un sistema de redes se puede cambiar la distribucin de tamaos para ver cmo vara el nivel de congestionamiento de una red.

    Toda simulacin de sistemas discretos utiliza variables aleatorias para estimar determinadas variables de respuesta o salida. Entonces estas ltimas tambin son variables aleatorias sobre las cuales se debe tener mucho cuidado en interpretarlas. Para eso es imprescindible para quien hace una simulacin determinar la cantidad de repeticiones o corridas que realizar con el modelo, dado que debe reproducir el comportamiento aleatorio que est representando, como as tambin los valores de los datos de entrada y la precisin estadstica en las respuestas.

    Las salidas de simulacin de un sistema discreto tienen el tratamiento de la estimacin de medias, variancias y correlaciones, intervalos de confianza y eventualmente se puede hacer un test de hiptesis para las medias para comparar distintas configuraciones del sistema simulado. En la unidad 2 se hizo una revisin de probabilidad y estadstica para luego aplicar estos conceptos a los datos observados de un sistema real. Esos mismos conceptos son aplicables para las salidas de simulacin.

    Anlisis estadstico para resultados obtenidos mediante simulaciones. Para analizar los datos se deben hacer una serie de suposiciones sobre los procesos y observaciones de los mismos cuando se hace la recoleccin de datos. Si estas suposiciones son errneas tambin lo sern las conclusiones que se hagan. Cuando se analizan datos estadsticos por lo general se supone que:

    Las observaciones recogidas son independientes. Los procesos no varan en el tiempo por lo que los datos siguen una misma distribucin para

    una variable.

    Cuando la cantidad de observaciones es grande la media de la muestra es una variable aleatoria con distribucin normal.

    Bajo estas suposiciones se hacen las estimaciones de las medias y varianzas, como se vio al principio de esta unidad, y se sacan conclusiones.

    En la simulacin de eventos discretos las observaciones recogidas no siempre son independientes e incluso no estacionarias (esto es no se llega al estado de equilibrio o estado estacionario). Eso hace dudar que la media de la distribucin que siguen sea constante.

  • SIMULACIN UNIDAD 6 pg. 10

    Una solucin puede ser realizar ejecuciones con repeticiones y que sean independientes. En una computadora, las repeticiones de una simulacin son diferentes a las que se hacen en otros mbitos y tienen las siguientes caractersticas:

    - No hay problemas con la metodologa porque el modelo de simulacin escrito en un lenguaje de programacin es el mismo toda vez que se ejecute.

    - Se debe tener cuidado con las condiciones iniciales y todas las ejecuciones deben tener las mismas. - Tambin todas las ejecuciones tienen que tener el mismo final de simulacin, segn sea ste un tiempo

    T o una cantidad de tems procesados. Determinacin del Tamao de Muestras

    Cuando se quiere estimar una media con una exactitud de r % y un nivel de confianza de 100(1-) %, cul es el nmero de observaciones n a realizar?

    Dado un estimador n

    szx , el intervalo de confianza (IC) para una muestra de tamao n es:

    n

    szx

    n

    szx

    La exactitud deseada implica que el intervalo de confianza sea: )100

    r1(x);

    100

    r1(x

    Entonces igualando las expresiones para el IC, se tiene:

    100

    rx

    n

    sz

    2

    100

    xr

    szn

    Ejemplo: si el tiempo medio de respuesta x es de 20 segundos y la desviacin estndar es de 5 segundos, cuntas repeticiones hay que hacer para tener un tiempo de respuesta con una exactitud dentro de 1 segundo, con el 95 % de confianza? Exactitud requerida: 1 segundo en 20 segundos, por lo tanto, r = 5 %

    x = 20 s = 5

    z = 1,96 (de tabla, para 1- = 95 y p = 1-/2 = 0,975)

    2100

    xr

    szn =

    2

    205

    5961100

    ))((

    ))(,)((

    n = (9,8)

    2 = 96,04

    n

    szx)

    r(x

    1001

  • SIMULACIN UNIDAD 6 pg. 11

    Sistemas con final definido y con final no definido. Simulaciones terminantes y no terminantes

    Los sistemas dinmicos discretos pueden tener un final definido o no definido.

    En el primer caso los eventos dejan de ocurrir en determinado momento, por ejemplo la atencin de un banco, el dictado de un curso, etc.

    Un banco: el banco abre cada da a las 8:00, sin clientes en el banco y cierra a las 15:00, completando el servicio de los clientes que estn en el banco. Aqu la longitud de cada periodo es diferente, pero cada periodo empieza siempre sin clientes en el sistema. El suceso de fin se produce cuando sale el ltimo cliente. Posibles medidas de ejecucin pueden ser el tiempo medio de espera de los clientes, as como la proporcin de llegadas en diferentes momentos del da.

    Un aula de libre acceso: Cada periodo comienza cuando el aula se abre y termina cuando llega la hora de cerrar. En este caso el suceso de fin siempre ocurre a la misma hora. Posible medidas de ejecucin pueden ser el nmero medio de usuarios conectados al sistema en los diferentes momentos del da, media del nmero de usuarios conectados.

    En un sistema con final definido en un determinado momento de tiempo cesan de ocurrir los sucesos. Un evento seala el final de un perodo, dicho suceso puede ocurrir siempre en el mismo tiempo durante cada perodo o en un tiempo de ocurrencia aleatorio. Se conoce como perodo o poca al trnsito desde el comienzo al suceso de fin. En un sistema con final definido, el estado al finalizar un perodo no debe afectar al comienzo del siguiente periodo. Hay que hacer una distincin entre el sistema y la simulacin de dicho sistema. Cada simulacin (ejecucin del modelo) es un proceso con final definido, aunque el sistema al que representa lo sea o no. Por contraste, en un sistema con final no definido, los sucesos discretos que dirigen el sistema no dejan nunca de ocurrir. Slo existe un periodo indefinido y no existe un suceso de fin. Los sistemas con final no definido son aquellos en que los eventos o sucesos que ocurren en el sistema no terminan y no hay un evento que indique el fin.

    Un aeropuerto: los aviones van aterrizando y despegando durante todo el da y no existe un momento en que esta actividad cese. Si consideramos un periodo de un da, en el da siguiente la actividad no es independiente sino que est conexionado con el da anterior. Posible medidas de ejecucin pueden ser el tiempo entre aterrizajes.

    Un hospital: los pacientes son atendidos, puede que ingresados y son dados de alta y estos sucesos no acaban nunca de producirse, ni se pueden diferenciar periodos independientes en la actividad. Posibles medidas de comportamiento son el tiempo medio que los pacientes estn en lista de espera, el tiempo medio de estancia en el hospital.

    Las simulaciones de sistemas con final definido se denominan terminantes y las de los sistemas que no lo tienen final definido, no terminantes.

    Comportamiento de estado estacionario y transiente de un sistema discreto. Tambin los sistemas se clasifican en estado estacionario o en estado transiente, trminos que suelen confundirse con los sistemas con final definido o no definido. En el primer caso se hacen referencias al comportamiento del sistema mientras que en el ltimo caso se hace referencia a la naturaleza del sistema. Cuando se analizan los resultados de una simulacin es necesario determinar si se tratan de datos del sistema en el estado transiente o estacionario. Cuando se trata de este ltimo caso, se hace referencia a que no hay cambios grandes en el estado del sistema, es decir, las distribuciones de probabilidad de las variables de estado se estabilizan o son constantes en el tiempo. Por ejemplo, un banco de sangre con una demanda que tiene una distribucin uniforme a lo largo del ao es un sistema con final no definido (siempre hay demanda de sangre) y alcanza el estado estacionario.

  • SIMULACIN UNIDAD 6 pg. 12

    En cambio, un servicio de emergencias es un sistema con final no definido, y si a esto se le suma llamadas de servicio que cambian a lo largo de la actividad del sistema, se trata de un sistema con estado no estacionario.

    Anlisis de salidas para estado estacionario o transiente. Eliminacin del Transiente Toda corrida de simulacin debe eliminar el efecto del transiente, que es el perodo inicial de la simulacin hasta que alcanza el estado estacionario (las salidas de simulacin son aproximadamente similares). Las formas de hacerlo son: 1. Corridas largas: es un mtodo largo y costoso. 2. Inicializacin apropiada: si se dan valores a las variables cerca del estado estacionario, se reduce la

    longitud del estado transiente. 3. Truncacin: La variabilidad de la respuesta en el estado estacionario es menor en que el estado

    transiente. Esta variabilidad se mide en trminos de rangos ( mnimos y mximos observados). Transiente 9

    Nmero de observaciones Sean n observaciones {x1, x2,......,xn}.

    1. Se ignoran las l primeras observaciones y se calculan el mnimo y el mximo de las n-l observaciones.

    2. Se repite para l=1,2,......,n-1 hasta la observacin (l+1) que no es ni el mnimo ni el mximo. l en este punto da la longitud de estado transiente. Pero ojo, puede dar datos incorrectos.

    Ej.: Se consideran la siguiente secuencia de observaciones: 1,2,3,4,5,6,7,8,9,10,11,10,9,10,11,10,9.....

    Ignorando la primer observacin (l=1) se tiene un rango desde 2 hasta 11. Como la segunda observacin es igual al mnimo, la fase transiente es mayor que 1.

    Ignorando las dos primeras observacin (l=2) se tiene un rango desde 3 hasta 11. Como la siguiente observacin (3) es igual al mnimo, la fase transiente es mayor que 2.

    Se contina as y se llega a l=9 con la secuencia (9,11), y la observacin 10 no es ni la mxima ni la mnima. Entonces la longitud del transiente es 9 y las primeras 9 observaciones se descartan.

    Eliminacin de los datos iniciales Requiere estudiar el promedio total despus que algunas observaciones iniciales son borradas de la muestra. En estado estacionario borrar algunas observaciones no cambia el promedio, pero la aleatoriedad en las observaciones hace cambiar el promedio levemente an en estado estacionario.

    Hacer corridas sin cambios en los parmetros de entrada salvo en la semilla, varias repeticiones. Promediando a travs de las repeticiones resulta en una trayectoria ms suave.

    Sean n repeticiones de tamao n cada una. xij es la observacin j en la repeticin i. j = 1,2,.....n (tiempo), i = 1,2,...m (repeticin).

  • SIMULACIN UNIDAD 6 pg. 13

    1- Promedio por observacin:

    m

    iijj njx

    mx

    1

    ,....2,11

    2- Promedio total:

    n

    j

    jxn

    x1

    1

    Sea l =1 y seguir en 3. 3. Si el transiente es la longitud l, se borran las l observaciones desde la trayectoria media y se toma el

    promedio desde n-l valores

    n

    lj

    jl xn

    x11

    1

    Ver el cambio relativo

    x

    xx l

    Repetir variando l desde 1 hasta n-1. Graficar la media total y el cambio relativo como funcin de l. Hay un l que aunque aumenta, el promedio se estabiliza, ese punto se conoce como punto de inflexin. Es el punto de longitud del intervalo del transiente.

    Promedio del movimiento de repeticiones independientes

    Es similar al mtodo de borrado de datos iniciales. Se hace el clculo de la media a travs de una ventana de intervalo de tiempo en lugar de una media total.

    1) Se toma una trayectoria media:

    m

    iijj njx

    mx

    1

    ,....2,11

    2) Se hace k=1

    knkkjxk

    xk

    kl

    jj

    ,..2,112

    11

    3) Repetir 2 con k = 2,3....hasta convergencia o suavidad del grfico. 4) La inflexin del grfico da el intervalo transiente.

    Medias batch El procedimiento consiste en correr una simulacin muy larga y dividir en varios intervalos de igual duracin. Cada parte es llamada batch o submuestra. La media es la media batch. El mtodo requiere estudiar la variancia de estas medias batch como funcin del tamao batch. Sea una corrida larga de N observaciones divididas en m batchs de tamao n.

    n

    Nm [ ] es la truncacin del L valor entero

    Por ejemplo: Se comienza con n=2. Se obtienen xij observaciones j del batch i.

    1. Para cada batch se calcula

    n

    j

    iji nixn

    x1

    ,....2,11

    2. Luego se calcula la media

    m

    i

    ixm

    x1

    1

    3. Se calcula la varianza

    m

    i

    i xxm

    xVar1

    2

    1

    1)(

  • SIMULACIN UNIDAD 6 pg. 14

    Se aumenta n y se repite desde las etapas 1 hasta 3 para n = 2,4,5...r. Se grafica la varianza como funcin del tamao batch n. La longitud del transiente se determina cuando el valor de n muestra una varianza que comienza a decrecer. Suponer que la longitud del transiente es T. Si el tamao batch n es n mayor varianza. - A n > T la primera media es ligeramente diferente pero las siguientes comienzan a parecerse, por lo cual la

    varianza disminuye.

    Simulaciones terminantes Hay simulaciones que nunca alcanzan el estado estacionario, siempre estn en estado transiente. Por ejemplo, en una red la transferencia de pequeos paquetes, de 1 a 3 nunca interese para grandes archivos. Por lo que se necesita estudiar el estado transiente. Eso implica las simulaciones terminales. A veces suceden cosas parecidas a las condiciones finales. El sistema al final de la simulacin no interesa o no alcanza al estado estacionario, por lo que hay que excluir esta informacin. El mtodo es similar a las condiciones iniciales. Hay que tener cuidado con el manejo de las entidades al final de la simulacin. Los tiempos de servicio: slo se consideran los que completaron el servicio. Tiempos de espera: slo interesan los que completaron la espera y comienzan con la ejecucin. La longitud de cola no es igual a la suma de las longitudes de cola en cada evento dividida por el nmero total de eventos, sino es la longitud de cola ponderada en el tiempo:

    Longitud promedio de cola Q = T

    dttQT 0

    )(1

    Criterios de parada (stop) Longitud de simulacin: se corre el simulador o el programa hasta alcanzar un intervalo de confianza deseado.

    Si la media es x y la varianza Var( x ) un 100(1-)% de la media es:

    )(2/1 xVarzx

    La varianza de la media de la muestra de n observaciones independientes es: Var( x ) = Var(x)/n . Esto es cierto si las observaciones son independientes cosa que en simulacin no ocurre: las observaciones no son independientes.

    Si el tiempo de espera para el trabajo i es grande, para el trabajo i+1 es mucho ms grande an y viceversa. Hay una correlacin entre las observaciones. Para estos casos se aplican tres mtodos: repeticiones independientes, medias batch y regeneracin. Los dos primeros son parecidos a la eliminacin del transiente.

    Repeticiones independientes Se repite la simulacin con distintas semillas. La hiptesis es que las medias de repeticiones independientes son independientes aunque las observaciones en una repeticin simple estn correlacionadas. Se hacen m repeticiones de tamao n+n0 cada una donde n0 es la longitud de la fase transiente. Las primeras n0 observaciones de cada repeticin se descartan.

    1. Para cada repeticin se calcula

    nn

    njiji njx

    nx

    0

    0 1

    ,....2,11

  • SIMULACIN UNIDAD 6 pg. 15

    2. Luego se calcula la media total para todas las repeticiones

    m

    i

    ixm

    x1

    1

    3. Se calcula la varianza de las medias repetidas

    m

    i

    i xxm

    xVar1

    2

    1

    1)(

    4. Se calcula el intervalo de confianza para la respuesta media:

    )(2/1 xVarzx

    Se descartan las mn0 observaciones iniciales.

    El intervalo de confianza (IC) es inversamente proporcional a mn Por lo que a IC ms pequeo, si >m o >n, pero para reducir mn0 residuos, m debe ser pequeo, aprox. 10. La longitud de las repeticiones n debera incrementarse para aumentar el IC. El n correcto surge de la covarianza de medias batch sucesivas:

    ))((2

    1),( 1

    1

    1

    1 xxxxm

    xxCov im

    i

    ii

    es una auto covarianza, por lo que m y n son miembros del mismo conjunto. Se repite el anlisis hasta que hay un n donde la auto covarianza de las medias batch es pequea comparada

    con sus varianzas. Mtodos de la regeneracin Por ejemplo sea una simulacin de escalado de una CPU simple. El inicio es una cola de trabajos vaca. A menudo se vuelve al estado inicial (cola vaca). Despus de este estado no hay dependencia de la historia previa. El tiempo de espera depende de los trabajos previos pero despus de un intervalo donde la CPU estuvo vaca no depende de estos trabajos previos. El sistema toma un nacimiento totalmente independiente de su vida previa. Por lo tanto hay una regeneracin. Dnde se produce? El punto de regeneracin es el instante en el cual el sistema entra en fase independiente. La duracin de tiempo entre dos puntos de regeneracin es un ciclo de regeneracin. En cada ciclo las respuestas no estn correlacionadas. El sistema regenerativo se puede analizar as: si el sistema tiene dos colas, se regenerara cuando las dos estn vacas. A mayores colas, la regeneracin es ms rara y los ciclos son ms largos. El sistema se torna no regenerativo, tienen memoria ms larga. El clculo de la varianza es ms complejo que los dos mtodos anteriores. Los ciclos donde distintas longitudes. Los promedios de los ciclos son relaciones con bases distintas (longitudes de ciclos.). Suponemos que tenemos una simulacin regenerativa de m ciclos de tamaos n1, n2, ...,nm.

    Las medias de los ciclos son

    in

    jij

    i

    i njxn

    x1

    ,....2,11

    La media total para todas las repeticiones

    m

    i

    ixm

    x1

    1

  • SIMULACIN UNIDAD 6 pg. 16

    En cambio se deben calcular las sumas de los ciclos:

    in

    jiji xy

    1

    La media total es

    m

    ii

    m

    ii

    n

    y

    x

    1

    1

    Se hace la diferencia wi = yi ni x i=1,2,....m Sumas observadas sumas esperadas.

    Se calcula la varianza de las diferencias

    m

    iiw w

    mSwVar

    1

    22

    1

    1)(

    Se hace el clculo de la longitud media del ciclo:

    m

    iin

    mn

    1

    1

    El IC es mn

    Szx w2/1

    No requiere eliminar las observaciones transientes. No hay residuos pero... Las longitudes del ciclo son impredecibles. No es posible planear el tiempo de simulacin de antemano. Encontrar el punto de regeneracin no es fcil. Muchas tcnicas de reduccin de varianza no pueden usarse porque las longitudes de los ciclos son variables. Los estimadores de medias y variancias son parciales porque los valores esperados de una muestra aleatorio no son iguales a la cantidad que se est estimando. Otros mtodos son aproximacin autoregresiva y anlisis espectral.

    Tcnica de reduccin de la varianza. El control de corrientes de los nmeros aleatorios para introducir correlacin en las observaciones sucesivas de tal forma que la varianza de los resultados va disminuyendo.