box jenkins

METODOLOGÍA BOX-JENKINS

SERIE TEMPORAL(Datos)

¿Es estacionaria la Serie?

Estimación de Parámetros del Modelo

Determinación de p, q, P, Q.

Selección ded, D y l

Transformación de la Serie

¿Es el Modelo adecuado?

Obtención de las predicciones

Evaluación de las Predicciones ¿Predice de forma satisfactoria?

NO

NO

NO

SI

SI

PREDICCION

EVALUACION

ESTIMACION

IDENTIFICACION

IDENTIFICACIÓN

ETAPAS

Análisis de ESTACIONARIEDAD.

Estacionariedad

en Media (valor para

d)

Estacionariedad

en Varianza (Logaritmo

s)

Determinación de la estructura ARMA que

subyace en la transformación estacionaria de la serie.

ANÁLISIS DE ESTACIONARIEDAD.

• Análisis Gráfico de la serie original y de distintas transformaciones de la misma.

• Análisis de los Correlogramas de la serie original y de distintas trans-formaciones de la misma

• Análisis de la Varianza Muestral (Sobre-diferenciación)• Contrastes de Orden de Integración

Instrumentos

• Es recomendable hacer una inter-pretación CONJUNTA de los resul-tados.

• Es posible que se produzcan CONTRA-DICCIONES entre los diferentes instru-mentos.

Observaciones

ANALISIS DE LOS CORRELOGRAMASEstructuras típicas

E S TA C I O N A R I O

N O E S TA C I O N A R I O

• A medida que nos aproximemos al orden de DIFERENCIACION adecuado, la varianza muestral tenderá a disminuir.

• Si superamos el orden de DIFERENCIACION adecuado, la varianza muestral tenderá a aumentar.

En general

ANALISIS DE LA VARIANZA MUESTRAL (SOBRE-DIFERENCIACIÓN)

En general vamos a trabajar bajo el principio de INVERTIBILIDAD lo que nos permite disponer de una representación autoregresiva para cualquier proceso ARIMA:

Contrastes de RAÍCES UNITARIAS o de ORDEN DE INTEGRACIÓN

En conexión con la observación anterior, debe recordarse que un polinomio de orden R siempre puede descomponerse como el producto de R binomios. Esto es:

El orden de integración indica

el número de veces que es necesario diferenciar una

serie para convertirla en

estacionaria.

Planteado de otra forma, indica

el número de RAICES UNITARIAS existentes en el polinomio AR asociado;

esto es:

Analizar el orden de integración

puede entenderse como equivalente

a examinar el número de raíces

unitarias existentes en la

representación AR de la serie.

Sin embargo, contamos con el

PROBLEMA de que tan apenas

conocemos nada acerca del PROCESO

GENERADOR DE DATOS (PGD)

de la serie.

Por ello, necesitamos desarrollar

planteamientos flexibles y generales.

•Selección del Modelo ó PGD de referencia.•Obtención de la ecuación de contraste.•Obtención del estadístico de prueba del contraste de integración.•Resolución del contraste.•Iteración, si procede, hasta alcanzar una conclusión definitiva.

PROCEDIMIENTO DE CONTRASTE

Selección del Modelo ó PGD de Referencia.

Vamos a considerar solo tres grupos de modelos, de modo que adscribiremos la serie analizada necesariamente a uno de ellos.

Obtención de la Ecuación de Contraste.

Una vez seleccionado el PGD que mejor parece ajustarse a la serie, se obtendrá la ecuación de contraste asociada:

En cualquiera de los tres casos, si el término vt no es un AR(1), bien porque se trate de un AR(p) con p>1, de un MA(q) o de un proceso ARMA(p,q), en la ecuación de contraste resultante intervendrá una estructura dinámica más extensa.

Obtención del Estadístico de Prueba del Contraste de Integración.

Para obtener el estadístico del contraste de Dickey-

Fuller relativo al orden de integración de la serie se

debe estimar previamente la ecuación de contraste seleccionada en la etapa

anterior por MCO.

La hipótesis nula y el estadístico de contraste son:

H0 implica que existe, al

menos, una raíz unitaria frente a la

alternativa que indica que la

serie, original o transformada,

es estacionaria.

El estadístico del contraste t del coeficiente que

acompaña al primer retardo

de la serie yt que aparece en la parte derecha de la ecuación

(esto es, de yt-1).

La distribución de este

estadístico no es estándar (no

es una t de Student ni alcanza la

normalidad en un contexto asintótico).

Resolución del Contraste

El PGD seleccionado para describir la serie debe ser aceptable.

El requisito mínimo es que los residuos obtenidos no presenten estructura de dependencia temporal, lo cual indicaría que el término vt

no es un AR(1) como habíamos supuesto.

Para analizar el supuesto de incorrelación en los residuos utilizaremos el contraste de Anderson o el de Ljung-Box.

Si se detecta dependencia temporal en los residuos de la estimación, trataremos de corregir este problema incluyendo sucesivos términos dinámicos en la parte derecha de la ecuación.

Por ejemplo, se el MODELO B:

Esta ecuación se estimará por MCO

y se volverán a analizar los residuos asociados.

Si persiste el problema se introducirán nuevos términos dinámicos hasta llegar a una

ecuación en la que esa relación de dependencia

temporal haya desaparecido

La H0 y alternativa así como el estadístico de contraste son los mismos.

Sin embargo, en este caso hablaremos del estadístico de Dickey-Fuller Aumentado.

• La distribución de probabilidad del estadístico del contraste no es estándar, aunque se encuentra tabulada, los puntos críticos del contraste varían con el tamaño de la muestra y con el PGD, y coinciden para el tDF y para tDFA.

• El valor de p en la ecuación del estadístico DFA debe ser suficiente para corregir los posibles problemas de correlación temporal en los residuos. Valores demasiado elevados nos deben inducir a sospechar de que el PGD seleccionado quizá no sea el más adecuado.

Observaciones

Iteración, si Procede, Hasta Alcanzar una Conclusión Definitiva.

• Se analizará la serie en niveles, yt. Si se rechaza la H0, ya se puede proponer una decisión: la serie es I(0). Por el contrario, si se acepta la H0, podemos decir que hemos detectado una raíz unitaria. En tal caso, debemos iterar.

• En caso de aceptar la H0 sobre la serie en niveles, actuaremos sobre la primera diferencia de la serie, Δyt. Repetiremos todo el proceso para concluir aceptando o rechazando la H0. En caso de rechazo, finalizamos el proceso identificando la serie como I(1). Si volvemos a aceptar la H0, podemos decir que hemos detectado al menos dos raíces unitarias. Continuaríamos iterando.

• A continuación intervendríamos sobre la segunda diferencia de la serie, Δ2yt. Volveremos a repetir toda la discusión anterior.

• No parece muy razonable obtener órdenes de integración elevados: I(2) ó I(3) deben ser valores suficientes.Para determinar el orden de integración de

una serie utilizando esta estrategia deberá enlazarse una secuencia de contrastes:

IDENTIFICACIÓN DE LOS PROCESOS ESTOCÁSTICOS ESTACIONARIOS

Se trata de identificar la estructura ARMA

IDENTIFICACIÓN DE LA FAMILIA GENÉRICA A LA QUE PUEDE ADSCRIBIRSE

EL PGD DE LA SERIE, COMO:

Esta parte del proceso de identificación se resolverá en dos etapas:

IDENTIFICADA LA FAMILIA GENÉRICA A LA QUE PARECE ADSCRIBIRSE EL PGD DE LA SERIE, DAREMOS VALOR A LOS PARÁMETROS TODAVÍA DESCONOCIDOS:

La primera etapa se resolverá atendiendo

a la forma de los correlogramas

muestrales obtenidos para la serie y al Régimen de Identificación.

En la segunda etapa se utilizarán

secuencias de contrastes

específicos.

DETERMINACIÓN DEL ORDEN q DE LA MEDIA MÓVIL

Utilizaremos el resultado de Barlett el cual nos permite decir que los coeficientes de autocorrelación muestral de una serie MA(q) verifican:

Utilizando este resultado, desarrollaremos un proceso iterativo:

En caso de rechazar la H0 anterior, continuaremos:

DETERMINACIÓN DEL ORDEN p DEL AUTORREGRESIVO

utilizaremos el resultado de Quenouilli el cual nos permite decir que los coeficientes de Autocorrelación parcial muestral de una serie AR(p) verifican:

Utilizando este resultado, desarrollaremos un proceso iterativo:

En caso de rechazar la H0 anterior, continuaremos:

DETERMINACIÓN DE LA ESCALA DEL PROCESO

Para concluir la

identificación resta por

discutir si en la ecuación

debe incluirse un término constante.

Si la respuesta es afirmativa,

el valor esperado de la serie (original o transformada) será diferente de cero y cero

en caso contrario.

La discusión la resolveremos

utilizado la media

muestral de la serie. Es

inmediato verificar que:

siendo w la media muestral de wt.

Aplicando el Teorema del Limite Central:

El estadístico de contraste es de tipo t:

ESTIMACIÓN

Una vez identificados los posibles procesos estocásticos generadores de la serie temporal objeto de estudio:

Se trata de obtener los mejores estimadores posibles de los parámetros del modelo:

Entre los dos métodos de estimación (MCO y MV), el

método MV está especialmente

recomendado ya que, bajo ciertas condiciones, cumple propiedades asintóticas óptimas.

Entre los problemas de estos algoritmos se

encuentran:

EVALUACIÓN

Análisis de ResiduosEstamos trabajando bajo el supuesto de:

• Media nula• Varianza constante: homocedasticidad• Independencia, no autocorrelación• Distribución normal

A partir del análisis de los residuos del modelo

estimado, NO puede aceptarse alguna de las anteriores hipótesis, el

modelo debe ser reformulado. MEDIA NULA

Inspección gráfica de la evolución de la serie de

residuos, ut.

Contraste de significatividad sobre el

valor esperado de la media de la serie de

residuos

De forma análoga al contraste para la determinación de la escala del proceso

El estadístico de contraste es de tipo t:

SOLUCIÓN AL PROBLEMA: ¿TÉRMINO INDEPENDIENTE?VARIANZA CONSTANTE: HOMOCEDASTICIDADInspección gráfica de la

evolución de la serie de residuos.

Contraste de la H0 de homocedasticidad, bajo una

estructura ARCH (Heteroscedasticidad

Condicional autorregresiva)

En general, ARCH (p):

Pasos:

Estimo R.A.:

Obtengo el R2

1

2

3

4

SOLUCIÓN AL PROBLEMA: ¿TRANSFORMACIÓN LOGARÍTMICA?

INDEPENDENCIA: NO AUTOCORRELACIÓN

Independencia: covarianzas nulas:

No autocorrelación para todo retardo:

Co ntraste de S ignifi cati v idad Indiv idua l De cada uno de los coeficientes de la FAC de la serie de residuos, ut :

Pasos:

1

2

3

Anderson (1942):

Co ntraste de S ignifi cati v idad Co njunta De los M coeficientes de la FAC de la serie de residuos, ut :

Pasos:

1

2

3

Utilización de los estadísticos de:

Donde, k es el no. de parámetros del modelo estimado (incluída la constante).

El estadístico de Ljung-Box permite disminuir el sesgo en muestras pequeñas

SOLUCIÓN AL PROBLEMA: IDENTIFICAR LA SERIE DE RESIDUOS Y ACTUAR EN CONSECUENCIA SOBRE EL MODELO ARIMA DE PARTIDA

DISTRIBUCIÓN NORMAL

Pasos:

1

2

3

Estadístico de Jarque- Bera (JB):

Donde g1 y g2 son los coeficientes de asimetría y curtosis de la serie de residuos, respectivamente:

Se fija un nivel de significación ε.

SOLUCIÓN AL PROBLEMA: ¿TRANSFORMACIÓN LOGARÍTMICA?

Análisis de Coeficientes

ESTACIONARIEDAD E INVERTIBILIDAD

Se trata de comprobar que el polinomio autoregresivo estimado, f(L), satisface la condición de estacionariedad y que el polinomio media móvil estimado, q(L), cumple la de invertibilidad.

• Si el modelo NO es ESTACIONARIO: Síntoma de que necesitamos diferenciar una vez más.

• Si el modelo NO es INVERTIBLE: Síntoma de sobre-diferenciación.

Solución al problema:

CONTRASTE DE SIGNIFICATIVIDAD INDIVIDUAL DE LOS COEF. ESTIMADOS

Pasos:

1

2

3 Contrastamos:

SOLUCIÓN AL PROBLEMA: ELIMINAR PARÁMETROS NO SIGNIFICATIVOS

BONDAD DEL AJUSTE

Mejor ajuste cuanto menor sea el valor de σ2 .

No es una medida definitiva para comparar modelos.

ANÁLISIS DE PERMANENCIA ESTRUCTURAL

En ocasiones, la serie observada a lo largo del tiempo ha sido generada por un mismo proceso pero los coeficientes pueden haber cambiado, con lo que las predicciones realizadas con el modelo estimado con la muestra total serán erróneas.

• Suponga que se ha identificado un modelo ARMA(1,1) con constante (1):

• Si los parámetros fueran estables a lo largo de toda la muestra, T

Test de CHOW: 1t1t1t1t uuyy

Pero podría ocurrir que los parámetros NO permanecieran estables.

En caso se dice que existe RUPTURA ESTRUCTURAL.

Puede haber una o más rupturas estructurales.

(Supongamos que existe una única ruptura)

Dicha ruptura se produce en un determinado

momento tal que hay T1 observaciones hasta

dicho período y T2

observaciones desde el mismo (y hasta T).

En tal caso, se ajustarían dos procesos

ARMA(1,1), pero con diferentes parámetros:

Estimo el modelo para las dos submuestras definidas y obtengo sus

respectivas sumas residuales cuadrados:

SR1: Suma residual del modelo estimado con la primera submuestra,

t=1,2,...,T1, [ecuación 2]:

Con los T1 primeros datos (2):

Con los T2 datos (T-T1) restantes(3):

CONTRASTE DE CHOW

Pasos:

1

2 Etapas: Estimo el modelo con todas las observaciones (t=1,2,...,T)

[ecuación 1] y obtengo la suma residual (SR):

u1t el residuo t-ésimo.

Siendou1t el residuo t-ésimo del modelo estimado.

3

SR2: Suma residual del modelo estimado con la primera submuestra,

t=T1+1,...,T, [ecuación 3]: u2t el residuo t-ésimo.

El estadístico de Chow se calcula como:

La generalización de FCHOW al caso de p puntos de ruptura es inmediata:

PREDICCIÓNPREDICCIÓN PUNTUAL

El predictor óptimo es el que minimiza el error cuadrático medio, condicionado a la información existente hasta el periodo T:

Se supondrá que las perturbaciones se conocen para el período muestral, siendo ruido blanco para periodos posteriores:

Calcularemos las predicciones puntuales y los errores de predicción en los modelos MA(2) y AR(2) y extenderemos al caso general de un ARMA (p,q).

Predicción con un MA(2)

Predicción puntual y error de predicción 1 período adelante:



Para todo 1>2 (orden de media móvil):

Superado el orden

del proces

o la predicc

ión coincide con

el valor

esperado del proceso: E(yt)

= δ

En consecuencia, con un MA(2), tiene

sentido predecir como máxim

o 2 períodos hacia adelant

e.

Predicción con un AR(2)




Para todo 1>2 (orden autorregresivo):

En general,

se demuestr

a que conforme

se aumenta

el horizonte

de predicción

, la predicción

puntual tiende

hacia el valor

esperado del

proceso:

Predicción con un Modelo ARMA(p, q)

Se efectúa siguiendo las pautas descritas, pero utilizando el modelo que resulta tras despejar la variable en niveles objeto de estudio. Por ejemplo:

Esta ecuación es la que se empleará para

generar las predicciones puntuales

que sean necesarias.

La obtención de las expresiones

correspondientes al error de predicción

asociada se realizará siguiendo el mismo

proceso que en los casos anteriores.

En muchas expresiones empleadas hasta ahora aparecen los términos uT, uT-1, uT-2… que hemos considerado como información disponible para el usuario.

Para obtenerlos numéricamente podemos hacerlos corresponder con los residuos correspondientes al periodo en cuestión o tratarlos como los errores e predicción un periodo hacia adelante:

La segunda opción, siempre que sea aplicable, parece preferible a la primera.

PREDICCIÓN POR INTERVALO: CONTRASTE DE PERMANENCIA ESTRUCTURAL

Error de Predicción:

Distribución del Error :

Predicción por Intervalos:

Contraste de permanencia estructural en la predicción: a través del IC calculado o el contraste de hipótesis equivalente:

Pasos:

1

2

3

PREDICCIÓN A PARTIR DE DATOS EN FORMA LOGARÍTMICA

Tomaremos como ejemplo un modelo AR(2) sobre la transformación logarítmica de la variable original:

Predicción Puntual

Predicción puntual y error de predicción de la serie en logaritmos:

Esta predicción sólo es útil si estamos interesados en predecir tasas de variación porcentual:

Representa el incremento porcentual previsto en la serie original, yt, entre el periodo T y el T+l.

Predicción puntual y error de predicción de la serie original:

No es correcto plantear:

El resultado apropiado es:

Predicción por Intervalo

Predicción por Intervalos para la serie en logaritmos:

Predicción por Intervalos para la serie original:

EVALUACIÓN CUANTITATIVA DE LAS PREDICCIONES

Estimaremos el modelo con las primeras T-H

observaciones.

La medición de los errores cometidos al efectuar, en base a él, las predicciones

para los H periodos reservados:

Error Cuadrático Medio (ECM):

Error Absoluto Medio (EAM):

Error Absoluto Porcentual Medio (EAPM):

Coeficiente de Desigualdad de Theil:

Descomposición del Error Cuadrático Medio (ECM)

La capacid

ad predicti

va de nuestro modelo

será mejor cuanto

más cerca de cero se encuentren las cuatro medida

s anterior

es (ECM, EAM,

EAPM, CDT)

Siendo:

σy ,σy : desviación típica de la serie de predictores y de la serie original, respectivamente:

ry,y coeficiente de correlación entre ambas series (de valores observados y de valores predichos):

Proporción de Sesgo:

Proporción de la Varianza:

Proporción Residual:

La situación óptima es que: UM y UV ≈0; UR ≈ 1

box jenkins

Documents