box jenkins
TRANSCRIPT
METODOLOGÍA BOX-JENKINS
SERIE TEMPORAL(Datos)
¿Es estacionaria la Serie?
Estimación de Parámetros del Modelo
Determinación de p, q, P, Q.
Selección ded, D y l
Transformación de la Serie
¿Es el Modelo adecuado?
Obtención de las predicciones
Evaluación de las Predicciones ¿Predice de forma satisfactoria?
NO
NO
NO
SI
SI
PREDICCION
EVALUACION
ESTIMACION
IDENTIFICACION
IDENTIFICACIÓN
ETAPAS
Análisis de ESTACIONARIEDAD.
Estacionariedad
en Media (valor para
d)
Estacionariedad
en Varianza (Logaritmo
s)
Determinación de la estructura ARMA que
subyace en la transformación estacionaria de la serie.
ANÁLISIS DE ESTACIONARIEDAD.
• Análisis Gráfico de la serie original y de distintas transformaciones de la misma.
• Análisis de los Correlogramas de la serie original y de distintas trans-formaciones de la misma
• Análisis de la Varianza Muestral (Sobre-diferenciación)• Contrastes de Orden de Integración
Instrumentos
• Es recomendable hacer una inter-pretación CONJUNTA de los resul-tados.
• Es posible que se produzcan CONTRA-DICCIONES entre los diferentes instru-mentos.
Observaciones
ANALISIS DE LOS CORRELOGRAMASEstructuras típicas
E S TA C I O N A R I O
N O E S TA C I O N A R I O
• A medida que nos aproximemos al orden de DIFERENCIACION adecuado, la varianza muestral tenderá a disminuir.
• Si superamos el orden de DIFERENCIACION adecuado, la varianza muestral tenderá a aumentar.
En general
ANALISIS DE LA VARIANZA MUESTRAL (SOBRE-DIFERENCIACIÓN)
En general vamos a trabajar bajo el principio de INVERTIBILIDAD lo que nos permite disponer de una representación autoregresiva para cualquier proceso ARIMA:
Contrastes de RAÍCES UNITARIAS o de ORDEN DE INTEGRACIÓN
En conexión con la observación anterior, debe recordarse que un polinomio de orden R siempre puede descomponerse como el producto de R binomios. Esto es:
El orden de integración indica
el número de veces que es necesario diferenciar una
serie para convertirla en
estacionaria.
Planteado de otra forma, indica
el número de RAICES UNITARIAS existentes en el polinomio AR asociado;
esto es:
Analizar el orden de integración
puede entenderse como equivalente
a examinar el número de raíces
unitarias existentes en la
representación AR de la serie.
Sin embargo, contamos con el
PROBLEMA de que tan apenas
conocemos nada acerca del PROCESO
GENERADOR DE DATOS (PGD)
de la serie.
Por ello, necesitamos desarrollar
planteamientos flexibles y generales.
•Selección del Modelo ó PGD de referencia.•Obtención de la ecuación de contraste.•Obtención del estadístico de prueba del contraste de integración.•Resolución del contraste.•Iteración, si procede, hasta alcanzar una conclusión definitiva.
PROCEDIMIENTO DE CONTRASTE
Selección del Modelo ó PGD de Referencia.
Vamos a considerar solo tres grupos de modelos, de modo que adscribiremos la serie analizada necesariamente a uno de ellos.
Obtención de la Ecuación de Contraste.
Una vez seleccionado el PGD que mejor parece ajustarse a la serie, se obtendrá la ecuación de contraste asociada:
En cualquiera de los tres casos, si el término vt no es un AR(1), bien porque se trate de un AR(p) con p>1, de un MA(q) o de un proceso ARMA(p,q), en la ecuación de contraste resultante intervendrá una estructura dinámica más extensa.
Obtención del Estadístico de Prueba del Contraste de Integración.
Para obtener el estadístico del contraste de Dickey-
Fuller relativo al orden de integración de la serie se
debe estimar previamente la ecuación de contraste seleccionada en la etapa
anterior por MCO.
La hipótesis nula y el estadístico de contraste son:
H0 implica que existe, al
menos, una raíz unitaria frente a la
alternativa que indica que la
serie, original o transformada,
es estacionaria.
El estadístico del contraste t del coeficiente que
acompaña al primer retardo
de la serie yt que aparece en la parte derecha de la ecuación
(esto es, de yt-1).
La distribución de este
estadístico no es estándar (no
es una t de Student ni alcanza la
normalidad en un contexto asintótico).
Resolución del Contraste
El PGD seleccionado para describir la serie debe ser aceptable.
El requisito mínimo es que los residuos obtenidos no presenten estructura de dependencia temporal, lo cual indicaría que el término vt
no es un AR(1) como habíamos supuesto.
Para analizar el supuesto de incorrelación en los residuos utilizaremos el contraste de Anderson o el de Ljung-Box.
Si se detecta dependencia temporal en los residuos de la estimación, trataremos de corregir este problema incluyendo sucesivos términos dinámicos en la parte derecha de la ecuación.
Por ejemplo, se el MODELO B:
Esta ecuación se estimará por MCO
y se volverán a analizar los residuos asociados.
Si persiste el problema se introducirán nuevos términos dinámicos hasta llegar a una
ecuación en la que esa relación de dependencia
temporal haya desaparecido
La H0 y alternativa así como el estadístico de contraste son los mismos.
Sin embargo, en este caso hablaremos del estadístico de Dickey-Fuller Aumentado.
• La distribución de probabilidad del estadístico del contraste no es estándar, aunque se encuentra tabulada, los puntos críticos del contraste varían con el tamaño de la muestra y con el PGD, y coinciden para el tDF y para tDFA.
• El valor de p en la ecuación del estadístico DFA debe ser suficiente para corregir los posibles problemas de correlación temporal en los residuos. Valores demasiado elevados nos deben inducir a sospechar de que el PGD seleccionado quizá no sea el más adecuado.
Observaciones
Iteración, si Procede, Hasta Alcanzar una Conclusión Definitiva.
• Se analizará la serie en niveles, yt. Si se rechaza la H0, ya se puede proponer una decisión: la serie es I(0). Por el contrario, si se acepta la H0, podemos decir que hemos detectado una raíz unitaria. En tal caso, debemos iterar.
• En caso de aceptar la H0 sobre la serie en niveles, actuaremos sobre la primera diferencia de la serie, Δyt. Repetiremos todo el proceso para concluir aceptando o rechazando la H0. En caso de rechazo, finalizamos el proceso identificando la serie como I(1). Si volvemos a aceptar la H0, podemos decir que hemos detectado al menos dos raíces unitarias. Continuaríamos iterando.
• A continuación intervendríamos sobre la segunda diferencia de la serie, Δ2yt. Volveremos a repetir toda la discusión anterior.
• No parece muy razonable obtener órdenes de integración elevados: I(2) ó I(3) deben ser valores suficientes.Para determinar el orden de integración de
una serie utilizando esta estrategia deberá enlazarse una secuencia de contrastes:
IDENTIFICACIÓN DE LOS PROCESOS ESTOCÁSTICOS ESTACIONARIOS
Se trata de identificar la estructura ARMA
IDENTIFICACIÓN DE LA FAMILIA GENÉRICA A LA QUE PUEDE ADSCRIBIRSE
EL PGD DE LA SERIE, COMO:
Esta parte del proceso de identificación se resolverá en dos etapas:
IDENTIFICADA LA FAMILIA GENÉRICA A LA QUE PARECE ADSCRIBIRSE EL PGD DE LA SERIE, DAREMOS VALOR A LOS PARÁMETROS TODAVÍA DESCONOCIDOS:
La primera etapa se resolverá atendiendo
a la forma de los correlogramas
muestrales obtenidos para la serie y al Régimen de Identificación.
En la segunda etapa se utilizarán
secuencias de contrastes
específicos.
DETERMINACIÓN DEL ORDEN q DE LA MEDIA MÓVIL
Utilizaremos el resultado de Barlett el cual nos permite decir que los coeficientes de autocorrelación muestral de una serie MA(q) verifican:
Utilizando este resultado, desarrollaremos un proceso iterativo:
En caso de rechazar la H0 anterior, continuaremos:
DETERMINACIÓN DEL ORDEN p DEL AUTORREGRESIVO
utilizaremos el resultado de Quenouilli el cual nos permite decir que los coeficientes de Autocorrelación parcial muestral de una serie AR(p) verifican:
Utilizando este resultado, desarrollaremos un proceso iterativo:
En caso de rechazar la H0 anterior, continuaremos:
DETERMINACIÓN DE LA ESCALA DEL PROCESO
Para concluir la
identificación resta por
discutir si en la ecuación
debe incluirse un término constante.
Si la respuesta es afirmativa,
el valor esperado de la serie (original o transformada) será diferente de cero y cero
en caso contrario.
La discusión la resolveremos
utilizado la media
muestral de la serie. Es
inmediato verificar que:
siendo w la media muestral de wt.
Aplicando el Teorema del Limite Central:
El estadístico de contraste es de tipo t:
ESTIMACIÓN
Una vez identificados los posibles procesos estocásticos generadores de la serie temporal objeto de estudio:
Se trata de obtener los mejores estimadores posibles de los parámetros del modelo:
Entre los dos métodos de estimación (MCO y MV), el
método MV está especialmente
recomendado ya que, bajo ciertas condiciones, cumple propiedades asintóticas óptimas.
Entre los problemas de estos algoritmos se
encuentran:
EVALUACIÓN
Análisis de ResiduosEstamos trabajando bajo el supuesto de:
• Media nula• Varianza constante: homocedasticidad• Independencia, no autocorrelación• Distribución normal
A partir del análisis de los residuos del modelo
estimado, NO puede aceptarse alguna de las anteriores hipótesis, el
modelo debe ser reformulado. MEDIA NULA
Inspección gráfica de la evolución de la serie de
residuos, ut.
Contraste de significatividad sobre el
valor esperado de la media de la serie de
residuos
De forma análoga al contraste para la determinación de la escala del proceso
El estadístico de contraste es de tipo t:
SOLUCIÓN AL PROBLEMA: ¿TÉRMINO INDEPENDIENTE?VARIANZA CONSTANTE: HOMOCEDASTICIDADInspección gráfica de la
evolución de la serie de residuos.
Contraste de la H0 de homocedasticidad, bajo una
estructura ARCH (Heteroscedasticidad
Condicional autorregresiva)
En general, ARCH (p):
Pasos:
Estimo R.A.:
Obtengo el R2
1
2
3
4
SOLUCIÓN AL PROBLEMA: ¿TRANSFORMACIÓN LOGARÍTMICA?
INDEPENDENCIA: NO AUTOCORRELACIÓN
Independencia: covarianzas nulas:
No autocorrelación para todo retardo:
Co ntraste de S ignifi cati v idad Indiv idua l De cada uno de los coeficientes de la FAC de la serie de residuos, ut :
Pasos:
1
2
3
Anderson (1942):
Co ntraste de S ignifi cati v idad Co njunta De los M coeficientes de la FAC de la serie de residuos, ut :
Pasos:
1
2
3
Utilización de los estadísticos de:
Donde, k es el no. de parámetros del modelo estimado (incluída la constante).
El estadístico de Ljung-Box permite disminuir el sesgo en muestras pequeñas
SOLUCIÓN AL PROBLEMA: IDENTIFICAR LA SERIE DE RESIDUOS Y ACTUAR EN CONSECUENCIA SOBRE EL MODELO ARIMA DE PARTIDA
DISTRIBUCIÓN NORMAL
Pasos:
1
2
3
Estadístico de Jarque- Bera (JB):
Donde g1 y g2 son los coeficientes de asimetría y curtosis de la serie de residuos, respectivamente:
Se fija un nivel de significación ε.
SOLUCIÓN AL PROBLEMA: ¿TRANSFORMACIÓN LOGARÍTMICA?
Análisis de Coeficientes
ESTACIONARIEDAD E INVERTIBILIDAD
Se trata de comprobar que el polinomio autoregresivo estimado, f(L), satisface la condición de estacionariedad y que el polinomio media móvil estimado, q(L), cumple la de invertibilidad.
• Si el modelo NO es ESTACIONARIO: Síntoma de que necesitamos diferenciar una vez más.
• Si el modelo NO es INVERTIBLE: Síntoma de sobre-diferenciación.
Solución al problema:
CONTRASTE DE SIGNIFICATIVIDAD INDIVIDUAL DE LOS COEF. ESTIMADOS
Pasos:
1
2
3 Contrastamos:
SOLUCIÓN AL PROBLEMA: ELIMINAR PARÁMETROS NO SIGNIFICATIVOS
BONDAD DEL AJUSTE
Mejor ajuste cuanto menor sea el valor de σ2 .
No es una medida definitiva para comparar modelos.
ANÁLISIS DE PERMANENCIA ESTRUCTURAL
En ocasiones, la serie observada a lo largo del tiempo ha sido generada por un mismo proceso pero los coeficientes pueden haber cambiado, con lo que las predicciones realizadas con el modelo estimado con la muestra total serán erróneas.
• Suponga que se ha identificado un modelo ARMA(1,1) con constante (1):
• Si los parámetros fueran estables a lo largo de toda la muestra, T
Test de CHOW: 1t1t1t1t uuyy
Pero podría ocurrir que los parámetros NO permanecieran estables.
En caso se dice que existe RUPTURA ESTRUCTURAL.
Puede haber una o más rupturas estructurales.
(Supongamos que existe una única ruptura)
Dicha ruptura se produce en un determinado
momento tal que hay T1 observaciones hasta
dicho período y T2
observaciones desde el mismo (y hasta T).
En tal caso, se ajustarían dos procesos
ARMA(1,1), pero con diferentes parámetros:
Estimo el modelo para las dos submuestras definidas y obtengo sus
respectivas sumas residuales cuadrados:
SR1: Suma residual del modelo estimado con la primera submuestra,
t=1,2,...,T1, [ecuación 2]:
Con los T1 primeros datos (2):
Con los T2 datos (T-T1) restantes(3):
CONTRASTE DE CHOW
Pasos:
1
2 Etapas: Estimo el modelo con todas las observaciones (t=1,2,...,T)
[ecuación 1] y obtengo la suma residual (SR):
u1t el residuo t-ésimo.
Siendou1t el residuo t-ésimo del modelo estimado.
3
SR2: Suma residual del modelo estimado con la primera submuestra,
t=T1+1,...,T, [ecuación 3]: u2t el residuo t-ésimo.
El estadístico de Chow se calcula como:
La generalización de FCHOW al caso de p puntos de ruptura es inmediata:
PREDICCIÓNPREDICCIÓN PUNTUAL
El predictor óptimo es el que minimiza el error cuadrático medio, condicionado a la información existente hasta el periodo T:
Se supondrá que las perturbaciones se conocen para el período muestral, siendo ruido blanco para periodos posteriores:
Calcularemos las predicciones puntuales y los errores de predicción en los modelos MA(2) y AR(2) y extenderemos al caso general de un ARMA (p,q).
Predicción con un MA(2)
Predicción puntual y error de predicción 1 período adelante:
Predicción puntual y error de predicción 2 período adelante:
Predicción puntual y error de predicción 3 período adelante:
Para todo 1>2 (orden de media móvil):
Superado el orden
del proces
o la predicc
ión coincide con
el valor
esperado del proceso: E(yt)
= δ
En consecuencia, con un MA(2), tiene
sentido predecir como máxim
o 2 períodos hacia adelant
e.
Predicción con un AR(2)
Predicción puntual y error de predicción 1 período adelante:
Predicción puntual y error de predicción 2 período adelante:
Predicción puntual y error de predicción 3 período adelante:
Para todo 1>2 (orden autorregresivo):
En general,
se demuestr
a que conforme
se aumenta
el horizonte
de predicción
, la predicción
puntual tiende
hacia el valor
esperado del
proceso:
Predicción con un Modelo ARMA(p, q)
Se efectúa siguiendo las pautas descritas, pero utilizando el modelo que resulta tras despejar la variable en niveles objeto de estudio. Por ejemplo:
Esta ecuación es la que se empleará para
generar las predicciones puntuales
que sean necesarias.
La obtención de las expresiones
correspondientes al error de predicción
asociada se realizará siguiendo el mismo
proceso que en los casos anteriores.
En muchas expresiones empleadas hasta ahora aparecen los términos uT, uT-1, uT-2… que hemos considerado como información disponible para el usuario.
Para obtenerlos numéricamente podemos hacerlos corresponder con los residuos correspondientes al periodo en cuestión o tratarlos como los errores e predicción un periodo hacia adelante:
La segunda opción, siempre que sea aplicable, parece preferible a la primera.
PREDICCIÓN POR INTERVALO: CONTRASTE DE PERMANENCIA ESTRUCTURAL
Error de Predicción:
Distribución del Error :
Predicción por Intervalos:
Contraste de permanencia estructural en la predicción: a través del IC calculado o el contraste de hipótesis equivalente:
Pasos:
1
2
3
PREDICCIÓN A PARTIR DE DATOS EN FORMA LOGARÍTMICA
Tomaremos como ejemplo un modelo AR(2) sobre la transformación logarítmica de la variable original:
Predicción Puntual
Predicción puntual y error de predicción de la serie en logaritmos:
Esta predicción sólo es útil si estamos interesados en predecir tasas de variación porcentual:
Representa el incremento porcentual previsto en la serie original, yt, entre el periodo T y el T+l.
Predicción puntual y error de predicción de la serie original:
No es correcto plantear:
El resultado apropiado es:
Predicción por Intervalo
Predicción por Intervalos para la serie en logaritmos:
Predicción por Intervalos para la serie original:
EVALUACIÓN CUANTITATIVA DE LAS PREDICCIONES
Estimaremos el modelo con las primeras T-H
observaciones.
La medición de los errores cometidos al efectuar, en base a él, las predicciones
para los H periodos reservados:
Error Cuadrático Medio (ECM):
Error Absoluto Medio (EAM):
Error Absoluto Porcentual Medio (EAPM):
Coeficiente de Desigualdad de Theil:
Descomposición del Error Cuadrático Medio (ECM)
La capacid
ad predicti
va de nuestro modelo
será mejor cuanto
más cerca de cero se encuentren las cuatro medida
s anterior
es (ECM, EAM,
EAPM, CDT)
Siendo:
σy ,σy : desviación típica de la serie de predictores y de la serie original, respectivamente:
ry,y coeficiente de correlación entre ambas series (de valores observados y de valores predichos):
Proporción de Sesgo:
Proporción de la Varianza:
Proporción Residual:
La situación óptima es que: UM y UV ≈0; UR ≈ 1