selección automática de modelos econométricos€¦ · selección automática de modelos...
TRANSCRIPT
SelecciónAutomáticadeModelosEconométricos
ComunicaciónSesiónOrdinariaPrivada21demarzo2018
HildegartAhumada
1
SelecciónAutomáticadeModelosEconométricosIntroducción
• Los desarrollos tecnológicos recientes llevaron a la aplicacióndevariosalgoritmos,
• Generalmenteconunsoloobjetivo(MinEMC)osimplementeobtenerunacoleccióndemodelos.
• Unalgoritmodiferenteseríaaquel“imite”lafuncióndeuneconometristasiguiendoundeterminadoenfoquemetodológico.• Autometrics,segúnmiconocimiento,eselúnicoalgoritmoqueautomatizaloqueharíauneconometristasiguiendounadeterminadametodología,enestecaso,ladenominada:Generalaparticular.
2
SelecciónAutomáticadeModelosEconométricosÍndice• QuéeslametodologíaGeneralaParticular
• Unpocodehistoria
• Comparacióndeestrategias
• DescripcióndeAutometrics
• Principalesdesarrollos
• Aplicaciones
• Mirandohaciaelfuturo
3
SelecciónAutomáticadeModelosEconométricosQuéeslametodologíaGeneralaParticular• IniciadaenlaLSEyenlalabordeDavidHendryysus
coautoresparaseriestemporales• Conjuntodecriteriosparalamodelacióneconométrica:
ü Utilizacióntantodelateoríaeconómicacomolosdatosmismoscomofuentedeinformación
ü EvitarSesgosenInconsistenciasporOmisióndevariablesy/orezagos: 𝑦↓𝑡 = 𝛽↓0 + 𝛽↓1 𝑥↓𝑡 + 𝛽↓2 𝑥↓𝑡−1 + 𝛽↓3 𝑦↓𝑡−1 + 𝑢↓𝑡
ü Modelocomoaproximaciónrazonable(vercomportamientode 𝑢↓𝑡 )
ü Modelomásgeneralposibleencuanto:Interdependencias(sistemas),Nolinealidades,ValoresextremosyQuiebres(Dummies)
4
SelecciónAutomáticadeModelosEconométricosUnpocodehistoria1roNOTEMOS:• Desdehacemuchotiempounaaspiracióndeloseconometristas
por:- ahorrodetiempo:(todaslascombinacionesde100variables:2100aprox1030regresiones!)-captarmayorinformación(ymásteorías)-mayorobjetividad
• Diversasestrategiashansidosugeridasperotambiéncriticadas,
principalmentepor“datamining”,quehastahacepocoerauntérminopeyorativoenEconometría.
5
SelecciónAutomáticadeModelosEconométricosUnpocodehistoria• “Datamining”:esteenfoquefuedesacreditadoprincipalmentedespués
delosexperimentosdeLovell(ReviewofEconomicsandStatistics,1983):
0-5verdaderosregresoresescondidosen40variablesusandodiversosalgoritmosdeselección(stepwise:maxR2,t,etc.).• HooverandPerez(EconometricsJournal,1999)mimicDavidHendry´sGtoPperoautomáticamente.Diferencias:tamañodemuestrasmásapropiados,búsquedaporvariassendasytestsdediagnóstico!• H&PmuchomejoresresultadosqueLovell´s
• Autometrics:BasadoenHP(yluegoGets)esunexcelenteejemplodecómolasuperacióndecríticaspuedellevaralprogresocientífico
6
SelecciónAutomáticadeModelosEconométricosComparación
Engrandeslíneaslasestrategiasdeselecciónautomáticapuedendividirseen:
ParticularaGeneral:empezandoporunmodelovacío,iragregandovariableshastaalgúncriteriodeterminación(contribuciónmarginal)+elmodelocompletonotienequeestimarse(perocongruentes?)+permiteinclusióndetérminosnolineales+enprincipioparaK(variables)>T(observaciones)-problemasconinterdependencias
Ejemplos• Stepwise(desdelos60´s):RSS,F,múltiplest,etc.• RETINA(RelevantTransformationoftheinputsnetworkapproach,Perez-
Amaral,etal.2005)• LASSO(LeastAbsoluteShrinkageandSelectionOperators)
7
SelecciónAutomáticadeModelosEconométricosComparación
GeneralaParticular:-Eleccióndelconjuntodeinformacióninicial(modeloinicialcongruente)+Posibilidaddemejoresmétodosestadísticos(likelihood)(?)SeleccióndeP-valoresEjemplos• StepwiseBackwardregressions(1960):sintestsdediagnósticoyfaltade
especificación• Eleccióndeordenesdepolinomiosytérminosauto-regresivos(AR)(Anderson,
1962,1971)• CriteriosdeInformación(AIC,BIC,etc.)• GetsandAutometrics
Híbridos:Autometricsconmásvariablesqueobservaciones
8
SelecciónAutomáticadeModelosEconométricosComparación
ResultadosdeSimulaciones(DoornikandHendry,2014)• Autometrics(Búsquedaeficientedeárbolsegúnestadísticost2
+Testsdediagnósticos)hamostradomejoresresultadosymenorvariabilidadennumerososescenariosconrespectoa:• algoritmosparticularageneral(comostepwiseolasso)y/o• sintestsdediagnóstico.
• Sibienalgunospuedensermejoresenciertoscasos,• Enotrosescenariospuedendarlugartambiénaresultados
extremadamentepobres.
9
SelecciónAutomáticadeModelosEconométricosDescripcióndeAUTOMETRICS
Desde2008:esla3rageneracióniniciadaconGets(2001)
Ø Principaldiferencia:EfficientTREEsearch(enreemplazodeMultiple-pathsearch)
Ø Unadiferencia(queimplicamayorrapidez):noseevalúanlosdiagnostictestsdurantelareducción.
Notarquesuponemoselmodeloinicialescongruente!Sifallanlostestsenelterminal:back-track
10
AUTOMETRICS:referencias
ü DOORNIK,J.A.(2009).'Autometrics',inJ.L.CASTLEANDN.SHEPHARD(ed.),TheMethodologyandPracticeofEconometrics:AFestschriftinHonourofDavidF.Hendry.OxfordUniversityPress,Oxford,pp.88-121.
ü DOORNIK,J.A.andHENDRY,D.F.(2009).'EmpiricalEconometricModelling',PcGive13,Vol.I,Oxmetrics6ed.,TimberlakeConsultantsLtd,London.
ü DOORNIKandHENDRY(2014).EmpiricalModelDiscoveryandTheoryEvaluation:AutomaticSelectionMethodsinEconometrics.ArneRydeMemorialLectures.MITPress.
11
12
SelecciónAutomáticadeModelosEconométricosDescripcióndeAUTOMETRICS
Cuandohaymuchasnosignificativassepuedendisminuirloscostosdebúsqueda:
• Pruning:siempresevaaeliminandounavariableperocuandounavariablenopuedeserremovida,seanulaunnodoysiguientesramasseignoran(pruned).Dependedelniveldesignificanciaysinosepasanlostestsdediagnóstico.
• Bunching:eliminaciónporgrupos
• Chopping:variablesmuyinsignificantespermanentementeeliminadas
13
SelecciónAutomáticadeModelosEconométricosPrincipalesdesarrollosdeAUTOMETRICS
Másvariablesqueobservaciones• T(observaciones)<K(variables)PEROalgunosβi=0talqueK<<T
enelDGP.
• Particiónencongruentesgruposoblockslomásgrandeposibles,C/unoK<<T.
• Sinocongruentes:HACSE
• Estimartodaslascombinacionesdelosgruposi,jparaseleccionarvariables(niveldesignificanciagrande)
• Launióndelasvariablesseleccionadasformaelmodeloinicial
14
SelecciónAutomáticadeModelosEconométricosPrincipalesdesarrollosdeAUTOMETRICSImpulseSaturation• Originalmente:ü Incluirla½delasvariablesindicadoras(000…1…0)para
c/observación.ü Luegolaotra½;ü Combinaryvolveraseleccionar.
• Actualmente:sehacedirectamenteusandoAutometrics
• Generalización:Steps-Tendencias-DummiesMultiplicativas
15
ImpulseSaturation
ü HendryD.F.(1999),“AneconometricanalysisofUSfoodexpenditure,1931-1989”,inMagnus,J.andMorgan,M.(eds.)Methodologyandtacitknowledge:Twoexperimentsineconometrics,341-361,NewYork:Wiley.
ü Hendry,D.F.,S.Johansen,andC.Santos(2008)AutomaticSelectionofIndicatorsinaFullySaturatedRegression,ComputationalStatistics,23,2,317-335.
ü Johansen,S.,andB.Nielsen(2009)AnAnalysisoftheIndicatorSaturationEstimatorasaRobustRegressionEstimator,Chapter1inJ.L.CastleandN.Shephard(eds.)TheMethodologyandPracticeofEconometrics:AFestschriftinHonourofDavidF.Hendry,OxfordUniversityPress,Oxford,1-36.
16
AUTOMETRICS:ImpulseSaturationOUTLIERS(bajoHo)deEricsson,2011
17
AUTOMETRICS:ImpulseSaturationBreaks(bajoH1)deEricsson,2011
18
AUTOMETRICS:algunasaplicaciones
Ø FlexibilizacióndelGVAR(VARconvariablesexternas):paravencerelproblemaladimensionalidadlasvariablesextranjerasseagreganponderadas(porcomercio)ysesuponenexógenas.PerosepuedeevaluarporAutometrics(casoT>K).Ericsson(2011)
Ø Generalizacióndelestudiodesesgodepronóstico(Time-varyingforecastbiases)Ericsson(2012,2014),AhumadayCornejo(2016)paraprónosticodelospreciosdelasoja.
Ø Datosdepanel:Efectosfijosporgrupoytiempoyevaluaciónde
heterogeneidades(poolability)comoenAhumadayCornejo(2014)paraanalizarlosefectoscomunesyespecíficosenlospreciosdeungrupodecommodities.
Ø Estudioderestriccionescuantitativasyregulaciones:comomedidasdeeficienciaenergéticaenmodelodedemanda(AhumadayNavajas,2016)
19
AUTOMETRICS:algunasreferenciasmás
• TestsNolineales:ü Castle,J.L.andD.F.Hendry(2010),‘ALow-DimensionPortmanteauTestforNon-linearity’,
JournalofEconometrics,158(2),pp.231-245.
• BREAKS:ü Castle,J.L.,Doornik,J.A.,&Hendry,D.F.(2012).Modelselectionwhentherearemultiple
breaks.JournalofEconometrics,169(2),239-246.
• SuperExogeneityü Hendry,D.F.,andC.Santos(2010)'AAutomaticTestofSuperExogeneity',
Chapter12inM.W.Watson,T.Bollerslev,andJ.Russell(eds.)VolatilityandTimeSeriesEconometrics:EssaysinHonorofRobertF.Engle,OxfordUniversityPress,Oxford,164.193.
20
SelecciónAutomáticadeModelosEconométricosMirandohaciaelfuturo• Actualmente:sepuedetambiénfijarvariables,aplicar
variablesinstrumentales,hacertestsparaformasfuncionalesnolineales,evaluarexogeneidad,etc.
• Próximamente:seestátrabajandoenextensiónasistemas(cointegración),datosdepanel,etc.
• Innumerablesaplicaciones:quedependansolodelacreatividaddelinvestigadorliberándonosdelprocesodeselecciónquepuedesermuytediosoenunmundointerdependienteyconconjuntosdeinformacióncadavezmásamplios!
21