modelar la concentración de la tierra

90
 Modelar la Concentración de la Tierra en Colombia Mediante Modelos Econométricos Espaciales Diana Jeanneth del Pilar Rodriguez Castillo Código: 832174 Universidad Nacional de Colombia Facultad de Ciencias Departamento de Estadística Bogotá, D. C. Mayo de 2010

Upload: jorgealbertorangel

Post on 05-Nov-2015

22 views

Category:

Documents


0 download

DESCRIPTION

gini tierra

TRANSCRIPT

  • Modelar la Concentracin de la Tierra enColombia Mediante ModelosEconomtricos Espaciales

    Diana Jeanneth del Pilar Rodriguez CastilloCdigo: 832174

    Universidad Nacional de ColombiaFacultad de Ciencias

    Departamento de EstadsticaBogot, D. C.Mayo de 2010

  • Modelar la Concentracin de la Tierra enColombia Mediante ModelosEconomtricos Espaciales

    Diana Jeanneth del Pilar Rodriguez CastilloCdigo: 832174

    Trabajo de tesis para optar al ttulo deMaestra Ciencias Estadstica

    DirectorEdilberto Cepeda C., Ph. D.

    Universidad Nacional de ColombiaFacultad de Ciencias

    Departamento de Estadstica

  • Bogot, D. C.Mayo de 2010

    4

  • ndice general

    Introduccin v

    1. Curva de Lorenz e ndices de concentracin. Tierra privadarural en Colombia 1

    1.1. Curva de Lorenz e ndice de concentracin de Gini . . . . . . 3

    1.2. Clculo de la curva de Lorenz y coeficiente de Gini . . . . . . 5

    1.2.1. Clculo de la curva de Lorenz . . . . . . . . . . . . . . 5

    1.2.2. Clculo del Gini . . . . . . . . . . . . . . . . . . . . . 6

    1.3. Distribucin de tierra en Colombia . . . . . . . . . . . . . . . 7

    1.3.1. Naturaleza de los datos . . . . . . . . . . . . . . . . . 7

    1.3.2. Distribucin de la tierra . . . . . . . . . . . . . . . . . 8

    1.3.3. Mapas de porcentajes . . . . . . . . . . . . . . . . . . 9

    1.4. Anlisis da la distribucin de tierra con el Gini . . . . . . . . 12

    1.4.1. Curva de Lorenz . . . . . . . . . . . . . . . . . . . . . 12

    1.4.2. Clculo del Gini para el ao 2000 . . . . . . . . . . . . 12

    1.4.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . 15

    2. Anlisis exploratorio de datos espaciales 17

    2.1. Heterogeneidad y autocorrelacin espacial . . . . . . . . . . . 20

    i

  • NDICE GENERAL

    2.1.1. Heterogeneidad espacial . . . . . . . . . . . . . . . . . 20

    2.1.2. Autocorrelacin o dependencia espacial . . . . . . . . . 20

    2.1.3. Matriz de pesos espaciales . . . . . . . . . . . . . . . . 21

    2.1.4. Operador de retardo espacial . . . . . . . . . . . . . . 23

    2.2. Autocorrelacin global y local . . . . . . . . . . . . . . . . . . 24

    2.2.1. Contrastes globales de autocorrelacin espacial . . . . 24

    2.2.2. Contrastes locales de autocorrelacin espacial . . . . . 26

    2.3. Mtodos de representacin de la tendencia espacial global enGeoDa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.3.1. Anlisis exploratorio de la dependencia espacial global 28

    2.3.2. Anlisis exploratorio de la dependencia espacial local . 36

    2.3.3. Anlisis exploratorio de datos multivariados . . . . . . 37

    3. Modelacin de la concentracin de tierra en Colombia pormtodos clsicos de econometra espacial 40

    3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    3.2. Modelo de regresin lineal espacial . . . . . . . . . . . . . . . 41

    3.2.1. Estimadores mximo verosmil para el modelo linealgeneral . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    3.2.2. Aplicacin . . . . . . . . . . . . . . . . . . . . . . . . 46

    3.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    4. Una aproximacin bayesiana para modelar la concentracinde la tierra en Colombia 52

    4.1. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . 52

    4.1.1. Distribucin a priori . . . . . . . . . . . . . . . . . . . 53

    4.1.2. Estimacin de los parmetros de un modelo, utilizandoel mtodo de simulacin . . . . . . . . . . . . . . . . . 54

    4.2. Una aproximacin Bayesiana para modelar la concentracinde la tierra en Colombia . . . . . . . . . . . . . . . . . . . . . 58

    4.2.1. Metodologa propuesta . . . . . . . . . . . . . . . . . . 58

    ii

  • ndice general

    4.2.2. Aplicacin . . . . . . . . . . . . . . . . . . . . . . . . . 60

    4.2.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . 64

    iii

  • Introduccin

    En esta tesis se pretende cumplir con dos objetivos: el primero consiste enrevisar los modelos clsicos de regresin espacial con varianza constante ymostrar cmo se derivan y se hacen las estimaciones de mxima verosimili-tud en dichos modelos y el segundo en hacer una propuesta bayesiana paramodelar y estimar la concentracin de la tierra en Colombia.

    Para el cumplimiento del primero se revis los artculos escritos por Anselin(1988) y (2001) y la literatura encontrada en los libros de econometra espa-cial. Esta rea de la econometra nace con la necesidad de ver las relacionesexistentes entre las variables econmicas y la zona geogrfica, donde se quie-ren observar. Primero se identific la relaciones de dependencia espacial dela variable o variables que se quieren analizar, utilizando mtodos descripti-vos, similares al anlisis exploratorios de datos. Por ejemplo, para analizarla autocorrealcin espacial de un variable particular se define una matriz devecindades que permita estudiar la relacin existente entre la variable obser-vada en una ubicacin geogrfica determinada y su comportamiento en suvecindad, acta como el operador retardo de las series de tiempo. Se revi-san los modelos clsicos de regresin espacial con varianza homosedstica enAnselin (1988), Moreno y Vaya (2000), y Arbia(2006), aplicndolos para mo-delar y estimar la concentracin de tierra en Colombia utilizando variablesexgenas que permitan explicar su comportamiento.

    Para la concrecin del segundo objetivo se examinaron algunos mtodos desimulacin con cadenas de markov conocidos como MCMC como el muestreode Gibbs, Geman y Geman (1984) y el algoritmo de Metrpolis-Hastings. Sehizo un estudio detallado del planteamiento de Cepeda y Gamerman (2001)con el fin de implementar la propuesta bayesiana para modelar y estimar la

    v

  • distribucin de tierra en Colombia.

    Este trabajo consta de 4 captulos. En el primero, se define la curva de Lorenzy el ndice de Gini, se muestra el comportamiento de estos en la distribucinde tierra en Colombia para los aos 1985, 1996 y 2000. La curva de Lorenzpermite determinar el porcentaje de tierra que poseen una proporcin depropietarios, en particular, se usar un porcentaje fijo de 95% de propie-tarios y se determinar la proporcin de tierra que poseen. Se realiza unacomparacin del comportamiento de esta variable en el periodo mencionado.

    En el segundo captulo, en la seccin 1, se presenta el anlisis exploratorio dedatos es paciales. En la seccin 2 y 3 se muestran las definiciones de heteroge-neidad y autocorrelacin espacial global y local. En la seccin 4, se muestralos mtodos de representacin de la tendencia espacial en Geo-Da (Anselin,2004), que permite analizar este tipo de datos y se muestra el anlisis de lasvariables: concentracin de tierra, necesidades bsicas insatisfechas, violenciade grupos armados al margen de la ley, en la geografa colombiana.

    El tercer captulo, en la seccin 2 se define el modelo lineal general espacialpresentado por Anselin (1988) y los casos particulares ms conocidos deeste modelo, as como los estimadores mximo verosmil de los parmetrosy finalmente se analizan los datos de la distribucin de tierra privada enColombia para el ao 2000 utilizando esta metodologa.

    Por ltimo, en el cuarto captulo, en la seccin 1 se presenta el teoremade Bayes, se muestran las formas que puede tener la distribucin a priori,informativa y no nformativa, se expone como puede simularse la distribucina posteriori y se desarrollan algunos mtodos de MCMC en particular, el deGibbs y el de Metrpolis-Hastings y sus algoritmos. En la seccin 2 se haceuna propuesta bayesiana para estimar un modelo para la distribucin detierra en Colombia sugerido por Cepeda y Gamerman (2001) y se presentanlas conclusiones de la implementacin de la metodologa bayesiana.

    vi

  • Captulo 1. Curva de Lorenz endices de concentracin.Tierra privada rural en

    Colombia

    Introduccin

    La concentracin de las variables econmicas como ingreso, tierra y pro-duccin agricola, se determina con los ndices de Theil, Gini y Hirschman-Herfindal, entre otros. En este captulo se calcula el ndice de Gini para latierra en Colombia, estudiando los predios privados rurales, mediante el n-dice de Gini. En este estudio se exluyen los departamentos de Amazonas,Guana, Guaviare y Vichada, dado que, para estos departamentos, no se po-see informacin de los predios registrados en el IGAC para los aos 1996 y2000.

    La informacin catastral registrada por el Instituto Geogrfico Agustn Co-dazzi (IGAC) para 1985 indicaba que el total de tierra registrada en Colom-bia era de 36.6 millones de hectreas, de las cuales, el 89% era propiedadprivada (Candelo, Mera y Ossa, 2000). En 1996, segn IGAC y Catastro deAntioqua, la tierra registrada era de 79.4 millones de hectreas, presentn-dose un incremento en el nmero de hectreas registradas con respecto a la

    1

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    dcada pasada, debido a la inclusin de tierras de indgenas, negritudes yel departamento de Antioqua. De la tierra registrada en 1996, el 52% erapropiedad privada, 32% corresponda a tierras indgenas y el 16% a tierrasdel estado. En ese ao, el total de la tierra registrada corresponda al 70%de la superficie total de la Repblica de Colombia, que es de 114 millones dehectreas.

    En el estudio de Candelo etal.(2000), publicado por la Contralora Generalde la Repblica se afirma que hay una relacin positiva entre la presencia degrupos alzados en armas y la concentracin de la tierra. Identificando variaszonas del pas que presentan este fenmeno, como el corredor de Frontino,que se inicia en el Urab Antioqueo y termina en el Norte de Santan-der, pasando por el Magdalena bajo y medio; el pie de monte llanero, quecomprende Arauca, Casanare, Meta, Putumayo y Caquet, y en los depar-tamentos del Valle del Cauca y Huila los cuales tenan presencia paramilitary/o guerrillera.

    Segn (Machado 2004) la concentracin de la propiedad de los factores pro-ductivos es el aspecto ms notorio de la inequidad en el sector rural, gene-rando serias implicaciones en el acceso y disponibilidad de recursos. Segn(Fajardo 2002), en 1996 los predios de 200 hectreas correspondientes al 2.8%del total de las fincas, concentraban el 39.9% de la tierra, con un porcentajemnimo de uso agrcola; y las fincas de hasta 5 hectreas, que correspondenal 46.8% del total de los predios solo posean el 3.2% de la tierra.

    El informe del Banco Mundial (2004) afirma que en el ao 2002 la desigual-dad en la tenencia de la tierra era alta, con un ndice de Gini de 0.85. Segneste informe, esta desigualdad se debe a tres aspectos: el primero, la subuti-lizacin de la tierra productiva donde el suelo apto para la actividad agrariay zonas ecologcamente frgiles se usan en ganadera, el segundo, se refierea la poca inversin de los gobiernos locales en el mejoramiento de los servi-cios pblicos, y el tercero, incremento de la violencia en reas con ausenciade oportunidades econmicas, generando desplazamiento e inequidad social.(Banco-Mundial and CEDE 2004).

    En este captulo, se aplican los conceptos de curva de Lorenz y el ndice deGini al estudio de la concentracin de tierra en Colombia. El ndice de Ginitrata de poner en evidencia el mayor o menor grado de desigualdad en elreparto del total de los valores de la variable de inters. Es un indicador delgrado de distribucin de la variable.

    En la seccin 1.3 se muestra la metodologa para calcular la curva de Lorenz

    2

  • 1.1. CURVA DE LORENZ E NDICE DE CONCENTRACIN DE GINI

    y el ndice de Gini, se dan ejemplos correspondientes a tres departamentos.Igualmente, se presenta el comportamiento de concentracin de la tierraprivada rural para Colombia en el ao 2000.

    1.1. Curva de Lorenz e ndice de concentracin deGini

    Sea una variable aleatoria con funcin de distribucin (), y media finita. Dado

    1() = inf { : () } , 0 1,la curva de Lorenz se define mediante una funcin (), definida en el inter-valo [0, 1], donde

    () = 1 1()

    0 ().

    El ndice de Gini (IG), (Gini, 1912) es una medida definida por

    = 1 2 1

    0(),

    cuya interpretacin geomtrica corresponde al doble del rea comprendidaentre la bisectriz del cuadrado unidad y la curva de Lorenz, como se muestraen la figura (1.1). As,

    = 2[1/2

    10()

    ]y 0 1, (Sen 1986). Este ndice se expresa comunmente en porcentaje.En el caso discreto, sea es una variable aleatoria, con valores posibles

    1 < 2 < . . . < , con ( = ) = y media ==1

    . La curva

    de Lorenz es la funcin en , definida a trozos, con vertices en (, ),

    donde = { } y = 1=1

    . As, el rea bajo la curva de

    Lorenz es ==1

    , con rea del trapecio dada por = (+1)/2

    para = 1, 2, ..., y con 0 = 0. (Mehran 1975; Gastwirth and Glauberman

    3

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    0 20 40 60 80 100

    020

    4060

    8010

    0

    Curva de Lorenz

    X

    L(X)

    Figura 1.1. Curva de Lorenz.

    1976). Por tanto el ndice de Gini es

    = 1 2 = 1 lm

    =1

    ( +1) = 1 () (1).

    equivalente a

    = 1 1

    =1

    2

    2

    =1

    1=1

    .

    4

  • 1.2. CLCULO DE LA CURVA DE LORENZ Y COEFICIENTE DE GINI

    1.2. Clculo de la curva de Lorenzy coeficiente de Gini

    1.2.1. Clculo de la curva de Lorenz

    Para determinar la curva de Lorenz en el caso de la distribucin de la tie-rra se debe tener en cuenta el concepto de distribucin equitativa. Existeuna distribucin equitativa de la tierra entre los miembros de una poblacincuando a cada uno de ellos le corresponde una fraccin proporcional del totalde la misma. Por ejemplo, en una poblacin de 100 propietarios, si la tierraest distribuida equitativamente, cada uno de los miembros de la poblacindebe ser propietario de un 1 % del total de la superficie de la tierra.

    La funcin de equidistribucin est determinada por la ecuacin () = ,donde es el porcentaje de los propietarios de la tierra y = () es elporcentaje de tierra que le corresponde. Cuando existe concentracin de latierra la curva de Lorenz se encuentra por debajo de la diagonal, y a mayorconcentracin de la tierra mayor es la curvatura.

    5

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    La metodologa para construir la curva de Lorenz es la siguiente:

    1. Ordenar la informacin del rea de los predios en sentido ascendente,en hectreas, y establecer el nmero de rangos.

    2. Calcular las frecuencias acumuladas del nmero de hectreas y delnmero de propietarios, de acuerdo con los rangos establecidos.

    3. Se determinan pares ordenados (, ), donde corresponde al porcenta-je acumulado de propietarios y al porcentaje acumulado de hectreas,y se localizan en el plano coordenado.

    4. La curva de Lorenz se obtiene uniendo los puntos correspondientes alos pares ordenados (, ), mediante una lnea continua.

    1.2.2. Clculo del Gini

    El coeficiente Gini es el cociente entre el rea de la regin limitada por lacurva de Lorenz y la recta Y=X, y el rea de la regin limitada por las rectasX=1, Y=X y Y=0. As,

    = 2(1

    2

    )= 1 2

    donde es el rea comprendida entre la curva de Lorenz, el eje y =1.

    Para calcular el rea bajo la curva de Lorenz, T, se realiza la suma de lasreas de los trapecios cuyas bases corresponden a los rangos porcentualesacumulados de los propietarios de la tierra. En consecuencia,

    =1

    2

    =1

    [1() +()][ ( ) ( 1)],

    donde , = 1, 2, . . . , , es el porcentaje acumulado de superficie de tierrarural y ( ), = 1, 2, . . . , , es el porcentaje acumulado de propietariosde la tierra. Este mtodo de clculo del Gini se considera bastante precisocuando se aplican a distribuciones de ocho o ms rangos. (Lora 1991).

    6

  • 1.3. DISTRIBUCIN DE TIERRA EN COLOMBIA

    1.3. Distribucin de tierra en Colombia

    1.3.1. Naturaleza de los datos

    La informacin de predios rurales resgistrados fue suministrada por el Insti-tuto Geogrfico Agustn Codazzi (IGAC) y para el ao de 1996 del catastrode Antioqua. Los periodos de tenencia de la tierra con registro catastral sonlos aos 1986, 1996, 1999, 2000 y 2001. Esta informacin esta desagregadapor cada municipio del pas. Las variables que maneja el IGAC son: Cdigodel departamento,Cdigo del municipio (este cdigo es el mismo que utilizael DANE), ndice del rango, Nombre del Departamento, Nombre del Mu-nicipio, Rangos de rea en hectreas, Total de predios por rango, Total depropietarios por rango, Total de superficie por rangos.

    En la tabla 1.1 se muestra la estructura de la base de datos presentada pormunicipios, se considran 13 rangos, en hectreas, como es registrado por elIGAC, tomando como ejemplo el municipio de Sop en el departamento deCundinamarca.

    Rango () Predios Propie Area Constr (2) Avalo< a 1 73 80 215.118 4.809 31.6893.5001 - 3 48 93 900.477 7.522 105.429.7003 - 5 23 27 887.665 2.468 334.404.0005 - 10 16 19 1.201.487 15.000 1.491.322.00010 - 15 22 25 2.692.937 2.234 588.022.00015 - 20 9 10 1.563.713 6.128 671.727.00020 - 50 30 39 9.784.236 24.262 3.939.730.00050 - 100 6 11 4.147.000 4.898 1.078.234.000100 - 200 8 9 10.713.998 14.765 2.208.735.000200 - 500 2 2 6.800.000 2.680 1.958.803.000500 - 1000 0 0 0 0 01000 - 2000 1 1 10.710.000 0 369.500.000> 2000 0 0 0 0 0

    Cuadro 1.1. Distribucin de la tierra por Rangos

    Los rangos en hectreas fueron asumidos por el DANE y el IGAC paraestudios de avalo.

    7

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    1.3.2. Distribucin de la tierra

    En esta seccin se presentan datos correspondientes a la estructura de con-centracin de la tierra en Colombia, para los aos 1996 y 2000. La tabla 1.2muestra datos de la concentracin de tierra en la regin Andina. Indica, porejemplo, que en 1996, en el departamento de Boyac, el 45.1% de la tierrarural estaba distribuida en el 95% de los propietarios. As, el 54.9% de latierra rural estaba distribuida en un 5% de los propietarios rurales. Para estedepartamento, en el ao 2000 se evidencia un incremento en la concentracinde la tierra, debido a que el porcentaje de la tierra rural distribuida en el5% de los propietarios alcanza el 58.3%. En la misma tabla, se muestra queen Quindo, en este periodo de tiempo, en porcentaje de tierra en manos del95% de los propietarios paso del 20% al 44.6%, indicando un proceso dedesconcentracin. Este fenmeno tambin se presenta en el Huila, que es eldepartamento de la regin Andina con menor concentracin.

    % de Prop. 40 60 80 90 95 40 60 80 90 95Antioqua 1.8 3.5 13.3 32.9 38.6 1.2 3.5 10.1 20.0 39.4Boyac 3.4 7.9 16.1 30.0 45.1 3.2 8.1 18.1 30.0 41.7Caldas 1.5 4.7 18.0 29.2 45.6 3.1 7.2 17.8 30.1 46.8Cund. 2.8 7.0 20.0 30.7 43.7 3.0 9.1 20.4 33.0 46.1Huila 3.1 9.0 21.1 37.5 51.6 3.2 10.2 26.6 45.2 62.0N. Sant. 2.6 8.5 22.2 35.3 47.1 3.1 10.0 28.9 45.1 59.2Quindo 1.9 4.5 11.3 19.5 26.6 2.9 7.9 19.0 31.1 44.6Risaralda 2.4 7.6 17.9 28.1 40.0 3.3 9.0 20.2 32.0 48.0Santander 2.0 8.1 18.8 32.1 44.0 3.3 8.1 20.1 37.0 49.1Tolima 2.2 8.0 20.1 38.3 49.1 3.0 9.2 22.1 40.0 57.1

    Cuadro 1.2. Porcentaje de Tenencia de Tierra. Regin Andina. 1996 y 2000

    En la Regin Atlntica se presenta menor concentracin en la tenencia de latierra rural en el periodo comprendido entre 1996 y 2000, como se observa enla tabla 1.3. En todos los departamentos dismunuy la cantidad de tierra enmanos del 5% de los propietarios. Durante este periodo, en el departamentodel Cesar, que es donde se presentan el mayor cambio, el porcentaje dela tierra en manos del 5% de los propietarios paso del 50.8% al 33.4%,presentandose un cambio del 17.4% en la concentracin de la tierra. La mayorconcentracin de tierra, en el ao 2000, se presenta en el departamento dela Guajira con el 55.6% de la tierra en manos del 95% de los propietarios.

    8

  • 1.3. DISTRIBUCIN DE TIERRA EN COLOMBIA

    % de Prop. 40 60 80 90 95 40 60 80 90 95Atlntico 4.5 12.6 29.0 45.0 54.3 4.1 12.1 30.0 46.0 66.1Bolvar 4.3 11.1 28.0 40.0 52.0 4.1 8.7 27.8 47.2 64.3Cesar 3.6 11.0 24.1 38.5 49.2 5.2 16.3 34.3 52.5 66.6Crdoba 1.9 9.1 23.0 39.0 54.4 2.3 8.5 25.3 40.0 60.0Guajira 1.0 3.4 9.2 14.5 20.0 3.1 10.5 25.8 43.1 55.6Magdalena 3.0 12.0 26.5 38.9 52.2 3.7 14.1 30.3 46.8 65.4Sucre 1.9 7.6 25.4 40.1 57.5 2.3 10.0 27.8 48.3 63.5

    Cuadro 1.3. Porcentaje de Tenencia de Tierra. Regin Atlntica. 1996 y 2000

    La regin Pacfica muestra mayor concentracin que las regiones Atlntica yAndina. La tabla 1.4 muestra que el departamento de Choc tiene un cambionotorio en la estructura de tenencia de la tierra, debido al incremento depredios registrados durante el periodo 1996 a 2000. En el ao 2000, en eldepartamento del Valle del Cauca el 64.3% de la tierra estaba en en manosdel 5% de los propietarios y, en el departamento del Cauca, el 61.5% de latierra corresponda al 5% de los propietarios.

    % de Prop. 40 60 80 90 95 40 60 80 90 95Cauca 1.3 4.6 12.5 20. 30. 2.0 6.9 18.3 28.7 38.5Choc 0.06 0.9 4.5 5.2 7.1 0.03 14.2 38.5 56.1 66.0Nario 2.4 8.2 16.9 28.6 35.7 2.9 9.3 19.2 32.1 42.5Valle 0.8 3.1 11.1 22.9 31.8 0.7 3.4 11.9 24.2 35.7

    Cuadro 1.4. Porcentaje de Tenencia de Tierra. Regin Pacfica. 1996 y 2000

    En la regin Orinoqua-Amazona se encuentran varios de los departamentoscon mayor concentracin de tierra de Colombia. Por ejemplo, para el ao2000, en el departamento de Arauca, el 33% de la tierra estaba en manosdel 95% de los propietarios, mientras que en los departamentos de Putumayo,Casanare y Meta, estaba el 35.7%, 37.6% y el 38.5%, respectivamente, comse muestra en la tabla 1.5.

    1.3.3. Mapas de porcentajes

    Los mapas muestran la evolucin de la estructura de concentracin de latierra para el 60%, 90% y 95% de los propietarios. Mostrando, lo dichoanteriormente, la mayor concentracin en Antioqua y Boyac en la reginAndina, los departamentos de Cuca y Valle del Cuca en la regin Pacfica,

    9

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    % de Prop. 40 60 80 90 95 40 60 80 90 95Caquet 1.6 5.1 10.4 15.6. 18.1 7.5 14.5 29.3 39.6 48.0Meta 0.9 3.1 10.0 17.6 28.1 0.9 3.0 10.2 20.7 38.0Arauca 3.1 8.0 16.1 22.1 33.2 2.6 8.0 15.6 22.1 33.2Casanare 1.2 5.1 12.9 21.9 34.4 1.4 7.5 14.5 26.7 37.6Putumayo 0.8 3.1 11.1 22.9 31.8 0.7 3.4 11.9 24.2 35.7

    Cuadro 1.5. Porcentaje de Tenencia de Tierra. Regin Orinoqua y Amazo-na. 1996 y 2000

    los departamentos del pie de monte llanero: Meta, Casanare, Arauca y demenor concentracin Caquet y Putumayo; en la regin Atlantica se eviden-cia menor concentracin que las otras regiones como se muestra en los mapas1.2, 1.3 y 1.4, donde se ve que los departamentos de Crdoba y Guajira tienela mayor concentracin en esta regin.

    Porcentaje de tierrapara el 60& de los propietarios

    0,00 - 3,50

    3,51 - 7,50

    7,51 - 9,30

    9,31 - 12,10

    Figura 1.2. Distribucin del 60% de la tierra en Colombia. 2000

    10

  • 1.3. DISTRIBUCIN DE TIERRA EN COLOMBIA

    Porcentaje de tierrapara el 90% de los propietarios

    0,00

    0,01 - 24,20

    24,21 - 33,00

    Figura 1.3. Distribucin del 90% de la tierra en Colombia. 2000

    Procentaje de tierrapara el 95% de los propietraios

    0,00

    0,01 - 41,70

    41,71 - 49,10

    Figura 1.4. Distribucin del 95% de la tierra en Colombia

    11

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    1.4. Anlisis da la distribucin de tierracon el Gini

    1.4.1. Curva de Lorenz

    La estructura de tenencia de la tierra, en este caso, es especificada mediantela curva de Lorenz. Esta curva muestra la proporcin de tenencia de la tierracomo una funcin de la proporcin de propietarios. La figura (1.5) muestrala curva de Lorenz para la distribucin de la tierra en Colombia y en losdepartamentos de Antioqua, Crdoba y Cesar, en el ao 2000. En esta fi-gura, se observa que la mayor concentracin de la tierra se present en eldepartamento de Antioqua, pus la concavidad de la curva de Lorenz es ma-yor con respecto a los departamento de Crdaba y Cesar. Si comparamos lacurva de Lorenz para Colombia con la curva del departamento de Antioquasus concavidades son similares, lo que indica similaridad en la estructura deconcentracin de la tierra.

    La estructura de tenencia de la tierra en Colombia para el ao 2000 muestraque el 57.1% de los propietarios tiene el 3% de la tierra, y el 97.1% de lospropietraios poseen el 41,6% de la tierra, es decir el 2.9% de los propietraiosde fincas en el pas poseen el 58.4% de la tierra registrada en los catastrosde Antioqua y el IGAC. Figura (1.5).

    1.4.2. Clculo del Gini para el ao 2000

    El Gini para la concentracin de la tierra rural en Colombia, en el ao 2000, esde 0.8479. Esto indica una alta acumulacin de la tierra en pocos propietarios.Como se observa en la tabla 1.6, la regin con ms alta concentracin de latierra es Orinoqua - Amazona con un Gini de 0.7843 y la menor es la reginAtlntica con un Gini de 0.6811.

    Regin GiniAndina 0.7579Atlntica 0.6811Pacfica 0.7584Orinoqua - Ama 0.7843

    Cuadro 1.6. Gini por regiones, ao 2000.

    En la regin Atlntica, se encuentra Cesar, que es el departamento con menor

    12

  • 1.4. ANLISIS DA LA DISTRIBUCIN DE TIERRA CON EL GINI

    0 20 40 60 80 100

    020

    6010

    0

    Antioquia 2000

    Acumulado de Propietarios

    Acm

    ulad

    o de

    tier

    ra

    0 20 40 60 80 100

    020

    6010

    0

    Cesar 2000

    Acumulado de Propietarios

    Acm

    ulad

    o de

    tier

    ra

    0 20 40 60 80 100

    020

    6010

    0

    Cordoba 2000

    Acumulado de Propietarios

    Acm

    ulad

    o de

    tier

    ra

    0 20 40 60 80 100

    020

    6010

    0

    Colombia 2000

    Acumulado de Propietarios

    Acm

    ulad

    o de

    tier

    ra

    Figura 1.5. Curva de Lorenz Ao 2000.

    concentracin de tierra en el pas en el ao 2000, con un Gini de 0.6178. Enesta regin, el departamento donde se presenta una mayor concentracin esCrdoba, con un Gini de 0.7295.

    La regin Andina tiene un Gini de 0.7579. All se encuentra el departamentoque presenta la mayor concentracin de tierra del territorio colombiano, An-tioqua, con un Gini de 0.8583. El departamento con menor concentracin detierra en esta regin es Norte de Santander, con un Gini de 0.6923. La Tabla1.7 muestra el Gini para 27 de los departamentos del pas. La alta concentra-cin de la tierra en el departamento de Antioqua tambin es evidenciada enel estudio de Gaviria y Muoz (2007), que muestra la relacin entre propiedad

    13

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    de la tierra y desplazamiento forzado, sustentada en datos que demuestrancomo a medida que aumenta el nmero de personas desplazadas, aumentala concentracin de la propiedad de la tierra, con los consecuentes efectosnegativos sobre la produccin agrcola y la poblacin rural.

    Departamento Gini Departamento GiniAntioqua 0.8583 Guajira 0.7090Boyac 0.7619 Magdalena 0.6547Caldas 0.7821 Sucre 0.6972Cundin 0.7529 Cauca 0.7579Huila 0.7025 Choc 0.6314Nort-San 0.6923 Nario 0.7646Quindo 0.7755 Valle 0.8429Risaralda 0.7591 Casanare 0.8108Santander 0.7539 Caquet 0.6904Tolima 0.7404 Meta 0.8544Atlntico 0.6662 Arauca 0.8198Bolvar 0.6937 Casanare 0.8108Cesar 0.6178 Putumayo 0.7459Crdoba 0.7295

    Cuadro 1.7. Gini por departamentos. 2000

    La regin Pacfica tiene, para este ao, un Gini de 0.7584. All se encuentrael departamento del Valle del Cauca, el tercero con mayor concentracin enel pas. Su Gini es de 0.8429. En esta regin el departamento con menosconcentracin de tierras es Choc, con un Gini de 0.6314. La alta cocentra-cin de esta regin en particular de los departamentos del Valle del Caucay Cauca tambin lo evidencia el estudio de (Gamarra 2007), quien afirmaque hay una baja productividad agrcola debido a la calidad de los suelos,agudizando as, por un lado, la necesidad de la poblacin rural por tenerextenciones mayores de tierra y por otro el incremento de la pobreza en lapoblacin campesina, ndigena y afrocolombiana.

    La regin con mayor cocentracin de tierras es Orinoqua-Amazona, con unGini de 0.7843. All se encuentran algunos de los departamentos con mayorconcentracin de tierras en Colombia. Meta, que tiene la segunda concenta-cin de tierras ms alta del pas, con un Gini de 0.8544, Arauca con un ndicede 0.8198 y Casanare con 0.8108. El departamento con menor concentracines Caquet, con un Gini de 0.6904. En esta regin la alta cocentracin sedebe, segn (Ortiz 2003), a la presencia de un alto porcentaje de cultivos

    14

  • 1.4. ANLISIS DA LA DISTRIBUCIN DE TIERRA CON EL GINI

    ilcitos y de actores del conflicto armado en Colombia: paramilitares, guerri-lla y fuerza pblica. Igualmente, la presencia de narcotrfico y su relacin con

    15

  • Captulo 1. Curva de Lorenz e indices de concentracin. Tierraprivada rural en Colombia

    el conflicto armado, genera desplazamiento y, posiblemente, mayor cocentra-cin de tierra (Daz and Snchez 2004).

    En la figura (1.6) se representa el ndice de Gini por departamentos. En ella,se observa que los departamentos del pie de monte llanero, Antioqua y Valledel Cauca son los que tienen mayor concentracin de tierra; los de menorconcentarcin estn en la regin Atlntica.

    Gini 2000Departamentos

    0,000000

    0,000001 - 0,666219

    0,666220 - 0,729512

    0,729513 - 0,794566

    Figura 1.6. Gini - 2000 por departamentos.

    1.4.3. Conclusiones

    Colombia presenta un alto nivel de concentracin de tierras, con un ndicede Gini de 0.8479. Los departamentos del pie de monte llanero, Antioqua yValle del Cauca son los que tienen mayor concentracin. En Colombia el 80%de la tierra est en manos del 10% de los propietarios. En el departamentodel Valle del Cauca el 80% de la tierra est en manos del 11.5% de lospropietarios, y en Antioqua el 80% de la tierra est en manos del 11% delos propietarios. Este alto grado de concentacin de tierras se presenta, engeneral, en todos los departamentos y regiones del pas.

    16

  • 1.4. ANLISIS DA LA DISTRIBUCIN DE TIERRA CON EL GINI

    La concentracin de tierras, en Colombia, tiene multiples causas. (Ibaezand Querubn 2004) afirma que una de las causas de alta concentracin estdada por la prolongacin de los conflictos agrarios del siglo pasado, y elnarcotrfico, que tienen una relacin estrecha con el conflicto armado debidoa la lgica e intereses de los actores (paramilitares, guerrilla y fuerza pblica),generando desplazamiento forzoso. (Ortiz 2003; Daz and Snchez 2004).

    Dada la distribucin de los indicadores de concentracin de la tierra en Co-lombia, podemos concluir, como en el estudio de (Gaviria and Muoz 2007),que incrementos en la concentracin de la tierra parecen estar relacionadoscon el conflicto armado y, en especial, con los mviles de intimidacin a lapoblacin no partcipe, que ha trado consigo un aumento significativo depersonas que abandonan sus tierras por causa de la violencia (Ibaez andQuerubn 2004).

    El estudio de los incrementos en la concentracin de la tierra y en el desplaza-miento forzado, resultado de luchas histricas por el poder y la acumulacinde la riqueza (Gaviria and Muoz 2007), son reas de especial inters parael desarrollo de investigaciones futuras que permitan entender los diversosfenmenos sociales y polticos presentes en Colombia durante los ltimosaos.

    En el apndice se definen otros ndices de concentracin y la informacin dela estructura de distribucin de la tierra en Colombia para el ao 1985.

    17

  • Captulo 2. Anlisisexploratorio de datos espaciales

    Introduccin

    Segn Tukey (1977) el Anlisis Exploratorio de Datos (AED) puede definirsecomo el conjunto de herramientas grficas y descriptivas utilizadas para iden-tificar patrones de comportamiento en los datos y para establecer hiptesiscon la menor estructura posible.

    El Anlisis Exploratorio de Datos Espaciales (AEDE), en palabras de (Anse-lin 999a), puede definirse como el conjunto de tcnicas que: describen y visua-lizan distribuciones espaciales, identifican puntos atpicos espaciales (spatialoutliers), descubren esquemas de asociacin espacial, visualizan agrupamien-tos (clusters) o puntos calientes (hot spots) y sugieren estructuras espacialesu otras formas de heterogeneidad espacial. Por tanto, estos mtodos tienenun carcter descriptivo, aunque la deteccin de estructuras espaciales en lasvariables geogrficas hace posible la formulacin de hiptesis para la mode-lacin economtrica y posible prediccin espacial.

    En particular, en el estudio de datos espaciales, cuando no existe un marcoformal o teora previa acerca del fenmeno que se analiza, deben utilizarselas tcnicas del AEDE. Esta situacin se presenta en el campo de las cienciassociales, cuando se analizan grandes bases de datos geogrficos cuya distribu-cin no se conoce a priori. En los ltimos aos, el AEDE ha sido introducido

    18

  • Introduccin

    en algunas aplicaciones de economa regional como el crecimiento econmicoen los pases Europeos (Moreno y Vay, 2000) o como el estudio de econo-metra espacial aplicada a la prediccin-extrapolacin de datos espaciales deregiones espaolas (Chasco, 2003).

    El AEDE combina el anlisis estadstico y el anlisis grafico de los datos, dan-do lugar a lo que podra denominarse una visualizacin cientfica (Haininget al., 2000), que une a los contrastes estadsticos sobre los efectos espacialesde dependencia y de heterogeneidad un amplio marco de grficos o vistasmltiples y dinmicas sobre la informacin geogrfica (Unwin 2000), siendofundamental el papel que juga los paquetes informticos especializados.

    Como dice (Chasco 2005), el software desarrollado en los ltimos aos se haconcentrado en la conexin de los sistemas de informacin georeferenciada(GIS por sus siglas en ingls) disponibles en el mercado (Grassland, ESRI,MapInfo) con paquetes estadsticos tradicionales (S-PLUS, SPSS, Matlab,SAS, R) o especficos de AEDE. De este modo, a la potente capacidad devisualizacin y anlisis de los GIS se le une la especializacin propia delanlisis espacial estadstico y grfico, (Bao et al. 2000). En estos momentos,junto a estos mdulos de enlace, existe tambin un esfuerzo creciente porelaborar programas de AEDE en entornos de opensource como R, Java yPython, que se encuentran libremente disponibles en Internet y cuya fuenteabierta hace posible su constante renovacin. Muchos de estos programaspueden consultarse en la pgina web del Center for Spatially IntegratedSocial Science, CSISS: http://www.csiss.org/clearinghouse/.

    Un buen mtodo grfico de AEDE es aqul que es capaz de analizar y re-presentar dos caractersticas fundamentales en toda distribucin espacial:suavizamiento (smooth) y asperezas (rough) (Wise et al, 1999). La propie-dad de alisado, que en el campo temporal seran la tendencia central de lavariable (medida a travs de la mediana) y su dispersin (recorrido inter-cuartlico), en las variables geogrficas incluira elementos globales, referidosa todo el mapa, como la tendencia espacial y autocorrelacin espacial global.La propiedad de asperezas (rough) de la distribucin se refiere a aquellosdatos localizados a cierta distancia del elemento de alisado (mediana), comolos llamados atpicos (outliers), situados bajo/sobre el primer/tercer cuartilde un diagrama de caja. Esta ltima propiedad es local, a diferencia de lapropiedad de suavizamiento que es global, que incluye, por ejemplo, casosque se revelan como muy distintos de sus correspondientes valores vecinosen el mapa (atpicos espaciales), regiones que se encuentran agrupadas enforma de valores altos o bajos de una variable produciendo autocorrelacin

    19

  • Captulo 2. anlisis exploratorio de datos espaciales

    espacial local (agrupamientos o clusters de zonas calientes o fras) o incluso,lneas de discontinuidad geogrfica (heterogeneidad espacial).

    Segn (Cressie 1993), el AEDE puede ser abordado desde el punto de vistadel anlisis desarrollado por la geoestadstica o a partir de la econometraespacial. El objeto del anlisis geoestadstico se encuentra, por lo general,en el entorno de las ciencias medioambientales (fsica, geologa, hidrologa,etc.) y se centra en el anlisis de muestras de datos puntuales procedentes dedistribuciones geogrficas continuas (por ejemplo, precipitacin atmosfrica,humedad de la tierra, altura del ocano, etc.). Por su parte, la econometraespacial analiza localizaciones geogrficas discretas de puntos o polgonos(departamentos, municipios, etc.). Es lo que se denomina perspectiva de re-tcula o lattice, y se encuentra en el anlisis de los fenmenos socioeconmicos(distribucin de la renta, clientes, votantes, etc.)

    A continuacin se presentan las principales tcnicas del AEDE que conside-ran las propiedades de suavizamiento (global) y asperezas (local), desde laperspectiva reticular o lattice.

    1. Distribucin espacial univariada:

    a) Mapa de caja y/o diagrama de caja.

    b) Asociacin espacial global:

    1) Mapa de contigidades espaciales.2) Grfico del retardo espacial.3) Diagrama/mapa de dispersin de Moran.

    c) Asociacin espacial local:

    1) Puntos atpicos en el diagrama de dispersin de Moran.2) Mapas LISA (Local Indicator of Spatial Asociation, por sus

    siglas en ingls).3) Diagrama de caja LISA.

    2. Distribucin espacial multivariada:

    a) Diagrama dispersin-caja.

    b) Asociacin espacial multivariante:Diagrama de dispersin multivariante de Moran.

    20

  • 2.1. HETEROGENEIDAD Y AUTOCORRELACIN ESPACIAL

    3. Heterogeneidad espacial:

    a) Mapa del histograma de frecuencias.

    b) Diagrama de dispersin.

    2.1. Heterogeneidad y autocorrelacinespacial

    En esta seccin se describen efectos espaciales que se pueden presentar cuan-do se trabaja con datos georreferenciados. Estos efectos son los que impidenque los mtodos estndar del anlisis economtrico sean una buena herra-mienta para el estudio de este tipo de datos, los cuales poseen los efectosespaciales de autocorrelacin y de heterogeneidad.

    2.1.1. Heterogeneidad espacial

    La heterogeneidad espacial es la carencia de uniformidad de los efectos espa-ciales en la variable de estudio. Esto implica que, en los modelos espaciales,las formas funcionales y los parmetros varan segn la localizacin geogr-fica, no siendo homogneos para la matriz de datos (Anselin 1988; Chasco2003). Esta variabilidad espacial suele ocurrir, por ejemplo, cuando se utili-zan datos de una variable econmica para explicar un fenmeno como con-centracin de riqueza en los departamentos de un pas que contiene regionespobres y regiones ricas.

    La heterogeneidad espacial puede tratarse con tcnicas economtricas clsi-cas, a travs de la consideracin de cambios considerables en los parmetros,coeficiente aleatorios o varias formas de cambios estructurales, tales como laregresin de cambio bruscos.

    2.1.2. Autocorrelacin o dependencia espacial

    Segn Goodchild (1987), la autocorrelacin espacial refleja el grado en que losobjetos o actividades en una unidad geogrfica son similares a otros objetoso actividades en unidades geogrficas prximas. Para (Cliff and Ord 1973), la

    21

  • Captulo 2. anlisis exploratorio de datos espaciales

    autocorrealcin espacial o dependencia espacial aparece como consecuenciade la existencia de una relacin funcional entre lo que ocurre en un puntodeterminado del espacio y lo que ocurre en otro lugar. Es decir, el valorque toma una variable en una regin se explica no solo por las condicionesinternas de la regin, sino tambin por el valor que toma esa variable en lasregiones vecinas.

    La autocorrelacin espacial puede ser positiva o negativa. Positiva cuandola presencia de un fenmeno determinado en una regin lleva a que este seextienda por las regiones vecinas, favoreciendo la concentracin del mismo.Por ejemplo, si la concentracin de la tierra en la regin es alta, se espera queen las regiones que la rodean se presente una alta concentracin de la tierra.Por el contrario, se tiene autocorrelacin negativa cuando la presencia de unfenmeno en una regin impide o dificulta su aparicin en las regiones vecinasa ella. Esta situacin sera compatible con la existencia de jerarquas, porejemplo, de tipo centro-periferia, donde una favorable evolucin del centropodra verse acompaado de un empeoramiento de las regiones perifricasprximas. Por ltimo cuando la variable se distribuye de forma aleatoria, noexistir autocorrealcin espacial (Moreno and Vay 2000).

    2.1.3. Matriz de pesos espaciales

    En el caso espacial la autocorrelacin depende de la interdpendencia de lasregiones contiguas entre si. Por tanto, un operador retardo como el que seconoce en el caso de series temporales no es til pues recoge solo una relacininterdireccional. La solucin en el caso espacial est dada por la matriz depesos espaciales o matriz de contigidad espacial, W:

    =

    0 12 ... 121 0 ... 2. . . .

    1 2 ... 0

    Esta es una matriz cuadrada no estocstica cuyos elementos reflejan laintensidad de la interdependencia existente entre cada par de regiones y. Los pesos de la matriz deben de ser positivos y finitos, pero no hayuna definicin nica de estos pesos. La forma ms usada es la contigidadfsica de primer orden, utilizado por Moran (1948) y Geary (1954), donde es igual a 1 si las regiones y son fsicamente adyacentes o 0 en casocontrario.

    22

  • 2.1. HETEROGENEIDAD Y AUTOCORRELACIN ESPACIAL

    A partir de una cuadricula regular, a continuacin se presenta los criteriosde contigidad fsica o de vecindad que se definen para construir la matriz .

    1. Criterio lineal. Sern vecinas de las regiones que comparten el ladoizquierdo o derecho de .

    2. Criterio torre o rook. Sern vecinas de las regiones que compartenalgn lado de .

    3. Criterio alfil o bishop. Sern vecinas de las regiones que compartenalgn vrtice con .

    4. Criterio reina o queen. Sern vecinas de las regiones que compartenalgn lado o vrtice con .

    El nmero de vecinos en el criterio 1 es 2, en los criterios 2 y 3 es 4, y en elcriterio 4 es 8.

    Esta matriz de contigidad, tambin llamada matriz Booleana, es claramentesimtrica, pero presenta limitaciones para determinar la interdependenciaregional pues solo tiene en cuenta la adyacencia fsica dejando de lado algunasinterdependencia diferentes a las fsicas como de tipo comercial entre regionesque no son vecinas.

    Cliff y Ord (1973,1981) sugieren la siguiente definicin para la matriz basada en la distancia entre regiones:

    =

    donde es la distancia que separa a las unidades y y la longitudrelativa de la frontera comn entre y con relacin al permetro de , siendo y parmetros a estimar. (Anselin 1980) sugiere que estos parmetros seandados a priori y no estimarlos para evitar mayor complejidad.

    (Anselin 1980) propone la utilizacin de una matriz con componentes

    =1

    2,

    donde 2 es la distancia al cuadrado del centro de la regin al centro dela regin . Otras propuestas de se encuentran en la literatura. Ver porejmeplo, (Dacey 1968) y Bodson y Peeters (1975).

    23

  • Captulo 2. anlisis exploratorio de datos espaciales

    2.1.4. Operador de retardo espacial

    Para definir el retardo espacial se debe tener en cuenta las diferentes ve-cindades de una regin. Si suponemos una malla regular (Cressie 1993), elconcepto de cambio espacial implica considerar observaciones que estn ale-jadas una o ms unidades de distancia de una localizacin (, ), donde lasunidades de distancia, determinadas por los retculos, pueden medirse en doso en cuatro direcciones. As, por ejemplo si seguimos el criterio reina, cadacelda en una estructura regular (, ) tiene ocho vecinos:

    1, + 1 , + 1 + 1, + 1 1, , + 1,

    1, 1 , 1 + 1, 1

    En el caso de estructuras regulares, el nmero de vecinos que resulta dependedel criterio de contigidad que se utilice. Segn (Anselin 1988), cuando laestructura es irregular, se puede encontrar un gran cantidad de direccionesposibles. Por tanto, el nmero de parmetros asociados con las diferentesvecindades puede llevar a un anlisis significativamente difcil. Adems, si setiene una gran cantidad de datos y una estructura regular, podra sucederque los grados de libertad restantes no seran suficientes para permitir unaestimacin eficiente de estos parmetros. Este problema se soluciona si seconsidera la suma de los pesos de todos los valores pertenecientes a una clasede contigidad dada, en vez de tomar cada una de ellas individualmente.Los trminos de la suma son obtenidos multiplicando la variable observadaen la vecindad , con los pesos asociados de la matriz de pesos espacial.Formalmente se tiene que

    =

    , (2.1)

    donde es el operador de retardo espacial asociada con la clase de con-tigidad , es el ndice de las observaciones que pertenecen a la clase decontigidad con respecto a la localizacin , y son los pesos espacialesde la matriz de pesos espacial. es una variable retardada espacialmente,que guarda cierta similitud con la distribucin retardo que se menciona enel anlisis de series de tiempo. En este caso, los pesos son dados a apriori,reduciendo as un problema de linealidad y el riesgo de imponer un errorestructural (Anselin 1988).

    24

  • 2.2. AUTOCORRELACIN GLOBAL Y LOCAL

    La matriz de pesos usada en el retardo espacial es frecuentemente estan-darizada por filas, es decir, para cada ,

    = 1. Por tanto, el retardo

    espacial puede ser interpretado como un promedio de pesos de la variablealeatoria en las vecindades de o como un suavizamiento espacial (Anselin999b).

    2.2. Autocorrelacin global y local

    2.2.1. Contrastes globales de autocorrelacin espacial

    Para determinar la presencia o ausencia de dependencia espacial a nivel uni-variado, se debe probar si se cumple la hiptesis de que una variable seencuentra distribuida de forma aleatoria en el espacio o si por el contrario,existe una asociacin significativa de valores similares o dismiles entre re-giones vecinas. Para ello, se ha propuesto unos estadsticos de dependenciaespacial, entre los que se destacan la I de Moran, la C de Geary y la G(d)de Getis y Ord.

    1. El contraste I de Moran (Moran 1948)

    =

    0

    ( )( )

    =1

    ( )2 = (2.2)

    donde refleja el valor de la variable cualitativa en la regin , esla media muestral, son los pesos de la matriz W, N es el tamaomuestral y 0 =

    . Segn (Cliff and Ord 1981), cuando el ta-

    mao muestral es suficientemente grande, la I de Moran estandarizadasigue una distribucin asinttica normal estndar. Se denotar () lavariable estandarizada del I de Moran.

    En este caso, un valor no significativo de () llevar a no rechazarla hiptesis nula de no autocorrelacin espacial, mientras que un valorsignificativo positivo del mismo informar acerca de la presencia de unesquema de autocorrelacin espacial positiva, es decir, la presencia de

    25

  • Captulo 2. anlisis exploratorio de datos espaciales

    una concentracin de valores similares de la variable aleatoria entreregiones vecinas. En caso contrario, un valor significativo negativo delmismo informar acerca de la presencia de un esquema de autocorre-lacin espacial negativa, es decir, se encontrar una concentracin devalores dismiles de la variable aleatoria entre regiones vecinas.

    2. C de Gary (Geary 1954)

    Es el segundo contraste de autocorrelacin espacial, el cual tiene lasiguiente expresin:

    =( 1)

    20

    ( )=1

    ( )2 = (2.3)

    donde el significado de sus elementos es equivalente al definido para laI de Moran.

    La distribucin del estadstico, despus de su estandarizacin, es a nivelasinttico una distribucin normal estndar. Al igual que en el casoanterior, la hiptesis nula del estadstico C de Gary es la inexistenciade autocorrealcin espacial frente a la hiptesis alternativa de presenciade un esquema de dependencia espacial. En este caso, al contrario delo ocurrido por la I de Moran, un valor negativo y significativo de laC de Gary estandarizada () indicar la existencia de un esquemade dependencia espacial positiva, y sucede lo contrario para un valorpositivo y significativo de la C de Geary que mostrar una dependenciaespacial negativa.

    26

  • 2.2. AUTOCORRELACIN GLOBAL Y LOCAL

    3. G(d) de Getis y Ord (Getis and Ord 1992)

    El tercer contraste presenta la siguiente expresin:

    () =

    =1

    =1

    ().

    =1

    =1

    .

    = (2.4)

    donde dos pares de regiones y son considerados vecinas siempre quese encuentra dentro de una distancia determinada (tomando, en estecaso, () un valor igual a 1 si son vecinas o 0 en caso contrario).

    La variable estandarizada () se distribuye a nivel asinttico segnuna normal estndar. En este caso, la hiptesis nula asociada al con-traste ya estandarizado, (), es la ausencia de asociacin espacial,mientras que un valor positivo (negativo) y significativo indica la exis-tencia de una tendencia a la concentracin de valores elevados (bajos)de la variable aleatoria en el espacio analizado.

    Para el computo de estos test, se puede usar cualquier definicin de la matrizde contigidad . Sin embargo, los resultados obtenidos por los diferentescontrastes pueden variar, a veces drsticamente, en funcin de la matriz especificada. Adems, es importante anotar que el clculo de la I de Morano de la C de Gary no excluye el estudio de la () de Getis y Ord enla medida en que todos ellos, en forma conjunta, suministra informacincomplementaria.

    2.2.2. Contrastes locales de autocorrelacin espacial

    Estos contrastes se realizan para determinar las asociaciones de dependenciaespacial entre alguna localizacin especfica con sus vecinos, determinandoagrupaciones o cluster. Generalmente se usa el mapa de la variable aleatoriapara detectar estas agrupaciones (Unwin and Unwin 1998).

    Entre los contrastes locales de asociacin espacial, los ms usados son: elestadstico de Moran, , basados en el test tradicional de la I de Moran yla () y () de Getis y Ord. Para cada caso, se obtendr un valor dedichos estadsticos en cada regin de la muestra, de esta manera se puedeanalizar la situacin de cada unidad espacial por separado.

    27

  • Captulo 2. anlisis exploratorio de datos espaciales

    1. El contraste local de Moran (Anselin and Florax 1995):

    =

    2 /

    (2.5)

    donde es el valor correspondiente de la variable normalizada en laregin , el conjunto de regiones vecinas a .

    Al igual que los estadsticos anteriores, se puede asumir la hiptesis deque estandarizada se distribuye normal estndar. Un valor positivo(negativo) del contraste indicar la existencia de un cluster de valoressimilares (dismiles) de la variable analizada alrededor de la regin .

    2. () de Getis y Ord (1992).

    Getis y Ord presentan varios ndices locales. El primero de ellos estdado por

    () =

    =1

    ()

    =1

    , = (2.6)

    donde es el valor de la variable de inters en la regin y ()son los elementos de la matriz de contigidad para una distancia dada.

    Un segundo contraste presentado por Getis y Ord, denominado ()incluye la observacin para la cual se calcula el valor del estadstico,es decir, no incorpora la restriccin presente en el estadstico anterior,permitiendo que a su vez sea diferente de 0. As:

    () =

    =1

    ()

    =1

    (2.7)

    Los estadsticos locales construidos por (Getis and Ord 1992) inicial-mente solo podan ser aplicados al caso de variables naturales posi-

    28

  • 2.3. MTODOS DE REPRESENTACIN DE LA TENDENCIA ESPACIAL GLOBAL EN GEODA

    tivas y para matrices de contigidad simtricas (binarias o de distan-cia). Para solucionar dichas limitaciones, Ord y Getis (1995) reespecifi-can ligeramente los estadsticos anteriores, obteniendo los denominados y .Despus de la estandarizacin de estos estadsticos locales de Getis yOrd (distribuyndose en todos los casos asintticamente normal estn-dar), un valor significativo y positivo (negativo) de los mismos indicarla existencia de un cluster alrededor de la regin de valores similareselevados (bajos) de la variable .

    Es importante resaltar que los clculos de los estadsticos locales de Moranjunto con los de Getis y Ord son complementarios, en la medida que ambostipos de ndices suministran informacin derivada del significado diferentede sus signos.

    2.3. Mtodos de representacin de la tendenciaespacial global en GeoDa

    Entre los programas de AEDE reticular, se destaca GeoDa, que incluye tam-bin un mdulo dedicado al anlisis de regresin espacial. Este programaha sido desarrollado por el Profesor Luc Anselin, de la Universidad de Illi-nois, para presentar la capacidad y posibilidades del AEDE. En trminosgenerales, las diferentes funciones de GeoDa podran ser clasificadas en 6categoras: tratamiento de datos geogrficos, transformacin de datos, re-presentacin grfica en mapas, grficos estadsticos, dependencia espacialy regresin espacial. La ltima versin de GeoDa es la 0.9.5i del 2004 yse encuentra en la web en http://geodacenter.asu.edu/software/downloads.(Anselin 2004; Chasco 2005).

    2.3.1. Anlisis exploratorio de la dependencia espacialglobal

    Como se enunci en la seccin anterior, la dependencia o autocorrelacin es-pacial, consiste en la existencia de una relacin funcional entre lo que ocurreen un punto determinado del espacio y lo que sucede en lugares cercanoso vecinos al mismo. Es decir, una variable estar espacialmente autocorre-lacionada cuando los valores observados en un punto o regin dependan de

    29

  • Captulo 2. anlisis exploratorio de datos espaciales

    los valores observados en regiones vecinas. La principales tcnicas de asocia-cin espacial en el AEDE reticular son: el diagrama de dispersin de Morany los grficos Local Indicator of Spatial Association, su sigla es LISA (ma-pa/diagrama de caja), as como sus correspondientes versiones multivarian-tes.

    La tendencia espacial es de carcter geogrfico y tiene un sentido global,es decir, referido a todo el mapa (y no a una parte del mismo). Por eso,las tcnicas del AEDE que analizan esta componente son herramientas derepresentacin cartogrfica, donde lo fundamental no es el mapa en s mismo,si no la representacin grfica de los estadsticos bsicos.

    Diagrama de dispersin de Moran univariado

    En el diagrama de dispersin de Moran el eje representa la variable deinters previamente estandarizada y en el eje el retardo espacial de dichavariable estandarizada. Como se enunci en la seccin 2.1.4, se entiende porretardo espacial el promedio ponderado de los valores que adopta una varia-ble en el subconjunto de observaciones vecinas a una dada. La pendiente dela recta de regresin es el valor del estadstico I de Moran de autocorrelacinespacial global.

    Este diagrama de dispersin divide el tipo de asociacin espacial en cuatrocategoras: dos para autocorrelacin espacial positiva (valores altos de unavariable rodeados de valores altos o valores bajos rodeados de valores ba-jos) y dos para autocorrelacin espacial negativa (valores altos rodeados porvalores bajos, y viceversa). Las categoras de asociacin espacial positiva co-rresponden con los cuadrantes I y III y las categoras de asociacin negativavienen dadas por los cuadrantes II y IV.

    Si la recta de regresin que ajusta la variable de inters estandarizada enfuncin de su retardo espacial cruza los cuadrantes I y III, existe una au-tocorrelacin espacial positiva de la variable de inters. Los puntos que seencuentran en el cuadrante II estn asociados a valores bajos de la variablede inters y a valores altos de la variable en su vecindad y viceversa paralos puntos que se encuentran en el cuadrante IV. Si los puntos se concentranen la recta de regresin que pasa por los cuadrantes II y IV se dice que existeuna autocorrelacin espacial negativa.

    La regresin del retardo espacial sobre la variable de inters, se realiza ba-jo las hiptesis clsicas del anlisis de regresin. As, la interpretacin del

    30

  • 2.3. MTODOS DE REPRESENTACIN DE LA TENDENCIA ESPACIAL GLOBAL EN GEODA

    test I de Moran permite conocer el grado en que este estadstico resume laestructura global de asociacin lineal existente en un fenmeno espacial.

    Dado que los valores de la variable se encuentran estandarizados, es posibleconseguir informacin tanto de la asociacin espacial global (pendiente dela recta de regresin) como de la asociacin espacial local. De este modo,los valores en el diagrama de dispersin de Moran situados a ms de dosunidades del origen del sistema coordenado pueden considerarse como puntosatpicos en el diagrama de dispersin de Moran, es decir, outliers locales deno estacionariedad espacial.

    En este estudio de la concentracin de la tierra en Colombia, por departa-mentos, se consideran las variables: porcentaje de tierra que tiene el 95% dela poblacin (PR95), necesidades bsicas insatisfechas en el sector rural en2005 (NBI05 rural), cobertura en educacin secundaria (SEC00), Porcentajede hectreas con presencia de cultivos ilcitos (COCA00), nmero de actosviolentos generados por grupos al margen de la ley (FARC, ELN, Autode-fensas), denotada VIOL-GML, y nmero de desplazados en las cabecerasmunicipales (REP-DES).

    Figura 2.1. Indice de Moran para la variable PR95.

    La figura (2.1) corresponde al grfico de dispersin de Moran para la variablePR95. Muestra que la relacin espacial es positiva, con un ndice de Moran

    31

  • Captulo 2. anlisis exploratorio de datos espaciales

    de 0.3150 y un p-valor de 0.0200. De este p-valor se puede concluir, porejemplo, que la concentracin de la tierra en Colombia no es aleatoria.

    En los cuadrantes I y III se encuentran los departamentos que presentanasociacin espacial positiva; en el cuadrante I encontramos los departamen-tos de la Guajira, Cesar, Bolvar y Atlntico, que tiene una concentracinmoderada de tierra y en el cuadrante III se encuentran los departamentoscon alta concentracin de tierra, que corresponde a los departamentos del piede monte llanero y a los departamentos de Cundinamarca, Boyac, Nario,Cauca, Quindo, Risaralda y Caldas. Los departamentos que presentan unaasociacin espacial negativa estn en los cuadrantes II y IV; en el cuadran-te II se encuentran los departamentos con concentracin alta de tierra, quetienen departamentos vecinos con una concentracin moderada de tierra, yellos son los departamentos de Antioquia, Valle del Cauca y Santander. En elcuadrante IV encontramos los departamentos con concentraciones modera-das de tierra y que estn rodeados de departamentos con una concentracinalta de tierra y que corresponden a los departamentos de Huila, Tolima,Putumayo y Choc.

    Figura 2.2. ndice de Moran para la variable NBI05 Rural.

    32

  • 2.3. MTODOS DE REPRESENTACIN DE LA TENDENCIA ESPACIAL GLOBAL EN GEODA

    La figura (2.2) corresponde al grfico de dispersin de Moran para la variableNBI05 Rural. Muestra que la relacin de asociacin espacial es positiva,con un ndice de Moran de 0.2780 y un p-valor de 0.010. De este p-valorse puede concluir, por ejemplo, que a un nivel de significancia del 5% elcomportamiento de la variable NBI05 en Colombia no es aleatoria.

    La existencia de correlacin espacial positiva se encuentra en los departa-mentos de la regin Caribe y el departamento de Nario con NBI altos ylos departamentos de Quindo, Risaralda, Caldas, Cundinamarca, Boyac,Arauca y Meta con un NBI bajos. Los departamentos que presentan unaasociacin espacial negativa son Antioquia, Atlntico, Santander y Putuma-yo, con NBI bajos con respecto a sus vecinos y Casanare, Valle del Cauca,Choc y Caquet con NBI altos con respecto sus vecinos.

    De igual manera, la variable COCA00 muestra una autocorrelacin espacialpositiva, con un ndice de Moran de 0.2649 y un p-valor de 0.0050. Lo quesignifica, por ejemplo, que a un nivel de significancia del 0.01% el compor-tamiento de la presencia de cultivos de coca en Colombia no es aleatorio. Sedestaca el departamento de Caquet con una presencia elevada de cultivosde coca junto con su vecino Putumayo. Los dems departamentos muestranla presencia de estos cultivos en menor proporcin, ver figura (2.3).

    Diagrama de dispersin

    Este grfico muestra la relacin entre dos variables, GeoDa superpone la rec-ta de regresin ajustada por el mtodo de mnimos cuadrados ordinarios ypresenta el valor de la pendiente de la misma. Este grfico se puede calcularpara los valores estandarizados de las variables, de forma que la pendien-te de la recta de regresin se corresponda con el coeficiente de correlacinde Pearson. Adicionalmente, el anlisis de los 4 cuadrantes del diagrama dedispersin permite identificar las localizaciones con valores superiores o in-feriores a la media en ambas variables o al contrario, valores superiores a lamedia en una variable e inferiores a la media en otra.

    El grfico (2.4) muestra que la correlacin entre las dos variables estandari-zadas NBI05 y PR95 es de 0.4074. En general, un ndice de NBI alto tieneconcentracin moderada de tierra y un ndice NBI medio tiene una concen-tracin alta de tierra. Entre los departamentos con moderada concentracinde tierra y NBI bajo estn Atlntico, Putumayo, Huila y Tolima. Entre losdepartamentos con NBI medio y alta concentracin de tierra estn Cundina-marca, Boyac, Santander, Quindo, Risaralda, Caldas, Antioquia, Valle del

    33

  • Captulo 2. anlisis exploratorio de datos espaciales

    Figura 2.3. ndice de Moran para la variable COCA00.

    Cauca y Meta. Los departamentos que presentan moderada concentracinde tierra y altos niveles de NBI son los departamentos de la regin Caribey el departamento del Choc. Los departamentos que presentan alta con-centracin de tierra y altos niveles de NBI son los departamentos Arauca,Casanare, Caquet, Nario y Cauca.

    Para las variables estandarizadas de violencia de los grupos armados al mar-gen de la ley (VIOL-GRARM) y PR95, se evidenci una correlacin negativasde -0.4239, como lo muestra la grfica (2.5). Esto significa que a mayor nive-les de violencia mayor es la concentracin de tierra. Entre los departamentoscon mayor violencia y alto nivel de concentracin de tierra se destacan: An-tioquia, Valle del Cauca, Cauca, Nario, Risaralda Santander y Arauca. Losdepartamentos que muestran un nivel medio de violencia y moderada con-centracin de tierra estn los departamentos de Choc, Guajira, Atlntico,Sucre, Magdalena, Crdoba, Huila, Tolima y Putumayo. Los departamentos

    34

  • 2.3. MTODOS DE REPRESENTACIN DE LA TENDENCIA ESPACIAL GLOBAL EN GEODA

    Figura 2.4. Diagrama de dispersin para PR95 y NBI05.

    Figura 2.5. Diagrama de dispersin para PR95 y Violencia de Grupos Ar-mados al Margen de la Ley.

    con moderada concentracin de tierra y alto nivel de violencia son Bolvar yNorte de Santander.

    Las dems variables con respecto a la concentracin de tierra no presentan

    35

  • Captulo 2. anlisis exploratorio de datos espaciales

    correlaciones relevantes.

    Diagrama de dispersin de Moran bivariado

    Se trata de un diagrama de dispersin de Moran, que en el eje vertical representa el retardo espacial de la variable que se desea explicar y en el eje la variable explicativa. Ambas variables deben estar previamente estanda-rizadas, de tal forma que la media de ambas sea cero y la desviacin estndarsea uno. Es decir, se trata de ver la relacin que existe, en cada punto de lamuestra, entre los valores de una variable y el valor medio de otra variable enlas vecindades de dicho punto. La pendiente de la lnea de regresin muestrael grado de relacin lineal existente entre la variable del eje horizontal y losvalores de la variable del eje vertical en los puntos vecinos a uno dado.

    Figura 2.6. ndice de Moran para NBI05 Rural y el retardo espacial de PR95.

    36

  • 2.3. MTODOS DE REPRESENTACIN DE LA TENDENCIA ESPACIAL GLOBAL EN GEODA

    En el caso del NBI05 vs W-PR95 se encontr que el I de Moran es de 0.2288,con un p-valor de 0.0010, como se evidencia en el grfico (2.6). Se identifi-ca una relacin positiva en la variable NBI05 con el retardo espacial de lavariable PR95. Se destaca el comportamiento de la regin Caribe que pre-senta valores altos de NBI05, con promedios de concentracin moderada detierra en estos departamentos y en los departamentos de Boyac, Casanarey Arauca que presenta valores medios de la variable NBI05, con promediosde concentracin alta de tierra de los mismos.

    2.3.2. Anlisis exploratorio de la dependencia espacial local

    Los indicadores LISA, Local Indicator of Spatial Association se representaen un mapa y/o en un diagrama de caja. El indicador LISA definido por(Anselin and Florax 1995), cumple con dos objetivos: el primero, que el valordel estadstico obtenido para cada observacin suministre informacin acercade la relevancia de una agrupacin espacial de valores similares alrededor dela misma, y segundo, que la suma del valor del estadstico para todas lasobservaciones sea proporcional a un indicador global de asociacin espacial.Sin embargo, no siempre se cumplen estos dos objetivos simultneamente.

    El mapa LISA representa las localizaciones de las asociaciones espacialeslocales de valores similares alrededor de un valor especfico de la variable deinters (Getis and Ord 1992; Anselin and Florax 1995; Unwin and Unwin1998). Los grficos LISA incluidos en GeoDa se basan en el estadstico Ide Moran de asociacin local. Se trata de un estadstico que, a diferenciadel estadstico I de Moran, no se calcula de forma global para todas lasobservaciones del mapa, sino que adquiere un valor diferente para todas ycada una de ellas, ver la ecuacin (2.5).

    Este estadstico mide el grado de concentracin de valores altos/bajos deuna variable en el entorno geogrfico de cada una de las observaciones de lamuestra. Para cada valor del estadstico es posible realizar una inferencia pa-ra evaluar el nivel de significancia estadstica de rechazo de la hiptesis nulade ausencia de similitud o disimilitud de valores en una localizacin geogr-fica. De este modo, se pone de manifiesto la presencia de atpicos espaciales,cuya mayor o menor intensidad depender de la significancia asociada a elestadstico I de Moran local.

    En el mapa (2.7) se identifica dos clusters asociados con la variable PR95(Guajira, Atlntico, Magdalena y Bolvar), con valores bajos de concentra-cin de tierra y un nivel de significancia de 0.05. El segundo cluster est

    37

  • Captulo 2. anlisis exploratorio de datos espaciales

    conformado por los departamentos de Boyac, Arauca y Casanare, con va-lores altos de concentracin de tierra y un p-valor de 0.01.

    Figura 2.7. Mapa LISA para la variable PR05 Rural.

    2.3.3. Anlisis exploratorio de datos multivariados

    El anlisis exploratorio de datos multivariados muestra las relaciones espa-ciales existentes entre las variables geogrficas en cuestin. Mencionaremosnicamente el grfico condicional.

    Grficos condicionales

    Este tipo de grficos utiliza 2 variables condicionales que dividen a la mues-tra de datos en diferentes grupos (categoras). Se trata de dibujar, para unatercera variable, un grfico o mapa diferente para cada grupo o categora.El programa GeoDa considera, para cada una de las 2 variables condicio-nales, 3 grupos o categoras, por lo que se producir un total de 9 grficoso mapas. Este programa permite variar los intervalos que determinan cadacategora. En concreto, con el programa GeoDa se pueden disear 4 tipos de

    38

  • 2.3. MTODOS DE REPRESENTACIN DE LA TENDENCIA ESPACIAL GLOBAL EN GEODA

    grficos condicionales: mapas, diagramas de caja, histogramas condicionalesy diagramas de dispersin condicionales.

    Figura 2.8. Mapa Condicional de PR95, NBI05 Rural y de Violencia degrupos al margen de la ley.

    Por ltimo, se muestra en la figura (2.8) un grfico condicional que permitever las relaciones existentes entre tres variables, dos variables condicionales

    39

  • Captulo 2. anlisis exploratorio de datos espaciales

    que son PR95 y NBI05 Rural con la variable VIOL-GRARM. En estos mapasse muestra que Valle del Cauca y Meta tienen alta concentracin de tierracon bajo NBI y con un nivel medio de violencia de los grupos al margen dela ley. En esta misma categora del alta concentracin de tierra pero con unNBI medio se encuentran los departamentos de Antioquia con una violenciamuy alta, le sigue Arauca y Cauca con un nivel medio-alto de violencia yluego los departamentos de Boyac y Nario con niveles medio de violencia.Se destaca tambin la categora de baja concentracin y nivel medio de NBIcon niveles medio de violencia en los departamentos de Cesar, Magdalena,Bolvar y Norte de Santander, Huila y Putumayo. Los departamentos deChoc, Crdoba y Sucre que tienen un NBI alto, con moderada concentracinde tierra presenta nivel bajo de violencia.

    40

  • Captulo 3. Modelacin de laconcentracin de tierra en

    Colombia por mtodos clsicosde econometra espacial

    3.1. Introduccin

    La econometra espacial surge de la necesidad de analizar datos regionalesde corte transversal. Cuando se utilizan este tipo de datos aparecen los efec-tos espaciales: la dependencia espacial y la heterogeneidad espacial. Estascaractersticas permite el uso de tcnicas economtricas no convencionales.Por ello es necesario un conjunto de mtodos y tcnicas diferentes a las cono-cidas en econometra. En la dcada de los 50, (Moran 1948) y (Geary 1954)son quienes presentan los primeros ndices para medir la autocorrelacin odependencia espacial. Posteriormente, el trmino de econometra espacial lopresenta (Paelinck and Klaassen), destacando cinco caractersticas de estu-dio: 1) El papel de la interdependencia espacial en modelos espaciales. 2) Laasimetra en las relaciones espaciales. 3) La importancia de factores explica-tivos en reas (espacios) diferentes. 4) Diferenciacin de las interacciones exante y ex post. 5) Modelizacin explcita del espacio. Luego Anselin en 1988define la econometra espacial como el Conjunto de tcnicas que tratan las

    41

  • Captulo 3. Modelacin de la concentracin de tierra enColombia por mtodos clsicos de econometra espacial

    peculiaridades causadas por el espacio en el anlisis estadstico de modelosde ciencia regional.

    Entre los modelos ms conocidos para el estudio del comportamiento de va-riables con distribucin espacial se encuentran tres: el primer modelo, incluyeretardo espacial en la variable dependiente, el segundo, presenta el retardoespacial en los errores y es conocido como un modelo de autocorrelacin es-pacial residual y el tercero, presenta heterogeneidad en los errores (Anselin988b). En los dos primeros modelos es necesario recurrir a la matriz de ve-cindades o matriz de pesos definida en el captulo anterior, para incluirla autocorrelacin espacial, la cual permite incorporar las influencias mutuaspresentes entre las unidades espaciales de la muestra. En el tercer caso, pue-de presentarse el retardo espacial en el error o en la variable dependiente oen ambas, en cuyo caso necesita las matrices de vecindades 1 y 2 que enalgunos casos pueden ser iguales.

    En este captulo, en la seccin 3.2 se define el modelo lineal general espa-cial presentado por (Anselin) y los casos particulares ms conocidos de estemodelo, en la seccin 3.2.1 se muestra los estimadores mximo verosmil delos parmetros y finalmente en la seccin 3.2.2 se analizan los datos de ladistribucin de tierra privada en Colombia para el ao 2000 utilizando estametodologa.

    3.2. Modelo de regresin lineal espacial

    Los modelos de regresin lineal espaciales los presenta (Anselin 1988), conuna estructura general para organizar varias situaciones modelo en la eco-nometra espacial. Las especificaciones se refieren a situaciones donde lasobservaciones son disponibles para una seccin cruzada de unidades espacia-les en un punto en el tiempo. La expresin del modelo es

    y = W1y + X + ,

    = W2+ ,

    con (0,)(3.1)

    y los elemnetos de la matriz de covarianzas como:

    = () hi > 0, (3.2)

    donde 0, . . . , , son las variables exgenas, con 0 = 1 para asumir unmodelo con intercepto, X es una matrix de tamao que contiene

    42

  • 3.2. MODELO DE REGRESIN LINEAL ESPACIAL

    observaciones de las + 1 variables exgenas consideradas; = (0, . . . , )es el vector de parmetros asociado con +1 variables exgenas; es el coefi-ciente de la variable dependiente retardada espacialmente y es el coeficienteen la estructura autorregresiva espacial de .

    La perturbacin tiene una distribucin normal con media un vector deceros y con matriz de covarianza diagonal . Los elementos de la diagonalprincipal muestran la heteroscedasticidad como una funcin de + 1 varia-bles exgenas Z, la cual incluye un trmino constante. Los parmetros son los trminos no constantes de Z, en caso de que = 0, se tiene = 2,es decir, la situacin clsica de homoscedasticidad.

    Las matrices W1 y W2 son matrices de peso espacial estandarizadas o noestandarizadas de , asociadas con un procesos autorregresivo en lavariable dependiente y uno en el trmino de la perturbacin, respectivamente,cabe anotar que las matrices pueden ser iguales. Este hecho permite que losdos procesos pueden ser derivados por una estructura espacial diferente, comolo expresa (Hordijk).

    El modelo tiene en total + + 3 parmetros desconocidos, que en formavectorial se expresara

    = [,, ,2,

    ] (3.3)

    El modelo lineal general se pude expresar como

    y = W1y + X + W2+ , (3.4)

    y substituyendo en la ecuacin (3.4) por = y X W1y se obtiene:

    y = W1y + X + W2(y X W1y) + ,= W1y + X + W2y W2X W2W1y + ,

    (3.5)

    Se tienen dos posibles formas de analizar este modelo, cuando 1 y 2son diferentes y cuando son iguales. En el primer caso, las matrices de pesono tienen elementos en comn pues corresponden a diferentes ordenes decontigidad y por tanto 12 = 0. Luego la ecuacin (3.5) quedara:

    y = W1y + X + W2y W2X + , (3.6)y se reduce a un retardo espacial biparamtrico con algunas restricciones enlos parmetros. En el segundo caso, la ecuacin quedara:

    43

  • Captulo 3. Modelacin de la concentracin de tierra enColombia por mtodos clsicos de econometra espacial

    y = (+ )W1y + X W1X W21y + , (3.7)y los dos parmetros y tienen restricciones (posibles conflictos), as queno se pueden identificar univocamente como lo muestra (Anselin and Bera).

    El mtodo de mnimos cuadrados ordinarios para el modelo de retardo espa-cial no provee estimadores consistentes del modelo expresado en la ecuacin(3.1) por la presencia de retardos espaciales entre las variables explicativas.

    Del modelo lineal general se pueden expresar varios casos particulares cuan-do los subvectores del vector son conjuntos de ceros, las estructuras delmodelo espacial cambia a formas conocidas de los modelos espaciales. Acontinuacin se mostraran las cuatro formas ms conocidas en la literatura.

    1. Para = 0, = 0, = 0 ( + 2 restricciones):

    y = X + (3.8)

    es el modelo de regresin lineal clsica, sin efectos espaciales.

    2. Para = 0, = 0 ( + 1 restricciones):

    y = W1y + X + (3.9)

    es el modelo mixto regresivo espacial autorregresivo de primer orden,la cual incluye las especificaciones del factor comn, con X incluidaen las variables explicativas, como un caso especial.

    3. Para = 0, = 0 ( + 1 restricciones):

    y = X + (I W2)1 (3.10)es un modelo de regresin lineal con perturbacin autorregresiva deprimer orden.

    4. Para = 0 ( restricciones):

    y = W1y + X + (I W2)1 (3.11)es un modelo mixto regresivo espacial autorregresivo con perturbacinautoregresiva de primer orden.

    Se pueden plantear ms especificaciones de modelos si en las ecuaciones (4)al (7) se permite heteroscedasticidad en (Z).

    44

  • 3.2. MODELO DE REGRESIN LINEAL ESPACIAL

    3.2.1. Estimadores mximo verosmil para el modelo linealgeneral

    En orden a introducir los estimadores mximo verosmil, se deriva la funcinde verosimilitud del modelo lineal general. De la ecuacin (3.1) se obtiene:

    (I W1)y = X + (3.12)y

    = (I W2)1 (3.13)de las ecuaciones (3.12) y (3.13) se obtiene:

    = (I W2)[(I W1)y X] (3.14)

    La funcin de verosimilitud para (0,) esta dada por:

    (2;) = () 12 [ 121

    ](3.15)

    Si = 2I, se tiene que = 2I = 2. Adems la inversa de la matrizde varianzas y covarianzas es 1 = 2I. Por tanto

    (2;) = ()(2)12

    [ 122

    ]

    (3.16)

    El jacobiano de la transformacin de en y expresada en la ecuacin (3.14)es:

    =

    = I W2(I W1) (3.17)Entonces con la ecuacin (3.16) y el jacobiano de la transformacin se puedeexpresar la funcin de verosimilitud de y como:

    (, , 2,; y) = (y)(2)12

    I W2(I W1)[ 122

    ]

    (3.18)con como una funcin de y, as como se expresa en la ecuacin (3.14).Consecuentemente, la log-verosimilitud se expresa como:

    (, , 2,; y) = (y) 12(2) +

    I W2+ (I W1)+[ 1

    22

    {(I W2)[(I W1)y X]

    }{(I W2)[(I W1)y X]

    }(3.19)

    45

  • Captulo 3. Modelacin de la concentracin de tierra enColombia por mtodos clsicos de econometra espacial

    La funcin anterior no se puede maximizar analiticamente debido a que losparmetros que se encuentran en ella tienen un alto grado de no linealidad.(Arbia) muestra en su libro una aproximacin a esta funcin de verosimilitudusando una metodologa planteada inicialmente por (LeSage) la cual consisteen cambiar algunos parmetros molestos por estimadores consistentes deellos.

    (LeSage 1999) propone estimar los parmetros del vector con los estima-dores de mnimos cuadrados del modelo reducido:

    (I W2)y = X + (3.20)Usando como matriz de pesos a T = (I W1)(I W1), se obtiene:

    = (XTX)1XT(I W2)y (3.21)Seguido, se define el estimador de los residuos del modelo (3.20) como:

    = (I W2)y X (3.22)y usando lo anterior se encuentra el estimador consitente de la varinaza delruido blanco dado por:

    2 =

    (3.23)

    Sustituyendo las estimaciones de los betas y de la varianza en la ecuacin(3.19) se obtiene:

    (, , ; y) = (y) + I W2+ (I W1)

    +[ 1

    22

    {(I W2)[(I W1)y X]

    }{(I W2)[(I W1)y X]

    }(3.24)

    que se puede maximizar numricamente para obtener los mximos de lafuncin seudo-verosimilitud de los parmetros y , llamados y . Lasestimaciones de los parmetros y 2 se hallan al sustituir y en lasecuaciones (3.21),(3.22) y (3.23).

    La prueba de hiptesis para mostrar la independencia espacial en el modeloespacial general se especifica como 0: = = 0 vs 1 : = = 0. Paraesta prueba se utiliza la aproximacin de la razn de verosimilitud. Bajo lahiptesis nula la funcin log-verosimilitud se expresa como:

    0(2,; y) = (y)

    22 1

    22[IX][IX] (3.25)

    46

  • 3.2. MODELO DE REGRESIN LINEAL ESPACIAL

    y la prueba de razn de verosimilitud esta dada por:

    = 2[(, , 2,; y) 0(2,; y)] (3.26)

    estadstico que est distribuido asintticamente como una 2 con dos gradosde libertad.

    Seleccin del modelo

    La seleccin de los modelos se hace utilizando el criterio de informacin deAkaike, AIC por sus siglas en ingls,

    =2+ 2

    (3.27)

    y el criterio de informacin bayesiana, BIC por sus siglas en ingls, o criteriode Schwarz

    =2+

    (3.28)

    donde es la verosimilitud, es el nmero de observaciones y es el nmerode parmetros estimados en el modelo. Estos dos criterios permiten deter-minar la bondad del ajuste del modelo. Entre los modelos que satisfacen lossupuestos de no correlacin de los residuales y de los residuales al cuadrado,se escoge el de menor valor de BIC o AIC.

    3.2.2. Aplicacin

    En esta seccin se estudia el modelo que se ajustar a los datos de concen-tracin de tierra, utilizando la variable independiente de concentracin detierra denotada por PR-95 que corresponde, como se dijo anteriormente, a laproporcin del 95 % de propietarios de la tierra que tiene un porcentaje acu-mulado de tierra y est calculada para el ao 2000, los datos originales fueronsuministrados por el IGAC y el Banco de la Repblica. Se consideraron co-mo variables explicativas del nivel de concentracin de tierra en Colombia,las siguientes: necesidades bsicas insatisfechas del sector rural para el ao2005 (NBI05 rural), tasa de cobertura en educacin secundaria para el ao2000 (SECU00), tasa de cobertura en la educacin superior para el ao 2000(TC-ES00), tasa de participacin de los departamentos con cultivos ilcitos

    47

  • Captulo 3. Modelacin de la concentracin de tierra enColombia por mtodos clsicos de econometra espacial

    (coca y amapola) durante el ao 2000 (Coca00), la variable violencia de gru-pos armados al margen de la ley para el ao 2000 (VIOL-GML) y tasa derecepcin de desplazados para el ao 2000 (TR-DES). Los datos, de estasvariables, utilizados en este anlisis fueron suministrados por diversas insti-tuciones. Los datos de la variable NBI05 rural fueron suministrados por elDANE, Departamento Administrativo Nacional de Estadsticas, los de SE-CU00 y TC-ES00 por el Ministerio de Educacin Nacional, los de Coca-00por la Polica Nacional - Direccin Antinarcticos, y los de VIOL-GML yTR-DES por el Departamento Nacional de Planeacin.

    Para comparar el desempeo del anlisis estadstico de estos datos, conside-ramos a continuacin varios modelos, el modelo de regresin lineal, el modelocon retardo espacial en la variable dependiente y el modelo con retardo es-pacial en los errores, y se muestra que el modelo con mejor ajuste es el quepresenta dependencia espacial en los errores.

    Modelo de regresin clsica

    En este modelo no se tiene en cuenta la dependencia espacial y su estimacinse realiza por mnimos cuadrados ordinarios (MCO), cuya expresin estadada por y = X + .

    Se ajustaron dos modelos. En el primero se consideraron las siguientes va-riables explicativas: NBI05, SECU00, Coca00, VIOL-GML y TR-DES, losparmetros estimados se encuentran en el cuadro (3.1). Para este modelo elcriterio de informacin de Akaike (AIC) est dado por = 195.36 y elcriterio de informacin bayesiana, (BIC) est dado por = 202.91 Enel segundo, las variables explicativas que se tomaron fueron: NBI05R, SE-CU01 y VIOL-GML. Los parmetros estimados se presentan en el cuadro(3.2). Para este modelo el valor del = 193.45 y el = 198.48. Entrelos dos modelos de regresin lineal el segundo presenta menor valor en loscriterios de informacin de Akaike y Bayesiano.

    0 1 2 3 4 51 -17.3943 0.2256 0.7407 0.1893 -0.0537 0.5345s.d 39.04215 0.1165 0.4898 0.2276 0.0242 0.4874p.v 0.6607 0.0670 0.1461 0.4153 0.0380 0.2858

    Cuadro 3.1. Parmetros estimados para el modelo 1

    48

  • 3.2. MODELO DE REGRESIN LINEAL ESPACIAL

    Modelo 0 1 2 32 -25.3634 0.1945 0.8796 -0.04534s.d 37.4410 0.1124 0.4626 0.0228p.v 0.5051 0.0977 0.0704 0.0597

    Cuadro 3.2. Parmetros estimados para el modelo 2

    La prueba de normalidad de los errores de Jarque-Bera, cuya hiptesis nula esel supuesto de normalidad versus la hiptesis alternativa de no normalidad,no rechaza la hiptesis 0, a un nivel de significancia del 5 %, en ningunode los dos modelos. De igual forma para ambos modelos, el diagnstico deheteroscedasticidad de los residuos dado por el estadstico de Breusch-Pagan,cuya hiptesis nula es que los parmetros de la varianza son ceros versus laalterniativa de que alguno de ellos es diferente de cero, no rechaza la hiptesis0, a un nivel de significancia del 5 %, esto es ausencia de heteroscedasticidad(Breusch and Pagan 1979).

    Modelo de regresin espacial con la variable dependiente retardadaespacialmente

    El modelo de regresin espacial con la variable dependiente retardada espa-cialmente, se expresa como y = W1y + X + . En este caso se ajustarondos modelos, el primero tiene la variable retardada espacialmente y las varia-bles independientes NBI05 rural, SECU00, Coca00, VIOL-GML, TR-DES yTC-ES00. Para este modelo el criterio de informacin de Akaike (AIC) es-t dado por = 195.76 y el criterio de informacin bayesiana, (BIC)est dado por = 202.82 y los parmetros estimados se muestran enel cuadro (3.3). El segundo modelo tiene la variable dependiente retardadaespacialmente y las variables explicativas NBI05 rural, Coca00, VIOL-GMLy TC-ES00. Los parmetros estimados se presentan en el cuadro (3.4).Pa-ra este modelo el criterio de informacin de Akaike (AIC) est dado por = 194.29 y el criterio de informacin bayesiana, (BIC) est dado por = 201.84. As el mejor modelo es el segundo, ya que tiene menor valoren los dos criterios.

    Para ambos modelos, el diagnstico de heteroscedasticidad de los residuosdado por el estadstico de Breusch-Pagan, no rechaza la hiptesis 0, a unnivel de significancia del 5 % de ausencia de heteroscedasticidad.

    49

  • Captulo 3. Modelacin de la concentracin de tierra enColombia por mtodos clsicos de econometra espacial

    Modelo 0 1 2 3 4 5 6 1 -1.9034 0.2944 0.3075 0.3495 -0.0609 0.5101 0.4283 0.2163s.d 34.6007 0.1212 0.4704 0.2086 0.0205 0.4106 0.3100 0.2153p.v 0.9561 0.0151 0.5132 0.0939 0.0030 0.2140 0.1670 0.3151

    Cuadro 3.3. Parmetros estimados para el modelo con retardo espacial

    Modelo 0 1 2 3 4 2 19.0137 0.2868 0.3393 -0.0572 0.4893 0.3211s.d 12.9083 0.1073 0.2101 0.0195 0.2750 0.2086p.v 0.1407 0.0075 0.1063 0.0033 0.0751 0.1237

    Cuadro 3.4. Parmetros estimados para un modelo con retardo espacial

    La prueba de razn de verosimilitud, est dada por = 2( ),donde es la funcin log-verosimilitud de un modelo espacial autorre-gresivo evaluada en los estimadores mximos verosmiles de los coeficientesy es la funcin log-verosimilitud para un modelo de regresin de m-nimos cuadrados ordinarios igualmente evaluado usando los estimadores deeste modelo. Este estadstico se distribuye 2 con un grado de libertad (An-selin 1988). Las hiptesis nula y alternativa se expresan como 0 : = 0 y1 : = 0, respectivamente. En este caso la prueba de dependencia espacialdada por la prueba de razn de verosimilitud no rechaza la hiptesis 0 dedependencia, a un nivel de significancia del 5 %.

    Modelo de Regresin espacial con retardo espacial en el error

    El modelo con retardo espacial en el error, expresado como y = X+ con = + , y con (0, 2). En este caso se ajustaron dos modelos,el primer modelo tiene las variables independientes NBI05 rural, SECU00,Coca00, VIOL-GML, TR-DES y la variable retardada espacialmente en elerror Para este modelo el criterio de informacin de Akaike (AIC) est dadopor = 192.39 y el criterio de informacin bayesiana, (BIC) est dadopor = 199.94. El segundo modelo se encuentra las variables NBI05 ru-ral, Coca00, VIOL-GML y la variable retardada espacialmente en el error. Acontinuacin en los cuadros (3.5) y (3.6) se presentan los parmetros estima-dos de ambos modelos. Para este modelo el criterio de informacin de Akaike(AIC) est dado por = 190.83 y el criterio de informacin bayesiana,

    50

  • 3.3. CONCLUSIONES

    (BIC) est dado por = 195.86. As, el mejor modelo es el segundo cuyosvalores de ambos criterios son menores que los del primer modelo.

    Modelo 0 1 2 3 4 5 1 7.3875 0.1806 0.4693 0.3649 -0.0572 0.3500 0.5043s.d 31.7992 0.1039 0.3823 0.2010 0.0204 0.3845 0.1963p.v 0.8162 0.0823 0.2196 0.0695 0.0051 0.3627 0.0102

    Cuadro 3.5. Parmetros estimados para un modelo con retardo espacial enlos errores

    Modelo 0 1 2 3 2 47.2447 0.1630 0.3685 -0.0535 0.5898s.d 7.5395 0.1056 0.2087 0.0181 0.1743p.v 0.0000 0.1228 0.0775 0.0032 0.0007

    Cuadro 3.6. Estimadores para un modelo con retardo espacial en los errores

    El diagnstico de heteroscedasticidad de los residuos dado por el estadsticode Breusch-Pagan, no rechaza la hiptesis 0, a un nivel de significancia del5 % de ausencia de heteroscedasticidad. La prueba de dependencia espacial enlos errores dada por la prueba de razn de verosimilitud rechaza la hiptesis0, a un nivel de significancia del 5%, evidenciando la dependencia espacialen los errores.

    3.3. Conclusiones

    Como lo muestra el cuadro (3.7), los modelo con menor AIC y BIC corres-ponden a los de retardo espacial en los errores, siendo el de mejor ajuste elsegundo, cuyas variables independientes estn dadas por NBI05 rural, Co-ca00, VIOL-GML. Lo que evidencia que la variable concentracin de la tierraprivada rural en Colombia para el ao 2000 es explicada por estas variables.Se utiliz el modelo de regresin lineal clsica para mostrar la diferencia conun modelo que presenta dependencia espacial, teniendo mejor ajuste el quepresenta dependencia espacial.

    51

  • Captulo 3. Modelacin