e spacial

3
Análisis de Datos Espaciales En clases anteriores hemos discutido los datos longitudinales, o “medidas repetidas en el tiempo”. En este tipo de datos debemos modelar la correlación entre observaciones del mismo sujeto, ya sea mediante la introducción de un efecto aleatorio de sujeto, mediante una estructura de covarianza para los errores, o mediantes ambos mecanismos. En el caso de datos georreferenciados tenemos la misma situación: hay que considerar la correlación entre las observaciones. Al igual que en las medidas repetidas en el tiempo, típicamente las observaciones más cercanas estarán más correlacionadas entre sí. Por lo tanto, la correlación entre los errores (o las observaciones) será una función de la distancia entre éstos. La distancia entre dos puntos P y Q , referenciados en un sistema de coordenadas de dos dimensiones (x,y), es 2 2 ( ) ( ) PQ P Q P Q d x x y y Normalmente suponemos varianzas homogéneas y que la correlación es la misma para dos puntos a la misma distancia (isotropía) sin importar la dirección en la que están los dos puntos. Bajo isotropía, las estructuras de correlación dependen solamente de la distancia entre los dos puntos. Los modelos más comunes para la correlación son: (pág 440 de SAS). 1. Esférico 3 ( , ) ( ) 1 1.5 0.5 si ij ij i j ij ij d d Corr e e f d d 2. Exponencial ( , ) ( ) exp ij i j ij d Corr e e fd 3. Gaussiano 2 2 ( , ) ( ) exp ij i j ij d Corr e e f d

Upload: vsuarezf2732

Post on 01-Oct-2015

215 views

Category:

Documents


0 download

DESCRIPTION

Spacial

TRANSCRIPT

  • Anlisis de Datos Espaciales

    En clases anteriores hemos discutido los datos longitudinales, o medidas repetidas en

    el tiempo. En este tipo de datos debemos modelar la correlacin entre observaciones

    del mismo sujeto, ya sea mediante la introduccin de un efecto aleatorio de sujeto,

    mediante una estructura de covarianza para los errores, o mediantes ambos

    mecanismos.

    En el caso de datos georreferenciados tenemos la misma situacin: hay que considerar

    la correlacin entre las observaciones. Al igual que en las medidas repetidas en el

    tiempo, tpicamente las observaciones ms cercanas estarn ms correlacionadas entre

    s. Por lo tanto, la correlacin entre los errores (o las observaciones) ser una funcin de

    la distancia entre stos. La distancia entre dos puntos P y Q, referenciados en un sistema

    de coordenadas de dos dimensiones (x,y), es

    2 2( ) ( )PQ P Q P Q

    d x x y y

    Normalmente suponemos varianzas homogneas y que la correlacin es la misma para

    dos puntos a la misma distancia (isotropa) sin importar la direccin en la que estn los

    dos puntos. Bajo isotropa, las estructuras de correlacin dependen solamente de la

    distancia entre los dos puntos.

    Los modelos ms comunes para la correlacin son: (pg 440 de SAS).

    1. Esfrico

    3

    ( , ) ( ) 1 1.5 0.5 siij ij

    i j ij ij

    d dCorr e e f d d

    2. Exponencial

    ( , ) ( ) exp iji j ij

    dCorr e e f d

    3. Gaussiano

    2

    2( , ) ( ) expij

    i j ij

    dCorr e e f d

  • 4. Lineal

    1( , ) ( ) 1 sii j ij ij ij

    Corr e e f d d d

    5. Lineal-log

    1( , ) ( ) 1 log( ) si logi j ij ij ij

    Corr e e f d d d

    6. Potencia

    ( , ) ( ) ijd

    i j ijCorr e e f d

    Debemos observar que en cada uno de estos modelos isotrpicos tenemos un

    parmetro de correlacin para estimar, y adems debemos estimar la varianza de los

    errores. Existen otros modelos con mayor nmero de parmetros (por ej., Matrn). Si el

    modelo fuese anisotrpico (hasta dos direcciones perpendiculares en SAS) o

    heteroscedstico habra ms cantidad de parmetros para estimar.

    Modelos con efecto pepita (nugget)

    Existen situaciones en las que localmente se observa ms variabilidad que la que

    esperaramos con los modelos anteriores, aunque la correlacin sigue dependiendo de

    la distancia entre las observaciones. Este efecto puede modelarse como una varianza

    adicional (efecto nugget):

    2 2

    1

    2

    ( )

    ( , ) ( )

    i

    i j ij

    Var e

    Cov e e f d

    Para ajustar estos modelos en SAS podemos usar dos estrategias: si no tenemos

    nugget modelamos directamente la matriz R con algunos de los modelos presentados

    antes (comando REPEATED con la opcin TYPE). Si tenemos nugget, entonces

    podemos modelar con REPEATED y las opciones TYPE y LOCAL, o modelamos la

    estructura de covarianza mediante el comando RANDOM (y la opcin TYPE) y el

    nugget es directamente la varianza residual (que aparece automticamente sin

    necesidad de usar REPEATED).

  • Ejemplo (pg. 458 en SAS for Mixed Models)

    Los datos provienen de una investigacin para evaluar las caractersticas del drenaje en

    sitio potencialmente peligroso por estar contaminado. Se estudiaron varias

    localizaciones en el sitio, para estudiar la relacin entre el movimiento del agua (medida

    por la log-transmitividad, LOGT) y el grosor de la capa de sal (SALT). Se espera una

    relacin lineal entre ambas medidas, pero tambin se espera que haya correlacin

    espacial entre las observaciones, para lo cual se registraron las coordenadas de cada

    localizacin (Northing, Easting).

    Se ajustan distintos modelos de covarianza, usando como efecto fijo la relacin lineal

    entre logt y sal.