metodología para la espacialización de variables

20

Upload: others

Post on 16-Oct-2021

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Metodología para la espacialización de variables

Metodología para la espacialización de variables

meteorológicas y de contaminantes utilizando

herramientas de programación de alto nivel

Nicolás Cuadros Rubio

Universidad Militar Nueva Granada

Facultad de Ingenieria, Especialización en Geomática

Bogotá, Colombia2015

Page 2: Metodología para la espacialización de variables

Índice general

1. Planteamiento del problema 6

2. Marco conceptual y teórico 7

2.1. Lenguaje de programación R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2. Geoestadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.3. El Semivariograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.4. Kriging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.5. Series de tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.6. Mapas de calor (Heatmap) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3. Objetivos 9

3.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.2. Objetivos especí�cos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

4. Datos y Métodos 10

4.1. Area de estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104.2. Información a utilizar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104.3. Método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

5. Resultados 12

5.1. Análisis espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125.1.1. Análisis exploratorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125.1.2. Análisis estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125.1.3. Predicciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

5.2. Análisis temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

6. Conclusiones 18

2

Page 3: Metodología para la espacialización de variables

Índice de �guras

4.1. Perímetro urbano de la ciudad de Bogotá y ubicación de las estaciones de monitoreo de laRMCAB [3]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

5.1. Ejemplo de los resultados de los estadísticos descriptivos para la variable velocidad del viento 135.2. información preliminar espacial de la variable temperatura y precipitación . . . . . . . . . . 135.3. Semivariogramas de la precipitación en el trimestre septiembre octubre noviembre de 2001 . 145.4. Ejemplo de los resultados de los semivariogramas y sus modelos en la lluvia y la temperatura 145.5. Mapas generados mediante automatización . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155.6. Mapas de varianza de las interpolaciones logarítmicas generadas mediante automatización para

distintas variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165.7. Productos temporales de las series de tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . 175.8. Mapas de calor de las series de tiempo para el último año . . . . . . . . . . . . . . . . . . . . 17

3

Page 4: Metodología para la espacialización de variables

Resumen

En el presente trabajo se desarrolló una metodología para la automatización de la creación de mapas devariables atmosféricas y de contaminantes, tales como precipitación, velocidad del viento, temperatura ymaterial particulado teniendo como base la información en resolución horaria de las estaciones de la Red deMonitoreo de Calidad del Aire de Bogotá (RMCAB) a partir de sus inicios en el año 1997 hasta la actualidad,realizando análisis descriptivos tanto en la componente temporal como espacial y �nalmente generando unainterpolación para la producción en masa de mapas, usando como herramienta el lenguaje de programaciónR.

Palabras Clave: Automatización, Análisis espacial, Temperatura, Precipitación, Velocidad del viento, Materialparticulado (PM10).

Abstract

In this paper was developed a methodology for produce automatic maps of atmospheric and contaminan-tsx variables such as precipitation, wind speed, temperature and particulate matter, using the informationfrom the stations of Network Monitoring Air Quality of Bogota (RMCAB) from its inception in 1997 untiltoday, producing statistical descriptive analysis both spatial and temporal component and �nally generatingautomatically interpolated maps, using as a tool the programming language R.

Resumen Key words: Automation, Spatial analysis, temperature, precipitation, wind speed, Particulate Mat-ter (PM10).

4

Page 5: Metodología para la espacialización de variables

Introducción

Durante los últimos años el continuo desarrollo de los sistemas de información geográ�ca (SIG) y de lageomática, además de la aplicación de técnicas geoestadísticas, ha supuesto un nuevo fomento al análisis yentendimiento de la distribución espacial de distintas variables aplicadas en las ciencias del medioambiente.Para entender algunos de estos fenómenos, los gobiernos locales invierten en las redes de monitoreo decalidad del aire, sistemas que son diseñados para obtener información de manera que se puedan implementarmedidas apropiadas y realizar estudios principalmente en pro de la salud pública. Desafortunadamente laimplementación y emplazamiento de las estaciones para una red de monitoreo tiene limitantes físicas yeconómicas, por lo que en algunos casos el número de puntos en el espacio con información puede no sersu�ciente y en otros casos se necesite tomar medidas en lugares donde no exista una medición in situ. De ahíla relevancia de implementar técnicas físicas y estadísticas que permitan inferir cuantitativamente el estadode concentraciones de contaminantes y el comportamiento de variables meteorológicas con cierto grado deexactitud.

Esta problemática ha sido extensamente estudiada alrededor del mundo, abordándola desde distintas ópticas;Sluiter [1], realizó una revisión acerca de los métodos de interpolación de información climatológica y meteoro-lógica en Holanda, describiendo los principales métodos y herramientas incluyendo el R/GSTAT, encontrandoen qué casos los métodos de interpolación determinísticos resultan más e�cientes que los probabilísticos segúnla naturaleza de los datos. Beaulant et, al [4] analizaron la red de monitoreo de la ciudad de Estrasburgo,Francia para generar un mapa de contaminación de material particulado y adicionan estaciones �virtuales� enalgunas localizaciones con patrones similares a las reales fortaleciendo el desempeño del método de interpola-ción. Kanaroglou et al [2] desarrollaron una estrategia basada principalmente en la modi�cación de la técnicadel variograma, en la información sobre el uso del suelo y en un índice de ponderación demográ�co paralocalizar de forma óptima redes de monitoreo considerando la variabilidad de la super�cie de contaminaciónen Toronto, Canadá. En España, Moral [14]determinó que la geoestadística es una herramienta imprescindi-ble cuando se desea analizar los patrones de distribución espacial de las variables medioambientales a partirde muestreos realizados en el área de interés. Asimismo, los procedimientos de estimación geoestadísticos,conocidos como "método de Kriging", permiten la realización de las "mejores interpolaciones" en aquelloslugares donde no se conoce la magnitud del atributo investigado.

En este trabajo se desarrolló una metodología la cual facilitó la operatividad de información que se generaregularmente en la RMCAB, incrementando la e�ciencia en entrega y publicación de la los datos geográ�cosobtenidos mediante técnicas de interpolación acordes a la información a espacializar, de manera que sedescriba e�cientemente el comportamiento del material particulado PM10 y las variables meteorológicas develocidad del viento, temperatura y precipitación.

5

Page 6: Metodología para la espacialización de variables

1 Planteamiento del problema

En la actualidad, las grandes urbes enfrentan numerosos desafíos asociados al bienestar de los ciudadanoscomo consecuencia del uso de recursos energéticos procedentes de fuentes no renovables. Diversos países en elmundo han considerado diferentes herramientas para comprender y gestionar la calidad del aire, tales comoredes de monitoreo, sistemas de pronóstico, índices de calidad de aire y planes de contingencia ante eventosde contaminación atmosférica. Dichas herramientas facilitan el análisis y procesamiento de información, latoma de decisiones así como la apropiación de todos los actores de los centros urbanos de manera que segestione efectivamente la calidad del aire que los afecta directamente.

En Bogotá, la Secretaría Distrital de Ambiente (SDA) "cuenta con la Red de Monitoreo de Calidad del Aire deBogotá (RMCAB), la cual permite recolectar información sobre la concentración de contaminantes de origenantropogénico y natural y el comportamiento de las variables meteorológicas que regulan la distribución delos mismos en la atmósfera bogotana". Entre sus obligaciones, la red de calidad del aire debe entregar a laciudadanía informes periódicos mensuales, trimestrales y anuales con los que reporta el estado atmosféricotanto en el componente de contaminación como en la parte meteorológica. Entre otros productos, los informespresentan mapas de (pm10), precipitación, temperatura y vientos así como relaciones entre las variables paraexplicar comportamientos desde el punto de vista meteorológico. A causa del gran volumen de información,actualmente los informes se entregan entre dos o tres meses después del periodo de estudio, en algunos casosperdiendo vigencia para la toma de decisiones de manera oportuna.

El trabajo que se planteó como proyecto para optar el título de especialista en geomática de la UniversidadMilitar consiste en establecer una metodología para la espacialización de la información recolectada por laRMCAB de forma semiautomática utilizando el lenguaje de programación R, de manera que se facilite elprocesamiento, análisis y la interpretación de los datos de manera temporal y espacial, con el objetivo demejorar los tiempos de entrega del documento a la ciudadanía. Para ello, se propone utilizar informaciónhistórica de la red para las estaciones que cuenten con los sensores de precipitación, temperatura, vientoy material particulado (pm10), procesando esta información en diferentes escalas temporales (mensuales,trimestrales, anuales, multianuales) obteniendo productos temporales y espaciales de esos periodos facilitandola construcción de los informes trimestrales y anuales de la red de monitoreo de calidad del aire de Bogotá.

6

Page 7: Metodología para la espacialización de variables

2 Marco conceptual y teórico

2.1. Lenguaje de programación R

R es un lenguaje y entorno de programación de alto nivel para computo y estadística. Es un proyecto GNUsimilar al entorno y lenguaje S desarrollado por Bell Laboratories por John Chambers y algunos colegas. Rpuede se considerado como una implementación distinta de S aunque muchos códigos de S se pueden ejecutaren R. R ofrece una amplia variedad de técnicas grá�cas estadísticas (análisis de series de tiempo lineal y nolineal de modelado, pruebas estadísticas clásicas� clasi�cación, agrupación, ...) y es altamente extensible.[12]

2.2. Geoestadística

"La geoestadística es una rama de la estadística aplicada que se especializa en el análisis y la modelación de lavariabilidad espacial en ciencias de la tierra. Su objeto de estudio es el análisis y la predicción de fenómenosen espacio y/o tiempo, tales como: ley de metales, porosidades, concentraciones de un contaminante, etc.Aunque el pre�jo geo- es usualmente asociado con geología, sin embargo la geoestadística tiene sus orígenesen la minería" [13].

2.3. El Semivariograma

"El variograma representa la tasa media de cambio de una propiedad con la distancia. El hecho de que dosobservaciones próximas sean más parecidas que si estuvieran más separadas se re�eja en el mismo conceptodel variograma. La dependencia espacial disminuye a medida que se incrementa la distancia, h, y �naliza a unacierta distancia, el rango. Más allá del rango, la tasa media de cambio es independiente de la separación entrelas observaciones. Si los variogramas tienden a la horizontalidad, con valores próximos a la varianza muestral,ello indica la ausencia de una estructura espacial. Este sería el caso de una población de insectos distribuidosaleatoriamente. La varianza muestral representa la variabilidad de los datos cuando ocurre esta circunstancia.No obstante, las variables ambientales pueden mostrar diferencias en los patrones de distribución espacial enfunción de la dirección considerada. Una vez que se han de�nido los puntos del variograma experimental, seránecesario ajustar un modelo a dichos puntos, denominado variograma teórico, debido a la imposibilidad detrabajar con un variograma como el experimental, carente de una función matemática precisa. Los modelosbásicos más usados son los denominados esférico, exponencial, gaussiano, potencial, lineal y el efecto pepitapuro" [14].

7

Page 8: Metodología para la espacialización de variables

2 Marco conceptual y teórico

2.4. Kriging

"El kriging es un término que ha sido acuñado para designar al "mejor estimador lineal insesgado" de unpunto y al mejor promedio lineal móvil ponderado de un bloque. Este nombre apareció alrededor de 1960para nombrar una técnica creada en Francia por Matheron a partir de los trabajos de D. G. Krige quién fueprobablemente el primero que hizo uso de la correlación espacial y del mejor estimador lineal insesgado enel campo de la evaluación de yacimientos minerales. El kriging es una técnica de estimación local que ofreceel mejor estimador lineal insesgado de una característica desconocida que se estudia. La limitación a la clasede estimadores lineales es bastante natural ya que esto signi�ca que solamente se requiere el conocimientodel momento de segundo orden de la función aleatoria (la covarianza o el variograma) y que en general en lapráctica es posible inferir a partir de una realización de la misma" [14].

Dentro de los métodos de estimación geoestadística el método de Kriging es uno de los más utilizados. Lasprincipales características que lo destacan son:. "1) Mientras que los métodos tradicionales utilizan el conceptoeuclidiano de la distancia para el cálculo de los pesos que se aplicarán a cada dato muestral, el método deKriging considera tanto la distancia como la geometría de la localización de las muestras. 2) este métodominimiza la varianza del error esperado. Como el valor real en un punto no muestral es desconocido, elmétodo emplea un modelo conceptual con una función aleatoria asociada a los valores reales. 3) Los métodosgeoestadísticos muestran una gran �exibilidad para la interpolación, pudiéndose estimar valores puntuales oen bloques, así como métodos para incorporar información secundaria que esté relacionada con la variableprincipal" [14].

2.5. Series de tiempo

"Una serie tiempo es una secuencia de observaciones, medidos en determinados momentos del tiempo, orde-nados cronológicamente y espaciados entre sí de manera uniforme, así los datos usualmente son dependientesentre sí. Las componentes de una serie de tiempo normalmente corresponde a las componentes de tendencia,componente estacional y la aleatoria [15].

De estos tres componentes los dos primeros son componentes determinísticos, mientras que la última esaleatoria. Así se puede denotar la serie de tiempo como:

Xt = Tt + Et + It

Donde Ttes la tendencia, Etes la componente estacional e Ites la componente aleatoria".[15]

2.6. Mapas de calor (Heatmap)

Un mapa de calor o heatmap es una representación bidimensional de los datos en la que los valores están re-presentados por colores. Un simple mapa de calor proporciona un resumen visual inmediato de la informaciónpermitiendo al usuario comprender conjuntos de datos complejos. No existen muchas formas de mostrar ma-pas de calor, aunque todos comparten una cosa en común; utilizar el color para comunicar las relaciones entrelos valores de los datos es mucho mas sencillo de entender comparado con una �gura numérica de una hojade cálculo [16]. La construcción de los mapas de calor puede hacerse mediante métodos de espacialización,considerano en la rejilla un sin �n de variables no necesariamente geográ�cas .

8

Page 9: Metodología para la espacialización de variables

3 Objetivos

3.1. Objetivo general

Desarrollar una metodología para la espacialización de las variables meteorológicas y de contaminantes de lasestaciones de la RMCAB de manera semiautomática utilizando herramientas de programación de alto nivel.

3.2. Objetivos especí�cos

De�nir la información válida temporal y espacialmente para cada uno de los sensores de temperatura, preci-pitación, viento y material particulado PM10 a lo largo de la historia de la RMCAB

Calcular de manera automática el comportamiento de la información en resoluciones temporales mensuales,interanual y multianualmente.

Precisar la mejor herramienta estadística para calcular la interpolación de las distintas variables de estudiode manera semiautomática

Desarrollar una metodología para semiautomatizar la espacialización de variables meteorológicas y de conta-minantes.

9

Page 10: Metodología para la espacialización de variables

4 Datos y Métodos

4.1. Area de estudio

"El área de estudio es la ciudad de Bogotá; está localizada en la Sabana de Bogotá, sobre la vertienteoccidental de la cordillera oriental del territorio nacional. Se encuentra enmarcada por los cerros orientalesdonde se localizan entre otros Guadalupe y Monserrate y por el occidente con el río Bogotá.. Los puntosextremos de la zona de estudio se ubican con las siguientes coordenadas geográ�cas: Límite norte: 04° 50'30´´ Latitud Norte, en el límite urbano norte de Bogotá. Límite sur: 04°17´ 37´´ Latitud Norte, divisoria deaguas, nacimiento del río Tunjuelo, Laguna de los Tunjos. Límite oriental: 74° 00´ Longitud oeste, divisoriade los cerros orientales de la ciudad. Límite occidental: 74°13´ Longitud oeste, en el sector de la con�uenciadel río Tunjuelo con el río Bogotá. La elevación sobre el nivel del mar, se encuentra entre los 2510 msnm ylos 3780 msnm." [11]

4.2. Información a utilizar

La información que será utilizada corresponde a los datos meteorológicos y de calidad del aire provisto por laSecretaría Distrital de Ambiente de Bogota en cada una de sus estaciones de la RMCAB. Existe informacióndesde agosto de 1997 hasta 2015, en resolución horaria para 16 puntos de la ciudad, con distintas fechas deinicio de operación y algunas fuera de servicio al momento de este trabajo. La ubicación y nombre de lasestaciones se presentan en la �gura 4.1.

4.3. Método

Se utilizaron datos de referencia con información de temperatura, velocidad del viento, precipitación y ma-terial particulado de las estaciones de la (RMCAB) cuyos registros tienen una longevidad variable desde elaño 1997 hasta octubre de 2015 en resolución horaria, esto dependiendo de la estación dado que varias deellas están fuera de servicio y otras han sido fundadas recientemente; los archivos de entrada tienen formato.csv y están divididos en dos, los históricos y los recientes para facilitar su manipulación y actualización.

El trabajo está distribuido en dos partes, temporal y espacialmente de forma que el algoritmo permitedescomponer la información adquirida para cada punto o estación y en el área urbana. Cada serie presentauna representatividad temporal superior al 75% para las resoluciones mensuales, trimestrales y anuales,modi�cando el número de estaciones por cada producto y por cada variable. En cada una de las seriestemporales se procede a revisar la estadística descriptiva, dando la oportunidad de aceptar o no la informaciónde las series de tiempo o someterlas a revisión. Por otra parte, el procedimiento iterativo se realiza para cadaperiodo de estudio el análisis exploratorio espacial, mostrando las estadísticas descriptivas de las estaciones en

10

Page 11: Metodología para la espacialización de variables

4 Datos y Métodos

cada periodo y determinando grá�camente la normalidad en los datos. A su vez, la información fue sometidaa dos tipos de transformaciónes para ser normalizadas, transformaciones logarítmicas y de Box-Cox, esteúltimo con la herramienta la función powerTransform del paquete car [4] en R, el cual usa la aproximación demáxima verosimilitud para seleccionar una transformación de una respuesta univariada o multivariada paranormalidad, linealidad y/o varianza constante.

En la fase del análisis estructural de los datos, se construyeron los variogramas omnidireccionales para cadauno de los periodos para luego ajustar los modelos teóricos en esta etapa del código el usuario tiene lalibertad de escoger cual es el modelo teórico que mas se acerca al experimental. A continuación realizar lainterpolación con el paquete gstat [9] el cual utiliza la función krige realizando la interpolación de las áreas.La función krige es un método simple adaptado en torno a gstat y predict.gstat para predicciones univaraidasde kriging y métodos de simulaciones condicionales, disponibles en el paquete. Finalmente se hace lecturadel shape de área de in�uencia de las estaciones de Bogotá [3], las localidades y los municipios aledaños yse hace la conversión de los puntos de las estaciones en coordenadas con ayuda de la función coordinates delpaquete sp [7, 8]

Figura 4.1: Perímetro urbano de la ciudad de Bogotá y ubicación de las estaciones de monitoreo dela RMCAB [3].

11

Page 12: Metodología para la espacialización de variables

5 Resultados

5.1. Análisis espacial

5.1.1. Análisis exploratorio

Dentro del análisis exploratorio espacial de los datos, el código generó los estadísticos descriptivos con in-formación su�ciente presentando los histogramas, los diagramas de cajas y los qq plot iterativamente paracada uno de los periodos y de las variables, así como la transformación logarítmica; luego entrega las trans-formaciones de box-cox y repite el procedimiento de manera que esta información es exportada en imágenesformato png (�gura 5.1), las cuales son almacenadas en un directorio que el algoritmo se encarga de crear.

Uno de los principales inconvenientes surge de la escasez de datos en algunos de los años, mostrando resultadospoco signi�cativos y en algunos casos incoherentes por lo que se restringió la creación de mapas a 4 puntoscomo mínimo. Para veri�car la calidad del producto, es necesario observar la cantidad de puntos que haconsiderado en el desarrollo del algoritmo.

5.1.2. Análisis estructural

A continuación el código establece las relaciones entre la variable y la coordenada X y la coordenada Y,generando grá�cos de tendencia de la información, nuevamente exportándola en formato png. De igual forma,el algoritmo suministra información preliminar del comportamiento de la variable mediante otros grá�cosexportados, tales como perspectivas y scatterplots para las coordenadas x e y, además de su relación conla variable a su vez que calcula los semivariogramas y presenta sus resultados (�gura 5.2); de esta formael usuario puede hacerse una idea clara de la estructura de los datos en el área. Los paquetes geoR [10]facilitan el cálculo de dicha información. Aunque se presentan resultados de anisotropía, debido al númerode datos disponibles los variogramas direccionales se sustentan sobre muy pocos puntos muestrales y arrojansoluciones de�cientes. Asimismo Los resultados muestran que algunos modelos del variograma no se ajustansatisfactoriamente en todas las variables, no obstante el código permite que el usuario haga las correccionesnecesarias en cada periodo de tiempo para mejorar los resultados del proceso. El script incluye la función�t.variogram (gstat) [9] de tal forma que los modelos son ajustados de manera automática, mejorando lapredicción signi�cativamente (�gura 5.4). Tal como lo menciona Moral [14], es importante señalar que "elobjetivo no es lograr el mejor ajuste de una función a una serie de puntos; se debe seleccionar el modeloque mejor explique el patrón de variabilidad espacial de la variable investigada, aunque éste no sea el mejordesde un punto de vista estadístico. En la mayoría de casos, el variograma teórico se ajustó a un modeloexponencial respondiendo apropiadamente en la mayoría de las variables".

12

Page 13: Metodología para la espacialización de variables

5 Resultados

(a) Histograma, diagrama de caja y qqplot en 2012y su comparativo con la transformada logarít-mica en el mismo periodo para la velocidad delviento

(b) Histograma, diagrama de caja y qqplot de lastransformaciones de Box-Cox en el II trimestrede 2012 y 2013 para la velocidad del viento

Figura 5.1: Ejemplo de los resultados de los estadísticos descriptivos para la variable velocidad delviento

(a) Contornos y perspectivas de la temperatura II tri-mestre de 2015

(b) Análisis de tendencia de la precipita-ción con respecto a la coordenada Y enel periodo 2013

Figura 5.2: información preliminar espacial de la variable temperatura y precipitación

5.1.3. Predicciones

Luego de analizar los productos entregados, el código inicia su proceso de estimaciones de la variable en los

puntos no muestrales considerando la estructura del modelo del semivariograma. Se encontró que el méto-

13

Page 14: Metodología para la espacialización de variables

5 Resultados

Figura 5.3: Semivariogramas de la precipitación en el trimestre septiembre octubre noviembre de2001

do de interpolación corresponde a un Kriging ordinario ya que las variables se caracterizan por considerar

�uctuaciones locales de la media, limitando el dominio de estacionariedad de la misma a un ámbito local,

aunque se asume desconocida. Una de las ventajas del algoritmo consiste en que el usuario obtiene su�cientes

elementos para encontrar el modelo más apropiado y ejecutar mejores predicciones, ajustando las variables

según la información resultante. Finalmente el producto espacial corresponde a una serie de mapas de tempe-

ratura, velocidad del viento, precipitación y material particulado (pm10) en resolución trimestral y anual,desde 1997 hasta 2015 (�gura 5.5), cada uno acompañado de su mapa de varianza (�gura 5.6), elcual permite comprobar la �abilidad de la interpolación sobre la super�cie. En total por variable seobtienen cerca de 170 mapas lo que corresponde a más de 500 mapas realizados automáticamentesobre la ciudad de Bogotá, dependiendo de la información disponible en cada periodo. La �gura5.5 presenta algunos de los resultados producto del algoritmo para datos espaciales, en resolucionestrimestrales y anuales.

(a) Semivariograma de la precipitación en el III trimestrede 2000 y su modelo ajustado

(b) Semivariograma de la precipitación en el II trimestrede 2010 y su modelo ajustado

Figura 5.4: Ejemplo de los resultados de los semivariogramas y sus modelos en la lluvia y la tempe-ratura

14

Page 15: Metodología para la espacialización de variables

5 Resultados

(a) Temperatura promedio trimestral según los datos de la RMCAB

(b) Precipitación acumulada de algunos trimestres en la RMCAB

(c) Velocidad del viento promedio en algunos trimestres según los datos de la RMCAB

(d) Material particulado promedio de algunos trimestres en la RMCAB

Figura 5.5: Mapas generados mediante automatización

15

Page 16: Metodología para la espacialización de variables

5 Resultados

Figura 5.6: Mapas de varianza de las interpolaciones logarítmicas generadas mediante automatiza-ción para distintas variables

5.2. Análisis temporal

En la �gura 5.7 se presentan un ejemplo de los resultados en donde se calculan los estadísticosdescriptivos para cada una de las series de tiempo consideradas en la metodología para las estacionesde monitoreo de calidad del aíre de de Bogotá. Esta información se ha obtenido automáticamentea su vez que se adquieren las grá�cas para los datos históricos, de�nidos por el usuario y el casodel año o periodo que esté sometido a estudio. Igualmente se presentan grá�cas a forma de resumendel comportamiento mensual y trimestral para cada variable y se compara tanto con su históricocomo con los datos climatológicos suministrados por el IDEAM [11], cuando de ellos se disponga.(�gura5.7 b).

Por otra parte, el algoritmo realiza el cálculo de los "heatmaps" o mapas de calor, los cuales consistenen desplegar el promedio de la variable mediante una paleta de colores, en el eje de las ordenadaslos meses y en las abscisas las horas correspondiente al último año del periodo de estudio (�gura5.8). Esta información muestra otra aplicabilidad de la geoestadística en áreas que no correspondennecesariamente a productos geográ�cos. Los mapas han sido desarrollados a partir de la funciónLevelplot del paquete lattice; en ella los cálculos se basan en la suposición de que todos los valoresx e y son evaluados en una cuadrícula (de�nidas por sus valores únicos) [17].

16

Page 17: Metodología para la espacialización de variables

5 Resultados

(a) Estadísticos descriptivos de la variable velocidad delviento

(b) promedios multitemporales del viento

Figura 5.7: Productos temporales de las series de tiempo

(a) Mapa de calor de la pre-cipitación

(b) Mapa de calor de la tem-peratura

(c) Mapa de calor del viento (d) Mapa de calor del Mate-rial Particulado

Figura 5.8: Mapas de calor de las series de tiempo para el último año

La �gura 5.8 facilita interpretación de los datos temporales cuando se tienen datos horarios, ya quepresenta la variabilidad de la información mensual y horaria. en el caso de la lluvia por ejemplo,se nota que en la estación de Centro de Alto Rendimiento para el mes de octubre y noviembre sepresentaron los mayores acumulados de lluvia, entre las 15 y las 17 horas.

17

Page 18: Metodología para la espacialización de variables

6 Conclusiones

Se construyó un algoritmo que optimiza la generación de informes de meteorología y calidad del aireen la ciudad de Bogotá, ayudando a mejorar el tiempo de producción y entrega de la información ala ciudadanía en los periodos que se requieran.

Dentro de los algoritmos se desarrollaron satisfactoriamente secciones que permitieron hacer el tra-tamiento de las series de forma espacial y temporal, considerando el porcentaje de información elcual debía superar el 75% de representatividad temporal en cualquiera de las resoluciones tratadas.

En el análisis espacial, se construyó una metodología que permitió analizar el comportamiento delas variables espacialmente en la ciudad de Bogotá (Colombia), generando estadísticos descriptivospara cada periodo de forma automática, así como tendencias espaciales y los semivarigramas parade�nir la autocorrelación de cada periodo en cada variable.

Los algoritmos arrojaron mapas de la ciudad de Bogotá mostrando el comportamiento de las variablesde estudio en formato png. Al correr los scripts se obtuvieron cerca de 500 mapas, materializandola automatización del procedimiento.

Desde el punto de vista temporal, de desarrolló una metodología para el análisis descriptivo delas series de tiempo, arrojando como resultados imágenes así como resúmenes mensuales, anualesy trimestrales de cada una de las variables en periodos recientes y su comparación con promedioshistóricos, seleccionados por el usuario al momento de ejecutar el algoritmo.

Se automatizaron los esquemas denominados "mapas de calor" los cuales realiza un proceso similarde espacialización sustituyendo los datos de las coordenadas x e y por valores promedio de los mesesversus las horas. Se encontró que este procedimiento extrapola la funcionalidad de la geoestadísticapara proporcionar más información de los datos en el análisis temporal.

Es importante considerar que este es un ejercicio al cual se debe profundizar exhaustivamente paraobtener resultados mas �ables o aproximados a la realidad, mediante técnicas estadísticas más so�s-ticadas. Se destaca que este documento es parte de un trabajo que debe continuar desarrollándose.

18

Page 19: Metodología para la espacialización de variables

Bibliografía

[1] Interpolation methods for climate data - literature review . Sluiter, R. 2008. 2008, Intern rapport; IR 2009-04.

[2] Establishing an air pollution monitoring network for intra-urban population exposure assess-ment: A location-allocation approach. Kanaroglou, P., Jerrett, M., Morrison, J., Beckerman, B.,Arain, M., Gilbert, N., & Brook, J. 2005. 2005, Atmospheric Environment 39, págs. 2399�2409

[3] Secretaría Distrital de Ambiente . 2014. Red de Monitoreo de Calidad del Aire de Bogotá -RMCAB. [En línea] 2014. [Citado el: 15 de 9 de 2015.] http://ambientebogota.gov.co/red-de-calidad-del-aire.

[4] John Fox and Sanford Weisberg (2011). An {R} Companion to Ap-plied Regression, Second Edition. Thousand Oaks CA: Sage. URL:http://socserv.socsci.mcmaster.ca/jfox/Books/Companion

[5] IDEAM. 2007. Estudio de la caracterización climática de Bogotá y Cuenca Alta del Río Tunjue-lo. [aut. libro] Germán Horacio Rosero, María Constanza Cadena, Martha Cecilia Montealegre,Jorge Enrique Bernal. Bogotá : s.n., 2007.

[6] Adding virtual measuring stations to a network for urban air pollution mapping. Beaulant, A.L., Perron, G., Kleinpeter, J., Weber, C., Ranchin, T., & Wald, L. 2008. 2008, Environmentinternational, págs. 599�605.

[7] Pebesma, E.J., R.S. Bivand, 2005. Classes and methods for spatial data in R. R News 5 (2),http://cran.r-project.org/doc/Rnews/.

[8] Roger S. Bivand, Edzer Pebesma, Virgilio Gomez-Rubio, 2013. Applied spatial data analysiswith R, Second edition. Springer, NY. http://www.asdar-book.org/

[9] Pebesma, E.J., 2004. Multivariable geostatistics in S: the gstat package. Computers & Geos-ciences, 30: 683-691.

[10] RIBEIRO JR., P.J. and DIGGLE, P.J. (2001) geoR: A package for geostatistical analysis. R-NEWS Vol 1, No 2. ISSN 1609-3631.

[11] IDEAM. (2014). Instituto de Hidrología, Meteorología y estudios Ambien-tales. Recuperado el 16 de octubre de 2015, de TIEMPO Y CLIMA:http://www.ideam.gov.co/documents/21021/21789/PROMEDIOS+ACTUALES_71-00tablas.xls/fa837392-e28c-438b-819c-22770c6e03be

19

Page 20: Metodología para la espacialización de variables

Bibliografía

[12] The R Foundation. (s.f.). What is R? Obtenido de Sitio web de R project: https://www.r-project.org/about.html

[13] VIERA, M. A. (2002). Geoestadística Aplicada. (UNAM, Ed.) Obtenido de Sitio web geofísicaUNAM: http://mmc2.geo�sica.unam.mx/cursos/geoest/GeoEstadistica.pdf

[14] García, F. M. (Enero de 2004). Aplicación de la geoestadística en las ciencias ambientales.Revista cientí�ca y técnica de ecología y medio ambiente.

[15] Villavicencio, J. (s.f.). Introducción a Series de Tiempo. Obteni-do de Sitio web del Instituto de Estadísticas de Puerto Rico:http://www.estadisticas.gobierno.pr/iepr/LinkClick.aspx?�leticket=4_BxecUaZmg%3D

[16] TechTarget. (2015). Heat map (heatmap) de�nition. Obtenido de Business intelligence - businessanalytics: http://searchbusinessanalytics.techtarget.com/de�nition/heat-map

[17] Sarkar, Deepayan (2008) Lattice: Multivariate Data Visualization with R. Springer, New York.ISBN 978-0-387-75968-5

20