modelo matematico altura ortom__tesis
TRANSCRIPT
UNIVERSIDAD DE SANTIAGO DE CHILE FACULTAD DE INGENIERIA
DEPARTAMENTO DE INGENIERIA GEOGRAFICA
MODELO MATEMATICO LOCAL PARA LA ESTIMACION DE COTA ORTOMETRICA
ELEAZAR QUIÑIMIL VASQUEZ
MAURICIO JAVIER ABUSLEME OJEDA 2008
UNIVERSIDAD DE SANTIAGO DE CHILE FACULTAD DE INGENIERIA
DEPARTAMENTO DE INGENIERIA GEOGRAFICA
MODELO MATEMATICO LOCAL PARA LA ESTIMACION DE COTA ORTOMETRICA
“TRABAJO DE TITULACION PRESENTADO EN
CONFORMIDAD A LOS REQUISITOS PARA OBTENER EL TITULO DE INGENIERO DE EJECUCION EN GEOMENSURA”
Profesor Guía: Héctor Patricio Contreras Ávila
ELEAZAR QUIÑIMIL VASQUEZ MAURICIO JAVIER ABUSLEME OJEDA
2008
AGRADECIMIENTOS.
Si me pongo a pensar en este proceso de 4 años, siento que he tenido que
superar varias dificultades, que sin la ayuda de Dios y de ciertos íconos de mi
vida, hubiera sido imposible de lograr. Gracias a mi hermano Aurelio, por confiar
en mi, por tener la visión necesaria, para darme la oportunidad que yo llegue
lejos. A mi madre, por el apoyo incondicional, porque nunca me falto nada, por
inculcarme tu espíritu de lucha y porque eres mi ejemplo a seguir. A mi
hermano César y su familia, que aunque estén lejos siempre estuvieron
dándome apoyo.
Agradezco a todos mis amigos que me acompañaron en este proceso, ellos
saben personalmente lo mucho que los quiero y que nunca olvidare todo lo que
pasamos juntos. A mi compañero de tesis, por apoyarme siempre y por dar todo
para sacar la tesis adelante. A ti por simplemente estar ahí y hacerme feliz. A
todos los profesores que me acompañaron en este proceso...
En fin, a todos ellos y a los que se sientan identificados con la causa......gracias.
Mauricio Abusleme.
Siempre se cometen injusticias en los agradecimientos,
pues la “memoria” es a menudo traicionera.
Agradezco en primer lugar a Blanca Vásquez (tía Olga), que me trajo al mundo
y que nos hemos acompañado y amado por tanto tiempo, en el mismo orden
agradezco a mi hermana Doris la “Quiñimil” que me va quedando, y que aunque
hemos pasado malos momentos se que estará en las buenas y las malas por
siempre. Con todo lo anterior agradezco a mi pequeña, pero amada familia, y
mientras todo esto pasa doy un vistazo al cielo, porque si veo a mi padre
orgulloso entonces entiendo que las cosas van bien.
Agradezco a cada uno, a cada dos, y cada todos los que han estado presentes
durante este trabajo de titulación, esta etapa, y como no toda mi vida (en
especial a ti que te has interesado, y me has acompañado este tiempo).
Hablando netamente de nuestro trabajo de titulación, agradezco al profesor
Héctor Contreras que nos acompañó tantos viernes en la tarde y que nos ayudó
en todo momento. En este sentido quiero dar un merecido gracias y un enorme
abrazo a ti Mauricio (Busleme) sin tu persona esto no hubiera sido lo mismo,
discutimos, reímos, nos cansamos, nos frustramos, nos ayudamos, y nos
conocimos un poco más. Gracias también a tu familia que siempre se preocupo
en todo sentido. Fue un agrado trabajar con un amigo, no nos sacamos los ojos,
si tuvimos diferencias, pero el trabajo esta hecho, y muy bien hecho.
Eleazar Quiñimil Vásquez
RESUMEN. La utilización del sistema de posicionamiento global (GPS) es cada vez más
frecuente y necesaria. Esto, debido en gran parte, a sus resultados rápidos y
precisos. Pero, pese a todas sus ventajas, en ingeniería esta tecnología es
utilizada a nivel planimétrico. Dejando muchas veces la componente altimétrica,
entregada por el receptor, de lado y sin utilización alguna.
Esta memoria estudia un método matemático que sea capaz de estimar altura
ortométrica, aprovechando la precisión de la altura elipsoidal que entrega el
receptor GPS. Para esto se realizaron modelos de regresión múltiple en dos
aplicaciones. La primera en una zona de la Región Metropolitana, y la segunda
en una línea de nivelación en la cuesta Lo Prado. Se compara ambos modelos
con la calibración vertical realizada por el software Trimble Geomatics Office
(TGO) de donde se concluyó que, dentro de una zona o línea de nivelación
estudiada, el modelo de regresión múltiple entrega mejores resultados que el
software TGO.
Finalmente se realizó, en el software Arcview GIS, una automatización para el
cálculo de los modelos, esperando que a futuro los software comerciales
integren este tipo de aplicaciones, para así, aumentar las precisiones, y reducir
costos y tiempo en los trabajos de ingeniería. Queda invitado el lector a
profundizar en las herramientas que entrega la ciencia en pro de la solución de
problemas atingentes a la rama de Geomensura, siendo esta memoria solo un
paso en este constante aprendizaje.
Palabras clave
■ Inferencia Estadística. ■ Regresión múltiple.
■ Altimetría. ■ Arcview.
ABSTRACT.
The use of Global Positioning System (GPS) is becoming more frequent and
necessary. This is due largely, to its quick and precise results. But in spite of all
its advantages, this technology is used at a planimetric level in engineering,
leaving the altimetric component, given by the receiver, without any use.
This thesis studies a mathematical method capable of estimating orthometric
height, taking advantage of the precision of the ellipsoid height given by a GPS
receiver. To achieve this, multiple regression models were made in two
applications. The first one is placed in an area of the Region Metropolitana, and
the second one in a leveling line in Cuesta Lo Prado. Comparing both models
with the vertical calibration made by Trimble Geomatics Office (TGO) software.
Where, it concluded, that within a studied area or leveled line, the multiple
regression model gives better results than the TGO software.
Finally, an automation to calculate the models in ArcView GIS software was
made. Hoping that future commercial software integrate this type of applications.
Then, it will be possible to increase precisions, and reduce costs and time in
engineering works. The reader is invited to go deeper on the tools given by
science in favour of the solution of problems related to Surveying. This thesis is
only a step in this constant learning.
Key words:
• Statistical Inference
• Altimetry
• Multiple Regression
• Arcview
INDICE GENERAL.
CAPITULO I – INTRODUCCION. 1.1 Antecedentes. 1
1.2 Estado actual del problema. 1
1.3 Hipótesis. 3
1.4 Objetivos. 3
1.4.1 Objetivo general. 3
1.4.2 Objetivos específicos. 3
1.5 Metodología de trabajo. 4
CAPITULO II – CONCEPTOS Y METODOLOGIA DE TRABAJO. 2.1 Introducción. 6
2.2 Conceptos previos geodésicos. 6
2.2.1 El elipsoide. 7
2.2.2 El geoide. 8
2.2.3 Datum geodésico. 9
2.2.4 Altura elipsoidal. 10
2.2.5 Altura ortométrica. 10
2.3 Sistemas de coordenadas. 11
2.3.1 Coordenadas cartesianas. 11
2.3.2 Coordenadas geodésicas. 12
2.3.3 Relación matemática entre coordenadas cartesianas y
Geodésicas. 13
2.4 Sistemas de referencia geodésicos. 14
2.4.1 Sistemas locales de referencia. 15
2.4.2 Sistemas globales de referencia. 16
2.4.3 International Terrestrial Reference Frame (ITRF) 16
2.4.4 Sistema WGS-84. 18
2.4.5 Sistema de referencia para las Américas (SIRGAS) 19
2.5 Sistema de posicionamiento global (GPS) 20
2.5.1 Señal GPS. 21
2.5.2 Fuentes de error GPS. 22
2.6 Transformación bidimensional de coordenadas. 23
2.6.1 Tipos de transformaciones bidimensionales. 23
2.6.2 Modelo de ajuste. 26
2.6.3 Precisión del método de ajuste. 29
2.7 Inferencia estadística. 31
2.7.1 Introducción. 31
2.7.2 Conceptos básicos de inferencia estadística. 32
2.7.3 Regresión Múltiple. 35
2.7.4 Estimación de los parámetros del modelo. 37
2.7.5 Propiedades de los estimadores. 39
2.7.6 Análisis de la varianza. 44
2.7.7 Correlación. 49
CAPITULO III – DESARROLLO. 3.1 Introducción. 53
3.2 Aplicacion1: Uso de regresión múltiple en una zona de la Región
Metropolitana. 54
3.2.1 Obtención de los coeficientes del modelo. 56
3.2.2 Intervalos de confianza. 58
3.2.3 Contrastes individuales de la t para los coeficientes del
Modelo de regresión. 60
3.2.4 Tabla ANOVA (contraste conjunto de la F) 63
3.2.5 Coeficientes de determinación y de correlación del
Conjunto. 64
3.2.6 Coeficientes de determinación y correlación
Individuales. 65
3.2.7 Aplicación del Modelo. 66
3.2.8 Calibración Local GPS de la zona de estudio Región
Metropolitana con Software Trimble Geomatics
Office (TGO) 73
3.3 Aplicación 2: Línea de nivelación Cuesta lo Prado. 76
3.3.1 Introducción. 76
3.3.2 Calculo y ajuste de Alturas ortométricas Cuesta
lo Prado. 78
3.3.3 Ajuste de los desniveles a través de modelo de ecuaciones
de condición. 83
3.3.4 Aplicación 2: Uso de regresión múltiple en la línea de
Nivelación Cuesta lo prado. 88
3.3.5 Aplicación de ajuste TGO a la línea de nivelación cuesta lo
Prado. 96
3.4 Automatización en software Arcview Gis 3.3 97
3.4.1 Automatización coordenadas planimétricas. 97
3.4.2 Automatización de parámetros verticales. 100
3.4.3 Datos desplegables a la vista. 108
CAPITULO IV – ANALISIS DE RESULTADOS. 4.1 Antecedentes. 111
4.2 Análisis aplicación 1: Zona estudio Región Metropolitana. 111
4.2.1 Contraste residuos TGO y Modelo de regresión múltiple. 111
4.2.2 Validación parámetros de estimación Altura ortométrica
aplicación 1. 113
4.2.3 Intervalos de confianza y de predicción. 117
4.3 Análisis aplicación 2: Línea de nivelación cuesta lo Prado. 119
4.3.1 Contraste residuos TGO y Modelo de regresión múltiple 119
4.3.2 Validación parámetros de estimación Altura ortométrica. 120
CAPITULO V – CONCLUSIONES Y RECOMENDACIONES. 5.1 Conclusiones. 122
5.2 Recomendaciones. 126
ANEXOS. 128
BIBLIOGRAFIA. 139
INDICE DE FIGURAS. 2.1 El Elipsoide 7
2.2 Relación Elipsoide-geoide 8
2.3 Altura Ortométrica 10
2.4 Relación Geométrica entre coordenadas cartesianas y geodésicas 13
2.5 Estaciones ITRF2005 17
2.6. Movimiento de las placas terrestres obtenido por
ITRF2005 (1 cm/año) 18
2.7. Parámetros WGS 84 19
2.8. Representación grafica de ejes XY girados, trasladados y escalados 25
3.1. Relación entre variables 53
3.2. Puntos dispuestos geográficamente aplicación 1 55
3.3. Propiedades del proyecto en software TGO 73
3.4. Datos importados TGO (aplicación 1) 74
3.5. Calibración local vertical TGO 75
3.6. Trimble R8 y Leica serie TPS400 78
3.7. Corrección a la línea 79
3.8. Calculo de distancias horizontales 79
3.9. Mediciones reciprocas y simultaneas 77
3.10. Pasos ajuste por mínimos cuadrados 84
3.11. Disposición geográfica de puntos cuesta lo prado 89
3.12. Parámetros de transformación bidimensional 98
3.13. Transformación bidimensional de coordenadas 99
3.14. Tabla de datos exportados 99
3.15. Estimación parámetros verticales Arcview 100
3.16. Caja de dialogo estimación vertical 101
3.17. Centroide automatizado, obtenido de datos insertados para realizar
Regresión 101
3.18. Módulos de utilización de Multiple Regression - Free
Statistics Software (Calculator) 103
3.19. Valores a insertar en calculadora 104
3.20. Resultados entregados por Multiple Regression - Free Statistics
Software (Calculador) 105
3.21. Tabla de validación 106
3.22. Caja transformación vertical 107
3.23. Resultado transformación vertical en arcview 108
3.24. Add Event Theme 110
3.25. Vista de puntos importados a las capas 110
4.1. Subzonas establecidas por distancia a su centro 114
4.2. Distribución espacial de residuos aplicación 1 aplicada
a los 56 puntos 115
4.3. Distribución espacial de residuos TGO aplicada a los 56 puntos 115
4.4. Distribución espacial de residuos en valor absoluto
de la aplicación 1, en los 100 km2 de la zona de estudio 116
4.5. Distribución espacial de residuos en valor absoluto del software
TGO, en los 100 km2 de la zona de estudio 116
4.6. Puntos de control cuesta lo prado 120
INDICE DE TABLAS.
2.1. Parámetros PSAD56, SAD69 e Hito XVIII 16
2.2. Tabla ANOVA del modelo de regresión múltiple 45
3.1. Puntos del Set de datos a utilizar aplicación 1 54
3.2. Coordenadas Centroide aplicación 1 55
3.3. Tabla ANOVA del contraste conjunto de la F(aplicación 1) 63
3.4. Tabla ANOVA de variable “Este” respecto variable
“Altura ortometrica” 65
3.5. Coeficientes de correlación y determinación individuales 66
3.6. Alturas Ortometricas obtenidas con regresión múltiple 66
3.7. Residuos simples, estandarizados y estudentizados Aplicación 1 69
3.8. Parámetros de Ajuste Vertical TGO (Aplicación 1) 75
3.9. Resumen errores TGO (Aplicación 1) 75
3.10. Alturas ortométricas entregadas por TGO (Aplicación 1) 76
3.11. Resultados poligonal 1 82
3.12. Resultados poligonal 2 83
3.13. Resultados alturas ortométricas ajustadas, poligonal 1 87
3.14. Resultados alturas ortométricas ajustadas, poligonal 2 88
3.15. Puntos para confección modelo regresión múltiple cuesta lo prado 89
3.16. Parámetros modelo regresión múltiple Cuesta Lo Prado 90
3.17. Contraste conjunto de la F cuesta lo prado 91
3.18. Residuos simples, estandarizados y estudentizados,
cuesta lo prado 91
3.19. Parámetros y centroide modelo, nueva regresión múltiple
5 parámetros 93
3.20. Tabla ANOVA nueva regresión múltiple 5 parámetros 94
3.21. Residuos simples, estandarizados y estudentizados, modificación
modelo cuesta lo prado 94
3.22. Parámetros ajuste vertical TGO cuesta lo prado 96
3.23. Alturas ortométricas entregadas por TGO, cuesta lo prado 96
4.1. Tolerancias altimétricas dependiendo de la escala 112
4.2. Precisiones modelo aplicación 1 v/s TGO, por subzonas 114
4.3. Altura ortométrica de puntos muéstrales 117
4.4. Estimación y predicción para muestras 118
4.5. Intervalos de confianza e intervalos de predicción 118
4.6. Puntos de control cuesta lo prado, aplicando modelo de regresión 121
INDICE DE GRAFICOS.
3.1. Histograma de residuos (Aplicación 1) 70
3.2. Probabilístico de normalidad (p-p y q-q) y simetría 70
3.3. Residuos estandarizados v/s Predicciones (aplicación 1) 72
3.4. Predicciones v/s Variable respuesta (aplicación 1) 72
3.5. Predicciones v/s Variable respuesta cuesta lo prado 92
3.6. Residuos estandarizados v/s Predicciones cuesta lo prado 92
3.7. Predicciones v/s Variable respuesta, modificación modelo
cuesta lo prado 95
3.8. Residuos estandarizados v/s Predicciones, modificación
modelo cuesta lo prado 95
4.1. Comparación Residuos Modelo de regresión v/s Residuos
TGO (aplicación 1) 112
4.2. Comparación Residuos Modelo de regresión aplicación 2
v/s Residuos TGO 119
1
CAPITULO I – INTRODUCCION 1.1 ANTECEDENTES.
Como se sabe actualmente, el Sistema de Posicionamiento Global (GPS) nos
entrega alturas referidas a un elipsoide de referencia y no al geoide, siendo este
último el utilizado como datum vertical actualmente en América Latina.
Ahora, la altura geodésica “h”, obtenida desde los receptores GPS es altamente
precisa, aunque no todavía con una utilización practica en ingeniería. Por esto,
es de interés utilizar esta altura geodésica y transformarla a una altura
ortométrica, la cual sí se utiliza para referenciar todo tipo de proyectos
ingenieriles. Hoy en día existen formas de llevar a cabo este traspaso de
alturas, tanto por modelos geoidales o por la utilización de programas
computacionales que calibren mediciones GPS. Lo que hace que el usuario
pueda conocer la altura ortométrica de un lugar, sólo con mediciones GPS, pero
que generalmente es de una baja precisión.
En estos casos es necesario, para la obtención de una altura ortométrica
precisa, llevar hasta el lugar una línea de nivelación geométrica, la que suele
ser costosa y consumidora de tiempo.
1.2 ESTADO ACTUAL DEL PROBLEMA. En Chile, la obtención de altura ortométrica a partir de GPS se realiza de dos
maneras. Por normativa descrita en el manual de carreteras Volumen II, y por
programas computacionales que calibren mediciones GPS.
2
Según la normativa descrita en el manual de carreteras Volumen II, en la
sección 2.312 Transporte de coordenadas mediante GPS, capítulo 2.312.6
Altimetría, señala que se pueden adoptar diversos criterios para realizar la
reducción al geoide:
• Aceptar que el área del levantamiento es suficientemente pequeña,
considerando el geoide plano o paralelo al elipsoide, omitiendo la
ondulación del geoide(N) en extensiones que varían entre 0 y 3
kilómetros. Se debe determinar el valor de N de al menos uno de los
puntos GPS, comparando la altura nivelada de dicho punto y aplicando
esa corrección a todos los demás puntos GPS del área.
• Aceptar que el geoide es plano y no paralelo al elipsoide. Este caso es
más preciso que lo anterior y se puede determinar con la utilización de
un mínimo de 3 puntos GPS con altura ortométrica conocida en la
periferia del área considerada. Las diferencias entre las alturas referidas
al elipsoide y ortométricas en esos puntos determinan un plano
considerado como un geoide local plano. Las reducciones a ese plano se
aplican proporcionalmente de acuerdo a la posición de cada punto GPS
restante.
• Uso directo del modelo geoidal global EGM 96, en donde para cada
punto tomado con GPS, se extrae la ondulación geoidal (N).
• Determinación de un geoide local. Igualmente como en el caso del
segundo criterio, pero con un mayor número de puntos GPS
uniformemente distribuidos con altura elipsoidal y ortométrica conocida.
En este caso se genera una superficie tridimensional que refleje más
fielmente el comportamiento del geoide en la zona levantada.
3
Con respecto a la utilización de programas computacionales, estos lo que
hacen, en simples palabras, es ajustar un conjunto de mediciones GPS a través
de puntos de altura ortométrica conocida, a un plano de referencia.
1.3 HIPOTESIS. Se puede realizar un modelo matemático local que logre determinar altura
ortométrica, en la zona analizada, sin la necesidad de ejecutar una nueva
nivelación para ello, obteniendo resultados más precisos que los métodos
actuales utilizados en Chile.
1.4 OBJETIVOS 1.4.1 OBJETIVO GENERAL.
Lograr un modelo matemático local que reduzca, en tiempo y dinero, la
densificación de puntos en una zona específica, obteniendo así alturas
ortométricas precisas, sin necesidad de medir nuevos puntos.
1.4.2 OBJETIVOS ESPECIFICOS.
• Automatizar la transformación de coordenadas planimétricas locales a
distintas proyecciones (o viceversa) a través de una transformación
bidimensional de semejanza.
• Automatizar, y/o dar a conocer una forma de automatizar, el calculo de
un modelo matemático de regresión múltiple para la obtención de altura
ortométrica.
4
• Ambientar en una plataforma SIG la transformación planimétrica y de
altura ortométrica con parámetros ya conocidos.
1.5 METODOLOGIA DE TRABAJO
Para llevar a cabo los objetivos es necesario realizar una descripción de los
procedimientos escogidos, con el fin de cumplir la verificación de la hipótesis, la
metodología escogida para este proyecto cuenta con:
• Recopilación de material y antecedentes relacionados con el tema.
• Definición de forma clara y precisa de la hipótesis.
• Definición de objetivos generales y específicos, los cuales deben
enmarcarse dentro de los límites del tema.
• Planificación y recopilación de datos de una zona de la Región
Metropolitana.
• Planificación y recopilación de datos tomados en la tesis “Metodología y
desarrollo para la georreferenciación de un proyecto vial cuesta Lo
Prado” María José Herrera, José Salas.
• Ordenamiento y obtención de alturas ortométricas para las dos
aplicaciones.
• Realización de los modelos, a través de regresión múltiple, para la
estimación de altura ortométrica.
5
• Contraste de resultados obtenidos a través de regresión múltiple, para
las dos aplicaciones, con los resultados entregados por el software de
procesamiento GPS Trimble Geomatics Office.
• Aplicación de los modelos obtenidos para la estimación de altura
ortométrica. Entregando su precisión en las distintas zona de estudio.
• Automatización del cálculo de transformación bidimensional, de
coordenadas planimétricas, a través de lenguaje de programación
Avenue.
• Automatización del cálculo de alturas ortométrica, con parámetros de
regresión múltiple conocidos, a través de lenguaje de programación
Avenue.
• Integración de capas geográficas de Chile, y cálculos automatizados en
plataforma Arcview GIS 3.3
• Análisis y Conclusiones.
6
CAPITULO II: CONCEPTOS Y METODOLOGIA DE TRABAJO. 2.1 INTRODUCCIÓN. La geodesia estudia la forma, dimensiones y campo gravitatorio de la tierra en
territorios extensos. Como se sabe, esta es su principal diferencia con la
topografía, la cual basa sus trabajos en superficies de extensión reducida en las
cuales se puede considerar despreciable la esfericidad terrestre. En esencia, la
Geodesia comienza sus trabajos allí donde termina la topografía. De todas
formas, no debe considerarse el estudio de estas ciencias por separado, pues
están íntimamente relacionadas, de tal manera que la topografía necesitará
apoyarse en la geodesia para una gran cantidad de aplicaciones prácticas.
En este trabajo se aplicarán conceptos de la geodesia física, que según P.S
Zakatov en su libro Curso de Geodesia Superior, la define como “la parte de la
geodesia superior que analiza los métodos de estudio de la figura de la tierra
como cuerpo físico y geométrico en base a las leyes de la mecánica y a datos
experimentales, o sea, como resultado de las mediciones geodésicas,
gravimétricas y astronómicas” y conceptos de la geodesia matemática que
formula los métodos y las técnicas para la construcción y el calculo de las redes
de coordenadas de referencia.
2.2 CONCEPTOS PREVIOS GEODÉSICOS. A continuación se definirán conceptos para el buen entendimiento de este
trabajo, tanto en las áreas de la geodesia física, como la geodesia matemática.
7
2.2.1 El elipsoide. Como se sabe la tierra no es redonda, y su figura se asemeja a una esfera
achatada en los polos, no existiendo una figura geométrica que la represente a
cabalidad, debido fundamentalmente a las irregularidades existentes. Estas
irregularidades de la tierra son detectables y no extrapolables a todos los
puntos simétricos de la tierra, ya que no existe un único modelo matemático que
represente toda la superficie terrestre, debido a que cada continente, nación o
país, emplea un modelo matemático distinto de forma que se adapte mejor a la
forma de la tierra en la zona a cartografiar. (Ignacio Alonso Fernández-Coppel, El datum)
Esta representación matemática se le denomina Elipsoide, que es un sólido
generado por la rotación de una elipse sobre su eje menor (Figura2.1). Está
definida por los siguientes parámetros: Semieje mayor(a), Semieje menor (b),
achatamiento (ƒ) y la primera y segunda excentricidad ( e y e’ respectivamente)
y las relaciones entre ellos son las siguientes:
ƒ a
ba −=
abae
22 +=
bbae
22
' +=
Figura 2.1 El Elipsoide.
Fuente: “La tierra”, por Dagoberto Salazar. http://nacc.upc.es/tierra/node25.html
8
2.2.2 El geoide. Se define al geoide como la superficie teórica de la tierra que une todos los
puntos que presenten igual potencial de gravedad. La forma así creada supone
la continuación por debajo de la superficie de los continentes, de la superficie
de los océanos en calma y mares suponiendo la ausencia de mareas, además
de la ausencia de perturbaciones exteriores (atracción de la luna y las
interacciones de todo el sistema solar), siendo así coincidente con el Nivel
medio del mar (NMM). Lejos de lo que se podría imaginar, esta superficie no es
uniforme, sino que presenta una serie de irregularidades, causadas por la
distinta composición mineral del interior de la tierra y de sus distintas
densidades, lo que implica que para cada punto de la superficie terrestre exista
una distancia distinta desde el centro de la tierra al punto del geoide. (Ignacio Alonso
Fernández-Coppel, El datum)
El geoide se extiende por los continentes sin interrupciones, sin embargo se
hundirá por debajo del elipsoide debido a la deficiencia de masa (océanos), por
otro lado , donde existan concentraciones de masa el geoide se levantará sobre
el elipsoide. A esta separación entre elipsoide y geoide se llama ondulación
geoidal (N) como se muestra en la figura 2.2.
Figura 2.2 Relación Elipsoide-geoide.
Fuente: “El geoide para el área mexicana y sus aplicaciones” por David Ávalos Naranjo.
9
Pero se debe tener cuidado de no confundir al geoide con el nivel medio del
mar, ya que este ultimo vendría siendo en estricto rigor un cuasi-geoide debido
a que varía constantemente y no es el mismo conforme uno se mueve a lo largo
de una costa, mucho menos entre océanos distintos.
2.2.3 Datum geodésico. El datum geodésico es la superficie de referencia para el cálculo y
determinación de coordenadas, estableciéndose datos iniciales de los cuales se
deriva el resto. Está compuesto por:
• Una superficie de referencia con definición geométrica exacta,
generalmente un elipsoide de revolución.
• Un “punto fundamental”, en el que coinciden las verticales al geoide y al
elipsoide.
En geodesia se emplean dos tipos de datum, el horizontal y el vertical:
• Datum Horizontal: Permite la determinación de la latitud y longitud. Se
elige un punto en el cual las superficies del elipsoide de referencia y del
geoide sean tangentes. De esta forma la vertical del geoide
(astronómica) y la vertical del elipsoide (geodésica) coincidirán, así
también, sus respectivas coordenadas.
• Datum Vertical: Es independiente del datum horizontal y es la superficie
que permite el cálculo de las alturas. Lo más usual es que esta superficie
sea el geoide o referida al nivel medio del mar.
10
2.2.4 Altura elipsoidal. Las alturas elipsoidales (h) representan la separación entre la superficie
topográfica terrestre y el elipsoide, calculada sobre la línea perpendicular a este
último.
Las alturas elipsoidales son obtenidas a partir de las coordenadas geocéntricas
cartesianas (X, Y, Z) definidas sobre un elipsoide de referencia (por ejemplo el
modelo Geodetic Reference System 1980, GRS80, o el World Geodetic System
1984, WGS84, los cuales, en la práctica, son iguales), y determinadas a partir
del posicionamiento satelital de los puntos de interés. (Grupo de Trabajo III SIRGAS).
2.2.5 Altura ortométrica.
Figura 2.3 Altura Ortométrica.
Fuente: Grupo de Trabajo III–SIRGAS
Los números geopotenciales son divididos por el valor medio de la gravedad
verdadera (g') entre el punto evaluado y el geoide. (Figura 2.3)
H')( g
Cortom =
11
Debido a que no es posible determinar directamente el valor de g’, es necesario
introducir hipótesis sobre distribución de masas internas terrestres. También las
alturas ortométricas pueden obtenerse a partir de las alturas elipsoidales
mediante la sustracción de las ondulaciones geoidales (N):
H Nhortom −=)(
2.3 SISTEMAS DE COORDENADAS. Cuando es necesario identificar la posición de un punto sobre el espacio se
utilizan los sistemas terrestres o geodésicos de referencia. Éstos
alternadamente, son asociados a una superficie que más se aproxime a la
forma de la tierra (elipsoide), en la cual se desarrollan todos los cálculos para
obtener sus coordenadas. Las coordenadas se pueden presentar en diversas
formas: referidas a un elipsoide determinado, denominadas coordenadas
geodésicas y en una superficie plana, que se denominará dependiendo de la
proyección que se ocupe, como por ejemplo, coordenadas UTM.
Las coordenadas referidas a los sistemas de referencia geodésicos son
presentadas principalmente como: Cartesianas, Geodésicas o Elipsoidales y
planas.
2.3.1 Coordenadas cartesianas. Es un sistema dextrógiro en donde el elipsoide está asociado a un sistema
cartesiano ortogonal formado por los ejes XYZ. El eje X está contenido en el
plano ecuatorial, orientado al meridiano cero (Greenwich), Z coincide con el eje
de rotación terrestre y está orientado en la dirección del polo norte, el eje Y
completa el sistema dextrógiro siendo perpendicular a los dos anteriores.
12
2.3.2 Coordenadas geodésicas.
Las coordenadas geodésicas determinan la posición espacial de un punto
cualquiera sobre un elipsoide determinado, que represente de mejor manera a
la tierra o una zona particular. Quedan determinadas por:
Latitud (φ): ángulo formado por la normal al punto a definir y su proyección
sobre el ecuador, varia de +90º a -90º y toma valores negativos al sur del
ecuador.
Longitud (λ): ángulo entre la sección meridiana que contiene al punto y el
meridiano de Greenwich, su graduación va de 0º a 180º, siendo negativas al
oeste del meridiano 0º y positivas al este.
Altura Elipsoidal (h): Corresponde a la distancia del punto a la superficie del
elipsoide, medida sobre su normal.
13
Figura 2.4 Relación Geométrica entre coordenadas cartesianas y geodésicas.
Fuente: Conceptos geodésicos básicos. http://www.colegiochubut.org.ar/agrimensores
2.3.3 Relación matemática entre coordenadas cartesianas y geodésicas.
Como se ve en la figura 2.4, un punto sobre la superficie terrestre, tiene
coordenadas cartesianas (X,Y,Z) geocéntricas, que pueden ser expresadas en
coordenadas geodésicas (φ,λ,h), o viceversa, de acuerdo con las siguientes
relaciones matemáticas:
a- Transformación de coordenadas geodésicas a cartesianas. (φ,λ,h) (X,Y,Z).
φ
λφλφ
senheNZ
senhNYhNX
⋅+−⋅=
⋅⋅+=⋅⋅+=
])1([
cos)(coscos)(
21
1
1
Donde:
-1ª excentricidad (e): 2
222
abae −
=
14
-Gran normal (N): φ221 sene
aN⋅−
=
a y b: semiejes del elipsoide.
b- Transformación de coordenadas cartesianas geodésicas, (X,Y,Z) (Φ,λ,h):
Ndh
XY
eadsenebZ
−=
⎥⎦
⎤⎢⎣
⎡=
⎥⎦
⎤⎢⎣
⎡⋅⋅−⋅⋅+
=
φ
λ
ψψ
φ
cos
arctan
cos'arctan
1
1
32
321
Donde:
-2da excentricidad (e’): 2
222'
bbae −
=
Y las variables auxiliares son:
21
21 YXd += ⎥⎦
⎤⎢⎣⎡
⋅⋅
=bdaZ1arctanψ
2.4 SISTEMAS DE REFERENCIA GEODÉSICOS. Un sistema de referencia geodésico es un recurso matemático que permite
asignar coordenadas a puntos sobre la superficie terrestre. Deben distinguirse
los llamados sistemas locales que utilizan, para su definición, un elipsoide
15
determinado y un punto datum, y los sistemas globales cuyos parámetros están
dados por una terna rectangular (X, Y, Z) cuyo origen se encuentra en el
geocentro del planeta. Para definir las coordenadas geodésicas (latitud, longitud
y altura elipsoidal) cuentan con un elipsoide de revolución asociado. Esta es
una definición rigurosa pero abstracta, pues tanto el centro como los ejes son
inaccesibles en la práctica.
2.4.1 Sistemas locales de referencia. Los sistemas locales de referencia son aquellos que adaptan el geoide a una
zona específica de la tierra, gracias a la utilización de un elipsoide determinado,
sobre este se realizan todos los cálculos geodésicos, con el previo
conocimiento de la posición geométrica del punto origen (datum) Además los
sistemas locales de referencia no son geocéntricos.
En las décadas de los años cincuenta y sesenta, para fines geodésicos y
cartográficos se definieron los sistemas de referencia sudamericanos, datum
Provisorio Sudamericano 1956 (PSAD56), con su vértice de origen en La
Canoa, Venezuela y datum Sudamericano 1969 (SAD69), con su origen en
Chua, Brasil.
Nuestro país ha adoptado como sistema de referencia oficial para el territorio
nacional, desde el extremo norte hasta la latitud 43° 30’ Sur, PSAD56, lo que
coincide aproximadamente con el límite entre las regiones X y XI. En el extremo
sur se utiliza el sistema SAD69 como referencia cartográfica, como también el
datum HitoXVIII en el extremo sur de la XII región.
En la tabla 2.1 se muestran los parámetros que definen a cada datum. La
cartografía sistemática escala 1/50000 editada por el IGM está referida a los
16
datums PSAD56, SAD69 e Hito XVIII, en las regiones correspondientes. Las
cartas IGM 1/25000 están referidas al SAD69. (Manual de carreteras Volumen II)
Tabla 2.1 Parámetros PSAD56, SAD69 e Hito XVIII.
Datum Elipsoide Semieje-mayor Achatamiento
PSAD56 Internacional
(Hayford)
6.378.388 m 1/297
SAD69 South American
1969 (UGGI-67)
6.378.160 m 1/298,25
Hito XVIII Internacional
(Hayford)
6.378.388 m 1/297
2.4.2 Sistemas globales de referencia.
A diferencia de los sistemas geodésicos locales, los sistemas geocéntricos son
tridimensionales y de alcance global. El concepto de punto datum desaparece, y
es reemplazado por el origen y orientación de la terna de referencia. Esta terna
consiste en los ejes ortogonales cartesianos X, Y, Z centrados en el centro de
masas de la tierra. Estos sistemas terrestres (fijados a la Tierra) tienen el eje X
solidario al meridiano origen de las longitudes y el eje Z próximo al eje de
rotación, por lo tanto este sistema “gira” juntamente con la tierra. Estos sistemas
resultan imprescindibles para ubicar puntos ligados al planeta Tierra. (Sistemas
Geodésicos. Comité Nacional de la Unión Geodésica y Geofísica Internacional .1era edición 1999)
2.4.3 International Terrestrial Reference Frame (ITRF). El organismo encargado de determinar y entregar información científica sobre
los parámetros de orientación de la tierra, para la realización de distintos
organismos (astronómicos, geodésicos y geofísicos), es el IERS (Internacional
Earth Rotation Service). ITRF fue establecido por IERS y constituye el marco de
17
referencia del ITRS (Internacional Earth Reference System). Existe alguna
confusión entre los conceptos de sistemas y marcos de referencia. Los
sistemas de referencia se definen a partir de consideraciones matemáticas y
físicas e involucran la especificación de parámetros, puntos origen, planos, ejes,
etc. Los marcos de referencia están constituidos por puntos materializados en el
terreno, ubicados con gran exactitud y precisión, según alguno de los sistemas
de referencia.
La constitución del ITRF corresponde a un conjunto de estaciones de las cuales
se conocen sus coordenadas y su variación respecto al tiempo, a las cuales se
les denomina Set of Station Coordinates (SSC). Para ello se emplean técnicas
como VLBI (Very Long Baseline Interferometry), SLR (Satelite Laser Ranging),
LLR (Lunar Laser Ranging), GPS, DORIS (Doppler Orbitography and Radio-
positoning Integrated by Satellite)
Figura 2.5 Estaciones ITRF2005.
Fuente: http://itrf.ensg.ign.fr/
18
Figura 2.6. Movimiento de las placas terrestres obtenido por ITRF2005 (1 cm/año).
Fuente: http://itrf.ensg.ign.fr/
2.4.4 Sistema WGS-84.
El sistema Geodésico Mundial 1984, es actualmente el sistema de referencia
para GPS y es compatible con el ITRF, básicamente bajo los siguientes
aspectos:
• Posición: geocéntrico, con origen en el centro de masa de la tierra,
incluyendo océanos y atmósfera.
• Orientación: eje Z en dirección del Polo de Referencia definido por IERS,
eje X en la intersección del meridiano de Referencia (IERS) y el plano
ecuatorial, eje Y completa el sistema ortogonal dextrógiro.
Al sistema cartesiano se asigna un elipsoide también denominado WGS-84, que
es compatible con el sistema de referencia 1980 (Elipsoide GRS80).
19
Figura 2.7. Parámetros WGS 84.
Fuente: Manual de carreteras Volumen II
2.4.5 Sistema de referencia para las Américas (SIRGAS). El sistema de referencia geocéntrico para las Américas (SIRGAS) es la
densificación regional del marco global de referencia terrestre del IERS (ITRF).
Las coordenadas SIRGAS están asociadas a una época específica de
referencia y su variación con el tiempo es tomada en cuenta ya sea por las
velocidades individuales de las estaciones SIRGAS o mediante un modelo
continuo de velocidades que cubre todo el continente. Además del sistema de
referencia geométrico, se ocupa de la definición y realización de un sistema
vertical de referencia basado en alturas elipsoidales como componente
geométrica y en números geopotenciales (referidos a un valor W0 global
convencional) como componente física. Las realizaciones o densificaciones de
SIRGAS asociadas a diferentes épocas materializan el mismo sistema de
referencia y sus coordenadas, reducidas a la misma época, son compatibles en
el nivel milimétrico.
La primera realización de SIRGAS (SIRGAS95) corresponde al ITRF94, época
1995.4 y está dada por una red GPS de alta precisión con 58 estaciones
distribuidas sobre América del Sur. Esta red fue reocupada en el año 2000,
extendiéndose a los países del Caribe y de Centro y Norte América. Por esta
razón, el significado original del acrónimo SIRGAS (Sistema de Referencia
Geocéntrico para América del Sur) cambió a Sistema de Referencia
Geocéntrico para las Américas. La nueva realización de SIRGAS
(SIRGAS2000) incluye 184 estaciones y corresponde al ITRF2000, época
20
2000.4. La precisión de las coordenadas de estas dos realizaciones está entre
±3 y ±6mm (Grupo II de Trabajo SIRGAS) La tercera realización de SIRGAS es
la red SIRGAS de Observación Continua (SIRGAS-CON). Actualmente está
compuesta por aproximadamente 130 estaciones GNSS de funcionamiento
permanente, de las cuales aproximadamente 50 pertenecen la red global del
IGS (International GNSS Service).
2.5 SISTEMA DE POSICIONAMIENTO GLOBAL (GPS)
El GPS (Global Positioning System, o sistema de posicionamiento Global) fue
desarrollado por el Departamento de Defensa de los Estados Unidos (DoD)
como un sistema de navegación de precisión, con fines militares. A partir de
1973 se comenzó a desarrollar la constelación NAVSTAR (Navigation Satellite
Timing and Ranging o Navegación por satélite con medición de tiempo y
distancia), la cual quedó operativa en 1995, conformada por 27 satélites (24
operativos y 3 de reserva), dando un alto grado de disponibilidad al sistema
GPS en todo momento del día y en cualquier lugar.
El sistema GPS esta referido al datum WGS-84 y tiene por objetivo calcular la
posición de un punto cualquiera en un espacio de coordenadas (X,Y,Z),
partiendo del cálculo de las distancias del punto a un mínimo de tres satélites
cuya localización es conocida. La distancia entre el usuario (receptor GPS) y un
satélite se mide multiplicando el tiempo de vuelo de la señal emitida desde el
satélite por su velocidad de propagación. Para medir el tiempo de vuelo de la
señal de radio es necesario que los relojes de los satélites y de los receptores
estén sincronizados, pues deben generar simultáneamente el mismo código.
Ahora bien, mientras los relojes de los satélites son muy precisos los de los
receptores son osciladores de cuarzo de bajo coste y por tanto imprecisos. Las
distancias con errores debidos al sincronismo se denominan pseudodistancias.
21
La desviación en los relojes de los receptores añade una incógnita más que
hace necesario un mínimo de cuatro satélites para estimar correctamente las
posiciones.
2.5.1 Señal GPS.
Los satélites que utiliza GPS contienen varios osciladores de alta precisión,
entregando medidas de tiempo del orden de 10 14− segundos. Los osciladores
de alta precisión del satélite tiene una frecuencia fundamental ƒ 0 = 10.23 MHz,
la cual genera dos frecuencias portadoras de la banda L, las cuales sirven para
transmitir información a través de los satélites.
Las dos frecuencias generadas a partir de ƒ 0 son:
• L1 = 1575.42 MHz, con longitud de onda λ=19 cm.
• L2 = 1227.60 MHz, con longitud de onda λ=24 cm.
Sobre estas dos frecuencias transportadoras se transmiten, a su vez, dos
códigos, que son secuencias binarias (combinación de ceros y unos) de
formación seudo aleatoria, llamados Ruidos Seudo Aleatorio-PRN (pseudos
Random Noise), estos códigos son:
• Código binario de adquisición Bruta o Grosera – C/A (Coarse Adquisition): modulado sólo en L1 y es el de menor frecuencia a 1.023
MHz, su longitud de onda λ es de 300 m. Es de uso civil.
22
• Código binario preciso P (ó Y): modulado en ambas portadoras (L1 y
L2) a una frecuencia de 10.23 MHz, tiene una longitud de onda λ de sólo
30 m. y es de uso Restringido.
Junto con estos dos códigos, se envía un mensaje de navegación (NAVDATA)
modulado en ambas portadoras, el cual suministra la siguiente información:
• Efemérides de los satélites: información que refleja el movimiento del
satélite en su orbita y permite calcular la posición de este al instante de
medición.
• Almanaque: información sobre la posición de todos los satélites de la
constelación.
• Tiempo del sistema.
• Correcciones a los relojes de los satélites.
• Número de identificación del satélite
• Estado (salud) del satélite
2.5.2 Fuentes de error GPS
Igualmente que en todos los equipos que se utilizan, una observación GPS está
sometida a varias fuentes de error, que se pueden minimizar dependiendo del
equipo y metodología que se utilice. Estas fuentes de error son las siguientes:
23
Satélites: -Variaciones Orbitales
-Errores en el oscilador
DoD: -S/A (Disponibilidad Selectiva)
Punto de Referencia: -Error del oscilador receptor
-Error en las coordenadas de referencia
Observaciones: -Retraso Ionosférico.
-Retraso Troposférico.
-Pérdidas de ciclos
-Errores de medida de fase con el receptor en
movimiento.
-Multipath (Ondas reflejadas)
-Errores en el estacionamiento
-Errores en la manipulación del equipo.
2.6 TRANSFORMACION BIDIMENSIONAL DE COORDENADAS. 2.6.1 Tipos de transformaciones bidimensionales. Las transformaciones bidimensionales se dividen en:
• Proyectiva.
• Afín.
• De Semejanza o conforme.
24
a- Transformación proyectiva bidimensional.
Las ecuaciones de la transformación bidimensional proyectiva posibilitan el
cálculo analítico de coordenadas de puntos del sistema de referencia sobre un
plano (X, Y) a partir de las coordenadas de sus puntos homólogos en el sistema
arbitrario (x´,y´) En estas ecuaciones se supone que la coordenada “Z” del
sistema de referencia es conocida al estar situados los puntos sobre un mismo
plano. En el caso de considerar puntos que no estén contenidos en dicho plano,
los valores de las coordenadas planimétricas (X, Y) que se obtengan, tendrán
un error proporcional al error de la “Z” considerada. Esta transformación suele
emplearse en aquellos casos en los que se suponen pequeñas variaciones de
relieve.
b- Transformación afín bidimensional.
La transformación de coordenadas afín bidimensional, es sólo una pequeña
modificación de la transformación de semejanza (2-D) a la cual se le incluyen
diferentes factores de escala, dirección eje de abscisas y ordenadas, y falta de
ortogonalidad entre sus ejes.
c- Transformación bidimensional conforme o de semejanza.
Una transformación de semejanza aplicada sobre una figura, es aquella que no
varía su verdadera forma después de la transformación. Para aplicar una
transformación bidimensional de semejanza es necesario conocer como mínimo
las coordenadas de dos puntos en ambos sistemas. Se mejora la precisión en
la transformación, si los puntos se eligen lo más alejados posibles. Debido a
que son 4 incógnitas y cada punto entrega 2 ecuaciones, son necesarios al
25
menos 3 puntos para haber redundancia y hacer posible el ajuste con 2 grados
de libertad.
Figura 2.8. Representación grafica de ejes XY girados, trasladados y escalados.
Fuente: “Ajuste Geodésico” Rene Zepeda.
La expresión general de una transformación conforme bidimensional,
considerando el caso más general, es decir, ejes girados, trasladados y con
diferentes unidades de medida, se tendrá:
y
x
TSenxCosyyTSenyCosxx
+⋅−⋅⋅=+⋅+⋅⋅=
))()(('))()(('
ωωλωωλ
Expresado en forma matricial la expresión anterior se tiene:
⎥⎦
⎤⎢⎣
⎡+⎥
⎦
⎤⎢⎣
⎡⋅⎥
⎦
⎤⎢⎣
⎡−
⋅=⎥⎦
⎤⎢⎣
⎡
y
x
TT
yx
CosSenSenCos
yx
)()()()(
''
ωωωω
λ
Pudiendo expresar la relación anterior de la siguiente forma:
26
⎥⎦
⎤⎢⎣
⎡+⎥
⎦
⎤⎢⎣
⎡⋅⎥
⎦
⎤⎢⎣
⎡−
=⎥⎦
⎤⎢⎣
⎡
y
x
TT
yx
abba
yx
''
Esta transformación es conocida con el nombre de Transformación de Helmert.
Donde los parámetros de la transformación a calcular son respectivamente a, b,
Tx, Ty. Conocidos los parámetros a y b puede determinarse el giro y el factor
de escala.
)()(
ωλωλ
SenbCosa⋅=⋅=
Con lo que:
)tan(
22
abA
ba
=
+=
ω
λ
2.6.2 Modelo de ajuste. El modelo aplicable para este caso es uno paramétrico con lo que:
La = F(Xa)
Modelo linealizado: AX + L = V
Partiendo de la forma general, las ecuaciones de observación para n puntos
serán:
27
ynnnxnnnn
yx
yx
TxbyayTybxaxP
TxbyayTybxaxPTxbyayTybxaxP
+⋅−⋅=+⋅+⋅=⇒
+⋅−⋅=+⋅+⋅=⇒+⋅−⋅=+⋅+⋅=⇒
''
''''
2222222
1111111
MMM
De esto se obtiene:
0|X
aXFA
δδ
=
y
x
TTba
X =
n
n
yx
yxyx
L
''
''''
2
2
1
1
M
=
Donde A se ira conformando de la siguiente manera:
1'0'''
0'1'''
==−==
====
yx
yx
Ty
Tyx
byy
ay
Tx
Txy
bxx
ax
δδ
δδ
δδ
δδ
δδ
δδ
δδ
δδ
El modelo de Helmert se resolverá por:
28
n
n
n
ny
x
y
n
x
nnn
y
n
x
nnn
yx
yx
yx
yx
VyVx
VyVxVyVx
yx
yxyx
TTba
Ty
Tx
by
ay
Tx
Tx
bx
ax
Ty
Tx
by
ay
Tx
Tx
bx
ax
Ty
Ty
by
ay
Tx
Tx
bx
ax
''
''''
''
''''
''''
''''
''''
''''
''''
''''
2
2
1
1
2
2
1
1
2222
2222
1111
1111
MM
MMMM
=−⋅
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢
⎣
⎡
δδ
δδ
δδ
δδ
δδδ
δδ
δδ
δδ
δδ
δδ
δδ
δδδ
δδ
δδ
δδ
δδ
δδ
δδ
δδδ
δδ
δδ
[ ]A [ ]X [ ]L [ ]V
Donde [A] [X] - [L] = [V] representa la forma general de las ecuaciones de
observación indirecta.
Aplicando la condición de mínimo al sistema de ecuaciones se tiene:
[ ] [ ] [ ][ ] [ ] [ ]( ) [ ] [ ] [ ] [ ]( )
[L] [P] [L] [L] [P] [A] [X] - [X] [A] [P] [L] - [X][A] [P] [A] [X] tttttt
1
2
⋅⋅+⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅=Φ−⋅⋅⋅−⋅=Φ
⋅⋅==Φ ∑=
LXAPLXA
VPVVt
n
i
ti
2º y 3º término son iguales, por propiedad de matrices, por lo que resulta.
[L] [P] [L] [X] [A] [P] [L]2 - [X][A] [P] [A] [X] tttt ⋅⋅+⋅⋅⋅⋅⋅⋅⋅⋅=Φ
Para minimizar la función Φ, habrá que calcular su derivada parcial con
respecto a X:
29
[L] [P] [A][A]) [P] [A] ([X]
0[A] [P] [L]2 -[A] [P] [A] [X]2
)(0
t1-t
ttt
⋅⋅⋅⋅⋅=
=⋅⋅⋅⋅⋅⋅⋅=Φ
=Φ
X
MinimoX
δδ
δδ
2.6.3 Precisión del método de ajuste. Lo primero es encontrar la precisión a posteriori del modelo ( 0
2) El parámetro
02 normalmente es desconocido y es necesario estimarlo. El estimador de este
parámetro es la varianza residual, definida como el coeficiente entre la suma de
residuos al cuadrado y el número de grados de libertad del modelo.
∑=
⋅−
=n
iiR v
uns
1
22 1ˆ
Donde:
n: Número de observaciones. En este caso particular cada observación que
entra en el modelo debe ser considerada dos veces es decir habrá 2n
observaciones debido a que cada punto de observación entrega dos
educaciones al modelo.
u: Número de parámetros
n –u: Grados de libertad del modelo.
∑=
n
iiv
1
2 : Suma de los cuadrados de los residuos.
30
En forma matricial se podrá estimar a través de.
unsR −
⋅⋅⋅⋅⋅=
LPAX-LPLˆ
ttt2
Asumiendo que 20
2ˆ σ≈Rs entonces es posible estimar las matrices de varianza-
covarianza de:
• Parámetros ajustados:
( ) 120
−⋅⋅⋅=∑ APAX t
a σ
• De los valores observados ajustados:
( ) tta AAPAAL ⋅⋅⋅⋅⋅=∑
−120σ
• De los residuos:
( ) )( 1120
−−−⋅⋅⋅⋅⋅=∑ PAAPAAV ttσ
31
2.7 INFERENCIA ESTADÍSTICA
2.7.1 Introducción. En el campo de la estadística se distinguen dos partes, la descriptiva y la
inferencial. La descriptiva intenta resumir en forma concisa, un conjunto de
datos en un solo valor, índice o coeficiente. Por su parte la inferencial trata de
llegar a conclusiones que sobrepasan el alcance de los datos analizados, es
decir se trata de técnicas que tienden a deducir características desconocidas a
partir de un conjunto de datos. (Dr. José Luis Borcosque, Métodos de cuantificación en geografía).
La inferencia estadística está formada por los métodos utilizados para tomar
decisiones o para obtener conclusiones sobre una población, utilizando la
información contenida en una muestra. Se puede dividir en dos grandes áreas:
estimación de parámetros y prueba de hipótesis.
Como la inferencia estadística nos permite trabajar con una variable a nivel de
intervalo o razón, así también se puede comprender la relación de dos o más
variables y nos permitirá relacionar mediante ecuaciones, una variable en
relación de la otra variable llamándose Regresión Lineal y una variable en
relación a otras variables llamándose Regresión múltiple, siendo a esta ultima a
la cual se referirá en este trabajo .
Con regresión múltiple se puede determinar si existe o no relación de
dependencia entre dos o más variables. Es decir, conociendo los valores de
una variable independiente, se trata de estimar los valores de dos o más
variables dependientes, consiguiendo de mejor manera, una función con
parámetros que realmente son influyentes en los resultados.
32
2.7.2 Conceptos básicos de inferencia estadística.
Para que un método de inferencia estadística proporcione buenos resultados
debe:
• Basarse en una técnica estadístico-matemática adecuada al problema y
suficientemente validada.
• Utilizar una muestra que realmente sea representativa de la población y
de un tamaño suficiente.
A continuación se definirán conceptos básicos, para un mejor entendimiento de
la materia, donde algunas posteriormente se mencionarán o explicarán con
mayor profundidad:
• Población: es un conjunto homogéneo de individuos sobre los que se
estudia una o varias características que son, de alguna forma,
observables.
• Muestra: es un subconjunto de la población. El número de elementos de
la muestra se denomina tamaño muestral.
• Muestreo aleatorio simple: es aquel en el que todos los individuos de la
población tienen la misma probabilidad de ser elegidos.
• Muestra aleatoria simple: de una variable aleatoria x , con distribución
F y de tamaño n , es un conjunto de n variables aleatorias ,,...,, 21 nxxx
independientes e igualmente distribuidas (con distribución F ).
33
• Espacio muestral: es el conjunto de muestras posibles que pueden
obtenerse al seleccionar una muestra aleatoria, de tamaño n , de una
cierta población.
• Parámetro: es cualquier característica medible de la función de
distribución de la variable en estudio (media, varianza,…etc.).
• Estadístico: es una función de la muestra T ( nxxx ,...,, 21 ). Por tanto, es
una variable aleatoria que tiene una función de distribución que se
denomina distribución en el muestreo de T.
• Distribuciones muéstrales de una estadística: es la distribución de
probabilidad que puede obtenerse como resultado de un número infinito
de muestras aleatorias independientes, cada una de tamaño n
provenientes de la población de interés.
• Estimador de la media poblacional: se utiliza la media muestral
definida por:
i
n
ix
nX
1
1=Σ=
Si X sigue una distribución normal (obedece campana de Gauss)
),( 2σµN , se verifica que:
)1,0(~/
,~2
Nn
Xn
NXσ
µσµ −⇔⎟⎟
⎠
⎞⎜⎜⎝
⎛
34
• Estimador de la varianza poblacional: se utiliza la cuasivarianza
muestral definida por
2
1
2 )(1
1ˆ XXn
s i
n
i−Σ
−=
=
Si X sigue una distribución normal ),( 2σµN , se verifica que:
212
2
~ˆ)1(
−−
nsn χ
σ
Dado que normalmente la varianza poblacional se desconoce y es
necesario estimarla, cuando ocurre esto se utiliza la distribución de la t
(t - Student), que corresponde a una distribución de probabilidad que
surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño (n<30), es de
interés, para la aplicación de este trabajo, el siguiente resultado:
1~/ −−
ntnXσ
µ
No sé profundizará en todos los tipos de distribución muéstrales existentes en
estadística, debido que no es el fin de este trabajo de tesis, sólo se adjuntarán
en anexos, las tablas normalizadas de cada distribución, de manera que el
lector pueda saber, y a la vez, interpretar de donde se obtienen los valores
normalizados de distribución.
35
2.7.3 Regresión múltiple.
Los Modelos de Regresión estudian la relación estocástica (sistema que
funciona por el azar) cuantitativa entre una variable de interés y un conjunto de
variables explicativas. Sea Y la variable de interés, variable respuesta o
dependiente y sean kxxx ,..., 21 las variables explicativas o regresoras. La
formulación matemática de estos modelos es la siguiente:
Y = ε+),...,( 21 kxxxm
Donde:
ε = es el error de observación debido a variables no controladas.
En estricto rigor el modelo de regresión es lineal. Por lo tanto la expresión
matemática general del modelo es:
Y εαααα +++++= kk xx ...2110
Donde como primer objetivo de este modelo es estimar los parámetros
kαααα ,...,,, 210 y la función de distribución del error F a partir de una muestra
de n observaciones, que tendrá la forma:
( ){ } ( )( ){ }niiikii
niii yxxxyx 1211 ;,...,,; == =r
De la expresión matemática general del modelo se deduce que para i = 1,2,...,n
se verifica la siguiente igualdad:
36
iikkiii xxxy εαααα +++++= ...22110
Que si se escribe de forma matricial queda:
⎪⎪⎭
⎪⎪⎬
⎫
⎪⎪⎩
⎪⎪⎨
⎧
+
++
+
++
+
++
+
++
+
++
=
==
nnkk
kk
kk
nnn x
xx
x
xx
x
xx
y
yy
ε
εε
α
αα
α
αα
α
αα
α
αα
MM
K
M
K
K
MMMM2
1
2
1
22
222
122
11
211
111
0
0
0
2
1
1
11
εαrrr
+= XY
Desarrollando y resumiendo las matrices del modelo de regresión múltiple son:
,2
1
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
ny
yy
YM
r
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
nk
k
k
nn x
xx
x
xx
x
xx
XM
K
M
K
K
MMM2
1
2
22
12
1
21
11
1
11
,
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
kα
αα
αM
r 1
0
,
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
nε
εε
εM
r 1
0
Donde:
Yr
: es un vector n-dimensional (matriz n x 1) de la variable respuesta o
dependiente.
X : es la matriz del diseño de las variables regresoras (matriz n × (k + 1)), la
primera columna de esta matriz está formada por unos, a la columna que se le
asociada con el parámetro 0α ; la columna j + 1 contiene la información relativa
a la variable xj, con j = 1,2...,k, asociándola al parámetro jα
αr : es el vector (k + 1)-dimensional (matriz (k+1) × 1) de los parámetros del
modelo.
37
εr : es el vector n-dimensional (matriz n x 1) de las perturbaciones aleatorias.
En el estudio del modelo de regresión lineal general se asume que se verifican
las siguientes hipótesis:
1- La función de regresión es lineal.
)/(),...,,/(),...,,()( 2121 iikiiikiii xYExxxYExxxmxm rr ===
kk xxx 11221110 ... αααα ++++= , con i = 1,…,n.
2- La varianza es constante.
221 ),...,,/()/( σ== ikiii xxxYVarxYVar r , con i = 1,…,n.
3- La distribución es normal.
212211021 ,...N( ~,...,,// σαααα kkiiikiii xxxxxxYxY ++++=r
4- Las observaciones iY son independientes (bajo normalidad, esto
equivale a que la 0),( =ji YYCov , si i≠j).
5- n > k + 1. En caso contrario no se dispone de información suficiente para
estimar los parámetros del modelo.
6- Las variables regresoras x1,x2,...,xk son linealmente independientes.
2.7.4 Estimación de los parámetros del modelo.
Sea ∧
α un estimador del vector de parámetros .αr Se define el vector de
predicciones como:
38
αˆ Χ=Υ
El vector de residuos se obtiene como:
Υ−Υ= ˆrre
El estimador por mínimo cuadrados de αr se obtiene minimizando la suma de
los residuos al cuadrado. Esto significa, que se minimiza la siguiente función de
k + 1 variables:
)ˆ()ˆ()ˆ( 2
1Υ−ΥΥ−Υ==Σ=Ψ
=
rrrr tti
n
ieeeα
)ˆ)(ˆ()ˆ()ˆ( αααα Χ−ΥΧ−Υ=Χ−ΥΧ−Υ=rrrr
tttt
αααα ˆˆˆˆ ΧΧ+ΥΧ−ΧΥ−ΥΥ= ttttttrrrr
Derivando respecto a α e igualando a cero, se obtiene las ecuaciones de
regresión:
αΧΧ=ΥΧ ttr
,
De donde se deduce el siguiente estimador por mínimos cuadrados:
ΥΧΧΧ= −r
tt 1)(α
La matriz ΧΧ t es una matriz (k +1)x(k+1) cuya expresión es la siguiente:
39
⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
Σ
ΣΣΣ
Σ
ΣΣΣ
⎜⎜⎜⎜⎜⎜
⎝
⎛
Σ
ΣΣΣ
Σ
ΣΣΣ
=ΧΧ
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
21
21
11
1
21
211
211
21
11
211
211
11
1
21
11
11
ikni
ikini
ikini
ikni
iikni
ini
iini
ini
iikni
iini
ini
ini
ikni
ini
ini
ni
t
x
xxxx
x
xx
xxx
x
xx
xxxx
x
xx
M
K
M
K
K
K
MMM
La matriz ΥΧr
t es una matriz (k+1)x1 que viene dada por:
ΥΧr
t =
⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
⎟⎟⎟⎟⎟⎟
⎠
⎞
Σ
ΣΣΣ
=
=
=
=
iikni
iini
iini
ini
yx
yxyx
y
1
21
11
1
M
2.7.5 Propiedades de los estimadores
a- Estimador de los coeficientes del modelo lineal. En el estimador del vector αr , por el método de mínimos cuadrados, se
verifican las siguientes propiedades:
• El estimador α es insesgado o centrado: ααr
=)ˆ(E . El termino insesgado
o centrado viene de la definición de sesgo, que es la diferencia entre el
valor esperado y el valor verdadero del parámetro a estimar. Por lo tanto,
es deseable que un estimador sea insesgado o que su sesgo sea nulo.
• La matriz de varianzas-covarianzas del estimador α es :
40
kjiij
ttEEEVar 0,212 )()()))ˆ(ˆ))(ˆ(ˆ(()ˆ( =
− =ΧΧ=−−= σσααααα . De donde se
deduce que los estimadores iα y jα (i≠j) no son independientes ya que
0)ˆ,ˆ(2 ≠= jiij Cov αασ , con i,j=0,1,…,k. En particular, la varianza del
estimador iα viene dada por:
iiiiiiii qVarCov 222 )ˆ()ˆ,ˆ( σσααασ ===== , con i=0,1,…,k, siendo iiq el
elemento i-ésimo de la matriz 1)( −ΧΧ t .
• El estimador α tiene distribución normal multivariante de orden k+1, esto
quiere decir :
))(,(N~ˆ 121)(k
−+ ΧΧ tσαα r
• El estimador iα del parámetro iα tiene la siguiente distribución normal :
),N(~ˆ 2i iii qσαα , con i =0,1,…,k.
El parámetro iα indica la influencia de la variable regresora ix en la variable
respuesta Y , además del incremento que se produce en ésta por el
crecimiento unitario en la variable regresora ix . Se debe tener en cuenta
que el valor de iα está condicionado al modelo de regresión múltiple con el
que se está trabajando y si se cambia el modelo (se eliminan o introducen
variables) el coeficiente iα , asociado a la variable regresora ix , también
cambia. Por otro lado aceptar que el valor iα es cero, equivale a aceptar
que la variable ix , no está relacionada linealmente con la variable Y .
Si se conoce la varianza del modelo 2σ , utilizando las distribuciones
mencionadas anteriormente, se pueden calcular intervalos de confianza de
41
los parámetros iα , individuales o conjuntos (regiones de confianza del
vector parametrito ),...,,( 21 jhjj ααα , con { }hjjj h ,...,2,1,0,...,, 21 ∈ o hacer
contrastes de simplificación sobre parámetros. En la práctica casi nunca se
conoce 2σ debido a que es la varianza de la población y siempre se hacen
modelos a partir de muestras de la población, por lo tanto la varianza 2σ es
necesario estimarla.
b- El estimador de la varianza.
Una hipótesis básica del modelo es que los errores son normales y
homocedásticos, por tanto, 2)( σε =iVar , con i = 1,…,n, el parámetro 2σ
normalmente es desconocido y es necesario estimarlo. El estimador de este
parámetro es la varianza residual, definida como:
2
1
2
)1(1
ˆ i
n
iR ekn
s=Σ
+−=
El estimador 2ˆRs es distinto del estimador que se obtiene por máxima
verosimilitud, que se denota como 2ˆ MVσ y que se define como:
2
1
2 1ˆ i
n
iMV en =Σ=σ
La relación entre ambos estimadores que dada de la siguiente forma:
22 ˆ)1(
ˆ MVR knns σ+−
=
42
El estimador 2ˆRs tiene la ventaja, respecto a 2ˆMVσ , de ser insesgado.
Utilizando la hipótesis de normalidad se obtiene la siguiente relación que
permite conocer la distribución de 2ˆRs :
21)(k-n2
2
~))1((+
+−χ
σRskn
De la relación anterior se obtiene un intervalo de confianza de 2σ con un nivel
de confianza 1 -α , que queda expresado como:
⎟⎠⎞
⎜⎝⎛+−
≤≤⎟⎠⎞
⎜⎝⎛ −
+−
+−+− 2
ˆ))1((
21
ˆ))1((2
)1(
22
)1(
2
αχσ
αχ kn
R
kn
R sknskn
Donde )(2)1( θχ +− kn el número que verifica que θθχξ =≤ +− ))(( 2
)1(knP , siendo ξ
Una variable aleatoria con distribución 2)1( +− knχ .
c- Inferencia sobre los parámetros del modelo.
De la distribución de iα , se deduce:
N(0,1)~ˆ
),N(~ˆ 2i
ii
iiiii q
qσ
αασαα
−⇒ , con i = 0,1,…,k
De 2ˆRs y del intervalo de 2σ la distribución de iω es )1( +− knt , o sea:
43
)1(~ˆ
+−
−= kn
ii
iii t
qσαα
ω , i=0,1,…,k
Utilizando iω se obtiene que un intervalo de confianza para iα a un nivel de
confianza 1-α es:
,2
1ˆˆ )1( ⎟⎠⎞
⎜⎝⎛ −⋅±∈ +−
ααα knRii tiiqs con i =0,1,…,k
Donde )()1( θ+− knt es el número que verifica que θθχζ =≤ +− ))(( 2)1(knP , siendo ζ
una variable aleatoria con distribución )1( +− knt . El estadístico iω también se
puede utilizar para realizar contrastes de hipótesis acerca de si la variable
explicativa ix influye individualmente o no en la variable respuesta Y (contraste
de simplificación). Aceptar que 0=iα equivale a aceptar que la variable ix no
está relacionada linealmente con la variable Y , por tanto no debe estar en el
modelo.
d- Contraste individual de la t.
Se desea hacer el siguiente contraste ( iC ) que verifique el contraste individual
de la t:
⎭⎬⎫
⎩⎨⎧
≠≡=≡
≡00
1
0
i
ii H
HC
αα
con i =0,1,…,k
44
Si 0H es cierto, se obtiene que:
iω │ )1(~ˆ
ˆˆ0 +−== kn
iiR
iiH t
qst
α , con i=0,1,…,k.
it representa la discrepancia entre la información que proporciona la muestra y
la información que proporciona la hipótesis nula ( 0H ).
Se deduce que el valorp − de este contraste bilateral es:
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛=>=− +−
iiR
iikn qs
ttPvalorpˆ
ˆˆ2 )1(α .
La región de aceptación del contraste a un nivel de significación α es:
⎟⎠⎞
⎜⎝⎛ −⋅≤≤⎟
⎠⎞
⎜⎝⎛ −⋅− +−+− 2
1ˆˆ2
1ˆ )1()1(ααα
kniiRikniiR tqstqs
2.7.6 Análisis de la varianza
En el siguiente apartado se va a explicar como descomponer la variable de
interés Y , cuando se ajusta un modelo de regresión múltiple.
a- Tabla ANOVA. Para todos los datos muestrales se hace la siguiente descomposición:
)ˆ()ˆ()( yyyyyy iiii −+−=−
45
Elevando al cuadrado y sumando se obtiene:
)ˆ)(ˆ(2)ˆ()ˆ()(1
2
1
2
1
2
1yyyyyyyyyy iii
n
ii
n
iii
n
ii
n
i−−Σ+−Σ+−Σ=−Σ
====
En base a la ortogonalidad de los vectores se obtiene que los productos
cruzados sean cero, de donde se sigue la siguiente igualdad (Teorema de
Pitágoras) que permite descomponer la variabilidad de la variable respuesta
( 2
1)( yyi
n
i−Σ
=) en la variabilidad explicada por la recta de regresión ( 2
1)ˆ( yyi
n
i−Σ
=),
más la variabilidad residual o no explicada por el modelo ajustado ( 2
1)ˆ( ii
n
iyy −Σ
=).
De esta igualdad se construye la siguiente tabla ANOVA:
Tabla 2.2. Tabla ANOVA del modelo de regresión múltiple
Tabla ANOVA del modelo de regresión múltiple Fuente de variación Suma de cuadrados Grados de libertad Varianzas
Por la recta scE= 2
1)ˆ( yyi
n
i−Σ
=
k kscEse =2ˆ
Residual scR= 2
1)ˆ( ii
n
iyy −Σ
=
n-(k+1) )1(ˆ2
+−=
knscRse
Global scG= 2
1)( yyi
n
i−Σ
=
n-1 1ˆ2
−=
nscGse
De esta tabla ANOVA se deduce el siguiente contraste acerca de la influencia
conjunta del modelo de regresión en la variable respuesta.
46
b- El contraste conjunto de la F.
El contraste se denomina MC y al igual que el contraste de la t, se desea
resolver lo siguiente:
⎭⎬⎫
⎩⎨⎧
≠≡====≡
≡0
0...
1
210
i
kM H
HC
αααα
, para algún i
Si 0H es cierto, ninguna de las variables regresoras influye en la variable
respuesta. En este supuesto se verifica que:
0ˆ ≈⇒≈ scEyyi ,
Por ser ésta una medida absoluta se compara con la varianza residual, lo que
lleva a utilizar el siguiente estadístico de contraste:
2
2
ˆˆˆ
R
eM s
sF =
Bajo la hipótesis nula y por la hipótesis de independencia se sigue que MF
sigue una distribución F (contraste de la F) con k y n-(k+1) grados de libertad.
MF │ )1(,2
2
~ˆˆ
0 +−= knkR
eH F
ss
valorp − del contraste es:
)ˆ( )1(, Mknk FFPvalorp ≥=− +− ,
47
Donde )1(, +− knkF denota una variable aleatoria que sigue una distribución F con
k y )1( +− kn . Si el valor critico valorp − del contraste es grande (mayor que el
nivel de significación α ) se acepta 0H , esto quiere decir, que el modelo de
regresión no es influyente y debe buscarse un modelo alternativo.
c- Contrastes individuales de la F Al igual que el contraste individual de la t, pero con la diferencia que se utilizará
la tabla ANOVA, se estudiará el incremento que se produce en el modelo al
introducir la variable regresora ix .
Para ello, si se desea contrastar la influencia de la variable ix , primeramente se
ajusta el modelo de regresión completo, con las k variables regresoras,
calculando así, la suma de cuadrados explicada por el modelo (scE(k)). A
continuación, se ajusta el modelo de regresión con k-1 variables, todas excepto
la variable ix . Nuevamente, se calcula la suma de cuadrados explicada por el
este modelo (scE(k- ix )), obteniendo así la suma al cuadrado incremental
debido a ix , como se muestra a continuación:
0)()()( ≥−−=∆ ii xkscEkscExscE
Este valor indica el aumento de la variabilidad explicada por el modelo al
introducir la variable ix . Para contrastar la influencia individual o no de ix , se
realiza el siguiente contraste:
⎭⎬⎫
⎩⎨⎧
≠≡=≡
≡00
1
0
i
i
HH
Ciαα
con i=0,1,…,k.
48
Como estadístico del contraste se utiliza:
)(ˆ1
)(
ˆ2 ks
xscE
FR
i
i
∆
= , con i=0,1,…,k.
Bajo la hipótesis nula se verifica que iF sigue una distribución F (contraste
individual de la F) con 1 y n – (k+1) grados de libertad.
iF │ )1(,1~0 +− knH F , con i=0,1,…,k.
Evidentemente, si 0H es cierto, 0)( ≈∆ ixscE y iF tomará valores pequeños. Por
lo tanto este contraste unilateral siendo el valorp − del contraste:
ikn FFPvalorp ˆ( )1(,1 ≥=− +− , con i=0,1,…,k.
Este contraste proporciona exactamente el mismo resultado que el contraste
individual de la t. Sin embargo, este método presenta la ventaja adicional de
poder utilizarse para contrastar la influencia de un subconjunto de l variables
explicativas, con l { }jljj xxxk ,...,,, 2≤ . En este caso el estadístico del contraste
utilizado es:
)(,2 ~)(ˆ
)(
ˆlknl
Rl F
ksl
lscE
F +−
∆
=
De esta manera en el modelo de regresión múltiple al hacer el contraste entre
la influencia individual de cada una de las variables regresoras y el contraste
49
sobre la influencia conjunta del modelo de regresión ajustado, se dan diversos
resultados significativos o no, pudiendo eliminar variables o agregar otras, para
así obtener un resultado más óptimo.
2.7.7 Correlación.
Al ajustar un modelo de regresión múltiple a una nube de observaciones es
importante disponer de alguna medida que permita medir la bondad del ajuste.
Esto se consigue con los coeficientes de correlación múltiple.
a- Coeficiente de correlación múltiple. Se define el coeficiente de correlación lineal simple (o de Pearson) entre dos
variables X e Y , como:
yx ssyxsYXr
⋅=
),(),(
Donde:
),( yxs : Covarianza muestral entre las variables X e Y .
xs : Desviación típica muestral X .
ys : Desviación típica muestral Y .
El coeficiente de correlación lineal simple es una medida de la relación lineal
existente entre las variables X e Y . En general, cuando se ajusta un modelo
estadístico a una nube de puntos, existe una medida de la bondad del ajuste, la
que se denomina coeficiente de determinación. Está definido por:
50
2
1
2
12
)(
)ˆ(
yy
yy
scGscER
i
n
i
i
n
i
−Σ
−Σ==
=
=
El coeficiente de correlación múltiple queda definido de igual forma que el
coeficiente de correlación lineal ( R ), representando así, el porcentaje de
variabilidad de la Y que explica el modelo de regresión.
Como scGscE ≤ , se verifica que 10 2 ≤≤ R . Si 2R = 1, la relación lineal es
exacta y si 2R =0, no existe relación lineal entre la variable respuesta y las
variables regresoras.
El coeficiente de correlación múltiple presenta el inconveniente de aumentar
siempre que aumenta el número de variables regresoras, ya que al aumentar k
(número de variables regresoras) disminuye la variabilidad no explicada,
algunas veces de forma artificial, lo que puede ocasionar problemas de
multicolinealidad. Si el número de observaciones n es pequeño, el
coeficiente 2R es muy sensible a los valores de n y k. En particular, si n = k + 1
el modelo se ajusta exactamente a las observaciones. Por ello y con el fin de
penalizar el número de variables regresoras que se incluyen en el modelo de
regresión, es conveniente utilizar el coeficiente de determinación corregido por
el número de grados de libertad ( 2R ). Este coeficiente es similar al anterior,
pero utiliza el cociente de varianzas en lugar del cociente de sumas de
cuadrados. Para su definición se tiene en cuenta que:
scGscR
scGscER −== 12
51
Cambiando las sumas de cuadrados por varianzas se obtiene el coeficiente de
determinación corregido por el número de grados de libertad, 2R , definido como
sigue:
2
1
2
1
2
22
)(1
1)1(
1
1ˆˆ1
yyn
ekn
ssR
i
n
i
i
n
i
Y
R
−Σ−
Σ+−
−=−=
=
=
Se deduce la relación entre los dos coeficientes de correlación, quedando:
2222
)1(1)1(1 RR
knnRR ≤⇒
+−−
−−=
También se puede relacionar el estadístico del contraste de regresión múltiple
(de la F) con el coeficiente de determinación, obteniendo:
[ ][ ]kRknR
ss
FR
eM 2
2
2
22
1)1(
ˆˆˆ
−+−
==
b- Correlación parcial.
Sea { }kXXX ,...,, 21 un conjunto de variables aleatorias, se define el coeficiente
de correlación parcial entre ix y jx , como la medida de la relación lineal entre
las variables ix y jx una vez que se ha eliminado en ambas variables los
efectos debidos al resto de las variables del conjunto { }kXXX ,...,, 21 . Al
coeficiente de correlación parcial, entre 1x y 2x se le denotará como kr ...312⋅ .
52
En el modelo de regresión múltiple:
εαααα +++++= kk XXXY ...22110
Se calcula el coeficiente de correlación parcial entre la variable respuesta Y y
una variable regresora ix , controlado por el resto de variables. Para ello se
utiliza el estadístico del contraste individual de la t, respecto a la variable ix y
que se definió anteriormente como:
( ) iiR
i
i
ii qs
tˆ
ˆˆ
ˆˆ αασα
== , con i=1,2,…, k.
Obteniéndose la siguiente relación:
)1(ˆˆ
2
22
+−+=⋅ knt
tr
i
iCYi
Donde C={ }kii ,...,1,1,...,2,1 +− es el conjunto de índices de todas las variables
regresoras excepto el índice i .
53
CAPITULO III – DESARROLLO.
3.1 INTRODUCCION. En este capítulo se desarrollarán dos aplicaciones de regresión múltiple. En la
primera se analizará un área determinada en la Región Metropolitana y en la
segunda, una línea de nivelación en la cuesta Lo Prado. En ambos casos se
verificará el comportamiento de cada modelo, de tal manera que estos
entreguen resultados óptimos. Los datos utilizados para las dos aplicaciones
que se desarrollarán están en el datum WGS84, con proyección cartográfica
UTM huso 19. Las alturas ortométricas utilizadas están referidas al nivel medio
del mar.
Antes de comenzar con los respectivos desarrollos, es de utilidad tener una
idea del tipo de relación, ya sea lineal o de otro tipo entre las variables que se
van a utilizar (figura 3.1).
Figura 3.1. Relación entre variables.
Fuente: Elaboración propia.
54
3.2 APLICACION1: USO DE REGRESIÓN MÚLTIPLE EN UNA ZONA DE LA REGIÓN METROPOLITANA.
Se dispone un set de datos de una zona dentro de la región metropolitana de
aproximadamente 100km 2 , abarcando parcialmente comunas como La Reina,
Peñalolén, San Joaquín, Macul, Ñuñoa y Santiago. El set de datos contiene 9
puntos, en donde a cada punto se le conoce su coordenada Norte, Este, Atura
ortométrica (H), y, ondulación geoidal (N) obtenida del modelo geoidal global
EGM96. Se procede al cálculo de la altura elipsoidal (h) para cada punto del set
de datos, mediante la siguiente expresión:
NHh +=
Obteniendo las alturas elipsoidales, los datos que se utilizarán para realizar el
modelo matemático, son los siguientes:
Tabla 3.1. Puntos del Set de datos a utilizar aplicación 1.
Punto Este Norte h H
A 348469.940 6299282.800 621.98 595.000
B 358468.010 6299297.100 826.774 799.000
C 358473.370 6289284.640 977.703 950.000
D 348472.120 6289282.720 615.877 589.000
1 353485.610 6294669.190 628.314 601.000
6 350475.920 6297045.920 607.102 580.000
7 356542.850 6297045.210 687.588 660.000
8 356553.000 6291499.060 760.546 733.000
9 350472.620 6291512.080 609.048 582.000
55
Los puntos del set de datos están dispuestos geográficamente según muestra
la figura 3.2.
La construcción de las matrices, que se utilizarán para la confección del modelo
de regresión múltiple, será en base a la reducción de cada una de las variables
a un centroide, que se obtiene mediante la media de las variables Norte, Este y
altura elipsoidal (h)
Figura 3.2. Puntos dispuestos geográficamente aplicación 1.
Fuente: Elaboración propia.
La media de la variable “H” nos permite comprobar si el modelo está
correctamente realizado. El significado del término libre (o constante) que se
introduce dentro de los cálculos matriciales del modelo de regresión, es
entregar, el valor de la variable respuesta en el punto de origen.
Tabla 3.2. Coordenadas Centroide aplicación 1.
Punto Este Norte h H
Centroide 353490.382 6294324.302 703.8813 676.556
56
3.2.1 Obtención de los coeficientes del modelo. La función de regresión tendrá la siguiente forma:
)mh(h)mN(N)mE(EH 3210 −+−+−+= αααα
Las matrices que se desarrollan, para la obtención del modelo de regresión,
quedan de la siguiente forma:
⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
=
582733660580601589950799595
Yr
,
⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
=
94.833-2812.222-3017.762-156.6652825.242-3062.618116.293-2720.9083052.468196.779-2721.6183014.462-175.567-344.8884.772-188.004-5041.582-5018.262-1
273.8225039.662-4982.9881122.8934972.7984977.6281
81.901-4958.4985020.442-1
X
Donde:
Yr
: corresponde a la matriz de la variable respuesta o dependiente, que en este
caso es la de alturas ortométricas.
X : es la matriz de diseño de las variables regresoras (matriz n × (k + 1)).
La obtención de los estimadores o coeficientes del modelo se realiza a través
de:
57
ΥΧΧΧ=
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
= − rr tt 1
3
2
1
0
)(
αααα
α
Con la multiplicación matricial para obtener αr , se obtienen los estimadores del
modelo, quedando de la siguiente forma:
)mh01(h9.998E)mN06(N--9.890E)mE05(E--7.673E676.556H −−+−+−+=
La varianza residual se obtiene de:
0.004ˆ05-3.548E1)(3-9
0.0001)()1(
1ˆ 2
12 =⇒=
+=Σ
+−=
= Rin
iR se
kns
Como se muestra a continuación, de la matriz de varianza-covarianza del
modelo, se obtienen las correspondientes varianzas para cada estimador:
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
⋅=
05-2.942E07-2.152E07-7.590E-18-6.767E-07-2.152E09-9.211E09-5.551E-20-4.950E-07-7.590E-09-5.551E-08-2.688E19-2.218E18-6.767E-20-4.950E-19-2.218E0.111
0.000016)ˆ(αVar
05942.209211.908688.2
111.0
33
22
11
00
−=−=−=
=
EqEqEq
q
58
Donde la varianza de cada estimador queda definida por:
iiRiR qss ⋅= 22 ˆ)(ˆ α
Resultando la siguientes varianzas para cada estimador:
001.0)(ˆ06-1.774E)(ˆ 002 =→= αα RR ss
07-6.552E)(ˆ13-4.293E)(ˆ 112 =→= αα RR ss
07-3.835E)(ˆ13-1.471E)(ˆ 222 =→= αα RR ss
05-2.168E)(ˆ10-4.699E)(ˆ 332 =→= αα RR ss
3.2.2 Intervalos de confianza.
Se procede al cálculo de los intervalos de confianza a un 90% para cada
estimador, incluyendo el de 2σ , ya que este ultimo obedece a la varianza
residual de una población total, cuestión que en la practica nunca se tiene,
debido a que siempre se trabaja con muestras en donde se hace referencia a la
varianza residual 2ˆRs , pero que sin lugar a dudas, es necesario tener en cuenta.
El cálculo de intervalos de confianza se hace a través de tablas de distribución
estadística (Tablas presentes en ítem Anexos) en el caso de 2σ , se utilizará 2
)1( +− knχ (también denominada ji-cuadrado) y para el caso de cada uno de los
estimadores se utilizará la distribución de )1( +− knt (t-student).
• Para 2σ se tiene que:
59
⎟⎠⎞
⎜⎝⎛
+−≤≤
⎟⎠⎞
⎜⎝⎛ −
+−
+−+− 2
ˆ))1((
21
ˆ))1((2
)1(
22
)1(
2
αχσ
αχ kn
R
kn
R sknskn
( ) ( )05.005-1.597E))13(9(
95.005-1.597E))13(9(
2)5(
22
)5( χσ
χ+−
≤≤+−
Por lo tanto:
0.0080.00305-6.973E06-7.210E 2 ≤≤⇒≤≤ σσ
Para cada estimador se tiene que:
)1(~ˆ
+−
−= kn
iiR
iii t
qSαα
ω
Por lo tanto, los intervalos de confianza de cada estimador, quedarán de la
siguiente manera:
• Para :0α
5~111.00.004
676.556toα−
676.558676.553 ≤≤ oα
• Para :)(1 Esteα
60
51 ~
08-2.688E0.00405-7.673E- tα−
05--7.541E05-7.810E 1 ≤≤ α
• Para :)(2 Norteα
52 ~
09-9.211E0.00406-9.890E-
tα−
06--9.117E05-1.066E 2 ≤≤ α
• Para :)(3 hα
53 ~05-2.942E0.004
01-9.998Et
α−
01-9.998E01-9.997E 2 ≤≤ α
3.2.3 Contrastes individuales de la t para los coeficientes del modelo de regresión.
A partir de los valores resultantes de los correspondientes contrastes
individuales de la t, para cada coeficiente, se obtiene que:
• Para :0α
61
⇒⎭⎬⎫
⎩⎨⎧
≠≡=≡
≡00
01
000 α
αHH
C Sí 0H es cierto, )1(~ˆ
ˆˆ +−= kniiR
ii t
qst
α
En donde:
0.111004.0676.556ˆ~
ˆˆˆ
0)5(00
00 =⇒= tt
qst
R
α =507912.714
Por lo tanto para :0α
0=− valorp
• Para :1α
⇒⎭⎬⎫
⎩⎨⎧
≠≡=≡
≡00
11
101 α
αHH
C Si 0H es cierto, )1(~ˆ
ˆˆ +−= kniiR
ii t
qst
α
En donde:
08-2.688E004.005-7.673E-ˆ~
ˆˆˆ
1)5(11
11 =⇒= tt
qst
R
α = -1.171E+02
Por lo tanto para :1α
⇒=− 0valorp La variable “Este” influye y explica el
comportamiento de la variable respuesta “Altura Ortométrica”.
62
• Para :2α
⇒⎭⎬⎫
⎩⎨⎧
≠≡=≡
≡00
21
202 α
αHH
C Si 0H es cierto, )1(~ˆ
ˆˆ +−= kniiR
ii t
qst
α
En donde:
09-9.211E004.006-9.890E-ˆ~
ˆˆˆ 2)5(
22
22 =⇒= tt
qst
R
α = -2.579E+01
Por lo tanto para :2α
⇒=− 0valorp La variable “Norte” influye y explica el
comportamiento de la variable respuesta “Altura Ortométrica”.
• Para :3α
⇒⎭⎬⎫
⎩⎨⎧
≠≡=≡
≡00
31
303 α
αHH
C si 0H es cierto, )1(~ˆ
ˆˆ +−= kniiR
ii t
qst
α
En donde:
05-2.942E004.001-9.998Eˆ~
ˆˆˆ 3)5(
33
33 =⇒= tt
qst
R
α = 4.613E+04
Por lo tanto para :3α
63
⇒=− 0valorp La variable “Altura elipsoidal (h)” influye y explica
el comportamiento e la variable respuesta “Altura Ortométrica”.
En otras palabras, el valor que se obtiene de valorp − es una probabilidad de
influencia de la variable regresora en la variable respuesta. Por lo tanto se tiene,
en los 4 coeficientes, un 0% de probabilidad de que la variable regresora no
influya ni explique, el comportamiento de la variable respuesta Altura
Ortométrica.
3.2.4 Tabla ANOVA (contraste conjunto de la F)
Se construye una tabla de análisis de varianza (ANOVA) utilizando la
distribución de probabilidad de Fisher (F) ya que esta analiza simultáneamente
varias medias poblacionales. Todo esto para verificar la influencia, o no, del
modelo en la variable respuesta, esta tabla queda de la siguiente forma:
Tabla 3.3 .Tabla ANOVA del contraste conjunto de la F aplicación 1.
TABLA ANOVA
Fuentes de variación Suma de cuadrados
Grados de libertad Varianzas
Por el modelo 131514,222 3 43838,074
Residual 7,984E-05 5 1,597E-05
Global 131514,222 8 16439,278
Con estos datos se obtiene el siguiente estadístico del contraste conjunto de la
F:
5,3)1(,2
2
~.676274523922505-1.597E
43838.074ˆ~ˆˆˆ FFFss
F MknkR
eM ==⇒= +−
64
Por lo tanto:
⇒=− 0valorp Se rechaza la NO influencia del modelo en la variable respuesta.
En base a los resultados de los contrastes individuales de la t y el contraste
conjunto de la F se deduce la influencia de cada una de las tres variables
regresoras y la influencia conjunta del modelo de regresión en la variable de
interés (Altura ortométrica).
3.2.5 Coeficientes de determinación y de correlación del conjunto. Una vez ajustada la recta de regresión a la nube de observaciones es
importante disponer de una medida que mida la bondad del ajuste realizado y
que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos
alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de
determinación, definido como sigue:
0.99992131514.2221131514.2222 ===
scGscER
El modelo ajustado explica el 99.99% de la variabilidad de la respuesta.
El coeficiente de correlación múltiple: 1=R
El coeficiente de determinación corregido por los grados de libertad:
9999.016439.278
05-1.597E1ˆˆ
1 22
22 =⇒−=−= R
ss
RY
R
65
Por lo tanto el coeficiente de correlación corregido por los grados de libertad,
es:
1=R
3.2.6 Coeficientes de determinación y correlación individuales.
Se determinan los coeficientes de correlación y por ende los de determinación,
mediante la siguiente expresión:
yx ssyxCovYXR
⋅=
),(),(
A modo de ejemplo, sólo se determinará el coeficiente de correlación y
determinación individual de la variable “Este” respecto a la variable dependiente
“Altura ortométrica”, a través de la tabla ANOVA, como un método opcional para
determinar dichos coeficientes.
• Se calcula la regresión de “Este” respecto al “Altura Ortométrica” y se
obtiene la siguiente tabla ANOVA :
Tabla 3.4. Tabla ANOVA de variable “Este” respecto variable “Altura ortométrica
Tabla ANOVA
Fuentes de variación
Suma de cuadrados
Grados de libertad
Varianzas
Por el modelo 90515.139 1 90515.139
Residual 40999.083 7 5857.012
Global 131514.222 8 16439.278
0.6882 =R 0.830=R
66
Tabla 3.5. Coeficientes de correlación y determinación individuales.
3.2.7 Aplicación del Modelo.
A continuación se aplicará el modelo desarrollado anteriormente a los mismos
puntos con los cuales se realizó la regresión múltiple, obteniendo los siguientes
resultados:
Tabla 3.6. Alturas Ortometricas obtenidas con regresión múltiple.
Punto H(regre) A 595.004 B 798.997 C 949.999 D 589.001 1 600.998 6 579.997 7 660.004 8 733.004 9 581.997
El vector de los residuos, matricialmente, se obtiene de la siguiente forma:
YXXXXYXYYYe ttrrrrr 1)(ˆˆ −−=−=−= α
Coeficientes de determinación y correlación.
variable 1
variable 2
Desv. (variable1)
Desv. (variable2) Cov. R 2R
Este Hort 3899.940 120.883 391108.574 0.830 0.688
Norte Hort 3814.464 120.883 -106622.258 -0.231 0.053
helip Hort 121.143 120.883 14644.066 1.000 1.000
Este Norte 3899.940 3814.464 -2233,834783 0.000 0.000
Este helip 3899.940 121.143 392340,418 0.830 0.690
Norte helip 3814.464 121.143 -106496,121 -0.230 0.053
67
Como YHYr
=ˆ , siendo tt XXXXH 1)( −= la matriz de proyección ortogonal.
En base a esto:
))(()(ˆ εαrrrrrrr
+−=−=−=−= XHIYHIYHYYYe
εεαεαrrrrrr )( HIHHXXe −=−−+=
Se calcula la matriz de varianzas de los residuos,
)())(())(()()( 22 HIHIHIHIEHIeVar ttt −=−−=−−= σσεεrrr
Por tanto, ie es una variable aleatoria con distribución.
),1(,0N(~ 2iii he −σ con i=1,…,n.
Donde iih es el valor de influencia de ixr que mide la “distancia estadística” de ixr
a x . Un residuo “grande” indica que la observación está lejos del modelo
estimado, por lo tanto, la predicción de esta observación es mala. Las
observaciones con residuos grandes se denominan observaciones atípicas o
heterogéneas.
Como los residuos tienen varianza variable y son dimensionados (tienen las
unidades de la variable respuesta “H”), normalmente se tipifican de la siguiente
manera:
ii
i
he−1σ
, con i=1,…,n.
68
Los residuos tipificados siguen una distribución normal estándar, pero como 2σ es desconocido, se sustituye por su estimador la varianza residual 2
Rs
obteniendo así, los residuos estandarizados definidos como:
iiR
ii vs
er
−=
1ˆ, con i=1,…,n.
Los residuos estandarizados tienen media cero y varianza próxima a 1, esto
permite distinguir a los residuos grandes.
Por la hipótesis de normalidad los residuos estandarizados siguen una
distribución t con )1( +− kn grados de libertad. Se obtienen del calculo del
estimador )(ˆ isR para cada i, i = 1,...,n, la varianza residual del modelo de
regresión obtenido a partir de la muestra en la que se ha eliminado la
observación ),( ii Yxr . Ahora se definen los “residuos estudentizados” como
~1ˆ )( iiiR
ii vs
et
−= )1()1( +−− knt con i = 1,…,n.
Los residuos estudentizados siguen una distribución t con )1()1( +−− kn
grados de libertad. Si el tamaño muestral (n) es grande, los residuos
estandarizados y los estudentizados son casi iguales y muy informativos,
pudiéndose considerar grandes los residuos estandarizados tales que .2>ir
69
En la tabla 3.7, se encuentran los residuos obtenidos por el modelo.
Tabla 3.7. Residuos simples, estandarizados y estudentizados Aplicación 1.
Punto
Residual
simple
Residuos
estandarizados
Residuos
estudentizados
A 0.004 1.769 1.971
B -0.003 -1.144 -1.225
C -0.001 -0.321 -0.321
D 0.001 0.239 0.239
1 -0.002 -0.684 -0.709
6 -0.003 -0.973 -1.052
7 0.003 1.225 1.352
8 0.004 1.134 1.253
9 -0.003 -0.808 -0.849
Promedio=0.049
Varianza=1.050
Con los residuos estandarizados o estudentizados se pueden construir los
siguientes gráficos de interés que sirven para verificar si los resultados del
modelo son favorables:
• El histograma de los residuos, que sirve para observar la existencia de
normalidad, simetría y detectar observaciones atípicas
70
-1.500
-1.000
-0.500
0.000
0.500
1.000
1.500
2.000
A B C D 1 6 7 8 9
Res
iduo
s es
tand
ariz
ados
Gráfico 3.1.Histograma de residuos (Aplicación 1).
Fuente: Elaboración propia
• El gráfico probabilístico de normalidad (p-p y q-q) y simetría, que
permite contrastar la normalidad (simetría) de la distribución de los
residuos.
0
1
2
3
4
5
6
-1 0 1
Residuos estandarizados
Gráfico 3.2. Probabilístico de normalidad (p-p y q-q) y simetría.
Fuente: Elaboración propia
71
• El gráfico de residuos ( ie ) frente a las predicciones ( iy ), que permite
detectar diferentes problemas:
1. Heterocedasticidad: significa que la varianza no es constante,
teniéndose que transformar los datos (de la variable dependiente)
o aplicar mínimos cuadrados ponderados.
2. Error en el análisis: se ha realizado mal el ajuste y se verifica
que los residuos negativos se corresponden con los valores
pequeños iy y los errores positivos se corresponden con los
valores grandes de iy , o al revés.
3. El modelo es inadecuado: por falta de linealidad y se deben de
transformar los datos o introducir nuevas variables que pueden ser
cuadrados de las existentes o productos de las mismas. O bien se
deben introducir nuevas variables explicativas.
4. Existencia de observaciones atípicas o puntos extremos.
Tener en cuenta que se debe utilizar el gráfico de residuos
( ie ) frente a las predicciones ( iy ) en lugar del gráfico de residuos
( ie ) frente a las observaciones ( iy ) porque las variables er e
Yr
están correlacionadas, mientras que las variables er e Y no lo
están.
72
-2
-1
0
1
2
500 600 700 800 900 1000
Predicciones
Res
iduo
s es
tand
ariz
ados
Grafico 3.3. Residuos estandarizados v/s Predicciones (aplicación 1)
Fuente: Elaboración propia
500
600
700
800
900
1000
500 600 700 800 900 1000
Variable respuesta
Pred
icci
ones
Grafico 3.4. Predicciones v/s Variable respuesta (aplicación 1)
Fuente: Elaboración propia
Del grafico 3.4 se infiere un ajuste razonable, debido a que las predicciones
están próximas a los valores observados y en el grafico 3.3 el comportamiento
de los residuos es el adecuado, no tendiendo a ninguna función matemática.
Con estos resultados, más los obtenidos en los contrastes individuales de la t,
Contraste conjunto de la F, coeficientes de determinación y correlación, se
determina que no es necesario incluir ni quitar ninguna variable para el modelo
de regresión múltiple realizado para la aplicación 1.
73
3.2.8 Calibración Local GPS de la zona de estudio Región Metropolitana con Software Trimble Geomatics Office (TGO)
Con el fin de analizar los resultados del modelo de regresión múltiple, se
realizará un ajuste vertical, mediante el software TGO.
Ingresando al software, antes de importar los datos GPS de la zona en estudio,
se configuran las propiedades del proyecto. De esta manera, el programa
queda preparado para recibir la información según el datum y proyección
correspondiente a los datos a importar.
Figura 3.3. Propiedades del proyecto en software TGO
Fuente: TGO
Los datos fueron importados en formato .csv con las siguientes características
Nombre, Latitud, Longitud, Altura, Código (WGS84)
74
Figura 3.4. Datos importados TGO (aplicación 1)
Fuente: TGO
Luego se procede a realizar una calibración local vertical para la interpolación
de ondulaciones geoidales a través de un plano que se ajuste a los datos
importados.
TGO aplica la siguiente relación para el cálculo de ondulaciones geoidales.
)(cos)( 321 mmm aaaN λλϕϕϕ −+−+=
Con lo que idealmente se esta aplicando sobre el punto medio de la zona de
ajuste (φm, λm), un desplazamiento constante sobre la vertical y dos giros en
las direcciones de los ejes coordenados, uno en la dirección S-N y otro en la
dirección W-E, con lo que se ajustará la ondulación del modelo a la observada.
75
Figura 3.5. Calibración local vertical TGO
Fuente: Elaboración Propia
Luego de realizado el ajuste se lee el informe de calculo para así percatar
cualquier anomalía.
Tabla 3.8. Parámetros de Ajuste Vertical TGO (Aplicación 1).
Coordenada Norte del punto de origen 6299297.100m
Coordenada Este del punto de origen 358468.010m
Separación vertical en el origen -27.772m
Pendiente Norte -8.682ppm
Pendiente Este -80.993ppm
Tabla 3.9. Resumen errores TGO (Aplicación 1)
Resumen
Error máximo Error medio cuadrático Punto
Vertical 0.018m 0.011 A
En la siguiente tabla se entregan los valores obtenidos de altura ortométrica con
la calibración vertical GPS hecha en el software TGO:
76
Tabla 3.10. Alturas Ortométricas entregadas por TGO (Aplicación 1) Punto Htgo
A 595.018
B 799.002
C 950.017
D 589.001
1 600.986
6 579.997
7 659.991
8 732.997
9 581.991
3.3 APLICACIÓN 2: LÍNEA DE NIVELACIÓN CUESTA LO PRADO
3.3.1 Introducción.
Para realizar un análisis del comportamiento de la regresión múltiple en una
línea de nivelación en la que se requiera interpolar alturas ortométricas, se
utilizaron datos de la memoria realizada por María José Herrera Gatica y José
Salas Silva en el año 2007. El título de la memoria es “Metodología y desarrollo
para la georreferenciación de un proyecto vial cuesta Lo Prado”. En está
memoria se realizaron poligonales electrónicas y mediciones GPS, siguiendo
las siguientes normativas del Manual de carreteras Volumen II:
• El orden de control del trabajo y la planificación de los procedimientos
GPS de la cantidad de líneas establecidas, serán según el capítulo 2.300
Ingeniería básica – Aspectos Geodésicos y topográficos, sección 2.301
Aspectos generales y referenciación de los estudios, capítulo 2.301.403
Referenciación de un Sistema de transporte de coordenadas secundario.
77
• La medición de las líneas bases tomadas con GPS, se realizaron con el
método estático rápido, tomando en consideración los tiempos
establecidos en el capítulo 2.300 Ingeniería básica – Aspectos
Geodésicos y topográficos, sección 2.312 Transporte de coordenadas
mediante GPS, capítulo 2.312.5 Métodos estáticos.
• Las Poligonales desarrolladas se hicieron de acuerdo al capítulo 2.300
Ingeniería básica – Aspectos Geodésicos y topográficos, sección 2.310
Poligonales, capítulo 2.310.4 Poligonales Secundarias.
• Las mediciones de las poligonales serán de acuerdo al capítulo 2.300
Ingeniería básica – Aspectos Geodésicos y topográficos, sección 2.310
Poligonales, capítulo 2.310.404 Tolerancias Admisibles, específicamente
Método de medida de ángulos horizontales y Método de medida de
distancias (2.310.404(4) y 2.310.104(5) respectivamente).
• Respecto a las precisiones (de un sistema de referenciación de segundo
orden y coordenadas líneas base) y tolerancias (ángulos horizontales,
medida de distancias y en la determinación de desniveles entre vértices)
obtenidas en está memoria, todas se ajustan a lo estipulado en los
capítulos 2.301.403 y 2.310.404 respectivamente.
Las mediciones GPS fueron realizadas con 3 receptores proporcionados por la
División de Ingeniería de Vialidad del Ministerio de Obras Publicas. La marca
del receptor geodésico utilizado es Trimble Modelo R8, cuyas precisiones en
Horizontal son de ± 0.005 m + 0.5 PPM y en vertical es de ±0.005 m + 1 PPM.
Estas mediciones GPS tienen la finalidad de ligar coordenadas obtenidas en
terreno a un sistema de referencia conocido. Las coordenadas de terreno
78
obtenidas para esta referenciación, son obtenidas mediante las poligonales
medidas a lo largo del camino emplazado en la cuesta Lo Prado, que consta de
26 estaciones. Para la medición de estas poligonales se utilizo la estación total
Leica serie TPS400, con precisión en distancias de ±5 mm + 2 ppm, y lectura
angular de 5 CC .
Figura 3.6. Trimble R8 y Leica serie TPS400.
Fuente: Elaboración propia.
3.3.2 Calculo y ajuste de Alturas ortométricas cuesta Lo Prado. Con los registros de terreno de las mediciones de poligonales electrónicas
realizados en la memoria “metodología y desarrollo de un proyecto vial cuesta
Lo Prado” se procede al calculo y ajuste de Altura ortométrica para los puntos a
utilizar en el modelo de regresión múltiple.
Lo primero es corregir a la línea los cenitales medidos en terreno
(pertenecientes a las poligonales)
79
Figura 3.7. Corrección a la línea.
Fuente: “Geodesia Geométrica” René Zepeda.
Deduciendo de la figura se puede establecer una relación para la corrección de
los cenitales a través del teorema del seno, con lo que se tiene.
)()( ZSen
scSenim=
− Como c es pequeño Z ≈ Z’ ⎟⎠⎞
⎜⎝⎛ ⋅−
=Di
ZSenimAsenc )'()(
cZZ += '
Luego se procede a calcular las distancias horizontales de cada tramo de las
dos poligonales, para esto se hace uso de los cenitales ya corregidos a la línea
y la expresión que se deduce de la siguiente figura.
Figura 3.8. Calculo de distancias horizontales. Fuente: “Geodesia Geométrica” René Zepeda.
80
)(αCosDiDh ⋅= ; Z−= 100α )100( ZCosDiDh −⋅=
Donde:
α: ángulo vertical respecto al horizonte.
Z: ángulo cenital corregido a la línea.
La precisión del calculo de las distancias horizontales puede ser establecido por
propagación del error a través de.
22
22
ZZ
DhDi
Di
DhDh σ
δδ
σδδ
σ ⋅⎟⎟⎠
⎞⎜⎜⎝
⎛+⋅⎟⎟
⎠
⎞⎜⎜⎝
⎛=
Donde:
Diσ y Zσ Son las presiones de las mediciones de distancia y angulares,
respectivamente, entregadas por el instrumento utilizado.
Derivadas parciales.
)100( ZCosDi
Dh −=δδ ; )100( ZSenDi
Z
Dh −⋅=δδ
La diferencia de nivel se calcula a través de mediciones recíprocas y
simultaneas.
81
Figura 3.9. Mediciones recíprocas y simultaneas.
Fuente: “Geodesia Geométrica” René Zepeda.
En los puntos A y B se miden los ángulos cenitales ZA y ZB; sus alturas son HA y
HB; e y r son los efectos de esfericidad y refracción.
De la figura anterior se deduce la expresión para el calculo de desniveles a
través de mediciones reciprocas y simultaneas, la obtención de esta fórmula
queda aclarada en el texto “Geodesia Geométrica” de Rene Zepeda Pág. 70.
)(21
ABh ZZTanDH −⋅=∆ Con Z B y ZA corregidos a la línea.
La precisión del calculo de desniveles puede ser establecido, por propagación
del error, a través de.
22
22
22
ZAZA
HZB
ZB
HDh
Dh
HH σ
δδ
σδδ
σδδ
σ ⋅⎟⎟⎠
⎞⎜⎜⎝
⎛+⋅⎟⎟
⎠
⎞⎜⎜⎝
⎛+⋅⎟⎟
⎠
⎞⎜⎜⎝
⎛= ∆∆∆
∆
82
Donde:
Dhσ Es la precisión de la distancia horizontal.
ZAσ y ZBσ Son las presiones de los cenitales corregidos a la línea.
Derivadas parciales.
)(21
ABDh
H ZZTan −=∆
δδ ;
221)(
21
⋅⎟⎟⎠
⎞⎜⎜⎝
⎛+−⋅=∆
ABhZB
H ZZTanDδδ ;
221)(
21
⋅⎟⎟⎠
⎞⎜⎜⎝
⎛+−⋅−=∆
ABhZA
H ZZTanDδδ
Para la Poligonal 1 los resultados son:
Tabla 3.11. Resultados poligonal 1.
Tramo Dhz (m) σDh (m) ∆H (m) H (m) σ∆H (m)
GPS2 551.315
GPS2 - E3 203.880 0.005 14.167 565.482 0.004
E3 - E4 587.297 0.006 74.459 639.940 0.013
E4 - E5 460.550 0.006 67.537 707.478 0.010
E5 - E6 299.079 0.006 30.296 737.774 0.006
E6 - E7 65.258 0.005 4.334 742.107 0.001
E7 - E8 28.508 0.005 1.474 743.581 0.001
E8 - GPS4 731.758 0.006 83.512 827.094 0.015
GPS4 827.358
83
Para la poligonal 2 los resultados obtenidos son:
Tabla 3.12. Resultados poligonal 2.
Tramo Dhz (m) σDh (m) ∆H (m) H (m) σ∆H (m)
GPS4 827.358
GPS4 - E11 681.807 0.006 -172.367 654.991 0.016
E11 - E12 1052.614 0.007 -295.367 359.624 0.025
E12 - E13 142.924 0.005 -10.584 349.040 0.003
E13 - E14 229.925 0.005 -20.165 328.875 0.005
E14 - E15 525.805 0.006 -33.984 294.891 0.010
E15 - E16 1083.594 0.007 -44.106 250.785 0.020
E16 - E17 474.590 0.006 -14.355 236.430 0.009
E17 - E18 561.269 0.006 -14.397 222.032 0.010
E18 - E19 754.267 0.007 -14.647 207.386 0.013
E19 - E20 470.892 0.006 -6.699 200.687 0.008
E20 - E21 348.370 0.006 -2.701 197.985 0.006
E21 - E22 303.925 0.006 -4.253 193.733 0.005
E22 - E23 984.254 0.007 -6.801 186.931 0.017
E23 - E24 292.568 0.006 -0.598 186.334 0.005
E24 - GPS5 433.388 0.006 -2.982 183.352 0.007
GPS5 182.503
Una vez obtenidos los desniveles se procede a obtener un error de cierre, para
luego ajustar dichos desniveles a través de un modelo de condición.
3.3.3 Ajuste de los desniveles a través de modelo de ecuaciones de condición.
El ajuste por mínimos cuadrados, mediante el modelo de ecuación de condición
en forma matricial, se calcula por los siguientes pasos.
84
Figura 3.10. Pasos ajuste por mínimos cuadrados.
Fuente: Memoria “Estudio y aplicación de Modelos Geoidales como marco de referencia vertical para Chile”.
Solución:
Modelo: F (La) = 0
Las ecuaciones de condición que se forman son. Para la poligonal 1.
LGPS2-E3b + VGPS2-E3 + LE3-E4b + VE3-E4 + LE4-E5b + VE4-E5 + LE5-E6b + VE5-E6 + LE6-E7b
+ VE6-E7+ LE7-E8b + VE7-E8+ LE8-GPS4b + VE8-GPS4 – (HGPS4 – HGPS2) = 0
Para la poligonal 2:
LGPS4-E11b + VGPS4-E11 + LE11-E12b + VE11-E12 + LE12-E13b + VE12-E13 + LE13-E14b + VE13-
E14 + LE14-E15b + VE14-E15+ LE15-E16b + VE15-E16 + LE16-E17b + VE16-E17 + LE17-E18b +
VE17-E18 + LE17-E18b + VE18-E19+ LE19-E20b + VE19-E20+ LE20-E21b + VE20-E21+ LE21-E22b
85
+ VE21-E22+ LE22-E23b + VE22-E23+ LE23-E24b + VE23-E24 + LE24-GPS5b + VE24-GPS5 –
(HGPS5 – HGPS4) = 0
La matriz B, corresponde a la matriz de funciones que liga los valores
observados a la función de ajuste, es decir, a la derivada para cada valor con
respecto a su recorrido. La matriz de los coeficientes B, para la poligonal 1,
queda de la siguiente forma:
[ ]111111111=B
Mientras que para la poligonal 2:
[ ]111111111111111=B
La matriz de error de cierre “W” para la poligonal 1 viene dada por.
[ ]264.0=W
Mientras que para la poligonal 2.
[ ]849.0−=W
La matriz Lb corresponde a las observaciones, en este caso desniveles.
86
⎥⎥⎥⎥⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢⎢⎢⎢⎢
⎣
⎡
=
512.83474.1334.4296.30537.67459.74167.14
1.poliLb
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢
⎣
⎡
−−−−−−−−−−−−−−−
=
982.2598.0801.6253.4701.2699.6647.14397.14355.14106.44984.33165.20584.10367.295367.172
2.poliLb
La matriz P corresponde al inverso de las precisiones al cuadrado de cada
medición. Para este caso dicha precisión viene dada por las distancias
horizontales de cada tramo. La varianza a priori 20σ utilizada es 1.
⎥⎥⎥⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢⎢⎢⎢
⎣
⎡
⋅=
2
22
21
20
1
1
1
n
P
σ
σ
σ
σO
⎥⎥⎥⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢⎢⎢⎢
⎣
⎡
⋅=
2
22
21
1
1
1
1
nDh
Dh
Dh
PO
Obtenidas estas matrices sólo basta aplicar el método de ecuación de condición
para así obtener los desniveles ajustados por mínimos cuadrados, de cada una
de las observaciones.
87
Cabe destacar que este método de ajuste, utilizado en un conjunto de
observaciones que presenten tan sólo una ecuación de condición, y, en la que
los pesos son establecidos en relación a la distancia (tal como el ejemplo
anterior) la solución de este modelo viene definida por:
parcialdistacumuladadist
eerrorcierrHcomp ..
⋅=∆
La fórmula anterior es conocida en topografía como “compensación
proporcional a la distancia”.
Además si se da el caso en que sólo existe una ecuación de condición y la
matriz de peso es considerada igual a 1 la solución de este modelo es:
tramosneerrorcierrHcomp
º=∆
La fórmula anterior es conocida en topografía como “compensación en partes
iguales”.
Tabla 3.13. Resultados alturas ortométricas ajustadas, poligonal 1.
Tramo ∆H ajustado (m) H ajustado (m)
GPS2 551.315
GPS2 - E3 14.189 565.504
E3 - E4 74.524 640.028
E4 - E5 67.588 707.617
E5 - E6 30.330 737.946
E6 - E7 4.341 742.287
E7 - E8 1.477 743.764
E8 - GPS4 83.594 827.358
GPS4 827.358
88
Tabla 3.14. Resultados alturas ortométricas ajustadas, poligonal 2
Tramo ∆H ajustado (m) H ajustado (m)
GPS4 827.358
GPS4 - E11 -172.436 654.922
E11 - E12 -295.474 359.447
E12 - E13 -10.599 348.848
E13 - E14 -20.188 328.660
E14 - E15 -34.038 294.623
E15 - E16 -44.216 250.406
E16 - E17 -14.403 236.003
E17 - E18 -14.454 221.549
E18 - E19 -14.723 206.825
E19 - E20 -6.747 200.078
E20 - E21 -2.737 197.341
E21 - E22 -4.283 193.058
E22 - E23 -6.902 186.156
E23 - E24 -0.627 185.529
E24 - GPS5 -3.026 182.503
GPS5 182.503
Finalmente con los desniveles ajustados y las alturas ortométricas calculadas
se obtienen los datos que se utilizarán en el modelo de regresión múltiple para
la obtención de altura ortométrica en “cuesta Lo Prado”
3.3.4 Aplicación 2: Uso de regresión múltiple en la línea de nivelación cuesta Lo Prado.
En cuesta Lo Prado se realizó un modelo para la obtención de altura
ortométrica con separación de 1km entre los puntos de control, interviniendo las
siguientes estaciones:
89
Tabla 3.15. Puntos para confección modelo regresión múltiple cuesta Lo Prado.
Figura 3.11. Disposición geográfica de puntos cuesta Lo Prado.
Fuente: Google Earth.
Punto Este (m) Norte (m) h (m) H (m)
GPS1 321785.062 6295856.052 535.403 510.292
GPS2 320853.898 6295814.300 576.334 551.315
GPS3 320088.809 6294297.629 822.237 797.330
E 4 320383.506 6295217.800 664.971 640.028
E 8 320381.777 6294719.835 768.699 743.764
E 11 319811.766 6293979.630 679.807 654.922
E 12 319077.853 6293225.225 384.269 359.447
E 15 318216.841 6292970.246 319.371 294.623
E 16 317133.541 6292948.752 275.047 250.406
E 18 316098.133 6292976.667 246.087 221.549
E 20 314880.064 6293107.545 224.527 200.078
E 22 314403.491 6292700.978 217.483 193.058
E 24 313172.949 6292360.944 209.932 185.529
90
Se realizó un modelo de 4 parámetros tal como se dedujo en la zona de estudio
Región metropolitana (aplicación 1)
Al igual que en la aplicación 1 se impuso el valor de la unidad para la matriz
Peso, si bien, se podrían haber establecido los pesos de las mediciones, en
relación, a la precisión con que fue observada o calculada las altura ortométrica
de cada punto. Se decidió desechar esto, debido a que no se disponía de las
presiones de medición de las estaciones GPS1, GPS2 Y GPS3. Además las
mediciones de los puntos anteriormente nombrados y los de las poligonales
antes expuestas fueron realizadas en épocas y condiciones; y con técnicas e
instrumental totalmente diferente una de la otra con lo que dotar de pesos
individualizados a cada punto sería algo irresponsable.
Del capítulo 2.9.3 se tiene que la ecuación general está dada por:
)mh(h)mN(N)mE(EH 3210 −+−+−+= αααα
Aplicando el cálculo matricial, explicado en el capítulo 3.1.1, se obtienen los
siguientes resultados:
Tabla 3.16. Parámetros modelo regresión múltiple cuesta Lo Prado.
Parámetros Valor Desv. Est. t p-valor
α0 430.949 8.869E-03 39672.31536 0.000
α1 -7.619E-05 7.904E-06 -7.870594355 0.000
α2 -2.801E-05 1.533E-05 -1.491749255 0.213
α3 1.000 7.329E-05 11141.13203 0.000
Centroide
Este (m) 318175.976
Norte (m) 6293859.662
h (m) 455.705
91
Donde el contraste conjunto viene dado por la tabla 3.17 y el resumen de los
resultados obtenidos, aplicando el modelo a los mismos puntos que se utilizaron
para realizar la regresión múltiple, se encuentra en la tabla 3.18:
Tabla 3.17. Contraste conjunto de la F cuesta Lo Prado.
Tabla ANOVA
Suma de cuadrados g.l. varianza F p-valor
Modelo 617015.942 3 205671.981 2.011E+08 0.000
Residual 0.0092 9 1.023E-03
Global 617015.952 12 51417.996
12 =R 1ˆ 2 =R 10.032ˆ =RS
Tabla 3.18. Residuos simples, estandarizados y estudentizados, cuesta Lo Prado.
Punto Hregre.
(m) Residuossimples
Residuos estandarizados
Residuos estudentizados
GPS1 510.317 -0.025 -1.089 -1.128
GPS2 551.321 -0.006 -0.240 -0.240
GPS3 797.329 0.001 0.056 0.056
E 4 640.012 0.017 0.586 0.595
E 8 743.755 0.009 0.322 0.324
E 11 654.926 -0.004 -0.156 -0.157
E 12 359.461 -0.014 -0.542 -0.547
E 15 294.635 -0.013 -0.490 -0.494
E 16 250.393 0.013 0.456 .460
E 18 221.511 0.037 1.269 1.378
E 20 200.040 0.038 1.377 1.501
E 22 193.044 0.014 0.512 0.518
E 24 185.596 -0.068 -2.773 -3.912
Prom. = -0.055
Var. = 1.071
92
100
200
300
400
500
600
700
800
900
100 200 300 400 500 600 700 800 900
Variables respuesta
Pred
icci
ones
Grafico 3.5. Predicciones v/s Variable respuesta cuesta Lo Prado.
Fuente: Elaboración propia
-3
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
100 200 300 400 500 600 700 800 900
Predicciones
Res
iduo
s es
tand
ariz
ados
Polinómica
Grafico 3.6. Residuos estandarizados v/s Predicciones cuesta Lo Prado.
Fuente: Elaboración propia
Del grafico 3.6 se desprende que es necesario introducir un término cuadrático
debido a que el comportamiento de los residuos no es adecuado. Esto, ya que
los puntos parecen seguir una parábola, es así como basándose en la figura 3.1
93
se decide introducir el termino dist3d y dist3d al cuadrado. Además debido al
resultado del contraste de la t se concluye la no influencia de la variable Norte
en la variable respuesta altura ortométrica, por lo que se decide descartarla del
modelo.
Con todo lo anterior se construye un nuevo modelo que sigue la siguiente
expresión:
)33()33()()( 2243210 mmmm ddistddistaddistddistahhaEEaaH −+−+−⋅+−+=
Los resultados que entrega el nuevo modelo son:
Tabla 3.19. Parámetros y centroide modelo, nueva regresión múltiple 5 parámetros
Parámetros Valor Desv. Est. (m) t p-valor
α0 430.949 2.229E-03 193320.052 0.000
α1 -9.224E-05 1.587E-06 -58.127 0.000
α2 4.959E-05 9.051E-06 5.479 0.000
α3 1.000 1.902E-05 52571.957 0.000
α4 -1.251E-08 1.553E-09 -8.051 0.000
Centroide
Este (m) 318175.976
Norte (m) 6293859.662
h (m) 455.705
Dist3d media (m) 2640.213
Dist3d media cuadrada 8522052.103
94
Tabla 3.20. Tabla ANOVA nueva regresión múltiple 5 parámetros.
Tabla ANOVA
Suma de cuadrados g.l. Varianza F p-valor
Modelo 617015.951 4 154253.988 2.388E+09 0.000
Residual 0.0005 8 6.460E-05
Global 617015.952 12 51417.996
12 =R 1ˆ 2 =R 080.0ˆ =RS
Tabla 3.21. Residuos simples, estandarizados y estudentizados, modificación modelo cuesta Lo Prado.
Punto Hregre.
(m) ResiduosSimples
Residuos Estandarizados
Residuos Estudentizados
GPS1 510.281 0.011 2.4906548 3.03047239
GPS2 551.333 -0.018 -2.6282145 -4.47866819
GPS3 797.328 0.002 0.4024259 0.35585305
E 4 640.030 -0.002 -0.2261110 -0.24241319
E 8 743.760 0.004 0.5487285 0.56562111
E 11 654.922 0.000 -0.0502900 -0.04948223
E 12 359.446 0.002 0.2691117 0.29634225
E 15 294.623 0.000 -0.0294420 -0.02734138
E 16 250.409 -0.002 -0.3408733 -0.35111426
E 18 221.548 0.001 0.1088128 0.11441399
E 20 200.077 0.001 0.2334229 0.23880563
E 22 193.053 0.005 0.7591222 0.76519272
E 24 185.533 -0.004 -1.5749783 -0.53887304
Prom. = -0,003
Var. = 1,303
95
100
200
300
400
500
600
700
800
900
100 200 300 400 500 600 700 800 900
Variable respuesta
Pred
icci
ones
Grafico 3.7. Predicciones v/s Variable respuesta, modificación modelo cuesta Lo Prado.
Fuente: Elaboración propia
-3
-2
-1
0
1
2
3
0 100 200 300 400 500 600 700 800 900
Predicciones
Res
iduo
s es
tand
ariz
ados
Grafico 3.8. Residuos estandarizados v/s Predicciones, modificación modelo cuesta Lo Prado.
Fuente: Elaboración propia
96
3.3.5 Aplicación de ajuste TGO a la línea de nivelación cuesta Lo Prado.
Los resultados obtenidos en la calibración GPS altimétrica en el TGO son:
Tabla 3.22. Parámetros ajuste vertical TGO cuesta Lo Prado
Coordenada Norte del punto de origen 6295856.052m
Coordenada Este del punto de origen 321785.063m
Separación vertical en el origen -25.083m
Pendiente Norte -27.742ppm
Pendiente Este -75.393ppm
Y los resultados para cada punto son:
Tabla 3.23. Alturas Ortométricas entregadas por TGO, cuesta Lo Prado.
Punto H TGO (m)
GPS1 510.320
GPS2 551.322
GPS3 797.325
E4 640.011
E8 743.753
E11 654.925
E12 359.463
E15 294.637
E16 250.395
E18 221.512
E20 200.041
E22 193.044
E24 185.595
97
3.4 AUTOMATIZACIÓN EN SOFTWARE ARCVIEW 3.3.
Se procede a automatizar los procedimientos expuestos en esta memoria
mediante lenguaje Avenue. Se consideró la explicación detallada sólo de la
estimación y transformación de parámetros, tanto en horizontal y vertical.
3.4.1 Automatización coordenadas planimétricas. a- Estimación de parámetros para transformación bidimensional de coordenadas. Una ves en el software Arcview se debe seleccionar el ítem “Estimación
parámetros” “Parámetros Horizontales”.
A través del paso anterior se ingresa en la rutina para el cálculo de parámetros
de una transformación bidimensional de Helmert.
Se debe seleccionar una tabla en formato .dbf con los campos Punto, E1, N1,
E2, N2. Luego de esto la rutina calculará los parámetros Tx, Ty, ángulo de
rotación y factor de escala, además del punto de origen (X0, Y0) residuo mayor
en X e Y (indicando el nombre de los puntos en los que estos residuos
máximos están ocurriendo) y el error medio cuadrático de la transformación.
Estos resultados se desplegarán en pantalla (figura 3.12) para poder ser
copiados por el usuario, así como también se dará la posibilidad de ser
guardados automáticamente a un archivo de extensión escogida por el mismo.
98
Figura 3.12. Parámetros de transformación bidimensional.
Fuente: Arcview Gis 3.3
b- Aplicación de parámetros para transformación bidimensional de coordenadas.
Para la aplicación de parámetros de transformación se debe seleccionar
“Transformación” “E1, N1 ---> E2, N2”
Si se acaba de realizar una estimación de parámetros horizontales, entonces
los parámetros de dicha estimación estarán ya ingresados en la pantalla
“Parámetros horizontales” (figura 3.13). Si se desea realizar una aplicación de
parámetros distinta sólo se deben sobrescribir dichos parámetros y punto de
origen. Hecho esto sólo basta con pulsar siguiente y elegir una tabla de datos
en formato .dbf que contenga los campos Punto, E1, N1. Luego de esto se
podrán exportar los resultados a un archivo de extensión escogida por el
usuario tal como se muestra en la figura 3.14 en donde E2CALCULAD y
N2CALCULAD representan las coordenadas calculadas, en base a los
parámetros antes estimados, para dos puntos de control dados.
99
Figura 3.13. Transformación bidimensional de coordenadas.
Fuente: Arcview Gis 3.3
Figura 3.14.Tabla de datos exportados.
Fuente: Microsoft Excel.
100
3.4.2 Automatización de parámetros verticales.
a- Estimación de parámetros verticales La estimación de parámetros verticales se encuentra en el ítem “estimación de
parámetros” ”parámetros verticales”, abriendo la ventana mostrada en la figura
3.15.
Figura 3.15. Estimación parámetros verticales Arcview.
Fuente: Arcview Gis 3.3.
Se encuentran programadas 4 tipos de regresiones aptas para:
• Zonas en general: Cualquier extensión de terreno que se requiera
estimar parámetros verticales.
• Línea de nivelación E-O: en el caso que se requiera estimar
parámetros verticales de líneas de nivelación orientadas Este- Oeste.
• Línea de nivelación N-S : en el caso que se requiera estimar
parámetros verticales de líneas de nivelación orientadas Norte- Sur
• Línea nivelación general: en el caso que se requiera estimar
parámetros verticales de líneas de nivelación sin orientación definida.
101
Luego de seleccionar cualquiera de las opciones y hacer clic en “siguiente”, se
muestra una caja de diálogo en donde, indistintamente del tipo de regresión
seleccionado, se requerirá el archivo en el que se encuentran los datos con los
cuales se quiera hacer la regresión. Estos datos deben estar formato .dbf y
tener datos como Punto, Este, Norte, altura elipsoidal y altura ortométrica
(Figura 3.16).
Figura 3.16. Caja de diálogo Estimación vertical.
Fuente: Arcview Gis 3.3.
Luego de dar “OK”, se busca y agrega el archivo con los datos requeridos. Al
realizar esta acción se despliega de inmediato, la siguiente ventana informativa:
Figura 3.17. Centroide automatizado, obtenido de datos insertados para realizar regresión.
Fuente: Arcview Gis 3.3.
102
En la figura 3.17, se tiene el centroide calculado automáticamente del archivo
de puntos que se acaba de insertar y que obedece a la explicación teórica y de
desarrollo, expuesta en secciones anteriores de esta memoria. Al hacer clic en
“OK” en el cuadro de diálogo del centroide calculado, Arcview preguntará si se
desea guardar la tabla creada con la transformación realizada, la que se debe
guardar con la misma extensión .dbf. Ésta luego de ser guardada, se abrirá
automáticamente junto con la página.
“http://www.wessa.net/rwasp_multipleregression.wasp”
Donde se encuentra Múltiple Regression - Free Statistics Software (Calculator).
b- Utilización de Multiple Regression - Free Statistics Software (Calculator).
Antes de explicar la utilización de este software libre, se debe entender que está
calculadora de regresión múltiple, entrega valores muy similares a los
realizados manualmente y expuestos en esta memoria.
A continuación se describirán los módulos de utilización de Multiple Regression
- Free Statistics Software (Calculator), combinado con la programación hecha
en Arcview GIS 3.3, para la estimación de parámetros verticales.
103
Figura 3.18. Módulos de utilización de Multiple Regression - Free Statistics Software (Calculator).
Fuente: Elaboración Propia
1- Send output to: se selecciona el formato de salida de los resultados de
la regresión.
2- Data X: se insertan los valores de los “deltas” que entrega la tabla que se
abre junto con la calculadora. Estos se encuentran separados por
104
columnas, incluyendo la variable a la que se le desea aplicar la regresión
(altura ortométrica), como muestra la siguiente figura:
Figura 3.19.Valores a insertar en calculadora.
Fuente: Elaboración Propia
En donde los parámetros encerrados, son los que se copian y pegan en el
módulo 2 de Multiple Regression - Free Statistics Software (Calculator).
3- Names of X columns: Se introduce el nombre de cada variable.
4- Sample Range: Rango de las observaciones.
5- Column Number of Endogenous: Número de la columna donde se
encuentra la variable que se le desea aplicar la regresión
6- Fixed Seasonal Effects: Efectos predeterminados en página.
7- Type of equation: Se selecciona el tipo de ecuación que desea aplicar.
105
8- Chart option: Resolución de gráficos.
Luego de verificar los 8 módulos, se procede a hacer clic en “Compute”, para la
obtención de los parámetros. La calculadora entrega las siguientes tablas de
resultados, resumidos en la figura 3.20:
Figura 3.20. Resultados entregados por Multiple Regression - Free Statistics Software (Calculator).
Fuente: Elaboración Propia
En donde:
1. Entrega la función de regresión múltiple general con los correspondientes
parámetros estimadores de cada variable.
106
2. Entrega los parámetros para cada variable, varianza residual para cada
parámetro y contraste de la t.
3. Coeficientes de determinación y correlación corregida, contraste de la F y
varianza residual del modelo.
Además de lo anterior, Multiple Regression - Free Statistics Software
(Calculator), entrega la validación de los mismos puntos que se utilizaron en el
modelo, mediante la siguiente tabla que se muestra en la figura 3.21:
Figura 3.21. Tabla de validación.
Fuente: Elaboración Propia
Como se menciono en el punto 1 de la figura 3.21, se pueden exportar los
resultados entregados por la página, a diferentes formatos, como planillas
Excel, en formato de textos, etc.
107
c- Aplicación de parámetros para transformación vertical.
Con los parámetros obtenidos de la página, se procede a la transformación
vertical. Ésta transformación es básicamente el traspaso de altura elipsoidal a
altura ortométrica, para esto, el único requerimiento es tener un archivo .dbf que
contenga datos como nombre del Punto, Este, Norte y altura elipsoidal.
Al igual que la transformación planimétrica, al acceder a la transformación
vertical (“Transformación” “E,N,helip E,N,Hortometrica”) se abre un cuadro
en donde se encuentran los parámetros de la última estimación vertical
realizada. En el caso que se haya realizado cualquier otra operación, se deberá
ingresar los datos del centroide de forma manual como se muestra en la figura
3.22 (primer recuadro segmentado)
Figura 3.22. Caja transformación vertical.
Fuente: Arcview Gis 3.3.
108
También en la figura 3.22, el segundo recuadro segmentado es donde se deben
copiar los parámetros entregados por Multiple Regression - Free Statistics
Software (Calculator), los que fueron mostrados en el punto 2 de la Figura 3.18.
Luego de aplicada la transformación, se procede a guardar la nueva tabla
creada, en donde básicamente es la misma que se inserto, pero ahora con una
nueva columna llamada Hort, que contiene el valor de la altura ortométrica a
través de parámetros estimados localmente (Figura 3.23)
Figura 3.23. Resultado transformación vertical en Arcview.
Fuente: Elaboración Propia
3.4.3 Datos desplegables a la vista.
Todas las aplicaciones antes mencionadas presentan la posibilidad de traer a la
vista los datos, utilizados para estimar parámetros, o calculados a través de
parámetros antes establecidos, siempre y cuando se encuentren bajo el
109
elipsoide de referencia WGS84 (o similar Ej. GRS80) y estén proyectados en
UTM Zona 19 sur. Las capas geográficas de Chile utilizadas fueron obtenidas
de la página Web.
“http://berlin.dis.ufro.cl/catalogo/c01fichas/c01av_utm.html”
Todas las coberturas fueron elaboradas sobre la base del Mapa digital del
Mundo (DCW, Digital Chart of the World), un proyecto realizado por la Empresa
ESRI (Environmental Systems Research Institute, Inc.) para la Agencia de
Cartografía de Defensa de los Estados Unidos (DMA, US Defence Mapping
Agency)
La cartografía del Mapa Digital del Mundo fue elaborada en el año 1993 a la
escala 1:1.000.000. Las coberturas de los límites exteriores y de las costas
continentales tienen su origen en el Mapa Digital del Mundo, tanto como las de
los Ríos, Esteros, Lagos, Salares y Quebradas. Todas las demás coberturas
fueron digitalizadas en el Laboratorio SIG de La Facultad de Ingeniería,
Ciencias y Administración de La Universidad de la Frontera (Temuco – Chile)
Si se ha aceptado la importación de archivos a la vista entonces se le
consultará donde se encuentra el archivo que contiene las coordenadas para
ser graficadas. Luego de elegir el archivo se desplegará en pantalla la ventana
“Add Event Theme” en donde se debe seleccionar la tabla antes importada y los
campos X e Y
110
Figura 3.23. Add Event Theme.
Fuente: Arcview Gis 3.3
Hechos los arreglos anteriores se desplegarán en la vista los puntos importados
y tabla de datos de estos.
Figura 3.23. Vista de puntos importados a las capas. Fuente: Arcview Gis 3.3.
111
CAPITULO IV – ANALISIS DE RESULTADOS.
4.1 ANTECEDENTES
En el desarrollo del modelo de regresión múltiple, visto en el capítulo 3, se
analizó la bondad de los modelos para la aplicación 1 y aplicación 2. Esto a
través de fundamentos estadísticos tales como: varianza residual, contrastes
individuales de la t, contraste conjunto de la F y coeficientes de determinación y
de correlación. En donde los resultados obtenidos se consideraron favorables.
Por lo que en este capítulo se contrastarán los resultados de los modelos de
regresión múltiple con los resultados obtenidos a través del software TGO.
Además se validarán los parámetros de los modelos con puntos de control
establecidos en la misma zona.
Debido a que la aplicación 1 es un área de estudio, mientras la aplicación 2 es
una línea de nivelación, se podrá realizar en la primera, un análisis nemotécnico
(o de más fácil apreciación por parte del lector) de la distribución espacial de los
residuos obtenidos por el ajuste local GPS TGO y del modelo de regresión
múltiple realizado.
4.2 ANÁLISIS APLICACIÓN 1: ZONA ESTUDIO REGIÓN METROPOLITANA. 4.2.1 Contraste residuos TGO y Modelo de regresión múltiple. Luego de haber desarrollado el modelo de regresión múltiple para la aplicación
1 y después de ajustar verticalmente los puntos con el software TGO, se obtuvo
el siguiente grafico de comparación de residuos:
112
-0.02
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
0.02
A B C D 1 6 7 8 9
Residuos modelo Residuos TGO
Gráfico 4.1. Comparación Residuos Modelo de regresión v/s Residuos TGO.
Fuente: Elaboración Propia
Del grafico 4.1 se concluye que en todos los puntos que se utilizaron para la
construcción, tanto del modelo aplicación 1 como para el plano TGO, los
residuos de aplicación 1 son mucho menores y tienden a 0. Además es
imprescindible analizar la magnitud de estos residuos (o discrepancias) y
compararlos con valores de tolerancia propuestos para un determinado
proyecto de ingeniería. Un buen estimador para esto es el que considera que la
tolerancia en la obtención de alturas a diferentes escalas es 1/8 de la
equidistancia entre curvas de nivel. Como muestra la siguiente tabla:
Tabla 4.1. Tolerancias altimétricas dependiendo de la escala.
Escala Plano Equidistancia(m) Tolerancia(m) 1:10000 10 1.250 1:5000 5 0.625 1:2000 2 0.250 1:1000 1 0.125 1:500 0.5 0.063
113
En base a las discrepancias obtenidas, tanto en el modelo de la aplicación 1
como el modelo TGO, y las tolerancias expuestas en la tabla 4.1 se concluye
que los dos ajustes son validos de ser utilizados en proyectos de ingeniería de
escalas menores a 1:500.
4.2.2 Validación parámetros de estimación Altura ortométrica aplicación 1. Los parámetros de estimación de altura ortométrica obtenidos en el modelo
aplicación 1 tienen validez dentro de la zona de estudio y se espera que los
valores que se extrapolen fuera de la zona no sean, en magnitud, tan
favorables.
Para comprobar lo anterior se establecieron 56 puntos de control, de estos 26
están ubicados fuera de la zona de estudio. Estos 56 puntos están distanciados
desde 1.2km hasta 11.5km desde el centro del área estudiada y se encuentran
distribuidos homogéneamente evitando así zonas sin información.
Aplicando el modelo los residuos oscilan entre 0m y 0.23m. Encontrándose los
mayores residuos en los puntos ubicados a más de 7km de la media, es decir,
los que se ubican fuera de la zona de estudio. De esta forma queda demostrado
que la aplicación de los parámetros fuera del perímetro de 7km entregará
discrepancias fuera de las tolerancias impuestas en 4.1.1
Además, con estos 56 puntos, se establecieron 8 subzonas (figura 26)
determinadas por la distancia al centro, en donde se comparó y determinó la
precisión del modelo obtenido, para la aplicación 1 versus el ajuste vertical el
software TGO.
114
Figura 4.1. Subzonas establecidas por distancia a su centro.
Fuente: Elaboración Propia
En la tabla 4.2 se muestran las precisiones y en donde se infiere que dentro de
la zona de 100 km2, el modelo de la aplicación 1 entrega mejores resultados, no
obstante en los resultados fuera de él, el software TGO se comporta de mejor
forma. Tabla 4.2. Precisiones modelo aplicación 1 v/s TGO, por subzonas.
Intervalo (m) RMS Modelo RMS TGO 0-1500 0,002 0,013
1501-3000 0,002 0,012 3001-4500 0,004 0,008 4501-6000 0,004 0,004 6001-7500 0,008 0,010 7501-9000 0,083 0,022 9001-10500 0,065 0,034 10501-12000 0,120 0,032
115
Figura 4.2. Distribución espacial de residuos aplicación 1 aplicada a los 56 puntos.
Fuente: Elaboración Propia
Figura 4.3. Distribución espacial de residuos TGO aplicada a los 56 puntos.
Fuente: Elaboración Propia
116
A continuación se mostrará en las figuras 4.4 y 4.5 la distribución espacial de
los residuos para el modelo aplicación 1 y para el plano TGO, respectivamente.
Figura 4.4. Distribución espacial de residuos en valor absoluto
de la aplicación 1, en los 100 km2 de la zona de estudio.
Fuente: Elaboración Propia
Figura 4.5. Distribución espacial de residuos en valor absoluto
del software TGO, en los 100 km2 de la zona de estudio.
Fuente: Elaboración Propia
117
4.2.3 Intervalos de confianza y de predicción. A la hora de interpolar un valor a través de un modelo de regresión múltiple es
necesario razonar que es lo que se busca, es así como nacen dos posibles
situaciones estimar o predecir.
Estimar la media de la distribución condicionada de txXY rr=/ . Esto es, se
quiere estimar el parámetro )/()( tt xXYExm rrr== y poder establecer cual es la
Altura ortométrica media de un punto de coordenadas Estei, Nortei, hi. Esta
estimación es entregada a través de un intervalo de confianza a un tanto por
ciento.
Predecir el valor de la variable respuesta en un individuo del que se conoce que
hxX rr= . Esto es, se quiere predecir un valor de la variable condicionada
hxXY rr=/ .Con lo que se quiere establecer cual es la altura ortométrica que se
predice para un punto de coordenadas Estei, Nortei, hi. Esta predicción es
entregada a través de un intervalo de predicción a un tanto por ciento. A
continuación se sacaron muestras de cada subzona, desarrollada en 4.1.2, de
manera de ver con que intervalo de confianza y predicción se esta comportando
el modelo. Para esto se tiene los siguientes valores de altura ortométrica para
cada punto de muestra:
Tabla 4.3. Altura ortométrica de puntos muéstrales.
Punto H 1.5kmE 631 3kmE 669
8(4.5KM) 700 6kmE 775
7.5kmN 702 9kmN 632
10.5kmS 589
12kmN 1060
118
En donde la estimación de la media de la distribución condicionada y la
predicción del valor de altura ortométrica, para cada muestra, viene dada en la
tabla 4.4 con su correspondiente varianza:
Tabla 4.4. Estimación y predicción para muestras.
Punto Xt = Xh yt SR med.
Cond.(m) SR
predi.(m)
1.5kmE (354980.146,6294733.2915,658.437) 631.000 0.002 0.005
3kmE (356035.1795,6294476.2539,696.522) 669.001 0.002 0.005
8(4.5KM) (356150.01,6292285.25,727.516) 700.002 0.002 0.005
6kmE (358352.4284,6297120.2144,802.74) 774.997 0.002 0.005
7.5kmN (356463.7346,6300349.7043,729.621) 702.003 0.003 0.005
9kmN (350675.1759,6302415.9201,659.195) 632.013 0.004 0.005
10.5kmS (346872.1471,6287438.4586,615.744) 589.009 0.004 0.005
12kmN (360987.9625,6302875.7012,1088.031) 1059.982 0.007 0.008
Obteniéndose así los siguientes intervalos de confianza con su correspondiente
amplitud (longitud):
Tabla 4.5.Intervalos de confianza e intervalos de predicción.
Punto Intervalo de confianza longitud intervalo de predicción longitud
1.5kmE 630.998 631.003 0.005 630.990 631.011 0.021
3kmE 668.998 669.003 0.005 668.990 669.011 0.021
8(4.5KM) 700.000 700.005 0.005 699.992 700.013 0.021
6kmE 774.994 775.000 0.006 774.986 775.008 0.022
7.5kmN 702.000 702.007 0.007 701.992 702.015 0.023
9kmN 632.005 632.020 0.014 631.997 632.028 0.030
10.5kmS 589.002 589.015 0.013 588.994 589.023 0.029
12kmN 1059.958 1060.006 0.048 1059.950 1060.014 0.064
119
4.3 ANÁLISIS APLICACIÓN 2: LÍNEA DE NIVELACIÓN CUESTA LO PRADO. 4.3.1 Contraste residuos TGO y Modelo de regresión múltiple. A continuación se procede a comparar los residuos entregados por el modelo
de regresión múltiple realizado para la aplicación 2 y el ajuste vertical hecho por
el software TGO (Gráfico 10).
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
GPS1 GPS2 GPS3 E 4 E 8 E 11 E 12 E 15 E 16 E 18 E 20 E 22 E 24
Residuos modelo Residuos TGO Gráfico 4.2. Comparación Residuos Modelo de regresión aplicación 2 v/s Residuos TGO.
Fuente: Elaboración Propia
En base al gráfico 4.2 se concluye que los residuos entregados por el modelo
de regresión múltiple realizado para la aplicación 2, correspondiente a la cuesta
Lo Prado, son mucho menores que los entregados por el ajuste vertical
realizado con el software TGO. Además, la varianza residual obtenida por el
modelo de regresión es menor a la obtenida por el software TGO. Sin embargo
ambos ajustes están dentro de las tolerancias altimétricas según lo explicado en
4.1.1.
120
4.3.2 Validación parámetros de estimación Altura ortométrica. Para realizar la validación de parámetros de alturas ortométrica obtenidas por
regresión múltiple en la línea de nivelación cuesta Lo Prado, se dispuso puntos
dentro y fuera de ella. En total son 13 puntos de control, como se aprecia en la
figura 4.6.
Figura 4.6. Puntos de control cuesta Lo Prado.
Fuente: Google Earth.
Aplicando el modelo realizado a los puntos de control, los residuos oscilan entre
0 y 0.013m. Como se muestra en la siguiente tabla:
121
Tabla 4.6. Puntos de control cuesta Lo Prado, aplicando modelo de regresión.
Hregre (m) H (m) residuos (m)
GPS5 182.514585 182.503 0.012
GPS6 190.397606 190.403 -0.005
GPS4 827.371495 827.358 0.013
E 3 565.503694 565.504 -0.001
E 5 707.608463 707.617 -0.008
E 6 737.943189 737.946 -0.003
E 7 742.284345 742.287 -0.003
E 13 348.847937 348.848 0.000
E 14 328.659257 328.660 -0.001
E 17 236.004492 236.003 0.001
E 19 206.823444 206.825 -0.002
E 21 197.335724 197.341 -0.006
E 23 186.156918 186.156 0.001
Los puntos GPS4, GPS5 Y GPS6, son los que tienen los residuos más grandes,
debido a que se encuentran fuera de de la línea de nivelación. El resto de los
puntos de control se encuentran dentro de la precisión lograda por el modelo
(0.008m).
122
CAPITULO V – CONCLUSIONES Y RECOMENDACIONES.
5.1 CONCLUSIONES.
Debido al cada vez más masivo uso del sistema de posicionamiento global y del
desarrollo de este en materia de precisión en la obtención de datos
planimétricos y altimétricos, se hace necesario y útil el aprovechamiento de esta
tecnología. En este tema y centrándonos en la obtención de altura ortométrica,
hasta que no se tenga un pleno conocimiento físico de la superficie terrestre, los
modelos matemáticos de interpolación, extrapolación y finalmente predicción
son los que posibilitan el uso de la tecnología GNNS en obras de ingeniería.
Según el principio de propagación de errores, la calidad final del proceso de
estimación y residuos resultantes estará limitado por la fuente de donde son
obtenidos los datos involucrados en el modelo. Para la aplicación 1 dependerá
directamente de la distribución uniforme, en cada punto, de la precisión del
modelo geoidal global EGM96, mientras que para la aplicación 2 depende del
método de obtención de desniveles, a través de mediciones trigonométricas,
utilizado.
Aplicados los dos modelos, Modelo de regresión múltiple y Ajuste vertical
software TGO, para la obtención de altura ortométrica, basado en los mismos
puntos, se tiene que:
• El objetivo principal de este trabajo de memoria está cumplido al ser
capaz de calcular la altura ortométrica de un punto del que se conocen
sus coordenadas planimétricas y su altura elipsoidal (posicionamiento
GPS) y que la precisión entregada es apta para aplicaciones
cartográficas a escalas menores a 1:500.
123
• Con respecto a los resultados obtenidos en “términos residuales” entre el
modelo de regresión múltiple y el software TGO, para puntos que se
encuentren dentro de la zona de estudio (o línea de nivelación) Se
verifica que serán más pequeños los que entregue el modelo de
regresión. Siendo ambos modelos factibles de ser mejorados a través de
una muestra mejor distribuida geográficamente así como también por la
incorporación de nuevos puntos.
• Fuera de la zona de estudio el modelo de regresión múltiple pierde cierto
grado de confianza (la magnitud de esta pérdida será directamente
explicada por el relieve de la zona) es por esto que se le recomienda al
lector, para datos extrapolados, la utilización de un modelo que minimice
esta pérdida en la precisión, como por ejemplo, el ajuste vertical
realizado por el software TGO.
• La precisión resultante para los parámetros son acordes con los residuos
obtenidos de las alturas ortométricas estimadas.
El modelo puede ser realizado indistintamente en cualquier proyección
cartográfica. Quedando propuesta la hipótesis de que al utilizar una proyección
con menor deformación, se obtengan mejores resultados.
Con respecto a la zona y línea de nivelación estudiada (Aplicación 1 y
Aplicación 2) cabe señalar que están situadas en zonas de alta variación de
relieve (Aplicación 1 en el piedemonte del valle de Santiago, mientras que la
aplicación 2 en una cuesta montañosa) también es necesario mencionar que en
estas dos aplicaciones se utilizaron una pequeña cantidad de datos de entrada
(en comparación con la zona o línea de nivelación a cubrir) con lo que, aunque
se distribuyó de la mejor forma los datos que se disponían, no se logró evitar
124
dejar zonas sin información. Todo lo anterior implica que los modelos
matemáticos fueron puestos a prueba bajo condiciones adversas, y explica los
resultados ya expuestos. Es así, como cabe esperar que en condiciones más
favorables, o de menor relieve, los modelos entreguen mejores resultados. Así
como también se lograría un resultado mas favorable, con la introducción de
mas datos de entrada, característica (desventaja por lo general) de los modelos
de regresión múltiple.
Con respecto al modelo matemático utilizado (regresión múltiple) cabe señalar,
o mejor dicho repetir y recalcar, que es un modelo altamente efectivo en la
mayoría de las situaciones, pero del cual se debe tener gran cuidado en sus
resultados y conclusiones. Esto se debe a que al ser un modelo que se adapta
a cada dato de entrada (no realiza un plano definido) ante la presencia de
errores presentes en los datos con que se construyó el modelo, este se
adaptará incluso a estos errores. Con lo que los resultados no serán los reales,
para evitar esto es indispensable realizar los estudios estadísticos señalados en
esta memoria. Así por ejemplo, si se realiza una revisión de los residuos
obtenidos se podrá concluir que datos pueden presentar errores y así ser
eliminados del modelo. Este tipo de modelo es susceptible de ser mejorado, al
introducir variables nuevas o de mayor orden.
Respecto a la estimación de parámetros, precisiones y resultados en general,
para los modelos de regresión múltiple (aplicación 1 y aplicación 2) Estos
fueron calculados y aplicados en hojas de cálculo de Microsoft Excel. Mientras
que para la automatización, de estos mismo cálculos, se hizo uso de la página
Web “www.wessa.net” (sección regresión múltiple) creada por el Profesor. Dr.
P. Wessa. Obteniéndose resultados semejantes. La aplicación efectiva de los
parámetros fue realizada en Arcview GIS 3.3 confirmando que las diferencias
125
en la altura ortométrica, calculada, de los puntos de control se mantienen en la
aplicación en órdenes similares.
Finalmente, dentro de este trabajo de título, el rol del Ingeniero Geomensor se
rige sobre dos grandes ítems que si bien se entrelazan son necesarios separar:
la componente práctica y la componente teórica.
• El segmento práctico es el que lleva a cabo la mayor parte del trabajo.
Este segmento toma al Ingeniero Geomensor como el experto en todo
tipo de medición, topográfica o geodésica, e interpretación de planos,
cartas y mapas. Es así como debe ir a la par con el desarrollo de las
nuevas tecnologías, conocer sus aplicaciones, y participar, directamente
o dando apoyo logístico, en todo el proceso de un proyecto de ingeniería.
Este proceso puede ser simplificado como: Planificación Ejecución
Análisis Producto final.
• La componente teórica del Ingeniero Geomensor, en especial del
perteneciente a la universidad de Santiago de Chile, le permite a este
profesional, ante un problema que exija una pronta solución, contar con
más de una técnica estándar de resolución, y en el caso que estas no
existiesen, idear técnicas alternativas, basadas en el conocimiento
científico adquirido en su etapa formativa.
De forma concreta, en este trabajo de título, el Ingeniero Geomensor debe
poseer un conocimiento, para la ejecución o interacción con otros profesionales,
en:
• Mediciones geodésicas y post-proceso de estas.
126
• Mediciones topográficas (nivelación geométrica o en su defecto
trigonométrica) y post-proceso de estas.
• Proyecciones cartográficas para la adecuada unificación de
mediciones geodésicas y topográficas.
• Ajustes, basados en la minimización de errores, para la obtención de
los datos finales provenientes de las mediciones hechas en terreno.
• Inferencia estadística, modelos alternativos, estudio probabilístico.
• Algún/os lenguaje/s de programación que sea/n capaz (capaces) de
automatizar y así abaratar los gastos en termino de cálculo
matemático que conlleven las técnicas alternativas elaboradas.
• En el caso de contar con más de una técnica de solución, el Ingeniero
Geomensor debe poder tomar una decisión, basado en, calidad,
rendimiento, tiempo y costos. En torno a lo anterior se presenta en la
sección de ANEXOS un estudio de tiempo y costos para una
campaña en cuesta Lo Prado.
5.2 RECOMENDACIONES.
Como en todo trabajo de ingeniería es preciso el reconocimiento del terreno
antes de establecer las posiciones de los puntos que entrarán en el modelo, de
modo de asegurar la distribución homogénea de datos, y en el caso de una
zona de gran relieve, evitar así zonas sin información.
127
Verificar la calidad de la muestra de datos con que se realizará el modelo ya
que la precisión esperada no será mejor que la de la muestra.
En el caso de una línea de nivelación se noto la mejoría del modelo al introducir
las variables distancia y distancia al cuadrado, ya que por fundamentos
estadísticos explicados en esta tesis, influyen en la obtención de altura
ortométrica.
En el caso de una línea de nivelación se recomienda verificar la orientación de
esta ya que dependiendo de lo anterior se tienen las siguientes situaciones:
• Si la línea presenta una dirección Norte-Sur la variable Este no será
necesario introducirla al modelo.
• Si la línea presenta una dirección Este-Oeste la variable Norte no será
necesario introducirla al modelo.
• Si no se da ninguno de los casos anteriores las dos variables son
significativas, y será necesario introducirlas al modelo.
128
ANEXOS. Estudio de tiempo y costos para una campaña en cuesta Lo Prado.
En esta sección se ha querido otorgar al lector una guía de los procedimientos
que se llevarían a cabo en una campaña en cuesta Lo Prado. Así fijado el
procedimiento se establece un estudio de tiempo y costos. Para este estudio se
recurrió a dos fuentes, la primera un Ingeniero Geomensor titulado de la
universidad de Concepción, el que se desempeña actualmente realizando este
tipo de trabajos (levantamientos geodésicos, taquimétricos, y nivelaciones); y la
segunda una empresa de arriendo de instrumental topográfico/geodésico para
así establecer el desglose debido a este ítem.
COTIZACION 1: Línea de de nivelación con apoyo de puntos GPS. Especificaciones de la ejecución del trabajo:
• La toma de los 13 puntos señalados en la fotografía aérea
monumentados y medidos con GPS Geodésico Topcon de doble
frecuencia, con lo cual se obtendrá coordenadas y altura elipsoidal de los
puntos.
• Se hará nivelación geométrica de los 13 puntos ocupando como
referencia algún punto de nivelación del IGM cercano al sector de
trabajo.
• La duración del trabajo en terreno será de 10 días y 2 días para la
confección de plano e informe.
129
• La presentación del trabajo se entregará en tres copias de planos a la
escala 1:2000 y con respaldo de los archivos digitales en Autocad 2004 y
2007.
• Se hará entrega de planillas en formato Excel donde estarán los
descriptores, coordenadas y alturas de los puntos tomados en la línea.
• Cada punto tendrá sus correspondientes monografías (coordenadas y
altura)
• Se dejarán a lo menos 6 PRS en terreno para efectos de inspección o
futuros Levantamientos y replanteos topográficos.
Honorarios: Los honorarios para la línea de nivelación con apoyo de puntos GPS, tiene un
costo de $1.850.000 más el 10% de impuesto.
COTIZACION 2: Línea de nivelación geométrica. Especificaciones de la ejecución del trabajo:
• La toma de los 13 puntos señalados en la fotografía aérea
monumentados y medidos con nivelación geométrica.
• Se hará nivelación geométrica de los 13 puntos ocupando como
referencia algún punto de nivelación del IGM cercano al sector de
trabajo.
130
• La duración del trabajo en terreno será de 7 días y 2 días para la
confección de plano e informe.
• Cada punto tendrá sus correspondientes monografías (coordenadas de
precisión de navegador GPS para su futura ubicación)
Honorarios:
Los honorarios para la línea de nivelación geométrica, tiene un costo de
$1.250.000 más el 10% de impuesto.
Presentación:
Expediente con la siguiente información:
• Informe topográfico.
• 3 copias de planos.
• CD que contiene archivos digitales de los planos, monografías e informe.
• Copia de patente municipal
Hasta el momento se dispone de dos cotizaciones, la primera indica el gasto en
el que debe incurrir el mandante, para así, establecer una pequeña cantidad de
puntos nivelados y geodésicamente ubicados. Este proceso debe ser realizado,
para que así, se disponga de datos de partida en la construcción del modelo
matemático que densificará futuros puntos. La segunda cotización indica el
coste en el que deberá incurrir el mandante en una futura densificación de
131
puntos (nivelación geométrica, replanteo trigonométrico a través de estación
total, posicionamiento GPS de baja precisión). Es preciso aclarar que se
realizará una comparación de costos y tiempo entre la densificación de futuros
puntos a través del modelo matemático versus una nivelación geométrica, esto,
debido a la información con que se dispone.
COTIZACION INSTRUMENTAL TOPOGRAFICO/GEODESICO.
Instrumental Marca / Modelo Valor Diario
Valor Semanal
Valor Quincenal
Valor Mensual
GPS GEODESICO
SIMPLE FRECUENCIA Incluye: 2 antenas colectoras, trípode, jalón o trípode, bases
nivelarte, cables de comunicación, software post proceso. Cheque
Garantía por 2.500.000 o en blanco
SPECTRA
PRECISIÓN EPOCH-10
$35.000
$180.000
$260.000
$380.000
GPS DOBLE FRECUENCIA
Incluye: 2 antenas colectoras, trípode, jalón o trípode, base
nivelantes, cables de comunicación, software post proceso.
Cheque Garantía por 8.000.000 o en blanco
TOPCON
CGD
$72.000
$390.000
$720.000
$1.400.000
Estación Total
Incluye: Cable comunicación, batería, cargador, trípode madera, jalón 4,7m, prisma, porta prisma
Documento en garantía por
2.500.000
Topcon GTS-212 Topcon GTS-229 Pentax PCS1215 Nikon DTM 332 Constructor 500 Constructo 600 Geodimiter 600 Trimble 3605 Trimble 605M Topcon 3007
$20.000 $20.000 $17.000 $18.000 $20.000 $20.000 $22.000 $22.000 $22.000 $22.000
$125.000 $125.000 $100.000 $115.000 $125.000 $125.000 $125.000 $135.000 $135.000 $135.000
$190.000 $190.000 $150.000 $165.000 $235.000 $235.000 $235.000 $260.000 $260.000 $260.000
$280.000 $280.000 $250.000 $260.000 $300.000 $300.000 $300.000 $350.000 $350.000 $350.000
NIVEL Automático Incluye
Trípode y mira
Documento en garantía por 250.000
NEDO N-24 NEDO X-24
BERGER N-24 PENTAX AL-320
$3.500 $3.500 $3.500 $4.000
$18.000 $18.000 $18.000 $20.000
$26.000 $26.000 $26.000 $30.000
$35.000 $35.000 $35.500 $42.000
132
Si se restan los honorarios de la cotización 1 con los de la cotización 2 se
obtendrán $600.000 que corresponde al valor que se esta cobrando en un
levantamiento geodésico realizado en tres días. Ahora si al resultado anterior se
le resta el costo debido al arriendo del instrumental necesario ($216.000 por los
tres días) se ontendrán $384.000 que corresponderá al costo explicado por
transporte, alarife/s, otros. Con estos datos es posible construir una nueva
cotización para la densificación de puntos.
COTIZACION 3: Densificación GPS y aplicación modelo matemático para la obtención de altura ortométrica. Especificaciones de la ejecución del trabajo:
• Toma de puntos señalados, monumentados y medidos con GPS
Geodésico de doble frecuencia, con lo cual se obtendrá coordenadas y
altura elipsoidal de los puntos.
• Se aplicará modelo matemático, construido con datos entregados por el
mandante, para conocer la altura ortométrica de los puntos densificados.
• La duración del trabajo en terreno será de 3 días y 2 días para la
confección de plano e informe.
• La presentación del trabajo se entregará en tres copias de planos a la
escala 1:2000 y con respaldo de los archivos digitales en Autocad 2004 y
2007.
• Se hará entrega de planillas en formato Excel donde estarán los
descriptores, coordenadas y alturas de los puntos tomados en terreno.
133
• Cada punto tendrá sus correspondientes monografías (coordenadas y
altura)
Honorarios: Los honorarios para la densificación GPS y aplicación modelo matemático para
la obtención de altura ortométrica, tiene un costo de $850.000 más el 10% de
impuesto.
Presentación:
Expediente con la siguiente información:
• Informe geodésico.
• 3 copias de planos.
• CD que contiene archivos digitales de los planos, monografías e informe.
134
Anexo: Distribución de la 2א. Fuente: E.S. Pearson, Tables of the Percentage Points of 2א the Distribution, Biometrika, vol.32
135
Anexo: Distribución de la t-student Fuente: E.S. Pearson, Critical values of Student's t Distribution, Biometrika, vol. 32
136
Anexo: Distribución de la F (parte1) Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol.32
137
Anexo: Distribución de la F (parte2) Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol32.
138
Anexo: Distribución de la F (parte3) Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol2.
139
BIBLIOGRAFIA. - Gunter Seeber, 2003, Satellite Geodesy, Walter de Gruyter, Berlin-New York
2003
- Zepeda Rene, 2004, Geodesia Satelital.
- Memoria de título, 2003, “Estudio y aplicación de modelos geoidales como
marco de referencia vertical para Chile” Garafulic Caviedes, Pedro Andrés.
- Manual de Carreteras VOL. II, 2001, Dirección de Vialidad, Ministerio de Obras
Publicas, Chile.
- LEN Y ASOCIADOS Ingenieros Consultores, H. Lange y R. Zepeda, Manual
de procedimiento para mejorar la precisión en las determinaciones altimétricas
mediante GPS en Chile usando un modelo Geoidal.
- Zakatov, P. S. Curso de Geodesia Superior, Editorial Rubiños 1860 S.A.
- Peter Vanícek, Marcelo Santos, Robert Tenzer, Antonio Hernández Navarro,
Algunos Aspectos Sobre Alturas Ortométricas y Normales
- Ignacio alonso Fernández-coppel, Las coordenadas geográficas y la
proyección UTM. El Datum, Universidad de Valladolid.
- Richard L. Burden y J.Douglas Faires, Análisis Numérico, Editorial Thomson
Learning Séptima Edición.
- Donald J. Koosis, Elementos de inferencia estadística, Editorial Limusa.
140
- Sistemas Geodésicos. Comité Nacional de la Unión Geodésica y Geofísica
Internacional .1era edición 1999.
- Technical report nº12 (“http://www.iers.org”)
- Publicaciones SIRGAS (http://www.sirgas.org)
-Documentos y revistas, departamento de matemáticas, Universidad de
Cataluña, (“http://dm.udc.es/mate/”)
- Alejandro Vasallo y Juan M. Vilar Fernández, 2006, Bancos y Cajas de
Ahorro: modelización del margen de beneficio por regresión múltiple. Análisis
comparativo ,
-Memoria de título, Universidad Técnica Metropolitana, 2006, “Diagnóstico del
uso de proyecciones transversales de Mercator en escalas urbanas” Sebastian
Fuentes.
-Memoria de título, Universidad de Santiago de Chile, 2003, “Evaluación de la
aplicación de un huso TM para chile continental, aplicable a cartografía del
ministerio de bienes nacionales” Fernando Millar.
-Memoria de título, Universidad de Santiago de Chile, 2003, “Estimación de los
parámetros de transformación entre los sistema de referencia WGS-84 y PSAD-
56 para una zona de Calama” Marcela Ramírez, Diego Ortiz.
- Memoria de título, Universidad de Santiago de Chile, 2003, “Metodología y
desarrollo para la georreferenciación de un proyecto vial cuesta Lo Prado”
María José Herrera, José Salas.