modelo matematico altura ortom__tesis

UNIVERSIDAD DE SANTIAGO DE CHILE FACULTAD DE INGENIERIA

DEPARTAMENTO DE INGENIERIA GEOGRAFICA

MODELO MATEMATICO LOCAL PARA LA ESTIMACION DE COTA ORTOMETRICA

ELEAZAR QUIÑIMIL VASQUEZ

MAURICIO JAVIER ABUSLEME OJEDA 2008

UNIVERSIDAD DE SANTIAGO DE CHILE FACULTAD DE INGENIERIA

DEPARTAMENTO DE INGENIERIA GEOGRAFICA

MODELO MATEMATICO LOCAL PARA LA ESTIMACION DE COTA ORTOMETRICA

“TRABAJO DE TITULACION PRESENTADO EN

CONFORMIDAD A LOS REQUISITOS PARA OBTENER EL TITULO DE INGENIERO DE EJECUCION EN GEOMENSURA”

Profesor Guía: Héctor Patricio Contreras Ávila

ELEAZAR QUIÑIMIL VASQUEZ MAURICIO JAVIER ABUSLEME OJEDA

2008

AGRADECIMIENTOS.

Si me pongo a pensar en este proceso de 4 años, siento que he tenido que

superar varias dificultades, que sin la ayuda de Dios y de ciertos íconos de mi

vida, hubiera sido imposible de lograr. Gracias a mi hermano Aurelio, por confiar

en mi, por tener la visión necesaria, para darme la oportunidad que yo llegue

lejos. A mi madre, por el apoyo incondicional, porque nunca me falto nada, por

inculcarme tu espíritu de lucha y porque eres mi ejemplo a seguir. A mi

hermano César y su familia, que aunque estén lejos siempre estuvieron

dándome apoyo.

Agradezco a todos mis amigos que me acompañaron en este proceso, ellos

saben personalmente lo mucho que los quiero y que nunca olvidare todo lo que

pasamos juntos. A mi compañero de tesis, por apoyarme siempre y por dar todo

para sacar la tesis adelante. A ti por simplemente estar ahí y hacerme feliz. A

todos los profesores que me acompañaron en este proceso...

En fin, a todos ellos y a los que se sientan identificados con la causa......gracias.

Mauricio Abusleme.

Siempre se cometen injusticias en los agradecimientos,

pues la “memoria” es a menudo traicionera.

Agradezco en primer lugar a Blanca Vásquez (tía Olga), que me trajo al mundo

y que nos hemos acompañado y amado por tanto tiempo, en el mismo orden

agradezco a mi hermana Doris la “Quiñimil” que me va quedando, y que aunque

hemos pasado malos momentos se que estará en las buenas y las malas por

siempre. Con todo lo anterior agradezco a mi pequeña, pero amada familia, y

mientras todo esto pasa doy un vistazo al cielo, porque si veo a mi padre

orgulloso entonces entiendo que las cosas van bien.

Agradezco a cada uno, a cada dos, y cada todos los que han estado presentes

durante este trabajo de titulación, esta etapa, y como no toda mi vida (en

especial a ti que te has interesado, y me has acompañado este tiempo).

Hablando netamente de nuestro trabajo de titulación, agradezco al profesor

Héctor Contreras que nos acompañó tantos viernes en la tarde y que nos ayudó

en todo momento. En este sentido quiero dar un merecido gracias y un enorme

abrazo a ti Mauricio (Busleme) sin tu persona esto no hubiera sido lo mismo,

discutimos, reímos, nos cansamos, nos frustramos, nos ayudamos, y nos

conocimos un poco más. Gracias también a tu familia que siempre se preocupo

en todo sentido. Fue un agrado trabajar con un amigo, no nos sacamos los ojos,

si tuvimos diferencias, pero el trabajo esta hecho, y muy bien hecho.

Eleazar Quiñimil Vásquez

RESUMEN. La utilización del sistema de posicionamiento global (GPS) es cada vez más

frecuente y necesaria. Esto, debido en gran parte, a sus resultados rápidos y

precisos. Pero, pese a todas sus ventajas, en ingeniería esta tecnología es

utilizada a nivel planimétrico. Dejando muchas veces la componente altimétrica,

entregada por el receptor, de lado y sin utilización alguna.

Esta memoria estudia un método matemático que sea capaz de estimar altura

ortométrica, aprovechando la precisión de la altura elipsoidal que entrega el

receptor GPS. Para esto se realizaron modelos de regresión múltiple en dos

aplicaciones. La primera en una zona de la Región Metropolitana, y la segunda

en una línea de nivelación en la cuesta Lo Prado. Se compara ambos modelos

con la calibración vertical realizada por el software Trimble Geomatics Office

(TGO) de donde se concluyó que, dentro de una zona o línea de nivelación

estudiada, el modelo de regresión múltiple entrega mejores resultados que el

software TGO.

Finalmente se realizó, en el software Arcview GIS, una automatización para el

cálculo de los modelos, esperando que a futuro los software comerciales

integren este tipo de aplicaciones, para así, aumentar las precisiones, y reducir

costos y tiempo en los trabajos de ingeniería. Queda invitado el lector a

profundizar en las herramientas que entrega la ciencia en pro de la solución de

problemas atingentes a la rama de Geomensura, siendo esta memoria solo un

paso en este constante aprendizaje.

Palabras clave

■ Inferencia Estadística. ■ Regresión múltiple.

■ Altimetría. ■ Arcview.

ABSTRACT.

The use of Global Positioning System (GPS) is becoming more frequent and

necessary. This is due largely, to its quick and precise results. But in spite of all

its advantages, this technology is used at a planimetric level in engineering,

leaving the altimetric component, given by the receiver, without any use.

This thesis studies a mathematical method capable of estimating orthometric

height, taking advantage of the precision of the ellipsoid height given by a GPS

receiver. To achieve this, multiple regression models were made in two

applications. The first one is placed in an area of the Region Metropolitana, and

the second one in a leveling line in Cuesta Lo Prado. Comparing both models

with the vertical calibration made by Trimble Geomatics Office (TGO) software.

Where, it concluded, that within a studied area or leveled line, the multiple

regression model gives better results than the TGO software.

Finally, an automation to calculate the models in ArcView GIS software was

made. Hoping that future commercial software integrate this type of applications.

Then, it will be possible to increase precisions, and reduce costs and time in

engineering works. The reader is invited to go deeper on the tools given by

science in favour of the solution of problems related to Surveying. This thesis is

only a step in this constant learning.

Key words:

• Statistical Inference

• Altimetry

• Multiple Regression

• Arcview

INDICE GENERAL.

CAPITULO I – INTRODUCCION. 1.1 Antecedentes. 1

1.2 Estado actual del problema. 1

1.3 Hipótesis. 3

1.4 Objetivos. 3

1.4.1 Objetivo general. 3

1.4.2 Objetivos específicos. 3

1.5 Metodología de trabajo. 4

CAPITULO II – CONCEPTOS Y METODOLOGIA DE TRABAJO. 2.1 Introducción. 6

2.2 Conceptos previos geodésicos. 6

2.2.1 El elipsoide. 7

2.2.2 El geoide. 8

2.2.3 Datum geodésico. 9

2.2.4 Altura elipsoidal. 10

2.2.5 Altura ortométrica. 10

2.3 Sistemas de coordenadas. 11

2.3.1 Coordenadas cartesianas. 11

2.3.2 Coordenadas geodésicas. 12

2.3.3 Relación matemática entre coordenadas cartesianas y

Geodésicas. 13

2.4 Sistemas de referencia geodésicos. 14

2.4.1 Sistemas locales de referencia. 15

2.4.2 Sistemas globales de referencia. 16

2.4.3 International Terrestrial Reference Frame (ITRF) 16

2.4.4 Sistema WGS-84. 18

2.4.5 Sistema de referencia para las Américas (SIRGAS) 19

2.5 Sistema de posicionamiento global (GPS) 20

2.5.1 Señal GPS. 21

2.5.2 Fuentes de error GPS. 22

2.6 Transformación bidimensional de coordenadas. 23

2.6.1 Tipos de transformaciones bidimensionales. 23

2.6.2 Modelo de ajuste. 26

2.6.3 Precisión del método de ajuste. 29

2.7 Inferencia estadística. 31

2.7.1 Introducción. 31

2.7.2 Conceptos básicos de inferencia estadística. 32

2.7.3 Regresión Múltiple. 35

2.7.4 Estimación de los parámetros del modelo. 37

2.7.5 Propiedades de los estimadores. 39

2.7.6 Análisis de la varianza. 44

2.7.7 Correlación. 49

CAPITULO III – DESARROLLO. 3.1 Introducción. 53

3.2 Aplicacion1: Uso de regresión múltiple en una zona de la Región

Metropolitana. 54

3.2.1 Obtención de los coeficientes del modelo. 56

3.2.2 Intervalos de confianza. 58

3.2.3 Contrastes individuales de la t para los coeficientes del

Modelo de regresión. 60

3.2.4 Tabla ANOVA (contraste conjunto de la F) 63

3.2.5 Coeficientes de determinación y de correlación del

Conjunto. 64

3.2.6 Coeficientes de determinación y correlación

Individuales. 65

3.2.7 Aplicación del Modelo. 66

3.2.8 Calibración Local GPS de la zona de estudio Región

Metropolitana con Software Trimble Geomatics

Office (TGO) 73

3.3 Aplicación 2: Línea de nivelación Cuesta lo Prado. 76

3.3.1 Introducción. 76

3.3.2 Calculo y ajuste de Alturas ortométricas Cuesta

lo Prado. 78

3.3.3 Ajuste de los desniveles a través de modelo de ecuaciones

de condición. 83

3.3.4 Aplicación 2: Uso de regresión múltiple en la línea de

Nivelación Cuesta lo prado. 88

3.3.5 Aplicación de ajuste TGO a la línea de nivelación cuesta lo

Prado. 96

3.4 Automatización en software Arcview Gis 3.3 97

3.4.1 Automatización coordenadas planimétricas. 97

3.4.2 Automatización de parámetros verticales. 100

3.4.3 Datos desplegables a la vista. 108

CAPITULO IV – ANALISIS DE RESULTADOS. 4.1 Antecedentes. 111

4.2 Análisis aplicación 1: Zona estudio Región Metropolitana. 111

4.2.1 Contraste residuos TGO y Modelo de regresión múltiple. 111

4.2.2 Validación parámetros de estimación Altura ortométrica

aplicación 1. 113

4.2.3 Intervalos de confianza y de predicción. 117

4.3 Análisis aplicación 2: Línea de nivelación cuesta lo Prado. 119

4.3.1 Contraste residuos TGO y Modelo de regresión múltiple 119

4.3.2 Validación parámetros de estimación Altura ortométrica. 120

CAPITULO V – CONCLUSIONES Y RECOMENDACIONES. 5.1 Conclusiones. 122

5.2 Recomendaciones. 126

ANEXOS. 128

BIBLIOGRAFIA. 139

INDICE DE FIGURAS. 2.1 El Elipsoide 7

2.2 Relación Elipsoide-geoide 8

2.3 Altura Ortométrica 10

2.4 Relación Geométrica entre coordenadas cartesianas y geodésicas 13

2.5 Estaciones ITRF2005 17

2.6. Movimiento de las placas terrestres obtenido por

ITRF2005 (1 cm/año) 18

2.7. Parámetros WGS 84 19

2.8. Representación grafica de ejes XY girados, trasladados y escalados 25

3.1. Relación entre variables 53

3.2. Puntos dispuestos geográficamente aplicación 1 55

3.3. Propiedades del proyecto en software TGO 73

3.4. Datos importados TGO (aplicación 1) 74

3.5. Calibración local vertical TGO 75

3.6. Trimble R8 y Leica serie TPS400 78

3.7. Corrección a la línea 79

3.8. Calculo de distancias horizontales 79

3.9. Mediciones reciprocas y simultaneas 77

3.10. Pasos ajuste por mínimos cuadrados 84

3.11. Disposición geográfica de puntos cuesta lo prado 89

3.12. Parámetros de transformación bidimensional 98

3.13. Transformación bidimensional de coordenadas 99

3.14. Tabla de datos exportados 99

3.15. Estimación parámetros verticales Arcview 100

3.16. Caja de dialogo estimación vertical 101

3.17. Centroide automatizado, obtenido de datos insertados para realizar

Regresión 101

3.18. Módulos de utilización de Multiple Regression - Free

Statistics Software (Calculator) 103

3.19. Valores a insertar en calculadora 104

3.20. Resultados entregados por Multiple Regression - Free Statistics

Software (Calculador) 105

3.21. Tabla de validación 106

3.22. Caja transformación vertical 107

3.23. Resultado transformación vertical en arcview 108

3.24. Add Event Theme 110

3.25. Vista de puntos importados a las capas 110

4.1. Subzonas establecidas por distancia a su centro 114

4.2. Distribución espacial de residuos aplicación 1 aplicada

a los 56 puntos 115

4.3. Distribución espacial de residuos TGO aplicada a los 56 puntos 115

4.4. Distribución espacial de residuos en valor absoluto

de la aplicación 1, en los 100 km2 de la zona de estudio 116

4.5. Distribución espacial de residuos en valor absoluto del software

TGO, en los 100 km2 de la zona de estudio 116

4.6. Puntos de control cuesta lo prado 120

INDICE DE TABLAS.

2.1. Parámetros PSAD56, SAD69 e Hito XVIII 16

2.2. Tabla ANOVA del modelo de regresión múltiple 45

3.1. Puntos del Set de datos a utilizar aplicación 1 54

3.2. Coordenadas Centroide aplicación 1 55

3.3. Tabla ANOVA del contraste conjunto de la F(aplicación 1) 63

3.4. Tabla ANOVA de variable “Este” respecto variable

“Altura ortometrica” 65

3.5. Coeficientes de correlación y determinación individuales 66

3.6. Alturas Ortometricas obtenidas con regresión múltiple 66

3.7. Residuos simples, estandarizados y estudentizados Aplicación 1 69

3.8. Parámetros de Ajuste Vertical TGO (Aplicación 1) 75

3.9. Resumen errores TGO (Aplicación 1) 75

3.10. Alturas ortométricas entregadas por TGO (Aplicación 1) 76

3.11. Resultados poligonal 1 82

3.12. Resultados poligonal 2 83

3.13. Resultados alturas ortométricas ajustadas, poligonal 1 87

3.14. Resultados alturas ortométricas ajustadas, poligonal 2 88

3.15. Puntos para confección modelo regresión múltiple cuesta lo prado 89

3.16. Parámetros modelo regresión múltiple Cuesta Lo Prado 90

3.17. Contraste conjunto de la F cuesta lo prado 91

3.18. Residuos simples, estandarizados y estudentizados,

cuesta lo prado 91

3.19. Parámetros y centroide modelo, nueva regresión múltiple

5 parámetros 93

3.20. Tabla ANOVA nueva regresión múltiple 5 parámetros 94

3.21. Residuos simples, estandarizados y estudentizados, modificación

modelo cuesta lo prado 94

3.22. Parámetros ajuste vertical TGO cuesta lo prado 96

3.23. Alturas ortométricas entregadas por TGO, cuesta lo prado 96

4.1. Tolerancias altimétricas dependiendo de la escala 112

4.2. Precisiones modelo aplicación 1 v/s TGO, por subzonas 114

4.3. Altura ortométrica de puntos muéstrales 117

4.4. Estimación y predicción para muestras 118

4.5. Intervalos de confianza e intervalos de predicción 118

4.6. Puntos de control cuesta lo prado, aplicando modelo de regresión 121

INDICE DE GRAFICOS.

3.1. Histograma de residuos (Aplicación 1) 70

3.2. Probabilístico de normalidad (p-p y q-q) y simetría 70

3.3. Residuos estandarizados v/s Predicciones (aplicación 1) 72

3.4. Predicciones v/s Variable respuesta (aplicación 1) 72

3.5. Predicciones v/s Variable respuesta cuesta lo prado 92

3.6. Residuos estandarizados v/s Predicciones cuesta lo prado 92

3.7. Predicciones v/s Variable respuesta, modificación modelo

cuesta lo prado 95

3.8. Residuos estandarizados v/s Predicciones, modificación

modelo cuesta lo prado 95

4.1. Comparación Residuos Modelo de regresión v/s Residuos

TGO (aplicación 1) 112

4.2. Comparación Residuos Modelo de regresión aplicación 2

v/s Residuos TGO 119

1

CAPITULO I – INTRODUCCION 1.1 ANTECEDENTES.

Como se sabe actualmente, el Sistema de Posicionamiento Global (GPS) nos

entrega alturas referidas a un elipsoide de referencia y no al geoide, siendo este

último el utilizado como datum vertical actualmente en América Latina.

Ahora, la altura geodésica “h”, obtenida desde los receptores GPS es altamente

precisa, aunque no todavía con una utilización practica en ingeniería. Por esto,

es de interés utilizar esta altura geodésica y transformarla a una altura

ortométrica, la cual sí se utiliza para referenciar todo tipo de proyectos

ingenieriles. Hoy en día existen formas de llevar a cabo este traspaso de

alturas, tanto por modelos geoidales o por la utilización de programas

computacionales que calibren mediciones GPS. Lo que hace que el usuario

pueda conocer la altura ortométrica de un lugar, sólo con mediciones GPS, pero

que generalmente es de una baja precisión.

En estos casos es necesario, para la obtención de una altura ortométrica

precisa, llevar hasta el lugar una línea de nivelación geométrica, la que suele

ser costosa y consumidora de tiempo.

1.2 ESTADO ACTUAL DEL PROBLEMA. En Chile, la obtención de altura ortométrica a partir de GPS se realiza de dos

maneras. Por normativa descrita en el manual de carreteras Volumen II, y por

programas computacionales que calibren mediciones GPS.

2

Según la normativa descrita en el manual de carreteras Volumen II, en la

sección 2.312 Transporte de coordenadas mediante GPS, capítulo 2.312.6

Altimetría, señala que se pueden adoptar diversos criterios para realizar la

reducción al geoide:

• Aceptar que el área del levantamiento es suficientemente pequeña,

considerando el geoide plano o paralelo al elipsoide, omitiendo la

ondulación del geoide(N) en extensiones que varían entre 0 y 3

kilómetros. Se debe determinar el valor de N de al menos uno de los

puntos GPS, comparando la altura nivelada de dicho punto y aplicando

esa corrección a todos los demás puntos GPS del área.

• Aceptar que el geoide es plano y no paralelo al elipsoide. Este caso es

más preciso que lo anterior y se puede determinar con la utilización de

un mínimo de 3 puntos GPS con altura ortométrica conocida en la

periferia del área considerada. Las diferencias entre las alturas referidas

al elipsoide y ortométricas en esos puntos determinan un plano

considerado como un geoide local plano. Las reducciones a ese plano se

aplican proporcionalmente de acuerdo a la posición de cada punto GPS

restante.

• Uso directo del modelo geoidal global EGM 96, en donde para cada

punto tomado con GPS, se extrae la ondulación geoidal (N).

• Determinación de un geoide local. Igualmente como en el caso del

segundo criterio, pero con un mayor número de puntos GPS

uniformemente distribuidos con altura elipsoidal y ortométrica conocida.

En este caso se genera una superficie tridimensional que refleje más

fielmente el comportamiento del geoide en la zona levantada.

3

Con respecto a la utilización de programas computacionales, estos lo que

hacen, en simples palabras, es ajustar un conjunto de mediciones GPS a través

de puntos de altura ortométrica conocida, a un plano de referencia.

1.3 HIPOTESIS. Se puede realizar un modelo matemático local que logre determinar altura

ortométrica, en la zona analizada, sin la necesidad de ejecutar una nueva

nivelación para ello, obteniendo resultados más precisos que los métodos

actuales utilizados en Chile.

1.4 OBJETIVOS 1.4.1 OBJETIVO GENERAL.

Lograr un modelo matemático local que reduzca, en tiempo y dinero, la

densificación de puntos en una zona específica, obteniendo así alturas

ortométricas precisas, sin necesidad de medir nuevos puntos.

1.4.2 OBJETIVOS ESPECIFICOS.

• Automatizar la transformación de coordenadas planimétricas locales a

distintas proyecciones (o viceversa) a través de una transformación

bidimensional de semejanza.

• Automatizar, y/o dar a conocer una forma de automatizar, el calculo de

un modelo matemático de regresión múltiple para la obtención de altura

ortométrica.

4

• Ambientar en una plataforma SIG la transformación planimétrica y de

altura ortométrica con parámetros ya conocidos.

1.5 METODOLOGIA DE TRABAJO

Para llevar a cabo los objetivos es necesario realizar una descripción de los

procedimientos escogidos, con el fin de cumplir la verificación de la hipótesis, la

metodología escogida para este proyecto cuenta con:

• Recopilación de material y antecedentes relacionados con el tema.

• Definición de forma clara y precisa de la hipótesis.

• Definición de objetivos generales y específicos, los cuales deben

enmarcarse dentro de los límites del tema.

• Planificación y recopilación de datos de una zona de la Región

Metropolitana.

• Planificación y recopilación de datos tomados en la tesis “Metodología y

desarrollo para la georreferenciación de un proyecto vial cuesta Lo

Prado” María José Herrera, José Salas.

• Ordenamiento y obtención de alturas ortométricas para las dos

aplicaciones.

• Realización de los modelos, a través de regresión múltiple, para la

estimación de altura ortométrica.

5

• Contraste de resultados obtenidos a través de regresión múltiple, para

las dos aplicaciones, con los resultados entregados por el software de

procesamiento GPS Trimble Geomatics Office.

• Aplicación de los modelos obtenidos para la estimación de altura

ortométrica. Entregando su precisión en las distintas zona de estudio.

• Automatización del cálculo de transformación bidimensional, de

coordenadas planimétricas, a través de lenguaje de programación

Avenue.

• Automatización del cálculo de alturas ortométrica, con parámetros de

regresión múltiple conocidos, a través de lenguaje de programación

Avenue.

• Integración de capas geográficas de Chile, y cálculos automatizados en

plataforma Arcview GIS 3.3

• Análisis y Conclusiones.

6

CAPITULO II: CONCEPTOS Y METODOLOGIA DE TRABAJO. 2.1 INTRODUCCIÓN. La geodesia estudia la forma, dimensiones y campo gravitatorio de la tierra en

territorios extensos. Como se sabe, esta es su principal diferencia con la

topografía, la cual basa sus trabajos en superficies de extensión reducida en las

cuales se puede considerar despreciable la esfericidad terrestre. En esencia, la

Geodesia comienza sus trabajos allí donde termina la topografía. De todas

formas, no debe considerarse el estudio de estas ciencias por separado, pues

están íntimamente relacionadas, de tal manera que la topografía necesitará

apoyarse en la geodesia para una gran cantidad de aplicaciones prácticas.

En este trabajo se aplicarán conceptos de la geodesia física, que según P.S

Zakatov en su libro Curso de Geodesia Superior, la define como “la parte de la

geodesia superior que analiza los métodos de estudio de la figura de la tierra

como cuerpo físico y geométrico en base a las leyes de la mecánica y a datos

experimentales, o sea, como resultado de las mediciones geodésicas,

gravimétricas y astronómicas” y conceptos de la geodesia matemática que

formula los métodos y las técnicas para la construcción y el calculo de las redes

de coordenadas de referencia.

2.2 CONCEPTOS PREVIOS GEODÉSICOS. A continuación se definirán conceptos para el buen entendimiento de este

trabajo, tanto en las áreas de la geodesia física, como la geodesia matemática.

7

2.2.1 El elipsoide. Como se sabe la tierra no es redonda, y su figura se asemeja a una esfera

achatada en los polos, no existiendo una figura geométrica que la represente a

cabalidad, debido fundamentalmente a las irregularidades existentes. Estas

irregularidades de la tierra son detectables y no extrapolables a todos los

puntos simétricos de la tierra, ya que no existe un único modelo matemático que

represente toda la superficie terrestre, debido a que cada continente, nación o

país, emplea un modelo matemático distinto de forma que se adapte mejor a la

forma de la tierra en la zona a cartografiar. (Ignacio Alonso Fernández-Coppel, El datum)

Esta representación matemática se le denomina Elipsoide, que es un sólido

generado por la rotación de una elipse sobre su eje menor (Figura2.1). Está

definida por los siguientes parámetros: Semieje mayor(a), Semieje menor (b),

achatamiento (ƒ) y la primera y segunda excentricidad ( e y e’ respectivamente)

y las relaciones entre ellos son las siguientes:

ƒ a

ba −=

abae

22 +=

bbae

22

' +=

Figura 2.1 El Elipsoide.

Fuente: “La tierra”, por Dagoberto Salazar. http://nacc.upc.es/tierra/node25.html

8

2.2.2 El geoide. Se define al geoide como la superficie teórica de la tierra que une todos los

puntos que presenten igual potencial de gravedad. La forma así creada supone

la continuación por debajo de la superficie de los continentes, de la superficie

de los océanos en calma y mares suponiendo la ausencia de mareas, además

de la ausencia de perturbaciones exteriores (atracción de la luna y las

interacciones de todo el sistema solar), siendo así coincidente con el Nivel

medio del mar (NMM). Lejos de lo que se podría imaginar, esta superficie no es

uniforme, sino que presenta una serie de irregularidades, causadas por la

distinta composición mineral del interior de la tierra y de sus distintas

densidades, lo que implica que para cada punto de la superficie terrestre exista

una distancia distinta desde el centro de la tierra al punto del geoide. (Ignacio Alonso

Fernández-Coppel, El datum)

El geoide se extiende por los continentes sin interrupciones, sin embargo se

hundirá por debajo del elipsoide debido a la deficiencia de masa (océanos), por

otro lado , donde existan concentraciones de masa el geoide se levantará sobre

el elipsoide. A esta separación entre elipsoide y geoide se llama ondulación

geoidal (N) como se muestra en la figura 2.2.

Figura 2.2 Relación Elipsoide-geoide.

Fuente: “El geoide para el área mexicana y sus aplicaciones” por David Ávalos Naranjo.

9

Pero se debe tener cuidado de no confundir al geoide con el nivel medio del

mar, ya que este ultimo vendría siendo en estricto rigor un cuasi-geoide debido

a que varía constantemente y no es el mismo conforme uno se mueve a lo largo

de una costa, mucho menos entre océanos distintos.

2.2.3 Datum geodésico. El datum geodésico es la superficie de referencia para el cálculo y

determinación de coordenadas, estableciéndose datos iniciales de los cuales se

deriva el resto. Está compuesto por:

• Una superficie de referencia con definición geométrica exacta,

generalmente un elipsoide de revolución.

• Un “punto fundamental”, en el que coinciden las verticales al geoide y al

elipsoide.

En geodesia se emplean dos tipos de datum, el horizontal y el vertical:

• Datum Horizontal: Permite la determinación de la latitud y longitud. Se

elige un punto en el cual las superficies del elipsoide de referencia y del

geoide sean tangentes. De esta forma la vertical del geoide

(astronómica) y la vertical del elipsoide (geodésica) coincidirán, así

también, sus respectivas coordenadas.

• Datum Vertical: Es independiente del datum horizontal y es la superficie

que permite el cálculo de las alturas. Lo más usual es que esta superficie

sea el geoide o referida al nivel medio del mar.

10

2.2.4 Altura elipsoidal. Las alturas elipsoidales (h) representan la separación entre la superficie

topográfica terrestre y el elipsoide, calculada sobre la línea perpendicular a este

último.

Las alturas elipsoidales son obtenidas a partir de las coordenadas geocéntricas

cartesianas (X, Y, Z) definidas sobre un elipsoide de referencia (por ejemplo el

modelo Geodetic Reference System 1980, GRS80, o el World Geodetic System

1984, WGS84, los cuales, en la práctica, son iguales), y determinadas a partir

del posicionamiento satelital de los puntos de interés. (Grupo de Trabajo III SIRGAS).

2.2.5 Altura ortométrica.

Figura 2.3 Altura Ortométrica.

Fuente: Grupo de Trabajo III–SIRGAS

Los números geopotenciales son divididos por el valor medio de la gravedad

verdadera (g') entre el punto evaluado y el geoide. (Figura 2.3)

H')( g

Cortom =

11

Debido a que no es posible determinar directamente el valor de g’, es necesario

introducir hipótesis sobre distribución de masas internas terrestres. También las

alturas ortométricas pueden obtenerse a partir de las alturas elipsoidales

mediante la sustracción de las ondulaciones geoidales (N):

H Nhortom −=)(

2.3 SISTEMAS DE COORDENADAS. Cuando es necesario identificar la posición de un punto sobre el espacio se

utilizan los sistemas terrestres o geodésicos de referencia. Éstos

alternadamente, son asociados a una superficie que más se aproxime a la

forma de la tierra (elipsoide), en la cual se desarrollan todos los cálculos para

obtener sus coordenadas. Las coordenadas se pueden presentar en diversas

formas: referidas a un elipsoide determinado, denominadas coordenadas

geodésicas y en una superficie plana, que se denominará dependiendo de la

proyección que se ocupe, como por ejemplo, coordenadas UTM.

Las coordenadas referidas a los sistemas de referencia geodésicos son

presentadas principalmente como: Cartesianas, Geodésicas o Elipsoidales y

planas.

2.3.1 Coordenadas cartesianas. Es un sistema dextrógiro en donde el elipsoide está asociado a un sistema

cartesiano ortogonal formado por los ejes XYZ. El eje X está contenido en el

plano ecuatorial, orientado al meridiano cero (Greenwich), Z coincide con el eje

de rotación terrestre y está orientado en la dirección del polo norte, el eje Y

completa el sistema dextrógiro siendo perpendicular a los dos anteriores.

12

2.3.2 Coordenadas geodésicas.

Las coordenadas geodésicas determinan la posición espacial de un punto

cualquiera sobre un elipsoide determinado, que represente de mejor manera a

la tierra o una zona particular. Quedan determinadas por:

Latitud (φ): ángulo formado por la normal al punto a definir y su proyección

sobre el ecuador, varia de +90º a -90º y toma valores negativos al sur del

ecuador.

Longitud (λ): ángulo entre la sección meridiana que contiene al punto y el

meridiano de Greenwich, su graduación va de 0º a 180º, siendo negativas al

oeste del meridiano 0º y positivas al este.

Altura Elipsoidal (h): Corresponde a la distancia del punto a la superficie del

elipsoide, medida sobre su normal.

13

Figura 2.4 Relación Geométrica entre coordenadas cartesianas y geodésicas.

Fuente: Conceptos geodésicos básicos. http://www.colegiochubut.org.ar/agrimensores

2.3.3 Relación matemática entre coordenadas cartesianas y geodésicas.

Como se ve en la figura 2.4, un punto sobre la superficie terrestre, tiene

coordenadas cartesianas (X,Y,Z) geocéntricas, que pueden ser expresadas en

coordenadas geodésicas (φ,λ,h), o viceversa, de acuerdo con las siguientes

relaciones matemáticas:

a- Transformación de coordenadas geodésicas a cartesianas. (φ,λ,h) (X,Y,Z).

φ

λφλφ

senheNZ

senhNYhNX

⋅+−⋅=

⋅⋅+=⋅⋅+=

])1([

cos)(coscos)(

21

1

1

Donde:

-1ª excentricidad (e): 2

222

abae −

=

14

-Gran normal (N): φ221 sene

aN⋅−

=

a y b: semiejes del elipsoide.

b- Transformación de coordenadas cartesianas geodésicas, (X,Y,Z) (Φ,λ,h):

Ndh

XY

eadsenebZ

−=

⎥⎦

⎤⎢⎣

⎡=

⎥⎦

⎤⎢⎣

⎡⋅⋅−⋅⋅+

=

φ

λ

ψψ

φ

cos

arctan

cos'arctan

1

1

32

321

Donde:

-2da excentricidad (e’): 2

222'

bbae −

=

Y las variables auxiliares son:

21

21 YXd += ⎥⎦

⎤⎢⎣⎡

⋅⋅

=bdaZ1arctanψ

2.4 SISTEMAS DE REFERENCIA GEODÉSICOS. Un sistema de referencia geodésico es un recurso matemático que permite

asignar coordenadas a puntos sobre la superficie terrestre. Deben distinguirse

los llamados sistemas locales que utilizan, para su definición, un elipsoide

15

determinado y un punto datum, y los sistemas globales cuyos parámetros están

dados por una terna rectangular (X, Y, Z) cuyo origen se encuentra en el

geocentro del planeta. Para definir las coordenadas geodésicas (latitud, longitud

y altura elipsoidal) cuentan con un elipsoide de revolución asociado. Esta es

una definición rigurosa pero abstracta, pues tanto el centro como los ejes son

inaccesibles en la práctica.

2.4.1 Sistemas locales de referencia. Los sistemas locales de referencia son aquellos que adaptan el geoide a una

zona específica de la tierra, gracias a la utilización de un elipsoide determinado,

sobre este se realizan todos los cálculos geodésicos, con el previo

conocimiento de la posición geométrica del punto origen (datum) Además los

sistemas locales de referencia no son geocéntricos.

En las décadas de los años cincuenta y sesenta, para fines geodésicos y

cartográficos se definieron los sistemas de referencia sudamericanos, datum

Provisorio Sudamericano 1956 (PSAD56), con su vértice de origen en La

Canoa, Venezuela y datum Sudamericano 1969 (SAD69), con su origen en

Chua, Brasil.

Nuestro país ha adoptado como sistema de referencia oficial para el territorio

nacional, desde el extremo norte hasta la latitud 43° 30’ Sur, PSAD56, lo que

coincide aproximadamente con el límite entre las regiones X y XI. En el extremo

sur se utiliza el sistema SAD69 como referencia cartográfica, como también el

datum HitoXVIII en el extremo sur de la XII región.

En la tabla 2.1 se muestran los parámetros que definen a cada datum. La

cartografía sistemática escala 1/50000 editada por el IGM está referida a los

16

datums PSAD56, SAD69 e Hito XVIII, en las regiones correspondientes. Las

cartas IGM 1/25000 están referidas al SAD69. (Manual de carreteras Volumen II)

Tabla 2.1 Parámetros PSAD56, SAD69 e Hito XVIII.

Datum Elipsoide Semieje-mayor Achatamiento

PSAD56 Internacional

(Hayford)

6.378.388 m 1/297

SAD69 South American

1969 (UGGI-67)

6.378.160 m 1/298,25

Hito XVIII Internacional

(Hayford)

6.378.388 m 1/297

2.4.2 Sistemas globales de referencia.

A diferencia de los sistemas geodésicos locales, los sistemas geocéntricos son

tridimensionales y de alcance global. El concepto de punto datum desaparece, y

es reemplazado por el origen y orientación de la terna de referencia. Esta terna

consiste en los ejes ortogonales cartesianos X, Y, Z centrados en el centro de

masas de la tierra. Estos sistemas terrestres (fijados a la Tierra) tienen el eje X

solidario al meridiano origen de las longitudes y el eje Z próximo al eje de

rotación, por lo tanto este sistema “gira” juntamente con la tierra. Estos sistemas

resultan imprescindibles para ubicar puntos ligados al planeta Tierra. (Sistemas

Geodésicos. Comité Nacional de la Unión Geodésica y Geofísica Internacional .1era edición 1999)

2.4.3 International Terrestrial Reference Frame (ITRF). El organismo encargado de determinar y entregar información científica sobre

los parámetros de orientación de la tierra, para la realización de distintos

organismos (astronómicos, geodésicos y geofísicos), es el IERS (Internacional

Earth Rotation Service). ITRF fue establecido por IERS y constituye el marco de

17

referencia del ITRS (Internacional Earth Reference System). Existe alguna

confusión entre los conceptos de sistemas y marcos de referencia. Los

sistemas de referencia se definen a partir de consideraciones matemáticas y

físicas e involucran la especificación de parámetros, puntos origen, planos, ejes,

etc. Los marcos de referencia están constituidos por puntos materializados en el

terreno, ubicados con gran exactitud y precisión, según alguno de los sistemas

de referencia.

La constitución del ITRF corresponde a un conjunto de estaciones de las cuales

se conocen sus coordenadas y su variación respecto al tiempo, a las cuales se

les denomina Set of Station Coordinates (SSC). Para ello se emplean técnicas

como VLBI (Very Long Baseline Interferometry), SLR (Satelite Laser Ranging),

LLR (Lunar Laser Ranging), GPS, DORIS (Doppler Orbitography and Radio-

positoning Integrated by Satellite)

Figura 2.5 Estaciones ITRF2005.

Fuente: http://itrf.ensg.ign.fr/

18

Figura 2.6. Movimiento de las placas terrestres obtenido por ITRF2005 (1 cm/año).

Fuente: http://itrf.ensg.ign.fr/

2.4.4 Sistema WGS-84.

El sistema Geodésico Mundial 1984, es actualmente el sistema de referencia

para GPS y es compatible con el ITRF, básicamente bajo los siguientes

aspectos:

• Posición: geocéntrico, con origen en el centro de masa de la tierra,

incluyendo océanos y atmósfera.

• Orientación: eje Z en dirección del Polo de Referencia definido por IERS,

eje X en la intersección del meridiano de Referencia (IERS) y el plano

ecuatorial, eje Y completa el sistema ortogonal dextrógiro.

Al sistema cartesiano se asigna un elipsoide también denominado WGS-84, que

es compatible con el sistema de referencia 1980 (Elipsoide GRS80).

19

Figura 2.7. Parámetros WGS 84.

Fuente: Manual de carreteras Volumen II

2.4.5 Sistema de referencia para las Américas (SIRGAS). El sistema de referencia geocéntrico para las Américas (SIRGAS) es la

densificación regional del marco global de referencia terrestre del IERS (ITRF).

Las coordenadas SIRGAS están asociadas a una época específica de

referencia y su variación con el tiempo es tomada en cuenta ya sea por las

velocidades individuales de las estaciones SIRGAS o mediante un modelo

continuo de velocidades que cubre todo el continente. Además del sistema de

referencia geométrico, se ocupa de la definición y realización de un sistema

vertical de referencia basado en alturas elipsoidales como componente

geométrica y en números geopotenciales (referidos a un valor W0 global

convencional) como componente física. Las realizaciones o densificaciones de

SIRGAS asociadas a diferentes épocas materializan el mismo sistema de

referencia y sus coordenadas, reducidas a la misma época, son compatibles en

el nivel milimétrico.

La primera realización de SIRGAS (SIRGAS95) corresponde al ITRF94, época

1995.4 y está dada por una red GPS de alta precisión con 58 estaciones

distribuidas sobre América del Sur. Esta red fue reocupada en el año 2000,

extendiéndose a los países del Caribe y de Centro y Norte América. Por esta

razón, el significado original del acrónimo SIRGAS (Sistema de Referencia

Geocéntrico para América del Sur) cambió a Sistema de Referencia

Geocéntrico para las Américas. La nueva realización de SIRGAS

(SIRGAS2000) incluye 184 estaciones y corresponde al ITRF2000, época

20

2000.4. La precisión de las coordenadas de estas dos realizaciones está entre

±3 y ±6mm (Grupo II de Trabajo SIRGAS) La tercera realización de SIRGAS es

la red SIRGAS de Observación Continua (SIRGAS-CON). Actualmente está

compuesta por aproximadamente 130 estaciones GNSS de funcionamiento

permanente, de las cuales aproximadamente 50 pertenecen la red global del

IGS (International GNSS Service).

2.5 SISTEMA DE POSICIONAMIENTO GLOBAL (GPS)

El GPS (Global Positioning System, o sistema de posicionamiento Global) fue

desarrollado por el Departamento de Defensa de los Estados Unidos (DoD)

como un sistema de navegación de precisión, con fines militares. A partir de

1973 se comenzó a desarrollar la constelación NAVSTAR (Navigation Satellite

Timing and Ranging o Navegación por satélite con medición de tiempo y

distancia), la cual quedó operativa en 1995, conformada por 27 satélites (24

operativos y 3 de reserva), dando un alto grado de disponibilidad al sistema

GPS en todo momento del día y en cualquier lugar.

El sistema GPS esta referido al datum WGS-84 y tiene por objetivo calcular la

posición de un punto cualquiera en un espacio de coordenadas (X,Y,Z),

partiendo del cálculo de las distancias del punto a un mínimo de tres satélites

cuya localización es conocida. La distancia entre el usuario (receptor GPS) y un

satélite se mide multiplicando el tiempo de vuelo de la señal emitida desde el

satélite por su velocidad de propagación. Para medir el tiempo de vuelo de la

señal de radio es necesario que los relojes de los satélites y de los receptores

estén sincronizados, pues deben generar simultáneamente el mismo código.

Ahora bien, mientras los relojes de los satélites son muy precisos los de los

receptores son osciladores de cuarzo de bajo coste y por tanto imprecisos. Las

distancias con errores debidos al sincronismo se denominan pseudodistancias.

21

La desviación en los relojes de los receptores añade una incógnita más que

hace necesario un mínimo de cuatro satélites para estimar correctamente las

posiciones.

2.5.1 Señal GPS.

Los satélites que utiliza GPS contienen varios osciladores de alta precisión,

entregando medidas de tiempo del orden de 10 14− segundos. Los osciladores

de alta precisión del satélite tiene una frecuencia fundamental ƒ 0 = 10.23 MHz,

la cual genera dos frecuencias portadoras de la banda L, las cuales sirven para

transmitir información a través de los satélites.

Las dos frecuencias generadas a partir de ƒ 0 son:

• L1 = 1575.42 MHz, con longitud de onda λ=19 cm.

• L2 = 1227.60 MHz, con longitud de onda λ=24 cm.

Sobre estas dos frecuencias transportadoras se transmiten, a su vez, dos

códigos, que son secuencias binarias (combinación de ceros y unos) de

formación seudo aleatoria, llamados Ruidos Seudo Aleatorio-PRN (pseudos

Random Noise), estos códigos son:

• Código binario de adquisición Bruta o Grosera – C/A (Coarse Adquisition): modulado sólo en L1 y es el de menor frecuencia a 1.023

MHz, su longitud de onda λ es de 300 m. Es de uso civil.

22

• Código binario preciso P (ó Y): modulado en ambas portadoras (L1 y

L2) a una frecuencia de 10.23 MHz, tiene una longitud de onda λ de sólo

30 m. y es de uso Restringido.

Junto con estos dos códigos, se envía un mensaje de navegación (NAVDATA)

modulado en ambas portadoras, el cual suministra la siguiente información:

• Efemérides de los satélites: información que refleja el movimiento del

satélite en su orbita y permite calcular la posición de este al instante de

medición.

• Almanaque: información sobre la posición de todos los satélites de la

constelación.

• Tiempo del sistema.

• Correcciones a los relojes de los satélites.

• Número de identificación del satélite

• Estado (salud) del satélite

2.5.2 Fuentes de error GPS

Igualmente que en todos los equipos que se utilizan, una observación GPS está

sometida a varias fuentes de error, que se pueden minimizar dependiendo del

equipo y metodología que se utilice. Estas fuentes de error son las siguientes:

23

Satélites: -Variaciones Orbitales

-Errores en el oscilador

DoD: -S/A (Disponibilidad Selectiva)

Punto de Referencia: -Error del oscilador receptor

-Error en las coordenadas de referencia

Observaciones: -Retraso Ionosférico.

-Retraso Troposférico.

-Pérdidas de ciclos

-Errores de medida de fase con el receptor en

movimiento.

-Multipath (Ondas reflejadas)

-Errores en el estacionamiento

-Errores en la manipulación del equipo.

2.6 TRANSFORMACION BIDIMENSIONAL DE COORDENADAS. 2.6.1 Tipos de transformaciones bidimensionales. Las transformaciones bidimensionales se dividen en:

• Proyectiva.

• Afín.

• De Semejanza o conforme.

24

a- Transformación proyectiva bidimensional.

Las ecuaciones de la transformación bidimensional proyectiva posibilitan el

cálculo analítico de coordenadas de puntos del sistema de referencia sobre un

plano (X, Y) a partir de las coordenadas de sus puntos homólogos en el sistema

arbitrario (x´,y´) En estas ecuaciones se supone que la coordenada “Z” del

sistema de referencia es conocida al estar situados los puntos sobre un mismo

plano. En el caso de considerar puntos que no estén contenidos en dicho plano,

los valores de las coordenadas planimétricas (X, Y) que se obtengan, tendrán

un error proporcional al error de la “Z” considerada. Esta transformación suele

emplearse en aquellos casos en los que se suponen pequeñas variaciones de

relieve.

b- Transformación afín bidimensional.

La transformación de coordenadas afín bidimensional, es sólo una pequeña

modificación de la transformación de semejanza (2-D) a la cual se le incluyen

diferentes factores de escala, dirección eje de abscisas y ordenadas, y falta de

ortogonalidad entre sus ejes.

c- Transformación bidimensional conforme o de semejanza.

Una transformación de semejanza aplicada sobre una figura, es aquella que no

varía su verdadera forma después de la transformación. Para aplicar una

transformación bidimensional de semejanza es necesario conocer como mínimo

las coordenadas de dos puntos en ambos sistemas. Se mejora la precisión en

la transformación, si los puntos se eligen lo más alejados posibles. Debido a

que son 4 incógnitas y cada punto entrega 2 ecuaciones, son necesarios al

25

menos 3 puntos para haber redundancia y hacer posible el ajuste con 2 grados

de libertad.

Figura 2.8. Representación grafica de ejes XY girados, trasladados y escalados.

Fuente: “Ajuste Geodésico” Rene Zepeda.

La expresión general de una transformación conforme bidimensional,

considerando el caso más general, es decir, ejes girados, trasladados y con

diferentes unidades de medida, se tendrá:

y

x

TSenxCosyyTSenyCosxx

+⋅−⋅⋅=+⋅+⋅⋅=

))()(('))()(('

ωωλωωλ

Expresado en forma matricial la expresión anterior se tiene:

⎥⎦

⎤⎢⎣

⎡+⎥

⎦

⎤⎢⎣

⎡⋅⎥

⎦

⎤⎢⎣

⎡−

⋅=⎥⎦

⎤⎢⎣

⎡

y

x

TT

yx

CosSenSenCos

yx

)()()()(

''

ωωωω

λ

Pudiendo expresar la relación anterior de la siguiente forma:

26

⎥⎦

⎤⎢⎣

⎡+⎥

⎦

⎤⎢⎣

⎡⋅⎥

⎦

⎤⎢⎣

⎡−

=⎥⎦

⎤⎢⎣

⎡

y

x

TT

yx

abba

yx

''

Esta transformación es conocida con el nombre de Transformación de Helmert.

Donde los parámetros de la transformación a calcular son respectivamente a, b,

Tx, Ty. Conocidos los parámetros a y b puede determinarse el giro y el factor

de escala.

)()(

ωλωλ

SenbCosa⋅=⋅=

Con lo que:

)tan(

22

abA

ba

=

+=

ω

λ

2.6.2 Modelo de ajuste. El modelo aplicable para este caso es uno paramétrico con lo que:

La = F(Xa)

Modelo linealizado: AX + L = V

Partiendo de la forma general, las ecuaciones de observación para n puntos

serán:

27

ynnnxnnnn

yx

yx

TxbyayTybxaxP

TxbyayTybxaxPTxbyayTybxaxP

+⋅−⋅=+⋅+⋅=⇒

+⋅−⋅=+⋅+⋅=⇒+⋅−⋅=+⋅+⋅=⇒

''

''''

2222222

1111111

MMM

De esto se obtiene:

0|X

aXFA

δδ

=

y

x

TTba

X =

n

n

yx

yxyx

L

''

''''

2

2

1

1

M

=

Donde A se ira conformando de la siguiente manera:

1'0'''

0'1'''

==−==

====

yx

yx

Ty

Tyx

byy

ay

Tx

Txy

bxx

ax

δδ

δδ

δδ

δδ

δδ

δδ

δδ

δδ

El modelo de Helmert se resolverá por:

28

n

n

n

ny

x

y

n

x

nnn

y

n

x

nnn

yx

yx

yx

yx

VyVx

VyVxVyVx

yx

yxyx

TTba

Ty

Tx

by

ay

Tx

Tx

bx

ax

Ty

Tx

by

ay

Tx

Tx

bx

ax

Ty

Ty

by

ay

Tx

Tx

bx

ax

''

''''

''

''''

''''

''''

''''

''''

''''

''''

2

2

1

1

2

2

1

1

2222

2222

1111

1111

MM

MMMM

=−⋅

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

δδ

δδ

δδ

δδ

δδδ

δδ

δδ

δδ

δδ

δδ

δδ

δδδ

δδ

δδ

δδ

δδ

δδ

δδ

δδδ

δδ

δδ

[ ]A [ ]X [ ]L [ ]V

Donde [A] [X] - [L] = [V] representa la forma general de las ecuaciones de

observación indirecta.

Aplicando la condición de mínimo al sistema de ecuaciones se tiene:

[ ] [ ] [ ][ ] [ ] [ ]( ) [ ] [ ] [ ] [ ]( )

[L] [P] [L] [L] [P] [A] [X] - [X] [A] [P] [L] - [X][A] [P] [A] [X] tttttt

1

2

⋅⋅+⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅=Φ−⋅⋅⋅−⋅=Φ

⋅⋅==Φ ∑=

LXAPLXA

VPVVt

n

i

ti

2º y 3º término son iguales, por propiedad de matrices, por lo que resulta.

[L] [P] [L] [X] [A] [P] [L]2 - [X][A] [P] [A] [X] tttt ⋅⋅+⋅⋅⋅⋅⋅⋅⋅⋅=Φ

Para minimizar la función Φ, habrá que calcular su derivada parcial con

respecto a X:

29

[L] [P] [A][A]) [P] [A] ([X]

0[A] [P] [L]2 -[A] [P] [A] [X]2

)(0

t1-t

ttt

⋅⋅⋅⋅⋅=

=⋅⋅⋅⋅⋅⋅⋅=Φ

=Φ

X

MinimoX

δδ

δδ

2.6.3 Precisión del método de ajuste. Lo primero es encontrar la precisión a posteriori del modelo ( 0

2) El parámetro

02 normalmente es desconocido y es necesario estimarlo. El estimador de este

parámetro es la varianza residual, definida como el coeficiente entre la suma de

residuos al cuadrado y el número de grados de libertad del modelo.

∑=

⋅−

=n

iiR v

uns

1

22 1ˆ

Donde:

n: Número de observaciones. En este caso particular cada observación que

entra en el modelo debe ser considerada dos veces es decir habrá 2n

observaciones debido a que cada punto de observación entrega dos

educaciones al modelo.

u: Número de parámetros

n –u: Grados de libertad del modelo.

∑=

n

iiv

1

2 : Suma de los cuadrados de los residuos.

30

En forma matricial se podrá estimar a través de.

unsR −

⋅⋅⋅⋅⋅=

LPAX-LPLˆ

ttt2

Asumiendo que 20

2ˆ σ≈Rs entonces es posible estimar las matrices de varianza-

covarianza de:

• Parámetros ajustados:

( ) 120

−⋅⋅⋅=∑ APAX t

a σ

• De los valores observados ajustados:

( ) tta AAPAAL ⋅⋅⋅⋅⋅=∑

−120σ

• De los residuos:

( ) )( 1120

−−−⋅⋅⋅⋅⋅=∑ PAAPAAV ttσ

31

2.7 INFERENCIA ESTADÍSTICA

2.7.1 Introducción. En el campo de la estadística se distinguen dos partes, la descriptiva y la

inferencial. La descriptiva intenta resumir en forma concisa, un conjunto de

datos en un solo valor, índice o coeficiente. Por su parte la inferencial trata de

llegar a conclusiones que sobrepasan el alcance de los datos analizados, es

decir se trata de técnicas que tienden a deducir características desconocidas a

partir de un conjunto de datos. (Dr. José Luis Borcosque, Métodos de cuantificación en geografía).

La inferencia estadística está formada por los métodos utilizados para tomar

decisiones o para obtener conclusiones sobre una población, utilizando la

información contenida en una muestra. Se puede dividir en dos grandes áreas:

estimación de parámetros y prueba de hipótesis.

Como la inferencia estadística nos permite trabajar con una variable a nivel de

intervalo o razón, así también se puede comprender la relación de dos o más

variables y nos permitirá relacionar mediante ecuaciones, una variable en

relación de la otra variable llamándose Regresión Lineal y una variable en

relación a otras variables llamándose Regresión múltiple, siendo a esta ultima a

la cual se referirá en este trabajo .

Con regresión múltiple se puede determinar si existe o no relación de

dependencia entre dos o más variables. Es decir, conociendo los valores de

una variable independiente, se trata de estimar los valores de dos o más

variables dependientes, consiguiendo de mejor manera, una función con

parámetros que realmente son influyentes en los resultados.

32

2.7.2 Conceptos básicos de inferencia estadística.

Para que un método de inferencia estadística proporcione buenos resultados

debe:

• Basarse en una técnica estadístico-matemática adecuada al problema y

suficientemente validada.

• Utilizar una muestra que realmente sea representativa de la población y

de un tamaño suficiente.

A continuación se definirán conceptos básicos, para un mejor entendimiento de

la materia, donde algunas posteriormente se mencionarán o explicarán con

mayor profundidad:

• Población: es un conjunto homogéneo de individuos sobre los que se

estudia una o varias características que son, de alguna forma,

observables.

• Muestra: es un subconjunto de la población. El número de elementos de

la muestra se denomina tamaño muestral.

• Muestreo aleatorio simple: es aquel en el que todos los individuos de la

población tienen la misma probabilidad de ser elegidos.

• Muestra aleatoria simple: de una variable aleatoria x , con distribución

F y de tamaño n , es un conjunto de n variables aleatorias ,,...,, 21 nxxx

independientes e igualmente distribuidas (con distribución F ).

33

• Espacio muestral: es el conjunto de muestras posibles que pueden

obtenerse al seleccionar una muestra aleatoria, de tamaño n , de una

cierta población.

• Parámetro: es cualquier característica medible de la función de

distribución de la variable en estudio (media, varianza,…etc.).

• Estadístico: es una función de la muestra T ( nxxx ,...,, 21 ). Por tanto, es

una variable aleatoria que tiene una función de distribución que se

denomina distribución en el muestreo de T.

• Distribuciones muéstrales de una estadística: es la distribución de

probabilidad que puede obtenerse como resultado de un número infinito

de muestras aleatorias independientes, cada una de tamaño n

provenientes de la población de interés.

• Estimador de la media poblacional: se utiliza la media muestral

definida por:

i

n

ix

nX

1

1=Σ=

Si X sigue una distribución normal (obedece campana de Gauss)

),( 2σµN , se verifica que:

)1,0(~/

,~2

Nn

Xn

NXσ

µσµ −⇔⎟⎟

⎠

⎞⎜⎜⎝

⎛

34

• Estimador de la varianza poblacional: se utiliza la cuasivarianza

muestral definida por

2

1

2 )(1

1ˆ XXn

s i

n

i−Σ

−=

=

Si X sigue una distribución normal ),( 2σµN , se verifica que:

212

2

~ˆ)1(

−−

nsn χ

σ

Dado que normalmente la varianza poblacional se desconoce y es

necesario estimarla, cuando ocurre esto se utiliza la distribución de la t

(t - Student), que corresponde a una distribución de probabilidad que

surge del problema de estimar la media de una población normalmente

distribuida cuando el tamaño de la muestra es pequeño (n<30), es de

interés, para la aplicación de este trabajo, el siguiente resultado:

1~/ −−

ntnXσ

µ

No sé profundizará en todos los tipos de distribución muéstrales existentes en

estadística, debido que no es el fin de este trabajo de tesis, sólo se adjuntarán

en anexos, las tablas normalizadas de cada distribución, de manera que el

lector pueda saber, y a la vez, interpretar de donde se obtienen los valores

normalizados de distribución.

35

2.7.3 Regresión múltiple.

Los Modelos de Regresión estudian la relación estocástica (sistema que

funciona por el azar) cuantitativa entre una variable de interés y un conjunto de

variables explicativas. Sea Y la variable de interés, variable respuesta o

dependiente y sean kxxx ,..., 21 las variables explicativas o regresoras. La

formulación matemática de estos modelos es la siguiente:

Y = ε+),...,( 21 kxxxm

Donde:

ε = es el error de observación debido a variables no controladas.

En estricto rigor el modelo de regresión es lineal. Por lo tanto la expresión

matemática general del modelo es:

Y εαααα +++++= kk xx ...2110

Donde como primer objetivo de este modelo es estimar los parámetros

kαααα ,...,,, 210 y la función de distribución del error F a partir de una muestra

de n observaciones, que tendrá la forma:

( ){ } ( )( ){ }niiikii

niii yxxxyx 1211 ;,...,,; == =r

De la expresión matemática general del modelo se deduce que para i = 1,2,...,n

se verifica la siguiente igualdad:

36

iikkiii xxxy εαααα +++++= ...22110

Que si se escribe de forma matricial queda:

⎪⎪⎭

⎪⎪⎬

⎫

⎪⎪⎩

⎪⎪⎨

⎧

+

++

+

++

+

++

+

++

+

++

=

==

nnkk

kk

kk

nnn x

xx

x

xx

x

xx

y

yy

ε

εε

α

αα

α

αα

α

αα

α

αα

MM

K

M

K

K

MMMM2

1

2

1

22

222

122

11

211

111

0

0

0

2

1

1

11

εαrrr

+= XY

Desarrollando y resumiendo las matrices del modelo de regresión múltiple son:

,2

1

⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜

⎝

⎛

=

ny

yy

YM

r

⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜

⎝

⎛

=

nk

k

k

nn x

xx

x

xx

x

xx

XM

K

M

K

K

MMM2

1

2

22

12

1

21

11

1

11

,

⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜

⎝

⎛

=

kα

αα

αM

r 1

0

,

⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜

⎝

⎛

=

nε

εε

εM

r 1

0

Donde:

Yr

: es un vector n-dimensional (matriz n x 1) de la variable respuesta o

dependiente.

X : es la matriz del diseño de las variables regresoras (matriz n × (k + 1)), la

primera columna de esta matriz está formada por unos, a la columna que se le

asociada con el parámetro 0α ; la columna j + 1 contiene la información relativa

a la variable xj, con j = 1,2...,k, asociándola al parámetro jα

αr : es el vector (k + 1)-dimensional (matriz (k+1) × 1) de los parámetros del

modelo.

37

εr : es el vector n-dimensional (matriz n x 1) de las perturbaciones aleatorias.

En el estudio del modelo de regresión lineal general se asume que se verifican

las siguientes hipótesis:

1- La función de regresión es lineal.

)/(),...,,/(),...,,()( 2121 iikiiikiii xYExxxYExxxmxm rr ===

kk xxx 11221110 ... αααα ++++= , con i = 1,…,n.

2- La varianza es constante.

221 ),...,,/()/( σ== ikiii xxxYVarxYVar r , con i = 1,…,n.

3- La distribución es normal.

212211021 ,...N( ~,...,,// σαααα kkiiikiii xxxxxxYxY ++++=r

4- Las observaciones iY son independientes (bajo normalidad, esto

equivale a que la 0),( =ji YYCov , si i≠j).

5- n > k + 1. En caso contrario no se dispone de información suficiente para

estimar los parámetros del modelo.

6- Las variables regresoras x1,x2,...,xk son linealmente independientes.

2.7.4 Estimación de los parámetros del modelo.

Sea ∧

α un estimador del vector de parámetros .αr Se define el vector de

predicciones como:

38

αˆ Χ=Υ

El vector de residuos se obtiene como:

Υ−Υ= ˆrre

El estimador por mínimo cuadrados de αr se obtiene minimizando la suma de

los residuos al cuadrado. Esto significa, que se minimiza la siguiente función de

k + 1 variables:

)ˆ()ˆ()ˆ( 2

1Υ−ΥΥ−Υ==Σ=Ψ

=

rrrr tti

n

ieeeα

)ˆ)(ˆ()ˆ()ˆ( αααα Χ−ΥΧ−Υ=Χ−ΥΧ−Υ=rrrr

tttt

αααα ˆˆˆˆ ΧΧ+ΥΧ−ΧΥ−ΥΥ= ttttttrrrr

Derivando respecto a α e igualando a cero, se obtiene las ecuaciones de

regresión:

αΧΧ=ΥΧ ttr

,

De donde se deduce el siguiente estimador por mínimos cuadrados:

ΥΧΧΧ= −r

tt 1)(α

La matriz ΧΧ t es una matriz (k +1)x(k+1) cuya expresión es la siguiente:

39

⎟⎟⎟⎟⎟⎟⎟

⎠

⎞

Σ

ΣΣΣ

Σ

ΣΣΣ

⎜⎜⎜⎜⎜⎜

⎝

⎛

Σ

ΣΣΣ

Σ

ΣΣΣ

=ΧΧ

=

=

=

=

=

=

=

=

=

=

=

=

=

=

=

=

21

21

11

1

21

211

211

21

11

211

211

11

1

21

11

11

ikni

ikini

ikini

ikni

iikni

ini

iini

ini

iikni

iini

ini

ini

ikni

ini

ini

ni

t

x

xxxx

x

xx

xxx

x

xx

xxxx

x

xx

M

K

M

K

K

K

MMM

La matriz ΥΧr

t es una matriz (k+1)x1 que viene dada por:

ΥΧr

t =

⎜⎜⎜⎜⎜⎜⎜

⎝

⎛

⎟⎟⎟⎟⎟⎟

⎠

⎞

Σ

ΣΣΣ

=

=

=

=

iikni

iini

iini

ini

yx

yxyx

y

1

21

11

1

M

2.7.5 Propiedades de los estimadores

a- Estimador de los coeficientes del modelo lineal. En el estimador del vector αr , por el método de mínimos cuadrados, se

verifican las siguientes propiedades:

• El estimador α es insesgado o centrado: ααr

=)ˆ(E . El termino insesgado

o centrado viene de la definición de sesgo, que es la diferencia entre el

valor esperado y el valor verdadero del parámetro a estimar. Por lo tanto,

es deseable que un estimador sea insesgado o que su sesgo sea nulo.

• La matriz de varianzas-covarianzas del estimador α es :

40

kjiij

ttEEEVar 0,212 )()()))ˆ(ˆ))(ˆ(ˆ(()ˆ( =

− =ΧΧ=−−= σσααααα . De donde se

deduce que los estimadores iα y jα (i≠j) no son independientes ya que

0)ˆ,ˆ(2 ≠= jiij Cov αασ , con i,j=0,1,…,k. En particular, la varianza del

estimador iα viene dada por:

iiiiiiii qVarCov 222 )ˆ()ˆ,ˆ( σσααασ ===== , con i=0,1,…,k, siendo iiq el

elemento i-ésimo de la matriz 1)( −ΧΧ t .

• El estimador α tiene distribución normal multivariante de orden k+1, esto

quiere decir :

))(,(N~ˆ 121)(k

−+ ΧΧ tσαα r

• El estimador iα del parámetro iα tiene la siguiente distribución normal :

),N(~ˆ 2i iii qσαα , con i =0,1,…,k.

El parámetro iα indica la influencia de la variable regresora ix en la variable

respuesta Y , además del incremento que se produce en ésta por el

crecimiento unitario en la variable regresora ix . Se debe tener en cuenta

que el valor de iα está condicionado al modelo de regresión múltiple con el

que se está trabajando y si se cambia el modelo (se eliminan o introducen

variables) el coeficiente iα , asociado a la variable regresora ix , también

cambia. Por otro lado aceptar que el valor iα es cero, equivale a aceptar

que la variable ix , no está relacionada linealmente con la variable Y .

Si se conoce la varianza del modelo 2σ , utilizando las distribuciones

mencionadas anteriormente, se pueden calcular intervalos de confianza de

41

los parámetros iα , individuales o conjuntos (regiones de confianza del

vector parametrito ),...,,( 21 jhjj ααα , con { }hjjj h ,...,2,1,0,...,, 21 ∈ o hacer

contrastes de simplificación sobre parámetros. En la práctica casi nunca se

conoce 2σ debido a que es la varianza de la población y siempre se hacen

modelos a partir de muestras de la población, por lo tanto la varianza 2σ es

necesario estimarla.

b- El estimador de la varianza.

Una hipótesis básica del modelo es que los errores son normales y

homocedásticos, por tanto, 2)( σε =iVar , con i = 1,…,n, el parámetro 2σ

normalmente es desconocido y es necesario estimarlo. El estimador de este

parámetro es la varianza residual, definida como:

2

1

2

)1(1

ˆ i

n

iR ekn

s=Σ

+−=

El estimador 2ˆRs es distinto del estimador que se obtiene por máxima

verosimilitud, que se denota como 2ˆ MVσ y que se define como:

2

1

2 1ˆ i

n

iMV en =Σ=σ

La relación entre ambos estimadores que dada de la siguiente forma:

22 ˆ)1(

ˆ MVR knns σ+−

=

42

El estimador 2ˆRs tiene la ventaja, respecto a 2ˆMVσ , de ser insesgado.

Utilizando la hipótesis de normalidad se obtiene la siguiente relación que

permite conocer la distribución de 2ˆRs :

21)(k-n2

2

~))1((+

+−χ

σRskn

De la relación anterior se obtiene un intervalo de confianza de 2σ con un nivel

de confianza 1 -α , que queda expresado como:

⎟⎠⎞

⎜⎝⎛+−

≤≤⎟⎠⎞

⎜⎝⎛ −

+−

+−+− 2

ˆ))1((

21

ˆ))1((2

)1(

22

)1(

2

αχσ

αχ kn

R

kn

R sknskn

Donde )(2)1( θχ +− kn el número que verifica que θθχξ =≤ +− ))(( 2

)1(knP , siendo ξ

Una variable aleatoria con distribución 2)1( +− knχ .

c- Inferencia sobre los parámetros del modelo.

De la distribución de iα , se deduce:

N(0,1)~ˆ

),N(~ˆ 2i

ii

iiiii q

qσ

αασαα

−⇒ , con i = 0,1,…,k

De 2ˆRs y del intervalo de 2σ la distribución de iω es )1( +− knt , o sea:

43

)1(~ˆ

+−

−= kn

ii

iii t

qσαα

ω , i=0,1,…,k

Utilizando iω se obtiene que un intervalo de confianza para iα a un nivel de

confianza 1-α es:

,2

1ˆˆ )1( ⎟⎠⎞

⎜⎝⎛ −⋅±∈ +−

ααα knRii tiiqs con i =0,1,…,k

Donde )()1( θ+− knt es el número que verifica que θθχζ =≤ +− ))(( 2)1(knP , siendo ζ

una variable aleatoria con distribución )1( +− knt . El estadístico iω también se

puede utilizar para realizar contrastes de hipótesis acerca de si la variable

explicativa ix influye individualmente o no en la variable respuesta Y (contraste

de simplificación). Aceptar que 0=iα equivale a aceptar que la variable ix no

está relacionada linealmente con la variable Y , por tanto no debe estar en el

modelo.

d- Contraste individual de la t.

Se desea hacer el siguiente contraste ( iC ) que verifique el contraste individual

de la t:

⎭⎬⎫

⎩⎨⎧

≠≡=≡

≡00

1

0

i

ii H

HC

αα

con i =0,1,…,k

44

Si 0H es cierto, se obtiene que:

iω │ )1(~ˆ

ˆˆ0 +−== kn

iiR

iiH t

qst

α , con i=0,1,…,k.

it representa la discrepancia entre la información que proporciona la muestra y

la información que proporciona la hipótesis nula ( 0H ).

Se deduce que el valorp − de este contraste bilateral es:

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛=>=− +−

iiR

iikn qs

ttPvalorpˆ

ˆˆ2 )1(α .

La región de aceptación del contraste a un nivel de significación α es:

⎟⎠⎞

⎜⎝⎛ −⋅≤≤⎟

⎠⎞

⎜⎝⎛ −⋅− +−+− 2

1ˆˆ2

1ˆ )1()1(ααα

kniiRikniiR tqstqs

2.7.6 Análisis de la varianza

En el siguiente apartado se va a explicar como descomponer la variable de

interés Y , cuando se ajusta un modelo de regresión múltiple.

a- Tabla ANOVA. Para todos los datos muestrales se hace la siguiente descomposición:

)ˆ()ˆ()( yyyyyy iiii −+−=−

45

Elevando al cuadrado y sumando se obtiene:

)ˆ)(ˆ(2)ˆ()ˆ()(1

2

1

2

1

2

1yyyyyyyyyy iii

n

ii

n

iii

n

ii

n

i−−Σ+−Σ+−Σ=−Σ

====

En base a la ortogonalidad de los vectores se obtiene que los productos

cruzados sean cero, de donde se sigue la siguiente igualdad (Teorema de

Pitágoras) que permite descomponer la variabilidad de la variable respuesta

( 2

1)( yyi

n

i−Σ

=) en la variabilidad explicada por la recta de regresión ( 2

1)ˆ( yyi

n

i−Σ

=),

más la variabilidad residual o no explicada por el modelo ajustado ( 2

1)ˆ( ii

n

iyy −Σ

=).

De esta igualdad se construye la siguiente tabla ANOVA:

Tabla 2.2. Tabla ANOVA del modelo de regresión múltiple

Tabla ANOVA del modelo de regresión múltiple Fuente de variación Suma de cuadrados Grados de libertad Varianzas

Por la recta scE= 2

1)ˆ( yyi

n

i−Σ

=

k kscEse =2ˆ

Residual scR= 2

1)ˆ( ii

n

iyy −Σ

=

n-(k+1) )1(ˆ2

+−=

knscRse

Global scG= 2

1)( yyi

n

i−Σ

=

n-1 1ˆ2

−=

nscGse

De esta tabla ANOVA se deduce el siguiente contraste acerca de la influencia

conjunta del modelo de regresión en la variable respuesta.

46

b- El contraste conjunto de la F.

El contraste se denomina MC y al igual que el contraste de la t, se desea

resolver lo siguiente:

⎭⎬⎫

⎩⎨⎧

≠≡====≡

≡0

0...

1

210

i

kM H

HC

αααα

, para algún i

Si 0H es cierto, ninguna de las variables regresoras influye en la variable

respuesta. En este supuesto se verifica que:

0ˆ ≈⇒≈ scEyyi ,

Por ser ésta una medida absoluta se compara con la varianza residual, lo que

lleva a utilizar el siguiente estadístico de contraste:

2

2

ˆˆˆ

R

eM s

sF =

Bajo la hipótesis nula y por la hipótesis de independencia se sigue que MF

sigue una distribución F (contraste de la F) con k y n-(k+1) grados de libertad.

MF │ )1(,2

2

~ˆˆ

0 +−= knkR

eH F

ss

valorp − del contraste es:

)ˆ( )1(, Mknk FFPvalorp ≥=− +− ,

47

Donde )1(, +− knkF denota una variable aleatoria que sigue una distribución F con

k y )1( +− kn . Si el valor critico valorp − del contraste es grande (mayor que el

nivel de significación α ) se acepta 0H , esto quiere decir, que el modelo de

regresión no es influyente y debe buscarse un modelo alternativo.

c- Contrastes individuales de la F Al igual que el contraste individual de la t, pero con la diferencia que se utilizará

la tabla ANOVA, se estudiará el incremento que se produce en el modelo al

introducir la variable regresora ix .

Para ello, si se desea contrastar la influencia de la variable ix , primeramente se

ajusta el modelo de regresión completo, con las k variables regresoras,

calculando así, la suma de cuadrados explicada por el modelo (scE(k)). A

continuación, se ajusta el modelo de regresión con k-1 variables, todas excepto

la variable ix . Nuevamente, se calcula la suma de cuadrados explicada por el

este modelo (scE(k- ix )), obteniendo así la suma al cuadrado incremental

debido a ix , como se muestra a continuación:

0)()()( ≥−−=∆ ii xkscEkscExscE

Este valor indica el aumento de la variabilidad explicada por el modelo al

introducir la variable ix . Para contrastar la influencia individual o no de ix , se

realiza el siguiente contraste:

⎭⎬⎫

⎩⎨⎧

≠≡=≡

≡00

1

0

i

i

HH

Ciαα

con i=0,1,…,k.

48

Como estadístico del contraste se utiliza:

)(ˆ1

)(

ˆ2 ks

xscE

FR

i

i

∆

= , con i=0,1,…,k.

Bajo la hipótesis nula se verifica que iF sigue una distribución F (contraste

individual de la F) con 1 y n – (k+1) grados de libertad.

iF │ )1(,1~0 +− knH F , con i=0,1,…,k.

Evidentemente, si 0H es cierto, 0)( ≈∆ ixscE y iF tomará valores pequeños. Por

lo tanto este contraste unilateral siendo el valorp − del contraste:

ikn FFPvalorp ˆ( )1(,1 ≥=− +− , con i=0,1,…,k.

Este contraste proporciona exactamente el mismo resultado que el contraste

individual de la t. Sin embargo, este método presenta la ventaja adicional de

poder utilizarse para contrastar la influencia de un subconjunto de l variables

explicativas, con l { }jljj xxxk ,...,,, 2≤ . En este caso el estadístico del contraste

utilizado es:

)(,2 ~)(ˆ

)(

ˆlknl

Rl F

ksl

lscE

F +−

∆

=

De esta manera en el modelo de regresión múltiple al hacer el contraste entre

la influencia individual de cada una de las variables regresoras y el contraste

49

sobre la influencia conjunta del modelo de regresión ajustado, se dan diversos

resultados significativos o no, pudiendo eliminar variables o agregar otras, para

así obtener un resultado más óptimo.

2.7.7 Correlación.

Al ajustar un modelo de regresión múltiple a una nube de observaciones es

importante disponer de alguna medida que permita medir la bondad del ajuste.

Esto se consigue con los coeficientes de correlación múltiple.

a- Coeficiente de correlación múltiple. Se define el coeficiente de correlación lineal simple (o de Pearson) entre dos

variables X e Y , como:

yx ssyxsYXr

⋅=

),(),(

Donde:

),( yxs : Covarianza muestral entre las variables X e Y .

xs : Desviación típica muestral X .

ys : Desviación típica muestral Y .

El coeficiente de correlación lineal simple es una medida de la relación lineal

existente entre las variables X e Y . En general, cuando se ajusta un modelo

estadístico a una nube de puntos, existe una medida de la bondad del ajuste, la

que se denomina coeficiente de determinación. Está definido por:

50

2

1

2

12

)(

)ˆ(

yy

yy

scGscER

i

n

i

i

n

i

−Σ

−Σ==

=

=

El coeficiente de correlación múltiple queda definido de igual forma que el

coeficiente de correlación lineal ( R ), representando así, el porcentaje de

variabilidad de la Y que explica el modelo de regresión.

Como scGscE ≤ , se verifica que 10 2 ≤≤ R . Si 2R = 1, la relación lineal es

exacta y si 2R =0, no existe relación lineal entre la variable respuesta y las

variables regresoras.

El coeficiente de correlación múltiple presenta el inconveniente de aumentar

siempre que aumenta el número de variables regresoras, ya que al aumentar k

(número de variables regresoras) disminuye la variabilidad no explicada,

algunas veces de forma artificial, lo que puede ocasionar problemas de

multicolinealidad. Si el número de observaciones n es pequeño, el

coeficiente 2R es muy sensible a los valores de n y k. En particular, si n = k + 1

el modelo se ajusta exactamente a las observaciones. Por ello y con el fin de

penalizar el número de variables regresoras que se incluyen en el modelo de

regresión, es conveniente utilizar el coeficiente de determinación corregido por

el número de grados de libertad ( 2R ). Este coeficiente es similar al anterior,

pero utiliza el cociente de varianzas en lugar del cociente de sumas de

cuadrados. Para su definición se tiene en cuenta que:

scGscR

scGscER −== 12

51

Cambiando las sumas de cuadrados por varianzas se obtiene el coeficiente de

determinación corregido por el número de grados de libertad, 2R , definido como

sigue:

2

1

2

1

2

22

)(1

1)1(

1

1ˆˆ1

yyn

ekn

ssR

i

n

i

i

n

i

Y

R

−Σ−

Σ+−

−=−=

=

=

Se deduce la relación entre los dos coeficientes de correlación, quedando:

2222

)1(1)1(1 RR

knnRR ≤⇒

+−−

−−=

También se puede relacionar el estadístico del contraste de regresión múltiple

(de la F) con el coeficiente de determinación, obteniendo:

[ ][ ]kRknR

ss

FR

eM 2

2

2

22

1)1(

ˆˆˆ

−+−

==

b- Correlación parcial.

Sea { }kXXX ,...,, 21 un conjunto de variables aleatorias, se define el coeficiente

de correlación parcial entre ix y jx , como la medida de la relación lineal entre

las variables ix y jx una vez que se ha eliminado en ambas variables los

efectos debidos al resto de las variables del conjunto { }kXXX ,...,, 21 . Al

coeficiente de correlación parcial, entre 1x y 2x se le denotará como kr ...312⋅ .

52

En el modelo de regresión múltiple:

εαααα +++++= kk XXXY ...22110

Se calcula el coeficiente de correlación parcial entre la variable respuesta Y y

una variable regresora ix , controlado por el resto de variables. Para ello se

utiliza el estadístico del contraste individual de la t, respecto a la variable ix y

que se definió anteriormente como:

( ) iiR

i

i

ii qs

tˆ

ˆˆ

ˆˆ αασα

== , con i=1,2,…, k.

Obteniéndose la siguiente relación:

)1(ˆˆ

2

22

+−+=⋅ knt

tr

i

iCYi

Donde C={ }kii ,...,1,1,...,2,1 +− es el conjunto de índices de todas las variables

regresoras excepto el índice i .

53

CAPITULO III – DESARROLLO.

3.1 INTRODUCCION. En este capítulo se desarrollarán dos aplicaciones de regresión múltiple. En la

primera se analizará un área determinada en la Región Metropolitana y en la

segunda, una línea de nivelación en la cuesta Lo Prado. En ambos casos se

verificará el comportamiento de cada modelo, de tal manera que estos

entreguen resultados óptimos. Los datos utilizados para las dos aplicaciones

que se desarrollarán están en el datum WGS84, con proyección cartográfica

UTM huso 19. Las alturas ortométricas utilizadas están referidas al nivel medio

del mar.

Antes de comenzar con los respectivos desarrollos, es de utilidad tener una

idea del tipo de relación, ya sea lineal o de otro tipo entre las variables que se

van a utilizar (figura 3.1).

Figura 3.1. Relación entre variables.

Fuente: Elaboración propia.

54

3.2 APLICACION1: USO DE REGRESIÓN MÚLTIPLE EN UNA ZONA DE LA REGIÓN METROPOLITANA.

Se dispone un set de datos de una zona dentro de la región metropolitana de

aproximadamente 100km 2 , abarcando parcialmente comunas como La Reina,

Peñalolén, San Joaquín, Macul, Ñuñoa y Santiago. El set de datos contiene 9

puntos, en donde a cada punto se le conoce su coordenada Norte, Este, Atura

ortométrica (H), y, ondulación geoidal (N) obtenida del modelo geoidal global

EGM96. Se procede al cálculo de la altura elipsoidal (h) para cada punto del set

de datos, mediante la siguiente expresión:

NHh +=

Obteniendo las alturas elipsoidales, los datos que se utilizarán para realizar el

modelo matemático, son los siguientes:

Tabla 3.1. Puntos del Set de datos a utilizar aplicación 1.

Punto Este Norte h H

A 348469.940 6299282.800 621.98 595.000

B 358468.010 6299297.100 826.774 799.000

C 358473.370 6289284.640 977.703 950.000

D 348472.120 6289282.720 615.877 589.000

1 353485.610 6294669.190 628.314 601.000

6 350475.920 6297045.920 607.102 580.000

7 356542.850 6297045.210 687.588 660.000

8 356553.000 6291499.060 760.546 733.000

9 350472.620 6291512.080 609.048 582.000

55

Los puntos del set de datos están dispuestos geográficamente según muestra

la figura 3.2.

La construcción de las matrices, que se utilizarán para la confección del modelo

de regresión múltiple, será en base a la reducción de cada una de las variables

a un centroide, que se obtiene mediante la media de las variables Norte, Este y

altura elipsoidal (h)

Figura 3.2. Puntos dispuestos geográficamente aplicación 1.


La media de la variable “H” nos permite comprobar si el modelo está

correctamente realizado. El significado del término libre (o constante) que se

introduce dentro de los cálculos matriciales del modelo de regresión, es

entregar, el valor de la variable respuesta en el punto de origen.

Tabla 3.2. Coordenadas Centroide aplicación 1.

Punto Este Norte h H

Centroide 353490.382 6294324.302 703.8813 676.556

56

3.2.1 Obtención de los coeficientes del modelo. La función de regresión tendrá la siguiente forma:

)mh(h)mN(N)mE(EH 3210 −+−+−+= αααα

Las matrices que se desarrollan, para la obtención del modelo de regresión,

quedan de la siguiente forma:

⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜

⎝

⎛

=

582733660580601589950799595

Yr

,

⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜

⎝

⎛

=

94.833-2812.222-3017.762-156.6652825.242-3062.618116.293-2720.9083052.468196.779-2721.6183014.462-175.567-344.8884.772-188.004-5041.582-5018.262-1

273.8225039.662-4982.9881122.8934972.7984977.6281

81.901-4958.4985020.442-1

X

Donde:

Yr

: corresponde a la matriz de la variable respuesta o dependiente, que en este

caso es la de alturas ortométricas.

X : es la matriz de diseño de las variables regresoras (matriz n × (k + 1)).

La obtención de los estimadores o coeficientes del modelo se realiza a través

de:

57

ΥΧΧΧ=

⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜

⎝

⎛

= − rr tt 1

3

2

1

0

)(

αααα

α

Con la multiplicación matricial para obtener αr , se obtienen los estimadores del

modelo, quedando de la siguiente forma:

)mh01(h9.998E)mN06(N--9.890E)mE05(E--7.673E676.556H −−+−+−+=

La varianza residual se obtiene de:

0.004ˆ05-3.548E1)(3-9

0.0001)()1(

1ˆ 2

12 =⇒=

+=Σ

+−=

= Rin

iR se

kns

Como se muestra a continuación, de la matriz de varianza-covarianza del

modelo, se obtienen las correspondientes varianzas para cada estimador:

⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜

⎝

⎛

⋅=

05-2.942E07-2.152E07-7.590E-18-6.767E-07-2.152E09-9.211E09-5.551E-20-4.950E-07-7.590E-09-5.551E-08-2.688E19-2.218E18-6.767E-20-4.950E-19-2.218E0.111

0.000016)ˆ(αVar

05942.209211.908688.2

111.0

33

22

11

00

−=−=−=

=

EqEqEq

q

58

Donde la varianza de cada estimador queda definida por:

iiRiR qss ⋅= 22 ˆ)(ˆ α

Resultando la siguientes varianzas para cada estimador:

001.0)(ˆ06-1.774E)(ˆ 002 =→= αα RR ss

07-6.552E)(ˆ13-4.293E)(ˆ 112 =→= αα RR ss

07-3.835E)(ˆ13-1.471E)(ˆ 222 =→= αα RR ss

05-2.168E)(ˆ10-4.699E)(ˆ 332 =→= αα RR ss

3.2.2 Intervalos de confianza.

Se procede al cálculo de los intervalos de confianza a un 90% para cada

estimador, incluyendo el de 2σ , ya que este ultimo obedece a la varianza

residual de una población total, cuestión que en la practica nunca se tiene,

debido a que siempre se trabaja con muestras en donde se hace referencia a la

varianza residual 2ˆRs , pero que sin lugar a dudas, es necesario tener en cuenta.

El cálculo de intervalos de confianza se hace a través de tablas de distribución

estadística (Tablas presentes en ítem Anexos) en el caso de 2σ , se utilizará 2

)1( +− knχ (también denominada ji-cuadrado) y para el caso de cada uno de los

estimadores se utilizará la distribución de )1( +− knt (t-student).

• Para 2σ se tiene que:

59

⎟⎠⎞

⎜⎝⎛

+−≤≤

⎟⎠⎞

⎜⎝⎛ −

+−

+−+− 2

ˆ))1((

21

ˆ))1((2

)1(

22

)1(

2

αχσ

αχ kn

R

kn

R sknskn

( ) ( )05.005-1.597E))13(9(

95.005-1.597E))13(9(

2)5(

22

)5( χσ

χ+−

≤≤+−

Por lo tanto:

0.0080.00305-6.973E06-7.210E 2 ≤≤⇒≤≤ σσ

Para cada estimador se tiene que:

)1(~ˆ

+−

−= kn

iiR

iii t

qSαα

ω

Por lo tanto, los intervalos de confianza de cada estimador, quedarán de la

siguiente manera:

• Para :0α

5~111.00.004

676.556toα−

676.558676.553 ≤≤ oα

• Para :)(1 Esteα

60

51 ~

08-2.688E0.00405-7.673E- tα−

05--7.541E05-7.810E 1 ≤≤ α

• Para :)(2 Norteα

52 ~

09-9.211E0.00406-9.890E-

tα−

06--9.117E05-1.066E 2 ≤≤ α

• Para :)(3 hα

53 ~05-2.942E0.004

01-9.998Et

α−

01-9.998E01-9.997E 2 ≤≤ α

3.2.3 Contrastes individuales de la t para los coeficientes del modelo de regresión.

A partir de los valores resultantes de los correspondientes contrastes

individuales de la t, para cada coeficiente, se obtiene que:

• Para :0α

61

⇒⎭⎬⎫

⎩⎨⎧

≠≡=≡

≡00

01

000 α

αHH

C Sí 0H es cierto, )1(~ˆ

ˆˆ +−= kniiR

ii t

qst

α

En donde:

0.111004.0676.556ˆ~

ˆˆˆ

0)5(00

00 =⇒= tt

qst

R

α =507912.714

Por lo tanto para :0α

0=− valorp

• Para :1α

⇒⎭⎬⎫

⎩⎨⎧

≠≡=≡

≡00

11

101 α

αHH

C Si 0H es cierto, )1(~ˆ

ˆˆ +−= kniiR

ii t

qst

α

En donde:

08-2.688E004.005-7.673E-ˆ~

ˆˆˆ

1)5(11

11 =⇒= tt

qst

R

α = -1.171E+02


⇒=− 0valorp La variable “Este” influye y explica el

comportamiento de la variable respuesta “Altura Ortométrica”.

62

• Para :2α

⇒⎭⎬⎫

⎩⎨⎧

≠≡=≡

≡00

21

202 α

αHH

C Si 0H es cierto, )1(~ˆ

ˆˆ +−= kniiR

ii t

qst

α

En donde:

09-9.211E004.006-9.890E-ˆ~

ˆˆˆ 2)5(

22

22 =⇒= tt

qst

R

α = -2.579E+01


⇒=− 0valorp La variable “Norte” influye y explica el

comportamiento de la variable respuesta “Altura Ortométrica”.

• Para :3α

⇒⎭⎬⎫

⎩⎨⎧

≠≡=≡

≡00

31

303 α

αHH

C si 0H es cierto, )1(~ˆ

ˆˆ +−= kniiR

ii t

qst

α

En donde:

05-2.942E004.001-9.998Eˆ~

ˆˆˆ 3)5(

33

33 =⇒= tt

qst

R

α = 4.613E+04


63

⇒=− 0valorp La variable “Altura elipsoidal (h)” influye y explica

el comportamiento e la variable respuesta “Altura Ortométrica”.

En otras palabras, el valor que se obtiene de valorp − es una probabilidad de

influencia de la variable regresora en la variable respuesta. Por lo tanto se tiene,

en los 4 coeficientes, un 0% de probabilidad de que la variable regresora no

influya ni explique, el comportamiento de la variable respuesta Altura

Ortométrica.

3.2.4 Tabla ANOVA (contraste conjunto de la F)

Se construye una tabla de análisis de varianza (ANOVA) utilizando la

distribución de probabilidad de Fisher (F) ya que esta analiza simultáneamente

varias medias poblacionales. Todo esto para verificar la influencia, o no, del

modelo en la variable respuesta, esta tabla queda de la siguiente forma:

Tabla 3.3 .Tabla ANOVA del contraste conjunto de la F aplicación 1.

TABLA ANOVA

Fuentes de variación Suma de cuadrados

Grados de libertad Varianzas

Por el modelo 131514,222 3 43838,074

Residual 7,984E-05 5 1,597E-05

Global 131514,222 8 16439,278

Con estos datos se obtiene el siguiente estadístico del contraste conjunto de la

F:

5,3)1(,2

2

~.676274523922505-1.597E

43838.074ˆ~ˆˆˆ FFFss

F MknkR

eM ==⇒= +−

64

Por lo tanto:

⇒=− 0valorp Se rechaza la NO influencia del modelo en la variable respuesta.

En base a los resultados de los contrastes individuales de la t y el contraste

conjunto de la F se deduce la influencia de cada una de las tres variables

regresoras y la influencia conjunta del modelo de regresión en la variable de

interés (Altura ortométrica).

3.2.5 Coeficientes de determinación y de correlación del conjunto. Una vez ajustada la recta de regresión a la nube de observaciones es

importante disponer de una medida que mida la bondad del ajuste realizado y

que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos

alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de

determinación, definido como sigue:

0.99992131514.2221131514.2222 ===

scGscER

El modelo ajustado explica el 99.99% de la variabilidad de la respuesta.

El coeficiente de correlación múltiple: 1=R

El coeficiente de determinación corregido por los grados de libertad:

9999.016439.278

05-1.597E1ˆˆ

1 22

22 =⇒−=−= R

ss

RY

R

65

Por lo tanto el coeficiente de correlación corregido por los grados de libertad,

es:

1=R

3.2.6 Coeficientes de determinación y correlación individuales.

Se determinan los coeficientes de correlación y por ende los de determinación,

mediante la siguiente expresión:

yx ssyxCovYXR

⋅=

),(),(

A modo de ejemplo, sólo se determinará el coeficiente de correlación y

determinación individual de la variable “Este” respecto a la variable dependiente

“Altura ortométrica”, a través de la tabla ANOVA, como un método opcional para

determinar dichos coeficientes.

• Se calcula la regresión de “Este” respecto al “Altura Ortométrica” y se

obtiene la siguiente tabla ANOVA :

Tabla 3.4. Tabla ANOVA de variable “Este” respecto variable “Altura ortométrica

Tabla ANOVA

Fuentes de variación

Suma de cuadrados

Grados de libertad

Varianzas

Por el modelo 90515.139 1 90515.139

Residual 40999.083 7 5857.012

Global 131514.222 8 16439.278

0.6882 =R 0.830=R

66

Tabla 3.5. Coeficientes de correlación y determinación individuales.

3.2.7 Aplicación del Modelo.

A continuación se aplicará el modelo desarrollado anteriormente a los mismos

puntos con los cuales se realizó la regresión múltiple, obteniendo los siguientes

resultados:

Tabla 3.6. Alturas Ortometricas obtenidas con regresión múltiple.

Punto H(regre) A 595.004 B 798.997 C 949.999 D 589.001 1 600.998 6 579.997 7 660.004 8 733.004 9 581.997

El vector de los residuos, matricialmente, se obtiene de la siguiente forma:

YXXXXYXYYYe ttrrrrr 1)(ˆˆ −−=−=−= α

Coeficientes de determinación y correlación.

variable 1

variable 2

Desv. (variable1)

Desv. (variable2) Cov. R 2R

Este Hort 3899.940 120.883 391108.574 0.830 0.688

Norte Hort 3814.464 120.883 -106622.258 -0.231 0.053

helip Hort 121.143 120.883 14644.066 1.000 1.000

Este Norte 3899.940 3814.464 -2233,834783 0.000 0.000

Este helip 3899.940 121.143 392340,418 0.830 0.690

Norte helip 3814.464 121.143 -106496,121 -0.230 0.053

67

Como YHYr

=ˆ , siendo tt XXXXH 1)( −= la matriz de proyección ortogonal.

En base a esto:

))(()(ˆ εαrrrrrrr

+−=−=−=−= XHIYHIYHYYYe

εεαεαrrrrrr )( HIHHXXe −=−−+=

Se calcula la matriz de varianzas de los residuos,

)())(())(()()( 22 HIHIHIHIEHIeVar ttt −=−−=−−= σσεεrrr

Por tanto, ie es una variable aleatoria con distribución.

),1(,0N(~ 2iii he −σ con i=1,…,n.

Donde iih es el valor de influencia de ixr que mide la “distancia estadística” de ixr

a x . Un residuo “grande” indica que la observación está lejos del modelo

estimado, por lo tanto, la predicción de esta observación es mala. Las

observaciones con residuos grandes se denominan observaciones atípicas o

heterogéneas.

Como los residuos tienen varianza variable y son dimensionados (tienen las

unidades de la variable respuesta “H”), normalmente se tipifican de la siguiente

manera:

ii

i

he−1σ

, con i=1,…,n.

68

Los residuos tipificados siguen una distribución normal estándar, pero como 2σ es desconocido, se sustituye por su estimador la varianza residual 2

Rs

obteniendo así, los residuos estandarizados definidos como:

iiR

ii vs

er

−=

1ˆ, con i=1,…,n.

Los residuos estandarizados tienen media cero y varianza próxima a 1, esto

permite distinguir a los residuos grandes.

Por la hipótesis de normalidad los residuos estandarizados siguen una

distribución t con )1( +− kn grados de libertad. Se obtienen del calculo del

estimador )(ˆ isR para cada i, i = 1,...,n, la varianza residual del modelo de

regresión obtenido a partir de la muestra en la que se ha eliminado la

observación ),( ii Yxr . Ahora se definen los “residuos estudentizados” como

~1ˆ )( iiiR

ii vs

et

−= )1()1( +−− knt con i = 1,…,n.

Los residuos estudentizados siguen una distribución t con )1()1( +−− kn

grados de libertad. Si el tamaño muestral (n) es grande, los residuos

estandarizados y los estudentizados son casi iguales y muy informativos,

pudiéndose considerar grandes los residuos estandarizados tales que .2>ir

69

En la tabla 3.7, se encuentran los residuos obtenidos por el modelo.

Tabla 3.7. Residuos simples, estandarizados y estudentizados Aplicación 1.

Punto

Residual

simple

Residuos

estandarizados

Residuos

estudentizados

A 0.004 1.769 1.971

B -0.003 -1.144 -1.225

C -0.001 -0.321 -0.321

D 0.001 0.239 0.239

1 -0.002 -0.684 -0.709

6 -0.003 -0.973 -1.052

7 0.003 1.225 1.352

8 0.004 1.134 1.253

9 -0.003 -0.808 -0.849

Promedio=0.049

Varianza=1.050

Con los residuos estandarizados o estudentizados se pueden construir los

siguientes gráficos de interés que sirven para verificar si los resultados del

modelo son favorables:

• El histograma de los residuos, que sirve para observar la existencia de

normalidad, simetría y detectar observaciones atípicas

70

-1.500

-1.000

-0.500

0.000

0.500

1.000

1.500

2.000

A B C D 1 6 7 8 9

Res

iduo

s es

tand

ariz

ados

Gráfico 3.1.Histograma de residuos (Aplicación 1).

Fuente: Elaboración propia

• El gráfico probabilístico de normalidad (p-p y q-q) y simetría, que

permite contrastar la normalidad (simetría) de la distribución de los

residuos.

0

1

2

3

4

5

6

-1 0 1

Residuos estandarizados

Gráfico 3.2. Probabilístico de normalidad (p-p y q-q) y simetría.


71

• El gráfico de residuos ( ie ) frente a las predicciones ( iy ), que permite

detectar diferentes problemas:

1. Heterocedasticidad: significa que la varianza no es constante,

teniéndose que transformar los datos (de la variable dependiente)

o aplicar mínimos cuadrados ponderados.

2. Error en el análisis: se ha realizado mal el ajuste y se verifica

que los residuos negativos se corresponden con los valores

pequeños iy y los errores positivos se corresponden con los

valores grandes de iy , o al revés.

3. El modelo es inadecuado: por falta de linealidad y se deben de

transformar los datos o introducir nuevas variables que pueden ser

cuadrados de las existentes o productos de las mismas. O bien se

deben introducir nuevas variables explicativas.

4. Existencia de observaciones atípicas o puntos extremos.

Tener en cuenta que se debe utilizar el gráfico de residuos

( ie ) frente a las predicciones ( iy ) en lugar del gráfico de residuos

( ie ) frente a las observaciones ( iy ) porque las variables er e

Yr

están correlacionadas, mientras que las variables er e Y no lo

están.

72

-2

-1

0

1

2

500 600 700 800 900 1000

Predicciones

Res

iduo

s es

tand

ariz

ados

Grafico 3.3. Residuos estandarizados v/s Predicciones (aplicación 1)


500

600

700

800

900

1000

500 600 700 800 900 1000

Variable respuesta

Pred

icci

ones

Grafico 3.4. Predicciones v/s Variable respuesta (aplicación 1)


Del grafico 3.4 se infiere un ajuste razonable, debido a que las predicciones

están próximas a los valores observados y en el grafico 3.3 el comportamiento

de los residuos es el adecuado, no tendiendo a ninguna función matemática.

Con estos resultados, más los obtenidos en los contrastes individuales de la t,

Contraste conjunto de la F, coeficientes de determinación y correlación, se

determina que no es necesario incluir ni quitar ninguna variable para el modelo

de regresión múltiple realizado para la aplicación 1.

73

3.2.8 Calibración Local GPS de la zona de estudio Región Metropolitana con Software Trimble Geomatics Office (TGO)

Con el fin de analizar los resultados del modelo de regresión múltiple, se

realizará un ajuste vertical, mediante el software TGO.

Ingresando al software, antes de importar los datos GPS de la zona en estudio,

se configuran las propiedades del proyecto. De esta manera, el programa

queda preparado para recibir la información según el datum y proyección

correspondiente a los datos a importar.

Figura 3.3. Propiedades del proyecto en software TGO

Fuente: TGO

Los datos fueron importados en formato .csv con las siguientes características

Nombre, Latitud, Longitud, Altura, Código (WGS84)

74

Figura 3.4. Datos importados TGO (aplicación 1)

Fuente: TGO

Luego se procede a realizar una calibración local vertical para la interpolación

de ondulaciones geoidales a través de un plano que se ajuste a los datos

importados.

TGO aplica la siguiente relación para el cálculo de ondulaciones geoidales.

)(cos)( 321 mmm aaaN λλϕϕϕ −+−+=

Con lo que idealmente se esta aplicando sobre el punto medio de la zona de

ajuste (φm, λm), un desplazamiento constante sobre la vertical y dos giros en

las direcciones de los ejes coordenados, uno en la dirección S-N y otro en la

dirección W-E, con lo que se ajustará la ondulación del modelo a la observada.

75

Figura 3.5. Calibración local vertical TGO

Fuente: Elaboración Propia

Luego de realizado el ajuste se lee el informe de calculo para así percatar

cualquier anomalía.

Tabla 3.8. Parámetros de Ajuste Vertical TGO (Aplicación 1).

Coordenada Norte del punto de origen 6299297.100m

Coordenada Este del punto de origen 358468.010m

Separación vertical en el origen -27.772m

Pendiente Norte -8.682ppm

Pendiente Este -80.993ppm

Tabla 3.9. Resumen errores TGO (Aplicación 1)

Resumen

Error máximo Error medio cuadrático Punto

Vertical 0.018m 0.011 A

En la siguiente tabla se entregan los valores obtenidos de altura ortométrica con

la calibración vertical GPS hecha en el software TGO:

76

Tabla 3.10. Alturas Ortométricas entregadas por TGO (Aplicación 1) Punto Htgo

A 595.018

B 799.002

C 950.017

D 589.001

1 600.986

6 579.997

7 659.991

8 732.997

9 581.991

3.3 APLICACIÓN 2: LÍNEA DE NIVELACIÓN CUESTA LO PRADO

3.3.1 Introducción.

Para realizar un análisis del comportamiento de la regresión múltiple en una

línea de nivelación en la que se requiera interpolar alturas ortométricas, se

utilizaron datos de la memoria realizada por María José Herrera Gatica y José

Salas Silva en el año 2007. El título de la memoria es “Metodología y desarrollo

para la georreferenciación de un proyecto vial cuesta Lo Prado”. En está

memoria se realizaron poligonales electrónicas y mediciones GPS, siguiendo

las siguientes normativas del Manual de carreteras Volumen II:

• El orden de control del trabajo y la planificación de los procedimientos

GPS de la cantidad de líneas establecidas, serán según el capítulo 2.300

Ingeniería básica – Aspectos Geodésicos y topográficos, sección 2.301

Aspectos generales y referenciación de los estudios, capítulo 2.301.403

Referenciación de un Sistema de transporte de coordenadas secundario.

77

• La medición de las líneas bases tomadas con GPS, se realizaron con el

método estático rápido, tomando en consideración los tiempos

establecidos en el capítulo 2.300 Ingeniería básica – Aspectos

Geodésicos y topográficos, sección 2.312 Transporte de coordenadas

mediante GPS, capítulo 2.312.5 Métodos estáticos.

• Las Poligonales desarrolladas se hicieron de acuerdo al capítulo 2.300


Poligonales, capítulo 2.310.4 Poligonales Secundarias.

• Las mediciones de las poligonales serán de acuerdo al capítulo 2.300


Poligonales, capítulo 2.310.404 Tolerancias Admisibles, específicamente

Método de medida de ángulos horizontales y Método de medida de

distancias (2.310.404(4) y 2.310.104(5) respectivamente).

• Respecto a las precisiones (de un sistema de referenciación de segundo

orden y coordenadas líneas base) y tolerancias (ángulos horizontales,

medida de distancias y en la determinación de desniveles entre vértices)

obtenidas en está memoria, todas se ajustan a lo estipulado en los

capítulos 2.301.403 y 2.310.404 respectivamente.

Las mediciones GPS fueron realizadas con 3 receptores proporcionados por la

División de Ingeniería de Vialidad del Ministerio de Obras Publicas. La marca

del receptor geodésico utilizado es Trimble Modelo R8, cuyas precisiones en

Horizontal son de ± 0.005 m + 0.5 PPM y en vertical es de ±0.005 m + 1 PPM.

Estas mediciones GPS tienen la finalidad de ligar coordenadas obtenidas en

terreno a un sistema de referencia conocido. Las coordenadas de terreno

78

obtenidas para esta referenciación, son obtenidas mediante las poligonales

medidas a lo largo del camino emplazado en la cuesta Lo Prado, que consta de

26 estaciones. Para la medición de estas poligonales se utilizo la estación total

Leica serie TPS400, con precisión en distancias de ±5 mm + 2 ppm, y lectura

angular de 5 CC .

Figura 3.6. Trimble R8 y Leica serie TPS400.


3.3.2 Calculo y ajuste de Alturas ortométricas cuesta Lo Prado. Con los registros de terreno de las mediciones de poligonales electrónicas

realizados en la memoria “metodología y desarrollo de un proyecto vial cuesta

Lo Prado” se procede al calculo y ajuste de Altura ortométrica para los puntos a

utilizar en el modelo de regresión múltiple.

Lo primero es corregir a la línea los cenitales medidos en terreno

(pertenecientes a las poligonales)

79

Figura 3.7. Corrección a la línea.

Fuente: “Geodesia Geométrica” René Zepeda.

Deduciendo de la figura se puede establecer una relación para la corrección de

los cenitales a través del teorema del seno, con lo que se tiene.

)()( ZSen

scSenim=

− Como c es pequeño Z ≈ Z’ ⎟⎠⎞

⎜⎝⎛ ⋅−

=Di

ZSenimAsenc )'()(

cZZ += '

Luego se procede a calcular las distancias horizontales de cada tramo de las

dos poligonales, para esto se hace uso de los cenitales ya corregidos a la línea

y la expresión que se deduce de la siguiente figura.

Figura 3.8. Calculo de distancias horizontales. Fuente: “Geodesia Geométrica” René Zepeda.

80

)(αCosDiDh ⋅= ; Z−= 100α )100( ZCosDiDh −⋅=

Donde:

α: ángulo vertical respecto al horizonte.

Z: ángulo cenital corregido a la línea.

La precisión del calculo de las distancias horizontales puede ser establecido por

propagación del error a través de.

22

22

ZZ

DhDi

Di

DhDh σ

δδ

σδδ

σ ⋅⎟⎟⎠

⎞⎜⎜⎝

⎛+⋅⎟⎟

⎠

⎞⎜⎜⎝

⎛=

Donde:

Diσ y Zσ Son las presiones de las mediciones de distancia y angulares,

respectivamente, entregadas por el instrumento utilizado.

Derivadas parciales.

)100( ZCosDi

Dh −=δδ ; )100( ZSenDi

Z

Dh −⋅=δδ

La diferencia de nivel se calcula a través de mediciones recíprocas y

simultaneas.

81

Figura 3.9. Mediciones recíprocas y simultaneas.

Fuente: “Geodesia Geométrica” René Zepeda.

En los puntos A y B se miden los ángulos cenitales ZA y ZB; sus alturas son HA y

HB; e y r son los efectos de esfericidad y refracción.

De la figura anterior se deduce la expresión para el calculo de desniveles a

través de mediciones reciprocas y simultaneas, la obtención de esta fórmula

queda aclarada en el texto “Geodesia Geométrica” de Rene Zepeda Pág. 70.

)(21

ABh ZZTanDH −⋅=∆ Con Z B y ZA corregidos a la línea.

La precisión del calculo de desniveles puede ser establecido, por propagación

del error, a través de.

22

22

22

ZAZA

HZB

ZB

HDh

Dh

HH σ

δδ

σδδ

σδδ

σ ⋅⎟⎟⎠

⎞⎜⎜⎝

⎛+⋅⎟⎟

⎠

⎞⎜⎜⎝

⎛+⋅⎟⎟

⎠

⎞⎜⎜⎝

⎛= ∆∆∆

∆

82

Donde:

Dhσ Es la precisión de la distancia horizontal.

ZAσ y ZBσ Son las presiones de los cenitales corregidos a la línea.

Derivadas parciales.

)(21

ABDh

H ZZTan −=∆

δδ ;

221)(

21

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛+−⋅=∆

ABhZB

H ZZTanDδδ ;

221)(

21

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛+−⋅−=∆

ABhZA

H ZZTanDδδ

Para la Poligonal 1 los resultados son:

Tabla 3.11. Resultados poligonal 1.

Tramo Dhz (m) σDh (m) ∆H (m) H (m) σ∆H (m)

GPS2 551.315

GPS2 - E3 203.880 0.005 14.167 565.482 0.004

E3 - E4 587.297 0.006 74.459 639.940 0.013

E4 - E5 460.550 0.006 67.537 707.478 0.010

E5 - E6 299.079 0.006 30.296 737.774 0.006

E6 - E7 65.258 0.005 4.334 742.107 0.001

E7 - E8 28.508 0.005 1.474 743.581 0.001

E8 - GPS4 731.758 0.006 83.512 827.094 0.015

GPS4 827.358

83

Para la poligonal 2 los resultados obtenidos son:

Tabla 3.12. Resultados poligonal 2.

Tramo Dhz (m) σDh (m) ∆H (m) H (m) σ∆H (m)

GPS4 827.358

GPS4 - E11 681.807 0.006 -172.367 654.991 0.016

E11 - E12 1052.614 0.007 -295.367 359.624 0.025

E12 - E13 142.924 0.005 -10.584 349.040 0.003

E13 - E14 229.925 0.005 -20.165 328.875 0.005

E14 - E15 525.805 0.006 -33.984 294.891 0.010

E15 - E16 1083.594 0.007 -44.106 250.785 0.020

E16 - E17 474.590 0.006 -14.355 236.430 0.009

E17 - E18 561.269 0.006 -14.397 222.032 0.010

E18 - E19 754.267 0.007 -14.647 207.386 0.013

E19 - E20 470.892 0.006 -6.699 200.687 0.008

E20 - E21 348.370 0.006 -2.701 197.985 0.006

E21 - E22 303.925 0.006 -4.253 193.733 0.005

E22 - E23 984.254 0.007 -6.801 186.931 0.017

E23 - E24 292.568 0.006 -0.598 186.334 0.005

E24 - GPS5 433.388 0.006 -2.982 183.352 0.007

GPS5 182.503

Una vez obtenidos los desniveles se procede a obtener un error de cierre, para

luego ajustar dichos desniveles a través de un modelo de condición.

3.3.3 Ajuste de los desniveles a través de modelo de ecuaciones de condición.

El ajuste por mínimos cuadrados, mediante el modelo de ecuación de condición

en forma matricial, se calcula por los siguientes pasos.

84

Figura 3.10. Pasos ajuste por mínimos cuadrados.

Fuente: Memoria “Estudio y aplicación de Modelos Geoidales como marco de referencia vertical para Chile”.

Solución:

Modelo: F (La) = 0

Las ecuaciones de condición que se forman son. Para la poligonal 1.

LGPS2-E3b + VGPS2-E3 + LE3-E4b + VE3-E4 + LE4-E5b + VE4-E5 + LE5-E6b + VE5-E6 + LE6-E7b

+ VE6-E7+ LE7-E8b + VE7-E8+ LE8-GPS4b + VE8-GPS4 – (HGPS4 – HGPS2) = 0

Para la poligonal 2:

LGPS4-E11b + VGPS4-E11 + LE11-E12b + VE11-E12 + LE12-E13b + VE12-E13 + LE13-E14b + VE13-

E14 + LE14-E15b + VE14-E15+ LE15-E16b + VE15-E16 + LE16-E17b + VE16-E17 + LE17-E18b +

VE17-E18 + LE17-E18b + VE18-E19+ LE19-E20b + VE19-E20+ LE20-E21b + VE20-E21+ LE21-E22b

85

+ VE21-E22+ LE22-E23b + VE22-E23+ LE23-E24b + VE23-E24 + LE24-GPS5b + VE24-GPS5 –

(HGPS5 – HGPS4) = 0

La matriz B, corresponde a la matriz de funciones que liga los valores

observados a la función de ajuste, es decir, a la derivada para cada valor con

respecto a su recorrido. La matriz de los coeficientes B, para la poligonal 1,

queda de la siguiente forma:

[ ]111111111=B

Mientras que para la poligonal 2:

[ ]111111111111111=B

La matriz de error de cierre “W” para la poligonal 1 viene dada por.

[ ]264.0=W

Mientras que para la poligonal 2.

[ ]849.0−=W

La matriz Lb corresponde a las observaciones, en este caso desniveles.

86

⎥⎥⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

=

512.83474.1334.4296.30537.67459.74167.14

1.poliLb

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

−−−−−−−−−−−−−−−

=

982.2598.0801.6253.4701.2699.6647.14397.14355.14106.44984.33165.20584.10367.295367.172

2.poliLb

La matriz P corresponde al inverso de las precisiones al cuadrado de cada

medición. Para este caso dicha precisión viene dada por las distancias

horizontales de cada tramo. La varianza a priori 20σ utilizada es 1.

⎥⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

⋅=

2

22

21

20

1

1

1

n

P

σ

σ

σ

σO

⎥⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

⋅=

2

22

21

1

1

1

1

nDh

Dh

Dh

PO

Obtenidas estas matrices sólo basta aplicar el método de ecuación de condición

para así obtener los desniveles ajustados por mínimos cuadrados, de cada una

de las observaciones.

87

Cabe destacar que este método de ajuste, utilizado en un conjunto de

observaciones que presenten tan sólo una ecuación de condición, y, en la que

los pesos son establecidos en relación a la distancia (tal como el ejemplo

anterior) la solución de este modelo viene definida por:

parcialdistacumuladadist

eerrorcierrHcomp ..

⋅=∆

La fórmula anterior es conocida en topografía como “compensación

proporcional a la distancia”.

Además si se da el caso en que sólo existe una ecuación de condición y la

matriz de peso es considerada igual a 1 la solución de este modelo es:

tramosneerrorcierrHcomp

º=∆

La fórmula anterior es conocida en topografía como “compensación en partes

iguales”.

Tabla 3.13. Resultados alturas ortométricas ajustadas, poligonal 1.

Tramo ∆H ajustado (m) H ajustado (m)

GPS2 551.315

GPS2 - E3 14.189 565.504

E3 - E4 74.524 640.028

E4 - E5 67.588 707.617

E5 - E6 30.330 737.946

E6 - E7 4.341 742.287

E7 - E8 1.477 743.764

E8 - GPS4 83.594 827.358

GPS4 827.358

88

Tabla 3.14. Resultados alturas ortométricas ajustadas, poligonal 2

Tramo ∆H ajustado (m) H ajustado (m)

GPS4 827.358

GPS4 - E11 -172.436 654.922

E11 - E12 -295.474 359.447

E12 - E13 -10.599 348.848

E13 - E14 -20.188 328.660

E14 - E15 -34.038 294.623

E15 - E16 -44.216 250.406

E16 - E17 -14.403 236.003

E17 - E18 -14.454 221.549

E18 - E19 -14.723 206.825

E19 - E20 -6.747 200.078

E20 - E21 -2.737 197.341

E21 - E22 -4.283 193.058

E22 - E23 -6.902 186.156

E23 - E24 -0.627 185.529

E24 - GPS5 -3.026 182.503

GPS5 182.503

Finalmente con los desniveles ajustados y las alturas ortométricas calculadas

se obtienen los datos que se utilizarán en el modelo de regresión múltiple para

la obtención de altura ortométrica en “cuesta Lo Prado”

3.3.4 Aplicación 2: Uso de regresión múltiple en la línea de nivelación cuesta Lo Prado.

En cuesta Lo Prado se realizó un modelo para la obtención de altura

ortométrica con separación de 1km entre los puntos de control, interviniendo las

siguientes estaciones:

89

Tabla 3.15. Puntos para confección modelo regresión múltiple cuesta Lo Prado.

Figura 3.11. Disposición geográfica de puntos cuesta Lo Prado.

Fuente: Google Earth.

Punto Este (m) Norte (m) h (m) H (m)

GPS1 321785.062 6295856.052 535.403 510.292

GPS2 320853.898 6295814.300 576.334 551.315

GPS3 320088.809 6294297.629 822.237 797.330

E 4 320383.506 6295217.800 664.971 640.028

E 8 320381.777 6294719.835 768.699 743.764

E 11 319811.766 6293979.630 679.807 654.922

E 12 319077.853 6293225.225 384.269 359.447

E 15 318216.841 6292970.246 319.371 294.623

E 16 317133.541 6292948.752 275.047 250.406

E 18 316098.133 6292976.667 246.087 221.549

E 20 314880.064 6293107.545 224.527 200.078

E 22 314403.491 6292700.978 217.483 193.058

E 24 313172.949 6292360.944 209.932 185.529

90

Se realizó un modelo de 4 parámetros tal como se dedujo en la zona de estudio

Región metropolitana (aplicación 1)

Al igual que en la aplicación 1 se impuso el valor de la unidad para la matriz

Peso, si bien, se podrían haber establecido los pesos de las mediciones, en

relación, a la precisión con que fue observada o calculada las altura ortométrica

de cada punto. Se decidió desechar esto, debido a que no se disponía de las

presiones de medición de las estaciones GPS1, GPS2 Y GPS3. Además las

mediciones de los puntos anteriormente nombrados y los de las poligonales

antes expuestas fueron realizadas en épocas y condiciones; y con técnicas e

instrumental totalmente diferente una de la otra con lo que dotar de pesos

individualizados a cada punto sería algo irresponsable.

Del capítulo 2.9.3 se tiene que la ecuación general está dada por:

)mh(h)mN(N)mE(EH 3210 −+−+−+= αααα

Aplicando el cálculo matricial, explicado en el capítulo 3.1.1, se obtienen los

siguientes resultados:

Tabla 3.16. Parámetros modelo regresión múltiple cuesta Lo Prado.

Parámetros Valor Desv. Est. t p-valor

α0 430.949 8.869E-03 39672.31536 0.000

α1 -7.619E-05 7.904E-06 -7.870594355 0.000

α2 -2.801E-05 1.533E-05 -1.491749255 0.213

α3 1.000 7.329E-05 11141.13203 0.000

Centroide

Este (m) 318175.976

Norte (m) 6293859.662

h (m) 455.705

91

Donde el contraste conjunto viene dado por la tabla 3.17 y el resumen de los

resultados obtenidos, aplicando el modelo a los mismos puntos que se utilizaron

para realizar la regresión múltiple, se encuentra en la tabla 3.18:

Tabla 3.17. Contraste conjunto de la F cuesta Lo Prado.

Tabla ANOVA

Suma de cuadrados g.l. varianza F p-valor

Modelo 617015.942 3 205671.981 2.011E+08 0.000

Residual 0.0092 9 1.023E-03

Global 617015.952 12 51417.996

12 =R 1ˆ 2 =R 10.032ˆ =RS

Tabla 3.18. Residuos simples, estandarizados y estudentizados, cuesta Lo Prado.

Punto Hregre.

(m) Residuossimples

Residuos estandarizados

Residuos estudentizados

GPS1 510.317 -0.025 -1.089 -1.128

GPS2 551.321 -0.006 -0.240 -0.240

GPS3 797.329 0.001 0.056 0.056

E 4 640.012 0.017 0.586 0.595

E 8 743.755 0.009 0.322 0.324

E 11 654.926 -0.004 -0.156 -0.157

E 12 359.461 -0.014 -0.542 -0.547

E 15 294.635 -0.013 -0.490 -0.494

E 16 250.393 0.013 0.456 .460

E 18 221.511 0.037 1.269 1.378

E 20 200.040 0.038 1.377 1.501

E 22 193.044 0.014 0.512 0.518

E 24 185.596 -0.068 -2.773 -3.912

Prom. = -0.055

Var. = 1.071

92

100

200

300

400

500

600

700

800

900

100 200 300 400 500 600 700 800 900

Variables respuesta

Pred

icci

ones

Grafico 3.5. Predicciones v/s Variable respuesta cuesta Lo Prado.


-3

-2.5

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

100 200 300 400 500 600 700 800 900

Predicciones

Res

iduo

s es

tand

ariz

ados

Polinómica

Grafico 3.6. Residuos estandarizados v/s Predicciones cuesta Lo Prado.


Del grafico 3.6 se desprende que es necesario introducir un término cuadrático

debido a que el comportamiento de los residuos no es adecuado. Esto, ya que

los puntos parecen seguir una parábola, es así como basándose en la figura 3.1

93

se decide introducir el termino dist3d y dist3d al cuadrado. Además debido al

resultado del contraste de la t se concluye la no influencia de la variable Norte

en la variable respuesta altura ortométrica, por lo que se decide descartarla del

modelo.

Con todo lo anterior se construye un nuevo modelo que sigue la siguiente

expresión:

)33()33()()( 2243210 mmmm ddistddistaddistddistahhaEEaaH −+−+−⋅+−+=

Los resultados que entrega el nuevo modelo son:

Tabla 3.19. Parámetros y centroide modelo, nueva regresión múltiple 5 parámetros

Parámetros Valor Desv. Est. (m) t p-valor

α0 430.949 2.229E-03 193320.052 0.000

α1 -9.224E-05 1.587E-06 -58.127 0.000

α2 4.959E-05 9.051E-06 5.479 0.000

α3 1.000 1.902E-05 52571.957 0.000

α4 -1.251E-08 1.553E-09 -8.051 0.000

Centroide

Este (m) 318175.976

Norte (m) 6293859.662

h (m) 455.705

Dist3d media (m) 2640.213

Dist3d media cuadrada 8522052.103

94

Tabla 3.20. Tabla ANOVA nueva regresión múltiple 5 parámetros.

Tabla ANOVA

Suma de cuadrados g.l. Varianza F p-valor

Modelo 617015.951 4 154253.988 2.388E+09 0.000

Residual 0.0005 8 6.460E-05

Global 617015.952 12 51417.996

12 =R 1ˆ 2 =R 080.0ˆ =RS

Tabla 3.21. Residuos simples, estandarizados y estudentizados, modificación modelo cuesta Lo Prado.

Punto Hregre.

(m) ResiduosSimples

Residuos Estandarizados

Residuos Estudentizados

GPS1 510.281 0.011 2.4906548 3.03047239

GPS2 551.333 -0.018 -2.6282145 -4.47866819

GPS3 797.328 0.002 0.4024259 0.35585305

E 4 640.030 -0.002 -0.2261110 -0.24241319

E 8 743.760 0.004 0.5487285 0.56562111

E 11 654.922 0.000 -0.0502900 -0.04948223

E 12 359.446 0.002 0.2691117 0.29634225

E 15 294.623 0.000 -0.0294420 -0.02734138

E 16 250.409 -0.002 -0.3408733 -0.35111426

E 18 221.548 0.001 0.1088128 0.11441399

E 20 200.077 0.001 0.2334229 0.23880563

E 22 193.053 0.005 0.7591222 0.76519272

E 24 185.533 -0.004 -1.5749783 -0.53887304

Prom. = -0,003

Var. = 1,303

95

100

200

300

400

500

600

700

800

900

100 200 300 400 500 600 700 800 900

Variable respuesta

Pred

icci

ones

Grafico 3.7. Predicciones v/s Variable respuesta, modificación modelo cuesta Lo Prado.


-3

-2

-1

0

1

2

3

0 100 200 300 400 500 600 700 800 900

Predicciones

Res

iduo

s es

tand

ariz

ados

Grafico 3.8. Residuos estandarizados v/s Predicciones, modificación modelo cuesta Lo Prado.


96

3.3.5 Aplicación de ajuste TGO a la línea de nivelación cuesta Lo Prado.

Los resultados obtenidos en la calibración GPS altimétrica en el TGO son:

Tabla 3.22. Parámetros ajuste vertical TGO cuesta Lo Prado

Coordenada Norte del punto de origen 6295856.052m

Coordenada Este del punto de origen 321785.063m

Separación vertical en el origen -25.083m

Pendiente Norte -27.742ppm

Pendiente Este -75.393ppm

Y los resultados para cada punto son:

Tabla 3.23. Alturas Ortométricas entregadas por TGO, cuesta Lo Prado.

Punto H TGO (m)

GPS1 510.320

GPS2 551.322

GPS3 797.325

E4 640.011

E8 743.753

E11 654.925

E12 359.463

E15 294.637

E16 250.395

E18 221.512

E20 200.041

E22 193.044

E24 185.595

97

3.4 AUTOMATIZACIÓN EN SOFTWARE ARCVIEW 3.3.

Se procede a automatizar los procedimientos expuestos en esta memoria

mediante lenguaje Avenue. Se consideró la explicación detallada sólo de la

estimación y transformación de parámetros, tanto en horizontal y vertical.

3.4.1 Automatización coordenadas planimétricas. a- Estimación de parámetros para transformación bidimensional de coordenadas. Una ves en el software Arcview se debe seleccionar el ítem “Estimación

parámetros” “Parámetros Horizontales”.

A través del paso anterior se ingresa en la rutina para el cálculo de parámetros

de una transformación bidimensional de Helmert.

Se debe seleccionar una tabla en formato .dbf con los campos Punto, E1, N1,

E2, N2. Luego de esto la rutina calculará los parámetros Tx, Ty, ángulo de

rotación y factor de escala, además del punto de origen (X0, Y0) residuo mayor

en X e Y (indicando el nombre de los puntos en los que estos residuos

máximos están ocurriendo) y el error medio cuadrático de la transformación.

Estos resultados se desplegarán en pantalla (figura 3.12) para poder ser

copiados por el usuario, así como también se dará la posibilidad de ser

guardados automáticamente a un archivo de extensión escogida por el mismo.

98

Figura 3.12. Parámetros de transformación bidimensional.

Fuente: Arcview Gis 3.3

b- Aplicación de parámetros para transformación bidimensional de coordenadas.

Para la aplicación de parámetros de transformación se debe seleccionar

“Transformación” “E1, N1 ---> E2, N2”

Si se acaba de realizar una estimación de parámetros horizontales, entonces

los parámetros de dicha estimación estarán ya ingresados en la pantalla

“Parámetros horizontales” (figura 3.13). Si se desea realizar una aplicación de

parámetros distinta sólo se deben sobrescribir dichos parámetros y punto de

origen. Hecho esto sólo basta con pulsar siguiente y elegir una tabla de datos

en formato .dbf que contenga los campos Punto, E1, N1. Luego de esto se

podrán exportar los resultados a un archivo de extensión escogida por el

usuario tal como se muestra en la figura 3.14 en donde E2CALCULAD y

N2CALCULAD representan las coordenadas calculadas, en base a los

parámetros antes estimados, para dos puntos de control dados.

99

Figura 3.13. Transformación bidimensional de coordenadas.


Figura 3.14.Tabla de datos exportados.

Fuente: Microsoft Excel.

100

3.4.2 Automatización de parámetros verticales.

a- Estimación de parámetros verticales La estimación de parámetros verticales se encuentra en el ítem “estimación de

parámetros” ”parámetros verticales”, abriendo la ventana mostrada en la figura

3.15.

Figura 3.15. Estimación parámetros verticales Arcview.

Fuente: Arcview Gis 3.3.

Se encuentran programadas 4 tipos de regresiones aptas para:

• Zonas en general: Cualquier extensión de terreno que se requiera

estimar parámetros verticales.

• Línea de nivelación E-O: en el caso que se requiera estimar

parámetros verticales de líneas de nivelación orientadas Este- Oeste.

• Línea de nivelación N-S : en el caso que se requiera estimar

parámetros verticales de líneas de nivelación orientadas Norte- Sur

• Línea nivelación general: en el caso que se requiera estimar

parámetros verticales de líneas de nivelación sin orientación definida.

101

Luego de seleccionar cualquiera de las opciones y hacer clic en “siguiente”, se

muestra una caja de diálogo en donde, indistintamente del tipo de regresión

seleccionado, se requerirá el archivo en el que se encuentran los datos con los

cuales se quiera hacer la regresión. Estos datos deben estar formato .dbf y

tener datos como Punto, Este, Norte, altura elipsoidal y altura ortométrica

(Figura 3.16).

Figura 3.16. Caja de diálogo Estimación vertical.


Luego de dar “OK”, se busca y agrega el archivo con los datos requeridos. Al

realizar esta acción se despliega de inmediato, la siguiente ventana informativa:

Figura 3.17. Centroide automatizado, obtenido de datos insertados para realizar regresión.


102

En la figura 3.17, se tiene el centroide calculado automáticamente del archivo

de puntos que se acaba de insertar y que obedece a la explicación teórica y de

desarrollo, expuesta en secciones anteriores de esta memoria. Al hacer clic en

“OK” en el cuadro de diálogo del centroide calculado, Arcview preguntará si se

desea guardar la tabla creada con la transformación realizada, la que se debe

guardar con la misma extensión .dbf. Ésta luego de ser guardada, se abrirá

automáticamente junto con la página.

“http://www.wessa.net/rwasp_multipleregression.wasp”

Donde se encuentra Múltiple Regression - Free Statistics Software (Calculator).

b- Utilización de Multiple Regression - Free Statistics Software (Calculator).

Antes de explicar la utilización de este software libre, se debe entender que está

calculadora de regresión múltiple, entrega valores muy similares a los

realizados manualmente y expuestos en esta memoria.

A continuación se describirán los módulos de utilización de Multiple Regression

- Free Statistics Software (Calculator), combinado con la programación hecha

en Arcview GIS 3.3, para la estimación de parámetros verticales.

103

Figura 3.18. Módulos de utilización de Multiple Regression - Free Statistics Software (Calculator).


1- Send output to: se selecciona el formato de salida de los resultados de

la regresión.

2- Data X: se insertan los valores de los “deltas” que entrega la tabla que se

abre junto con la calculadora. Estos se encuentran separados por

104

columnas, incluyendo la variable a la que se le desea aplicar la regresión

(altura ortométrica), como muestra la siguiente figura:

Figura 3.19.Valores a insertar en calculadora.


En donde los parámetros encerrados, son los que se copian y pegan en el

módulo 2 de Multiple Regression - Free Statistics Software (Calculator).

3- Names of X columns: Se introduce el nombre de cada variable.

4- Sample Range: Rango de las observaciones.

5- Column Number of Endogenous: Número de la columna donde se

encuentra la variable que se le desea aplicar la regresión

6- Fixed Seasonal Effects: Efectos predeterminados en página.

7- Type of equation: Se selecciona el tipo de ecuación que desea aplicar.

105

8- Chart option: Resolución de gráficos.

Luego de verificar los 8 módulos, se procede a hacer clic en “Compute”, para la

obtención de los parámetros. La calculadora entrega las siguientes tablas de

resultados, resumidos en la figura 3.20:

Figura 3.20. Resultados entregados por Multiple Regression - Free Statistics Software (Calculator).


En donde:

1. Entrega la función de regresión múltiple general con los correspondientes

parámetros estimadores de cada variable.

106

2. Entrega los parámetros para cada variable, varianza residual para cada

parámetro y contraste de la t.

3. Coeficientes de determinación y correlación corregida, contraste de la F y

varianza residual del modelo.

Además de lo anterior, Multiple Regression - Free Statistics Software

(Calculator), entrega la validación de los mismos puntos que se utilizaron en el

modelo, mediante la siguiente tabla que se muestra en la figura 3.21:

Figura 3.21. Tabla de validación.


Como se menciono en el punto 1 de la figura 3.21, se pueden exportar los

resultados entregados por la página, a diferentes formatos, como planillas

Excel, en formato de textos, etc.

107

c- Aplicación de parámetros para transformación vertical.

Con los parámetros obtenidos de la página, se procede a la transformación

vertical. Ésta transformación es básicamente el traspaso de altura elipsoidal a

altura ortométrica, para esto, el único requerimiento es tener un archivo .dbf que

contenga datos como nombre del Punto, Este, Norte y altura elipsoidal.

Al igual que la transformación planimétrica, al acceder a la transformación

vertical (“Transformación” “E,N,helip E,N,Hortometrica”) se abre un cuadro

en donde se encuentran los parámetros de la última estimación vertical

realizada. En el caso que se haya realizado cualquier otra operación, se deberá

ingresar los datos del centroide de forma manual como se muestra en la figura

3.22 (primer recuadro segmentado)

Figura 3.22. Caja transformación vertical.


108

También en la figura 3.22, el segundo recuadro segmentado es donde se deben

copiar los parámetros entregados por Multiple Regression - Free Statistics

Software (Calculator), los que fueron mostrados en el punto 2 de la Figura 3.18.

Luego de aplicada la transformación, se procede a guardar la nueva tabla

creada, en donde básicamente es la misma que se inserto, pero ahora con una

nueva columna llamada Hort, que contiene el valor de la altura ortométrica a

través de parámetros estimados localmente (Figura 3.23)

Figura 3.23. Resultado transformación vertical en Arcview.


3.4.3 Datos desplegables a la vista.

Todas las aplicaciones antes mencionadas presentan la posibilidad de traer a la

vista los datos, utilizados para estimar parámetros, o calculados a través de

parámetros antes establecidos, siempre y cuando se encuentren bajo el

109

elipsoide de referencia WGS84 (o similar Ej. GRS80) y estén proyectados en

UTM Zona 19 sur. Las capas geográficas de Chile utilizadas fueron obtenidas

de la página Web.

“http://berlin.dis.ufro.cl/catalogo/c01fichas/c01av_utm.html”

Todas las coberturas fueron elaboradas sobre la base del Mapa digital del

Mundo (DCW, Digital Chart of the World), un proyecto realizado por la Empresa

ESRI (Environmental Systems Research Institute, Inc.) para la Agencia de

Cartografía de Defensa de los Estados Unidos (DMA, US Defence Mapping

Agency)

La cartografía del Mapa Digital del Mundo fue elaborada en el año 1993 a la

escala 1:1.000.000. Las coberturas de los límites exteriores y de las costas

continentales tienen su origen en el Mapa Digital del Mundo, tanto como las de

los Ríos, Esteros, Lagos, Salares y Quebradas. Todas las demás coberturas

fueron digitalizadas en el Laboratorio SIG de La Facultad de Ingeniería,

Ciencias y Administración de La Universidad de la Frontera (Temuco – Chile)

Si se ha aceptado la importación de archivos a la vista entonces se le

consultará donde se encuentra el archivo que contiene las coordenadas para

ser graficadas. Luego de elegir el archivo se desplegará en pantalla la ventana

“Add Event Theme” en donde se debe seleccionar la tabla antes importada y los

campos X e Y

110

Figura 3.23. Add Event Theme.


Hechos los arreglos anteriores se desplegarán en la vista los puntos importados

y tabla de datos de estos.

Figura 3.23. Vista de puntos importados a las capas. Fuente: Arcview Gis 3.3.

111

CAPITULO IV – ANALISIS DE RESULTADOS.

4.1 ANTECEDENTES

En el desarrollo del modelo de regresión múltiple, visto en el capítulo 3, se

analizó la bondad de los modelos para la aplicación 1 y aplicación 2. Esto a

través de fundamentos estadísticos tales como: varianza residual, contrastes

individuales de la t, contraste conjunto de la F y coeficientes de determinación y

de correlación. En donde los resultados obtenidos se consideraron favorables.

Por lo que en este capítulo se contrastarán los resultados de los modelos de

regresión múltiple con los resultados obtenidos a través del software TGO.

Además se validarán los parámetros de los modelos con puntos de control

establecidos en la misma zona.

Debido a que la aplicación 1 es un área de estudio, mientras la aplicación 2 es

una línea de nivelación, se podrá realizar en la primera, un análisis nemotécnico

(o de más fácil apreciación por parte del lector) de la distribución espacial de los

residuos obtenidos por el ajuste local GPS TGO y del modelo de regresión

múltiple realizado.

4.2 ANÁLISIS APLICACIÓN 1: ZONA ESTUDIO REGIÓN METROPOLITANA. 4.2.1 Contraste residuos TGO y Modelo de regresión múltiple. Luego de haber desarrollado el modelo de regresión múltiple para la aplicación

1 y después de ajustar verticalmente los puntos con el software TGO, se obtuvo

el siguiente grafico de comparación de residuos:

112

-0.02

-0.015

-0.01

-0.005

0

0.005

0.01

0.015

0.02

A B C D 1 6 7 8 9

Residuos modelo Residuos TGO

Gráfico 4.1. Comparación Residuos Modelo de regresión v/s Residuos TGO.


Del grafico 4.1 se concluye que en todos los puntos que se utilizaron para la

construcción, tanto del modelo aplicación 1 como para el plano TGO, los

residuos de aplicación 1 son mucho menores y tienden a 0. Además es

imprescindible analizar la magnitud de estos residuos (o discrepancias) y

compararlos con valores de tolerancia propuestos para un determinado

proyecto de ingeniería. Un buen estimador para esto es el que considera que la

tolerancia en la obtención de alturas a diferentes escalas es 1/8 de la

equidistancia entre curvas de nivel. Como muestra la siguiente tabla:

Tabla 4.1. Tolerancias altimétricas dependiendo de la escala.

Escala Plano Equidistancia(m) Tolerancia(m) 1:10000 10 1.250 1:5000 5 0.625 1:2000 2 0.250 1:1000 1 0.125 1:500 0.5 0.063

113

En base a las discrepancias obtenidas, tanto en el modelo de la aplicación 1

como el modelo TGO, y las tolerancias expuestas en la tabla 4.1 se concluye

que los dos ajustes son validos de ser utilizados en proyectos de ingeniería de

escalas menores a 1:500.

4.2.2 Validación parámetros de estimación Altura ortométrica aplicación 1. Los parámetros de estimación de altura ortométrica obtenidos en el modelo

aplicación 1 tienen validez dentro de la zona de estudio y se espera que los

valores que se extrapolen fuera de la zona no sean, en magnitud, tan

favorables.

Para comprobar lo anterior se establecieron 56 puntos de control, de estos 26

están ubicados fuera de la zona de estudio. Estos 56 puntos están distanciados

desde 1.2km hasta 11.5km desde el centro del área estudiada y se encuentran

distribuidos homogéneamente evitando así zonas sin información.

Aplicando el modelo los residuos oscilan entre 0m y 0.23m. Encontrándose los

mayores residuos en los puntos ubicados a más de 7km de la media, es decir,

los que se ubican fuera de la zona de estudio. De esta forma queda demostrado

que la aplicación de los parámetros fuera del perímetro de 7km entregará

discrepancias fuera de las tolerancias impuestas en 4.1.1

Además, con estos 56 puntos, se establecieron 8 subzonas (figura 26)

determinadas por la distancia al centro, en donde se comparó y determinó la

precisión del modelo obtenido, para la aplicación 1 versus el ajuste vertical el

software TGO.

114

Figura 4.1. Subzonas establecidas por distancia a su centro.


En la tabla 4.2 se muestran las precisiones y en donde se infiere que dentro de

la zona de 100 km2, el modelo de la aplicación 1 entrega mejores resultados, no

obstante en los resultados fuera de él, el software TGO se comporta de mejor

forma. Tabla 4.2. Precisiones modelo aplicación 1 v/s TGO, por subzonas.

Intervalo (m) RMS Modelo RMS TGO 0-1500 0,002 0,013

1501-3000 0,002 0,012 3001-4500 0,004 0,008 4501-6000 0,004 0,004 6001-7500 0,008 0,010 7501-9000 0,083 0,022 9001-10500 0,065 0,034 10501-12000 0,120 0,032

115

Figura 4.2. Distribución espacial de residuos aplicación 1 aplicada a los 56 puntos.


Figura 4.3. Distribución espacial de residuos TGO aplicada a los 56 puntos.


116

A continuación se mostrará en las figuras 4.4 y 4.5 la distribución espacial de

los residuos para el modelo aplicación 1 y para el plano TGO, respectivamente.

Figura 4.4. Distribución espacial de residuos en valor absoluto

de la aplicación 1, en los 100 km2 de la zona de estudio.


Figura 4.5. Distribución espacial de residuos en valor absoluto

del software TGO, en los 100 km2 de la zona de estudio.


117

4.2.3 Intervalos de confianza y de predicción. A la hora de interpolar un valor a través de un modelo de regresión múltiple es

necesario razonar que es lo que se busca, es así como nacen dos posibles

situaciones estimar o predecir.

Estimar la media de la distribución condicionada de txXY rr=/ . Esto es, se

quiere estimar el parámetro )/()( tt xXYExm rrr== y poder establecer cual es la

Altura ortométrica media de un punto de coordenadas Estei, Nortei, hi. Esta

estimación es entregada a través de un intervalo de confianza a un tanto por

ciento.

Predecir el valor de la variable respuesta en un individuo del que se conoce que

hxX rr= . Esto es, se quiere predecir un valor de la variable condicionada

hxXY rr=/ .Con lo que se quiere establecer cual es la altura ortométrica que se

predice para un punto de coordenadas Estei, Nortei, hi. Esta predicción es

entregada a través de un intervalo de predicción a un tanto por ciento. A

continuación se sacaron muestras de cada subzona, desarrollada en 4.1.2, de

manera de ver con que intervalo de confianza y predicción se esta comportando

el modelo. Para esto se tiene los siguientes valores de altura ortométrica para

cada punto de muestra:

Tabla 4.3. Altura ortométrica de puntos muéstrales.

Punto H 1.5kmE 631 3kmE 669

8(4.5KM) 700 6kmE 775

7.5kmN 702 9kmN 632

10.5kmS 589

12kmN 1060

118

En donde la estimación de la media de la distribución condicionada y la

predicción del valor de altura ortométrica, para cada muestra, viene dada en la

tabla 4.4 con su correspondiente varianza:

Tabla 4.4. Estimación y predicción para muestras.

Punto Xt = Xh yt SR med.

Cond.(m) SR

predi.(m)

1.5kmE (354980.146,6294733.2915,658.437) 631.000 0.002 0.005

3kmE (356035.1795,6294476.2539,696.522) 669.001 0.002 0.005

8(4.5KM) (356150.01,6292285.25,727.516) 700.002 0.002 0.005

6kmE (358352.4284,6297120.2144,802.74) 774.997 0.002 0.005

7.5kmN (356463.7346,6300349.7043,729.621) 702.003 0.003 0.005

9kmN (350675.1759,6302415.9201,659.195) 632.013 0.004 0.005

10.5kmS (346872.1471,6287438.4586,615.744) 589.009 0.004 0.005

12kmN (360987.9625,6302875.7012,1088.031) 1059.982 0.007 0.008

Obteniéndose así los siguientes intervalos de confianza con su correspondiente

amplitud (longitud):

Tabla 4.5.Intervalos de confianza e intervalos de predicción.

Punto Intervalo de confianza longitud intervalo de predicción longitud

1.5kmE 630.998 631.003 0.005 630.990 631.011 0.021

3kmE 668.998 669.003 0.005 668.990 669.011 0.021

8(4.5KM) 700.000 700.005 0.005 699.992 700.013 0.021

6kmE 774.994 775.000 0.006 774.986 775.008 0.022

7.5kmN 702.000 702.007 0.007 701.992 702.015 0.023

9kmN 632.005 632.020 0.014 631.997 632.028 0.030

10.5kmS 589.002 589.015 0.013 588.994 589.023 0.029

12kmN 1059.958 1060.006 0.048 1059.950 1060.014 0.064

119

4.3 ANÁLISIS APLICACIÓN 2: LÍNEA DE NIVELACIÓN CUESTA LO PRADO. 4.3.1 Contraste residuos TGO y Modelo de regresión múltiple. A continuación se procede a comparar los residuos entregados por el modelo

de regresión múltiple realizado para la aplicación 2 y el ajuste vertical hecho por

el software TGO (Gráfico 10).

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

GPS1 GPS2 GPS3 E 4 E 8 E 11 E 12 E 15 E 16 E 18 E 20 E 22 E 24

Residuos modelo Residuos TGO Gráfico 4.2. Comparación Residuos Modelo de regresión aplicación 2 v/s Residuos TGO.


En base al gráfico 4.2 se concluye que los residuos entregados por el modelo

de regresión múltiple realizado para la aplicación 2, correspondiente a la cuesta

Lo Prado, son mucho menores que los entregados por el ajuste vertical

realizado con el software TGO. Además, la varianza residual obtenida por el

modelo de regresión es menor a la obtenida por el software TGO. Sin embargo

ambos ajustes están dentro de las tolerancias altimétricas según lo explicado en

4.1.1.

120

4.3.2 Validación parámetros de estimación Altura ortométrica. Para realizar la validación de parámetros de alturas ortométrica obtenidas por

regresión múltiple en la línea de nivelación cuesta Lo Prado, se dispuso puntos

dentro y fuera de ella. En total son 13 puntos de control, como se aprecia en la

figura 4.6.

Figura 4.6. Puntos de control cuesta Lo Prado.

Fuente: Google Earth.

Aplicando el modelo realizado a los puntos de control, los residuos oscilan entre

0 y 0.013m. Como se muestra en la siguiente tabla:

121

Tabla 4.6. Puntos de control cuesta Lo Prado, aplicando modelo de regresión.

Hregre (m) H (m) residuos (m)

GPS5 182.514585 182.503 0.012

GPS6 190.397606 190.403 -0.005

GPS4 827.371495 827.358 0.013

E 3 565.503694 565.504 -0.001

E 5 707.608463 707.617 -0.008

E 6 737.943189 737.946 -0.003

E 7 742.284345 742.287 -0.003

E 13 348.847937 348.848 0.000

E 14 328.659257 328.660 -0.001

E 17 236.004492 236.003 0.001

E 19 206.823444 206.825 -0.002

E 21 197.335724 197.341 -0.006

E 23 186.156918 186.156 0.001

Los puntos GPS4, GPS5 Y GPS6, son los que tienen los residuos más grandes,

debido a que se encuentran fuera de de la línea de nivelación. El resto de los

puntos de control se encuentran dentro de la precisión lograda por el modelo

(0.008m).

122

CAPITULO V – CONCLUSIONES Y RECOMENDACIONES.

5.1 CONCLUSIONES.

Debido al cada vez más masivo uso del sistema de posicionamiento global y del

desarrollo de este en materia de precisión en la obtención de datos

planimétricos y altimétricos, se hace necesario y útil el aprovechamiento de esta

tecnología. En este tema y centrándonos en la obtención de altura ortométrica,

hasta que no se tenga un pleno conocimiento físico de la superficie terrestre, los

modelos matemáticos de interpolación, extrapolación y finalmente predicción

son los que posibilitan el uso de la tecnología GNNS en obras de ingeniería.

Según el principio de propagación de errores, la calidad final del proceso de

estimación y residuos resultantes estará limitado por la fuente de donde son

obtenidos los datos involucrados en el modelo. Para la aplicación 1 dependerá

directamente de la distribución uniforme, en cada punto, de la precisión del

modelo geoidal global EGM96, mientras que para la aplicación 2 depende del

método de obtención de desniveles, a través de mediciones trigonométricas,

utilizado.

Aplicados los dos modelos, Modelo de regresión múltiple y Ajuste vertical

software TGO, para la obtención de altura ortométrica, basado en los mismos

puntos, se tiene que:

• El objetivo principal de este trabajo de memoria está cumplido al ser

capaz de calcular la altura ortométrica de un punto del que se conocen

sus coordenadas planimétricas y su altura elipsoidal (posicionamiento

GPS) y que la precisión entregada es apta para aplicaciones

cartográficas a escalas menores a 1:500.

123

• Con respecto a los resultados obtenidos en “términos residuales” entre el

modelo de regresión múltiple y el software TGO, para puntos que se

encuentren dentro de la zona de estudio (o línea de nivelación) Se

verifica que serán más pequeños los que entregue el modelo de

regresión. Siendo ambos modelos factibles de ser mejorados a través de

una muestra mejor distribuida geográficamente así como también por la

incorporación de nuevos puntos.

• Fuera de la zona de estudio el modelo de regresión múltiple pierde cierto

grado de confianza (la magnitud de esta pérdida será directamente

explicada por el relieve de la zona) es por esto que se le recomienda al

lector, para datos extrapolados, la utilización de un modelo que minimice

esta pérdida en la precisión, como por ejemplo, el ajuste vertical

realizado por el software TGO.

• La precisión resultante para los parámetros son acordes con los residuos

obtenidos de las alturas ortométricas estimadas.

El modelo puede ser realizado indistintamente en cualquier proyección

cartográfica. Quedando propuesta la hipótesis de que al utilizar una proyección

con menor deformación, se obtengan mejores resultados.

Con respecto a la zona y línea de nivelación estudiada (Aplicación 1 y

Aplicación 2) cabe señalar que están situadas en zonas de alta variación de

relieve (Aplicación 1 en el piedemonte del valle de Santiago, mientras que la

aplicación 2 en una cuesta montañosa) también es necesario mencionar que en

estas dos aplicaciones se utilizaron una pequeña cantidad de datos de entrada

(en comparación con la zona o línea de nivelación a cubrir) con lo que, aunque

se distribuyó de la mejor forma los datos que se disponían, no se logró evitar

124

dejar zonas sin información. Todo lo anterior implica que los modelos

matemáticos fueron puestos a prueba bajo condiciones adversas, y explica los

resultados ya expuestos. Es así, como cabe esperar que en condiciones más

favorables, o de menor relieve, los modelos entreguen mejores resultados. Así

como también se lograría un resultado mas favorable, con la introducción de

mas datos de entrada, característica (desventaja por lo general) de los modelos

de regresión múltiple.

Con respecto al modelo matemático utilizado (regresión múltiple) cabe señalar,

o mejor dicho repetir y recalcar, que es un modelo altamente efectivo en la

mayoría de las situaciones, pero del cual se debe tener gran cuidado en sus

resultados y conclusiones. Esto se debe a que al ser un modelo que se adapta

a cada dato de entrada (no realiza un plano definido) ante la presencia de

errores presentes en los datos con que se construyó el modelo, este se

adaptará incluso a estos errores. Con lo que los resultados no serán los reales,

para evitar esto es indispensable realizar los estudios estadísticos señalados en

esta memoria. Así por ejemplo, si se realiza una revisión de los residuos

obtenidos se podrá concluir que datos pueden presentar errores y así ser

eliminados del modelo. Este tipo de modelo es susceptible de ser mejorado, al

introducir variables nuevas o de mayor orden.

Respecto a la estimación de parámetros, precisiones y resultados en general,

para los modelos de regresión múltiple (aplicación 1 y aplicación 2) Estos

fueron calculados y aplicados en hojas de cálculo de Microsoft Excel. Mientras

que para la automatización, de estos mismo cálculos, se hizo uso de la página

Web “www.wessa.net” (sección regresión múltiple) creada por el Profesor. Dr.

P. Wessa. Obteniéndose resultados semejantes. La aplicación efectiva de los

parámetros fue realizada en Arcview GIS 3.3 confirmando que las diferencias

125

en la altura ortométrica, calculada, de los puntos de control se mantienen en la

aplicación en órdenes similares.

Finalmente, dentro de este trabajo de título, el rol del Ingeniero Geomensor se

rige sobre dos grandes ítems que si bien se entrelazan son necesarios separar:

la componente práctica y la componente teórica.

• El segmento práctico es el que lleva a cabo la mayor parte del trabajo.

Este segmento toma al Ingeniero Geomensor como el experto en todo

tipo de medición, topográfica o geodésica, e interpretación de planos,

cartas y mapas. Es así como debe ir a la par con el desarrollo de las

nuevas tecnologías, conocer sus aplicaciones, y participar, directamente

o dando apoyo logístico, en todo el proceso de un proyecto de ingeniería.

Este proceso puede ser simplificado como: Planificación Ejecución

Análisis Producto final.

• La componente teórica del Ingeniero Geomensor, en especial del

perteneciente a la universidad de Santiago de Chile, le permite a este

profesional, ante un problema que exija una pronta solución, contar con

más de una técnica estándar de resolución, y en el caso que estas no

existiesen, idear técnicas alternativas, basadas en el conocimiento

científico adquirido en su etapa formativa.

De forma concreta, en este trabajo de título, el Ingeniero Geomensor debe

poseer un conocimiento, para la ejecución o interacción con otros profesionales,

en:

• Mediciones geodésicas y post-proceso de estas.

126

• Mediciones topográficas (nivelación geométrica o en su defecto

trigonométrica) y post-proceso de estas.

• Proyecciones cartográficas para la adecuada unificación de

mediciones geodésicas y topográficas.

• Ajustes, basados en la minimización de errores, para la obtención de

los datos finales provenientes de las mediciones hechas en terreno.

• Inferencia estadística, modelos alternativos, estudio probabilístico.

• Algún/os lenguaje/s de programación que sea/n capaz (capaces) de

automatizar y así abaratar los gastos en termino de cálculo

matemático que conlleven las técnicas alternativas elaboradas.

• En el caso de contar con más de una técnica de solución, el Ingeniero

Geomensor debe poder tomar una decisión, basado en, calidad,

rendimiento, tiempo y costos. En torno a lo anterior se presenta en la

sección de ANEXOS un estudio de tiempo y costos para una

campaña en cuesta Lo Prado.

5.2 RECOMENDACIONES.

Como en todo trabajo de ingeniería es preciso el reconocimiento del terreno

antes de establecer las posiciones de los puntos que entrarán en el modelo, de

modo de asegurar la distribución homogénea de datos, y en el caso de una

zona de gran relieve, evitar así zonas sin información.

127

Verificar la calidad de la muestra de datos con que se realizará el modelo ya

que la precisión esperada no será mejor que la de la muestra.

En el caso de una línea de nivelación se noto la mejoría del modelo al introducir

las variables distancia y distancia al cuadrado, ya que por fundamentos

estadísticos explicados en esta tesis, influyen en la obtención de altura

ortométrica.

En el caso de una línea de nivelación se recomienda verificar la orientación de

esta ya que dependiendo de lo anterior se tienen las siguientes situaciones:

• Si la línea presenta una dirección Norte-Sur la variable Este no será

necesario introducirla al modelo.

• Si la línea presenta una dirección Este-Oeste la variable Norte no será

necesario introducirla al modelo.

• Si no se da ninguno de los casos anteriores las dos variables son

significativas, y será necesario introducirlas al modelo.

128

ANEXOS. Estudio de tiempo y costos para una campaña en cuesta Lo Prado.

En esta sección se ha querido otorgar al lector una guía de los procedimientos

que se llevarían a cabo en una campaña en cuesta Lo Prado. Así fijado el

procedimiento se establece un estudio de tiempo y costos. Para este estudio se

recurrió a dos fuentes, la primera un Ingeniero Geomensor titulado de la

universidad de Concepción, el que se desempeña actualmente realizando este

tipo de trabajos (levantamientos geodésicos, taquimétricos, y nivelaciones); y la

segunda una empresa de arriendo de instrumental topográfico/geodésico para

así establecer el desglose debido a este ítem.

COTIZACION 1: Línea de de nivelación con apoyo de puntos GPS. Especificaciones de la ejecución del trabajo:

• La toma de los 13 puntos señalados en la fotografía aérea

monumentados y medidos con GPS Geodésico Topcon de doble

frecuencia, con lo cual se obtendrá coordenadas y altura elipsoidal de los

puntos.

• Se hará nivelación geométrica de los 13 puntos ocupando como

referencia algún punto de nivelación del IGM cercano al sector de

trabajo.

• La duración del trabajo en terreno será de 10 días y 2 días para la

confección de plano e informe.

129

• La presentación del trabajo se entregará en tres copias de planos a la

escala 1:2000 y con respaldo de los archivos digitales en Autocad 2004 y

2007.

• Se hará entrega de planillas en formato Excel donde estarán los

descriptores, coordenadas y alturas de los puntos tomados en la línea.

• Cada punto tendrá sus correspondientes monografías (coordenadas y

altura)

• Se dejarán a lo menos 6 PRS en terreno para efectos de inspección o

futuros Levantamientos y replanteos topográficos.

Honorarios: Los honorarios para la línea de nivelación con apoyo de puntos GPS, tiene un

costo de $1.850.000 más el 10% de impuesto.

COTIZACION 2: Línea de nivelación geométrica. Especificaciones de la ejecución del trabajo:

• La toma de los 13 puntos señalados en la fotografía aérea

monumentados y medidos con nivelación geométrica.

• Se hará nivelación geométrica de los 13 puntos ocupando como

referencia algún punto de nivelación del IGM cercano al sector de

trabajo.

130



• Cada punto tendrá sus correspondientes monografías (coordenadas de

precisión de navegador GPS para su futura ubicación)

Honorarios:

Los honorarios para la línea de nivelación geométrica, tiene un costo de

$1.250.000 más el 10% de impuesto.

Presentación:

Expediente con la siguiente información:

• Informe topográfico.

• 3 copias de planos.

• CD que contiene archivos digitales de los planos, monografías e informe.

• Copia de patente municipal

Hasta el momento se dispone de dos cotizaciones, la primera indica el gasto en

el que debe incurrir el mandante, para así, establecer una pequeña cantidad de

puntos nivelados y geodésicamente ubicados. Este proceso debe ser realizado,

para que así, se disponga de datos de partida en la construcción del modelo

matemático que densificará futuros puntos. La segunda cotización indica el

coste en el que deberá incurrir el mandante en una futura densificación de

131

puntos (nivelación geométrica, replanteo trigonométrico a través de estación

total, posicionamiento GPS de baja precisión). Es preciso aclarar que se

realizará una comparación de costos y tiempo entre la densificación de futuros

puntos a través del modelo matemático versus una nivelación geométrica, esto,

debido a la información con que se dispone.

COTIZACION INSTRUMENTAL TOPOGRAFICO/GEODESICO.

Instrumental Marca / Modelo Valor Diario

Valor Semanal

Valor Quincenal

Valor Mensual

GPS GEODESICO

SIMPLE FRECUENCIA Incluye: 2 antenas colectoras, trípode, jalón o trípode, bases

nivelarte, cables de comunicación, software post proceso. Cheque

Garantía por 2.500.000 o en blanco

SPECTRA

PRECISIÓN EPOCH-10

$35.000

$180.000

$260.000

$380.000

GPS DOBLE FRECUENCIA

Incluye: 2 antenas colectoras, trípode, jalón o trípode, base

nivelantes, cables de comunicación, software post proceso.

Cheque Garantía por 8.000.000 o en blanco

TOPCON

CGD

$72.000

$390.000

$720.000

$1.400.000

Estación Total

Incluye: Cable comunicación, batería, cargador, trípode madera, jalón 4,7m, prisma, porta prisma

Documento en garantía por

2.500.000

Topcon GTS-212 Topcon GTS-229 Pentax PCS1215 Nikon DTM 332 Constructor 500 Constructo 600 Geodimiter 600 Trimble 3605 Trimble 605M Topcon 3007

$20.000 $20.000 $17.000 $18.000 $20.000 $20.000 $22.000 $22.000 $22.000 $22.000

$125.000 $125.000 $100.000 $115.000 $125.000 $125.000 $125.000 $135.000 $135.000 $135.000

$190.000 $190.000 $150.000 $165.000 $235.000 $235.000 $235.000 $260.000 $260.000 $260.000

$280.000 $280.000 $250.000 $260.000 $300.000 $300.000 $300.000 $350.000 $350.000 $350.000

NIVEL Automático Incluye

Trípode y mira

Documento en garantía por 250.000

NEDO N-24 NEDO X-24

BERGER N-24 PENTAX AL-320

$3.500 $3.500 $3.500 $4.000

$18.000 $18.000 $18.000 $20.000

$26.000 $26.000 $26.000 $30.000

$35.000 $35.000 $35.500 $42.000

132

Si se restan los honorarios de la cotización 1 con los de la cotización 2 se

obtendrán $600.000 que corresponde al valor que se esta cobrando en un

levantamiento geodésico realizado en tres días. Ahora si al resultado anterior se

le resta el costo debido al arriendo del instrumental necesario ($216.000 por los

tres días) se ontendrán $384.000 que corresponderá al costo explicado por

transporte, alarife/s, otros. Con estos datos es posible construir una nueva

cotización para la densificación de puntos.

COTIZACION 3: Densificación GPS y aplicación modelo matemático para la obtención de altura ortométrica. Especificaciones de la ejecución del trabajo:

• Toma de puntos señalados, monumentados y medidos con GPS

Geodésico de doble frecuencia, con lo cual se obtendrá coordenadas y

altura elipsoidal de los puntos.

• Se aplicará modelo matemático, construido con datos entregados por el

mandante, para conocer la altura ortométrica de los puntos densificados.



• La presentación del trabajo se entregará en tres copias de planos a la

escala 1:2000 y con respaldo de los archivos digitales en Autocad 2004 y

2007.

• Se hará entrega de planillas en formato Excel donde estarán los

descriptores, coordenadas y alturas de los puntos tomados en terreno.

133

• Cada punto tendrá sus correspondientes monografías (coordenadas y

altura)

Honorarios: Los honorarios para la densificación GPS y aplicación modelo matemático para

la obtención de altura ortométrica, tiene un costo de $850.000 más el 10% de

impuesto.

Presentación:

Expediente con la siguiente información:

• Informe geodésico.

• 3 copias de planos.

• CD que contiene archivos digitales de los planos, monografías e informe.

134

Anexo: Distribución de la 2א. Fuente: E.S. Pearson, Tables of the Percentage Points of 2א the Distribution, Biometrika, vol.32

135

Anexo: Distribución de la t-student Fuente: E.S. Pearson, Critical values of Student's t Distribution, Biometrika, vol. 32

136

Anexo: Distribución de la F (parte1) Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol.32

137

Anexo: Distribución de la F (parte2) Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol32.

138

Anexo: Distribución de la F (parte3) Fuente: E.S. Pearson, Tables of the Percentage Points of the Inverted Beta (F) Distribution, Biometrika, vol2.

139

BIBLIOGRAFIA. - Gunter Seeber, 2003, Satellite Geodesy, Walter de Gruyter, Berlin-New York

2003

- Zepeda Rene, 2004, Geodesia Satelital.

- Memoria de título, 2003, “Estudio y aplicación de modelos geoidales como

marco de referencia vertical para Chile” Garafulic Caviedes, Pedro Andrés.

- Manual de Carreteras VOL. II, 2001, Dirección de Vialidad, Ministerio de Obras

Publicas, Chile.

- LEN Y ASOCIADOS Ingenieros Consultores, H. Lange y R. Zepeda, Manual

de procedimiento para mejorar la precisión en las determinaciones altimétricas

mediante GPS en Chile usando un modelo Geoidal.

- Zakatov, P. S. Curso de Geodesia Superior, Editorial Rubiños 1860 S.A.

- Peter Vanícek, Marcelo Santos, Robert Tenzer, Antonio Hernández Navarro,

Algunos Aspectos Sobre Alturas Ortométricas y Normales

- Ignacio alonso Fernández-coppel, Las coordenadas geográficas y la

proyección UTM. El Datum, Universidad de Valladolid.

- Richard L. Burden y J.Douglas Faires, Análisis Numérico, Editorial Thomson

Learning Séptima Edición.

- Donald J. Koosis, Elementos de inferencia estadística, Editorial Limusa.

140

- Sistemas Geodésicos. Comité Nacional de la Unión Geodésica y Geofísica

Internacional .1era edición 1999.

- Technical report nº12 (“http://www.iers.org”)

- Publicaciones SIRGAS (http://www.sirgas.org)

-Documentos y revistas, departamento de matemáticas, Universidad de

Cataluña, (“http://dm.udc.es/mate/”)

- Alejandro Vasallo y Juan M. Vilar Fernández, 2006, Bancos y Cajas de

Ahorro: modelización del margen de beneficio por regresión múltiple. Análisis

comparativo ,

-Memoria de título, Universidad Técnica Metropolitana, 2006, “Diagnóstico del

uso de proyecciones transversales de Mercator en escalas urbanas” Sebastian

Fuentes.

-Memoria de título, Universidad de Santiago de Chile, 2003, “Evaluación de la

aplicación de un huso TM para chile continental, aplicable a cartografía del

ministerio de bienes nacionales” Fernando Millar.

-Memoria de título, Universidad de Santiago de Chile, 2003, “Estimación de los

parámetros de transformación entre los sistema de referencia WGS-84 y PSAD-

56 para una zona de Calama” Marcela Ramírez, Diego Ortiz.

- Memoria de título, Universidad de Santiago de Chile, 2003, “Metodología y

desarrollo para la georreferenciación de un proyecto vial cuesta Lo Prado”

María José Herrera, José Salas.

modelo matematico altura ortom__tesis

Documents