tema 3 ajuste de curvas

20
Guía de estudio Matemática V 19 TEMA 3 POLINOMIOS INTERPOLANTES Y AJUSTE DE CURVAS 3.1. INTERPOLACIÓN En el subcampo matemático del análisis numérico, se denomina interpolación a la construcción de nuevos puntos partiendo del conocimiento de un conjunto discreto de puntos. En ingeniería y algunas ciencias es frecuente disponer de un cierto número de puntos obtenidos por muestreo o a partir de un experimento y pretender construir una función que los ajuste. Otro problema estrechamente ligado con el de la interpolación es la aproximación de una función complicada por una más simple. Si tenemos una función cuyo cálculo resulta costoso, podemos partir de un cierto número de sus valores e interpolar dichos datos construyendo una función más simple. En general, por supuesto, no obtendremos los mismos valores evaluando la función obtenida que si evaluásemos la función original, si bien dependiendo de las características del problema y del método de interpolación usado la ganancia en eficiencia puede compensar el error cometido. En todo caso, se trata de, a partir de n parejas de puntos (x k ,y k ), obtener una función f que verifique n k y x f k k , , 1 , ) ( K = = a la que se denomina función interpolante de dichos puntos. A los puntos x k se les llama nodos. Algunas formas de interpolación que se utilizan con frecuencia son la interpolación polinómica, la interpolación lineal (la cual es un caso particular de la anterior), la interpolación por medio de spline o la interpolación polinómica de Hermite. 3.1.1. Interpolación polinómica de Lagrange: En análisis numérico, el polinomio de Lagrange, llamado así en honor a Joseph- Louis de Lagrange, es el polinomio que interpola un conjunto de puntos dado en la forma de Lagrange. Fue descubierto por Edward Waring en 1779 y redescubierto más tarde por Leonhard Euler en 1783. Dado que existe un único polinomio interpolador para un determinado conjunto de puntos, resulta algo confuso llamar a este polinomio el polinomio interpolador de Lagrange. Un nombre más conciso es interpolación polinómica en la forma de Lagrange. Dada un conjunto de n + 1 puntos:

Upload: ibra-higuera

Post on 29-Dec-2015

61 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

19

TEMA 3 POLINOMIOS INTERPOLANTES Y AJUSTE DE CURVAS

3.1. INTERPOLACIÓN

En el subcampo matemático del análisis numérico, se denomina interpolación a la construcción de nuevos puntos partiendo del conocimiento de un conjunto discreto de puntos. En ingeniería y algunas ciencias es frecuente disponer de un cierto número de puntos obtenidos por muestreo o a partir de un experimento y pretender construir una función que los ajuste. Otro problema estrechamente ligado con el de la interpolación es la aproximación de una función complicada por una más simple. Si tenemos una función cuyo cálculo resulta costoso, podemos partir de un cierto número de sus valores e interpolar dichos datos construyendo una función más simple. En general, por supuesto, no obtendremos los mismos valores evaluando la función obtenida que si evaluásemos la función original, si bien dependiendo de las características del problema y del método de interpolación usado la ganancia en eficiencia puede compensar el error cometido. En todo caso, se trata de, a partir de n parejas de puntos (xk,yk), obtener una función f que verifique

nkyxf kk ,,1,)( K==

a la que se denomina función interpolante de dichos puntos. A los puntos xk se les llama nodos. Algunas formas de interpolación que se utilizan con frecuencia son la interpolación polinómica, la interpolación lineal (la cual es un caso particular de la anterior), la interpolación por medio de spline o la interpolación polinómica de Hermite. 3.1.1. Interpolación polinómica de Lagrange: En análisis numérico, el polinomio de Lagrange, llamado así en honor a Joseph-Louis de Lagrange, es el polinomio que interpola un conjunto de puntos dado en la forma de Lagrange. Fue descubierto por Edward Waring en 1779 y redescubierto más tarde por Leonhard Euler en 1783. Dado que existe un único polinomio interpolador para un determinado conjunto de puntos, resulta algo confuso llamar a este polinomio el polinomio interpolador de Lagrange. Un nombre más conciso es interpolación polinómica en la forma de Lagrange.

Dada un conjunto de n + 1 puntos:

Page 2: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

20

))(,(,)),(,( xfxxfx L00 nn

donde todos los se asumen distintos, el polinomio interpolador en la forma de Lagrange es la combinación lineal:

ix

)()()()(:)( 000

xLyxLyxLxfxP nnj

n

jj ++== ∑

=L

de bases polinómicas de Lagrange:

)()(

)()(

)()(

)()(

)()(

:)(1

1

1

1

1

1

0

0

,0 nj

n

jj

j

jj

j

jj

n

jii ij

ij xx

xxxxxx

xxxx

xxxx

xxxx

xxxx

xL−−

−⋅

−−

⋅−−

=−−

=+

+

≠=∏ LL

Desventajas de su uso Debido a que el polinomio interpolador de Lagrange ajusta a todos los puntos que le son especificados, en situaciones con una gran cantidad de datos se obtiene un polinomio de grado muy alto, lo cual normalmente resulta impráctico. Es por esta razón que en la práctica no es común utilizar este método, sino que se prefiere ajustar los datos lo mejor posible, utilizando un polinomio de menor grado, incluso si este polinomio no pasa por ninguno de los puntos que le son especificados (pero ajusta en forma aproximada siguiendo algún criterio de optimalidad). Otro problema del polinomio interpolador de Lagrange es lo que se conoce como overfitting (término inglés, algunas veces castellanizado a sobre fiteo): a medida que crece el grado del polinomio interpolador, se percibe una creciente variación entre puntos de control consecutivos, lo que produce que la aproximación entre dos puntos continuos sea muy distinta a la que uno esperaría. A pesar de estos problemas, el polinomio interpolador de Lagrange es muy simple de implemetar y tiene interés teórico más que práctico por su sencillez. Ejemplo:

Construya los polinomios interpolantes de Lagrange para la función f(x) = sen(x) en los puntos x0 = -1.5, x1 = − 0.75, x2 = 0, x3 = 0.75, x4 = 1.5 , evalúe en x = 1.

Solución:

x0 = -1.5 f(x0) = − 0.99749 x1 = − 0.75 f(x1) = − 0.68164 x2 = 0 f(x2) = 0 x3 = 0.75 f(x3) = 0.68164 x4 = 1.5 f(x4) = 0.99749

Page 3: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

21

Con cinco puntos, el polinomio interpolador tendrá, como máximo, grado cuatro (es decir, la máxima potencia será cuatro), al igual que cada componente de la base polinómica. La base polinómica es:

)()(

)()(

)()(

)()()(

40

4

30

3

20

2

10

10 xx

xxxxxx

xxxx

xxxxxL

−−

⋅−−

⋅−−

⋅−−

=

)2/32/3()2/3(

)4/32/3()4/3(

)02/3()0(

)4/32/3()4/3(

−−−

⋅−−

−⋅

−−−

⋅+−

⋅+=

xxxx

xxxx91

272

8116

24332 234 +−−=

)()()()( 413121011 xxxxxxxx −−−−

)()()()()( 4320 xxxxxxxxxL −⋅

−⋅

−⋅

−=

)2/3()4/3()0()2/3()2/34/3()4/34/3()04/3()2/34/3( −−

−⋅

−−−

⋅−

⋅⋅+

=xxxx

−−+−

xxxx98

2732

8132

243128 234 −++−=

)()(

)()()( 42

4

321202 xxxx

xxxxxx −−

⋅)()()(

)( 3102

xxxxxxxL

−−

⋅−−

⋅−−

=

)2/30()2/3(

)4/30()4/3(

)4/30()4/3(

)2/30()2/3(

−−

⋅−−

⋅++

⋅+

⋅+=

xxxx

1920

8164 24 +−= xx

)()(

)()(

))()(

43

4

23

2

1 xxxx

xxxxxxxx

−−

⋅−−

⋅−−

()()(

3

1

03

03 xxxx

xL−

⋅−

=

)2/3)2/3()0()4/3()2/3(

−4/3()04/3()4/34/3()2/34/3(−

⋅−−

⋅+

⋅⋅+

=xxxx

++

xxxx98

2732

8132

243128 234 ++−−=

)()(

)()(

)()(

)()(

)( 32104 xx

xxxxxx

xxxx

xxxx

xL−−

⋅−−

⋅−−

⋅−−

= 34241404

Page 4: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

22

)4/32/3()4/3(

)02/3()0(

)4/32/3()4/3(

)2/32/3()2/3(

−−

⋅−−

⋅++

⋅+

⋅+=

xxxx

xxxx91

272

8116

24332 234 −−+=

Así, el polinomio interpolador se obtiene simplemente como la combinación lineal entre los y los valores de las abscisas:

)()()()()()()()()()()( 4433221100 xLxfxLxfxLxfxLxfxLxfxP ++++=

⎟⎠⎞

⎜⎝⎛ −−+⋅+⎟

⎠⎞

⎜⎝⎛ ++−−⋅+

⎟⎠

⎜⎝

−++−⋅−⎟⎠

⎜⎝

+−−⋅−=

xxxxxxxx

xxxxxxxx

91

272

8116

2433299749.0

98

2732

8132

24312868164.0

9278124368164.0

9278124399749.0

234234

xx 99014.014451.0 3 +−=

⎞⎛⎞⎛ 83232128121632 234234

P(x)

f(x)

Ahora evaluamos este polinomio en x = 1 para obtener

, tenemos que para , por lo que el error relativo cometido es

84564.0)1(99014.0)1(14451.0)1( 3 ≈+−=P )1()1( senf =84147.0=

Er = %496.010084147.0

100 ≈⋅=⋅p

84564.084147.0* −− pp

Page 5: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

23

3.1.2. Diferencias divididas interpolantes de Newton: Éste método es más algorítmico y resulta sumamente cómodo en determinados casos, sobre todo cuando queremos calcular un polinomio interpolador de grado elevado.

Tomemos f una función y escribamos su polinomio interpolador de grado m como sigue:

)())(())(()()( 110102010 −−−−++−−+−+= nnn xxxxxxaxxxxaxxaaxP LL (1)

))((1

0∏−

=−

i

jj

m

i xxa)(1

0 ∑=

+=i

n axP

Estos coeficientes se calculan mediante diferencias divididas, cuya expresión general esta dada por:

ijijii xx

xxf−++

++1

1],,[ Kjiijii xxfxxf −

= ++++ 11 ],,[],,[ KK

][ 00 xfa = ,],,[ 101 Kxxfa = ],,,[ 10 ii xxxfa K

Como se ve en la fórmula, las diferencias divididas se calculan de modo recursivo usando coeficientes anteriores. Una vez hayamos realizado todos los cálculos, notaremos que hay (muchas) más diferencias divididas que coeficientes ai. El cálculo de todos los términos intermedios debe realizarse simplemente porqué son necesarios para poder formar todos los términos finales. Sin embargo, los términos usados en la construcción del polinomio interpolador son todos aquéllos que involucren a x0, así:

= ,

Con esta notación, podemos reexpresar la ecuación (1) como:

)())(](,,,,[))(](,,[)](,[][)(

110210

102100100

−−−−++ − − +−+=

nn

n

xxxxxxxxxxfxxxxxxxfxxxxfxfxP

LL

L

1)( += xexf

A esta ecuación se le conoce con el nombre de fórmula de diferencias divididas interpolantes de Newton Ejemplo:

Queremos hallar el valor de la función para x = 0.75 mediante el método de las Diferencias Divididas de Newton de grado 2. Solución: Una forma sencilla de hacer los cálculos anteriores es determinando sucesivamente las entradas de un arreglo triangular:

Page 6: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

24

x )(xf Primeras diferencias divididas

Segundas diferencias divididas

0x )( 0xf 01

01 )()(],

xxxfxf

x−10[xf−

=02

1021210

],[],[],,[

xxxxfxxf

xxxf−−

=

1x )( 1xf 12

122

)()(]xx

xfxfx−−

=

2 )( 2xf

1,[xf

x

x

)(xf

Primeras diferencias divididas

Segundas diferencias divididas

0 e 02/1],[ 0xf

2/3

1 −−

=eex

)(2 2/3 ee −

= 01

2222],,[2/32/32

210 −+−−

=eeeexxxf

)2(2 2/32 eee +−=

22/3e

1

/ 211

]2/32

2 −−

=ee

)2/32 ee −

2e

,[ 1 xxf

(2=

1 El polinomio de diferencias divididas interpolantes de Newton de grado 2 es:

))(](,,[)](,[][)( 1021001002 xxxxxxxfxxxxfxfxP −−+−+=

)2/1)(0)(2(2)0)((2)( 2/322/32 −−+−+−−+= xxeeexeeexP

2/322/3

)2/1)(0)(2(2)0)((2)( −−+−+−−+= xxeeexeeexP

2

792377.5)75.0)(34()75.0)(2(2)75.0( 2/3222/322 ≈++−−+−= eeeeeeeP

2

exeeexeeexP ++−−+−= )34()2(2)( 2/3222/32

Ahora evaluamos este polinomio en x = 0.75 para obtener

,

tenemos que para 75460.5)75.0( 75.1 == ef 84147.0= , por lo que el error relativo cometido es

Er = %66.0100100*≈⋅=⋅

− pp 79238.575460.5 − 75460.5p

Page 7: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

25

ACTIVIDAD No. 8 1. Elabore el Diagrama de flujo para determinar el polinomio interpolador de

Lagrange y el polinomio de interpolación de Newton. Diseñe sus programas. 2. Usando los siguientes datos, calcúlese ln 2 con un polinomio de interpolación

de Newton con diferencias divididas de tercer orden.

x 1 4 6 5 f(x) 0.000 0000 1.386 2944 1.791 7595 1.609 4379 Ajuste mediante polinomio interpolador de Lagrange y compare los resultados.

3. Queremos hallar el valor de la función para x = 0.75 usando un polinomio interpolador de Lagrange de grado 2 (Comparar con el ejercicio resuelto en clase)

1)( += xexf

4. .Dados los datos:

x 1.6 2 2.5 3.2 4 4.5 f(x) 2 8 14 15 8 2 Calcule f(2.8) con un polinomio de interpolación de Newton de orden 1 a 3. Elija la secuencia de puntos que considere apropiada.

Page 8: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

26

3.2. AJUSTE DE CURVAS POR MINIMOS CUADRADOS El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe Piazzi descubrió el asteroide Ceres. Fue capaz de seguir su órbita durante 40 días. Durante el curso de ese año, muchos científicos intentaron estimar su trayectoria con base en las observaciones de Piazzi (resolver las ecuaciones no lineales de Kepler de movimiento es muy difícil). La mayoría de evaluaciones fueron inútiles; el único cálculo suficientemente preciso para permitir a Zach, astrónomo alemán, reencontrar a Ceres al final del año fue el de un Carl Friedrich Gauss de 24 años (los fundamentos de su enfoque ya los había plantado en 1795, cuando aún tenía 18 años). Pero su método de mínimos cuadrados no se publicó hasta 1809, apareciendo en el segundo volumen de su trabajo sobre mecánica celeste, Theoria Motus Corporum Coelestium in sctionibus conicis solem ambientium. Mínimos cuadrados es una técnica de optimización matemática que, dada una serie de mediciones, intenta encontrar una función que se aproxime a los datos minimizando la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos. Un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria. El teorema de Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución normal. También es importante que los datos recogidos estén bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar más peso a un dato en particular, véase mínimos cuadrados ponderados). 3.2.1. Mínimos cuadrados y análisis de regresión lineal: El ejemplo mas simple de una aproximación por mínimos cuadrados es ajustar una línea recta a un conjunto de observaciones definidas por puntos:

. La expresión matemática para la línea recta es ),(,),,(),,( 2211 nn yxyxyx L

ε++= bxay

Donde los coeficientes a y b son que representan la pendiente y la intersección con el eje y respectivamente. ε es el error o diferencia entre el modelo y las observaciones. Así el error o residuo puede expresarse como:

bxay −−=ε

Luego la suma de los cuadrados de dichas desviaciones estaría dada por:

∑∑==

−−==i

iii

r bxayS1

2

1)(ε

nn2

Page 9: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

27

La obtención de los valores de los coeficientes, tales que esta suma sea mínima es un problema que se puede resolver recurriendo a la derivación parcial de la función en términos de a y b e igualando a cero:

0)(2)1()(211 == ii

∑∑∑ ∑∑ =⎟⎟⎞

⎜⎜⎛

+⇒=−−n

i

n

i

n n

i

n

i ybxnaxbay 0

=−−−=−⋅−−=∂∂ ∑∑

n

ii

n

iir bxaybxay

aS

=== == ⎠⎝ iii ii 111 11

(1)

0)(2)()(211

=⋅−−−=−⋅−−=∂∂ ∑∑

==i

n

iii

n

iiii

r xbxayxbxaybS

∑∑∑∑ ∑∑==== ==

=⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟

⎟⎠

⎞⎜⎜⎝

⎛⇒=−−

n

iii

n

ii

n

ii

n

i

n

iii

n

iii yxbxaxxbxayx

11

2

11 1

2

10 (2)

De esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser resueltas por cualquier método. Escribiendo el sistema de ecuaciones en forma matricial tenemos:

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

⎛⋅

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

∑∑

=

=

==

=n

iii

n

ii

n

ii

n

ii

n

ii

yx

y

b

a

xx

xn

1

1

1

2

1

1 ; 2

11

2

1

2

1

1)det( ⎟⎟⎠

⎞⎜⎜⎝

⎛−== ∑∑

∑∑

==

==

=n

ii

n

iin

ii

n

ii

n

ii

xxnxx

xnA

Si usamos la regla de Cramer:

2

11

2

111

2

11

2

1

11

)det(⎟⎟⎠

⎞⎜⎜⎝

⎛−

==

∑∑

∑∑∑∑∑∑

∑∑

==

======

==

n

ii

n

ii

n

iii

n

ii

n

ii

n

ii

n

ii

n

iii

n

ii

n

ii

xxn

yxxxy

A

xyx

xy

a

2

11

2

11111

1

)det(⎟⎟⎠

⎞⎜⎜⎝

⎛−

==

∑∑

∑∑∑∑∑

==

=====

=

n

ii

n

ii

n

ii

n

ii

n

iii

n

iii

n

ii

n

ii

xxn

yxyxn

A

yxx

yn

b

Page 10: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

28

( )22

2

∑∑∑∑∑∑

−=

xxn

xyxxya ;

( )22 ∑∑∑∑∑

−=

xxn

yxxynb

Otra forma de calcular los coeficientes es a partir de las medias aritméticas de las observaciones:

nx

x ∑= ; n

yy ∑= , xbya −= ;

22 xnx

yxnxyb

−=∑∑

Se debe tener presente la diferencia entre el valor de obtenido con la ecuación de regresión y el valor de Y observado. Mientras es una estimación y su bondad en la estimación depende de lo estrecha que sea la relación entre las dos variables que se estudian. Esta diferencia se conoce como error en la estimación, este error se puede medir a partir de la Desviación estándar de la estimación:

2−=

nSrSxy , Donde ∑

=−−=

n

iiir bxayS

1

2)(

Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo estimado ó esperado de acuerdo al modelo, puede considerarse como un indicador del grado de precisión con que la ecuación de regresión, describe la relación entre las dos variables. No es posible comparar con las relaciones de variables dadas en distinta unidad de medida. Es necesario entonces calcular una medida que interprete o mida mejor el grado de relación entre las variables: Coeficientes de determinación y de correlación: El coeficiente de determinación es la relación entre la variación explicada y la variación total. Este Coeficiente de correlación mide la fuerza de la relación entre las variables. Su valor siempre estará 0 < r < 1

tStt SS

r−

=2tS ; donde es el error residual asociado con la variable dependiente

antes de la regresión. Una presentación alternativa es la siguiente:

( )( ) ( )( )∑ ∑∑ ∑∑ ∑

−−

−=

2222 yynxxn

yxynr ∑ x

Criterios: 0 a 0.2 Correlación muy débil, despreciable 0.2 a 0.4 Correlación débil. baja 0.4 a 0.7 Correlación moderada

Page 11: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

29

0.7 a 0.9 Correlación fuerte, alta, importante 0.9 a 1.0 Correlación muy fuerte, muy alta

La correlación entre los valores de dos variables es un hecho. El que lo consideremos satisfactorio o no, depende de la interpretación. Otro problema que representa la correlación es cuando se pregunta si una variable, de algún modo causa o determina a la otra. La correlación no implica causalidad. Si las variables x e y están correlacionadas, esto puede ser por que x causa a y, o porque y causa a x o porque alguna otra variable afecta tanto a x como y, o por una combinación de todas estas razones; o puede ser que la relación sea una coincidencia. Ejemplo: Se toma una muestra aleatoria de 8 ciudades de una región geográfica de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educación superior y la mediana del ingreso de cada ciudad, los resultados son los siguientes: % de Graduados (x): 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2 Mediana Ingreso (y): 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 x y xy x2 y2 y 2)ˆ( yy −

1 7.2 4.2 30.24 51.84 17.64 4.6133 0.1708 2 6.7 4.9 32.83 44.89 24.01 4.5109 0.1514 3 17.0 7.0 119.00 289.00 49 6.6201 0.1443 4 12.5 6.2 77.50 156.25 38.44 5.6986 0.2514 5 6.3 3.8 23.94 39.69 14.44 4.429 0.3956 6 23.9 7.6 181.64 571.21 57.76 8.033 0.1875 7 6.0 4.4 26.40 36.00 19.36 4.3676 0.001 8 10.2 5.4 55.08 104.04 29.16 5.2276 0.0297

89.8 43.5 546.63 1292.92 249.81 1.3317

∑ = 8.89x , , , ∑ = 5.43y ∑ = 63.546xy ∑ = 92.12922x , ∑ = 81.2492

∑ =− 2)ˆ( yy

y

( )1389.3

)63.546

2 =8.89(92.12928

8.8992.12925.4322

2

−⋅

⋅−⋅=

−=

∑∑∑∑∑∑

xxn

xyxxya

( )20477.0

)8.5.43

2 =⋅

89(92.129288.8963.5468

22 −⋅

−⋅=

−=

∑∑∑∑∑xxn

yxxynb

Page 12: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

30

Por tanto la ecuación de regresión nos queda: x20477.01389 +

87246.8)28( =

)2ibx

y .3ˆ =

Esta ecuación permite estimar el valor de ŷ para cualquier valor de x, por ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la mediana de ingreso para la ciudad será:

20477.01389.3ˆ +=y

La suma de los cuadrados de dichas desviaciones y la Desviación estándar de la estimación esta dada por:

3317.1=(1

−−=∑=

n

iir ayS , 4711.0

23317

=−4

.12=

−=

nSrSxy

El coeficiente de correlación:

( )( ) ( )( ) ))5.43(81.249

5.438.8963.54682−

⋅−⋅=

−= ∑ ∑∑ yxxyn

r

9485.0=r

8)()8.89(92.12928( 22222 ⋅−⋅−− ∑ ∑∑ ∑ yynxxn

Se observa que la correlación entre los valores de las dos variables es muy fuerte.

0

1

2

3

45

6

7

8

0 5 10 15 20 25 30

9

Observacionesy=a+bx

Grafica de dispersión elaborada en Excel

EXCEL - fx-570ES ó 991 ES

En el apéndice 5 se muestra la hoja de cálculo en EXCEL y se explica como trabajar en la calculadora con el modo de REGRESION LINEAL.

Page 13: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

31

ACTIVIDAD No. 9

1. Los datos siguientes muestran la relación entre la temperatura y la presión de

un fluido. Usando regresión lineal encuentre una formula que permita determinar la presión a una temperatura de 35: T 10 20 30 40 50 60 70 P 0.5 2.5 2.0 4.0 3.5 6.0 5.5

Calcule la desviación estándar de la estimación y el coeficiente de correlación. Grafique e Interprete los resultados.

2. Demuestre que los datos que se indican a continuación no se ajustan a una

línea recta. x 1 2 3 4 5 y 0.5 1.7 3.4 5.7 8.4

Calcule la desviación estándar de la estimación y el coeficiente de correlación. Grafique e Interprete los resultados.

3. Se quiere resolver un problema de hipótesis relacionado con la caída del paracaidista de la actividad No. 5, en la cual se dio el siguiente modelo matemático teórico:

⎟⎟

⎜⎜

⎛−=

− tmc

ec

gmtv 1)( donde m=98.1 Kg, g=9,8 m/s2 y el coeficiente de

arrastre c=12.5 kg/s. Un modelo empírico alternativo para la velocidad del paracaidista esta dado por:

⎟⎠⎞

⎜⎝⎛

+=

tt

cgmtv

75.3)(

Compruebe la veracidad de esos modelos matemáticos. Esto podría hacerse al medir la velocidad real del paracaidista con valores conocidos del tiempo y comparar estos resultados con las velocidades predichas por cada modelo. Velocidades medidas del paracaidista en m/s

x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 y 10 16.3 23 27.5 31 35.6 39 41.5 42.9 45 46 45.5 46 49 50 Calcule la desviación estándar de la estimación y el coeficiente de correlación. Grafique e Interprete los resultados.

Page 14: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

32

3.2.2. Regresión Polinomial: En muchos casos una curva es más adecuada para ajustar los datos. El procedimiento de mínimos cuadrados puede extenderse fácilmente para ajustar un polinomio de grado superior un conjunto de observaciones definidas por puntos:

. Por ejemplo, supongamos que ajustamos un polinomio de segundo grado o cuadrático:

),(,),,(),,( 2211 nn yxyxyx L

ε+++= 2cxbxay

Donde los coeficientes a, b y c son lo coeficientes a determinar y ε es el error o diferencia entre el modelo y las observaciones. En este caso el error o residuo puede es:

2cxbxay −−−=ε

Luego la suma de los cuadrados de dichas desviaciones estaría dada por:

∑∑==

−−−==n

iiii

n

ir cxbxayS

1

22

1

2 )(ε

Recurriendo a la derivación parcial de la función en términos de a, b y c e igualando a cero:

0)(21

2 =−−−−=∂ ∑

=iiii

r cxbxaya

∂ nS

0)(21

2 =⋅−−−−=∂ ∑

=i

iiii

r xcxbxayb

∂ nS

0)(2 2

1

2 =⋅−−−−=∂ ∑

=i

iiii

r xcxbxayc

∂ nS

⎞⎛⎞⎛ nnn2

∑∑∑∑ =++n

yxcxbxax

⎟⎜⎟⎜⎟⎜

De esta forma se obtienen tres ecuaciones normales del modelo.

∑∑∑===

=⎟⎟⎠

⎜⎜⎝

+⎟⎟⎠

⎜⎜⎝

+i

ii

ii

i ycxbxna111

⎟⎞

⎜⎛

⎟⎞

⎜⎛

⎟⎞

⎜⎛ nnn

32

(1)

====⎟⎠

⎜⎝

⎟⎠

⎜⎝

⎟⎠

⎜⎝ i

iii

ii

ii

i1111

∑∑∑∑ =⎟⎞

⎜⎛

+⎟⎞

⎜⎛

+⎟⎞

⎜⎛ n

ii

n

i

n

i

n

i yxcxbxax 2432

(2)

==== ⎠⎝⎠⎝⎠⎝ iiii 1111 (3)

Page 15: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

33

Escribiendo el sistema de ecuaciones en forma matricial tenemos:

⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜⎜

=

⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜⎜

∑∑∑

∑∑∑

∑∑

=

=

=

===

===

==

n

iii

n

iii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

yx

yx

y

c

b

a

xxx

xxx

xxn

1

2

1

1

1

4

1

3

1

2

1

3

1

2

1

1

2

1

Resolviendo se obtienen los coeficientes a, b y c.

Desviación estándar de la estimación:

3−=

nSrSxy , Donde ∑∑

==−=−−−=

n

ii

n

iiiir yycxbxayS

1

2

1

22 )ˆ()(

Coeficientes de determinación y de correlación: El coeficiente de determinación es la relación entre la variación explicada y la variación total. Su valor siempre estará 0 < r < 1

tSrt SS

r−

=2 S ; donde es el error residual asociado con la variable dependiente

antes de la regresión

t

∑=

−=I

yy1

)(n

2tS .

Este Coeficiente de correlación mide la fuerza de la relación entre las variables.

tSrt SS

r−

=

Ejemplo: Los datos siguientes muestran la relación entre la distancia recorrida (m) y la velocidad alcanzada por un cuerpo (m/s2). Usando regresión polinomial encuentre una formula que permita determinar la velocidad a una distancia de 4.5 m:

x 0 1 2 3 4 5 v 2.1 7.7 13.6 27.2 40.9 61.1

Calcule la desviación estándar de la estimación y el coeficiente de correlación. Grafique e Interprete los resultados. Solución:

Page 16: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

34

x y xy x2 x2y x3 x4 0 0 2,1 0 0 0 0 0 1 1 7,7 7,7 1 7,7 1 1 2 2 13,6 27,2 4 54,4 8 16 3 3 27,2 81,6 9 244,8 27 81 4 4 40,9 163,6 16 654,4 64 256 5 5 61,1 305,5 25 1527,5 125 625 15 152,6 585,6 55 2488,8 225 979

= 6.585xy , ∑∑ = 15x , ∑ , = 6.152y ∑ = 552x

⎠⎝ ==== iiii 1111

775.50)5.4(86071.1)5.4(35929.247857.2ˆ 2 =++=y

, ,

,

∑ = 8.24882 yx

∑ = 2253x ∑ = 9794x

Escribiendo el sistema de ecuaciones en forma matricial tenemos:

⎟⎟⎟⎟⎟⎟⎟⎟⎞

⎜⎜⎜⎜⎜⎜⎜⎜⎛

=

⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜⎜

∑∑∑

∑∑∑

∑∑

=

=

===

==

n

ii

n

iii

n

ii

n

i

n

i

n

i

n

ii

n

ii

n

ii

n

ii

n

ii

yx

yx

y

c

b

a

xxx

xxx

xxn

2

1

1

432

1

3

1

2

1

1

2

1

⎟⎟⎟

⎜⎜⎜

⎛=

⎟⎟⎟

⎜⎜⎜

⎛⋅⎟⎟⎟

⎜⎜⎜

8.248869.5856.152

97922555225551555156

cba

Resolviendo este sistema de ecuaciones se tiene a = 2.47857 , b = 2.35929 , c = 1.86071

Por tanto la ecuación de regresión es: 286071.135929.247857.2ˆ xxy ++=

El valor de la velocidad ŷ estimado para x = 4.5 m es:

m/s

Calculando el error residual asociado con la variable dependiente antes de la regresión y la suma de los cuadrados de las desviaciones:

∑=

−=I

t yyS1

)(n

2n

2 ; ∑

=−=

iir yyS

1)ˆ(

Page 17: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

35

ŷ 2)( yy − 2)ˆ( yy − 1 2,4786 544,4444 0,14334 2 6,6986 314,4711 1,0028 3 14,64 140,0278 1,0816 4 26,3029 3,1211 0,80479 5 41,6871 239,2178 0,61953

2513,3933 3,74637

833.2513=rS 74637,3= ; rS

Desviación estándar de la estimación:

1175.136

74637.33

=−

=−

=nSrSxy

Coeficientes de determinación y de correlación:

99851.0933.2513

2 ===t

rtS

r 74637.3933.2513 −− SS

99925.0=r

Se observa la correlación entre los valores de dos variables es muy fuerte.

0

10

20

30

40

50

60

0 2 4 6

70

Observaciones

y=a+bx+cx2

Grafica de dispersión elaborada en Excel

EXCEL - fx-570ES ó 991 ES

En el apéndice 6 se muestra la hoja de cálculo en EXCEL y se explica como trabajar en la calculadora con el modo de REGRESION POLINOMIAL.

Page 18: Tema 3 Ajuste de Curvas

Guía de estudio Matemática V

Guía de estudio Matemática V

36

ACTIVIDAD No. 10

1. Emplee la regresión por mínimos cuadrados para ajustar a una línea recta:

x 1 2 3 4 5 6 7 8 9 y 1 1.5 2 3 4 5 8 10 13 a) Además de la pendiente y la intersección, calcule el error estándar de la estimación y el coeficiente de correlación. Grafique los datos y la línea recta. Evalúe el ajuste. b) Vuelva a hacer el cálculo del inciso (a), pero usando regresión polinomial para ajustar los datos a una parábola. Compare los resultados con los obtenidos en (a)

2. Los datos siguientes representan el crecimiento bacterial en un cultivo líquido

durante cierto número de días. dia 0 4 8 12 16 20 cantidad x10-6 67 84 98 125 149 185

Encuentre la ecuación de mejor ajuste (recta o parábola) a la tendencia de datos. Grafique en cada caso e interprete los resultados. Pronostique la cantidad de bacterias después de 40 días.

3. Un objeto se suspende en un túnel de viento y se mide la fuerza para varios niveles de velocidad del viento. A continuación están tabulados los resultados v (m/s) 10 20 30 40 50 60 70 80 F (N) 25 70 380 550 610 1220 830 1450

Encuentre la ecuación de mejor ajuste (recta o parábola) a la tendencia de datos. Grafique en cada caso e interprete los resultados.

4. Usando regresión polinomial para ajustar a una parábola los datos del ejercicio

No 2 de la actividad No 9. Compare los resultados con los obtenidos anteriormente.

5. Diseñe hojas de cálculo para aplicar la regresión lineal y la polinomial. Tome

algunos de los ejercicios propuestos y varíe algún o varios de los valores de y. Anote sus observaciones con respecto al cambio de la desviación estándar y el coeficiente de correlación. ¿Ofrecerá en estos casos la ecuación de regresión un ajuste adecuado?

Page 19: Tema 3 Ajuste de Curvas

APENDICE No 5

Presione [1] para seleccionar A, presione [=] A

3.138938806

Presione [shift] , [STAT] , [7] , [2] para seleccionar B, presione [=] B

0.2047715985

Presione [shift] , [STAT] , [7] , [3] para seleccionar r, presione [=] r

0.9485249968

Usando la calculadora fx-570ES ó 991 ES Presiona las teclas [ Mode ], [ 3 ] para trabajar en STAT. Seleccione 2 para trabajar con REGRESION LINEAL. Ingrese los datos: X Y 1 7.2 4.2 2 6.7 4.9 3 17 7 4 12.5 6.2 5 6.3 3.8 6 23.9 7.6 7 6 4.4 8 10.2 5.4 Presione [AC] , [shift] , [STAT] , [7] para buscar los coeficientes de la ecuación de regresión y=A + Bx

Autor: Ing. Neptali Franco

Page 20: Tema 3 Ajuste de Curvas

APENDICE No 6

Autor: Ing. Neptali Franco

Presione [AC] , [shift] , [STAT] , [7] para buscar los coeficientes de la ecuación de regresión y=A + Bx Cx2 Presione [1] para seleccionar A, presione [=] A

2.478571429

Presione [shift] , [STAT] , [7] , [2] para seleccionar B, presione [=] B

2.359285714

Presione [shift] , [STAT] , [7] , [3] para seleccionar C, presione [=] C

1.860714286

Usando la calculadora fx-570ES ó 991 ES Presiona las teclas [ Mode ], [ 3 ] para trabajar en STAT. Seleccione 3 para trabajar con REGRESION POLINOMIAL-2do orden. Ingrese los datos: X Y 0 0 2.1 1 1 7.7 2 2 13.6 3 3 27.2 4 4 40.9 5 5 61.1