capitulo 5 optimizaci¶on con...

22
CAPITULO 5 Optimizaci´oncon restricciones 5.1 Introducci´on Un gran n´ umero de modelos de optimizaci´on imponen a las variables una serie de restricciones que se traducen en el que m´ ınimo no se busca en todo el espacio sino en un subconjunto del espacio definido por las restricciones. Por ejemplo consideremos los siguientes problemas: 1. Una sonda espacial en forma de elipsoide entra a la atm´osfera de la tierra y su superficie comienza a calentarse. Supongamos que la ecuaci´on del elipsoide est´a dada por 4x 2 + y 2 +4z 2 =1 y que despu´ es de una hora, la temperatura sobre la superficie de la sonda es T (x, y, z )=8x 2 +4yz - 16z + 600. Determ´ ınese el punto m´as caliente sobre la superficie. En este caso el problema se plantea de la siguiente forma: sea Ω un subconjunto de < 3 definido por Ω= {(x, y, z ) | G(x, y, z )=4x 2 + y 2 +4z 2 - 16}. 77

Upload: others

Post on 15-Mar-2020

13 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

CAPITULO 5

Optimizacion conrestricciones

5.1 Introduccion

Un gran numero de modelos de optimizacion imponen a las variablesuna serie de restricciones que se traducen en el que mınimo no se buscaen todo el espacio sino en un subconjunto del espacio definido por lasrestricciones. Por ejemplo consideremos los siguientes problemas:

1. Una sonda espacial en forma de elipsoide entra a la atmosfera dela tierra y su superficie comienza a calentarse. Supongamos quela ecuacion del elipsoide esta dada por

4x2 + y2 + 4z2 = 1

y que despues de una hora, la temperatura sobre la superficie dela sonda es

T (x, y, z) = 8x2 + 4yz − 16z + 600.

Determınese el punto mas caliente sobre la superficie.

En este caso el problema se plantea de la siguiente forma: sea Ωun subconjunto de <3 definido por

Ω = (x, y, z) | G(x, y, z) = 4x2 + y2 + 4z2 − 16.

77

Page 2: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

78 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

Determinar

Max T (x, y, z).

x ∈ Ω

Este es un problema cuadratico con una restriccion cuadraticadada por una igualdad.

2. Otro problema cuadratico pero con restricciones en forma dedesigualdad es el problema de seleccionar un portafolio de acciones.Supongamos que al inicio del ano un inversionista desea gastaruna cantidad M en la compra de varias acciones. Acude a unacasa de bolsa donde el encargado de inversiones le muestra variasopciones que se componen de acciones de distintas empresas. Acada uno de esos conjuntos le llamaremos un portafolio. Nuestroinversionista desea seleccionar el portafolio que, por un lado,le maximice los rendimientos , mientras que por otro lado legarantice que las perdidas sean pequenas. El empleado de labolsa le hace saber que no puede asegurarle de antemano quetal o cual portafolio va a cumplir con sus requerimientos, pues elmercado de valores funciona en forma aleatoria y es difıcil preveerel comportamiento del mismo. Le explica que la mejor manera demodelar este problema es la de considerar a los rendimientos comovariables aleatorias. Es decir si definimos a ri como el rendimientoanual de la i-esima accion, ri es una variable aleatoria. Ademas, lesugiere, que como no se sabe cuanto valdra una accion al terminodel ano, es difıcil fijar el rendimiento exacto, por lo que es msconveniente trabajar con el rendimieno esperado y pedir que estesea mayor o igual a un valor fijo r∗.

Por otro lado, una forma mas conveniente de plantear el problemade minimizar las perdidas es la de minimizar las variaciones delos posibles redimientos; ası con estos dos puntos de vista elproblema de decidir cual portafolio adquirir se reduce a mininizarla varianza del portafolio fijando que el rendimieno esperado delportafolio sea mayor o igual a un porcentaje.

Recordemos que la esperanza E de una variable aleatoria es elvalor que se espera que tenga esa variable en un futuro; en el

Page 3: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.1. INTRODUCCION 79

caso particular de que las variables aleatorias representen lasrendimientos de las acciones, el valor esperado para el proximoano de una accion particular puede estimarse por medio del valorpromedio que obtuvo esa accion durante el ano anterior, siemprey cuando se asuma que el estado de la bolsa no cambiara muchorespecto al del ano anterior. La esperanza de la suma de variablesaleatorias es la suma de las esperanzas, es decir si xi son variablesaleatorias

E(x1 + . . . , xn) = E(x1) + . . . + E(xn).

La varianza σ2 de una variable aleatoria mide cuanto dista elvalor de la variable aleatoria respecto del valor promedio de dichavariable. Es decir la varianza del rendimiento de una accionestima cuanto difiere el rendimiento de su rendimiento promedio.La covarianza Cov es otro concepto probabilıstico que intervieneen nuestro modelo y que aparece cuando se calcula la varianzade la suma de dos variables aleatorias. A grandes rasgos, lacovarianza mide cuanto depende una variable aleatoria respectode otra. Por ejemplo, en el caso de los rendimientos de lasacciones nos mide cuanto depende el rendimiento de una delcomportamiento del rendimiento de la otra. Por ello si dos variablesaleatorias son independientes, la covarianza entre ellas es cero. Enel caso de n variables aleatorias, en las que no se tiene la certezade que sean independientes entre si, la varianza V ar de la sumade las variables aleatorias es igual a

V ar(x1 + . . . + xn) = V ar(x1) + . . . + V ar(xn)

+2(Cov(x1, x2) + . . . Cov(x1, xn) + . . . Cov(xn−1, xn)).

Asimismo,

V ar(ax + by) = a2 V ar(x) + b2 V ar(y) + 2xy Cov(x, y)

yE(ax + by) = aE(x) + bE(y).

Por ejemplo, supongamos que se desea invertir en la bolsa Mpesos comprando un numero de acciones x1 de Telmex, cuyo

Page 4: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

precio al tiempo t = 0 es P1 por accion, un numero x2 de Banorte,con precio P2 y un numero x3 de Bimbo, con precio P3. Entoncesel valor del portafolio al t = 0 es igual a

x1P1 + x2P2 + x3P3 = M,

entonces dividiendo entre el monto del presupuesto M se obtieneque

w1 + w2 + w3 = 1,

si denotamos a wi como el porcentaje del presupuesto que seinvierte en la accion i, es decir wi = xiPi

M

Por otro lado el rendimiento ri al tiempo uno se define como

ri =P 1

i − P 0i

P 0i

,

por lo que el rendimiento total del portafolio es

rp =P 1

p − P 0p

P 0p

=3∑

i=1

xiP0i

Mri,

= w1r1 + w2r2 + w3r3.

Se tienen los siguientes datos: Mi analista financiero me proporcionala siguiente informacion: La estimacion del rendimiento esperadode las acciones de Telmex: es de r1 = 0.5, la de Banorte es der2 = 0.2 y las de Bimbo r3 = 0.15. Asimismo, las varianzas decada uno de los rendimiento son son σ2

1 = 0.25, σ22 = 0.10, y

σ23 = 0.5, mientras que las Cov(r1, r2) = 0.05, Cov(r2, r3) = 0.03

y Cov(r1, r3) = 0.01. ¿Cuantas acciones de cada companıa sedeben comprar, si deseo minimizar la varianza del portafolio σ2

p,teniendo al menos un rendimiento esperado E(rp) de 0.20? Elproblema a minimizar es el siguiente:

Min 12

σ2p ,

sujeto a : E(rp) ≥ 0.20,

w1 + w2 + w3 = 1,

wi ≥ 0.

Page 5: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.1. INTRODUCCION 81

La ultima restriccion implica que las variables wi, solo puedentomar valores mayores o iguales a cero, lo que significa que no sepuede pedir prestado para invertir en el portafolio. La funcion σ2

p

es una funcion cuadratica ya que

σ2p = σ2(

3∑

i=1

wiri)

=3∑

i=1

w2i σ

2i +

3∑

i=1

3∑

j=1

wiwjCov(ri, rj),

= 2(0.05w1w2 + 0.03w2w3 + 0.01w1w3) + 0.25w21 + 0.1w2

2 + 0.5w23.

Por otro lado, las restricciones son lineales ya que

E(rp) = 0.5 w1 + 0.2 w2 + 0.15 w3 ≥ 0.2.

Este es un modelo cuadratico con restricciones lineales de desigualdad.

El lector debe estar ya familiarizado con problemas de minimizacioncon restricciones de igualdad pues es material que siempre se incluyeen el estudio del calculo de varias variables. Supongamos que se desearesolver el problema presentado en el ejemplo 1 de esta introduccion:

Max T (x, y, z),

x ∈ Ω

donde T (x, y, z) = 8x2 + 4yz− 16z + 600 y Ω = (x, y, z) | G(x, y, z) =4x2 + y2 + 4z2 − 16 = 0.

Por el curso del calculo sabemos que este problema podemos trans-formarlo en un problema sin restricciones si consideramos el problemade determinar los puntos crıticos en <4 de la funcion

H(x, y, z, λ) = T (x, y, z) + λ(4x2 + y2 + 4z2 − 16).

A λ se le conoce como el multiplicador de Lagrange. En este caso

H(x, y, z, λ) = 8x2 + 4yz − 16z + 600 + λ(4x2 + y2 + 4z2 − 16)

Page 6: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

82 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

y tiene como derivadas parciales a

∂H

∂x= 16x + 8xλ,

∂H

∂y= 4z + 2yλ,

∂H

∂z= 4y − 16 + 8zλ,

∂H

∂λ= 4x2 + y2 + 4z2 − 16.

Al igualarlas a cero se obtienen como soluciones a (+−4/3,−4/3, 4/3,−2),

(0, 4, 0, 0), (0,−2,√

3,√

3) y (0,−2,−√3,−√3). ¿En cual de estospuntos la temperatura es mayor? Un procedimiento es el evaluar T ytomar el punto en el que alcanza el valor mas grande. Otro procedimientonos lo daran las condiciones de segundo orden.

El teorema que nos dice que el determinar los puntos crıticos de unafuncion F sobre una superficie es equivalente a determinar los puntoscrıticos de una funcion H se puede demostrar usando el teorema de lafuncion implıcita. La dificultad de los problemas de minimizacion conrestricciones reside en que no se tiene una caracterizacion de un puntomınimo que dependa unicamente de la funcion objetivo, tambien serequiere que se satisfagan ciertas condiciones respecto a las restricciones.A continuacion presentaremos algunas definiciones que nos seran utilesen el manejo de las restricciones.

5.2 Puntos admisibles y regulares

Iniciaremos esta seccion con una clasificacion de los problemas con res-tricciones y presentando algunas definiciones que nos seran utiles elresto del capıtulo.

Sea F una funcion de <n a los reales y sea Ω el conjunto de <n

definido por

Ω = x ∈ <n | hj(x) = cj para j = 1, . . . m,

donde hj puede ser una funcion lineal o no lineal. Un problema de

Page 7: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.2. PUNTOS ADMISIBLES Y REGULARES 83

restricciones de igualdad es de la forma

Min F (x).

x∈Ω

En el caso lineal las restricciones son de la forma

hj(x) = ctjx− ej = 0.

Un problema de minimizacion con restricciones en desigualdad esun problema de minimizacion en el que Ω se define como

Ω = y ∈ <n| hj(y) = 0, j = 1, . . . ,m, gj(y) ≤ 0, j = 1, . . . , s.

Definicion 5.1 Diremos que x ∈ <n es un punto admisible de unproblema de minimizacion con restricciones si x ∈ Ω.

¿Que se entiende por el mınimo de f restringido a un conjunto Ω?

Definicion 5.2 Un punto x∗ se dice que es un mınimo relativo de Frestringido a un subconjunto Ω de <n si

F (x∗) ≤ F (x) ∀ x ∈ Ω.

Definicion 5.3 Definamos como la matriz jacobiana del vector th =(h1(x), . . . , hm(x)) a la matriz m× n con componentes

Jh(x) =

∂h1∂x1

. . . ∂h1∂xn

∂h2∂x1

. . . ∂h2∂xn

.... . .

...∂hm∂x1

. . . ∂hm∂xn

.

La matriz jacobiana de h tiene como renglon i al gradiente de hi.Esta matriz nos define para cada x una transformacion lineal de <n a<m. Por ejemplo en el caso del ejemplo del elipsoide, dado que solotenemos una restriccion, Jh es una matriz de 1× 3 definida por

Jh(x) = (8x, 2y, 8z).

Page 8: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

84 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

En el caso que Ω sea el conjunto

Ω = x ∈ <n | hj(x) = ctjx = ej para j = 1, . . . m

entonces Jh =t C con C la matriz de m × n que tiene como j−esimorenglon al vector ct

j.Denotemos como N(x) al epacio nulo de la transformacion Jh(x),

es decir

N(x) = y ∈ <n| Jh(x) y = 0.N(x) es el espacio ortogonal al espacio generado por los vectores

∇h1(x), . . . ,∇hm(x).

Ası en el ejemplo 1, N(x) es el espacio

N(x) = (a, b, c) ∈ <3| 8xa + 2yb + 8zc = 0.

En particular N(0) = <3 pues ∇h1(0) = 0 y en cambio N(1, 1, 1) =8a+2b+8c = 0. La dimension de N(1, 1, 1) es 2. En el caso de tenerrestricciones lineales N(x) es igual

N(x) = y ∈ <n| Cty = 0.

Definicion 5.4 Diremos que x∗ es un punto regular de Ω si el conjuntode vectores

∇h1(x∗), . . . ,∇hm(x∗)

es linealmente independiente.

Observese que si m ≤ n es posible que el gradiente de todas lasrestricciones sean linealmente independientes pero si m > n no esposible que haya un punto regular admisible. En el caso lineal o setiene que todos los puntos son regulares o ninguno pues seran regularessi la matriz C es de rango completo o sea de rango igual a m.

Sea F una funcion de <n a los reales y sea Ω el conjunto de <n

definido por

Ω = x ∈ <n | hj(x) = cj para j = 1, . . . m,

Page 9: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.2. PUNTOS ADMISIBLES Y REGULARES 85

donde hj puede ser una funcion lineal o no lineal. Un problema deminimizacion con restricciones de igualdad no lineal (P) es de la forma

Min F (x).

x∈Ω

Denotemos como T (x∗) el plano tangente a la superficie Ω en elpunto x∗. Recordemos que el plano tangente esta formado por todoslos vectores y ∈ <n que son rectas tangente a una curva que pasa porx∗ y que esta sobre Ω.

Teorema 5.5 Si x∗ es un punto regular admisible de Ω entonces

N(x∗) = T (x∗).

Demostracion. Probemos primero que T (x∗) ⊂ N(x∗). Sea y ∈T (x∗) ⇒ existe una curva x(t) de < a <n que pasa por x∗. Supongamosque x(0) = x∗ y que x(0) = y. La diferencial total de h es cero puesx(t) esta en Ω y

0 =dh(x(t))

dt|t=0 = Jh(x∗)x(0) = Jh(x∗)y

lo que implica que y ∈ N(x∗).Demostremos ahora que N(x∗) ⊂ T (x∗). Sea y ∈ N(x∗) entonces

hay que demostrar que existe una curva x(t) en Ω para t ∈ [0, t0] talque x(0) = x∗ y x(0) = y. Para ello considerese la curva

x(t) = x∗ + yt + J th(x∗) u(t) (5.8)

con u(t) un vector en <m. Demostrar la existencia de la curva x(t) esequivalente a demostrar que existe t0 > 0 tal que para cada t ∈ [0, t0]existe un unico vector u(t) para el cual h(x(t)) = 0.

Al evaluar la curva x(t) en cero se tiene que

x(0) = x∗ + Jh(x∗)u(0).

Como deseamos que x(0) = x∗ impongamos la condicion que u(0) = 0.Para que x(t) ∈ Ω se tiene que cumplir que

h(x∗ + yt + J(x∗)tu(t)) = 0. (5.9)

Page 10: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

86 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

Observemos que para cada t tenemos que determinar un vector u(t) ∈<m que satisfaga el sistema de m ecuaciones con m incognitas dadopor (5.9) ¿Tiene solucion este sistema para toda t en el intervalo [0, t0],para alguna t0?

El teorema de la funcion implıcita nos dice que esta sistema puederesolverse en forma unica en una vecindad de u(0) si h(x(0)) = 0 yDuh es no singular en t = 0.

Duh(x∗ + yt + J th(x∗)u(t))|t=0 = Jh(x∗) J t

h(x∗)

es no singular pues, por hipotesis, x∗ es un punto regular por lo queel rango de esta matriz es m. Por lo tanto existe una unica u(t) para|t| ≤ t0 tal que x(t) ∈ Ω. Ademas

0 =dh

dt(x∗ + yt + J t

h(x∗)u(t))|t=0 = Jh(x∗)[y + J th(x∗)u(0)];

como y ∈ N(x∗) entonces

dh

dt(x∗ + yt + J t

h(x∗)u(t))|t=0 = [Jh(x∗) J th(x∗)]u(0) = 0

lo que implica que u(0) = 0 por lo que x(0) = y. Ası que y ∈ T (x∗).

Lema 5.6 Sea x∗ un punto regular de las restricciones h(x) = 0 y seax∗ un punto extremo de F en

Ω = x ∈ <n | hj(x) = 0 para j = 1, . . .m,entonces para toda y ∈ N(x∗) se cumple

t∇F (x∗)y = 0.

Demostracion. Tomemos una y ∈ N(x∗), por el lema anterior, existeuna curva x(t) que satisface que x(0) = x∗ y x(0) = y. Como x∗ esun punto extremo de F sobre la curva x(t) se tiene que al evaluar laderivada de F en x∗ por la regla de la cadena se obtiene que

0 =dF

dt(x∗) =

dF

dt(x(t))|t=0 = ∇F (x∗)ty.

Por lo tanto ∇F (x∗) es ortogonal al espacio tangente siempre que x∗

sea un punto regular de Ω a la vez que un punto extremo de F .

Page 11: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.3. CONDICIONES DE SEGUNDO ORDEN 87

Teorema 5.7 Sea x∗ un punto extremo local de F sujeto a las restric-ciones h(x) = 0. Si x∗ es un punto regular de Ω entonces existe λ ∈ <m

tal que∇F (x∗) + Jh(x∗)tλ = 0. (5.9)

Demostracion. Por el lema anterior ∇F (x∗) es ortogonal a todovector en el plano tangente a la superficie Ω y por el teorema (5.5) esortogonal a todo vector y ∈ N(x∗). Ası que ∇F (x∗) esta en el espaciogenerado por ∇h1(x

∗), . . . ,∇hm(x∗) y se puede escribir como unacombinacion lineal de estos vectores; es decir, existe un vector λ ∈ <m

tal que∇f(x∗) = −tJh(x∗)λ.

Observemos que, como en el caso lineal, la expresion (5.9) nos defineun sistema de n ecuaciones con n + m incognitas que junto a las mecuaciones h(x) = 0 nos define un sistema de n+m ecuaciones con n+mincognitas. Al vector λ se le conoce con el nombre de multiplicador deLagrange.

5.3 Condiciones de segundo orden

Teorema 5.8 Supongamos que x∗ es un mınimo local del problema (P )y que x∗ es un punto regular de Ω entonces existe un vector λ ∈ <m talque

∇F (x∗) +t Jh(x∗)λ = 0.

Si N(x∗) = y ∈ <m|Jh(x∗)y = 0 entonces la matriz

L(x∗) = HF (x∗) +m∑

i=1

λiHhi(x∗)

es semidefinida positiva en N(x∗), es decir tyL(x∗)y ≥ 0 para today ∈ N(x∗).

Demostracion. La primera parte se demuestra por el teorema 5.22.Para demostrar la segunda parte, considerese a x(t) una curva quepasa por x∗ en t = 0 con vector tangente y ∈ N(x∗) y que satisface

Page 12: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

88 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

x(0) = y entonces F restringido a esta curva es una funcion de variablereal. Como x∗ es un mınimo local de F ⇒

d2F (x(t))

dt2|t=0 ≥ 0,

lo que implica que

tx(0)HF (x∗)x(0) +∇F (x∗)x(0) ≥ 0. (5.10)

Por otro lado como la curva x(t) esta sobre Ω, satisface que paratoda restriccion hi

λihi(x(t)) = 0

y al derivar dos veces esta expresion y al evaluarla en t = 0 se tiene que

tx(0)λiHhi(x∗)x(0) +∇hi(x

∗)λix(0) = 0.

Sumando respecto a i

tx(0)m∑

i=1

λiHhi(x∗)x(0) +t Jh(x∗)λx(0) = 0. (5.11)

Recordemos que por el teorema (5.22)

∇F (x∗) = −tJh(x∗)λ

y sumando (5.10) y (5.11) se tiene que

tx(0)[HF (x∗) +m∑

i=1

Hhi(x∗)λi]x(0) ≥ 0

para toda y ∈ N(x∗). Lo que implica que L(x∗) es una matriz semidefinidapositiva.

Teorema 5.9 Supongase que hay un punto x∗ en Ω y una λ ∈ <m talque

∇F (x∗) +t Jh(x∗)λ = 0. (5.12)

Page 13: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.3. CONDICIONES DE SEGUNDO ORDEN 89

Supongase tambien que la matriz

L(x∗) = HF (x∗) +m∑

i=1

Hhi(x∗)λi

es definida positiva en

N(x∗) = y ∈ <n|Jh(x∗)y = 0.⇒ x∗ es un mınimo local estricto de F en Ω.

Demostracion. Supongamos que x∗ no es un mınimo local estrictoentonces existe y ∈ Vδ(x

∗) tal que F (y) ≤ F (x∗). Aun mas existe unasucesion yk ∈ Ω que converge a x∗ y tal que F (yk) ≤ F (x∗). Deesta ultima afirmacion se desprende que si al menos hay un punto y enel que F alcanza un valor menor que en x∗, como F es continua debeentonces tomar todos los valores entre F (y) y F (x∗) en puntos yk enΩ. Esta sucesion es de la forma

yk = x∗ + δksk

con vectores sk en la bola unitaria de <n y δk > 0. Claramente δk → 0cuando k tiende a infinito y ademas como sk es una sucesion acotadadebe tener una subsucesion convergente a un elemento s∗ ∈ Ω. Ademas

limk→∞

h(yk)− h(x∗)δk

= 0

lo que implica queJh(x∗)s∗ = 0,

por lo que s∗ ∈ N(x∗).Aplicando la serie de Taylor a hi alrededor de x∗ se tiene

0 = hi(yk)

= hi(x∗) + δk

t∇hi(x∗)sk +

δ2k

2tskHhi

(ηi)sk.

Multiplicando por λi y sumando de i = 1 hasta m se tiene que

0 =m∑

i=1

λihi(yk) =m∑

i=1

λi(hi(x∗) + δk

t∇hi(x∗)sk +

δ2k

2tskHhi

(ηi)sk).

(5.13)

Page 14: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

90 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

Por otro lado se tiene que

F (yk) = F (x∗) + δtk∇F (x∗)sk +

δ2k

2

t

skHF (ξk)sk

y sumando esta igualdad con (5.13) se tiene que

F (yk) = F (x∗) + δtk[∇F (x∗) +

m∑

i=1

λiδhi(x∗)]sk

+δ2k

2

t

sk[HF (ξk) + λiHhi(ηi)]sk.

Dado que F (yk)− F (x∗) ≤ 0 y de (5.10) se tiene que

0 ≥ δ2k

2

t

sk[HF (ξk) + λiHhi(ηi)]sk

para cada k, por lo que al pasar al lımite se tiene que se contradice lahipotesis que la matriz L sea definida positiva en x∗.

Los puntos maximos de F restringidos a un conjunto Ω puedencaracterizarse de una manera similar a los puntos mınimos. La condicionde primer orden es la misma que (5.10) lo que difiere es que la matrizL debe ser una matriz negativa definida.

5.3.1 Ejemplos

Retomemos el ejemplo de la sonda en forma de elipsoide con ecuacion4x2 + y2 + 4z2 − 16 = 0 y cuya distribucion de temperatura esta dadapor la funcion T (x, y, z) = 8x2+4yz−16z+600. En la seccion 5.1.1. sedetermino que los puntos (+

−4/3,−4/3, 4/3), (0, 4, 0), (0,−2,+−√

3) soncandidatos a ser puntos extremos de T en la elipsoide. ¿En cuales deellos alcanza el valor mınimo T? Para responder calculemos la matrizL respectiva. En el caso del primer punto que tiene multiplicador deLagrange λ = −2, L es de la forma

L(4/3,−4/3, 4/3) =

0 0 00 −4 40 4 −16

.

Page 15: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.3. CONDICIONES DE SEGUNDO ORDEN 91

El espacio tangente N(4/3,−4/3, 4/3) esta definido por

N(4/3,−4/3, 4/3) = y = (a, b, c)| 32

3a− 8

3b +

32

3c = 0.

EntoncestyL(4/3,−4/3, 4/3)y = −3b2 − 16a2 < 0

para toda y ∈ N(4/3,−4/3, 4/3). Por lo tanto, la matriz L respectiva esestrictamente negativa definida por lo que T alcanza en (4/3,−4/3, 4/3)un maximo.

Para el punto (−4/3,−4/3, 4/3), con multiplicador de Lagrange λ =−2, se tiene que, por un razonamiento similar al aplicando antes, lamatriz L(−4/3,−4/3, 4/3) es estrictamente negativa definida por loque tambien en este punto T alcanza su valor maximo. Para el punto(0, 4, 0) con multiplicador de Lagrange igual a cero, la matriz L es iguala

L(0, 4, 0) = HF (0, 4, 0) =

16 0 00 0 40 4 0

.

El plano tangente a la sonda en este punto es de la forma

N(0, 4, 0) = y = (a, b, c)| b = 0por lo que tyL(0, 4, 0)y = 16a2 por lo que la matriz es positiva definidaen N(0, 4, 0).

Para el caso de (0,−2,√

3) que tiene multiplicador de Lagrangeigual a λ =

√3, L es de la forma

L(0,−2,√

3) =

16 + 8√

3 0 00 2

√3 4

0 4 8√

3

.

N(0,−2,√

3) = y = (a, b, c) ∈ <3| − 4b + 8√

3c = 0 y

tyL(0,−2,√

3)y = (16 + 8√

3)a2 +12√

3b2 ≥ 0.

Ası que la matriz L(0,−2,√

3) es positiva definida en N(0,−2,√

3).Para el ultimo punto (0,−2,−√3) con multiplicador de Lagrange λ =−√3 se tiene que la matriz L respectiva no es positiva definida. Porlo tanto T alcanza su mınimo en los puntos (0, 4, 0) y (0,−2,

√3) de la

elipsoide.

Page 16: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

92 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

5.3.2 Caso de restricciones en desigualdad

Consideremos el siguiente problema

Min F (x, y) = (x− 3)2 + (y − 3)2,

sujeto a h1(x, y) = x2 + y2 − 5 ≤ 0,

h2(x, y) = 3x + y − 6 ≤ 0.

En la grafica 5.3 se presenta las curvas de nivel de F y el conjuntoΩ que es el conjunto con rayas horizontales. Como se observa paratodos los puntos en el interior de Ω ninguna de las dos restricciones esactiva. En el caso que estemos sobre la recta 3x + y = 6 la restriccionh2 es activa mientras que h1 no lo es, salvo para el caso de los puntos(12 + 3

√114,−3(10 +

√114)) y (12− 3

√114, 3

√114− 10) donde h2 es

tambien activa. Los puntos sobre la curva x2 + y2 = 5 que estan pordebajo de la recta 3x + y = 6 tiene a h2 como restriccion activa.

Al graficar la region admisible observamos que el mınimo debeencontrarse en los puntos cercanos a la interseccion en el primer cuadrantede la recta con la circunferencia. Un buen punto inicial para iniciar labusqueda del mınimo es (12− 3

√114, 3

√114− 10).

En general

Ω = y ∈ <n| hj(y) = 0, j = 1, . . . , m, fj(y) ≤ 0, j = 1, . . . , s(5.14)

y las funciones hj y fj son funciones de <n a <.Dado un punto x ∈ Ω se definen las restricciones activas en este

punto como aquellas para las cuales se satisface la igualdad. Denotemoscomo I(x) a los ındices asociados a las restricciones activas en x.Entonces el espacio N(x) se define para el caso e las desigualdades

N(x) = y ∈ <n| t∇hj(x)y = 0 j = 1, . . . ,m y t∇fj(x)y = 0 ∀j ∈ I(x).Asimismo diremos en este caso que x es un punto regular de Ω si

el conjunto de vectores formados por los gradientes de las restriccionesactivas son linealmente independientes.

Para el ejemplo anterior N(0, 0) = 0 porque ese punto es un puntointerior de Ω. Pero

N(12 + 3√

114,−3(10 +√

114)) = y = (a, b) ∈ <2| 3a + b = 0

Page 17: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.3. CONDICIONES DE SEGUNDO ORDEN 93

yN(0,

√5) = y = (a, b) ∈ <2| 2

√5b = 0.

5.3.3 Condiciones de Kuhn y Tucker para el casono lineal

Considerese el problema

Min F (x)

x ∈ Ω

con Ω definido por

Ω = y ∈ <n| hj(y) ≤ 0,

con hj una funcion no lineal.

Teorema 5.10 Si x∗ es un punto extremo de F restringido a Ω y six∗ es un punto regular de Ω entonces existe µ ∈ <s con µj ≥ 0 paraj = 1, . . . s tal que

∇F (x∗) +s∑

j=1

µj∇hj(x∗) = 0 (5.15)

yµj[hj(x

∗)] = 0 ∀ j = 1, . . . , s. (5.16)

La demostracion de este teorema es la siguiente: Sea

S = x ∈ Ω|hj(x) = 0 para j ∈ I(x∗)

entonces si x∗ es el mınimo de f en Ω entonces tambien lo es en S por loque al tener puras restricciones de igualdad por lo que x∗debe satisfacerlas condiciones de primer orden para restricciones de igualdad vistas enla seccion anterior, por lo tanto existen µj para j ∈ I(x∗) tal que

∇F (x∗) +m∑

i∈I(x∗)µi∇hi(x

∗) = 0.

Page 18: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

94 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

Si seleccionamos µi = 0 para i no estando en I(x∗) entonces seobtienen las condiciones de Kuhn y Tucker .

∇F (x∗) +m∑

i=1

µi∇hi(x∗) = 0,

ademas se cumple que

µihi(x) = 0 i = 1, . . . , m.

Basta ahora demostrar que las µi asociadas a las restricciones activasde x∗ son no negativas. Esto lo haremos por reduccion al absurdo.Supongamos que hay alguna µk < 0 para alguna k ∈ J(x∗). Sea S lasuperficie definida por todas las restricciones activas salvo la k-esimarestriccion y sea N(x∗) el espacio tangente asociado a esta superficieen el punto x∗. Como x∗ es un punto regular existe una y ∈ <n talque y ∈ N(x∗) y que satisface que t∇hk(x

∗)y < 0. Recordemos quesi y ∈ N(x∗) existe una curva x(t) que satisface que x(0) = x∗ y quex(0) = y y que para alguna δ > 0, x(t) ∈ S para t ∈< 0, δ >. Entonces

dF (x(t))

dt|t=0 =t ∇F (x∗)y = −µt

k ∇hk(x∗)y < 0.

De nuevo como en el caso lineal tenemos que y es una direccion dedescenso lo que contradice que x∗ sea el mınimo.

Las condiciones de segundo orden son similares al caso de igualdad.

Teorema 5.11 Supongamos que x∗ es un mınimo local del problema(P ) y que x∗ es un punto regular de Ω entonces existe un vector µ ∈ <s

tal que µj ≥ 0 y∇F (x∗) +t Jh(x∗)λ = 0.

Si N(x∗) = y ∈ <m|t∇h(x∗)y = 0 ∀j ∈ I(x∗) entonces la matriz

L(x∗) = F (x∗) +s∑

i=1

µiHhi(x∗)

es semidefinida positiva en N(x∗).

Page 19: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.3. CONDICIONES DE SEGUNDO ORDEN 95

Teorema 5.12 (Condiciones suficientes) Supongase que hay un puntox∗ en Ω y una µ ∈ <s tal que

∇F (x∗) +s∑

j=1

µj ∇hj(x∗) = 0. (5.17)

Supongase tambien que la matriz

L(x∗) = HF (x∗) +s∑

i=1

Hhi(x∗)µi

es definida positiva en

N(x∗) = y ∈ <n|t∇hj(x∗)y = 0 ∀j ∈ I(x∗).

⇒ x∗ es un mınimo local estricto de F en Ω.

La demostracion es similar al caso de igualdad.

5.3.4 Ejemplo

Consideremos el siguiente problema

Min F (x, y) = (x− 3)2 + (y − 3)2,

sujeto a h1(x, y) = x2 + y2 − 5 ≤ 0,

h2(x, y) = 3x + y − 6 ≤ 0.

El gradiente de F es igual a ∇F (x, y) = (2(x − 3), 2(y − 3)).Supongamos el primer caso que h1 y que h2 no son activas entonces elpunto x1 que hace al gradiente cero es (3, 3), punto que no es admisible.Por lo tanto alguna de las restricciones debe ser activa. Supongamosque h1 es activa entonces el sistema a resolver es

2(x− 3) + 2xµ2 = 0,

2(y − 3) + 2xµ2 = 0,

x2 + y2 = 5.

La solucion del sistema es (√

5/2,√

5/2) es la solucion con µ1 = 0.8973.Este punto no esta en Ω. Supongamos que h2 es activa entonces

Page 20: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

96 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

t∇h2(x, y) = (2x, 2y). Entonces el sistema de ecuaciones a resolveres

2(x− 3) + 3µ1 = 0,

2(y − 3) + µ1 = 0,

3x + y = 6.

La solucion del sistema es (1.2, 2.4) con µ1 = 1.2. Este punto no estaen Ω.

Supongamos ahora que h1 y h2 son activas, entonces el sistemacorrespondiente a resolver es

2(x− 3) + 3µ1 + 2xµ2 = 0,

2(y − 3) + µ1 + 2xµ2 = 0,

3x + y = 6,

x2 + y2 = 5.

La solucion es (1.425834, 1.722497) con µ1 = 0.47571918 y µ2 = 0.603567.Demostremos que este punto es un mınimo. La matriz L respectiva es

L(1.425834, 1.722497) =(

2 + 2µ2 00 2 + 2µ2

).

Esta matriz es positiva definida para cualquier vector de <2 distinto decero.

5.4 Ejercicios

1. Plantee y resuelva analıticamente el siguiente problema. El Sol deMerida fue recientemente adquirido por Televisa. Este se vende a$2.00 el ejemplar y tiene una circulacion diaria de 20,000 numeros.Por cuestion de venta de anuncios gana $1, 000 por pagina yel periodico vende 15 paginas diarias. La nueva administraciondesea incrementar sus ganancias y desea reducir sus gastos sema-nales. El periodico gasta $60, 000 en su departamento editorial(escritores, reporteros, fotografos,etc), $20, 000 en su departamentode suscripciones y $50, 000 de gastos fijos a la semana. Si se reduce

Page 21: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

5.4. EJERCICIOS 97

el presupuesto del departamento editorial se ahorrarıa dinero peroafectarıa la calidad del periødico. El mınimo presupuesto con elque puede funcionar este departamento es de $40, 000. Estudiosdemuestran que por cada 10% de reduccion de presupuesto de estedepartamento se pierde un 2% de suscriptores y uno por cientopor venta de anuncios. Recientemente, otro periodico, incrementosu presupuesto del departamento de publicidad en un 20% y comoconsecuencia se incremento en un 15% la venta de anuncios. Losnuevos duenos del Sol de Merida estan dispuestos a gastar hasta$40, 000 en su departamento de publicidad, ¿Que estrategia hayque seguir para maximizar las ganacias dado que el monto totalde gastos no puede exceder los $50, 000 nuevos pesos a la semana?

2. Resuelva analıticamente el siguiente problema

Min x2 − xy + y2 − 3x

sujeto a x, y ≥ 0

x + y ≤ 1.

Bosqueje el conjunto Ω admisible.

3. Resuelva analıticamente

Min x31 + x2

2

sujeto a x21 + x2

2 − 10 = 0,

1− x1 ≤ 0,

1− x2 ≤ 0,

Grafique la region admisible.

4. Una companıa planea fabricar cajas rectangulares cerradas conun volumen de 8lt. El material para la base y la tapa cuesta eldoble que el material para los lados. Encuentre las dimensionespara las cuales el costo es mınimo.

5. El cono z2 = x2 + y2 esta cortado por el plano z = 1 + x + y.Hallense los puntos sobre esta seccion mas proximos al origen.

Page 22: CAPITULO 5 Optimizaci¶on con restriccionessgpwe.izt.uam.mx/pages/cbi/psb/ananum/material_adicional/OPTI5.pdf · 80 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES¶ precio al tiempo t

98 CAPITULO 5. OPTIMIZACION CON RESTRICCIONES

6. Se trata de montar un radiotelescopio en un planeta recien descu-bierto. Para minimizar la interferencia se desea emplazarlo dondeel campo magnetico sea mas debil. Supongamos que se modela elplaneta usando una esfera con un radio de 6 unidades. Se sabe quela fuerza magnetica esta dada por G(x, y, z) = 6x− y2 + xz + 60,considerando un sistema coordinado cuyo origen esta en el centrodel planeta. ¿Donde hay que ubicar al radiotelescopio?

7. Dados n numeros positivos a1, a2, . . . , an, hallese el valor maximode la expresion

w(x) =n∑

i=1

aixi

si∑N

i=1 x2i = 1.

8. Se tiene un portafolio con tres activos con los siguientes datos

A1 A2 A3

ri .4 .8 .8σ2

i .2 .25 .2σij σ12=.1 σ13=0.1 σ23 = 0.05

determine la composicion del portafolio que minimiza el riesgo,con rendimiento esperado igual a r∗, determine los posibles valoresque puede tomar r∗, sin ventas en corto y la suma de las Wi debeser igual a 1.

9. Determine transformando el siguiente problema a un problema deprogramacion lineal: Minimice F (x, y) = 2x2 +y2−2xy−5x−2ysujeto a h1(x, y) = 3x + 2y ≤ 20, h2(x, y) = 5x − 2y ≥ −4, yx, y ≥ 0.

10. Determine la solucion del problema anterior en forma directa.