papa quiroz

Upload: raqhum

Post on 24-Feb-2018

247 views

Category:

Documents


1 download

TRANSCRIPT

  • 7/25/2019 Papa Quiroz

    1/84

    UNIVERSIDAD NACIONAL DEL CALLAO

    FACULTAD DE CIENCIAS NATURALES Y MATEMATICA

    INSTITUTO DE INVESTIGACION

    Un Metodo no Euclidiano para Problemas de Optimizacion

    en Espacios Euclidianos.

    Erik Alex Papa Quiroz

    Resolucion Rectorial N 1352-2007-R

    (01 de noviembre de 2007 al 31 de octubre de 2008)

  • 7/25/2019 Papa Quiroz

    2/84

    Indice

    Resumen iv

    Introduccion 1

    Marco Teorico 6

    1 Preliminares 7

    1.1 Smbolos y Notaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    1.2 Definiciones Basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

    2 Elementos de Geometra Riemanniana 112.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    2.2 Variedades diferenciables . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.3 Aplicaciones diferenciables entre variedades . . . . . . . . . . . . . . . 16

    2.4 Espacio tangente a una variedad diferenciable . . . . . . . . . . . . . 18

    2.5 Metricas riemannianas en variedades diferenciables . . . . . . . . . . 21

    2.6 Campos de vectores, conexiones afines y deriva

    da covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.7 Curvatura de una variedad riemanniana . . . . . . . . . . . . . . . . 38

    2.8 Gradiente y Hessiana en una variedad riemanniana . . . . . . . . . . 42

    2.9 Variedades completas . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    3 El Problema de Optimizacion y sus Condiciones de Optimalidad 50

    3.1 Existencia de puntos de mnimo global . . . . . . . . . . . . . . . . . 51

    3.2 Caracterizacion de puntos de mnimo local . . . . . . . . . . . . . . . 52

    ii

  • 7/25/2019 Papa Quiroz

    3/84

    3.3 Elementos del analisis convexo . . . . . . . . . . . . . . . . . . . . . . 54

    3.3.1 Convexidad en una variedad riemanniana . . . . . . . . . . . . 55

    3.3.2 Funciones cuasi-convexas y pseudoconvexas . . . . . . . . . . 59

    4 Metodo del Maximo Descenso 61

    4.1 Metodo con busqueda de Armijo generalizado . . . . . . . . . . . . . 64

    4.2 Metodo com uma regularizacion proximal . . . . . . . . . . . . . . . . 67

    Materiales y Metodos 71

    Resultados 72

    Discusion 73

    Bibliografa 74

    Apendice 77

    iii

  • 7/25/2019 Papa Quiroz

    4/84

    Resumen

    Un Metodo no Euclidiano para Problemas de Optimizacion en Espacios

    Euclidianos

    Erik Alex Papa Quiroz

    El Objetivo de la investigacion es presentar un metodo de optimizacion usando

    elementos de geometra riemanniana para resolver problemas de optimizacion que

    mejoren algunas desventajas de los metodos proyectivos.

    Esta investigacion fue motivada por el alto costo computacional de los metodos

    proyectivos para mantener viabilidad en cada iteracion en la busqueda de la solucion

    de problemas de optimizacion con restricciones, como tambien, de la incertidumbre

    de la convergencia de los iterados cuando el problema tiene una funci on que no es

    convexa.

    La tecnica empleada para la recopilacion de datos fue la busqueda de trabajos

    relacionados en revistas publicadas, uso de bibliotecas y hemerotecas especializadas

    como tambien viajes a centros de investigacion en el extranjero (Brasil, Colombia y

    Argentina).

    El resultado de la investigacion es la introduccion de un metodo no euclidiano

    que bajo algunas hipotesis naturales sobre el problema se obtiene la convergencia

    de los iterados a un punto crtico del problema de optimizacion y cuando la funcion

    objetivo es convexa se demuestra la convergencia a la solucion. Presentamos tambien

    una implementacion del metodo para algunos problemas particulares.

    En este sentido, este trabajo puede ser considerado como un aporte significa-tivo para la matematica computacional en la busqueda de algoritmos eficientes en

    la solucion de problemas practicos que surgen en diversas areas de las ciencias y la

    ingeniera.

    Palabras Claves:

    Metodo del gradiente, problemas convexos, metricas riemannianas, implementacion

    computacional.

    iv

  • 7/25/2019 Papa Quiroz

    5/84

    Introduccion

    La Optimizacion es una rama de la Matematica Aplicada que estudia el problema

    de maximizar o minimizar una funcion, llamada funcion objetivo, sujeta a algunas

    restricciones sobre su dominio. La Optimizacion, como lnea de investigacion, surgioa mediados del siglo anterior y en este intervalo de tiempo a demostrado diversas

    aplicaciones en diferentes areas de las Ciencias e Ingenieras, donde una eleccion

    optima de los parametros y variables conlleva al mejoramiento de las tecnicas para

    resolver el problema planteado.

    El problema de Optimizacion puede ser expresado, sin perdida de generalidad,

    como:

    min{f(x) :h(x) = 0},donde f :IRn IR en una funcion de valores reales y f :IRn IRm es una funcionde valores en IRm yxes la variable a determinar.

    Una clase de metodos muy conocidos y utilizados para resolver el problema planteado

    son los metodos proyectivos, los cuales generan una sucesion de puntos{xk}, dadospor x0 IRn tal que h(x0) = 0 (un punto inicial dado) y

    xk =PM(xk + tkdk),

    donde PM es la proyeccion ortogonal del punto xk +tkd

    k al conjunto M ={xIRn : h(x) = 0}, dk es la direccion de desplazamiento y tk es la longitud de paso dedk. Diferentes elecciones de dk dan origen a diferentes metodos proyectivos de opti-

    mizacion. Por ejemplo, si dk = f(xk),entonces tendremos el metodo de gradienteproyectado, sidk = (2f(xk))1(f(xk)),tendremos el metodo de Newton proyec-

    tado, etc. Propiedades de convergencia global de estos metodos son garantizados ba jo

    1

  • 7/25/2019 Papa Quiroz

    6/84

    algunas condiciones de convexidad sobre la funcion objetivo f y el conjunto de las

    restricciones M.

    Una desventaja de los metodos proyectivos es el alto costo computacional en re-

    alizar en cada iteracion una proyeccion sobreM.Otra desventaja es cuando la funcion

    objetivo fpierde la propiedad de la convexidad, llevando as a la indeterminacion si

    la sucesion{xk}converge y si el punto de convergencia es un punto optimo del prob-lema. Observemos que en general propiedades de convexidad de la funcion objetivo

    y de las restricciones garantizan la convergencia global de los metodos a un punto

    optimo.

    Una alternativa para superar estas desventajas es considerar al conjunto M comouna variedad diferenciable dotada con propiedades geometricas no euclidianas y trans-

    formar el problema original en el siguiente problema irrestricto:

    min{f(x) :x M}.

    Una de tales geometras es la geometra riemanniana, teora matematica que ha lla-

    mado mucho la atencion de los investigadores despues de su aplicacion en la teora

    de la relatividad por Albert Einstein.

    La alternativa planteada no es nueva, como se puede pensar, esta pertenece al

    area de la Optimizacion Matematica sobre variedades riemannianas el cual surgio

    como una extension natural de la teora y los metodos de optimizacion en el espacio

    euclidiano para espacios mas generales. Una de las ventajas de usar herramientas

    de geometria riemanniana en optimizacion es que problemas restrictos pueden ser

    vistos como irrestrictos considerando las propiedades intrnsecas de la variedad. Otra

    ventaja, es que problemas no convexos se pueden transformar en convexos escogiendo

    una metrica riemanniana apropiada.

    Uno de los precursores de la geometra riemanniana fue Lobachevski quien se

    atrevio a darnos la posibilidad de la existencia de una geometra no euclidiana,

    ver ALEKSANDROV, KOLMOGOROV y LAURENTIEV (1981),[1], proponiendo

    nuevas ideas, relacionando la geometra con la realidad material, el metodo, el alcance

    y sus aplicaciones. A raz de estas nuevas ideas, los matematicos actualmente estu-

    dian diversos espacios, ademas del euclidiano, entre ellos los espacios de Lobachevski,

    2

  • 7/25/2019 Papa Quiroz

    7/84

    los proyectivos, de infinitas dimensiones, los riemannianos, topologicos entre otros.

    El uso de la geometra riemanniana, por Einstein en 1915, en la teora de la

    gravitacion universal fue uno de los grandes impulsores para que en otras lneas de

    investigacion se utilizen las ideas de la geometria no euclidiana. En los tiempos

    actuales en que vivimos, tenemos ya diversas aplicaciones de la geometria riemanniana

    en varios campos de la ciencia e ingeniera, por ejemplo en estadstica, economa,

    computacion, biologa y optimizacion, entre otros.

    La relacion entre los metodos de Optimizacion Matematica y la geometria rie-

    manniana data por lo menos del ano 1972, con el trabajo desarrollado por LUEN-

    BERGER (1972), [17], donde usando el metodo de descenso geodesico obtiene la tasade convergencia del metodo del gradiente proyectado para el problema de min f(x),

    sujeto a h(x) = 0, donde f : IRn IR, h : IRn IRm, n > m. Esta lnea deinvestigacion tuvo continuidad con GABAY (1982), [11], donde del punto de vista

    de esta teora, estudia el metodo de gradiente reducido, generaliza los metodos de

    Cuasi-Newton obteniendo convergencia superlineal. Tambien hace un analisis com-

    putacional mostrando que la teora y la practica interrelacionadas pueden dar buenos

    resultados.El metodo de maximo descenso, estudiado por Cauchy en l847, es uno de los

    metodos mas antiguos y conocidos en la literatura para resolver problemas de op-

    timizacion con funciones objetivo continuamente diferenciables. Sin embargo, para

    una funcion arbitraria los resultados de convergencia no son muy fuertes ya que la

    convergencia global, como tambien la existencia de puntos de acumulacion no son

    garantizados. Solamente podemos asegurar que cualquier punto de acumulacion, si

    existe, es un punto crtico del problema.

    La situacion es muy diferente cuando la funcion objetivo es convexa, porque asum-

    iendo solamente que el conjunto de soluciones optimas es no vaco, el metodo de

    maximo descenso con busqueda de ARMIJO (1966), [2], y con una regularizacion

    proximal converge a un punto optimo. Este metodo en variedades riemannianas, con-

    siderando un problema de optimizacion con funcion objetivo arbitraria, fue estudiado

    por UDRISTE (1997), [24], SMITH (1994), [23] y RAPCSAK (1997), [21], obteniendo

    los mismos resultados clasicos de convergencia. Para el caso convexo en estas varie-

    3

  • 7/25/2019 Papa Quiroz

    8/84

    dades con curvatura seccional no negativa, la convergencia global usando la regla de

    busqueda de Armijo, pasos fijos y una regularizacion proximal, fue generalizada por

    da CRUZ NETO, LIMA y OLIVEIRA (1999), [6] y para funciones cuasi-convexas

    solamente en espacios euclidianos, por KIWIEL y MURTY (1997), [14]. Esta inves-

    tigacion, esta orientada a extender los resultados de Kiwiel y Murty en variedades

    riemannianas completas y con curvatura seccional no negativa.

    El objetivo principal de este trabajo consiste en construir un metodo de opti-

    mizacion usando elementos de geometra riemanniana que supere algunas desventajas

    de los metodos proyectivos.

    La importancia de esta investigacion es que nuestros resultados permitiran resolverproblemas de optimizacion sin necesidad de realizar proyecciones en cada iteraci on

    reduciendo as el costo computacional de los metodos proyectivos. Otra importan-

    cia es que podremos resolver problemas de optimizacion con funciones objetivos no

    convexas que se transformen en convexas mediante la introduccion de una metrica

    riemanniana apropiada sobre el conjunto de las restricciones, ampliando as el campo

    de aplicacion de los metodos proyectivos.

    Al no existir una metodologa efectiva para solucionar el problema planteado sejustifica el desarrollo de este proyecto para una posible incorporacion en los planes

    curriculares de estudio de las diversas especialidades de la matematica aplicada que

    desarrollen metodos de optimizacion como tambien de la construccion de nuevos al-

    goritmos para resolver problemas mas difciles.

    El trabajo esta organizada por los siguientes captulos:

    En el Captulo 1, presentamos los preliminares del trabajo de investigacion. Damos

    algunos smbolos y notaciones como tambien las herramientas matematicas necesarias

    para el buen entendimiento del trabajo.

    En el Captulo 2, presentamos elementos basicos de la geometra riemanniana

    basados en BOOTHBY (1986), [3], do CARMO (2005) (1988), [8], [9], LAGES (1960)

    (1973), [15],[16] y su relacion con la Optimizacion OLIVEIRA (1995), [19], damos

    ejemplos de las metricas mas conocidas y estudiamos una clase particular de metricas

    riemannianas diagonales, definidas en el ortante positivo IRn++ y el hipercubo abierto

    (0, 1)n,espacios naturales donde se definen los problemas de optimizacion, obteniendo

    4

  • 7/25/2019 Papa Quiroz

    9/84

    propiedades geometricas importantes como curvatura cero, ecuaciones secillas para

    hallar geodesicas y condiciones suficientes para garantizar que la variedad riemanniana

    sea completa.

    En el Captulo 3 presentamos el problema de optimizacion sobre una variedad rie-

    manniana y desarrollamos sus condiciones de optimalidad, caracterizamos los puntos

    de mnimo, luego estudiamos la clase de funciones convexas y cuasi-convexas.

    En el Captulo 4, desarrollamos el metodo de maximo descenso, y analizamos la

    convergencia del metodo para resolver el problema de minimizacion usando funciones

    objetivo cuasi-convexas. Probamos que la sucesion generada por el metodo, usando

    la regla de busqueda generalizada de Armijo y una regularizacion proximal, convergea un punto crtico de la funcion. Presentamos tambien un Apendice con algunos

    experimentos computacionales. Debemos resaltar que el resultado de esta investi-

    gacion ha generado el artculo de autoria de PAPA QUIROZ, QUISPE CARDENAS

    y OLIVEIRA (2008), [20], publicado por la revista Journal of Mathematical Analysis

    and Applications (USA).

    5

  • 7/25/2019 Papa Quiroz

    10/84

    Marco Teorico

    6

  • 7/25/2019 Papa Quiroz

    11/84

    Captulo 1

    Preliminares

    En este captulo haremos un resumen de los resultados basicos necesarios al desarrollo

    de los subsiguientes captulos. Las demostraciones seran, en princpio, todas ellas

    referenciadas.

    1.1 Smbolos y Notaciones

    A lo largo de este trabajo, usaremos la siguiente simbologa:(0, 1)n = (0, 1) (0, 1) ... (0, 1).IRn+= {x= (x1, x2,...,xn) IRn :xi > 0, i= 1, 2,..,n} .IRn++= {x= (x1, x2,...,xn) IRn :xi 0, i= 1, 2,..,n} .Dados x, y IRn, (x, y) =ni=1 xiyi: producto interno euclideano en IRn.Cp() ={f : IR : fes diferenciable de orden p} es el conjunto de funcionesp veces diferenciables en un domnio abierto . Si p =, entonces C() es elconjunto de funciones infinitamente diferenciables.

    M: variedad diferenciable.

    TpM: es el espacio tangente a Men el punto p.

    H: es el conjunto de campos de vectores X TpM. : es la conexion afin del conjunto de campo de vectoresH.X(p) : es un campo vectorial aplicado en el punto p.

    gradf(x) : es el gradiente de fen el sentido de la derivada covariante.

    Hf : es la matriz Hessiana de f.

    7

  • 7/25/2019 Papa Quiroz

    12/84

    1.2 Definiciones Basicas

    Definicion 1.2.1 SeaF :U IRn IRm una funcion diferenciable definida en unabierto U. Definimos la diferencial deFen el punto q U como una aplicacion

    dFq :IRn IRm,

    definida de la siguiente manera, dFq(v) = (0) conv IRn, donde= F o para

    algun : (, ) U tal que(0) =qy(0) =v. As:

    dFq(v) =(0) =

    d

    dt(F o)(t)|t=0.

    Se puede probar facilmente (ver do CARMO (2005),[8], pp. 127-128) que la diferencial

    es una aplicacion lineal que no depende de la curva tal que (0) =q, ademas, si:

    F(x) =F(x1, x2,...,xn) = (F1(x), F2(x),...,Fn(x)),

    la diferencial en el punto q, en las bases canonicas es:

    dFq = F1x1

    (q) F1x2

    (q) ... F1xn

    (q)

    ... ... ... ...

    Fmx1

    (q) Fmx2

    (q) ... Fmxn

    (q)

    .

    Definicion 1.2.2 SeaF :U IRn IRm una funcion diferenciable definida en unabierto U. Diremos quepU es punto crtico, si la diferencial deFen el punto p,dFp : IR

    n IRm no es sobreyectiva. La imagemF(p), dondep es punto crtico esllamado valor crtico. Un punto deIRm que no es valor crtico se llama valor regular

    deF, esto es, a

    F(U) es valor regular sidFx es sobreyectiva para todo x

    F1(a).

    Por un resultado de algebra lineal obtenemos una equivalencia para la sobreyectividad

    de la diferencialdFx:

    Para todox F1(a),dFx es sobreyectiva si y solamente si, el rango (dFx) =m n.As: a F(U) es valor regular si, y solamente si, el rango (dFx) = m, para todox F1(a).En particular sim= 1 tal quea

    F(U) es valor regular si, y solamente si,

    F(x)

    = 0

    para todo x F1(a).

    8

  • 7/25/2019 Papa Quiroz

    13/84

    Definicion 1.2.3 Dado un conjunto M, un subconjunto de partes deM, se dice

    una topologa enM si:

    1. y M;2. SiA, B entoncesA B ;

    3. Si(Ai)il es una famlia de elementos de, entonces

    il Ai .

    El par (M, ) se dice espacio topologico y los elementos de son llamados abiertos

    del espacio topologico (, M).

    Definicion 1.2.4 (Espacios de Hausdorff). Sea M un espacio topologico, diremos

    queMes un espacio de Hausdorff, si para cualquier par de elementos distintos en

    M, existen abiertos disjuntos de dichos elementos.

    Definicion 1.2.5 SeaMun conjunto arbitrario, una metrica es una aplicaciond :

    M M IR tal que para todo x, y,z Mse satisfacen las siguientes condiciones:

    d1 : d(x, y) 0, d(x, y) = 0 si y solo six= y;

    d2 : d(x, y) =d(y, x);

    d3 : d(x, z) d(x, y) + d(y, z).

    El par(M, d) se llama espacio metrico.

    Definicion 1.2.6 Una sucesion{xm} en un espacio metricoMse llama de Cauchycuando para todo > 0 dado, existen0 IN tal que para todo m, n > n0, se tiened(xm, xn)< .

    Definicion 1.2.7 El espacio metrico (M, d) es completo cuando toda sucesion de

    Cauchy enMes convergente.

    Definicion 1.2.8 Sea(X, d)un espacio metrico completo. Una sucesion{yk}, k 0,deXes cuasi-Fejer convergente al conjunto U X, si para cadau U existe unasucesion{k} IR tal quek 0,

    +k=0

    k

  • 7/25/2019 Papa Quiroz

    14/84

    Teorema 1.2.1 En un espacio metrico completo (X, d), si{yk} es cuasi-Fejer con-vergente para un conjunto U X, entonces{yk} es limitada. Si ademas, un puntode acumulaciony de

    {yk

    }pertence aU. Entonces

    {yk

    }converge y lim

    k

    yk = y.

    Demostracion. Analogo a BURACHIK (1995), [4].

    10

  • 7/25/2019 Papa Quiroz

    15/84

    Captulo 2

    Elementos de Geometra

    Riemanniana

    2.1 Introduccion

    Las nociones de geometra riemanniana fueron introducidas por G. Riemann un

    10 de Junio de 1854 a travez de una disertacion titulada: Sobre las hipotesis que

    estan en los fundamentos de la geometra. En el afirma que toda coleccion continua

    de fenomenos homogeneos puede considerarse como un espacio. Estas ideas dieron

    origen a lo que hoy conocemos como geometra riemanniana.

    En este captulo presentamos los conceptos principales de estas ideas que usaremos

    a lo largo de este trabajo, como son: variedades diferenciables, aplicaciones diferen-

    ciables entre variedades diferenciables y los espacios tangentes a estas variedades,

    tambien definiremos metrica riemanniana, geodesica, curvatura, gradiente y Hessiano

    de funciones o matriz Hessiana de una funcion, en una variedad riemanniana. En

    lo que concierne a metricas, presentamos una clase de metricas riemannianas diago-

    nales, herramientas que nos permiten obtener propiedades interesantes para desarrol-

    lar nuevos algoritmos en Optimizacion, esto es, que sobre una variedad riemanniana

    se puede derivar un campo vectorial tangente a lo largo de una curva, a traves de

    la llamada derivada covariante a lo largo de curvas que depende de la metrica. For-

    malizaremos estos resultados en las siguientes secciones.

    11

  • 7/25/2019 Papa Quiroz

    16/84

    2.2 Variedades diferenciables

    Una variedad diferenciable, a groso modo, es un espacio topologico (no necesari-

    amente vectorial) semejante localmente al espacio euclidiano IRn cuja relacion tiene

    el soporte de la diferenciabilidad. En esta seccion presentamos estas ideas y daremos

    algunos ejemplos de variedades diferenciables relacionadas con problemas de Opti-

    mizacion. Para una demostracion rigurosa de los resultados aqu presentados, refer-

    enciamos a Manfredo do CARMO (1988), [9]; SAKAI (1996), [22]; ELON LAGES

    (1960 y 1973), [15] y [16]; BOOTHBY (1986), [3], y HICKS (1966), [12].

    En todo este captulo, el termino diferenciable de una funcion o aplicacion sig-

    nificara que es infinitamente diferenciable.

    Definicion 2.2.1 (Superficie regular de IRn). Un subconjunto S IRn, es una su-perficie regular deIRn de dimensionk n si para cadap Sexiste una vecindadVdep enIRn, un subconjunto abiertoU IRk y una aplicacion biyectivaX :U SVtal que:

    1.

    Xes diferenciable enU.

    2.X es homeomorfismo.

    3. Para todo q U, dXq :IRk IRn es inyectiva, dondedXq es la diferencial deX en el punto q.

    Vease un grafico de la definicion de superficie regular en IR3.

    p*

    X

    x

    y

    z

    V S

    V

    US

    Figura 1. Superficie regular

    Para cadap S,la aplicacionX :U V Ses llamadaparametrizacion deSenp, osistema de coordenadas locales en p. V Ses llamada vecindad coordenadade p.

    12

  • 7/25/2019 Papa Quiroz

    17/84

    Proposicion 2.2.1 Sea U un subconjunto abierto de IRn y F : U IRm unafuncion diferenciable enUcon valor regulara IRm, entoncesF1(a) es una super-ficie regular de dimensionn

    m.

    Corolario 2.2.1 SeaUun subconjunto abierto de IRn yf : U IR una funciondiferenciable tal que(f)(x) = 0,para todo x f1(a).EntoncesS=f1(a) es unasuperficie regular.

    La Proposicion 2.2.1 permite mostrar una famlia de superfcies regulares utiles en el

    contexto de la Optimizacion Matematica.

    Ejemplo 2.2.1 Consideremos los problemas de Optimizacion Lineal:

    (P)min cTx

    s.a Ax= b

    x 0.

    (D) max bT

    s.a AT+ s= c

    s 0.donde: x,s, c IRn; , b IRm yA IRmn es de rango m < n. El problema(P)es llamado primal y(D) el dual de(P).

    a). Restricciones estrictas primales. Si S ={x IRn++ : Ax = b} es elconjunto de las restricciones estrictas del problema (P), definiendo la funcion

    F :IRn++ IRm,porF(x) =Ax b se tiene quedFx = A, para todo x IRn++.Por tener la matriz A rango m y aplicando la Proposicion 2.2.1 tenemos que

    F1(0) =Ses una superfcie regular de dimensionn m.

    b). Restricciones estrictas duales. SiS= {(, s) IRmIRn++:AT+s= c} esel conjunto de las restricciones estrictas del problema(D), definiendo la funcion

    F :IRm IRn++ IRn, por:

    F(, s) =AT+ s c= [AT I]

    s

    cSe tienedF(,s) = [A

    T I]con rango n, para todo(, s) IRm IRn++. Aplicandola Proposicion 2.2.1, F1(0) =Ses una superfcie regular de dimensionm.

    13

  • 7/25/2019 Papa Quiroz

    18/84

    Ejemplo 2.2.2 Consideremos el problema en Optimizacion no Lineal:

    min f (x)

    s.a h(x) = 0

    x U

    dondeUes un abierto deIRn, f :IRn IR yh: IRn IRm son funciones dadas.Sih es diferenciable y su matriz Jacobiana en el punto x, Jh(x) tiene rango m en-

    tonces, el conjunto{x U : h(x) = 0} es una superficie regular. Como casosparticulares tenemos que los conjuntos{x IRn : h(x) = 0} y{x IRn : h(x) =0y x >0

    }son superficies regulares.

    Una propiedad importante de las superficies regulares, es que ella no depende del

    cambio de parametros, es decir, cualquier otra parametrizacion de la superficie en un

    punto p S sigue manteniendo las propiedades diferenciables. Este resultado nosservira para generalizar la definicion de superficie regular a variedad diferenciable.

    Definicion 2.2.2 (Cambio de parametros). SeanX SyY Sdos parametriza-ciones deSen el punto p tales que

    W = X(U) Y(V) = .

    La aplicacionY1oX : X1(W) Y1(W) es llamada cambio de parametros.

    Proposicion 2.2.2 SeaS una superficie regular deIRn de dimensionk. El cambio

    de parametrosY1oX : X1(W) Y1(W) es un difeomorfismo.

    La nocion de variedad diferenciable que definimos a seguir es necesaria para poder

    extender los metodos del calculo diferencial a espacios mas generales. Como veremos

    posteriormente, una superficie regular sera un claro ejemplo de variedad diferenciable.

    Definicion 2.2.3 (Variedad diferenciable). Una variedad diferenciable de dimension

    n es un conjunto M y una famlia de aplicaciones inyectivasX :UM, I(conjunto de parametros), definidos en abiertosU deIR

    n enMtales que se cumplen

    las siguientes condiciones:

    14

  • 7/25/2019 Papa Quiroz

    19/84

    1. M=I

    X(U).

    2. Para todo parX,X conX(U) X(U) =W=, los conjuntosX1(W)yX1(W) son abiertos en IRn y las aplicacionesX1 X :X1(W)X1(W) son diferenciables.

    El par (U, X) con p X(U) es llamado una parametrizacion. Una famlia{(U, X)} satisfaciendo los items1 y 2es llamadaestructura diferenciablede M.As, la variedad es un conjunto Mcon una estructura diferenciable.

    Una estructura diferenciable en una variedad diferenciable Minduce de forma natural

    una topologa en Mdefinido por:

    AMes abierto en M si para todo I,X1(A X(U)) es abierto enIRn.

    Observemos que la topologa es definida de tal modo que los conjuntosX(U) sonabiertos y las aplicacionesX son continuas.Debido a la Proposicion 2.2.2 podemos enunciar, el siguiente resultado.

    Proposicion 2.2.3 Toda superficie regular deIRn

    de dimension k es una variedad

    diferenciable de la misma dimension.

    Proposicion 2.2.4 SiM1 yM2 son dos variedades diferenciables de dimensionm1

    ym2 respectivamente, entonces el producto cartesiano M1 M2 es una variedad dedimensionm1+ m2.

    Definicion 2.2.4 (Variedad de Hausdorff de base numerable). Una variedad diferen-

    ciableM,es llamada variedad de Hausdorff siM,con la topologa dada, es un espacio

    de Hausdorff.

    La variedad diferenciable M tiene base numerable si ella puede ser cubierta por

    una cantidad numerable de vecindades coordenadas, esto es, si existe una sucecion

    {Xn(Un)} , n IN, de vecindades coordenadas tal que: M=

    nN

    Xn(Un).

    En todo este captulo asumiremos que la variedad diferenciable Mes de Hausdorff y

    de base numerable.

    15

  • 7/25/2019 Papa Quiroz

    20/84

    2.3 Aplicaciones diferenciables entre variedades

    Definicion 2.3.1 Seaf : U M IR, dondeUes un subconjunto abierto de lavariedad diferenciableM. Diremos quefes diferenciable enp U, si para algunaparametrizacionX : U IRn M, conp X(U)U, la funcion compuestaf X :U IRn IR es diferenciable enX1 (p). Se dice quef es diferenciableenUsi es diferenciable en todo punto deU.

    X

    X1

    f

    M

    pU

    f(p)

    f X

    IR

    U

    Figura 2. f es diferenciable enU.

    Una consecuencia inmediata del item 2de la Definicion 2.2.3 es que, la diferenciabili-

    dad de una funcion de valores reales definida sobre una variedad diferenciable M no

    depende de la eleccion de la parametrizacion. En efecto, seaX : U IRn M,otra parametrizacion tal que, p X(U) U. Podemos expresar:

    f X

    =f X X

    1

    X :U

    IRn

    M.

    ComofX es diferenciable por definicion y X1 Xes diferenciable por ser cambiode parametros, entoncesf Xes tambien diferenciable.

    Definicion 2.3.2 Una curva sobre una variedad difereciableM es una funcion :

    I M dondeI= (, ). Diremos quees diferenciable en t0 Isi para algunaparametrizacionX : U IRn M con (t0) X(U), la funcion compuesta=

    X1

    :I

    Ues diferenciable ent0,donde(I)

    X(U). Sies diferenciable

    en todo t I, diremos quees diferenciable enI.

    16

  • 7/25/2019 Papa Quiroz

    21/84

    X

    X1

    X(U)

    (t) (t0) =p

    t0

    U IRn

    M

    I

    = X1

    Figura 3. es diferenciable ent I.

    La definicion de diferenciabilidad puede ser extendida para aplicaciones entre varie-

    dades.

    Definicion 2.3.3 Sean M1 yM2 variedades diferenciables de dimensionm ynres-

    pectivamente. Una aplicacion: M1 M2 es diferenciable enp V, si dados:

    X1:U1 IRn M1

    parametrizacion deM1 enp y:

    X2:U2 IRm M2

    parametrizacion de M2 en (p) con (X1(U1)) X2(U2), la aplicacionX12 X1 : U1 IRn IRm es diferenciable enX11 (p). Esta ultima aplicacion es llamadaexpresion de en las parametrizacionesX1 yX2. es diferenciable en un abierto deM1 si es diferencible en todos los puntos del abierto.

    Analogamente al caso de funciones de valores reales, se muestra que la definicion no

    depende de las parametrizaciones elejidas.

    Observacion 2.3.1 Una consecuencia de la Definicion 2.3.3 es que, siX :U Mes una parametrizacion de M en el punto p entoncesX1 :X(U) M IRn esdiferenciable.

    Definicion 2.3.4 (Difeomorfismo entre variedades diferenciables). Sea : M1M2 una aplicacion diferenciable entre dos variedades diferenciables. Decimos que

    17

  • 7/25/2019 Papa Quiroz

    22/84

    es difeomorfismo si es bijetiva y1 es diferenciable. es difeomorfismo local en

    p M1, si existen vecindadesUdep yV de(p)tal que : U Ves difeomorfismo.

    Observacion 2.3.2 De la observacion 2.3.1, concluimos que cualquier parametriza

    cionX :U IRn X(U) M, es un difeomorfismo. Por esta razon, muchas vecespara facilitar la notacion se identificaX(U) U.

    2.4 Espacio tangente a una variedad diferenciable

    Las consideraciones a seguir motivan la definicion que extiende a variedades difer-

    enciables la nocion de vector tangente. Para superficies de IR3, un vector tangente en

    un puntop de la superficie es definida como el vector velocidad en IR3 de una curva

    de la superficie pasando por p. Como en variedades diferenciables no disponemos

    del soporte de un espacio ambiente, precisamos de una propriedad caracterstica del

    vector tangente que substituya la nocion de velocidad.

    Recordemos algunas formalidades en superficies regulares.

    Sea >0 suficientemente pequeno y una curva : (, ) IRn tal que:

    (t) = (1(t),...,n(t)),

    con (0) = p y

    (0) = (

    1(0),...,

    n(0)) = v IRn. Sea ademas una funcion f :IRn IR diferenciable definida en una vecindad de p. Podemos restringir f a lacurva y calcular la derivada direccional de fen la direccion de v IRn:

    d(f )dt (t)t=0

    =

    ni=1

    fi((0))didt(0) =

    ni=1

    i(0) ip f.Por tanto la derivada direccional en la direccion de v es un operador sobre funciones

    diferenciables que depende unicamente de v y esta es la propiedad caracterstica que

    usaremos para definir un vector tangente en variedades.

    Definicion 2.4.1 (Vector tangente en un punto de una variedad diferenciable). Sea

    M una variedad diferenciable. Consideremos una curva diferenciable

    : (, ) M,

    18

  • 7/25/2019 Papa Quiroz

    23/84

    donde(0) = p y sea Dp ={f :MIR : fes diferenciable enp}. Definimos elvector tangente a la curvaent= 0 como la funcion(0) :Dp IR dada por:

    (0)f (0)(f) = d(f )dt (t)t=0

    , f Dp.

    Un vector tangente enp es el vector tangente ent= 0 de alguna curva: (, ) M con(0) =p.

    Si Mes una superficie regular de dimension k n, esto es M IRn, definimos elvector tangente en el punto pcomo el vector velocidad en IRn,esto es,

    (0) = (

    1(0),

    2(0),...,n(0)).

    Definicion 2.4.2 (Espacio tangente a una variedad diferenciable). El espacio tan-

    gente a una variedadMen un punto p representado porTpM, es el conjunto de todos

    los vectores tangentes aM enp. As, TpM={vIRm :v es un vector tangente enp}.

    Observacion 2.4.1 Si para una parametrizacionX : U IRn M conp=X(0)y q U, podemos restringir la funcionf Dp y la curva : (, ) M en estaparametrizacion:

    f oX(q) =f(X(q)) =f(q) =f(q1,...,qn)

    (identificacion: f oX f).Podemos escribir tambien,

    X1 (t) = (q1(t),...,qn(t)).

    Por definicion tenemos:

    (0)f= d(f )

    dt (t)

    t=0

    = d(f X X 1 )

    dt (t)

    t=0

    = d

    dt(f(q1(t), q2(t),...,qn(t))

    t=0

    entonces:

    (0)f=n

    i=1

    q

    i(0). fqi (p)= ni=1

    q

    i(0). qi0 f.19

  • 7/25/2019 Papa Quiroz

    24/84

    As,

    (0) =n

    i=1

    q

    i(0).

    qi

    0

    (2.1)

    es la expresion del vector tangente a enp con relacion a la parametrizacionX.Observacion 2.4.2 Para una curva coordenada en U, i(xi) = (0,...,xi, ..., 0), se

    tiene que la composicionX i = i es una curva coordenada sobre M y de laecuacion anterior,

    i(0) = ( xi

    )0. Se sigue que( xi

    )0 es el vector tangente a la curva

    coordenadai(t).

    Observacion 2.4.3 De la eleccion de una parametrizacion obtenemosn vectores

    ( ( xi )p, i= 1,...,n) enTpMque generan, por (2.1), los vectores enTpM.

    Observacion 2.4.4 SeaMuna variedad diferenciable, el fibrado tangente deM es

    definido por:

    T M= {(p, v); p M/ v TpM}.

    T M puede ser unido de uma estructura diferenciable transformandose as en una

    variedad diferenciable (ver do CARMO (1988), [8], pag. 15 para su demostracion).

    En los siguientes resultados presentamos ejemplos de espacios tangentes.

    Proposicion 2.4.1 El espacio tangente de una variedad diferenciable que es un sub-

    conjunto abierto deIRn es el propio IRn.

    Como consecuencia de esta proposicion se tiene:

    a). TpIRn =IRn, TpIR

    n++ = IR

    n.

    b). SiM= {(, s) IRm IRn :s >0}, entonces TpM=IRm+n.

    Proposicion 2.4.2 SeaM = F1(a) una variedad de dimensionn m, donde laaplicacionF : U IRn IRm es una funcion diferenciable, Ues abierto ya es unvalor regular deF, entonces: TpM=Tp(F

    1(a)) =K er(dFp).

    Ejemplo 2.4.1 SiM= {x IRn++ : Ax = b}, dondeA IRmn tiene rango m < n,entonces:

    TpM=KerA= {x IRn :Ax= 0}.

    20

  • 7/25/2019 Papa Quiroz

    25/84

    En efecto, la funcion que define M es F : IRn++ IRm tal que F(x) = Ax b, ladiferencial deFen el punto p M esdFp = A, luego aplicando la Proposicion 2.4.2obtenemos el resultado.

    Ejemplo 2.4.2 Sea h : U IRn IRm una funcion diferenciable con JacobianoJh(x) =dhx con rango m. Consideremos la variedadM=h

    1(x) ={xU, h(x) =0}, entonces:

    Tp

    h1(0)

    = K er(Jh(x)).

    Corolario 2.4.1 Sea D IRn un conjunto abierto y f : D IR una funcion

    diferenciable tal quef(x) = 0,para todo x f1

    (a) vimos que, M=f1

    (a) es unavariedad diferenciable. Entonces para cadap M,

    Tp

    f1(a)

    = f(p).

    Proposicion 2.4.3 SeanM1 yM2 dos variedades diferenciables de dimensionn ym

    respectivamente y sea: M1M2 una aplicacion diferenciable. Para cadapM1y cadav TpM1, escojamos una curva diferenciable: (, )M con(0) =p,(0) =v. Definiendo = , la aplicacion:

    dp : TpM1 T(p)M2,

    dada por dp(v) =(0) es una aplicacion lineal que no depende de la eleccion de.

    Esta aplicacion es llamada la diferencial de enp.

    Proposicion 2.4.4 SeaM1 yM2 dos variedades diferenciables. Si: M1M2 es

    un difeomorfismo, entoncesdp:TpM1 T(p)M2 es un isomorfismo.

    2.5 Metricas riemannianas en variedades diferen-

    ciables

    Las metricas en un espacio son muy importantes porque nos permiten medir

    distancias, calcular errores, longitudes de curvas, etc. Cuando tenemos una curva

    21

  • 7/25/2019 Papa Quiroz

    26/84

    parametrizada en IRn, (t) = (1(t), 2(t),...,n(t)) donde t pertenece a algun inter-

    valo Ide IR, la longitud de arco de la curva generada por (t) es medida por:

    () = Iv(t)dt

    donde v(t) = (

    1(t),

    2(t),...,

    n(t)) y, representa la norma euclideana. As, lalongitud de la curva depende de la norma del vector velocidad definido por la metrica

    usual en IRn. Ahora, si nuestro espacio es una variedad diferenciableM y tenemos

    definida una curva en ella, entonces la longitud de arco de la curva sera obtenida por

    la medida realizada en el vector perteneciente al espacio tangente en cada punto.

    Necesitamos entonces definir una metrica en el espacio tangente TpMpara cada pM. Recordemos que ademas del producto interno clasico:

    (v, w)p =i

    viwi,

    podemos definir otro producto interno:

    < v, w >p=i,j

    gijviwi= (Gv,w),

    donde G = (gij) es una matriz simetrica definida positiva. Esta definicion aparece de

    modo natural al realizar un cambio de coordenadas. En efecto, sean x= (x1, x2,...,xn)

    yz= (z1, z2,...,zn) tal que x(t) =x(z(t)), esto es,

    x(t) = (x1(z1(t), z2(t),...,zn(t)), x2(z1(t), z2(t),...,zn(t)),...,xn(z1(t), z2(t),...,zn(t)),

    entonces:

    dxidt

    =n

    j=1

    xizj

    zjt

    , para todo i= 1, 2,...,n.

    Denotando vx = (vx1 , vx2 ,...,v

    xn) y v

    z = (vz1, vz2,...,v

    zn), donde v

    xi =

    dxidt

    yvzi = dzidt

    ,

    tememos:

    vx 2 = (vx, vx) =n

    i=1

    dxidt

    2.

    Como:

    dxidt 2

    = nj=1

    xi

    zjvzj

    2

    =

    nj=1

    xizj vzjn

    k=1

    xi

    zkvzk= n

    j=1 n

    k=1

    xi

    zkvzk

    xi

    zj vzj ,

    22

  • 7/25/2019 Papa Quiroz

    27/84

    entonces:

    vx 2=n

    i=1

    nj=1

    nk=1

    xizj

    xizk

    vzk

    vzj ,

    conmutando sumandos:

    vx 2=n

    j=1

    nk=1

    ni=1

    xizj

    xizk

    vzkv

    zj .

    Haciendo un cambio k por i e i por k obtenemos:

    vx 2=n

    i,j=1

    nk=1

    xkzj

    xkzi

    vzi v

    zj .

    Definiendo gij = n

    k=1xkzj

    xkzi se tiene finalmente que:

    (vx, vx) = vx 2=n

    i,j=1

    gijvzi v

    zj = (Gv

    z, vz).

    Queda claro que un cambio en el sistema de coordenadas no altera las metricas. En

    efecto, si v =G1\2w tenemos que:

    (v, v)p = (G1\2w, G1\2w)p = (Gw,w)p= w, wp .

    Metrica riemanniana.

    Definicion 2.5.1 Sea S una variedad diferenciable. Una metrica riemanniana es

    una aplicacion que asocia a cadap Mun funcional , p

    , p:TpM TpM IR,

    de modo que se cumplen las siguientes condiciones:

    1.

    ,

    p es un producto interno (bilineal, simetrica y definida positiva) para cada

    p M.

    2. , p varia diferenciablemente en el siguiente sentido: SiX : U IRn Mes um sistema de coordenadas en torno de p, conX(x1, x2, x3,....,xn) = qX(U) y

    xi(q) =dXq(0, 0,..., 0, 1, 0, ..., 0, 0), entonces la funcion: gij :U IR

    definida por

    gij(x1, x2,...,xn) =

    xi(q),

    xj(q)

    q

    ,

    es diferenciable.

    23

  • 7/25/2019 Papa Quiroz

    28/84

    Las funciones gij son llamadas expresiones de la metrica riemanniana en el sistema

    coordenadoXy la matriz G= (gij) es la representacion de la metrica riemanniana.Como

    Xes un difeomorfismo (Observacion 2.3.2) se tiene que d

    Xq :IR

    n

    TqM es

    un isomorfismo (Proposicion 2.4.4) y as la matriz G = (gij) es invertible. Por tanto,

    toda metrica riemanniana tiene su matriz de representacion invertible.

    Definicion 2.5.2 (Variedad riemanniana). Una variedad diferenciable para la cual

    se define una metrica riemanniana se denomina unavariedad riemanniana.

    Ejemplo 2.5.1 Sea M = IRn, defina la parametrizacionX : IRn IRn tal que

    X(x1, x2,...,xn) = (x1, x2,...,xn).Definamos la metrica:

    , p : IRn IRn IR, definido por x, yp =xTy.

    Seaq IRn entonces:

    xi(q) =dXqei = ei,

    y as, gij :U

    IR definidas por:

    gij(x) =

    xi(x),

    xj(x)

    x

    = ei, ejx=eTiej =ij,

    son diferenciables enIRn.

    LuegoM=IRn,con la expresion de la metricaG = I d,es una variedad riemanniana,

    esto es, el espacio euclidiano es un ejemplo particular de variedad riemanniana.

    Ejemplo 2.5.2 SeaMla variedad definida por el siguiente conjunto:

    M= {(x1, x2) IR2 :x2 > 0}.

    Usamos la parametrizacion identidad, ademasTpM=IR2, conp= (p1, p2) M.

    Definimos la aplicacion:

    , p : IR2 IR2 IR

    tal que:

    (x1, x2), (y1, y2)p = 1

    p2 (x1y1+ x2y2).

    24

  • 7/25/2019 Papa Quiroz

    29/84

    Seaq= (q1, q2) M, entonces

    xi(q) =dXqei=ei, para todo i= 1, 2.

    Luego: gij :M IR definidas por:

    gij(x1, x2) = 1

    x2 ei, ej = 1

    x2ij,

    son diferenciables enM. Por lo tanto, Mes una variedad riemanniana con la ex-

    presion de la metrica:

    G(p) = 1

    p2(Id)22.

    Esta metrica es conocida como metrica de Lobatchevsky o Poincaire.

    Los siguientes dos ejemplos son tambien variedades riemannianas para las metricasG

    segun se definen, los cuales se demuestran bajo el mismo procedimiento que los dos

    ultimos ejemplos anteriores.

    Ejemplo 2.5.3 SiM=IRn++ y el funcional , p:TpIRn++ TpIRn++ IR tal que:

    u, vp =uT

    G(p)v,

    donde:

    G(p) =diag(1/(hi(pi))2),

    entonces:

    gij(x) = ij

    (h2(xi))2.

    Ejemplo 2.5.4 Sea la variedad riemanniana (IR2, G(x)), con

    u, v

    p = u

    TG(p)v,

    donde:

    G(p) =

    4p21+ 1 2p12p1 1

    es la metrica riemanniana dada porUdriste.

    25

  • 7/25/2019 Papa Quiroz

    30/84

    2.6 Campos de vectores, conexiones afines y deriva

    da covariante

    Introducimos los campos de vectores en los espacios tangentes a las variedades rie-

    mannianas. En Optimizacion Matematica ellos representan las direcciones, a partir de

    un punto dado, para algun algoritmo iterativo propuesto. Observando la trayectoria

    continua del algoritmo, esta tendra sus caractersticas, como curvatura, que depen-

    den obviamente de las caractersticas del campo. Surge as la necesidad de definir

    conceptos correspondientes al de derivada de funciones.

    Definicion 2.6.1 (Campo de vectores en una variedad diferenciable). Un campo de

    vectores X en una variedad diferenciableMes una correspondencia que a cada punto

    p M asocia un vectorX(p) TpM.

    Considerando una parametrizacionX :U IRn Mes posible escribir:

    X(p) =n

    i=1

    ai(p).(

    xi)p,

    donde cada ai :M IR es una funcion en M y{(

    xi )p} es una base asociada aX,1 i n. Diremos que Xes diferenciable si, y solamente si, las funciones ai sondiferenciables para alguna parametrizacion.

    Es util pensar en campos vectoriales como aplicaciones X :D Fdefinidas por

    (Xf)(p) =i

    ai(p).f

    xi(p),

    donde D es el conjunto de las funciones diferenciables sobre M y F es el conjunto

    de las funciones sobre M.Como estamos interesados en trayectorias en M, consideraremos los campos restritos

    a una curva.

    Definicion 2.6.2 (Campo de vectores a lo largo de curvas). Un campo vectorialV a

    lo largo de una curva: IMes una aplicacion que a cada(t)M asocia unvector tangenteV(t) T(t)M. Se dise queVes diferenciable si para cada funciondiferenciablef enD, la funcionV(t)fes una funcion diferenciable enI.

    SeaX un campo definido enM, el campo X a lo largo de sera denotado V(t) =

    26

  • 7/25/2019 Papa Quiroz

    31/84

    X((t)) y diremos queVes inducido porX.

    El campo vectorial dX(X1)(t)[(X1 )(t)] = d(XoX1)(t)dt

    denotado por ddt

    , es

    llamado campo velocidad o tangente de.

    Conexiones Afines.

    Denotemos T Mcomo el conjunto de espacios tangentes definidos en M.

    SeaH =H(M) ={X :MT M : para cada pM, X(p)TpM, y X C} elconjunto de campo de vectores yD = D(M) = {f :M IR: f C}el conjuntode funciones reales de clase C.

    Definicion 2.6.3 Una conexion afin es una aplicacion

    :

    H H Hdonde a

    cada par de campos(X, Y)se asocia otro campoXY tal que para todo X, Y , Z H,yf, g D verifique:

    1.(fX+gY)Z=fXZ+ gYZ;

    2.X(Y + Z) = XY + XZ;

    3.Xf Y =fXY + X(f)Y, dondeX(f) =n

    i=1ai(.)

    f(.)xi

    .

    Considerando una curva diferenciable en M : I M, denotaremos el conjunto decampo de vectores a lo largo de esta curva comoH.

    Proposicion 2.6.1 SeaMuna variedad diferenciable con una conexion afin. En-tonces existe una unica aplicacion D

    dt, donde a cada V H se asocia otro campo

    enH, denotado por DVdt , tal que para todo V, W H yf : I IR una funciondiferenciable enIse cunplen:

    a. D

    dt(V + W) = DV

    dt + DW

    dt .

    b. Ddt

    (f V) = dfdt

    V + fDVdt

    .

    c. SiV(t) =Y((t)), dondeY H, entonces DVdt

    = ddt

    Y.

    Ddt

    es llamadaDerivada Covariante.

    Observacion 2.6.1 La Proposicion 2.6.1 muestra que la eleccion de una conexion

    afin deMda origen a una unica derivada covariante para cada campo vectorial a lo

    largo de una curva.

    27

  • 7/25/2019 Papa Quiroz

    32/84

    Observacion 2.6.2 Al realizar la demostracion de esta Proposicion, encontramos

    una caracterizacion de la derivada covariante para una cierta parametrizacionX, deacuerdo con:

    DVdt

    =n

    j=1

    dvj

    dtXj+

    ni,j=1

    vjdxidt

    XiXj .

    Observacion 2.6.3 La nocion de conexion afin, ofrece una manera de derivar campo

    de vectores a lo largo de curvas. As, en particular para el campo vectorialV = ddt

    tenemos:D

    dt

    d

    dt

    ,

    que llamaremosaceleracion de una curva en M.

    Expresion de la conexion afin relativa a coordenadas locales.

    Suponga que los campos de vectores X, Y H sean representados en una ciertavecindad localX :U Rn M, de algun punto p, por:

    X=n

    i=1

    xi

    xi, Y =

    ni=1

    yi

    xi,

    donde (/xi) representan los vectores de la base del sistema de coordenadas locales.

    Por simplicidad de notacion expresaremos:

    xi=Xi.

    Entonces tenemos

    X=n

    i=1

    xiXi, Y =n

    i=1

    yiXi.

    Segun las propiedades de la definicion de la conexion afin:

    XY = xiXi j

    yjXj=

    i

    xiXi

    j

    yjXj

    =

    i

    xi

    j

    (yjXiXj) +

    i

    xi

    j

    yjxi

    Xj

    .Observe queXiXj H, pudiendo por tanto ser tambien representado atravez deuna base local, esto es:

    XiXj =n

    k=1kijXk (2.2)

    que, substituyendo en la ecuacion anterior, se obtiene:

    28

  • 7/25/2019 Papa Quiroz

    33/84

    XY =n

    k=1

    ni,j=1

    xiyjkij+

    ni=1

    xiykxi

    Xk.Definicion 2.6.4 (Smbolos de Christoffel). Los smbolos de Christoffel, o coefi-

    cientes de la conexion afin enU, son las funciones (diferenciables):

    kij :U M R

    definidas por (2.2).

    Expresion de la derivada covariante en terminos de coordenadas locales y

    de los smbolos de Christoffel.

    SeaX :U Mun sistema de coordenadas locales en torno de p M. Un resultadoobtenido al demostrar la Proposicion 2.6.1 es:

    DV

    dt =

    nj=1

    dvj

    dtXj+

    ni,j=1

    vjdxidt

    XiXj ,

    y usando

    XiXj =

    n

    k=1 kijXk,

    tenemosDV

    dt =

    nj=1

    dvj

    dtXj+

    ni,j=1

    vjdxidt

    nk=1

    kijXk

    ,

    =n

    j=1

    dvj

    dtXj+

    nk=1

    ni,j=1

    vjdxidt

    kijXk.

    As:DV

    dt =

    n

    k=1dvk

    dt +

    n

    i,j=1 vjdxi

    dtk

    ijXk (2.3)es la expresion de la derivada covariante en terminos de coordenadas locales y de los

    smbolos de Christoffel.

    Geodesicas y Campos paralelos.

    La derivada covariante permite definir el transporte paralelo a lo largo de curvas que

    dependen de la metrica, osea, que cambiando la metrica, cambia en general la manera

    de derivar campos vectoriales, en particular nos permite conocer geodesicas, curvas

    29

  • 7/25/2019 Papa Quiroz

    34/84

    cuyo vector tangente es paralelo o derivada covariante nula. Si : [a, b] Mes unacurva, tal que (a) = y (b) = q, el transporte paralelo es P(t) : TpM TqM unisomorfismo lineal tal que P(t)(v) = V(b) que es el unico transporte paralelo a lo

    largo de .

    Con la metrica euclidiana la geodesica es el segmento de recta entre dos puntosp y q

    cualquiera que caracteriza la trayectoria de menor longitud que los une.

    Si : [a, b] IRn es una curva diferenciable pasando por: p = (a) yq = (b),siendo el campo d

    dtasociado fisicamente a la velocidad, tenemos la aceleracion d

    dt(d

    dt)

    en cada punto (t) con la propiedad de ser geodesica dada por

    ddt(ddt) = 0.

    La extension de esta nocion a variedades exigira apenas que la componente tangencial

    de la derivada sea nula.

    Geodesicas.

    Definicion 2.6.5 Una curva parametrizada : I Mes una geodesica si el campo

    tangente ddt verifica:D

    dt(

    d

    dt) = 0.

    Campos paralelos.

    Dado Muna variedad diferenciable, una conexion afin y un campo V a lo largode una curva diferenciable :I M, V es denominado campo paralelo si DV

    dt = 0,

    para todo t I.As, si es una geodesica, entonces d

    dt es paralelo.

    Ecuaciones geodesicas.

    De la expresion (2.3), un campo paralelo Ves determinado por las ecuaciones

    nk=1

    dvkdt

    +n

    i,j=1

    vjdidt

    kij

    Xk = 0o, equivalentemente,

    dv

    k

    dt +

    ni,j=1

    vj didt kij = 0, k= 1,...,n.

    30

  • 7/25/2019 Papa Quiroz

    35/84

    Cuando se trata de una geodesica(t) = (1(t),...,n(t)), se tienevi = di

    dt, entonces

    esta ultima ecuacion se transforma en

    ddt

    (dkdt

    ) +n

    i,j=1

    djdt

    didt

    kij = 0, k = 1,...,n

    od2kdt2

    +n

    i,j=1

    kijdidt

    djdt

    = 0, k= 1,...,n (2.4)

    el cual es un sistema de n ecuaciones diferenciales de 2do. orden, que posee solucion

    unica en algun intervalo I= [a, b], verificandox(0) =(0) =p y dxdt

    (0) =(0) =v .

    Conexion afin en variedades riemannianas.

    Definicion 2.6.6 SeaM una variedad diferenciable con una conexion afin y unametrica riemanniana , . Se dice que es compatible con la metrica , si paratodo par de campos de vectoresV yWa lo largo de la curva diferenciable : I Mse tiene:

    d

    dtV, W = DV

    dt , W + V,DW

    dt . (2.5)

    Proposicion 2.6.2 Si la conexion afines compatible con,yV, Wson camposparalelos a lo largo de una curva diferenciable : I M entonces,V, W esconstante.

    En particular si(t) = (1(t),...,n(t)) es una geodesica,ddt , ddt es constante.

    Proposicion 2.6.3 Sea M una variedad riemanniana. Una conexi on afin escompatible con el

    ,

    si, y solamente si:

    XY, Z = XY, Z + Y, XZ, para todo X, Y, Z H.

    Definicion 2.6.7 Una conexion afin en una variedad diferenciableM es llamadasimetrica si:

    XY YX= [X, Y],

    donde [X, Y] =X Y Y X.

    Observaciones:

    31

  • 7/25/2019 Papa Quiroz

    36/84

    1. En un sistema de coordenadas (U, X) la simetra de la conexion afin implicaque

    xi

    xj

    = xj

    xi

    .

    En efecto, para todo f

    D,

    XiXj(f) XjXi(f) = 2f

    xixj

    2f

    xjxi= 0.

    2. En consecuencia se tiene que:

    XiXj XjXi=n

    k=1

    (kij kji)Xk = 0.

    Debido a la independencia lineal de{Xk} obtenemos:

    kij = kji.

    La reciproca es inmediata.

    El teorema a seguir garantiza la existencia y unicidad de una conexion simetrica y

    compatible con la metrica en una variedad riemanniana.

    Teorema 2.6.1 (Levi-Civita). Dada una variedad riemannianaM, existe una unica

    conexion afin enM satisfaciendo las condiciones:

    a) es simetrica.

    b) es compatible con la metrica riemanniana.

    (Esta conexion es denominada conexion riemanniana).

    Relacion entre la metrica riemanniana y los smbolos de Christoffel.

    Dado un sistema de coordenadas (U, X), las funciones conocidas como smbolos deChristoffel ki,j : U IR definen los coeficientes de conexionXiXj =

    nk

    kijXk. Se

    muestra que

    mij = {1

    2

    nk

    xigjk +

    xjgki

    xkgij}gkm,

    32

  • 7/25/2019 Papa Quiroz

    37/84

    donde gij = xi , xj son elementos de la matriz G(x) y gij los elementos de suinversa G1(x) respectivamente.

    En efecto, tomemos x

    i

    =Xi, x

    j

    =Xj y x

    k

    =Xk. Usando el resultado siguiente:

    Z, YX =12{XY, Z+YZ, XZX, Y[X, Z], Y[Y, Z], X[X, Y], Z}

    (2.6)

    tenemos:

    Xk, XjXi =1

    2{XiXj, Xk + XjXk, Xi XkXi, Xj}.

    Como

    XjXi =

    XiXj =

    XiXj =

    n

    l=1 lijXl y usando a linealidad del productointerno, se tiene:

    nl=1

    lijXk, Xl =1

    2{XiXj, Xk + XjXk, Xi XkXi, Xj},

    y as:n

    l=1

    lijgkl =1

    2{

    xigjk +

    xjgki

    xkgij}.

    Denotandobk = 12{

    xigjk +

    xj

    gki xk gij}, k = 1, 2,...,nobtenemos un sistema linealGy = b con y = (1ij, 2ij ,..., nij) y b = (b1, b2,...,bn). ComoG(x) es invertible (ver

    definicion de metrica riemanniana) entonces y= G1b. As tenemos:

    mij =1

    2

    nk=1

    gmkbk.

    Finalmente sustituyendo el valor de bk en la expresion anterior se tiene:

    mij =1

    2

    n

    k=1{

    xigjk +

    xjgki

    xkgij}gkm. (2.7)

    Ejemplo 2.6.1 Sea la variedad riemannianaM=IRn++, con la metrica dada por

    G(x) =diag

    1

    (h1(x1))2,

    1

    (h2(x2))2,...,

    1

    (hn(xn)2

    ,

    para funcioneshi:IR++ IR++ diferenciables. La inversa de la matrizG(x) es:

    G1(x) =diag (h1(x1))2, (h2(x2))

    2, ..., (hn(xn))2

    .

    33

  • 7/25/2019 Papa Quiroz

    38/84

    1. Obtencion de los smbolos de Christoffel.

    Recordemos que la relacion de la metrica con los smbolos de Christoffel esta

    dado por la ecuacion (2.7).

    Cuando k=m tenemos quegmk = 0, as la expresion es reducida a:

    mij =1

    2

    xigim+

    xjgmi

    xmgij

    gmm.

    Consideramos dos casos:

    a) Sii= j

    mii =1

    2

    xigim+

    xigmi

    xmgii

    gmm.

    Param= i

    iii= 1

    hi(xi)

    xi(hi(xi)) .

    Param =imii = 0.

    b) Sii =jmij =

    1

    2

    xi

    gim+

    xj

    gmi gmm.

    Param= i entonces, m =j y:

    iij = 0.

    Param= j entonces, m =i y:

    jij = 0.

    Param =i ym =j entonces,

    mij = 0.

    De ambos casos tenemos:

    mij = 1

    hi(xi)

    (hi(xi))

    xiimij (2.8)

    que es la expresion de los Smbolos de Christoffel en relacion a la metricaG(x).

    Como aplicaciones tenemos:

    34

  • 7/25/2019 Papa Quiroz

    39/84

    Sihi(xi) = 1, entonces, G(x) =I . Luego: mij = 0, i,j,m= 1,...,n. Sihi(xi) =xi entonces, G(x) =X2. Luego: mij = 1xi imij.

    Sihi(xi) =xr2

    i entonces, G(x) =Xr

    . Luego: mij =

    r2

    1xi imij.

    Se hi(xi) = sr2

    i xr2

    i, si IR++ entonces, G(x) = SrXr. Luego mij = r

    21xi

    imij.

    2. Obtencion de la derivada covariante.

    Vimos que la relacion de la derivada covariante con respecto a los smbolos de

    Christoffel es dada por la ecuacion (2.3). Sustituyendo la expresi on (2.8) en

    (2.3) obtenemos:DV

    dt =

    ni=1

    dvi

    dt 1

    hi(xi)

    (hi(xi))

    xivi

    dxidt

    Xi.

    En particular:

    Sihi(xi) = 1, kij = 0, y as:DV

    dt =

    ni=1

    dvi

    dtXi,

    que es la propia derivada usual.

    Sihi(xi) =xi, mij = 1xi imij yDV

    dt =

    ni=1

    dvi

    dt 1

    xivi

    dxidt

    Xi.

    Sihi(xi) =xr2

    i, mij = r2 1xi imij

    DV

    dt =

    n

    i=1

    dvi

    dtr

    2

    1

    xivi

    dxidt

    Xi.

    3. Determinacion de la ecuacion geodesica: Seap = (p1, p2,...,pn) IRn++ yv =(v1, v2,...,vn) TpIRn++=IRn con

    : I IRn++:(t) = (1(t), 2(t),...,n(t)),

    donde(0) =p y d(0)dt

    =v, I alguun intervalo abierto deIR. Substituyendo los

    smbolos de Christoffel (2.8) en la ecuacion (2.4) obtenemos:

    d2

    idt2

    1hi(i)

    (hi(i))i

    ( didt

    )2 = 0, i= 1,...,n (2.9)

    35

  • 7/25/2019 Papa Quiroz

    40/84

    i(0) =pi, i= 1,...,n

    i(0) =vi, i= 1,...,n.

    La ecuacion diferencial (2.9) es equivalente a resolver:

    didt

    =hi(i)ai,

    para alguna constanteai, que tambien es equivalente a resolver la integral: 1

    hi(i)di = ait + bi, i= 1, 2,...,n

    para algunas constantesai ybi enIR.

    Entonces, la unica geodesica (t) de IRn++, con metrica G(p), pasando por el

    punto (0) = p, en la direccion(0) = v, es obtenida resolviendo el siguiente

    problema: (

    1

    hi(i))di = ait + bi i= 1,...,n (2.10)

    dondeai ybi son constantes reales tales que:

    i(0) =pi, i= 1,...,n.

    i(0) =vi, i= 1,...,n.

    En particular:

    Si hi(i) = 1 tenemos queG(p) = Iy considerando las condiciones ini-ciales de (2.10) encontramos la expresion de la curva geodesica:

    i(t) =vit +pi i= 1,...,n.

    Esto es, las geodesicas son curvas: IR IRn++ definidas por:

    (t) = (v1t +p1,...,vnt +pn).

    Observemos que la geodesica (t) esta definida para valores de t tal que

    vit +pi>0.

    Sih(i) =i entonces,G(x) =X2 considerando las condiciones inicialesde (2.10), las curvas geodesicas son funciones exponenciales:

    (t) =

    p1exp

    v1p1

    t

    , p2exp

    v2

    p2t

    ,...,pnexp

    vn

    pnt

    .

    Vemos que dados cualquier p

    IRn++ y v

    IRn, la geodesica (t) esta

    definida para todo t IR.

    36

  • 7/25/2019 Papa Quiroz

    41/84

    Ejemplo 2.6.2 Consideremos la variedad riemannianaCn0 = (0, 1)n con la metrica

    dada por:

    G(p) =diag 1

    (h1(1))2,

    1

    (h2(2))2, ...,

    1

    (hn(n))2 ,para funcioneshi: (0, 1) (0, 1) diferenciables. As, la unica geodesica(t) deCn0 ,con metricaG(p), pasando por el punto (0) =p, en la direcion(0) =v TpCn0 =IRn, es obtenida resolviendo la siguiente ecuacion:

    (

    1

    hi(i))di=ait + bi i= 1,...,n,

    dondeai ybi son constantes reales tales que:

    i(0) =pi, i= 1,...,n.

    i(0) =vi, i= 1,...,n.

    Sihi(i) =sen2(i) entoncesG(p) =csc4(p), con las geodesicas enCn0 ,

    (t) = (1(t), 2(t),...,n(t)),

    considerando las condiciones iniciales de (2.10), son:

    i(t) = 1

    arccot csc2(pi)vit + cot(pi) para todo, i= 1, 2..., n.Observamos que dados cualquier p Cn0 y v IRn, la geodesica (t) estadefinida para todo t IR.

    Sihi(i) =i(1 i) se tiene queG(p) =P2(I P)2, las geodesicas enCn0 ,

    (t) = (1(t), 2(t),...,n(t)),

    considerando las condiciones iniciales de (2.10), son:

    i(t) =1

    2

    1 + tgh

    1

    2

    vipi(1 pi) t + arccoth(2pi 1)

    para todo, i= 1, 2..., n.

    dondetanh(z) = ezez

    ez+ez es la funcion tangente hiperbolica.

    Observamos que dados cualesquiera p Cn0 y v IRn, la geodesica(t) estadefinida para todo t IR.

    37

  • 7/25/2019 Papa Quiroz

    42/84

    2.7 Curvatura de una variedad riemanniana

    En esta seccion, presentamos la definicion de curvatura de una variedad riema-

    nniana que, intuitivamente, mide cuanto ella se aleja de ser euclidiana. Del punto de

    vista de las aplicaciones esta seccion muestra esencialmente que las variedadesIRn++y

    Cn0 con la metrica dada porG(x) =diag

    1(h1(x1))2

    , 1(h2(x2))2

    ,..., 1(hn(xn))2

    para cuaquier

    funcion diferenciable hi : IR++ IR++ yhi: (0, 1)n IR++ respectivamnte, tienecurvatura cero.

    Definicion 2.7.1 (Aplicacion curvatura). SeaA(H, H) el conjunto de aplicacionesde

    Hen

    Hy

    la conexion afin en una variedad riemannianaM, dada por el teorema

    de Levi-Civita.

    Una curvaturaKde una variedad riemannianaMes una correspondencia

    K : H H A(H, H)

    definida por:

    K(X, Y)Z= YXZXYZ+ [X,Y]Z.

    Observacion 2.7.1 Si la variedad M = IRn, entonces K(X, Y)Z = 0, para todo

    X, Y , Z H. En efecto, basta indicarZ = (z1, z2,...,zn) las componentes del campoZen las coordenadas naturales deIRn y la conexion definida por:

    XZ= (Xz1, Xz2,...,Xzn).

    Observacion 2.7.2 Si consideramos un sistema de coordenadas(U, X) en torno delpunto p y{Xi} , i= 1, 2,...,nes una base deTpM obtenemos:

    K(Xi, Xj)Xk = XiXj XjXiXk.Observacion 2.7.3 La curvaturaKes antisimetrica. En efecto,

    K(X, Y)Z+ K(Y, X)Z= [X,Y]Z+ [Y,X]Z, para todo Z H.

    Como [X, Y] = [Y, X], entonces:

    K(X, Y)Z+ K(Y, X)Z= 0, para todo Z H,

    y as,

    K(X, Y) = K(Y, X).

    38

  • 7/25/2019 Papa Quiroz

    43/84

    Proposicion 2.7.1 La curvaturaKde una variedad riemanniana es trilineal, en el

    siguiente sentido:

    a. Kes bilineal enH H, esto es,

    K(f X1+ gX2, Y1) =f K(X1, Y1) + gK(X2, Y1),

    K(X1, f Y1+ gY2) =f K(X1, Y1) + gK(X1, Y2),

    dondef, g D(M) yX1,X2, Y1, Y2 H.

    b. Para todo parX, Y H, el operador curvaturaK(X, Y) :H H es lineal,

    esto es,

    K(X, Y)(Z+ W) =K(X, Y)Z+ K(X, Y)W,

    K(X, Y)(f Z) =f K(X, Y)Z,

    dondef D(M) y Z, W H.

    Proposicion 2.7.2 Sea(U, X)un sistema de coordenadas en torno dep My{Xi}una base deTpMen este sistema de coordenadas. Entonces:

    K(Xi, Xj)Xk =n

    l=1

    KlijkXl,

    donde las componentesKlijk son dadas por:

    Klijk =Xjlik Xiljk +

    ns=1

    sikljs

    ns=1

    sjklis.

    Observacion 2.7.4 Si en las coordenadas (U, X) escribimos: X = n

    i=1uiXi, Y =

    nj=1

    vjXj , Z=n

    k=1wkXk, por la linealidad deK tenemos:

    K(X, Y)Z=n

    i,j,k,l=1

    KlijkuivjwkXl.

    Ejemplo 2.7.1 SeaM = IRn++ o M = Cn0 con estructura de variedad riemanniana

    representada por la matrizG(x) = diag( 1(h1(x1))2

    , 1(h2(x2))2

    ,..., 1(hn(xn))2

    ). Ya vimos que

    sus smbolos de Christoffel son:

    mij = 1hi(xi) (hi(xi))

    xiimij.

    39

  • 7/25/2019 Papa Quiroz

    44/84

    Si en las coordenadas(U, X) escribimos: X= ni=1

    uiXi, Y =n

    j=1vjXj , Z=

    nk=1

    wkXk,

    de la tri-linealidad deK tenemos:

    K(X, Y)Z=n

    i,j,k=1

    uivjwkK(Xi, Xj)Xk.

    Por definicion de curvatura:

    K(Xi, Xj)Xk = Xj(XiXk) Xi(XjXk) + [Xi,Xj ]Xk,

    como la conexion es de Levi Civita se tiene [Xi, Xj ] = 0. As,

    K(Xi, X

    j)X

    k=

    Xj(Xi

    Xk

    ) Xi

    (Xj

    Xk

    ).

    Sii= j, entoncesK(Xi, Xj)Xk = 0.

    Supongamos quei =j, entonces

    XiXk =n

    j=1

    jikXj.

    Sustituyendo los smbolos de Christoffel tenemos:

    XiXk =n

    j=1

    1hi(xi) (hi(xi))xi ijikXj = 1hi(xi) (hi(xi))xi ikXi (2.11)luego tomandoXj se tiene:

    Xj(XiXk) = Xj 1

    hi(xi)

    (hi(xi))

    xiikXi

    ,

    por definicion de conexion afinX(f Y) =fXY+X(f)Y dondeX(f) =n

    i=1ai(.)

    fxi

    ,

    entonces tenemos:

    Xj(XiXk) = 1

    hi(xi)

    (hi(xi))

    xiikXjXi+ Xj

    1

    hi(xi)

    (hi(xi))

    xiik

    Xi.

    Usando (2.11) y dado que i= j, el primero y segundo termino de la suma anterior,es igual a cero. Por tanto:

    Xj(XiXk) = 0.

    Analogamente,

    Xi(XjXk) = 0.

    40

  • 7/25/2019 Papa Quiroz

    45/84

    De ambos resultados se tiene:

    K(Xi, Xj)Xk = 0, i,j,k = 1, 2, ...n.

    AsK(X, Y)Z= 0. Luego las variedades riemannianasIRn++ yCn0 con metricaG(x)

    tienen curvatura cero. En particular, con las metricasI , Xr,paraIRn++ycosec4(x),

    Xr(I X)r paraCn0 , son variedades de curvatura cero.

    Curvatura Seccional.

    Intimamente relacionado con el operador curvatura K esta la curvatura seccional (o

    riemanniana) que definiremos a seguir.

    SeaMuna variedad riemanniana yun subespacio bidimensional deTpM. Definimos

    la forma cuadratica como Q: IRtal que:

    Q(x, y) = x, xy, y x, y2.

    Geometricamente

    Q(x, y) representa el area del paralelogramo definido por xe y.

    Proposicion 2.7.3 Sea TpMun subespacio bidimensional yx, y ,dos vec-tores linealmente independientes. Entonces,

    K(x, y) =K(x, y)x, y

    Q(x, y) ,

    no depende de la eleccion de los vectoresx yy.

    Definicion 2.7.2 (Curvatura Seccional). Dado un punto p M y TpM. Elnumero K(x, y) = K(), donde{x, y} es una base de , es llamado CurvaturaSeccional deM.

    Si K(x, y) 0 para todo x, y entonces, la curvatura seccional de la variedadriemanniana es no positiva.

    Si K(x, y) 0 para todo x, y entonces, la curvatura seccional de la variedadriemanniana es no negativa.

    41

  • 7/25/2019 Papa Quiroz

    46/84

    2.8 Gradiente y Hessiana en una variedad riema-

    nniana

    SeaMuna variedad riemanniana yf :M IRuna funcion diferenciable. Dadop M sabemos que la diferencial de fen el punto p es un funcional lineal definidoenTpM, entonces por el teorema de representacion de Riesz existe un unico elemento

    denotado porMf(p) TpMtal que para todo v TpMse tiene

    dfp(v) = Mf(p), v (2.12)

    y

    Mf(p) = dfp,

    esto es, la aplicacion diferencial se puede caracterizar por la aplicacion de producto

    interno. As podemos definir un campo vectorialgrad f :M T M, como

    grad f(p) = Mf(p).

    La expresion (2.12) puede ser escrita como:

    dfp(X(p)) = gradf(p), X(p),paratodo X H,

    y as tambien podemos definir una aplicacion df :H M =L(M, IR), dondeL(M, IR) es el conjunto de funciones en M en IR, tal que:

    df(X) = grad f, X.

    Ademas, dfp(X(p)) = ddt

    (f )|t=0 para alguna curva : I M con (0) = p y

    (0) =X(p), luego tenemos que dfp(X(p)) =

    ni=1 i(0) fxi (p) =X(f)(p), por tantodf(X) = grad f, X =X(f).

    As llegamos a la siguiente definicion.

    Definicion 2.8.1 El gradiente de una funcion diferenciable f : M IR es uncampo vectorialgrad f :MT M metricamente equivalente a la diferencial, estoes,

    dfp(X(p)) = grad f(p), X(p) =X(p)f, paratodo X H.

    42

  • 7/25/2019 Papa Quiroz

    47/84

    Observacion 2.8.1 SeaM IRn una variedad riemanniana con la metrica definidaporv, wx = vTG(x)w donde G(x) es una matriz simetrica definida positiva. Sepuede caracterizar el campo gradiente como:

    gradf(q) =G1(q)f(q),

    dondeG1(q) = (gij(q)) es la matriz inversa deG(q) yf = ( fx1

    , ..., fxn

    ) es el vector

    de derivadas parciales de la funcionf X. En efecto,

    dfq(v) =f(q)Tv= f(q)T(G(q)1)TG(q)v= (G(q)1f(q))TG(q)v=

    G(q)1f(q), v

    q

    .

    Ejemplo 2.8.1 Sea la variedad riemanniana IRn con la metrica euclidianaG = I,

    entoncesgradf(x) =f(x) (el gradiente usual).

    Ejemplo 2.8.2 Sea la variedad riemannianaIRn++ con la expresion de la metrica

    G(x) =diag

    1

    (h1(x1))2, ...,

    1

    (hn(xn))2

    ,

    para funcioneshi:IR++ IR++

    gradf(x) =diag(h1(x1))

    2

    , ..., (hn(xn))

    2

    )f

    (x).

    En particular:

    1. Sihi(xi) =xi entonces:

    gradf(x)f(x) =X2f(x),

    donde denotamos X=diag(x1,...,xn).

    2. Sihi(xi) =xr2

    i, r= 2 entonces:

    gradf(x)f(x) =Xrf(x).

    Ejemplo 2.8.3 Sea la variedad riemanniana Cn0 = (0, 1)n con la expresion de la

    metrica dada porG(x) =csc 4(x) =diag(csc 4(x1),...,csc4(xn)), entonces

    gradf(x)f(x) =sen 4(x)f(x),

    dondesen(X) =diag(sen(x1),...,sen(xn)).

    43

  • 7/25/2019 Papa Quiroz

    48/84

    Definicion 2.8.2 Sea M una variedad riemanniana y p M. Decimos que p espunto crtico sigradf(p) = 0.

    Definicion 2.8.3 (Hessiana de una funcion). Sea f : M IR una funcion declaseCk, k 2. La Hessiana def, denotada porHf, es definida como la derivadacovariante del campo gradiente, esto es,

    Hf =D

    dt(gradf) .

    As, la Hessiana en el punto p, en la direccion dev TpM es:

    Hfp (v) =

    D

    dt(gradf) (p) = vgradf(p).

    A partir del concepto de Hessiana podemos definir las aplicaciones Hfp : TpMTpM y H

    f : M L(T M , T M ) dondeL(T M , T M ) es el conjunto de aplicacioneslineales de T M en T M y Hf(p) =Hfp L(TpM, TpM).

    Proposicion 2.8.1 Para cadap M, el operadorHfp : TpM TpM es lineal yautoadjunto, esto es,Hfp (v), wp = v, Hfp (w)p.

    De la Proposicion anterior, para cadap Mpodemos introducir una forma cuadraticaqfp :TpM TpM IRdefinida por:

    qfp (v, w) = Hfp v, wp.

    Mas generalmente, podemos definir la aplicacion qf : H H L(M, IR) dada por:

    qf(X, Y) =

    Xgrad f, Y

    . (2.13)

    La funcion definida en (2.13) tiene la desventaja de depender del conocimiento de la

    metrica y de la conexion, cuando sabemos que la metrica determina una conexion

    afin (Teorema de Levi Civita), por tanto la proposicion siguiente es importante para

    poder obtener una caracterizacion adecuada.

    Proposicion 2.8.2 Para todo X, Y H

    qf(X, Y) = (XY XY)f= (Y X YX)f.

    44

  • 7/25/2019 Papa Quiroz

    49/84

    Observacion 2.8.2 En un sistema de coordenadas (X, U) en terminos de la base{Xk} tenemos:

    qf(Xi, Xj) = XiXjn

    m=1 mij Xm f,esto es:

    qf(Xi, Xj) = Hfp Xi, Xj =

    2f

    xixj

    nm=1

    mijf

    xm

    . (2.14)

    Ejemplo 2.8.4 Sea la variedad riemannianaIRn con metricaG(x) =I; como vimos

    anteriormente, los smbolos de Christoffel son mij = 0, para todo i, j, m = 1..., n,

    entonces la matriz Hessiana es la Hessiana usualHfp (p) =f(p).

    Ejemplo 2.8.5 Sea la variedad riemanniana IRn++ con la metrica gij = ij

    hi(xi)hj(xj).

    Sabemos que los smbolos de Christoffel son:

    mij = 1hi(xi)

    hi(xi)

    xiimij,

    entonces:

    qf(XiXj) =XiXj+n

    m=1

    1

    hi(xi)

    hi(xi)

    xiimijXm.

    Sim =j entoncesimij = 0, luego se tiene:qf(Xi, Xj) =

    2

    xixj+

    1

    hi(xi)

    hi(xi)

    xiij

    xi

    f.

    As, Hfx =

    qf(Xi)(Xj)

    es la matriz que representa la Hessiana de la funcion f.

    Aun podemos dar una representacion matricial

    Hfx =f(x) + G(x)

    1

    2 (G(x)1

    2 )F(x),

    donde:

    F(x) =diag

    f(x)x1

    , f(x)x2

    ,..., f(x)xn

    .

    G(x) =diag

    1(h1(x1))2

    , 1(h2(x2))2

    , ..., 1(hn(xn))2

    .

    f(x) =diag(2f

    x21

    , 2f

    x22

    , ..., 2f

    x2n).

    En particular:

    45

  • 7/25/2019 Papa Quiroz

    50/84

    1. Sihi(xi) = 1 entoncesHfx =f

    (x) la matriz Hessiana usual.

    2. Sihi(xi) =xi entonces Hfx =f

    (x) + X1F(x).

    3. Sihi(xi) =xr2

    i, r= 2, entonces: Hfx =f(x) + r2 X1F(x).

    Corolario 2.8.1 Sip M es un punto crtico def yX, Y H, entonces:

    Hfp (X(p), Y(p)) =X(p)Y(p)f.

    Demostracion. Hfp (X(p), Y(p)) = X(p)(Y(p)f) X(p)Y(p),grad f(p), y comograd f(p) = 0, se sigue el Corolario.

    De este corolario, se deduce que sip Mes un punto crtico de fentonces la matrizHessiana de f, calculada en este punto, coincide con la matriz Hessiana usual.

    2.9 Variedades completas

    Todos los algoritmos desarrollados en Optimizacion, en la perspectiva de la ge-

    ometra riemanniana, necesitan de la hipotesis de variedad completa, que en terminos

    simples significa que la geodesica, contenida en ella, esta definida para todos los val-ores de t IR. El Teorema de Hopf y Rinow de gran importancia y utilidad en lasaplicaciones el cual enunciaremos porteriormente, dice: Dados dos puntos cualquiera

    de la variedad completa existe siempre una geodesica que minimiza la longitud de

    arco entre todas las curvas regulares por partes que unen tales puntos.

    Una pregunta natural sera, si se podra desarrollar metodos geodesicos donde la

    hipotesis de variedad completa sea mas suave, por ejemplo, introduzir una medida

    en la variedad a partir del producto interno del espacio tangente donde la geodesicaeste definida en casi todos los puntos y los puntos donde la geodesica no sea definida,

    pertenezca a un conjunto de medida nula.

    Restringiendonos a las variedades completas, desarrollamos esta teora de manera

    resumida.

    Definicion 2.9.1 Una variedad riemannianaMes llamada (geodesicamente) com-

    pleta si para todo p

    M, las geodesicas que parten dep estan definidas para todos

    los valores del parametro t R.

    46

  • 7/25/2019 Papa Quiroz

    51/84

    Ejemplo 2.9.1 IRn con la metrica euclidianaG(x) = I, es (geodesicamente) com-

    pleta, pues dado un punto cualquiera x M y una direccion arbitraria v TxM,vimos que la i-esima componente de la geodesica que cumple las condiciones iniciales

    i(0) =xi yi(0) =vi, para todo i= 1,...,n, es dado por: i(t) =xi+ tvi, para todo

    i= 1, 2,...,n, lo que esta definida para todo t IR.

    Ejemplo 2.9.2 IRn++ con la metricaG(x) =X2 es (geodesicamente) completa, pues

    dado un punto cualquieraxM y una direccion cualquierav TxM, vimos que lai-esima componente de la geodesica cumpliendo las condiciones iniciales i(0) = xi

    yi(0) = vi, para todo i = 1,...,n es : i(t) = xiexp(vixi

    t) la cual esta definido para

    todo t IR.

    Ejemplo 2.9.3 Cn0 = (0, 1)n con la metrica dada por:

    G(x) =csc 4(x) =diag(csc 4(x1),...,csc4(xn))

    es (geodesicamente) completa pues dado un punto arbitrario xM y una direccioncualquierav TxM, vimos que la i-esima componente de la geodesica cumpliendo lascondiciones inicialesi(0) =xi yi(0) =vi, para todo i= 1,...,nes:

    i(t) = 1

    arccot

    csc2(xi)vit + cot(xi)

    ,

    para todo i= 1, 2..., n.

    En adelante consideramos que la variedad riemanniana estudiada tiene la propriedad

    de conexidad, esto es, para cualquier par de puntos p, qde Mexiste una curva difer-

    enciable contenida en M, : [a, b] : M, tal que (a) =p y (b) =q.

    Definicion 2.9.2 Dados dos puntosp yqenM, la distancia riemanniana dep aq

    en la variedad, denotada pord(x, y), es definida por

    d(p, q) =I nf

    ba

    (t)dt (2.15)

    donde: [a, b] Mes una curva diferenciable tal que(a) =p y(b) =q.

    Proposicion 2.9.1 Con la distancia geodesica (2.15) Mes un espacio metrico.

    47

  • 7/25/2019 Papa Quiroz

    52/84

    Teorema 2.9.1 (Hopf-Rinow) SeaMuna variedad riemanniana y seapM. Lassiguientes afirmaciones son equivalentes:

    a) Limitados y cerrados son compactos.

    b) M es completo como espacios metrico.

    c) Mes geodesicamente completa.

    d) Para todo q M existe una geodesica uniendo p yq con:

    d(p, q) =I nf

    ba

    (t)dt,

    esto es, el mnimo de (2.15) es obtenida por una geodesica.

    Ejemplo 2.9.4 Sea la variedad riemannianaIRn++con expresion de la metricaG(x) =

    X2. Dadosp yqenIRn++, existe una unica geodesica uniendo p aq. En efecto, sea

    i(t) = piexp(vitpi

    ) y i(t) = piexp(witpi

    ) las i-esimas componentes que satisfazen las

    condiciones iniciales:

    i(0) =i(0) =pi,

    i(t0) =i(t0) =qi.

    Se puede verificar que vi = wi para todo i = 1,...,n. En efecto, tomando el valor

    t= t0 tenemos que para todoi = 1,...,n: qi=piexp(vit0pi

    ) =piexp(wit0pi

    )dividiendo por

    pi, tomando logaritmo y multiplicando porpi/t0 tenemosvi =wi y asi(t) = i(t)

    para todo t IR. Ademas:

    a). Debido a queqi=piexp(vi

    pi

    ) entoncesvi=piln(qi

    pi

    ).

    b).

    i(t)

    i(t)= vi

    pientonces

    i(t)

    i(t)

    = 1

    t0ln2( qi

    pi) as:

    d(p, q) = t0

    0(t)dt=

    n

    i=1

    ln

    qi

    pi

    21

    2

    .

    Ejemplo 2.9.5 Sea la variedad riemanniana Cn0 = (0, 1) con la expresi on de la

    metrica riemannianaG(x) =csc4(x). Dadosp yqenCn0 , existe una unica geodesica

    que unep yq. Ademas tenemos:

    48

  • 7/25/2019 Papa Quiroz

    53/84

    a). qi = i(t0) = 1

    arccot (csc2(pi)vit0+ ctg(pi)) , para todo i = 1,...,n, en-tonces

    vi=

    cot(qi) cot(pi)

    t0csc2(pi)

    .

    b).

    i(t)

    sen2(i(t)) = ai = csc

    2(pi)vi. Substituyendo el valor de vi y elevando al

    cuadrado tenemos: i(t)

    sen2(i(t))

    2=a2i =

    1

    2t20{cot(qi) cot(pi)}2

    usando estos hechos tenemos:

    d(p, q) = t00

    (t)dt= 1 n

    i=1

    [cot(qi) cot(pi)]21

    2

    .

    Teorema 2.9.2 Ley de cosenos. Sea M una variedad riemanniana completa con

    curvatura seccional no negativa, en un triangulo geodesico normalizado tal que1, 2,

    3 segmento de geodesicas minimizantes. Vale la desigualdad

    c2 a2 + b2 2abcos (2.16)

    donde = arg(1(0).3(l3)), a = L(1), b = L(3), c = L(2), L, longitud degeodesica

    49

  • 7/25/2019 Papa Quiroz

    54/84

    Captulo 3

    El Problema de Optimizacion y sus

    Condiciones de Optimalidad

    Diversos fenomemos naturales son estudiados a traves de modelos matematicos, en

    especial por modelos presentados por un problema de optimizacion el cual mostraremos

    mas adelante. En estos modelos, es necesario garantizar inicialmente las condiciones

    para la existencia y caracterizacion de puntos optimos, para luego desarrollar un al-

    goritmo adecuado que resuelva algunos modelos matematicos de optimizacion, en tal

    sentido, definimos el conjunto sobre el cual estamos trabajando, es decir conoceremos

    lo que es una variedad convexa y en ella estudiamos una clase particular de funciones

    llamadas convexas y cuasi-convexas.

    Para el desarrollo de este Captulo, iniciamos con algunas definiciones elementales,

    que seran de gran utilidad al resolver un problema de optimizacion.

    Definicion 3.0.3 (Mnimo: global, local, estricto). Sea M una variedad riema-nniana completa yf :M IR una funcion.

    1. x M es un mnimo global def si, f(x) f(x), para todo x M.

    2. x Mes un mnimo local def si, existe >0 tal que:

    f(x) f(x), para todo x B(x, ),

    dondeB(x, ) = {x M, d(x, x)< } .

    50

  • 7/25/2019 Papa Quiroz

    55/84

    3. x Mes mnimo local estricto si, existe >0 tal que f(x)< f(x),para todox = x, x B(x, ).

    El problema de interes sera resolver el siguiente modelo:

    min f(x)

    x M(3.1)

    que significa encontrar los mnimos globale de una funcion fsobreM, y es denominado

    Problema de Minimizacion, sujeta generalmente a algunas restricciones sobre su

    dominio.

    El modelo (3.1) resuelve tambien el Problema de Maximizacion.

    max f(x)

    x Mpara ello basta definir f(x) = g(x).

    3.1 Existencia de puntos de mnimo global

    Definicion 3.1.1 Una funcionf : M IR es denominada semicontinua inferiorenx M, si para toda sucesion{xk} deMconvergente ax se tiene que:

    lim infk

    f(xk) f(x).

    Sif es semicontinua inferior para todo xM, entonces decimos quef es semicon-tinua inferior enM.

    El siguiente Teorema garantiza la existencia de un punto de mnimo global para el

    problema (3.1).

    Teorema 3.1.1 (Weierstrass) Considere el problema (3.1), sif :M IRes semi-continua inferior y M es compacto, entonces existe un punto de mnimo global de

    f.

    Demostracion. Mostraremos inicialmente que fes limitada inferiormente, esto es,

    existe

    IR tal que:

    f(x), para todo x M.

    51

  • 7/25/2019 Papa Quiroz

    56/84

    Por contradiccion, supongamos que f no es limitada inferiormente, entonces existe

    una sucesion{xk} M tal que:

    limk+

    f(xk) = . (3.2)

    Dado que Mes compacto, entonces existe una subsucesion{xkj} {xk} tal que:

    limj+

    xkj =x,por la semicontinuidad inferior de f tenemos:

    lim infj+

    f(xkj )

    f(x),

    lo que contradice a (3.2), por lo tanto f es limitada inferiormente en M. De aqu

    existe f IR tal que f =inf{f(x) :xM}. Por propiedad de nfimo, existe unasucesion{xk} Mtal que:

    limk

    f(xk) =f.

    Por la compacidad de M, existe x y{xkj} {xk} tal que limj xkj = x M.Nuevamente, por la semicontinuidad inferior de f

    lim infj

    f(xkj ) f(x).

    Como{f(xk)} converge a f, la subsucesion{f(xkj)} converge a f obteniendo que

    f f(x),

    as, xes un punto de mnimo global de f en M.

    3.2 Caracterizacion de puntos de mnimo local

    Presentamos en esta Seccion las condiciones necesarias y suficientes de optimalidad

    local para el problema (3.1).

    Teorema 3.2.1 (Condicion necesaria de primer orden). Seaf : M IR de claseC1. Six es un punto de mnimo local, entoncesgrad f(x) = 0.

    52

  • 7/25/2019 Papa Quiroz

    57/84

    Demostracion. Tomemos v TxM y una curva geodesica : IR M concondiciones (0) = x y (0) = v. Definamos la aplicacion h : IR IR tal queh(t) =f((t)). Como x es punto de mnimo local para f, entonces existe > 0 tal

    que

    h(0) =f(x) f((0)) =h(t),

    para todo t (, ) lo que implica que en t= 0 tenemos un punto de mnimo localde h. Por la condicion necesaria de primer orden en IRse tiene

    h(0) = grad f(x), v = 0.

    Tomando en particular v= grad f(x) tenemos que grad f(x) = 0.

    Teorema 3.2.2 (Condicion necesaria de segundo orden). Seaf : M IR de claseC2. Six es punto de mnimo local, entoncesv, Hfxv 0, v TxM.

    Demostracion. Seav TxM,y:IR Muna geodesica con (0) =x, (0) =v.Definimosh : IR IRtal queh(t) =f((t)).Del Teorema 3.2.1, ent = 0 tenemos unpunto de mnimo local de h, entonces por la condicion necesaria de segundo orden:

    h(0) = 0, luego h(0) 0.Veamos:

    h(t) = gradf((t)), (t)h(t) = d

    dtgradf((t)), (t)

    =

    Ddt

    (gradf((t))), (t)

    +

    gradf((t)), Ddt

    ((t))

    =

    Hf(t)(t), (t)

    =

    v, Hfxv)

    =

    Hfxv, v)

    0.

    Teorema 3.2.3 (Condicion suficiente de segundo orden). Seaf :M IRde claseC2. Six M que satisface:

    a) grad f(x) = 0.

    b) Hfx definida positiva.

    Entonces, x es un punto de mnimo local estricto def.

    53

  • 7/25/2019 Papa Quiroz

    58/84

    Demostracion. Por contradiccion. Supongamos quex no es punto de mnimo local

    estricto, entonces existe una subsucesion{xk} B(x, 1k

    )/{x} tal que:

    f(x) f(xk). (3.3)

    Sea la geodesica minimal k : [0, 1]IR tal que k(0) = x, k(1) =xk, k(0) = vky d(x.xk) =

    expxxk . Definimos h : IR IR tal que h(t) = (f k)(t) y por eldesarrollo de Taylor de segundo orden de h en 0 :

    h(t) =h(0) + th(0) +1

    2t2h(0) + (|t|2), donde, lim

    t0

    (|t|2)|t|2 = 0,

    esto es,f(k(t)) =f(x

    ) +t2

    2

    D

    dtgrad f(x)vk, vk

    + (|t|2).

    Evaluando en t = 1

    f(xk) =f(x) +1

    2

    vk, H

    fxvk

    + (d2(x, xk)) (3.4)

    donde: limd0

    (d2(x, xk)

    d2(x, xk) = 0.

    Definamos z

    k

    =

    vk

    vk , la sucesion{zn

    } es limitada, entonces existe una subsucesion{zkj} {zk} tal que{zkj} z. Substituyendo en (3.4) k por kj ,tenemos:

    f(xkj ) =f(x) +1

    2

    vkj , H

    fxvkj

    + (d2(x, xkj)) (3.5)

    donde: limd0

    (d2(x, xkj)

    d2(x, xkj ) = 0.

    De la relacion (3.3) y tomando lmite en (3.5) cuando j ,obtenemos:

    0 z, Hfx z ,lo que contradice la hipotesis b) del Teorema 3.2.3. Por tanto, x es un punto de

    mnimo local estricto.

    3.3 Elementos del analisis convexo

    La teora del analisis convexo en variedades riemannianas fueron estudiadas por

    RAPCSAK (1997), [21] y UDRISTE (1997), [24]. Rapsack considera una variedad

    54

  • 7/25/2019 Papa Quiroz

    59/84

    diferenciable con metrica induzida de IRn, obteniendo caracterizaciones de primer

    y segundo orden. UDRISTE considero el estudio sobre una variedad riemanniana

    abstracta generalizando (independientemente) la teora de convexidad.

    A partir de estos trabajos el estudio del analisis convexo con aplicacion a la teora de

    Optimizacion se ha profundizado, vease por ejemplo da CRUZ NETO y OLIVEIRA

    (1995),[5], FERREIRA y OLIVEIRA (1998), [10] quienes consideran en sus estudios,

    una variedad riemanniana completa con curvatura seccional no negativa, bajo esta

    misma perspectiva, desarrollamos basicamente el analisis convexo sobre una variedad

    riemanniana.

    En esta Seccion damos algunas nociones de los elementos del analisis convexo y conesta misma perspectiva definimos funciones convexas y cuasi-convexas en una variedad

    riemanniana.

    3.3.1 Convexidad en una variedad riemanniana

    Existen diversos puntos de vista en la geometra riemannianna para generalizar el

    concepto de convexidad de IRn, los mas importantes son los que presentamos en las

    siguientes definiciones.

    Definicion 3.3.1 SeaM una variedad riemanniana completa, se dice queA Mes totalmente convexo, si para cualquier par de puntosp yqdeA (no necesariamente

    distintos), las geodesicas que unen dichos puntos, estan integramente contenidos en

    A.

    Ejemplo 3.3.1 SiM = IRn con la metrica identidadG(x) = I, cualquier conjunto

    convexo en el sentido clasico es totalmente convexo.

    Ejemplo 3.3.2 Sip My existe una relacion geodesica no trivial enp, es decir unageodesica: : [a, b]M tal que(a) =p = (b) con(t)=p para algunt[0, 1],entonces el conjunto A ={p} no es totalmente convexo. Se deduce de esto que engeneral conjuntos unitarios no son totalmente convexos.

    Definicion 3.3.2 Decimos queAMes convexo si para todo par de puntosp yq

    deA existe una geodesica minimal que unep yqcontenido enA.

    55

  • 7/25/2019 Papa Quiroz

    60/84

    Ejemplo 3.3.3 El propio My los conjuntos unitarios son conjuntos convexos.

    Definicion 3.3.3 f : M IR es llamada funcion convexa si su restriccion a

    cualquier geodesica deM es una funcion convexa enIR, es decir, si:IR M esuna geodesica entonces:

    f :IR IR

    es convexa.

    Teorema 3.3.1 f : M R es convexa si, y solamente si, para todo segmento degeodesica: [a, b] My para cualquier [0, 1] se verifica

    f(((1 )a+ b)) (1 )f((a)) + f((b)).

    Demostracion. Siendo fconvexa, demostraremos que:

    f(((1 )a+ b)) (1 )f((a)) + f((b)) (3.6)

    Sea h : IR IR tal que h(t) =f((t)). Para a, b [a, b] y [0, 1] se tiene

    h((1 )a + b) (1 )h(a) + h(b).

    De aqu se tiene (3.6).

    Reciprocamente, seat= (1 )a + bcon [0, 1] entonces:

    f (t) =f(((1 )a + b))

    f(((1 )a) + f((b)= (1 )f((a)) + f((b))

    (1

    )f

    (a) + f

    (b).

    Observacion 3.3.1 La Definicion 3.3.3 es la generalizacion natural de la definicion

    clasica de funcion convexa emM=IRn con la metrica usual. En efecto, dadosp yq

    la geodesica: [0, 1] M, que los une es:

    () =p+ (qp) = (1 )p+ q.

    Luego, del Teorema 3.3.1 tenemos:

    f(()) =f((1 )p + q) (1 )f(p) + f(q)

    56

  • 7/25/2019 Papa Quiroz

    61/84

    f((1 )p+ q) =f(()) =f((1 )(0) + (1)) (1 )f((0)) + f((1))

    = (1 )f(p) + f(p).

    Para IR, definimos el conjunto de nivel M = {x M; f(x) }.

    Teorema 3.3.2 Sif :M IR es convexa, entoncesM es totalmente