complementos ao curso de fÍsica matemÁtica ii:...

Post on 26-Nov-2018

239 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

COMPLEMENTOS AO CURSO DE FÍSICAMATEMÁTICA II: FUNÇÃO DEGREEN E TEORIA ESPECTRAL DE OPERADORES COMPACTOS

DOMINGOS H. U. MARCHETTI

IFUSP - 2018

Conteúdo

1. Preliminares à Teoria de SturmLiouville 31.1. Solução geral e solução do PVI 41.2. Teoremas de Sturm 101.3. Problema de SturmLiouville 121.4. Existência de autovalores 152. O Problema de Sturm-Liouville 182.1. Considerações Algébricas 182.2. Operador integral inverso a L0 seu núcleo integral de Green 212.3. A equação integral do Problema de Sturm-Liouville 262.4. Redução de uma forma quadrática Hermiteana aos eixos principais 323. Operadores Compactos: Teoria Espectral 443.1. Compacidade na reta e em espaços métricos 443.2. Equicontinuidade 483.3. Operadores compactos 493.4. Teoria espectral de operadores compactos autoadjuntos 534. Equações integrais 604.1. O método de aproximações Sucessivas 604.2. Transformação inversa, valores regulares e singulares 664.3. Aproximação por núcleos integrais de posto nito 724.4. Alternativa e determinante de Fredholm 74

Nestas notas temos por objetivo coletar e reorganizar os principais resultados da teoria espectralde operadores hermitianos compactos contidos no texto do Prof. Chaim S. Hönig Análise funcionale o problema de Sturm-Liouville e empregados no tratamento da Teoria de SturmLiouville. Estareorganização do material se faz necessário por conta de nossa preocupação em desenvolver oproblema de SturmLiouville concisamente, inserindo apenas o que lhe é própriamente pertinente.

1

COMPLEMENTOS 2

Faremos uma discussão preliminar do problema de Sturm-Liouville por intermédio dos teoremasde comparação e oscilação de Sturm. Nesta abordagem seguiremos o Cap. IV do texto do Prof.Jorge Sotomayor Lições de equações diferenciais ordinárias .Dividiremos o assunto em quatro seções. A Seção 1 introduz o problema de Sturm-Liouville

como concebido em sua forma clássica, por intermédio dos teoremas de Sturm. A Seção 2 introduza função de Green G(x, y) do problema de SturmLiouville e dene o operador integral Gρ quetem como núcleo esta função. Segue desta representação que as autofunções ϕn(x) do problemaassociados ao autovalor λn são autofunções do operador integral Gρ associado ao autovalor 1/λn.A teroria espectral para Gρ é muito mais simples pois Gρ é um operador Hermitiano compacto. NaSeção 3 estudamos a teoria espectral dos operadores compactos em geral. Na Seção 2 aplicamosesta teoria a Gρ, estendendo em seguida o método da função de Green ao sentido generalizado.Visando dar uma base algébrica mais sólida ao tratamento via função de Green do problema deSturmLiouville, faremos na Seção 4 uma exposição da teoria de Fredholm das equações integrais.

COMPLEMENTOS 3

1. Preliminares à Teoria de SturmLiouville

O objetivo é estudar o problema de SturmLiouville cuja formulação se dá em termos de umaequação diferencial ordinária de segunda ordem da forma

− Lλ[y]def.= (p(x)y′)

′+ (λρ(x)− q(x)) y = f(x) (1.1)

onde p, p′, q e ρ são funções contínuas denidas em um intervalo [a, b] tais que p(x), ρ(x) ≥ 0

(p(x) > 0 problema regular) e λ ∈ R.Primeiramente, por que estudar este tipo de equação e quais as motivações para este estudo?

Apontamos, ao menos, três motivações principais (para uma discussão sobre esta questão, vejahttps://math.stackexchange.com/questions/1915313): 1. Seja Lλ : C 2(a, b) −→ C (a, b) a transfor-mação linear (entre espaços vetoriais de funções) cuja ação é denida pelo lado direito da igualdade

(1.1) e seja (f, g) =

∫ b

a

f(x)g(x)dx o produto interno nestes espaços. Lλ é um operador dife-

rencial autoadjunto, i. e., a equação adjunta L∗λ[v], denida por (Lλ[u], v) = (u, L∗λ[v]) paraquaisquer duas funções u e v no domínio de Lλ, e obtida por integração parcial, mantém a mesmaforma (1.1): L∗λ[v] = Lλ[v]. Por conta disso, os valores próprios λ's, da equação de autovaloresLλ[y] = L0[y]− λy = 0, são reais e as autofunções yλ's, correpondentes a autovalores distintos, sãoortogonais; 2. Denimos sobre o espaço (a = 0 e b = L)

H10 (0, L) =

f : (0, L) −→ R : f, f ′ ∈ L2(0, L), f(0) = f(L) = 0

de Sobolev os funcionais

E, J : H10 (0, L) −→ R

de energia e norma ponderada:

E[y] =

∫ L

0

(p(x)y′(x)2 + q(x)y(x)2

)dx (1.2)

J [y] =

∫ L

0

ρ(x)y(x)2dx = ‖y‖2ρ . (1.3)

Equações de EulerLagrange do problema de SturmLiouville são obtidas pelo cálculo das variações.Para calcular a derivada funcional de E e J na direção do vetor v (satisfazendo v(0) = v(L) = 0):

limε→0

1

ε(E[y + εv]− E [y]) =

(v,δE

δy[y]

)=

∫ L

0

v(x)δE[y]

δy(x)dx

limε→0

1

ε(J [y + εv]− J [y]) =

(v,δJ

δy[y]

)substituímos (1.2) e (1.3) no lado esquerdo destas equações e integramos por partes, resultando asequações

δE[y]

δy(x)= −2 (p(x)y′)

′+ 2q(x)y

δJ [y]

δy(x)= 2ρ(x)y . (1.4)

COMPLEMENTOS 4

O mínimo do funcional energia E[y] sujeito ao vínculo de normalização ‖y‖ρ = 1:

miny∈H1

0 (0,L)E[y] : J [y] = 1

satisfaz, pelo método do multiplicador de Lagrange:

limε→0

1

ε(E[y + εv]− λJ [y + εv]− E [y] + λJ [y]) =

(v,δE[y]

δy− λδJ [y]

δy

)= 0

resultando por (1.4) a equação de EulerLagrange (1.1) com f ≡ 0:1

− (p(x)y′)′+ (q(x)− λρ(x))y = 0 ,

sujeita ao vínculo ‖y‖ρ = 1 e cuja única solução dado pelo par (λ, y(x)), fornece o menor autovalorλ1 e autofunção y1(x) correspondente ao problema de autovalores de SturmLiouville (mínimoglobal do funcional energia vinculado). Dados λ1 e y1(x), minimizamos o funcional energia E[y]

sujeito ao vínculo de normalização e ortogonalidade:

miny∈H1

0 (0,L)

E[y] : J [y] = 1 e (y, y1)ρ =

∫ L

0

y(x)y1(x)ρ(x)dx = 0

cuja única solução (λ, y(x)), fornece o segundo menor autovalor λ2 > λ1 e autofunção correspon-dente y2(x) normalizada ‖y2‖ρ = 1. Prosseguindo, os minimizantes do funcional de energia E[y]

sujeitos ao vínculo de normalização e ortogonalidade com respeito as soluções obtidas anterior-mente, produzem uma coleção enumerável de autovalores e autofunções correspondentes

λ1 < λ2 < · · · < λn < · · ·y1(x), y2(x), . . . , yn(x), . . . (1.5)

mutuamente ortogonais e normalizadas do problema de autovalores de SturmLiouville. 3. Aterceira e última motivação para se estudar as equações da forma (1.1) é que as leis que descrevema eletrostática/eletrodinâmica, que regem a dinâmica e regime estacionário de meios contínuos,como por exemplo a propagação do calor e vibrações em meios elásticos, e que descrevem a funçãode onda de uma partícula quântica em um potencial podem ser reduzidas a uma ou mais equaçõesdesta forma por separação de variáveis adequada a simetria do problema.Este estudo está dividido em quatro Subseções:

1.1. Solução geral e solução do PVI. Inicialmente, estudaremos as propriedades básicas deuma equação diferencial linear de segunda ordem

y′′ + p(x)y′ + q(x)y = f(x) (1.6)

onde p, q, f : (a, b) −→ R são funções contínuas.

1Escrevemos a ação A = E−λJ =∫

L dx, onde a Lagrangeana L = L [y, y′] = p(x) (y′)2+(q(x)−λ)y2. A equação

de EulerLagrange ∂/∂xLy′ −Ly = 0, onde Ly′ e Ly denotam, respectivamente, as derivadas parciais de L comrespeito a y′ e y, associada a esta Lagrangeana coincide com a equação de SturmLiouville.

COMPLEMENTOS 5

Existência e unicidade do PVI. Consideremos o problema de valor inicial (PVI) dado pelaequação (1.6) juntamente com os dados iniciais:

y(x0) = y0

y′(x0) = v0 (1.7)

com (x0, y0, v0) ∈ (a, b)× R× R arbitrário.

Teorema 1.1. Se p, q e f são contínuas em (a, b), então o PVI, equações (1.6) e (1.7), tem uma,

e somente uma, solução denida no intervalo (a, b).

Prova. Seja

y1(x) = y(x)

y2(x) = y′(x)

as componentes de uma função y = (y1, y2) : J ⊂ (a, b) −→ R2 a valores vetoriais. Como

y′1 = y2

y′2 = −q(x)y1 − p(x)y2 + f(x)

a função y satisfaz um PVI

y′ = f(x,y) (1.8)

y0 = y(x0) (1.9)

onde f = (f1, f2) com f1 = f1(x, y1, y2) = y2 e f2 = f2(x, y1, y2) = −q(x)y1 − p(x)y2 + f(x) ey0 = (y0, v0) ∈ R2 para algum x0 ∈ J ⊂ (a, b). Note que cada componente fi de f é contínua em x

e diferenciável em y1 e y2 e o campo vetorial (x,f) está denido no cilíndro aberto Ω = (a, b)×R×R.Logo, pelo Teorema de existência e unicidade do PVI para um sistema de equações diferenciais deprimeira ordem, existe um aberto J contendo x0 e uma única função y : J −→ R2 tal que y(J) ⊂ R2

e satisfaz o PVI (1.8) e (1.9) para todo x ∈ J . A existência do PVI pode ser estendida a um intervalomaximal J∗ que coincide com intervalo (a, b) pois as soluções de um sistema linear são globais nointervalo de denição e isso conclui a prova do Teorema 1.1.

Equação homogênea (f ≡ 0). Considere agora a equação (1.6) homogênea

y′′ + p(x)y′ + q(x)y = 0 , x ∈ (a, b) (1.10)

com p, q contínuas. Pelo Teorema 1.1, existe uma única solução para cada um dos dados iniciais:

y(x0) = 1 , y′(x0) = 0 (1.11)

ey(x0) = 0 , y′(x0) = 1 (1.12)

COMPLEMENTOS 6

para algum x0 ∈ (a, b). Sejam

φ1 : (a, b) −→ R

φ2 : (a, b) −→ R

as soluções do PVI (1.10) juntamente com (1.11) e (1.12), respectivamente. Então, qualquer função

φ(x) = α1φ1(x) + α2φ2(x) , α1, α2 ∈ R (1.13)

é solução do PVI (1.10) comφ(x0) = α1 , φ′(x0) = α2 .

A recíproca também é verdadeira.

Proposição 1.2. Qualquer solução de (1.10) é da forma (1.13) para algum par α1, α2 ∈ R.

Prova. Seja φ : (a, b) −→ R uma solução de (1.10) e tome φ(x0) = α1 e φ′(x0) = α2, x0 ∈ (a, b).Então, devido a linearidade da equação (1.10),

ψ(x) = φ(x)− α1φ1(x)− α2φ2(x) ,

satisfaz (1.10) com ψ(x0) = ψ′(x0) = 0. Pelo Teorema 1.1, ψ(x) ≡ 0 é a única solução do PVI,concluindo a demonstração.

De onde se conclui que (1.13) é a solução geral da equação (1.10).

Denição 1.3. Duas funções φ1, φ2 : (a, b) −→ R são linearmente dependentes (L. D.) se

existir uma constante k ∈ R tal que

φ2(x) = kφ1(x) , ∀x ∈ (a, b) .

Duas funções (φ1 e φ2) são linearmente independentes (L. I.) se a condição

α1φ1(x) + α2φ2(x) = 0 , ∀x ∈ (a, b)

implicar que α1 = α2 = 0 (obviamente, φ1 e φ2 são L. I. se não forem L. D.).

Denição 1.4. Dadas duas funções φ1, φ2 : (a, b) −→ R diferenciáveis, o determinante

W (φ1, φ2;x) =

∣∣∣∣∣ φ1(x) φ2(x)

φ′1(x) φ′2(x)

∣∣∣∣∣= φ1(x)φ′2(x)− φ2(x)φ′1(x) (1.14)

é chamado Wronskiano das funções φ1, φ2 em x ∈ (a, b) ou simplesmente função Wronskiana.

Proposição 1.5. Sejam φ1, φ2 : (a, b) −→ R duas funções diferenciáveis cujo Wronskiano

W (φ1, φ2;x0) é diferente de 0 em um ponto x0 ∈ (a, b). Então φ1, φ2 são L. I..

Prova. Suponhamos, por contradição, que φ1, φ2 sejam L. D.. Então existem α1 e α2 tais que|α1|+ |α2| 6= 0 e

α1φ1(x) + α2φ2(x) = 0 , ∀x ∈ (a, b) .

COMPLEMENTOS 7

Derivando esta equaçãoα1φ

′1(x) + α2φ

′2(x) = 0

e tomando x = x0, temos (φ1(x0) φ2(x0)

φ′1(x0) φ′2(x0)

)(α1

α2

)=

(0

0

). (1.15)

Como por hipótese W (φ1, φ2;x0) 6= 0, a única solução de (1.15) para (α1, α2) é α1 = α2 = 0,contradizendo |α1|+ |α2| 6= 0 e a suposição de φ1, φ2 serem L. D..

Observação 1.6. A reciproca é falsa, como pode ser visto pelo seguinte exemplo: φ1(x) = x3 e

φ2(x) = |x|3, denidas em R, são L. I. porém W (φ1, φ2;x0) = 0 para todo x0 ∈ R.

Teorema 1.7. Sejam φ1, φ2 : (a, b) −→ R duas soluções quaisquer de (1.10). Então φ1 e φ2 são L.

I. se, e somente se, W (φ1, φ2;x0) 6= 0 em um ponto x0 ∈ (a, b). Se, além disso, W (φ1, φ2;x0) 6= 0

em algum ponto x0, então W (φ1, φ2;x) 6= 0 para todo x ∈ (a, b).

Prova. Devido a Proposição 1.5, resta provar para a primeira assertiva que, se φ1, φ2 são soluçõesL. I. de (1.10), então W (φ1, φ2;x0) 6= 0 em algum ponto x0. Vamos mostrar que W (φ1, φ2;x) 6= 0,∀x ∈ (a, b).Suponhamos, por contradição, que W (φ1, φ2;x0) = 0. Então o sistema de equações

α1φ1(x0) + α2φ2(x0) = 0

α1φ′1(x0) + α2φ

′2(x0) = 0 (1.16)

tem solução nãoDerivando a expressão trivial ((α1, α2) 6= (0, 0)) para (α1, α2). Escrevemos

φ(x) = α1φ1(x) + α2φ2(x) , x ∈ (a, b)

que, por hipótese, é solução da equação (1.10) e, por (1.16), satisfaz as condições iniciais

φ(x0) = φ′(x0) = 0 .

Logo, pelo Teorema 1.1, φ(x) = 0 para todo x ∈ (a, b) e isso implica que φ1, φ2 são L. D.,contradizendo a hipótese. A segunda assertiva segue da fórmula de AbelLiouville (veja Teorema1.8 a seguir).

Teorema 1.8. Sejam φ1, φ2 : (a, b) −→ R duas soluções quaisquer de (1.10). Então

W (φ1, φ2;x) = W (φ1, φ2;x0) exp

(−∫ x

x0

p(s)ds

), x0 ∈ (a, b) . (1.17)

COMPLEMENTOS 8

Prova. Diferenciando (1.14) com respeito a x, temos

W ′(φ1, φ2;x) = φ′1(x)φ′2(x)− φ′2(x)φ′1(x) + φ1(x)φ′′2(x)− φ2(x)φ′′1(x)

= φ1(x)φ′′2(x)− φ2(x)φ′′1(x)

= φ1(x) (−p(x)φ′2(x)− q(x)φ2(x))− φ2(x) (−p(x)φ′1(x)− q(x)φ1(x))

= −p(x) (φ1(x)φ′2(x)− φ2(x)φ′1(x))

= −p(x)W (φ1, φ2;x) .

Integrando (logW )′ = W ′/W = −p(x) sobre o intervalo (x0, x) obtemos pelo teorema fundamentaldo cálculo a fórmula (1.17) desejada.

Observação 1.9. Pela fórmula de AbelLiouville (1.17), uma de duas alternativas ocorre: ou

W (φ1, φ2;x) = 0, ∀x ∈ (a, b) ou W (φ1, φ2;x) 6= 0, ∀x ∈ (a, b).

Teorema 1.10. Sejam ψ1, ψ2 : (a, b) −→ R duas soluções L. I. de (1.10). Então qualquer solução

φ de (1.10) é da forma

φ(x) = α1ψ1(x) + α2ψ2(x) , (1.18)

para algum par α1, α2 ∈ R.

Prova. Seja φ(x) uma solução de (1.10). Fixe x0 ∈ (a, b) e escreva

α1ψ1(x) + α2ψ2(x) = φ(x0)

α1ψ′1(x) + α2ψ

′2(x) = φ′(x0) .

Como W (ψ1, ψ2;x0) 6= 0, então α1 e α2 são determinados pelos valores φ(x0) e φ′(x0) da solução esua derivada no ponto x0.Considere a função

σ(x) = α1ψ1(x) + α2ψ2(x)

que é uma solução de (1.10) com

σ(x0) = α1ψ1(x0) + α2ψ2(x0) = φ(x0)

σ′(x0) = α1ψ′1(x0) + α2ψ

′2(x0) = φ′(x0) .

Pelo Teorema 1.1, de existência e unicidade, σ(x) = φ(x). Note que a diferença δ(x) = σ(x)−φ(x)

satisfaz (1.10) com δ(x0) = δ′(x0) = 0, cuja única solução é δ(x) = 0 para todo x ∈ (a, b), concluindoa demonstração do teorema.

Observação 1.11.(1) Se encontrarmos quaisquer duas soluções ψ1, ψ2 L.I. de (1.10), então escrevemos sua solução

geral (1.18).

(2) Se y1(x) e y2(x) são duas soluções da equação nãohomogênea , então y1(x)− y2(x) é uma

solução da equação homogênea (1.10). Portanto, se yp(x) é uma solução particular qualquer

COMPLEMENTOS 9

de (1.6) então uma solução geral de (1.6) é

y(x) = α1ψ1(x) + α2ψ2(x) + yp(x)

(3) Se conhecermos duas soluções L. I. de (1.10), então podemos determinar uma solução geral

de (1.6) pelo método da variação das constantes.

Comentário Algébrico. Seja C j(a, b), j ≥ 0, o espaço vetorial (real) das funções φ : (a, b) −→ Rda classe C j (isto é, a classe das funções continuamente diferenciáveis até a jésima derivada). Aequação (1.6) dene um operador diferencial em C 2(a, b):

L : C 2(a, b) −→ C (a, b)

φ 7−→ L [φ] = φ′′ + p(x)φ′ + q(x) ,

com p, q : (a, b) −→ R contínuas.O núcleo (ou espaço nulo) N (L) do operador L é um subespaço vetorial de C 2(a, b):

N (L) =φ ∈ C 2(a, b) : L[φ] = 0

(lembre que a combinação linear de duas soluções φ1 e φ2 de é uma solução de (1.10). 0 é afunção em (a, b) identicamente nula, isto é, o elemento 0 do espaço vetorial C 0(a, b)). Vimos quedim (N (L)) = 2.A imagem R(L) do operador L em C 2(a, b) é o subespaço vetorial de C 0(a, b)

R(L) =f ∈ C 0(a, b) : ∃φ ∈ C 2(a, b) e L[φ] = f

.

Segue do Teorema 1.1, de existência e unicidade da solução de (1.6), que R(L) = C 0(a, b). Logo,o operador L é sobrejetivo. Porém, como N (L) tem dimensão 2, o operador L não é inversível.2

A imagem inversa L−1[f ] de um elemento f ∈ C 0(a, b) é uma variedade linear (am) da forma

yp + N (L)

onde yp(x) é qualquer elemento de L−1[f ].Incluindo ao espaço C 2(a, b) no domínio D (Lµ) do operador diferencial Lµ = L0− µρ, dado por

(1.1), as condições de contorno,

D (Lµ) =φ ∈ C 2(a, b) : αφ(a) + βφ′(a) = γφ(b) + δφ(b) = 0

,

se µ é diferente de qualquer autovalor λ de L0: µ 6∈ λ ∈ R : Lλ[φ] = L0[φ]−λρφ = 0 para algum φ 6=0, então, como veremos,

(L0 − µρ) : D (Lµ) −→ C 0(a, b)

é injetivo e sobrejetivo. O operador inverso Sµ = (L0 − µρ)−1 é compacto S é um operadorintegral e seu núcleo integral é a função de Green G(x, x′;µ): Sµ[f ](x) =

∫ baG(x, x′;µ)f(x′)dx′.

Por isso iremos retornar a nossa leitura do texto do Prof. Elon Lima Espaços métricos sobreespaços métricos (Banach e Hilbert) compactos e separaveis.

2Para ser inversível L precisaria ser injetivo, isto é, N (L) = 0. Equivalentemente, L[φ1 − φ2] = L[φ1]− L[φ1] =0 =⇒ φ1 − φ2 = 0 .

COMPLEMENTOS 10

Nos tópicos a seguir desta seção preliminar, seguiremos de perto o Cap. IV do texto do Prof.Jorge Sotomayor Lições de equações diferenciais ordinárias.

1.2. Teoremas de Sturm. Introduziremos aqui os instrumentos necessários para a análise doproblema de autovalores mencionado nas motivações. Demonstraremos dois teoremas devido aSturm e duas aplicações que nos permitem provar de maneira ilustrativa a existência de umainnidade de autovalores e autofunções correspondentes do problema de Sturm-Liouville. Vejaequação (1.5).

Teorema 1.12 (de separação). Sejam u, v : (a, b) −→ R duas soluções L. I. de (1.10) com p,

q : (a, b) −→ R contínuas. Então os zeros de u e v se alternam em (a, b).

Prova. Pelo Teorema 1.7, se u e v são L. I., então o Wronskiano W (u, v;x) não se anula em algumponto x0 ∈ (a, b) e, devido ao Teorema 1.8,

W (u, v;x) = u(x)v′(x)− v(x)u′(x) 6= 0 , ∀x ∈ (a, b) . (1.19)

Em consequência disso, o sinal de W (u, v;x) permanece constante para todo x ∈ (a, b).Se x1 e x2 são quaisquer dois zeros consecutivos de u(x) em (a, b), então os sinais da derivada

u′(x) nestes pontos são distintos: ou

u′(x1) < 0 < u′(x2) (1.20)

e, neste caso, u(x) < 0 para x ∈ (x1, x2); ou

u′(x2) < 0 < u′(x1) (1.21)

e u(x) > 0 para x ∈ (x1, x2). Como, devido a (1.19),

W (u, v;x1) = −v(x1)u′(x1)

W (u, v;x2) = −v(x2)u′(x2)

têm o mesmo sinal, segue de (1.20) ou (1.21) que os sinais de v(x1) e v(x2) são também distintos.Este fato implica que v(x) deve se anular pelo menos uma vez no interval (x1, x2). Trocando u e vde papeis, se por outro lado x1 e x2 são quaisquer dois zeros consecutivos de v(x) em (a, b), entãou(x) deve se anular pelo menos uma vez no interval (x1, x2). Logo os zeros de u e v se entrelaçamem (a, b) pois, caso contrário, teríamos uma contradição.

Teorema 1.13 (de comparação). Sejam u, v : (a, b) −→ R soluções não triviais (i. e., não

identicamente nulas) de

(p(x)u′)′+ q(x)u = 0 (1.22)

e

(p(x)v′)′+ q(x)v = 0 (1.23)

onde p, p′, q e q são contínuas em (a, b), p(x) > 0 e q(x) ≥ q(x). Se x1 < x2 são zeros consecutivos

de u, então v se anula pelo menos uma vez em (x1, x2), a menos que q(x) = q(x) neste intervalo

COMPLEMENTOS 11

e, nesse caso u e v são L. D.:

v(x) = ku(x) , ∀x ∈ (x1, x2)

para algum k ∈ R.

Prova. Subtraindo (1.22) multiplicado por v de (1.23) multiplicado por u, obtemos

(p(x)u′)′v − (p(x)v′)

′u− (q(x)− q(x))uv = 0 . (1.24)

Reescrevendo os dois primeiros termos como uma derivada total

(p(x)u′)′v − (p(x)v′)

′u = (p(x)u′v − p(x)v′u)

= − (p(x)W (u, v;x))′ ,

a integral de (1.24) sobre o intervalo (x1, x2), pelo teorema fundamental do cálculo, pode ser escritacomo ∫ x2

x1

(q(x)− q(x))u(x)v(x)dx = p(x1)W (u, v;x1)− p(x2)W (u, v;x2) .

Suponha, por contradição, que v(x) não se anule no intervalo (x1, x2). Podemos ainda supor, semperda de generalidade, que ambos u(x) > 0 e v(x) > 0 em (x1, x2). Como u1(x1) = u1(x2) = 0 eu′(x1) > 0 e u′(x2) < 0, concluímos∫ x2

x1

(q(x)− q(x))u(x)v(x)dx = −p(x1)v(x1)u′(x1) + p(x2)v(x2)u′(x2) ≤ 0

que é uma contradição pois q(x) ≥ q(x), por hipótese, a não ser que q(x) = q(x) em (x1, x2) e,nesse caso, pelo Teorema de separação 1.12, as duas soluções u e v são L. D.: ∃k ∈ R tal quev(x) = ku(x) para todo x ∈ (x1, x2).

Daremos a seguir duas aplicações do Teorema de comparação.

Proposição 1.14. Considere a equação (1.22) no intervalo (a, b) com p, p′ e q contínuas e p(x) > 0.

Se q(x) ≤ 0 em (a, b), então as soluções não triviais de (1.22) tem no máximo um zero neste

intervalo.

Prova. Uma solução (não identicamente nula) de

(p(x)v′)′= 0

é

v(x) =

∫ x

a

1

p(s)ds

(note que p(x)v′(x) = 1, pelo teorema fundamental do cálculo). Como pela hipótese sobre p(x),v(x) se anula apenas em x = a, segue do Teorema de comparação 1.13 que u(x) tem no máximoum zero no intervalo (a, b).

Proposição 1.15. Sejam c, K constantes tais que

0 < c2 < q(x) < K2

COMPLEMENTOS 12

em (a, b) e seja u(x) uma solução não trivial de

u′′ + q(x)u = 0 .

i. Se x1 e x2 são zeros sucessivos de u, então

π

K≤ x2 − x1 ≤

π

c. (1.25)

ii. Se u(a) = u(b) = 0 e u tem n− 1 zeros em (a, b), então

cb− aπ≤ n ≤ K

b− aπ

. (1.26)

Prova. Para o ítem i., z(x) = sin c(x− x1) é uma solução de

z′′ + c2z = 0

tal que z(x1) = 0 e o zero sucessivo de z(x) é x1 + π/c. Pelo Teorema de comparação 1.13, temos

x2 ≤ x1 + π/c

que prova a segunda desigualdade de (1.25). Usando o mesmo raciocínio para a solução z(x) =

sinK(x− x1) dez′′ +K2z = 0

obtemosx2 − x1 ≥

π

K,

concluindo a demonstração de i.. Sob as hipóteses do ítem ii., existem exatamente n intervalosentre zeros consecutivos de u em (a, b). Aplicando a cada um dos intervalos, iterativamente, asestimativas do ítem i., obtemos

K≤ b− a ≤ n

π

cou seja, as desigualdades (1.26), concluindo a prova da Proposição 1.15.

1.3. Problema de SturmLiouville. A equação(equação (1.1) com f ≡ 0)

− Lλ[y] = (p(x)y′)′+ (λρ(x)− q(x)) y = 0 (1.27)

com p(x), ρ(x) > 0, é chamada equação de StrmLiouville homogênea. Considere (1.27) denidano intervalo I = [a, b], p(x) da classe C 1(a.b), q(x) e ρ(x) da classe C (a.b) e λ1 e λ2 valores distintosde λ para os quais (1.27) admite em I soluções y1(x) e y2(x) não triviais.Subtraindo

(p(x)y′1)′y2 + (λ1ρ(x)− q(x)) y1y2 = 0

de(p(x)y′2)

′y1 + (λ2ρ(x)− q(x)) y2y1 = 0

resulta(λ1 − λ2) ρ(x)y1y2 = (p(x)y1y

′2 − p(x)y′1y2)

′. (1.28)

COMPLEMENTOS 13

Integrando (1.28) sobre I, segue do teorema fundamental do cálculo que

(λ1 − λ2)

∫ b

a

ρ(x)y1(x)y2(x)dx = p(x) (y1(x)y′2(x)− y′1(x)y2(x))|ba . (1.29)

e para que o lado direito desta igualdade se anule, impomos às soluções de (1.27) condições adicio-nais nas extremidades do intervalo I:Condições de contorno (ou fronteira) autoadjuntas (separadamente em a e b),

αy(a) + βy′(a) = 0

γy(b) + δy′(b) = 0 (1.30)

com |α|+ |β| 6= 0 e |γ|+ |δ| 6= 0.Se p(a) = p(b), podemos então também assumir condições de contorno periódicas:

y(a) = y(b)

y′(a) = y′(b) .

Denição 1.16. Um problema de SturmLiouville regular em [a, b] consiste de uma equação da

forma (1.27) juntamente com condições de contorno autoadjuntas (1.30).

Os valores λ para os quais (1.27) e (1.30) admitem solução não trivial são ditos autovalores

do problema.

As soluções soluções u(x) não triviais de (1.27) e (1.30) correspondentes a um autovalor λ são

ditas autofunções do problema associado a λ.

Proposição 1.17. Considere um problema de SturmLiouville regular em [a, b], Se λ1 e λ2 são

autovalores distintos e y1(x) e y2(x) autofunções a eles associadas, então y1 e y2 são ortogonais em

[a, b] em relação ao produto interno com peso

〈y1, y2〉ρ =

∫ b

a

y1(x)y2(x)ρ(x)dx = 0 .

Prova. Segue imediatamente de (1.29) juntamente com (1.30) (verique!).

Exemplo 1.18. A equação y′′ + λy = 0 em [0, π] com condição de contorno (autoadjunta com

α = γ = 0 e β = δ = 1): y(0) = y(π) = 0 tem autovalores

λ ∈

1, 4, . . . , n2, . . .

(1.31)

e a autofunção

un(x) = sinnx (1.32)

associada ao nésimo autovalor λn = n2 possui n− 1 zeros no intervalo (0, π).

A mesma equação com a condição de fronteira (autoadjunta com α = γ = 0 e β = δ = 1):

y′(0) = y′(π) = 0

tem autovalores no mesmo conjunto (1.31) e a autofunção

vn(x) = cosnx (1.33)

COMPLEMENTOS 14

associada ao nésimo autovalor λn = n2 também possui n− 1 zeros no intervalo (0, π).

A mesma equação y′′ + λy = 0 em [−π, π] com a condição de contorno periódica: u(−π) = u(π)

e u′(π) = u′(π) possui autovalores

λ ∈

0, 1, . . . , n2, . . .

e a cada autovalor λn = n2 6= 0 temos associado um autoespaço bidimensional de funções geradas

por un(x) e vn(x) dadas pelas autofunções (1.32) e (1.33).

Denição 1.19. Se a equação (1.27) denida no interior (a, b) do intervalo I = [a, b] em uma ou

ambas extremidades uma das funções p(x), q(x) e ρ(x) não é contínua ou uma das funções p(x),

q(x) se anula, então dizemos que o problema de contorno para (1.27) em I é singular. Se I for

um intervalo innito a equação (1.27) em I também é dita ser singular.

Em qualquer um destes casos, se λ1 e λ2 são valores distintos para os quais (1.27) em I admite

soluções não triviais y1 e y2, então (1.28) continua válida mas (1.29) pode divergir. Exigimos nestes

casos que as soluções de (1.27) sejam de quadrado integrável em I em relação a ρ.

Note que, pela desigualdade de CauchySchwarz(∫ b

a

|y1(x)| |y2(x)| ρ(x)dx

)2

≤∫ b

a

y1(x)2ρ(x)dx

∫ b

a

y2(x)2ρ(x)dx <∞

e no lugar de (1.29) temos

(λ1 − λ2)

∫ b

a

ρ(x)y1(x)y2(x)dx = limwa,zb

p(x) (y1(x)y′2(x)− y′1(x)y2(x))|zw . (1.34)

Proposição 1.20. Considere um problema singular para (1.27) em um intervalo I = [a, b] (a ou b

ou ambos pode ser innito) com condições de contorno que impliquem que o lado direito de (1.34)

seja nulo. Se λ1 e λ2 são autovalores distintos e y1(x) e y2(x) autofunções a eles associadas de

quadrado integrável em relação a ρ, então

〈y1, y2〉ρ := limya,zb

∫ z

y

y1(x)y2(x)ρ(x)dx = 0 .

Exemplo 1.21. A equação de Bessel

(xy′)′+

(k2x− n2

x

)y = 0

denida no intervalo (0, a], a > 0, é da forma (1.27) com p(x) = ρ(x) = x, q(x) = n2/x e λ = k2,

para n ∈ Z. Trata-se de um problema de SturmLiouville singular em vista de p se anular e

q divergir em x = 0. Uma condição de contorno apropriada a este problema: y(a) = 0 e y(x)

limitada quando x tende a 0, a qual garante soluções não triviais do problema de autovalores de

quadrado integrável.

Exemplo 1.22. Há muitas outras equações de relevancia Física da forma de Sturm-Liouville

(1.27), sendo a maioria delas singular: i. Equação de Legendre e associada de Legendre((1− x2)y′

)′+

(l(l + 1)− m2

1− x2

)y = 0

COMPLEMENTOS 15

em (−1, 1) com p(x) = 1− x2 e q(x) = m2/(1− x2), m ∈ Z (com m = 0 temos a eq. de Legendre),

é singular nos pontos x = ±1; ii. Equação de Laguerre(xe−xy′

)′+ λe−xy = 0 ,

em (0,∞) com p(x) = xe−x, ρ(x) = e−x e λ ∈ R, é singular nos pontos x = 0 e ∞; iii. Equação

de Hermite (e−x

2

y′)′

+ λe−x2

y = 0

em (−∞,∞) com p(x) = ρ(x) = e−x2e λ ∈ R, é singular nos pontos x = ±∞.

1.4. Existência de autovalores. Por simplicidade, considere o Problema de SturmLiouville :

u′′ + (λρ(x)− q(x))u = 0 (1.35)

regular em [a, b] com condição de contorno de Dirichlet

u(a) = u(b) = 0 . (1.36)

Veremos nesta subseção como os resultados anteriores devido a Sturm permitem provar a existênciade uma innidade de autovalores e autofunções correspondentes. O objetivo é mostrar a seguinte

Proposição 1.23. Os autovalores do Problema de SturmLiouville regular em [a, b] dado por (1.35)

e (1.36) formam uma sequência λ0 < λ1 < · · · < λn < · · · tal que limn→∞ λn =∞.

A menos de um fator constante, existe apenas uma autofunção un(x) associada a cada λn e un(x)

tem exatamente n zeros em (a, b).

A prova deste resultado envolve vários Lemas preparatórios a seguir. Veremos ao nal como(1.35) está relacionada a forma geral da equação (1.27).Para cada λ ∈ R, seja uλ(x) a única solução de (1.35) com

uλ(a) = 0 e u′λ(a) = 1

e considere a aplicação

N : R −→ Z+ = 0, 1, . . .λ 7−→ N(λ)

que associa a cada λ o número de zeros de uλ(x) no intervalo semiaberto (a, b].

Lema 1.24. (i) λ > ν implica N(λ) ≥ N(ν); (ii) Se uλ(b) = 0, então N é descontínua no ponto

λ.

Prova. Se λ > ν, então devido a ρ(x) > 0 temos λρ(x) − q(x) > νρ(x) − q(x). Pelo Teorema dacomparação 1.13 (com νρ(x)−q(x) no lugar de q(x) e λρ(x)−q(x) no lugar de q(x)) uλ(x) se anulapelo menos uma vez entre dois zeros consecutivos de uν(x). Como em x = a ambos uλ(x) e uν(x)

se anulam, o número de zeros de uν em (a, b) é menor ou igual ao número de zeros de uλ nesteintervalo, que implica a desigualdade do ítem (i).Para o ítem (ii), se uλ(b) = 0, então ν < λ implica, pelo ítem (i),

N(ν) ≤ N(λ)− 1

COMPLEMENTOS 16

provando que N é discontínua no ponto λ.

Lema 1.25. (i) 0 ∈ N(R) onde N(R) = R(N) é o conjunto imagem de N . (ii) limλ→∞N(λ) =

∞.

Prova. Se λ é tal que λρ(x)− q(x) ≤ 0 em [a, b], então pela Proposição 1.14 segue-se que uλ não seanula em [a, b]. Isto é, N(λ) = 0 para λ ≤ λ0 onde λ0 é o maior λ tal que a desigualdade anterioré satisfeita.Para o ítem (ii), se λ é tal que

λρ(x)− q(x) ≥ n2π2

(b− a)2

em [a, b], então pelo ítem (i) da Proposição 1.15, uλ tem pelo menos n zeros no intervalo [a, b], ouseja,

N(λ) ≥ n .

Como n ∈ Z+ é arbitrário e ρ(x) e q(x) é contínua em um intervalo fechado e limitado, isto provaa segunda asserção.

Lema 1.26. N é contínua à direita e λ é um ponto de discontinuidade se, e somente se, uλ(b) = 0.

Neste caso

N(λ)− limν↑λ

N(ν) = 1 . (1.37)

Prova. O caso N(λ) ≡ 0 é trivial. Seja λ ∈ R e suponha que

N(λ) = m ≥ 0 .

Sejama = x0 < x1 < · · · < xm ≤ b

os zeros da função uλ(x) em [a, b]. Como u′λ(x0) = 1 6= 0, . . ., u′λ(xm) 6= 0, existem ε1 > 0 e δ > 0

tais que seMi = x ∈ [a, b] : |x− xi| < δ

e

M =m⋃i=0

Mi ,

então x ∈ M implica |u′λ(x)| > ε1. Além disso, se uλ(b) 6= 0 (isto é, xm 6= b) podemos supor queδ < b− xm. Seja

ε2 = inf |uλ(x)| : x ∈ [a, b] \M > 0 ,

e observe que x ∈ [a, b] \M implica |uλ(x)| > ε2. Pela continuidade e diferenciabilidade (isso nãofoi demonstrado no texto do Djairo e Aloizio) das soluções de (1.35) em relação a λ, resulta que∃ r > 0 tal que

|uλ(x)− uν(x)| < ε2

|u′λ(x)− u′ν(x)| < ε1

COMPLEMENTOS 17

para todo x ∈ [a, b], se |λ− ν| < r, pelo teorema do valor médio: para cada x ∈ [a, b], existe

λ ∈ [ν, λ] tal que uλ − uν =

∫ λ

ν

duα/dα dα = (λ − ν)uλ e o mesmo para u′λ − u′ν . Para ν nestas

condições, se x ∈ [a, b] \M então uν(x) 6= 0 e tem o mesmo sinal de uλ. Além disso, uν(x) tem nomáximo um zero em cada um dos Mi, pois u′ν não se anula em M .Logo, por conta do sinal de uν(x) que concorda com uλ(x) em [a, b] \M , uν(x) tem exatamente

um zero em cada Mi, 0 ≤ i ≤ m em− 1 ≤ N(ν) ≤ m .

Pelo ítem (i) do Lema 1.24, temos que N é contínua à direita em λ e se λ é um ponto de discon-tinuidade de N , então temos (1.37). Se uλ(b) 6= 0, existe um zero de uν(x) em Mm e N(ν) = m,provando a continidade de N em λ.

Segue dos Lemas 1.24, 1.25 e 1.26 que os pontos λ0 < λ1 < · · · < λn < · · · de descontinuidade

de N(λ) formam uma sequência innita satisfazendo

(1) λ < λ0, uλ(x) não se anula em (a, b];(2) Para n ≥ 1, se λn−1 < λ < λn, então uλ(x) tem exatamente n zeros em (a, b) mas uλ(b) 6= 0;(3) Para todo n ≥ 0, uλn(x) tem exatamente n zeros em (a, b) e uλn(b) = 0;(4) limn→∞ λn =∞.

Prova da Proposição 1.23. Os autovalores do Problema de SturmLiouville (1.35) e (1.36) coinci-dem com as discontinuidades λn's de N(λ), que formam uma sequência innita, e as autofunçõescorrespondentes são dadas pelas funções uλn(x), n = 0, 1, 2, . . ., com n zeros no intervalo (a, b).

Observação 1.27. Considere a equação (1.27) para o problema de SturmLiouville regular em [a, b]

com a condição de contorno (1.36) de Dirichlet. Fazendo a mudança da variável independente x

para

w(x) =

∫ x

a

ds

p(s)

reduzimos a equação (1.27) em uma equação do tipo (1.35) regular em [0, w(b)] (veja Exercício 1.b

da sexta lista de exercícios).

COMPLEMENTOS 18

2. O Problema de Sturm-Liouville

Consideremos o operador diferencial linear de segunda ordem

Lλ[u] = L0[u]− λρ(x)u (2.1)

eL0[u] = − (p(x)u′)

′+ q(x)u , (2.2)

onde p : [a, b] −→ R é continuamente diferenciável, q, ρ : [a, b] −→ R são contínuas com p(x) > 0

e ρ(x) > 0 para x ∈ [a, b], atuando sobre espaço vetorial de funções u : [a, b] −→ R da classe C 2

sujeitas às condições de fronteira autoadjuntas:

F1[u] = αu(a) + βu′(a)

F2[u] = γu(b) + δu′(b) (2.3)

com α, β, γ e δ reais tais que

|α|+ |β| 6= 0 e |γ|+ |δ| 6= 0 . (2.4)

Denição 2.1. O problema de Sturm-Liouville consiste em achar uma função u = u(x) que é

solução do sistema de equações

Lλ[u] = f(x) (2.5)

em [a, b] e

F1[u] = F2[u] = 0 , (2.6)

com f : [a, b] −→ R uma função contínua.

Dizemos que λ é um autovalor do problema de Sturm-Liouville se a equação homogênea

Lλ[y] = L0[y]− λρ(x)y = 0

tem uma solução y = y(x), não identicamente nula, que satisfaz a condição de fronteira (2.6). A

solução y chama-se autofunção correspondente ao autovalor λ.

2.1. Considerações Algébricas. Faremos um sumário das propriedades algébricas do problemade SturmLiouville, algumas já mencionada na Seção 1 outras tocadas brevemente e aprofundadasmais adiante na presente seção.Identidade de Lagrange e suas consequencias.

Proposição 2.2. Dados u, v ∈ C 2(a, b), então vale a indentidade de Lagrange

〈v, L0[u]〉 − 〈L0[v], u〉 = p(b)W (u, v; b)− p(a)W (u, v; a) . (2.7)

Prova. Temos

vL0[u]− L0[v]u = v (p(x)u′)′ − (p(x)v′)

′u

= (v (p(x)u′)− (p(x)v′)u)′

COMPLEMENTOS 19

e, pelo teorema fundamental do cálculo ,∫ b

a

(vL0[u]− L0[v]u) dx =

∫ b

a

(v (p(x)u′)− (p(x)v′)u)′dx

= p(x) (u(x)v′(x)− v(x)u′(x))|ba (2.8)

de onde se conclui, juntamente com a denição (1.14), a demonstração da proposição.

Proposição 2.3. Sejam duas funções u, v ∈ C (2)(a, b) satisfazendo as condições de fronteira (2.6)

(ou p(a) = p(b) = 0 para o problema singular), então temos p(b)W (u, v; b) = p(a)W (u, v; a) = 0 e

〈v, L0[u]〉 = 〈L0[v], u〉 .

O operador L0 neste caso é dito ser formalmente autoadjunto.

Prova. Se u e v satisfazem (2.6), então o sistema

αu(a) + βu′(a) = 0

αv(a) + βv′(a) = 0

para as incógnitas (α, β) tem uma solução não trivial: (α, β) 6= (0, 0), por hipótese. Disso segueque

W (u, v; a) =

∣∣∣∣∣ u(a) v(a)

u′(a) v′(a)

∣∣∣∣∣ = u(a)v′(a)− v(a)u′(a) = 0 ,

e o mesmo ocorre para a outra extremidade: W (u, v; b) = 0, de onde se conclui, juntamente com(2.7), a demonstração da proposição.

Proposição 2.4. (i) Todos os autovalores do problema de SturmLiouville (2.1)-(2.3) são reais.

(ii) Toda autofunção correspondente a um dado autovalor λ deste problema e combinação linear

de autofunções reais.

Prova. Seja L0[y] = λρ(x)y com y(x) não identicamente nula. Então L0[y] = λρ(x)y. Por (2.8),temos

0 =

∫ b

a

(yL0[y]− L0[y]y) dx

=

∫ b

a

(yλρ(x)y − λρ(x)yy

)dx = (λ− λ)

∫ b

a

|y(x)|2 ρ(x)dx

e como a integral não se anula pela hipótese de y ∈ C 2[a, b] ser não trivial, concluimos que λ = λ.Para o ítem (ii), seja y = v+ iw 6= 0 uma autofunção do problema de SturmLiouville correspon-

dente ao autovalor λ. Como as funções p(x), q(x) e ρ(x) e parâmetros λ, α, β, δ e γ que denemo problema (2.1)-(2.3) são reais, segue imediatamente da linearidades das equações

L0[v + iw] = L0[v] + iL0[w] = λ (v + iw)

COMPLEMENTOS 20

eFj[v + iw] = Fj[v] + iFj[w] = 0 , j = 1, 2

que as funções reais u e v são autofunções do problema correspondentes ao mesmo autovalor λ.

Proposição 2.5. As autofunções (reais) do problema de SturmLiouville (2.5) e (2.6) correspon-

dentes a autovalores distintos são ortogonais relativamente a ρ(x), isto é, se L0[y1] = λρ(x)y1 e

L0[y2] = µρ(x)y2, com λ 6= µ, então

〈y1, y2〉ρ =

∫ b

a

y1(x)y2(x)ρ(x)dx = 0 .

Prova. Segue da Proposição 2.4 que λ e µ e auto funções associadas y1 e y2 são reais e, de (1.29) eProposição 2.3 que

(λ− µ)

∫ b

a

y1(x)y2(x)ρ(x)dx = p(x) (y1(x)y′2(x)− y′1(x)y2(x))|ba = 0

concluindo a demonstração.

Enumerabilidade dos autovalores. A nalidade deste parágrafo é esboçar uma prova que as auto-funções ortogonais (e, consequentemente, os autovalores a estes associados) do probema de SturmLiouville formam um conjunto enumerável. Argumentaremos ainda que este conjunto é completono sentido que a solução y(x) de (2.5) e (2.6), quando λ não é um autovalor, pode ser expressapor uma série de autofunções do problema, uniformemente convergente e convergente em médiaquadrática. Estes resultados serão demonstrados no Teorema , fundamental deste parágrafo.Lembremos de nossa leitura do texto Espaços Métricos de Elon L. Lima, que uma coleção

B de abertos em um espaço métrico (M,d) chama-se uma base quando todo aberto A ⊂ M seexprime como uma união A =

⋃α

Bα de conjuntos Bα ∈ B. Isto é equivalente a dizer que, dados

arbitrariamente um aberto A de M e x ∈ A, existe B ∈ B tal que x ∈ B ⊂ A. Em particular,diz-se que M tem uma base enumerável quando existe uma coleção B = B1, B2, . . . , Bn, . . .de abertos de M tais que todo aberto de M é a união de Bn's. Lembremos que um subconjuntoE ⊂ M diz-se denso em M quando E = M , isto é, quando todo ponto de M é limite de umsequência de pontos de E. Veja pág. 305 do texto para a demonstração da caracterização a seguir:

Proposição 2.6. As seguintes armações com respeito a um espaço métrico (M,d) são equivalen-

tes:

(1) M contém um subconjunto enumerável denso;

(2) M possui uma base enumerável de abertos;

(3) Toda cobertura aberta de M admite uma subcobertura enumerável.

Proposição 2.7. Os autovalores do problema de Sturm-Liouville formam um conjunto enumerável.

Prova. Pela Proposição 2.5, aos autovalores corresponde autofunções ortogonais aos pares da classeC 2(a, b) e, portanto, de quadrado integrável. A coleção das funções contínuas de quadrado integrá-veis CL2(ρ)(a, b) forma um espaço vetorial e, portanto, métrico cuja métrica d2(f, g) = ‖f − g‖2,ρ =

COMPLEMENTOS 21√∫ b

a

(f(x)− g(x))2 ρ(x)dx, para quaisquer duas funções f, g : [a, b] −→ R, é induzida pela norma

no espaço CL2(ρ)(a, b). Como este espaço é separável (pois o espaço C (a, b) com a métrica da con-vergência uniforme, que tem uma topologia mais na que CL2(ρ)(a, b), o é) então o conjunto detodos autovetores ortogonais é necessariamente enumerável.

Seja (λn)n≥1 a sequência de autovalores do problema de SturmLiouville e (yn(x))n≥1 a sequência

das autofunções correspondentes. Admitindo que os yn's formam uma base ortonormal de CL2(a, b):〈ym, yn〉ρ = δm,n, podemos então resolver formalmente o problema (2.5) e (2.6): seja

y(x) =∑n≥1

cnyn(x)

cn = 〈y, yn〉ρ .

Por linearidade das equações, temos

L0[y] =∑n≥1

cnL0[yn] =∑n≥1

cnλnρ(x)yn

e, por conseguinte, Lλ[y] = f implica

L0[y]− λρ(x)y = ρ(x)∑n≥1

cn (λn − λ) yn(x)

= f(x)

= ρ(x)∑n≥1

〈fρ, yn〉ρyn(x)

= ρ(x)∑n≥1

〈f, yn〉yn(x) (2.9)

pois

〈fρ, yn〉ρ =

∫ b

a

f(x)

ρ(x)yn(x)ρ(x)dx =

∫ b

a

f(x)yn(x)dx = 〈f, yn〉 .

Igualando as duas séries em (2.9), temos cn (λn − λ) = 〈f, yn〉 por ortogonslidade dos yn's, isto é

cn =〈f, yn〉

(λn − λ)

e, portanto,

y(x) =∑n≥1

〈f, yn〉(λn − λ)

yn(x)

se λ 6= λn para todo n. Esta fórmula será deduzida novamente, veja ítem (e) do Teorema 2.15, porintermédio de uma equação integral equivalente com informação sobre a sua convergência.

2.2. Operador integral inverso a L0 seu núcleo integral de Green. Vamos a seguir assumirque λ = 0 não é um autovalor do problema (2.5) e (2.6).

COMPLEMENTOS 22

Teorema 2.8. Existe uma função G : [a, b] × [a, b] −→ R contínua tal que, dado f ∈ C [a, b],

u ∈ C 2[a, b] é solução do sistema

L0[u] = f(x) , x ∈ [a, b] (2.10)

e

F1(u) = F2(u) = 0 , (2.11)

se, e somente se,

u(x) =

∫ b

a

G(x, y)f(y)dy . (2.12)

A função G chama-se função de Green do problema.

Prova. Estabeleceremos, primeiramente, a existência de uma solução da forma (2.12). A demons-tração divide-se em duas partes.a. Construção da função de Green. Seja φi = φi(x), i = 1, 2, uma solução real nãonula deL0[φi] = 0, satisfazendo Fi[φi] = 0.Observe que φ1(x) e φ2(x) são L. I. pois, do contrário, seriam proporcionais: φ2(x) = kφ1(x).

Por denição, se φi, i = 1, 2 satisfaz L0[φi] = 0 e Fi[φi] = 0, então φ = φ2 = kφ1, com k ∈ R, énãonula, satisfaz L0[φ] = 0 e F1[φ] = F2[φ] = 0. Pela Denição 2.1, φ seria uma autofunção doproblema associada ao autovalor λ = 0, em contradição com a hipótese assumida anteriormente.Procuremos a função G da forma

G(x, y) =

G1(x, y) = cφ1(x)φ2(y) se a ≤ x ≤ y

G1(x, y) = cφ2(x)φ1(y) se y ≤ x ≤ b(2.13)

com c = c(y) uma constante a ser determinada, como veremos a seguir, por uma condição sobre aderivada ∂G/∂x de G em x = y.Quando a variável y é mantida xa, escremos Gy(x) = G(x, y). Temos assegurado que

L0[Gy](x) = 0 , ∀x 6= y

Fi[Gy] = 0 , i = 1, 2 , (2.14)

pois, por linearidade, L0[Gy](x) = cφ2(y)L[φ1](x) = 0 se x < y, L0[Gy](x) = cφ1(y)L[φ2](x) = 0 sex > y, F1[Gy] = cφ2(y)F1[φ1] = 0 e F2[Gy] = cφ1(y)F2[φ2] = 0.Observe que (2.13) é contínua em R = [a, b]×[a, b], incluindo a diagonal L = (x, y) ∈ R : x = y:

G1(y, y) = cφ1(y)φ2(y) = G2(y, y) , y ∈ [a, b] .

Mas exigir continuidade da derivada ∂G(x, y)/∂x em mathcalL implica, como veremos, que afunção de Green (2.13) é trivial. Para xar o valor da constante c = c(y), vamos adotar a condição

∆G(y) =−1

p(y)(2.15)

COMPLEMENTOS 23

onde ∆G(y) denota o salto da derivada ∂G/∂x da função de Green G em (x, y) ao se aproximarde L horizontalmente de ambos os lados.Temos

∆G(y) =∂G

∂x(x, y)

∣∣∣∣x=y+0

− ∂G

∂x(x, y)

∣∣∣∣x=y−0

=∂G2

∂x(y, y)− ∂G1

∂x(y, y)

= c (φ1(y)φ′2(y)− φ′1(y)φ2(y))

= cW (φ1, φ2; y) .

Como a função Wronskiana W (φ1, φ2; y) de φ1 e φ2 para algum ponto y é diferente de 0 (pois docontrário seriam L. D. e, portanto, proporcionais: φ2 = kφ1, em contradição com λ = 0 não serautovalor), obtemos de (2.15) que

c(y) =−1

p(y)W (φ1, φ2; y).

Vamos mostrar que pW = −c−1 é, de fato, constante em y. Diferenciando esta quantidadejuntamente com L0(φi) = − (p(y)φ′i)

′ + q(y)φi = 0, i = 1, 2, temos

(pW )′ = p′W + pW ′

= p′ (φ1φ′2 − φ′1φ2) + p (φ1φ

′′2 − φ′′1φ2)

= − (pφ′′1 + p′φ′1)φ2 + φ1 (pφ′′2 + p′φ′2)

= −qφ1φ2 + qφ1φ2 = 0 .

Logo c(y) assume o mesmo valor para todo y ∈ [a, b], o qual xamos igual a

c =−1

p(a)W (φ1, φ2; a). (2.16)

Substituindo c em (2.13), resulta

G(x, y) =

φ1(x)φ2(y)

−p(a)W (φ1, φ2; a)se a ≤ x ≤ y

φ1(y)φ2(x)

−p(a)W (φ1, φ2; a)se y ≤ x ≤ b

(2.17)

de onde se conclui que G é simétrica:

G(x, y) = G(y, x) . (2.18)

Em vista de (2.18), (2.15) e (2.16), o salto ∆G(x) da derivada da função de Green quando nosaproximamos verticalmente de L é

∆G(x) =∂G

∂x(x, y)

∣∣∣∣y=x−0

− ∂G

∂x(x, y)

∣∣∣∣y=x+0

=−1

p(x). (2.19)

Passemos à segunda parte.

COMPLEMENTOS 24

b. Vericação de que (2.12) resolve ( 2.10) e (2.11). Lembremos que as condições de fronteira(2.11) já estão asseguradas por (2.14). Temos

u(x) =

∫ x

a

G2(x, y)f(y)dy +

∫ b

x

G1(x, y)f(y)dy . (2.20)

Diferenciando esta expressão, usando o teorema fundamental do cálculo,

u′(x) =

∫ x

a

∂G2

∂x(x, y)f(y)dy +G2(x, x)f(x) +

∫ b

x

∂G1

∂x(x, y)f(y)dy −G1(x, x)f(x)

=

∫ x

a

∂G2

∂x(x, y)f(y)dy +

∫ b

x

∂G1

∂x(x, y)f(y)dy

pela continuidade de G(x, y) e f(x). Diferenciando novamente,

u′′(x) =

∫ x

a

∂2G2

∂x2(x, y)f(y)dy +

∂G2

∂x(x, x)f(x) +

∫ b

x

∂2G1

∂x2(x, y)f(y)dy − ∂G1

∂x(x, x)f(x) .

Multiplicando u, u′ e u′′ respectivamente por q(x), −p′(x) e −p(x), somando em seguida os termos,resulta da denição (2.2) e (2.19)

L0[u](x) =

∫ x

a

L0[G2y](x)f(y)dy +

∫ b

x

L0[G1y](x)f(y)dy − p(x)∆G(x)f(x)

= f(x) . (2.21)

A solução das equações (2.10) e (2.11) é necessariamente da forma (2.12), contanto que a soluçãodo problema seja única. Suponha, por contradição, que existam duas soluções u1 e u2 de (2.10) e(2.11). Segue da linearidade das equações que u = u1 − u2 satisfaz L0[u] = 0 e F1[u] = F2[u] = 0

que, pela hipótese de λ = 0 não ser autovalor, tem apenas a solução trivial: u ≡ 0, provando aunicidade de (2.12) e concluindo a demonstração.

Observação 2.9. A demonstração do teorema mostra que a aplicação

f ∈ C [a, b] 7−→ u = G f ∈ C 2[a, b]

onde

G f(x) =

∫ b

a

G(x, y) f(y) dy (2.22)

é o operador integral com núcleo G(x, y), é contínua. Esse fato pode ser demonstrado pelo teorema

do gráco fechado: se o gráco (f,G f), f ∈ C ([a, b]), é fechado em C [a, b] × C 2[a, b], então G

é contínua (na métrica do supremo ou de quadrado integrável). Veremos que a aplicação G é

equicontínua e esse fato irá determinar as propriedades dos autovlores e autofunções do problema

de SturmLiouville.

Exemplo 2.10. Considere a equação

−u′′ = f(x) ,

COMPLEMENTOS 25

em [a, b] com u(a) = u(b) = 0 e f ∈ C ([a, b]). Sabemos que λ = 0 não é um autovalor do problema:

L0[u] = −u′′ = λu, com F1[u] = u(a) = 0 e F2[u] = u(b) = 0, cujos autovalores e autofunções

correspondentes são: λn = n2π2/(b− a)2 e ϕn =√

2 sinnπ(x− a)/(b− a), n ∈ N.Seja φi(x), i = 1, 2, uma solução de L0[φi] satisfazendo Fi(φi) = 0:

φ1(x) = x− aφ2(x) = x− b .

Temos

W (φ1, φ2;x) =

∣∣∣∣∣ x− a x− b1 1

∣∣∣∣∣ = b− a 6= 0 .

A função de Green do problema é dada por (2.17):

G(x, y) =

−(x− a)(y − b)

b− ase a ≤ x ≤ y

−(y − a)(x− b)b− a

se y ≤ x ≤ b

e podemos facilmente vericar que

u(x) =b− xb− a

∫ x

a

(y − a)f(y)dy +x− ab− a

∫ b

x

(b− y)f(y)dy

satisfaz as equações do problema, sendo esta sua única solução.

Exemplo 2.11. Considere a equação

−u′′ − u = f(x) ,

em [0, π] com u(0) = u′(π) = 0. Sabemos que λ = 0 não é um autovalor do problema: L0[u] =

−u′′ − u = 0, com F1[u] = u(0) = 0 e F2[u] = u′(π) = 0. A solução geral da equação homogênea

correspondente e sua derivada

u(x) = A cosx+B sinx

u′(x) = −A sinx+B cosx ,

juntamente com as condições de fronteira: F1[u] = A = 0 e F2[u] = B cos π = −B = 0, fornecem

somente a solução trivial para λ = 0.

Seja φi(x), i = 1, 2, uma solução de L0[φi] satisfazendo Fi[φi] = 0:

φ1(x) = sinx

φ2(x) = cosx .

Temos

W (φ1, φ2;x) =

∣∣∣∣∣ sinx cosx

cosx − sinx

∣∣∣∣∣ = −1 6= 0 .

COMPLEMENTOS 26

A função de Green do problema é dada por (2.17):

G(x, y) =

sinx cos y se 0 ≤ x ≤ y

sin y cosx se y ≤ x ≤ π

e podemos facilmente vericar que

u(x) = cos x

∫ x

0

sin y f(y)dy + sinx

∫ π

x

cos y f(y)dy

satisfaz as equações do problema, sendo esta sua única solução. De fato,

u′(x) = − sinx

∫ x

0

sin y f(y)dy + cosx

∫ π

x

cos y f(y)dy

e

u′′(x) = − cosx

∫ x

0

sin y f(y)dy − sin2 xf(x)− sinx

∫ π

x

cos y f(y)dy − cos2 xf(x)

= −u(x)− f(x) .

2.3. A equação integral do Problema de Sturm-Liouville. Uma consequência desse teoremaé a equivalência entre o problema de Sturm-Liouville (veja Denição 2.1) e a solução de uma equaçãointegral, similar em espírito à equivalência do problema de valor inicial para equações diferenciaisde primeira ordem e a equação integral correspondente. Estendemos, para isso, a denição dooperador integral incluindo o peso ρ:

Gρf(x) =

∫ b

a

G(x, y) f(y) ρ(x) dy (2.23)

de modo que G1 = G , dado por (2.22), seja um caso particular com ρ ≡ 1.A aplicação

f ∈ CL2(ρ)[a, b] 7−→ u = Gρf ∈ C 2L2(ρ)[a, b]

atua sobre o espaço métrico(CL2(ρ)[a, b], d2

)das funções f : [a, b] −→ C contínuas de quadrado

integrável em relação ao peso ρ(x):∫ b

a

|f(x)|2 ρ(x)dx := ‖f‖22,ρ <∞ ,

munido de um produto interno com peso ρ(x):

〈f, g〉ρ :=

∫ b

a

f(x)g(x)ρ(x)dx ,

e cuja norma ‖f‖22,ρ = 〈f, f〉ρ dene a métrica d2(f, g) = ‖f − g‖2,ρ.

Proposição 2.12. u ∈ C 2[a, b] é solução do problema de SturmLiouville (2.5) e (2.6) se, e

somente se, satisfaz a equação integral

u(x)− λGρu(x) = g(x) (2.24)

com g(x) = G f(x).

COMPLEMENTOS 27

Prova. Pelo Teorema 2.8, u é solução do problema L0[u] = λρu + f com F1[u] = F2[u] = 0 se, esomente se, u satisfaz

u(x) =

∫ b

a

G(x, y) (λρ(y)u(y) + f(y)) dy ,

concluindo a prova da proposição.

Corolário 2.13. (a) λ é autovalor do problema de SturmLiouville (2.5) e (2.6) se, e somente se,

1/λ é autovalor de Gρ. (b) u é autofunção do problema de SturmLiouville correspondente a λ se,

e somente se, u é autofunção de Gρ correspondente a 1/λ.

Prova. Segue da proposição anterior com f = 0, juntamente com a Denição 2.1, que u é autofunçãodo problema de SturmLiouville correspondente ao autovalor λ se, e somente se (faça g = G f = 0

em (2.24)),

Gρu(x) =1

λu(x) ,

concluindo a demonstração.

Sendo o núcleo G(x, y) do operador Gρ real e simétrico: G(x, y) = G(y, x), (2.23) dene umoperador Hermitiano:

〈Gρf, g〉ρ = 〈f,Gρg〉ρ , ∀ f, g ∈ CL2(ρ)[a, b] .

De fato, ∫ b

a

Gρf(x)g(x)ρ(x)dx =

∫ b

a

(∫ b

a

G(x, y)f(y)ρ(y)dy

)g(x)ρ(x)dx

=

∫ b

a

f(y)

(∫ b

a

G(y, x)g(x)ρ(x)dx

)ρ(y)dy

=

∫ b

a

f(y)Gρg(y)ρ(y)dx

onde na segunda igualdade usamos a simetria de G(x, y) e o teorema de Fubini para trocar a ordemde integração. Note que o integrando é contínuo em [a, b]× [a, b] e, portanto, a integral é uniformee absolutamente convergente.

Corolário 2.14. (a) Todo autovalor λ do problema de SturmLiouville é real e tem uma autofunção

correspondente real.

Prova. Se u é uma solução não trivial de L0[u] = λρu com F1[u] = F2[u] = 0, então u é soluçãonão trivial de L0(u) = λρu com F1[u] = F2[u] = 0. Pelo Corolário 2.13, temos

Gρu =1

λu , Gρu =

1

λu

e

0 = 〈Gρu, u〉ρ − 〈u,Gρu〉ρ =

(1

λ− 1

λ

)〈u, u〉ρ =

λ− λ|λ|2

‖u‖22,ρ

implica que λ = λ. A segunda parte segue da Proposição 2.4.

COMPLEMENTOS 28

Solução do problema de SturmLiouville e suas propriedades. Mais adiante iremos mostrarque Gρ, denido em C [a, b] ou em CL2(ρ)[a, b], é um operador compacto e estudaremos as propri-edades espectrais destes operadores. A aplicação da teoria espectral de operadores compactos aoproblema de SturmLiouville produz o seguinte

Teorema 2.15. Considere o problema de SturmLiouville

Lλ[u] = − (p(x)u′)′+ (q(x)− λρ(x))u = f(x) (2.25)

e

F1[u] = F2[u] = 0 (2.26)

onde Lλ, F1 e F2 satisfazem as condições adotadas em (2.1)-(2.3). Então,

(a) Os autovalores do problema, isto é, λ's para os quais uma solução u 6= 0 de Lλ[u] = 0,

juntamente com (2.26), exista, formam uma sequencia innita crescente (λn)n≥1 de números

reais tais que

limn→∞

λn =∞ (2.27)

e ∑n≥1

1

λn<∞ (2.28)

(i. e. Gρ é compacto da classe traço).

(b) Cada autovalor λn tem multiplicidade 1, isto é, o espaço vetorial N (Lλ) invariante pela

ação de Lλ tem dimensão 1; xando uma autofunção real ϕn tal que

‖ϕn‖22,ρ =

∫ b

a

ϕn(x)2ρ(x)dx = 1 ,

então qualquer outra autofunção correspondente a λn é multipla de ϕn.

(c) A sequência (ϕn)n≥1 forma uma base ortonormal do espaço pré-Hilbertiano CL2(ρ)[a, b].

(d) Para toda função u ∈ C 2[a, b] tal que F1[u] = F2[u] = 0, temos

u(x) =∞∑n=1

cnϕn(x)

onde os cn's são coecientes de Fourier em relação a base ortonormal:

cn = 〈u, ϕn〉ρ =

∫ b

a

u(x)ϕn(x)ρ(x)dx ,

sendo a série uniformemente e absolutamente convergente em [a, b].

(e) Seja λ 6= λn para todo n ∈ N e f ∈ C [a, b]. O problema de SturmLiouville (2.25) e (2.26)

tem uma, e só uma solução u dada por

u(x) =∑n≥1

〈f, ϕn〉λn − λ

ϕn(x) ,

sendo a série uniformemente e absolutamente convergente em [a, b].

COMPLEMENTOS 29

(f) Se λ = λm para algum m ∈ N, dado f ∈ C [a, b], o problema de SturmLiouville (2.25) e

(2.26) tem solução se, e somente se, 〈f, ϕm〉 = 0, isto é,∫ b

a

f(x)ϕm(x)dx = 0 .

Neste caso a solução u(x) é como no ítem (e), sendo arbitrária a componente cm de ϕm.

Prova de (a). Provamos (2.27) na Proposição 1.23 para o caso particular (1.35) e (1.36). PeloCorolário 2.13 e o fato de Gρ ser compacto, os autovalores 1/λn de Gρ só podem acumular em 0.Logo (2.27) para o problema de SturmLiouville (2.25) e (2.26) segue de limn→∞(1/λn) = 0.Antes de provar que 1/λn tende a 0 de forma somável, vamos primeiramente mostrar que∑

n≥1

1/λ2n < ∞. Para isso, iremos aplicar a desigualdade de Bessel (como nas séries de Fourier

- consulte a Sec. 3.5 de Análise de Fourier e equações diferenciais parciais, Djairo G. de Figuei-redo) à função

y 7−→ G(x, y) .

O nésimo coeciente de Fourier desta função, mantendo x ∈ (a, b) xo, é

cn = 〈G(x, ·), ϕn〉ρ

=

∫ b

a

G(x, y)ϕn(y)ρ(y)dy = (Gρϕn) (x) .

Portanto ∑n≥1

|cn|2 ≤∫ b

a

G(x, y)2ρ(y)dy . (2.29)

Como Gρϕn = (1/λn)ϕn, pelo Corolário 2.13, reescrevemos (2.29) como∑n≥1

1

λ2n

ϕn(x)2 ≤∫ b

a

G(x, y)2ρ(y)dy (2.30)

e integrando na variável x, tendo em conta a normalização de ϕn, obtemos∑n≥1

1

λ2n

≤∫ b

a

∫ b

a

G(x, y)2ρ(x)dxρ(y)dy <∞

por G(x, y) ser uniformemente contínua em [a, b]× [a, b].Equação (2.28) é consequência do Teorema de Mercer (consulte Methods of Mathematical Phy-

sics por R. Courant e D. Hilbert, págs. 130-140):

G(x, y) =∑n≥1

1

λnϕn(x)ϕn(y) (2.31)

sendo a soma convergente uniformemente e absolutamente em [a, b], que veremos mais adiante.Integrando esta identidade em x e y, juntamente com a normalização dos ϕn's, temos∑

n≥1

1

λn=

∫ b

a

∫ b

a

G(x, y)ρ(x)dxρ(y)dy <∞ .

COMPLEMENTOS 30

Prova de (b). Suponhamos que existam duas soluções u1(x) e u2(x) L. I. de Lλ[u] = 0 comF1[u] = F2[u] = 0 . Considere a função Wrosnskiana

W (u1, u2;x) =

∣∣∣∣∣ u1(x) u2(x)

u′1(x) u′2(x)

∣∣∣∣∣ .Como u1 e u2 são L. I. ,W 6= 0. Como (pW )′ = 0, segue que p(x)W (u1, u2;x) = p(a)W (u1, u2; a) 6=0. Porém, o sistema

F1[u1] = αu1(a) + βu′1(a) = 0

F1[u2] = αu2(a) + βu′2(a) = 0

para (α, β) tem solução não trivial (α, β) 6= (0, 0) devido a condição (2.4). Isto implica que(u1(a) u2(a)

u′1(a) u′2(a)

)(α

β

)=

(0

0

)tem solução não identicamente nula se, e somente se, W (u1, u2; a) = 0, em contradição com asuposição de u1 e u2 serem L. I.. Logo N(Lλ) = 1.

Prova de (c). A prova é análoga à prova do Teorema da base no contexto de séries de Fourier(consulte a Sec. 3.11 e veja Teorema 3.9 de Análise de Fourier e equações diferenciais parciais,Djairo G. de Figueiredo). Um sistema ortonormal (ϕn)n≥1 é dito completo se cada função g :

[a, b] −→ R da classe C[a, b] pode ser aproximada por uma série nitan∑k=1

ckϕk(x), em média

quadrática: ∥∥∥∥∥g −n∑k=1

ckϕk

∥∥∥∥∥2

2,ρ

=

∫ b

a

(g(x)−

n∑k=1

ckϕk(x)

)2

ρ(x)dx < ε

com precisão ε > 0 arbitráriamente pequena, tomando n sucientemente grande. Para um sistema

ortonormal completo a desigualdade de Bessel:

∥∥∥∥∥g −∞∑k=1

ckϕk

∥∥∥∥∥2

2,ρ

≥ 0 torna-se uma igualdade e,

consequentemente, para qualquer g ∈ C[a, b] a identidade de Parseval:∑n≥1

c2n = ‖g‖2

2,ρ ,

onde os cn = 〈g, ϕn〉ρ são os coecientes de Fourier de g, é satisfeita.

COMPLEMENTOS 31

Prova de (d). Aplicando o Teorema 2.8 ao problema L0[u] = h(x) com F1[u] = F2[u] = 0, temos

u(x) = (G h) (x)

=

∫ b

a

G(x, y)h(y)dy

=

∫ b

a

G(x, y)h(y)

ρ(y)ρ(y)dy = (Gρh/ρ) (x) .

Se h/ρ ∈ CL2(ρ)[a, b], então pelo ítem (c),

h(x)

ρ(x)=

∑n≥1

cnϕn(x)

cn = 〈h/ρ, ϕn〉ρ (2.32)

e, consequentemente,

u(x) = (Gρh/ρ) (x) =∑n≥1

cn1

λnϕn(x) .

Vamos mostrar que, se h/ρ ∈ C [a, b], então a série para u(x) é uniformemente e absolutamenteconvergente em [a, b]. Note que u = (Gρh/ρ) é da classe C 2[a, b] se h/ρ ∈ C [a, b]. Pela desigualdadede Schwarz,

∑n≥1

∣∣∣∣cn 1

λnϕn(x)

∣∣∣∣ ≤(∑n≥1

|cn|2)1/2(∑

n≥1

1

λ2n

ϕn(x)2

)1/2

≤ ‖h/ρ‖2,ρ

(∫ b

a

G(x, y)2ρ(y)dy

)1/2

≤ ‖h/ρ‖2,ρ

√b− aM

onde usamos a identidade de Parseval:∑

n≥1 |cn|2 = ‖h/ρ‖2

2,ρ, a desigualdade de Bessel (2.30) eM2 = maxx,y∈[a,b] G(x, y)2ρ(y).

Prova de (e). Pela Proposição 2.12, Lλ[u] = L0[u] − λρ(x)u = f(x), juntamente com F1[u] =

F2[u] = 0, é equivalente a equação integral

u− λGρu = Gρf/ρ . (2.33)

Tomando o produto interno desta equação, em relação a ρ, com a né sima autofunção ϕn, resulta

〈u, ϕn〉ρ − λ〈Gρu, ϕn〉ρ = 〈Gρf/ρ, ϕn〉ρ

e, como Gρ é um operador autoadjunto e Gρϕn = 1/λnϕn, temos

〈u, ϕn〉ρ −λ

λn〈u, ϕn〉ρ =

1

λn〈f/ρ, ϕn〉ρ . (2.34)

Resolvendo para 〈u, ϕn〉ρ, obtemos

〈u, ϕn〉ρ =1

λn − λ〈f/ρ, ϕn〉ρ =

1

λn − λ〈f, ϕn〉 (2.35)

COMPLEMENTOS 32

de onde se conclui que a solução de (2.33) é dada pela série

u(x) =∑n≥1

〈f, ϕn〉λn − λ

ϕn(x) (2.36)

convergente em média quadrática e, pelo mesmo argumento utilizado no ítem anterior, uniforme-mente e absolutamente convergente em [a, b].

Prova de (f). Supondo λ = λm, para algum m ∈ N, equação (2.34) com n = m implica

0 = λm

(〈u, ϕm〉ρ −

λmλm〈u, ϕm〉ρ

)= 〈f/ρ, ϕm〉ρ = 〈f, ϕm〉 .

Somando a equação (2.35) sobre n ∈ N\m, temos

u(x) =∑

n≥1,n 6=m

〈f, ϕn〉λn − λm

ϕn(x) , (2.37)

onde a convergência da série já foi discutida no ítem anterior. Portanto, uma solução geral doproblema de SturmLiouville não homogêneo quando λ = λm é dada por

u(x) =∑

n≥1,n 6=m

〈f, ϕn〉λn − λm

ϕn(x) + cmϕm(x) (2.38)

com cm ∈ R uma constante arbitrária. Aplicando o operador de SturmLiouville 1/ρLλ − λm àsolução u(x), obtemos

1

ρ(x)Lλ[u]− λmu =

∑n≥1,n 6=m

〈f, ϕn〉λn − λm

(λn − λm)ϕn(x)

=∑

n≥1,n 6=m

〈f, ϕn〉ϕn(x)

=∑n≥1

〈f, ϕn〉ϕn(x)

=∑n≥1

〈f/ρ, ϕn〉ρϕn(x) =f(x)

ρ(x)

onde usamos a ortogonalidade 〈f, ϕm〉 = 0.

2.4. Redução de uma forma quadrática Hermiteana aos eixos principais . Seja A = A∗

uma matriz n × n Hermiteana, onde A∗ é a matriz adjunta denida por 〈y, Ax〉 = 〈A∗y,x〉 paratodo x, y ∈ Cn. Considere a base e1, e2, . . . , en de Cn ortonormal: 〈ei, ej〉 = δij que diagonalizaa matriz A:

E∗AE = Λ

= diag (λi, i = 1, . . . , n) ,

COMPLEMENTOS 33

onde λ1, λ2, . . . , λn enumera os autovalores de A contando multiplicidades e E = [e1e2 · · · en] é amatriz n× n unitária: E−1 = E∗, com os autovetores nas correspondentes colunas.Reduzimos a forma quadrática 〈y, Ax〉 aos eixos principais

〈y, Ax〉 =n∑i=1

λiyixi

=n∑i=1

λi〈y, ei〉〈ei,x〉

onde xi = 〈ei,x〉 e yi = 〈y, ei〉 = 〈ei,y〉 são as componentes do vetor x e y na base. Segueque a matriz A pode ser decomposta em termos de seus elementos espectrais: σ = λ1, λ2, . . . , λno conjunto de autovalores ou espectro e P1, P2, . . . , Pn a coleção de projetores nas direções dosautovetores correspondentes: Pi = 〈·, ei〉〈ei, ·〉 = eie

Ti :

A =n∑i=1

λi〈·, ei〉〈ei, ·〉

=n∑i=1

λiPi .

Em geral, se f é um polinômio ou uma função que pode ser expressa por uma série de potências,temos

f(A) =n∑i=1

f(λi)〈·, ei〉〈ei, ·〉

e, em particular,

I =n∑i=1

〈·, ei〉〈ei, ·〉

é a decomposição espectral da identidade. Entre todas as notações do projetor Pi preferimos〈·, ei〉〈ei, ·〉 por ser mais simples de estender para o espaço vetorial de funções.Considere o operador integral Gρ dado por (2.23). Do Teorema 2.15 extraímos que as autofunções

ϕn(x), n = 1, 2, . . ., associadas aos autovalores 1/λn's formam uma base ortonormal para o espaçovetorial CL2(ρ)[a, b]. Seja f , g ∈ CL2(ρ)[a, b], isto é, as normas ‖f‖2,ρ, ‖g‖2,ρ são ambas nitas. Sejamfn = 〈f, ϕn〉ρ e gn = 〈g, ϕn〉ρ as componentes de f e g na direção do nésima autofunção ϕn(x).Analogamente, reduzimos a forma quadrática 〈g,Gρf〉ρ aos eixos principais

〈g,Gρf〉ρ =∑n≥1

1

λngnfn

=∑n≥1

1

λn〈g, ϕn〉ρ〈ϕn, f〉ρ

de onde segue a decomposição espectral do operador integral

Gρ = L−10 ρ =

∑n≥1

1

λn〈·, ϕn〉ρ〈ϕn, ·〉ρ . (2.39)

COMPLEMENTOS 34

Em termos de seu núcleo integral G(x, y), devido a

〈g,Gρf〉ρ =

∫ b

a

g(x) (Gρf) (x)ρ(x)dx

=

∫ b

a

∫ b

a

g(x)G(x, y)f(y)ρ(y)dyρ(x)dx ,

temos

G(x, y) =∑n≥1

1

λnϕn(x)ϕn(y) (2.40)

(compare com (2.31)), sendo que o traço de Gρ,

TrGρ =

∫ b

a

G(x, x)ρ(x)dx

=

∫ b

a

∑n≥1

1

λnϕn(x)2ρ(x)dx

=∑n≥1

1

λn

∫ b

a

ϕn(x)2ρ(x)dx

=∑n≥1

1

λn<∞

por G(x, x)ρ(x) ser uma função uniformemente contínua em [a, b]. A troca da integral com osomatório na terceira igualdade é justicada pela convergência uniforme da série (2.40), devido aoseguinte resultado

Teorema 2.16 (T. Mercer (1909)). Seja G(x, y) o núcleo do operador integral Gρ dado por (2.23).

Suponha G(x, y) simétrico e positivo denido, isto é, todos autovalores µn = 1/λn, n ≥ 1, positivos:

1/λn > 0 (com 0 o único ponto de acumulação por Gρ ser compacto). Então a série (2.40) que o

representa converge uniformemente e absolutamente em [a, b]× [a, b].

Prova. Armamos inicialmente que G(x, x) ≥ 0, ∀x ∈ [a, b]. Caso contrário, se G(x0, x0) < 0 emalgum ponto x0 ∈ (a, b), então G(x, x) < 0 em uma vizinhança Ix0 = (x0 − δ, x0 + δ), δ > 0, porcontinuidade, que contradiz o fato de G(x, y) ser positiva denida: 〈χ,Gρχ〉ρ ≥ 0 ao escolhermosuma função χ(x) = 1 para x ∈ Ix0 e χ(x) = 0 para x ∈ [a, b] \Ix0 .Observamos, além disso, que a função

H(x, y) = G(x, y)−n∑k=1

1

λkϕk(x)ϕk(y)

dene um núcleo de um operador integral Hρ:

Hρf(x) =

∫ b

a

H(x, y)f(y)ρ(y)dy

que é simétrico e positivo denido, para todo n ∈ N. Hρ é um operador denido no complementoortogonal CL2(ρ)[a, b]\Mk ao subespaço vetorial Mk gerado pelas autofunções ϕk(x), k = 1, . . . , nde Gρ, ortonormais com respeito ao produto interno 〈·, ·〉ρ com peso ρ(x). Como os autovalores

COMPLEMENTOS 35

µk = 1/λk, k ∈ N, de Gρ são todos positivos os autovalores µk = 1/λk, k > n, de Hρ são igualmentepositivos.Segue destas observações que

H(x, x) = G(x, x)−n∑k=1

1

λkϕk(x)2 ≥ 0 , ∀x ∈ [a, b]

de onde se conclui que o somatórion∑k=1

1

λkϕk(x)2 ≤ max

x∈[a,b]G(x, x) <∞

é nito uniformemente em [a, b], para todo n ∈ N. Pela desigualdade de Schwarz, temos(n∑k=1

ϕk(x)√λk· ϕk(y)√

λk

)2

(n∑k=1

ϕk(x)2

λk

(n∑k=1

ϕk(y)2

λk

)sendo ambas as somas do lado direito uniformememente nitas em [a, b] × [a, b]. Segue destadesigualdade que a série (2.40) converge absolutamente e uniformemente em [a, b]× [a, b].

Observação 2.17. A convergência uniforme continua sendo válida se Gρ tiver um número nito

de autovalores negativos e esse é o caso dos operadores de SturmLiouville.

Segue da decomposição (2.39), que(1

ρL0 − λρ

)−1

= (L0 − λρ)−1 ρ =∑n≥1

1

λn − λ〈·, ϕn〉ρ〈ϕn, ·〉ρ (2.41)

(compare com 2.36).As decomposições espectrais do operadores (2.39) e (2.41) sugerem a seguinte denição de G que

torma explícita a construção da função de Green, agora para o problema (2.25) e (2.26) com λ 6= 0:

Denição 2.18. Considere λ 6= λn para todo n ≥ 1. A função G : [a, b]× [a, b] −→ R contínua é o

núcleo integral da solução de L0[u]−λρ(x)u = f(x), com condições de contorno F1[u] = F2[u] = 0:

u(x) =

∫ b

a

G(x, y)f(y)dy ,

se, e somente se,

(1) Para cada y ∈ (a, b), G(x, y) = Gy(x) é contínua em x, satisfaz F1[Gy] = F2[Gy] = 0;

(2) Se x 6= y, Gy(x) é da classe C 2[a, b] em x e

limxy

∂G

∂x(x, y)− lim

xy

∂G

∂x(x, y) =

−1

p(y);

(3) Se x 6= y, Gy(x) satisfaz1

ρ(x)L0[Gy]− λGy = 0.

Suponhamos que λ1 seja um autovalor do problema L0[u]−λρ(x)u = 0, juntamente com F1[u] =

F2[u] = 0 e f/ρ ∈ C [a, b] seja ortogonal à autofunção ϕ1(x) correspondente: 〈f/ρ, ϕ1〉ρ = 0. Então,

COMPLEMENTOS 36

por (2.37),

u(x) =

(1

ρL0 − λ1

)−1f

ρ(x)

=∑n≥2

〈f/ρ, ϕn〉ρλn − λ1

ϕn(x)

=

∫ b

a

∑n≥2

ϕn(x)ϕn(y)

λn − λ1

f(y)

ρ(y)ρ(y)dy

=

∫ b

a

G(x, y)f(y)

ρ(y)ρ(y)dy (2.42)

e1

ρ(x)L0[u]− λ1u =

∫ b

a

∑n≥2

ϕn(x)ϕn(y)f(y)

ρ(y)ρ(y)dy

de onde se conclui que

1

ρ(x)L0[Gy]− λ1Gy =

∑n≥2

ϕn(x)ϕn(y) = −ϕ1(x)ϕ1(y) , x 6= y (2.43)

devido a completeza do sistema ortogonal (ϕn(x))n≥1:∑n≥1

ϕn(x)ϕn(y) = δ(x− y) , (2.44)

isto é, a função delta de Dirac é o núcleo integral do operador identidade (formalmente)

(I f/ρ) (x) =

∫ b

a

δ(x− y)f(y)

ρ(y)ρ(y)dy

=

∫ b

a

∑n≥1

ϕn(x)ϕn(y)f(y)

ρ(y)ρ(y)dy

=∑n≥1

〈f/ρ, ϕn〉ρ ϕn(x) = f/ρ(x) . (2.45)

Observação 2.19. Note que o núcleo integral denido em (2.42)

G(x, y) =∑n≥2

ϕn(x)ϕn(y)

λn − λ1

(2.46)

é simétrico com respeito a troca das variáveis x e y:

G(x, y) = G(y, x) . (2.47)

Note que a série (2.44) é uniformemente e absolutamente convergente em toda região fechada e

limitada (compacta) em R\L = (x, y) ∈ [a, b]× [a, b] : x 6= y. A troca entre a integral e soma

na equação (2.45]) é, portanto, justicada com exceção do ponto y = x.

COMPLEMENTOS 37

Teorema 2.20. Suponha que L0[u] − λ1ρ(x)u = 0, juntamente com F1[u] = F2[u] = 0, tenha

solução não identicamente nula ϕ1(x) tal que ‖ϕ1‖2,ρ = 1. Existe uma função contínua

G : [a, b]× [a, b] −→ R

tal que, dado f/ρ ∈ C [a, b], u ∈ C 2 [a, b] é solução de Lλ1 [u] = f(x), com F1[u] = F2[u] = 0 se, e

somente se, 〈ϕ1, f〉 = 0 e

u(x) =

∫ b

a

G(x, y)f(y)dy , (2.48)

onde G é chamada função de Green generalizada, é a única solução do problema no complemento

ortogonal à direção ϕ1(x).

Prova. (=⇒) 〈ϕ1, f〉 = 0 é uma condição necessária: suponha ϕ1(x) e u(x) soluções do problemade SturmLiouville homogêneo e não homogêneo, respectivamente. Então, integrando em [a, b] oproduto de ϕ1(x) pela equação (2.25) (sem o peso ρ(x)):

〈ϕ1, (L0[u]− λρu)〉 = 〈ϕ1, f〉 . (2.49)

Mas L0, juntamente com 2.26, é auto adjunto

〈ϕ1, (L0[u]− λρu)〉 = 〈(L0[ϕ1]− λρϕ1), u〉 = 0

de onde se conclui que o lado direito de (2.49) é nulo, concluindo a asserção.Prova. (⇐=) Construção da função de Green generalizada (inversa do operador diferencial nocomplemento ortogonal à direção ϕ1(x)): Seja φi = φi(x; y), i = 1, 2, uma solução real nãonula de

1

ρ(x)L0[φi]− λ1φi = −ϕ1(x)ϕ1(y) , x 6= y (2.50)

satisfazendo Fi[φi] = 0.Procuramos a função G da forma

G(x, y) =

φ1(x; y) se a ≤ x < y

φ2(x; y) se y ≤ x ≤ b(2.51)

que é contínua em x = y:G(y + 0, y) = G(y − 0, y) (2.52)

Primeiro passo. A condiçãoφ1(y; y) = φ2(y; y)

determina uma das duas constantes arbitrárias, uma de cada solução φi(x; y). Note que φi(x; y)

satisfaz uma equação não homogênea e a solução geral é dada por uma solução particular da nãohomogênea mas a solução geral da homogênea. Uma constante desta solução geral é xada pelacondição de fronteira Fi[φi] = 0.Vamos mostrar que ∂G/∂x(x, y) é descontínua em x = y, sem ter que impôr esta condição para

se xar a constante que ainda resta arbitrária. Armamos que

∂G

∂x(y + 0, y)− ∂G

∂x(y − 0, y) =

−1

p(y). (2.53)

COMPLEMENTOS 38

Usando (2.43), temos

ϕ1(x)(L0[Gy](x)− λ1ρ(x)Gy(x))− Gy(x)(L0[ϕ1](x)− λ1ρ(x)ϕ1(x)) = −ρ(x)ϕ1(x)2ϕ1(y) (2.54)

onde o segundo termo do lado esquerdo é nulo: L0[ϕ1](x) − λ1ρ(x)ϕ1(x) = 0. O lado esquerdodesta equação pode, por outro lado, ser escrito como uma derivada total:

ϕ1(x)L0[Gy](x)− Gy(x)L0[ϕ1](x) = − d

dx

(p(x)

(ϕ1(x)G′y(x)− ϕ′1(x)Gy(x)

))(2.55)

Integrando sobre [a, b] a equação (2.54), juntamente com (2.55), ‖ϕ1‖2,ρ = 1 e as condições de

fronteira (2.26) satisfeitas por ϕ1 e Gy, resulta

p(x)ϕ1(x)G′y(x)∣∣∣ya

+ p(x)ϕ1(x)G′y(x)∣∣∣by− p(x)ϕ′1(x)Gy(x)

∣∣∣ba

= ϕ1(y)

e, consequentemente,

p(x)W(ϕ1, Gy;x

)∣∣∣ba

+ p(y)ϕ1(y)G′y(y − 0)− p(y)ϕ1(y)G′y(y + 0) = ϕ1(y) ,

de onde se conclui (2.53). Note que usamos apenas as propriedades até agora deduzidas para Gy(x).A equação (2.53) é necessária para se mostrar que (2.48) satisfaz (2.25).Segundo passo. Para determinar a constante restante, impomos a ortogonalidade: 〈ϕ1, Gy〉ρ = 0.Juntamente a isso, vamos mostrar que a ortogonalidade da função de Green generalizada estáintimamente relacionada com sua simétria pela troca de x por y (veja comentário na Observação2.19):

G(x, y) = G(y, x) . (2.56)

Sejam y e z dois pontos quaisquer distintos no intervalo (a, b) e escreva Gy(x) = G(x, y) eGz(x) = G(x, z). Usando

0 = Gy(x)Lλ[Gz](x)− Gz(x)Lλ[Gy](x) = − d

dx

(p(x)

(Gy(x)G′z(x)− G′y(x)Gz(x)

))(2.57)

e integrando sobre [a, b], pela descontinuidade de G′y e G′z em x = y e x = z, respectivamente,temos

0 = p(x)Gy(x)G′z(x)∣∣∣za

+ p(x)Gy(x)∣∣∣bz− p(x)G′y(x)Gz(x)

∣∣∣ya− p(x)G′y(x)Gz(x)

∣∣∣by

= p(x)W(Gy, Gz;x

)∣∣∣ba

+ p(z)G(z, y)(G′z(z − 0)− G′z(z + 0)

)−p(y)

(G′y(y − 0)− G′y(y + 0)

)G(y, z)

= p(z)G(z, y) (1/p(z))− p(y) (1/p(y)) G(y, z)

= G(z, y)− G(y, z)

demonstrando (2.56).

COMPLEMENTOS 39

Por outro lado, por (2.57),

0 = 〈Gy,1

ρLλ[Gz]〉ρ − 〈Gz,

1

ρLλ[Gy]〉ρ

= −ϕ1(z)〈Gy, ϕ1〉ρ + ϕ1(y)〈Gz, ϕ1〉ρ

de onde se conclui que,〈Gy, ϕ1〉ρ = 0 , ∀y ∈ (a, b) . (2.58)

A condição de ortogonalidade (2.58), juntamente com a continuidade (2.52) de G(x, y) em x = y,garantem a simetria da função de Green e determinam ambas constantes.Terceiro passo. Vericação de que (2.48) resolve (2.25) com λ = λ1 e (2.26): Vamos mostrar que(2.48) com G(x, y) dado por (2.51):

u(x) =

∫ x

a

φ2(x; y)f(y)dy +

∫ b

x

φ1(x; y)f(y)dy (2.59)

satisfaz Lλ1 [u] = f e F1[u] = F2[u] = 0. Consulte as equações (2.20)-(2.21) para a dedução deexpressões análogas.Cada termo de (2.59) depende da variável x através da função φi(x; y) e dos extremos do intervalo

de integração. Derivando (2.59) em relação a x, temos

u′(x) =

∫ x

a

∂φ2

∂x(x; y)f(y)dy +

∫ b

x

∂φ1

∂x(x; y)f(y)dy + (φ2(x;x− 0)− φ1(x;x+ 0))f(x)

=

∫ x

a

∂φ2

∂x(x; y)f(y)dy +

∫ b

x

∂φ1

∂x(x; y)f(y)dy ,

devido a continuidade de G(x, y) em x = y. Derivando (2.59) mais uma vez em relação a x, temos

u′′(x) =

∫ x

a

∂2φ2

∂x2(x; y)f(y)dy +

∫ b

x

∂2φ1

∂x2(x; y)f(y)dy +

(∂φ2

∂x(x;x− 0)− ∂φ1

∂x(x;x+ 0)

)f(x)

=

∫ x

a

∂2φ2

∂x2(x; y)f(y)dy +

∫ b

x

∂2φ1

∂x2(x; y)f(y)dy − 1

p(x)f(x)

pela simetria G(x, y) = G(y, x) e (2.53). Segue destas expressões, juntamente com (2.25) e (2.50),que

Lλ1 [u] =

∫ x

a

Lλ1 [φ2](x; y)f(y)dy +

∫ b

x

Lλ1 [φ1](x; y)f(y)dy + f(x)

= −ρ(x)ϕ1(x)

(∫ x

a

ϕ1(y)f(y)dy +

∫ b

x

ϕ1(y)f(y)dy

)+ f(x)

= f(x) ,

pela ortogonalidade 〈ϕ1, f〉 =

∫ b

a

ϕ1(y)f(y)dy = 0, e F1[u] = F2[u] = 0 devido a Fi[φi] = 0, i = 1 e

2, e continuidade de G(x, y) em x = y, concluindo a demonstração do teorema.

COMPLEMENTOS 40

Exemplo 2.21. Considere a equação

− u′′ = f(x) , em [0, 1] (2.60)

com

u(0) = 0 , u(1)− u′(1) = 0 . (2.61)

A solução geral da equação homogênea: u(x) = a+ bx, juntamente com a condição (2.61) implica

que ϕ0(x) =√

3x é uma autofunção (normalizada) do problema, associada ao autovalor λ = 0.

Neste caso, a solução de (2.60) requer a função de Green no sentido generalizado, isto é, vamos

inverter o operador L0[u] = −u′′, com F1[u] = F2[u] = 0 dado por (2.61), no complemento ortogonal

à direção ϕ0(x) =√

3x.

Função de Green generalizada: A função φ1 = φ1(x; y) satisfaz

− φ′′1 = −3xy (2.62)

com F1[φ1] = φ1(0) = 0; A função φ2 = φ2(x; y) satisfaz

− φ′′2 = −3xy (2.63)

com F2[φ2] = φ2(1)− φ′2(1) = 0.

A solução geral de (2.62) ou (2.63) é

φ(x, y) =x3y

2+ a(y)x+ b(y) .

Usando as condições de contorno:

φ1(0) = b1(y) = 0

e, por φ′(x; y) = 3x2y/2 + a(y),

φ2(1)− φ′2(1) =y

2+ a2 + b2 −

3y

2− a2

= b2 − y = 0 ,

logo b2(y) = b. A função de Green do problema é, por (2.51),

G(x, y) =

x3y

2+ a1(y)x se 0 ≤ x < y

x3y

2+ a2(y)x+ y se y ≤ x ≤ 1

.

Impondo a condição de continuidade,

φ1(y, y) =y4

2+ a1(y)y =

y4

2+ a2(y)y + y = φ2(y; y) ,

obtemos a1(y) = a2(y) + 1 e, consequentemente,

G(x, y) =

x3y

2+ a(y)x+ x se 0 ≤ x < y

x3y

2+ a(y)x+ y se y ≤ x ≤ 1

. (2.64)

COMPLEMENTOS 41

Impondo a condição de ortogonalidade,∫ 1

0

G(x, y)ϕ0(x)dx =√

3

∫ y

0

φ1(x; y)xdx+√

3

∫ 1

y

φ2(x; y)xdx

=√

3

(∫ y

0

(x3y

2+ a(y)x+ x

)xdx+

∫ 1

y

(x3y

2+ a(y)x+ y

)xdx

)=√

3

(∫ y

0

x2dx+ y

∫ 1

y

xdx+

∫ 1

0

(x4y

2+ a(y)x2

)dx

)=√

3

(y3

3+y

2(1− y2) +

y

10+a(y)

3

)= 0

implica

a(y) = 3

(y3

6− 6y

10

)=y3

2− 9y

5.

Substituindo este resultado em (2.64), concluímos

G(x, y) =

xy

2(x2 + y2) +

9

5xy + x se 0 ≤ x < y

xy

2(x2 + y2) +

9

5xy + y se y ≤ x ≤ 1

.

A solução do problema (2.60) e (2.61) é, portanto,

u(x) =

∫ 1

0

(xy

2

(x2 + y2

)+

9

5xy

)f(y)dy +

∫ x

0

yf(y)dy + x

∫ 1

x

f(y)dy .

Note que a derivada segunda em x do primeiro termo do lado direito desta expressão se anula por

ortogonalidade: 3x

∫ 1

0

yf(y)dy = ϕ0(x)

∫ 1

0

ϕ0(y)f(y)dy = ϕ0(x)〈ϕ0, f〉 = 0.

Exemplo 2.22. Considere −u′′ − π2/4u = f(x) em [0, 1] com

u(0) = u′(1) = 0 .

λ = π2/4 é um autovalor para este problema, isto é, Lπ2/4[u] = −u′′ − π2/4u = 0 com F1[u] =

u(0) = 0 e F2[u] = u′(1) = 0 tem uma solução não identicamente nula: ϕ1(x) =√

2 sinπx/2,

normalizada

‖ϕ1‖22 = 2

∫ 1

0

sin2 π

2xdx = 2

∫ 1

0

1− cos πx

2dx = 1 ,

onde usamos cos πx = cos2 πx/2− sin2 πx/2 = 1− 2 sin2 πx/2 e

∫ 1

0

cos πxdx = (1/π) sinπx|10 = 0.

Função de Green generalizada: A função φ1 = φ1(x; y) satisfaz −φ′′1 − π2/4φ1 =

−2 sinπx/2 sinπy/2 com F1[φ1] = φ1(0) = 0; A função φ2 = φ2(x; y) satisfaz −φ′′2 − π2/4φ2 =

−2 sinπx/2 sinπy/2 com F2[φ2] = φ′2(0) = 0. A solução geral de

−φ′′i −π2

4φi = −2 sinπx/2 sinπy/2

é

φi(x; y) = − 2

πx cos

π

2x sin

π

2y + ai(y) cos

π

2x+ bi(y) sin

π

2x .

COMPLEMENTOS 42

Impondo as condições de fronteira, temos

F1[φ1] = φ1(0) = a1(y) = 0

e

F2[φ2] = φ′2(1) = sinπ

2y − π

2a2(y) = 0 =⇒ a2(y) =

2

πsin

π

2y .

Substituindo as expressões de φ1 e φ2 em (2.51), temos

G(x, y) =

− 2

πx cos

π

2x sin

π

2y + b1(y) sin

π

2x se 0 ≤ x < y

2

π(1− x) cos

π

2x sin

π

2y + b2(y) sin

π

2x se y ≤ x ≤ 1

.

Da continuidade de G(x, y) em x = y, resulta

b1(y) = b2(y) +2

πcos

π

2y

e, consequentemente,

G(x, y) =

2

πsin

π

2x cos

π

2y − 2

πx cos

π

2x sin

π

2y + b(y) sin

π

2x se 0 ≤ x < y

2

π(1− x) cos

π

2x sin

π

2y + b(y) sin

π

2x se y ≤ x ≤ 1

para alguma b(y) a ser determinada pela condição de ortogonalidade:

0 =

∫ 1

0

G(x, y)ϕ1(x)dx

=√

2

(− 2

πsin

π

2y

∫ 1

0

x sinπ

2x cos

π

2x dx+ b(y)

∫ 1

0

sin2 π

2x dx

)+√

2

(2

πcos

π

2y

∫ y

0

sin2 π

2x dx+

2

πsin

π

2y

∫ 1

y

sinπ

2x cos

π

2x dx

)=√

2

(− 1

π2sin

π

2y +

1

2b(y) +

1

πcos

π

2y

(y − 1

πsinπy

)+

2

π2sin

π

2y cos2 π

2y

)=√

2

(− 1

π2sin

π

2y +

1

2b(y) +

1

πy cos

π

2y

)resultando

G(x, y) =

2

π(1− y) sin

π

2x cos

π

2y − 2

πx cos

π

2x sin

π

2y +

2

π2sin

π

2x sin

π

2y se 0 ≤ x < y

2

π(1− x) cos

π

2x sin

π

2y − 2

πy sin

π

2x cos

π

2y +

2

π2sin

π

2x sin

π

2y se y ≤ x ≤ 1

.

COMPLEMENTOS 43

A solução u : [0, 1] −→ R da equação não homogênea no complemento ortogonal à direção da

autofunção ϕ1(x) =√

2 sinπx/2 é

u(x) =2

πsin

π

2x

∫ 1

0

(−y cos

π

2y +

1

πsin

π

2y

)f(y) dy − 2

πx cos

π

2x

∫ 1

0

sinπ

2y f(y) dy

+2

πcos

π

2x

∫ x

0

sinπ

2y f(y) dy +

2

πsin

π

2x

∫ 1

x

cosπ

2y f(y) dy

=−2

πsin

π

2x

∫ 1

0

y cosπ

2y f(y) dy

+2

πcos

π

2x

∫ x

0

sinπ

2y f(y) dy +

2

πsin

π

2x

∫ 1

x

cosπ

2y f(y) dy ,

pela ortogonalidade 〈f, ϕ1〉 =√

2

∫ 1

0

sinπ

2y f(y) dy = 0.

COMPLEMENTOS 44

3. Operadores Compactos: Teoria Espectral

O objetivo desta seção é introduzir uma subclasse H [a, b] da classe C [a, b] das funções f :

[a, b] −→ R contínuas que tem um papel importante na análise espectral dos operadores integraisGρ cujo núcleo integral G(x, y), dado pela função de Green do problema de SturmLiouville. Asubclasse H [a, b] é formada pelas funções equicontínuas que, por intermédio do Teorema deAscoli, caracterizam os subconjuntos H (relativamente) compactos da classe C [a, b] de funçõescontínuas com a métrica d (f, g) = maxa≤x≤b |f(x)− g(x)| da convergência uniforme.Faremos aqui uso de conceitos apresentados nos Caps. 8 e 9 do belíssimo livro Espaços Métricos

do Prof. Elon L. Lima (veja Terceiro roteiro de leitura, para mais detalhes) e do texto Análisefuncional e o problema de SturmLiouville do Prof. Chaim S. Hönig.Em seguida, desenvolveremos em detalhes o Teoria espectral de operadores compactos Hermiti-

anos em espaços pré-Hilbertianos. Para este assunto seguiremos os textos Análise funcional e oproblema de SturmLiouville do Prof. Chaim S. Hönig e Lições de equações diferenciais ordiná-rias do Prof. Jorge Sotomayor.

3.1. Compacidade na reta e em espaços métricos. Enunciaremos três resultados clássicos daAnálise de R, sobre sua topologia, que nos oferecem diferentes caracterizações de um compacto Kde R.

Teorema 3.1 (BolzanoWeierstrass). Todo subconjunto innito limitado K ⊂ R possui um ponto

de acumulação.

Teorema 3.2 (chamado, às vezes, Bolzano-Weierstrass). Toda sequência (xn)n≥1 limitada de nú-

meros reais possui uma subsequência(xnj

)j≥1

convergente.

Teorema 3.3 (BorelLebesgue). Seja [a, b] ⊂⋃λ∈L

Aλ onde (Aλ)λ∈L é uma família de conjuntos

abertos. Então existem λ1, . . . , λn ∈ L tais que

[a, b] ⊂ Aλ1 ∪ · · · ∪ Aλn .

Observação 3.4. No Teorema 3.3, [a, b] pode ser substituído por um subconjunto F fechado e

limitado qualquer de R. Basta tomar um intervalo [a, b] tal que F ⊂ [a, b], incluir o aberto Aλ0 =

R\F e aplicar o Teorema 3.3 com [a, b] ⊂ Aλ0 ∪ Aλ1 ∪ · · · ∪ Aλn e⋃λ∈L

Aλ uma cobertura de F por

abertos.

Vamos incluir as provas destes resultados pois ilustram o conceito que pretendemos descrever emespaços métricos em geral.Prova do Teorema 3.1. Seja A = x ∈ R : K ∩ [x,∞) é innito, isto é, A é o conjunto de todos osx's tais que existam innitos pontos de K à sua direita. Como K é limitado, K ⊂ [a, b] para alguma e b de R, sendo b uma quota superior para K. Seja c = supA, isto é, c é a menor quota superiorde A de tal maneira que (c− ε, c+ ε) ∩ K é innito, existem innitos pontos de K à direita dec − ε mas não há uma innidade de pontos à direita de c + ε. Como ε > 0 é arbitrário, c é umponto de acumulação de K, concluindo a demonstração.

COMPLEMENTOS 45

Prova do Teorema 3.2. Sejam α e β tais que

α < xn < β , ∀n ∈ N

e Xn = xn, xn+1,..., n = 1, 2, . . ., uma sequencia decrescente de conjuntos com innitos pontos de(xn)n≥1:

[a, b] ⊃ X1 ⊃ X2 ⊃ · · · ⊃ Xn ⊃ · · · .Se an = inf Xn é a maior quota inferior do conjunto Xn, então o ínmo da sequencia decrescentesatisfaz

a1 ≤ a2 ≤ · · · ≤ an ≤ · · · .Por (xn)n≥1 ser uma sequência limitada e a sequência (an)n≥1 dos ínmos de Xn ser monotonica,existe o limite

a = limn→∞

an .

Consequentemente, dado ε > 0 existe n0 = n0(ε) tal que

a− ε < an0 < a+ ε .

Como an0 = inf Xn0 , existe n ≥ n0 tal que an0 ≤ xn < a+ ε e

a− ε < xn < a+ ε . (3.1)

Basta agora escolher uma sequência (εj)j≥1 com εj = 1/j e tomar a subsequência(xnj

)j≥1

de(xn)n≥1 tal que para cada j a desigualdade (3.1) seja satisfeita: a− εj < xnj

< a + εj, concluindoa demonstração do teorema.

Prova do Teorema 3.3. Pela hipótese e denição de cobertura, para cada y ∈ [a, b] existe algumíndice λ ∈ L tal que y ∈ Aλ. Seja X o conjunto dos pontos x ∈ [a, b] tais que o intervalo [a, x] estácontido em uma união nita:

Aλ1 ∪ · · · ∪ Aλn .O conjunto X 6= ∅ pois para algum λ, temos a ∈ Aλ e como Aλ é um aberto, existe δ > 0 tal quea+δ < b e [a, a+δ) ⊂ Aλ. Então [a, a+δ) ⊂ X, isto é, está contido em uma união nita de abertosAλ's. É evidente que, qualquer y tal que a ≤ y < x, então y ∈ X. Logo X é um intervalo [a, c) ou[a, c], onde c = supX. Armamos que X = [a, c], pois existe λ0 tal que c ∈ Aλ0 . Por outro lado,como Aλ0 é aberto, existe ε > 0 tal que (c− ε, c+ ε) ∈ Aλ0 . Pela denição de supremo, podemosencontrar x ∈ X tal que

c− ε < x ≤ c .

Porém,[a, x] ⊂ Aλ1 ∪ · · · ∪ Aλn

e[a, c] ⊂ Aλ1 ∪ · · · ∪ Aλn ∪ Aλ0 .

Portanto, c ∈ X e c = b, pois se não for contradiz a denição de supremo, concluindo a demons-tração.

COMPLEMENTOS 46

Introduziremos agora algumas denições para espaço métrico (M,d) em geral.

Denição 3.5. Seja X um subconjunto de um espaço métrico (M,d).

(1) Uma cobertura de X é uma família F = (Cλ)λ∈L de subconjuntos de M tal que

X ⊂⋃λ∈L

Cλ ≡ S ,

isto é, cada x ∈ X, ∃λ ∈ L tal que x ∈ Cλ.(2) Se existe L′ ⊂ L tal que para cada x ∈ X ainda podese obter λ ∈ L′ com x ∈ C, então a

subfamília F ′ = (Cλ)λ∈L′ chamase subcobertura de X. A subcobertura F ′ é própria se L′

é um subconjunto próprio de L.

(3) Uma cobertura= (Aλ)λ∈L de X dizse aberta quando cada subconjunto Aλ, λ ∈ L, é abertoem M . F é nita se L é um conjunto nito: L = λ1, . . . , λn e escrevemos neste caso

X ⊂ Aλ1 ∪ · · · ∪ Aλn .

Denição 3.6. Um espaço métrico (M,d) chama-se compacto se toda cobertura F aberta possui

uma subcobertura nita.Um subconjunto X de M chama-se um subconjunto compacto quando o

subespaço métrico (X, d|X), onde d|X é a restrição da métrica d em M aos pontos do subconjunto

X, é compacto.

Enunciaremos sem demonstrações algumas implicações do conceito compacto. Para uma provados resultados a seguir, consulte o Cap. 8 do texto Espaços Metricos de Elon L. Lima.

Proposição 3.7. Todo subconjunto fechado de um espaço métrico compacto é compacto. Um

subconjunto compacto de qualquer espaço métrico é necessariamente fechado.

Corolário 3.8. Qualquer intresecção K =⋂λ∈L

Kλ de compactos Kλ é compacto.

Corolário 3.9. Todo espaço métrico compacto é completo.

Proposição 3.10. Todo espaço métrico compacto é limitado.

De fato, se B(x, r) = y ∈M : d (x, y) < r denota a bola aberta de centro em x ∈ M e raior > 0, então M é compacto se, e somente se, for possível extrair da cobertura M =

⋃x

B (x, 1) uma

subcobertura nita M = B (x1, 1)∪ · · ·∪B (xn, 1). Porém uma subcobertura nita de M por bolasde raio 1 é necessariamente limitada por B(x1, 2n).Segue das Proposições 3.7 e 3.10 que qualquer K ⊂ M compacto é fechado e limitado. Se M é

R ou Rn, então a recíproca

K fechado e limitado =⇒ K compacto

é também satisfeita. A reciproca porém não é em geral válida, como podese ver do seguinteexemplo.

COMPLEMENTOS 47

Exemplo 3.11. Considere o espaço métrico (de Hilbert)

l2 (R) =

x = (xn)n≥1 ∈ RN : ‖x‖2

2 =∑n≥1

x2n <∞

das sequências (xn)n≥1 em R de quadrado somável, munido com o produto interno 〈x, y〉 =∑n≥1

xnyn

e métrica d(x, y) = ‖x− y‖2 induzida pela norma ‖x‖22 = 〈x, x〉. Considere o subconjunto X =

e1, e2, . . . , en, . . . ⊂ l2(R) formado pelas sequências en = (0, . . . , 0, 1, 0, . . .) cuja única compo-

nente não nula na nésima posição é 1. Como ‖en‖2 = 1 e ‖en − em‖ =√

2, ∀n,m ∈ N com

n 6= m, temos X ⊂ B (0, r), r > 1, é limitado, innito e discreto e, portanto, fechado mas não é

compacto:

X ⊂⋃n≥1

B (en, r) , r <

√2

2

não admite subcobertura nita.

Proposição 3.12. A imagem f(K) de um conjunto compacto K por uma aplicação f : M −→ N

contínua, de um espaço métrico (M,d) em um espaços métrico (N, d′), é um conjunto compacto.

Corolário 3.13. Se M é compacto, então toda aplicação f : M −→ N contínua é fechada (F ⊂M

fechado =⇒ f(F ) ⊂ N fechado)

Corolário 3.14. Se M é compacto, então toda apliacação contínua é limitada.

Teorema 3.15. Se (E, d) é um espaço métrico, são equivalentes as armações:

A. E é compacto;

B. E é sequencialmente compacto (toda sequência de pontos de E contém uma subsequência

convergente);

C. E é completo e totalmente limitado, isto é, para todo ε > 0, existe um recobrimento nito

de E formado por conjuntos de diâmetro ≤ ε.

Uma variante deste resultado, útil em aplicações, é o seguinte

Teorema 3.16. São equivalentes as armações:

A'. X é relativamente compacto em E, isto é, X é compacto;

B'. Toda sequência de pontos em X contém uma subsequência convergente em E;

C'. X é totalmente limitado.

Observação 3.17. (E, d) é totalmente limitado se, e somente se, E é compacto. Todo espaço

metrico totalmente limitado é separável, isto é, cumpre uma das seguintes armações equiva-

lentes:

(1) E contém um subconjunto enumerável denso;

(2) E contém uma base enumerável de abertos;

(3) Toda cobertura aberta de E admite uma subcobertura enumerável.

COMPLEMENTOS 48

De fato, se E é totalmente limitado, então para cada n existe Fn ⊂ E nito tal que d (x, Fn) < 1/n

para todo x ∈ E. Seja F =⋃n≥1

Fn. Como F é uma união enumerável de conjuntos nitos, é

enumerável e para todo x ∈ E temos d (x, F ) = 0. Logo, F é denso em E.

Após esta breve exposição sobre os diversos conceitos relacionados a compacidade de um conjunto,estenderemos estes conceitos de maneira a estabelecer a teoria espectral de operados integraiscompactos.

3.2. Equicontinuidade. Seja (E, d) um espaço métrico compacto, (F, d′) um espaço métrico com-pleto e C (E,F ) o conjunto das funções f : E −→ F contínuas munido da distância

d∞(f, g) = supx∈E

d′ (f(x), g(x)) .

Observe que (C (E,F ) , d∞) é um espaço métrico completo. Na aplicação em mãos, E é um intervalofechado [a, b], F é a reta R e C ([a, b] ,R) (C [a, b], por brevidade) denota o conjunto da aplicaçõescontínuas de [a, b] em R. A imagem de uma f : [a, b] −→ R contínua é um intervalo fechado elimitado de R, portanto, compacto.

Denição 3.18. Seja H ⊂ C (E,F ) um conjunto de aplicações de E em F . Dizemos que H é

equicontínuo no ponto x0 ∈ E se, e somente se, dado ε > 0, existe uma vizinhaça Vx0 de x0 tal

que

d′(f(x), f(x0)) < ε , se x ∈ Vx0para todo f ∈H .

Dizemos que H é equicontínuo se H é equicontínuo em todo ponto x ∈ E. Observe que

H ⊂ C (E,F ).

Exemplo 3.19. Dado m > 0, o conjunto

H =

f ∈ C 1 [a, b] : sup

a≤x≤b|f ′(x)| ≤ m

é um subconjunto equicontínuo de C [a, b] pois, pelo teorema do valor médio:

|f(x)− f(y)| ≤ m |x− y| , ∀x, y ∈ [a, b]

(f é Lipschitz contínua) para todo f ∈H .

Teorema 3.20 (Ascoli). Um subconjunto H ⊂ C (E,F ) é relativamente compacto se, e somente

se, ele satisfaz as condições

(1) H é equicontínuo;

(2) Para todo x ∈ E, o conjunto Hx = f(x) : f ∈H é relativamente compacto em F .

Prova. Seguiremos o Cap. III, 1, B. do texto Análise funcional e o problema de SturmLiouvilledo Prof. Chaim S. Hönig. Implicação (=⇒), iniciaremos pelo ítem 2. Se H é relativamentecompacto, então Hx, por ser a imagem de uma aplicação contínua, também o é:

f ∈ C (E,F ) 7−→ f(x) ∈ F .

COMPLEMENTOS 49

Resta provar o ítem 1.: H é equicontínua. Do ítem C' do Teorema 3.16 segue que existe umrecobrimento nito H1, . . . , Hn de H por conjuntos de diâmetro ε/3. Fixemos f1 ∈ H1, . . . ,fn ∈ Hn. Da continuidade das funções f1, . . . , fn, segue que, dado x0 ∈ E, existe uma vizinhançaVx0 de x0 tal que, para x ∈ Vx0 , temos

d′ (fi(x), fi(x0)) <ε

3, i = 1, . . . , n .

Dado f ∈H , seja i tal que f ∈ Hi. Para x ∈ Vx0 , pela desigualdade triangular, temos

d′ (f(x), f(x0)) ≤ d′ (f(x), fi(x)) + d′ (fi(x), fi(x0)) + d′ (fi(x0), fi(x0)) < ε ,

o que prova a equicontinuidade de H no ponto x0 e, consequentemente, em todo ponto x ∈ E.Implicação (⇐=): seja H ⊂ C (E,F ) equicontínuo e tal que, para todo x ∈ E, Hx seja relativa-

mente compacto em F . Para demonstrar que H é relativamente compacto é suciente, pelo ítemC' do Teorema 3.16, mostrar que H é completamente limitado, isto é, dado ε, existe um recobri-mento nito de H por conjuntos de diâmetro ≤ ε. Sendo H equicontínuo, para todo x ∈ E, existeuma vizinhança aberta Ax de x tal que, se x′ ∈ Ax então d′ (f(x′), f(x)) < ε/3. Sendo E compacto,H pode ser recoberto por um número nito de abertos Ax1 , . . . , Axn com esta propriedade. Poroutro lado Hi = Hxi , i = 1, . . . , n, é por hipótese relativamente compacto e existe, portanto, umrecobrimento nito Hi,1, . . . , Hi,mi

por conjuntos de diâmetro ≤ ε/3.Para cada sequência de inteiros p1, . . . , pn com 1 ≤ pi ≤ mi, seja

Hp1,...,pn = f ∈H : f(xi) ∈ Hi,pi , i = 1, . . . , n .

Esses conjuntos evidentemente formam um recobrimento nito de H e resta mostrar que cadaHp1,...,pn tem diâmetro < ε. Sejam f, g ∈ Hp1,...,pn quaisquer. Para todo x ∈ E, existe i tal quex ∈ Axi e, pela desigualdade triangular,

d′ (f(x), g(x)) ≤ d′ (f(x), f(xi)) + d′ (f(xi), g(xi)) + d′ (g(xi), g(x)) < ε ,

concluindo a demonstração.

3.3. Operadores compactos. Sejam E e F espaços normados, isto é, E e F são espaços métricoscom a métrica induzida por uma norma d(x, y) = ‖x− y‖, e seja

k : E −→ F (3.2)

uma aplicação linear:k (αx+ βy) = αk(x) + βk(y)

quaisquer que sejam α, β ∈ R e x, y ∈ E.O conjuto das aplicações lineares contínuas de E em F forma um espaço vetorial L (E,F ) munido

da norma k ∈ L (E,F ) 7−→ ‖k‖ = sup‖x‖≤1 ‖k(x)‖. Para todo x ∈ E temos ‖k(x)‖ ≤ ‖k‖ ‖x‖ e ‖k‖é a menor constante c tal que ‖k(x)‖ ≤ c ‖x‖. Um exemplo de aplicação linear contínua, pertinenteao problema de SturmLiouville desenvolvido nestas notas, tem suas propriedades deduzidas nosseguintes

COMPLEMENTOS 50

Lema 3.21. Sejam E e F espaços normados e k uma aplicação linear de E em F . São equivalentes

as seguintes propriedades:

(1) k é contínua na origem;

(2) sup‖x‖≤1 ‖k(x)‖ = M <∞;

(3) existe C > 0 tal que ‖k(x)‖ ≤ C ‖x‖ para todo x ∈ E;(4) k é contínua.

Prova. 1.⇒2.: sendo k contínua na origem, dado ε > 0, existe δ > 0 tal que ‖x‖ < δ implica‖k(x)‖ < ε e, portanto, ‖x/δ‖ ≤ 1 implica

‖k(x/δ)‖ = ‖k(x)/δ‖ = ‖k(x)‖ /δ < ε/δ ≡M <∞ .

2.⇒3.: para todo x ∈ E, x 6= 0, o elemento x/ ‖x‖ tem norma 1 e, portanto, ‖k (x/ ‖x‖)‖ ≤ C

implica‖k(x)‖ = ‖k (x/ ‖x‖)‖ ‖x‖ ≤ C ‖x‖ .

3.⇒4.: se ‖x− x0‖ ≤ ε/C = δ, então

‖f(x)− f(x0)‖ = ‖f(x− x0)‖ ≤ C ‖x− x0‖ ≤ ε .

4.⇒1.: é evidente.

Lema 3.22. Sejam E = C [a, b], F = C [c, d] e K : [c, d] × [a, b] −→ R uma função contínua.

Dena para todo f ∈ E

(K f) (s) =

∫ b

a

K(s, t)f(t)dt , s ∈ [c, d] . (3.3)

A aplicação K é linear de C [a, b] em C [c, d], com ambos espaços munidos da norma do supremo

‖f‖ = supx∈[a,b] |f(x)|, é contínua: K ∈ L (C [a, b] ,C [c, d]) e sua norma satisfaz

‖K ‖ ≤ sups∈[c,d]

∫ b

a

|K(s, t)| dt . (3.4)

Prova. Sendo f(t) e K(s, t) contínuas, a aplicação (3.3) está bem denida. Sendo K uniformementecontínua em [c, d] × [a, b], dado ε > 0, existe δ = δ(ε) > 0 tal que |t1 − t2|,|s1 − s2| < δ implicam|K(s1, t1)−K(s2 − t2)| < ε. Logo,

|(K f) (s1)− (K f) (s2)| ≤∫ b

a

|K(s1, t)−K(s2 − t)| |f(t)| dt

≤ ε(b− a) ‖f‖ (3.5)

de onde se conclui a continuidade de (K f) (s). A linearidade da aplicação é devido a linearidadeda operação de integração e sua continuidade segue de

|(K f) (s)| ≤∫ b

a

|K(s, t)| |f(t)| dt

≤∫ b

a

|K(s, t)| dt · ‖f‖ (3.6)

COMPLEMENTOS 51

que implica

‖K f‖ ≤ sups∈[c,d]

∫ b

a

|K(s, t)| dt · ‖f‖ (3.7)

e a desigualdade (3.4). Pode-se mostrar que ‖K ‖ = sups∈[c,d]

∫ ba|K(s, t)| dt e como esta norma é

nita, devido a continuidade uniforme de K(s, t), Lema 3.21 juntamente com (3.7) implicam queK : C [a, b] −→ C [c, d] é uma aplicação linear contínua.

A seguir introduziremos o ingrediente necessário para a denição de operadores compactos (veja

o texto Análise funcional e o problema de SturmLiouville do Prof. Chaim S. Hönig, para suademonstração)

Proposição 3.23. São equivalentes as seguintes assertivas:

a. k leva a bola unitátia B(x, 1) = y ∈ E : ‖x− y‖ < 1 de E, centrada em algum x, em um

conjunto relativamente compacto de F ;

b. k leva conjuntos limitados de E em conjuntos relativamente compactos de F ;

c. Toda sequência limtada de pontos (xn)n≥1 de E contém uma subsequência(xnj

)j≥1

tal que

a sequência(k(xnj

))j≥1

é convergente.

Denição 3.24. Dizemos que a aplicação linear k : E −→ F é compacta ou completamente

contínua se ela satisfaz as condições equivalentes a., b. e c. da Proposição 3.23.

Observação 3.25. Como todo conjunto relativamente compacto de um espaço normado é limi-

tado, segue que toda aplicação linear compacta é contínua. O conjunto das aplicações lineares

compactas de E em F é, portanto, um subespaço vetorial de L (E,F ).

Retornemos ao exemplo pertinente ao problema de SturmLiouville.

Lema 3.26. A aplicação linear K : C [a, b] −→ C [c, d] dada por (3.3) é compacta.

Prova. Basta mostrar que K (B), onde B é uma bola unitária em C [a, b]: B = B(g, 1) =

f ∈ C [a, b] : ‖f − g‖ < 1 para algum g ∈ C [a, b], é um conjunto relativamente compacto deC [c, d]. Para isso, pelo Teorema de Ascoli, é suciente mostrar que

(1) K (B) é equicontínua e(2) para todo s0 ∈ [c, d], o subconjunto de R,

K (B)s0 = (K f) (s0) : f ∈ B ,

é limitado.

Itens 1. e 2. seguem da prova do Lema 3.22 (veja equações (3.5) e (3.6)). Por K ser umaaplicação linear em um espaço normado, é suciente tomar a bola B centrada na origem (funçãonula): g(s) = 0, ∀s ∈ [a, b] (veja Lema 3.21). Neste caso f−g = f e K (f−g) = K f−K g = K f .Se |s1 − s2| < δ, então

|(K f) (s1)− (K f) (s2)| ≤ ε(b− a) ‖f‖ ≤ ε(b− a) ,

qualquer que seja f ∈ B, provando a equicontinuidade de K (B).

COMPLEMENTOS 52

Para todo f ∈ B e s0 ∈ [a, b], temos

|(K f) (s0)| ≤∫ b

a

|K(s0, t)| dt · ‖f‖ ≤∫ b

a

|K(s0, t)| dt <∞ .

Logo K (B)s0 é limitado, concluindo a demonstração do lema.

Lemas 3.22 e 3.26 se aplicam ao operador Gρ : C [a, b] −→ C [a, b] dado por

(Gρf) (x) =

∫ b

a

G(x, y)ρ(y)dy

onde ρ : [a, b] −→ R e G : [a, b] × [a, b] −→ R são uniformemente contínua e tais que ρ(x) > 0

e G(x, y) = G(y, x). Os resultados são válidos na topologia (mais na) uniforme, com a mé-trica d∞(f, g) = supx∈[a,b] |f(x)− g(x)| = ‖f − g‖∞ induzida pela norma do supremo ‖f‖∞ =

supx∈[a,b] |f(x)|, como também na topologia do espaço preHilbertiano CL2(ρ) [a, b] com a métrica

d2(f, g) = ‖f − g‖2,ρ induzida pela norma ‖f‖22,ρ =

∫ b

a

f(x)2ρ(x)dx = 〈f, f〉ρ.

Lema 3.27. A aplicação linear K : CL2 [a, b] −→ CL2 [c, d] dada por (3.3) é compacta.

Prova. Basta mostrar que K (B), onde B é uma bola unitária em CL2 [a, b]: B = B(0, 1) =

f ∈ CL2 [a, b] : ‖f‖ < 1, é um conjunto relativamente compacto de CL2 [c, d]. Para isso, peloTeorema de Ascoli, é suciente mostrar que

(1) K (B) é equicontínua e(2) o subconjunto de R,

‖K (B)‖2 =

(∫ d

c

|(K f) (s)|2 ds)1/2

: f ∈ B

,

é limitado.

Novamente, ítens 1. e 2. seguem de uma variante da prova do Lema 3.22 (veja equações (3.5) e(3.6)). Se |s1 − s2| < δ, então, pela desigualdade de Cauchy-Schwarz,

|(K f) (s1)− (K f) (s2)| ≤∫ b

a

|K(s1, t)−K(s2 − t)| |f(t)| dt

≤(∫ b

a

|K(s1, t)−K(s2 − t)|2 dt)1/2

‖f‖2

≤ ε√b− a ‖f‖2 ≤ ε

√b− a ,

qualquer que seja f ∈ B, provando a equicontinuidade de K (B).

COMPLEMENTOS 53

Para todo f ∈ B e s ∈ [a, b], temos, pela desigualdade de Cauchy-Schwarz,

|(K f) (s)| ≤∫ b

a

|K(s, t)| |f(t)| dt

≤(∫ b

a

|K(s, t)|2 dt)1/2

‖f‖2

≤(∫ b

a

|K(s, t)|2 dt)1/2

e, portanto,

‖K f‖2 =

(∫ d

c

|(K f) (s)|2 ds)1/2

≤(∫ d

c

∫ b

a

|K(s, t)|2 dtds)1/2

<∞

Logo ‖K (B)‖2 é limitado, concluindo a demonstração do lema.

Observação 3.28. Como a métrica d∞ (f, g) = ‖f − g‖∞ = supx∈[c,d] |f(x)− g(x)| é mais na que

a métrica d2(f, g) = ‖f − g‖2: ‖f − g‖2 ≤√d− c ‖f − g‖∞, a função identidade i : C [c, d] −→

CL2 [c, d], i(f) = f , é contínua. Bastava provar no lema acima que a aplicação linear K :

CL2 [a, b] −→ C [c, d] é compacta.

3.4. Teoria espectral de operadores compactos autoadjuntos. Seja A : E −→ E umoperador (aplicação linear de E em E) compacto em um espaço E pre-Hilbertiano cuja norma‖x‖ =

√〈x, x〉 de x ∈ E (‖x‖ = 0⇔ x = 0) é induzida por um produto interno

〈·, ·〉 : E × E −→ C

denido pela forma sesquilinear Hermitiana: 〈x, y〉 = 〈y, x〉. Dados x, y ∈ E quaisquer, é satisfeitaa desigualdade de CauchySchwarz

|〈x, y〉| ≤ ‖x‖ ‖y‖ (3.8)

e a identidade do paralelogramo

‖x+ y‖2 + ‖x− y‖2 = 2(‖x‖2 + ‖y‖2) . (3.9)

Denotamos o núcleo e, respectivamente, a imagem de A por N (A) = x ∈ E : Ax = 0 eI (A) = Ax : x ∈ E. λ é um autovalor de A se, e somente se, N (A− λI) 6= 0. Nestecaso, o subespaço N (A− λI) de E, invariante pela ação de A, é formado pelos autovetores de Aassociados a λ e o vetor nulo 0. O operador A, sendo compacto, é contínuo e A ∈ L(E), o espaçodos operadores limitados de E para E: ∃c > 0 tal que ‖Ax‖ ≤ c ‖x‖, cuja norma é induzida pelanorma do espaço vetorial E (‖A‖ é a menor quota superior c):

‖A‖ = sup‖x‖=1

‖Ax‖ . (3.10)

O operador A é autoadjunto se, para todo x, y ∈ E temos

〈y, Ax〉 = 〈Ay, x〉 .

COMPLEMENTOS 54

Proposição 3.29. Seja A ∈ L(E) um operador autoadjunto contínuo. Então

‖A‖ = sup‖x‖=1

〈x,Ax〉 .

Prova. Verica-se facilmente que

4〈x,Ay〉 = 〈x+ y, A (x+ y)〉 − 〈x− y, A (x− y)〉 .

Seja γ = sup‖x‖=1 |〈x,Ax〉|, onde o supremo é atingido pela menor quota superior desta quantidade.

Pela denição de quota superior: |〈z, Az〉| ≤ c ‖z‖2 com z = x ± y e identidade do paralelogramo(3.9), temos

4 |〈x,Ay〉| ≤ γ(‖x+ y‖2 + ‖x− y‖2)

= 2γ(‖x‖2 + ‖y‖2) .

Se ‖x‖ = ‖y‖ = 1, então esta desigualdade ca

|〈x,Ay〉| ≤ γ .

Fazendo y = Ax/ ‖Ax‖, obtemos

|〈x,Ay〉| = |〈Ax, y〉| = |〈Ax,Ax/ ‖Ax‖〉| = ‖Ax‖ ≤ γ

para todo x ∈ E tal que ‖x‖ = 1 e, em particular, para x∗ ∈ E que atinge o supremo em (3.10).Logo,

‖A‖ ≤ γ . (3.11)

Por outro lado, pela desigualdade de Cauchy-Schwarz (3.8), temos

|〈x,Ax〉| ≤ ‖x‖ ‖Ax‖ = ‖Ax‖ ,

∀x ∈ E tal que ‖x‖ = 1. Tomando o supremo nesta desigualdade, concluimos γ ≤ ‖A‖ que,juntamente com (3.11), demonstra a proposição.

Lema 3.30. Se A é um operador auto-adjunto compacto, então existe um autovalor λ de A com

|λ| = ‖A‖.

Prova. Pela Proposição 3.29, ‖A‖ = sup‖x‖=1 |〈x,Ax〉|, onde x ∈ E 7−→ 〈x,Ax〉 ∈ R é uma funçãocontínua de x. Existe, portanto, uma sequência (xn)n≥1 em E com ‖xn‖ = 1 e tal que

limn→∞〈xn, Axn〉 = ‖A‖ . (3.12)

Como 〈xn, Axn〉 é limitado em R e A é compacto, existe uma subsequência (xnk)k≥1 de (xn)n≥1 tal

que 〈xnk, Axnk

〉 e Axnk=: yk convergem

limk→∞〈xnk

, Axnk〉 = λ

limk→∞

Axnk= y

para um λ ∈ R e um ponto y ∈ E. Observe que, devido a (3.12), |λ| = ‖A‖.

COMPLEMENTOS 55

Porém, devido a ‖Axnk‖2 ≤ ‖A‖2 = λ2, temos

‖(A− λI)xnk‖2 = ‖Axnk

‖2 − 2λ〈xnk, Axnk

〉+ λ2

≤ 2(λ2 − λ〈xnk

, Axnk〉)−→ 0

quando k tende a ∞. Isso prova que y = limk→∞ λxnké não nulo (pois λ 6= 0 e ‖xnk

‖ = 1) e, pelacontinuidade a aplicação x 7−→ Ax,

Ay = A limk→∞

λxnk= λ lim

k→∞Axnk

= λy .

Logo, λ é um autovalor de A com |λ| = ‖A‖ e y é um autovetor de A associado a λ.

Lema 3.31. Se A é um operador auto-adjunto compacto, então

(i) Os autovalores de A estão contidos no intervalo [−‖A‖ , ‖A‖];(ii) Os autovetores x e y associados a autovalores λ e η distintos são ortogonais: 〈x, y〉 = 0;

(iii) O subespaço invariante N (A− λI) = x ∈ E : (A− λI)x = 0 de autovetores associados

a algum autovalor λ 6= 0 de A tem dimensão nita.

Prova. Se x é um autovetor associado ao autovalor λ de A (de norma unitária: ‖x‖ = 1), entãopela denição (3.10) de norma de A segue que

‖A‖ ≥ ‖Ax‖ = |λ| ‖x‖ = |λ|

de onde se conclui a demonstração do ítem (i) se λ ∈ R. Mas, como A é autoadjunto, os autovaloresde A devido a

λ = λ ‖x‖2 = 〈λx, x〉 = 〈Ax, x〉 = 〈x,Ax〉 = 〈x, λx〉 = λ ‖x‖2 = λ

são necessariamente reais. Se x e y são autovetores associados a autovalores λ e η distintos, então

λ〈x, y〉 = 〈λx, y〉 = 〈Ax, y〉 = 〈x,Ay〉 = 〈x, ηy〉 = η〈x, y〉

e, portanto,(λ− η)〈x, y〉 = 0 ,

concluindo a prova do ítem (ii). Suponhamos, por contradição, que dim (N (A− λI)) = ∞.Podemos então encontrar uma sequência ortonormal innita x1, x2, . . . , xn, . . . que gera estesubespaço invariante. Como os xn's pertencem a N (A− λI), temos que, para todo n, Axn = λxn.Segue-se que, se m 6= n,

‖Axn − Axm‖2 = λ ‖xn − xm‖2 = λ〈xn − xm, xn − xm〉 = λ(‖xn‖2 + ‖xm‖2) = 2λ

ou seja, a distância entre quaisquer dois vetores xn e xm desta sequência: ‖xn − xm‖ =√

2 émantida positiva e igual para todo par de vetores pela ação de A: ‖Axn − Axm‖ =

√2λ > 0, devido

a hipótese λ 6= 0. Disso segue que: 1. o conjunto X = x1, x2, . . . , xn, . . . é limitado e fechado.2. não podemos extrair da sequencia Ax1, Ax2, . . . , Axn, . . . , uma subsequência convergente, emcontradição como a hipótese de A ser um operador compacto, concluindo a demonstração do ítem(iii).

COMPLEMENTOS 56

Lema 3.32. Os autovalores de A ou são em número nito ou formam uma sequência que tem 0

como único ponto de acumulação.

Prova. Por (i) do Lema 3.31 sabemos que o espectro de A, isto é, o conjunto de autovaloresde A, é limitado, com ±‖A‖ suas quotas inferiores e superiores. Sendo o intervalo [−‖A‖ , ‖A‖]um conjunto compacto de R, toda sequencia innita de autovalores tem ao menos um ponto deacumulação. Suponhamos, por contradição, que λ 6= 0 é um ponto de acumulação. Neste caso existeuma subsequência λn1 , λn2 , . . . , λnk

, . . . de autovalores de A convergente para λ: limk→∞ λnk= λ.

Sem perda de generalidade, podemos escolhê-la tal que |λnk| > |λ| /2, k ≥ 1. Se xn1 , xn2 , . . . , xnk

,. . . são autovetores associados a estes autovalores com ‖xnk

‖ = 1, então se k 6= l,

‖Axnk− Axnl

‖2 = ‖λnkxnk− λnl

xnl‖2

= 〈λnkxnk− λnl

xnl, λnk

xnk− λnl

xnl〉

= |λnk|2 ‖xnk

‖2 + |λnl|2 ‖xnl

‖2

= |λnk|2 + |λnl

|2 ≥ |λ|2

Resulta, como na demonstração de (iii) do Lema 3.31, que a sequência Axn1 , Axn2 , . . . , Axnk, . . .

não admite uma subsequência convergente, em contradição com A ser um operador compacto (vejaDenição 3.24). Isso conclui a demonstração pois um número nito de pontos (autovalores de A)não se acumula em parte alguma do intervalo.

Dado um subespaço H ⊂ E, denimos o subespaço ortogonal a H por

H⊥ = x ∈ E : 〈x, y〉 = 0 para todo y ∈ H .

Notemos que H⊥ é fechado.Sejam λ1, λ2, . . . , λn, . . . os autovalores não nulos de A e seja H o subespaço fechado de E gerado

pelos pelos subespaços dois a dois ortogonais: N (A− λ1I), N (A− λ2I), . . . , N (A− λnI), . . . .Como N (A) é o subespaço dos autovalores associados ao autovalor λ = 0, segue por (ii) do Lema3.31 que N (A) ⊂ H⊥.Por outro lado, H é invariante pela ação de A e, em consequência, H⊥ também o é. Como a

restrição A|H⊥ de A a H⊥ não tem autovalores não nulos (pois os autovalores não nulos estão emH) segue-se que A|H⊥ ≡ 0 em decorrência do Lema 3.30. Obtemos então que H⊥ ⊂ N (A), o queacarreta, juntamente com a inclusão oposta obtida anteriormente, H⊥ = N (A).Além disso, como N (A− λnI) ⊂ I (A) (note, para isso, que αx : α ∈ C ⊂ N (A− λnI) é

invariante pela ação de A: Aαx = λnαx) temos H ⊂ I (A). Se x ∈ E e y ∈ N (A) então 〈Ax, y〉 =

〈x,Ay〉 = 0, isto é, I (A) ⊂ N (A)⊥. Consequentemente, N (A) ⊂ I (A)⊥ ⊂ H⊥ = N (A), ouseja, N (A) = I (A)⊥.Como H é gerado pelos subespaços N (A− λnI)'s, segue-se que existe uma base ortonormal de

H composta pelos autovetores e1, e2, . . . , en, . . . associados aos autovalores λ′1, λ′2, . . . , λ

′n, . . .

de A. Por (iii) do Lema 3.31, a mutiplicidade geométrica dim (N (A− λnI)) de cada autovalorλn é nita, os autovalores λ′n foram renumerados repetindo λn um número de vezes igual a estamultiplicidade.

COMPLEMENTOS 57

Lema 3.33. H = I (A).

Prova. Já sabemos que H ⊂ I (A), restando mostrar a inclusão no outro sentido. Dado x ∈ E,denimos ym ∈ H por (série parcial de x na base de H)

ym =m∑i=1

〈x, ei〉ei .

Pela desigualdade de Bessel‖ym‖2 ≤ ‖x‖2

e

Aym =m∑i=1

〈x, ei〉Aei =m∑i=1

〈x, ei〉λ′iei =m∑i=1

〈x, λ′iei〉ei =m∑i=1

〈x,Aei〉ei =m∑i=1

〈Ax, ei〉ei . (3.13)

Como A é um operador compacto, existe uma subsequência (ymk)k≥1 tal que (Aymk

)k≥1 convergea um ponto y de H (lembre que H é invariante pela ação de A). Mas, por continuidade da formasesquilinear 〈·, ·〉, juntamente com (3.13),

〈Ax− y, ej〉 = 〈Ax, ej〉 − limk→∞〈Aymk

, ej〉

= 〈Ax, ej〉 − limk→∞〈∑mk

i=1〈x, ei〉Aei, ej〉

= 〈Ax, ej〉 − limk→∞

∑mk

i=1〈Ax, ei〉〈ei, ej〉

= 〈Ax, ej〉 − 〈Ax, ej〉 = 0

para todo j ≥ 1, que acarreta

Ax− y ∈ H⊥ = N (A) = I (A)⊥ .

Mas Ax−y ∈ I (A) (pois Ax−y = limk→∞ (Ax− Aymk) = limk→∞A (x− ymk

)). Logo Ax−y = 0

e isso prova que Ax ∈ H qualquer que seja x ∈ E, de onde se conclui que I (A) ⊂ H e a prova dolema.

Estamos prontos para enunciar o principal resultado sobre o espectro de operadores compactos

atuando sobre um espaço préHilbertiano, isto é, um espaço vetorial separável, munidos de umproduto interno, porém, não necessariamente completo. O seguinte resultado sumariza os conteúdosdos Lemas 3.303.33.

Teorema 3.34 (espectral de operadores compactos Hermitianos). Seja E um espaço pré-Hilbertiano

e A um operador compacto Hermitiano (sinônimo de auto-adjunto), com A 6= 0. Existe uma

sequência (nita ou innita) (λn)n≥1 de autovalores λn 6= 0 e uma sequência (en)n≥1 de autovetores

correspondentes, formando um conjunto ortonormal: 〈en, em〉 = δn,m tal qye, para todo x ∈ E,

Ax =∑n≥1

λn〈x, en〉en .

COMPLEMENTOS 58

A sequência (λn)n≥1 contém todos os autovalores nãonulos de A, está ordenada de forma que

|λn| ≥ |λn+1|

e necessariamente satisfaz, quando innita,

limn→∞

λn = 0 .

Por m, a dimensão do subespaço invariante N (A− λI) correspondente a qualquer um autovalor

λ é nita e igual ao número de vezes que λ comparece na sequência.

Prova. Indiquemos por λ1 e e1 o par autovalor e autovetor correpondente de A com |λ1| = ‖A‖,cuja existência foi demonstrada no Lema 3.30. Se E1 = E e A1 = A|E1

= A, temos |λ1| = ‖A1‖ eE2 = N (A− λ1I)⊥ é um subespaço de E1 invariante pela ação de A ortogonal a e1.A restrição A2 = A1|E2

de A1 ao subespaço E2 é um operador hermitiano compacto. Logo,aplicando o Lema 3.30, existe um par λ2 e e2 de autovalor e autovetor correspondente de A1 (e,portanto, de A) com |λ2| = ‖A2‖ ≤ ‖A1‖. Segue que |λ2| ≥ |λ1|.Repetindo, Lema 3.30 aplicado a An : En −→ En, onde An = A|En−1

é hermitiano compactoEn = E⊥n−1 é pré-Hilbrtiano, obtemos um par λn e en de autovalor e autovetor correspondente deAn (e, portanto, de A) tal que λn = ‖An‖. Segue que os autovalores não-nulos λ1, λ2, . . . , λn de Asatisfazem

|λ1| ≥ |λ2| ≥ · · · ≥ |λn| ;

os autovetores correspondentes e1, e2, . . . , en de A são ortogonais dois a dois, normalizados e formamum sistema ortonormal; os subespaços E1, E2, . . . , En+1 de E onde En+1 = E⊥n é o subespaço deEn ortogonal aos vetores e1, e2, . . . , en.A. Se a restrição An+1 = A|En+1

= 0 de A ao subespaço En+1 for nula, então temos,

Ax =n∑i=1

λi〈x, ei〉ei (3.14)

para todo x ∈ E, isto é, o conjunto A(E) é o subespaço gerado por e1, e2, . . . , en. De fato, sex = x−

∑ni=1〈x, ei〉ei então 〈x, ei〉 = 0 para i = 1, . . . , n e, por conseguinte, x ∈ En+1 donde segue

que Ax = 0 e (3.14).B. Se para todo n ≥ 1 a restrição An+1 = A|En+1

de A ao subespaço En+1 for não nula, entãotemos uma sequência innita (λn)n≥1 de autovalores e um sistema ortonormal (en)n≥1 de autovetorescorrespondentes tais que

(a) a sequencia decrescente |λn| tende a 0. Caso contrário, existiria um ε > 0 tal que |λn| > ε

para todo n e uma sequência (en/λn)n≥1 limitada (‖en/λn‖ ≤ 1/ε ) sem que Aen/λn = en,n ≥ 1, contivesse uma subsequência convergente. Veja Lema 3.32 para uma outra provadesta asserção;

(b) para todo x ∈ E, temosAx =

∑n≥1

λn〈x, en〉en

COMPLEMENTOS 59

sendo esta série convergente para Ax. Basta para isto mostrar que, dado x ∈ E e ε > 0,existe m0 tal que, para m ≥ m0, ‖Ax−

∑mn=1 λn〈x, en〉en‖ < ε, o que resulta de∥∥∥Ax−∑m

n=1λn〈x, en〉en

∥∥∥ =∥∥∥A(x−∑m

n=1〈x, en〉en

)∥∥∥≤ ‖Am+1‖

∥∥∥x−∑m

n=1〈x, en〉en

∥∥∥≤ |λm+1| ‖x‖

uma vez que |λm+1| tende a 0 quando m→∞;(c) todo autovalor λ 6= 0 de A encontra-se na sequência (λn)n≥1, pois se não, o autovetor

correspondente e seria ortogonal a todos os en e, de (b), teríamos Ae = 0, contrário ahipótese de que Ae = λe 6= 0.

(d) Dado um autovalor λ 6= 0 que aparece p vezes na sequência (λn)n≥1, o subespaço N (A− λI)

invariante gerado pelos autovetores correspondentes a λ tem dimensão ≥ p, pois pelo Lema3.30 existem pelo menos p autovetores ortonormais correspondentes a λ. O subespaço nãopode ter dimensão > p pois, neste caso, existiria pelo um autovetor e correspondente aλ ortogonal aos anteriores e a todos os en's e, como em (c), seguiria que Ae = 0, emcontradição à hipótese λ 6= 0.

Corolário 3.35. Sob as mesmas condições do Teorema 3.34, temos a seguinte caracterização fun-

cional de um autovalor λn 6= 0 de A

|λn| = supx∈E

|〈x,Ax〉|〈x, x〉

: 〈x, ei〉 = 0, i = 1, . . . , n− 1

(3.15)

e, para quaisquer x, y ∈ E, temos

〈Ax, y〉 =∑n≥1

λn〈x, en〉〈en, y〉 . (3.16)

A fórmula (3.15) aplicada ao problema de SturmLiouville aparece nas motivações para se estudaras equações da forma (1.1) como operadores em espaços vetoriais de funções no contexto dasequações de EulerLagrange. A fórmula (3.16) foi utlizada na Subseção 2.4 para deduzir a equação(2.50), satisfeita pela função de Green no sentido generalizado.

COMPLEMENTOS 60

4. Equações integrais

4.1. O método de aproximações Sucessivas.Núcleo integral limitado. Esta seção é dedicada às equações integrais do segundo tipo da forma

u(x)−∫ b

a

K(x, y)u(y)dy = f(x) (4.1)

com f, |f | : [a, b] −→ R integráveis e o núcleo integral K : [a, b]× [a, b] −→ R uma função limitadae contínua, com exceção talvez de x = y, também chamadas de equações integrais de Fredholm.Permitimos discontinuidade na diagonal com a nalidade de incluir os núcleos integrais de Volterra,contínuos na região triângular a ≤ y ≤ x ≤ b e nulo no complemento.Para qualquer função f(x) integrável, a integral

Kf(x) :=

∫ b

a

K(x, y)f(y)dy (4.2)

é uma função contínua de x e (4.1) pode ser reescrita como

u = f +Ku . (4.3)

Tentaremos inicialmente uma solução de (4.3) pelo método de aproximações sucessivas. Tomandoa 0ésima aproximação u0(x) = 0, obtemos sucessivamente melhores aproximações: u1 = f +Ku0,u2 = f +Ku1, . . . ,

un = f +Kun−1

= f +Kf + · · ·+Kn−1f

onde a nésima iterada Knf de K em f é denida pelas relações de recorrência

K1f = Kf

K2f = K (Kf)

...

Knf = K(Kn−1f

)=

∫ b

a

K(·, xn) · · ·∫ b

a

K(x3, x2)

∫ b

a

K(x2, x1)f(x1)dx1dx2 · · · dxn (4.4)

...

Somos assim levados a uma solução tentativa na forma de série de funções, chamada de série deNeumann:

u(x) = f(x) +K1f(x) + · · ·+Kn−1f(x) + · · · (4.5)

Se a série de Neumann (4.5) convergir uniformemente, sua soma u(x) será uma solução de (4.3).De fato, aplicando K em (4.5), obtemos a equação (4.3):

Ku = K(f +Kf + · · ·+Kn−1f + · · ·

)= Kf +K2f + · · ·+Knf + · · · = u− f . (4.6)

COMPLEMENTOS 61

Am de assegurar a convergência uniforme de (4.5), é suciente assumir que

M := maxa≤x,y≤b

|K(x, y)| < 1

b− a(4.7)

pois, pelas denições (4.2) e (4.4), a série (4.6) é majorada pela séries numérica:

maxa≤x≤b

|Ku(x)| ≤ M ‖f‖1 +M2(b− a) ‖f‖1 + · · ·+Mn(b− a)n−1 ‖f‖1 + · · ·

=M ‖f‖1

1−M(b− a)<∞

convergente pela hipótese (4.7), onde

‖f‖1 =

∫ b

a

|f(x)| dx .

A condição (4.7) é de forma alguma necessária para a convergência uniforme de (4.5), como podeser visto pelos seguintes exemplos.

Exemplo 4.1.(1) K(x, y) = α(x)β(x), onde α(x) e β(x) são duas funções contínuas arbitrárias, sujeitas

somente à condição: ∫ b

a

α(x)β(x)dx = 0 .

Para qualquer f(x) contínua, temos então

Kf(x) =

∫ b

a

α(x)β(x)f(x)dx = Cα(x)

K2f(x) =

∫ b

a

α(x)β(y)Cα(y)dy = Cα(x)

∫ b

a

β(y)α(y)dy = 0

...

Knf(x) = K(Kn−1f

)(x) = 0 , ∀n ≥ 2 .

A série de Neumann (4.5) neste caso se reduz a apenas dois termos e a solução de (4.3) é

u(x) = f(x) + Cα(x)

onde C =

∫ b

a

β(y)f(y)dy.

COMPLEMENTOS 62

(2) Núcleo integral de Volterra: K(x, y) = 0 para a ≤ x < y ≤ b. Mantendo a notação

M = max |K(x, y)| e ‖f‖1 =

∫ b

a

|f(x)| dx, temos

|Kf(x)| =

∣∣∣∣∫ x

a

K(x, y)f(y)dy

∣∣∣∣ ≤M ‖f‖1∣∣K2f(x)∣∣ =

∣∣∣∣∫ x

a

K(x, y)Kf(y)dy

∣∣∣∣ ≤ ∫ x

a

M ·M ‖f‖1 dy = M2 ‖f‖1 (x− a)

∣∣K3f(x)∣∣ =

∣∣∣∣∫ x

a

K(x, y)K2f(y)dy

∣∣∣∣ ≤M3 ‖f‖1

∫ x

a

(y − a) dy = M3 ‖f‖1

(x− a)2

2

...∣∣Kn+1f(x)∣∣ =

∣∣∣∣∫ x

a

K(x, y)Knf(y)dy

∣∣∣∣ ≤Mn+1 ‖f‖1

∫ x

a

(y − a)n−1

(n− 1)!dy = Mn+1 ‖f‖1

(x− a)n

n!

...

A série (4.6) é, portanto, majorada pela série numérica

S = M ‖f‖1 +M2 ‖f‖1 (b− a) +M3 ‖f‖1

(b− a)2

2+ · · ·+Mn+1 ‖f‖1

(b− a)n

n!+ · · ·

= M ‖f‖1 exp (M(b− a)) <∞

convergente, não importando quão grande seja M . Consequentemente, as séries de Neu-

mann (4.5) para os núcleos integrais de Volterra sempre convergem uniformemente para a

solução de (4.3).

Núcleo integral de quadrado integrável. A condição (4.7) pode ser substituída por uma con-dição menos restritiva ∫ a

b

∫ b

a

|K(x, y)|2 dxdy < 1 . (4.8)

Sob esta condição podemos ainda dispensar qualquer hipotese de continuidade, sendo sucienteassumir que K : [a, b] × [a, b] −→ C seja quadrado integrável, isto é, pertencente ao espaço L2

correspondente ao domínio de integração [a, b] × [a, b]. Denotaremos este espaço por L2 paradistinguir do espaço de funções em [a, b] . O produto escalar e a norma em L2 e L2 são denotadospor ( , ) e ‖ ‖ e 〈 , 〉 e ‖||‖, respectivamente. Além disso, se as hipóteses sobreK forem generalizadasentão será necessário restringir a função f apropriadamente: f, |f | e |f |2 devem ser integráveis em[a, b], isto é, f pertence ao espaço L2.Seja K ∈ L2. Segue do teorema de Fubini sobre integrações sucessivas que a integral∫ b

a

|K(x, y)|2 dy

existe para quase todo x e∫ b

a

∫ b

a

|K(x, y)|2 dydx =

∫ b

a

∫ b

a

|K(x, y)|2 dxdy = ‖|K|‖2 .

COMPLEMENTOS 63

Portanto,

k(x) =

(∫ b

a

|K(x, y)|2 dy)1/2

é um elemento do espaço L2 e ‖k‖ = ‖|K|‖. Se f ∈ L2, a integral

Kf(x) :=

∫ b

a

K(x, y)f(y)dy

faz sentido para todos os pontos x para os quais k(x) é nito e dene uma função em L2: peladesigualdade de Schwarz,∣∣∣∣∫ b

a

K(x, y)f(y)dy

∣∣∣∣2 ≤ ∫ b

a

|K(x, y)|2 dy ·∫ b

a

|f(y)|2 dy = k2(x) ‖f‖2 (4.9)

e, portanto,

‖Kf‖2 =

∫ b

a

∣∣∣∣∫ b

a

K(x, y)f(y)dy

∣∣∣∣2 dx ≤ ‖k‖2 ‖f‖2 = ‖|K|‖2 ‖f‖2 . (4.10)

Como K pertence ao espaço L2, ‖|K|‖2 < ∞ e o núcleo integral K(x, y) gera a transformaçãolinear: K : f ∈ L2 −→ Kf ∈ L2 a qual satisfaz (∀f, g ∈ L2, c ∈ C)

(1) Aditividade: K (f + g) = Kf +Kg,(2) Homogeneidade: K (cf) = cKf ,(3) Quota superior: ∃M tal que ‖Kf‖ ≤ M ‖f‖ (a menor quota M é denominada norma da

transformação linear K, que denotamos por ‖K‖).

Toda transformação linear K é contínua no sentido que, se (fn)n≥1 é uma sequência de funções

em L2 convergente em média quadrática para f : ‖f − fn‖2 =

∫ b

a

|f(x)− fn(x)|2 dx → 0, então a

sequência (Kfn)n≥1 converge em média quadrática para Kf :

‖Kf −Kfn‖ = ‖K (f − fn)‖ ≤ ‖K‖ ‖f − fn‖ → 0

quando n → ∞. Por outro lado, toda transformação K que é aditiva, homogênea e contínua étambém limitada e, portanto, linear. De fato, se K nestas condições não fosse limitada, existiriauma sequência (hn)n≥1 de funções em L2 tal que

‖Khn‖ > n ‖hn‖ ,

para todo n ≥ 1. Escrevendo gn = hn/(n ‖hn‖), teríamos

‖gn‖ =1

n→ 0 e ‖Kgn‖ =

1

n ‖hn‖‖Khn‖ > 1

em contradição com a hipótese de continuidade.

COMPLEMENTOS 64

As operações de adição e multiplicação para uma transformação linearK são denidas de maneirausual:

(cK) f = cKf

(K1 +K2) f = K1f +K2f

(K1K2) f = K1 (K2f)

de onde se conclui, imediatamente, que

‖cK‖ = |c| ‖K‖‖K1 +K2‖ ≤ ‖K1‖+ ‖K2‖‖K1K2‖ ≤ ‖K1‖ ‖K2‖ .

Em particular, para iteração da transformação linear K em (4.4), temos∥∥K2∥∥ ≤ ‖K‖2

...

‖Kn‖ ≤ ‖K‖n

...

A convergência de uma sequência (Kn)n≥1 de transformações lineares para uma transformaçãolinear K pode ser denida de várias maneiras:

a. para cada f ∈ L2, Knf converge fracamente paraKf : limn→∞ (h,Knf −Kf) = 0, ∀h ∈ L2;b. para cada f ∈ L2, Knf converge fortemente (em média quadrática) para Kf , isto é,

limn→∞ ‖Knf −Kf‖ = 0;c. limn→∞ ‖Kn −K‖ = 0

Denominamos, respectivamente, a. convergência fraca, b. convergência forte (ou simplesmenteconvergência), c. convergência na norma. Obviamente, convergência forte implica convergênciafraca (basta usar a desigualdade de Schwarz). Se (Kn)n≥1 tende para K na norma então, para cadaelemento f de L2,

‖Knf −Kf‖ = ‖(Kn −K) f‖ ≤ ‖Kn −K‖ ‖f‖ → 0

quando n → ∞ e, portanto, Knf tende fortemente para Kf . Sendo, além disso, a convergênciauniforme em f , em todo subconjunto limitado de L2 (i.e. em todo conjunto de elementos f cujanorma ‖f‖ ≤ C para algum C < ∞) a convergência na norma é também chamada convergência

uniforme.Tendo introduzido estas noções preliminares, estamos prontos para demonstrar o seguinte.

Teorema 4.2. Se o núcleo integral K(x, y) satisfaz a condição (4.8), a equação integral

u−Ku = f (4.11)

tem uma única solução u pertencente a L2 para todo f pertencente a L2. Esta solução é obtida

como o limite da série de Neumann (4.5) em média quadrática e no sentido ordinário para quase

COMPLEMENTOS 65

todo ponto x. Além disso, é suciente assumir que K(x, y) pertença a L2 e que a transformação

linear K satisfaça ‖K‖ < 1.

Prova. Pela equação (4.10) e denição 3. a seguir, temos

‖K‖ ≤ ‖|K|‖ < 1 , (4.12)

pela hipótese (4.8), onde ‖K‖ denota a norma da transformação linear K no espaço L2. Vamosagora mostrar que é suciente assumir ‖K‖ < 1. Para isso, notamos que a série de Neuman

u = f +K1f + · · ·+Kn−1f + · · · (4.13)

converge em média quadática, pois

‖un − um‖ =∥∥Kmf + · · ·+Kn−1f

∥∥≤

(‖K‖m + · · ·+ ‖K‖n−1) ‖f‖

=‖K‖m − ‖K‖n

1− ‖K‖‖f‖

tende a 0 quando n,m tendem a innito, pela hipótese (4.12). O limite da série (4.13) é claramnenteum elemento de L2:

‖u‖ =∥∥f +Kf + · · ·+Kn−1f + · · ·

∥∥≤

(1 + ‖K‖+ · · ·+ ‖K‖n−1 + · · ·

)‖f‖

=1

1− ‖K‖‖f‖ <∞ (4.14)

para qualquer f pertencente a L2.Em vista da continuidade da transformação linear K,

K (limun) = limKun

= lim(Kf +K2f + · · ·+Knf

),

é permitido aplicar a transformação K à equação (4.13), no lado direito termo-a-termo:

Ku = Kf +K2f + · · ·+Knf + · · ·=

(f +Kf +K2f + · · ·+Knf + · · ·

)− f = u− f .

O elemento u de L2, representado pela série de Neumann (4.13), é portanto uma solução da equaçãointegral (4.11).A série (4.13) também converge no sentido ordinário uma vez que, pela equação (4.9), temos

|Knf(x)| ≤ k(x)∥∥Kn−1f

∥∥ ≤ k(x) ‖K‖n−1 ‖f‖

e a série (4.13) no sentido ordinário (veja (4.4) e (4.5)) é necessariamente igual ao elemento u(x)

de L2 para (quase) todo ponto x para os quais k(x) é nito pois, por hipótese (4.12), Kf deneuma função em L2.

COMPLEMENTOS 66

Sob a condição (4.12) a solução é única. Suponha, em contradição, que existam dois elementosu1 e u2 distintos de L2 tais que u1 −Ku1 = f e u2 −Ku2 = f . Então

u1 − u2 −K (u1 − u2) = 0

e‖u1 − u2‖ = ‖K (u1 − u2)‖ ≤ ‖K‖ ‖u1 − u2‖ < ‖u1 − u2‖ .

devido a ‖K‖ < 1. Temos necessariamente que ‖u1 − u2‖ = 0 e, consequentemente, u1(x) = u2(x)

para quase todo x.

4.2. Transformação inversa, valores regulares e singulares. Seja I a transformação em L2

identidade: If = f , ∀f ∈ L2 e O a transformação nula: Of = 0. Podemos escrever a equaçãointegral (4.11) como

(I −K)u = f . (4.15)

O Teorema 4.2 de existência e unicidade da solução de (4.15) estabelece, sob a condição (4.12),uma correspondência entre os elementos de L2: u e f por intermédio de uma transformação R,

u = Rf

que é aditiva, homogênea e, em virtude de (4.14), também limitada. Logo, R : L2 −→ L2 é umatransformação linear.Temos,

(I −K)Rf = (I −K)u = f , ∀f ∈ L2

e, portanto,(I −K)R = I . (4.16)

Em particular, temos

(I −K)R (I −K)h = (I −K)h, ∀h ∈ L2

que implicaR (I −K)h = h, ∀h ∈ L2

e, consequentemente,R (I −K) = I . (4.17)

Sumarizamos as equações (4.16) e (4.17) pela armação: R é a transformação inversa de I − K.Denotamos R = (I −K)−1.A inversa de uma transformação linear T qualquer, quando existe, é univocamente denida.

Quando a inversa à direita Sd: TSd = I e a inversa à esquerda Se: SeT = I de T existem sãonecessariamente iguais Sd = Se = S à inversa de T . A existência da inversa à direita não assegura,em geral, a existência da inversa à esquerda. Entretanto, se T transforma elementos distintos emelementos distintos de L2, isto é, se

Tf1 = Tf2 =⇒ f1 = f2 ,

então a equação TS = I implica que ST = I, pela mesma razão que (4.16) implica (4.17).

COMPLEMENTOS 67

Temos visto que toda transformação linear da forma I −K, onde ‖K‖ < 1, tem uma inversa aqual pode ser construída por intermédio da série de Neuman (4.13):

(I −K)−1 = I +K + · · ·+Kn−1 + · · ·

convergente em norma:∥∥(I −K)−1 −(I +K + · · ·+Kn−1

)∥∥ =∥∥∥∑

m≥nKm∥∥∥

≤∑

m≥n‖K‖m

=‖K‖n

1− ‖K‖→ 0

quando n→∞.É claro que a inversa de I−K pode existir mesmo se ‖K‖ > 1, como pode ser visto nos Exemplos

1 2. Por isso vamos introduzir um parâmetro λ ∈ C na equação (4.15), juntamente com a seguintedenição.

Denição 4.3. Considere a equação integral

(I − λK)u = f (4.18)

com λ um número complexo, f e K pertencentes respectivamente a L2 e L2. O valor λ é dito ser

regular com respeito a K se (I − λK)−1 existir. Para λ regular escrevemos

(I − λK)−1 = I + λKλ (4.19)

onde Kλé uma transformação linear em L2, univocamente denida por esta equação para todo λ

exceto λ = 0; denimos K0 = K (por continuidade). Kλ é denominada transformação resolvente.

Os valores não-regulares de λ são chamados singulares.

Aplicando o Teorema 4.2 com λK no lugar de K, concluímos

Corolário 4.4. Todo valor λ tal que |λ| < 1/ ‖K‖ é regular e

(I − λK)−1 = I + λK + · · ·+ λn−1Kn−1 + · · · , (4.20)

no sentido de convergência na norma.

Por sua denição (4.19), a transformação resolvente Kλ satisfaz

(I − λK) (I + λKλ) = (I + λKλ) (I − λK) = I

que, por sua vez, é equivalente para λ 6= 0 à equação (válida também para λ = 0)

λKKλ = λKλK = Kλ −K . (4.21)

Vamos mostrar que Kλ e Kµ comutam para quaisquer dois valores λ e µ regulares:

KλKµ = KµKλ . (4.22)

COMPLEMENTOS 68

Para isso, note que a mesma equação (4.21) é válida com λ substituído por µ. Reescrevendo (4.21)como

(Kλ −K)µKµ = (λKλK)µKµ = λKλ (µKKµ) = λKλ (Kµ −K) ,

concluímosµ (KλKµ −KKµ) = λ (KλKµ −KλK)

que juntamente com (4.21), resulta

(λ− µ)KλKµ = λKλK − µKKµ = (Kλ −K)− (Kµ −K) = Kλ −Kµ

e, em consequência,

KλKµ =Kλ −Kµ

λ− µ. (4.23)

Como o lado direito é simétrico em relação a λ e µ, equação (4.22) é deduzida desta equação.O conjunto dos valores λ regulares é, além disso, um conjunto aberto. Mais precisamente,

Proposição 4.5. Se µ é um valor regular para equação (4.18) então todos os valores λ tais que

|λ− µ| < 1

‖Kµ‖(4.24)

são regulares e temos (no sentdo de convergência na norma)

Kλ = Kµ + (λ− µ)K2µ + · · ·+ (λ− µ)n−1Kn

µ + · · · . (4.25)

Prova. Observe que, de acordo com a hipótese, λ − µ é um valor regular com respeito a trans-formação Kµ e a transformação resolvente correspondente, denotada por (Kµ)λ−µ, é representadapela série no lado direito de (4.25). Portanto, o problema se reduz a mostrar que (Kµ)λ−µ = Kλ,ou equivalentemente,

λ (Kµ)λ−µK = λK (Kµ)λ−µ = (Kµ)λ−µ −K .

Claramente, temos que (Kµ)−µ = K. Nossa asserção segue, portanto, da equação (4.23) com K

substituído por Kµ e os valores λ e µ substituídos por λ− µ e −µ:

(Kµ)λ−µK =(Kµ)λ−µ −K

λ.

Em particular, segue do desenvolvimento em série que a norma de Kλ é uma função contínua de

λ:

|‖Kλ‖ − ‖Kµ‖| ≤ ‖Kλ −Kµ‖≤ |λ− µ| ‖Kµ‖2 + · · ·+ |λ− µ|n−1 ‖Kµ‖n + · · ·

= |λ− µ| ‖Kµ‖2

1− |λ− µ| ‖Kµ‖→ 0

quando λ → µ. Além disso, se (λn)n≥1 é uma sequência de valores regulares tendendo para λ∞então, por (4.23),

‖Kλn −Kλm‖ ≤ |λn − λm| ‖Kλn‖ ‖Kλm‖ ≤ |λn − λm|M2 → 0

COMPLEMENTOS 69

para m,n→∞. A sequencia de transformações resolventes (Kλn)n≥1 satisfaz, portanto, o critériode convergência de Cauchy com respeito a convergência na norma, convergindo na norma para umatransformação linear K∞. Equação (4.21) com λ substituído por λn torna-se no limite

λ∞K∞K = λ∞KK∞ = K∞ −K

que implica que λ∞ é um valor regular e que Kλ∞ = K∞.Estes fatos podem ser sumarizados como:

Teorema 4.6. A transformação resolvente Kλ é uma função analítica regular de λ em cada ponto µ

o qual é um valor regular para K. Kλ não pode ser continuada analiticamente além deste conjunto

e quando um ponto regular se aproxima de um ponto singular a norma de Kλ diverge.

Prova. Pela Proposição 4.5, Kλ é uma função de λ analítica regular em algum ponto µ enquantosua série de potência em torno de µ tiver raio de convergência estritamente positivo que, por suavez, é garantido enquanto ‖Kµ‖ < ∞ pela equação (4.24). A Proposição 4.5 aplicada a todo µregular dene o conjunto aberto resolvente, cujos pontos aderentes de sua fronteira necessariamentedevem satisfazer ‖Kµ‖ =∞.

Núcleo integral da transformação resolvente. Vimos que toda função K(x, y) pertencente aoespaço L2 gera uma transformação linear K do espaço L2 nele mesmo, cuja norma não excedea norma de K(x, y) como um elemento de L2: ‖K‖ ≤ ‖|K|‖. Em seguida, operamos com astransformações, sem fazer uso dos núcleos que o geram. Põe-se o problema de se examinar comoestas operações com as transformações lineares podem ser interpretadas em termos de operaçõescom núcleos integrais.É evidente que se as transformações F e G são geradas por núcleos F (x, y) e G(x, y) pertencentes

a L2, então as transformações cF e F + G são geradas por núcleos cF (x, y) e F (x, y) + G(x, y),igualmente pertencentes a L2. Vamos mostrar a asserção, menos evidente, que a transformaçãoH = FG é gerada pelo núcleo

H(x, y) =

∫ b

a

F (x, z)G(z, y)dz ,

o qual também pertence a L2 e satisfaz, pela desigualdade de Schwarz (basta adaptar as fórmulas(4.9) e (4.10), veja (4.26) a seguir)

‖|H|‖ ≤ ‖|F |‖ ‖|G|‖ .

Para um elemento h de L2 arbitrário, as ações Hh e F (Gh) são denidas pelas integrais

Hh(x) =

∫ b

a

(∫ b

a

F (x, z)G(z, y)dz

)h(y)dy

e

F (Gh) (x) =

∫ b

a

F (x, z)

(∫ b

a

G(z, y)h(y)dy

)dz .

Para mostrar que estas integrais existem e são iguais uma a outra para quase todo x, evocamoso teorema de Fubini. Isso reduz a mostrar que para um ponto x = x0 não excepcional a função

COMPLEMENTOS 70

F (x0, z)G(z, y)h(y) é integrável no quadrado [a, b]× [a, b] e isso segue do fato que as funções G(z, y)

e F (x0, z)h(y) são quadrado integrável no quadrado. Para isso aplicamos a desigualdade de Schwarze notamos que G e h pertencem a L2 e L2 e F (x0, ·) a L2.Segue imediatamente destes fatos que se a transformaçãoK é gerada pelo núcleo integralK(x, y),

as transformações K2, K3, . . . , são geradas pelos núcleos integrais K(2)(x, y), K(3)(x, y), . . . , de-nominados núcleos integrais iterados e denidos pela fórmula recursiva

K(n)(x, y) =

∫ b

a

K(x, z)K(n−1)(z, y)dz , n = 2, 3, . . .

com K(1)(x, y) = K(x, y).Pela desigualdade de Schwarz,∣∣K(n)(x, y)

∣∣2 =

∣∣∣∣∫ b

a

K(x, z)K(n−1)(z, y)dz

∣∣∣∣2 ≤ ∫ b

a

|K(x, z)|2 dz∫ b

a

∣∣K(n−1)(z, y)∣∣2 dz (4.26)

e integrando em x e y, resulta∥∥∣∣K(n)∣∣∥∥ ≤ ‖|K|‖ · ∥∥∣∣K(n−1)

∣∣∥∥ ≤ · · · ≤ ‖|K|‖nao ser iterada n vêzes.Considere a série para o nucleo integral

Kλ(x, y) = K(x, y) + λK(2)(x, y) + · · ·+ λn−1K(n)(x, y) + · · · (4.27)

onde λ é um parâmetro complexo. A série é majorada na norma do espaço L2 pela série numérica

‖|Kλ|‖ ≤ ‖|K|‖+ |λ| ‖|K|‖2 + · · ·+ |λ|n−1 ‖|K|‖n + · · · .

Disso segue que, para todo valor de λ tal que

|λ| < 1

‖|K|‖(4.28)

a série (4.27) converge em média quadrática para Kλ(x, y), que é um elemento de L2.

Proposição 4.7. Os valores de λ tais que a desigualdade (4.28) é satisfeita são regulares com

respeito a transformação linear K gerada pelo núcleo integral K(x, y). A transformação resolvente

Kλ denida por (4.19) é também do tipo integral, isto é, gerada pelo núcleo integral pertencente a

L2, sendo Kλ(x, y) dado pela soma (4.27), convergente em média quadrática e no sentido ordinário,

para quase todo (x, y) ∈ [a, b]× [a, b].

Prova. A transformação linear Kλ gerada pelo núcleo integral Kλ(x, y) coincide com a transfor-mação resolvente denida por (4.19) no parágrafo anterior. De fato, a convergência em médiaquadrática da série (4.27) implica na convergência na norma da transformação linear correspon-dente

Kλ = K + λK2 + · · ·+ λn−1Kn + · · · (4.29)

e a asserção segue por comparação com (4.19) e (4.20).Além disso, sob a condição (4.28), (4.27) converge, não somente na média como no sentido

ordinário, para o mesmo limiteKλ(x, y), para quase todo (x, y). Isso segue da seguinte desigualdade,

COMPLEMENTOS 71

válida para n > 2, ∣∣K(n)(x, y)∣∣ =

∣∣∣∣∫ b

a

∫ b

a

K(x, s)K(n−2)(s, t)K(t, y)dsdt

∣∣∣∣=

∣∣(K(n−2), Hxy

)∣∣≤ ‖|K|‖n−2 ‖|Hxy|‖

onde Hxy(s, t) denota a função K(x, s)K(t, y), a qual pertence a L2 para quase todo (x, y).

A condição (4.28) é suciente, porém não necessária para a convergência da série (4.27) comopode-se ser visto pelos Exemplos 1 e 2 trocando-seK por λK na séries (4.6) seguida da multiplicaçãopor K.Entretanto, é possível que para certas transformações K o valor de λ seja regular, isto é, a trans-

formação resolvente Kλ para este λ exista, sem que a série (4.29) correspondente seja convergente.A questão que se coloca é: a transformação Kλ continua do tipo integral também nestes casos?Para respondê-la, multiplicando os dois membros da igualdade (4.19), que dene a transformação

resolvente Kλ, pela direita por K, fazendo uso em seguida da relação (4.21), obtemos

(1− λK)−1K = K + λKλK = K +Kλ −K = Kλ . (4.30)

Provaremos na próxima subseção o seguinte

Lema 4.8. Toda transformação a qual pode ser representada pelo produto TK de duas transfor-

mações lineares, sendo K do tipo integral, é também do tipo integral.

Segue do Lema 4.8 e (4.30) que, para todo valor λ regular, a transformação resolvente Kλ é dotipo integral. Observamos, de passagem, que existem transformações lineares em L2 que não sãodo tipo integral, por exemplo, a indentidade If = f . De fato, se I fosse gerada pelo núcleo integralI(x, y), teríamos então ∫ b

a

∫ b

a

f(x)I(x, y)f(y)dydx = (If, g) = (f, g) (4.31)

para todo f e g em L2. Escolhendo, em particular, f e g iguais a função característica de doisintervalos J1 e J2 disjuntos J1 ∩ J2 = ∅ arbitrários e contidos em [a, b], teremos

(f, g) = 0

enquanto que o primeiro membro de (4.31) é a integral de I(x, y) sobre o quadrado [a, b] × [a, b]

no plano xy cujos lados são paralelos aos eixos e não interseptam a diagonal x = y. Portanto,a integral é nula sobre todo o quadrado e, consequentemente, I(x, y) = 0 para quase todo (x, y)

neste, que é impossível para uma função.

COMPLEMENTOS 72

4.3. Aproximação por núcleos integrais de posto nito. Uma classe particularmente simplesde transformações lineares em L2 é formada pelas assim ditas transformações de posto nito,representadas na forma

Kf =r∑i=1

(f, ψi)ϕi (4.32)

onde ϕ1, ϕ2, . . . , ϕr e ψ1, ψ2, . . . , ψr são elementos do espaço L2 dados. Cada transformação deposto nito é do tipo integral com núcleo integral

K(x, y) =r∑i=1

ϕi(x)ψi(y) (4.33)

sendo que este núcleo é dito ser de posto nito. O núcleo integral de posto nito é, claramente,um elemento do espaço L2. Além disso, podese passar de núcleos de posto nito para núcleopertencentes a L2 em geral, fazendo uso do seguinte

Teorema 4.9. Todo núcleo integral K(x, y) pertencente a L2 pode ser aproximado, tão bem quanto

se deseja, por um núcleo integral de posto nito, onde a aproximação se dá no sentido da métrica

em L2, isto é, em média quadrática: dado ε > 0, existe R = R(ε) tal que para todo r > R, existe

Kr representado na forma (4.32) tal que

‖|K −Kr|‖ < ε .

Prova. Sabemos que a séries de Fourier em ambas variáveis x e y de uma funçãoK : [a, b]×[a, b] −→C quadrado integrável converge em média para esta função. Basta então tomar a série parcial comíndice (número de termos) sucientemente grande.

Se preferir, há uma outra prova que não faz menção a séries de Fourier. Consulte para isso o

texto "Functional Analysis"de Frigyes Riesz e Béla Sz.-Nagy, Seção 69. Prosseguiremos com duasaplicações deste resultado. Iniciaremos com a seguinte prova concernente à transformação linearTK ser do tipo integral se T é limitada e K é gerada pelo núcleo integral K(x, y) pertencente aL2.Prova do Lema 4.8. Seja (Kn(x, y))n≥1 uma sequência de núcleos integrais de posto nito da forma

Kn(x, y) =rn∑i=1

ϕn,i(x)ψn,i(y) ,

convergente em média para K(x, y). Seja χn,i = Tϕn,i e escreva

Hn(x, y) =rn∑i=1

χn,i(x)ψn,i(y) .

Para y ∈ [a, b] xo, Kn(x, y) e Hn(x, y) são elementos de L2 e, além disso,

Hn(x, y) = TKn(x, y) , ∀y .

COMPLEMENTOS 73

Consequentemente,∫ b

a

|H(x, y)−Hn(x, y)|2 dx = ‖T‖2

∫ b

a

|K(x, y)−Kn(x, y)|2 dx

e tomando a integral com respeito a y, temos

‖|H −Hn|‖2 ≤ ‖T‖2 ‖|K −Kn|‖2 .

Pelo Teorema de RieszFischer da convergência em média, Teorema 4.9, a convergência em médiade (Kn(x, y))≥1 para K(x, y) implica a convergência em média de (Hn(x, y))≥1 para, digamos,H(x, y). Denotando a transformação linear correspondente por H, temos

‖H −Hn‖ ≤ ‖|H −Hn|‖ −→ 0

e‖TK − TKn‖ ≤ ‖T‖ ‖K −Kn‖ ≤ ‖T‖ ‖|K −Kn|‖ −→ 0 ,

quando n tende a ∞.Por outro lado, para cada elemento f ∈ L2, temos

Hnf =rn∑i=1

(f, ψn,i)χn,i

= Trn∑i=1

(f, ψn,i)ϕn,i = T (Knf)

e, consequentemente,Hn = TKn e H = TK ,

o que prova que a transformação TK é gerada pelo núcleo integral H(x, y), concluindo a demons-tração.

Como segunda aplicação do teorema da aproximação vamos mostrar que núcleos integrais distin-

tos geram sempre transformações lineares distintas, quase certamente, no sentido que se K1(x, y) eK2(x, y) diferem em apenas um conjunto nulo do plano, então K1 ≡ K2.É suciente mostrar que a transformação K gerada pelo núcleo integral K(x, y) não pode ser

igual a transformação nula O (denida por Of = 0 para qualquer f ∈ L2) a não ser que K(x, y)

é quase certamente zero. Suponha, por absurdo, que K = O. Então, para duas funções f , g ∈ L2

arbitrárias e F (x, y) = g(x)f(y) em L2, temos

(K,F ) =

∫ b

a

∫ b

a

K(x, y)F (x, y)dxdy

=

∫ b

a

(∫ b

a

K(x, y)f(y)dy

)g(x)dx = (Kf, g) = 0 .

Segue que K(x, y) é ortogonal a todos os núcleos integrais de posto nito e, como estes são densosem L2 pelo Teorema 4.9, K(x, y) é ortogonal a si próprio: ‖|K|‖2 = (K,K) = 0, implicando queK(x, y) = 0 quase certamente e concluindo a demonstração da armação.

COMPLEMENTOS 74

4.4. Alternativa e determinante de Fredholm.Equação integral com núcleo de posto nito. No caso em que o núcleo integral K(x, y) é deposto nito (4.33), o estudo da equação integral

f −Kf = g (4.34)

reduz-se ao estudo de um sistema linear de equações algébricas. Sem perda de generalidade, pode-mos assumir que as ϕi(x)'s em (4.33) formam um conjunto de funções L. I. e assumimos o mesmodas ψi(x)'s.A equação (4.34) é da forma

f −r∑i=1

(f, ψi)ϕi = g (4.35)

e toda solução f desta equação pode ser escrita como

f = g +r∑j=1

ξjϕj (4.36)

com constantes numéricas ξj's a serem determinadas pela equação. Substituindo (4.36) em (4.35),resulta uma relação linear homogênea das ϕj(x)'s

r∑j=1

(ξj − (g, ψj)−

r∑i=1

(ϕi, ψj) ξi

)ϕj = 0

que implica, por serem L. I., que todos os coecientes desta relação devem se anular. Consequen-temente, os coecientes ξj's da expansão (4.36) de uma solução f de (4.35) satisfazem um sistemade equações algébricas

ξj −r∑i=1

cijξi = ηj , j = 1, . . . , r, (4.37)

onde

cij = (ϕi, ψj)

ηj = (g, ψj) .

No outro sentido, cada solução (ξj)rj=1 do sistema (4.37) fornece, por meio de (4.36), uma solução

f da equação (4.35).Escrevendo as matrizes r×r identidade I = [δij]

ri,j=1 e C = [cij]

ri,j=1 e vetor η = [ηj]

rj=1, a equação

(4.37) na forma matricial(I − C) ξ = η (4.38)

tem uma única solução ξ = [ξj]rj=1, se o determinate d := det (I − C) 6= 0 de (I − C) é diferente de

0, dada pela fórmula de Cramer

ξi =1

d

r∑j=1

d

(i

j

)ηj , i = 1, . . . , r , (4.39)

COMPLEMENTOS 75

onde d

(i

j

)denota o menor da matriz I − C em relação a entrada ij, isto é, o determinante de

I − C com a iésima e jésima coluna subtraídas. Para isso, note que

ξ = (I − C)−1 η

=1

dAdj (I − C)η (4.40)

é a única solução ξ de (4.38) quando d 6= 0. A matriz adjunta Adj (A) de uma matriz A é a

transposta da matriz dos cofatores de A: Adj (A) = Cof(A)T , com Aij = (−1)i+jd

(i

j

)o cofator de

A em relação a entrada ij, reproduzindo assim a regra de Cramer (4.39) (VERIFICAR!).A única solução de (4.34) é portanto

f = g +1

d

r∑i,j=1

d

(i

j

)(g, ψj)ϕi = (I +K1) g (4.41)

sendo K1 uma transformação linear com núcleo integral

K1(x, y) =1

d

r∑i,j=1

d

(i

j

)ϕi(x)ψj(y) .

Em particular, a equação integral homogênea

f −r∑i=1

(f, ψi)ϕi = 0 (4.42)

ou sua equivalente equação algébrica,

ξj −r∑i=1

cijξi = 0 , j = 1, . . . , r, (4.43)

tem como única solução a trivial: f = 0 ou ξi = 0, i = 1, . . . , r.Por outro lado, quando d = 0, tanto (4.42) como (4.43) admitem soluções não identicamente

nulas, o número de soluções L. I. sendo igual a nulidade da matriz (I − C), isto é, a diferençaentre a ordem r e o seu posto.Considere a equação integral adjunta de (4.34) 3,

f ′ −K∗f ′ = g′ (4.44)

onde o núcleo integral K∗(x, y) da transformação adjunta K∗ é adjunto do núcleo integral K(x, y)

de acordo com a relaçãoK∗(x, y) = K(y, x) ,

isto é,

K∗(x, y) =r∑i=1

ψi(x)ϕi(y) .

3O linha nas funções f e g signica apenas outras funções f ′ e g′ da mesma classe. A equação adjunta quando Ktem posto nito é da forma (4.45) (compare com 4.42).

COMPLEMENTOS 76

Como anteriormente, introduzimos as quantidades correspondentes: a matriz C∗ =[c∗ij]de

ordem r, e os determinantes d∗ e d∗(i

j

)da matriz I − C∗ e de I − C∗ com a iésima linha e

jésima coluna removidas. Temos

c∗ij = (ψi, ϕj) = (ϕj, ψi) = cji

de onde segue que d∗ = d, d∗(i

j

)= d

(i

j

)e que as duas matrizes I − C e I − C∗ tem a mesma

nulidade. Consequentemente, quando d 6= 0 temos d∗ 6= 0 e a equação (4.44) tem uma únicasolução f ′ para qualquer g′ pertencente a L2, enquanto que quando d = d∗ = 0, a equação (4.42) ea equação

f −r∑i=1

(f, ϕi)ψi = 0 (4.45)

tem o mesmo número ν, ν ≥ 1, de soluções L. I..Para certos g's, equação (4.34) tem uma solução mesmo se d = 0, a saber, quando g é ortogonal

a todas as soluções de (4.45). De fato, escrevendo

f = g +r∑j=1

ξjϕj , f ′ =r∑j=1

ξ′jϕj , ηj = (g, ψj)

passamos para o sistema de equações algébricas

ξj −r∑i=1

cijξi = ηj , (4.46)

ξ′j −r∑i=1

cijξ′i = 0 j = 1, . . . , r, (4.47)

e observamos que a ortogonalidade entre g e f ′ é equivalente à entre os vetores η = [ηj]rj=1 e

ξ′ =[ξ′j]rj=1

:

(g, f ′) =(g,∑r

j=1ξ′jψj

)=∑r

j=1ξ′j (g, ψj) =

∑r

j=1ξ′jηj = η · ξ .

e o problema se reduz a um bem conhecido teorema de álgebra para um sistema de equações: asolução ξ = [ξj]

rj=1 de (4.46) existe se, e somente se, o vetor η = [ηj]

rj=1 é ortogonal a todas as

soluções ξ′ =[ξ′j]rj=1

do sistema adjunto homogêneo (4.47).Resumindo,

Teorema 4.10 (alternativa de Fredholm). Ou as equações integrais (I) f − Kf = g e (I*)

f ′−K∗f ′ = g′ cujos núcleos integrais são, respectivamente, K(x, y) e K∗(x, y) = K(y, x), têm uma

única solução, f e f ′, quaisquer que sejam g e g′ (têm a única solução f = 0 e f ′ = 0 quando g = 0

e g′ = 0), ou as equaçõs homogêneas (H) ϕ − Kϕ = 0 e (H*) ϕ′ − K∗ϕ′ = 0 tem soluções não

identicamente nulas, o número ν de soluções L. I. é nito e mesmo para (H) e (H*).

No segundo caso, a condição necessária e suciente para que (I) e (I*) tenham soluções é que

g seja ortogonal a todas soluções ϕ's de (H*) e que g′ seja ortogonal a todas soluções ϕ′'s de (H).

COMPLEMENTOS 77

Veremos a seguir que a alternativa de Fredholm, expressa no enunciado do Teorema 4.10, semantém inalterada para equações integrais cujo núcleo não é de posto nito.Consideremos agora equações integrais

f − λKf = g (4.48)

com um parâmetro λ ∈ C. Vamos substituir nos cálculos anteriores K(x, y) por λK(x, y); a matriz

C será substituída por λC e o determinante d e seus menores d

(i

j

)tornar-se-ão polinômios em λ,

denotados respectivamente por d(λ) e d

(i

j, λ

). Como d(0) = 1, d(λ) não é identicamente nulo

e possuem no máximo um número nito ≤ r de raízes, λ1, . . . , λν . Todos os valores de λ diferentesdestes zeros são regulares e o núcleo resolvente é igual a

K1(x, y) =1

d

r∑i,j=1

d

(i

j, λ

)ϕi(x)ψj(y) .

Os valores λ1, . . . , λν são singulares, pois para estes valores a equação (4.48) não pode ser resolvidapara todos os g's e, consequentemente, a transformação I − λK não possue uma inversa. Para

uma equação integral com núcleo de posto nito existem no máximo um número nito de valores

singulares; o núcleo integral da tranformação resolvente é uma função racional do parâmetro λ aqual tem pólos nestes valores singulares.Determinantes de Fredholm. Ivar Fredholm4 foi o primeiro a propor um método de resoluçãode equações integrais da forma

f(x)− λ∫ b

a

K(x, y)f(y)dy = g(x) (4.49)

sob a hipótese que K : [a, b]× [a, b] −→ C é uniformemente contínuo. Fredholm parte da idéia, jáutilizada por Volterra, de substituir a integral em (4.49) por uma soma∫ b

a

K(x, y)f(y)dy −→n∑j=1

K(x, ξj)f(ξj)h

e considerar a equação (4.49) apenas nos pontos x = ξi, i = 1, . . . , n, igualmente espaçados porh = (b− a)/n no intervalo [a, b]:

ξi = a+ ih , i = 1, . . . , n .

A equação integral torna-se um sistema de equações lineares algébricas para as variáveis desconhe-cidas fi = f(ξj), j = 1, . . . , n:

fi − λhn∑j=1

kijfj = gi , i = 1, . . . , n , (4.50)

4Sur une nouvelle méthode pour la résolution du problème de Dirichlet, Vetenskaps-Academiens Förh. Stockholm,3946 (1900); Sur une classe d'équations fonctionnelles, Acta Math. 27, 365390 (1903)

COMPLEMENTOS 78

onde kij = K(ξi, ξj) e gi = g(ξi) são as entradas de uma matriz K = [kij]ni,j=1 e as componentes

do vetor g = (g1, . . . , gn), ambos de ordem n. Se f = (f1, . . . , fn) denota o vetor das incógntas,o sistema de equações (4.50) na forma matricial pode ser escrito como (note a semelhança com(4.38))

(I − λhK)f = g ,

cuja solução f = (I − λhK)−1 g será obtida por intermédio de uma fórmula para inversa (I − λhK)−1

análoga a (4.40), isto é, a razão entre a transposta da matriz dos cofatores e o determinante damatriz em um sentido mais amplo como veremos a seguir.Observamos primeiramente que o determinante da matriz I − λhK é um polinômio de ordem n

em λh que pode ser desenvolvido de acordo com a seguinte fórmula:

Proposição 4.11. Com d(λ) = det (I − λhK), temos

d(λ) = 1− λhn∑i=1

kii +λ2h2

2!

n∑i,j=1

∣∣∣∣∣ kii kijkji kjj

∣∣∣∣∣− · · ·+

+ (−1)nλnhn

n!

n∑i1,...,in=1

∣∣∣∣∣∣∣∣∣∣ki1i1 ki1i2 · · · ki1in

ki2i1 ki2i2. . . ki2in

......

......

kini1 kini2 · · · kinin

∣∣∣∣∣∣∣∣∣∣. (4.51)

Prova. Para obter (4.51), empregaremos a clássica fórmula do determinante

d(λ) =∑π

(−1)|π| (I − λhK)1π1· · · (I − λhK)nπn (4.52)

onde o somatório é sobre todas as permutações π =

(1 2 . . . n

π1π2 . . . πn

)do conjunto de índices In =

1, 2, . . . , n e (−1)|π| indica o sinal da permutação, com |π| denotando o número de permuta-ção elementares (transposições), entre pares de índices, de In necessária para tornar a sucessãoπ1π2 . . . πn na ordem natural 1 2 . . . n. Notamos que |π| não é unívoca e o sinal da permutaçãoindepende da maneira que é realizada a contagem. Para estas e outras noções utilizadas na prova,veja Caps. 1 e 4 de Álgebra exterior de Elon L. Lima.Desenvolvendo o produto de elementos da matriz I−λhK em (4.52), juntamente com I = [δij]

ni,j=1

onde δij = 0 se i 6= j e δii = 1, obtemos

d(λ) = 1−∑π

(−1)|π|

(λh

n∑i=1

kiπi∏j 6=i

δj,πj+

+λ2h2∑

1≤i<j≤n

kiπikjπj∏

k 6=i,j

δk,πk − · · ·+ (−1)n λnhnk1π1 · · · kinin

(4.53)

que ainda não tem a forma (4.51) devido as somas sobre os índices dos λhKiπi 's que aparecem naexpansão estarem ordenados para evitar contagem repetida de termos. Para que os índices das

COMPLEMENTOS 79

somas percorram todos os valores em In, observe que o coeciente∑π

(−1)|π|∑

1≤ii<···<ik≤n

ki1πi1 · · · kikπik∏

k 6=i1,...,,ik

δk,πk

de (−1)kλkhk, para algum k ∈ In, é da forma

∑1≤ii<···<ik≤n

∑π

(−1)|π|ki1πii · · · kikπik =∑

1≤ii<···<ik≤n

∣∣∣∣∣∣∣∣∣∣ki1i1 ki1i2 · · · ki1ik

ki2i1 ki2i2. . . ki2ik

......

......

kiki1 kiki2 · · · kikik

∣∣∣∣∣∣∣∣∣∣=

1

k!

n∑i1,...,ik=1

∣∣∣∣∣∣∣∣∣∣ki1i1 ki1i2 · · · ki1ik

ki2i1 ki2i2. . . ki2ik

......

......

kiki1 kiki2 · · · kikik

∣∣∣∣∣∣∣∣∣∣onde a soma sobre π percorre as permutações π =

(i1 i2 . . . ikπi1 πi2 . . . πik

)do conjunto de índices reduzidos

i1, i2, . . . , ik, fazendo com que a soma resulte um determinante, isto é, algum menor de K daordem k. Como o determinante de uma matriz é a única função multilinear antisimétrica porpermutações de suas linhas e/ou colunas, se anulando portanto quando duas ou mais linhas oucolunas forem repetidas, podemos substituir a soma ordenada nos índices pela soma irrestrita,dividindo pela multiplicidade k! dos termos que não se anulam, em correspondência com o númerode permutações do conjunto i1, i2, . . . , ik de índices reduzidos. Note que toda vez que transpomosum par de linhas transpomos igualmente o par correspondente de colunas, mantendo com isso osinal do determinante e concluindo a prova da proposição.

Sendo p(λ) um polinômio não identicamente 0, pois p(0) = 1, o sistema (4.50) tem uma única

solução f = (f1, . . . , fn) para todo λ, com exceção de no máximo um número nito de valores≤ n; além disso, a solução f tem a forma de n razões cujo denominador é o determinante d(λ) e onumerador determinantes construídos a partir dos menores de K e das coordenadas gi de g.No lugar de investigar se a solução de (4.50) tende, quando n→∞, para um limite e se este, por

sua vez, fornece a solução de (4.49), Fredholm utilizou a fórmula clássica algébrica somente paradeduzir a partir desta, por uma passagem puramente formal de n para ∞, uma expressão a qualele mostrou de uma maneira direta convergir e fornecer a solução de (4.49).Para simplicar as expressões, introduzimos a notação

K

(x1x2 . . . xny1y2 . . . yn

)=

∣∣∣∣∣∣∣∣∣∣K (x1, y1) K (x1, y2) · · · K (x1, yn)

K (x2, y1) K (x2, y2). . . K (x2, yn)

......

......

K (xn, y1) K (xn, y2) · · · K (xn, yn)

∣∣∣∣∣∣∣∣∣∣

COMPLEMENTOS 80

e observamos que este determinante muda de sinal pela troca de posição entre quaisquer par devariáveis xi e xk ou de variáveis yi e yk e, consequentemente, permanece inalterado quando se aplicaum número par de transposições deste tipo. Em particular, o determinante permanece inalterado

por permutações quaisquer dos elementos

(xiyi

).

Os coecientes de λm/m! na expansão (4.51) podem ser escritos de maneira mais compacta como

hmn∑

i1,...,in=1

K

(ξi1ξi2 . . . ξimξi1ξi2 . . . ξim

)e esta soma tem como limite formal, quando h→ 0, as integrais de Riemann multiplas∫ b

a

∫ b

a

· · ·∫ b

a

K

(ξ1ξ2 . . . ξmξ1ξ2 . . . ξm

)dξ1dξ2 . . . dξm .

O limite formal do determinante (4.51) é então dado pela série completa

d(λ) = 1− λ∫ b

a

K

(ξ1

ξ1

)dξ1 +

λ2

2!

∫ b

a

∫ b

a

K

(ξ1ξ2

ξ1ξ2

)dξ1dξ2 − · · ·+

+ (−1)nλn

n!

∫ b

a

∫ b

a

· · ·∫ b

a

K

(ξ1ξ2 . . . ξnξ1ξ2 . . . ξn

)dξ1dξ2 . . . dξn + · · · . (4.54)

Primeiramente, observamos que esta série é convergente em valor absoluto para todo λ ∈ C.Para mostrar isso, usaremos o fato que o determinante de ordem n de uma matriz cujos elementossão limitados, em valor absoluto, por M é no máximo Mnnn/2. Este resultado é um Corolário dadesigualdade de Hadamard, a qual será demonstrada mais adiante.Disso segue, juntamente com max |K(x, y)| < M , que a série (4.54) é estimada pela seguinte

série majorante

|d(λ)| ≤∞∑n=0

nn/2

n!Mn(b− a)n |λ|n (4.55)

que converge pelo teste da razão, uma vez que

1

n+ 1

(n+ 1)(n+1)/2

nn/2M(b− a) |λ| = (1 + 1/n)n/2√

n+ 1M(b− a) |λ| ≤

√e

n+ 1M(b− a) |λ| < 1

quaisquer que sejaM , b−a e |λ|, se n for suciente grande. A série (4.54), não sendo identicamente0 por d(0) = 1, é uma função inteira de λ denominada determinante de Fredholm.O limite formal para a clássica fórmula algébrica para o numerador da solução de (4.50) leva a

um núcleo integral, similar a K1 na expressão (4.41), na forma de uma série

K

(x

y

)− λ

∫ b

a

K

(xξ1

yξ1

)dξ1 +

λ2

2!

∫ b

a

∫ b

a

K

(xξ1ξ2

yξ1ξ2

)dξ1dξ2 − · · ·+

+ (−1)nλn

n!

∫ b

a

∫ b

a

· · ·∫ b

a

K

(xξ1ξ2 . . . ξnyξ1ξ2 . . . ξn

)dξ1dξ2 . . . dξn + · · · (4.56)

que converge para todo λ ∈ C, pela mesma razão que d(λ) converge; a soma d

(x

y

)(λ) é chamada

de menor de Fredholm. Desenvolvendo cada termo desta expressão por Laplace em relação a

COMPLEMENTOS 81

primeira linha, obtemos

K

(xξ1ξ2 . . . ξnyξ1ξ2 . . . ξn

)= K

(x

y

)K

(ξ1ξ2 . . . ξnξ1ξ2 . . . ξn

)−K

(x

ξ1

)K

(ξ1ξ2 . . . ξnyξ2 . . . ξn

)+K

(x

ξ2

)K

(ξ1ξ2 . . . ξnyξ1 . . . ξn

)−

− · · ·+ (−1)nK

(x

ξn

)K

(ξ1ξ2 . . . ξnyξ1 . . . ξn−1

)= K

(x

y

)K

(ξ1ξ2 . . . ξnξ1ξ2 . . . ξn

)−K

(x

ξ1

)K

(ξ1ξ2 . . . ξnyξ2 . . . ξn

)−K

(x

ξ2

)K

(ξ2ξ1 . . . ξnyξ1 . . . ξn

)−

− · · · −K(x

ξn

)K

(ξnξ1 . . . ξn−1

yξ1 . . . ξn−1

)e como a variável em uma integral denida pode ser denotada por qualquer outra letra, segue destaexpressão que∫ b

a

∫ ba· · ·∫ baK

(xξ1ξ2 . . . ξnyξ1ξ2 . . . ξn

)dξ1dξ2 . . . dξn = K

(x

y

)∫ ba

∫ ba· · ·∫ baK

(ξ1ξ2 . . . ξnξ1ξ2 . . . ξn

)dξ1dξ2 . . . dξn−

−n∫ ba

∫ ba· · ·∫ baK

(x

z

)K

(zξ1 . . . ξn−1

yξ1 . . . ξn−1

)dzdξ1dξ2 . . . dξn−1 .

Comparando (4.54) com (4.56), juntamente com a expressão acima, concluímos que d

(x

y

)=

d

(x

y

)(λ) satisfaz a seguinte equação integral

d

(x

y

)= K(x, y)d+ λ

∫ b

a

K(x, z)d

(z

y

)dz .

Por um cálculo análogo, partindo do desenvolvimento de K

(xξ1ξ2 . . . ξnyξ1ξ2 . . . ξn

)por Laplace em relação

a primeira coluna, fornece a seguinte relação

d

(x

y

)= K(x, y)d+ λ

∫ b

a

d

(x

z

)K(z, y)dz .

Estas duas relações expressam o fato que

1

dd

(x

y

)coincide com o núcleo integral do resolvente Kλ(x, y) associado ao núcleo K(x, y) (veja, para isso,equações (4.18), (4.19) e (4.29)), para todos valores de λ para os quais d(λ) 6= 0. Estes valoressão regulares com respeito a K(x, y). Por outro lado, os zeros de d(λ) são valores singulares. De

fato, um zero λ0 de d(λ) é um polo de Kλ(x, y), pois d

(x

y

)(λ) não é divisível por (λ− λ0), uma

imediata consequência da relação

− d′(λ) =

∫ b

a

d

(x

x

)(λ) dx . (4.57)

COMPLEMENTOS 82

Suponha por contradição que d

(x

y

)(λ) é divisível por (λ− λ0). Então o lado direito de (4.57)

deve se anular em λ = λ0 embora o lado esquerdo da (4.57), sendo limλ→λ0 d(λ)/(λ − λ0) =

limλ→λ0(d(λ) − d(λ0))/(λ − λ0) = d′(λ0) 6= 0, assumindo por simplicidade λ0 um zero simples ded(λ), não se anula neste valor. Para provar a relação (4.57), diferenciamos termo-a-termo a série(uniformemente convergente) (4.54) em λ e integramos termo-a-termo (4.56), com y = x, em x

sobre o intervalo [a, b]. Concluindo: os valores singulares são precisamente os zeros da funçãointeira d(λ); estes por sua vez ou são em número nito ou enumeráveis, não possuindo ponto deacumulação nito.É possível estender o método de solução de Fredholm, e ele próprio fez isso, para o caso que λ

é um valor singular. Porém as fórmulas são menos elementares por envolver menores de ordemsuperior. Notamos, como consequência de (4.57), uma fórmula interessante

− (log d(λ))′ =1

d(λ)

∫ b

a

d

(x

x

)(λ) dx

=

∫ b

a

K(x, x)dx+ λ

∫ b

a

K(2)(x, x)dx+ · · ·+ λn−1

∫ b

a

K(n)(x, x)dx+ · · ·

válida no maior círculo no plano complexo de centro na origem e que não contenha valores sin-

gulares em seu interior. A segunda igualdade segue da substituição d

(x

x

)(λ)/d(λ) = Kλ(x, y) e

de sua expansão em série de Neumann (4.27), a qual é uniformemente convergente. Uma últimaobservação: a hipótese que K(x, y) é uma função continua e [a, b] × [a, b] pode ser enfraquecidapara uma função limitada e integrável para quase todo ponto. Para a versão fraca é necessário acondição adicional que K(x, x) = 0 em [a, b] pois integrabilidade de K(x, y) em [a, b] × [a, b] nãogarante integrabilidade na diagonal x = y.Desigualdade de Hadamard. Demonstraremos agora uma desigualdade para determinantes,cujo Corolário foi utilizado para estimar a série em λ do determinante de Fredholm (4.54) poruma série majorante (4.55), uniformemente convergente.

Teorema 4.12. Se C = [cij]ni,j=1 é uma matriz n × n com entradas ckl = akl + ibkl em C então o

determinante |C| de C satisfaz

|C| ≤ A1A2 · · ·An (4.58)

onde

Ak =

√∑n

l=1|ckl|2 =

√∑n

l=1

(|akl|2 + |bkl|2

).

Com exceção do caso obvio quando o lado direito de (4.58) é zero, a igualdade de (4.58) é atingida

somente quando os vetores nas linhas de C forem aos pares ortogonais:n∑k=1

cikcjk = 0 , para i 6= j .

Prova. Se o lado direito de (4.58) não é zero, o problema pode ser reduzido ao caso onde asquantidades Ak's são iguais a 1, dividindo os elementos de matriz ck,l, l = 1, . . . , n, da késimalinha por Ak.

COMPLEMENTOS 83

O determinante |C| é uma função contínua das 2n2 variáveis akl's e bkl's as quais variam em umdomínio limitado caracterizado pelas condições A1 = 1, A2 = 1, . . . , An = 1. Uma função contínuaem um domínio limitado atinge seu máximo valor |C|∗ = |C∗| em certos valores c∗ij. O máximovalor |C|∗ é certamente ≥ 1 pois a matriz identidade I = [δkl]

nk,l=1 tem determinate |I| = 1 e satisfaz

A1 = · · · = An = 1.Armamos que o determinante extremal |C|∗ tem os vetores de suas linhas ortogonais aos pares.

Para mostrar isso, basta considerar apenas duas linhas i e j. Vamos mostrar que a hipótese que

Sij =n∑k=1

c∗ikc∗jk 6= 0

leva a uma contradição. Partindo de |C|∗, construímos um determinante |C|′ = |C ′| cujos elementosc′kl da matriz C ′ são idênticos aos elementos c∗kl da matriz C∗exceto por aqueles na jésima linha:c′jl 6= c∗jl, l = 1, . . . , n, que denimos como sendo uma combinação linear das iésima e jésimalinhas de C∗:

c′jl = λc∗il + µc∗jl .

As quantidades λ e µ são determinadas por duas condições: (i) ortogonalidaden∑k=1

c∗ikc′jk = 0

e (ii) normalizaçãon∑k=1

∣∣c′jk∣∣2 = 1 .

Da condição (i) deduzimos que λ+ Sijµ = 0; da condição (ii) deduzimos que

|λ|2 + λµSij + λµSij + |µ|2 = 1 .

Substituindo a primeira na segunda, resulta(1− |Sij|2

)|µ|2 = 1

ou seja, |µ| > 1. Mas, escolhendo µ positivo, temos |C|′ = µ |C|∗ > |C|∗uma contradição com ofato que |C∗| é o máximo valor de |C|.Como as linhas de C∗ são ortogonais, temos

|C|∗ |C|∗ = |C∗|∣∣∣(C∗)T ∣∣∣ =

∣∣∣C∗ (C∗)T ∣∣∣ =∣∣∣[c∗ik] [c∗jk]T ∣∣∣ =

∣∣∣[∑n

k=1c∗ikc

∗jk

]∣∣∣ = |[δij]| = 1 ,

concluindo a demonstração do teorema.

top related