analiza matematyczna ii

Uniwersytet Jana Kochanowskiego w KielcachWydział Matematyczno-Przyrodniczy

Instytut Matematyki

Dr hab. prof. UJK Grzegorz Łysik

Analiza Matematyczna IISkrypt wykładów

Kielce, 2012.

1

1 Funkcje wielu zmiennych

1.1 Przestrzeń Rn i jej podzbiory

1. Niech n będzie liczbą naturalną. Przestrzeń Rn jest iloczynem kartezjańskim negzemplarzy prostej rzeczywistej R tzn. Rn = R× · · · × R. Punkt x należący do Rn

posiada n współrzędnych, czyli x = (x1, . . . , xn). Punkty przestrzeni Rn nazywamyteż wektorami. Przestrzeń Rn jest przestrzenią liniową z naturalnymi działaniamidodawania wektorów i mnożenia przez liczbę rzeczywistą

x + y = (x1 + y1, . . . , xn + yn) dla x, y ∈ Rn;

λx = (λx1, . . . , λxn) dla λ ∈ R, x ∈ Rn.

W przestrzeni Rn wprowadza się normę euklidesową l2 wektora x ∈ Rn wzorem

‖x‖ = ‖x‖2 =√

x21 + · · ·+ x2

n.

Norma euklidesowa spełnia następujące warunki

• 1. ‖x‖ = 0 wtedy i tylko wtedy, gdy x = 0;

• 2. ‖λx‖ = |λ|‖x‖;• 3. ‖x + y‖ ≤ ‖x‖+ ‖y‖.Wykażemy, że norma euklidesowa spełnia warunek 3. W tym celu należy wykazać,

że dla dowolnych xi, yi ∈ R, i = 1, . . . , n zachodzi nierówność√√√√

n∑i=1

(xi + yi)2 ≤√√√√

n∑i=1

x2i +

√√√√n∑

i=1

y2i . (1)

Ponieważ wyrażenia podpierwiastkowe są nieujemne nierówność powyższa jest rów-noważna z nierównością

n∑i=1

(xi + yi)2 ≤

(√√√√n∑

i=1

x2i +

√√√√n∑

i=1

y2i

)2

=n∑

i=1

x2i +2

√√√√n∑

i=1

x2i ·

√√√√n∑

i=1

y2i +

n∑i=1

y2i . (2)

Korzystając z tożsamości∑n

i=1(xi+yi)2 =

∑ni=1 x2

i +2∑n

i=1 x2i y

2i +

∑ni=1 y2

i , wystarczyzatem wykazać nierówność Cauchy’ego

n∑i=1

xiyi ≤√√√√

n∑i=1

x2i ·

√√√√n∑

i=1

y2i . (3)

W tym celu zdefiniujmy funkcję zmiennej rzeczywistej t

f(t) =n∑

i=1

(xit + yi)2 =

( n∑i=1

x2i

)t2 + 2

( n∑i=1

xiyi

)t +

n∑i=1

y2i . (4)

2

Ponieważ funkcja f jest nieujemną funkcją kwadratową jej wyróżnik musi być niedo-datni, czyli ( n∑

i=1

xiyi

)2

−( n∑

i=1

x2i

) ·( n∑

i=1

y2i

)≤ 0. (5)

Stąd wynika nierówność (3).W przestrzeni Rn wprowadzamy metrykę euklidesową wzorem

ρ(x, y) = ‖x− y‖2 =

√√√√n∑

i=1

(xi − yi)2 dla x, y ∈ Rn

Metryka ρ jest nieujemną funkcją na iloczynie kartezjańskim Rn × Rn spełniającąwarunki

• 1. ρ(x, y) = 0 wtedy i tylko wtedy, gdy x = y;

• 2. ρ(x, y) = ρ(y, x);

• 3. ρ(x, z) ≤ ρ(x, y) + ρ(y, z).

Ostatni warunek jest nazywany nierównością trójkąta. Wynika on z warunku 3.normy.

Użyteczne jest także wprowadzenie normy l1 i normy l∞ wektora x ∈ Rn,

‖x‖1 = |x1|+ · · ·+ |xn|,‖x‖∞ = max|x1|, . . . , |xn|.

Pomiędzy normami ‖x‖1, ‖x‖2 i ‖x‖∞ zachodzą nierówności

‖x‖∞ ≤ ‖x‖2 ≤ ‖x‖1;

‖x‖1 ≤√

n‖x‖2 ≤ n‖x‖∞.

3

Def. Otwartą kulą euklidesową o środku x ∈ Rn i promieniu r > 0 nazywamyzbiór

B(x, r) = x ∈ Rn : ρ(x, x) < r.Def. Prostopadłościanem lub kostką nazywamy zbiór

P (a, b) = x ∈ Rn : ai < xi < bi, i = 1, ..., n, gdzie a < b.

Def. Sympleksem nazywamy zbiór

S(r) = x ∈ Rn : x1 > 0, ..., xn > 0, x1 + · · ·+ xn < r, gdzie r > 0.

Def. Zbiór Ω ⊂ Rn nazywamy otwartym jeśli dla dowolnego x ∈ Ω istnieje r > 0takie, że B(x, r) ⊂ Ω.

Zbiór F ⊂ Rn nazywamy domkniętym jeśli Rn \ F jest zbiorem otwartym.Domknięciem zbioru Ω ⊂ Rn nazywamy zbiór Ω = x ∈ Rn : dla dowolnego ε > 0

istnieje y ∈ Ω taki, że ρ(x, y) < ε.Domknięcie Ω zbioru Ω jest zbiorem domkniętym.Wnętrzem zbioru Ω ⊂ Rn nazywamy zbiór intΩ = x ∈ Ω : istnieje r > 0 takie,

że B(x, r) ⊂ Ω.Brzegiem zbioru Ω ⊂ Rn nazywamy zbiór ∂Ω = Ω \ intΩ.Zbiór Ω ⊂ Rn nazywamy spójnym, jeśli dowolne dwa jego punkty można połączyć

krzywą zawartą w Ω.Zbiór otwarty i spójny nazywany obszarem.Mówimy, że zbiór Ω jest ograniczony jeśli jest on zawarty w pewnej kuli.

1.2 Granica i ciągłość funkcji

Definicja 1.1 Niech f : Ω ⊂ Rn → R oraz x ∈ Ω \ Ω. Mówimy, że granica funkcjif przy x → x jest równa liczbie g jeśli dla każdego ε > 0 istnieje δ > 0 taka, że jeśli‖x− x‖ ≤ δ, x ∈ Ω, to |f(x)− g| < ε. Piszemy wówczas

limx→x

f(x) = g.

W przypadku funkcji wielu zmiennych definiuje się pojęcie granic iterowanych.Pojęcie to wprowadzimy dla funkcji dwóch zmiennych.

Definicja 1.2 Niech (x, y) ∈ R2 oraz f będzie zdefiniowana w zbiorze Ω = (x, y) ∈R2 : |x − x| < d1, |y − y| < d2 \ (x, y) dla pewnych d1, d2 > 0 Załóżmy, że dlakażdego y ∈ R takiego, że 0 < |y − y| < d2 istnieje granica

limx→x

f(x, y) = g(y)

oraz, że istnieje granicalimy→y

g(y) = g.

4

Wówczas mówimy, że istnieje granica iterowana

limy→y

limx→x

f(x, y) = g.

Analogicznie definiujemylimx→x

limy→y

f(x, y).

Okazuje się, że granice iterowane nie muszą być sobie równe nawet w przypadku,gdy obie istnieją.

Przykład 1.1 Niech

f(x, y) =|y|

|x|+ |y| dla (x, y) 6= (0, 0).

Wówczaslimy→0

limx→0

f(x, y) = 1 6= 0 = limx→0

limy→0

f(x, y).

Twierdzenie 1.1 Niech (x, y) ∈ R2, Ω = (x, y) ∈ R2 : |x − x| < d1, |y − y| <d2 \ (x, y) dla pewnych d1, d2 > 0 oraz f : Ω → R. Załóżmy, że istnieje granica

lim(x,y)→(x,y)

f(x, y) = g.

Jeśli dla każdego ustalonego x takiego, że 0 < |x− x| < d1 istnieje granica

limy→y

f(x, y) = g(x)

oraz dla każdego ustalonego y takiego, że 0 < |y − y| < d2 istnieje granica

limx→x

f(x, y) = h(y),

to istnieją granice iterowane i są równe g.

Definicja 1.3 Niech f : Ω ⊂ Rn → R, x ∈ Ω. Mówimy, że f jest ciągła w x jeśligranica funkcji f|Ω\x w punkcie x jest równa f (x).

Twierdzenie 1.2 Jeśli funkcje f i g są ciągłe w punkcie x ∈ Ω, to również funkcjef ± g, f · g oraz f/g są ciągłe w x i ile g(x) 6= 0.

Twierdzenie 1.3 Jeśli f jest ciągła w x oraz f (x) > 0, to istnieje δ > 0, taka, żef(x) > 0 dla ‖x− x‖ < δ.

Twierdzenie 1.4 (Weierstrassa.) Jeśli funkcja f jest ciągła na zbiorze zwartym K ⊂Rn, to f jest ograniczona na K i osiąga swoje kresy.

Definicja 1.4 Mówimy, że funkcja f jest jednostajnie ciągła na zbiorze D jeśli dlakażdego ε > 0 istnieje δ > 0 taka, że dla dowolnych x, y ∈ D zachodzi implikacja:jeśli ‖x− y‖ < δ, to |f(x)− f(y)| < ε.

5

Twierdzenie 1.5 Jeśli f jest ciągła na zbiorze zwartym K, to jest jednostajnie ciągłana K.

Definicja 1.5 Niech funkcje ϕ1(t1, ..., tk), ..., ϕn(t1, ..., tk) będa zdefiniowane na zbio-rze U ⊂ Rk. Niech Ω = x ∈ Rn : istnieje t = (t1, ..., tk) ∈ U takie, że xi = ϕi(t) dlai = 1, ..., n oraz niech f : Ω → R będzie funkcją na Ω. Wówczas definiujemy funkcjęu = f ϕ : U → R będącą złożeniem funkcji f i ϕ = (ϕ1, ..., ϕn) wzorem

u(t) = f(ϕ1(t), ..., ϕn(t)

).

Twierdzenie 1.6 Jeśli funkcje xi = ϕi(t), i = 1, ..., n, są ciągłe w punkcie t oraz fjest ciągła w punkcie x = ϕ(t), to f ϕ jest ciągła w t.

Definicja 1.6 Niech f : Ω ⊂ Rn → Rk. Mówimy, że f spełnia warunek Lipschitzaw punkcie x ∈ Ω ze stałą Lipschitza L < ∞ jeśli istnieje δ > 0 taka, że dla x ∈B(x, δ) ∩ Ω zachodzi

‖f(x)− f (x)‖ ≤ L‖x− x‖.

Twierdzenie 1.7 Jeśli f spełnia warunek Lipschitza w punkcie x ∈ Ω, to f jestciągła w x. Ponadto, jeśli stała Lipschitza L nie zależy od x ∈ U ⊂ Ω, to f jestjednostajnie ciągła w U .

Definicja 1.7 Niech f : Ω ⊂ Rn → Rk oraz α ∈ (0, 1]. Mówimy, że f jest hölderow-sko ciągła w punkcie x ∈ Ω z wykładnikiem α jeśli istnieją L < ∞, δ > 0 takie, żedla x ∈ B(x, δ) ∩ Ω zachodzi

‖f(x)− f (x)‖ ≤ L‖x− x‖α.

Twierdzenie 1.8 Jeśli f jest hölderowsko ciągła w punkcie x ∈ Ω, to f jest ciągław x.

Definicja 1.8 Odwzorowanie T : Rn → Rk nazywamy liniowym jeśli dla dowolnychx, y ∈ Rn oraz α, β ∈ R zachodzi

T (αx + βy) = αT (x) + βT (y).

Twierdzenie 1.9 Odwzorowanie liniowe T : Rn → Rk jest jednostajnie ciągłe naRn.

6

2 Rachunek różniczkowy rzędu pierwszego

2.1 Pochodne kierunkowe funkcji wielu zmiennych

Przypomnijmy definicję pochodnej funkcji jednej zmiennej.

Definicja 2.1 Niech f bedzie funkcją określoną na przedziale otwartym I = (a, b) ⊂R o wartościach rzeczywistych. Mówimy, że f ma pochodną w punkcie x ∈ I jeśliistnieje granica ilorazu róznicowego

limh→0

f (x + h)− f (x)

h= f ′(x), (6)

Funkcję f : I → R nazywamy różniczkowalną w I jeśli f ma pochodną w każdympunkcie x ∈ I.

W przypadku funkcji wielu zmiennych wyrażenie (6) nie ma sensu. Istotnie abyf (x + h) miało sens h powinno być wektorem, lecz nie jest zdefiniowana operacjadzielenia przez wektor. Można jednak zdefiniować pochodną funkcji w kierunku usta-lonego wektora.

Definicja 2.2 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω orazv ∈ Rn \ 0. Pochodną kierunkową funkcji f w kierunku wektora v w punkcie xnazywamy granicę

limt→0

f (x + tv)− f (x)

t=: Lvf (x)

o ile ta granica istnieje i jest skończona.

Zauważmy, że Lvf (x) jest faktycznie pochodną funkcji jednej zmiennej g(t) =f (x + tv) w zerze.

Pochodną kierunkową w kierunku wersora ei, i = 1, . . . , n, nazywamy pochodnącząstkową w kierunku ei i oznaczamy

Leif (x) =

∂f

∂xi

(x) = f ′xi(x) = lim

t→0

f (x + tei)− f (x)

t.

Dla pochodnych cząstkowych stosuje się zwykłe reguły różniczkowania. Jednakw przypadku funkcji wielu zmiennych z istnienia pochodnych kierunkowych nawetw całym zbiorze określoności funkcji i w każdym kierunku nie można wnioskować ociągłości funkcji.

Przykład 2.1 Niech

f(x, y) =

x2yx4 + y2 dla (x, y) 6= (0, 0),

0 dla (x, y) = (0, 0).

Wówczas f posiada pochodne kierunkowe w kierunku dowolnego wektora lecz jest nie-ciągła w zerze.

7

Przykład 2.2 Niech

f(x, y) =

xyx2 + y2 dla (x, y) 6= (0, 0),

0 dla (x, y) = (0, 0).

Wówczas f ′x(0, 0) = f ′y(0, 0) = 0, lecz nie istnieją pochodne Lvf(0, 0) dla v ∈ (R \0)2.

Przykład 2.3 Niechf(x, y) =

√|xy|

Wówczas f jest ciągła i ma pochodne kierunkowe w dowolnym punkcie w kierunkudowolnego wektora. Jeśli v = (cos ϕ, sin ϕ), to

Lvf(0, 0) = limt→0

√t2| cos ϕ sin ϕ| − 0

t= ±

√| cos ϕ sin ϕ|.

Zatem Lvf nie jest na ogół równa v1∂f∂x

+ v2∂f∂y.

Twierdzenie 2.1 Niech v, w ∈ Rn \ 0, f : Ω → R oraz x ∈ Ω. Załóżmy, żepochodna kierunkowa Lvf istnieje w pewnym otoczeniu punktu x i jest ciągła w x.Wówczas jeśli istnieje pochodna kierunkowa Lwf (x), to istnieje pochodna Lv+wf (x)oraz

Lv+wf (x) = Lvf (x) + Lwf (x).

Twierdzenie 2.2 Niech f : Ω → R oraz x ∈ Ω. Jeśli istnieją pochodne cząstkowe∂f∂xi

dla i = 1, . . . , n w pewnym otoczeniu punktu x oraz są ciągłe w x, to dla h ∈ Rn

takiego, że x + h ∈ Ω zachodzi

f (x + h)− f (x) =n∑

i=1

∂f

∂xi

(x) · hi +n∑

i=1

αi(h) · hi

przy czym limh→0 αi(h) = 0 dla i = 1, . . . , n.

Wniosek 2.1 Niech f : Ω → R oraz x ∈ Ω. Jeśli istnieją pochodne cząstkowe ∂f∂xi

dla i = 1, . . . , n w pewnym otoczeniu punktu x oraz są ciągłe w x, to f jest ciągła wx.

Definicja 2.3 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω. Jeśliistnieją pochodne cząstkowe ∂f

∂xi(x) dla i = 1, . . . , n, to wektor

[ ∂f

∂x1

(x), . . . ,∂f

∂xn

(x)]

nazywamy gradientem funkcji f w punkcie x i oznaczamy gradf (x) lub ∇f (x).

Tezę Twierdzenia 2.2 można sformułować następująco.

8

Wniosek 2.2 Jeśli istnieją pochodne cząstkowe ∂f∂xi

dla i = 1, . . . , n w pewnym oto-czeniu punktu x oraz są ciągłe w x, to dla h ∈ Rn takiego, że x + h ∈ Ω zachodzi

f (x + h)− f (x) = gradf (x) h + α(h) h,

gdzie oznacza iloczyn skalarny, α(h) =(α1(h), . . . , αn(h)

)przy czym limh→0 αi(h) =

0 dla i = 1, . . . , n.

Wniosek 2.3 Niech f : Ω → Rk, x ∈ Ω, Ω jest obszarem w Rn. Jeśli istniejąpochodne cząstkowe ∂fj

∂xidla i = 1, . . . , n, j = 1, . . . , k w pewnym otoczeniu punktu x

oraz są ciągłe w x, to dla h ∈ Rn takiego, że x + h ∈ Ω zachodzi

f (x + h)− f (x) =

gradf1(x)· · ·

gradfk (x)

h + α(h)h,

gdzie α(h) =(α1(h), . . . , αk(h)

)tr przy czym limh→0 αi(h) = 0 dla i = 1, . . . , k.

2.2 Różniczka odwzorowania

Definicja 2.4 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → Rk, x ∈ Ω. Mó-wimy, że f jest odwzorowaniem różniczkowalnym w punkcie x jeśli istnieje operatorliniowy

L : Rn → Rk

zwany różniczką funkcji f w punkcie x i oznaczany Df (x) (lub df (x) jeśli k = 1) taki,że dla h ∈ Rn spełniającego x + h ∈ Ω zachodzi

f (x + h) = f (x) + L(h) + α(h)h przy czym limh→0

α(h) = 0. (7)

Uwaga. Warunek (7) jest równoważny warunkowi

limh→0

f (x + h)− f (x)− L(h)

‖h‖ = 0. (8)

Twierdzenie 2.3 Niech f : Ω → R. Jeśli f jest różniczkowalna w x, to dla każdegowektora v 6= 0 istnieje pochodna kierunkowa Lvf (x) oraz

Lvf (x) = df (x)(v).

W szczególności istnieją pochodne cząstkowe ∂f∂xi

(x) = df (x)(ei), i = 1, . . . , n oraz

df (x)(h) =n∑

i=1

∂f

∂xi

(x)hi = gradf (x) h dla h ∈ Rn.

W przypadku odwzorowania różniczkowalnego o wartościach w Rk

Df (x)(h) =

gradf1(x)· · ·

gradfk (x)

h dla h ∈ Rn.

9

Twierdzenie 2.4 Niech f : Ω → R. Jeśli f jest różniczkowalna w x, to f jest ciągław x.

Uwaga. Niech f : Ω ⊂ R2 → R oraz v ∈ S1. Wówczas wektor v ma współrzędnev = (cos α, sin α) = (cos α, cos β), gdzie α (odpowiednio β) jest kątem pomiędzy v aosią OX (odpowiednio OY ). Wówczas

Lvf (x) =∂f

∂x(x) cos α +

∂f

∂y(x) cos β.

Analogicznie jeśli f : Ω ⊂ Rn → R oraz v ∈ Sn−1, to

Lvf (x) =n∑

i=1

∂f

∂xi

(x) cos αi,

gdzie αi jest kątem pomiędzy v a osią OXi, i = 1, . . . , n.

Przykład 2.4 Niech F = (f1, f2) : R2 → R2 będzie dane wzorem F (x, y) = (x cos y, x sin y)Wówczas

∂f1

∂x= cos y,

∂f1

∂y= −x sin y,

∂f1

∂x= sin y,

∂f2

∂x= x cos y.

Zatem dla (h1, h2) ∈ R2 mamy

DF (x, y)

[h1

h2

]=

[cos y − x sin ysin y x cos y

] [h1

h2

]=

[cos y · h1 − x sin y · h2

sin y · h1 + x cos y · h2

].

2.3 Reguły różniczkowania.

I Liniowość.Różniczkowanie jest operacją liniową, tzn. Jeśli F,G : Ω ⊂ Rn → Rk są różnicz-

kowalne w x oraz α, β ∈ R, to αF + βG jest różniczkowalne w x oraz

D(αF + βG)(x) = αDF (x) + βDG(x).

II Różniczka iloczynu.Jeśli ϕ : Ω ⊂ Rn → R oraz F : Ω → Rk są różniczkowalne w x, to ϕ · F : Ω → Rk

jest różniczkowalne w x oraz

D(ϕ · F )(x) = F (x) · dϕ(x) + ϕ(x) ·Df (x)

=

f1(x)· · ·

fk (x)

· gradϕ(x) + ϕ(x)

gradf1(x)· · ·

gradfk (x)

.

10

III Różniczka złożenia odwzorowań.Niech G : U ⊂ Rn → Rm oraz F : V ⊂ Rm → Rk. Załóżmy, że ImG = y ∈

Rm : istnieje x ∈ U : y = G(x) ⊂ V . Wówczas możemy zdefiniować złożenieodwzorowań F i G wzorem

F G(x) = F(G(x)

)dla x ∈ U.

Twierdzenie 2.5 Przy powyższych oznaczeniach jeśli G jest różniczkowalne w punk-cie x = (x1, . . . , xn) ∈ U oraz F jest różniczkowalne w punkcie y = (y1, . . . , ym) = g(x)(tzn. yi = gi(x) dla i = 1, . . . , m), to złożenie F G jest różniczkowalne w x oraz

D(F G)(x) = DF(G(x)

) DG(x).

Zatem

∂(F G)j

∂xi

(x) =m∑

l=1

∂Fj

∂li

(Gj (x)

) · ∂Gl

∂xi

(x), i = 1, . . . , n, j = 1, . . . , k.

Wniosek 2.4 Niezmienniczość pierwszej różniczki. Jeśli G : U ⊂ Rn → Rn jestróżniczkowalne w x ∈ U oraz f : V ⊂ Rn → R jest różniczkowalna w y = G(x) ∈ Rn,to

d(f G)(x) =n∑

i=1

f ′yi

(Gi(x)

) · dGi(x).

Wniosek 2.5 Różniczkowanie funkcji skalarnych złożonych. Niech G = (g1, . . . , gn) :(a, b) ⊂ R → Rn będzie różniczkowalne w t ∈ (a, b) oraz f : V ⊂ Rn → R będzieróżniczkowalna w x = G(t) ∈ Rn. Wówczas f G : (a, b) → R jest różniczkowalna wt oraz

(f G)′(t) =n∑

i=1

f ′xi

(G(t)

) · g′i(t).

Definicja 2.5 Niech Ω = Rn \ 0 oraz λ ∈ R. Funkcję f : Ω → R nazywamy(dodatnio) jednorodną stopnia λ jeśli dla każdych t ∈ R+ i x ∈ Ω zachodzi

f(tx1, . . . , txn) = tλf(x1, . . . , xn).

Twierdzenie 2.6 Jeśli f jest funkcją jednorodną stopnia λ i różniczkowalną w Rn \0, to

x gradf(x) = λf(x) dla x ∈ Rn \ 0.

Uwaga. Zachodzi też twierdzenie odwrotne, tzn. jeśli funkcja różniczkowalna f :Rn \ 0 → R spełnia x gradf(x) = λf(x) dla x ∈ Rn \ 0, to f jest jednorodnastopnia λ.

11

2.4 Twierdzenie Lagrange’a o wartości średniej

Niech f : Ω ⊂ Rn → R będzie funkcja różniczkowalna w punkcie x ∈ Ω oraz v ∈Rn \ 0. Wówczas

Lvf (x) = df (x) · v = gradf (x) v.

Jeśli ograniczymy się do wektorów ze sfery jednostkowej v ∈ Sn−1, to można zapytaćdla jakiego v, Lvf (x) przyjmuje największą wartość. Oczywiście jeśli gradf (x) = 0,to Lvf (x) = 0 dla dowolnego v. Zatem możemy założyć, że gradf (x) 6= 0. Wówczasna mocy nierówności Schwarza mamy

|Lvf (x)| = |gradf (x) v| ≤ ‖gradf (x)‖ · ‖v‖ ≤ ‖gradf (x)‖.

Ponadto, jeśli

v =gradf (x)

‖gradf (x)‖ ,

toLvf (x) = gradf (x) gradf (x)

‖gradf (x)‖ =‖gradf (x)‖2

‖gradf (x)‖ = ‖gradf (x)‖.

Zatem Lvf (x) przyjmuje największą wartość dla v = gradf (x). Innymi słowamifunkcja f najszybciej wzrasta w kierunku gradientu.

Twierdzenie 2.7 Lagrange’a o wartości średniej. Niech f : Ω ⊂ Rn → R. Jeśli fjest różniczkowalna w każdym punkcie odcinka [a, b] ⊂ Ω, to istnieje punkt c ∈ [a, b]taki, że

f(b) = f(a) + df(c) · (b− a).

Wniosek 2.6 Jeśli f : Ω → R jest różniczkowalna w obszarze Ω ⊂ Rn oraz df(x) = 0dla x ∈ Ω, to f jest stała.

Uwaga. Twierdzenie Lagrange’a nie przenosi się dosłownie na funkcje o warto-ściach wektorowych. W tym przypadku mamy słabsze sformułowanie.

Twierdzenie 2.8 Lagrange’a o wartości średniej, wersja wektorowa. Niech F : Ω ⊂Rn → Rk. Jeśli F jest różniczkowalne w każdym punkcie odcinka [a, b] ⊂ Ω, oraz‖DF (x)‖L(Rn,Rk) ≤ M dla x ∈ [a, b] to

‖F (b)− F (a)‖Rk ≤ M‖b− a‖Rn .

Definicja 2.6 Odwzorowanie F : Ω ⊂ Rn → Rk nazywamy odwzorowaniem (funkcjąjeśli k = 1) klasy C1(Ω) jeśli jego pochodne cząstkowe rzędu pierwszego ∂fj

∂xi, i =

1, . . . , n, j = 1, . . . , k są funkcjami ciągłymi w Ω.

Wniosek 2.7 Jeśli Ω jest obszarem w Rn oraz F : Ω → Rk jest klasy C1(Ω), to Fspełnia warunek Lipschitza na każdym zwartym wypukłym podzbiorze K ⊂ Ω.

12

2.5 Przestrzeń styczna do wykresu funkcji

Definicja 2.7 Niech f : Ω ⊂ Rn → R. Wykresem funkcji f nazywamy zbiór

Gr(f) = (x, y) ∈ Ω× R : x ∈ Ω, y = f(x).

Niech f : Ω ⊂ Rn → R będzie różniczkowalna w punkcie x ∈ Ω. Wówczasrównanie

y = f (x) + df (x) · (x− x)

wyznacza przestrzeń (prostą gdy n = 1, płaszczyznę gdy n = 2) do wykresu Gr(f)funkcji f w punkcie x.

Umiejętność wyznaczenia przestrzeni stycznej do wykresu jest przydatna do ob-liczania przybliżonej wartości funkcji. Istotnie jeśli f : Ω ⊂ Rn → R jest różniczko-walna w x, to dla małych przyrostów argumentu ∆x zachodzi

f (x + ∆x) = f (x) + df (x) ·∆x + ε(∆x)

przy czymε(∆x)

‖∆x‖ → 0 przy ∆x → 0.

Zatem ε(∆x) jest małe w stosunku do ∆x i można przyjąć, że

f (x + ∆x) ≈ f (x) + df (x) ·∆x.

Przykład. Zbiornik ma kształt walca o wysokości h0 = 2 m i średnicy d0 = 4 m,przy czym pomiary wykonano z dokładnością 1%. W jakich granicach może byćrzeczywista objętość zbiornika i ile wynosi błąd względny.

Objętość walca wyraża się wzorem V (h, d) = π4hd2. W naszym przypadku

|h− h0| ≤ 0, 2 =: ∆h, |d− d0| ≤ 0, 4 =: ∆d, V (h0, d0) = 8π m3. Zatem

V (h0+∆h, d0+∆d)−V (h0, d0) = π4(d2

0∆h+2h0d0∆d) = π4(42·0, 2+2·2·4·0, 4) = 0, 24π.

Błąd względny wynosi

V (h0 + ∆h, d0 + ∆d)− V (h0, d0)

V (h0, d0)= 0, 03 = 3%.

13

3 Rachunek różniczkowy drugiego rzędu

3.1 Pochodne kierunkowe drugiego rzędu

Definicja 3.1 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω orazv, w ∈ Rn \0. Załóżmy, że pochodna kierunkowa Lvf funkcji f w kierunku wektorav istnieje w otoczeniu U punktu x. Wówczas odwzorowanie

U 3 x 7→ Lvf(x)

jest funkcją zdefiniowaną w otoczeniu U punktu x o wartościach w R. Jeśli istniejepochodna kierunkowa tej funkcji w kierunku wektora w w punkcie x, to nazywamyją pochodną kierunkową drugiego rzędu i oznaczamy

L2wvf (x) = Lw

(Lvf

)(x).

Jeśli v = ei, w = ej, i, j ∈ 1, . . . , n, są wersorami i-tej i j-tej osi współrzędnych, todrugą pochodną kierunkową L2

ejeif (x) nazywamy drugą pochodną cząstkową i ozna-

czamy

L2ejei

f (x) =∂2f

∂xj∂xi

(x) = f ′′xjxi(x).

Jeśli i = j, to stosujemy też oznaczenie

L2eiei

f (x) =∂2f

∂x2i

(x) = f ′′xixi(x).

Jeśli i 6= j, to ∂2f∂xj∂xi

nazywamy też drugą pochodną cząstkową mieszaną.

Przykład 3.1 Niech f(x, y) = xayb dla x > 0, y > 0, gdzie a, b ∈ R. Wówczas

∂f

∂x(x, y) = axa−1yb,

∂f

∂y(x, y) = bxayb−1;

∂2f

∂x2(x, y) =

∂

∂x

(axa−1yb

)= a(a− 1)xa−2yb,

∂2f

∂y∂x(x, y) =

∂

∂y

(axa−1yb

)= abxa−1yb−1,

∂2f

∂x∂y(x, y) =

∂

∂x

(bxayb−1

)= abxa−1yb−1,

∂2f

∂y2(x, y) =

∂

∂y

(bxayb−1

)= b(b− 1)xayb−2.

Zauważmy, że ∂2f∂y∂x

= ∂2f∂x∂y

. Zatem jest uzasadnione przypuszczenie że tak jestw ogólnym przypadku. Niestety przypuszczenie to nie jest prawdziwe jak pokazujeprzykład.

14

Przykład 3.2 Niech

f(x, y) =

xy(x2−y2)

x2+y2 dla (x, y) 6= (0, 0),

0 dla (x, y) 6= (0, 0).

Wówczas∂2f

∂x∂y(0, 0) = 1 6= −1 =

∂2f

∂y∂x(0, 0).

3.2 Druga różniczka

Definicja 3.2 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω. Mó-wimy, że f jest dwukrotnie różniczkowalna w punkcie x jeśli zachodzą warunki1. f jest różniczkowalna w pewnym otoczeniu U punktu x;2. Przy każdym ustalonym h ∈ Rn odwzorowanie

U 3 x 7→ wh(x) =: df(x) · h ∈ R

jest różniczkowalne w x.Wówczas różniczkę odwzorowania wh nazywamy drugą różniczką f . Zatem dla h, k ∈Rn mamy określone odwzorowanie

(k, h) 7→ dwh(x) · k =: d2f (x)(k, h)

Jest jasne, że powyższe odwzorowanie jest liniowe względem h oraz względem k.Zatem druga różniczka jest odwzorowaniem 2-liniowym na Rn × Rn.

Jeśli f jest dwukrotnie różniczkowalna w każdym punkcie obszaru Ω ⊂ Rn, to d2fjest odwzorowaniem z Ω w przestrzeń odwzorowań dwuliniowych na Rn × Rn, tzn

d2f : Ω → L2(Rn × Rn).

Jeśli f : (a, b) ⊂ R→ R jest dwukrotnie różniczkowalna w x, to

d2f (x)(k, h) = f ′′(x) · k · h.

Przykład 3.3 Niech A : Rn → R będzie funkcją liniową, tzn. A(x) = A · x dlax ∈ Rn i pewnej macierzy A ∈ M(n × 1). Wówczas dA(x) = A. Zatem dla h ∈ Rn

odwzorowanieRn 3 x 7→ wh(x) = dA(x) · h = A · h

nie zależy od x. Stąd d2A = dwh = 0. Analogicznie jest w przypadku odwzorowanialiniowego A : Rn → Rk.

Przykład 3.4 Niech A ∈ M(n× n) oraz

f(x) = xtrAx =n∑

i,j=1

aijxixj.

15

Wówczasdf(x)(h) = htrAx + xtrAh dla x ∈ Rn, h ∈ Rn.

Zatem przy ustalonym h ∈ Rn odwzorowanie

Rn 3 x 7→ wh(x) = htrAx + xtrAh

jest liniowe i jego różniczką jest

dwh(x)(k) = htrAk + ktrAh.

Czylid2f(x)(k, h) = htrAk + ktrAh dla k ∈ Rn, h ∈ Rn.

W przypadku gdy macierz A jest symetryczna dostajemy

d2f(x)(k, h) = 2htrAk dla k ∈ Rn, h ∈ Rn.

Twierdzenie 3.1 Niech f : Ω ⊂ Rn → R, x ∈ Ω. Wówczas f jest dwukrotnieróżniczkowalna w x wtedy i tylko wtedy, gdy1 f jest różniczkowalna w pewnym otoczeniu U punktu x;2 Pochodne cząstkowe ∂f

∂xi, i = 1, . . . , n są różniczkowalne w x.

Twierdzenie 3.2 Niech f : Ω ⊂ Rn → R, x ∈ Ω.Jeśli f jest dwukrotnie różniczkowalna w x, toa) dla dowolnych h, k ∈ Rn istnieje

L2khf (x) = d2f (x)(k, h);

b) Istnieją drugie pochodne cząstkowe ∂2f∂xi∂xj

, i, j = 1, . . . , n oraz dla h, k ∈ Rn,

d2f (x)(k, h) =n∑

i,j=1

∂2f

∂xi∂xj

(x)hikj.

Z twierdzenia 3.1 wynika

Wniosek 3.1 Jeśli f posiada w pewnym otoczeniu punktu x ciągłe pochodne cząst-kowe pierwszego rzędu oraz pochodne cząstkowe drugiego rzędu ciągłe w x, to f jestdwukrotnie różniczkowalna w x.

3.3 Symetria drugiej różniczki

Definicja 3.3 Odwzorowanie dwuliniowe A : Rn × Rn → R nazywamy symetrycz-nym, jeśli

A(x, y) = A(y, x) dla x, y ∈ Rn.

Twierdzenie 3.3 Schwarza o symetrii drugiej różniczki.Niech f : Ω ⊂ Rn → R, x ∈ Ω. Jeśli f jest dwukrotnie różniczkowalna w x, to drugaróżniczka d2f (x) jest odwzorowaniem dwuliniowym symetrycznym, tzn.

L2khf (x) = L2

hkf (x).

W szczególności∂2f

∂xi∂xj

(x) =∂2f

∂xj∂xi

(x) dla i, j = 1, . . . , n.

16

3.4 Macierz Hessego

Niech f będzie dwukrotnie różniczkowalna w x ∈ Ω. Połóżmy

aij =∂2f

∂xj∂xi

(x) dla i, j = 1, . . . , n,

A =(aij

)n

i,j=1.

Wówczas macierz A jest symetryczna oraz na mocy wzoru z Twierdzenia 3.2

d2f (x)(k, h) =n∑

i,j=1

∂2f

∂xi∂xj

(x)hikj = ktrAh = htrAk.

Definicja 3.4 Formę kwadratową

Rn 3 h 7→ htrAh = d2f (x)(h, h) ∈ R

nazywamy formą kwadratową Hessego, a odpowiadającą jej macierz A macierzą Hes-sego lub hesjanem funkcji f w punkcie x.Ślad hesjanu nazywamy operatorem Laplace’a

TrA =n∑

i=1

∂2f

∂x2i

(x) = ∆f(x).

3.5 Wzór Taylora drugiego rzędu.

Twierdzenie 3.4 Niech f : Ω → R będzie dwukrotnie różniczkowalna w x ∈ Ω.Wówczas dla h ∈ Rn takiego, że x + h ∈ Ω zachodzi

f (x + h) = f (x) + df (x)h + 12d2f (x)(h, h) + ‖h‖2ψ(h),

gdzie ψ jest ciągła w zerze oraz ψ(0) = 0.

Definicja 3.5 Niech f : Ω → R. Mówimy, że funkcja f jest klasy C2(Ω) jeśli dladowolnych ustalonych h, k ∈ Rn odwzorowanie

Ω 3 x 7→ d2f(x)(k, h) ∈ R

jest ciągłe lub równoważnie, gdy wszystkie pochodne cząstkowe drugiego rzędu ∂2f∂xj∂xi

(x),i, j = 1, . . . , n, są ciągłe w Ω.

17

4 Rachunek różniczkowy k-tego rzędu

4.1 k-ta różniczka

Wzorując się na definicji drugiej różniczki można indukcyjnie zdefiniować różniczkiwyższych rzędów.

Definicja 4.1 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω orazk ∈ N, k ≥ 2. Mówimy, że f jest k-krotnie różniczkowalna w punkcie x jeśli zachodząwarunki1. f jest (k − 1)-krotnie różniczkowalna w pewnym otoczeniu U punktu x;2. Dla dowolnych ustalonych h(1), . . . , h(k−1) ∈ Rn odwzorowanie

U 3 x 7→ wh(1),...,h(k−1)(x) =: dk−1f(x)(h(1), . . . , h(k−1)) ∈ Rjest różniczkowalne w x.Wówczas różniczkę odwzorowania wh(1),...,h(k−1) nazywamy k-tą różniczką f . Zatemdla h, h(1), . . . , h(k−1) ∈ Rn mamy określone odwzorowanie

(h, h(1), . . . , h(k−1)) 7→ dwh(1),...,h(k−1) (x) · h =: dkf (x)(h, h(1), . . . , h(k−1)).

k-ta różniczka jest odwzorowaniem k-liniowym na Rn × · · · × Rn o wartościach w R.Twierdzenia dotyczące drugiej różniczki odpowiednio przenoszą się na przypadek

k-tej różniczki.

Twierdzenie 4.1 Niech f : Ω ⊂ Rn → R, x ∈ Ω. Wówczas f jest k-krotnie różnicz-kowalna w x wtedy i tylko wtedy, gdy1 f jest (k − 1)-krotnie różniczkowalna w pewnym otoczeniu U punktu x;2 Pochodne cząstkowe (k − 1) rzędu są różniczkowalne w x.

Twierdzenie 4.2 Niech f : Ω ⊂ Rn → R, x ∈ Ω.Jeśli f jest k-krotnie różniczkowalna w x, toa) dla dowolnych wektorów h(1), . . . , h(k) ∈ Rn istnieje k-ta pochodna kierunkowa

Lkh(k),...,h(1)f (x) = dkf (x)(h(1), . . . , h(k));

b) Istnieją pochodne cząstkowe rzędu k oraz dla h(1), . . . , h(k) ∈ Rn,

dkf (x)(h(1), . . . , h(k)) =∑

α∈Nk0 ,αi≤n

∂kf

∂xα1 · · · ∂xαk

(x)h(1)α1· · ·h(k)

αk.

W szczególności dla k = 3,

d3f (x)(h(1), h(2), h(3)) =n∑

α1,α2,α3=1

∂3f

∂xα1∂xα2∂xα3

(x)h(1)α1

h(2)α2

h(3)α3

.

Z twierdzenia 4.1 wynika

Wniosek 4.1 Jeśli f posiada w pewnym otoczeniu punktu x ciągłe wszystkie pochodnecząstkowe rzędu k− 1 oraz pochodne cząstkowe rzędu k ciągłe w x, to f jest k-krotnieróżniczkowalna w x.

18

4.2 Symetria k-tej różniczki

Twierdzenie 4.3 Schwarza o symetrii k-tej różniczki.Niech f : Ω ⊂ Rn → R, x ∈ Ω. Jeśli f jest k-krotnie różniczkowalna w x, to k-taróżniczka dkf (x) jest odwzorowaniem k-liniowym symetrycznym, tzn.

dkf (x)(h(1), . . . , h(k)

)= dkf (x)

(h(σ(1)), . . . , h(σ(k))

),

gdzie σ : 1, . . . , k → 1, . . . , k jest dowolną permutacją. W szczególności, pochodnecząstkowe mieszane nie zależą od kolejności różniczkowania.

4.3 Wzór Taylora

Twierdzenie 4.4 Wzór Taylora.Niech f : Ω ⊂ Rn → R będzie k-krotnie różniczkowalna w każdym punkcie odcinka[a, b] ⊂ Ω. Wówczas istnieje punkt c ∈ [a, b] taki, że

f(b) = f(a)+df(a)

1!(b−a)+ · · ·+ dk−1f(a)

(k − 1)!(b−a, . . . , b−a)+

dkf(c)

k!(b−a, . . . , b−a).

4.4 Funkcje klasy Ck

Definicja 4.2 Niech f : Ω → R oraz k ∈ N. Mówimy, że funkcja f jest funkcjąklasy Ck(Ω) jeśli jest ona k-krotnie różniczkowalna w każdym punkcie x ∈ Ω oraz dladowolnych ustalonych h(1), . . . , h(k) ∈ Rn odwzorowanie

Ω 3 x 7→ dkf (x)(h(1), . . . , h(k)) ∈ R

jest ciągłe lub równoważnie, gdy wszystkie pochodne cząstkowe k-tego rzędu∂kf

∂xi1···∂xik

(x), ij = 1, . . . , n dla j = 1, . . . , k, są ciągłe w Ω.

Definicja 4.3 Niech f : Ω → R. Mówimy, że funkcja f jest funkcją klasy C∞(Ω)lub że jest funkcją gładką na Ω jeśli jest ona klasy Ck(Ω) dla dowolnego k ∈ N lubrównoważnie, gdy wszystkie pochodne cząstkowe dowolnego rzędu są ciągłe w Ω.

Funkcjami gładkimi są wielomiany, funkcja wykładnicza, logarytmiczna, funkcjetrygonometryczne, sumy, iloczyny funkcji gładkich, iloraz funkcji gładkich poza ze-rami mianownika, złożenia funkcji gładkich.

Definicja 4.4 Niech f : Ω → R będzie funkcją ciągłą. Nośnikiem funkcji f nazy-wamy domknięcie zbioru tych punktów x ∈ Ω takich, że f(x) 6= 0. Nośnik funkcjioznaczamy jako suppf , tak więc,

suppf = x ∈ Ω : f(x) 6= 0.

19

Przykład 4.1 Niech

g(t) =

e−1/t dla t > 0,

0 dla t ≤ 0.

Wówczas f jest funkcją gładką na R o nośniku R+ = [0,∞).

Dowód Jest jasne, że f jest klasy C∞ na R \ 0. Następnie f ∈ C0(R), gdyżlimt→0+ e−1/t = 0. Pozostaje wykazać, że dla dowolnego k ∈ N pochodna rzędu k jestfunkcją ciągłą w zerze. W tym celu indukcyjnie dowodzi się, że

f (k)(t) = e−1/t ·W2k(1t) dla t > 0,

gdzie W2k jest pewnym wielomianem stopnia 2k. W celu wykazania, że f (k) jestfunkcją ciągłą w zerze wystarczy zatem wykazać następujący fakt.Dla każdego N ∈ N istnieje stała CN < ∞ taka, że

e−1/t ≤ CN tN dla t > 0

lub równoważniexNe−x ≤ CN dla x > 0.

Dowód tej nierówności można uzyskać badając przebieg zmienności funkcji g(x) =xNe−x, x > 0. Otóż funkcja ta jest rosnąca dla 0 < x < N i malejąca dla x > N .W punkcie x = N przyjmuje maksimum równe NNe−N =: CN . 2

Podamy teraz przykład funkcji gładkiej na Rn o nośniku równym kuli jednostko-wej.

Przykład 4.2 Niech

g(t) =

e1/(t−1) dla t < 1,

0 dla t ≥ 1

orazf(x) = g(x2) = g(x2

1 + · · ·+ x2n) dla x ∈ Rn.

Wówczas f jest funkcją gładką na R, której nośnikiem jest kula jednostkowa, tzn.f(x) > 0 dla ‖x‖ < 1 oraz f(x) = 0 dla ‖x‖ ≥ 1.

Dowód. Jest jasne, że suppf = B(0, 1). Indukcyjnie wykazuje się, że dowolnapochodna cząstkowa rzędu k ∈ N jest postaci

W(x1, . . . , xn, g′(x2), . . . , g(k)(x2)

),

gdzie W jest pewnym wielomianem. Zatem f ∈ C∞(Rn). 2

20

5 Ekstrema lokalne funkcjiDefinicja 5.1 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R oraz x ∈ Ω.Mówimy, że f posiada w punkcie x lokalne minimum (maksimum) jeśli istnieje δ > 0taka, że

f(x) ≥ f (x) dla ‖x− x‖ < δ,(f(x) ≤ f (x) dla ‖x− x‖ < δ

).

Lokalne minimum lub maksimum nazywamy lokalnym ekstremum.

5.1 Warunek konieczny 1-go rzędu

Twierdzenie 5.1 Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Jeśli f posiada pochodnecząstkowe pierwszego rzędu w x oraz x jest punktem lokalnego ekstremum, to

∂f

∂x1

(x) = · · · = ∂f

∂xn

(x).

Wniosek 5.1 Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Jeśli f jest różniczkowalna w xoraz x jest punktem lokalnego ekstremum, to

df (x) = 0.

Warto podkreślić, że warunek znikania pochodnych cząstkowych pierwszego rzędujest tylko warunkiem koniecznym ekstremum lokalnego.

Przykład 5.1 Niechf(x, y) = xy

Wówczasf ′x(0, 0) = f ′y(0, 0) = 0,

ale f nie posiada ekstremum w punkcie (0, 0).

Tym nie mniej warunek znikania pochodnych pierwszego rzędu pozwala ustalić punktypodejrzane o ekstrema.

Definicja 5.2 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R.Punkt x ∈ Ω nazywamy punktem stacjonarnym (lub krytycznym) funkcji f jeśli ist-nieją pochodne cząstkowe ∂f

∂xi(x) dla i = 1, . . . , n i są równe zeru.

Znajomość punktów stacjonarnych funkcji jest przydatna do wyznaczenia naj-większej i najmniejszej wartości funkcji na zbiorze zwartym K b Rn. Jak wiemyfunkcja ciągła przyjmuje na zbiorze zwartym K swoje kresy. Zatem jeśli jest onaróżniczkowalna we wnętrzu zbioru K, to wartości maksymalne i minimalne mogą byćprzyjmowane w punktach stacjonarnych wnętrza K lub na brzegu K.

21

Przykład 5.2 Niech

f(x, y) = 2x2 − xy + y2, K = (x, y) : x2 + y2 ≤ 1.

Wówczas intK = (x, y) : x2 + y2 < 1. Układem równań na punkty stacjonarne jest

∂f

∂x= 4x− y = 0,

∂f

∂y= −x + 2y = 0.

Punktem stacjonarnym jest O = (0, 0) oraz f(0, 0) = 0. W celu zbadania f na brzeguzbioru K zauważmy, że ∂K = x2 + y2 = 1 = (cos ϕ, sin ϕ) : 0 ≤ ϕ ≤ 2π. Zatem

f(cos ϕ, sin ϕ) = 2 cos2 ϕ− cos ϕ sin ϕ + sin2 ϕ

= cos2 ϕ− 12sin 2ϕ + 1 =: g(ϕ).

Liczymy pochodną funkcji g:

g′(ϕ) = −2 cos ϕ sin ϕ− cos 2ϕ = − sin 2ϕ− cos 2ϕ.

g′(ϕ) = 0 wtedy i tylko wtedy, gdy ϕ = 38π lub ϕ = 7

8π.

g(38π) = 1

2(3−√2) > 0, g(7

8π) = 1

2(3 +

√2). Zatem

maxK

f = f(cos 78π, sin 7

8π) = 1

2(3 +

√2), min

Kf = f(0, 0) = 0. 2

W przypadku gdy mamy wyznaczyć ekstrema funkcji na zbiorze domkniętymF ⊂ Rn, poza punktami stacjonarnymi wnętrza zbioru F należy uwzględnić ekstremafunkcji na brzegu zbioru F oraz zachowanie się funkcji dla F 3 x →∞.

Przykład 5.3 Niech

f(x, y) = (x + y)e−x2−y2

, F = (x, y) : x ≥ 0, y ≥ 0.

Wówczas intK = (x, y) : x > 0, y > 0. Układem równań na punkty stacjonarnejest

∂f

∂x= (−2x2 − 2xy + 1)e−x2−y2

= 0,

∂f

∂y= (−2y2 − 2xy + 1)e−x2−y2

= 0.

Punktem stacjonarnym we wnętrzu zbioru F jest A = (12, 1

2) oraz f(1

2, 1

2) = e−1/2. W

celu zbadania f na brzegu zbioru K zauważmy, że intF = I1 ∪ I2, gdzie I1 = (x, 0) :x ≥ 0, I2 = (0, y) : y ≥ 0 Następnie

maxI1

f = max0≤x<∞

xe−x2

= f(√

22

, 0) =√

22

e−1/2, minI1

f = f(0, 0) = 0.

22

Analogicznie maxI2 f = f(0,√

22

) =√

22

e−1/2, minI2 f = f(0, 0) = 0.W celu zbadania zachowania się funkcji f przy (x, y) 3 F →∞ połóżmy x = r cos ϕ,y = r sin ϕ dla r > 0, 0 ≤ ϕ ≤ π/2. Wówczas

f(r cos ϕ, r sin ϕ) = (cos ϕ + sin ϕ)re−r2 → 0 gdy r →∞.

Zatem maxF f = max(e−1/2,

√2

2e−1/2

)= e−1/2 = f(1

2, 1

2), minF f = f(0, 0) = 0. 2

Następny przykład pokazuje, że punktów stacjonarnych może być nieskończeniewiele.

Przykład 5.4 Niechf(x, y) = xy2, Ω = R2.

Wówczas rozwiązaniem układu równań na punkty stacjonarne

∂f

∂x= y2 = 0,

∂f

∂y= 2xy = 0

jest cała prosta y = 0. Łatwo zauważyć, że w punktach (x, 0), x > 0, funkcjaf posiada minimum lokalne równe 0, natomiast w punktach (x, 0), x < 0, funkcjaf posiada maksimum lokalne równe 0. W punkcie (0, 0) nie ma ani minimum animaksimum lokalnego.

5.2 Forma kwadratowa Hessego

Warunek dostateczny na ekstremum funkcji – podobnie jak w przypadku 1-wymiarowym– można sformułować przy pomocy drugiej różniczki. Przypomnijmy, że druga róż-niczka funkcji to forma dwuliniowa

d2f (x)(k, h) =n∑

i,j=1

∂2f (x)

∂xi∂xj

kihj dla k, h ∈ Rn.

Jej wartość na przekątnej k = h nazywamy formą kwadratową Hessego stowarzy-szoną z d2f (x),

H(h) = d2f (x)(h, h) =n∑

i,j=1

∂2f (x)

∂xi∂xj

hihj dla h ∈ Rn.

Oznaczmy

A =

(∂2f

∂xi∂xj

(x)

)n

i,j=1

.

Wówczas, jeśli f jest dwukrotnie różniczkowalna w x, to

H(h) = htrAh dla h ∈ Rn.

23

Definicja 5.3 Formę kwadratową H na Rn nazywamy dodatnio (odpowiednio, ujem-nie) określoną jeśli H(h) > 0 (odpowiednio, H(h) < 0) dla każdego h ∈ Rn \ 0.Jeśli forma h przyjmuje zarówno wartości dodatnie jak i ujemne, to mówimy, że jestona nieokreślona.

Zauważmy, że jeśli forma kwadratowa H jest dodatnio określona, to istnieje stałaM > 0 taka, że

H(h) ≥ Mh2 dla h ∈ Rn.

Istotnie, jeśli H jest dodatnio określona, to przyjmuje wartości dodatnie na sferzejednostkowej i wobec zwartości sfery jednostkowej istnieje M > 0 takie, że

H(h) ≥ M dla h ∈ Rn, ‖h‖ = 1.

ZatemH

( h

‖h‖)

=1

‖h‖2H(h) ≥ M dla h ∈ Rn, h 6= 0.

StądH(h) ≥ M‖h‖2 = Mh2 dla h ∈ Rn. 2

W przyszłości wykażemy, że dla macierzy symetrycznej A ∈ M(n × n) formakwadratowa

H(h) = htrAh dla h ∈ Rn

jest dodatnio określona, wtedy i tylko wtedy, gdy wszystkie wartości własne macierzyA są dodatnie.

Twierdzenie 5.2 Kryterium Sylvestera. Niech A ∈ M(n × n) będzie macierzą sy-metryczną. Wówczas forma kwadratowa

H(h) = htrAh dla h ∈ Rn

jest dodatnio określona, wtedy i tylko wtedy, gdy wyznaczniki wszystkich minorówgłównych są dodatnie, tzn.,

det

a11 a12 . . . a1l

a21 a22 . . . a2l...

... . . . ...al1 al2 . . . all

> 0 dla l = 1, . . . , n.

Wniosek 5.2 Kryterium Sylvestera. Niech A ∈ M(n × n) będzie macierzą syme-tryczną. Wówczas forma kwadratowa

F (h) = htrAh dla h ∈ Rn

jest ujemnie określona, wtedy i tylko wtedy, gdy

(−1)l det

a11 a12 . . . a1l

a21 a22 . . . a2l...

... . . . ...al1 al2 . . . all

> 0 dla l = 1, . . . , n.

24

5.3 Warunek dostateczny 2-go rzędu

Twierdzenie 5.3 Warunek dostateczny drugiego rzędu ekstremum lokalnego.Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Załóżmy, że f jest dwukrotnie różniczkowalna wx, przy czym df (x) = 0. Jeśli forma kwadratowa Hessego

H(h) = d2f (x)(h, h) dla h ∈ Rn

jest dodatnio (odpowiednio, ujemnie) określona, to f przyjmuje w x lokalne minimum(odpowiednio, lokalne maksimum).Jeśli forma H jest nieokreślona, to f nie ma ekstremum w x (x jest wtedy punktemsiodłowym funkcji f).

Twierdzenie 5.4 Warunek dostateczny drugiego rzędu ekstremum globalnego.Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Załóżmy, że f jest klasy C2(Ω) oraz df (x) = 0.Jeśli forma kwadratowa Hessego

H(h) = d2f(x)(h, h) dla h ∈ Rn

jest dodatnio (odpowiednio, ujemnie) określona dla każdego x ∈ Ω, to f przyjmuje wx ścisłe minimum (odpowiednio, ścisłe maksimum) globalne.

Przykład 5.5 Niech

f(x, y) = (1 + ey) cos x− yey, Ω = R2.

Wówczas rozwiązaniem układu równań na punkty stacjonarne

∂f

∂x= −(1 + ey) sin x = 0,

∂f

∂y= ey(cos x− 1− y) = 0

są punkty Ak = (2kπ, 0), k ∈ Z oraz Bk = ((2k + 1)π,−2), k ∈ Z. Macierzą Hessegojest

H(x, y) =

(−(1 + ey) cos x −ey sin x−ey sin x ey(cos x− 2− y)

).

H(Ak) =

(−2 00 −1

), H(Bk) =

(1 + e−2 0

0 −e−2

)

W punktach Ak mamy H(Ak) < 0. Zatem funkcja przybiera w tych punktach maksi-mum lokalne równe f(2kπ, 0) = 2. W punktach Bk macierz Hessego jest nieokreślona,a zatem są to punkty siodłowe. 2

Przykład 5.6 Niech A ∈ M(n × n) będzie macierzą symetryczną, B ∈ M(n × 1)wektorem poziomym oraz c ∈ R. Rozważmy funkcję kwadratową n-zmiennych

f(x) = xtrAx + Bx + c dla x ∈ Rn.

25

Jeśli A =(aij

)n

i,j=1, B = (b1, . . . , bn), to

f(x) =n∑

i,j=1

aijxixj +n∑

i=1

bixi + c

= x1(a11x1 + a12x2 + . . . + a1nxn)

+ x2(a21x1 + a22x2 + . . . + a2nxn)

...+ xn(an1x1 + an2x2 + . . . + annxn)

+ b1x1 + b2x2 + . . . + bnxn + c.

Układem równań na punkty stacjonarne jest układ

∂f

∂x1

= 2(a11x1 + a12x2 + · · ·+ a1nxn) + b1 = 0,

...∂f

∂xn

= 2(an1x1 + an2x2 + · · ·+ annxn) + bn = 0,

czyligradf(x) = 2xtrA + b = 0.

Jeśli macierz A jest odwracalna, to istnieje dokładnie jeden punkt stacjonarny

x = −12A−1btr.

Ponadto, H(x) = 2A. Zatem, jeśli A > 0, to x jest globalnym, ścisłym minimum;jeśli A < 0, to x jest globalnym, ścisłym maksimum; jeśli A jest nieokreślona, to xjest punktem siodłowym. 2

5.4 Zastosowania

A. Odległość prostych

Prosta l w Rn jest zadana przez punkt a ∈ Rn i wektor v ∈ Rn. Zatem niech l1, l2będą dwoma prostymi:

l1 = x ∈ Rn : x = a + tv dla t ∈ R, gdzie a ∈ Rn, v ∈ Rn,

l2 = y ∈ Rn : y = b + sw dla s ∈ R, gdzie b ∈ Rn, w ∈ Rn.

Wówczas odległość prostej l1 od prostej l2 jest dana wzorem

ρ(l1, l2) = minx∈l1,y∈l2

‖x− y‖.

Zatem

ρ2(l1, l2) = min(t,s)∈R2

n∑i=1

(ai − bi + tvi − swi)2.

26

Czyli trzeba znaleźć minimum funkcji kwadratowej

f(t, s) =n∑

i=1

(ai − bi + tvi − swi)2.

B. Odległość prostej od hiperpłaszczyzny

Odległość punktu p ∈ Rn od (n− 1)-wymiarowej hiperpłaszczyzny Π zadanej równa-niem

Π = x ∈ Rn : btrx = c, gdzie b ∈ Rn, c ∈ Rwyraża się wzorem

ρ2(p, Π) = minx∈Rn−1

( n−1∑i=1

(pi − xi)2 +

(pn − 1

bn(c−

n−1∑i=1

bixi)))

o ile bn 6= 0.Jeśli n = 3, Π = b1x1 + b2x2 + b3x3 = c, przy czym b3 6= 0, to

ρ2(p, Π) = min(x1,x2)∈R2

((p1 − x1)

2 + (p2 − x2) +(p3 − c− b1x1 − b2x2

b3

)).

C. Nierówność między średnią geometryczną i arytmetyczną

Zajmiemy się teraz problemem wyznaczenia najmniejszej wartości sumy n liczb do-datnich, których iloczyn jest ustalony.

Problem polega na znalezieniu minimum wyrażenia x1 + x2 + · · · + xn jeśli x1 >0, x2 > 0, . . . , xn > 0 oraz x1 · x2 · · · xn = C, C > 0. Z ostatniego warunku dostajemy

xn =C

x1 · x2 · · · xn−1

.

Zatem wystarczy znaleźć minimum funkcji

f(x1, x2, . . . , xn−1) = x1 + x2 · · ·+ xn−1 +C

x1 · x2 · · ·xn−1

w obszarze Rn−1+ = x1 > 0, x2 > 0, . . . , xn−1 > 0. Piszemy układ równań na punkt

stacjonarny

∂f

∂x1

= 1− C

x21 · x2 · · · xn−1

= 0,

∂f

∂x2

= 1− C

x1 · x22 · · · xn−1

= 0,

...∂f

∂xn−1

= 1− C

x1 · x2 · · · x2n−1

= 0.

27

Stąd x1 = x2 = . . . = xn−1 = C1/n. Łatwo zauważyć, że jeśli xi → 0 lub xi →∞ dlapewnego i = 1, 2, . . . , n − 1, to f(x1, x2, . . . , xn−1) → ∞. Zatem punkt stacjonarnyfunkcji f jest punktem jej minimum globalnego, czyli

f(x1, x2, . . . , xn−1) ≥ f(C1/n, C1/n, . . . , C1/n) = nC1/n dla (x1, x2, . . . , xn−1) ∈ Rn−1+ .

Stąd dostajemy nierówność pomiędzy średnimi arytmetyczną i geometryczną n liczbdodatnich

x1 + x2 + · · ·+ xn−1 + xn

n≥ n√x1 · x2 · · ·xn−1 · xn.

Korzystając z powyższej nierówności można rozwiązać następujące zadanie.Zadanie 1. Znaleźć trójkąt o danym obwodzie 2p, którego pole P jest największe.

Oznaczając przez a, b, c boki trójkąta zadanie sprowadza się do wyznaczenia maksi-mum funkcji

P (a, b, c) =√

p(p− a)(p− b)(p− c)

przy warunku a + b + c = 2p lub równoważnie maksimum iloczynu

(p− a)(p− b)(p− c)

pod warunkiem, że suma (p− a) + (p− b) + (p− c) = p jest stała.

Zadanie 2. Znaleźć (n+1)-kąt o największym polu P wpisany w koło o promieniuR > 0.Oznaczmy przez ϕ1, ϕ2, . . . , ϕn+1 kąty środkowe (n+1)-kąta. Wówczas ϕ1+ϕ2+ · · ·+ϕn+1 = 2π. Pole (n + 1)-kąta wpisanego w koło o promieniu R wyraża się wzorem

P = 12R2

(sin ϕ1 + · · ·+ sin ϕn+1

).

Zadanie sprowadza się do znalezienia maksimum funkcji

u(ϕ1, . . . , ϕn) = sin ϕ1 + · · ·+ sin ϕn − sin(ϕ1 + · · ·+ ϕn)

w zbiorze F = ϕ1 ≥ 0, . . . , ϕn ≥ 0, ϕ1 + · · ·+ ϕn ≤ 2π. Punkt stacjonarny leżący wewnętrzu tego zbioru spełnia układ równań

∂u

∂ϕ1

= cos ϕ1 − cos(ϕ1 + · · ·+ ϕn) = 0,

...∂u

∂ϕn

= cos ϕn − cos(ϕ1 + · · ·+ ϕn) = 0.

Zatem ϕ1 = . . . = ϕn = 2πn+1

= ϕn+1 oraz umax = u( 2πn+1

, . . . , 2πn+1

) = (n + 1) sin 2πn+1

.Zauważmy jeszcze, że na ścianie ϕn = 0 zbioru F funkcja maksimum funkcji u

wynosi n sin 2πn

< (n+1) sin 2πn+1

, gdyż funkcja x 7→ sin(2πx)x

jest malejąca w przedziale(0, 1

2).

28

D. Metoda najmniejszych kwadratów, regresja liniowa

Załóżmy, że na płaszczyźnie R2 danych jest n punktów

A1 = (x1, y1), . . . , An = (xn, yn).

Zadanie regresji liniowej polega na znalezieniu prostej y = ax + b leżącej najbliżejtych punktów w sensie, że suma kwadratów

∑ni=1 d2

i , gdzie di = |axi + b − yi|, jestnajmniejsza. Zadanie to ma duże zastosowanie w statystyce.

Celem jest znalezienie minimum funkcji kwadratowej

E(a, b) =n∑

i=1

(axi + b− yi

)2.

Układem równań na punkt stacjonarny jest

∂E

∂a= 2

n∑i=1

(axi + b− yi

)xi = 0,

∂E

∂b= 2

n∑i=1

(axi + b− yi

)= 0.

Zatem punkt stacjonarny spełnia układ

a ·∑ni=1 x2

i + b ·∑ni=1 xi =

∑ni=1 xiyi,

a ·∑ni=1 xi + b · n =

∑ni=1 yi.

Zatem oznaczając x = (x1, . . . , xn), y = (y1, . . . , yn) dostajemy

a =n · x y − ( ∑n

i=1 xi

)( ∑ni=1 yi

)

nx2 − ( ∑ni=1 xi

)2 ,

b =x2 ·∑n

i=1 yi −( ∑n

i=1 xi

) · x y

nx2 − (∑ni=1 xi

)2 .

E. Regresja kwadratowa


A1 = (x1, y1), . . . , An = (xn, yn).

Zadanie regresji kwadratowej polega na znalezieniu paraboli y = ax2 + bx + c leżącejnajbliżej tych punktów w sensie, że wyrażenie

E(a, b, c) =n∑

i=1

(ax2

i + bxi + c− yi

)2

29

przybiera wartość najmniejszą. Układem równań na punkt stacjonarny jest

∂E

∂a= 2

n∑i=1

(ax2

i + bxi + c− yi

)x2

i = 0,

∂E

∂b= 2

n∑i=1

(ax2

i + bxi + c− yi

)xi = 0,

∂E

∂c= 2

n∑i=1

(ax2

i + bxi + c− yi

)= 0.

F. Regresja wykładnicza i logarytmiczna


A1 = (x1, y1), . . . , An = (xn, yn).

Zadanie regresji wykładniczej polega na znalezieniu funkcji wykładniczej y = Beax

leżącej najbliżej tych punktów w sensie, że wyrażenie

F (a,B) =n∑

i=1

(Beaxi − yi

)2

przybiera wartość najmniejszą. Ponieważ ln y = ln(Beax) = ax + ln B wystarczyznaleźć minimum funkcji

E(a, b) =n∑

i=1

(axi + b− ln yi

)2, gdzie b = ln B.

Analogicznie definiuje się zadanie regresji logarytmicznej.

G. Programowanie liniowe

Zadanie programowania liniowego polega na znalezieniu ekstremów funkcji liniowej wzbiorze opisanym przez funkcje liniowe. Dla danego wektora b ∈ Rn oraz liczby c ∈ Rznaleźć

minW

(btrx + c) oraz maxW

(btrx + c),

gdzieW = x ∈ Rn : g1(x) ≤ 0, . . . , gk(x) ≤ 0,

gi(x) = vtri x + di, vi ∈ Rn, di ∈ R dla i = 1, . . . , k.

Ponieważ funkcja x → btrx + c jest stała na hiperpłaszczyznach btrx = const, więc jejekstrema są przyjmowane w punktach ekstremalnych zbioru W .

30

6 Zasada Banacha

6.1 Zwartość i zupełność

Definicja 6.1 Niech (X, ρ) będzie przestrzenią metryczną. Podzbiór K ⊂ X na-zywamy zwartym jeśli dowolny ciąg punktów zbioru K zawiera podciąg zbieżny dopunktu zbioru K.

Fakt 1. Każdy zbiór zwarty jest domknięty.Fakt 2. Domknięty podzbiór zbioru zwartego jest zwarty.Fakt 3. Domknięty i ograniczony zbiór K ⊂ Rn jest zwarty.

Definicja 6.2 Niech (X, ρ) będzie przestrzenią metryczną. Mówimy, że ciąg xn∞n=1

punktów xn ∈ X spełnia warunek Cauchy’ego jeśli zachodzi

(C)dla dowolnego ε > 0 istnieje N ∈ N takie, że

ρ(xn, xm) < ε dla n,m ≥ N.

Lemat 6.1 Każdy ciąg zbieżny w przestrzeni metrycznej (X, ρ) spełnia warunek Cau-chy’ego.

Lemat 6.2 Każdy ciąg Cauchy’ego w przestrzeni metrycznej (X, ρ) jest ograniczony.

Definicja 6.3 Niech (X, ρ) będzie przestrzenią metryczną. Mówimy, że przestrzeń(X, ρ) jest zupełna jeśli każdy ciąg Cauchy’ego elementów przestrzeni X jest zbieżnyw X.

Przykład 6.1 Przestrzeń (0, 1) z metryką ρ(x, y) = |x−y| nie jest zupełna. PodobnieQ, gdzie Q jest zbiorem liczb wymiernych, nie jest zupełna.

Lemat 6.3 Każda przestrzeń metryczna (X, ρ) zwarta jest zupełna.

Lemat 6.4 Jeśli w przestrzeni metrycznej (X, ρ) każda kula domknięta jest zwarta,to (X, ρ) jest zupełna.

Ponieważ w przestrzeni Rn kule domknięte są zwarte mamy

Wniosek 6.1 Przestrzeń Rn z metryką euklidesową jest zupełna

Wniosek 6.2 Domknięty podzbiór przestrzeni zupełnej jest przestrzenią zupełną.

31

6.2 Zasada Banacha

Definicja 6.4 Niech (X, ρ) będzie przestrzenią metryczną.Odwzorowanie T : X → X nazywamy zwężającym jeśli istnieje stała 0 < λ < 1 taka,że dla dowolnych x, y ∈ X zachodzi

ρ(T (x), T (y)) ≤ λρ(x, y).

Łatwo zauważyć, że odwzorowanie zwężające jest ciągłe.

Definicja 6.5 Punkt x ∈ X nazywamy punktem stałym odwzorowania T : X → Xjeśli T (x) = x.

Przykład 6.2 Niech T : Rn → Rn będzie odwzorowaniem liniowym, tzn. Tx = Axdla pewnej macierzy M ∈ M(n × n). Wówczas punkt 0 jest punktem stałym od-wzorowanie T . T jest odwzorowaniem zwężającym wtedy i tylko wtedy, gdy moduływartości własnych własnych macierzy A są mniejsze od 1.

Przedstawimy teraz tzw. zasadę Banacha. Jest to jedno z najważniejszych twier-dzeń analizy, wykorzystywane do dowodu istnienia rozwiązań wielu problemów ma-tematycznych.

Twierdzenie 6.1 (Banacha o punkcie stałym.) Niech T będzie odwzorowaniem zwę-żającym przestrzeni metrycznej, zupełnej (X, ρ) w siebie. Wówczas istnieje dokładniejeden punkt stały odwzorowania T . Ponadto, jest wyznaczony jako granica ciąguT nx∞n=1, gdzie x jest dowolnym punktem przestrzeni X.

Dowód. Weźmy dowolny punkt x ∈ X i oznaczmy d = ρ(x, Tx). Korzystając zdefinicji odwzorowania zwężającego oraz indukcji matematycznej łatwo zauważyć, żedla n ∈ N0 zachodzi

ρ(T nx, T n+1x) ≤ λnd,

gdzie 0 < λ < 1. Ponieważ szereg∑∞

n=0 λnd jest zbieżny, więc ciąg T nx∞n=0 jestciągiem Cauchy’ego w X. Wobec zupełności przestrzeni X istnieje granica

limn→∞

T nx = x.

Korzystając z ciągłości odwzorowania T dostajemy

T x = T limn→∞

T nx = limn→∞

T n+1x = x.

Zatem x jest punktem stałym T . Jeśli y też jest punktem stałym odwzorowania T ,to ponieważ

ρ(x, y) = ρ(T x, T y) ≤ λρ(x, y)

oraz λ < 1, więc musi zachodzić ρ(x, y) = 0. Stąd x = y. 2

32

7 Odwracanie odwzorowańNiech f : (a, b) → R będzie funkcją klasy C1, której pochodna f ′ nigdzie nie znika naodcinku (a, b). Ponieważ f ′ z założenia jest funkcją ciągłą, więc na mocy własnościDarboux dla każdego x ∈ (a, b) zachodzi f ′(x) > 0 lub f ′(x) < 0. Zatem f jest funkcjąściśle rosnącą lub ściśle malejącą, a więc różnowartościową. Stąd wnioskujemy, żeistnieje funkcja odwrotna f−1 :

(f(a), f(b)

) → R, tzn. f−1(f(x)

)= x dla każdego

x ∈ (a, b).

W przypadku odwzorowań wielowymiarowych F : Ω ⊂ Rn → Rn sytuacja jestbardziej złożona. Naturalnym odpowiednikiem warunku f ′(x) 6= 0 jest nieosobliwośćróżniczki odwzorowania F , czyli warunek

JF (x) 6= 0 dla x ∈ Ω,

gdzie JF = det DF jest jakobianem odwzorowania F , czyli wyznacznikiem macierzyróżniczki DF . Niestety dla n ≥ 2 odwzorowanie o nieznikającym jakobianie nie musibyć różnowartościowe.

Przykład 7.1 Niech Ω = (r, ϕ) : r > 0, ϕ ∈ R oraz

F (r, ϕ) =(f1(r, ϕ), f2(r, ϕ)

):= (r cos ϕ, r sin ϕ) dla (r, ϕ) ∈ Ω.

Wówczas F odwzorowuje Ω na R2 \ (0, 0) oraz

JF (r, ϕ) = det

(∂f1

∂r∂f1

∂ϕ∂f2

∂r∂f2

∂ϕ

)= det

(cos ϕ −r sin ϕsin ϕ r cos ϕ

)= r > 0 dla (r, ϕ) ∈ Ω.

Odwzorowanie F nie jest różnowartościowe, gdyż F (r, ϕ + 2π) = F (r, ϕ). Zauważmyjednak, że dowolny punkt (r0, ϕ0) ∈ Ω posiada otoczenie otwarte U = (r, ϕ) : r >0, ϕ0 − π < ϕ < ϕ0 + π, na którym F jest różnowartościowe. Dowolny punkt(x, y) ∈ R2 \ (0, 0) można przedstawić w postaci x = r cos ϕ, y = r sin ϕ, gdzier =

√x2 + y2, ϕ = arctg y

x. (r, ϕ) nazywamy współrzędnymi biegunowymi punktu

(x, y).

Definicja 7.1 Niech F : Ω ⊂ Rn → Rn będzie odwzorowaniem klasy C1. Mówimy,że F jest nieosobliwe w punkcie x ∈ Ω jeśli JF (x) 6= 0. Podobnie F jest nieosobliwena zbiorze U ⊂ Ω jeśli jest nieosobliwe w każdym punkcie zbioru U .

Twierdzenie 7.1 O lokalnym odwracaniu odwzorowań.Niech F : Ω ⊂ Rn → Rn będzie odwzorowaniem klasy C1 oraz x ∈ Ω.Jeśli F jest nieosobliwe w x, toa) F (Ω) jest otoczeniem punktu y = F (x);b) Istnieje otoczenie U punktu x takie, że F|U jest różnowartościowe.

33

Twierdzenie 7.2 O różniczkowalności odwzorowania odwrotnego.Niech F : Ω ⊂ Rn → Rn będzie odwzorowaniem klasy C1(Ω). Załóżmy,że F jestnieosobliwe na Ω. Wówczas1. F (Ω) jest zbiorem otwartym;2. Jeśli F jest różnowartościowe na Ω, to odwzorowanie odwrotne F−1 jest klasy C1

oraz dla y = F (x), x ∈ Ω zachodzi

DF−1(y) =(DF (x)

)−1, JF−1(y) = 1

/JF (x).

Przykład 7.2 Niech Ω = (r, ϕ) : r > 0,−π < ϕ < π oraz

F (r, ϕ) =(f1(r, ϕ), f2(r, ϕ)

):= (r cos ϕ, r sin ϕ) dla (r, ϕ) ∈ Ω.

Wówczas F odwzorowuje wzajemnie jednoznacznie Ω na R2 \ (x, 0) : x ≤ 0 oraz

JF (r, ϕ) = det


)= r > 0 dla (r, ϕ) ∈ Ω.

Z Twierdzenia 7.2 wynika, że odwzorowanie odwrotne G = F−1 jest klasy C1.G można wyrazić w sposób jawny

G(x, y) =(g1(x, y), g2(x, y)

):=

(√x2 + y2, arctg

y

x

).

Tym nie mniej różniczkę odwzorowania G można wyliczyć nie korzystając z jawnychwzorów na G. Otóż na podstawie punktu 2 Twierdzenia 7.2 mamy

DG(x, y) =(DF

)−1=


)−1

=

(cos ϕ sin ϕ

−sin ϕr

cos ϕr

)

=

(x√

x2+y2

y√x2+y2

−yx2+y2

xx2+y2

).

Stąd

dg1(dx, dy) =xdx + ydy√

x2 + y2, dg2(dx, dy) =

xdy − ydx

x2 + y2.

34

8 DyfeomorfizmyZ tematem odwracania odwzorowań wiąże się pojęcie dyfeomorfizmu.

Definicja 8.1 Odwzorowanie F : Ω ⊂ Rn → Rm nazywamy dyfeomorfizmem zbioruΩ na obraz F (Ω) jeśli spełnione są trzy warunki

1. F jest klasy C1,

2. F jest nieosobliwe i różnowartościowe,

3. odwzorowanie odwrotne F−1 : F (Ω) → Rn jest ciągłe.

Każdy dyfeomorfizm jest homeomorfizmem. Ponadto, z warunku nieosobliwościF wynika, że m ≥ n. Z twierdzenia o różniczkowaniu złożenia odwzorowań wynika

Wniosek 8.1 Jeśli F : Ω ⊂ Rn → U ⊂ Rm jest dyfeomorfizmem Ω na U orazG : U → Rk jest dyfeomorfizmem U na V = G(U), to G F jest dyfeomorfizmem Ωna V .

Uwaga. Jeśli m > n, to z warunków nieosobliwości i różnowartościowości F niewynika ciągłość odwzorowania odwrotnego. Pokazuje to poniższy przykład

Przykład 8.1 Niech F : (−2π, 1) ⊂ R→ R2 będzie dane wzorem

F (t) =

(cos t, sin t) dla − 2π < t < 0,

(1, t) dla 0 ≤ t < 1.

Wówczas F jest odwzorowaniem klasy C1, jest nieosobliwe i różnowartościowe, leczodwzorowanie odwrotne nie jest ciągłe.

Tym nie mniej z Twierdzenia 7.2 dostajemy

Wniosek 8.2 Jeśli odwzorowanie F : Ω ⊂ Rn → Rn jest klasy C1 oraz jest nieoso-bliwe i różnowartościowe, to jest ono dyfeomorfizmem Ω na F (Ω) oraz F−1 : F (Ω) →Ω jest dyfeomorfizmem.

Podamy teraz serię ważnych przykładów dyfeomorfizmów.

Przykład 8.2 NiechF (r, ϕ) = (r cos ϕ, r sin ϕ)

Wówczas F jest dyfeomorfizmem zbioru Ω = (r, ϕ) : r > 0,−π < ϕ < π naR2 \ (x, 0) : x ≤ 0. F nazywamy dyfeomorfizmem biegunowym.

Przykład 8.3 NiechF (r, ϕ, z) = (r cos ϕ, r sin ϕ, z)

Wówczas F jest dyfeomorfizmem zbioru Ω = (r, ϕ, z) : r > 0,−π < ϕ < π, z ∈ Rna R3 \ (x, 0, z) : x ≤ 0. F nazywamy dyfeomorfizmem walcowym.

35

Przykład 8.4 (Współrzędne sferyczne).Współrzędnymi sferycznymi punktu (x, y, z) ∈ R3 nazywamy liczby r, ψ, ϕ takie, że

x = r cos ψ cos ϕ, y = r cos ψ sin ϕ, z = r sin ψ.

NiechF (r, ϕ, ψ) = (r cos ψ cos ϕ, r cos ψ sin ϕ, r sin ψ)

Wówczas F jest dyfeomorfizmem zbioru Ω = (r, ϕ, ψ) : r > 0,−π < ϕ < π,−π2

<ψ < π

2 na obraz.

Zauważmy, że F jest złożeniem dwóch dyfeomorfizmów walcowych F = G H, gdzie

G(ρ, ϕ, z) = (ρ cos ϕ, ρ sin ϕ, z),

H(r, ϕ, ψ) = (r cos ψ, ϕ, r sin ψ).

Zatem F jest dyfeomorfizmem Ω na R3 \ (x, 0, z) : x ≤ 0. Policzmy jeszcze macierzróżniczki F . Na mocy twierdzenia o różniczce złożenia odwzorowań dostajemy

DF = DG DH =

cos ϕ −ρ sin ϕ 0sin ϕ ρ cos ϕ 0

0 0 1

cos ψ 0 −r sin ψ0 1 0

sin ψ 0 r cos ψ

ρ=r cos ψ=

cos ψ cos ϕ −r cos ψ sin ϕ −r sin ϕ cos ψcos ψ sin ϕ r cos ψ cos ϕ −r sin ψ sin ϕ

sin ψ 0 r cos ψ

.

Ponadto,JF = JG · JH = ρ · r = r2 cos ψ.

Przykład 8.5 Niech 0 < a1 < a2, 0 < b2 < b2 α < β orazΩ = (x, y) : x > 0, y > 0, a1x

α < y < a2xα, b1x

β < y < b2yβ.

Jeśli oznaczymy u = x−αy, v = x−βy, to (x, y) ∈ Ω wtedy i tylko wtedy, gdy (u, v) ∈P = (u, v) : a1 < u < a2, b1 < v < b2. Niech

F (x, y) = (x−αy, x−βy) dla (x, y) ∈ Ω.

F jest wzajemnie jednoznacznym odwzorowaniem Ω na P .

DF (x, y) =

(−αx−α−1y x−α

−βx−β−1y x−β

)

orazJF (x, y) = (β − α)x−α−β−1y > 0 dla (x, y) ∈ Ω.

Zatem F jest dyfeomorfizmem Ω na P . Dyfeomorfizm odwrotny jest dany przez

F−1(u, v) =

((u

v

)β−α

,(vβ

uα

)1/(β−α))

.

36

Przykład 8.6 Niech Ω = (x, y) : x ∈ I, 0 < y < f(x), gdzie I = (a, b) ⊂ R orazniech f : I → R+ jest funkcją klasy C1(I) o wartościach dodatnich. Połóżmy

Ψ(x, y) =

(x,

y

f(x)

)dla (x, y) ∈ Ω.

Wówczas Ψ jest wzajemnie jednoznacznym odwzorowaniem Ω na P = (u, v) : u ∈I, 0 < v < 1. Macierzą różniczki Ψ jest

DΨ =

(1 0

−yf ′(x)f2(x)

1f(x)

)

orazJΨ(x, y) =

1

f(x)> 0 dla (x, y) ∈ Ω.

Zatem Ψ jest dyfeomorfizmem Ω na P . Dyfeomorfizm odwrotny jest dany przez

Ψ−1(u, v) =(u, vf(u)

).

Przykład 8.7 (Symetria sferyczna).Niech

I(x) =x

‖x‖2dla x ∈ Ω := Rn \ 0.

Wówczas I jest wzajemnie jednoznacznym odwzorowaniem zbioru Ω na siebie orazISn−1 = Id. Ponadto, I−1 = I gdyż

I(I(x)

)=

x‖x‖2∥∥ x‖x‖2

∥∥2 = x dla x ∈ Ω.

ZatemDI(y) DI(x) = Id dla y = I(x) ∈ Ω.

Czyli I jest nieosobliwe i jest to dyfeomorfizm Rn \ 0 na siebie.

Zadanie. Policzyć macierz różniczki odwzorowania I.

37

9 Funkcje uwikłaneNiech F : Ω ⊂ R2 → R będzie funkcją klasy C1. Rozważmy zbiór

S = (x, y) ∈ Ω : F (x, y) = 0.

Niech (x, y) ∈ S. Będziemy chcieli wiedzieć kiedy w otoczeniu punktu (x, y) zbiór Sjest wykresem funkcji y = g(x) lub funkcji x = h(y). Mówimy wówczas, że równanieF (x, y) = 0 określa w sposób uwikłany funkcję y = g(x) lub funkcję x = h(y).

Przykład 9.1 Niech S = (x, y) ∈ R2 : x2 + y2 = 1 oraz niech (x, y) ∈ S.Jeśli −1 < x < 1, y > 0, to funkcja g(x) =

√1− x2 określona w otoczeniu punktu x

spełnia g(x) = y oraz x2 +(g(x)

)2= 1.

Podobnie, jeśli −1 < x < 1 lecz y < 0, to funkcja g dana przez g(x) = −√1− x2

spełnia g(x) = y oraz x2 +(g(x)

)2= 1.

Jeśli natomiast y = 0, to funkcja h(y) =√

1− y2 jeśli x = 1 (odpowiednio h(y) =

−√

1− y2 jeśli x = −1) zdefiniowana w otoczeniu punktu y spełnia(h(y)

)2+ y2 = 1

oraz h(y) = x.

Twierdzenie 9.1 O funkcji uwikłanej.Niech F : Ω ⊂ R2 → R będzie funkcją klasy C1,

S = (x, y) ∈ Ω : F (x, y) = 0 oraz (x, y) ∈ S.

Jeśli∂F

∂y(x, y) 6= 0,

to istnieją przedział I 3 x i funkcja g : I → R klasy C1 taka, że g(x) = y oraz zbiórS1 = (x, g(x)) : x ∈ I jest zawarty w S i otwarty w S. Ponadto,

g′(x) =−∂F

∂x(x, g(x))

∂F∂y

(x, g(x))dla x ∈ I1 ⊂ I.

Analogicznie, jeśli∂F

∂x(x, y) 6= 0,

to istnieją przedział J 3 y i funkcja h : J → R klasy C1 taka, że h(y) = x oraz zbiórS2 = (h(y), y) : y ∈ J jest zawarty w S i otwarty w S. Ponadto,

h′(y) =−∂F

∂y(h(y), y)

∂F∂x

(h(y), y)dla x ∈ J1 ⊂ J.

38

Uogólnimy teraz twierdzenie o funkcji uwikłanej na wyższe wymiary. Niech k, l, n ∈N oraz k + l = n. Współrzędne punktu x ∈ Rn podzielimy na dwie grupy x =(x1, . . . , xl, xl+1, . . . , xn) = (x′, y), gdzie x′ = (x1, . . . , xl), y = (xl+1, . . . , xn) = (y1, . . . , yk).Niech F : Ω ⊂ Rn → Rk będzie odwzorowaniem klasy C1(Ω; Rk),tzn. F = (f1, . . . , fk), gdzie fi ∈ C1(Ω; R) dla i = 1, . . . , k. Jak wiemy różniczka DFodwzorowania F jest odwzorowaniem liniowym z Rn do Rk, którego macierzą jest

DF =

∂f1

∂x1

∂f1

∂x2. . . ∂f1

∂xn∂f2

∂x1

∂f2

∂x2. . . ∂f2

∂xn...... . . . ...

∂fk

∂x1

∂fk

∂x2. . . ∂fk

∂xn

.

Wyznacznik macierzy kwadratowej otrzymanej z macierzy różniczki DF poprzez wy-bór kolumn o numerach p1, p2, . . . , pk będziemy oznaczać

Jp1,p2,...,pkF =

∂(f1, f2, . . . , fk)

∂(xp1xp2 . . . xpk)

= det

∂f1

∂xp1

∂f1

∂xp2. . . ∂f1

∂xpk∂f2

∂xp1

∂f2

∂xp2. . . ∂f2

∂xpk...... . . . ...

∂fk

∂xp1

∂fk

∂xp2. . . ∂fk

∂xpk

i nazywać jakobianem cząstkowym F .Rozpatrzmy zbiór

S = (x′, y) ∈ Ω : F (x′, y) = 0= (x′, y) ∈ Ω : fi(x

′, y) = 0 dla i = 1, . . . , k.

Twierdzenie 9.2 O funkcji uwikłanej, przypadek ogólny. Przy powyższych założe-niach jeśli x = (x′, y) ∈ S oraz

Jl+1...nF (x) 6= 0

to istnieje odwzorowanie G = (g1, . . . , gk) klasy C1 określone w pewnym obszarze∆ ⊂ Rl o wartościach w Rk takie, że G(x′) = y, tzn.

g1(x1, . . . , xl) = xl+1 = y1,

......

...gk (x1, . . . , xl) = xl+k = yk

dla x′ ∈ ∆ oraz zbiór S1 = (x′, g1(x′), . . . , gk(x

′) : x′ ∈ ∆ jest zawarty w S i otwartyw S. Ponadto,

DG(x′) = −(Dx′F )−1(x′, G(x′)) (DyF )(x′, g(x′)) dla x′ ∈ ∆′ ⊂ ∆.

39

Przykład 9.2 Niech F = (f1, f2) : R5 → R2, gdzie

f1(x1, x2, y1, y2, y3) = ex1 − x1y2 + x2y1 + y3 − 7 = 0,

f2(x1, x2, y1, y2, y3) = x22 cos x1 − x1 − x1y3 + x2y1 − 3 = 0

oraz

S = (x1, x2, y1, y2, y3) ∈ R5 : F (x1, x2, y1, y2, y3) = 0, x = (0, 1), y = (2, 3, 4).

Wówczas (x, y) ∈ S. Macierzą różniczki odwzorowania F jest

DF (x, y) =

(ex1 − y2 y1 x2 −x1 1

−x22 sin x1 − 1− y3 2x2 cos x1 + y1 x2 0 −x1

).

ZatemDF (x, y) =

(−2 2 1 0 1−5 4 1 0 0

)

orazJx1x2F (x, y) = det

(−2 2−5 4

)= 2 6= 0.

Na podstawie Twierdzenia 9.2 wnioskujemy, że w otoczeniu ∆ punktu y istnieje od-wzorowanie G = (g1, g2) klasy C1 takie, że F (g1(y), g2(y), y) ≡ 0. Macierz różniczkiodwzorowania G można wyznaczyć ze wzoru

DF = (DxF ) DG + (DyF ) = 0.

Stąd DG = −(DxF )−1 (DyF ). Zatem

DG(y) = −(−2 2−5 4

)−1

(

1 0 11 0 0

)

= −(

2 −152−1

)

(1 0 11 0 0

)=

(−1 0 −2−3

20 −5

2

).

Stąd∂g1

∂y1(y) = −1,

∂g1

∂y2(y) = 0,

∂g1

∂y3(y) = −2,

∂g2

∂y1(y) = −3

2 ,∂g2

∂y2(y) = 0,

∂g2

∂y3(y) = −5

2 .

40

10 Ekstrema warunkoweCzęsto zachodzi potrzeba znalezienia ekstremów funkcji rzeczywistej f na zbiorzeopisanym przez ograniczenia równościowe

S = x ∈ Ω ⊂ Rn : g1(x) = 0, . . . , gk(x) = 0.Mówimy wówczas, że mamy do czynienia z problemem znalezienia ekstremów warun-kowych. Na przykład chcemy znaleźć minimum i maksimum funkcji liniowej

f(x) = a1x1 + · · ·+ aaxn

na (n− 1)-wymiarowej sferze

Sn−1 = x ∈ Rn : g(x) = x21 + · · ·+ x2

n − 1 = 0.Definicja 10.1 Niech g1, . . . , gk będą funkcjami rzeczywistymi klasy C1(Ω) oraz

S = x ∈ Ω ⊂ Rn : g1(x) = 0, . . . , gk(x) = 0.Punkt x ∈ S nazywamy punktem regularnym zbioru S, jeśli gradienty ∇g1(x), . . . ,∇gk (x) są liniowo niezależnymi wektorami w Rn (zatem k ≤ n).

Przykład 10.1 Niech Sn−1 = x ∈ Rn : g(x) = x21 + · · ·+ x2

n − 1 = 0 będzie sferą.Wówczas ∇g(x) = (2x1, . . . , 2xn) 6= 0 dla x ∈ Sn−1. Zatem każdy punkt sfery Sn−1

jest punktem regularnym.

Przykład 10.2 Niech S = (x, y) ∈ R2 : g(x, y) = x2 − y3 = 0. Wówczas∇g(x, y) = (2x, 3y2) 6= 0 dla (x, y) ∈ S \ (0, 0). Zatem (0, 0) nie jest punktemregularnym zbioru S, a pozostałe punkty są regularne.

Definicja 10.2 Jeśli x jest punktem regularnym zbioru S, to przestrzenią stycznądo S w punkcie x nazywamy zbiór

TxS = h ∈ Rn : ∇gi(x)h = 0 dla i = 1, . . . , k.

Czasami problem szukania ekstremów warunkowych można sprowadzić do szuka-nia ekstremów funkcji na zbiorze otwartym. Na przykład jeśli zmienne (x1, . . . , xn)da się rozdzielić na dwie grupy (x1, . . . , xl) = x′ i (xl+1, . . . , xn) = y, 1 ≤ l ≤ n− 1,w ten sposób, że układ równań

g1(x′, y) = 0, . . . , gk(x

′, y) = 0

można rozwiązać globalnie, tzn. istnieją funkcje hj : U ⊂ Rl → R dla j = 1, . . . , k,k + l = n takie, że gi

(x′, h1(x

′), . . . , hk(x′))

= 0, to problem znalezienia minimum

minx∈Ω

f(x) : g1(x) = 0, . . . , gk(x) = 0

można sprowadzić do problemu znalezienia minimum na zbiorze otwartym U

minx′∈U

f(x′, h1(x

′), . . . , hk(x′)).

41

Przykład 10.3 Problem

min(x1,x2)∈R2

x21 + x2

2 : x1 + x2 = 1

jest równoważny problemowi

minx1∈R

x21 + (1− x1)

2.

Twierdzenie 10.1 (Warunek konieczny I rzędu ekstremum warunkowego).Niech f, g1, . . . , gk : Ω → R będą funkcjami klasy C1 na zbiorze otwartym Ω ⊂ Rn,

S = x ∈ Ω : g1(x) = 0, . . . , gk(x) = 0.

Jeśli funkcja f ma w punkcie regularnym x zbioru S ekstremum warunkowe, to istniejąliczby λ1, . . . , λk ∈ R takie, że

∇f (x) +k∑

i=1

λi∇gi(x) = 0. (9)

Definicja 10.3 Liczby λ1, . . . , λk nazywamy współczynnikami Lagrange’a, a funkcję

L(x, λ) = f(x) +k∑

i=1

λi∇gi(x)

funkcją Lagrange’a.

Uwaga. Jeśli x jest punktem regularnym zbioru S, to warunek (9) oznacza, że∇xL = 0. Jednocześnie, mamy ∇λL = (g1, . . . , gk). Zatem jeśli funkcja f osiąga wpunkcie regularnym zbioru S ekstremum lokalne, to dla pewnego λ ∈ Rk spełnionyjest układ (n + k) równań

∇L(x, λ) = 0.

Przykład 10.4 Niech

f(x) = a1x1 + · · ·+ anxn, gdzie (a1, . . . , an) 6= (0, . . . , 0),

Sn−1 = g(x) = 0, gdzie g(x) = x21 + · · ·+ x2

n − 1.

Wówczas

∇f(x) = (a1, . . . , an), ∇g(x) = (2x1, . . . , 2xn) 6= 0 na S.

Zatem każdy punkt sfery Sn−1 jest regularny. Jeśli f ma ekstremum warunkowe wpunkcie x ∈ Sn−1, to istnieje λ ∈ R taka, że

(a1, . . . , an) + 2λ(x1, . . . , xn) = 0.

42

Stąd

(x1, . . . , xn) = − 1

2λ(a1, . . . , an).

Lecz x ∈ Sn−1, czyli x21 + · · ·+ x2

n = 1. Zatem

λ = ± 1

2√

a21 + · · ·+ a2

n

oraz (x1, . . . , xn) = ± (a1, . . . , an)√a2

1 + · · ·+ a2n

.

Minimum (odpowiednie, maksimum) funkcji f na sferze Sn−1 wynosi−√

a21 + · · ·+ a2

n

(odpowiednio,√

a21 + · · ·+ a2

n).

Niech A ∈ M(n × n) będzie macierzą symetryczną oraz H(h) = htrAh formąkwadratową. W dowodzie kryterium Sylvestera skorzystaliśmy z faktu, że forma Hjest dodatnio określona wtedy i tylko wtedy, gdy wszystkie wartości własne macierzyA są dodatnie. Obecnie możemy ten fakt udowodnić.

Przykład 10.5 Niech A ∈ M(n× n) będzie macierzą symetryczną oraz

H(x) = xtrAx =n∑

i,j=1

aijxixj dla x ∈ Rn.

Wyznaczmy ekstrema funkcji H na sferze Sn−1 = x ∈ Rn : g(x) = 0, gdzie g(x) =x2 − 1 = x2

1 + · · · + x2n − 1. Ponieważ ∇g(x) = 2x 6= 0 na Sn−1, więc każdy punkt

sfery jest regularny. Połóżmy

L(x, λ) = xtrAx− λ(x2 − 1).

Jeśli w punkcie x ∈ Sn−1 funkcja H osiąga ekstremum warunkowe, to ∇L(x, λ) = 0dla pewnego λ ∈ R. Mamy

∂L∂xi

= 2∑n

j=1 aijxj − 2λxi dla i = 1, . . . , n,

∂L∂λ

= −g(x).

Zatem (A − λId)x = 0. Aby ten układ miał rozwiązanie x ∈ Sn−1, λ musi byćwartością własną macierzy A. Ponieważ macierz A jest symetryczna jej wartościwłasne λ1, . . . , λn są rzeczywiste (tzn. spectrumA = λ1, . . . , λn). Jeśli Ax = λixoraz x2 = 1, to

H(x) = xtrAx = xtrλix = λixtrx = λix

2 = λi.

Zatem wartości ekstremalne funkcji H na sferze Sn−1 należą do zbioru λ1, . . . , λn.Ponieważ dla r > 0 zachodzi

H(

xr

)=

(xr

)trA x

r= 1

r2 xtrAx = 1

r2 H(x).

wnioskujemy stąd, że H jest dodatnio określona wtedy i tylko wtedy, gdy λi > 0 dlai = 1, . . . , n.

43

Twierdzenie 10.2 (Warunek dostateczny II rzędu minimum warunkowego).Niech f, g1, . . . , gk : Ω ⊂ Rn → R będą funkcjami klasy C2,

S = x ∈ Ω ⊂ Rn : g1(x) = 0, . . . , gk(x) = 0oraz niech x ∈ S będzie punktem regularnym. Połóżmy

L(x, λ) = f(x) +k∑

i=1

λi∇gi(x)

Jeśli istnieje λ = (λ1, . . . , λk) ∈ R taka, że

∇xL(x, λ) = 0 (10)

orazd2

xL(x, λ)(h, h) > 0 (11)dla każdego Rn 3 h 6= 0 spełniającego d(g1, . . . , gk)(x)h = 0, to funkcja f ma w xzbioru S ścisłe minimum lokalne warunkowe.

Przykład 10.6 Znajdziemy ekstrema funkcji f(x, y, z) = x + y + z na powierzchniS = 1

x+ 1

y+ 1

z= 1. Konstruujemy funkcję Lagrange’a

L(x, y, z, λ) = x + y + z + λ

(1

x+

1

y+

1

z− 1

),

a następnie liczymy jej pochodne cząstkowe pierwszego rzędu i przyrównujemy je dozera

∂L

∂x= 1− λ

x2= 0,

∂L

∂y= 1− λ

y2= 0,

∂L

∂z= 1− λ

z2= 0,

∂L

∂λ=

1

x+

1

y+

1

z− 1 = 0.

Aby ten układ miał rozwiązanie λ musi być dodatnie. Wówczas x = ±√

λ, y = ±√

λ,z = ±

√λ. Jeśli x = y = z = x =

√λ, to λ = 9, a więc x = y = z = 3. Mamy zatem

punkt stacjonarny P1 = (3, 3, 3). Jeśli x = −√

λ, to y =√

λ, z =√

λ. Zatem λ = 1,x = −1, y = z = 1. Mamy zatem punkt stacjonarny P2 = (−1, 1, 1). Analogiczniedostajemy punkty stacjonarne P3 = (1,−1, 1) i P4 = (1, 1,−1). Liczymy teraz drugąróżniczkę względem zmiennych (x, y, z),

d2L(h, h) =(h1 h2 h3

)

2λx3 0 00 2λ

y3 0

0 0 2λz3

h1

h2

h3

= 2λ

(h2

1

x3+

h22

y3+

h22

z3

).

W punkcie P1 mamy d2L(P1)(h, h) = 1827

(h2

1 + h22 + h2

3

)> 0. Zatem w P1 jest funkcja

f przyjmuje minimum warunkowe na S oraz f(3, 3, 3) = 9.W punkcie P2 mamy d2L(P2)(h, h) = 2

( − h21 + h2

2 + h23

). Z warunku dg(h) = 0 w

punkcie P2 dostajemy h1 +h2 +h3 = 0. Zatem h3 = −h1−h2, a więc d2L(P2)(h, h) =2(− h2

1 + h22 + (h1 + h2)

2)

= 4h2(h1 + h2) przyjmuje zarówno wartości dodatnie jak iujemne. Czyli w P2 funkcja f ma punkt siodłowy na S. Podobnie w P3 i P4 funkcjaf ma punkt siodłowy na S.

44

11 RozmaitościDefinicja 11.1 Niech n ≤ m. Zbiór S ⊂ Rm nazywamy n-wymiarowym płatem jeśliistnieje dyfeomorfizm F : Ω ⊂ Rn → Rm zbioru otwartego Ω na S, tzn. F (Ω) = S.Dyfeomorfizm F nazywa się parametryzacją płata S. Płat 1-wymiarowy nazywamyłukiem otwartym, a płat 2-wymiarowy powierzchnią otwartą.

Przykład 11.1 Zbiór otwarty Ω ⊂ Rn jest płatem n-wymiarowym. W tym przy-padku dyfeomorfizm F : Ω → Rn jest dany przez F (x) = x dla x ∈ Ω. WówczasDF = Id. Odwrotnie każdy płat n-wymiarowy w Rn jest zbiorem otwartym.

Przykład 11.2 Niech g : Ω ⊂ Rn → R będzie funkcją klasy C1. Wówczas wykresfunkcji g czyli zbiór

S = (x, g(x)) : x ∈ Ω ⊂ Rn+1

jest płatem n-wymiarowym w Rn+1. Istotnie jeśli położymy

F (x) = (x, g(x)) dla x ∈ Ω,

to F jest dyfeomorfizmem Ω na S, gdyż DF = (Id,∇g)tr. Odwzorowanie odwrotnejest dane przez F−1(x, y) = x dla x ∈ Ω, y ∈ R takich, że y = g(x).Analogicznie wykres odwzorowania G : Ω ⊂ Rn → Rk czyli zbiór

S = (x,G(x)) : x ∈ Ω ⊂ Rn+k

jest płatem n-wymiarowym w Rn+k.


S = (x, y) ∈ R2 : x2 + y2 = 1 \ (−1, 0).Wówczas S = F (Ω), gdzie Ω = (−π, π), F (ϕ) = (cos ϕ, sin ϕ) dla ϕ ∈ Ω. ZatemS jest łukiem otwartym. Ciągłość odwzorowania odwrotnego F−1 wynika z Lematu11.1. Zauważmy, że okrąg S1 = x2 + y2 = 1 nie jest łukiem otwartym, gdyż jest onzbiorem zwartym i wobec tego nie może być obrazem zbioru otwartego Ω ⊂ R.Lemat 11.1 Niech T, X będą przestrzeniami metrycznymi przy czym T jest zwartaoraz niech Ω będzie otwartym podzbiorem T . Załóżmy, że odwzorowanie F : Ω → Xrozszerza się do odwzorowania ciągłego F : T → X spełniającego warunek:jeśli F (t) = F (t′) dla t, t′ ∈ T , t 6= t′, to t, t′ 6∈ Ω.Wówczas F jest homeomorfizmem Ω na F (Ω).


Ω = (ϕ, ψ) : −π < ϕ < π,−π2

< ψ < π2

oraz F : Ω → R3,F (ϕ, ψ) = (cos ψ cos ϕ, cos ψ sin ϕ, sin ψ).

Wówczas F (Ω) = S2 \ (x, 0, z) : x ≤ 0, z ∈ R jest płatem 2-wymiarowym, a Fjest jego przedstawieniem parametrycznym. Ciągłość odwzorowanie odwrotnego F−1

wynika z Lematu 11.1, w którym T = Ω, X = R3, F - przedłużenie F .

45

Zadanie. Wykazać, że powierzchnia walca

S = (x, y, z) : x2 + y2 = 1, 0 < z < 1

jest 2-wymiarowym płatem.

Zauważmy, że jeśli F : Ω → Rm jest przedstawieniem parametrycznym n-wymiaro-wego płata S oraz G : Ω1 → Ω jest dyfeomorfizmem zbioru otwartego Ω1 ⊂ Rn na Ω,to złożenie H = F G jest też przedstawieniem parametrycznym płata S.Zachodzi również twierdzenie odwrotne.

Twierdzenie 11.1 Niech F : Ω ⊂ Rn → Rm oraz H : Ω1 ⊂ Rn → Rm będą parame-tryzacjami płata n-wymiarowego S ⊂ Rm. Wówczas złożenie G = F−1 H : Ω1 → Ωjest dyfeomorfizmem Ω1 na Ω.

Pojęcie płata nie obejmuje ważnych zbiorów, które naturalnie pojawiają się wanalizie. Przykładowo okrąg S1 i sfera S2 nie są płatami. Dlatego wprowadza sięogólniejsze pojęcie rozmaitości.

Definicja 11.2 Niech n ≤ m. Zbiór S ⊂ Rm nazywamy n-wymiarową rozmaitością(klasy Ck), jeśli jest ona sumą pewnej rodziny n-wymiarowych płatów Sj, j ∈ J , któresą zbiorami otwartymi względem S, tzn.

S =⋃j∈J

Sj,

gdzie Sj = F (Ωj), Fj jest dyfeomorfizmem (klasy Ck) zbioru otwartego Ωj ⊂ Rn naSj.Mapą rozmaitości nazywamy parę (F, Ω), gdzie F : Ω → Rm jest dyfeomorfizmemzbioru otwartego Ω ⊂ Rn na zbiór F (Ω) zawarty w S i otwarty względem S.Rodzinę map pokrywających rozmaitość S nazywamy atlasem rozmaitości.

Uwagi.1. Dowolna rozmaitość S ⊂ Rn posiada atlas przeliczalny.2. Jeśli rozmaitość S jest zwarta, to posiada atlas skończony.3. Płat n-wymiarowy jest rozmaitością posiadającą atlas złożony z jednej mapy.

Przykład 11.5 Niech S1 = (x, y) : x2 + y2 = 1 będzie okręgiem. Połóżmy

F1(ϕ) = (cos ϕ, sin ϕ) dla ϕ ∈ Ω1 = (−π, π) ⊂ R,

F2(ϕ) = (cos ϕ, sin ϕ) dla ϕ ∈ Ω2 = (0, 2π) ⊂ R.

Wówczas F1 i F2 są dyfeomorfizmami zbiorów Ω1 i Ω2 odpowiednio na S1 = S1 \(−1, 0) i S2 = S1\(1, 0). Zbiory S1 i S2 są otwarte względem S1 oraz S1 = S1∪S2.Zatem okrąg S1 jest 1-wymiarową rozmaitością posiadającą atlas złożony z dwóchmap.

46

Przykład 11.6 Niech S2 = (x, y, z) : x2+y2+z2 = 1 będzie sferą dwuwymiarową.Połóżmy

Φ±(u, v) =( 2u

1 + u2 + v2,

2v

1 + u2 + v2, ±u2 + v2 − 1

1 + u2 + v2

)dla (u, v) ∈ R2.

Wówczas Φ± jest dyfeomorfizmem R2 na S± = S2 \ (0, 0,±1). Zbiory S+ i S−są otwarte względem S2 oraz S2 = S+ ∪ S−. Zatem okrąg S2 jest 2-wymiarowąrozmaitością posiadającą atlas złożony z dwóch map.

Definicja 11.3 Niech S ⊂ Rm będzie dowolnym niepustym zbiorem oraz x ∈ S.Wektor v ∈ Rm nazywamy wektorem stycznym do S w punkcie x jeśli istnieją ciągpunktów xi ∈ S zbieżny do x oraz ciąg liczb dodatnich ai ∈ R+ takie, że

v = limi→∞

ai(xi − x).

Zbiór wszystkich wektorów stycznych do S w punkcie x nazywamy przestrzenią stycznądo S w x i oznaczamy TxS.Ponadto oznaczamy TS =

⋃x∈S TxS i nazywamy przestrzenią styczną do S.

Zauważmy, że wektor zerowy zawsze należy do TxS. Ponadto, jeśli v ∈ TxS iλ > 0 to λv ∈ TxS.Jeśli S jest zbiorem otwartym w Rm i x ∈ S, to TxS = Rm.


S = (x, y) : y2 = x3, (x, y) = (0, 0).

Wówczas T(x,y)S = R+.

Uwaga. Jeśli S jest rozmaitością, to TxS nazywamy przestrzenią styczną, a x +TxS hiperpłaszczyzną styczną do S w x.

Twierdzenie 11.2 Niech S ⊂ Rm będzie n-wymiarową rozmaitością oraz x ∈ S.Wówczas TxS jest n-wymiarową podprzestrzenią liniową w Rm, przy czym jeśli (F, Ω)jest mapą obejmującą punkt x oraz t = F−1(x), to

TxS = DF (t)(Rn) = DF (t)h, h ∈ Rn.

Twierdzenie 11.3 Niech l + n = m, G ⊂ Rm będzie zbiorem otwartym, F : G → Rl

odwzorowaniem klasy C1 oraz S = x ∈ G : F (x) = 0 niepustym zbiorem.Jeśli rządDF (x) = l dla x ∈ S, to1. S jest n-wymiarową rozmaitością;2. TxS = v ∈ Rm : DF (x)v = 0 = kerDF (x) dla x ∈ S.Zatem hiperpłaszczyzną styczną do S w x jest zbiór

x ∈ Rm : DF (x)(x− x) = 0.

47

Przykład 11.8 Niech g : Ω ⊂ Rn → R będzie klasy C1 oraz niech S = (x, g(x)) :x ∈ Ω ⊂ Rn+1 będzie wykresem g. Wówczas

F (x) = (x, g(x)) dla x ∈ Ω,

jest F jest dyfeomorfizmem Ω na S. Jeśli x ∈ Ω, y = f (x), to (x, y) ∈ S i przestrzeniąstyczną do S w (x, y) jest

T(x,y)S = (h,∇g(x) · h) : h ∈ Rn,natomiast hiperpłaszczyzną styczną do S w (x, y) jest

(x + h, y +∇g(x)(x) · h) : h ∈ Rn = (x, y +n∑

i=1

∂g

∂xi

(x)(xi − xi))

: x ∈ Rn.


F (x) = x21 + · · ·+ x2

n+1 − 1 dla x ∈ Rn+1

orazSn = x ∈ Rn+1 : F (x) = 0

będzie sferą n-wymiarową. Wówczas DF (x) = ∇F (x) = 2x dla x ∈ S. Spełnionesą założenia Twierdzenia 11.3 przy l = 1, m = n + 1 i G = Rm. Zatem Sn jestn-wymiarową rozmaitością oraz dla x ∈ Sn,

TxS = x ∈ Rn+1 : x · x = 0.Hiperpłaszczyzną styczną do S w x jest

x ∈ Rn+1 : x · (x− x) = 0 = x ∈ Rn+1 : x · x = 1.

Przykład 11.10 Niech F : R3 → R2 oraz S ⊂ R3 będą zadane przez

F (x, y, z) = (x + y + z − 1, x2 + y2 + z2 − 1),

S = (x, y, z) ∈ R3 : F (x, y, z) = 0.Macierzą różniczki F jest

DF (x, y, z) =

(1 1 12x 2y 2z

).

Ponieważ rządDF (x, y, z) = 2 dla (x, y, z) ∈ S, S jest 3 − 2 = 1-wymiarową rozma-itością. Jeśli p = (a, b, c) ∈ S, to przestrzeń styczna jest prostą

TpS = (x, y, z) : x + y + z = 0, ax + by + cz = 0,natomiast prosta styczna do S w p jest wyznaczona przez (x, y, z) : x + y + z =1, ax + by + cz = 1.

48

12 Całka oznaczona Riemanna.

12.1 Definicja całki oznaczonej Riemanna.

Niech I = [a, b] ⊂ R będzie zwartym przedziałem oraz f : I → R funkcją ograniczoną.Oznaczmy odpowiednio przez m i M kresy dolny i górny funkcji f na przedziale I,tzn.

m = infx∈I

f(x), M = supx∈I

f(x).

W przedziale I wybierzmy rosnący ciąg punktów xiki=0 taki, że a = x0 < x1 <

· · · < xk = b. Oznaczmy ∆i = xi − xi−1 dla i = 1, . . . , k. Liczbę δ = maxi=1,...,k ∆i

nazywamy średnicą podziału Π = x1, . . . , xk przedziału I. Dla i = 1, . . . , k niech

mi = inff(x) : x ∈ [xi−1, xi],Mi = supf(x) : x ∈ [xi−1, xi].

Liczby s i S, gdzie

s = m1∆1 + · · ·+ mk∆k,

S = M1∆1 + · · ·+ Mk∆k,

nazywamy odpowiednio sumą dolną i sumą górną funkcji f odpowiadającą podziałowiΠ. Bezpośrednio z powyższej definicji otrzymujemy nierówności

m(b− a) ≤ s ≤ S ≤ M(b− a).

Rozpatrzmy teraz ciąg podziałów Πn∞n=1 przedziału I. Niech δn będzie średnicąpodziału Πn, a sn i Sn odpowiednio sumą dolną i górną funkcji f odpowiadającąpodziałowi Πn, n = 1, . . .. Ciąg Πn∞n=1 nazywamy normalnym jeśli limn→∞ δn = 0.

Twierdzenie 12.1 Niech f : I → R będzie funkcją ograniczoną. Wówczas dla do-wolnego normalnego ciągu podziałów przedziału I istnieją skończone granice

s = limn→∞

sn, S = limn→∞

Sn

i nie zależą one od wyboru ciągu podziałów.

Definicja 12.1 Liczbę s nazywamy całką dolną funkcji f na przedziale I, a liczbę Snazywamy całką górną funkcji f na przedziale I. Stosujemy też oznaczenia

s =

∫ b

a

f(x)dx = limn→∞

sn, S =

∫ b

a

f(x)dx = limn→∞

Sn.

Definicja 12.2 Niech f : I → R będzie funkcją ograniczoną. Mówimy, że f jestcałkowalna w sensie Riemanna na przedziale I jeśli jej całka dolna na przedziale Ijest równa jej całce górnej funkcji na przedziale I. Wówczas wspólną wartość tychcałek nazywamy całką oznaczoną Riemanna funkcji f na przedziale I i oznaczamy

∫ b

a

f(x)dx.

49

Bezpośrednio z definicji otrzymujemy nierówności

m(b− a) ≤∫ b

a

f(x)dx ≤ M(b− a).

12.2 Warunki całkowalności

Z Twierdzenia 12.1 wynika

Wniosek 12.1 Niech f : I → R będzie funkcją ograniczoną. Jeśli dla dowolnegoε > 0 istnieje podział Π przedziału I taki, że S − s ≤ ε, gdzie s i S są odpowiedniosumami dolną i górną funkcji f dla tego podziału, to f jest całkowalna na przedzialeI.

Twierdzenie 12.2 Niech f : I → R będzie funkcją ciągłą. Wówczas f jest całkowanaw sensie Riemanna.

Twierdzenie 12.3 Niech f : I → R będzie funkcją monotoniczną. Wówczas f jestcałkowana w sensie Riemanna.

Definicja 12.3 Niech A ⊂ R. Mówimy, że A jest zbiorem miary zero jeśli dla do-wolnego ε > 0 istnieje pokrycie zbioru A ciągiem przedziałów otwartych (an, bn)∞n=1

takie, że∞∑

n=1

(bn − an) < ε.

Każdy zbiór przeliczalny ma miarę zero. Zbiór Cantora jest przykładem zbiorunieprzeliczalnego o mierze zero.

Twierdzenie 12.4 (Lebesque’a.) Niech f : I → R będzie funkcją ograniczoną.Wówczas f jest całkowana w sensie Riemanna wtedy i tylko wtedy, gdy zbiór punktównieciągłości f ma miarę zero.

Wniosek 12.21. Jeśli f : I → R jest funkcją ograniczoną, całkowalną w sensie Riemanna, tocałkowalne są też funkcje |f | i f 2.2. Jeśli f, g : I → R są funkcjami ograniczonymi, całkowalnymi w sensie Riemanna,to funkcja f · g też jest całkowalna.

Pojęcie całki oznaczonej można też zdefiniować używając pojęcia ciągu aproksy-macyjnego. Otóż jeśli w każdym odcinku [xi−1, xi] podziału Π wybierzemy dowolniepunkt ξi, to sumę

σ = f(ξ1)∆x1 + · · ·+ f(ξk)∆xk

nazywamy sumą przybliżoną. Oczywiście między sumą dolną, sumą przybliżoną isumą górną zachodzą nierówności

s < σ < S.

Ciągiem aproksymacyjnym nazywamy ciąg sum przybliżonych odpowiadający nor-malnemu ciągowi podziałów.

50

Twierdzenie 12.5 Niech f : I → R będzie funkcją ograniczoną. Jeśli f jest cał-kowalna na przedziale I, to dowolny ciąg aproksymacyjny jest zbieżny do

∫ b

af(x)dx.

Odwrotnie, jeśli istnieje normalny ciąg podziałów taki, że wszystkie odpowiadającemu ciągi aproksymacyjne są zbieżne do tej samej granicy g, to f jest całkowalna oraz∫ b

af(x)dx = g.

12.3 Własności całki oznaczonej

Twierdzenie 12.6 Niech f, g : I → R będą funkcjami całkowalnymi w sensie Rie-manna na przedziale [a, b] oraz C ∈ R. Wówczas1. f + g i Cf są całkowalne oraz

∫ b

a

(f + g)(x)dx =

∫ b

a

f(x)dx +

∫ b

a

g(x)dx,

∫ b

a

(Cf)(x)dx = C

∫ b

a

f(x)dx,

tzn. operacja f 7→ ∫ b

af(x)dx jest liniowa.

2. Jeśli f(x) ≤ g(x) dla x ∈ I, to∫ b

a

f(x)dx ≤∫ b

a

g(x)dx.

3. Jeśli c ∈ (a, b), to całki∫ c

af(x)dx i

∫ b

cf(x)dx istnieją oraz

∫ b

a

f(x)dx =

∫ c

a

f(x)dx +

∫ b

c

f(x)dx.

4. Funkcja |f(x)| jest całkowalna oraz

∣∣∣∫ b

a

f(x)dx∣∣∣ ≤

∫ b

a

|f(x)|dx.

5. Jeśli f i g są funkcjami ciągłymi na [a, b], f(x) ≤ g(x) dla x ∈ [a, b] oraz f (x) <g(x) dla pewnego x ∈ [a, b], to

∫ b

a

f(x)dx <

∫ b

a

g(x)dx.

Twierdzenie 12.7 (O wartości średniej.) Jeśli f jest funkcją ciągłą w przedziale I,to istnieje punkt x ∈ I taki, że

f (x) =1

b− a

∫ b

a

f(x)dx.

51

12.4 Podstawowy wzór rachunku całkowego

Twierdzenie 12.8 Niech f : I → R będzie funkcją całkowalną w sensie Riemanna.Połóżmy

F (x) =

∫ x

a

f(x)dx dla x ∈ I.

Wówczas F jest funkcją ciągłą na I. Ponadto F ma pochodną F ′(x) w każdym punkciex ciągłości funkcji f oraz F ′(x) = f(x).

Funkcję F z powyższego twierdzenia nazywamy funkcją pierwotną dla f .

Wniosek 12.3 Jeśli f : I → R jest ciągła oraz F jest jej funkcją pierwotną, to∫ b

a

f(x)dx = F (b)− F (a).

Z powyższego wniosku oraz twierdzeń o całkowaniu przez części i przez podsta-wienie dostajemy

Twierdzenie 12.9 Jeśli funkcje f i g mają ciągłe pochodne w przedziale I, to∫ b

a

f(x)g′(x)dx = f(b)g(b)− f(a)g(a)−∫ b

a

f ′(x)g(x)dx.

Twierdzenie 12.10 Niech u : [a, b] → [α, β] oraz f : [α, β] → R będą funkcjamiciągłymi. Jeśli u ma ciągłą pochodną w przedziale [a, b], to

∫ b

a

f(u(x)

)u′(x)dx =

∫ u(b)

u(a)

f(u)du.

12.5 Zastosowania geometryczne całki oznaczonej

Całka oznaczona znajduje zastosowanie do obliczania pól obszarów na płaszczyźnie iobjętości obszarów w przestrzeni.

Wniosek 12.4 Niech f : I → R będzie funkcją ciągłą nieujemną. Wówczas poleobszaru D między wykresem funkcji y = f(x), osią OX i prostymi x = a oraz x = bwyraża się wzorem

|D| =∫ b

a

f(x)dx.

Wniosek 12.5 Niech f, g : I → R będą funkcjami ciągłymi takimi, że f(x) ≤ g(x)dla x ∈ I. Wówczas pole obszaru D między wykresami funkcji y = f(x), y = g(x) iprostymi x = a oraz x = b wyraża się wzorem

|D| =∫ b

a

(f(x)− g(x)

)dx.

52

Całka oznaczona służy do obliczania objętość brył obrotowych.

Wniosek 12.6 Niech f : I → R będzie funkcją ciągłą nieujemną. Wówczas objętośćbryły V powstałej w wyniki obrotu obszaru ograniczonego wykresem funkcji y = f(x)i prostymi OX, x = a oraz x = b dookoła osi OX wyraża się wzorem

|V | = π

∫ b

a

f 2(x)dx.

Załóżmy teraz, że dane są funkcje ciągłe x = x(t) i y = y(t) określone dla t ∈ I.Niech Π = a = t0 < t1, . . . , tk−1 < tk = b będzie podziałem odcinka I. Wówczaspunkty Ai =

(x(ti), y(ti)

), i = 0, 1, . . . , k, leżą na krzywej γ = (x, y) ∈ R2 : x =

x(t), y = y(t) dla t ∈ I. Długość łamanej A0A1 · · ·Ak−1Ak dana jest wzorem

d =k∑

i=1

√(x(ti)− x(ti−1)

)2+

(y(ti)− y(ti−1)

)2.

Dla normalnego ciągu Πn podziałów odcinka I oznaczmy przez dn długość łamanejodpowiadającej podziałowi Πn. Jeśli istnieje granica limn→∞ dn i nie zależy ona odwyboru normalnego ciągu podziałów, to krzywą γ nazywamy prostowalną, a granicę|γ| = limn→∞ dn nazywamy długością γ.

Wniosek 12.7 Niech x, y : I → R będą funkcjami klasy C1 na odcinku x ∈ I.Wówczas krzywa γ = (x, y) ∈ R2 : x = x(t), y = y(t) dla t ∈ I jest prostowalna, ajej długość wyraża się wzorem

|γ| =∫ b

a

√(x′(t)

)2+

(y′(t)

)2dx.

12.6 Całki niewłaściwe

Całkę oznaczoną Riemanna została zdefiniowana dla funkcji ograniczonej, określonejna odcinku zwartym I = [a, b]. Często zachodzi potrzeba zdefiniowania pojęcia całkidla funkcji określonej na przedziale niezwartym, lub też funkcji nieograniczonej. Roz-ważmy sytuację, że funkcja f jest określona na przedziale prawostronnie otwartym[a, b), gdzie a < b (b może być równe ∞). jeśli dla dowolnego β < b istnieje całkaRiemanna

I(β) =

∫ β

a

f(x)dx

oraz istnieje granica (skończona lub nieskończona) limβ→b I(β), to tą granicę nazy-wamy całką niewłaściwą funkcji f na przedziale [a, b).Analogicznie określamy całkę niewłaściwą na przedziale lewostronnie otwartym (a, b].Można również zdefiniować całkę na przedziale otwartym (a, b). W tym celu wybie-ramy dowolny punkt c ∈ (a, b) i definiujemy

∫ b

a

f(x)dx =

∫ c

a

f(x)dx +

∫ b

c

f(x)dx

53

o ile działanie dodawania w tym wzorze jest wykonalne, czyli nie jest to wyrażenietypu ∞−∞.

Całki niewłaściwe są przydatne w badaniu zbieżności szeregów liczbowych.

Twierdzenie 12.11 (Kryterium całkowe zbieżności szeregów.) Niech f : [1,∞) →R będzie funkcją ciągłą, nieujemną i nierosnącą. Wówczas szereg

∑∞n=1 f(n) jest

zbieżny, wtedy i tylko wtedy, gdy∫ ∞

1

f(x)dx < ∞.

Przykład 12.1 Niech f(x) = 1xα dla x > 0, gdzie α > 0. Wówczas f jest funkcją

ciągłą na (0,∞), nieujemną i malejącą. Dla α > 1 mamy∫ ∞

1

f(x)dx = limb→∞

∫ b

1

1

xαdx = lim

b→∞x−α+1

−a + 1

∣∣∣∣x=b

x=1

= limb→∞

b−α+1 − 1

−α + 1=

1

1− α.

Dla α = 1 mamy∫ ∞

1

f(x)dx = limb→∞

∫ b

1

1

xdx = lim

b→∞ln x

∣∣∣∣x=b

x=1

= limb→∞

ln b = ∞.

Podobnie dla 0 < α < 1,∫∞

1f(x)dx = ∞.

Zatem szereg∑∞

n=11

nα jest zbieżny dla α > 1 i rozbieżny dla 0 < α ≤ 1.

12.7 Przechodzenie do granicy pod znakiem całki

Niech fn będzie ciągiem funkcji całkowalnych w przedziale zwartym I = [a, b] zbież-nym do funkcji f . Interesuje nas pytanie czy funkcja f jest całkowalna i czy ciągliczbowy

∫ b

afn(x)dx jest zbieżny do

∫ b

af(x)dx? Jak pokazuje następujący przykład

w ogólnym przypadku odpowiedź na to pytanie jest negatywna.


fn(x) = 2nxe−nx2

dla x > 0.

Wówczas limn→∞ fn(x) = 0 dla dowolnego x > 0. Tym nie mniej

limn→∞

∫ 1

0

fn(x)dx = limn→∞

−e−nx2

∣∣∣∣x=1

x=0

= limn→∞

(1− e−n

)= 1.

Powyższy przykład pokazuje, że ze zbieżności punktowej ciągu funkcji nie możnawnioskować o zbieżności ciągu całek z tych funkcji.

Twierdzenie 12.12 Niech fn∞n=1 będzie ciągiem funkcji całkowalnych na przedzialeI zbieżnym jednostajnie na I do funkcji f . Wówczas f jest całkowalna na I oraz dladowolnego x ∈ I ciąg funkcji ϕn(x) =

∫ x

xfn(t)dt jest zbieżny jednostajnie do funkcji

ϕ(x) =∫ x

xf(t)dt na I. W szczególności limn→∞

∫ b

afn(t)dt =

∫ b

af(t)dt.

54

Wniosek 12.8 Niech fn∞n=1 będzie ciągiem funkcji całkowalnych na przedziale Ioraz szereg

∑∞n=1 fn jest zbieżnym jednostajnie na I do funkcji S na I. Wówczas S

jest całkowalna na I oraz dla dowolnego x ∈ I szereg∑∞

n=1

∫ x

xfn(t)dt jest zbieżny

jednostajnie do funkcji ϕ(x) =∫ x

xS(t)dt na I.

Przykład 12.3 Rozważmy szereg∑∞

n=1 nxn−1. Z kryterium d’Alamberta wynika,że szereg ten jest zbieżny dla x ∈ (−1, 1). Oznaczmy jego sumę przez S(x). Ponieważszereg ten jest zbieżny jednostajnie na dowolnym domkniętym podprzedziale [a, b] ⊂(−1, 1), więc korzystając z Wniosku 12.7 dostajemy

∫ x

0

S(t)dt =

∫ x

0

∞∑n=1

ntn−1dt =∞∑

n=1

∫ x

0

nxn−1dt =∞∑

n=1

xn =x

1− x.

Stąd

S(x) =

(x

1− x

)′=

1

(1− x)2dla x ∈ (−1, 1).

12.8 Całki zależne od parametru

Niech U ⊂ R2 będzie zbiorem otwartym, [a, b]× [c, d] ⊂ U oraz f : U → R. Załóżmy,że dla każdego y ∈ [c, d] istnieje całka

∫ b

a

f(x, y)dx =: g(y).

Interesuje nas pytanie czy funkcja g jest różniczkowalna?

Twierdzenie 12.13 Jeśli w prostokącie P = [a, b]× [c, d] funkcja f jest ciągła i maciągłą pochodną cząstkową ∂f

∂y, to funkcja

g(y) =

∫ b

a

f(x, y)dx

jest różniczkowalna dla y ∈ (c, d) oraz

g′(y) =

∫ b

a

∂f

∂y(x, y)dx dla y ∈ (c, d).

Całki zależne od parametru umożliwiają zdefiniowanie wielu nowych funkcji. Jednąz nich, niezwykle ważną w Analizie, jest funkcja Γ-Eulera. Określamy ją wzorem

Γ(x) =

∫ ∞

0

tx−1e−tdt dla x > 0.

Całka w tym wzorze jest całką niewłaściwą. Można wykazać, że jest ona zbieżna dlax > 0. Korzystając ze wzory na całkowanie przez części dostajemy wzór

Γ(x + 1) = xΓ(x) dla x > 0.

55

Ponieważ Γ(1) =∫∞0

e−tdt = 1 wnioskujemy stąd, że Γ(n) = (n − 1)! dla n ∈ N.Zatem funkcja Γ jest przedłużeniem funkcji „silnia” na argumenty dodatnie. Okazujesię, że można ją też zdefiniować na płaszczyźnie zespolonej.

Inną ważną funkcją definiowaną przy pomocy całki z parametrami jest funkcjaB-Eulera.

B(x, y) =

∫ 1

0

tx−1(1− t)y−1dt dla x > 0, y > 0.

Związek pomiędzy funkcjami Γ i B wyraża wzór

B(x, y) =Γ(x)Γ(y)

Γ(x + y)dla x > 0, y > 0.

Wzór ten udowodnimy po nauczeniu się całkowania funkcji wielu zmiennych.Zauważmy, że kładąc t = sin2 ϕ, mamy 1− t = cos2 ϕ, dt = 2 sin ϕ cos ϕ. Zatem

2

∫ π/2

0

sin2x−1 ϕ · cos2y−1 ϕdϕ = B(x, y).

56

13 Całki wielokrotne

13.1 Definicja i własności całki n-krotnej na przedziale

Przypomnijmy, że przedziałem domkniętym lub kostką domkniętą w przestrzeni n-wymiarowej Rn nazywamy zbiór

P = P (a, b) = x ∈ Rn : ai ≤ xi ≤ bi, i = 1, . . . , n, gdzie a < b.

Średnicą przedziału P nazywamy liczbę

δ = δ(P ) =√

(b1 − a1)2 + · · ·+ (bn − an)2.

n-wymiarową miarą lub objętością przedziału P nazywamy iloczyn

|P | = (b1 − a1) · · · (bn − an).

Podziałem przedziału domkniętego P nazywamy rodzinę Π = P1, . . . , Pk przedzia-łów domkniętych Pi o rozłącznych wnętrzach

intPi ∩ intPj dla i 6= j

taką, że

P =k⋃

i=1

Pi.

Jeśli δi jest średnicą przedziału Pi w podziale Π przedziału P , to δ = maxi=1,...,k δi

nazywamy średnicą podziału Π. Ciąg podziałów Πj∞j=1 przedziału P nazywamynormalnym jeśli limj→∞ δj = 0 gdzie δj jest średnicą podziału Πj.

Niech f : P → R funkcją ograniczoną zdefiniowaną na przedziale domkniętym P ,a Π = P1, . . . , Pk podziałem tego przedziału. Oznaczmy odpowiednio przez m i Mkresy dolny i górny funkcji f na przedziale P , tzn.

m = infx∈P

f(x), M = supx∈P

f(x).

Dla i = 1, . . . , k niech

mi = inff(x) : x ∈ Pi,Mi = supf(x) : x ∈ Pi.

Liczby s i S, gdzie

s = m1|P1|+ · · ·+ mk|Pk|,S = M1|P1|+ · · ·+ Mk|Pk|,

nazywamy odpowiednio sumą dolną i sumą górną funkcji f odpowiadającą podziałowiΠ. Bezpośrednio z powyższej definicji otrzymujemy nierówności

m(b− a)1 ≤ s ≤ S ≤ M(b− a)1,

gdzie (b− a)1 = (b1 − a1) · · · (bn − an).

57

Rozpatrzmy teraz normalny ciąg podziałów Πj∞j=1 przedziału P . Niech δj będzieśrednicą podziału Πj, a sj i Sj odpowiednio sumą dolną i górną funkcji f odpowia-dającą podziałowi Πj, j = 1, 2, . . ..

Lemat 13.1 Niech f : P → R będzie funkcją ograniczoną. Wówczas dla dowolnegonormalnego ciągu podziałów przedziału P istnieją skończone granice

s = limj→∞

sj, S = limj→∞

Sj

i nie zależą one od wyboru normalnego ciągu podziałów.

Definicja 13.1 Liczbę s nazywamy całką dolną funkcji f na przedziale P , a liczbęS nazywamy całką górną funkcji f na przedziale P . Stosujemy też oznaczenia

s =

∫ b

a

f(x)dx = limj→∞

sj, S =

∫ b

a

f(x)dx = limj→∞

Sj.

Definicja 13.2 Niech f : P → R będzie funkcją ograniczoną. Mówimy, że f jestcałkowalna w sensie Riemanna na przedziale P jeśli jej całka dolna na przedziale Pjest równa jej całce górnej funkcji na przedziale P . Wówczas wspólną wartość tychcałek nazywamy całką oznaczoną Riemanna funkcji f na przedziale P i oznaczamy

∫

P

f(x)dx =

∫ b1

a1

· · ·∫ bn

an

f(x1, . . . , xn)dx1 . . . dxn.

Własności całki Riemanna.1. Jeśli f : P → R jest funkcją ciągłą na przedziale domkniętym P , to f jest

całkowalna na P .2. Jeśli f, g : P → R są całkowalne na P i c ∈ R, to f + g i cf są całkowalne na

P oraz ∫

P

(f(x) + g(x)

)dx =

∫

P

f(x)dx +

∫

P

g(x)dx,∫

P

c · f(x)dx = c ·∫

P

f(x)dx.

Definicja 13.3 Niech Π = P1, . . . , Pk będzie podziałem przedziału P oraz niechξi ∈ Pi dla i = 1, . . . , k. Sumę

σ = f(ξ1)|P1|+ · · ·+ f(ξk)|Pk|nazywamy sumą przybliżoną. Ciąg sum przybliżonych dla normalnego ciągu podzia-łów nazywamy ciągiem aproksymacyjnym.

Lemat 13.2 Funkcja f : P → R jest całkowalna na przedziale P wtedy i tylkowtedy, gdy istnieje normalny ciąg podziałów taki, że wszystkie ciągi aproksymacyjnesą zbieżne do tej samej granicy.

Interpretacja geometryczna całki podwójnej.

Niech P = [a, b]× [c, d] ⊂ R2 oraz niech f : P → R będzie funkcją ciągłą na P .Jeśli f ≥ 0, to

∫P

f(x, y)dxdy jest objętością bryły G, gdzie

G = (x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f(x, y).

58

13.2 Całka iterowana

Obliczanie całki wielokrotnej bezpośrednio z definicje jest zadaniem trudnym i prak-tycznie niewykonalnym. Przykładowo zadanie obliczenia całki

∫∫

[0,1]2xydxdy

sprowadza się do znalezienia granicy przy k →∞ podwójnej sumy

k∑i,j=1

i · jk2

· 1

k2=

k(k + 1)

2k2· k(k + 1)

2k2→ 1

4.

Okazuje się, że całkę wielokrotną można sprowadzić do całki iterowanej, którą z koleimożna obliczyć korzystając z całki nieoznaczonej jednej zmiennej. Pojęcie całki itero-wanej wprowadzimy w przypadku funkcji dwóch zmiennych. W ogólnym przypadkupojęcie to można naturalnie uogólnić.

Definicja 13.4 Niech P = [a, b] × [c, d] ⊂ R2 oraz niech f : P → R będzie funkcjąograniczoną. Załóżmy, że dla każdego ustalonego y ∈ [c, d] istnieje całka oznaczonaRiemanna

∫ b

af(x, y)dx. Jeśli funkcja

[c, d] 3 y 7→ g(y) =

∫ b

a

f(x, y)dx

jest całkowalna w sensie Riemanna, to jej całkę na przedziale [c, d] nazywamy całkąiterowaną funkcji f i oznaczamy

∫ d

c

[ ∫ b

a

f(x, y)dx]dy =

∫ d

c

g(y)dy.

Analogicznie definiujemy całkę iterowaną∫ b

a

[ ∫ d

c

f(x, y)dy]dx.

W przypadku funkcji n zmiennych definiuje się n! całek iterowanych.Istnieją przykłady funkcji, dla których istnieją całki iterowane lecz nie istnieje

całka podwójna. Tym nie mniej zachodzi

Twierdzenie 13.1 (Fubiniego.) Niech P = [a, b]× [c, d] ⊂ R2 oraz niech f : P → Rbędzie funkcją ciągłą. Wówczas istnieją całki iterowane i są równe całce podwójnej

∫ d

c

[ ∫ b

a

f(x, y)dx]dy =

∫ b

a

[ ∫ d

c

f(x, y)dy]dx =

∫∫

P

f(x, y)dxdy.

59

13.3 Całka wielokrotna na zbiorze ograniczonym

Pojęcie całki wielokrotnej można uogólnić na funkcje określone na zbiorach ograni-czonych.

Definicja 13.5 Niech D ⊂ Rn będzie zbiorem ograniczonym oraz f : P → R funkcjąograniczoną. Niech P będzie przedziałem zawierającym zbiór D. Wówczas określamy

∫

D

f(x)dx =

∫

P

f0(x)dx,

gdzie

f0(x) =

f(x) dla x ∈ D,

0 dla x 6∈ D.

Całki wielokrotne na dobrych zbiorach można wyznaczyć korzystając z całekiterowanych.

Definicja 13.6 Zbiór D ⊂ R2 nazywamy normalnym względem osi OX jeśli jest onpostaci

D = (x, y) ∈ R2 : a ≤ x ≤ b, ϕ(x) ≤ y ≤ ψ(x),gdzie ϕ, ψ są funkcjami ciągłymi na [a, b] oraz ϕ(x) ≤ ψ(x) dla x ∈ [a, b].Analogicznie D ⊂ R2 nazywamy normalnego względem osi OY jeśli jest on postaci

D = (x, y) ∈ R2 : c ≤ y ≤ d, φ(y) ≤ x ≤ χ(x),

gdzie φ, χ są funkcjami ciągłymi na [a, b] oraz φ(y) ≤ χ(y) dla y ∈ [c, d].

Twierdzenie 13.2 Jeśli f : D → R będzie funkcją ciągłą na zbiorze D ⊂ R2 nor-malnym względem osi OX, to

∫∫

D

f(x, y)dxdy =

∫ b

a

[ ∫ ψ(x)

ϕ(x)

f(x, y)dy]dx.

Analogicznie jeśli f : D → R będzie funkcją ciągłą na zbiorze D ⊂ R2 normalnymwzględem osi OY , to

∫∫

D

f(x, y)dxdy =

∫ d

c

[ ∫ χ(y)

φ(y)

f(x, y)dx]dy.

Zbiór D ⊂ R2 będący skończoną sumą zbiorów normalnych względem osi OX lubOY o rozłącznych wnętrzach nazywamy zbiorem regularnym.Jeśli D = D1 ∪ · · · ∪Dk jest zbiorem regularnym, to

∫∫

D

f(x, y)dxdy =k∑

i=1

∫∫

Di

f(x, y)dxdy

60

Analogicznie definiujemy zbiory regularne w R3. Przykładowo zbiór D ⊂ R3

nazywamy normalnym względem osi OX i płaszczyzny OXY jeśli jest on postaci

D = (x, y, z) ∈ R3 : a ≤ x ≤ b, ϕ(x) ≤ y ≤ ψ(x), g(x, y) ≤ z ≤ h(x, y).

Wówczas dla funkcji f ciągłej na D mamy∫∫∫

D

f(x, y, z) dxdydz =

∫ b

a

( ∫ ψ(x)

ϕ(x)

( ∫ h(x,y)

g(x,y)

f(x, y, z)dz)dy

)dx.

13.4 Zastosowania całek w geometrii

Pole obszaru płaskiego, regularnego D ⊂ R2 zadane jest wzorem

|D| =∫∫

D

1 dxdy.

Środek ciężkości zbioru regularnego D ⊂ R2 ma współrzędne (ξ, η), gdzie

ξ =1

|D|∫∫

D

x dxdy, η =1

|D|∫∫

D

y dxdy.

Objętość bryły V ⊂ R3 zdefiniowanej jako

V = (x, y, z) ∈ R3 : g(x, y) ≤ z ≤ h(x, y), (x, y) ∈ D,

gdzie D ⊂ R2 jest zbiorem regularnym, g i h funkcjami ciągłymi na D wyraża sięwzorem

|V | =∫∫∫

V

1 dxdydz =

∫∫

D

(h(x, y)− g(x, y)

)dxdy.

Niech D ⊂ (x, y) : y > 0 będzie zbiorem regularnym oraz V bryłą powstałąprzez obrót zbioru D wokół osi OX. Wówczas

|V | = 2π

∫∫

D

y dxdy.

Reguła Guldina. Objętość bryły obrotowej V powstałej w wyniku obrotu zbiorunormalnego D ⊂ (x, y) : y > 0 dookoła osi OX jest równa iloczynowi pola zbioruD przez drogę, którą zatacza środek ciężkości zbioru D podczas tego obrotu, tzn.

|V | = 2πη|D|.

Przykład 13.1 Niech T będzie torusem powstałym w wyniku obrotu koła K =(x, y, z) : (x − a)2 + z2 ≤ r2, y = 0, 0 < r ≤ a, dookoła osi OZ. Ponieważ punktciężkości koła K ma współrzędne (a, 0, 0), a jego pole wynosi πr2, więc z regułyGuldina dostajemy objętość torusa T ,

|T | = 2π · a · πr2 = 2π2ar2.

61

Twierdzenie 13.3 Pole powierzchni wykresu funkcji. Niech D ⊂ R2 będzie zbioremregularnym, a f : D → R funkcją klasy C1. Wówczas pole powierzchni wykresufunkcji f , t.j. pole powierzchni zbioru

S = (x, y, z) ∈ R3 : z = f(x, y), (x, y) ∈ Dwyraża się wzorem

|S| =∫∫

D

√1 +

(∂f(x, y)

∂x

)2

+

(∂f(x, y)

∂y

)2

dxdy.

13.5 Zamiana zmiennych w całce wielokrotnej

Dla funkcji jednej zmiennej zachodzi wzór na całkowanie przez podstawienie.Mianowicie, jeśli ϕ : [a, b] → [α, β] oraz f : [α, β] → R są funkcjami ciągłymi orazϕ ma ciągłą pochodną w przedziale [a, b], to

∫ b

a

f(ϕ(x)

)ϕ′(x) dx =

∫ ϕ(b)

ϕ(a)

f(y) dy.

Uogólnimy teraz tez wzór na przypadek całek wielokrotnych.

Twierdzenie 13.4 Niech ∆ i D będą regularnymi zbiorami w Rn oraz niechΦ = (ϕ1, . . . , ϕn) : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem klasyC1 zbioru ∆ na D (dyfeomorfizmem). Jeśli f : D → R jest funkcją ciągłą, to∫

D

f(y) dy =

∫

∆

f(Φ(x)

)|JΦ(x)| dx,

gdzie JΦ = det D(ϕ1,...,ϕn)D(x1,...,xn)

jest jakobianem odwzorowania Φ.

Dowód Twierdzenia 13.4 przeprowadzimy dla n = 2. Wówczas można je sformu-łować następująco.

Twierdzenie 13.5 Niech ∆ i D będą regularnymi zbiorami w R2 oraz niechΦ = (ϕ, ψ) : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem zbioru ∆na D, przy czym ϕ, ψ są klasy C1, ϕ(u, v) = x, ψ(u, v) = y dla (u, v) ∈ ∆.Jeśli f : D → R jest funkcją ciągłą, to

∫∫

D

f(x, y) dxdy =

∫∫

∆

f(ϕ(u, v), ψ(u, v)

)∣∣∣∣ detD(ϕ, ψ)

D(u, v)(u, v)

∣∣∣∣ dudv.

W wymiarze n = 3 Twierdzenie 13.4 przyjmuje postać.

Twierdzenie 13.6 Niech ∆ i D będą regularnymi zbiorami w R3 oraz niechΦ = (ϕ, ψ, χ) : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem zbioru∆ na D, przy czym ϕ, ψ, χ są klasy C1, ϕ(u, v, w) = x, ψ(u, v, w) = y, χ(u, v, w) = zdla (u, v, w) ∈ ∆. Jeśli f : D → R jest funkcją ciągłą, to∫∫∫

D

f(x, y, z) dxdydz

=

∫∫∫

∆

f(ϕ(u, v, w), ψ(u, v, w), χ(u, v, w)

)∣∣∣∣ detD(ϕ, ψ, χ)

D(u, v, w)(u, v, w)

∣∣∣∣ dudvdw

62

13.6 Przykłady

Przykład 13.2 Niech ∆ i D będą regularnymi zbiorami w Rn oraz niechΦ : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem klasy C1 zbioru ∆na D. Niech f(x) = 1 dla x ∈ D. Wówczas

|D| =∫

D

1 dy =

∫

∆

|JΦ(x)| dx.

Liniowa zamiana zmiennych.Niech Φ : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem liniowym,

tzn. Φ(x) = Ax dla pewnej nieosobliwej macierzy A. Wówczas macierzą różniczki Φjest A czyli JΦ(x) = det A. Zatem dla funkcji f ciągłej na D mamy

∫

D

f(y) dy = | det A|∫

∆

f(Ax) dx.

W szczególności, biorąc f ≡ 1 dostajemy

|D| = | det A| · |∆|.Czyli odwzorowanie liniowe zmienia objętość obszaru proporcjonalnie do wyznacznikamacierzy A.

Współrzędne biegunoweJeśli obszar D ⊂ R2 jest kołem (lub wycinkiem koła, lub pierścieniem), to do

obliczenia całki po D stosujemy współrzędne biegunowe: x = r cos ϕ, y = r sin ϕ.Wówczas odwzorowanie (r, ϕ) → (x, y) przekształca prostokąt ∆ = [0, R]× [0, 2π] nakoło D = K(0, R) = x2 + y2 ≤ R2. Jest to odwzorowanie wzajemnie jednoznacznez Int∆ na IntD \ (x, y) : x ≥ 0, y = 0. Ponieważ ∆ \ Int∆ ma miarę zero możemystosować Twierdzenie 13.5.

Przykład 13.3 Policzymy całkę∫∫

D

dxdy√x2 + y2

, gdzie D = x2 + y2 ≤ 1.

Ponieważ funkcja podcałkowa jest nieograniczona w zerze powyższa całka jest całkąniewłaściwą, tzn. trzeba policzyć granicę

lima→0

∫∫

Da

dxdy√x2 + y2

, gdzie Da = a2 ≤ x2 + y2 ≤ 1, a > 0.

Stosując współrzędne biegunowe dostajemy

lima→0

∫∫

Da

dxdy√x2 + y2

= lima→0

∫∫

[a,1]×[0,2π]

1

r· r drdϕ

= lima→0

∫ 1

a

( ∫ 2π

0

1dϕ)

dr = lima→0

2π(1− a) = 2π.

63

Przykład 13.4 Policzymy całkę

I =

∫∫

R2

e−x2−y2

dxdy.

Ponieważ całkujemy po obszarze nieograniczonym powyższa całka jest całką niewła-ściwą, tzn. trzeba policzyć granicę

I = limR→∞

∫∫

DR

e−x2−y2

dxdy, gdzie DR = x2 + y2 ≤ R2, R > 0.

Stosując współrzędne biegunowe dostajemy

limR→∞

∫∫

DR

e−x2−y2

dxdy

= limR→∞

∫∫

[0,R]×[0,2π]

e−r2 · r drdϕ = limR→∞

∫ R

0

( ∫ 2π

0

e−r2

r dϕ)dr

= limR→∞

∫ R

0

2πre−r2

dr = limR→∞

−πe−r2∣∣∣r=R

r=0

= limR→∞

(π − πe−R2)

= π.

Z drugiej strony na mocy twierdzenia Fubiniego

I =

∫∫

R2

e−x2−y2

dxdy =

∫

R

( ∫

Re−x2

dx

)e−y2

dy

=

∫

Re−x2

dx ·∫

Re−y2

dy.

Zatem wykazaliśmy ważny wzór∫

Re−x2

dx =√

π.

Związek pomiędzy funkcjami Γ i B-Eulera.

Przypomnijmy, że funkcje Γ i B-Eulera były określone dla x > 0, y > 0 wzorami

Γ(x) =

∫ ∞

0

tx−1e−t dt, B(x, y) =

∫ 1

0

tx−1(1− t)y−1 dt.

Wyprowadzimy teraz związek pomiędzy tymi funkcjami. Korzystając z twierdzeniaFubiniego mamy

Γ(x)Γ(y) =

∫ ∞

0

tx−1e−t dt ·∫ ∞

0

sy−1e−s ds =

∫ ∞

0

∫ ∞

0

tx−1sy−1e−t−s dtds.

64

W całce podwójnej dokonajmy zamiany zmiennych t = u, t + s = v. Wówczas(t, s) ∈ R+ × R+ wtedy i tylko wtedy, gdy v ∈ R+, 0 ≤ u ≤ v oraz dtds = dudv.Zatem ∫ ∞

0

∫ ∞

0

tx−1sy−1e−t−s dtds =

∫ ∞

0

∫ v

0

ux−1(v − u)y−1e−v dudv

=

∫ ∞

0

( ∫ v

0

ux−1(v − u)y−1 du

)e−v dv.

Dokonajmy teraz zamiany zmiennych w całce wewnętrznej u = tv, 0 ≤ t ≤ 1, du =vdt,

∫ v

0

ux−1(v − u)y−1 du =

∫ 1

0

(tv)x−1(v − tv)y−1v dt

= vx+y−1

∫ 1

0

tx−1(1− t)y−1 dt = vx+y−1B(x, y).

Zatem

Γ(x)Γ(y) =

∫ ∞

0

vx+y−1B(x, y)e−vdv = B(x, y)Γ(x + y).

Współrzędne walcowe.Jeśli obszar V ⊂ R3 jest częścią walca lub stożka, to do liczenia całek wygodnie

jest stosować współrzędne walcowe. x = r cos ϕ, y = r sin ϕ, z = z. Wówczas

|J(r, ϕ, z)| =∣∣∣ det

cos ϕ sin ϕ 0−r sin ϕ r cos ϕ 0

0 0 1

∣∣∣ = r.

Przykład 13.5 Policzymy całkę∫∫∫

V

(x2 + y2) dxdydz,

gdzie V jest stożkiem ściętym V = (x, y, z) : x2 + y2 ≤ z2, 0 < R1 ≤ z ≤ R2.Przeciwobrazem V przy współrzędnych walcowych jest ∆ = (r, ϕ, z) : 0 ≤ r ≤z, 0 ≤ ϕ ≤ 2π, R1 ≤ z ≤ R2. Zatem

∫∫∫

V

(x2 + y2) dxdydz =

∫∫∫

∆

r2 · r drdϕdz =

∫ R2

R1

(∫ 2π

0

( ∫ z

0

r3 dr

)dϕ

)dz

=

∫ R2

R1

( ∫ 2π

0

z4

4dϕ

)dz =

∫ R2

R1

πz4

2dz =

π

10

(R5

2 −R51

).

Współrzędne sferyczne.Jeśli obszar V ⊂ R3 jest częścią kuli, to do liczenia całek stosujemy współrzędne

sferyczne x = r cos ϕ cos ψ, y = r sin ϕ cos ψ, z = r sin ψ. Wówczas

|J(r, ϕ, ψ)| =∣∣∣ det

cos ϕ cos ψ sin ϕ cos ψ sin ψ−r sin ϕ cos ψ r cos ϕ cos ψ 0−r cos ϕ sin ψ −r sin ϕ sin ψ r cos ψ

∣∣∣ = r2 cos ψ.

65

Przykład 13.6 Policzymy objętość kuli B(R) o promieniu R,

|B(R)| =∫∫∫

B(R)

1 dxdydz.

Przeciwobrazem B(R) przy współrzędnych sferycznych jest ∆ = (r, ϕ, ψ) : 0 ≤ r ≤R, 0 ≤ ϕ ≤ 2π,−π/2 ≤ ψ ≤ π/2. Zatem

|B(R)| =∫∫∫

∆

r2 cos ψ drdϕdψ =

∫ R

0

r2 dr ·∫ 2π

0

dϕ ·∫ π/2

−π/2

cos ψ dψ

=R3

3· 2π · 2 =

4

3R3.

Zauważmy, że przekształcenie liniowe x = ax′ y = by′, z = cz′ przekształca elipsoidęE = x2

a2 + y2

b2+ z2

c2≤ 1 na kulę B = x′2 + y′2 + z′2 ≤ 1 oraz dxdydz = abcdx′dy′dz′.

Zatem |E| = 43πabc.

Pole krzywoliniowego prostokąta.

Przykład 13.7 Obliczymy pole krzywoliniowego prostokąta D ograniczonego para-bolami y2 = px, y2 = qx, x2 = ay i x2 = by, gdzie 0 < p < q, 0 < a < b.Zauważmy, że dowolny punkt (x, y) ∈ D jest jednoznacznie wyznaczony przez parę(u, v) ∈ ∆ = [p, q] × [a, b], jako przecięcie parabol y2 = ux i x2 = vy, mianowiciex =

3√

uv2, y =3√

u2v. Zatem mamy dyfeomorfizm

∆ 3 (u, v) → Φ(u, v) =( 3√

uv2,3√

u2v) ∈ D.

Liczymy moduł jakobianu JΦ,

|JΦ(u, v)| =∣∣∣ det

(13u−2/3v2/3 2

3u1/3v−1/3

23u−1/3v1/3 1

3u2/3v−2/3

) ∣∣∣ =1

3.

Zatem|D| =

∫∫

D

dxdy =

∫∫

∆

1

3dudv =

1

3(q − p)(b− a).

Analogicznie obliczamy pola krzywoliniowych prostokątów ograniczonych przezodcinki hiperbol, parabol, prostych itp.

66

14 Orientacja

14.1 Orientacja przestrzeni

Niech (e1, . . . , en), gdzie ei = (0, . . . , 1, . . . , 0), i = 1, . . . , n, będzie bazą standardowąprzestrzeni Rn. Niech (f1, . . . , fn) będzie inną bazą przestrzeni Rn, przy czym kolej-ność wektorów f1, . . . , fn jest istotna. Każdy wektor fj można przedstawić w postaciliniowej kombinacji wektorów ei, i = 1 . . . , n, tzn.

fj =n∑

i=1

aijei, j = 1, . . . , n.

Utwórzmy macierz A =(aij

)i,j=1,...,n

. Mówimy, że baza (f1, . . . , fn) wyznacza orienta-cję przestrzeni Rn zgodną z bazą (e1, . . . , en) (odpowiednio, przeciwną) jeśli DetA > 0(odpowiednio, DetA < 0). Orientację wyznaczoną przez bazę (e1, . . . , en) nazywa sięteż orientacją dodatnią, a orientację do niej przeciwną orientacją ujemną.

Przykład 14.1 Niech f1 = (2, 1), f2 = (1, 3). Wówczas (f1, f2) wyznacza orientacjędodatnią R2, natomiast (f2, f1) orientację ujemną.

14.2 Orientacja rozmaitości

Niech S ⊂ Rm będzie n-wymiarową rozmaitością, n ≤ m. Wówczas dla każdegopunktu x ∈ S istnieje zbiór otwarty Ω ⊂ Rn oraz dyfeomorfizm Φ : Ω → Rm taki,że Φ(Ω) 3 x. Oznaczmy a = Φ−1(x). Ponieważ rządDΦ(a) = n, więc przestrzeniąstyczną do S w punkcie x jest TxS = DΦ(a)

(Rn

). Przestrzeń TxS jest przestrzenią

liniową, można więc określić w niej orientację. Mianowicie przez dodatnią orientacjęprzestrzeni TxS rozumiemy orientację wyznaczoną przez układ wektorów (f1, . . . , fn),gdzie fi = DΦ(a)(ei), i = 1, . . . , n.Załóżmy, że w każdym punkcie x ∈ S wybraliśmy orientację przestrzeni stycznej TxS.Jeśli x ∈ Φ(Ω) oraz dla dowolnego y ∈ Φ(Ω) orientacja TyS jest zgodna z orientacjąTxS, to mówimy, że rozmaitość S ma wyznaczoną orientację. Rozmaitość dla którejmożna wyznaczyć orientację nazywamy orientowalną. Jeśli S jest spójna, to możnaw niej wyznaczyć co najwyżej dwie orientacje.

Uwaga. Wstęga Möbiusa nie jest orientowalna.

Przypadki szczególne.

1. Zbiór otwarty U ⊂ Rn jest n-wymiarową rozmaitością. Ponadto TxU = Rn

dla x ∈ U . Jeśli w każdym punkcie x ∈ U wybierzemy dodatnią (ujemną) orientacjęTxU , to mówimy, że U jest dodatnio (ujemnie) zorientowany.

2. Każda krzywa gładka jest orientowalna i jej orientacja wyznacza kierunekobiegu krzywej.

67

3. Niech M ⊂ R3 będzie 2-wymiarową powierzchnią w R3. Wówczas TxM = R2

dla x ∈ M . Jeśli (ux, vx) jest bazą TxM zgodną z orientacją M , to wektor

nx =ux × vx

‖ux × vx‖

nazywamy wektorem zewnętrznym normalnym do M w punkcie x. Wektor nx ∈ R3

jest wektorem o długości 1 prostopadłym do wektorów ux i vx oraz trójka (ux, vx, nx)tworzy bazę R3. Mówimy, że (ux, vx) zadaje dodatnią orientację TxM jeśli (ux, vx, nx)zadaje dodatnią orientację R3.

Przykład 14.2 Niech f : Ω ⊂ R2 → R będzie funkcją klasy C1 oraz M wykresemf , tzn.

M = (x, y, z) ∈ R3 : z = f(x, y) dla (x, y) ∈ Ω.Odwzorowanie

Φ(x, y) =(x, y, f(x, y)

)dla (x, y) ∈ Ω

jest mapą płata M . Φ wyznacza dodatnią orientację M za pomocą pary wektorów(u(x,y), v(x,y)), gdzie u(x,y) = DΦ(x, y)(e1), v(x,y) = DΦ(x, y)(e2). Ponieważ macierząróżniczki Φ jest

DΦ(x, y) =

1 00 1

f ′x(x, y) f ′y(x, y)

,

więc

u(x,y) = DΦ(x, y)(e1) = (1, 0, f ′x(x, y)),

v(x,y) = DΦ(x, y)(e2) = (0, 1, f ′y(x, y)).

W celu wyznaczenia wektora normalnego zewnętrznego do M liczymy iloczyn wekto-rowy

u(x,y) × v(x,y) =

∣∣∣∣∣∣

e1 e2 e3

1 0 f ′x(x, y)0 1 f ′y(x, y)

∣∣∣∣∣∣= e1 · (−f ′x(x, y))− e2 · (f ′y(x, y)) + e3

=(− f ′x(x, y),−f ′y(x, y), 1

).

Zatem

n(x, y, f(x, y)) =

(− f ′x(x, y),−f ′y(x, y), 1)

√1 + f ′ 2x (x, y) + f ′ 2y (x, y)

.

68

14.3 Orientacja brzegu rozmaitości

Załóżmy, że S jest rozmaitością n-wymiarową oraz jej brzeg ∂S jest rozmaitością(n−1)-wymiarową. Wówczas orientację ∂S można wyznaczyć korzystając z orientacjiS. Opiszemy tę procedurę w kilku ważnych przypadkach.

Przypadek 1. Niech U ⊂ R2 będzie zbiorem otwartym, którego brzeg γ = ∂Ujest krzywą zamkniętą. Wówczas na γ mamy orientację dodatnią jeśli podczas obiegukrzywej γ zbiór U leży po lewej stronie.

Przypadek 2. Niech M ⊂ R3 będzie 2-wymiarową powierzchnią z brzegiem, ajej brzeg γ = ∂M krzywą gładką. Wtedy dla każdego punktu x ∈ γ = ∂M istniejezbiór otwarty x ∈ U ⊂ M oraz homeomorfizm regularny

Φ : K+ = (x, y) ∈ R2 : x2 + y2 < 1, y ≥ 0 →na U

taki, że Φ(0, 0) = x. Niech orientacja ma M będzie zgodna z orientacją wyznaczonąprzez mapę Φ, Połóżmy f1 = DΦ(0, 0)(e1), f2 = DΦ(0, 0)(e2). Wówczas para wekto-rów (f1, f2) zadaje orientację w x, przy czym wektor f1 jest styczny do γ w punkciex. Mówimy, że orientacje M i γ są zgodne jeśli f1 wyznacza orientację na γ zgodnąz pierwotną orientacją γ.

Przypadek 3. Niech U ⊂ R3 będzie zbiorem otwartym, którego brzeg M = ∂Ujest 2-wymiarową powierzchnią. Niech orientacja TxM będzie zadana przez paręwektorów (ux, vx) oraz niech

nx =ux × vx

‖ux × vx‖będzie wektorem normalnym do M w punkcie x. Oznaczmy

xε = x + εnx.

Wówczas mówimy, że M jest zorientowana dodatnio (ujemnie) jeśli xε 6∈ U (xε ∈ U)dla dostatecznie małych ε > 0. Innymi słowami M = ∂U jest zorientowana dodatniojeśli wektory nx dla x ∈ M są skierowane na zewnątrz U .

69

15 Całka krzywoliniowa

15.1 Krzywe w Rn

Definicja 15.1 Niech γ : [a, b] → Rn będzie funkcją ciągłą i różnowartościową wprzedziałach [a, b) i (a, b]. Wówczas zbiór

γ = x ∈ Rn : x = γ(t) dla pewnego t ∈ [a, b]jest krzywą zwartą i spójną, a γ jest parametryzacją γ.Krzywą γ nazywamy łukiem gładkim jeśli jest ona wyznaczona przez parametryzacjęγ = (γ1, . . . , γn) : [a, b] → Rn taką, że γ1, . . . , γn są funkcjami klasy C1 oraz

γ′ 21 (t) + · · ·+ γ′ 2n (t) > 0

dla każdego t ∈ (a, b). Orientację krzywej γ wyznacza wektor

γ′(t) =(γ′1(t), . . . , γ

′n(t)

).

Będziemy też dopuszczali przypadek, gdy krzywa γ jest sumą skończonej ilości łukówgładkich. Długością krzywej γ nazywamy całkę

d = d(γ) =

∫ b

a

√γ′ 21 (t) + · · ·+ γ′ 2n (t)dt

15.2 Całka krzywoliniowa zorientowana

Niech F = (F1, F2, F3) będzie polem sił określonym na obszarze U ⊂ R3 oraz γkrzywą zawartą w U . Naturalnym problemem jest potrzeba znalezienia wielkościpracy potrzebnej do przesunięcia zadanej masy wzdłuż krzywej γ. Do rozwiązaniatego problemu służy całka krzywoliniowa zorientowana.

Definicja 15.2 Niech γ : [a, b] → Rn będzie parametryzacją krzywej γ oraz F =(F1, . . . , Fn) : γ → Rn polem wektorowym na γ. Niech Π = t0, . . . , tk, gdziea = t0 < t1 < · · · < tk = b, będzie podziałem odcinka [a, b]. Wybierzmy dowolniepunkty θi ∈ [ti−1, ti] dla i = 1, . . . , k. Niech ∆xj,i = γj(ti)−γj(ti−1) będzie przyrostemγj w przedziale [ti−1, ti], j = 1, . . . , n, i = 1, . . . , k. Wówczas sumę

σ =k∑

i=1

F1

(γ(θi)

) ·∆x1,i + · · ·+ Fn

(γ(θi)

) ·∆xn,i

nazywamy sumą przybliżoną. Następnie analogicznie do konstrukcji całki Riemannafunkcji jednej zmiennej definiujemy ciąg normalny podziałów oraz ciągi aproksyma-cyjne. Jeśli są one zbieżne do wspólnej granicy, to nazywamy ją całką zorientowanąpola F wzdłuż krzywej γ oznaczamy

∫

γ

F(x)dx =

∫

γ

F1(x)dx1 + · · ·+ Fn(x)dxn.

70

Zauważmy, że jeśli krzywa γ jest sumą dwóch krzywych γ1 + γ2, to∫

γ

F(x)dx =

∫

γ1

F(x)dx +

∫

γ2

F(x)dx.

W szczególności, jeśli γ2 = −γ1 tzn. γ2(t) = γ1(−t) dla t ∈ [a, b], to∫

−γ1

F(x)dx = −∫

γ1

F(x)dx.

Uwaga. Wyrażenie F1(x)dx1 + · · ·+ Fn(x)dxn nazywane jest 1-formą.

Okazuje się, że całka krzywoliniowa zorientowana zależy tylko od orientacji krzy-wej, a nie od jej parametryzacji. Ponadto można ją obliczyć korzystając z całkiRiemanna.

Twierdzenie 15.1 Niech F = (F1, . . . , Fn) : γ → Rn będzie ciągłym polem wektoro-wym na krzywej gładkiej γ oraz niech γ : [a, b] → Rn będzie parametryzacją γ klasyC1. Wówczas całka zorientowana

∫γFdx istnieje oraz

∫

γ

Fdx =

∫ b

a

F(γ(t)

) γ′(t)dt

=

∫ b

a

(F1

(γ(t)

) · γ′1(t) + · · ·+ Fn

(γ(t)

) · γ′n(t))dt.

Ponadto∫

γFdx zależy tylko od orientacji krzywej γ.

Wniosek 15.1 Jeśli γ = (x(t), y(t))

: t ∈ [a, b] jest krzywą gładką w R2 orazF = (P, Q) ciągłym polem wektorowym na γ, to

∫

γ

P (x, y)dx + Q(x, y)dy =

∫ b

a

(P

(x(t), y(t)

) · x′(t) + Q(x(t), y(t)

) · y′(t))dt.

Wniosek 15.2 Jeśli γ = (x(t), y(t), z(t))

: t ∈ [a, b] jest krzywą gładką w R3 orazF = (P, Q,R) ciągłym polem wektorowym na γ, to∫

γ

P (x, y, z)dx + Q(x, y, z)dy + R(x, y, z)dz

=

∫ b

a

(P

(x(t), y(t), z(t)

) · x′(t) + Q(x(t), y(t), z(t)

) · y′(t) + R(x(t), y(t), z(t)

) · z′(t))dt.

Przykład 15.1 Niech F(x, y) =( −y

x2+y2 ,x

x2+y2

)będzie polem wektorowym na R2 \

(0, 0) oraz γ = (r cos t, r sin t), 0 ≤ t ≤ 2π okręgiem o promieniu r > 0. Wówczas∫

γ

x

x2 + y2dy − y

x2 + y2dx

=

∫ 2π

0

r cos t

(r cos t)2 + (r sin t)2· r cos t +

−r sin t

(r cos t)2 + (r sin t)2· (−r sin t)

dt

=

∫ 2π

0

1 dt = 2π.

Zauważmy, że całka ta nie zależy od r.

71

15.3 Całka krzywoliniowa niezorientowana

Niech f : γ → R będzie funkcją rzeczywistą określoną na krzywej γ. Jeśli f jest dodat-nia, to można ją interpretować jako gęstość masy rozłożonej na krzywej γ i wówczasinteresuje nas problem wyznaczenia masy całej krzywej. W tym celu wprowadzimypojęcie całki krzywoliniowej niezorientowanej.

Definicja 15.3 Niech γ = γ(t) : t ∈ [a, b] będzie krzywą gładką oraz f : γ → Rfunkcją rzeczywistą. Niech Π = t0, . . . , tk, gdzie a = t0 < t1 < · · · < tk = b będziepodziałem odcinka [a, b]. Wybierzmy dowolnie punkty θi ∈ [ti−1, ti] dla i = 1, . . . , k.Niech ∆si będzie długością łuku

(γ(ti−1), γ(ti)

). Wówczas

∆si =

∫ ti

ti−1

√γ′ 21 (t) + · · ·+ γ′ 2n (t)dt.

Definiujemy sumą przybliżoną dla podziału Π:

σ =k∑

i=1

f(γ(θi)

)∆si.

Następnie dla normalnego ciągu podziałów (Πj) oznaczamy przez σj ciąg sum przybli-żonych. Jeśli granica ciągu σj nie zależy od wyboru normalnego ciągu podziałów orazod wyboru punktów θi, to nazywamy ją całką niezorientowaną funkcji f po krzywejγ i oznaczamy ∫

γ

f(x)ds = limj→∞

σj.

Twierdzenie 15.2 Niech f : γ → Rn będzie funkcją ciągłą na krzywej gładkiej γoraz niech γ : [a, b] → Rn będzie parametryzacją γ klasy C1. Wówczas całka niezo-rientowana

∫γf(x)ds istnieje oraz

∫

γ

f(x)ds =

∫ b

a

f(γ(t)

)√γ′ 21 (t) + · · ·+ γ′ 2n (t)dt.

15.4 Związek całki zorientowanej z całką niezorientowaną

Niech γ = γ(t) : t ∈ [a, b] będzie krzywą gładką. Wówczas wektor

γ′(t) =(γ′1(t), . . . , γ

′n(t)

)

jest styczny do γ i skierowany zgodnie z orientacją γ. Jego długość wynosi

‖γ′(t)‖ =√

γ′ 21 (t) + · · ·+ γ′ 2n (t).

Niech F : γ → Rn będzie polem wektorowym na γ. Oznaczmy przez α = α(t) kątpomiędzy wektorami F(t) a γ′(t). Wówczas składowa Fs wektora F styczna do γwynosi

Fs = ‖F‖ · cos α.

72

Policzmy iloczyn skalarny

F(γ(t)

) γ′(t) = ‖F(γ(t)

) · ‖γ′(t)‖ · cos α = Fs

(γ(t)

) · ‖γ′(t)‖.Stąd

∫

γ

F(x) dx =

∫ b

a

F(γ(t)

) γ′(t) dt

=

∫ b

a

Fs

(γ(t)

) · ‖γ′(t)‖ dt

=

∫ b

a

Fs

(γ(t)

) ·√

γ′ 21 (t) + · · ·+ γ′ 2n (t) dt

=

∫

γ

Fs(x) ds.

Czyli ∫

γ

F(x) dx =

∫

γ

Fs(x) ds.

Wniosek 15.3 Jeśli pole wektorowe F jest prostopadłe do krzywej γ, to∫

γ

F(x) dx = 0.

15.5 Zastosowania całek krzywoliniowych

1. Jeśli F = (F1, . . . , Fn) jest siłą działającą na punkt materialny, to pracę potrzebnądo przesunięcia tego punktu wzdłuż krzywej γ obliczamy ze wzoru

W =

∫

γ

F(x) dx =

∫

γ

F1(x) dx1 + · · ·+ Fn(x) dxn

=

∫

γ

Fs(x) ds.

W szczególności, jeśli F⊥γ, tzn. siła F jest prostopadła do γ, to W = 0.2. Niech y = f(x), a ≤ x ≤ b będzie nieujemną funkcją klasy C1. Wówczas pole

powierzchni S powstałej w wyniku obrotu krzywej γ = (x, f(x)), x ∈ [a, b] dookołaosi OX wynosi

|S| = 2π

∫ b

a

f(x)√

1 + f ′ 2(x) dx.

Ponieważ krzywa γ ma parametryzację γ = (x(t) = t, y(t) = f(t)), t ∈ [a, b], więc

|S| = 2π

∫ b

a

y(t)√

x′ 2(t) + y′ 2(t) dt = 2π

∫

γ

y ds.

Przypomnijmy, że środek ciężkości krzywej γ ma wspólrzędne (ξ, η), gdzie ξ = 1|γ|

∫γx ds,

η = 1|γ|

∫γy ds. Zatem otrzymujemy ponownie regułę Guldina

|S| = 2π · η · |γ|.

73

15.6 Wzór Greena

Wzór Greena wyraża związek pomiędzy całką zorientowaną po krzywej zamkniętej(konturze), a całką podwójną po obszarze wewnątrz tej krzywej.

Twierdzenie 15.3 (Greena). Niech D ⊂ R2 będzie zbiorem regularnym, któregobrzeg γ = ∂D jest krzywą regularną zorientowaną dodatnio. Jeśli funkcje P, Q : D →R są klasy C1, to

∮

γ

P (x, y) dx + Q(x, y) dy =

∫∫

D

(∂Q(x, y)

∂x− ∂P (x, y)

∂y

)dxdy.

Wniosek 15.4 Niech D ⊂ R2 będzie zbiorem regularnym, którego brzeg γ = ∂D jestkrzywą regularną zorientowaną dodatnio. Wówczas

|D| =∮

γ

x dy = −∮

γ

y dx =1

2

∮

γ

(x dy − y dx

).

Wniosek 15.5 Niech D ⊂ R2 będzie zbiorem regularnym, którego brzeg γ = ∂D jestkrzywą regularną zorientowaną dodatnio. Jeśli funkcje P,Q : D → R są klasy C1 ispełniają warunek całkowalności

(C)∂Q(x, y)

∂x=

∂P (x, y)

∂ydla (x, y) ∈ D,

to ∮

γ

P (x, y) dx + Q(x, y) dy = 0.

Wniosek 15.6 Niech D ⊂ R2 będzie obszarem spójnym i jednospójnym (tzn, zbiórR2 \ D jest spójny). Jeśli funkcje P, Q : D → R są klasy C1 i spełniają warunekcałkowalności (C), to dla dowolnej krzywej regularnej γ ⊂ D całka

∫

γ

P (x, y) dx + Q(x, y) dy

zależy tylko od początku i końca tej krzywej.

Przy założeniach powyższego wniosku wybierając dowolnie punkt (x, y) ∈ D możemyokreślić funkcję

U(x, y) = −∫ (x,y)

(x,y)

P (ξ, η) dξ + Q(ξ, η) dη dla (x, y) ∈ D.

74

Tak określoną funkcję U : D → R nazywamy potencjałem pola wektorowego (P, Q).Zauważmy, że

∂U(x, y)

∂x= − lim

h→0

1

h

( ∫ (x+h,y)

(x,y)

P (ξ, η) dξ + Q(ξ, η) dη −∫ (x,y)

(x,y)

P (ξ, η) dξ + Q(ξ, η) dη

)

= − limh→0

1

h

∫ (x+h,y)

(x,y)

P (ξ, η) dξ + Q(ξ, η) dη

= − limh→0

1

h

∫ h

0

P (x + t, y)(t)′ dt

= −P (x, y).

Analogicznie dostajemy

∂U(x, y)

∂y= −Q(x, y).

Ponieważ P i Q są klasy C1, funkcja U jest klasy C2. Zatem jej pochodne mieszanesą równe

∂2U(x, y)

∂x∂y= − ∂

∂xQ(x, y)

‖∂2U(x, y)

∂y∂x= − ∂

∂yP (x, y).

Co jest zgodne z warunkiem (C).

15.7 Niezależność całki krzywoliniowej od drogi całkowania

Załóżmy teraz, że pole wektorowe F : D → Rn jest określone na spójnym i jedno-spójnym obszarze D ⊂ Rn.

Definicja 15.4 Mówimy, że całka krzywoliniowa pola F nie zależy od drogi całkowa-nia, jeśli dla dowolnych krzywych regularnych γ1 i γ2 o tych samych końcach zachodzi

∫

γ1

F(x) dx =

∫

γ2

F(x) dx.

Wówczas pole F nazywamy potencjalnym, a jego potencjał wynosi

U(x) =

∫ x

x

F(ξ) dξ.

Analogicznie jak w przypadku n = 2 wykazuje się, że

∂U(x)

∂xi

= −Fi(x) dla i = 1, . . . , n.

75

Jeśli pole F jest klasy C1, to potencjał U jest klasy C2 oraz zachodzi

∂2U(x)

∂xj∂xi

= − ∂

∂xj

Fi(x)

‖∂2U(x)

∂xi∂xj

= − ∂

∂xi

Fj(x).

Zatem pole F spełnia warunek całkowalności

(Cn)∂

∂xj

Fi(x) =∂

∂xi

Fj(x) dla i, j = 1, . . . , n.

Uwaga. W przypadku pola F = [P,Q, R] : D ⊂ R3 → R3 warunek całkowalnościprzyjmuje postać:

∂P (x,y,z)∂y

= ∂Q(x,y,z)∂x

,∂Q(x,y,z)

∂z= ∂R(x,y,z)

∂y,

∂R(x,y,z)∂x

= ∂P (x,y,z)∂z

dla (x, y, z) ∈ D.

Wykażemy później, że jeśli pole F spełnia warunek całkowalności w obszarze jedno-spójnym, to jest ono potencjalne.

15.8 Całka krzywoliniowa funkcji o wartościach zespolonych

Niech D ⊂ C ' R2 będzie obszarem na płaszczyźnie zespolonej oraz γ krzywą re-gularną w D. Niech f : D → C będzie funkcją ciągłą o wartościach zespolonych.Oznaczmy z = x + iy, f = u + iv. Wówczas funkcje u, v : D → R można traktowaćjako funkcje rzeczywiste na zbiorze D ⊂ R2. Definiujemy

∫

γ

f(z) dz =

∫

γ

(u(x, y) + iv(x, y)

)(dx + idy)

=

∫

γ

(u(x, y) dx− v(x, y) dy

)+ i

∫

γ

(v(x, y) dx + u(x, y) dy

).

Zauważmy, że warunek (C) niezależnośći całki od drogi całkowania przyjmuje postać

(CR)

∂u(x, y)∂x

=∂v(x, y)

∂y,

∂u(x, y)∂y

= −∂v(x, y)∂x

dla (x, y) ∈ D.

Równania (CR) nazywają się układem Cauchy-Riemanna.Uwaga. Funkcja f(z) = 1

zspełnia równania (CR). Tym nie mniej

∫∂B(0,R)

1zdz =

2πi. Zatem całka po konturze zamkniętym nie jest równa zero. Wynika to z faktu,że zbiór B(0, R) \ 0 nie jest jednospójny.

76

16 Całki powierzchniowe

16.1 Całka powierzchniowa niezorientowana

Niech D ⊂ R2 będzie zbiorem regularnym oraz f : D → R funkcją klasy C1. Wówczaswykres funkcji f czyli zbiór

S = (x, y, z) ∈ R3 : z = f(x, y), (x, y) ∈ D

jest płatem regularnym. Jak wiemy pole płata S wyraża się wzorem

|S| =∫∫

D

√1 +

(∂f(x, y)

∂x

)2

+

(∂f(x, y)

∂y

)2

dxdy.

Niech F : S → R będzie funkcją ograniczoną. Podzielmy D na k zbiorów regularnych,tzn.

D =k⋃

i=1

Di gdzie intDi ∩ intDj = ∅ dla i 6= j.

Oznaczmy przez ∆i część wykresu funkcji f nad zbiorem Di oraz przez |∆Si| pole∆Si, i = 1, . . . , k. Wybierzmy dowolnie punkt Ai ∈ ∆Si, i = 1, . . . , k i utwórzmysumę przybliżoną

σ =k∑

i=1

F (Ai)|∆Si|.

Następnie tworzymy normalny ciąg podziałów zbioru D, odpowiadający mu ciąg po-działów zbioru S oraz ciąg sum przybliżonych. Jeżeli wszystkie ciągi przybliżone sązbieżne do tej samej granicy to granicę tę nazywamy całką powierzchniową niezorien-towaną funkcji F po płacie S i oznaczamy

∫∫

S

F (x, y, z) dS.

Zachodzi

Twierdzenie 16.1 Niech f : D → R będzie funkcją klasy C1 oraz

S = (x, y, z) ∈ R3 : z = f(x, y) dla (x, y) ∈ D

będzie płatem regularnym. Jeśli F : S → R jest funkcją ciągłą, to∫∫

S

F (x, y, z) dS =

∫∫

D

F(x, y, f(x, y)

)√1 + f ′ 2x (x, y) + f ′ 2y (x, y) dxdy.

Analogicznie definiuje się całkę powierzchniową niezorientowaną, w przypadkugdy płat S jest określony przez S = (x, y, z) : y = f(x, z) lub S = (x, y, z) : x =f(y, z).

77

W ogólnym przypadku zbiór S ⊂ R3 jest dwuwymiarowym płatem regularnym,jeśli istnieje zbiór regularny D ⊂ R2 i dyfeomorfizm Φ : D → R3 taki, że Φ(D) = S.Jeśli Φ = (ϕ, ψ, χ), gdzie ϕ, ψ, χ : D → R są funkcjami klasy C1, to zachodzi

Twierdzenie 16.2 Niech S ⊂ R3 będzie płatem dwuwymiarowym regularnym orazF : S → R funkcją ciągłą. Wówczas całka powierzchniowa niezorientowana funkcjiF po płacie S wyraża się wzorem

∫∫

S

F (x, y, z) dS

=

∫∫

D

F(ϕ(u, v), ψ(u, v), χ(u, v)

)√J2

1 (u, v) + J22 (u, v) + J2

3 (u, v) dudv,

gdzie

J1(u, v) =

∣∣∣∣∣∣∣

∂ϕ∂u

∂ϕ∂v

∂ψ∂u

∂ψ∂v

∣∣∣∣∣∣∣= C, J2(u, v) =

∣∣∣∣∣∣∣

∂ϕ∂u

∂ϕ∂v

∂χ∂u

∂χ∂v

∣∣∣∣∣∣∣= −B, J3(u, v) =

∣∣∣∣∣∣∣

∂ψ∂u

∂ψ∂v

∂χ∂u

∂χ∂v

∣∣∣∣∣∣∣= A.

Uwaga. Przypomnijmy, że macierzą różniczki odwzorowania Φ jest macierz

∂ϕ∂u

∂ϕ∂v

∂ψ∂u

∂ψ∂v

∂χ∂u

∂χ∂v

.

Jeśli S ⊂ R3 jest dwuwymiarową rozmaitością (powierzchnią) taką, że można jąrozłożyć na sumę płatów regularnych S = S1 ∪ · · · ∪ Sk o rozłącznych wnętrzachintSi ∩ intSj = ∅ dla i, j = 1 . . . , k, i 6= j, to S nazywamy powierzchnią regularną iprzez całkę po S rozumiemy sumę całek po płatach Si, i = 1, . . . , k.

Interpretacja fizyczna

1. Jeśli na powierzchni S jest rozłożony ładunek elektryczny o gęstości F (x, y, z), tocałka

∫∫S

F (x, y, z) dS wyraża całkowity ładunek na S.

2. Jeśli na powierzchni S jest rozłożona jest materia o gęstości ρ(x, y, z), to całka∫∫S

ρ(x, y, z) dS wyraża całkowitą masę na S.

3. Jeśli na powierzchni S jest rozłożona jest materia o gęstości ρ(x, y, z), to punkt Oo masie jednostkowej jest przyciągany przez S siłą F = (Fx, Fy, Fz), gdzie

Fx =

∫∫

S

ρ(x, y, z)x

(x2 + y2 + z2)3/2dS,

Fy =

∫∫

S

ρ(x, y, z)y

(x2 + y2 + z2)3/2dS,

Fz =

∫∫

S

ρ(x, y, z)z

(x2 + y2 + z2)3/2dS.

78

Przykład 16.1 Niech S = x2 + y2 + z2 = r2, z ≥ 0 będzie jednorodną półsferą ostałej gęstości ρ > 0. Wówczas punkt O o masie jednostkowej jest przyciągany siłąF = (Fx, Fy, Fz). Wobec symetrii jest jasne, że Fx = Fy = 0. Natomiast

Fz =

∫∫

S

ρ · z

(x2 + y2 + z2)3/2dS.

W celu obliczenia tej całki zastosujemy współrzędne sferyczne. Otóż S = Φ(D), gdzieD = [0 ≤ ϕ ≤ 2π]× [0 ≤ ψ ≤ π/2] oraz

Φ(ϕ, ψ) = (r cos ϕ cos ψ, r sin ϕ cos ψ, r sin ψ) = (x, y, z).

Macierzą różniczki odwzorowania Φ jest macierz−r sin ϕ cos ψ −r cos ϕ sin ψr cos ϕ cos ψ − sin ϕ sin ψ

0 r cos ψ

.

Liczymy

J21 + J2

2 + J23 = r4 sin2 ψ cos2 ψ + r4 sin2 ϕ cos4 ψ + r4 cos2 ϕ cos4 ψ = r4 cos2 ψ.

Zatem

Fz = ρ

∫ 2π

0

∫ π/2

0

r sin ψ

r3· r2 cos ψ dψdϕ

= 2πρ

∫ π/2

0

sin ψ cos ψdψ = πρ.

Zauważmy że siła nie zależy od promienia półsfery (czy potrafisz to wytłumaczyć bezrachunków).

Stwierdzenie 16.1 Niech F będzie funkcją ciągła w kuli domkniętej B(R). Wówczas∫∫∫

B(R)

F (x, y, z) dxdydz =

∫ R

0

( ∫∫

Sr

F (x, y, z) dS

)dr,

gdzie Sr = ∂B(r) jest sferą o promieniu r.

Dowód. Korzystając ze współrzędnych sferycznych i wykorzystując rachunki zPrzykładu 16.1 dostajemy

∫∫

Sr

F (x, y, z) dS =

∫ 2π

0

∫ π/2

−π/2

G(r, ϕ, ψ) · r2 cos ψ dψdϕ,

gdzieG(r, ϕ, ψ) = F (r cos ϕ cos ψ, r sin ϕ cos ψ, r sin ψ).

Z drugiej strony∫∫∫

B(R)

F (x, y, z) dxdydz =

∫ R

0

∫ 2π

0

∫ π/2

−π/2

G(r, ϕ, ψ) · r2 cos ψ dψdϕdr.

Zatem na podstawie twierdzenia Fubiniego dostajemy wyprowadzany wzór. 2

79

16.2 Całka powierzchniowa zorientowana

Motywacja.

Załóżmy, że przez powierzchnię S ⊂ R3 przepływa ciecz (gaz, strumień pola,. . . ).W punkcie (x, y, z) ∈ S prędkość przepływu cieczy wynosi v(x, y, z) ∈ R3. Oznaczmyprzez n wektor normalny, zewnętrzny do S. Wówczas składowa prędkości prostopadłado S jest dana przez iloczyn skalarny v n, a całkowita objętość przepływy cieczyprzez S w jednostce czasu wynosi

V =

∫∫

S

v n dS.

Definicja 16.1 Niech S ⊂ R3 będzie płatem regularnym zorientowanym, a n(x, y, z) ∈R3 wektorem normalnym zewnętrznym do S. Niech F :→ R3 będzie ciągłym polemwektorowym na S. Przez całkę powierzchniową zorientowaną pola F (strumieniempola F) przez powierzchnię S nazywamy całkę

∫∫

S

F(x, y, z) n(x, y, z) dS.

Załóżmy, że płat S jest zadany jako obraz zbioru otwartego D ⊂ R2 pod działa-niem dyfeomorfizmu Φ = (ϕ, ψ, χ) : D → R3, tzn.

S = (x, y, z) ∈ R3 : x = ϕ(u, v), y = ψ(u, v), z = χ(u, v) dla (u, v) ∈ D ⊂ R2.Wówczas macierzą różniczki DΦ jest

ϕ′u ϕ′vψ′u ψ′vχ′u χ′v

.

Zatem przestrzeń styczna do S jest rozpięta na wektorach [ϕ′u, ψ′u, χ

′u] = f1 i [ϕ′v, ψ′v, χ′v] =

f2. Wektorem normalnym zewnętrznym jest

n =f1 × f2

‖f1 × f2‖ .

Mamy

f1 × f2 =

∣∣∣∣∣∣

e1 e2 e3

ϕ′u ψ′u χ′uϕ′v ψ′v χ′v

∣∣∣∣∣∣= e1 · (ψ′uχ′v − ψ′vχ

′u)− e2 · (ϕ′uχ′v − ϕ′vχ

′u) + e3 · (ϕ′uψ′v − ϕ′vψ

′u)

=[A,B, C

],

n =

[A,B,C

]√

A2 + B2 + C2.

PonadtodS =

√A2 + B2 + C2 dudv.

80

Zatem jeśli F = [P, Q,R], to∫∫

S

F(x, y, z) n(x, y, z) dS

=

∫∫

D

[P,Q, R] [A,B,C]√A2 + B2 + C2

√A2 + B2 + C2 dudv

=

∫∫

D

(PA + QB + RC

)dudv.

Uwaga. Całkę powierzchniową zorientowaną pola F = [P, Q,R] oznacza się rów-nież w postaci ∫∫

S

P dydz + Qdzdx + R dxdy.

Wyrażenie P dydz + Qdzdx + R dxdy nazywa się 2-formą. Wówczas jeśli

S = (x, y, z) ∈ R3 : x = x(u, v), y = y(u, v), z = z(u, v) dla (u, v) ∈ D ⊂ R2,

to

dydz =

∣∣∣∣y′u y′vz′u z′v

∣∣∣∣ dudv = Adudv,

dzdx =

∣∣∣∣z′u z′vx′u x′v

∣∣∣∣ dudv = B dudv,

dxdy =

∣∣∣∣x′u x′vy′u y′v

∣∣∣∣ dudv = C dudv.

Jeśli powierzchnia S jest wykresem funkcji f : D → R, tzn.

S = (x, y, z) ∈ R3 : z = f(x, y) dla (x, y) ∈ D ⊂ R2,

to

n(x, y, z) =[−f ′x(x, y),−f ′y(x, y), 1]√1 + f ′ 2x (x, y) + f ′ 2y (x, y)

.

Zatem∫∫

S

P dydz + Qdzdx + R dxdy

=

∫∫

D

(− P

(x, y, f(x, y)

)f ′x(x, y)−Q

(x, y, f(x, y)

)f ′y(x, y) + R

(x, y, f(x, y)

))dxdy.

81

Przykład 16.2 Policzmy całkę zorientowaną∫∫

S

x dydz + y dzdx + z dxdy,

gdzie S jest sferą x2 + y2 + z2 = R2 zorientowaną dodatnio. W tym celu stosujemywspółrzędne sferyczne x = R cos ϕ cos ψ, y = R sin ϕ cos ψ, z = R sin ψ, gdzie 0 ≤ϕ ≤ 2π, −π/2 ≤ ψ ≤ π/2. Wówczas

dydz =

∣∣∣∣R cos ϕ cos ψ −R sin ϕ sin ψ

0 R cos ψ

∣∣∣∣ dϕdψ = R2 cos ϕ cos2 ψ dϕdψ,

dzdx =

∣∣∣∣0 R cos ψ

−R sin ϕ cos ψ −R cos ϕ sin ψ

∣∣∣∣ dϕdψ = R2 sin ϕ cos2 ψ dϕdψ,

dxdy =

∣∣∣∣−R sin ϕ cos ψ −R cos ϕ sin ψR cos ϕ cos ψ −R sin ϕ sin ψ

∣∣∣∣ dϕdψ = R2 sin ψ cos ψ dϕdψ.

Zatem∫∫

S

x dydz + y dzdx + z dxdy

=

∫∫

(0,2π)×(−π/2,π/2)

(R cos ϕ cos ψ ·R2 cos ϕ cos2 ψ + R sin ϕ cos ψ ·R2 sin ϕ cos2 ψ

+ R sin ψ ·R2 sin ψ cos ψ)

dϕdψ

=

∫ 2π

0

∫ π/2

−π/2

R3 cos ψ dψdϕ = 4πR3.

16.3 Twierdzenie Gaussa-Ostrogradskiego

Następna twierdzenie wyraża związek pomiędzy całką powierzchniową zorientowanąa całką potrójną.

Twierdzenie 16.3 (Gaussa-Ostrogradskiego). Niech V ⊂ R3 będzie zbiorem regu-larnym, którego brzeg S = ∂V jest powierzchnią regularną zorientowaną dodatnio(zewnętrznie). Jeśli pole wektorowe F = (P, Q, R) : V → R3 jest klasy C1, to

(GO)

∫∫

S

P dydz + Qdzdx + R dxdy =

∫∫∫

V

(∂P

∂x+

∂Q

∂y+

∂R

∂z

)dxdydz.

Wniosek 16.1 Jeśli V ⊂ R3 będzie zbiorem regularnym, którego brzeg S = ∂V jestpowierzchnią regularną zorientowaną dodatnio, to jego objętość wynosi

|V | = 1

3

∫∫

S

x dydz + y dzdx + z dxdy.

82

Niech F = (P, Q,R) będzie polem wektorowym na V klasy C1. Wyrażenie

div F =∂P

∂x+

∂Q

∂y+

∂R

∂z: V → R

nazywamy dywergencją pola F. Zatem twierdzenie Gaussa-Ostrogradskiego mówi, żestrumień pola F przez powierzchnię S = ∂V jest równy całce objętościowej dywergen-cji pola F. W szczególności jeśli div F = 0 w V , to strumień pola F przez S wynosizero. Takie pole F nazywa się bezźródłowe. Wzór Gaussa-Ostrogradskiego można teżzapisać w postaci ∫∫∫

V

div F dxdydz =

∫∫

S

F n dS,

gdzie F n = Fn jest składową normalną pola F.

Przykład 16.3 Sprawdzimy wzór Gaussa-Ostrogradskiego pola F = (x2, y2, z2) ikuli V = B(R). Korzystając z rachunków przeprowadzonych w Przykładzie 16.2dostajemy dla S = ∂B(R)

∫∫

S

F n dS =

∫∫

S

x2 dydz + y2 dzdx + z2 dxdy

=

∫∫

(0,2π)×(−π/2,π/2)

((R cos ϕ cos ψ

)2R2 cos ϕ cos2 ψ +

(R sin ϕ cos ψ

)2R2 sin ϕ cos2 ψ

+(R sin ψ

)2R2 sin ψ cos ψ

)dϕdψ

= R4

∫ 2π

0

cos3 ϕdϕ

∫ π/2

−π/2

cos4 ψ dψ +

∫ 2π

0

sin3 ϕ dϕ

∫ π/2

−π/2

cos4 ψ dψ

+

∫ 2π

0

1 dϕ

∫ π/2

−π/2

sin3 ψ cos ψ dψ

= 0.

Z drugiej strony div F = 2(x + y + z) jest funkcją nieparzystą względem płaszczyznyx + y + z = 0. Zatem

∫∫∫

B(R)

2(x + y + z) dxdydz = 0. 2

Niech u : Ω → R będzie funkcją klasy C2 na obszarze Ω ⊂ R3. Załóżmy, że dlakażdego regularnego obszaru V ⊂ Ω strumień pola ∂u

∂n= gradu n =

[∂u∂x

, ∂u∂y

, ∂u∂z

] n

przez powierzchnię S = ∂V znika. Wówczas ze wzoru (GO) dostajemy

0 =

∫∫

S

∂u

∂ndS =

∫∫

S

gradu n dS =

∫∫∫

V

div gradu dxdydz.

Ponieważ powyższa równość zachodzi dla każdego regularnego obszaru V ⊂ R3, więcmusi być div gradu = 0. Lecz

div gradu = div[∂u

∂x,∂u

∂y,∂u

∂z

]=

∂2u

∂x2+

∂2u

∂y2+

∂2u

∂z2=: ∆u.

83

Czyli funkcja u spełnia równanie Laplace’a ∆u = 0. Funkcje spełniające równanie La-place’a nazywamy harmonicznymi. Odwrotnie jeśli u ∈ C2 jest funkcją harmoniczną,to

∫∫S

∂u∂n

dS = 0 dla każdej regularnej zamkniętej powierzchni S.

16.4 Twierdzenie Stokes’a

Twierdzenie Stokes’a wyraża związek pomiędzy całką zorientowaną po powierzchniS ⊂ R3 i całką krzywoliniową zorientowaną po brzegu γ = ∂S powierzchni S.

Twierdzenie 16.4 (Stokes’a.) Niech krzywa regularna γ będzie brzegiem 2-wymiaro-wego płata regularnego S ⊂ R3, przy czym γ i S są zgodnie zorientowane. Jeśli polewektorowe F = [P, Q,R] jest klasy C1 w pewnym otoczeniu płata S, to

∮

γ

P dx + Qdy + R dz

=

∫∫

S

(∂R

∂y− ∂Q

∂z

)dydz +

(∂P

∂z− ∂R

∂x

)dzdx +

(∂Q

∂x− ∂P

∂y

)dxdy.

Uwaga. Zauważmy, że jeśli S ⊂ R2, to R dz = 0 i wzór Stokes’a redukuje się dowzoru Greena

∮

γ

P dx + Qdy =

∫∫

S

(∂Q

∂x− ∂P

∂y

)dxdy.

Jeśli F = [P, Q,R] jest polem wektorowym klasy C1, to pole[∂R

∂y− ∂Q

∂z,

∂P

∂z− ∂R

∂x,

∂Q

∂x− ∂P

∂y

]= rotF

nazywa się rotacją lub wirowością pola F. Jeśli Fs jest składową pola F styczną doγ, to wzór Stokes’a można napisać w postaci

∮

γ

Fs ds =

∫∫

S

(rotF) n dS.

Przykład 16.4

Zauważmy, że jeśli pole F : Ω → R3 jest bezwirowe, tzn. rotF = 0, to całkakrzywoliniowa ∫

γ

P dx + Qdy + R dz

zależy tylko od początku i końca krzywej γ (o ile obszar Ω jest jednospójny). Zatemustalając dowolnie punkt początkowy krzywej γ całka ta definiuje funkcję U(x, y, z)końca krzywej γ. Tak zdefiniowana funkcja U nazywana jest potencjałem pola F.

Odwrotnie dla danej funkcji U ∈ C2(Ω) jej gradient gradU =(

∂U∂x

, ∂U∂y

, ∂U∂z

)wy-

znacza pole wektorowe [P, Q,R] =[

∂U∂x

, ∂U∂y

, ∂U∂z

], którego rotacja znika. Mamy więc

84

Wniosek 16.2 Aby pole wektorowe F = [P, Q,R] zdefiniowane w obszarze jednospój-nym Ω ⊂ R3 było polem potencjalnym potrzeba i wystarcza, aby rotF = 0. Wówczaspraca takiego pola wzdłuż dowolnej krzywej zamkniętej wynosi 0.

Przykład 16.5 Niech Ω = R3 \ 0. (Jest to zbiór jednospójny w R3.) Niech Fbędzie polem sił wytworzonym przez siłę grawitacji masy jednostkowej położonej wpoczątku układu współrzędnych. Wówczas

F =(−x

r3,−y

r3,−z

r3

), gdzie r =

√x2 + y2 + z2,

(|F| = 1

r2

).

Mamy∂Q

∂x=

∂

∂x

( −y

(x2 + y2 + z2)3/2

)=

3xy

(x2 + y2 + z2)5/2=

∂P

∂y,

∂R

∂y=

3yz

(x2 + y2 + z2)5/2=

∂Q

∂z,

∂P

∂z=

3xz

(x2 + y2 + z2)5/2=

∂R

∂x.

Zatem pole F jest bezwirowe. Aby znaleźć potencjał U pola F należy znaleźć funkcjęU(x, y, z) taką, że

∂U(x, y, z)

∂x=−x

r3,

∂U(x, y, z)

∂y=−y

r3,

∂U(x, y, z)

∂z=−z

r3.

Ustalmy (x, y, z) ∈ R3 \ 0, np. (x, y, z) = (0, 0, 1). Z pierwszego z tych równańdostajemy

U(x, y, z) =

∫ x

0

−ξ

(ξ2 + y2 + z2)3/2dξ+V (y, z) =

1

(x2 + y2 + z2)1/2− 1

(y2 + z2)1/2+V (y, z).

Następnie z drugiego równania mamy∂U(x, y, z)

∂y=

−y

(x2 + y2 + z2)3/2− −y

(y2 + z2)3/2+

∂V (y, z)

∂y=

−y

(x2 + y2 + z2)3/2.

Zatem∂V (y, z)

∂y=

−y

(y2 + z2)3/2.

Stąd

V (y, z) =

∫ y

0

−η

(η2 + z2)3/2dη + W (z) =

1

(y2 + z2)1/2− 1

(z2)1/2+ W (z).

Teraz korzystając z trzeciego równania dostajemy∂U(x, y, z)

∂z=

−z

(x2 + y2 + z2)3/2− −z

(y2 + z2)3/2+

−z

(y2 + z2)3/2− −z

(z2)3/2+

∂W (z)∂z

=−z

(x2 + y2 + z2)3/2.

Zatem∂W (z)

∂z=

−z

(z2)3/2.

Stąd

V (z) =

∫ z

1

−ζ

(ζ2)3/2dζ =

1

(z2)1/2− 1.

Ostatecznie U(x, y, z) = (x2 + y2 + z2)−1/2 − 1. 2

85

analiza matematyczna ii

Documents