analiza matematyczna ii
TRANSCRIPT
Uniwersytet Jana Kochanowskiego w KielcachWydział Matematyczno-Przyrodniczy
Instytut Matematyki
Dr hab. prof. UJK Grzegorz Łysik
Analiza Matematyczna IISkrypt wykładów
Kielce, 2012.
1
1 Funkcje wielu zmiennych
1.1 Przestrzeń Rn i jej podzbiory
1. Niech n będzie liczbą naturalną. Przestrzeń Rn jest iloczynem kartezjańskim negzemplarzy prostej rzeczywistej R tzn. Rn = R× · · · × R. Punkt x należący do Rn
posiada n współrzędnych, czyli x = (x1, . . . , xn). Punkty przestrzeni Rn nazywamyteż wektorami. Przestrzeń Rn jest przestrzenią liniową z naturalnymi działaniamidodawania wektorów i mnożenia przez liczbę rzeczywistą
x + y = (x1 + y1, . . . , xn + yn) dla x, y ∈ Rn;
λx = (λx1, . . . , λxn) dla λ ∈ R, x ∈ Rn.
W przestrzeni Rn wprowadza się normę euklidesową l2 wektora x ∈ Rn wzorem
‖x‖ = ‖x‖2 =√
x21 + · · ·+ x2
n.
Norma euklidesowa spełnia następujące warunki
• 1. ‖x‖ = 0 wtedy i tylko wtedy, gdy x = 0;
• 2. ‖λx‖ = |λ|‖x‖;• 3. ‖x + y‖ ≤ ‖x‖+ ‖y‖.Wykażemy, że norma euklidesowa spełnia warunek 3. W tym celu należy wykazać,
że dla dowolnych xi, yi ∈ R, i = 1, . . . , n zachodzi nierówność√√√√
n∑i=1
(xi + yi)2 ≤√√√√
n∑i=1
x2i +
√√√√n∑
i=1
y2i . (1)
Ponieważ wyrażenia podpierwiastkowe są nieujemne nierówność powyższa jest rów-noważna z nierównością
n∑i=1
(xi + yi)2 ≤
(√√√√n∑
i=1
x2i +
√√√√n∑
i=1
y2i
)2
=n∑
i=1
x2i +2
√√√√n∑
i=1
x2i ·
√√√√n∑
i=1
y2i +
n∑i=1
y2i . (2)
Korzystając z tożsamości∑n
i=1(xi+yi)2 =
∑ni=1 x2
i +2∑n
i=1 x2i y
2i +
∑ni=1 y2
i , wystarczyzatem wykazać nierówność Cauchy’ego
n∑i=1
xiyi ≤√√√√
n∑i=1
x2i ·
√√√√n∑
i=1
y2i . (3)
W tym celu zdefiniujmy funkcję zmiennej rzeczywistej t
f(t) =n∑
i=1
(xit + yi)2 =
( n∑i=1
x2i
)t2 + 2
( n∑i=1
xiyi
)t +
n∑i=1
y2i . (4)
2
Ponieważ funkcja f jest nieujemną funkcją kwadratową jej wyróżnik musi być niedo-datni, czyli ( n∑
i=1
xiyi
)2
−( n∑
i=1
x2i
) ·( n∑
i=1
y2i
)≤ 0. (5)
Stąd wynika nierówność (3).W przestrzeni Rn wprowadzamy metrykę euklidesową wzorem
ρ(x, y) = ‖x− y‖2 =
√√√√n∑
i=1
(xi − yi)2 dla x, y ∈ Rn
Metryka ρ jest nieujemną funkcją na iloczynie kartezjańskim Rn × Rn spełniającąwarunki
• 1. ρ(x, y) = 0 wtedy i tylko wtedy, gdy x = y;
• 2. ρ(x, y) = ρ(y, x);
• 3. ρ(x, z) ≤ ρ(x, y) + ρ(y, z).
Ostatni warunek jest nazywany nierównością trójkąta. Wynika on z warunku 3.normy.
Użyteczne jest także wprowadzenie normy l1 i normy l∞ wektora x ∈ Rn,
‖x‖1 = |x1|+ · · ·+ |xn|,‖x‖∞ = max|x1|, . . . , |xn|.
Pomiędzy normami ‖x‖1, ‖x‖2 i ‖x‖∞ zachodzą nierówności
‖x‖∞ ≤ ‖x‖2 ≤ ‖x‖1;
‖x‖1 ≤√
n‖x‖2 ≤ n‖x‖∞.
3
Def. Otwartą kulą euklidesową o środku x ∈ Rn i promieniu r > 0 nazywamyzbiór
B(x, r) = x ∈ Rn : ρ(x, x) < r.Def. Prostopadłościanem lub kostką nazywamy zbiór
P (a, b) = x ∈ Rn : ai < xi < bi, i = 1, ..., n, gdzie a < b.
Def. Sympleksem nazywamy zbiór
S(r) = x ∈ Rn : x1 > 0, ..., xn > 0, x1 + · · ·+ xn < r, gdzie r > 0.
Def. Zbiór Ω ⊂ Rn nazywamy otwartym jeśli dla dowolnego x ∈ Ω istnieje r > 0takie, że B(x, r) ⊂ Ω.
Zbiór F ⊂ Rn nazywamy domkniętym jeśli Rn \ F jest zbiorem otwartym.Domknięciem zbioru Ω ⊂ Rn nazywamy zbiór Ω = x ∈ Rn : dla dowolnego ε > 0
istnieje y ∈ Ω taki, że ρ(x, y) < ε.Domknięcie Ω zbioru Ω jest zbiorem domkniętym.Wnętrzem zbioru Ω ⊂ Rn nazywamy zbiór intΩ = x ∈ Ω : istnieje r > 0 takie,
że B(x, r) ⊂ Ω.Brzegiem zbioru Ω ⊂ Rn nazywamy zbiór ∂Ω = Ω \ intΩ.Zbiór Ω ⊂ Rn nazywamy spójnym, jeśli dowolne dwa jego punkty można połączyć
krzywą zawartą w Ω.Zbiór otwarty i spójny nazywany obszarem.Mówimy, że zbiór Ω jest ograniczony jeśli jest on zawarty w pewnej kuli.
1.2 Granica i ciągłość funkcji
Definicja 1.1 Niech f : Ω ⊂ Rn → R oraz x ∈ Ω \ Ω. Mówimy, że granica funkcjif przy x → x jest równa liczbie g jeśli dla każdego ε > 0 istnieje δ > 0 taka, że jeśli‖x− x‖ ≤ δ, x ∈ Ω, to |f(x)− g| < ε. Piszemy wówczas
limx→x
f(x) = g.
W przypadku funkcji wielu zmiennych definiuje się pojęcie granic iterowanych.Pojęcie to wprowadzimy dla funkcji dwóch zmiennych.
Definicja 1.2 Niech (x, y) ∈ R2 oraz f będzie zdefiniowana w zbiorze Ω = (x, y) ∈R2 : |x − x| < d1, |y − y| < d2 \ (x, y) dla pewnych d1, d2 > 0 Załóżmy, że dlakażdego y ∈ R takiego, że 0 < |y − y| < d2 istnieje granica
limx→x
f(x, y) = g(y)
oraz, że istnieje granicalimy→y
g(y) = g.
4
Wówczas mówimy, że istnieje granica iterowana
limy→y
limx→x
f(x, y) = g.
Analogicznie definiujemylimx→x
limy→y
f(x, y).
Okazuje się, że granice iterowane nie muszą być sobie równe nawet w przypadku,gdy obie istnieją.
Przykład 1.1 Niech
f(x, y) =|y|
|x|+ |y| dla (x, y) 6= (0, 0).
Wówczaslimy→0
limx→0
f(x, y) = 1 6= 0 = limx→0
limy→0
f(x, y).
Twierdzenie 1.1 Niech (x, y) ∈ R2, Ω = (x, y) ∈ R2 : |x − x| < d1, |y − y| <d2 \ (x, y) dla pewnych d1, d2 > 0 oraz f : Ω → R. Załóżmy, że istnieje granica
lim(x,y)→(x,y)
f(x, y) = g.
Jeśli dla każdego ustalonego x takiego, że 0 < |x− x| < d1 istnieje granica
limy→y
f(x, y) = g(x)
oraz dla każdego ustalonego y takiego, że 0 < |y − y| < d2 istnieje granica
limx→x
f(x, y) = h(y),
to istnieją granice iterowane i są równe g.
Definicja 1.3 Niech f : Ω ⊂ Rn → R, x ∈ Ω. Mówimy, że f jest ciągła w x jeśligranica funkcji f|Ω\x w punkcie x jest równa f (x).
Twierdzenie 1.2 Jeśli funkcje f i g są ciągłe w punkcie x ∈ Ω, to również funkcjef ± g, f · g oraz f/g są ciągłe w x i ile g(x) 6= 0.
Twierdzenie 1.3 Jeśli f jest ciągła w x oraz f (x) > 0, to istnieje δ > 0, taka, żef(x) > 0 dla ‖x− x‖ < δ.
Twierdzenie 1.4 (Weierstrassa.) Jeśli funkcja f jest ciągła na zbiorze zwartym K ⊂Rn, to f jest ograniczona na K i osiąga swoje kresy.
Definicja 1.4 Mówimy, że funkcja f jest jednostajnie ciągła na zbiorze D jeśli dlakażdego ε > 0 istnieje δ > 0 taka, że dla dowolnych x, y ∈ D zachodzi implikacja:jeśli ‖x− y‖ < δ, to |f(x)− f(y)| < ε.
5
Twierdzenie 1.5 Jeśli f jest ciągła na zbiorze zwartym K, to jest jednostajnie ciągłana K.
Definicja 1.5 Niech funkcje ϕ1(t1, ..., tk), ..., ϕn(t1, ..., tk) będa zdefiniowane na zbio-rze U ⊂ Rk. Niech Ω = x ∈ Rn : istnieje t = (t1, ..., tk) ∈ U takie, że xi = ϕi(t) dlai = 1, ..., n oraz niech f : Ω → R będzie funkcją na Ω. Wówczas definiujemy funkcjęu = f ϕ : U → R będącą złożeniem funkcji f i ϕ = (ϕ1, ..., ϕn) wzorem
u(t) = f(ϕ1(t), ..., ϕn(t)
).
Twierdzenie 1.6 Jeśli funkcje xi = ϕi(t), i = 1, ..., n, są ciągłe w punkcie t oraz fjest ciągła w punkcie x = ϕ(t), to f ϕ jest ciągła w t.
Definicja 1.6 Niech f : Ω ⊂ Rn → Rk. Mówimy, że f spełnia warunek Lipschitzaw punkcie x ∈ Ω ze stałą Lipschitza L < ∞ jeśli istnieje δ > 0 taka, że dla x ∈B(x, δ) ∩ Ω zachodzi
‖f(x)− f (x)‖ ≤ L‖x− x‖.
Twierdzenie 1.7 Jeśli f spełnia warunek Lipschitza w punkcie x ∈ Ω, to f jestciągła w x. Ponadto, jeśli stała Lipschitza L nie zależy od x ∈ U ⊂ Ω, to f jestjednostajnie ciągła w U .
Definicja 1.7 Niech f : Ω ⊂ Rn → Rk oraz α ∈ (0, 1]. Mówimy, że f jest hölderow-sko ciągła w punkcie x ∈ Ω z wykładnikiem α jeśli istnieją L < ∞, δ > 0 takie, żedla x ∈ B(x, δ) ∩ Ω zachodzi
‖f(x)− f (x)‖ ≤ L‖x− x‖α.
Twierdzenie 1.8 Jeśli f jest hölderowsko ciągła w punkcie x ∈ Ω, to f jest ciągław x.
Definicja 1.8 Odwzorowanie T : Rn → Rk nazywamy liniowym jeśli dla dowolnychx, y ∈ Rn oraz α, β ∈ R zachodzi
T (αx + βy) = αT (x) + βT (y).
Twierdzenie 1.9 Odwzorowanie liniowe T : Rn → Rk jest jednostajnie ciągłe naRn.
6
2 Rachunek różniczkowy rzędu pierwszego
2.1 Pochodne kierunkowe funkcji wielu zmiennych
Przypomnijmy definicję pochodnej funkcji jednej zmiennej.
Definicja 2.1 Niech f bedzie funkcją określoną na przedziale otwartym I = (a, b) ⊂R o wartościach rzeczywistych. Mówimy, że f ma pochodną w punkcie x ∈ I jeśliistnieje granica ilorazu róznicowego
limh→0
f (x + h)− f (x)
h= f ′(x), (6)
Funkcję f : I → R nazywamy różniczkowalną w I jeśli f ma pochodną w każdympunkcie x ∈ I.
W przypadku funkcji wielu zmiennych wyrażenie (6) nie ma sensu. Istotnie abyf (x + h) miało sens h powinno być wektorem, lecz nie jest zdefiniowana operacjadzielenia przez wektor. Można jednak zdefiniować pochodną funkcji w kierunku usta-lonego wektora.
Definicja 2.2 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω orazv ∈ Rn \ 0. Pochodną kierunkową funkcji f w kierunku wektora v w punkcie xnazywamy granicę
limt→0
f (x + tv)− f (x)
t=: Lvf (x)
o ile ta granica istnieje i jest skończona.
Zauważmy, że Lvf (x) jest faktycznie pochodną funkcji jednej zmiennej g(t) =f (x + tv) w zerze.
Pochodną kierunkową w kierunku wersora ei, i = 1, . . . , n, nazywamy pochodnącząstkową w kierunku ei i oznaczamy
Leif (x) =
∂f
∂xi
(x) = f ′xi(x) = lim
t→0
f (x + tei)− f (x)
t.
Dla pochodnych cząstkowych stosuje się zwykłe reguły różniczkowania. Jednakw przypadku funkcji wielu zmiennych z istnienia pochodnych kierunkowych nawetw całym zbiorze określoności funkcji i w każdym kierunku nie można wnioskować ociągłości funkcji.
Przykład 2.1 Niech
f(x, y) =
x2yx4 + y2 dla (x, y) 6= (0, 0),
0 dla (x, y) = (0, 0).
Wówczas f posiada pochodne kierunkowe w kierunku dowolnego wektora lecz jest nie-ciągła w zerze.
7
Przykład 2.2 Niech
f(x, y) =
xyx2 + y2 dla (x, y) 6= (0, 0),
0 dla (x, y) = (0, 0).
Wówczas f ′x(0, 0) = f ′y(0, 0) = 0, lecz nie istnieją pochodne Lvf(0, 0) dla v ∈ (R \0)2.
Przykład 2.3 Niechf(x, y) =
√|xy|
Wówczas f jest ciągła i ma pochodne kierunkowe w dowolnym punkcie w kierunkudowolnego wektora. Jeśli v = (cos ϕ, sin ϕ), to
Lvf(0, 0) = limt→0
√t2| cos ϕ sin ϕ| − 0
t= ±
√| cos ϕ sin ϕ|.
Zatem Lvf nie jest na ogół równa v1∂f∂x
+ v2∂f∂y.
Twierdzenie 2.1 Niech v, w ∈ Rn \ 0, f : Ω → R oraz x ∈ Ω. Załóżmy, żepochodna kierunkowa Lvf istnieje w pewnym otoczeniu punktu x i jest ciągła w x.Wówczas jeśli istnieje pochodna kierunkowa Lwf (x), to istnieje pochodna Lv+wf (x)oraz
Lv+wf (x) = Lvf (x) + Lwf (x).
Twierdzenie 2.2 Niech f : Ω → R oraz x ∈ Ω. Jeśli istnieją pochodne cząstkowe∂f∂xi
dla i = 1, . . . , n w pewnym otoczeniu punktu x oraz są ciągłe w x, to dla h ∈ Rn
takiego, że x + h ∈ Ω zachodzi
f (x + h)− f (x) =n∑
i=1
∂f
∂xi
(x) · hi +n∑
i=1
αi(h) · hi
przy czym limh→0 αi(h) = 0 dla i = 1, . . . , n.
Wniosek 2.1 Niech f : Ω → R oraz x ∈ Ω. Jeśli istnieją pochodne cząstkowe ∂f∂xi
dla i = 1, . . . , n w pewnym otoczeniu punktu x oraz są ciągłe w x, to f jest ciągła wx.
Definicja 2.3 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω. Jeśliistnieją pochodne cząstkowe ∂f
∂xi(x) dla i = 1, . . . , n, to wektor
[ ∂f
∂x1
(x), . . . ,∂f
∂xn
(x)]
nazywamy gradientem funkcji f w punkcie x i oznaczamy gradf (x) lub ∇f (x).
Tezę Twierdzenia 2.2 można sformułować następująco.
8
Wniosek 2.2 Jeśli istnieją pochodne cząstkowe ∂f∂xi
dla i = 1, . . . , n w pewnym oto-czeniu punktu x oraz są ciągłe w x, to dla h ∈ Rn takiego, że x + h ∈ Ω zachodzi
f (x + h)− f (x) = gradf (x) h + α(h) h,
gdzie oznacza iloczyn skalarny, α(h) =(α1(h), . . . , αn(h)
)przy czym limh→0 αi(h) =
0 dla i = 1, . . . , n.
Wniosek 2.3 Niech f : Ω → Rk, x ∈ Ω, Ω jest obszarem w Rn. Jeśli istniejąpochodne cząstkowe ∂fj
∂xidla i = 1, . . . , n, j = 1, . . . , k w pewnym otoczeniu punktu x
oraz są ciągłe w x, to dla h ∈ Rn takiego, że x + h ∈ Ω zachodzi
f (x + h)− f (x) =
gradf1(x)· · ·
gradfk (x)
h + α(h)h,
gdzie α(h) =(α1(h), . . . , αk(h)
)tr przy czym limh→0 αi(h) = 0 dla i = 1, . . . , k.
2.2 Różniczka odwzorowania
Definicja 2.4 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → Rk, x ∈ Ω. Mó-wimy, że f jest odwzorowaniem różniczkowalnym w punkcie x jeśli istnieje operatorliniowy
L : Rn → Rk
zwany różniczką funkcji f w punkcie x i oznaczany Df (x) (lub df (x) jeśli k = 1) taki,że dla h ∈ Rn spełniającego x + h ∈ Ω zachodzi
f (x + h) = f (x) + L(h) + α(h)h przy czym limh→0
α(h) = 0. (7)
Uwaga. Warunek (7) jest równoważny warunkowi
limh→0
f (x + h)− f (x)− L(h)
‖h‖ = 0. (8)
Twierdzenie 2.3 Niech f : Ω → R. Jeśli f jest różniczkowalna w x, to dla każdegowektora v 6= 0 istnieje pochodna kierunkowa Lvf (x) oraz
Lvf (x) = df (x)(v).
W szczególności istnieją pochodne cząstkowe ∂f∂xi
(x) = df (x)(ei), i = 1, . . . , n oraz
df (x)(h) =n∑
i=1
∂f
∂xi
(x)hi = gradf (x) h dla h ∈ Rn.
W przypadku odwzorowania różniczkowalnego o wartościach w Rk
Df (x)(h) =
gradf1(x)· · ·
gradfk (x)
h dla h ∈ Rn.
9
Twierdzenie 2.4 Niech f : Ω → R. Jeśli f jest różniczkowalna w x, to f jest ciągław x.
Uwaga. Niech f : Ω ⊂ R2 → R oraz v ∈ S1. Wówczas wektor v ma współrzędnev = (cos α, sin α) = (cos α, cos β), gdzie α (odpowiednio β) jest kątem pomiędzy v aosią OX (odpowiednio OY ). Wówczas
Lvf (x) =∂f
∂x(x) cos α +
∂f
∂y(x) cos β.
Analogicznie jeśli f : Ω ⊂ Rn → R oraz v ∈ Sn−1, to
Lvf (x) =n∑
i=1
∂f
∂xi
(x) cos αi,
gdzie αi jest kątem pomiędzy v a osią OXi, i = 1, . . . , n.
Przykład 2.4 Niech F = (f1, f2) : R2 → R2 będzie dane wzorem F (x, y) = (x cos y, x sin y)Wówczas
∂f1
∂x= cos y,
∂f1
∂y= −x sin y,
∂f1
∂x= sin y,
∂f2
∂x= x cos y.
Zatem dla (h1, h2) ∈ R2 mamy
DF (x, y)
[h1
h2
]=
[cos y − x sin ysin y x cos y
] [h1
h2
]=
[cos y · h1 − x sin y · h2
sin y · h1 + x cos y · h2
].
2.3 Reguły różniczkowania.
I Liniowość.Różniczkowanie jest operacją liniową, tzn. Jeśli F,G : Ω ⊂ Rn → Rk są różnicz-
kowalne w x oraz α, β ∈ R, to αF + βG jest różniczkowalne w x oraz
D(αF + βG)(x) = αDF (x) + βDG(x).
II Różniczka iloczynu.Jeśli ϕ : Ω ⊂ Rn → R oraz F : Ω → Rk są różniczkowalne w x, to ϕ · F : Ω → Rk
jest różniczkowalne w x oraz
D(ϕ · F )(x) = F (x) · dϕ(x) + ϕ(x) ·Df (x)
=
f1(x)· · ·
fk (x)
· gradϕ(x) + ϕ(x)
gradf1(x)· · ·
gradfk (x)
.
10
III Różniczka złożenia odwzorowań.Niech G : U ⊂ Rn → Rm oraz F : V ⊂ Rm → Rk. Załóżmy, że ImG = y ∈
Rm : istnieje x ∈ U : y = G(x) ⊂ V . Wówczas możemy zdefiniować złożenieodwzorowań F i G wzorem
F G(x) = F(G(x)
)dla x ∈ U.
Twierdzenie 2.5 Przy powyższych oznaczeniach jeśli G jest różniczkowalne w punk-cie x = (x1, . . . , xn) ∈ U oraz F jest różniczkowalne w punkcie y = (y1, . . . , ym) = g(x)(tzn. yi = gi(x) dla i = 1, . . . , m), to złożenie F G jest różniczkowalne w x oraz
D(F G)(x) = DF(G(x)
) DG(x).
Zatem
∂(F G)j
∂xi
(x) =m∑
l=1
∂Fj
∂li
(Gj (x)
) · ∂Gl
∂xi
(x), i = 1, . . . , n, j = 1, . . . , k.
Wniosek 2.4 Niezmienniczość pierwszej różniczki. Jeśli G : U ⊂ Rn → Rn jestróżniczkowalne w x ∈ U oraz f : V ⊂ Rn → R jest różniczkowalna w y = G(x) ∈ Rn,to
d(f G)(x) =n∑
i=1
f ′yi
(Gi(x)
) · dGi(x).
Wniosek 2.5 Różniczkowanie funkcji skalarnych złożonych. Niech G = (g1, . . . , gn) :(a, b) ⊂ R → Rn będzie różniczkowalne w t ∈ (a, b) oraz f : V ⊂ Rn → R będzieróżniczkowalna w x = G(t) ∈ Rn. Wówczas f G : (a, b) → R jest różniczkowalna wt oraz
(f G)′(t) =n∑
i=1
f ′xi
(G(t)
) · g′i(t).
Definicja 2.5 Niech Ω = Rn \ 0 oraz λ ∈ R. Funkcję f : Ω → R nazywamy(dodatnio) jednorodną stopnia λ jeśli dla każdych t ∈ R+ i x ∈ Ω zachodzi
f(tx1, . . . , txn) = tλf(x1, . . . , xn).
Twierdzenie 2.6 Jeśli f jest funkcją jednorodną stopnia λ i różniczkowalną w Rn \0, to
x gradf(x) = λf(x) dla x ∈ Rn \ 0.
Uwaga. Zachodzi też twierdzenie odwrotne, tzn. jeśli funkcja różniczkowalna f :Rn \ 0 → R spełnia x gradf(x) = λf(x) dla x ∈ Rn \ 0, to f jest jednorodnastopnia λ.
11
2.4 Twierdzenie Lagrange’a o wartości średniej
Niech f : Ω ⊂ Rn → R będzie funkcja różniczkowalna w punkcie x ∈ Ω oraz v ∈Rn \ 0. Wówczas
Lvf (x) = df (x) · v = gradf (x) v.
Jeśli ograniczymy się do wektorów ze sfery jednostkowej v ∈ Sn−1, to można zapytaćdla jakiego v, Lvf (x) przyjmuje największą wartość. Oczywiście jeśli gradf (x) = 0,to Lvf (x) = 0 dla dowolnego v. Zatem możemy założyć, że gradf (x) 6= 0. Wówczasna mocy nierówności Schwarza mamy
|Lvf (x)| = |gradf (x) v| ≤ ‖gradf (x)‖ · ‖v‖ ≤ ‖gradf (x)‖.
Ponadto, jeśli
v =gradf (x)
‖gradf (x)‖ ,
toLvf (x) = gradf (x) gradf (x)
‖gradf (x)‖ =‖gradf (x)‖2
‖gradf (x)‖ = ‖gradf (x)‖.
Zatem Lvf (x) przyjmuje największą wartość dla v = gradf (x). Innymi słowamifunkcja f najszybciej wzrasta w kierunku gradientu.
Twierdzenie 2.7 Lagrange’a o wartości średniej. Niech f : Ω ⊂ Rn → R. Jeśli fjest różniczkowalna w każdym punkcie odcinka [a, b] ⊂ Ω, to istnieje punkt c ∈ [a, b]taki, że
f(b) = f(a) + df(c) · (b− a).
Wniosek 2.6 Jeśli f : Ω → R jest różniczkowalna w obszarze Ω ⊂ Rn oraz df(x) = 0dla x ∈ Ω, to f jest stała.
Uwaga. Twierdzenie Lagrange’a nie przenosi się dosłownie na funkcje o warto-ściach wektorowych. W tym przypadku mamy słabsze sformułowanie.
Twierdzenie 2.8 Lagrange’a o wartości średniej, wersja wektorowa. Niech F : Ω ⊂Rn → Rk. Jeśli F jest różniczkowalne w każdym punkcie odcinka [a, b] ⊂ Ω, oraz‖DF (x)‖L(Rn,Rk) ≤ M dla x ∈ [a, b] to
‖F (b)− F (a)‖Rk ≤ M‖b− a‖Rn .
Definicja 2.6 Odwzorowanie F : Ω ⊂ Rn → Rk nazywamy odwzorowaniem (funkcjąjeśli k = 1) klasy C1(Ω) jeśli jego pochodne cząstkowe rzędu pierwszego ∂fj
∂xi, i =
1, . . . , n, j = 1, . . . , k są funkcjami ciągłymi w Ω.
Wniosek 2.7 Jeśli Ω jest obszarem w Rn oraz F : Ω → Rk jest klasy C1(Ω), to Fspełnia warunek Lipschitza na każdym zwartym wypukłym podzbiorze K ⊂ Ω.
12
2.5 Przestrzeń styczna do wykresu funkcji
Definicja 2.7 Niech f : Ω ⊂ Rn → R. Wykresem funkcji f nazywamy zbiór
Gr(f) = (x, y) ∈ Ω× R : x ∈ Ω, y = f(x).
Niech f : Ω ⊂ Rn → R będzie różniczkowalna w punkcie x ∈ Ω. Wówczasrównanie
y = f (x) + df (x) · (x− x)
wyznacza przestrzeń (prostą gdy n = 1, płaszczyznę gdy n = 2) do wykresu Gr(f)funkcji f w punkcie x.
Umiejętność wyznaczenia przestrzeni stycznej do wykresu jest przydatna do ob-liczania przybliżonej wartości funkcji. Istotnie jeśli f : Ω ⊂ Rn → R jest różniczko-walna w x, to dla małych przyrostów argumentu ∆x zachodzi
f (x + ∆x) = f (x) + df (x) ·∆x + ε(∆x)
przy czymε(∆x)
‖∆x‖ → 0 przy ∆x → 0.
Zatem ε(∆x) jest małe w stosunku do ∆x i można przyjąć, że
f (x + ∆x) ≈ f (x) + df (x) ·∆x.
Przykład. Zbiornik ma kształt walca o wysokości h0 = 2 m i średnicy d0 = 4 m,przy czym pomiary wykonano z dokładnością 1%. W jakich granicach może byćrzeczywista objętość zbiornika i ile wynosi błąd względny.
Objętość walca wyraża się wzorem V (h, d) = π4hd2. W naszym przypadku
|h− h0| ≤ 0, 2 =: ∆h, |d− d0| ≤ 0, 4 =: ∆d, V (h0, d0) = 8π m3. Zatem
V (h0+∆h, d0+∆d)−V (h0, d0) = π4(d2
0∆h+2h0d0∆d) = π4(42·0, 2+2·2·4·0, 4) = 0, 24π.
Błąd względny wynosi
V (h0 + ∆h, d0 + ∆d)− V (h0, d0)
V (h0, d0)= 0, 03 = 3%.
13
3 Rachunek różniczkowy drugiego rzędu
3.1 Pochodne kierunkowe drugiego rzędu
Definicja 3.1 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω orazv, w ∈ Rn \0. Załóżmy, że pochodna kierunkowa Lvf funkcji f w kierunku wektorav istnieje w otoczeniu U punktu x. Wówczas odwzorowanie
U 3 x 7→ Lvf(x)
jest funkcją zdefiniowaną w otoczeniu U punktu x o wartościach w R. Jeśli istniejepochodna kierunkowa tej funkcji w kierunku wektora w w punkcie x, to nazywamyją pochodną kierunkową drugiego rzędu i oznaczamy
L2wvf (x) = Lw
(Lvf
)(x).
Jeśli v = ei, w = ej, i, j ∈ 1, . . . , n, są wersorami i-tej i j-tej osi współrzędnych, todrugą pochodną kierunkową L2
ejeif (x) nazywamy drugą pochodną cząstkową i ozna-
czamy
L2ejei
f (x) =∂2f
∂xj∂xi
(x) = f ′′xjxi(x).
Jeśli i = j, to stosujemy też oznaczenie
L2eiei
f (x) =∂2f
∂x2i
(x) = f ′′xixi(x).
Jeśli i 6= j, to ∂2f∂xj∂xi
nazywamy też drugą pochodną cząstkową mieszaną.
Przykład 3.1 Niech f(x, y) = xayb dla x > 0, y > 0, gdzie a, b ∈ R. Wówczas
∂f
∂x(x, y) = axa−1yb,
∂f
∂y(x, y) = bxayb−1;
∂2f
∂x2(x, y) =
∂
∂x
(axa−1yb
)= a(a− 1)xa−2yb,
∂2f
∂y∂x(x, y) =
∂
∂y
(axa−1yb
)= abxa−1yb−1,
∂2f
∂x∂y(x, y) =
∂
∂x
(bxayb−1
)= abxa−1yb−1,
∂2f
∂y2(x, y) =
∂
∂y
(bxayb−1
)= b(b− 1)xayb−2.
Zauważmy, że ∂2f∂y∂x
= ∂2f∂x∂y
. Zatem jest uzasadnione przypuszczenie że tak jestw ogólnym przypadku. Niestety przypuszczenie to nie jest prawdziwe jak pokazujeprzykład.
14
Przykład 3.2 Niech
f(x, y) =
xy(x2−y2)
x2+y2 dla (x, y) 6= (0, 0),
0 dla (x, y) 6= (0, 0).
Wówczas∂2f
∂x∂y(0, 0) = 1 6= −1 =
∂2f
∂y∂x(0, 0).
3.2 Druga różniczka
Definicja 3.2 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω. Mó-wimy, że f jest dwukrotnie różniczkowalna w punkcie x jeśli zachodzą warunki1. f jest różniczkowalna w pewnym otoczeniu U punktu x;2. Przy każdym ustalonym h ∈ Rn odwzorowanie
U 3 x 7→ wh(x) =: df(x) · h ∈ R
jest różniczkowalne w x.Wówczas różniczkę odwzorowania wh nazywamy drugą różniczką f . Zatem dla h, k ∈Rn mamy określone odwzorowanie
(k, h) 7→ dwh(x) · k =: d2f (x)(k, h)
Jest jasne, że powyższe odwzorowanie jest liniowe względem h oraz względem k.Zatem druga różniczka jest odwzorowaniem 2-liniowym na Rn × Rn.
Jeśli f jest dwukrotnie różniczkowalna w każdym punkcie obszaru Ω ⊂ Rn, to d2fjest odwzorowaniem z Ω w przestrzeń odwzorowań dwuliniowych na Rn × Rn, tzn
d2f : Ω → L2(Rn × Rn).
Jeśli f : (a, b) ⊂ R→ R jest dwukrotnie różniczkowalna w x, to
d2f (x)(k, h) = f ′′(x) · k · h.
Przykład 3.3 Niech A : Rn → R będzie funkcją liniową, tzn. A(x) = A · x dlax ∈ Rn i pewnej macierzy A ∈ M(n × 1). Wówczas dA(x) = A. Zatem dla h ∈ Rn
odwzorowanieRn 3 x 7→ wh(x) = dA(x) · h = A · h
nie zależy od x. Stąd d2A = dwh = 0. Analogicznie jest w przypadku odwzorowanialiniowego A : Rn → Rk.
Przykład 3.4 Niech A ∈ M(n× n) oraz
f(x) = xtrAx =n∑
i,j=1
aijxixj.
15
Wówczasdf(x)(h) = htrAx + xtrAh dla x ∈ Rn, h ∈ Rn.
Zatem przy ustalonym h ∈ Rn odwzorowanie
Rn 3 x 7→ wh(x) = htrAx + xtrAh
jest liniowe i jego różniczką jest
dwh(x)(k) = htrAk + ktrAh.
Czylid2f(x)(k, h) = htrAk + ktrAh dla k ∈ Rn, h ∈ Rn.
W przypadku gdy macierz A jest symetryczna dostajemy
d2f(x)(k, h) = 2htrAk dla k ∈ Rn, h ∈ Rn.
Twierdzenie 3.1 Niech f : Ω ⊂ Rn → R, x ∈ Ω. Wówczas f jest dwukrotnieróżniczkowalna w x wtedy i tylko wtedy, gdy1 f jest różniczkowalna w pewnym otoczeniu U punktu x;2 Pochodne cząstkowe ∂f
∂xi, i = 1, . . . , n są różniczkowalne w x.
Twierdzenie 3.2 Niech f : Ω ⊂ Rn → R, x ∈ Ω.Jeśli f jest dwukrotnie różniczkowalna w x, toa) dla dowolnych h, k ∈ Rn istnieje
L2khf (x) = d2f (x)(k, h);
b) Istnieją drugie pochodne cząstkowe ∂2f∂xi∂xj
, i, j = 1, . . . , n oraz dla h, k ∈ Rn,
d2f (x)(k, h) =n∑
i,j=1
∂2f
∂xi∂xj
(x)hikj.
Z twierdzenia 3.1 wynika
Wniosek 3.1 Jeśli f posiada w pewnym otoczeniu punktu x ciągłe pochodne cząst-kowe pierwszego rzędu oraz pochodne cząstkowe drugiego rzędu ciągłe w x, to f jestdwukrotnie różniczkowalna w x.
3.3 Symetria drugiej różniczki
Definicja 3.3 Odwzorowanie dwuliniowe A : Rn × Rn → R nazywamy symetrycz-nym, jeśli
A(x, y) = A(y, x) dla x, y ∈ Rn.
Twierdzenie 3.3 Schwarza o symetrii drugiej różniczki.Niech f : Ω ⊂ Rn → R, x ∈ Ω. Jeśli f jest dwukrotnie różniczkowalna w x, to drugaróżniczka d2f (x) jest odwzorowaniem dwuliniowym symetrycznym, tzn.
L2khf (x) = L2
hkf (x).
W szczególności∂2f
∂xi∂xj
(x) =∂2f
∂xj∂xi
(x) dla i, j = 1, . . . , n.
16
3.4 Macierz Hessego
Niech f będzie dwukrotnie różniczkowalna w x ∈ Ω. Połóżmy
aij =∂2f
∂xj∂xi
(x) dla i, j = 1, . . . , n,
A =(aij
)n
i,j=1.
Wówczas macierz A jest symetryczna oraz na mocy wzoru z Twierdzenia 3.2
d2f (x)(k, h) =n∑
i,j=1
∂2f
∂xi∂xj
(x)hikj = ktrAh = htrAk.
Definicja 3.4 Formę kwadratową
Rn 3 h 7→ htrAh = d2f (x)(h, h) ∈ R
nazywamy formą kwadratową Hessego, a odpowiadającą jej macierz A macierzą Hes-sego lub hesjanem funkcji f w punkcie x.Ślad hesjanu nazywamy operatorem Laplace’a
TrA =n∑
i=1
∂2f
∂x2i
(x) = ∆f(x).
3.5 Wzór Taylora drugiego rzędu.
Twierdzenie 3.4 Niech f : Ω → R będzie dwukrotnie różniczkowalna w x ∈ Ω.Wówczas dla h ∈ Rn takiego, że x + h ∈ Ω zachodzi
f (x + h) = f (x) + df (x)h + 12d2f (x)(h, h) + ‖h‖2ψ(h),
gdzie ψ jest ciągła w zerze oraz ψ(0) = 0.
Definicja 3.5 Niech f : Ω → R. Mówimy, że funkcja f jest klasy C2(Ω) jeśli dladowolnych ustalonych h, k ∈ Rn odwzorowanie
Ω 3 x 7→ d2f(x)(k, h) ∈ R
jest ciągłe lub równoważnie, gdy wszystkie pochodne cząstkowe drugiego rzędu ∂2f∂xj∂xi
(x),i, j = 1, . . . , n, są ciągłe w Ω.
17
4 Rachunek różniczkowy k-tego rzędu
4.1 k-ta różniczka
Wzorując się na definicji drugiej różniczki można indukcyjnie zdefiniować różniczkiwyższych rzędów.
Definicja 4.1 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R, x ∈ Ω orazk ∈ N, k ≥ 2. Mówimy, że f jest k-krotnie różniczkowalna w punkcie x jeśli zachodząwarunki1. f jest (k − 1)-krotnie różniczkowalna w pewnym otoczeniu U punktu x;2. Dla dowolnych ustalonych h(1), . . . , h(k−1) ∈ Rn odwzorowanie
U 3 x 7→ wh(1),...,h(k−1)(x) =: dk−1f(x)(h(1), . . . , h(k−1)) ∈ Rjest różniczkowalne w x.Wówczas różniczkę odwzorowania wh(1),...,h(k−1) nazywamy k-tą różniczką f . Zatemdla h, h(1), . . . , h(k−1) ∈ Rn mamy określone odwzorowanie
(h, h(1), . . . , h(k−1)) 7→ dwh(1),...,h(k−1) (x) · h =: dkf (x)(h, h(1), . . . , h(k−1)).
k-ta różniczka jest odwzorowaniem k-liniowym na Rn × · · · × Rn o wartościach w R.Twierdzenia dotyczące drugiej różniczki odpowiednio przenoszą się na przypadek
k-tej różniczki.
Twierdzenie 4.1 Niech f : Ω ⊂ Rn → R, x ∈ Ω. Wówczas f jest k-krotnie różnicz-kowalna w x wtedy i tylko wtedy, gdy1 f jest (k − 1)-krotnie różniczkowalna w pewnym otoczeniu U punktu x;2 Pochodne cząstkowe (k − 1) rzędu są różniczkowalne w x.
Twierdzenie 4.2 Niech f : Ω ⊂ Rn → R, x ∈ Ω.Jeśli f jest k-krotnie różniczkowalna w x, toa) dla dowolnych wektorów h(1), . . . , h(k) ∈ Rn istnieje k-ta pochodna kierunkowa
Lkh(k),...,h(1)f (x) = dkf (x)(h(1), . . . , h(k));
b) Istnieją pochodne cząstkowe rzędu k oraz dla h(1), . . . , h(k) ∈ Rn,
dkf (x)(h(1), . . . , h(k)) =∑
α∈Nk0 ,αi≤n
∂kf
∂xα1 · · · ∂xαk
(x)h(1)α1· · ·h(k)
αk.
W szczególności dla k = 3,
d3f (x)(h(1), h(2), h(3)) =n∑
α1,α2,α3=1
∂3f
∂xα1∂xα2∂xα3
(x)h(1)α1
h(2)α2
h(3)α3
.
Z twierdzenia 4.1 wynika
Wniosek 4.1 Jeśli f posiada w pewnym otoczeniu punktu x ciągłe wszystkie pochodnecząstkowe rzędu k− 1 oraz pochodne cząstkowe rzędu k ciągłe w x, to f jest k-krotnieróżniczkowalna w x.
18
4.2 Symetria k-tej różniczki
Twierdzenie 4.3 Schwarza o symetrii k-tej różniczki.Niech f : Ω ⊂ Rn → R, x ∈ Ω. Jeśli f jest k-krotnie różniczkowalna w x, to k-taróżniczka dkf (x) jest odwzorowaniem k-liniowym symetrycznym, tzn.
dkf (x)(h(1), . . . , h(k)
)= dkf (x)
(h(σ(1)), . . . , h(σ(k))
),
gdzie σ : 1, . . . , k → 1, . . . , k jest dowolną permutacją. W szczególności, pochodnecząstkowe mieszane nie zależą od kolejności różniczkowania.
4.3 Wzór Taylora
Twierdzenie 4.4 Wzór Taylora.Niech f : Ω ⊂ Rn → R będzie k-krotnie różniczkowalna w każdym punkcie odcinka[a, b] ⊂ Ω. Wówczas istnieje punkt c ∈ [a, b] taki, że
f(b) = f(a)+df(a)
1!(b−a)+ · · ·+ dk−1f(a)
(k − 1)!(b−a, . . . , b−a)+
dkf(c)
k!(b−a, . . . , b−a).
4.4 Funkcje klasy Ck
Definicja 4.2 Niech f : Ω → R oraz k ∈ N. Mówimy, że funkcja f jest funkcjąklasy Ck(Ω) jeśli jest ona k-krotnie różniczkowalna w każdym punkcie x ∈ Ω oraz dladowolnych ustalonych h(1), . . . , h(k) ∈ Rn odwzorowanie
Ω 3 x 7→ dkf (x)(h(1), . . . , h(k)) ∈ R
jest ciągłe lub równoważnie, gdy wszystkie pochodne cząstkowe k-tego rzędu∂kf
∂xi1···∂xik
(x), ij = 1, . . . , n dla j = 1, . . . , k, są ciągłe w Ω.
Definicja 4.3 Niech f : Ω → R. Mówimy, że funkcja f jest funkcją klasy C∞(Ω)lub że jest funkcją gładką na Ω jeśli jest ona klasy Ck(Ω) dla dowolnego k ∈ N lubrównoważnie, gdy wszystkie pochodne cząstkowe dowolnego rzędu są ciągłe w Ω.
Funkcjami gładkimi są wielomiany, funkcja wykładnicza, logarytmiczna, funkcjetrygonometryczne, sumy, iloczyny funkcji gładkich, iloraz funkcji gładkich poza ze-rami mianownika, złożenia funkcji gładkich.
Definicja 4.4 Niech f : Ω → R będzie funkcją ciągłą. Nośnikiem funkcji f nazy-wamy domknięcie zbioru tych punktów x ∈ Ω takich, że f(x) 6= 0. Nośnik funkcjioznaczamy jako suppf , tak więc,
suppf = x ∈ Ω : f(x) 6= 0.
19
Przykład 4.1 Niech
g(t) =
e−1/t dla t > 0,
0 dla t ≤ 0.
Wówczas f jest funkcją gładką na R o nośniku R+ = [0,∞).
Dowód Jest jasne, że f jest klasy C∞ na R \ 0. Następnie f ∈ C0(R), gdyżlimt→0+ e−1/t = 0. Pozostaje wykazać, że dla dowolnego k ∈ N pochodna rzędu k jestfunkcją ciągłą w zerze. W tym celu indukcyjnie dowodzi się, że
f (k)(t) = e−1/t ·W2k(1t) dla t > 0,
gdzie W2k jest pewnym wielomianem stopnia 2k. W celu wykazania, że f (k) jestfunkcją ciągłą w zerze wystarczy zatem wykazać następujący fakt.Dla każdego N ∈ N istnieje stała CN < ∞ taka, że
e−1/t ≤ CN tN dla t > 0
lub równoważniexNe−x ≤ CN dla x > 0.
Dowód tej nierówności można uzyskać badając przebieg zmienności funkcji g(x) =xNe−x, x > 0. Otóż funkcja ta jest rosnąca dla 0 < x < N i malejąca dla x > N .W punkcie x = N przyjmuje maksimum równe NNe−N =: CN . 2
Podamy teraz przykład funkcji gładkiej na Rn o nośniku równym kuli jednostko-wej.
Przykład 4.2 Niech
g(t) =
e1/(t−1) dla t < 1,
0 dla t ≥ 1
orazf(x) = g(x2) = g(x2
1 + · · ·+ x2n) dla x ∈ Rn.
Wówczas f jest funkcją gładką na R, której nośnikiem jest kula jednostkowa, tzn.f(x) > 0 dla ‖x‖ < 1 oraz f(x) = 0 dla ‖x‖ ≥ 1.
Dowód. Jest jasne, że suppf = B(0, 1). Indukcyjnie wykazuje się, że dowolnapochodna cząstkowa rzędu k ∈ N jest postaci
W(x1, . . . , xn, g′(x2), . . . , g(k)(x2)
),
gdzie W jest pewnym wielomianem. Zatem f ∈ C∞(Rn). 2
20
5 Ekstrema lokalne funkcjiDefinicja 5.1 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R oraz x ∈ Ω.Mówimy, że f posiada w punkcie x lokalne minimum (maksimum) jeśli istnieje δ > 0taka, że
f(x) ≥ f (x) dla ‖x− x‖ < δ,(f(x) ≤ f (x) dla ‖x− x‖ < δ
).
Lokalne minimum lub maksimum nazywamy lokalnym ekstremum.
5.1 Warunek konieczny 1-go rzędu
Twierdzenie 5.1 Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Jeśli f posiada pochodnecząstkowe pierwszego rzędu w x oraz x jest punktem lokalnego ekstremum, to
∂f
∂x1
(x) = · · · = ∂f
∂xn
(x).
Wniosek 5.1 Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Jeśli f jest różniczkowalna w xoraz x jest punktem lokalnego ekstremum, to
df (x) = 0.
Warto podkreślić, że warunek znikania pochodnych cząstkowych pierwszego rzędujest tylko warunkiem koniecznym ekstremum lokalnego.
Przykład 5.1 Niechf(x, y) = xy
Wówczasf ′x(0, 0) = f ′y(0, 0) = 0,
ale f nie posiada ekstremum w punkcie (0, 0).
Tym nie mniej warunek znikania pochodnych pierwszego rzędu pozwala ustalić punktypodejrzane o ekstrema.
Definicja 5.2 Niech Ω będzie otwartym podzbiorem Rn, f : Ω → R.Punkt x ∈ Ω nazywamy punktem stacjonarnym (lub krytycznym) funkcji f jeśli ist-nieją pochodne cząstkowe ∂f
∂xi(x) dla i = 1, . . . , n i są równe zeru.
Znajomość punktów stacjonarnych funkcji jest przydatna do wyznaczenia naj-większej i najmniejszej wartości funkcji na zbiorze zwartym K b Rn. Jak wiemyfunkcja ciągła przyjmuje na zbiorze zwartym K swoje kresy. Zatem jeśli jest onaróżniczkowalna we wnętrzu zbioru K, to wartości maksymalne i minimalne mogą byćprzyjmowane w punktach stacjonarnych wnętrza K lub na brzegu K.
21
Przykład 5.2 Niech
f(x, y) = 2x2 − xy + y2, K = (x, y) : x2 + y2 ≤ 1.
Wówczas intK = (x, y) : x2 + y2 < 1. Układem równań na punkty stacjonarne jest
∂f
∂x= 4x− y = 0,
∂f
∂y= −x + 2y = 0.
Punktem stacjonarnym jest O = (0, 0) oraz f(0, 0) = 0. W celu zbadania f na brzeguzbioru K zauważmy, że ∂K = x2 + y2 = 1 = (cos ϕ, sin ϕ) : 0 ≤ ϕ ≤ 2π. Zatem
f(cos ϕ, sin ϕ) = 2 cos2 ϕ− cos ϕ sin ϕ + sin2 ϕ
= cos2 ϕ− 12sin 2ϕ + 1 =: g(ϕ).
Liczymy pochodną funkcji g:
g′(ϕ) = −2 cos ϕ sin ϕ− cos 2ϕ = − sin 2ϕ− cos 2ϕ.
g′(ϕ) = 0 wtedy i tylko wtedy, gdy ϕ = 38π lub ϕ = 7
8π.
g(38π) = 1
2(3−√2) > 0, g(7
8π) = 1
2(3 +
√2). Zatem
maxK
f = f(cos 78π, sin 7
8π) = 1
2(3 +
√2), min
Kf = f(0, 0) = 0. 2
W przypadku gdy mamy wyznaczyć ekstrema funkcji na zbiorze domkniętymF ⊂ Rn, poza punktami stacjonarnymi wnętrza zbioru F należy uwzględnić ekstremafunkcji na brzegu zbioru F oraz zachowanie się funkcji dla F 3 x →∞.
Przykład 5.3 Niech
f(x, y) = (x + y)e−x2−y2
, F = (x, y) : x ≥ 0, y ≥ 0.
Wówczas intK = (x, y) : x > 0, y > 0. Układem równań na punkty stacjonarnejest
∂f
∂x= (−2x2 − 2xy + 1)e−x2−y2
= 0,
∂f
∂y= (−2y2 − 2xy + 1)e−x2−y2
= 0.
Punktem stacjonarnym we wnętrzu zbioru F jest A = (12, 1
2) oraz f(1
2, 1
2) = e−1/2. W
celu zbadania f na brzegu zbioru K zauważmy, że intF = I1 ∪ I2, gdzie I1 = (x, 0) :x ≥ 0, I2 = (0, y) : y ≥ 0 Następnie
maxI1
f = max0≤x<∞
xe−x2
= f(√
22
, 0) =√
22
e−1/2, minI1
f = f(0, 0) = 0.
22
Analogicznie maxI2 f = f(0,√
22
) =√
22
e−1/2, minI2 f = f(0, 0) = 0.W celu zbadania zachowania się funkcji f przy (x, y) 3 F →∞ połóżmy x = r cos ϕ,y = r sin ϕ dla r > 0, 0 ≤ ϕ ≤ π/2. Wówczas
f(r cos ϕ, r sin ϕ) = (cos ϕ + sin ϕ)re−r2 → 0 gdy r →∞.
Zatem maxF f = max(e−1/2,
√2
2e−1/2
)= e−1/2 = f(1
2, 1
2), minF f = f(0, 0) = 0. 2
Następny przykład pokazuje, że punktów stacjonarnych może być nieskończeniewiele.
Przykład 5.4 Niechf(x, y) = xy2, Ω = R2.
Wówczas rozwiązaniem układu równań na punkty stacjonarne
∂f
∂x= y2 = 0,
∂f
∂y= 2xy = 0
jest cała prosta y = 0. Łatwo zauważyć, że w punktach (x, 0), x > 0, funkcjaf posiada minimum lokalne równe 0, natomiast w punktach (x, 0), x < 0, funkcjaf posiada maksimum lokalne równe 0. W punkcie (0, 0) nie ma ani minimum animaksimum lokalnego.
5.2 Forma kwadratowa Hessego
Warunek dostateczny na ekstremum funkcji – podobnie jak w przypadku 1-wymiarowym– można sformułować przy pomocy drugiej różniczki. Przypomnijmy, że druga róż-niczka funkcji to forma dwuliniowa
d2f (x)(k, h) =n∑
i,j=1
∂2f (x)
∂xi∂xj
kihj dla k, h ∈ Rn.
Jej wartość na przekątnej k = h nazywamy formą kwadratową Hessego stowarzy-szoną z d2f (x),
H(h) = d2f (x)(h, h) =n∑
i,j=1
∂2f (x)
∂xi∂xj
hihj dla h ∈ Rn.
Oznaczmy
A =
(∂2f
∂xi∂xj
(x)
)n
i,j=1
.
Wówczas, jeśli f jest dwukrotnie różniczkowalna w x, to
H(h) = htrAh dla h ∈ Rn.
23
Definicja 5.3 Formę kwadratową H na Rn nazywamy dodatnio (odpowiednio, ujem-nie) określoną jeśli H(h) > 0 (odpowiednio, H(h) < 0) dla każdego h ∈ Rn \ 0.Jeśli forma h przyjmuje zarówno wartości dodatnie jak i ujemne, to mówimy, że jestona nieokreślona.
Zauważmy, że jeśli forma kwadratowa H jest dodatnio określona, to istnieje stałaM > 0 taka, że
H(h) ≥ Mh2 dla h ∈ Rn.
Istotnie, jeśli H jest dodatnio określona, to przyjmuje wartości dodatnie na sferzejednostkowej i wobec zwartości sfery jednostkowej istnieje M > 0 takie, że
H(h) ≥ M dla h ∈ Rn, ‖h‖ = 1.
ZatemH
( h
‖h‖)
=1
‖h‖2H(h) ≥ M dla h ∈ Rn, h 6= 0.
StądH(h) ≥ M‖h‖2 = Mh2 dla h ∈ Rn. 2
W przyszłości wykażemy, że dla macierzy symetrycznej A ∈ M(n × n) formakwadratowa
H(h) = htrAh dla h ∈ Rn
jest dodatnio określona, wtedy i tylko wtedy, gdy wszystkie wartości własne macierzyA są dodatnie.
Twierdzenie 5.2 Kryterium Sylvestera. Niech A ∈ M(n × n) będzie macierzą sy-metryczną. Wówczas forma kwadratowa
H(h) = htrAh dla h ∈ Rn
jest dodatnio określona, wtedy i tylko wtedy, gdy wyznaczniki wszystkich minorówgłównych są dodatnie, tzn.,
det
a11 a12 . . . a1l
a21 a22 . . . a2l...
... . . . ...al1 al2 . . . all
> 0 dla l = 1, . . . , n.
Wniosek 5.2 Kryterium Sylvestera. Niech A ∈ M(n × n) będzie macierzą syme-tryczną. Wówczas forma kwadratowa
F (h) = htrAh dla h ∈ Rn
jest ujemnie określona, wtedy i tylko wtedy, gdy
(−1)l det
a11 a12 . . . a1l
a21 a22 . . . a2l...
... . . . ...al1 al2 . . . all
> 0 dla l = 1, . . . , n.
24
5.3 Warunek dostateczny 2-go rzędu
Twierdzenie 5.3 Warunek dostateczny drugiego rzędu ekstremum lokalnego.Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Załóżmy, że f jest dwukrotnie różniczkowalna wx, przy czym df (x) = 0. Jeśli forma kwadratowa Hessego
H(h) = d2f (x)(h, h) dla h ∈ Rn
jest dodatnio (odpowiednio, ujemnie) określona, to f przyjmuje w x lokalne minimum(odpowiednio, lokalne maksimum).Jeśli forma H jest nieokreślona, to f nie ma ekstremum w x (x jest wtedy punktemsiodłowym funkcji f).
Twierdzenie 5.4 Warunek dostateczny drugiego rzędu ekstremum globalnego.Niech f : Ω ⊂ Rn → R oraz x ∈ Ω. Załóżmy, że f jest klasy C2(Ω) oraz df (x) = 0.Jeśli forma kwadratowa Hessego
H(h) = d2f(x)(h, h) dla h ∈ Rn
jest dodatnio (odpowiednio, ujemnie) określona dla każdego x ∈ Ω, to f przyjmuje wx ścisłe minimum (odpowiednio, ścisłe maksimum) globalne.
Przykład 5.5 Niech
f(x, y) = (1 + ey) cos x− yey, Ω = R2.
Wówczas rozwiązaniem układu równań na punkty stacjonarne
∂f
∂x= −(1 + ey) sin x = 0,
∂f
∂y= ey(cos x− 1− y) = 0
są punkty Ak = (2kπ, 0), k ∈ Z oraz Bk = ((2k + 1)π,−2), k ∈ Z. Macierzą Hessegojest
H(x, y) =
(−(1 + ey) cos x −ey sin x−ey sin x ey(cos x− 2− y)
).
H(Ak) =
(−2 00 −1
), H(Bk) =
(1 + e−2 0
0 −e−2
)
W punktach Ak mamy H(Ak) < 0. Zatem funkcja przybiera w tych punktach maksi-mum lokalne równe f(2kπ, 0) = 2. W punktach Bk macierz Hessego jest nieokreślona,a zatem są to punkty siodłowe. 2
Przykład 5.6 Niech A ∈ M(n × n) będzie macierzą symetryczną, B ∈ M(n × 1)wektorem poziomym oraz c ∈ R. Rozważmy funkcję kwadratową n-zmiennych
f(x) = xtrAx + Bx + c dla x ∈ Rn.
25
Jeśli A =(aij
)n
i,j=1, B = (b1, . . . , bn), to
f(x) =n∑
i,j=1
aijxixj +n∑
i=1
bixi + c
= x1(a11x1 + a12x2 + . . . + a1nxn)
+ x2(a21x1 + a22x2 + . . . + a2nxn)
...+ xn(an1x1 + an2x2 + . . . + annxn)
+ b1x1 + b2x2 + . . . + bnxn + c.
Układem równań na punkty stacjonarne jest układ
∂f
∂x1
= 2(a11x1 + a12x2 + · · ·+ a1nxn) + b1 = 0,
...∂f
∂xn
= 2(an1x1 + an2x2 + · · ·+ annxn) + bn = 0,
czyligradf(x) = 2xtrA + b = 0.
Jeśli macierz A jest odwracalna, to istnieje dokładnie jeden punkt stacjonarny
x = −12A−1btr.
Ponadto, H(x) = 2A. Zatem, jeśli A > 0, to x jest globalnym, ścisłym minimum;jeśli A < 0, to x jest globalnym, ścisłym maksimum; jeśli A jest nieokreślona, to xjest punktem siodłowym. 2
5.4 Zastosowania
A. Odległość prostych
Prosta l w Rn jest zadana przez punkt a ∈ Rn i wektor v ∈ Rn. Zatem niech l1, l2będą dwoma prostymi:
l1 = x ∈ Rn : x = a + tv dla t ∈ R, gdzie a ∈ Rn, v ∈ Rn,
l2 = y ∈ Rn : y = b + sw dla s ∈ R, gdzie b ∈ Rn, w ∈ Rn.
Wówczas odległość prostej l1 od prostej l2 jest dana wzorem
ρ(l1, l2) = minx∈l1,y∈l2
‖x− y‖.
Zatem
ρ2(l1, l2) = min(t,s)∈R2
n∑i=1
(ai − bi + tvi − swi)2.
26
Czyli trzeba znaleźć minimum funkcji kwadratowej
f(t, s) =n∑
i=1
(ai − bi + tvi − swi)2.
B. Odległość prostej od hiperpłaszczyzny
Odległość punktu p ∈ Rn od (n− 1)-wymiarowej hiperpłaszczyzny Π zadanej równa-niem
Π = x ∈ Rn : btrx = c, gdzie b ∈ Rn, c ∈ Rwyraża się wzorem
ρ2(p, Π) = minx∈Rn−1
( n−1∑i=1
(pi − xi)2 +
(pn − 1
bn(c−
n−1∑i=1
bixi)))
o ile bn 6= 0.Jeśli n = 3, Π = b1x1 + b2x2 + b3x3 = c, przy czym b3 6= 0, to
ρ2(p, Π) = min(x1,x2)∈R2
((p1 − x1)
2 + (p2 − x2) +(p3 − c− b1x1 − b2x2
b3
)).
C. Nierówność między średnią geometryczną i arytmetyczną
Zajmiemy się teraz problemem wyznaczenia najmniejszej wartości sumy n liczb do-datnich, których iloczyn jest ustalony.
Problem polega na znalezieniu minimum wyrażenia x1 + x2 + · · · + xn jeśli x1 >0, x2 > 0, . . . , xn > 0 oraz x1 · x2 · · · xn = C, C > 0. Z ostatniego warunku dostajemy
xn =C
x1 · x2 · · · xn−1
.
Zatem wystarczy znaleźć minimum funkcji
f(x1, x2, . . . , xn−1) = x1 + x2 · · ·+ xn−1 +C
x1 · x2 · · ·xn−1
w obszarze Rn−1+ = x1 > 0, x2 > 0, . . . , xn−1 > 0. Piszemy układ równań na punkt
stacjonarny
∂f
∂x1
= 1− C
x21 · x2 · · · xn−1
= 0,
∂f
∂x2
= 1− C
x1 · x22 · · · xn−1
= 0,
...∂f
∂xn−1
= 1− C
x1 · x2 · · · x2n−1
= 0.
27
Stąd x1 = x2 = . . . = xn−1 = C1/n. Łatwo zauważyć, że jeśli xi → 0 lub xi →∞ dlapewnego i = 1, 2, . . . , n − 1, to f(x1, x2, . . . , xn−1) → ∞. Zatem punkt stacjonarnyfunkcji f jest punktem jej minimum globalnego, czyli
f(x1, x2, . . . , xn−1) ≥ f(C1/n, C1/n, . . . , C1/n) = nC1/n dla (x1, x2, . . . , xn−1) ∈ Rn−1+ .
Stąd dostajemy nierówność pomiędzy średnimi arytmetyczną i geometryczną n liczbdodatnich
x1 + x2 + · · ·+ xn−1 + xn
n≥ n√x1 · x2 · · ·xn−1 · xn.
Korzystając z powyższej nierówności można rozwiązać następujące zadanie.Zadanie 1. Znaleźć trójkąt o danym obwodzie 2p, którego pole P jest największe.
Oznaczając przez a, b, c boki trójkąta zadanie sprowadza się do wyznaczenia maksi-mum funkcji
P (a, b, c) =√
p(p− a)(p− b)(p− c)
przy warunku a + b + c = 2p lub równoważnie maksimum iloczynu
(p− a)(p− b)(p− c)
pod warunkiem, że suma (p− a) + (p− b) + (p− c) = p jest stała.
Zadanie 2. Znaleźć (n+1)-kąt o największym polu P wpisany w koło o promieniuR > 0.Oznaczmy przez ϕ1, ϕ2, . . . , ϕn+1 kąty środkowe (n+1)-kąta. Wówczas ϕ1+ϕ2+ · · ·+ϕn+1 = 2π. Pole (n + 1)-kąta wpisanego w koło o promieniu R wyraża się wzorem
P = 12R2
(sin ϕ1 + · · ·+ sin ϕn+1
).
Zadanie sprowadza się do znalezienia maksimum funkcji
u(ϕ1, . . . , ϕn) = sin ϕ1 + · · ·+ sin ϕn − sin(ϕ1 + · · ·+ ϕn)
w zbiorze F = ϕ1 ≥ 0, . . . , ϕn ≥ 0, ϕ1 + · · ·+ ϕn ≤ 2π. Punkt stacjonarny leżący wewnętrzu tego zbioru spełnia układ równań
∂u
∂ϕ1
= cos ϕ1 − cos(ϕ1 + · · ·+ ϕn) = 0,
...∂u
∂ϕn
= cos ϕn − cos(ϕ1 + · · ·+ ϕn) = 0.
Zatem ϕ1 = . . . = ϕn = 2πn+1
= ϕn+1 oraz umax = u( 2πn+1
, . . . , 2πn+1
) = (n + 1) sin 2πn+1
.Zauważmy jeszcze, że na ścianie ϕn = 0 zbioru F funkcja maksimum funkcji u
wynosi n sin 2πn
< (n+1) sin 2πn+1
, gdyż funkcja x 7→ sin(2πx)x
jest malejąca w przedziale(0, 1
2).
28
D. Metoda najmniejszych kwadratów, regresja liniowa
Załóżmy, że na płaszczyźnie R2 danych jest n punktów
A1 = (x1, y1), . . . , An = (xn, yn).
Zadanie regresji liniowej polega na znalezieniu prostej y = ax + b leżącej najbliżejtych punktów w sensie, że suma kwadratów
∑ni=1 d2
i , gdzie di = |axi + b − yi|, jestnajmniejsza. Zadanie to ma duże zastosowanie w statystyce.
Celem jest znalezienie minimum funkcji kwadratowej
E(a, b) =n∑
i=1
(axi + b− yi
)2.
Układem równań na punkt stacjonarny jest
∂E
∂a= 2
n∑i=1
(axi + b− yi
)xi = 0,
∂E
∂b= 2
n∑i=1
(axi + b− yi
)= 0.
Zatem punkt stacjonarny spełnia układ
a ·∑ni=1 x2
i + b ·∑ni=1 xi =
∑ni=1 xiyi,
a ·∑ni=1 xi + b · n =
∑ni=1 yi.
Zatem oznaczając x = (x1, . . . , xn), y = (y1, . . . , yn) dostajemy
a =n · x y − ( ∑n
i=1 xi
)( ∑ni=1 yi
)
nx2 − ( ∑ni=1 xi
)2 ,
b =x2 ·∑n
i=1 yi −( ∑n
i=1 xi
) · x y
nx2 − (∑ni=1 xi
)2 .
E. Regresja kwadratowa
Załóżmy, że na płaszczyźnie R2 danych jest n punktów
A1 = (x1, y1), . . . , An = (xn, yn).
Zadanie regresji kwadratowej polega na znalezieniu paraboli y = ax2 + bx + c leżącejnajbliżej tych punktów w sensie, że wyrażenie
E(a, b, c) =n∑
i=1
(ax2
i + bxi + c− yi
)2
29
przybiera wartość najmniejszą. Układem równań na punkt stacjonarny jest
∂E
∂a= 2
n∑i=1
(ax2
i + bxi + c− yi
)x2
i = 0,
∂E
∂b= 2
n∑i=1
(ax2
i + bxi + c− yi
)xi = 0,
∂E
∂c= 2
n∑i=1
(ax2
i + bxi + c− yi
)= 0.
F. Regresja wykładnicza i logarytmiczna
Załóżmy, że na płaszczyźnie R2 danych jest n punktów
A1 = (x1, y1), . . . , An = (xn, yn).
Zadanie regresji wykładniczej polega na znalezieniu funkcji wykładniczej y = Beax
leżącej najbliżej tych punktów w sensie, że wyrażenie
F (a,B) =n∑
i=1
(Beaxi − yi
)2
przybiera wartość najmniejszą. Ponieważ ln y = ln(Beax) = ax + ln B wystarczyznaleźć minimum funkcji
E(a, b) =n∑
i=1
(axi + b− ln yi
)2, gdzie b = ln B.
Analogicznie definiuje się zadanie regresji logarytmicznej.
G. Programowanie liniowe
Zadanie programowania liniowego polega na znalezieniu ekstremów funkcji liniowej wzbiorze opisanym przez funkcje liniowe. Dla danego wektora b ∈ Rn oraz liczby c ∈ Rznaleźć
minW
(btrx + c) oraz maxW
(btrx + c),
gdzieW = x ∈ Rn : g1(x) ≤ 0, . . . , gk(x) ≤ 0,
gi(x) = vtri x + di, vi ∈ Rn, di ∈ R dla i = 1, . . . , k.
Ponieważ funkcja x → btrx + c jest stała na hiperpłaszczyznach btrx = const, więc jejekstrema są przyjmowane w punktach ekstremalnych zbioru W .
30
6 Zasada Banacha
6.1 Zwartość i zupełność
Definicja 6.1 Niech (X, ρ) będzie przestrzenią metryczną. Podzbiór K ⊂ X na-zywamy zwartym jeśli dowolny ciąg punktów zbioru K zawiera podciąg zbieżny dopunktu zbioru K.
Fakt 1. Każdy zbiór zwarty jest domknięty.Fakt 2. Domknięty podzbiór zbioru zwartego jest zwarty.Fakt 3. Domknięty i ograniczony zbiór K ⊂ Rn jest zwarty.
Definicja 6.2 Niech (X, ρ) będzie przestrzenią metryczną. Mówimy, że ciąg xn∞n=1
punktów xn ∈ X spełnia warunek Cauchy’ego jeśli zachodzi
(C)dla dowolnego ε > 0 istnieje N ∈ N takie, że
ρ(xn, xm) < ε dla n,m ≥ N.
Lemat 6.1 Każdy ciąg zbieżny w przestrzeni metrycznej (X, ρ) spełnia warunek Cau-chy’ego.
Lemat 6.2 Każdy ciąg Cauchy’ego w przestrzeni metrycznej (X, ρ) jest ograniczony.
Definicja 6.3 Niech (X, ρ) będzie przestrzenią metryczną. Mówimy, że przestrzeń(X, ρ) jest zupełna jeśli każdy ciąg Cauchy’ego elementów przestrzeni X jest zbieżnyw X.
Przykład 6.1 Przestrzeń (0, 1) z metryką ρ(x, y) = |x−y| nie jest zupełna. PodobnieQ, gdzie Q jest zbiorem liczb wymiernych, nie jest zupełna.
Lemat 6.3 Każda przestrzeń metryczna (X, ρ) zwarta jest zupełna.
Lemat 6.4 Jeśli w przestrzeni metrycznej (X, ρ) każda kula domknięta jest zwarta,to (X, ρ) jest zupełna.
Ponieważ w przestrzeni Rn kule domknięte są zwarte mamy
Wniosek 6.1 Przestrzeń Rn z metryką euklidesową jest zupełna
Wniosek 6.2 Domknięty podzbiór przestrzeni zupełnej jest przestrzenią zupełną.
31
6.2 Zasada Banacha
Definicja 6.4 Niech (X, ρ) będzie przestrzenią metryczną.Odwzorowanie T : X → X nazywamy zwężającym jeśli istnieje stała 0 < λ < 1 taka,że dla dowolnych x, y ∈ X zachodzi
ρ(T (x), T (y)) ≤ λρ(x, y).
Łatwo zauważyć, że odwzorowanie zwężające jest ciągłe.
Definicja 6.5 Punkt x ∈ X nazywamy punktem stałym odwzorowania T : X → Xjeśli T (x) = x.
Przykład 6.2 Niech T : Rn → Rn będzie odwzorowaniem liniowym, tzn. Tx = Axdla pewnej macierzy M ∈ M(n × n). Wówczas punkt 0 jest punktem stałym od-wzorowanie T . T jest odwzorowaniem zwężającym wtedy i tylko wtedy, gdy moduływartości własnych własnych macierzy A są mniejsze od 1.
Przedstawimy teraz tzw. zasadę Banacha. Jest to jedno z najważniejszych twier-dzeń analizy, wykorzystywane do dowodu istnienia rozwiązań wielu problemów ma-tematycznych.
Twierdzenie 6.1 (Banacha o punkcie stałym.) Niech T będzie odwzorowaniem zwę-żającym przestrzeni metrycznej, zupełnej (X, ρ) w siebie. Wówczas istnieje dokładniejeden punkt stały odwzorowania T . Ponadto, jest wyznaczony jako granica ciąguT nx∞n=1, gdzie x jest dowolnym punktem przestrzeni X.
Dowód. Weźmy dowolny punkt x ∈ X i oznaczmy d = ρ(x, Tx). Korzystając zdefinicji odwzorowania zwężającego oraz indukcji matematycznej łatwo zauważyć, żedla n ∈ N0 zachodzi
ρ(T nx, T n+1x) ≤ λnd,
gdzie 0 < λ < 1. Ponieważ szereg∑∞
n=0 λnd jest zbieżny, więc ciąg T nx∞n=0 jestciągiem Cauchy’ego w X. Wobec zupełności przestrzeni X istnieje granica
limn→∞
T nx = x.
Korzystając z ciągłości odwzorowania T dostajemy
T x = T limn→∞
T nx = limn→∞
T n+1x = x.
Zatem x jest punktem stałym T . Jeśli y też jest punktem stałym odwzorowania T ,to ponieważ
ρ(x, y) = ρ(T x, T y) ≤ λρ(x, y)
oraz λ < 1, więc musi zachodzić ρ(x, y) = 0. Stąd x = y. 2
32
7 Odwracanie odwzorowańNiech f : (a, b) → R będzie funkcją klasy C1, której pochodna f ′ nigdzie nie znika naodcinku (a, b). Ponieważ f ′ z założenia jest funkcją ciągłą, więc na mocy własnościDarboux dla każdego x ∈ (a, b) zachodzi f ′(x) > 0 lub f ′(x) < 0. Zatem f jest funkcjąściśle rosnącą lub ściśle malejącą, a więc różnowartościową. Stąd wnioskujemy, żeistnieje funkcja odwrotna f−1 :
(f(a), f(b)
) → R, tzn. f−1(f(x)
)= x dla każdego
x ∈ (a, b).
W przypadku odwzorowań wielowymiarowych F : Ω ⊂ Rn → Rn sytuacja jestbardziej złożona. Naturalnym odpowiednikiem warunku f ′(x) 6= 0 jest nieosobliwośćróżniczki odwzorowania F , czyli warunek
JF (x) 6= 0 dla x ∈ Ω,
gdzie JF = det DF jest jakobianem odwzorowania F , czyli wyznacznikiem macierzyróżniczki DF . Niestety dla n ≥ 2 odwzorowanie o nieznikającym jakobianie nie musibyć różnowartościowe.
Przykład 7.1 Niech Ω = (r, ϕ) : r > 0, ϕ ∈ R oraz
F (r, ϕ) =(f1(r, ϕ), f2(r, ϕ)
):= (r cos ϕ, r sin ϕ) dla (r, ϕ) ∈ Ω.
Wówczas F odwzorowuje Ω na R2 \ (0, 0) oraz
JF (r, ϕ) = det
(∂f1
∂r∂f1
∂ϕ∂f2
∂r∂f2
∂ϕ
)= det
(cos ϕ −r sin ϕsin ϕ r cos ϕ
)= r > 0 dla (r, ϕ) ∈ Ω.
Odwzorowanie F nie jest różnowartościowe, gdyż F (r, ϕ + 2π) = F (r, ϕ). Zauważmyjednak, że dowolny punkt (r0, ϕ0) ∈ Ω posiada otoczenie otwarte U = (r, ϕ) : r >0, ϕ0 − π < ϕ < ϕ0 + π, na którym F jest różnowartościowe. Dowolny punkt(x, y) ∈ R2 \ (0, 0) można przedstawić w postaci x = r cos ϕ, y = r sin ϕ, gdzier =
√x2 + y2, ϕ = arctg y
x. (r, ϕ) nazywamy współrzędnymi biegunowymi punktu
(x, y).
Definicja 7.1 Niech F : Ω ⊂ Rn → Rn będzie odwzorowaniem klasy C1. Mówimy,że F jest nieosobliwe w punkcie x ∈ Ω jeśli JF (x) 6= 0. Podobnie F jest nieosobliwena zbiorze U ⊂ Ω jeśli jest nieosobliwe w każdym punkcie zbioru U .
Twierdzenie 7.1 O lokalnym odwracaniu odwzorowań.Niech F : Ω ⊂ Rn → Rn będzie odwzorowaniem klasy C1 oraz x ∈ Ω.Jeśli F jest nieosobliwe w x, toa) F (Ω) jest otoczeniem punktu y = F (x);b) Istnieje otoczenie U punktu x takie, że F|U jest różnowartościowe.
33
Twierdzenie 7.2 O różniczkowalności odwzorowania odwrotnego.Niech F : Ω ⊂ Rn → Rn będzie odwzorowaniem klasy C1(Ω). Załóżmy,że F jestnieosobliwe na Ω. Wówczas1. F (Ω) jest zbiorem otwartym;2. Jeśli F jest różnowartościowe na Ω, to odwzorowanie odwrotne F−1 jest klasy C1
oraz dla y = F (x), x ∈ Ω zachodzi
DF−1(y) =(DF (x)
)−1, JF−1(y) = 1
/JF (x).
Przykład 7.2 Niech Ω = (r, ϕ) : r > 0,−π < ϕ < π oraz
F (r, ϕ) =(f1(r, ϕ), f2(r, ϕ)
):= (r cos ϕ, r sin ϕ) dla (r, ϕ) ∈ Ω.
Wówczas F odwzorowuje wzajemnie jednoznacznie Ω na R2 \ (x, 0) : x ≤ 0 oraz
JF (r, ϕ) = det
(cos ϕ −r sin ϕsin ϕ r cos ϕ
)= r > 0 dla (r, ϕ) ∈ Ω.
Z Twierdzenia 7.2 wynika, że odwzorowanie odwrotne G = F−1 jest klasy C1.G można wyrazić w sposób jawny
G(x, y) =(g1(x, y), g2(x, y)
):=
(√x2 + y2, arctg
y
x
).
Tym nie mniej różniczkę odwzorowania G można wyliczyć nie korzystając z jawnychwzorów na G. Otóż na podstawie punktu 2 Twierdzenia 7.2 mamy
DG(x, y) =(DF
)−1=
(cos ϕ −r sin ϕsin ϕ r cos ϕ
)−1
=
(cos ϕ sin ϕ
−sin ϕr
cos ϕr
)
=
(x√
x2+y2
y√x2+y2
−yx2+y2
xx2+y2
).
Stąd
dg1(dx, dy) =xdx + ydy√
x2 + y2, dg2(dx, dy) =
xdy − ydx
x2 + y2.
34
8 DyfeomorfizmyZ tematem odwracania odwzorowań wiąże się pojęcie dyfeomorfizmu.
Definicja 8.1 Odwzorowanie F : Ω ⊂ Rn → Rm nazywamy dyfeomorfizmem zbioruΩ na obraz F (Ω) jeśli spełnione są trzy warunki
1. F jest klasy C1,
2. F jest nieosobliwe i różnowartościowe,
3. odwzorowanie odwrotne F−1 : F (Ω) → Rn jest ciągłe.
Każdy dyfeomorfizm jest homeomorfizmem. Ponadto, z warunku nieosobliwościF wynika, że m ≥ n. Z twierdzenia o różniczkowaniu złożenia odwzorowań wynika
Wniosek 8.1 Jeśli F : Ω ⊂ Rn → U ⊂ Rm jest dyfeomorfizmem Ω na U orazG : U → Rk jest dyfeomorfizmem U na V = G(U), to G F jest dyfeomorfizmem Ωna V .
Uwaga. Jeśli m > n, to z warunków nieosobliwości i różnowartościowości F niewynika ciągłość odwzorowania odwrotnego. Pokazuje to poniższy przykład
Przykład 8.1 Niech F : (−2π, 1) ⊂ R→ R2 będzie dane wzorem
F (t) =
(cos t, sin t) dla − 2π < t < 0,
(1, t) dla 0 ≤ t < 1.
Wówczas F jest odwzorowaniem klasy C1, jest nieosobliwe i różnowartościowe, leczodwzorowanie odwrotne nie jest ciągłe.
Tym nie mniej z Twierdzenia 7.2 dostajemy
Wniosek 8.2 Jeśli odwzorowanie F : Ω ⊂ Rn → Rn jest klasy C1 oraz jest nieoso-bliwe i różnowartościowe, to jest ono dyfeomorfizmem Ω na F (Ω) oraz F−1 : F (Ω) →Ω jest dyfeomorfizmem.
Podamy teraz serię ważnych przykładów dyfeomorfizmów.
Przykład 8.2 NiechF (r, ϕ) = (r cos ϕ, r sin ϕ)
Wówczas F jest dyfeomorfizmem zbioru Ω = (r, ϕ) : r > 0,−π < ϕ < π naR2 \ (x, 0) : x ≤ 0. F nazywamy dyfeomorfizmem biegunowym.
Przykład 8.3 NiechF (r, ϕ, z) = (r cos ϕ, r sin ϕ, z)
Wówczas F jest dyfeomorfizmem zbioru Ω = (r, ϕ, z) : r > 0,−π < ϕ < π, z ∈ Rna R3 \ (x, 0, z) : x ≤ 0. F nazywamy dyfeomorfizmem walcowym.
35
Przykład 8.4 (Współrzędne sferyczne).Współrzędnymi sferycznymi punktu (x, y, z) ∈ R3 nazywamy liczby r, ψ, ϕ takie, że
x = r cos ψ cos ϕ, y = r cos ψ sin ϕ, z = r sin ψ.
NiechF (r, ϕ, ψ) = (r cos ψ cos ϕ, r cos ψ sin ϕ, r sin ψ)
Wówczas F jest dyfeomorfizmem zbioru Ω = (r, ϕ, ψ) : r > 0,−π < ϕ < π,−π2
<ψ < π
2 na obraz.
Zauważmy, że F jest złożeniem dwóch dyfeomorfizmów walcowych F = G H, gdzie
G(ρ, ϕ, z) = (ρ cos ϕ, ρ sin ϕ, z),
H(r, ϕ, ψ) = (r cos ψ, ϕ, r sin ψ).
Zatem F jest dyfeomorfizmem Ω na R3 \ (x, 0, z) : x ≤ 0. Policzmy jeszcze macierzróżniczki F . Na mocy twierdzenia o różniczce złożenia odwzorowań dostajemy
DF = DG DH =
cos ϕ −ρ sin ϕ 0sin ϕ ρ cos ϕ 0
0 0 1
cos ψ 0 −r sin ψ0 1 0
sin ψ 0 r cos ψ
ρ=r cos ψ=
cos ψ cos ϕ −r cos ψ sin ϕ −r sin ϕ cos ψcos ψ sin ϕ r cos ψ cos ϕ −r sin ψ sin ϕ
sin ψ 0 r cos ψ
.
Ponadto,JF = JG · JH = ρ · r = r2 cos ψ.
Przykład 8.5 Niech 0 < a1 < a2, 0 < b2 < b2 α < β orazΩ = (x, y) : x > 0, y > 0, a1x
α < y < a2xα, b1x
β < y < b2yβ.
Jeśli oznaczymy u = x−αy, v = x−βy, to (x, y) ∈ Ω wtedy i tylko wtedy, gdy (u, v) ∈P = (u, v) : a1 < u < a2, b1 < v < b2. Niech
F (x, y) = (x−αy, x−βy) dla (x, y) ∈ Ω.
F jest wzajemnie jednoznacznym odwzorowaniem Ω na P .
DF (x, y) =
(−αx−α−1y x−α
−βx−β−1y x−β
)
orazJF (x, y) = (β − α)x−α−β−1y > 0 dla (x, y) ∈ Ω.
Zatem F jest dyfeomorfizmem Ω na P . Dyfeomorfizm odwrotny jest dany przez
F−1(u, v) =
((u
v
)β−α
,(vβ
uα
)1/(β−α))
.
36
Przykład 8.6 Niech Ω = (x, y) : x ∈ I, 0 < y < f(x), gdzie I = (a, b) ⊂ R orazniech f : I → R+ jest funkcją klasy C1(I) o wartościach dodatnich. Połóżmy
Ψ(x, y) =
(x,
y
f(x)
)dla (x, y) ∈ Ω.
Wówczas Ψ jest wzajemnie jednoznacznym odwzorowaniem Ω na P = (u, v) : u ∈I, 0 < v < 1. Macierzą różniczki Ψ jest
DΨ =
(1 0
−yf ′(x)f2(x)
1f(x)
)
orazJΨ(x, y) =
1
f(x)> 0 dla (x, y) ∈ Ω.
Zatem Ψ jest dyfeomorfizmem Ω na P . Dyfeomorfizm odwrotny jest dany przez
Ψ−1(u, v) =(u, vf(u)
).
Przykład 8.7 (Symetria sferyczna).Niech
I(x) =x
‖x‖2dla x ∈ Ω := Rn \ 0.
Wówczas I jest wzajemnie jednoznacznym odwzorowaniem zbioru Ω na siebie orazISn−1 = Id. Ponadto, I−1 = I gdyż
I(I(x)
)=
x‖x‖2∥∥ x‖x‖2
∥∥2 = x dla x ∈ Ω.
ZatemDI(y) DI(x) = Id dla y = I(x) ∈ Ω.
Czyli I jest nieosobliwe i jest to dyfeomorfizm Rn \ 0 na siebie.
Zadanie. Policzyć macierz różniczki odwzorowania I.
37
9 Funkcje uwikłaneNiech F : Ω ⊂ R2 → R będzie funkcją klasy C1. Rozważmy zbiór
S = (x, y) ∈ Ω : F (x, y) = 0.
Niech (x, y) ∈ S. Będziemy chcieli wiedzieć kiedy w otoczeniu punktu (x, y) zbiór Sjest wykresem funkcji y = g(x) lub funkcji x = h(y). Mówimy wówczas, że równanieF (x, y) = 0 określa w sposób uwikłany funkcję y = g(x) lub funkcję x = h(y).
Przykład 9.1 Niech S = (x, y) ∈ R2 : x2 + y2 = 1 oraz niech (x, y) ∈ S.Jeśli −1 < x < 1, y > 0, to funkcja g(x) =
√1− x2 określona w otoczeniu punktu x
spełnia g(x) = y oraz x2 +(g(x)
)2= 1.
Podobnie, jeśli −1 < x < 1 lecz y < 0, to funkcja g dana przez g(x) = −√1− x2
spełnia g(x) = y oraz x2 +(g(x)
)2= 1.
Jeśli natomiast y = 0, to funkcja h(y) =√
1− y2 jeśli x = 1 (odpowiednio h(y) =
−√
1− y2 jeśli x = −1) zdefiniowana w otoczeniu punktu y spełnia(h(y)
)2+ y2 = 1
oraz h(y) = x.
Twierdzenie 9.1 O funkcji uwikłanej.Niech F : Ω ⊂ R2 → R będzie funkcją klasy C1,
S = (x, y) ∈ Ω : F (x, y) = 0 oraz (x, y) ∈ S.
Jeśli∂F
∂y(x, y) 6= 0,
to istnieją przedział I 3 x i funkcja g : I → R klasy C1 taka, że g(x) = y oraz zbiórS1 = (x, g(x)) : x ∈ I jest zawarty w S i otwarty w S. Ponadto,
g′(x) =−∂F
∂x(x, g(x))
∂F∂y
(x, g(x))dla x ∈ I1 ⊂ I.
Analogicznie, jeśli∂F
∂x(x, y) 6= 0,
to istnieją przedział J 3 y i funkcja h : J → R klasy C1 taka, że h(y) = x oraz zbiórS2 = (h(y), y) : y ∈ J jest zawarty w S i otwarty w S. Ponadto,
h′(y) =−∂F
∂y(h(y), y)
∂F∂x
(h(y), y)dla x ∈ J1 ⊂ J.
38
Uogólnimy teraz twierdzenie o funkcji uwikłanej na wyższe wymiary. Niech k, l, n ∈N oraz k + l = n. Współrzędne punktu x ∈ Rn podzielimy na dwie grupy x =(x1, . . . , xl, xl+1, . . . , xn) = (x′, y), gdzie x′ = (x1, . . . , xl), y = (xl+1, . . . , xn) = (y1, . . . , yk).Niech F : Ω ⊂ Rn → Rk będzie odwzorowaniem klasy C1(Ω; Rk),tzn. F = (f1, . . . , fk), gdzie fi ∈ C1(Ω; R) dla i = 1, . . . , k. Jak wiemy różniczka DFodwzorowania F jest odwzorowaniem liniowym z Rn do Rk, którego macierzą jest
DF =
∂f1
∂x1
∂f1
∂x2. . . ∂f1
∂xn∂f2
∂x1
∂f2
∂x2. . . ∂f2
∂xn...... . . . ...
∂fk
∂x1
∂fk
∂x2. . . ∂fk
∂xn
.
Wyznacznik macierzy kwadratowej otrzymanej z macierzy różniczki DF poprzez wy-bór kolumn o numerach p1, p2, . . . , pk będziemy oznaczać
Jp1,p2,...,pkF =
∂(f1, f2, . . . , fk)
∂(xp1xp2 . . . xpk)
= det
∂f1
∂xp1
∂f1
∂xp2. . . ∂f1
∂xpk∂f2
∂xp1
∂f2
∂xp2. . . ∂f2
∂xpk...... . . . ...
∂fk
∂xp1
∂fk
∂xp2. . . ∂fk
∂xpk
i nazywać jakobianem cząstkowym F .Rozpatrzmy zbiór
S = (x′, y) ∈ Ω : F (x′, y) = 0= (x′, y) ∈ Ω : fi(x
′, y) = 0 dla i = 1, . . . , k.
Twierdzenie 9.2 O funkcji uwikłanej, przypadek ogólny. Przy powyższych założe-niach jeśli x = (x′, y) ∈ S oraz
Jl+1...nF (x) 6= 0
to istnieje odwzorowanie G = (g1, . . . , gk) klasy C1 określone w pewnym obszarze∆ ⊂ Rl o wartościach w Rk takie, że G(x′) = y, tzn.
g1(x1, . . . , xl) = xl+1 = y1,
......
...gk (x1, . . . , xl) = xl+k = yk
dla x′ ∈ ∆ oraz zbiór S1 = (x′, g1(x′), . . . , gk(x
′) : x′ ∈ ∆ jest zawarty w S i otwartyw S. Ponadto,
DG(x′) = −(Dx′F )−1(x′, G(x′)) (DyF )(x′, g(x′)) dla x′ ∈ ∆′ ⊂ ∆.
39
Przykład 9.2 Niech F = (f1, f2) : R5 → R2, gdzie
f1(x1, x2, y1, y2, y3) = ex1 − x1y2 + x2y1 + y3 − 7 = 0,
f2(x1, x2, y1, y2, y3) = x22 cos x1 − x1 − x1y3 + x2y1 − 3 = 0
oraz
S = (x1, x2, y1, y2, y3) ∈ R5 : F (x1, x2, y1, y2, y3) = 0, x = (0, 1), y = (2, 3, 4).
Wówczas (x, y) ∈ S. Macierzą różniczki odwzorowania F jest
DF (x, y) =
(ex1 − y2 y1 x2 −x1 1
−x22 sin x1 − 1− y3 2x2 cos x1 + y1 x2 0 −x1
).
ZatemDF (x, y) =
(−2 2 1 0 1−5 4 1 0 0
)
orazJx1x2F (x, y) = det
(−2 2−5 4
)= 2 6= 0.
Na podstawie Twierdzenia 9.2 wnioskujemy, że w otoczeniu ∆ punktu y istnieje od-wzorowanie G = (g1, g2) klasy C1 takie, że F (g1(y), g2(y), y) ≡ 0. Macierz różniczkiodwzorowania G można wyznaczyć ze wzoru
DF = (DxF ) DG + (DyF ) = 0.
Stąd DG = −(DxF )−1 (DyF ). Zatem
DG(y) = −(−2 2−5 4
)−1
(
1 0 11 0 0
)
= −(
2 −152−1
)
(1 0 11 0 0
)=
(−1 0 −2−3
20 −5
2
).
Stąd∂g1
∂y1(y) = −1,
∂g1
∂y2(y) = 0,
∂g1
∂y3(y) = −2,
∂g2
∂y1(y) = −3
2 ,∂g2
∂y2(y) = 0,
∂g2
∂y3(y) = −5
2 .
40
10 Ekstrema warunkoweCzęsto zachodzi potrzeba znalezienia ekstremów funkcji rzeczywistej f na zbiorzeopisanym przez ograniczenia równościowe
S = x ∈ Ω ⊂ Rn : g1(x) = 0, . . . , gk(x) = 0.Mówimy wówczas, że mamy do czynienia z problemem znalezienia ekstremów warun-kowych. Na przykład chcemy znaleźć minimum i maksimum funkcji liniowej
f(x) = a1x1 + · · ·+ aaxn
na (n− 1)-wymiarowej sferze
Sn−1 = x ∈ Rn : g(x) = x21 + · · ·+ x2
n − 1 = 0.Definicja 10.1 Niech g1, . . . , gk będą funkcjami rzeczywistymi klasy C1(Ω) oraz
S = x ∈ Ω ⊂ Rn : g1(x) = 0, . . . , gk(x) = 0.Punkt x ∈ S nazywamy punktem regularnym zbioru S, jeśli gradienty ∇g1(x), . . . ,∇gk (x) są liniowo niezależnymi wektorami w Rn (zatem k ≤ n).
Przykład 10.1 Niech Sn−1 = x ∈ Rn : g(x) = x21 + · · ·+ x2
n − 1 = 0 będzie sferą.Wówczas ∇g(x) = (2x1, . . . , 2xn) 6= 0 dla x ∈ Sn−1. Zatem każdy punkt sfery Sn−1
jest punktem regularnym.
Przykład 10.2 Niech S = (x, y) ∈ R2 : g(x, y) = x2 − y3 = 0. Wówczas∇g(x, y) = (2x, 3y2) 6= 0 dla (x, y) ∈ S \ (0, 0). Zatem (0, 0) nie jest punktemregularnym zbioru S, a pozostałe punkty są regularne.
Definicja 10.2 Jeśli x jest punktem regularnym zbioru S, to przestrzenią stycznądo S w punkcie x nazywamy zbiór
TxS = h ∈ Rn : ∇gi(x)h = 0 dla i = 1, . . . , k.
Czasami problem szukania ekstremów warunkowych można sprowadzić do szuka-nia ekstremów funkcji na zbiorze otwartym. Na przykład jeśli zmienne (x1, . . . , xn)da się rozdzielić na dwie grupy (x1, . . . , xl) = x′ i (xl+1, . . . , xn) = y, 1 ≤ l ≤ n− 1,w ten sposób, że układ równań
g1(x′, y) = 0, . . . , gk(x
′, y) = 0
można rozwiązać globalnie, tzn. istnieją funkcje hj : U ⊂ Rl → R dla j = 1, . . . , k,k + l = n takie, że gi
(x′, h1(x
′), . . . , hk(x′))
= 0, to problem znalezienia minimum
minx∈Ω
f(x) : g1(x) = 0, . . . , gk(x) = 0
można sprowadzić do problemu znalezienia minimum na zbiorze otwartym U
minx′∈U
f(x′, h1(x
′), . . . , hk(x′)).
41
Przykład 10.3 Problem
min(x1,x2)∈R2
x21 + x2
2 : x1 + x2 = 1
jest równoważny problemowi
minx1∈R
x21 + (1− x1)
2.
Twierdzenie 10.1 (Warunek konieczny I rzędu ekstremum warunkowego).Niech f, g1, . . . , gk : Ω → R będą funkcjami klasy C1 na zbiorze otwartym Ω ⊂ Rn,
S = x ∈ Ω : g1(x) = 0, . . . , gk(x) = 0.
Jeśli funkcja f ma w punkcie regularnym x zbioru S ekstremum warunkowe, to istniejąliczby λ1, . . . , λk ∈ R takie, że
∇f (x) +k∑
i=1
λi∇gi(x) = 0. (9)
Definicja 10.3 Liczby λ1, . . . , λk nazywamy współczynnikami Lagrange’a, a funkcję
L(x, λ) = f(x) +k∑
i=1
λi∇gi(x)
funkcją Lagrange’a.
Uwaga. Jeśli x jest punktem regularnym zbioru S, to warunek (9) oznacza, że∇xL = 0. Jednocześnie, mamy ∇λL = (g1, . . . , gk). Zatem jeśli funkcja f osiąga wpunkcie regularnym zbioru S ekstremum lokalne, to dla pewnego λ ∈ Rk spełnionyjest układ (n + k) równań
∇L(x, λ) = 0.
Przykład 10.4 Niech
f(x) = a1x1 + · · ·+ anxn, gdzie (a1, . . . , an) 6= (0, . . . , 0),
Sn−1 = g(x) = 0, gdzie g(x) = x21 + · · ·+ x2
n − 1.
Wówczas
∇f(x) = (a1, . . . , an), ∇g(x) = (2x1, . . . , 2xn) 6= 0 na S.
Zatem każdy punkt sfery Sn−1 jest regularny. Jeśli f ma ekstremum warunkowe wpunkcie x ∈ Sn−1, to istnieje λ ∈ R taka, że
(a1, . . . , an) + 2λ(x1, . . . , xn) = 0.
42
Stąd
(x1, . . . , xn) = − 1
2λ(a1, . . . , an).
Lecz x ∈ Sn−1, czyli x21 + · · ·+ x2
n = 1. Zatem
λ = ± 1
2√
a21 + · · ·+ a2
n
oraz (x1, . . . , xn) = ± (a1, . . . , an)√a2
1 + · · ·+ a2n
.
Minimum (odpowiednie, maksimum) funkcji f na sferze Sn−1 wynosi−√
a21 + · · ·+ a2
n
(odpowiednio,√
a21 + · · ·+ a2
n).
Niech A ∈ M(n × n) będzie macierzą symetryczną oraz H(h) = htrAh formąkwadratową. W dowodzie kryterium Sylvestera skorzystaliśmy z faktu, że forma Hjest dodatnio określona wtedy i tylko wtedy, gdy wszystkie wartości własne macierzyA są dodatnie. Obecnie możemy ten fakt udowodnić.
Przykład 10.5 Niech A ∈ M(n× n) będzie macierzą symetryczną oraz
H(x) = xtrAx =n∑
i,j=1
aijxixj dla x ∈ Rn.
Wyznaczmy ekstrema funkcji H na sferze Sn−1 = x ∈ Rn : g(x) = 0, gdzie g(x) =x2 − 1 = x2
1 + · · · + x2n − 1. Ponieważ ∇g(x) = 2x 6= 0 na Sn−1, więc każdy punkt
sfery jest regularny. Połóżmy
L(x, λ) = xtrAx− λ(x2 − 1).
Jeśli w punkcie x ∈ Sn−1 funkcja H osiąga ekstremum warunkowe, to ∇L(x, λ) = 0dla pewnego λ ∈ R. Mamy
∂L∂xi
= 2∑n
j=1 aijxj − 2λxi dla i = 1, . . . , n,
∂L∂λ
= −g(x).
Zatem (A − λId)x = 0. Aby ten układ miał rozwiązanie x ∈ Sn−1, λ musi byćwartością własną macierzy A. Ponieważ macierz A jest symetryczna jej wartościwłasne λ1, . . . , λn są rzeczywiste (tzn. spectrumA = λ1, . . . , λn). Jeśli Ax = λixoraz x2 = 1, to
H(x) = xtrAx = xtrλix = λixtrx = λix
2 = λi.
Zatem wartości ekstremalne funkcji H na sferze Sn−1 należą do zbioru λ1, . . . , λn.Ponieważ dla r > 0 zachodzi
H(
xr
)=
(xr
)trA x
r= 1
r2 xtrAx = 1
r2 H(x).
wnioskujemy stąd, że H jest dodatnio określona wtedy i tylko wtedy, gdy λi > 0 dlai = 1, . . . , n.
43
Twierdzenie 10.2 (Warunek dostateczny II rzędu minimum warunkowego).Niech f, g1, . . . , gk : Ω ⊂ Rn → R będą funkcjami klasy C2,
S = x ∈ Ω ⊂ Rn : g1(x) = 0, . . . , gk(x) = 0oraz niech x ∈ S będzie punktem regularnym. Połóżmy
L(x, λ) = f(x) +k∑
i=1
λi∇gi(x)
Jeśli istnieje λ = (λ1, . . . , λk) ∈ R taka, że
∇xL(x, λ) = 0 (10)
orazd2
xL(x, λ)(h, h) > 0 (11)dla każdego Rn 3 h 6= 0 spełniającego d(g1, . . . , gk)(x)h = 0, to funkcja f ma w xzbioru S ścisłe minimum lokalne warunkowe.
Przykład 10.6 Znajdziemy ekstrema funkcji f(x, y, z) = x + y + z na powierzchniS = 1
x+ 1
y+ 1
z= 1. Konstruujemy funkcję Lagrange’a
L(x, y, z, λ) = x + y + z + λ
(1
x+
1
y+
1
z− 1
),
a następnie liczymy jej pochodne cząstkowe pierwszego rzędu i przyrównujemy je dozera
∂L
∂x= 1− λ
x2= 0,
∂L
∂y= 1− λ
y2= 0,
∂L
∂z= 1− λ
z2= 0,
∂L
∂λ=
1
x+
1
y+
1
z− 1 = 0.
Aby ten układ miał rozwiązanie λ musi być dodatnie. Wówczas x = ±√
λ, y = ±√
λ,z = ±
√λ. Jeśli x = y = z = x =
√λ, to λ = 9, a więc x = y = z = 3. Mamy zatem
punkt stacjonarny P1 = (3, 3, 3). Jeśli x = −√
λ, to y =√
λ, z =√
λ. Zatem λ = 1,x = −1, y = z = 1. Mamy zatem punkt stacjonarny P2 = (−1, 1, 1). Analogiczniedostajemy punkty stacjonarne P3 = (1,−1, 1) i P4 = (1, 1,−1). Liczymy teraz drugąróżniczkę względem zmiennych (x, y, z),
d2L(h, h) =(h1 h2 h3
)
2λx3 0 00 2λ
y3 0
0 0 2λz3
h1
h2
h3
= 2λ
(h2
1
x3+
h22
y3+
h22
z3
).
W punkcie P1 mamy d2L(P1)(h, h) = 1827
(h2
1 + h22 + h2
3
)> 0. Zatem w P1 jest funkcja
f przyjmuje minimum warunkowe na S oraz f(3, 3, 3) = 9.W punkcie P2 mamy d2L(P2)(h, h) = 2
( − h21 + h2
2 + h23
). Z warunku dg(h) = 0 w
punkcie P2 dostajemy h1 +h2 +h3 = 0. Zatem h3 = −h1−h2, a więc d2L(P2)(h, h) =2(− h2
1 + h22 + (h1 + h2)
2)
= 4h2(h1 + h2) przyjmuje zarówno wartości dodatnie jak iujemne. Czyli w P2 funkcja f ma punkt siodłowy na S. Podobnie w P3 i P4 funkcjaf ma punkt siodłowy na S.
44
11 RozmaitościDefinicja 11.1 Niech n ≤ m. Zbiór S ⊂ Rm nazywamy n-wymiarowym płatem jeśliistnieje dyfeomorfizm F : Ω ⊂ Rn → Rm zbioru otwartego Ω na S, tzn. F (Ω) = S.Dyfeomorfizm F nazywa się parametryzacją płata S. Płat 1-wymiarowy nazywamyłukiem otwartym, a płat 2-wymiarowy powierzchnią otwartą.
Przykład 11.1 Zbiór otwarty Ω ⊂ Rn jest płatem n-wymiarowym. W tym przy-padku dyfeomorfizm F : Ω → Rn jest dany przez F (x) = x dla x ∈ Ω. WówczasDF = Id. Odwrotnie każdy płat n-wymiarowy w Rn jest zbiorem otwartym.
Przykład 11.2 Niech g : Ω ⊂ Rn → R będzie funkcją klasy C1. Wówczas wykresfunkcji g czyli zbiór
S = (x, g(x)) : x ∈ Ω ⊂ Rn+1
jest płatem n-wymiarowym w Rn+1. Istotnie jeśli położymy
F (x) = (x, g(x)) dla x ∈ Ω,
to F jest dyfeomorfizmem Ω na S, gdyż DF = (Id,∇g)tr. Odwzorowanie odwrotnejest dane przez F−1(x, y) = x dla x ∈ Ω, y ∈ R takich, że y = g(x).Analogicznie wykres odwzorowania G : Ω ⊂ Rn → Rk czyli zbiór
S = (x,G(x)) : x ∈ Ω ⊂ Rn+k
jest płatem n-wymiarowym w Rn+k.
Przykład 11.3 Niech
S = (x, y) ∈ R2 : x2 + y2 = 1 \ (−1, 0).Wówczas S = F (Ω), gdzie Ω = (−π, π), F (ϕ) = (cos ϕ, sin ϕ) dla ϕ ∈ Ω. ZatemS jest łukiem otwartym. Ciągłość odwzorowania odwrotnego F−1 wynika z Lematu11.1. Zauważmy, że okrąg S1 = x2 + y2 = 1 nie jest łukiem otwartym, gdyż jest onzbiorem zwartym i wobec tego nie może być obrazem zbioru otwartego Ω ⊂ R.Lemat 11.1 Niech T, X będą przestrzeniami metrycznymi przy czym T jest zwartaoraz niech Ω będzie otwartym podzbiorem T . Załóżmy, że odwzorowanie F : Ω → Xrozszerza się do odwzorowania ciągłego F : T → X spełniającego warunek:jeśli F (t) = F (t′) dla t, t′ ∈ T , t 6= t′, to t, t′ 6∈ Ω.Wówczas F jest homeomorfizmem Ω na F (Ω).
Przykład 11.4 Niech
Ω = (ϕ, ψ) : −π < ϕ < π,−π2
< ψ < π2
oraz F : Ω → R3,F (ϕ, ψ) = (cos ψ cos ϕ, cos ψ sin ϕ, sin ψ).
Wówczas F (Ω) = S2 \ (x, 0, z) : x ≤ 0, z ∈ R jest płatem 2-wymiarowym, a Fjest jego przedstawieniem parametrycznym. Ciągłość odwzorowanie odwrotnego F−1
wynika z Lematu 11.1, w którym T = Ω, X = R3, F - przedłużenie F .
45
Zadanie. Wykazać, że powierzchnia walca
S = (x, y, z) : x2 + y2 = 1, 0 < z < 1
jest 2-wymiarowym płatem.
Zauważmy, że jeśli F : Ω → Rm jest przedstawieniem parametrycznym n-wymiaro-wego płata S oraz G : Ω1 → Ω jest dyfeomorfizmem zbioru otwartego Ω1 ⊂ Rn na Ω,to złożenie H = F G jest też przedstawieniem parametrycznym płata S.Zachodzi również twierdzenie odwrotne.
Twierdzenie 11.1 Niech F : Ω ⊂ Rn → Rm oraz H : Ω1 ⊂ Rn → Rm będą parame-tryzacjami płata n-wymiarowego S ⊂ Rm. Wówczas złożenie G = F−1 H : Ω1 → Ωjest dyfeomorfizmem Ω1 na Ω.
Pojęcie płata nie obejmuje ważnych zbiorów, które naturalnie pojawiają się wanalizie. Przykładowo okrąg S1 i sfera S2 nie są płatami. Dlatego wprowadza sięogólniejsze pojęcie rozmaitości.
Definicja 11.2 Niech n ≤ m. Zbiór S ⊂ Rm nazywamy n-wymiarową rozmaitością(klasy Ck), jeśli jest ona sumą pewnej rodziny n-wymiarowych płatów Sj, j ∈ J , któresą zbiorami otwartymi względem S, tzn.
S =⋃j∈J
Sj,
gdzie Sj = F (Ωj), Fj jest dyfeomorfizmem (klasy Ck) zbioru otwartego Ωj ⊂ Rn naSj.Mapą rozmaitości nazywamy parę (F, Ω), gdzie F : Ω → Rm jest dyfeomorfizmemzbioru otwartego Ω ⊂ Rn na zbiór F (Ω) zawarty w S i otwarty względem S.Rodzinę map pokrywających rozmaitość S nazywamy atlasem rozmaitości.
Uwagi.1. Dowolna rozmaitość S ⊂ Rn posiada atlas przeliczalny.2. Jeśli rozmaitość S jest zwarta, to posiada atlas skończony.3. Płat n-wymiarowy jest rozmaitością posiadającą atlas złożony z jednej mapy.
Przykład 11.5 Niech S1 = (x, y) : x2 + y2 = 1 będzie okręgiem. Połóżmy
F1(ϕ) = (cos ϕ, sin ϕ) dla ϕ ∈ Ω1 = (−π, π) ⊂ R,
F2(ϕ) = (cos ϕ, sin ϕ) dla ϕ ∈ Ω2 = (0, 2π) ⊂ R.
Wówczas F1 i F2 są dyfeomorfizmami zbiorów Ω1 i Ω2 odpowiednio na S1 = S1 \(−1, 0) i S2 = S1\(1, 0). Zbiory S1 i S2 są otwarte względem S1 oraz S1 = S1∪S2.Zatem okrąg S1 jest 1-wymiarową rozmaitością posiadającą atlas złożony z dwóchmap.
46
Przykład 11.6 Niech S2 = (x, y, z) : x2+y2+z2 = 1 będzie sferą dwuwymiarową.Połóżmy
Φ±(u, v) =( 2u
1 + u2 + v2,
2v
1 + u2 + v2, ±u2 + v2 − 1
1 + u2 + v2
)dla (u, v) ∈ R2.
Wówczas Φ± jest dyfeomorfizmem R2 na S± = S2 \ (0, 0,±1). Zbiory S+ i S−są otwarte względem S2 oraz S2 = S+ ∪ S−. Zatem okrąg S2 jest 2-wymiarowąrozmaitością posiadającą atlas złożony z dwóch map.
Definicja 11.3 Niech S ⊂ Rm będzie dowolnym niepustym zbiorem oraz x ∈ S.Wektor v ∈ Rm nazywamy wektorem stycznym do S w punkcie x jeśli istnieją ciągpunktów xi ∈ S zbieżny do x oraz ciąg liczb dodatnich ai ∈ R+ takie, że
v = limi→∞
ai(xi − x).
Zbiór wszystkich wektorów stycznych do S w punkcie x nazywamy przestrzenią stycznądo S w x i oznaczamy TxS.Ponadto oznaczamy TS =
⋃x∈S TxS i nazywamy przestrzenią styczną do S.
Zauważmy, że wektor zerowy zawsze należy do TxS. Ponadto, jeśli v ∈ TxS iλ > 0 to λv ∈ TxS.Jeśli S jest zbiorem otwartym w Rm i x ∈ S, to TxS = Rm.
Przykład 11.7 Niech
S = (x, y) : y2 = x3, (x, y) = (0, 0).
Wówczas T(x,y)S = R+.
Uwaga. Jeśli S jest rozmaitością, to TxS nazywamy przestrzenią styczną, a x +TxS hiperpłaszczyzną styczną do S w x.
Twierdzenie 11.2 Niech S ⊂ Rm będzie n-wymiarową rozmaitością oraz x ∈ S.Wówczas TxS jest n-wymiarową podprzestrzenią liniową w Rm, przy czym jeśli (F, Ω)jest mapą obejmującą punkt x oraz t = F−1(x), to
TxS = DF (t)(Rn) = DF (t)h, h ∈ Rn.
Twierdzenie 11.3 Niech l + n = m, G ⊂ Rm będzie zbiorem otwartym, F : G → Rl
odwzorowaniem klasy C1 oraz S = x ∈ G : F (x) = 0 niepustym zbiorem.Jeśli rządDF (x) = l dla x ∈ S, to1. S jest n-wymiarową rozmaitością;2. TxS = v ∈ Rm : DF (x)v = 0 = kerDF (x) dla x ∈ S.Zatem hiperpłaszczyzną styczną do S w x jest zbiór
x ∈ Rm : DF (x)(x− x) = 0.
47
Przykład 11.8 Niech g : Ω ⊂ Rn → R będzie klasy C1 oraz niech S = (x, g(x)) :x ∈ Ω ⊂ Rn+1 będzie wykresem g. Wówczas
F (x) = (x, g(x)) dla x ∈ Ω,
jest F jest dyfeomorfizmem Ω na S. Jeśli x ∈ Ω, y = f (x), to (x, y) ∈ S i przestrzeniąstyczną do S w (x, y) jest
T(x,y)S = (h,∇g(x) · h) : h ∈ Rn,natomiast hiperpłaszczyzną styczną do S w (x, y) jest
(x + h, y +∇g(x)(x) · h) : h ∈ Rn = (x, y +n∑
i=1
∂g
∂xi
(x)(xi − xi))
: x ∈ Rn.
Przykład 11.9 Niech
F (x) = x21 + · · ·+ x2
n+1 − 1 dla x ∈ Rn+1
orazSn = x ∈ Rn+1 : F (x) = 0
będzie sferą n-wymiarową. Wówczas DF (x) = ∇F (x) = 2x dla x ∈ S. Spełnionesą założenia Twierdzenia 11.3 przy l = 1, m = n + 1 i G = Rm. Zatem Sn jestn-wymiarową rozmaitością oraz dla x ∈ Sn,
TxS = x ∈ Rn+1 : x · x = 0.Hiperpłaszczyzną styczną do S w x jest
x ∈ Rn+1 : x · (x− x) = 0 = x ∈ Rn+1 : x · x = 1.
Przykład 11.10 Niech F : R3 → R2 oraz S ⊂ R3 będą zadane przez
F (x, y, z) = (x + y + z − 1, x2 + y2 + z2 − 1),
S = (x, y, z) ∈ R3 : F (x, y, z) = 0.Macierzą różniczki F jest
DF (x, y, z) =
(1 1 12x 2y 2z
).
Ponieważ rządDF (x, y, z) = 2 dla (x, y, z) ∈ S, S jest 3 − 2 = 1-wymiarową rozma-itością. Jeśli p = (a, b, c) ∈ S, to przestrzeń styczna jest prostą
TpS = (x, y, z) : x + y + z = 0, ax + by + cz = 0,natomiast prosta styczna do S w p jest wyznaczona przez (x, y, z) : x + y + z =1, ax + by + cz = 1.
48
12 Całka oznaczona Riemanna.
12.1 Definicja całki oznaczonej Riemanna.
Niech I = [a, b] ⊂ R będzie zwartym przedziałem oraz f : I → R funkcją ograniczoną.Oznaczmy odpowiednio przez m i M kresy dolny i górny funkcji f na przedziale I,tzn.
m = infx∈I
f(x), M = supx∈I
f(x).
W przedziale I wybierzmy rosnący ciąg punktów xiki=0 taki, że a = x0 < x1 <
· · · < xk = b. Oznaczmy ∆i = xi − xi−1 dla i = 1, . . . , k. Liczbę δ = maxi=1,...,k ∆i
nazywamy średnicą podziału Π = x1, . . . , xk przedziału I. Dla i = 1, . . . , k niech
mi = inff(x) : x ∈ [xi−1, xi],Mi = supf(x) : x ∈ [xi−1, xi].
Liczby s i S, gdzie
s = m1∆1 + · · ·+ mk∆k,
S = M1∆1 + · · ·+ Mk∆k,
nazywamy odpowiednio sumą dolną i sumą górną funkcji f odpowiadającą podziałowiΠ. Bezpośrednio z powyższej definicji otrzymujemy nierówności
m(b− a) ≤ s ≤ S ≤ M(b− a).
Rozpatrzmy teraz ciąg podziałów Πn∞n=1 przedziału I. Niech δn będzie średnicąpodziału Πn, a sn i Sn odpowiednio sumą dolną i górną funkcji f odpowiadającąpodziałowi Πn, n = 1, . . .. Ciąg Πn∞n=1 nazywamy normalnym jeśli limn→∞ δn = 0.
Twierdzenie 12.1 Niech f : I → R będzie funkcją ograniczoną. Wówczas dla do-wolnego normalnego ciągu podziałów przedziału I istnieją skończone granice
s = limn→∞
sn, S = limn→∞
Sn
i nie zależą one od wyboru ciągu podziałów.
Definicja 12.1 Liczbę s nazywamy całką dolną funkcji f na przedziale I, a liczbę Snazywamy całką górną funkcji f na przedziale I. Stosujemy też oznaczenia
s =
∫ b
a
f(x)dx = limn→∞
sn, S =
∫ b
a
f(x)dx = limn→∞
Sn.
Definicja 12.2 Niech f : I → R będzie funkcją ograniczoną. Mówimy, że f jestcałkowalna w sensie Riemanna na przedziale I jeśli jej całka dolna na przedziale Ijest równa jej całce górnej funkcji na przedziale I. Wówczas wspólną wartość tychcałek nazywamy całką oznaczoną Riemanna funkcji f na przedziale I i oznaczamy
∫ b
a
f(x)dx.
49
Bezpośrednio z definicji otrzymujemy nierówności
m(b− a) ≤∫ b
a
f(x)dx ≤ M(b− a).
12.2 Warunki całkowalności
Z Twierdzenia 12.1 wynika
Wniosek 12.1 Niech f : I → R będzie funkcją ograniczoną. Jeśli dla dowolnegoε > 0 istnieje podział Π przedziału I taki, że S − s ≤ ε, gdzie s i S są odpowiedniosumami dolną i górną funkcji f dla tego podziału, to f jest całkowalna na przedzialeI.
Twierdzenie 12.2 Niech f : I → R będzie funkcją ciągłą. Wówczas f jest całkowanaw sensie Riemanna.
Twierdzenie 12.3 Niech f : I → R będzie funkcją monotoniczną. Wówczas f jestcałkowana w sensie Riemanna.
Definicja 12.3 Niech A ⊂ R. Mówimy, że A jest zbiorem miary zero jeśli dla do-wolnego ε > 0 istnieje pokrycie zbioru A ciągiem przedziałów otwartych (an, bn)∞n=1
takie, że∞∑
n=1
(bn − an) < ε.
Każdy zbiór przeliczalny ma miarę zero. Zbiór Cantora jest przykładem zbiorunieprzeliczalnego o mierze zero.
Twierdzenie 12.4 (Lebesque’a.) Niech f : I → R będzie funkcją ograniczoną.Wówczas f jest całkowana w sensie Riemanna wtedy i tylko wtedy, gdy zbiór punktównieciągłości f ma miarę zero.
Wniosek 12.21. Jeśli f : I → R jest funkcją ograniczoną, całkowalną w sensie Riemanna, tocałkowalne są też funkcje |f | i f 2.2. Jeśli f, g : I → R są funkcjami ograniczonymi, całkowalnymi w sensie Riemanna,to funkcja f · g też jest całkowalna.
Pojęcie całki oznaczonej można też zdefiniować używając pojęcia ciągu aproksy-macyjnego. Otóż jeśli w każdym odcinku [xi−1, xi] podziału Π wybierzemy dowolniepunkt ξi, to sumę
σ = f(ξ1)∆x1 + · · ·+ f(ξk)∆xk
nazywamy sumą przybliżoną. Oczywiście między sumą dolną, sumą przybliżoną isumą górną zachodzą nierówności
s < σ < S.
Ciągiem aproksymacyjnym nazywamy ciąg sum przybliżonych odpowiadający nor-malnemu ciągowi podziałów.
50
Twierdzenie 12.5 Niech f : I → R będzie funkcją ograniczoną. Jeśli f jest cał-kowalna na przedziale I, to dowolny ciąg aproksymacyjny jest zbieżny do
∫ b
af(x)dx.
Odwrotnie, jeśli istnieje normalny ciąg podziałów taki, że wszystkie odpowiadającemu ciągi aproksymacyjne są zbieżne do tej samej granicy g, to f jest całkowalna oraz∫ b
af(x)dx = g.
12.3 Własności całki oznaczonej
Twierdzenie 12.6 Niech f, g : I → R będą funkcjami całkowalnymi w sensie Rie-manna na przedziale [a, b] oraz C ∈ R. Wówczas1. f + g i Cf są całkowalne oraz
∫ b
a
(f + g)(x)dx =
∫ b
a
f(x)dx +
∫ b
a
g(x)dx,
∫ b
a
(Cf)(x)dx = C
∫ b
a
f(x)dx,
tzn. operacja f 7→ ∫ b
af(x)dx jest liniowa.
2. Jeśli f(x) ≤ g(x) dla x ∈ I, to∫ b
a
f(x)dx ≤∫ b
a
g(x)dx.
3. Jeśli c ∈ (a, b), to całki∫ c
af(x)dx i
∫ b
cf(x)dx istnieją oraz
∫ b
a
f(x)dx =
∫ c
a
f(x)dx +
∫ b
c
f(x)dx.
4. Funkcja |f(x)| jest całkowalna oraz
∣∣∣∫ b
a
f(x)dx∣∣∣ ≤
∫ b
a
|f(x)|dx.
5. Jeśli f i g są funkcjami ciągłymi na [a, b], f(x) ≤ g(x) dla x ∈ [a, b] oraz f (x) <g(x) dla pewnego x ∈ [a, b], to
∫ b
a
f(x)dx <
∫ b
a
g(x)dx.
Twierdzenie 12.7 (O wartości średniej.) Jeśli f jest funkcją ciągłą w przedziale I,to istnieje punkt x ∈ I taki, że
f (x) =1
b− a
∫ b
a
f(x)dx.
51
12.4 Podstawowy wzór rachunku całkowego
Twierdzenie 12.8 Niech f : I → R będzie funkcją całkowalną w sensie Riemanna.Połóżmy
F (x) =
∫ x
a
f(x)dx dla x ∈ I.
Wówczas F jest funkcją ciągłą na I. Ponadto F ma pochodną F ′(x) w każdym punkciex ciągłości funkcji f oraz F ′(x) = f(x).
Funkcję F z powyższego twierdzenia nazywamy funkcją pierwotną dla f .
Wniosek 12.3 Jeśli f : I → R jest ciągła oraz F jest jej funkcją pierwotną, to∫ b
a
f(x)dx = F (b)− F (a).
Z powyższego wniosku oraz twierdzeń o całkowaniu przez części i przez podsta-wienie dostajemy
Twierdzenie 12.9 Jeśli funkcje f i g mają ciągłe pochodne w przedziale I, to∫ b
a
f(x)g′(x)dx = f(b)g(b)− f(a)g(a)−∫ b
a
f ′(x)g(x)dx.
Twierdzenie 12.10 Niech u : [a, b] → [α, β] oraz f : [α, β] → R będą funkcjamiciągłymi. Jeśli u ma ciągłą pochodną w przedziale [a, b], to
∫ b
a
f(u(x)
)u′(x)dx =
∫ u(b)
u(a)
f(u)du.
12.5 Zastosowania geometryczne całki oznaczonej
Całka oznaczona znajduje zastosowanie do obliczania pól obszarów na płaszczyźnie iobjętości obszarów w przestrzeni.
Wniosek 12.4 Niech f : I → R będzie funkcją ciągłą nieujemną. Wówczas poleobszaru D między wykresem funkcji y = f(x), osią OX i prostymi x = a oraz x = bwyraża się wzorem
|D| =∫ b
a
f(x)dx.
Wniosek 12.5 Niech f, g : I → R będą funkcjami ciągłymi takimi, że f(x) ≤ g(x)dla x ∈ I. Wówczas pole obszaru D między wykresami funkcji y = f(x), y = g(x) iprostymi x = a oraz x = b wyraża się wzorem
|D| =∫ b
a
(f(x)− g(x)
)dx.
52
Całka oznaczona służy do obliczania objętość brył obrotowych.
Wniosek 12.6 Niech f : I → R będzie funkcją ciągłą nieujemną. Wówczas objętośćbryły V powstałej w wyniki obrotu obszaru ograniczonego wykresem funkcji y = f(x)i prostymi OX, x = a oraz x = b dookoła osi OX wyraża się wzorem
|V | = π
∫ b
a
f 2(x)dx.
Załóżmy teraz, że dane są funkcje ciągłe x = x(t) i y = y(t) określone dla t ∈ I.Niech Π = a = t0 < t1, . . . , tk−1 < tk = b będzie podziałem odcinka I. Wówczaspunkty Ai =
(x(ti), y(ti)
), i = 0, 1, . . . , k, leżą na krzywej γ = (x, y) ∈ R2 : x =
x(t), y = y(t) dla t ∈ I. Długość łamanej A0A1 · · ·Ak−1Ak dana jest wzorem
d =k∑
i=1
√(x(ti)− x(ti−1)
)2+
(y(ti)− y(ti−1)
)2.
Dla normalnego ciągu Πn podziałów odcinka I oznaczmy przez dn długość łamanejodpowiadającej podziałowi Πn. Jeśli istnieje granica limn→∞ dn i nie zależy ona odwyboru normalnego ciągu podziałów, to krzywą γ nazywamy prostowalną, a granicę|γ| = limn→∞ dn nazywamy długością γ.
Wniosek 12.7 Niech x, y : I → R będą funkcjami klasy C1 na odcinku x ∈ I.Wówczas krzywa γ = (x, y) ∈ R2 : x = x(t), y = y(t) dla t ∈ I jest prostowalna, ajej długość wyraża się wzorem
|γ| =∫ b
a
√(x′(t)
)2+
(y′(t)
)2dx.
12.6 Całki niewłaściwe
Całkę oznaczoną Riemanna została zdefiniowana dla funkcji ograniczonej, określonejna odcinku zwartym I = [a, b]. Często zachodzi potrzeba zdefiniowania pojęcia całkidla funkcji określonej na przedziale niezwartym, lub też funkcji nieograniczonej. Roz-ważmy sytuację, że funkcja f jest określona na przedziale prawostronnie otwartym[a, b), gdzie a < b (b może być równe ∞). jeśli dla dowolnego β < b istnieje całkaRiemanna
I(β) =
∫ β
a
f(x)dx
oraz istnieje granica (skończona lub nieskończona) limβ→b I(β), to tą granicę nazy-wamy całką niewłaściwą funkcji f na przedziale [a, b).Analogicznie określamy całkę niewłaściwą na przedziale lewostronnie otwartym (a, b].Można również zdefiniować całkę na przedziale otwartym (a, b). W tym celu wybie-ramy dowolny punkt c ∈ (a, b) i definiujemy
∫ b
a
f(x)dx =
∫ c
a
f(x)dx +
∫ b
c
f(x)dx
53
o ile działanie dodawania w tym wzorze jest wykonalne, czyli nie jest to wyrażenietypu ∞−∞.
Całki niewłaściwe są przydatne w badaniu zbieżności szeregów liczbowych.
Twierdzenie 12.11 (Kryterium całkowe zbieżności szeregów.) Niech f : [1,∞) →R będzie funkcją ciągłą, nieujemną i nierosnącą. Wówczas szereg
∑∞n=1 f(n) jest
zbieżny, wtedy i tylko wtedy, gdy∫ ∞
1
f(x)dx < ∞.
Przykład 12.1 Niech f(x) = 1xα dla x > 0, gdzie α > 0. Wówczas f jest funkcją
ciągłą na (0,∞), nieujemną i malejącą. Dla α > 1 mamy∫ ∞
1
f(x)dx = limb→∞
∫ b
1
1
xαdx = lim
b→∞x−α+1
−a + 1
∣∣∣∣x=b
x=1
= limb→∞
b−α+1 − 1
−α + 1=
1
1− α.
Dla α = 1 mamy∫ ∞
1
f(x)dx = limb→∞
∫ b
1
1
xdx = lim
b→∞ln x
∣∣∣∣x=b
x=1
= limb→∞
ln b = ∞.
Podobnie dla 0 < α < 1,∫∞
1f(x)dx = ∞.
Zatem szereg∑∞
n=11
nα jest zbieżny dla α > 1 i rozbieżny dla 0 < α ≤ 1.
12.7 Przechodzenie do granicy pod znakiem całki
Niech fn będzie ciągiem funkcji całkowalnych w przedziale zwartym I = [a, b] zbież-nym do funkcji f . Interesuje nas pytanie czy funkcja f jest całkowalna i czy ciągliczbowy
∫ b
afn(x)dx jest zbieżny do
∫ b
af(x)dx? Jak pokazuje następujący przykład
w ogólnym przypadku odpowiedź na to pytanie jest negatywna.
Przykład 12.2 Niech
fn(x) = 2nxe−nx2
dla x > 0.
Wówczas limn→∞ fn(x) = 0 dla dowolnego x > 0. Tym nie mniej
limn→∞
∫ 1
0
fn(x)dx = limn→∞
−e−nx2
∣∣∣∣x=1
x=0
= limn→∞
(1− e−n
)= 1.
Powyższy przykład pokazuje, że ze zbieżności punktowej ciągu funkcji nie możnawnioskować o zbieżności ciągu całek z tych funkcji.
Twierdzenie 12.12 Niech fn∞n=1 będzie ciągiem funkcji całkowalnych na przedzialeI zbieżnym jednostajnie na I do funkcji f . Wówczas f jest całkowalna na I oraz dladowolnego x ∈ I ciąg funkcji ϕn(x) =
∫ x
xfn(t)dt jest zbieżny jednostajnie do funkcji
ϕ(x) =∫ x
xf(t)dt na I. W szczególności limn→∞
∫ b
afn(t)dt =
∫ b
af(t)dt.
54
Wniosek 12.8 Niech fn∞n=1 będzie ciągiem funkcji całkowalnych na przedziale Ioraz szereg
∑∞n=1 fn jest zbieżnym jednostajnie na I do funkcji S na I. Wówczas S
jest całkowalna na I oraz dla dowolnego x ∈ I szereg∑∞
n=1
∫ x
xfn(t)dt jest zbieżny
jednostajnie do funkcji ϕ(x) =∫ x
xS(t)dt na I.
Przykład 12.3 Rozważmy szereg∑∞
n=1 nxn−1. Z kryterium d’Alamberta wynika,że szereg ten jest zbieżny dla x ∈ (−1, 1). Oznaczmy jego sumę przez S(x). Ponieważszereg ten jest zbieżny jednostajnie na dowolnym domkniętym podprzedziale [a, b] ⊂(−1, 1), więc korzystając z Wniosku 12.7 dostajemy
∫ x
0
S(t)dt =
∫ x
0
∞∑n=1
ntn−1dt =∞∑
n=1
∫ x
0
nxn−1dt =∞∑
n=1
xn =x
1− x.
Stąd
S(x) =
(x
1− x
)′=
1
(1− x)2dla x ∈ (−1, 1).
12.8 Całki zależne od parametru
Niech U ⊂ R2 będzie zbiorem otwartym, [a, b]× [c, d] ⊂ U oraz f : U → R. Załóżmy,że dla każdego y ∈ [c, d] istnieje całka
∫ b
a
f(x, y)dx =: g(y).
Interesuje nas pytanie czy funkcja g jest różniczkowalna?
Twierdzenie 12.13 Jeśli w prostokącie P = [a, b]× [c, d] funkcja f jest ciągła i maciągłą pochodną cząstkową ∂f
∂y, to funkcja
g(y) =
∫ b
a
f(x, y)dx
jest różniczkowalna dla y ∈ (c, d) oraz
g′(y) =
∫ b
a
∂f
∂y(x, y)dx dla y ∈ (c, d).
Całki zależne od parametru umożliwiają zdefiniowanie wielu nowych funkcji. Jednąz nich, niezwykle ważną w Analizie, jest funkcja Γ-Eulera. Określamy ją wzorem
Γ(x) =
∫ ∞
0
tx−1e−tdt dla x > 0.
Całka w tym wzorze jest całką niewłaściwą. Można wykazać, że jest ona zbieżna dlax > 0. Korzystając ze wzory na całkowanie przez części dostajemy wzór
Γ(x + 1) = xΓ(x) dla x > 0.
55
Ponieważ Γ(1) =∫∞0
e−tdt = 1 wnioskujemy stąd, że Γ(n) = (n − 1)! dla n ∈ N.Zatem funkcja Γ jest przedłużeniem funkcji „silnia” na argumenty dodatnie. Okazujesię, że można ją też zdefiniować na płaszczyźnie zespolonej.
Inną ważną funkcją definiowaną przy pomocy całki z parametrami jest funkcjaB-Eulera.
B(x, y) =
∫ 1
0
tx−1(1− t)y−1dt dla x > 0, y > 0.
Związek pomiędzy funkcjami Γ i B wyraża wzór
B(x, y) =Γ(x)Γ(y)
Γ(x + y)dla x > 0, y > 0.
Wzór ten udowodnimy po nauczeniu się całkowania funkcji wielu zmiennych.Zauważmy, że kładąc t = sin2 ϕ, mamy 1− t = cos2 ϕ, dt = 2 sin ϕ cos ϕ. Zatem
2
∫ π/2
0
sin2x−1 ϕ · cos2y−1 ϕdϕ = B(x, y).
56
13 Całki wielokrotne
13.1 Definicja i własności całki n-krotnej na przedziale
Przypomnijmy, że przedziałem domkniętym lub kostką domkniętą w przestrzeni n-wymiarowej Rn nazywamy zbiór
P = P (a, b) = x ∈ Rn : ai ≤ xi ≤ bi, i = 1, . . . , n, gdzie a < b.
Średnicą przedziału P nazywamy liczbę
δ = δ(P ) =√
(b1 − a1)2 + · · ·+ (bn − an)2.
n-wymiarową miarą lub objętością przedziału P nazywamy iloczyn
|P | = (b1 − a1) · · · (bn − an).
Podziałem przedziału domkniętego P nazywamy rodzinę Π = P1, . . . , Pk przedzia-łów domkniętych Pi o rozłącznych wnętrzach
intPi ∩ intPj dla i 6= j
taką, że
P =k⋃
i=1
Pi.
Jeśli δi jest średnicą przedziału Pi w podziale Π przedziału P , to δ = maxi=1,...,k δi
nazywamy średnicą podziału Π. Ciąg podziałów Πj∞j=1 przedziału P nazywamynormalnym jeśli limj→∞ δj = 0 gdzie δj jest średnicą podziału Πj.
Niech f : P → R funkcją ograniczoną zdefiniowaną na przedziale domkniętym P ,a Π = P1, . . . , Pk podziałem tego przedziału. Oznaczmy odpowiednio przez m i Mkresy dolny i górny funkcji f na przedziale P , tzn.
m = infx∈P
f(x), M = supx∈P
f(x).
Dla i = 1, . . . , k niech
mi = inff(x) : x ∈ Pi,Mi = supf(x) : x ∈ Pi.
Liczby s i S, gdzie
s = m1|P1|+ · · ·+ mk|Pk|,S = M1|P1|+ · · ·+ Mk|Pk|,
nazywamy odpowiednio sumą dolną i sumą górną funkcji f odpowiadającą podziałowiΠ. Bezpośrednio z powyższej definicji otrzymujemy nierówności
m(b− a)1 ≤ s ≤ S ≤ M(b− a)1,
gdzie (b− a)1 = (b1 − a1) · · · (bn − an).
57
Rozpatrzmy teraz normalny ciąg podziałów Πj∞j=1 przedziału P . Niech δj będzieśrednicą podziału Πj, a sj i Sj odpowiednio sumą dolną i górną funkcji f odpowia-dającą podziałowi Πj, j = 1, 2, . . ..
Lemat 13.1 Niech f : P → R będzie funkcją ograniczoną. Wówczas dla dowolnegonormalnego ciągu podziałów przedziału P istnieją skończone granice
s = limj→∞
sj, S = limj→∞
Sj
i nie zależą one od wyboru normalnego ciągu podziałów.
Definicja 13.1 Liczbę s nazywamy całką dolną funkcji f na przedziale P , a liczbęS nazywamy całką górną funkcji f na przedziale P . Stosujemy też oznaczenia
s =
∫ b
a
f(x)dx = limj→∞
sj, S =
∫ b
a
f(x)dx = limj→∞
Sj.
Definicja 13.2 Niech f : P → R będzie funkcją ograniczoną. Mówimy, że f jestcałkowalna w sensie Riemanna na przedziale P jeśli jej całka dolna na przedziale Pjest równa jej całce górnej funkcji na przedziale P . Wówczas wspólną wartość tychcałek nazywamy całką oznaczoną Riemanna funkcji f na przedziale P i oznaczamy
∫
P
f(x)dx =
∫ b1
a1
· · ·∫ bn
an
f(x1, . . . , xn)dx1 . . . dxn.
Własności całki Riemanna.1. Jeśli f : P → R jest funkcją ciągłą na przedziale domkniętym P , to f jest
całkowalna na P .2. Jeśli f, g : P → R są całkowalne na P i c ∈ R, to f + g i cf są całkowalne na
P oraz ∫
P
(f(x) + g(x)
)dx =
∫
P
f(x)dx +
∫
P
g(x)dx,∫
P
c · f(x)dx = c ·∫
P
f(x)dx.
Definicja 13.3 Niech Π = P1, . . . , Pk będzie podziałem przedziału P oraz niechξi ∈ Pi dla i = 1, . . . , k. Sumę
σ = f(ξ1)|P1|+ · · ·+ f(ξk)|Pk|nazywamy sumą przybliżoną. Ciąg sum przybliżonych dla normalnego ciągu podzia-łów nazywamy ciągiem aproksymacyjnym.
Lemat 13.2 Funkcja f : P → R jest całkowalna na przedziale P wtedy i tylkowtedy, gdy istnieje normalny ciąg podziałów taki, że wszystkie ciągi aproksymacyjnesą zbieżne do tej samej granicy.
Interpretacja geometryczna całki podwójnej.
Niech P = [a, b]× [c, d] ⊂ R2 oraz niech f : P → R będzie funkcją ciągłą na P .Jeśli f ≥ 0, to
∫P
f(x, y)dxdy jest objętością bryły G, gdzie
G = (x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f(x, y).
58
13.2 Całka iterowana
Obliczanie całki wielokrotnej bezpośrednio z definicje jest zadaniem trudnym i prak-tycznie niewykonalnym. Przykładowo zadanie obliczenia całki
∫∫
[0,1]2xydxdy
sprowadza się do znalezienia granicy przy k →∞ podwójnej sumy
k∑i,j=1
i · jk2
· 1
k2=
k(k + 1)
2k2· k(k + 1)
2k2→ 1
4.
Okazuje się, że całkę wielokrotną można sprowadzić do całki iterowanej, którą z koleimożna obliczyć korzystając z całki nieoznaczonej jednej zmiennej. Pojęcie całki itero-wanej wprowadzimy w przypadku funkcji dwóch zmiennych. W ogólnym przypadkupojęcie to można naturalnie uogólnić.
Definicja 13.4 Niech P = [a, b] × [c, d] ⊂ R2 oraz niech f : P → R będzie funkcjąograniczoną. Załóżmy, że dla każdego ustalonego y ∈ [c, d] istnieje całka oznaczonaRiemanna
∫ b
af(x, y)dx. Jeśli funkcja
[c, d] 3 y 7→ g(y) =
∫ b
a
f(x, y)dx
jest całkowalna w sensie Riemanna, to jej całkę na przedziale [c, d] nazywamy całkąiterowaną funkcji f i oznaczamy
∫ d
c
[ ∫ b
a
f(x, y)dx]dy =
∫ d
c
g(y)dy.
Analogicznie definiujemy całkę iterowaną∫ b
a
[ ∫ d
c
f(x, y)dy]dx.
W przypadku funkcji n zmiennych definiuje się n! całek iterowanych.Istnieją przykłady funkcji, dla których istnieją całki iterowane lecz nie istnieje
całka podwójna. Tym nie mniej zachodzi
Twierdzenie 13.1 (Fubiniego.) Niech P = [a, b]× [c, d] ⊂ R2 oraz niech f : P → Rbędzie funkcją ciągłą. Wówczas istnieją całki iterowane i są równe całce podwójnej
∫ d
c
[ ∫ b
a
f(x, y)dx]dy =
∫ b
a
[ ∫ d
c
f(x, y)dy]dx =
∫∫
P
f(x, y)dxdy.
59
13.3 Całka wielokrotna na zbiorze ograniczonym
Pojęcie całki wielokrotnej można uogólnić na funkcje określone na zbiorach ograni-czonych.
Definicja 13.5 Niech D ⊂ Rn będzie zbiorem ograniczonym oraz f : P → R funkcjąograniczoną. Niech P będzie przedziałem zawierającym zbiór D. Wówczas określamy
∫
D
f(x)dx =
∫
P
f0(x)dx,
gdzie
f0(x) =
f(x) dla x ∈ D,
0 dla x 6∈ D.
Całki wielokrotne na dobrych zbiorach można wyznaczyć korzystając z całekiterowanych.
Definicja 13.6 Zbiór D ⊂ R2 nazywamy normalnym względem osi OX jeśli jest onpostaci
D = (x, y) ∈ R2 : a ≤ x ≤ b, ϕ(x) ≤ y ≤ ψ(x),gdzie ϕ, ψ są funkcjami ciągłymi na [a, b] oraz ϕ(x) ≤ ψ(x) dla x ∈ [a, b].Analogicznie D ⊂ R2 nazywamy normalnego względem osi OY jeśli jest on postaci
D = (x, y) ∈ R2 : c ≤ y ≤ d, φ(y) ≤ x ≤ χ(x),
gdzie φ, χ są funkcjami ciągłymi na [a, b] oraz φ(y) ≤ χ(y) dla y ∈ [c, d].
Twierdzenie 13.2 Jeśli f : D → R będzie funkcją ciągłą na zbiorze D ⊂ R2 nor-malnym względem osi OX, to
∫∫
D
f(x, y)dxdy =
∫ b
a
[ ∫ ψ(x)
ϕ(x)
f(x, y)dy]dx.
Analogicznie jeśli f : D → R będzie funkcją ciągłą na zbiorze D ⊂ R2 normalnymwzględem osi OY , to
∫∫
D
f(x, y)dxdy =
∫ d
c
[ ∫ χ(y)
φ(y)
f(x, y)dx]dy.
Zbiór D ⊂ R2 będący skończoną sumą zbiorów normalnych względem osi OX lubOY o rozłącznych wnętrzach nazywamy zbiorem regularnym.Jeśli D = D1 ∪ · · · ∪Dk jest zbiorem regularnym, to
∫∫
D
f(x, y)dxdy =k∑
i=1
∫∫
Di
f(x, y)dxdy
60
Analogicznie definiujemy zbiory regularne w R3. Przykładowo zbiór D ⊂ R3
nazywamy normalnym względem osi OX i płaszczyzny OXY jeśli jest on postaci
D = (x, y, z) ∈ R3 : a ≤ x ≤ b, ϕ(x) ≤ y ≤ ψ(x), g(x, y) ≤ z ≤ h(x, y).
Wówczas dla funkcji f ciągłej na D mamy∫∫∫
D
f(x, y, z) dxdydz =
∫ b
a
( ∫ ψ(x)
ϕ(x)
( ∫ h(x,y)
g(x,y)
f(x, y, z)dz)dy
)dx.
13.4 Zastosowania całek w geometrii
Pole obszaru płaskiego, regularnego D ⊂ R2 zadane jest wzorem
|D| =∫∫
D
1 dxdy.
Środek ciężkości zbioru regularnego D ⊂ R2 ma współrzędne (ξ, η), gdzie
ξ =1
|D|∫∫
D
x dxdy, η =1
|D|∫∫
D
y dxdy.
Objętość bryły V ⊂ R3 zdefiniowanej jako
V = (x, y, z) ∈ R3 : g(x, y) ≤ z ≤ h(x, y), (x, y) ∈ D,
gdzie D ⊂ R2 jest zbiorem regularnym, g i h funkcjami ciągłymi na D wyraża sięwzorem
|V | =∫∫∫
V
1 dxdydz =
∫∫
D
(h(x, y)− g(x, y)
)dxdy.
Niech D ⊂ (x, y) : y > 0 będzie zbiorem regularnym oraz V bryłą powstałąprzez obrót zbioru D wokół osi OX. Wówczas
|V | = 2π
∫∫
D
y dxdy.
Reguła Guldina. Objętość bryły obrotowej V powstałej w wyniku obrotu zbiorunormalnego D ⊂ (x, y) : y > 0 dookoła osi OX jest równa iloczynowi pola zbioruD przez drogę, którą zatacza środek ciężkości zbioru D podczas tego obrotu, tzn.
|V | = 2πη|D|.
Przykład 13.1 Niech T będzie torusem powstałym w wyniku obrotu koła K =(x, y, z) : (x − a)2 + z2 ≤ r2, y = 0, 0 < r ≤ a, dookoła osi OZ. Ponieważ punktciężkości koła K ma współrzędne (a, 0, 0), a jego pole wynosi πr2, więc z regułyGuldina dostajemy objętość torusa T ,
|T | = 2π · a · πr2 = 2π2ar2.
61
Twierdzenie 13.3 Pole powierzchni wykresu funkcji. Niech D ⊂ R2 będzie zbioremregularnym, a f : D → R funkcją klasy C1. Wówczas pole powierzchni wykresufunkcji f , t.j. pole powierzchni zbioru
S = (x, y, z) ∈ R3 : z = f(x, y), (x, y) ∈ Dwyraża się wzorem
|S| =∫∫
D
√1 +
(∂f(x, y)
∂x
)2
+
(∂f(x, y)
∂y
)2
dxdy.
13.5 Zamiana zmiennych w całce wielokrotnej
Dla funkcji jednej zmiennej zachodzi wzór na całkowanie przez podstawienie.Mianowicie, jeśli ϕ : [a, b] → [α, β] oraz f : [α, β] → R są funkcjami ciągłymi orazϕ ma ciągłą pochodną w przedziale [a, b], to
∫ b
a
f(ϕ(x)
)ϕ′(x) dx =
∫ ϕ(b)
ϕ(a)
f(y) dy.
Uogólnimy teraz tez wzór na przypadek całek wielokrotnych.
Twierdzenie 13.4 Niech ∆ i D będą regularnymi zbiorami w Rn oraz niechΦ = (ϕ1, . . . , ϕn) : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem klasyC1 zbioru ∆ na D (dyfeomorfizmem). Jeśli f : D → R jest funkcją ciągłą, to∫
D
f(y) dy =
∫
∆
f(Φ(x)
)|JΦ(x)| dx,
gdzie JΦ = det D(ϕ1,...,ϕn)D(x1,...,xn)
jest jakobianem odwzorowania Φ.
Dowód Twierdzenia 13.4 przeprowadzimy dla n = 2. Wówczas można je sformu-łować następująco.
Twierdzenie 13.5 Niech ∆ i D będą regularnymi zbiorami w R2 oraz niechΦ = (ϕ, ψ) : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem zbioru ∆na D, przy czym ϕ, ψ są klasy C1, ϕ(u, v) = x, ψ(u, v) = y dla (u, v) ∈ ∆.Jeśli f : D → R jest funkcją ciągłą, to
∫∫
D
f(x, y) dxdy =
∫∫
∆
f(ϕ(u, v), ψ(u, v)
)∣∣∣∣ detD(ϕ, ψ)
D(u, v)(u, v)
∣∣∣∣ dudv.
W wymiarze n = 3 Twierdzenie 13.4 przyjmuje postać.
Twierdzenie 13.6 Niech ∆ i D będą regularnymi zbiorami w R3 oraz niechΦ = (ϕ, ψ, χ) : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem zbioru∆ na D, przy czym ϕ, ψ, χ są klasy C1, ϕ(u, v, w) = x, ψ(u, v, w) = y, χ(u, v, w) = zdla (u, v, w) ∈ ∆. Jeśli f : D → R jest funkcją ciągłą, to∫∫∫
D
f(x, y, z) dxdydz
=
∫∫∫
∆
f(ϕ(u, v, w), ψ(u, v, w), χ(u, v, w)
)∣∣∣∣ detD(ϕ, ψ, χ)
D(u, v, w)(u, v, w)
∣∣∣∣ dudvdw
62
13.6 Przykłady
Przykład 13.2 Niech ∆ i D będą regularnymi zbiorami w Rn oraz niechΦ : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem klasy C1 zbioru ∆na D. Niech f(x) = 1 dla x ∈ D. Wówczas
|D| =∫
D
1 dy =
∫
∆
|JΦ(x)| dx.
Liniowa zamiana zmiennych.Niech Φ : ∆ → D będzie wzajemnie jednoznacznym odwzorowaniem liniowym,
tzn. Φ(x) = Ax dla pewnej nieosobliwej macierzy A. Wówczas macierzą różniczki Φjest A czyli JΦ(x) = det A. Zatem dla funkcji f ciągłej na D mamy
∫
D
f(y) dy = | det A|∫
∆
f(Ax) dx.
W szczególności, biorąc f ≡ 1 dostajemy
|D| = | det A| · |∆|.Czyli odwzorowanie liniowe zmienia objętość obszaru proporcjonalnie do wyznacznikamacierzy A.
Współrzędne biegunoweJeśli obszar D ⊂ R2 jest kołem (lub wycinkiem koła, lub pierścieniem), to do
obliczenia całki po D stosujemy współrzędne biegunowe: x = r cos ϕ, y = r sin ϕ.Wówczas odwzorowanie (r, ϕ) → (x, y) przekształca prostokąt ∆ = [0, R]× [0, 2π] nakoło D = K(0, R) = x2 + y2 ≤ R2. Jest to odwzorowanie wzajemnie jednoznacznez Int∆ na IntD \ (x, y) : x ≥ 0, y = 0. Ponieważ ∆ \ Int∆ ma miarę zero możemystosować Twierdzenie 13.5.
Przykład 13.3 Policzymy całkę∫∫
D
dxdy√x2 + y2
, gdzie D = x2 + y2 ≤ 1.
Ponieważ funkcja podcałkowa jest nieograniczona w zerze powyższa całka jest całkąniewłaściwą, tzn. trzeba policzyć granicę
lima→0
∫∫
Da
dxdy√x2 + y2
, gdzie Da = a2 ≤ x2 + y2 ≤ 1, a > 0.
Stosując współrzędne biegunowe dostajemy
lima→0
∫∫
Da
dxdy√x2 + y2
= lima→0
∫∫
[a,1]×[0,2π]
1
r· r drdϕ
= lima→0
∫ 1
a
( ∫ 2π
0
1dϕ)
dr = lima→0
2π(1− a) = 2π.
63
Przykład 13.4 Policzymy całkę
I =
∫∫
R2
e−x2−y2
dxdy.
Ponieważ całkujemy po obszarze nieograniczonym powyższa całka jest całką niewła-ściwą, tzn. trzeba policzyć granicę
I = limR→∞
∫∫
DR
e−x2−y2
dxdy, gdzie DR = x2 + y2 ≤ R2, R > 0.
Stosując współrzędne biegunowe dostajemy
limR→∞
∫∫
DR
e−x2−y2
dxdy
= limR→∞
∫∫
[0,R]×[0,2π]
e−r2 · r drdϕ = limR→∞
∫ R
0
( ∫ 2π
0
e−r2
r dϕ)dr
= limR→∞
∫ R
0
2πre−r2
dr = limR→∞
−πe−r2∣∣∣r=R
r=0
= limR→∞
(π − πe−R2)
= π.
Z drugiej strony na mocy twierdzenia Fubiniego
I =
∫∫
R2
e−x2−y2
dxdy =
∫
R
( ∫
Re−x2
dx
)e−y2
dy
=
∫
Re−x2
dx ·∫
Re−y2
dy.
Zatem wykazaliśmy ważny wzór∫
Re−x2
dx =√
π.
Związek pomiędzy funkcjami Γ i B-Eulera.
Przypomnijmy, że funkcje Γ i B-Eulera były określone dla x > 0, y > 0 wzorami
Γ(x) =
∫ ∞
0
tx−1e−t dt, B(x, y) =
∫ 1
0
tx−1(1− t)y−1 dt.
Wyprowadzimy teraz związek pomiędzy tymi funkcjami. Korzystając z twierdzeniaFubiniego mamy
Γ(x)Γ(y) =
∫ ∞
0
tx−1e−t dt ·∫ ∞
0
sy−1e−s ds =
∫ ∞
0
∫ ∞
0
tx−1sy−1e−t−s dtds.
64
W całce podwójnej dokonajmy zamiany zmiennych t = u, t + s = v. Wówczas(t, s) ∈ R+ × R+ wtedy i tylko wtedy, gdy v ∈ R+, 0 ≤ u ≤ v oraz dtds = dudv.Zatem ∫ ∞
0
∫ ∞
0
tx−1sy−1e−t−s dtds =
∫ ∞
0
∫ v
0
ux−1(v − u)y−1e−v dudv
=
∫ ∞
0
( ∫ v
0
ux−1(v − u)y−1 du
)e−v dv.
Dokonajmy teraz zamiany zmiennych w całce wewnętrznej u = tv, 0 ≤ t ≤ 1, du =vdt,
∫ v
0
ux−1(v − u)y−1 du =
∫ 1
0
(tv)x−1(v − tv)y−1v dt
= vx+y−1
∫ 1
0
tx−1(1− t)y−1 dt = vx+y−1B(x, y).
Zatem
Γ(x)Γ(y) =
∫ ∞
0
vx+y−1B(x, y)e−vdv = B(x, y)Γ(x + y).
Współrzędne walcowe.Jeśli obszar V ⊂ R3 jest częścią walca lub stożka, to do liczenia całek wygodnie
jest stosować współrzędne walcowe. x = r cos ϕ, y = r sin ϕ, z = z. Wówczas
|J(r, ϕ, z)| =∣∣∣ det
cos ϕ sin ϕ 0−r sin ϕ r cos ϕ 0
0 0 1
∣∣∣ = r.
Przykład 13.5 Policzymy całkę∫∫∫
V
(x2 + y2) dxdydz,
gdzie V jest stożkiem ściętym V = (x, y, z) : x2 + y2 ≤ z2, 0 < R1 ≤ z ≤ R2.Przeciwobrazem V przy współrzędnych walcowych jest ∆ = (r, ϕ, z) : 0 ≤ r ≤z, 0 ≤ ϕ ≤ 2π, R1 ≤ z ≤ R2. Zatem
∫∫∫
V
(x2 + y2) dxdydz =
∫∫∫
∆
r2 · r drdϕdz =
∫ R2
R1
(∫ 2π
0
( ∫ z
0
r3 dr
)dϕ
)dz
=
∫ R2
R1
( ∫ 2π
0
z4
4dϕ
)dz =
∫ R2
R1
πz4
2dz =
π
10
(R5
2 −R51
).
Współrzędne sferyczne.Jeśli obszar V ⊂ R3 jest częścią kuli, to do liczenia całek stosujemy współrzędne
sferyczne x = r cos ϕ cos ψ, y = r sin ϕ cos ψ, z = r sin ψ. Wówczas
|J(r, ϕ, ψ)| =∣∣∣ det
cos ϕ cos ψ sin ϕ cos ψ sin ψ−r sin ϕ cos ψ r cos ϕ cos ψ 0−r cos ϕ sin ψ −r sin ϕ sin ψ r cos ψ
∣∣∣ = r2 cos ψ.
65
Przykład 13.6 Policzymy objętość kuli B(R) o promieniu R,
|B(R)| =∫∫∫
B(R)
1 dxdydz.
Przeciwobrazem B(R) przy współrzędnych sferycznych jest ∆ = (r, ϕ, ψ) : 0 ≤ r ≤R, 0 ≤ ϕ ≤ 2π,−π/2 ≤ ψ ≤ π/2. Zatem
|B(R)| =∫∫∫
∆
r2 cos ψ drdϕdψ =
∫ R
0
r2 dr ·∫ 2π
0
dϕ ·∫ π/2
−π/2
cos ψ dψ
=R3
3· 2π · 2 =
4
3R3.
Zauważmy, że przekształcenie liniowe x = ax′ y = by′, z = cz′ przekształca elipsoidęE = x2
a2 + y2
b2+ z2
c2≤ 1 na kulę B = x′2 + y′2 + z′2 ≤ 1 oraz dxdydz = abcdx′dy′dz′.
Zatem |E| = 43πabc.
Pole krzywoliniowego prostokąta.
Przykład 13.7 Obliczymy pole krzywoliniowego prostokąta D ograniczonego para-bolami y2 = px, y2 = qx, x2 = ay i x2 = by, gdzie 0 < p < q, 0 < a < b.Zauważmy, że dowolny punkt (x, y) ∈ D jest jednoznacznie wyznaczony przez parę(u, v) ∈ ∆ = [p, q] × [a, b], jako przecięcie parabol y2 = ux i x2 = vy, mianowiciex =
3√
uv2, y =3√
u2v. Zatem mamy dyfeomorfizm
∆ 3 (u, v) → Φ(u, v) =( 3√
uv2,3√
u2v) ∈ D.
Liczymy moduł jakobianu JΦ,
|JΦ(u, v)| =∣∣∣ det
(13u−2/3v2/3 2
3u1/3v−1/3
23u−1/3v1/3 1
3u2/3v−2/3
) ∣∣∣ =1
3.
Zatem|D| =
∫∫
D
dxdy =
∫∫
∆
1
3dudv =
1
3(q − p)(b− a).
Analogicznie obliczamy pola krzywoliniowych prostokątów ograniczonych przezodcinki hiperbol, parabol, prostych itp.
66
14 Orientacja
14.1 Orientacja przestrzeni
Niech (e1, . . . , en), gdzie ei = (0, . . . , 1, . . . , 0), i = 1, . . . , n, będzie bazą standardowąprzestrzeni Rn. Niech (f1, . . . , fn) będzie inną bazą przestrzeni Rn, przy czym kolej-ność wektorów f1, . . . , fn jest istotna. Każdy wektor fj można przedstawić w postaciliniowej kombinacji wektorów ei, i = 1 . . . , n, tzn.
fj =n∑
i=1
aijei, j = 1, . . . , n.
Utwórzmy macierz A =(aij
)i,j=1,...,n
. Mówimy, że baza (f1, . . . , fn) wyznacza orienta-cję przestrzeni Rn zgodną z bazą (e1, . . . , en) (odpowiednio, przeciwną) jeśli DetA > 0(odpowiednio, DetA < 0). Orientację wyznaczoną przez bazę (e1, . . . , en) nazywa sięteż orientacją dodatnią, a orientację do niej przeciwną orientacją ujemną.
Przykład 14.1 Niech f1 = (2, 1), f2 = (1, 3). Wówczas (f1, f2) wyznacza orientacjędodatnią R2, natomiast (f2, f1) orientację ujemną.
14.2 Orientacja rozmaitości
Niech S ⊂ Rm będzie n-wymiarową rozmaitością, n ≤ m. Wówczas dla każdegopunktu x ∈ S istnieje zbiór otwarty Ω ⊂ Rn oraz dyfeomorfizm Φ : Ω → Rm taki,że Φ(Ω) 3 x. Oznaczmy a = Φ−1(x). Ponieważ rządDΦ(a) = n, więc przestrzeniąstyczną do S w punkcie x jest TxS = DΦ(a)
(Rn
). Przestrzeń TxS jest przestrzenią
liniową, można więc określić w niej orientację. Mianowicie przez dodatnią orientacjęprzestrzeni TxS rozumiemy orientację wyznaczoną przez układ wektorów (f1, . . . , fn),gdzie fi = DΦ(a)(ei), i = 1, . . . , n.Załóżmy, że w każdym punkcie x ∈ S wybraliśmy orientację przestrzeni stycznej TxS.Jeśli x ∈ Φ(Ω) oraz dla dowolnego y ∈ Φ(Ω) orientacja TyS jest zgodna z orientacjąTxS, to mówimy, że rozmaitość S ma wyznaczoną orientację. Rozmaitość dla którejmożna wyznaczyć orientację nazywamy orientowalną. Jeśli S jest spójna, to możnaw niej wyznaczyć co najwyżej dwie orientacje.
Uwaga. Wstęga Möbiusa nie jest orientowalna.
Przypadki szczególne.
1. Zbiór otwarty U ⊂ Rn jest n-wymiarową rozmaitością. Ponadto TxU = Rn
dla x ∈ U . Jeśli w każdym punkcie x ∈ U wybierzemy dodatnią (ujemną) orientacjęTxU , to mówimy, że U jest dodatnio (ujemnie) zorientowany.
2. Każda krzywa gładka jest orientowalna i jej orientacja wyznacza kierunekobiegu krzywej.
67
3. Niech M ⊂ R3 będzie 2-wymiarową powierzchnią w R3. Wówczas TxM = R2
dla x ∈ M . Jeśli (ux, vx) jest bazą TxM zgodną z orientacją M , to wektor
nx =ux × vx
‖ux × vx‖
nazywamy wektorem zewnętrznym normalnym do M w punkcie x. Wektor nx ∈ R3
jest wektorem o długości 1 prostopadłym do wektorów ux i vx oraz trójka (ux, vx, nx)tworzy bazę R3. Mówimy, że (ux, vx) zadaje dodatnią orientację TxM jeśli (ux, vx, nx)zadaje dodatnią orientację R3.
Przykład 14.2 Niech f : Ω ⊂ R2 → R będzie funkcją klasy C1 oraz M wykresemf , tzn.
M = (x, y, z) ∈ R3 : z = f(x, y) dla (x, y) ∈ Ω.Odwzorowanie
Φ(x, y) =(x, y, f(x, y)
)dla (x, y) ∈ Ω
jest mapą płata M . Φ wyznacza dodatnią orientację M za pomocą pary wektorów(u(x,y), v(x,y)), gdzie u(x,y) = DΦ(x, y)(e1), v(x,y) = DΦ(x, y)(e2). Ponieważ macierząróżniczki Φ jest
DΦ(x, y) =
1 00 1
f ′x(x, y) f ′y(x, y)
,
więc
u(x,y) = DΦ(x, y)(e1) = (1, 0, f ′x(x, y)),
v(x,y) = DΦ(x, y)(e2) = (0, 1, f ′y(x, y)).
W celu wyznaczenia wektora normalnego zewnętrznego do M liczymy iloczyn wekto-rowy
u(x,y) × v(x,y) =
∣∣∣∣∣∣
e1 e2 e3
1 0 f ′x(x, y)0 1 f ′y(x, y)
∣∣∣∣∣∣= e1 · (−f ′x(x, y))− e2 · (f ′y(x, y)) + e3
=(− f ′x(x, y),−f ′y(x, y), 1
).
Zatem
n(x, y, f(x, y)) =
(− f ′x(x, y),−f ′y(x, y), 1)
√1 + f ′ 2x (x, y) + f ′ 2y (x, y)
.
68
14.3 Orientacja brzegu rozmaitości
Załóżmy, że S jest rozmaitością n-wymiarową oraz jej brzeg ∂S jest rozmaitością(n−1)-wymiarową. Wówczas orientację ∂S można wyznaczyć korzystając z orientacjiS. Opiszemy tę procedurę w kilku ważnych przypadkach.
Przypadek 1. Niech U ⊂ R2 będzie zbiorem otwartym, którego brzeg γ = ∂Ujest krzywą zamkniętą. Wówczas na γ mamy orientację dodatnią jeśli podczas obiegukrzywej γ zbiór U leży po lewej stronie.
Przypadek 2. Niech M ⊂ R3 będzie 2-wymiarową powierzchnią z brzegiem, ajej brzeg γ = ∂M krzywą gładką. Wtedy dla każdego punktu x ∈ γ = ∂M istniejezbiór otwarty x ∈ U ⊂ M oraz homeomorfizm regularny
Φ : K+ = (x, y) ∈ R2 : x2 + y2 < 1, y ≥ 0 →na U
taki, że Φ(0, 0) = x. Niech orientacja ma M będzie zgodna z orientacją wyznaczonąprzez mapę Φ, Połóżmy f1 = DΦ(0, 0)(e1), f2 = DΦ(0, 0)(e2). Wówczas para wekto-rów (f1, f2) zadaje orientację w x, przy czym wektor f1 jest styczny do γ w punkciex. Mówimy, że orientacje M i γ są zgodne jeśli f1 wyznacza orientację na γ zgodnąz pierwotną orientacją γ.
Przypadek 3. Niech U ⊂ R3 będzie zbiorem otwartym, którego brzeg M = ∂Ujest 2-wymiarową powierzchnią. Niech orientacja TxM będzie zadana przez paręwektorów (ux, vx) oraz niech
nx =ux × vx
‖ux × vx‖będzie wektorem normalnym do M w punkcie x. Oznaczmy
xε = x + εnx.
Wówczas mówimy, że M jest zorientowana dodatnio (ujemnie) jeśli xε 6∈ U (xε ∈ U)dla dostatecznie małych ε > 0. Innymi słowami M = ∂U jest zorientowana dodatniojeśli wektory nx dla x ∈ M są skierowane na zewnątrz U .
69
15 Całka krzywoliniowa
15.1 Krzywe w Rn
Definicja 15.1 Niech γ : [a, b] → Rn będzie funkcją ciągłą i różnowartościową wprzedziałach [a, b) i (a, b]. Wówczas zbiór
γ = x ∈ Rn : x = γ(t) dla pewnego t ∈ [a, b]jest krzywą zwartą i spójną, a γ jest parametryzacją γ.Krzywą γ nazywamy łukiem gładkim jeśli jest ona wyznaczona przez parametryzacjęγ = (γ1, . . . , γn) : [a, b] → Rn taką, że γ1, . . . , γn są funkcjami klasy C1 oraz
γ′ 21 (t) + · · ·+ γ′ 2n (t) > 0
dla każdego t ∈ (a, b). Orientację krzywej γ wyznacza wektor
γ′(t) =(γ′1(t), . . . , γ
′n(t)
).
Będziemy też dopuszczali przypadek, gdy krzywa γ jest sumą skończonej ilości łukówgładkich. Długością krzywej γ nazywamy całkę
d = d(γ) =
∫ b
a
√γ′ 21 (t) + · · ·+ γ′ 2n (t)dt
15.2 Całka krzywoliniowa zorientowana
Niech F = (F1, F2, F3) będzie polem sił określonym na obszarze U ⊂ R3 oraz γkrzywą zawartą w U . Naturalnym problemem jest potrzeba znalezienia wielkościpracy potrzebnej do przesunięcia zadanej masy wzdłuż krzywej γ. Do rozwiązaniatego problemu służy całka krzywoliniowa zorientowana.
Definicja 15.2 Niech γ : [a, b] → Rn będzie parametryzacją krzywej γ oraz F =(F1, . . . , Fn) : γ → Rn polem wektorowym na γ. Niech Π = t0, . . . , tk, gdziea = t0 < t1 < · · · < tk = b, będzie podziałem odcinka [a, b]. Wybierzmy dowolniepunkty θi ∈ [ti−1, ti] dla i = 1, . . . , k. Niech ∆xj,i = γj(ti)−γj(ti−1) będzie przyrostemγj w przedziale [ti−1, ti], j = 1, . . . , n, i = 1, . . . , k. Wówczas sumę
σ =k∑
i=1
F1
(γ(θi)
) ·∆x1,i + · · ·+ Fn
(γ(θi)
) ·∆xn,i
nazywamy sumą przybliżoną. Następnie analogicznie do konstrukcji całki Riemannafunkcji jednej zmiennej definiujemy ciąg normalny podziałów oraz ciągi aproksyma-cyjne. Jeśli są one zbieżne do wspólnej granicy, to nazywamy ją całką zorientowanąpola F wzdłuż krzywej γ oznaczamy
∫
γ
F(x)dx =
∫
γ
F1(x)dx1 + · · ·+ Fn(x)dxn.
70
Zauważmy, że jeśli krzywa γ jest sumą dwóch krzywych γ1 + γ2, to∫
γ
F(x)dx =
∫
γ1
F(x)dx +
∫
γ2
F(x)dx.
W szczególności, jeśli γ2 = −γ1 tzn. γ2(t) = γ1(−t) dla t ∈ [a, b], to∫
−γ1
F(x)dx = −∫
γ1
F(x)dx.
Uwaga. Wyrażenie F1(x)dx1 + · · ·+ Fn(x)dxn nazywane jest 1-formą.
Okazuje się, że całka krzywoliniowa zorientowana zależy tylko od orientacji krzy-wej, a nie od jej parametryzacji. Ponadto można ją obliczyć korzystając z całkiRiemanna.
Twierdzenie 15.1 Niech F = (F1, . . . , Fn) : γ → Rn będzie ciągłym polem wektoro-wym na krzywej gładkiej γ oraz niech γ : [a, b] → Rn będzie parametryzacją γ klasyC1. Wówczas całka zorientowana
∫γFdx istnieje oraz
∫
γ
Fdx =
∫ b
a
F(γ(t)
) γ′(t)dt
=
∫ b
a
(F1
(γ(t)
) · γ′1(t) + · · ·+ Fn
(γ(t)
) · γ′n(t))dt.
Ponadto∫
γFdx zależy tylko od orientacji krzywej γ.
Wniosek 15.1 Jeśli γ = (x(t), y(t))
: t ∈ [a, b] jest krzywą gładką w R2 orazF = (P, Q) ciągłym polem wektorowym na γ, to
∫
γ
P (x, y)dx + Q(x, y)dy =
∫ b
a
(P
(x(t), y(t)
) · x′(t) + Q(x(t), y(t)
) · y′(t))dt.
Wniosek 15.2 Jeśli γ = (x(t), y(t), z(t))
: t ∈ [a, b] jest krzywą gładką w R3 orazF = (P, Q,R) ciągłym polem wektorowym na γ, to∫
γ
P (x, y, z)dx + Q(x, y, z)dy + R(x, y, z)dz
=
∫ b
a
(P
(x(t), y(t), z(t)
) · x′(t) + Q(x(t), y(t), z(t)
) · y′(t) + R(x(t), y(t), z(t)
) · z′(t))dt.
Przykład 15.1 Niech F(x, y) =( −y
x2+y2 ,x
x2+y2
)będzie polem wektorowym na R2 \
(0, 0) oraz γ = (r cos t, r sin t), 0 ≤ t ≤ 2π okręgiem o promieniu r > 0. Wówczas∫
γ
x
x2 + y2dy − y
x2 + y2dx
=
∫ 2π
0
r cos t
(r cos t)2 + (r sin t)2· r cos t +
−r sin t
(r cos t)2 + (r sin t)2· (−r sin t)
dt
=
∫ 2π
0
1 dt = 2π.
Zauważmy, że całka ta nie zależy od r.
71
15.3 Całka krzywoliniowa niezorientowana
Niech f : γ → R będzie funkcją rzeczywistą określoną na krzywej γ. Jeśli f jest dodat-nia, to można ją interpretować jako gęstość masy rozłożonej na krzywej γ i wówczasinteresuje nas problem wyznaczenia masy całej krzywej. W tym celu wprowadzimypojęcie całki krzywoliniowej niezorientowanej.
Definicja 15.3 Niech γ = γ(t) : t ∈ [a, b] będzie krzywą gładką oraz f : γ → Rfunkcją rzeczywistą. Niech Π = t0, . . . , tk, gdzie a = t0 < t1 < · · · < tk = b będziepodziałem odcinka [a, b]. Wybierzmy dowolnie punkty θi ∈ [ti−1, ti] dla i = 1, . . . , k.Niech ∆si będzie długością łuku
(γ(ti−1), γ(ti)
). Wówczas
∆si =
∫ ti
ti−1
√γ′ 21 (t) + · · ·+ γ′ 2n (t)dt.
Definiujemy sumą przybliżoną dla podziału Π:
σ =k∑
i=1
f(γ(θi)
)∆si.
Następnie dla normalnego ciągu podziałów (Πj) oznaczamy przez σj ciąg sum przybli-żonych. Jeśli granica ciągu σj nie zależy od wyboru normalnego ciągu podziałów orazod wyboru punktów θi, to nazywamy ją całką niezorientowaną funkcji f po krzywejγ i oznaczamy ∫
γ
f(x)ds = limj→∞
σj.
Twierdzenie 15.2 Niech f : γ → Rn będzie funkcją ciągłą na krzywej gładkiej γoraz niech γ : [a, b] → Rn będzie parametryzacją γ klasy C1. Wówczas całka niezo-rientowana
∫γf(x)ds istnieje oraz
∫
γ
f(x)ds =
∫ b
a
f(γ(t)
)√γ′ 21 (t) + · · ·+ γ′ 2n (t)dt.
15.4 Związek całki zorientowanej z całką niezorientowaną
Niech γ = γ(t) : t ∈ [a, b] będzie krzywą gładką. Wówczas wektor
γ′(t) =(γ′1(t), . . . , γ
′n(t)
)
jest styczny do γ i skierowany zgodnie z orientacją γ. Jego długość wynosi
‖γ′(t)‖ =√
γ′ 21 (t) + · · ·+ γ′ 2n (t).
Niech F : γ → Rn będzie polem wektorowym na γ. Oznaczmy przez α = α(t) kątpomiędzy wektorami F(t) a γ′(t). Wówczas składowa Fs wektora F styczna do γwynosi
Fs = ‖F‖ · cos α.
72
Policzmy iloczyn skalarny
F(γ(t)
) γ′(t) = ‖F(γ(t)
) · ‖γ′(t)‖ · cos α = Fs
(γ(t)
) · ‖γ′(t)‖.Stąd
∫
γ
F(x) dx =
∫ b
a
F(γ(t)
) γ′(t) dt
=
∫ b
a
Fs
(γ(t)
) · ‖γ′(t)‖ dt
=
∫ b
a
Fs
(γ(t)
) ·√
γ′ 21 (t) + · · ·+ γ′ 2n (t) dt
=
∫
γ
Fs(x) ds.
Czyli ∫
γ
F(x) dx =
∫
γ
Fs(x) ds.
Wniosek 15.3 Jeśli pole wektorowe F jest prostopadłe do krzywej γ, to∫
γ
F(x) dx = 0.
15.5 Zastosowania całek krzywoliniowych
1. Jeśli F = (F1, . . . , Fn) jest siłą działającą na punkt materialny, to pracę potrzebnądo przesunięcia tego punktu wzdłuż krzywej γ obliczamy ze wzoru
W =
∫
γ
F(x) dx =
∫
γ
F1(x) dx1 + · · ·+ Fn(x) dxn
=
∫
γ
Fs(x) ds.
W szczególności, jeśli F⊥γ, tzn. siła F jest prostopadła do γ, to W = 0.2. Niech y = f(x), a ≤ x ≤ b będzie nieujemną funkcją klasy C1. Wówczas pole
powierzchni S powstałej w wyniku obrotu krzywej γ = (x, f(x)), x ∈ [a, b] dookołaosi OX wynosi
|S| = 2π
∫ b
a
f(x)√
1 + f ′ 2(x) dx.
Ponieważ krzywa γ ma parametryzację γ = (x(t) = t, y(t) = f(t)), t ∈ [a, b], więc
|S| = 2π
∫ b
a
y(t)√
x′ 2(t) + y′ 2(t) dt = 2π
∫
γ
y ds.
Przypomnijmy, że środek ciężkości krzywej γ ma wspólrzędne (ξ, η), gdzie ξ = 1|γ|
∫γx ds,
η = 1|γ|
∫γy ds. Zatem otrzymujemy ponownie regułę Guldina
|S| = 2π · η · |γ|.
73
15.6 Wzór Greena
Wzór Greena wyraża związek pomiędzy całką zorientowaną po krzywej zamkniętej(konturze), a całką podwójną po obszarze wewnątrz tej krzywej.
Twierdzenie 15.3 (Greena). Niech D ⊂ R2 będzie zbiorem regularnym, któregobrzeg γ = ∂D jest krzywą regularną zorientowaną dodatnio. Jeśli funkcje P, Q : D →R są klasy C1, to
∮
γ
P (x, y) dx + Q(x, y) dy =
∫∫
D
(∂Q(x, y)
∂x− ∂P (x, y)
∂y
)dxdy.
Wniosek 15.4 Niech D ⊂ R2 będzie zbiorem regularnym, którego brzeg γ = ∂D jestkrzywą regularną zorientowaną dodatnio. Wówczas
|D| =∮
γ
x dy = −∮
γ
y dx =1
2
∮
γ
(x dy − y dx
).
Wniosek 15.5 Niech D ⊂ R2 będzie zbiorem regularnym, którego brzeg γ = ∂D jestkrzywą regularną zorientowaną dodatnio. Jeśli funkcje P,Q : D → R są klasy C1 ispełniają warunek całkowalności
(C)∂Q(x, y)
∂x=
∂P (x, y)
∂ydla (x, y) ∈ D,
to ∮
γ
P (x, y) dx + Q(x, y) dy = 0.
Wniosek 15.6 Niech D ⊂ R2 będzie obszarem spójnym i jednospójnym (tzn, zbiórR2 \ D jest spójny). Jeśli funkcje P, Q : D → R są klasy C1 i spełniają warunekcałkowalności (C), to dla dowolnej krzywej regularnej γ ⊂ D całka
∫
γ
P (x, y) dx + Q(x, y) dy
zależy tylko od początku i końca tej krzywej.
Przy założeniach powyższego wniosku wybierając dowolnie punkt (x, y) ∈ D możemyokreślić funkcję
U(x, y) = −∫ (x,y)
(x,y)
P (ξ, η) dξ + Q(ξ, η) dη dla (x, y) ∈ D.
74
Tak określoną funkcję U : D → R nazywamy potencjałem pola wektorowego (P, Q).Zauważmy, że
∂U(x, y)
∂x= − lim
h→0
1
h
( ∫ (x+h,y)
(x,y)
P (ξ, η) dξ + Q(ξ, η) dη −∫ (x,y)
(x,y)
P (ξ, η) dξ + Q(ξ, η) dη
)
= − limh→0
1
h
∫ (x+h,y)
(x,y)
P (ξ, η) dξ + Q(ξ, η) dη
= − limh→0
1
h
∫ h
0
P (x + t, y)(t)′ dt
= −P (x, y).
Analogicznie dostajemy
∂U(x, y)
∂y= −Q(x, y).
Ponieważ P i Q są klasy C1, funkcja U jest klasy C2. Zatem jej pochodne mieszanesą równe
∂2U(x, y)
∂x∂y= − ∂
∂xQ(x, y)
‖∂2U(x, y)
∂y∂x= − ∂
∂yP (x, y).
Co jest zgodne z warunkiem (C).
15.7 Niezależność całki krzywoliniowej od drogi całkowania
Załóżmy teraz, że pole wektorowe F : D → Rn jest określone na spójnym i jedno-spójnym obszarze D ⊂ Rn.
Definicja 15.4 Mówimy, że całka krzywoliniowa pola F nie zależy od drogi całkowa-nia, jeśli dla dowolnych krzywych regularnych γ1 i γ2 o tych samych końcach zachodzi
∫
γ1
F(x) dx =
∫
γ2
F(x) dx.
Wówczas pole F nazywamy potencjalnym, a jego potencjał wynosi
U(x) =
∫ x
x
F(ξ) dξ.
Analogicznie jak w przypadku n = 2 wykazuje się, że
∂U(x)
∂xi
= −Fi(x) dla i = 1, . . . , n.
75
Jeśli pole F jest klasy C1, to potencjał U jest klasy C2 oraz zachodzi
∂2U(x)
∂xj∂xi
= − ∂
∂xj
Fi(x)
‖∂2U(x)
∂xi∂xj
= − ∂
∂xi
Fj(x).
Zatem pole F spełnia warunek całkowalności
(Cn)∂
∂xj
Fi(x) =∂
∂xi
Fj(x) dla i, j = 1, . . . , n.
Uwaga. W przypadku pola F = [P,Q, R] : D ⊂ R3 → R3 warunek całkowalnościprzyjmuje postać:
∂P (x,y,z)∂y
= ∂Q(x,y,z)∂x
,∂Q(x,y,z)
∂z= ∂R(x,y,z)
∂y,
∂R(x,y,z)∂x
= ∂P (x,y,z)∂z
dla (x, y, z) ∈ D.
Wykażemy później, że jeśli pole F spełnia warunek całkowalności w obszarze jedno-spójnym, to jest ono potencjalne.
15.8 Całka krzywoliniowa funkcji o wartościach zespolonych
Niech D ⊂ C ' R2 będzie obszarem na płaszczyźnie zespolonej oraz γ krzywą re-gularną w D. Niech f : D → C będzie funkcją ciągłą o wartościach zespolonych.Oznaczmy z = x + iy, f = u + iv. Wówczas funkcje u, v : D → R można traktowaćjako funkcje rzeczywiste na zbiorze D ⊂ R2. Definiujemy
∫
γ
f(z) dz =
∫
γ
(u(x, y) + iv(x, y)
)(dx + idy)
=
∫
γ
(u(x, y) dx− v(x, y) dy
)+ i
∫
γ
(v(x, y) dx + u(x, y) dy
).
Zauważmy, że warunek (C) niezależnośći całki od drogi całkowania przyjmuje postać
(CR)
∂u(x, y)∂x
=∂v(x, y)
∂y,
∂u(x, y)∂y
= −∂v(x, y)∂x
dla (x, y) ∈ D.
Równania (CR) nazywają się układem Cauchy-Riemanna.Uwaga. Funkcja f(z) = 1
zspełnia równania (CR). Tym nie mniej
∫∂B(0,R)
1zdz =
2πi. Zatem całka po konturze zamkniętym nie jest równa zero. Wynika to z faktu,że zbiór B(0, R) \ 0 nie jest jednospójny.
76
16 Całki powierzchniowe
16.1 Całka powierzchniowa niezorientowana
Niech D ⊂ R2 będzie zbiorem regularnym oraz f : D → R funkcją klasy C1. Wówczaswykres funkcji f czyli zbiór
S = (x, y, z) ∈ R3 : z = f(x, y), (x, y) ∈ D
jest płatem regularnym. Jak wiemy pole płata S wyraża się wzorem
|S| =∫∫
D
√1 +
(∂f(x, y)
∂x
)2
+
(∂f(x, y)
∂y
)2
dxdy.
Niech F : S → R będzie funkcją ograniczoną. Podzielmy D na k zbiorów regularnych,tzn.
D =k⋃
i=1
Di gdzie intDi ∩ intDj = ∅ dla i 6= j.
Oznaczmy przez ∆i część wykresu funkcji f nad zbiorem Di oraz przez |∆Si| pole∆Si, i = 1, . . . , k. Wybierzmy dowolnie punkt Ai ∈ ∆Si, i = 1, . . . , k i utwórzmysumę przybliżoną
σ =k∑
i=1
F (Ai)|∆Si|.
Następnie tworzymy normalny ciąg podziałów zbioru D, odpowiadający mu ciąg po-działów zbioru S oraz ciąg sum przybliżonych. Jeżeli wszystkie ciągi przybliżone sązbieżne do tej samej granicy to granicę tę nazywamy całką powierzchniową niezorien-towaną funkcji F po płacie S i oznaczamy
∫∫
S
F (x, y, z) dS.
Zachodzi
Twierdzenie 16.1 Niech f : D → R będzie funkcją klasy C1 oraz
S = (x, y, z) ∈ R3 : z = f(x, y) dla (x, y) ∈ D
będzie płatem regularnym. Jeśli F : S → R jest funkcją ciągłą, to∫∫
S
F (x, y, z) dS =
∫∫
D
F(x, y, f(x, y)
)√1 + f ′ 2x (x, y) + f ′ 2y (x, y) dxdy.
Analogicznie definiuje się całkę powierzchniową niezorientowaną, w przypadkugdy płat S jest określony przez S = (x, y, z) : y = f(x, z) lub S = (x, y, z) : x =f(y, z).
77
W ogólnym przypadku zbiór S ⊂ R3 jest dwuwymiarowym płatem regularnym,jeśli istnieje zbiór regularny D ⊂ R2 i dyfeomorfizm Φ : D → R3 taki, że Φ(D) = S.Jeśli Φ = (ϕ, ψ, χ), gdzie ϕ, ψ, χ : D → R są funkcjami klasy C1, to zachodzi
Twierdzenie 16.2 Niech S ⊂ R3 będzie płatem dwuwymiarowym regularnym orazF : S → R funkcją ciągłą. Wówczas całka powierzchniowa niezorientowana funkcjiF po płacie S wyraża się wzorem
∫∫
S
F (x, y, z) dS
=
∫∫
D
F(ϕ(u, v), ψ(u, v), χ(u, v)
)√J2
1 (u, v) + J22 (u, v) + J2
3 (u, v) dudv,
gdzie
J1(u, v) =
∣∣∣∣∣∣∣
∂ϕ∂u
∂ϕ∂v
∂ψ∂u
∂ψ∂v
∣∣∣∣∣∣∣= C, J2(u, v) =
∣∣∣∣∣∣∣
∂ϕ∂u
∂ϕ∂v
∂χ∂u
∂χ∂v
∣∣∣∣∣∣∣= −B, J3(u, v) =
∣∣∣∣∣∣∣
∂ψ∂u
∂ψ∂v
∂χ∂u
∂χ∂v
∣∣∣∣∣∣∣= A.
Uwaga. Przypomnijmy, że macierzą różniczki odwzorowania Φ jest macierz
∂ϕ∂u
∂ϕ∂v
∂ψ∂u
∂ψ∂v
∂χ∂u
∂χ∂v
.
Jeśli S ⊂ R3 jest dwuwymiarową rozmaitością (powierzchnią) taką, że można jąrozłożyć na sumę płatów regularnych S = S1 ∪ · · · ∪ Sk o rozłącznych wnętrzachintSi ∩ intSj = ∅ dla i, j = 1 . . . , k, i 6= j, to S nazywamy powierzchnią regularną iprzez całkę po S rozumiemy sumę całek po płatach Si, i = 1, . . . , k.
Interpretacja fizyczna
1. Jeśli na powierzchni S jest rozłożony ładunek elektryczny o gęstości F (x, y, z), tocałka
∫∫S
F (x, y, z) dS wyraża całkowity ładunek na S.
2. Jeśli na powierzchni S jest rozłożona jest materia o gęstości ρ(x, y, z), to całka∫∫S
ρ(x, y, z) dS wyraża całkowitą masę na S.
3. Jeśli na powierzchni S jest rozłożona jest materia o gęstości ρ(x, y, z), to punkt Oo masie jednostkowej jest przyciągany przez S siłą F = (Fx, Fy, Fz), gdzie
Fx =
∫∫
S
ρ(x, y, z)x
(x2 + y2 + z2)3/2dS,
Fy =
∫∫
S
ρ(x, y, z)y
(x2 + y2 + z2)3/2dS,
Fz =
∫∫
S
ρ(x, y, z)z
(x2 + y2 + z2)3/2dS.
78
Przykład 16.1 Niech S = x2 + y2 + z2 = r2, z ≥ 0 będzie jednorodną półsferą ostałej gęstości ρ > 0. Wówczas punkt O o masie jednostkowej jest przyciągany siłąF = (Fx, Fy, Fz). Wobec symetrii jest jasne, że Fx = Fy = 0. Natomiast
Fz =
∫∫
S
ρ · z
(x2 + y2 + z2)3/2dS.
W celu obliczenia tej całki zastosujemy współrzędne sferyczne. Otóż S = Φ(D), gdzieD = [0 ≤ ϕ ≤ 2π]× [0 ≤ ψ ≤ π/2] oraz
Φ(ϕ, ψ) = (r cos ϕ cos ψ, r sin ϕ cos ψ, r sin ψ) = (x, y, z).
Macierzą różniczki odwzorowania Φ jest macierz−r sin ϕ cos ψ −r cos ϕ sin ψr cos ϕ cos ψ − sin ϕ sin ψ
0 r cos ψ
.
Liczymy
J21 + J2
2 + J23 = r4 sin2 ψ cos2 ψ + r4 sin2 ϕ cos4 ψ + r4 cos2 ϕ cos4 ψ = r4 cos2 ψ.
Zatem
Fz = ρ
∫ 2π
0
∫ π/2
0
r sin ψ
r3· r2 cos ψ dψdϕ
= 2πρ
∫ π/2
0
sin ψ cos ψdψ = πρ.
Zauważmy że siła nie zależy od promienia półsfery (czy potrafisz to wytłumaczyć bezrachunków).
Stwierdzenie 16.1 Niech F będzie funkcją ciągła w kuli domkniętej B(R). Wówczas∫∫∫
B(R)
F (x, y, z) dxdydz =
∫ R
0
( ∫∫
Sr
F (x, y, z) dS
)dr,
gdzie Sr = ∂B(r) jest sferą o promieniu r.
Dowód. Korzystając ze współrzędnych sferycznych i wykorzystując rachunki zPrzykładu 16.1 dostajemy
∫∫
Sr
F (x, y, z) dS =
∫ 2π
0
∫ π/2
−π/2
G(r, ϕ, ψ) · r2 cos ψ dψdϕ,
gdzieG(r, ϕ, ψ) = F (r cos ϕ cos ψ, r sin ϕ cos ψ, r sin ψ).
Z drugiej strony∫∫∫
B(R)
F (x, y, z) dxdydz =
∫ R
0
∫ 2π
0
∫ π/2
−π/2
G(r, ϕ, ψ) · r2 cos ψ dψdϕdr.
Zatem na podstawie twierdzenia Fubiniego dostajemy wyprowadzany wzór. 2
79
16.2 Całka powierzchniowa zorientowana
Motywacja.
Załóżmy, że przez powierzchnię S ⊂ R3 przepływa ciecz (gaz, strumień pola,. . . ).W punkcie (x, y, z) ∈ S prędkość przepływu cieczy wynosi v(x, y, z) ∈ R3. Oznaczmyprzez n wektor normalny, zewnętrzny do S. Wówczas składowa prędkości prostopadłado S jest dana przez iloczyn skalarny v n, a całkowita objętość przepływy cieczyprzez S w jednostce czasu wynosi
V =
∫∫
S
v n dS.
Definicja 16.1 Niech S ⊂ R3 będzie płatem regularnym zorientowanym, a n(x, y, z) ∈R3 wektorem normalnym zewnętrznym do S. Niech F :→ R3 będzie ciągłym polemwektorowym na S. Przez całkę powierzchniową zorientowaną pola F (strumieniempola F) przez powierzchnię S nazywamy całkę
∫∫
S
F(x, y, z) n(x, y, z) dS.
Załóżmy, że płat S jest zadany jako obraz zbioru otwartego D ⊂ R2 pod działa-niem dyfeomorfizmu Φ = (ϕ, ψ, χ) : D → R3, tzn.
S = (x, y, z) ∈ R3 : x = ϕ(u, v), y = ψ(u, v), z = χ(u, v) dla (u, v) ∈ D ⊂ R2.Wówczas macierzą różniczki DΦ jest
ϕ′u ϕ′vψ′u ψ′vχ′u χ′v
.
Zatem przestrzeń styczna do S jest rozpięta na wektorach [ϕ′u, ψ′u, χ
′u] = f1 i [ϕ′v, ψ′v, χ′v] =
f2. Wektorem normalnym zewnętrznym jest
n =f1 × f2
‖f1 × f2‖ .
Mamy
f1 × f2 =
∣∣∣∣∣∣
e1 e2 e3
ϕ′u ψ′u χ′uϕ′v ψ′v χ′v
∣∣∣∣∣∣= e1 · (ψ′uχ′v − ψ′vχ
′u)− e2 · (ϕ′uχ′v − ϕ′vχ
′u) + e3 · (ϕ′uψ′v − ϕ′vψ
′u)
=[A,B, C
],
n =
[A,B,C
]√
A2 + B2 + C2.
PonadtodS =
√A2 + B2 + C2 dudv.
80
Zatem jeśli F = [P, Q,R], to∫∫
S
F(x, y, z) n(x, y, z) dS
=
∫∫
D
[P,Q, R] [A,B,C]√A2 + B2 + C2
√A2 + B2 + C2 dudv
=
∫∫
D
(PA + QB + RC
)dudv.
Uwaga. Całkę powierzchniową zorientowaną pola F = [P, Q,R] oznacza się rów-nież w postaci ∫∫
S
P dydz + Qdzdx + R dxdy.
Wyrażenie P dydz + Qdzdx + R dxdy nazywa się 2-formą. Wówczas jeśli
S = (x, y, z) ∈ R3 : x = x(u, v), y = y(u, v), z = z(u, v) dla (u, v) ∈ D ⊂ R2,
to
dydz =
∣∣∣∣y′u y′vz′u z′v
∣∣∣∣ dudv = Adudv,
dzdx =
∣∣∣∣z′u z′vx′u x′v
∣∣∣∣ dudv = B dudv,
dxdy =
∣∣∣∣x′u x′vy′u y′v
∣∣∣∣ dudv = C dudv.
Jeśli powierzchnia S jest wykresem funkcji f : D → R, tzn.
S = (x, y, z) ∈ R3 : z = f(x, y) dla (x, y) ∈ D ⊂ R2,
to
n(x, y, z) =[−f ′x(x, y),−f ′y(x, y), 1]√1 + f ′ 2x (x, y) + f ′ 2y (x, y)
.
Zatem∫∫
S
P dydz + Qdzdx + R dxdy
=
∫∫
D
(− P
(x, y, f(x, y)
)f ′x(x, y)−Q
(x, y, f(x, y)
)f ′y(x, y) + R
(x, y, f(x, y)
))dxdy.
81
Przykład 16.2 Policzmy całkę zorientowaną∫∫
S
x dydz + y dzdx + z dxdy,
gdzie S jest sferą x2 + y2 + z2 = R2 zorientowaną dodatnio. W tym celu stosujemywspółrzędne sferyczne x = R cos ϕ cos ψ, y = R sin ϕ cos ψ, z = R sin ψ, gdzie 0 ≤ϕ ≤ 2π, −π/2 ≤ ψ ≤ π/2. Wówczas
dydz =
∣∣∣∣R cos ϕ cos ψ −R sin ϕ sin ψ
0 R cos ψ
∣∣∣∣ dϕdψ = R2 cos ϕ cos2 ψ dϕdψ,
dzdx =
∣∣∣∣0 R cos ψ
−R sin ϕ cos ψ −R cos ϕ sin ψ
∣∣∣∣ dϕdψ = R2 sin ϕ cos2 ψ dϕdψ,
dxdy =
∣∣∣∣−R sin ϕ cos ψ −R cos ϕ sin ψR cos ϕ cos ψ −R sin ϕ sin ψ
∣∣∣∣ dϕdψ = R2 sin ψ cos ψ dϕdψ.
Zatem∫∫
S
x dydz + y dzdx + z dxdy
=
∫∫
(0,2π)×(−π/2,π/2)
(R cos ϕ cos ψ ·R2 cos ϕ cos2 ψ + R sin ϕ cos ψ ·R2 sin ϕ cos2 ψ
+ R sin ψ ·R2 sin ψ cos ψ)
dϕdψ
=
∫ 2π
0
∫ π/2
−π/2
R3 cos ψ dψdϕ = 4πR3.
16.3 Twierdzenie Gaussa-Ostrogradskiego
Następna twierdzenie wyraża związek pomiędzy całką powierzchniową zorientowanąa całką potrójną.
Twierdzenie 16.3 (Gaussa-Ostrogradskiego). Niech V ⊂ R3 będzie zbiorem regu-larnym, którego brzeg S = ∂V jest powierzchnią regularną zorientowaną dodatnio(zewnętrznie). Jeśli pole wektorowe F = (P, Q, R) : V → R3 jest klasy C1, to
(GO)
∫∫
S
P dydz + Qdzdx + R dxdy =
∫∫∫
V
(∂P
∂x+
∂Q
∂y+
∂R
∂z
)dxdydz.
Wniosek 16.1 Jeśli V ⊂ R3 będzie zbiorem regularnym, którego brzeg S = ∂V jestpowierzchnią regularną zorientowaną dodatnio, to jego objętość wynosi
|V | = 1
3
∫∫
S
x dydz + y dzdx + z dxdy.
82
Niech F = (P, Q,R) będzie polem wektorowym na V klasy C1. Wyrażenie
div F =∂P
∂x+
∂Q
∂y+
∂R
∂z: V → R
nazywamy dywergencją pola F. Zatem twierdzenie Gaussa-Ostrogradskiego mówi, żestrumień pola F przez powierzchnię S = ∂V jest równy całce objętościowej dywergen-cji pola F. W szczególności jeśli div F = 0 w V , to strumień pola F przez S wynosizero. Takie pole F nazywa się bezźródłowe. Wzór Gaussa-Ostrogradskiego można teżzapisać w postaci ∫∫∫
V
div F dxdydz =
∫∫
S
F n dS,
gdzie F n = Fn jest składową normalną pola F.
Przykład 16.3 Sprawdzimy wzór Gaussa-Ostrogradskiego pola F = (x2, y2, z2) ikuli V = B(R). Korzystając z rachunków przeprowadzonych w Przykładzie 16.2dostajemy dla S = ∂B(R)
∫∫
S
F n dS =
∫∫
S
x2 dydz + y2 dzdx + z2 dxdy
=
∫∫
(0,2π)×(−π/2,π/2)
((R cos ϕ cos ψ
)2R2 cos ϕ cos2 ψ +
(R sin ϕ cos ψ
)2R2 sin ϕ cos2 ψ
+(R sin ψ
)2R2 sin ψ cos ψ
)dϕdψ
= R4
∫ 2π
0
cos3 ϕdϕ
∫ π/2
−π/2
cos4 ψ dψ +
∫ 2π
0
sin3 ϕ dϕ
∫ π/2
−π/2
cos4 ψ dψ
+
∫ 2π
0
1 dϕ
∫ π/2
−π/2
sin3 ψ cos ψ dψ
= 0.
Z drugiej strony div F = 2(x + y + z) jest funkcją nieparzystą względem płaszczyznyx + y + z = 0. Zatem
∫∫∫
B(R)
2(x + y + z) dxdydz = 0. 2
Niech u : Ω → R będzie funkcją klasy C2 na obszarze Ω ⊂ R3. Załóżmy, że dlakażdego regularnego obszaru V ⊂ Ω strumień pola ∂u
∂n= gradu n =
[∂u∂x
, ∂u∂y
, ∂u∂z
] n
przez powierzchnię S = ∂V znika. Wówczas ze wzoru (GO) dostajemy
0 =
∫∫
S
∂u
∂ndS =
∫∫
S
gradu n dS =
∫∫∫
V
div gradu dxdydz.
Ponieważ powyższa równość zachodzi dla każdego regularnego obszaru V ⊂ R3, więcmusi być div gradu = 0. Lecz
div gradu = div[∂u
∂x,∂u
∂y,∂u
∂z
]=
∂2u
∂x2+
∂2u
∂y2+
∂2u
∂z2=: ∆u.
83
Czyli funkcja u spełnia równanie Laplace’a ∆u = 0. Funkcje spełniające równanie La-place’a nazywamy harmonicznymi. Odwrotnie jeśli u ∈ C2 jest funkcją harmoniczną,to
∫∫S
∂u∂n
dS = 0 dla każdej regularnej zamkniętej powierzchni S.
16.4 Twierdzenie Stokes’a
Twierdzenie Stokes’a wyraża związek pomiędzy całką zorientowaną po powierzchniS ⊂ R3 i całką krzywoliniową zorientowaną po brzegu γ = ∂S powierzchni S.
Twierdzenie 16.4 (Stokes’a.) Niech krzywa regularna γ będzie brzegiem 2-wymiaro-wego płata regularnego S ⊂ R3, przy czym γ i S są zgodnie zorientowane. Jeśli polewektorowe F = [P, Q,R] jest klasy C1 w pewnym otoczeniu płata S, to
∮
γ
P dx + Qdy + R dz
=
∫∫
S
(∂R
∂y− ∂Q
∂z
)dydz +
(∂P
∂z− ∂R
∂x
)dzdx +
(∂Q
∂x− ∂P
∂y
)dxdy.
Uwaga. Zauważmy, że jeśli S ⊂ R2, to R dz = 0 i wzór Stokes’a redukuje się dowzoru Greena
∮
γ
P dx + Qdy =
∫∫
S
(∂Q
∂x− ∂P
∂y
)dxdy.
Jeśli F = [P, Q,R] jest polem wektorowym klasy C1, to pole[∂R
∂y− ∂Q
∂z,
∂P
∂z− ∂R
∂x,
∂Q
∂x− ∂P
∂y
]= rotF
nazywa się rotacją lub wirowością pola F. Jeśli Fs jest składową pola F styczną doγ, to wzór Stokes’a można napisać w postaci
∮
γ
Fs ds =
∫∫
S
(rotF) n dS.
Przykład 16.4
Zauważmy, że jeśli pole F : Ω → R3 jest bezwirowe, tzn. rotF = 0, to całkakrzywoliniowa ∫
γ
P dx + Qdy + R dz
zależy tylko od początku i końca krzywej γ (o ile obszar Ω jest jednospójny). Zatemustalając dowolnie punkt początkowy krzywej γ całka ta definiuje funkcję U(x, y, z)końca krzywej γ. Tak zdefiniowana funkcja U nazywana jest potencjałem pola F.
Odwrotnie dla danej funkcji U ∈ C2(Ω) jej gradient gradU =(
∂U∂x
, ∂U∂y
, ∂U∂z
)wy-
znacza pole wektorowe [P, Q,R] =[
∂U∂x
, ∂U∂y
, ∂U∂z
], którego rotacja znika. Mamy więc
84
Wniosek 16.2 Aby pole wektorowe F = [P, Q,R] zdefiniowane w obszarze jednospój-nym Ω ⊂ R3 było polem potencjalnym potrzeba i wystarcza, aby rotF = 0. Wówczaspraca takiego pola wzdłuż dowolnej krzywej zamkniętej wynosi 0.
Przykład 16.5 Niech Ω = R3 \ 0. (Jest to zbiór jednospójny w R3.) Niech Fbędzie polem sił wytworzonym przez siłę grawitacji masy jednostkowej położonej wpoczątku układu współrzędnych. Wówczas
F =(−x
r3,−y
r3,−z
r3
), gdzie r =
√x2 + y2 + z2,
(|F| = 1
r2
).
Mamy∂Q
∂x=
∂
∂x
( −y
(x2 + y2 + z2)3/2
)=
3xy
(x2 + y2 + z2)5/2=
∂P
∂y,
∂R
∂y=
3yz
(x2 + y2 + z2)5/2=
∂Q
∂z,
∂P
∂z=
3xz
(x2 + y2 + z2)5/2=
∂R
∂x.
Zatem pole F jest bezwirowe. Aby znaleźć potencjał U pola F należy znaleźć funkcjęU(x, y, z) taką, że
∂U(x, y, z)
∂x=−x
r3,
∂U(x, y, z)
∂y=−y
r3,
∂U(x, y, z)
∂z=−z
r3.
Ustalmy (x, y, z) ∈ R3 \ 0, np. (x, y, z) = (0, 0, 1). Z pierwszego z tych równańdostajemy
U(x, y, z) =
∫ x
0
−ξ
(ξ2 + y2 + z2)3/2dξ+V (y, z) =
1
(x2 + y2 + z2)1/2− 1
(y2 + z2)1/2+V (y, z).
Następnie z drugiego równania mamy∂U(x, y, z)
∂y=
−y
(x2 + y2 + z2)3/2− −y
(y2 + z2)3/2+
∂V (y, z)
∂y=
−y
(x2 + y2 + z2)3/2.
Zatem∂V (y, z)
∂y=
−y
(y2 + z2)3/2.
Stąd
V (y, z) =
∫ y
0
−η
(η2 + z2)3/2dη + W (z) =
1
(y2 + z2)1/2− 1
(z2)1/2+ W (z).
Teraz korzystając z trzeciego równania dostajemy∂U(x, y, z)
∂z=
−z
(x2 + y2 + z2)3/2− −z
(y2 + z2)3/2+
−z
(y2 + z2)3/2− −z
(z2)3/2+
∂W (z)∂z
=−z
(x2 + y2 + z2)3/2.
Zatem∂W (z)
∂z=
−z
(z2)3/2.
Stąd
V (z) =
∫ z
1
−ζ
(ζ2)3/2dζ =
1
(z2)1/2− 1.
Ostatecznie U(x, y, z) = (x2 + y2 + z2)−1/2 − 1. 2
85