matematyka (materiały dydaktyczne) - wsb.edu.pl · matematyka (materiały dydaktyczne) aleksander...

112
Niniejsza publikacja zostala przygotowana w ramach realizacji projektu ”Innowacyjne specjalności na kierunku Informatyka w Wyższej Szkole Biznesu w Dąbrowie Górniczej”, Program Operacyjny Kapital Ludzki, Dzialanie 4.1, Poddzialanie 4.1.1 - Wzmocnienie potencjalu dydaktycznego uczelni Matematyka (Materialy dydaktyczne) Aleksander Blaszczyk

Upload: buixuyen

Post on 01-Mar-2019

290 views

Category:

Documents


0 download

TRANSCRIPT

Niniejsza publikacja została przygotowana w ramach realizacji projektu ”Innowacyjnespecjalności na kierunku Informatyka w Wyższej Szkole Biznesu w Dąbrowie

Górniczej”, Program Operacyjny Kapitał Ludzki, Działanie 4.1, Poddziałanie 4.1.1 -Wzmocnienie potencjału dydaktycznego uczelni

Matematyka(Materiały dydaktyczne)

Aleksander Błaszczyk

Spis treści

Rozdział I. Struktury liczbowe 31. Wstęp mnogościowy 32. Liczby naturalne. Indukcja Matematyczna 43. Liczby całkowite, wymierne i rzeczywiste 124. Wielomiany 175. Liczby zespolone 226. Grupy, ciała, przestrzenie liniowe 267. Zadania do rozdziału I 33

Rozdział II. Macierze i wyznaczniki 451. Macierze 452. Wyznaczniki 513. Macierz odwrotna 664. Zadania do rozdziału II 69

Rozdział III. Układy równań liniowych 771. Układy równań liniowych 772. Przekształcenia elementarne macierzy 803. Metoda Gaussa rozwiązywania układów równań 854. Formy kwadratowe 895. Zadania do rozdziału III 94

Rozdział IV. Przekształcenia liniowe 991. Pojęcie przekształcenia liniowego 992. Postać macierzowa przekształceń liniowych 1013. Zmiany baz 1034. Wartości i wektory własne 1045. Zadania do rozdziału IV 107

Skorowidz 109

Bibliografia 111

1

ROZDZIAŁ I

Struktury liczbowe

1. Wstęp mnogościowy

Rozpoczniemy wykład od ustalenia pojęć i zebrania podstawowych faktów, którepóźniej wykorzystamy.

Pojęciem podstawowym jest zbiór. Przyjmijmy, że pojęcie zbioru jest dla nas intu-icyjnie zrozumiałe.

Tak więc, jeśli A jest zbiorem, a x należy do zbioru A, czyli x jest elementem zbioruA, to piszemy

x ∈ A.W przeciwnym przypadku piszemy x /∈ A. Często zbiór można opisać wyliczając jegoelementy. Na przykład, jeśli zbiór A składa się jedynie z liczb 1, 2 oraz 3, to zapisujemyten fakt następująco:

A = {1, 2, 3}.Niekiedy zbiór można opisać przez podanie formuły, którą spełniają jego elementy. Takwięc jeśli B jest zbiorem wszystkich rozwiązań równania

x2 − 3x+ 2 = 0,

to piszemyB = {x ∈ R : x2 − 3x+ 2 = 0}.

Wówczas, jak łatwo sprawdzić, B = {1, 2}.W określeniu zbioru B pojawił się symbol R oznaczający zbiór wszystkich liczb

rzeczywistych. Ma on znaczenie zasadnicze w matematyce i na jego temat powiemynieco więcej. Równie ważny jest podzbiór liczb rzeczywistych składający się z liczbnaturalnych. W tym miejscu trzeba dodać, że zbiór A jest zawarty w zbiorze B, cozapisujemy symbolicznie

A ⊆ B,

jeśli każdy element zbioru A jest także elementem zbioru B. Mówimy wtedy, że A jestpodzbiorem zbioru B.

Mając dwa zbiory A i B możemy mówić o ich sumie i iloczynie. Sumą zbiorów A iB nazywamy zbiór A ∪B złożony z tych elementów x, że x ∈ A lub x ∈ B. Iloczynemzbiorów A i B nazywamy zbiór A∩B, którego elementami są takie x, że x ∈ A i x ∈ B.Oprócz tego możemy mówić o różnicy A \ B zbiorów A i B. Składa się ona z tych x,że x ∈ A i x /∈ B.

3

4 I. STRUKTURY LICZBOWE

Ważnym pojęciem w matematyce jest iloczyn kartezjański. Aby go zdefiniowaćtrzeba dysponować pojęciem pary uporządkowanej (a, b). Nie wnikając w dokładną jejdefinicję poprzestaniemy na zasadniczej własności par uporządkowanych. Otóż (a, b) =(c, d) wtedy i tylko wtedy, gdy a = c oraz b = d. Jeśli A i B są zbiorami, to ich iloczynemkartezjańskim jest zbiór

A×B = {(a, b) : a ∈ A oraz b ∈ B}.Jeśli mamy dwa zbiory X i Y , i każdemu elementowi x ∈ X przyporządkowany

jest dokładnie jeden f(x) ∈ Y , to takie przyporządkowanie f nazywamy funkcją. Sto-sujemy oznaczenie f : X → Y . Zbiór X, na którym określona jest funkcja f nazywamydziedziną funkcji f , który oznaczamy też Df , a zbiór Y przeciwdziedziną funkcji f .Zbiór

f(X) = {f(x) : x ∈ X}zbiorem wartości funkcji f .

Jeśli f : X → Y oraz g : Y → Z, to możemy rozważać złożenie funkcji f i g czylifunkcję, którą oznaczamy symbolem g ◦ f , a definiujemy jako:

g ◦ f(x) = g(f(x)).

ZbiórWf = {(x, f(x)) ∈ X × Y : x ∈ Df}

nazywamy wykresem funkcji f .Funkcję f nazywamy różnowartościową, jeśli dla dowolnych x1, x2 ∈ Df zachodzi

x1 6= x2 ⇒ f(x1) 6= f(x2).

Jeśli funkcja f : X → Y jest różnowartościowa oraz zbiór wartości funkcji f(X) jestrówny Y , to możemy mówić o funkcji odwrotnej f−1 : Y → X zdefiniowanej wzorem

f−1(y) = x, jeśli f(x) = y.

2. Liczby naturalne. Indukcja Matematyczna

Liczb naturalnych, podobnie jak pojęcia zbioru, nie będziemy definiować. Zbiórliczb naturalnych będziemy oznaczać symbolem N, tzn.

N = {1, 2, 3, . . . }.Trzy kropki następujące po trzecim przecinku oznaczają, że dalej następują kolejneelementy, czyli kolejne liczby naturalne. W zbiorze liczb naturalnych N nie ma liczbynajwiększej, a więc zbiór ten jest nieskończony. Jest natomiast liczba najmniejsza.Przyjmuje się jako pewnik (czyli aksjomat) następujące stwierdzenie:

(Zasada Minimum). Jeśli zbiór A ⊆ N ma przynajmniej jeden element, to wśródelementów zbioru A jest liczba najmniejsza.

2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 5

Powyższa zasada, choć nie można jej udowodnić, wydaje się intuicyjnie jasna, a jejprawdziwość nie budzi wątpliwości. Jednak wynikające z niej wnioski, a w szczególnościZasada Indukcji Matematycznej, już nie zawsze są tak łatwe do zaakceptowania.

Twierdzenie 2.1 (Zasada Indukcji Matematycznej). Jeśli A jest takim podzbioremzbioru liczb naturalnych, że:

(I) 1 ∈ A,(II) jeśli n ∈ A, to także n+ 1 ∈ A,

to wówczas każda liczba naturalna należy do A, tzn. A = N.

Twierdzenie to można łatwo uzasadnić przy pomocy Zasady Minimum. Istotnie,gdyby zbiór A zawarty w zbiorze N liczb naturalnych spełniał warunki (I) oraz (II), abył od niego różny, to na mocy Zasady Minimum musiałaby istnieć najmniejsza takaliczba, powiedzmy n0, która do niego nie należy. Oczywiście n0 > 1, bo 1 ∈ A. Skorojednak n0 jest liczbą najmniejszą wśród tych, które nie należą do A, to n0− 1 ∈ A. Tojednak przeczy określeniu liczby n0, bo na mocy warunku (II), n0 = (n0 − 1) + 1 ∈ A.

Często wygodniej jest posługiwać się Zasadą Indukcji Matematycznej w wersjiuogólnionej:

Twierdzenie 2.2 (Zasada Indukcji Matematycznej ∗). Niech W będzie własnościąprzysługującą liczbom naturalnym, a W(n) niech oznacza, że liczba n ma własność W.Wówczas, jeśli spełnione są dwa warunki:

(I*) zachodzi W(1),(II*) jeśli zachodzi W(n), to zachodzi również W(n+ 1),

to własność W zachodzi dla wszystkich liczb naturalnych.

Zasada Indukcji Matematycznej jest jednym z najważniejszych narzędzi, przy po-mocy których dowodzi się twierdzeń. Zilustrujemy to na kilku przykładach.

Przykład 2.1. Dla każdej liczby naturalnej n suma wszystkich kolejnych liczbnaturalnych od 1 aż do n włącznie jest równa 12n(n+ 1), tzn.

(1) 1 + 2 + 3 + · · ·+ n =n(n+ 1)

2,

przy czym po lewej stronie równości występuje suma n składników, tzn. dokładnie tyleile wynosi liczba n.

Aby udowodnić powyższy wzór rozważmy własność W(n) mówiącą, że zachodzirówność (1). Wówczas oczywiście zachodzi W(1), bo po lewej stronie równości mamy1, a po prawej ułamek 1(1+1)

2 . Zatem spełniony jest warunek (I*) Zasady IndukcjiMatematycznej. Aby sprawdzić warunek (II*) wystarczy do obydwu stron równości(1) dodać liczbę n+ 1. Wówczas otrzymujemy

1 + 2 + 3 + · · ·+ n+ (n+ 1) =

=n(n+ 1)

2+ (n+ 1) =

n(n+ 1) + 2(n+ 1)2

=(n+ 1)(n+ 2)

2,

6 I. STRUKTURY LICZBOWE

co właśnie oznacza, że zachodzi warunek W(n+ 1).

Ze wzoru (1) wynika w szczególności, że suma liczb od 1 do 100 wynosi 5050.Można to oczywiście sprawdzić dodając do siebie kolejnych 100 liczb, co jest oczywiściedość żmudne. Poza tym nie jesteśmy w stanie wykonać nieskończenie wiele tego typuobliczeń. Na tym właśnie polega siła Indukcji Matematycznej. Jednak sprawdzeniewzoru dla nawet bardzo wielu liczb nie oznacza jeszcze, że jest on prawdziwy dlawszystkich liczb naturalnych. Przykładem może być wielomian Eulera

E(n) = n2 + n+ 41.

Można sprawdzić, że wstawiając w miejsce n kolejno liczby:

0, 1, 2, 3, ..., 39

otrzymane w ten sposób liczby E(n) są liczbani pierwszymi, tzn. jedynymi liczbaminaturalnymi, przez które daje się podzielić bez reszty są 1 oraz E(n). Można by więcprzypuszczać, że tak jest zawsze. Niestety

E(40) = 402 + 40 + 41 = 41 · 41,

a więc E(40) nie jest liczbą pierwszą. O liczbach pierwszych powiemy jeszcze niecopóźniej.

Przykład 2.2 (Suma wyrazów postępu geometrycznego). Jeśli q jest liczbą rze-czywistą różną od 1, to dla każdej liczby naturalnej n prawdziwy jest wzór:

(2) 1 + q + q2 + · · ·+ qn =1− qn+1

1− q,

przy czym po lewej stronie równości występuje suma n+1 składników, z których każdynastępny jest kolejną potęgą liczby q. Zauważmy także, że q0 = 1.

Przykład 2.3 (Nierówność Bernoulliego). Dla dowolnej liczby rzeczywistej x >−1 i dla dowolnej liczby naturalnej n zachodzi wzór:

(3) (1 + x)n > 1 + nx.

Warunek (I*) w dowodzie indukcyjnym tej nierówności jest oczywisty; zachodzi nawetrówność. Aby uzasadnić warunek (II*) wystarczy pomnożyć obustronnie wzór 3 przez1 + x. Nierówność się zachowa bo x > −1 i będziemy mieli

(1 + x)n+1 = (1 + x)n(1 + x) > (1 + nx)(1 + x) =

= 1 + nx+ x+ nx2 > 1 + (n+ 1)x,

bo nx2 > 0 dla każdej liczby rzeczywistej.

Indukcji matematycznej możemy także użyć do definiowania nowych pojęć. W ta-kich przypadkach Zasada Indukcji Matematycznej pozwala nam upewnić się, że danepojęcie określone jest dla wszystkich liczb naturalnych.

2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 7

Przykładem takiej sytuacji jest definicja symbolu n! (czytamy „en silnia”). Przyj-mujemy więc co następuje:

0! = 1,1! = 1,

(n+ 1)! = n! · (n+ 1).

Innymi słowy n! (dla n > 1) jest to iloczyn wszystkich kolejnych liczb naturalnychlicząc od 1 aż do n włącznie, tzn.

n! = 1 · 2 · · · · · n.Przy pomocy tego pojęcia możemy policzyć ilość wszystkich możliwych ustawień ele-mentów zbioru n-elementowego. Można odpowiedzieć na przykład na pytanie: na ilesposobów można posadzić 5 osób przy stole prezydialnym? Zanim odpowiemy na to py-tanie, sprecyzujemy pojęcie „ustawienia” lub „uszeregowania”. Są to synonimy słowapermutacja.

Definicja 2.1. Permutacją elementów zbioru {x1, . . . , xn} nazywamy każdy układpostaci

p = (xi1 , xi2 , . . . , xin),w którym dla każdego k 6 n element xik stoi na pozycji k.

Zatem permutacja elementów zbioru

A = {x1, . . . , xn}polega na tym, że pozycja każdego elementu zbioru A jest w niej ściśle określona.Przestawienie elementów daje nam inną permutację. Na przykład zbiór {x, y, z} jestidentyczny ze zbiorem {z, y, x} bo ma te same elementy, a permutacje (x, y, z) oraz(z, y, x) tego samego zbioru elementów są różne.

Przykład 2.4. Lista wszystkich permutacji zbioru A = {1, 2, 3} jest następująca:

p1 = (1, 2, 3)

p2 = (1, 3, 2)p3 = (2, 1, 3)p4 = (2, 3, 1)p5 = (3, 1, 2)p6 = (3, 2, 1).

Łatwo zauważyć, że wszystkie te permutacje różnią się między sobą. Natomiast fakt,że wyczerpują one całą listę możliwych permutacji wymaga już zastanowienia lub za-stosowania następującego twierdzenia:

Twierdzenie 2.3. Dla każdej liczby naturalnej n, każdy zbiór składający się z nelementów ma dokładnie n! permutacji.

8 I. STRUKTURY LICZBOWE

Także i to twierdzenie można udowodnić metodą indukcyjną. Jeśli zbiór jest jedno-elementowy, to ma oczywiście tylko jedną permutację bo jego elementu nie ma z czymprzestawić. Jeśli założymy, że każdy zbiór n-elementowy ma n! permutacji, to nietrud-no zauważyć, że zbiór złożony z n + 1 elementów będzie miał ich (n + 1)!. Istotnie,jeśli wybierzemy sobie jeden z elementów tego zbioru, to wszystkie pozostałe możnaustawić na n! sposobów. Z drugiej zaś strony pojedyńczy element można w permutacjin+ 1-elementowej ustawić na n+ 1 sposobów. Zatem wszystkich możliwych ustawieńjest

(n+ 1) · n!,co na mocy definicji symbolu silni daje (n+ 1)!, a to kończy dowód.

Zbiór wszystkich permutacji zbioru n-elementowego {1, . . . , n} oznaczać będziemysymbolem Pn.

Z powyższego twierdzenia wynika, że lista permutacji w przykładzie 2.4 jest kom-pletna: powinno ich być 3! czyli 6. atwo również odpowiedzieć na wcześniejsze pytanieo ilość możliwości rozmieszczenia 5 osób przy stole: tych możliwości jest 120. Innyprzykład: wszystkich możliwych ułożeń talii 52 kart jest 52!, co w przybliżeniu wynosi807·1065. Jak więc widać liczby n! rosną bardzo szybko. Świadczy o tym także następnyprzykład.

Przykład 2.5. Dla dowolnej liczby naturalnej n zachodzi nierówność:

(4) n! > 2n−1.

Istotnie, dla n = 1 po obydwu stronach nierówności mamy 1. Aby sprawdzić warunek(II*) Zasady Indukcji Matematycznej załóżmy, że n > 1 oraz, że zachodzi nierów-ność (4). Skoro n+ 1 > 2, to mamy

(n+ 1)! = n!(n+ 1) > 2n−1 · 2 = 2n,

co kończy dowód.

Okazuje się, że liczby postaci n! rosną znacznie szybciej niż liczby 2n; w istociestosunek

n!2n

rośnie do nieskończoności.Jeśli A = {1, 2, . . . , n}, to z każdą permutacją elementów zbioru A związane jest

pojęcie inwersji.

Definicja 2.2. Mówimy, że para (xi, xj) tworzy inwersję w permutacji

p = (x1, x2, . . . , xn)

zbioru {1, 2, . . . , n}, jeśli xi > xj, a jednocześnie i < j.

Mówiąc prościej: inwersja w permutacji ma miejsce wtedy, gdy liczba większa wy-stępuje w tej permutacji przed liczbą mniejszą. Ilość inwersji w permutacji p będziemyoznaczali symbolem I(p).

2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 9

Przykład 2.6. Permutacje zbioru trójelementowego {1, 2, 3} wyszczególnione wprzykładzie 2.4 mają następujące liczby inwersji:

I(p1) = 0, I(p2) = I(p3) = 1, I(p4) = I(p5) = 2 oraz I(p6) = 3.

Sprawdźmy ostatnią z tych równości. atwo zobaczyć, że w permutacji p6 = (3, 2, 1)mamy trzy inwersje: (3, 2), (3, 1) oraz (2, 1).

Z pojęciem permutacji związane są także tzw. współczynniki Newtona(nk

). Dla

dowolnych liczb całkowitych n oraz k większych lub równych 0, przy czym k 6 n,przyjmujemy (

n

k

)=

n!k!(n− k)!

.

Nietrudno sprawdzić, że zachodzą następujące równości:

(n

0

)=(n

n

)= 1(5) (

n

1

)= n(6) (

n

k

)=(

n

n− k

)(7) (

n

k

)+(

n

k + 1

)=(n+ 1k + 1

)(8)

Wzory (5), (6) i (7) wynikają wprost z definicji, a dla dowodu wzoru (8) wystarczysprowadzić dwa ułamki do wspólnego mianownika:

(n

k

)+(

n

k + 1

)=

n!k! (n− k)!

+n!

(k + 1)! [n− (k + 1)]!=

=n! (k + 1) + n! (n− k)

(k + 1)! (n− k)!=n! [(k + 1) + (n− k)]

(k + 1)! (n− k)!=

=n! (n+ 1)

(k + 1)! [(n+ 1)− (k + 1)]!=

(n+ 1)!(k + 1)! [(n+ 1)− (k + 1)]!

=(n+ 1k + 1

).

Przy pomocy wzoru (8) można obliczać kolejne liczby(nk

)ustawiając je w następującej

tablicy zwanej trójkątem Pascala:

10 I. STRUKTURY LICZBOWE

11 1

1 2 11 3 3 1

1 4 6 4 11 5 10 10 5 1

1 6 15 20 15 6 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Liczba znajdująca się w n-tym wierszu tej tablicy na pozycji k odpowiada współ-czynnikowi Newtona

(nk

); pamiętać należy jednak, że zarówno wiersze jak i pozycje w

wierszach liczymy od 0. Na przykład widoczna powyżej liczba 20 stojąca w szóstymwierszu odpowiada współczynnikowi

(63

). Kolejne wiersze powstają w ten sposób, że

na początku oraz na końcu każdego wiersza jest liczba 1, a każda inna jest sumą dwóchliczb, które znajdują się nad nią w wierszu poprzednim.

Przy pomocy współczynników Newtona można obliczyć ilość tzw. kombinacji k-elementowych wybranych ze zbioru n-elementowego, czyli ilość wszystkich możliwychwyborów k elementów spośród n elementów. Kolejność elementów jest dla poszcze-gólnego wyboru nieistotna. Chodzi tu jedynie o ilość podzbiorów k-elementowychzawartych w zbiorze n-elementowym. Oczywiście podzbiór n-elementowy zbioru n-elementowego jest z nim identyczny, a więc jest tylko jeden. Także zbiór pusty, czylitaki, który nie ma żadnego elementu jest jeden. Ogólnie prawdziwe jest następującetwierdzenie:

Twierdzenie 2.4. Ilość podzbiorów k-elementowych dowolnego zbioru n-elementowegowynosi

(nk

).

Uzasadnienie tego twierdzenia przeprowadzimy indukcyjnie ze względu na n. Wpierwjednak przyjmijmy następujące oznaczenia: niech |X| oznacza ilość elementów zbioruX, a [X]k zbiór wszystkich jego k-elementowych podzbiorów. Zatem, gdy n = 0 totakże k = 0 i zbiór [X]k jest jednoelementowy, bo składa się jedynie ze zbioru pustego.Z drugiej zaś strony mamy równość(

00

)=

0!0! · 0!

= 1

bo 0! = 1. Załóżmy zatem, że równość

|[Y ]k| =(n

k

)

zachodzi dla każdego zbioru n-elementowego Y i każdego k 6 n. Ustalmy zbiór (n+1)-elementowy X i rozważmy zbiór

Ck = {(a,A) : a ∈ A,A ⊆ X oraz |A| = k},

2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 11

gdzie k 6 n + 1. Dalsza część dowodu oparta jest na standardowym triku kombina-torycznym: policzymy ilość elementów zbioru Ck na dwa sposoby, a następnie porów-namy. Przy każdym ustalonym A ∈ [X]k istnieje dokładnie k elementów a takich, że(a,A) ∈ Ck. Zatem otrzymujemy

|Ck| = k · |[X]k|.Z drugiej strony, jeśli ustalimy element a ∈ X oraz para (a,A) ∈ Ck, to pozostałeelementy zbioru A, czyli elementy zbioru A\{a} są wybrane ze zbioru n-elementowegoY = X \ {a}. Korzystając z założenia indukcyjnego otrzymujemy równość

|Ck| = (n+ 1) ·(

n

k − 1

).

Porównując obydwie równości dostajemy ostatecznie

|[X]k| = n+ 1k·(

n

k − 1

)=n+ 1k· n!

(k − 1)! · (n− (k − 1))!=(n+ 1k

),

co kończy dowód.Przy pomocy współczynników Newtona można także zapisać wzór dwumienny

Newtona pozwalający na obliczanie wyrażeń postaci (x + y)n, gdzie n jest dowolnąliczbą naturalną.

Zanim zapiszemy ten wzór przyjmijmy pewną umowę, tzw. konwencję sumacyjnąprzyjętą powszechnie nie tylko w matematyce. Wielką literą grecką Σ (czytaj „sigma”)będziemy oznaczać dodawanie liczb, których wartości zależą od elementów należącychdo danego zbioru. Zatem jeśli A = {1, 2, . . . , n}, to symbol∑

k∈Aak oznacza sumę a1 + a2 + · · ·+ an.

Na przykład, jeśli A = {1, 2, 3, 4, 5}, to∑k∈A

k2 = 1 + 22 + 32 + 42 + 52 = 55,

a jeśli A = {2, 4, 6, 7}, to ∑k∈A

k2 = 22 + 42 + 62 + 72 = 105.

Na ogół jednak tym danym zbiorem będzie u nas odcinek zbioru liczb naturalnychpostaci {1, 2, . . . , n} lub {m,m+ 1,m+ 2, . . . , n}. Wtedy piszemy

n∑k=1

ak = a1 + a2 + · · ·+ an lubn∑

k=m

ak = am + am+1 + · · ·+ an.

Czasami wygodnie jest założyć, że zbiór A zaczyna się od 0, wtedy∑k∈A

ak =n∑k=0

ak = a0 + a1 + · · ·+ an.

12 I. STRUKTURY LICZBOWE

Dzięki prawom przemienności dodawania oraz rozdzielności mnożenia względemdodawania mamy wzór:

(9) αn∑k=1

ak + βn∑k=1

bk =n∑k+1

(αak + βbk).

Z twierdzenia 2.4 wynika następujący ważny wzór:

Twierdzenie 2.5 (Wzór dwumienny Newtona). Dla dowolnej liczby naturalnej noraz dowolnych liczb rzeczywistych x i y zachodzi wzór:

(10) (x+ y)n =n∑k=0

(n

k

)xn−kyk.

Istotnie, skoro(x+ y)n = (x+ y)(x+ y) · . . . (x+ y),

to, na mocy zasady rozdzielności mnożenia względem dodawania, wyrażenie (x + y)n

jest równe sumie wyrażeń postaci xn−kyk. Powstają one w ten sposób, że z każdegospośród n nawiasów wybieramy x lub y, przy czym jeśli wybierać będziemy elementy k-krotnie, a w pozostałych przypadkach (czyli n − k-krotnie) wybierzemy elementx, to otrzymamy składnik xn−kyk. Ponieważ wyborów takich jest dokładnie

(nk

)to

współczynnik przy xn−kyk będzie równy właśnie(nk

). To kończy dowód wzoru Newtona.

W szczególności dla n = 2 oraz n = 3 mamy znane wzory:

(x+ y)2 = x2 + 2xy + y2,

oraz(x+ y)3 = x3 + 3x2y + 3xy2 + y3.

Wstawiając we wzorze (10) x = y = 1 otrzymujemy równośćn∑k=0

(n

k

)= 2n.

Interpretacja tego wzoru jest oczywista: wszystkich podzbiorów zbioru n-elementowegojest dokładnie 2n.

3. Liczby całkowite, wymierne i rzeczywiste

Zbiorem szerszym od zbioru N liczb naturalnych jest zbiór Z liczb całkowitych,który poza elementami zbioru N zawiera jeszcze 0 oraz liczby postaci −n, gdzie n ∈ N.Zatem

Z = N ∪ {0} ∪ {−n : n ∈ N}.Inaczej mówiąc zbiór liczb całkowitych składa się z liczb całkowitych dodatnich (czyliliczb naturalnych), zera oraz z liczb całkowitych ujemnych. Ma więc postać:

. . . ,−3,−2,−1, 0, 1, 2, 3, . . .

3. LICZBY CAŁKOWITE, WYMIERNE I RZECZYWISTE 13

Ogólniejsze od liczb całkowitych są liczby wymierne, które mają postaćp

q,

gdzie p jest dowolną liczbą całkowitą, a q jest liczbą naturalną. Zatem liczby wymierneto nic innego, jak dobrze znane ułamki, przy czym przyjmujemy, że

p

q=x

y

jeśli py = xq. W szczególności mamy więc12

=24

=36.

Zbiór wszystkich liczb wymiernych oznaczamy symbolem Q. Wiadomo, że w mianow-niku ułamka nie może pojawić się zero, lecz może pojawić się jedynka. W takim przy-padku liczba wymierna jest liczbą całkowitą. Przypomnijmy także, że ułamki dają sięniekiedy uprościć przez podzielenie mianownika i licznika przez wspólny czynnik. Takaprocedura ma charakter skończony i prowadzi do ułamka nieskracalnego, np.

3042

=1521

=57.

W ułamku nieskracalnym, licznik i mianownik nie mają wspólnego dzielnika różnegood 1 i −1, a więc są względnie pierwsze. Własności działań na liczbach wymiernychsą czytelnikowi zapewne dobrze znane. Przypomnijmy oczywiste prawa mnożenia idodawania ułamków:

a

b· cd

=a · cb · d

,

a

b+c

d=a · d+ b · c

b · d.

Liczby wymierne nie wystarczają do mierzenia wielkości występujących w matematycea także w świecie realnym. Na przykład: jak wynika z twierdzenia Pitagorasa, przekątnakwadratu o boku długości 1 ma długość równą liczbie, która podniesiona do kwadratudaje 2. Nie jest to liczba wymierna, bo w przeciwnym wypadku można by ją przedstawićw postaci ułamka nieskracalnego postaci a

b. Mielibyśmy wówczas(

a

b

)2= 2.

Jeśliby liczba a była nieparzysta, to była by postaci a = 2k + 1. Mielibyśmy wówczas

2b2 = a2 = (2k + 1)2 = 4k2 + 4k + 1,

co jest niemożliwe, bo z lewej strony powyższej równości mamy liczbę parzystą, a poprawej nieparzystą. Wobec tego liczba a musi być parzysta, a więc a = 2r dla pewnejliczby naturalnej r. To daje równość (2r

b

)2= 2,

14 I. STRUKTURY LICZBOWE

która po przekształceniu ma postać

b2

r2= 2.

Rozumując jak poprzednio dochodzimy do wniosku, że także b jest liczbą parzystą, cojednak przeczy nieskracalności ułamka a

b.

Tak więc, aby zmierzyć długość przekątnej kwadratu o boku 1 musimy zgodzić sięna istnienie liczby

√2, która nie jest wymierna. Fakt ten był już prawdopodobnie znany

filozofom z kręgu Pitagorasa, a jest także wspomniany w dziele Euklidesa Elementy.Niewymierność innej ważnej liczby ma także starożytny rodowód: od bardzo dawna

było wiadomo, że stosunek długości obwodu koła do długości jego średnicy jest stałyniezależnie od wielkości koła. Stosunek ten oznaczamy obecnie symbolem π. Od naj-dawniejszych czasów próbowano ustalić jego dokładną wielkość. Tak więc Archimedesuważał, że wynosi on 227 , Ptolemeusz przyjmował π równe 3 + 8

60 + 303600 , a matematyk

hinduski Bhaskara w XII wieku ustalił wielkość π na 754240 . Dopiero matematyk holender-ski Ludolph van Coolen w roku 1610 wyznaczył przybliżoną wartość π z dokładnościądo 35 miejsc po przecinku. Stąd też liczba π nazywana jest także ludolfiną.

Nie wchodząc głębiej w naturę liczb rzeczywistych przyjmijmy jedynie, że zbiór Rwszystkich liczb rzeczywistych spełnia następujący aksjomat:

(Aksjomat Dedekinda). Jeśli R = A ∪ B i zbiory A i B nie są puste oraz dladowolnego a ∈ A i dowolnego b ∈ B zachodzi nierówność

a < b,

to wśród liczb należących do zbioru A jest liczba największa albo wśród liczb należącychdo zbioru B jest liczba najmniejsza.

Dzięki temu postulatowi dla każdego zbioru ograniczonego złożonego z liczb rzeczy-wistych możemy określić jego kres górny (= supremum) oraz kres dolny (= infimum).

Definicja 3.1. Mówimy, że zbiór X ⊆ R jest ograniczony z góry, gdy istnieje takaliczba α ∈ R, że nierówność

x 6 α

zachodzi dla każdego x ∈ X. Podobnie mówimy, że zbiór A jest ograniczony z dołu,gdy istnieje taka liczba β ∈ R, że nierówność

β 6 x

zachodzi dla każdego x ∈ X. Liczby α i β nazywamy, odpowiednio ograniczeniemgórnym i ograniczeniem dolnym zbioru A.

Nie każdy zbiór liczb jest ograniczony, np. okazuje się, że zbiór{2n

n∈ Q : n ∈ N

}nie jest ograniczony z góry ale jest ograniczony z dołu. Natomiast zbiór

{a ∈ Q : a2 < 2}

3. LICZBY CAŁKOWITE, WYMIERNE I RZECZYWISTE 15

jest ograniczony z góry na przykład przez liczbę 142100 . Z Aksjomatu Dedekinda wynikaco następuje:

Twierdzenie 3.1. Niech X ⊆ R będzie dowolnym zbiorem niepustym. Wówczas:

(1) jeśli zbiór X jest ograniczony z góry, to istnieje taka liczba

α = supX,

nazywana kresem górnym zbioru X, że α jest najmniejszym ograniczeniemgórnym zbioru X, tzn. x 6 α dla każdego x ∈ X oraz jeśli α′ < α, to istniejetakie x ∈ X, że α′ < x.

(2) jeśli zbiór X jest ograniczony z dołu, to istnieje taka liczba

β = inf X,

nazywana kresem dolnym zbioru X, że β jest największym ograniczeniem dol-nym zbioru X, tzn. β 6 x dla każdego x ∈ X oraz jeśli β < β′, to istniejetakie x ∈ X, że x < β′.

Istotnie, ustalmy zbiór niepusty X ograniczony z góry. Wówczas zbiór

B = {b ∈ R : x < b dla każdego x ∈ X}

jest także niepusty. Jeśli zaś jako A przyjmiemy dopełnienie zbioru B, tzn.

A = {a ∈ A : a /∈ B},

to otrzymamy taki zbiór niepusty, że A ∪ B = R. Istotnie, z określenia zbioru Bwynika, że żaden element zbioru X nie należy do B, a więc X ⊆ A, przy czym zbiórX jest niepusty. Jeśli w zbiorze A jest liczba największa, powiedzmy a0, to x 6 a0,bo X ⊆ A. Wówczas a0 jest elementem największym w X (a więc a0 = supX), bow przeciwnym wypadku a0 należałoby do B. Jeśli zaś w B jest liczba najmniejsza, tozgodnie z definicją jest ona kresem górnym zbioru X. Drugiej części twierdzenia 3.1dowodzi się analogicznie.

Można nietrudno sprawdzić, że

sup{a ∈ Q : a2 < 2} = inf{a ∈ Q : 2 < a2} =√

2.

Pojęcie kresu górnego i kresu dolnego należą do najważniejszych w tej części matema-tyki, którą nazywamy analizą matematyczną. Przy jego pomocy można w szczególnościrozszerzyć pojęcie potęgowania liczb na przypadek, gdy wykładnik potęgi jest liczbąniewymierną. Dla liczb wymiernych postaci p

qoraz dodatnich x ∈ R mamy

xpq = q√xp;

możemy przy tym zakładać, że q ∈ N. Jeśli α ∈ R oraz x > 0, to przyjmujemy

xα = sup{xw : w ∈ Q oraz w 6 α},

16 I. STRUKTURY LICZBOWE

jeśli x > 1. Definicja jest poprawna bo dla x > 1 zbiór {xw : w ∈ Q oraz w 6 α}jest ograniczony z góry przez każdą liczbę postaci xs, gdzie α 6 s oraz s ∈ Q. Jeśli0 < x < 1, to przyjmujemy

xα = inf{xw : w ∈ Q oraz w 6 α}.

Wśród podzbiorów zbioru R liczb rzeczywistych będziemy wyróżniali przedziały;zbiór ∆ nazywamy przedziałem, jeśli dla dowolnych liczb x, y, z ∈ R takich, że x <y < z zachodzi warunek:

x, z ∈ ∆ pociąga y ∈ ∆.

Bywają rozmaite przedziały: z końcami lub bez końców, ograniczone lub nieograniczo-ne. Oto one:

(a, b) = {x ∈ R : a < x < b},

[a, b) = {x ∈ R : a 6 x < b},

(a, b] = {x ∈ R : a < x 6 b},

[a, b] = {x ∈ R : a 6 x 6 b},

(−∞, a) = {x ∈ R : x < a},

(−∞, a] = {x ∈ R : x 6 a},

(a,∞) = {x ∈ R : a < x},

[a,∞) = {x ∈ R : a 6 x}.

Możemy także uważać, że

R = (−∞,∞).

Przedziały bez końców postaci (a, b) nazywamy otwartymi, a przedziały wraz z końcami[a, b] przedziałami domkniętymi.

Każdej liczbie rzeczywistej x można przyporządkować największą liczbę całkowitą cnie większą od x. Liczbę c nazywamy częścią całkowitą liczby x i oznaczamy symbolem[x]. Na przykład [π] = 3, [12 ] = 0, [−65 ] = −2.

Na koniec odnotujmy własności wartości bezwględnej. Przypomnijmy, że wartośćbezwględną liczby x (lub inaczej moduł liczby x), którą oznaczamy symbolem |x|,definiujemy wzorem:

|x| =

x, jeśli x > 0−x, jeśli x < 0

.

Najważniejsze własności wartości bezwzględnej zawarte są w następującym twierdze-niu:

4. WIELOMIANY 17

Twierdzenie 3.2. Dla dowolnych liczb rzeczywistych x, y oraz a > 0 zachodząnastępujące wzory:

− |x| 6 x 6 |x|(a)

|x| 6 a wtedy i tylko wtedy, gdy − a 6 x 6 a(b)

|x+ y| 6 |x|+ |y|(c)

|x| − |y| 6 |x− y|(d)

|xy| = |x| · |y|(e)

Własności (a), (b) oraz (e) wynikają wprost z definicji. Zauważmy, że na mocywłasności (a) mamy

−|x| 6 x 6 |x| oraz − |y| 6 y 6 |y|.Dodając te nierówności stronami otrzymujemy

−(|x|+ |y|) 6 x+ y 6 |x|+ |y|.Zatem na mocy własności (b) mamy

|x+ y| 6 |x|+ |y|.Dysponując już własnością (c) możemy napisać, że

|x| = |(x− y) + y| 6 |x− y|+ |x|skąd

|x| − |y| 6 |x− y|.

4. Wielomiany

Omówimy wpierw w skrócie niektóre własności arytmetyczne liczb całkowitych, awięc własności związane z podzielnością. Mówimy, że liczba całkowita a jest podzielnaprzez liczbę całkowitą b, albo, że liczba b dzieli a (bez reszty), gdy a jest wielokrotnościąliczby b, tzn. gdy istnieje taka liczba całkowita c, że a = bc. Fakt, że b dzieli a zapisujemysymbolicznie w następujący sposób:

b|a.Z prawa łączności wynika, że jeśli b|a oraz b|c, to także b|a + c. Liczba 1 dzieli

każdą liczbę naturalną, a z drugiej strony, jeśli liczba b dzieli a, to nie może być od niejwiększa. Zatem dla dowolnych dwóch liczb, powiedzmy a oraz b, istnieje największaliczba, która dzieli obydwie. Oznaczamy ją symbolem

NWD(a, b)

i nazywamy największym wspólnym dzielnikiem liczb a i b. Jeśli NWD(a, b) = 1, tomówimy, że a i b są względnie pierwsze. Na przykład liczby 4 i 9 są względnie pierwsze,a liczby 6 i 9 nie są. Tak więc licznik i mianownik w ułamku nieskracalnym są liczbamiwzględnie pierwszymi.

Dla liczb względnie pierwszych zachodzi następujące ważne twierdzenie:

18 I. STRUKTURY LICZBOWE

Twierdzenie 4.1. Dla dowolnych liczb całkowitych dodatnich a i b istnieją takieliczby całkowite x i y, że

NWD(a, b) = ax+ by.

W szczególności, jeśli liczby całkowite dodatnie a i b są względnie pierwsze, to istniejątakie liczby całkowite x i y, że

ax+ by = 1.

Aby to twierdzenie uzasadnić rozważmy zbiór

S = {ax+ by : ax+ by > 0 oraz x, y ∈ Z}.Na mocy Zasady Minimum istnieje

d = minS.

Istnieją wówczas liczby x0, y0 ∈ Z takie, że

d = ax0 + by0.

Pozostaje wykazać, że d = NWD(a, b). Zaważmy wpierw, że d|a. Istotnie, gdyby resztaz dzielenia a przez d była dodatnia, tzn. gdyby dla pewnego z ∈ N oraz 0 < r < dzachodziła równość a = zd+ r to mieli byśmy

r = a− zd = a− azx0 − by0 = a(1− zx0) + b(−y0) ∈ S,co daje sprzeczność z określeniem elementu d jako najmniejszego elementu w zbiorzeS.

Podobni dowodzi się, że d|b. Zatem d ¬ NWD(a, b). Jeśli zaś przyjmiemy, żeNWD(a, b) = d0, to d0|a oraz d0|b, czyli istnieją takie liczby x, y ∈ N, że a = xd0oraz b = yd0. Mamy wówczas

d = ax0 + by0 = xd0x0 + yd0y0 = d0(xx0 + yy0),

co w szczególności oznacza, że d ­ d0. Mamy więc równość d = d0, co kończy dowód.Teraz już łatwo otrzymujemy następujące twierdzenie:

Twierdzenie 4.2 (Zasadnicze Twierdzenie Arytmetyki). Jeśli liczby a i b są względ-nie pierwsze oraz a dzieli iloczyn bc, to a dzieli c.

Istotnie, skoro NWD(a, b) = 1, to z twierdzenia 4.1 wynika, że

ax+ by = 1

dla pewnych liczb x, y ∈ N, a więc

c = acx+ bcy.

Skoro zaś a|acx oraz a|bcy, to a|c.Metodą indukcji matematycznej twierdzenie to można nieco uogólnić:

Wniosek 4.1. Jeśli liczby a oraz b są względnie pierwsze oraz n jest liczbą natu-ralną, to

a|bnc pociąga a|c.

4. WIELOMIANY 19

Istotnie, jeśli a|bn+1c, to a|b(bnc). Zatem a|bnc, a więc na mocy założenia indukcyj-nego, a|c.

Przypomnijmy, że liczbę naturalną n > 1 nazywamy liczbą pierwszą, jeśli jedynymiliczbami naturalnymi przez które daje się ona podzielić jest 1 i ona sama. Najmniejsząliczbą pierwszą jest oczywiście 2. Jest to jedyna liczba pierwsza wśród liczb parzystych,ale oczywiście nie każda liczba nieparzysta jest liczbą pierwszą. Przykładem jest 9.Zauważmy także, że każde dwie różne liczby pierwsze są względnie pierwsze. Okazujesię, że każda liczba naturalna większa od 1 jest iloczynem pewnej ilości liczb pierwszych,tzn. zachodzi twierdzenie:

Twierdzenie 4.3. Jeśli liczba naturalna a > 1 nie jest liczbą pierwszą, to istniejeliczba naturalna k oraz liczby pierwsze p1, p2, . . . , pk takie, że

a = p1 · p2 · · · · · pk.

Istotnie, gdyby to twierdzenie nie było prawdziwe, to zgodnie z Zasadą Minimum,istniałaby najmniejsza liczba naturalna a0 > 1, która nie jest liczbą pierwszą, a mimoto nie jest iloczynem liczb pierwszych. Wówczas jednak a0 = b · c, przy czym 1 <b < a0, 1 < c < a0. Wobec tego każda spośród liczb b jak i c jest liczbą pierwsząlub jest iloczynami liczb pierwszych. W konsekwencji również a0 jest iloczynem liczbpierwszych. To daje sprzeczność.

Z tego twierdzenia wynika w szczególności, że liczb pierwszych jest nieskończeniewiele. Mówi o tym następujące twierdzenie, które wykorzystamy później.

Twierdzenie 4.4. Dla każdej liczby naturalnej istnieje liczba pierwsza od niej więk-sza.

Przypuśćmy, że tak nie jest. Wówczas zbiór P wszystkich liczb pierwszych jestskończony i możemy zapisać go w postaci

P = {p1, p2, . . . , pn}.Z poprzedniego twierdzenia wynika, że liczba

p = p1 · p2 · · · · · pn + 1

jest także pierwsza. Istotnie w przeciwnym wypadku mamy

p = q1 · q2 · · · · · qk,przy czym qi ∈ P dla każdego i = 1, 2, . . . , k. W szczególności qi|p dla każdego i =1, 2, . . . , k. Zatem każda z liczb qi dzieli różnicę

p− p1 · p2 · · · · · pn = 1,

co nie jest możliwe. To dowodzi, że p jest liczbą pierwszą. Z drugiej strony p jest większeod każdej liczby ze zbioru P , co daje sprzeczność.

Przypomnijmy, że wielomianem o współczynnikach rzeczywistych nazywamy wy-rażenie

a0 + a1x+ · · ·+ anxn,

20 I. STRUKTURY LICZBOWE

gdzie a0, a1, . . . , an są liczbami rzeczywistymi, a an 6= 0. Liczbę n nazywamy stopniemtego wielomianu.

Przy rozważaniu wielomianów pojawia się naturalny problem znajdywania jegopierwiastków, tzn. takich liczb x ∈ R, że w(x) = 0, gdzie w(x) jest wielomianem.Dla wielomianów stopnia większego od 2 nie zawsze jest to zadanie proste. Okazujesię, że dla wielomianów stopnia większego od 4 nie istnieją ogólne wzory pozwalająceobliczyć pierwiastki wielomianu. Oznacza to, że istnieją wielomiany stopnia 5 (takimwielomianem jest na przykład wielomian w(x) = x5 − 4x − 2), których pierwiastkinie dadzą się wyrazić przy pomocy (nawet wielokrotnie powtarzanych) działań aryt-metycznych i operacji wyciągania pierwiastków. Istnieje jednak nietrudne kryteriumpozwalające sprawdzić czy wielomian o współczynnikach całkowitych ma pierwiastkiwymierne. Brzmi ono następująco:

Twierdzenie 4.5 (O pierwiastkach wymiernych). Jeśli współczynniki wielomianuw(x) = a0 + a1x + · · · + anx

n są liczbami całkowitymi oraz liczba wymierna pq

będącaułamkiem nieskracalnym jest pierwiastkiem tego wielomianu, to wyraz wolny (czyli a0)jest podzielny przez p, a współczynnik przy największej potędze (czyli an) jest podzielnyprzez q.

W szczególności z tego kryterium wynika, że jeśli an = 1, to każdy pierwiastekwymierny jest od razu liczbą całkowitą.

Aby przekonać się, że twierdzenie jest prawdziwe załóżmy, że w(pq) = 0. Mamy

wówczas po wymnożeniu przez qn następującą równość:

anpn + an−1p

n−1q + · · ·+ a1pqn−1 + a0q

n = 0.

Skoro liczby p i q są względnie pierwsze oraz każdy składnik sumy poza pierwszymzawierają jako czynnik liczbę q (czyli dzielą się przez q), to także anpn jest podzielneprzez q. Stąd na mocy wniosku 4.1, q dzieli an. Analogicznie, skoro wszystkie składnikisumy poza być może ostatnim dzielą się przez p, to także a0qn dzieli się przez p, a więcna mocy tego samego wniosku, a0 jest podzielne przez p.

Wnioskiem z przytoczonego wyżej kryterium jest to, że dla każdej liczby naturalnejm pierwiastek n-tego stopnia z m jest albo liczbą naturalną albo jest liczbą niewymier-ną. Istotnie, rozważmy wielomian

f(x) = xn −m.

Oczywiście x = n√m jest pierwiastkiem tego wielomianu. Jeśli n

√m = p

q, gdzie p i

q są naturalne i względnie pierwsze, to zgodnie z powyższym kryterium q = 1, skądpn − m = 0 czyli m jest n-tą potęgą liczby p. Tak więc na przykład liczba 3

√4 jest

niewymierna.Wzór z przykładu 2.2 jest szczególnym przypadkiem wzoru występującego w na-

stępnym przykładzie. Wystarczy w nim przyjąć x = 1 oraz a = q.

4. WIELOMIANY 21

Przykład 4.1. Jeśli x oraz a są dowolnymi liczbami rzeczywistymi oraz x 6= a, todla dowolnej liczby naturalnej n zachodzi równość:

(11) xn + xn−1a+ xn−2a2 + · · ·+ xan−1 + an =xn+1 − an+1

x− a.

Zauważmy, że w kolejnych składnikach sumy po lewej stronie znaku równości wykładnikpotęgi przy x maleje o 1, zaś wykładnik przy a rośnie o 1.

Dowód tego wzoru przeprowadzimy indukcyjnie (tzn. w oparciu o twierdzenie 2.2)przyjmując, że własność W(n) mówi, że wzór (3) zachodzi dla liczby naturalnej n.Wtedy W(1) oznacza oczywistą równość

x+ a =x2 − a2

x− a.

Jeśli zachodziW(n), to aby sprawdzićW(n+1) pomnożymy równość (11) obustronnieprzez a, a następnie dodamy, do obydwu stron xn+1. Mamy wówczas

xn+1 + xna+ · · ·+ xan + an+1 =

= xn+1 + axn+1 − an+1

x− a=xn+1(x− a) + a(xn+1 − an+1)

x− a=xn+2 − an+2

x− a.

Wnioskiem ze wzoru (11) jest ważne kryterium podzielności wielomianów:

Twierdzenie 4.6 (Kryterium Bezoult’a). Wielomian

w(x) = a0 + a1x+ · · ·+ an−1xn−1 + anx

n

jest podzielny bez reszty przez dwumian x− a wtedy i tylko wtedy, gdy a jest pierwiast-kiem wielomianu w(x), tzn. w(a) = 0.

Istotnie, jeśli w(a) = 0, to

w(x) = w(x)− w(a) =

= (a0 + a1x+ · · ·+ an−1xn−1 + anx

n)− (a0 + a1a+ · · ·+ an−1an−1 + ana

n) =

= a1(x− a) + · · ·+ an−1(xn−1 − an−1) + an(xn − an).

Z kolei, na mocy wzoru (3), każde z wyrażeń xk−ak dla k = 1, 2, . . . , n daje się podzielićbez reszty przez x− a. Zatem także i w(x) daje się podzielić bez reszty przez x− a.

Druga część równoważności w Kryterium Bezoult’a jest oczywista, bo jeśli w(x)dzieli się bez reszty przez x− a, to istnieje taki wielomian q(x), że

w(x) = q(x)(x− a).

Wówczas w(a) = 0. Zauważmy, że skoro w wyniku dzielenia przez x− a stopień wielo-mianu zmniejsza się o 1, to wielomian stopnia n ma co najwyżej n pierwiastków.

Kryterium Bezoult’a w połączeniu z twierdzeniem 4.5 o znajdywaniu pierwiastkówwymiernych wielomianów o współczynnikach całkowitych daje praktyczną możliwośćprzedstawiania niektórych wielomianów w postaci iloczynów jednomianów i wielomia-nów nierozkładalnych stopnia drugiego. Zobaczymy to na następującym przykładzie:

22 I. STRUKTURY LICZBOWE

Przykład 4.2. Rozważmy wielomian

w(x) = x3 + 6x2 + 11x+ 6

i zauważmy, że na mocy twierdzenia 4.5 jedynymi pierwiastkami wymiernymi mogąbyć liczby całkowite ze zbioru {1, 2, 3,−1,−2,−3}. Istotnie, jeśli liczba wymierna jestp

Z Kryterium Bezoult’a wiąże się jeszcze inny przykład na to, że sprawdzenie wzo-ru w nawet bardzo wielu przypadkach nie musi oznaczać jego ogólnej prawdziwości,tzn. prawdziwości dla wszystkich liczb naturalnych. Okazuje się, że rozkładając wielo-mian xn− 1 na czynniki nierozkładalne o współczynnikach całkowitych (tzn. na takie,które już dalej nie dają się rozłożyć) otrzymujemy często wielomiany o współczynni-kach równych 0, 1 oraz −1. Tak więc na przykład

x2 − 1 = (x− 1)(x+ 1)

x3 − 1 = (x− 1)(x2 + x+ 1)

x4 − 1 = (x− 1)(x+ 1)(x2 + 1)

x5 − 1 = (x− 1)(x4 + x3 + x2 + x+ 1)

x6 − 1 = (x− 1)(x+ 1)(x2 + x+ 1)(x2 − x+ 1).

Okazuje się jednak, że ta zasada nie jest ogólnie prawdziwa: jeden z elementów rozkładuwielomianu x105 − 1 ma współczynniki równe −2.

5. Liczby zespolone

W elementarnym kursie algebry rozważane są równania kwadratowe postaci

ax2 + bx+ c = 0.

Łatwe sprawdzenie pokazuje, że rozwiązania takiego równania są postaci:

x1 =−b+

√∆

2aoraz x2 =

−b−√∆

2a,

o ile wyróżnik ∆ = b2 − 4ac jest liczbą nieujemną. Jeśli ∆ < 0, to powyższe równanienie ma pierwiastków rzeczywistych. Najprostsze takie równanie, to równanie postacix2 + 1 = 0. Okazuje się, że można zbudować obiekt matematyczny szerszy od zbioruliczb rzeczywistych, w którym dowolne równania kwadratowe mają zawsze pierwiast-ki. Obiekt ten, to zbiór liczb zespolonych, a konstrukcja tego zbioru jest następująca.Przyjmujemy, że rozwiązaniem powyżej wspomnianego równania x2+1 = 0 jest liczba,którą oznaczamy symbolem i. Tak więc

i2 = −1.

Z uwagi na ostatnią równość, liczbę i przyjęto nazywać jednostką urojoną. Dysponującjuż jednostką urojoną i tworzymy formalne sumy postaci

(12) z = a+ bi,

5. LICZBY ZESPOLONE 23

gdzie a, b są liczbami rzeczywistymi. Zbiór wszystkich sum postaci (12) tworzy to conazywamy zbiorem liczb zespolonych, który oznaczać będziemy symbolem C. Liczbęrzeczywistą a nazywamy częścią rzeczywistą liczby zespolonej z, a liczbę rzeczywistą bczęścią urojoną liczby zespolonej z. Części te oznaczamy odpowiednio symbolami re(z)oraz im(z). Tak więc, jeśli z = a+ bi, to

re(z) = a oraz im(z) = b.

Jeśli b = 0, czyli, jeśli część urojona liczby zespolonej z jest równa 0, to z = a, czyliliczba zespolona staje się wtedy liczbą rzeczywistą. Tak więc zbiór liczb zespolonychjest obiektem większym niż zbiór liczb rzeczywistych. Tym bardziej, że podstawowedziałania na liczbach zespolonych definiujemy tak samo jak działania na wyrażeniachalgebraicznych, pamiętając wszakże, że i2 = −1. Mamy zatem:

(a+ bi) + (c+ di) = (a+ c) + (b+ d)i,

(a+ bi)(c+ di) = ac+ adi+ bci+ bdi2 = (ac− bd) + (ad+ bc)i.Z przyjętych powyżej definicji sumy i iloczynu liczb zespolonych wynika, że liczba 0 jestelementem neutralnym dodawania liczb zespolonych, a liczba 1 elementem neutralnymmnożenia tych liczb. Zauważmy jeszcze, że liczba przeciwna do liczby zespolonej nie-zerowej z = a+ bi ma postać −z = −a− bi, i jak nietrudno sprawdzić liczba odwrotnaz−1 do liczby zespolonej z = a+ bi, tj. taka liczba, że zz−1 = z−1z = 1 ma postać

z−1 =a

a2 + b2+−b

a2 + b2i.

Oczywiście liczba odwrotna do liczby z = 0 + 0i nie istnieje.

Przykład 5.1. Liczba odwrotna do liczby

z = 1 + i

ma postać

(1 + i)−1 =12− 1

2i.

Istotnie, w tym przypadku mamy a = b = 1.

Przedstawiony powyżej opis liczb zespolonych, nie jest jedyny. Jest to tak zwanapostać algebraiczna liczby zespolonej z = a+ bi.

Pokażemy teraz jak można liczby zespolone interpretować geometrycznie. Z uwagina to, że dowolna liczba zespolona z zapisana w postaci algebraicznej, to liczba a+ bi,możemy ją umieścić w prostokątnym układzie współrzędnych jako punkt o odciętej rów-nej a i rzędnej równej b. Na odwrót, każdy punkt na płaszczyźnie opisany parą swoichwspółrzędnych (a, b) można utożsamić z liczbą zespoloną a + bi. Zatem płaszczyznamoże być interpretowana jako zbiór liczb zespolonych. Nazywamy ją wtedy płaszczy-zną zespoloną lub płaszczyzną Gaussa. Zauważmy, że naturalny układ współrzędnychprostokątnych tej płaszczyzny, to układ wyznaczony przez prostą złożoną z wszystkichpunktów postaci (a, 0), gdzie a ∈ R oraz prostą złożoną z punktów postaci (0, b), gdzieb ∈ R. Pierwsza z tych osi odpowiada dokładnie zbiorowi liczb rzeczywistych, dlatego

24 I. STRUKTURY LICZBOWE

nazywana jest osią rzeczywistą, a druga oś odpowiada zbiorowi tzw. liczb zespolonychczysto urojonych tj. liczb postaci bi, i dlatego nazywana jest osią urojoną.

Umieszczenie liczb zespolonych na płaszczyźnie prowadzi w naturalny sposób dokolejnych pojęć. Pierwsze z nich to pojęcie modułu, znanego już w odniesieniu doliczb rzeczywistych. Jeśli z = a+ bi, to modułem liczby zespolonej z nazywamy liczbęrzeczywistą |z| określoną wzorem:

|z| =√a2 + b2.

Zauważmy, że jeśli liczba zespolona z jest liczbą rzeczywistą a, to

|z| =√a2 + 0 =

√a2 = |a|,

a więc w tym przypadku moduł liczby zespolonej pokrywa się z wartością bezwzględ-ną liczby rzeczywistej a czyli z modułem liczby a. Moduł liczby zespolonej ma prostąinterpretację geometryczną: jest odległością tej liczby od liczby 0, co w oczywisty spo-sób wynika z twierdzenia Pitagorasa. Rozważmy sytuację bardziej szczegółowo. Niechz = a + bi 6= 0, a r niech będzie odcinkiem na płaszczyźnie zespolonej łączącym 0 zliczbą z. Odcinek r – długości |z| – tworzy z osią rzeczywistą pewien kąt α ∈ [0, 2π).Z elementarnej trygonometrii wiadomo, że

sinα =b

|z|oraz cosα =

a

|z|.

Zatemz = |z|(cosα + i sinα).

Powyższa postać liczby zespolonej nosi nazwę postaci geometrycznej lub postaci try-gonometrycznej. Kąt α nazywamy wówczas argumentem głównym liczby zespolonej z,który oznaczamy symbolem arg(z). Tak więc

z = |z|(cos(arg z) + i sin(arg(z)).

Z uwagi na to, że cos(α + 2kπ) = cosα oraz sin(α + 2kπ) = sinα, gdzie k ∈ Z, dladowolnego k ∈ Z mamy

z = |z|(cos(arg(z) + 2kπ) + i sin(arg(z) + 2kπ)).

Element arg(z) + 2kπ, gdzie k ∈ Z, nazywamy ogólnie argumentem liczby zespolonejz. Jeśli k = 0, to taki argument jest argumentem głównym liczby zespolonej z.

Przykład 5.2. Jeśli z = 1 + i, to arg(z) = π4 . Istotnie, |z| =

√2 oraz

sinπ

4= cos

π

4=

1√2.

Postać geometryczna liczby zespolonej jest szczególnie dogodna, w przypadku po-tęgowania liczb zespolonych, a także ich pierwiastkowania. Korzystając ze wzorów try-gonometrycznych na sinus i cosinus sumy, a więc wzoru

sin(α + β) = sinα cos β + sin β cosα

5. LICZBY ZESPOLONE 25

oraz ze wzorucos(α + β) = cosα cos β − sinα sin β

łatwo sprawdzić, że

(13) z1 · z2 = |z1| · |z2|(cos(α + β) + i sin(α + β)),

jeśli z1 = |z1|(cosα + i sinα), z2 = |z2|(cos β + i sin β). Z ostatniego wzoru wynika wszczególności, że

z−1 =1|z|

(cos(−α) + i sin(−α)),

jeśli z 6= 0 jest postaci z = |z|(cosα+ i sinα). Tak więc iloraz dwóch liczb zespolonych

z1 i z2 postaci takiej jak powyżej wyrazić można wzorem:z1z2

=|z1||z2|

(cos(α− β) + i sin(α− β))

przy założeniu, że z2 6= 0. Stosując wzór (13) i zasadę indukcji matematycznej otrzy-mujemy tzw. wzór de Moivre’a na potęgę liczby zespolonej z = |z|(cosα + i sinα):

zn = |z|n(cos(nα) + i sin(nα)).

Przykład 5.3. Jeśli z = −12 +√32 i to |z| =

√14 + 3

4 = 1, a więc arg(z) = 23π bo

sin 23π = −12 oraz cos 23π =√32 . Zatem

z17 = (cos23π + i sin

23π)17 = cos

343π + i sin

343π =

= cos(10π +43π) + i sin(10π +

43π) = cos

43π + i sin

43π = −1

2−√

32i

Operacją odwrotną do potęgowania jest pierwiastkowanie, rozumiane w tym sensie,że jeśli n ∈ N oraz zn = w, to liczbę z nazywamy pierwiastkiem stopnia n z liczby w,co zapisujemy następująco:

z = n√w.

Dla liczby zespolonej z 6= 0 pierwiastek stopnia n ­ 2 nie jest określony jednoznacznie.Rozumiemy go jako zbiór wszystkich liczb zespolonych postaci

(14) n

√|z|(

cosα + 2kπ

n+ i sin

α + 2kπn

),

gdzie z = |z|(cosα + i sinα) oraz k = 0, . . . , n − 1. Pierwiastek n

√|z| w ostatnim

wzorze rozumiemy jako pierwiastek arytmetyczny stopnia n z liczby rzeczywistej |z|.Wzór (14) wynika natychmiast ze wzoru de Moivre’a.

Przykład 5.4. Jeśli z = 1 = cos 0 + i sin 0, to pierwiastki n-tego stopnia z z mająpostać

(15) εk = cos2kπn

+ i sin2kπn,

26 I. STRUKTURY LICZBOWE

gdzie k = 0, . . . , n−1. W szczególności dla n = 3 mamy ε0 = 1, ε1 = cos 2π3 + i sin 2π3 =−12 + i

√32 oraz ε2 = cos 4π3 + i sin 4π3 = −12 − i

√32 .

Na liczbach zespolonych możemy wykonać pewną prostą operację, która nie maodpowiednika w zbiorze liczb rzeczywistych. Otóż, jeśli z = a+ bi, to liczbę zespoloną

z = a− binazywamy liczbą sprzężoną z liczbą zespoloną z. Geometrycznie operacja sprzężeniana płaszczyźnie zespolonej oznacza symetrię względem osi rzeczywistej. Tak więc

z = z dla dowolnej liczby zespolonej z oraz a = a, jeśli a ∈ R.Ponadto dla dowolnych liczb zespolonych z1, z2 prawdziwe są następujące wzory:

z1 ± z2 = z1 ± z2, z1 · z2 = z1 · z2,(z1z2

)=z1z2,

przy czym w ostatnim wzorze zakładamy, że z2 6= 0.Zauważmy, że podobnie jak w zbiorze liczb rzeczywistych, w zbiorze liczb zespolo-

nych można także rozważać wielomiany. Jak już wspomniano wyżej, liczby zespolonepozwalają rozwiązywać równania, które w zakresie liczb rzeczywistych nie mają roz-wiązania, takie jak na przykład równanie x2+1 = 0. Prawdziwe jest jednak twierdzenieznacznie ogólniejsze:

Twierdzenie 5.1 (Zasadnicze Twierdzenie Algebry). Każdy wielomian stopnia n,o współczynnikach rzeczywistych lub zespolonych, ma dokładnie n pierwiastków zespo-lonych.

Z wymienionych powyżej własności operacji sprzężenia wynika, że jeśli wielomiano współczynnikach rzeczywistych ma pierwiastek równy z, to także liczba z jest pier-wiastkiem tego wielomianu. Stąd wynika, że jeśli wielomian o współczynnikach rze-czywistych jest stopnia nieparzystego, to musi mieć pierwiastek rzeczywisty bo dlaktóregoś z pierwiastków musi zachodzić równość z = z gdyż jest ich nieparzysta ilość.

6. Grupy, ciała, przestrzenie liniowe

Jak nietrudno zauważyć operacje w omawianych wyżej zbiorach liczb naturalnych,całkowitych, wymiernych, rzeczywistych i zespolonych, mają pewne wspólne własności.Dla przykładu, działanie dodawania w każdym z wymienionych powyżej zbiorze jestoperacją łączną, tzn. dla dowolnych x, y, z zachodzi rowność

x+ (y + z) = (x+ y) + z.

Ponad to dodawanie w tych zbiorach jest przemienne tzn. x+ y = y + x. Analogicznewłasności ma mnożenie liczb. Następną wspólną własnością tych działań jest to, żeistnieje dla nich element neutralny. Liczba 0 jest elementem neutralnym dodawania:x + 0 = 0 + x = x, a 1 elementem neutralnym mnożenia x · 1 = 1 · x = x. Jednak zprzyjętej przez nas powyżej definicji zbioru liczb naturalnych N = {1, 2, 3, . . . } wynika,że dodawanie w zbiorze liczb naturalnych nie ma elementu neutralnego. Zauważmy

6. GRUPY, CIAŁA, PRZESTRZENIE LINIOWE 27

jeszcze, że dodawanie we wszystkich zbiorach liczbowych z wyjątkiem zbioru liczbnaturalnych, ma taką własność, że dla dowolnego elementu x istnieje element przeciwny,tj. taki element y, że x + y = y + x = 0. Analogiczną własność ma mnożenie, aledopiero w zbiorze liczb wymiernych bez elementu 0: dla każdego x istnieje taki y, żex · y = y · x = 1. Uzasadnia to potrzebę wprowadzenia następującej definicji:

Definicja 6.1. Grupą nazywamy każdy zbiór G z wyróżnionym elementem e, wktórym określone jest działanie dwuargumentowe „•”, tzn. każdym dwóm elementomx, y ∈ G przyporządkowany jest element z G, który oznaczamy symbolem x • y, w takisposób, że spełnione są następujące warunki:

(1) x • (y • z) = (x • y) • z dla dowolnych x, y, z ∈ G,(2) x • e = e • x = x dla każdego x ∈ G,(3) dla każdego x ∈ G istnieje taki element y ∈ G, że x • y = y • x = e.

Jeśli ponadto spełniony jest warunek(4) x • y = y • x dla dowolnych x, y ∈ G

to taką grupę nazywamy przemienną (lub abelową).

Przykład 6.1. (a) Zbiór liczb całkowitych Z z działaniem dodawania i elementemneutralnym 0 jest grupą przemienną. Podobnie zbiór liczb wymiernych Q, zbiór liczbrzeczywistych R, zbiór liczb zespolonych C, z dodawaniem i wyróżnionym elementem0 jest grupą przemienną.

(b) Zbiór liczb całkowitych Z z działaniem mnożenia nie jest grupą, gdyż dla liczbyk ∈ Z, różnej od 1 oraz −1 nie istnieje liczba całkowita l taka, że k · l = 1.

(c) Zbiór liczb wymiernych niezerowych Q \ {0} z mnożeniem oraz wyróżnionymelementem 1 jest grupą przemienną. Podobnie zbiór liczb rzeczywistych niezerowych.

(d) Rozważmy zbiór Izom złożony ze wszystkich izometrii płaszczyzny. Niech idoznacza izometrię trywialną, tj. taką, że id(x) = x dla każdego punktu x płaszczyzny.Niech „◦” oznacza działanie złożenia w zbiorze Izom. Jest to istotnie działanie w tymzbiorze, gdyż złożenie dwóch izometrii płaszczyzny jest izometrią płaszczyzny. Z ele-mentarnego kursu geometrii wiadomo, że zbiór Izom wraz z działaniem ◦ i z elementemneutralnym id jest grupą. Wiadomo również, że nie jest to grupa przemienna.

(e) Rozważmy zbiór Perm(n) wszystkich funkcji różnowartościowych zbioru n-elementowego {1, 2, . . . , n} z działaniem składania funkcji. Każdą taką funkcje możemyutożsamić z permutacją zbioru {1, 2, . . . , n}. Istotnie, jeśli

f : {1, 2, . . . , n} → {1, 2, . . . , n},to możemy taką funkcję jednoznacznie opisać jako permutację (f(1), f(2), . . . , f(n)).Składanie funkcji jest wtedy tożsame ze składaniem permutacji. Grupa ta, jak nietrud-no zauważyć, nie jest przemienna. Wiemy także, że ma ona n! elementów.

Podamy teraz przykłady pewnych grup bliskie grupom liczbowym. Ustalmy liczbęnaturalną n ­ 2 i rozpatrzmy zbiór

Zn = {0, 1, . . . , n− 1}.

28 I. STRUKTURY LICZBOWE

Zdefiniujemy działanie w tym zbiorze w następujący sposób. Jeśli k, l ∈ Zn, to jakwynika z twierdzenia o dzieleniu z resztą, istnieje dokładnie jedna taka liczba r ∈{0, . . . , n− 1}, że

k + l = q · n+ r,

gdzie q ∈ N ∪ {0}, tj. r jest resztą z dzielenia liczby k + l przez n. Możemy zatemwprowadzić w zbiorze Zn działanie ⊕ w następujący sposób:

k ⊕ l = r.

Podobnie, jeśli k, l ∈ Zn, to niech k � l będzie resztą z dzielenia liczby k · l przez n,czyli

k � l = r,

jeślik · l = p · n+ r,

gdzie p ∈ N∪{0}. Zauważmy, że 0 jest elementem neutralnym działania ⊕, a 1 elemen-tem neutralnym działania � w zbiorze Zn. Zarówno ⊕ jak i � jest oczywiście operacjąprzemienną. Pewnego wysiłku wymaga sprawdzenie, że obie te operacje są łączne. Za-uważmy jeszcze, że jeśli k ∈ Zn, k 6= 0, to n − k ∈ Zn oraz k ⊕ (n − k) = 0. Takwięc Zn z działaniem ⊕ i z elementem neutralnym 0 jest grupą przemienną. Pewienkłopot sprawia działanie � w kwestii istnienia elementu odwrotnego. Zauważmy, żejeśli n = 4, to:

2� 0 = 0, 2� 1 = 2, 2� 2 = 0, 2� 3 = 2.

Tak więc element 2 ∈ Z4 nie ma w Z4 elementu odwrotnego, tj. takiego, że 2� k = 1,gdyż Z4 = {0, 1, 2, 3}. Oczywiście 0 też nie ma elementu odwrotnego, ale na to możemyprzystać, bo tak jest także w znanych nam zbiorach liczbowych. Oczywiście elementemodwrotnym do 1 jest 1, a odwrotnym do 3 jest też 3, gdyż

3� 3 = 1.

Sprawę istnienia elementów odwrotnych w zbiorze Zn względem działania � wyjaśnianastępująca własność: k ∈ Zn\{0}ma element odwrotny w Zn wtedy i tylko wtedy, gdyNWD(k, n) = 1, tj. dokładnie wtedy, gdy liczby k oraz n są względnie pierwsze. Zatem,jeśli n jest liczbą pierwszą, to zbiór Zn \ {0} z działaniem � i elementem neutralnym1, jest grupą przemienną. Dla przykładu, jeśli n = 5, to

2� 3 = 1,

i elementem odwrotnym do 2 jest 3.

Definicja 6.2. Załóżmy, że K jest zbiorem, w którym określone są dwa działaniaoznaczane symbolem „+” oraz „·”, a ponadto istnieją dwa różne elementy 0, 1 ∈ K ispełnione są następujące warunki:

(1) K z działaniem + i wyróżnionym elementem 0 jest grupą przemienną;(2) K \ {0} z działaniem · i wyróżnionym elementem 1 jest grupą przemienną;

6. GRUPY, CIAŁA, PRZESTRZENIE LINIOWE 29

(3) dla dowolnych x, y, z ∈ K zachodzi równość

(x+ y) · z = x · z + y · z.Wówczas mówimy, że K jest ciałem.

Przykład 6.2. (a) Zbiór liczb rzeczywistych R ze zwykłymi działaniami doda-wania i mnożenia liczb oraz z wyróżnionymi elementami 0 i 1 jest ciałem. Podobnieciałem jest zbiór liczb wymiernych Q oraz zbiór liczb zespolonych C z naturalnymidziałaniami oraz z elementami wyróżnionymi 0 i 1.

(b) Zbiór Zn, o ile n jest liczbą pierwszą, z działaniami ⊕ i � oraz z elementamiwyróżnionymi 0 i 1 jest ciałem.

Omówimy teraz jeszcze jedno pojęcie algebraiczne. Zanim je jednak formalnie zde-finiujemy odwołamy się do wiedzy czytelnika z zakresu elementarnej geometrii i fizyki.Pojęcie wektora jest jednym z podstawowych pojęć, jakim posługuje się właśnie geome-tria i fizyka. Każdy kto już zapoznał się z wektorami wie, że można je do siebie dodawaći mnożyć przez tak zwane „skalary”, czyli w istocie przez liczby. Wiadomo, że działaniedodawania wektorów wyznacza w zbiorze wektorów grupę. Istotnie, dodawanie wekto-rów jest działaniem łącznym, istnieje element neutralny dodawania wektorów(jest nimwektor zerowy), a także każdy wektor ma wektor niego przeciwny. Ponadto dodawaniewektorów jest działaniem przemiennym.

Definicja 6.3. Załóżmy, że K jest ciałem, a V zbiorem z działaniem „+” i z wyróż-nionym elementem 0. Załóżmy ponadto, że jest określona operacja, która elementowielementowi α ∈ K i każdemu v ∈ V przyporządkowuje element αv. Jeśli spełnione sąnastępujące warunki:

(1) V z działaniem + i z elementem 0 jest grupą abelową,(2) α(v + w) = αv + αw dla każdego α ∈ K oraz v, w ∈ V ,(3) (α + β)v = αv + βv dla α, β ∈ K oraz v ∈ V ;(4) (αβ)v = α(βv) dla α, β ∈ K oraz v ∈ V ;(5) 1v = v dla x ∈ X,

to zbiór V nazywamy przestrzenią liniową lub przestrzenią wektorową nad ciałem K.Elementy przestrzeni liniowej nazywane są wektorami, a elementy ciała K skalarami.

Zauważmy, że dodawanie wektorów oznaczamy tym samym znakiem +, którymoznaczane jest dodawanie elementów ciała K. Nie powinno to jednak prowadzić donieporozumień, bo z kontekstu będzie zawsze jasne, o które działanie chodzi. Oczywiścienie może się pojawić napis postaci α + v, gdzie α ∈ K oraz v ∈ V, bo to nie miało bysensu. Umawiamy się także, że symbol mnożenia w ciele, oznaczany zwykle kropką, wcelu uproszczenia zapisu pomijamy, tzn. zamiast α · β piszemy zwykle αβ. Elementuneutralnego w grupie V , czyli wektora zerowego 0 nie należy mylić ze skalarem 0, czyli zelementem neutralnym względem dodawania w ciele K. Zauważmy jednak, że zachodzimiędzy nimi następująca ważna zależność:

• α0 = 0 dla każdego α ∈ K,

30 I. STRUKTURY LICZBOWE

• 0v = 0 dla każdego v ∈ V.Istotnie, skoro dla każdego v ∈ V zachodzi v = v + 0, to na mocy prawa rozdzielności(prawa (2) ) zachodzi równość αv = α(v + 0) = αv + α0, która po odjęciu αv, czylipo dodaniu do obydwu stron równości elementu przeciwnego do αv, daje pierwszą zrówności. Podobnie, na mocy prawa rozdzielności (3) zachodzi równość

αv = (α + 0)v = αv + 0v,

która po odjęciu αv daje drugą z równości.Rozważmy następujące przykłady:

Przykład 6.3. (a) Każdy punkt P przestrzeni 3-wymiarowej R3 możemy utożsa-mić z wektorem o początku w punkcie 0 = (0, 0, 0) i końcem w punkcie P . Jeśli punktP = (x1, x2, x3), to wektor

−→0P możemy zapisać jako tzw. wektor wierszowy:

−→0P = [x1, x2, x3],

lub wektor kolumnowy:

−→0P =

x1x2x3

.Wektor, którego wszystkie współrzędne są równe 0 nazywamy wektorem zerowym ioznaczamy symbolem 0. Zbiór wszystkich wektorów wierszowych wyznaczonych przezpunkty przestrzeni R3 wraz z działaniami:

[x1, x2, x3] + [y1, y2, y3] = [x1 + y1, x2 + y2, x3 + y3]

orazα[x1, x2, x3] = [αx1, αx2, αx3],

gdzie α ∈ R oraz z wyróżnionym elementem 0 jest przestrzenią liniową nad ciałem R.To samo stwierdzenie dotyczy zbioru wektorów kolumnowych.

(b) Uogólnieniem przestrzeni liniowej opisanej w punkcie (a) jest przestrzeń Rn,gdzie n ­ 1. Składa się ona z wektorów wierszowych

[x1, . . . , xn]

lub kolumnowych x1...xn

Działania na nich określamy w naturalny sposób:

[x1, . . . , xn] + [y1, . . . , yn] = [x1 + y1, . . . , xn + yn],

α[x1, . . . , xn] = [αx1, . . . , αxn],gdzie α jest dowolną liczbą rzeczywistą. Wektorem zerowym 0 jest wektor

0 = [0, . . . , 0].

6. GRUPY, CIAŁA, PRZESTRZENIE LINIOWE 31

Analogicznie definiujemy działania i wektor zerowy, gdy rozpatrujemy Rn jako prze-strzeń złożoną z wektorów kolumnowych.

Jest rzeczą oczywistą, że zastępując ciało R liczb rzeczywistych innym ciałem K,na przykład ciałem liczb zespolonych lub jakimkolwiek innym, otrzymujemy przestrzeńliniową Kn nad ciałem K. Zauważmy w szczególności, że gdy n = 1, przestrzeń Kn,czyli po prostu ciało K jest przestrzenią liniową nad K.

Następne przykłady przestrzeni liniowych mają nieco inną naturę.

Przykład 6.4. (a) Rozważmy zbiór R[x] złożony ze wszystkich wielomianów owspółczynnikach rzeczywistych. Dodawanie wielomianów definiujemy w następującysposób. Załóżmy, że stopień wielomianu w1 jest równy n, a wielomianu w2 wynosi m.Wówczas

w1 = a0 + a1x+ · · ·+ anxn oraz w2 = b0 + b1x+ · · ·+ bmx

m,

gdzie an 6= 0 6= bm. Załóżmy, że k = max{n,m}. Wówczas

w1 + w2 = (a0 + b0) + (a1 + b1)x+ · · ·+ (ak + bk)xk,

gdzie dla minn,m < i ¬ k przyjmujemy za ai lub bi wartość 0, w zależności od tegoczy n < k, czy m < k. Mnożenie przez skalar α ∈ R określamy w naturalny sposób:

αw = αa0 + (αa1)x+ · · ·+ (αan)xn,

jeśli w = a0 + a1x + · · · + anxn. Przyjmujemy za 0 wielomian zerowy. W ten sposób

R[x] staje się przestrzenią liniową nad ciałem R.(b) Uogólnieniem (w pewnym sensie) przestrzeni opisanej w punkcie (a) jest prze-

strzeń C(R) złożona ze wszystkich funkcji ciągłych f : R→ R. Działania dodawania imnożenia przez skalar określamy następująco:

(f + g)(x) = f(x) + g(x),

(αf)(x) = αf(x).Wektorem zerowym w tej przestrzeni jest funkcja stała, która każdemu x ∈ R przy-pisuje liczbę 0. Zbiór liczb rzeczywistych R możemy zastąpić dowolnym podzbioremA ⊆ R otrzymując przestrzeń liniową C(A).

Definicja 6.4. Kombinacją liniową wektorów v1, . . . , vn nazywamy wektor v po-staci

v = α1v1 + · · ·+ αnvn,

gdzie α1, . . . , αn ∈ K.

Definicja 6.5. Zbiór wektorów A w przestrzeni liniowej V nazywamy liniowozależnymi, jeśli istnieją elementy α1, . . . , αn ciała K, nie wszystkie równe 0 oraz takiukład wektorów v1, . . . , vn ∈ A, że

α1v1 + · · ·+ αnvn = 0.

Jeśli zbiór wektorów A nie jest liniowo zależny, to mówimy, że jest liniowo niezależny.

32 I. STRUKTURY LICZBOWE

Przykład 6.5. Wektory [1, 1, 1, 1], [2, 0, 0, 1], [0, 0, 1, 0] w przestrzeni R4 są liniowoniezależne, natomiast wektory [1, 1, 2, 3], [1, 1, 0, 0], [8, 8, 10, 15] są liniowo zależne, gdyż

5[1, 1, 2, 3] + 3[1, 1, 0, 0] + (−1)[8, 8, 10, 15] = [0, 0, 0, 0].

Jeśli A ⊆ X jest takim zbiorem liniowo niezależnym, że każdy wektor z przestrzeniX jest kombinacją liniową pewnych elementów ze zbioru A, to zbiór A nazywamy baząprzestrzeni liniowej X.

Przykład 6.6. Zauważmy, że zbiór wektorów

{[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0, 0, 1]}jest bazą przestrzeni R4. Nietrudno sprawdzić, że bazą przestrzeni R4 jest również zbiór

{[1, 4, 3, 4], [1, 5, 2, 3], [1, 5, 2, 2], [0, 2,−1,−1]}.Pierwsza z baz, z uwagi na swoją prostotę, zwana jest bazą kanoniczną przestrzeniR4. Ogólnie bazą kanoniczną przestrzeni Kn nazywamy zbiór {e1, e2, . . . , en}, gdziee1 = [1, 0, . . . , 0], e2 = [0, 1, . . . , 0],. . . ,en = [0, 0, . . . , 1].

Zasadniczym twierdzeniem o bazach przestrzeni liniowych jest następujące twier-dzenie.

Twierdzenie 6.1. (1) Każda przestrzeń liniowa ma bazę.(2) Dowolne dwie bazy tej samej przestrzeni liniowej mają taką samę liczbę ele-

mentów.

Liczba elementów w bazie przestrzeni liniowej X nazywamy wymiarem przestrze-ni X i oznaczamy symbolem dim(X). Definicja jest poprawna z uwagi na twierdze-nie 6.1 (b). Może się zdarzyć, że przestrzeń liniowa V nie ma bazy o skończenie wieluelementach. Mówimy wówczas, że przestrzeń V ma wymiar nieskończony, co zapisujemysymbolem dim(V ) =∞.

Przykład 6.7. Przestrzeń liniowa Kn ma wymiar n. Istotnie, baza kanoniczna{e1, . . . , en} przestrzeni Kn ma dokładnie n elementów.

Przestrzeń R[x] ma wymiar nieskończony. W tym celu wystarczy zauważyć, że zbiórwielomianów Z = {xn : n ­ 0} jest liniowo niezależny i że każdy wielomian w ∈ R[x]jest kombinacją liniową elementów ze zbioru Z. Ponieważ zbiór Z jest nieskończony,więc dim(R[x]) =∞.

Obok pojęcia bazy przestrzeni liniowej funkcjonuje ważne pojęcie bazy uporządko-wanej. Załóżmy, że A jest bazą przestrzeni liniowej V , która jest zbiorem skończonym.Wówczas dowolną permutację elementów bazy A nazywamy bazą uporządkowaną. Takwięc jeśli baza A ma n wektorów, to wyznacza ona n! baz uporządkowanych. Załóżmy,że (v1, . . . , vn) jest bazą uporządkowaną przestrzeni liniowej V . Dla każdego wektorav ∈ V , zgodnie z definicją bazy, istnieją takie skalary α1, . . . , αn ∈ K, że

v = α1v1 + · · ·+ αnvn.

7. ZADANIA DO ROZDZIAŁU I 33

Gdyby istniały również takie skalary β1, . . . , βn, że

v = β1v1 + · · ·+ βnvn,

to

α1v1 + · · ·+ αnvn = β1v1 + · · ·+ βnvn.

Zatem

(α1 − β1)v1 + · · ·+ (αn − βn)vn = 0.

Z liniowej niezależności wektorów v1, . . . , vn wynika, że αi − βi = 0, czyli αi = βi dlakażdego i = 1, . . . , n. Tak więc

Twierdzenie 6.2. Jeśli (v1, . . . , vn) jest bazą uporządkowaną przestrzeni liniowejV , to każdy wektor v ∈ V ma jednoznaczne przedstawienie w postaci kombinacji linio-wej wektorów v1, . . . , vn; ściślej, dla każdego wektora v ∈ V istnieje dokładnie jedentaki układ skalarów α1, . . . , αn, że v = α1v1 + · · ·+ αnvn.

Ostatnie twierdzenie pozwala wprowadzić pojęcie współrzędnych wektora w danejbazie uporządkowanej.

Definicja 6.6. Jeśli (v1, . . . , vn) jest bazą uporządkowaną przestrzeni liniowej V ,v ∈ V oraz v = α1v1+ · · ·+αnvn, to dla każdego i = 1, . . . , n, skalar αi nazywamy i-tąwspółrzędną wektora v w bazie uporządkowanej (v1, . . . , vn).

Przykład 6.8. Rozważmy przestrzeń R4 z bazą kanoniczną uporządkowaną (e1, e2, e3, e4).Wówczas dla dowolnego wektora [x1, x2, x3, x4] ∈ R4 liczby xi są i-tymi współrzędnymiw tej bazie dla każdego i = 1, 2, 3, 4. Zauważmy, że w przypadku bazy uporządkowanej

([1, 4, 3, 4], [1, 5, 2, 3], [1, 5, 2, 2], [0, 2,−1,−1])

(p. przykład 6.6) wektor [3, 16, 6, 8] ma współrzędne równe odpowiednio 1, 1, 1 i 1.

7. Zadania do rozdziału I

Zadanie 1. Pokazać, że jeśli w permutacji zbioru {1, . . . , n} zmienimy miejscamidwa wyrazy, to ilość inwersji zmieni się o liczbę nieparzystą.Wskazówka: Przeprowadzić dowód indukcyjny ze względu na różnicę pozycji, na któ-rych stoją zmieniane elementy.

Zadanie 2. Wykazać, że ilość permutacji, w których występuje parzysta ilość in-wersji jest równa ilości permutacji, w których jest nieparzysta ilość inwersji.Wskazówka: Zauważyć, że zamiana miejscami dwóch pierwszych elementów permutacjizmienia ilość inwersji w danej permutacji z parzystej na nieparzystą, a nieparzystej naparzystą (patrz poprzednie zadanie). Po takiej zamianie dokonanej w dwóch różnychpermutacjach otrzymamy dwie różne permutacje.

34 I. STRUKTURY LICZBOWE

Zadanie 3. Wykazać, że w permutacji p = (p1, . . . , pn) zbioru {1, . . . , n} dla każ-dego elementu pi ilość tych inwersji, które zawierają pi jest parzysta wtedy i tylkowtedy, gdy pi + i jest liczbą parzystą.Wskazówka: Przeprowadzić dowód indukcyjny ze względu na i. Aby sprawdzić twier-dzenie dla i = 1 zauważyć, że ilość elementów mniejszych od p1 jest parzysta wtedy itylko wtedy, gdy p1 jest nieparzysta.

Zadanie 4. Wykazać indukcyjnie, że dla dowolnej liczby naturalnej n prawdziwesą następujące równości:

12 + 22 + 32 + · · ·+ n2 =n(n+ 1)(2n+ 1)

6;(a)

13 + 23 + 33 + · · ·+ n3 =n2(n+ 1)2

4;(b)

1 · 2 · 3 + 2 · 3 · 4 + · · ·+ n(n+ 1)(n+ 2) =n(n+ 1)(n+ 2)(n+ 3)

4;(c)

1 · 1! + 2 · 2! + 3 · 3! + · · ·+ n · n! = (n+ 1)!− 1.(d)

Zadanie 5. Udowodnić wzór dwumienny Newtona, tzn. wykazać, że

(x+ y)n =n∑k=0

(n

k

)xn−kyk

dla dowolnych liczb x, y ∈ R.Wskazówka: Skorzystać z zasady indukcji matematycznej i wzoru (8) ze str. 9.

Zadanie 6. Wykazać, że suma liczb stojących w n-tym wierszu trójkąta Pascalana miejscach parzystych jest równa 2n−1, tzn. wykazać, że(

n

0

)+(n

2

)+ · · ·+

(n

2k

)= 2n−1,

gdzie 2k jest największą liczbą parzystą mniejszą od n.Wskazówka: Wykorzystać wzory

n∑k=0

(n

k

)= 2n oraz

n∑k=0

(−1)k(n

k

)= 0.

Zadanie 7. Obliczyć sumę liczb stojących w n-tym wierszu trójkąta Pascala namiejscach nieparzystych.

Zadanie 8. Udowodnić następujący wzór(k

k

)+(k + 1k

)+ · · ·+

(k + r

k

)=(k + r + 1k + 1

).

Wskazówka: Przeprowadzić dowód indukcyjny ze względu na r. Wykorzystać tożsa-mość (8) ze str. 9.

7. ZADANIA DO ROZDZIAŁU I 35

Zadanie 9. Rozważmy następującą (nieskończoną) tablicę złożoną z liczb natural-nych utworzonych w następujący sposób: pierwszy wiersz i pierwsza kolumna składasię z samych jedynek, natomiast liczby ank dla n, k > 1 stojące w n–tym wierszu orazk–tej kolumnie są sumami pierwszych k wyrazów stojących w n− 1-szym wierszu, tzn.

an,k = an−1,1 + an−1,2 + · · ·+ an−1,k.

Otrzymamy w ten sposób następujące liczby:

1 1 1 1 1 1 . . .1 2 3 4 5 6 . . .1 3 6 10 15 21 . . .1 4 10 20 35 56 . . .1 5 15 35 70 126 . . .1 6 21 56 126 252 . . .. . . . . . . . . . . . . . . . . . . . . . . . . . .

Wykazać, że są to wyrazy trójkąta Pascala, tzn.

an,k =(n+ k − 2k − 1

).

Wskazówka: Skorzystać z równości(n

k

)=(

n

n− k

)oraz z poprzedniego zadania.

Zadanie 10. Udowodnić twierdzenie 2.4, tzn. wykazać, że ilość wszystkich pod-zbiorów k–elementowych zbioru n–elementowego wynosi(

n

k

).

Wskazówka: Przeprowadzić dowód indukcyjny ze względu na n. Wykorzystać wzór (8)ze str. 9.

Zadanie 11. (a) Liczby a1, a2, . . . , an tworzą postęp arytmetyczny, jeśli

a2 − a1 = a3 − a2 = · · · = an − an−1.Mówimy, że liczby a1, a2, . . . , an tworzą postęp arytmetyczny drugiego stopnia, jeśliróżnice

a2 − a1, a3 − a2, . . . , an − an−1tworzą postęp arytmetyczny. Wykazać indukcyjnie, że jeśli n > 4 oraz a1, a2, . . . , antworzą postęp arytmetyczny drugiego stopnia, to

(1) an = a1 +(n− 1

1

)(a2 − a1) +

(n− 1

2

)(a3 − 2a2 + a1).

36 I. STRUKTURY LICZBOWE

Sprawdzić, że liczby 12, 22, 32, . . . , n2 tworzą postęp arytmetyczny drugiego stopnia.Obliczyć sumę 12 + 22 + · · ·+ n2 wykorzystując wzór (1).

Wskazówka: W dowodzie wzoru (1) wykorzystać równość

an = 3an−1 − 3an−2 + an−3.

(b) Jeśli mamy liczby a1, a2, . . . , an, . . . , to indukcyjnie możemy zdefiniować nastę-pujące układy liczb:

d11 = a2 − a1, d21 = a3 − a2, . . . , dn1 = an+1 − an, . . .

złożony z różnic kolejnych liczb a1, a2, . . . , układ

d12 = d21 − d11, d22 = d31 − d21, . . . , dn2 = dn+11 − dn1 , . . . ,

zwany ciągiem jego drugich różnic, i ogólnie mając zdefiniowany ciąg m-tych różnicd1m, d

2m, . . . definiujemy ciąg jego m+ 1 różnic w następujący sposób:

d1m+1 = d2m − d1m, d2m+1 = d3m − d2m, . . . , dnm+1 = dn+1m − dnm, . . .

Mówimy, że liczby a1, a2, . . . , an, . . . tworzą postęp arytmetyczny m-tego stopnia, jeślim − 1-szy ciąg różnic jest postępem arytmetycznym, czyli m-ty postęp jest stały.Wykazać, że jeśli liczby a1, a2, . . . tworzą postęp arytmetyczny stopnia m, to

(2) an = a1 +(n− 1

1

)d11 +

(n− 1

2

)d12 + · · ·+

(n− 1m

)d1m.

Wskazówka: Wykazać najpierw indukcyjnie, że dla dowolnych liczb naturalnych n, koraz 0 < l < n zachodzi równość

dnk =(l

0

)dn−lk+l +

(l

1

)dn−lk+l−1 + · · ·+

(l

l

)dn−lk .

Indukcje przeprowadzić ze względu na n, wykorzystując równość dn+1k = dnk + dnk+1,prawdziwą dla dowolnych n, k. Zauważyć, że podstawiając w powyższym wzorze za kliczbę 1, a za l liczbę n− 1 otrzymamy

dn1 =n−1∑i=0

(n− 1i

)d1n−i =

n∑i=1

(n− 1i− 1

)d1i .

Równość (2) dowodzić indukcyjnie, wykorzystując ostatni wzór wraz z równością an+1 =an + dn1 oraz fakt, że d1k = 0 dla k > m+ 1.

(c) Pokazać, że liczby 1m, 2m, 3m, . . . tworzą postęp arytmetyczny stopnia m. Wy-prowadzić wzór na sumę

14 + 24 + · · ·+ n4.

Wskazówka: Wykorzystać wzór (2) oraz zadanie 8.

7. ZADANIA DO ROZDZIAŁU I 37

Zadanie 12. Wykazać indukcyjnie, że dla dowolnej liczby naturalnej n prawdziwesą następujące równości:

12!

+23!

+ · · ·+ n

(n+ 1)!= 1− 1

(n+ 1)!;(a)

11 · 2 · 3

+1

2 · 3 · 4+ · · ·+ 1

n(n+ 1)(n+ 2)=

n(n+ 3)4(n+ 1)(n+ 2)

;(b)

11 · 3

+1

3 · 5+ · · ·+ 1

(2n− 1)(2n+ 1)=

n

2n+ 1;(c)

11 · 4

+1

4 · 7+ · · ·+ 1

(3n− 2)(3n+ 1)=

n

3n+ 1;(d)

1− 12

+13− 1

4+ · · ·+ 1

2n− 1− 1

2n=

1n+ 1

+1

n+ 2+ · · ·+ 1

2n.(e)

Zadanie 13. Wykazać indukcyjnie, że dla każdej liczby rzeczywistej a > 0 i dlakażdej liczby naturalnej n zachodzi wzór:

1a(a+ 1)

+1

(a+ 1)(a+ 2)+ · · ·+ 1

(a+ n− 1)(a+ n)=

n

a(a+ n).

Zadanie 14. Znaleźć sumy:

(a)n∑k=1

1k(k + 1)

(b)n∑k=2

1k2 − 1

.

Zadanie 15. Wykazać, że dla każdej liczby naturalnej n > 3 zachodzi nierówność:

1n+ 1

+1

n+ 2+ · · ·+ 1

2n>

35.

Wskazówka: Sprwadzić, że14

+15

+16>

35

oraz zauważyć, że jeśli lewą stronę nierówności oznaczymy an, to an+1 > an, gdyż

an+1 = an +1

2n+ 1+

12n+ 2

− 1n+ 1

.

Zadanie 16. Wykazać, że dla każdej liczby naturalnej n > 2 zachodzi nierówność

1√1

+1√2

+ · · ·+ 1√n>√n.

Wskazówka: Wykazać, a następnie zastosować nierówność

√n+

1√n+ 1

>√n+ 1.

38 I. STRUKTURY LICZBOWE

Zadanie 17. Wykazać, że jeśli n > 2, to

n! < (√

2)n(n−1).

Wskazówka: Sprawdzić wpierw, że dla każdego n > 2 zachodzi nierówność

n < 2n−1,

a następnie zastosować wzór (1) str. 5.

Zadanie 18. Wykazać, że dla każdego n > 2 zachodzi nierówność

(2n)!(n!)2

>22n

n+ 1.

Wskazówka: W dowodzie indukcyjnym wykorzystać nierówność

2n+ 1(n+ 1)2

>2

n+ 2.

Zadanie 19. Wykazać, że jeśli x oraz y są różnymi liczbami rzeczywistymi dodat-nimi, to dla każdej liczby naturalnej n > 2 zachodzi nierówność

(x+ y)n < 2n−1(xn + yn).

Wskazówka: W dowodzie indukcyjnym skorzystać z nierówności

(xn − yn)(x− y) > 0.

Zadanie 20. Wykazać, że jeśli x1, x2, . . . , xn są dowolnymi liczbami rzeczywistymidodatnimi spełniającymi warunek

x1 · x2 · · · · · xn = 1.

to

x1 + x2 + · · ·+ xn > n.

Wskazówka: Dowodzić indukcyjnie. Jeśli twierdzenie jest prawdziwe dla dowolnegoukładu n liczb rzeczywistych dodatnich oraz

x1 · x2 · · · · · xn · xn+1 = 1,

to istnieją takie wskaźniki i, j 6 n+ 1, że xi 6 1 oraz xj > 1. Możemy więc dodatkowozałożyć, że xn 6 1 oraz xn+1 > 1. Mamy wówczas

x1 + x2 + · · ·+ xn−1 + xn · xn+1 > n,

oraz xn · xn+1 − xn − xn+1 + 1 = (xn − 1)(xn+1 − 1) 6 0, co daje nierówność

x1 + x2 + · · ·+ xn+1 > n+ 1.

7. ZADANIA DO ROZDZIAŁU I 39

Zadanie 21. Wykazać, że jeśli a1, a2, . . . , an są dowolnymi liczbami rzeczywistymidodatnimi, to

a1 + a2 + · · ·+ ann

> n√a1 · a2 · · · · · an.

Wskazówka: Przyjąć

xk =ak

n√a1 · a2 · · · · · an

dla k = 1, 2, . . . , n i zastosować poprzednie zadanie.

Zadanie 22. Dla każdej liczby naturalnej n wypiszmy w porządku rosnącym wszyst-kie ułamki nieskracalne z przedziału [0, 1], których mianowniki nie przekraczają n.Zbiór wszystkich tych ułamków oznaczmy symbolem An. Zbiór An nazywany jest n–tym ciągiem Farey’a. Dla przykładu wypiszmy ułamki piątego ciągu Farey’a:

0 =01<

15<

14<

13<

25<

12<

35<

23<

34<

45<

11

= 1,

a więc

A5 ={0

1,

15,

14,

13,

25,

12,

35,

23,

34,

45,

11

}.

(a) Wykazać, że jeśli ab, cd

są dwoma kolejnymi ułamkami należącymi do An−1takimi, że b · c− a · d = 1 oraz jeśli k

n∈ An jest takim ułamkiem, że a

b< k

n< c

d, to

n = b+ d oraz k = a+ c.

Wskazówka: Pokazać najpierw, że n = b+ d, wykorzystując nierówność

1bd

=c

d− a

b=(c

d− k

n

)+(k

n− a

b

)>b+ d

nbd

oraz nierównośća

b<a+ c

b+ d<c

d,

prawdziwą dla każdej pary ułamków ab< c

d. Następnie wykazać, że

−1b< k − (a+ c) <

1d.

(b) Wykazać, że jeśli ab, pq

oraz cd

są kolejnymi trzema wyrazami dowolnego zbioruAn, to

p

q=a+ c

b+ d.

Wskazówka: Udowodnić indukcyjnie, że dla każdego n ∈ N zbiór An ma następującewłasności:

(i) jeśli ab, pq, cd

są kolejnymi ułamkami ciągu An to:

p

q=a+ c

b+ d

40 I. STRUKTURY LICZBOWE

(ii) jeśli rs, tu

są kolejnymi ułamkami ciągu An, to:

ts− ru = 1.

W tym celu załóżmy prawdziwość twierdzenia dla liczby naturalnej n. Zauważyć, żez podpunktu (a) wynika, że wśród trzech kolejnych ułamków z ciągu An+1 nie mogąwystąpić dwa kolejne ułamki z ciągu An+1, które nie należą do An. Prawdziwościtwierdzenia dla n+1 dowodzić rozpatrując kolejne przypadki. Jeśli a

b, pq, cd

są kolejnymiułamkami An+1 przy czym p

q∈ An+1, to równość

p

q=a+ c

b+ d

wynika z podpunktu (a) i z założenia indukcyjnego. Wobec tego, jeśli rs, tu

są kolejnymiułamkami An+1 oraz jeden z nich, na przykład t

u, jest elementem An+1, to biorąc

najmniejszy ułamek r′

s′∈ An spośród większych od t

umamy t = r + r′ oraz u = s+ s′.

Dlatego też

ts− ru = (r + r′)s− r(s+ s′) = rs+ r′s− rs− rs′ = r′s− rs′ = 1,

co wynika z założenia indukcyjnego, gdyż rs, r′

s′są kolejnymi ułamkami ciągu An. Jeśli

ab, pq, cd

są kolejnymi ułamkami ciągu An+1 oraz skrajny, na przykład cd

należy do An+1,to cq − pd = 1 na mocy powyżej wykazanej własności oraz pb − aq = 1 na mocyzałożenia indukcyjnego. Wobec tego cq + aq = pb+ dp, skąd otrzymujemy

p

q=a+ c

b+ d.

Podobnie rozumujemy, gdy ab, cd∈ An+1 oraz p

q∈ An. W pozostałym przypadku,

tzn. kiedy wszystkie ułamki ab, pq, cd

są z An oraz rs, tu∈ An, prawdziwość twierdze-

nia wynika bezpośrednio z założenia indukcyjnego.

Zadanie 23. Wykazać, że jeśli x > 0 liczbą niewymierną, to dla każdej liczbynaturalnej n istnieje taka liczba naturalna k, że dokładnie jedna spośród liczb

k(1 + x), k(

1 +1x

)należy do przedziału (n, n+ 1).

Wskazówka: Wykazać, że dla dowolnej liczby naturalnej n liczb postaci k(1 + x)mniejszych od n jest [ n

1+x ] oraz, że liczb postaci k(1 + 1x) mniejszych od n jest [ n

1+ 1x

]

(przypomnijmy, że [a] oznacza część całkowitą liczby rzeczywistej a). Następnie wyka-zać, że [ n

1+x ] + [ n1+ 1x

] = n− 1. W tym celu sprawdzić, że

n

1 + x+

n

1 + 1x

= n,

7. ZADANIA DO ROZDZIAŁU I 41

oraz zauważyć, że na mocy niewymierności liczby x mamy

n

1 + x=[

n

1 + x

]+ ε i

n

1 + 1x

=[

n

1 + 1x

]+ η,

gdzie ε, η ∈ (0, 1).

Zadanie 24. Wykazać, że każda liczba postaci n5−n, gdzie n jest liczbą naturalną,jest podzielna przez 6.Wskazówka: Rozłożyć wielomian n5−n i skorzystać z faktu, że wśród trzech kolejnychliczb naturalnych jedna z nich jest podzielna przez 3.

Zadanie 25. Wykazać, że liczba n! jest podzielna przez sumę 1+2+ · · ·+n wtedyi tylko wtedy, gdy liczba n+ 1 nie jest liczbą pierwszą większą od 2.Wskazówka: Skorzystać ze wzoru 1 + 2 + · · ·+ n = n(n+1)

2 .

Zadanie 26. Wykazać, że jeśli n jest liczbą nieparzystą, która nie jest podzielnaprzez 3, to liczba n2 − 1 jest podzielna przez 24.Wskazówka: Skorzystać z równości n2−1 = (n−1)(n+1). Zauważyć, że spośród dwóchliczb parzystych n− 1 oraz n+ 1 jedna z nich jest też liczbą podzielną przez 4, a takżeże jedna z nich jest liczbą podzielną przez 3.

Zadanie 27. Wykazać, że jeśli liczby nieparzyste p, q > 3 nie są podzielne przez3, to liczba p2 − q2 jest podzielna przez 24.Wskazówka: Wykorzystać fakt, że zarówno p jak i q są liczbami postaci 3m+ n, gdzien ∈ {1, 2}, przy czym jeśli m = 1, to n jest liczbą parzystą, a jeśli m = 2, to n jestliczbą nieparzystą. Skorzystać z faktu, że jeśli a, b, c są liczbami nieparzystymi, to dladowolnych liczb całkowitych x, y jedna spośród liczb: x−y lub ax+by+c jest parzysta.

Zadanie 28. Wykazać, ze dla każdej liczby naturalnej n, liczba (1 + n)n − 1 jestpodzielna przez n2.Wskazówka: Skorzystać ze wzoru Newtona i zauważyć, że każdy składnik wyrażenia(1 + n)n − 1 jest podzielny przez n2.

Zadanie 29. Niech m,n, p, q będą liczbami naturalnymi. Wykazać, że jeśli m− pdzieli mn+ pq, to dzieli także mq + np.Wskazówka: Do wyrażenia mq + np dodać, a następnie odjąć mn + pq. Otrzymanewyrażenia odpowiednio pogrupować.

Zadanie 30. Wykazać, że dla każdej liczby naturalnej n > 2 istnieje liczba pierwszap taka, że

n 6 p 6 n!− 1.

Wskazówka: Niech {p1, p2, . . . , pm} będzie zbiorem wszystkich liczb pierwszych mniej-szych od n!. Jeśli wszystkie liczby pi są mniejsze od n, to mamy

p1 · p2 · · · · · pm 6 (n− 1)!.

42 I. STRUKTURY LICZBOWE

Ponieważ (n− 1)! + 1 < n!, więc

p = p1 · p2 · · · · · pm + 1 6 (n− 1)! + 1 < n!.

Na podstawie analogicznego rozumowania jak w twierdzeniu 4.4 wnosimy, że p jest licz-bą pierwszą, co jest sprzeczne z przypuszczeniem, że wszystkie liczby pi były mniejszeod n.

Zadanie 31. W ciele liczb zespolonych rozwiązać równania i układy nierówności:(1)

(1− i)z = (3− i)z + 2 + 3i;

(2)|z| − z = 1 + 2i;

(3)z · z + z − z = 3 + 2i;

(4) {(4− 3i)z + (2 + i)w = 5(1 + i)(2− i)z − (2 + 3i)w = −(1 + i)

(5) {2(2 + i)z − i(3 + 2i)w = 5 + 4i(3− i)z + 2(2 + i)w = 2(1 + 3i)

(6) z

2− i+

w

1 + i= 2

5z(2− i)2

+2w

(1 + i)2= 3

Zadanie 32. Przedstawić w postaci trygonometrycznej następujące liczby zespo-lone:

(a) z = 1; (b) z = −2i;

(c) z = 1 + i; (d) z =√

3 + i;

(e) z = −1− i√

3; (f) z = 1− i.(g) z = 1 + i tgα; (h) z = tgα + i.

(i) z = 1 + cosα + i sinα; (j) z =1 + i tgα1− i tgα

.

(k) z =√

6 +√

2 + i(√

6−√

2); (l) z =√

6−√

2 + i(√

6 +√

2).

Zadanie 33. Przedstawić w postaci trygonometrycznej następujące liczby zespo-lone:

7. ZADANIA DO ROZDZIAŁU I 43

(a) (1 + i√

3)6; (b)(

1 + i√

31 + i

)20

(c)(

cosπ

3+ i sin

π

6

)2; (d) 3

√i;

(e)(−1

2− i√

32

)−11; (f)

(1 + i

1 + i√

3

)7.

Zadanie 34. Wykazać równości:

(a) cos 4x = 8 cos4 x− 8 cos2 x+ 1 (b) sin 4x = 4 sin x cosx(1− 2 sin2 x).

Zadanie 35. Podać interpretację geometryczną następujących zbiorów:

(a) {z ∈ C : |z| > 3}; (b) {z ∈ C : |z − i+ 1| ¬ 1};

(c) {z ∈ C : |z + 1|2 ¬ |z − 1|2}; (d){z ∈ C :

∣∣∣∣z − 3z + 1

∣∣∣∣ ­ 1}

;

(e) {z ∈ C : re(z) = 2}; (f) {z ∈ C : im(z2) = 2},(g) {z ∈ C : |z − 1|+ |z + 1| = 2}; (h) {z ∈ C : |z|2 = 2re(z)},

(re(z) oraz im(z) oznaczają odpowiednio część rzeczywistą i zespoloną liczby z).

Zadanie 36. W zbiorze liczb zespolonych rozwiązać równania

(a) z2 − 3z + 3 + i = 0; (b) z2 + (1 + 2i)z + i = 0

(c) z4 − 2z2 + 4 = 0; (d) z4 + (15 + 7i)z2 + 8− 15i = 0.

Zadanie 37. Znaleźć wszystkie pierwiastki:

(a) 3√

8 + 8i; (b) 4√i (c) 6

√1− i (d) 4

√−64.

Zadanie 38. Zbadać, czy dane wektory przestrzeni C(R) są liniowo niezależne:(1) 1, sinx, cosx,(2) sin2 x, cos2 x, sin 2x, cos 2x,(3) 1, 5x, 5−x.

Zadanie 39. Sprawdzić, że jeśli wektory v1, . . . , vn są liniowo niezależne, to wektoryv1, v1 + v2, . . . , v1 + v2 + · · ·+ vn są liniowo niezależne.

Zadanie 40. Sprawdzić czy dane wektory tworzą bazę przestrzeni R3:(a) [1, 0,−1], [1, 1, 3], [4, 1, 1],(b) [2, 3, 5], [1, 8, 1], [2, 7, 5],(c) [4, 5, 4], [−2, 1, 0], [3, 4, 5].

ROZDZIAŁ II

Macierze i wyznaczniki

1. Macierze

Jeśli n i m są liczbami naturalnymi, to macierzą o m wierszach i n kolumnachnazywamy układ m · n liczb z ciała K zapisanych w postaci tablicy

(1) A =

a11 a12 . . . a1na21 a22 . . . a2n...

......

am1 am2 . . . amn

,Jeśli macierz ma m wierszy i n kolumn, to będziemy też mówić, że jest wymiarówm× n. Macierz A postaci (1) będziemy także zapisywać w następujący sposób:

(2) A = [aij],

gdzie 1 6 i 6 m oraz 1 6 j 6 n. Liczby aij tworzące macierz A nazywamy elementamimacierzy A. W zapisie aij pierwszy wskaźnik, tzn. i oznacza numer wiersza, a drugiwskaźnik, tzn. j oznacza numer kolumny, w której znajduje się dany element macierzy.Zbiór wszystkich macierzy o m wierszach i n kolumnach oznaczać będziemy symbolemKm×n i nazywać przestrzenią macierzy wymiaru m× n o współczynnikach z ciała K.

Przykład 1.1. Oto kilka przykładów macierzy:

A =[1], B =

[1 2 3

], C =

0 1 23 4 71 6 2

, D =

123

,

E =[0 1 23 5 4

], F =

0 31 52 4

, G =[i 2 3 + 2i2 i i

].

Łatwo zauważyć, że A ∈ K1×1, B ∈ K1×3, C ∈ K3×3, D ∈ K3×1, E ∈ K2×3, F ∈K3×2, przy czym K może być zarówno ciałem liczb wymiernych, rzeczywistych lubzespolonych. Macierz G ∈ C2×3.

Wszystkie macierze w tym przykładzie są różne. Pierwsza z nich ma tylko jedenwiersz i jedną kolumnę i z tego powodu może być utożsamiona z liczbą rzeczywistą.Macierz B ma tylko jeden wiersz (i trzy kolumny), a macierz D jedną kolumnę (i trzy

45

46 II. MACIERZE I WYZNACZNIKI

wiersze). Tego typu macierze będziemy nazywali wektorami wierszowymi lub kolum-nowymi (por. przykład 6.3 na str. 30). Zatem wektory wierszowe to elementy zbioruK1×n, a wektory kolumnowe to elementy Kn×1, gdzie n ∈ N. Ponadto macierze B iD są do siebie podobne w tym sensie, że te same liczby, które w macierzy B tworząwiersz, w macierzy D tworzą kolumnę. Możemy więc powiedzieć, że macierz D powsta-ła z macierzy B przez zamianę wiersza na kolumnę. Taką operację będziemy nazywaćtranspozycją. Dokładniej: jeśli macierz A = [aij] jest macierzą wymiarów m × n, tomacierz B = [bij] wymiarów n×m otrzymaną z macierzy A poprzez zamianę wierszyna kolumny z zachowaniem ich kolejności, czyli

bij = aji,

nazywamy macierzą transponowaną do A. Macierz transponowaną do macierzy A ozna-czamy symbolem AT . Tak więc, jeśli A jest postaci (1), to

AT =

a11 a12 . . . a1na21 a22 . . . a2n...

......

am1 an2 . . . amn

T

=

a11 a21 . . . am1a12 a22 . . . am2...

......

a1n a2n . . . amn

.Oczywiście powtórne zastosowanie operacji transponowania spowoduje powrót do ma-cierzy A. Łatwo zauważyć, że w naszym przykładzie mamy także F T = E oraz ET = F .

Macierze, które mają takie same wymiary można do siebie dodawać, tzn. jeśli A =[aij], B = [bij] ∈ Km×n, to sumą macierzy A i B nazywamy taką macierz A+B ∈ Km+n,że

A+B = [aij + bij],

tzn.

A+B =

a11 + b11 a12 + b12 . . . a1n + b1na21 + b21 a22 + b22 . . . a2n + b2n

......

...am1 + bm1 am2 + bm2 . . . amn + bmn

.Zatem dodawanie macierzy tych samych wymiarów polega na dodaniu do każdegoelementu stojącego w w i-tym wierszu i j-tej kolumnie macierzy A elementu stojącegow i-tym wierszu i j-tej kolumnie macierzy B.

Macierz można pomnożyć przez dowolny element α ∈ K: iloczynem macierzy A =[aij] ∈ Km×n przez element α ∈ K nazywamy macierz αA ∈ Km×n daną wzorem

αA = [αaij].

tzn.

αA =

αa11 αa12 . . . αa1nαa21 αa22 . . . αa2n

......

...αam1 αam2 . . . αamn

,

1. MACIERZE 47

a więc każdy element macierzy A mnożymy przez α. Bez trudu stwierdzamy, że zbiórwszystkich macierzy Km×n z działaniem dodawania macierzy i mnożeniem przez ele-menty z ciała K jest przestrzenią liniową nad ciałem K:

A+ (B + C) = (A+B) + C,

A+ 0 = A,

gdzie 0 oznacza macierzą zerową, czyli macierz złożoną z samych zer,

A+ (−1)A = 0,

A+B = B + A,

α(A+B) = αA+ αB,

(α + β)A = αA+ βA,

(αβ)A = α(βA),

1A = A,

gdzie A,B,C ∈ Km×n oraz α, β ∈ K. Możemy zatem stwierdzić, że

Twierdzenie 1.1. Zbiór Km×n z działaniami dodawania macierzy i działaniemmnożenia przez skalar, z wyróżnioną macierzą zerową jest przestrzenią liniową nadciałem K.

Przykład 1.2.1 2 6 72 2 12 43 1 11 5

+

1 1 1 02 2 2 20 8 1 2

=

2 3 7 74 4 14 63 9 12 7

4

2 3 7 74 4 14 63 9 12 7

=

8 12 28 2816 16 56 2412 36 48 28

.Operacja mnożenia macierzy przez macierz jest bardziej złożona a poza tym nie

zawsze wykonalna. Aby pomnożyć macierz A przez macierz B musimy założyć, że wwierszach macierzy A jest tyle samo elementów ile ich jest w kolumnach macierzy B.Oznacza to tyle, że macierz A musi mieć tyle kolumn ile macierz B wierszy. Dokładniej,jeśli macierz A jest wymiarów l ×m natomiast B jest macierzą wymiarów m × n, toiloczyn macierzy A i B jest macierzą AB = [cij] wymiarów l × n przy czym

(3) cij = ai1b1j + ai2b2j + · · ·+ ailblj

dla dowolnego i ∈ {1, . . . , l} oraz j ∈ {1, . . . , n}.Tak więc aby wyznaczyć element, który stoi w i-tym wierszu i j-tej kolumnie macie-

rzy AB mnożymy kolejno elementy i-tego wiersza macierzy A przez odpowiadajace imelementy j-tej kolumny macierzy B (jest ich tyle samo), a następnie dodajemy wszyst-kie uzyskane w ten sposób iloczyny. Widać z tak postawionej definicji, że mnożeniemacierzy nie zawsze jest wykonalne, o czym przekonuje nas następujący przykład:

48 II. MACIERZE I WYZNACZNIKI

Przykład 1.3. [0 2 31 5 4

2 1 0 13 1 1 01 2 2 2

=[

9 8 8 621 14 13 9

].

Zauważmy przy tym, że iloczyn2 1 0 13 1 1 01 2 2 2

· [0 2 31 5 4

]

nie jest określony.

Zauważmy jeszcze, że zamiana kolejności wykonywania mnożenia macierzy (jeślijest ono wykonalne) może spowodować, że otrzymamy macierz innych wymiarów. Istot-nie, mnożenia macierzy E i F z przykładu 1.1 są wykonalne w dowolnej kolejności,jednak EF ∈ K2×2, a FE ∈ K3×3. Zatem z konieczności, EF 6= FE.

Macierz A nazywamy kwadratową, gdy ma tyle samo wierszy co kolumn. Tak więcmacierz kwadratowa jest wymiarów n×n, dla pewnego n ∈ N. O macierzy kwadratowejmówimy wtedy, że jest stopnia n. Macierz C z przykładu 1.1 jest kwadratowa. Mnożeniemacierzy kwadratowych tego samego stopnia jest zawsze wykonalne i daje w wynikumacierz tego samego stopnia. Jednak i w tym przypadku nietrudno wskazać takiemacierze A,B ∈ Rn×n, że

AB 6= BA.

Przykład 1.4. Rozważmy następujące macierze stopnia 3:

A =

1 0 22 1 00 2 1

, B =

1 2 02 0 10 1 2

.Posługując się wzorem (3) łatwo obliczyć, że

AB =

1 4 44 4 14 1 2

,natomiast

BA =

5 2 22 2 52 5 2

.Widzimy więc, że AB 6= BA.

Dla macierzy kwadratowej wyróżnia się pojęcie tzw. przekątnej macierzy, tj. zbiór{aii : i ∈ {1, . . . , n}}. Macierz, która ma wszystkie wyrazy zerowe „pod przekątną” lub

1. MACIERZE 49

„nad przekątną” nazywamy macierzą trójkątną. Ściślej, macierz jest trójkątna, jeśliaij = 0 dla i > j lub aij = 0 dla i < j. Tak więc macierz trójkątna jest postaci

a11 a12 a13 . . . a1n0 a22 a23 . . . a2n0 0 a33 . . . a3n...

......

...0 0 0 . . . ann

lub postaci

a11 0 0 . . . 0a21 a22 0 . . . 0a31 a32 a33 . . . 0...

......

...an1 an2 an3 . . . ann

.

Macierz kwadratowa, która ma wszystkie elementy zerowe, z wyjątkiem być możewyrazów stojących na przekątnej nazywa się macierzą diagonalną. Tak więc macierzdiagonalna jest macierzą postaci:

a11 0 0 . . . 00 a22 0 . . . 00 0 a33 . . . 0...

......

...0 0 0 . . . ann

.

Przykład 1.5. Wśród macierzy

A =

1 2 30 1 20 0 1

, B =

1 0 02 5 03 −2 1

, C =

1 0 00 2 00 0 3

macierze A i B są trójkątne, a macierz C jest diagonalna.

Wśród macierzy diagonalnych wyróżniamy macierze jednostkowe, tzn. takie, którena przekątnej mają same jedynki, a poza przekatną zera. Macierz jednostkowa stopnia ndana jest wzorem:

In = [δij],przy czym

δij =

1, jeśli i = j

0, jeśli i 6= j.

Powyżej zdefiniowany symbol δij zwykło się nazywać deltą Kroneckera. Tak więc ma-cierz jednostkowa stopnia n ma postać

In =

1 0 0 . . . 00 1 0 . . . 00 0 1 . . . 0...

......

...0 0 0 . . . 1

.Macierze jednostkowe odgrywają podobną rolę w mnożeniu macierzy jak liczba 1 wmnożeniu liczb rzeczywistych. Mówi o tym następujące twierdzenie, którego nietrudneuzasadnienie pozostawiamy czytelnikowi.

50 II. MACIERZE I WYZNACZNIKI

Twierdzenie 1.2. Jeśli A ∈ Km×n, to

ImA = AIn = A.

W szczególności, jeśli m = n, to otrzymujemy równość:

InA = AIn = A,

a więc w tym przypadku mnożenie macierzy jest przemienne.Operacja mnożenia macierzy ma jeszcze trzy dodatkowe własności. Mówi o tym

kolejne twierdzenie.

Twierdzenie 1.3. (a) Jeśli A ∈ Kk×l, B ∈ Kl×m oraz C ∈ Km×n, to

(AB)C = A(BC).

(b) Jeśli A ∈ Kl×m oraz B,C ∈ Km×n, to

A(B + C) = AB + AC.

(c) Jeśli A,B ∈ Kl×m oraz C ∈ Km×n, to

(A+B)C = AC +BC.

Własność zawarta w podpunkcie (a) tego twierdzenia nazywa się łącznością. Zatemmnożąc trzy lub więcej macierzy możemy łączyć je w grupy, pamiętając, że nie mo-żemy zmieniać kolejności wykonywania działań. Własność z podpunktów (b) i (c), totzw. rozdzielność mnożenia macierzy względem ich dodawania. Pozwala ona, podob-nie jak wśród liczb rzeczywistych, wyciągnąć wspólny czynnik przed lub za nawias,co znowu na ogół nie jest tym samym, ze względu na brak przemienności mnożeniamacierzy.

Możemy również pomyśleć o działaniu, które byłoby działaniem odwrotnym domnożenia macierzy w podobnym sensie jak działaniem odwrotnym do mnożenia liczbrzeczywistych jest dzielenie. Jeśli a, b, c ∈ R to równość

a · b = c

pociąga, żeb =

c

a= c · a−1 = a−1 · c,

o ile a 6= 0. Analogiczna operacja dla macierzy może nie mieć sensu chyba, że dlamacierzy A będziemy potrafili wyznaczyć macierz A−1 tych samych wymiarów taką,że

AA−1 = A−1A = In,

gdzie, przypominamy, In jest macierzą jednostkową stopnia n.Okazuje się, że dla pewnych macierzy działanie analogiczne do dzielenia liczb można

wprowadzić. Potrzebować będziemy jednak dodatkowego pojęcia, o którym powiemyw następnym paragrafie.

2. WYZNACZNIKI 51

2. Wyznaczniki

Pojęciem, o którym mówiliśmy na końcu poprzedniego paragrafu jest wyznacznik(lub inczej wyróżnik lub determinant) macierzy kwadratowej. Niech A będzie macierząkwadratową stopnia n, tzn.

(1) A =

a11 a12 . . . a1na21 a22 . . . a2n...

......

an1 an2 . . . ann

.Wybierzmy z pierwszego wiersza macierzy A dowolny element. Z drugiego wiersza

wybierzmy dowolny element, ale nie z kolumny, z której wybraliśmy pierwszy element. Ztrzeciego wiersza wybierzmy element, który nie stoi w kolumnach, z których wybraliśmydwa poprzednie. Postępujemy tak aż do n–tego wiersza. Po wymnożeniu wybranychelementów możemy na przykład otrzymać iloczyn

a11a22a33 · · · · · ann,lub iloczyn

a12a21a33 · · · · · ann.Ogólnie, każdy taki iloczyn jest postaci

(2) a1p1a2p2 · · · · · anpn ,gdzie

(3) p = (p1, p2, . . . , pn)

jest permutacją zbioru {1, 2, . . . , n}. Iloczyn

(−1)I(p)a1p1a2p2 · · · · · anpn ,gdzie I(p) jest liczbą inwersji występujących w permutacji p = (p1, p2, . . . , pn), nazy-wamy składnikiem wyznacznika macierzy A. Sumę wszystkich składników wyznacznikamacierzy A nazywamy wyznacznikiem macierzy A. Wyznacznik macierzy A oznaczaćbędziemy symbolem detA. Tak więc

(4) detA =∑p∈Pn

(−1)I(p)a1p1a2p2 · · · · · anpn .

Wyznacznik det jest więc funkcją określoną w zbiorze wszystkich macierzy kwadra-towych wzorem (4) o wartościach w ciele K.

Przykład 2.1. Obliczymy wyznaczniki macierzy stopnia 1, 2 oraz 3.1. Jeśli n = 1, to:

detA = det[a11] = a11,

2. Jeśli n = 2, to:

detA = det[a11 a12a21 a22

]= (−1)0a11a22 + (−1)1a12a21 = a11a22 − a12a21,

52 II. MACIERZE I WYZNACZNIKI

gdyż w pierwszym składniku wyznacznika macierzy A permutacja (1, 2) nie ma inwersji,a w drugim składniku permutacja (2, 1) ma dokładnie jedną inwersję.

3. Jeśli n = 3, to:

detA = det

a11 a12 a13a21 a22 a23a31 a32 a33

= (−1)0a11a22a33 + (−1)2a12a23a31 + (−1)2a13a21a32+

+ (−1)1a11a23a32 + (−1)1a12a21a33 + (−1)3a13a22a31 == a11a22a33 + a12a23a31 + a13a21a32 − a11a23a32 − a12a21a33 − a13a22a31.

To, że w poszczególnych składnikach wyznacznika powyższej macierzy występują liczby-1 w takich a nie innych wykładnikach wynika, jak czytelnik zapewne pamięta, z tego,że odpowiednie permutacje zbioru {1, 2, 3} występujące w składnikach wyznacznikachmacierzy A mają liczbę inwersji równą 0, 2, 2, 1, 1 oraz 3 (por. Przykład 2.6 str. 9).

Wzór na wyznacznik macierzy stopnia 1 oraz 2 nie powinien przedstawiać żadnejtrudności w obliczaniu. Natomiast do obliczania wyznacznika stopnia 3 możemy posłu-żyć się pewnym schematem. Polega on na dopisaniu do macierzy stopnia 3 jego dwóchpierwszych wierszy:

+a11

FFFF

FFFF

F

FFFF

FFFF

Fa12 a13−

xxxx

xxxx

x

+a21

FFFF

FFFF

F

FFFF

FFFF

Fa22

FFFF

FFFF

F

FFFF

FFFF

F

xxxx

xxxx

xa23−

xxxx

xxxx

x

+a31

FFFFFFFF

FFFFFFFFa32

GGGG

GGGG

G

GGGG

GGGG

G

xxxx

xxxx

xa33−

wwwwwwww

a11 a12

GGGG

GGGG

G

GGGG

GGGG

G

wwww

wwww

wa13

a21 a22 a23

a następnie dodaniu iloczynów elementów stojących na liniach ukośnych z góry do dołuze znakiem „+”, jeśli zaczynamy od elementu opatrzonego znakiem „+” i ze znakiem„-”, jeśli zaczynamy od elementu opatrzonego znakiem „-”. Ten schemat obliczaniawyznacznika macierzy stopnia 3 nazywamy schematem Sarrusa. Wersja równoważnapolega na dopisaniu dwóch kolejnych kolumn.

Przykład 2.2. Obliczmy dla przykładu następujący wyznacznik

det

1 2 35 5 61 3 3

.

2. WYZNACZNIKI 53

Podpisujemy pod macierzą dwa pierwsze rzędy:

+ 1 2 3 −+ 5 5 6 −+ 1 3 3 −

1 2 35 5 6

a następnie dodajemy obliczone składniki wyznacznika tej macierzy:

1 · 5 · 3 + 5 · 3 · 3 + 1 · 2 · 6− 3 · 5 · 1− 6 · 3 · 1− 3 · 2 · 5.Wyznacznik macierzy jest zatem równy

det

1 2 35 5 61 3 3

= 15 + 45 + 12− 15− 18− 30 = 72− 63 = 9.

Jest to sposób mnemotechniczny zapamiętywania wyznacznika stopnia trzeciego.Metoda ta nie daje się przenieść bezpośrednio na wyznaczniki wyższych stopni, co niedziwi, bo jak wiemy, wyznacznik macierzy stopnia czwartego jest sumą 24 składni-ków, a stopnia piątego aż 120 składników, gdyż tyle jak wiemy jest permutacji zbioru{1, 2, 3, 4, 5}. Nietrudno jednak zauważyć, że

Twierdzenie 2.1. Wyznacznik macierzy trójkątnej jest równy iloczynowi elemen-tów stojących na przekątnej.

Istotnie, w macierzy trójkątnej wszystkie wyrazy pod lub nad przekątną są równezero. Dlatego też wszystkie składniki wyznacznika macierzy, z wyjątkiem co najwyżej

(−1)0a11a22 · · · · · ann = a11a22 · · · · · annzawierają czynnik równy zero, a więc są równe zero. Wobec tego wyznacznik takiejmacierzy jest równy a11a22 · · · · · ann.

Inną, niemal natychmiast zauważalną własnością wyznaczników jest, że

Twierdzenie 2.2. Jeśli w jakimś wierszu macierzy kwadratowej występują samezera, to wyznacznik takiej macierzy jest równy zero.

Wynika to bezpośrednio z definicji wyznacznika, gdyż zgodnie ze wzorem (4), przy-najmniej jeden czynnik każdego z wyrażeń postaci a1p1a2p2 . . . anpn jest równy zero.

Kolejna ważna własność wyznacznika to

Twierdzenie 2.3. detA = detAT .

Istotnie, niech p = (p1, . . . , pn) będzie permutacją zbioru {1, . . . , n} wyznaczającąskładnik wyznacznika macierzy B = AT . Składnik ten jest postaci

(−1)I(p)b1p1 · · · · · bnpn .

54 II. MACIERZE I WYZNACZNIKI

Ponieważ macierz B jest macierzą transponowaną macierzy A, więc

(−1)I(p)b1p1 · · · · · bnpn = (−1)I(p)ap11 · · · · · apnn.Niech q = (q1, . . . , qn) będzie permutacją odwrotną do permutacji p, tj.

qi = j wtedy i tylko wtedy, gdy pj = i.

W permutacji q występuje tyle samo inwersji co w permutacji p, gdyż liczby pj, pj′tworzą inwersję w permutacji p wtedy i tylko wtedy, gdy liczby j = qi oraz j′ = qi′tworzą inwersję w permutacji q. Wobec tego po odpowiednim przegrupowaniu czynni-ków możemy napisać, że rozważany składnik wyznacznika jest postaci

(−1)I(p)b1p1 · · · · · bnpn = (−1)I(q)a1q1 · · · · · anqn ,a więc jest składnikiem wyznacznika macierzy A. Pozostaje zauważyć, że skoro róż-ne permutacje zbioru {1, . . . , n} mają różne permutacje odwrotne, to każdy składnikwyznacznika macierzy A będzie równy dokładnie jednemu składnikowi wyznacznikamacierzy B = AT .

Z ostatniego twierdzenia wynika, że każda własność wzynacznika odnosząca się dowierszy macierzy będzie także prawdziwa dla kolumn tej macierzy. Na przykład, jeśliw pewnej kolumnie macierzy kwadratowej wszystkie elementy są zerami to wyznaczniktakiej macierzy jest równy zero.

Załóżmy, że w danej macierzy kwadratowej A = [aij] stopnia n zmienimy miejscamidwa wiersze; dla ustalenia uwagi załóżmy, że wiersz i-ty zmieniamy z j-tym, gdzie i < j.Tak otrzymaną macierz oznaczmy symbolem B. Oczywiście

(5) bik = ajk, bjk = aik oraz alk = blk

dla każdego k = 1, . . . , n oraz l 6= i, j. Dowolny składnik wyznacznika macierzy B jestwyznaczony przez pewną permutację p = (p1, . . . , pn) zbioru {1, . . . , n} i jest postaci

(−1)I(p)b1p1 · · · · · bipi · · · · · bjpj · · · · · bnpn .Uwzględniając wzory (5) i korzystając z przemienności mnożenia możemy napisać, żeskładnik ten jest postaci

(−1)I(p)a1p1 · · · · · ajpi · · · · · aipj · · · · · anpn = (−1)I(p)a1p1 · · · · · aipj · · · · · ajpi · · · · · anpn .W permutacji

q = (q1, . . . , qi, . . . , qj, . . . , qn) = (p1, . . . , pj, . . . , pi, . . . , pn),

powstałej z permutacji p w wyniku zamiany elementu pi z elementem pj zmieni się wstosunku do p ilość inwersji o liczbę nieparzystą (patrz zadanie 1 str. 33):

I(q) = I(p)± (2m− 1), m ∈ N.Stąd

(−1)I(p)b1p1 · · · · · bipi · · · · · bjpj · · · · · bnpn = −(−1)I(q)a1q1 · · · · · anqn .

2. WYZNACZNIKI 55

Pokazaliśmy zatem, że każdy składnik wyznacznika macierzy B jest przeciwny dopewnego składnika wynacznika macierzy A. Ponieważ dla różnych permutacji zbioru{1, . . . , n} w wyniku zamiany i-tego elementu z j-tym otrzymamy różne permutacje,więc każdy składnik wyznacznika macierzy A będzie przeciwny do dokładnie jednegoskładnika wyznacznika macierzy B. Stąd otrzymujemy następujące twierdzenie

Twierdzenie 2.4. Jeśli w macierzy kwadratowej zamienimy miejscami dwa wier-sze (kolumny), to wyznacznik zmieni znak na przeciwny.

Bezpośrednią konsekwencją ostatniego twierdzenia jest następujące:

Twierdzenie 2.5. Jeśli dwa wiersze (kolumny) w macierzy kwadratowej są takiesame, to wyznacznik tej macierzy jest równy zero.

Istotnie, jeśli w takiej macierzy zamienimy miejscami identyczne wiersze, to macierzpozostanie taka sama. Z ostatniego twierdzenia mamy jednak, że

detA = − detA,

a to jest możliwe tylko wtedy, gdy detA = 0.

Równie łatwą do uzasadnienia, a użyteczną własność wyznacznika odnotujmy wnastępnym twierdzeniu:

Twierdzenie 2.6. Wspólny czynnik elementów stojących w dowolnym wierszu (ko-lumnie) macierzy kwadratowej można wyciągnąć przed znak wyznacznika.

Aby się o tym przekonać załóżmy, że mamy daną liczbę rzeczywistą β. Zgodnie zdefinicją

detA =∑p∈Pn

(−1)I(p)a1p1a2p2 · · · · · anpn .

W każdym składniku wyznacznika macierzy A występuje jako czynnik dokładnie jedenelement z każdego wiersza, np. z wiersza o numerze i. Dlatego możemy napisać

β detA =∑p∈Pn

(−1)I(p)a1p1a2p2 · βaipi · · · · · anpn ,

lub inaczej

β detA = det

a11 a12 . . . a1n...

......

βai1 βai2 . . . βain...

......

an1 an2 . . . ann

56 II. MACIERZE I WYZNACZNIKI

Przykład 2.3. Obliczmy wyznacznik macierzy12 44 306 22 156 33 35

.Bezpośrednie zastosowanie definicji (schematu Sarrusa), powoduje, że musimy mnożyćprzez siebie dosyć duże liczby. Natomiast twierdzenie 2.6 pozwala nam znacznie upro-ścić rachunki. Mamy bowiem, po wyciągnięciu liczby 6 z pierwszej kolumny, liczby 11z drugiej oraz liczby 5 z ostatniej kolumny, następującą równość:

det

12 44 306 22 156 33 35

= 6 · 11 · 5 · det

2 4 61 2 31 3 7

,Możemy jeszcze wyciągnąć liczbę 2 z pierwszego wiersza. Wtedy wyznacznik naszejmacierzy będzie równy liczbie

6 · 11 · 5 · 2 · det

1 2 31 2 31 3 7

.Wiemy jednak, że wyznacznik macierzy, w której dwa wiersze są takie same jest równyzero. Stąd mamy równość

det

12 44 306 22 156 33 35

= 6 · 11 · 5 · 0 = 0.

Ostatnie twierdzenie łącznie z twierdzeniem 2.5 daje nam następujące

Twierdzenie 2.7. Jeśli macierz kwadratowa zawiera dwa wiersze (kolumny) pro-porcjonalne, to wyznacznik takiej macierzy jest równy zero.

Omówimy teraz jedną z najczęściej wykorzystywanych własności wyznacznika. NiechB będzie macierzą powstałą z macierzy A = [aij] w wyniku dodania do k–tego wierszamacierzy A jej i–tego wiersza pomnożonego przez dowolną liczbę rzeczywistą β, gdzie1 6 k 6 n oraz i 6= k. Wówczas k-ty wiersz macierzy B będzie miał postać

ak1 + βai1, ak2 + βai2, . . . , akn + βain.

Każdy sładnik wyznacznika macierzy B jest wtedy postaci:

(−1)I(p)a1p1a2p2 · · · · · (akpk + βaipk) · · · · · anpn ,gdzie p = (p1, p2, . . . , pn) jest pewną permutacją zbioru {1, . . . , n}, a I(p) ilością inwer-sji w permutacji p. Składnik ten jest oczywiście równy sumie

(−1)I(p)a1p1a2p2 · · · · · akpk · · · · · anpn + (−1)I(p)a1p1a2p2 · · · · · βaipk · · · · · anpn .

2. WYZNACZNIKI 57

Wśród składników występujących w powyższej sumie rozpoznajemy postać składnikawyzncznika macierzy A – to ten stojący z lewej strony sumy oraz składnik wyznacznikamacierzy C, w której k-ty wiersz jest proporcjonalny do i-tego wiersza – to ten stojącyz prawej strony. Z twierdzenia 2.7 wynika, że

detC =∑p∈Pn

(−1)I(p)a1p1a2p2 · · · · · βai@,pk · · · · · anpn = 0.

Dlatego też

detB =∑p∈Pn

(−1)I(p)a1p1 · · · · · (akpk + βaipk) · · · · · anpn =

=∑p∈Pn

[(−1)I(p)a1p1 · · · · · akpk · · · · · anpn + (−1)I(p)a1p1 · · · · · βaipk · · · · · anpn

]=

=∑p∈Pn

(−1)I(p)a1p1 · · · · · akpk · · · · · anpn +∑p∈Pn

(−1)I(p)a1p1 · · · · · βaipk · · · · · anpn =

= detA+ detC = detA.

Wykazaliśmy więc następujące twierdzenie:

Twierdzenie 2.8. Wyznacznik macierzy nie zmieni się, jeśli do dowolnego wiersza(kolumny) dodamy inny wiersz (kolumnę) pomnożony przez dowolną liczbę rzeczywistą.

Przykład 2.4. Obliczmy wyznacznik macierzy

A =

1 1 1 11 2 3 41 3 6 101 4 10 20

.W tym celu pomnóżmy pierwszą kolumnę przez −1 i dodajmy kolejno do kolumnydrugiej, trzeciej i czwartej. W ten sposób na mocy twierdzenia 2.8 otrzymujemy, że

detA = det

1 0 0 01 1 2 31 2 5 91 3 9 19

Pomnóżmy teraz drugą kolumnę przez −2 i dodajmy do trzeciej, a następnie pomnóż-my również drugą kolumnę przez −3 i dodajmy do kolumny czwartej. Otrzymujemywówczas

detA = det

1 0 0 01 1 0 01 2 1 31 3 3 10

.

58 II. MACIERZE I WYZNACZNIKI

W końcu pomnóżmy trzecią kolumnę przez −3 i dodajmy do czwartej. Otrzymujemy

detA = det

1 0 0 01 1 0 01 2 1 01 3 3 1

.Otrzymaliśmy wyznacznik macierzy trójkątnej, który jak wiemy jest równy iloczynowiliczb stojących na przekątnej czyli jest równy 1.

Niech dana będzie macierz A (niekoniecznie kwadratowa) wymiarów n × m orazliczba naturalna k, która nie jest większa ani od n ani od m. Wybierzmy z macierzyA dowolne k wierszy i k kolumn. Z wszystkich elementów, które stoją na przecięciuwybranych wierszy i kolumn można zbudować nową macierz kwadratową stopnia k.Wyznacznik tej macierzy nazywamy minorem stopnia k macierzy A. Minor danej ma-cierzy oznaczać będziemy symbolem Mi1,...,ik;j1,...,jk , jeśli mamy na myśli minor stopniak wyznaczony przez wiersze o numerach i1, . . . , ik i kolumny o numerach j1, . . . , jk. Naprzykład, jeśli

A =

2 3 6 7 −23 −2 1 0 54 0 2 1 −1

,to

M1,3;2,5 = det[3 −20 −1

]= −3,

natomiast

M1,2,3;2,4,5 = det

3 7 −2−2 0 50 1 −1

= 4− 14− 15 = −25.

Jeśli Mi1,...,ik;j1,...,jk , jest minorem macierzy kwadratowej A, to elementy macierzy A sto-jące na przecięciu wierszy, których numer jest różny od i1, . . . , ik i kolumn o numerachróżnych od j1, . . . , jk tworzą również macierz kwadratową. Wyznacznik tej macierzynazywamy dopełnieniem minora Mi1,...,ik;j1,...,jk , który oznaczać będziemy symbolemM ′

i1,...,ik;j1,...,jk . W szczególności minorami stopnia 1 są wyznaczniki macierze jedno-elementowe czyli elementy macierzy. W przypadku macierzy kwadratowej stopnia ndopełnieniami elementów aij macierzy A są minory stopnia n− 1 postaci:

M ′i;j = detAij = det

a11 a12 . . . a1,j−1 a1,j+1 . . . a1na21 a22 . . . a2,j−1 a2,j+1 . . . a2n...

......

......

ai−1 1 ai−1 2 . . . ai−1 j−1 ai−1 j+1 . . . ai−1nai+11 ai+12 . . . ai+1 j−1 ai+1 j+1 . . . ai+1n

......

......

...an1 an2 . . . an,j−1 an,j+1 . . . ann

,

2. WYZNACZNIKI 59

czyli wyznaczniki macierzy Aij powstałych z macierzy A w wyniku skreślenia i - tegowiersza i j-tej kolumny. Dopełnieniem minora M1,3;2,3 w macierzy

A =

1 2 3 10 −1 6 21 7 −2 13 4 2 1

jest

M ′1,3;2,3 = det

[0 23 1

]= −6,

a minora M2;3 czyli elementu a23 = 6 jest

M ′2;3 = det

1 2 11 7 13 4 1

= 7 + 4 + 6− 21− 4− 2 = −10.

Dla minora Mi1,i2,...,ik;j1,j2,...,jk danej macierzy kwadratowej A liczbę

(−1)tM ′i1,i2,...,ik;j1,j2,...,jk ,

gdzie t = i1 + · · · + ik + j1 + · · · + jk, nazywamy dopełnieniem algebraicznym minoraMi1,i2,...,ik;j1,j2,...,jk w macierzy A. W szczególnym przypadku, dopełnienia algebraiczneelementów aij macierzy kwadratowej A będziemy oznaczać symbolem Dij. Wobec tego

(6) Dij = (−1)i+jM ′i;j = (−1)i+j detAij.

Przykład 2.5. Niech

A =

1 2 3 41 1 6 32 2 5 22 0 0 1

; oraz M = det[1 21 1

].

Widać, że minor M jest wyznaczony przez pierwszy i drugi wiersz oraz pierwszą i drugąkolumnę. Wobec tego

M ′ = det[5 20 1

],

i dopełnienie algebraiczne minora M jest równe:

(−1)1+2+1+2 detM ′ = detM ′ = 5.

Dopełnienie algebraiczne elementu 4 stojącego w pierwszym wierszu i czwartej kolum-nie macierzy A jest równe

D14 = (−1)1+4 det

1 1 62 2 52 0 0

= 14.

60 II. MACIERZE I WYZNACZNIKI

Jeśli M jest minorem macierzy kwadratowej A, a M ′ jego dopełnieniem, to dowolnyskładnik minora M ′ (składnik wyznacznika M ′) pomnożony przez liczbę (−1)t, gdzie tjest sumą numerów wierszy i kolumn w których występuje macierz określająca minorM , nazywamy składnikiem dopełnienia algberaicznego minora M .

Lemat 2.1. Jeśli M jest minorem stopnia k w macierzy kwadratowej A stopnia n,przy czym k < n, to:

(1) dowolny składnik minora M pomnożony przez składnik dopełnienia algebraicz-nego minora M jest składnikiem wyznacznika macierzy A;

(2) iloczyn minora M przez jego dopełnienie algebraiczne jest sumą k! · (n − k)!różnych składników wyznacznika macierzy A.

Ustalmy w macierzy kwadratowej stopnia n wiersze o numerach i1, . . . , ik oraz ko-lumny o numerach j1, . . . , jk. Wybrane wiersze i kolumny wyznaczają minor

M = Mi1,...,ik;j1,...,jk = det

b11 . . . b1k...

......

bk1 . . . bkk

,gdzie

bl m = ail jm , 1 6 l 6 k, 1 6 m 6 k.

Dopełnieniem tego minora będzie minor

M ′ = Mi′1,...,i′n−k;j

′1,...,j

′n−k

= det

c11 . . . c1n−k...

......

cn−k 1 . . . cn−k n−k

,gdzie

cl m = ai′lj′m , 1 6 l,m 6 n− k.

Oczywiście

{i1, . . . , ik, i′1, . . . , i′n−k} = {j1, . . . , jk, j′1, . . . , j′n−k} = {1, . . . , n}Ustalmy dowolną permutację p = (p1, . . . , pk) zbioru {1, . . . , k} oraz permutację q =(q1, . . . , qn−k) zbioru {1, . . . , n−k}. Składnik minora M wyznaczony przez permutacjęp jest postaci

(7) (−1)I(p)b1 p1 · · · · · bk pk = (−1)I(p)ai1 jp1 · · · · · aik jpk ,zaś składnik dopełnienia minora M wyznaczony przez permutację q jest postaci

(8) (−1)I(q)c1 q1 · · · · · cn−k qn−k = (−1)I(q)ai′1 j′q1 · · · · · ai′n−k j′qn−k .

Zdefiniujmy permutację r zbioru {1, . . . , n} w następujący sposób:

(9) rl =

jps , jeśli l = isj′qs , jeśli l = i′s.

2. WYZNACZNIKI 61

Zauważmy przede wszystkim, że zarówno liczby jp1 , . . . , jpk jak i liczby j′q1 , . . . , j′qn−k

występują w porządku wzrastania dolnych wskaźników, tzn. jeśli l < m to liczba jplpoprzedza w permutacji r liczbę jpm oraz liczba j′ql poprzedza w permutacji r liczbęj′qm . Wynika to stąd, że i1 < · · · < ik oraz i′1 < · · · < i′n−k. Obliczmy ilość inwersji wpermutacji r. Ponieważ także j1 < · · · < jk oraz j′1 < · · · < j′n−k, więc ilość inwersjiw r wynikająca z poprzedzania elementu mniejszego przez większy wśród elementówpostaci jp1 , . . . , jpk jest równa I(p), a ilość analogicznych inwersji występujących wśródelementów postaci j′q1 , . . . j

′qn−k

będzie równa I(q). Wobec tego ilość inwersji w permu-tacji r jest równa

I(r) = I(p) + I(q) + w,

gdzie w jest ilością inwersji występujących w r, które tworzą elementy postaci jploraz j′qm . Z zadania 3 (str. 34) wynika, że ilość inwersji, w których występuje elementpostaci jps jest liczbą parzystą wtedy i tylko wtedy, gdy jps+ is jest liczbą parzystą dlakażdego s = 1, . . . , k. Wszystkie inwersje, w których występują elementy jps wyczerpiąnam zbiór wszystkich inwersji permutacji r, za wyjątkiem tych, które są utworzonejedynie przez elementy j′qs . Dlatego też

I(jp1 ; r) + · · ·+ I(jpk ; r) = 2I(p) + w,

gdzie dla każdego s = 1, . . . , k symbol I(jps ; r) oznacza ilość inwersji w permutacji r,w których występuje element pjs . Ponieważ wszystkie liczby postaci

I(jps ; r)− (jps + is),

są parzyste więc liczba

I(jp1 ; r) + · · ·+ I(jpk ; r)− (jp1 + · · ·+ jpk + i1 + · · ·+ ik)

jest parzysta, skąd wynika, że

w − (jp1 + · · ·+ jpk + i1 + · · ·+ ik) = w − (j1 + · · ·+ jk + i1 + · · ·+ ik)

jest liczbą parzystą. Mamy zatem

(−1)w = (−1)j1+···+jk+i1+···+ik .

Po wymnożeniu składnika minora M przez składnik jego dopełnienia algebraicznego(patrz wzory (7) i (8)) otrzymujemy

(10) (−1)I(p)ai1 jp1 · · · · · aik jpk · (−1)i1+···+ik+j1+···+jk(−1)I(q)ai′1 j′q1 · · · · · ai′n−k j′qn−k =

= (−1)I(p)+I(q)+wai1 jp1 · · · · · aik jpkai′1 j′q1 · · · · · ai′n−k j′qn−k =

= (−1)I(r)a1r1 · · · · · anrn ,czyli składnik wyznacznika macierzy A. W ten sposób dowód pierwszej części lematuzostał zakończony.

W celu wykazania drugiej części lematu zauważmy, że minor M , jako wyznacznikmacierzy stopnia k, jest sumą swoich k! składników. Z kolei jego dopełnienie, jako wy-znacznik macierzy stopnia n− k, ma (n− k)! składników. Dlatego też iloczyn minora

62 II. MACIERZE I WYZNACZNIKI

M przez jego dopełnienie algebraiczne ma formalnie k! · (n− k)! składników. Na mocypierwszej części lematu każdy z nich jest składnikiem wyznacznika macierzy A. Prze-konajmy się, że te wszystkie składniki są różnymi składnikami wyznacznika macierzyA. Ze wzorów (7), (8) oraz (10), wynika, że iloczyn składnika minora M przez jegodopełnienie algebraiczne jest równe składnikowi wyznacznika macierzy A postaci:

(−1)I(r)a1r1 · · · · · anrn ,gdzie r jest permutacją zbioru {1, . . . , n} zdefiniowanego wzorem (9), przy czym skład-nik minora M jest wyznaczony przez permutację p, a składnik dopełnienia algberaicz-nego jest wyznaczony przez permutację q zbioru {1, . . . , n − k}. Biorąc dowolny innyiloczyn składnika minora M przez składnik jego dopełnienia algebraicznego otrzymu-jemy składnik macierzy A postaci:

(−1)I(r′)a1r′1 · · · · · anr′n ,

gdzie r′ jest permutacją zbioru {1, . . . , n} określoną także wzorem (9), przy czym terazskładnik minora M jest wyznaczony przez pewną permutację p′, a składnik dopełnieniaalgebraicznego przez permutację q′, gdzie p 6= p lub q 6= q′. Wystarczy więc pokazać,że permutacje r oraz r′ są różne. Załóżmy na przykład, że p 6= p′ (analogicznie rozu-mujemy, jeśli q 6= q′). Wtedy dla pewnego s ∈ {1, . . . , n} mamy ps 6= p′s. Niech l = is.Wobec tego na mocy definicji permutacji r i r′ mamy

rl = jps 6= jp′s = r′l,

skąd wynika, że permutacje r i r′ są różne.

Własność zawartą w powyższym lemacie wykorzystamy w następujący sposób.Ustalmy dowolnie k wierszy w macierzy kwadratowej A stopnia n, gdzie 1 6 k < n.Niech M1,M2, . . . ,Ml będą wszystkimi minorami, wyznaczonymi przez ustalone k wier-szy oraz k kolumn macierzy A. Wyborom k spośród n kolumn odpowiadają dokładniek–elementowe kombinacje zbioru n–elementowego. Dlatego też l =

(nk

)(patrz twier-

dzenie 2.4 str. 10). Niech Ai oznacza dopełnienie algebraiczne minora Mi dla każdegoi ∈ {1, . . . , l}. Z ostatniego lematu wynika, że dla każdego i ∈ {1, . . . , l} iloczyn Mi ·Aizawiera dokładnie k! · (n − k)! różnych składników wyznacznika macierzy A. Dlategoteż suma

(11) M1A1 +M2A2 + · · ·+MlAl,

zawiera formalnie l · k! · (n − k)! =(nk

)· k! · (n − k)! = n! składników wyznacznika

macierzy A. Nietrudno zauważyć, że wszystkie składniki wyznacznika macierzy A,które otrzymamy z sumy (11) będą różne. W tym celu wystarczy pokazać, że składnikimacierzy A otrzymane z różnych składników Mi · Ai sumy (11) są różne. To wynikajednak stąd, że dwa różne minory Mi i Mj są wyznacznikami różnych macierzy Bi orazBj stopnia k znajdujących się w ustalonych k wierszach. Każdy składnik minora Mi

zawierać będzie jako czynnik element z pewnej kolumny macierzy Bi, która to kolumnanie jest kolumną macierzy Bj. Ponadto żaden element tej kolumny nie jest czynnikiem

2. WYZNACZNIKI 63

składnika dopełnienia algebraicznego Aj. Tak więc wszystkie składniki wyznacznikamacierzy A otrzymane z sumy (11) są różnymi składnikami wyznacznika macierzy A,a ponieważ jest ich n!, więc wyczerpują wszystkie możliwe składniki detA. W tensposób dowiedliśmy następującego twierdzenia:

Twierdzenie 2.9 (Laplace). Jeśli w macierzy kwadratowej A stopnia n jest usta-lonych k wierszy, gdzie k < n, to wyznacznik macierzy A jest równy sumie wszystkichiloczynów minorów stopnia k występujących w ustalonych wierszach przez ich dopeł-nienia algberaiczne.

Analogiczne twierdzenie jest prawdziwe, jeśli ustalimy dowolną liczbę kolumn wmacierzy A. Wynika to z twierdzenia 2.3, gdyż operacja transpozycji zmienia wierszena kolumny, a jednocześnie wyznacznik się nie zmienia.

W szczególnym przypadku dla minorów stopnia 1 jako wniosek z twierdzenia La-place’a otrzymujemy nastepujące

Twierdzenie 2.10 (Wzór Laplace’a). Jeśli w macierzy kwadratowej A ustalimywiersz o numerze i lub kolumnę o numerze j, to zachodzą następujące wzory:

(12) detA = (−1)i+1ai1Mi;1 + (−1)i+2ai2Mi;2 + · · ·+ (−1)i+nainMi;n,

oraz

(13) detA = (−1)1+ja1jM1;j + (−1)2+ja2jM2;j + · · ·+ (−1)n+janjMn;j.

Jeśli do obliczenia wyznacznika macierzy stosujemy wzór (12), to mówimy, że roz-wijamy go względem i-tego wiersza. Podobnie, w przypadku stosowania wzoru (13)mówimy o rozwinięciu wyznacznika względem j-tej kolumny.

Przykład 2.6. Poniżej rozwijamy wyznacznik względem czwartej kolumny.

det

1 2 3 41 1 6 32 2 5 22 0 0 1

= (−1)1+4 · 4 · det

1 1 62 2 52 0 0

+ (−1)2+4 · 3 · det

1 2 32 2 52 0 0

+

+ (−1)3+4 · 2 · det

1 2 31 1 62 0 0

+ (−1)4+4 · 1 · det

1 2 31 1 62 2 5

=

= (−4) · (−14) + 3 · 8 + (−2) · 18 + 7 = 51.

Otrzymamy jednak nieco prostsze rachunki, gdy rozwiniemy go względem czwartegowiersza:

det

1 2 3 41 1 6 32 2 5 22 0 0 1

= (−1)4+1 · 2 · det

2 3 41 6 32 5 2

+ (−1)4+4 · 1 · det

1 2 31 1 62 2 5

=

= (−2) · (−22) + 7 = 51.

64 II. MACIERZE I WYZNACZNIKI

Z twierdzenia Laplace’a wyprowadzimy teraz następujące twierdzenie:

Twierdzenie 2.11 (Cauchy). Jeśli A i B są macierzami kwadratowymi tego sa-mego stopnia, to

det(AB) = detA · detB.

Istotnie, niech A = [aij] i B = [bij] będą macierzami kwadratowymi stopnia n. Poustaleniu pierwszych n wierszy w następującej macierzy C stopnia 2n

C =

a11 . . . a1n 0 . . . 0...

......

...an1 . . . ann 0 . . . 0−1 . . . 0 b11 . . . b1n...

......

...0 . . . −1 bn1 . . . bnn

,

otrzymujemy na mocy twierdzenia Laplace’a, że

(14) detC = detA · detB,

gdyż jedynym niezerowym minorem w pierwszych n wierszach macierzy C jest detA,a jego dopełnienie algebraiczne jest równe

(−1)2(1+···+n) detB = detB.

Z drugiej strony, korzystając z twierdzenia 2.8, możemy tak przekształcić macierz C niezmieniając jej wyznacznika, aby w miejscu występowania elementów aij pojawiły sięzera. W tym celu pomnożymy n+1-szy wiersz macierzy C przez liczbę a11 i dodamy dowiersza pierwszego. Następnie n+2-gi wiersz pomnożymy przez liczbę a12 i dodamy dopierwszego i tak dalej aż do wiersza o numerze 2n, który mnożymy przez a1n i dodajemydo pierwszego. W ten sposób w pierwszym wierszu w kolumnach do n-tej włączniepojawią się zera. Następne wyrazy pierwszego wiersza będą równe odpowiednio:

a11b11 + · · · + a1nbn1 =n∑j=1

a1jbj1, . . . , a11b1n + · · · + a1nbnn =n∑j=1

a1jbjn.

Działając analogicznie na wiersz drugi, trzeci i tak dalej, kończąc na n-tym otrzymamyw miejscu elementów aij zera. Pozostałe wyrazy tych wierszy będą równe

a21b11 + · · · + a2nbn1 =n∑j=1

a2jbj1, . . . , a21b1n + · · · + a2nbnn =n∑j=1

a2jbjn

a31b11 + · · · + a3nbn1 =n∑j=1

a3jbj1, . . . , a31b1n + · · · + a3nbnn =n∑j=1

a3jbjn

..................................................................................................................

2. WYZNACZNIKI 65

an1b11 + · · · + annbn1 =n∑j=1

anjbj1, . . . , an1b1n + · · · + annbnn =n∑j=1

anjbjn.

Zauważmy, że wyrazy te, to zgodnie ze wzorem (3) (patrz str. 47) elementy iloczynumacierzy AB. W ten sposób otrzymamy macierz

D =[

0 AB−In B

],

której

(15) detD = detC.

Korzystając jeszcze raz z twierdzenia Laplace’a dla pierwszych n wierszy macierzy Dotrzymujemy

detD = det(AB) · (−1)1+2+···+n+(n+1)+···+2n det(−In) =

= det(AB) · (−1)(1+2n)2n

2 · (−1)n = det(AB)(−1)2n(n+1) = det(AB).

Z ostatniej równości oraz z (14) i (15) wynika, że

detA · detB = detC = detD = det(AB).

66 II. MACIERZE I WYZNACZNIKI

3. Macierz odwrotna

Macierz kwadratową B stopnia n nazywamy macierzą odwrotną do macierzy kwa-dratowej A stopnia n jeśli:

AB = In,

gdzie In jest macierzą jednostkową stopnia n. Macierz odwrotną do macierzy A ozna-czamy symbolem A−1.

Załóżmy, że macierz kwadratowa A ma macierz odwrotną. Wtedy z twierdzeniaCauchy’ego otrzymujemy równość

det(A · A−1) = detA · detA−1.

Ponieważ A · A−1 = In, oraz det In = 1, więc

detA · detA−1 = 1,

a wobec tego detA 6= 0. Stąd wynika, że jeśli macierz kwadratowa ma macierz odwrot-ną, to musi ona mieć wyznacznik różny od zera. Okazuje się, że prawdziwe jest takżetwierdzenie odwrotne.

Twierdzenie 3.1. Dla dowolnej macierzy kwadratowej A istnieje macierz odwrot-na wtedy i tylko wtedy, gdy detA 6= 0.

Pozostaje wykazać, że macierz A o wyznaczniku różnym od zera ma macierz od-wrotną. Załóżmy, że detA 6= 0. Okazuje się, że macierz B dana wzorem:

(1) B =1

detA

D11 D12 . . . D1nD21 D22 . . . D2n

......

...Dn1 Dn2 . . . Dnn

T

,

gdzie Dij = (−1)i+jM ′i;j jest dopełnieniem algberaicznym elementu aij, jest macierzą

odwrotną macierzy A. Sprawdzimy, że

A ·B = In

Jeśli zamienimy j-tą kolumnę macierzy A kolumną k-tą, tzn.a1ka2k...ank

,to wyznacznik z tak otrzymanej macierzy, zgodnie z twierdzeniem 2.5, będzie równyzero, jeśli k 6= j (jeśli k = j, to nic nie zmieniamy i wyznacznik będzie równy detA). Zdrugiej strony rozwijając wyznacznik tak zmienionej macierzy względem j-tej (nowejzmienionej kolumny) otrzymamy zgodnie ze wzorem Laplace’a, że

(−1)1+ja1kM ′1;j + (−1)2+ja2kM ′

2;j + · · ·+ (−1)n+jankM ′n;j = 0,

3. MACIERZ ODWROTNA 67

jeśli j 6= k, oraz

(−1)1+ja1jM ′1;j + (−1)2+ja2jM ′

2;j + · · ·+ (−1)n+janjM ′j;n = detA.

Ostatnie dwie równości możemy krótko zapisać, pamiętając, że Dij = (−1)i+jM ′i;j, w

następującej postaci

(2)n∑i=1

aikDij = δkj detA,

gdzie symbol δkj oznacza deltę Kroneckera. Analogiczny wzór prawdziwy jest dla wier-szy:

(3)n∑i=1

aki ·Dji = δkj detA.

Przyjmijmy W = detA. Wówczas element cij macierzy A · B, jest na mocy definicjiiloczynu macierzy równy

cij = ai1 ·1W·Dj1 + ai2 ·

1W·Dj2 + · · ·+ ain ·

1WDjn =

=1W

(ai1 ·Dj1 + ai2 ·Dj2 + · · ·+ ain ·Djn

)=

1W

n∑k=1

aikDjk

Jednak zgodnie ze wzorem (3) wiemy, że powyższa suma jest równa δij ·W . Stąd

cij = δij,

a to oznacza, że AB = [δij] = In.

Zauważmy, że jeśli AB = In, to również BA = In. Istotnie, jeśli AB = In, tozarówno macierz A jak i B ma wyznacznik różny od zera. Z ostatniego twierdzeniawynika, że istnieje macierz odwrotna do B. Wobec tego

B−1 = InB−1 = (AB)B−1 = A(BB−1) = AIn = A,

a stądBA = BB−1 = In.

Macierze kwadratowe o wyznaczniku różnym od zera nazywamy macierzami nie-osobliwymi. Tak więc macierze nieosobliwe (i tylko one) mają macierz odwrotną.

Dowód ostatniego twierdzenia podaje nam metodę wyznaczania macierzy odwrot-nej. Rozpatrzmy macierz A, dla której det(A) 6= 0. Budujemy macierz D, której ele-mentami są dopełnienia algebraiczne elementów macierzy A, tzn.

D =

D11 D12 . . . D1nD21 D22 . . . D2n

......

...Dn1 Dn2 . . . Dnn

,

68 II. MACIERZE I WYZNACZNIKI

a następnie tę macierz transponujemy. Teraz aby otrzymać macierz odwrotną wystar-czy każdy element macierzy DT podzielić przez detA.

Przykład 3.1. Wyznaczyny macierz odwrotną do macierzy

A =

2 5 26 3 17 3 1

.Wpierw obliczamy wyznacznik:

det

2 5 26 3 17 3 1

= −1.

Następnie obliczamy dopełnienia algebraiczne kolejnych elementów macierzy A:

D11 = (−1)1+1 det[3 13 1

]= 0, D12 = (−1)1+2 det

[6 17 1

]= 1, D13 = (−1)3+1 det

[6 37 3

]= −3,

D21 = (−1)2+1 det[5 23 1

]= 1, D22 = (−1)2+2 det

[2 27 1

]= −12, D23 = (−1)2+3 det

[2 57 3

]= 29,

D31 = (−1)3+1 det[5 23 1

]= −1, D32 = (−1)3+2 det

[2 26 1

]= 10, D33 = (−1)3+3 det

[2 56 3

]= −24.

Mamy zatem

DT =

0 1 −11 12 10−3 29 −24

.Stąd otrzymujemy macierz odwrotną:

A−1 =1−1

DT = −

0 1 −11 12 10−3 29 −24

=

0 −1 1−1 −12 −103 −29 24

.Z wyprowadzonych dotąd wzorów i twierdzeń nietrudno już wyprowadzić kilka dal-

szych:

Twierdzenie 3.2. Jeśli macierze A i B są macierzami nieosobliwymi tego samegostopnia, to zachodzą następujące wzory:

(AB)−1 = B−1A−1;(a)

det(A−1) =1

det(A);(b)

(A−1)−1 = A;(c)

(A−1)T = (AT )−1.(d)

4. ZADANIA DO ROZDZIAŁU II 69

4. Zadania do rozdziału II

Zadanie 41. Dane są macierze:

A =[

2 −3−1 4

], B =

[−2 31 −4

], C =

[1 2 30 3 1

],

D =

1 2 00 −1 32 1 5

, E =

2 −1 31 0 20 3 0

.Sprawdź czy wykonalne są działania, a jeśli tak to wykonaj je:

(a) 2A+B, DCT , (A+D)C;(b) (A−B)C, CDE, (D + E)CT ;(c) CT (A+D), A2 + C, A+ C2.

Zadanie 42. Sprawdzić, że dla dowolnych macierzy A ∈ Rm×n, B ∈ Rn×k zachodziwzór (AB)T = BTAT .

Zadanie 43. Rozważmy ciąg {an}∞n=0 zadany rekurencyjnie: a0 = 0, a1 = 1 orazan+1 = an−1+an dla n ­ 2. Ciąg {an}∞n=0 nazywany jest ciągiem Fibbonaciego. Spraw-dzić, że dla każdej liczby naturalnej n zachodzi równość[

an+1 anan an−1

]=[1 11 0

]nZadanie 44. Macierz A nazywa się symetryczną, jeśli A = AT . Udowodnić, że

(a) jeśli macierz A jest symetryczna, to dla dowolnej macierzy B macierz BABT

też jest symetryczna;(b) jeśli A i B są macierzami symetrycznymi, to AB jest macierzą symetryczną

wtedy i tylko wtedy, gdy AB = BA;(c) jeśli macierz odwracalna A jest symetryczna, to A−1 także jest symetryczna.

Zadanie 45. Obliczyć wyznaczniki następujących macierzy:

(a) 1 1 11 2 31 3 6

,5 −3 11

2 −9 51 −4 −12

;

(b) 1 2 3 45 6 7 89 10 11 1213 14 15 16

,

1 2 3 42 3 4 13 4 1 24 1 2 3

,

1 1 0 01 1 1 00 1 1 10 0 1 1

,

1 1 1 11 2 3 41 4 9 161 8 27 64

;

70 II. MACIERZE I WYZNACZNIKI

(c) 2 1 1 1 11 3 1 1 11 1 4 1 11 1 1 5 11 1 1 1 6

,

1 2 3 4 55 1 2 3 44 5 1 2 33 4 5 1 22 3 4 5 1

,

0 1 1 1 11 0 1 1 11 1 0 1 11 1 1 0 11 1 1 1 0

;

(d) 1 a1 a2 a3 a41 a1 + b1 a2 a3 a41 a1 a2 + b2 a3 a41 a1 a2 a3 + b3 a41 a1 a2 a3 a4 + b4

,

Odpowiedzi (a): 1; 564. (b): 0; 160; −1; 12. (c): 394; 1875; 4. (d): b1b2b3b4.

Zadanie 46. Wykazać, że wyznacznik dowolnej macierzy kwadratowej wyznaczonyprzez elementy stojące w lewym górnym rogu „prostokątnego” trójkąta Pascala (patrzzadanie 9 str. 35), tzn. wyznacznik macierzy

1 1 1 . . . 11 2 3 . . . n

1 3 6 . . .(n+12

). . . . . . . . . . . . . . . . . . . . . . . .

1 n(n+1n−1

). . .

(2n−2n−1

)

=

1 1 1 . . . 11

(21

) (31

). . .

(n1

)1

(32

) (42

). . .

(n+12

). . . . . . . . . . . . . . . . . . . . . . . . . . . .

1(

nn−1

) (n+1n−1

). . .

(2n−2n−1

)

jest równy 1.Wskazówka: Od każdej kolumny odjąć poprzednią, a następnie od każdego wierszaodjąć poprzedni. Wykorzystać tożsamość (8) ze str. 9, a następnie stosując wzór La-place’a rozwinąć wyznacznik według pierwszej kolumny (lub wiersza). Zauważyć, żewyznacznik tak powstałej macierzy jest równy wyznacznikowi analogicznej macierzymającej o jedną kolumnę mniej.

Zadanie 47. Wykazać, że

det

1 2 3 . . . n− 1 nn 1 2 . . . n− 2 n− 1

n− 1 n 1 . . . n− 3 n− 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 3 4 . . . n 1

= (−1)n−1nn−1(n+ 1)

2.(a)

4. ZADANIA DO ROZDZIAŁU II 71

Wskazówka: Od każdego wiersza poczynając od pierwszego odjąć następny, po czymod każdej kolumny odjąć ostatnią. Pomnożyć każdą z kolumn z wyjątkiem ostatniejprzez − 1

ni dodać do ostatniej kolumny.

det

0 1 1 . . . 11 0 1 . . . 11 1 0 . . . 1. . . . . . . . . . . . . . .1 1 1 . . . 0

= (−1)n−1(n− 1).(b)

Wskazówka: Od każdego wiersza poczynając od drugiego odjąć wiersz pierwszy. Na-stępnie do pierwszej kolumny dodać kolejno wszystkie kolumny począwszy od drugiej.

Zadanie 48. Dla jakich wartości x ∈ R zachodzą równości:(a)

det

1 1 1 11 x− 1 1 11 1 x− 2 11 1 1 x− 3

= 0

(b)

det

1 x x xx 1 x xx x 1 xx x x 1

= 0

(c)

det

1 x x2 x3

1 a a2 a3

1 b b2 b3

1 c c2 c3

= 0,

gdzie (a− b)(b− c)(c− a) 6= 0.Odpowiedzi (a): x = 2, x = 3, x = 4. (b): x = 1, x = −13 . (c): x = a, x = b, x = c.

Zadanie 49. Wykazać, że dla dowolnych liczba a, b, c ∈ R zachodzą następującerówności:

(a)

det

a+ b b aa a+ b bb a a+ b

= 2(a3 + b3).

(b)

det

1 1 1a b ca2 b2 c2

= (a− b)(b− c)(c− a).

72 II. MACIERZE I WYZNACZNIKI

(c)

det

a 0 0 b0 a b 00 b a 0b 0 0 a

= (a2 − b2)2.

Zadanie 50. Wykazać, że wyznacznik

det

1 0 1 42 4 3 17 2 9 31 2 8 7

jest podzielny przez 13.Wskazówka: Do kolumny czwartej dodać kolejno: kolumnę pierwszą pomnożoną przez1000, kolumnę drugą pomnożoną przez 100 i kolumnę trzecią pomnożoną przez 10, anastępnie skorzystać z równości 13 · 78 = 1014, 13 · 187 = 2431, 13 · 561 = 7293 oraz13 · 99 = 1287

Zadanie 51. Wykazać, że jeśli macierz kwadratowa A jest stopnia n, a macierzkwadratowa B jest stopnia m, to wyznacznik macierzy kwadratowej D stopnia m+ n,gdzie

D =[

A 000C B

]jest równy detA · detB.Wskazówka: Wykorzystać ogólny wzór Laplace’a.

Zadanie 52. Obliczyć przy pomocy ogólnego wzoru Laplace’a następujące wy-znacznik

det

1 2 3 0 20 1 2 0 10 0 1 0 05 6 7 1 08 9 0 3 1

Zadanie 53. Obliczyć macierze odwrotne do macierzy:(a) 1 2 −3

0 1 20 0 1

, 2 2 3

1 −1 0−1 2 1

(b)

4 7 0 01 2 0 00 0 7 −40 0 −5 3

,

1 1 1 11 1 −1 −11 −1 1 −11 −1 −1 1

,

1 3 −5 70 1 2 −30 0 1 20 0 0 1

,

1 1 3 22 2 1 21 2 3 41 1 2 3

4. ZADANIA DO ROZDZIAŁU II 73

(c) 1 −2 9 14 −2 1 22 −1 1 11 −1 8 1

,

2 3 −1 24 4 1 41 0 2 14 7 −2 5

,

1 2 2 03 5 4 31 4 3 21 3 2 2

,

2 −2 5 −2−2 3 −6 2−3 5 −8 2−2 2 −3 1

(d)

1 1 0 13 6 −2 42 3 −1 21 0 2 1

,

1 1 0 15 4 2 52 3 −1 22 4 −1 3

,

5 2 3 24 4 5 33 1 2 15 4 5 3

,

4 4 1 42 3 −1 21 0 2 14 7 −2 5

(e)

3 5 4 31 2 2 01 4 3 21 3 2 2

,−2 3 −6 22 −2 5 −2−3 5 −8 2−2 2 −3 1

,

3 6 −2 41 1 0 12 3 −1 21 0 2 1

,

4 8 6 52 6 5 21 4 3 21 3 2 2

.(f)

1 3 3 12 7 7 22 7 7 10 1 2 −1

,

3 2 3 12 1 1 15 3 4 33 3 5 4

,

0 1 0 20 5 −2 90 3 −1 51 1 0 1

,

0 1 2 42 3 5 93 5 8 133 5 7 11

.Odpowiedź (a): 1 −2 7

0 1 −20 0 1

;

1 −4 −31 −5 −3−1 6 4

(b):

2 −7 0 0−1 4 0 00 0 3 40 0 5 7

, 14

1 1 1 11 1 −1 −11 −1 1 −11 −1 −1 1

,

1 −3 11 −380 1 −2 70 0 1 −20 0 0 1

, 17

2 3 −7 6−1 2 7 −104 −1 0 −2−3 −1 0 5

.Zadanie 54. Z równania A ·X ·B = CT ·B wylicz macierz X wiedząc, że

A =

2 1 11 3 12 0 1

, B =

−2 1 05 6 72 0 0

, C =

1 0 11 1 00 1 1

.Zadanie 55. Z równania A ·X ·B = C ·BT wylicz macierz X wiedząc, że

A =

1 0 03 3 20 2 1

, B =

1 1 11 2 31 3 4

, C =

1 1 10 1 10 0 1

.

74 II. MACIERZE I WYZNACZNIKI

Zadanie 56. Z równania AT ·X ·B = A · C wylicz macierz X wiedząc, że

A =

1 3 13 2 11 1 1

, B =

2 1 13 2 −12 1 0

, C =

0 1 11 0 10 1 0

.Zadanie 57. Z równania A ·X ·B = A · CT wylicz macierz X wiedząc, że

(a) A =

1 2 30 1 20 0 1

, B =

1 4 13 3 22 0 1

, C =

0 0 −10 1 01 0 0

.

(b) A =

4 5 62 1 02 0 0

, B =

2 1 11 3 12 0 1

, C =

1 0 11 1 00 1 1

.

(c) A =

1 2 30 1 20 0 1

, B =

1 −1 03 1 3−1 2 1

, C =

1 1 10 1 10 0 1

.Zadanie 58. Z równania A ·X ·B = A · C wyliczyć macierz X wiedząc, że

A =

1 1 21 4 12 0 1

, B =

3 1 20 1 01 0 1

, C =

0 0 10 1 01 0 0

.Zadanie 59. Z równania AT ·X ·B = C2 ·B wyliczyć macierz X wiedząc, że

A =

3 0 11 1 02 0 1

, B =

1 1 10 1 10 0 1

, C =

1 1 01 2 00 0 1

.Zadanie 60. Z równania (A ·X ·B)T = C · AT wylicz macierz X wiedząc, że

A =

1 2 30 1 20 0 1

, B =

1 3 11 4 12 0 1

, C =

0 0 −10 1 01 0 0

.Zadanie 61. Mając daną macierz

A =

1 1 −11 −1 −11 1 −1

znaleźć macierz kwadratową X stopnia 3, jeśli wiadomo, że macierz A−1 · X · A jestmacierzą diagonalną oraz

A−1 ·X2 · A =

0 0 00 1 00 0 9

.

4. ZADANIA DO ROZDZIAŁU II 75

Wskazówka: Wykorzystać równość A−1 ·X2 · A = (A−1 ·X · A) · (A−1 ·X · A).

Zadanie 62. Wykazać, że iloczyn oraz macierz odwrotna dla macierzy postaci1 a b0 1 c0 0 1

jest macierzą takiej samej postaci.

Zadanie 63. Sprawdzić prawdziwość wzorów (a) – (d) z twierdzenia 3.2 str. 68.

ROZDZIAŁ III

Układy równań liniowych

1. Układy równań liniowych

Rozważmy układ m równań z n niewiadowymi x1, x2, . . . , xn:

(1)

a11x1 + a12x2 + · · ·+ a1nxn = b1a21x1 + a22x2 + · · ·+ a2nxn = b2

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .am1x1 + am2x2 + · · ·+ amnxn = bm,

gdzie aij, bi ∈ R, dla i, j 6 n. Powyższy układ możemy zapisać także w postacia11 a12 . . . a1na21 a22 . . . a2n...

......

am1 am2 . . . amn

x1x2...xn

=

b1b2...bm

Macierz A = [aij] będziemy nazywać macierzą układu równań (1), a wektory ko-

lumnowe

x =

x1x2...xn

, b =

b1b2...bm

odpowiednio kolumną niewiadomych i kolumną wyrazów wolnych układu równań (1).Tak więc układ równań możemy zapisać w postaci następującego równania macierzo-wego:

Ax = b.

Wektor kolumnowy

c =

c1c2...cn

,gdzie c1, . . . , cn są liczbami rzeczywistymi, będziemy nazywać rozwiązaniem układurównań (1), jeśli po podstawieniu za każdą niewiadomą xi liczby ci we wszystkich rów-naniach układu otrzymamy równość. Układ równań nazywamy niesprzecznym, jeśli maon przynajmiej jedno rozwiązanie. W przeciwnym przypadku układ nazywamy sprzecz-nym. Jeśli układ ma więcej niż jedno rozwiązanie, to nazywamy go nieoznaczonym.

77

78 III. UKŁADY RÓWNAŃ LINIOWYCH

Układ równań liniowych nazywamy układem Cramera, jeśli liczba niewiadomych wtym układzie jest równa ilości równań oraz macierz układu równań jest nieosobliwa.

Załóżmy, że układ równań postaci (1) jest układem Cramera. Wtedy m = n orazdetA 6= 0. Poszukajmy rozwiązań takiego układu równań. Jeśli c jest rozwiązaniemukładu, to Ac = b. Wobec nieosobliwości macierzy A, istnieje macierz odwrotna A−1,a zatem

c = A−1b.

Zgodnie ze wzorem (1) mamy

A−1 =1

detA

D11 D21 . . . Dn1

D12 D22 . . . Dn2...

......

D1n Dn2 . . . Dnn

,a zatem

c1c2...cn

= c =1

detA

D11 D21 . . . Dn1

D12 D22 . . . Dn2...

......

D1n Dn2 . . . Dnn

b1b2...bn

.Mnożąc macierze zapisane po prawej stronie ostatniej równości otrzymujemy, wzór

(2) ci =D1ib1 +D2ib2 + · · ·+Dnibn

detAdla każdego i 6 n. Skorzystajmy ze wzoru Laplace’a i zauważamy, że licznik tegoułamka przedstawia wyznacznik macierzy A, w której i-tą kolumnę zastąpiono kolumnąwyrazów wolnych. W ten sposób wykazaliśmy następujące twierdzenie:

Twierdzenie 1.1. Układ Cramera ma dokładnie jedno rozwiązanie

c =

c1c2...cn

gdzie elementy ci dla i 6 n wyrażają się wzorami (2).

Przykład 1.1. Rozwiążemy układ równań3x1 −5x2 −2x3 −2x4 = 1x1 +3x2 +2x3 −x4 = 0−x1 −x2 −x3 +x4 = −1−4x1 +5x2 +2x3 +3x4 = 0

1. UKŁADY RÓWNAŃ LINIOWYCH 79

Obliczamy wyznacznik układu równań:

det

3 −5 −2 −21 3 2 −1−1 −1 −1 1−4 5 2 3

= −1.

Stąd układ jest układem Cramera. Następnie obliczamy wyznaczniki czterech macierzy,które powstają w wyniku zastąpienia odpowiednio pierwszej, drugiej, trzeciej i czwartejkolumny kolumną wyrazów wolnych.

det

1 −5 −2 −20 3 2 −1−1 −1 −1 10 5 2 3

= 2, det

3 1 −2 −21 0 2 −1−1 −1 −1 1−4 0 2 3

= 3,

det

3 −5 1 −21 3 0 −1−1 −1 −1 1−4 5 0 3

= −5, det

3 −5 −2 11 3 2 0−1 −1 −1 −1−4 5 2 0

= 1.

Dlatego rozwiązaniem układu równań jest wektor kolumnowy−2−35−1

.

80 III. UKŁADY RÓWNAŃ LINIOWYCH

2. Przekształcenia elementarne macierzy

Przekształceniami elementarnymi na wierszach (kolumnach) macierzy nazywamynastępujące operacje:

(1) mnożenie dowolnego wiersza (kolumny) przez liczbę różną od zera;(2) dodanie do wiersza (kolumny) innego wiersza (kolumny) pomnożonego przez

dowolną liczbę.(3) przestawienie miejscami dwóch dowolnych wierszy (kolumn) macierzy;

Nietrudno zauważyć, że przkształcenie (3), tzn. zamiana wierszy może być łatwouzyskana poprzez zastosowanie operacji (1) oraz (2). Istotnie, jeśli chcemy w macierzyzamienić dwa wiersze powiedzmy wiersz i-ty z wierszem k-tym, to na początek dodajmydo i-tego wiersza k-ty. Następnie tak otrzymany wiersz pomnóżmy przez -1. Wtedy wi-tym wierszu mamy elementy postaci −aij − akj. Po dodaniu tego wiersza do wierszak-tego, w k-tym wierszu otrzymamy liczby postaci −aij. Tak więc po wymnożeniu goprzez −1 w k-tym wieszu dostaniemy wiersz o numerze i. Następnie dodając go dowiersza o numerze i i mnożąc tak otrzymany wiersz i-ty przez −1, w i-tym wierszupojawi się wiersz k-ty.

Jeśli macierz B jest otrzymana z macierzy A poprzez zastosowanie przekształceńelementarnych na wierszach to mówimy, że macierze A i B są równoważne, co zapisu-jemy w postaci A ' B.

Macierz kwadratową nazywamy macierzą elementarną, jeśli spełnia jeden z dwóchwarunków:

(a) jest ona macierzą diagonalną, w której na przekątnej występują same jedynkiz wyjątkiem co najwyżej jednego elementu, który jest różny od zera;

(b) jest macierzą, w której na przekątnej są same jedynki, a poza nią same zera zwyjątkiem jednego elementu niezerowego.

Twierdzenie 2.1. Przekształceniom elementarnym typu (1) i (2) na wierszachmacierzy A wymiarów m× n odpowiadają iloczyny macierzy elementarnych stopnia ntypu (a)i (b), przez macierz A.

Istotnie zauważmy, że przekształcenie typu (1), tj. pomnożenie i-tego wiersza przezliczbę α 6= 0 można otrzymać mnożąc (z lewej strony) macierz A przez macierz ele-mentarną w której i-ty element stojący na przekątnej jest równy α:

a11 a12 . . . a1n...

......

αai1 αai2 . . . αain...

......

am1 an2 . . . amn

=

1 0 . . . 0 . . . 0...

......

...0 0 . . . α . . . 0...

......

...0 0 . . . 0 . . . 1

a11 a12 . . . a1n...

......

ai1 ai2 . . . ain...

......

am1 an2 . . . amn

2. PRZEKSZTAŁCENIA ELEMENTARNE MACIERZY 81

Dodanie j-tego wiersza macierzy A pomnożonego przez liczbę α do i-tego otrzymu-jemy mnożąc macierz A (z lewej strony) przez macierz elementarną typu (2), w którejaij = α. Na przykład

a11 + αa21 a12 + αa22 . . . a1n + αa2n...

......

αai1 αai2 . . . αain...

......

am1 an2 . . . amn

=

=

1 α 0 . . . 00 1 0 . . . 00 0 1 . . . 0...

......

...0 0 0 . . . 1

a11 a12 . . . a1na21 a22 . . . a2na31 a32 . . . a3n...

......

am1 an2 . . . amn

.

Twierdzenie 2.2. Każdą macierz niezerową można przekształcić za pomocą ope-racji elementarnych na wierszach do postaci schodkowej, tj. do postaci

0 . . . 0 b1j1 . . . b1j2 . . . b1jk . . . b1n0 . . . 0 0 . . . b2j2 . . . b2jk . . . b2n0 . . . 0 0 . . . 0 . . . b3jk . . . b3n. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 . . . 0 0 . . . 0 . . . bkjk . . . bkn0 . . . 0 0 . . . 0 . . . 0 . . . 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 . . . 0 0 . . . 0 . . . 0 . . . 0

,

gdzie k 6 n, liczby b1j1 , . . . , bkjk są liczbami różnymi od zera, a wszystkie elementyznajdujące we wszystkich wierszach począwszy od k + 1-ego oraz stojące z lewej stronyb1j1 , . . . , bkjk są równe zero, tzn. bij = 0 dla i > k + 1 oraz bij = 0 dla j < ji, gdziei = 1, . . . , k.

Przykładami macierzy schodkowych są macierze

1 2 30 1 10 0 1

,

0 2 3 8 10 0 1 5 20 0 0 4 40 0 0 1 10 0 0 0 0

.

Istotnie, jeśli mamy macierz o jednym wierszu niezerowym, to jest ona oczywiścieschodkowa. Przypuśćmy, że nasze twierdzenie jest prawdziwe dla macierzy, które mająm wierszy. Rozważmy dowolną macierz niezerową, która ma m+1 wierszy. Istnieje ko-lumna tej macierzy, w której jest przynajmniej jeden element różny od zera. Ustalmy

82 III. UKŁADY RÓWNAŃ LINIOWYCH

taką kolumnę o najniższym numerze (będzie to pierwsza taka kolumna patrząc od lewejstrony). Niech numer tej kolumny będzie równy j1. Jeśli liczba stojąca w pierwszymwierszu w koumnie j1 jest równa zero, to dokonajmy operacji elementarnej polegającejna zamianie pierwszego wiersza z dowolnym wierszem, w którym jest element nieze-rowy kolumny o numerze j1 (gdyby liczba ta była różna od zera, to nie wykonujemyżadnej operacji). W ten sposób otrzymamujemy macierz, w której w pierwszym wier-szu element stojący w kolumnie j1-ej jest niezerowy, a wszystkie wyrazy poprzedzająceten element w pierwszym wierszu są równe 0. Oznaczmy ten niezerowy element sym-bolem b1j1 . Stosując operacje elementarne możemy teraz tak przekształcić macierz abyw miejscu elementów niezerowych bij1 występujących ewentualnie pod elementem b1j1pojawiły się zera. W tym celu wystaczy pomnożyć wiersz pierwszy przez

− bij1b1j1

i dodać do wiersza i-tego. Po wykonaniu tych wszystkich operacji macierz zostanieprzekszałcona do postaci

B =

0 . . . 0 b1j1 b1j1+1 . . . b1n0 . . . 0 0 b2j1+1 . . . b2n. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 . . . 0 0 bm+1j1+1 . . . bm+1n

.Macierz b2j1+1 . . . b2n

. . . . . . . . . . . . . . . . . . . .bm+1j1+1 . . . bm+1n

,jest macierzą o m wierszach, a więc korzystając z założenia indukcyjnego możemy jąsprowadzić do macierzy schodkowej przy pomocy operacji elementarnych na wierszach.Operacje te odpowiadają dokładnie operacjom na wierszach od drugiego do m+ 1-egomacierzy B. Odpowiadające operacje nie zmienią wiersza pierwszego i kolumn o nume-rach mniejszych od j1, a zatem doprowadzą wyjściową macierz do postaci schodkowej.Tak więc z zasady indukcji matematycznej wynika, że twierdzenie 2.2 jest prawdziwedla każdej macierzy.

Przy pomocy tego twierdzenia możemy podać znacznie efektywniejszą metodę wy-znaczania macierzy odwrotnej niż ta wynikająca z twierdzenia 3.1. Załóżmy, że macierzA stopnia n jest nieosobliwa. Wiemy już, że dokonując operacji elementarnych na wier-szach macierzy A możemy ją sprowadzić do macierzy schodkowej B postaci

B =

b11 b12 . . . b1n0 b22 . . . b2n. . . . . . . . . . . . . . . . .0 0 . . . bnn

.Elementy stojące na przekątnej powyższej macierzy są niezerowe, gdyż operacje ele-mentarne przekształcają macierz nieosobliwą w nieosobliwą. Jeśli teraz dla każdego

2. PRZEKSZTAŁCENIA ELEMENTARNE MACIERZY 83

i 6 n pomnożymy wiersze o numerze i macierzy B przez odwrotności elementów bii(czyli zastosujemy operacje elementarne typu (1)), to otrzymamy macierz postaci

C =

1 c12 . . . c1n0 1 . . . c2n. . . . . . . . . . . . . . .0 0 . . . 1

.Teraz już łatwo widać, że stosując operacje elementarne typu (2) na wierszach macierzyC otrzymamy macierz jednostkową In. Z drugiej strony twierdzenie 2.2 mówi, że każdejoperacji elementarnej na wierszach macierzy A odpowiada pomnożenie tej macierzy zlewej strony przez odpowiednią macierz elementarną. Możemy więc napisać, że

E1E2 . . . ElA = In,

gdzie E1, E2, . . . , El są macierzami elementarnymi odpowiadającymi operacjom ele-mentarnym prowadzącym od macierzy A do macierzy B, od B do C i w końcu od Cdo In. Z ostatniej równości wynika zatem, że

E1E2 . . . ElIn = A−1.

Ostatnie dwie równości możemy zinterpretować w postaci następującego twierdzenia.

Twierdzenie 2.3. Aby otrzymać macierz odwrotną do macierzy nieosobliwej Astopnia n należy dokonać tych samych przekształceń elementarnych na wierszach ma-cierzy jednostkowej In, co na wierszach macierzy A, które prowadzą do macierzy In.

Przykład 2.1. Znajdziemy macierz odwrotną do macierzy

A =

2 7 33 9 41 5 3

metodą przekształceń elementarnych tzn. stosując twierdzenie 2.3. Ponieważ mamy wy-konywać te same przekształcenia elementarne na wierszach macierzy A i na wierszachmacierzy I3 tworzymy macierz powstałą z A uzupełniając ją macierzą jednostkowąstopnia 3 2 7 3 | 1 0 0

3 9 4 | 0 1 01 5 3 | 0 0 1

'Dalej, zgodnie z twierdzeniem, będziemy się starać przekształcić macierz A do I3,dokonując tych samych operacji elementarnych na wierszach macierzy I3. Zgodnie zdefinicją macierze równoważne, to takie, że jedna z nich może być otrzymana z drugiejw wyniku zastosowania operacji elementarnych, więc kolejno otrzymywane macierzebędziemy na początku i końcu oznaczać symbolem „'”. Wpierw zmieniamy kolejnośćwierszy:

'

1 5 3 | 0 0 12 7 3 | 1 0 03 9 4 | 0 1 0

'

84 III. UKŁADY RÓWNAŃ LINIOWYCH

Mnożymy teraz pierwszy wiersz macierzy przez −2 i dodajemy do wiersza drugiego anastępnie mnożymy pierwszy wiersz przez −3 i dodajemy do wiersza trzeciego:

'

1 5 3 | 0 0 10 −3 −3 | 1 0 −20 −6 −5 | 0 1 −3

'Następnie mnożymy drugi wiersz przez −2 i dodajemy do wiersza trzeciego:

'

1 5 3 | 0 0 10 −3 −3 | 1 0 −20 0 1 | −2 1 1

'Teraz mnożymy drugi wiersz przez −13 :

'

1 5 3 | 0 0 10 1 1 | −13 0 2

3

0 0 1 | −2 1 1

'Mnożąc drugi wiersz przez −5 i dodając do pierwszego otrzymujemy:

'

1 0 −2 | 5

3 0 −730 1 1 | −13 0 2

3

0 0 1 | −2 1 1

'Na koniec do pierwszego wiersza dodajemy trzeci wiersz pomnożony przez 2, a dodrugiego dodajemy wiersz trzeci pomnożony przez −1:

'

1 0 0 | −73 2 −130 1 1 | −13 0 2

3

0 0 1 | −2 1 1

'

1 0 0 | −73 2 −130 1 0 | 5

3 −1 −130 0 1 | −2 1 1

.Z ostatniego twierdzenia wynika więc, że macierzą odwrotną do macierzy

A =

2 7 33 9 41 5 3

jest macierz

B =

−73 2 −1353 −1 −13−2 1 1

.Wykonując mnożenie AB lub BA sprawdzamy, że wynik jest poprawny.

Wyżej opisane operacje elementarne możemy także wykonywać na kolumnach ma-cierzy zamiast na wierszach i w efekcie otrzymamy także macierz odwrotną Najwy-godniej wtedy podpisać macierz jednostkową pod macierzą, której macierz odwrotnąchcemy obliczyć i przeprowadzać operacje na kolumnach.

3. METODA GAUSSA ROZWIĄZYWANIA UKŁADÓW RÓWNAŃ 85

3. Metoda Gaussa rozwiązywania układów równań

Przejdziemy teraz do omówienia metody rozwiązania dowolnego układu równań,tzn. takiego, w którym ilość równań jest niekoniecznie taka sama jak ilość niewiado-mych. Zatem rozważmy układ

(1)

a11x1 + a12x2 + · · ·+ a1nxn = b1a21x1 + a22x2 + · · ·+ a2nxn = b2

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .am1x1 + am2x2 + · · ·+ amnxn = bm,

gdzie aij są liczbami rzeczywistymi. Jak pamiętamy wzory Cramera dawały rozwiązaniaukładu równań Cramera, tj. takiego układu, w którym ilość niewiadomych była równailości równań oraz macierz tego układu była nieosobliwa. Podamy teraz naturalnąmetodę rozwiązywania dowolnych układów równań, która na dodatek nie odwołuje siędo pojęcia wyznacznika.

Dwa układy równań nazywamy równoważnymi, jeśli mają one takie same zbioryrozwiązań. Na początek prosta obserwacja. Zauważmy, że jeśli w układzie równań (1)którekolwiek równanie pomnożymy obustronnie przez liczbę różną od zera, to otrzy-mamy układ równoważny z wyjściowym. Podobnie, pomnożenie obustonne dowolnegorównania a następnie dodanie go do innego równania prowadzi do układu równoważne-go. Jest rzeczą oczywistą, że przestawienie dwóch wierszy także nie zmieni nam zbiorurozwiązań układu równań. Wszystkie wymienione powyżej operacje na układzie rów-nań możemy nazwać, przez analogię do operacji wykonywanych na wierszach macierzy,operacjami albo przekształceniami elementarnymi. Jak się przekonamy analogia ta jestnieprzypadkowa.

Macierz Au postaci

Au =

a11 a12 . . . a1n b1a21 a22 . . . a2n b2. . . . . . . . . . . . . . . . . . . . . . . .am1 am2 . . . amn bm

powstałą przez dopisanie do macierzy A układu równań (1) kolumny wyrazów wolnychnazywamy macierzą uzupełnioną układu równań (1). Z poczynionych wcześniej uwagwynika, że mamy następujące twierdzenie:

Twierdzenie 3.1. Jeśli macierz B jest macierzą otrzymaną poprzez zastosowanieprzekształceń elementarnych na wierszach macierzy Au, gdzie Au jest macierzą uzupeł-nioną układu równań postaci (1), to układ równań, dla którego macierz B jest macierząuzupełnioną jest równoważny z układem (1).

Zauważmy, że jeśli któreś równanie w układzie równań może być otrzymane z innychw rezultacie obustronnego dodania innych równań pomnożonych przez odpowiednieliczby to takie równanie może być pominięte w układzie równań. Istotnie, jeśli równanieai1x1 + · · · + ainxn = bi może być otrzymane w rezultacie dodania i1-ego równania

86 III. UKŁADY RÓWNAŃ LINIOWYCH

pomnożonego obustronnie przez liczbę c1, i2-ego pomnożonego przez c2 itd, to mnożącodpowiednio i1-sze równanie przez −c1, drugie przez −c2 itd, a następnie dodając jeobustronnie do i-tego otrzymamy równanie

0x1 + 0x2 + . . . 0xn = 0,

które jest spełnione przez dowolne liczby rzeczywiste. Wobec tego jeśli w wierszu macie-rzy uzupełnionej po dokonaniu przekształceń elementarnych pojawi się wiersz złożonyz samych zer, to możemy go pominąć, nie zmieniając przy tym zbioru rozwiązań.

Przejdźmy teraz do opisu metody Gaussa. Rozpatrujemy macierz uzupełnioną ukła-du równań. Jak wiemy każdą macierz można przekształcić za pomocą przekształceńelementarnych do postaci schodkowej. Po usunięciu wierszy złożonych z samych zer(jeśli one się pojawią) otrzymamy macierz postaci

b11 b12 . . . b1n d10 b22 . . . b2n d2. . . . . . . . . . . . . . . . . . . . .0 0 . . . bnn dn

gdzie bii 6= 0 dla i 6 n, albo macierz postaci

b11 b12 . . . b1m . . . b1n d10 b22 . . . b2m . . . b2n d2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 0 . . . bmm . . . bmn dm

,

gdzie m < n oraz bii 6= 0 dla i 6 m. Pierwsza z tych macierzy odpowiada układowirównań

(2)

b11x1 + b12x2 + · · ·+ b1nxn = d1

b22x2 + · · ·+ b2nxn = d2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

bnnxn = dn

które, jak nietrudno się przekonać, ma jednoznaczne rozwiązanie. Z ostatniego równa-nia wyliczamy xn. Mając już xn z przedostatniego równania możemy obliczyć xn−1 itd,aż do x1. W drugim przypadku nasza macierz odpowiada układowi równań

(3)

b11x1 + b12x2 + · · ·+ b1mxm + · · ·+ b1nxn = d1

b22x2 + · · ·+ b2mxm + · · ·+ b2nxn = d2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

bmmxm + · · ·+ bmnxn = dm

3. METODA GAUSSA ROZWIĄZYWANIA UKŁADÓW RÓWNAŃ 87

Jeśli teraz w układzie równań za niewiadome xm+1, . . . , xn przyjąć dowolne liczby rze-czywiste αm+1, . . . , αn , a następnie napisać układ (3) w postaci

b11x1 + b12x2 + · · ·+ b1mxm = d1 − b1m+1αm+1 − · · · − b1nαnb22x2 + · · ·+ b2mxm = d2 − b2m+1αm+1 − · · · − b2nαn

. . . . . . . . . . . . . . . . . . . . . . . . . . .bmmxm = dm − bmm+1αm+1 − · · · − bmnαn

to możemy układ rozwiązać w taki sam sposób jak układ (2). W tym przypadku otrzy-mamy nieskończenie wiele rozwiązań, a więc układ ten jest nieoznaczony. Powyższysposób rozwiązania układu równań nosi nazwą metody Gaussa lub metody rugowanianiewiadomych.

Przykład 3.1. Rozwiążemy metodą Gaussa następujący układ równań.x1 − 3x2 + 4x3 + 2x4 = 1

2x1 + 4x2 − 3x3 + 3x4 = −13x1 + x2 + 2x3 − x4 = 0

12x1 + 4x2 + 7x3 + 2x4 = 0

Wpierw wyznaczamy macierz uzupełnioną tego układu równań:

Au =

1 −3 4 2 12 4 −3 3 −13 1 2 −1 012 4 7 2 0

.Następnie dokonujemy przekształceń elementarnych na wierszach tej macierzy, tak abyotrzymać macierz schodkową. W tym celu na początek mnożymy wiersz pierwszy przez-2 i dodajemy do wiersza drugiego, wiersz pierwszy przez -3 i dodajemy do wierszatrzeciego, w końcu mnożymy wiersz pierwszy przez -12 i dodajemy do czwartego. Potych operacjach otrzymujemy macierz rownoważną postaci:

1 −3 4 2 10 10 −11 −1 −30 10 −10 −7 −30 40 −41 −22 −12

.Jeśli teraz wiersz drugi otrzymanej macierzy pomnożymy przez -1 i dodamy do wierszatrzeciego, a potem jeszcze wiersz drugi pomnożymy przez -4 i dodamy do wierszaczwartego, to otrzymamy macierz

1 −3 4 2 10 10 −11 −1 −30 0 1 −6 00 0 3 −18 0

.

88 III. UKŁADY RÓWNAŃ LINIOWYCH

Następnie wiersz trzeci mnożymy przez −3 i dodajemy do wiersza ostatniego:1 −3 4 2 10 10 −11 −1 −30 0 1 −6 00 0 0 0 0

.Widzimy, że w czwartym wierszu są same zera, a więc możemy pominąć go w dalszychrachunkach. Otrzymujemy wówczas macierz 1 −3 4 2 1

0 10 −11 −1 −30 0 1 −6 0

.Za niewiadomą x4 podstawiamy dowolną liczbę rzeczywistą α i w ten sposób mamy

x3 = 6α.

Pozostałe dwie niewiadome obliczamy korzystając z dwóch pierwszych wierszy ostatniejmacierzy:

x2 =−3 + 11x3 + x4

10=−3 + 11 · 6α + α

10=−3 + 67α

10,

x1 = 1 + 3x2 − 4x3 − 2x4 = 1 + 3−3 + 67α

10− 4 · 6α− 2α =

1− 59α10

.

4. FORMY KWADRATOWE 89

4. Formy kwadratowe

Formą kwadratową zmiennych x1, . . . , xn nazywamy wielomian tych zmiennych po-staci

(1) F (x1, . . . , xn) =n∑

i,j=1

aijxixj =

= a11x21 + a12x1x2 + . . . + a1nx1xn+

+a21x2x1 + a22x22 + . . . + a2nx2xn+

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .+an1xnx1 + an2xnx2 + . . . + annx

2n,

gdzie aij = aji dla i, j ∈ {1, . . . , n}. Nietrudno zauważyć, że formę kwadratową posta-ci (1) możemy zapisać w postaci równoważnej przy pomocy następującego równaniamacierzowego

F (x1, . . . , xn) =[x1 x2 . . . xn

a11 a12 . . . a1na21 a22 . . . a2n...

... . . ....

an1 an2 . . . ann

·x1x2...xn

,lub oznaczając A = [aij] oraz x jako wektor kolumnowy o elementach x1, . . . , xn poprostu jako

F (x) = xT · A · x.Macierz symetryczną A będziemy nazywać macierzą formy kwadratowej F . Wraz zkażdą formą kwadratową F możemy związać tzw. formę dwuliniową. Definiujemy jąna parach wektorów kolumnowych w następujący sposób:

g(x, y) = xT · A · y.Przyjmijmy dla ustalonej liczby naturalnej n następujące oznaczenia wektorów kolum-nowych:

e1 =

100...0

, e2 =

010...0

, . . . , en =

000...1

oraz 0 =

000...0

.

Nietrudno sprawdzić, że dla każdej pary liczb i, j ∈ {1, . . . , n} zachodzi równość

aij = eTi · A · ej.Głównym problemem jakim będziemy się zajmować w tym paragrafie, jest odpo-

wiedź na pytanie jakie warunki winna spełniać macierz A formy kwadratowej F , abydla każdego wektora kolumnowego x 6= 0 spełniony był warunek

(2) F (x) > 0.

90 III. UKŁADY RÓWNAŃ LINIOWYCH

W takim przypadku mówimy, że forma kwadratowa F jest dodatnio określona. Jeślidla każdego x 6= 0 spełniony jest warunek

(3) F (x) < 0.

to mówimy, że forma kwadratowa F jest ujemnie określona.

Załóżmy, że następujące minory macierzy A są różne od zera:

(4) N1 = a11 6= 0, N2 = det[a11 a12a21 a22

]6= 0, N3 = det

a11 a12 a13a21 a22 a23a31 a32 a33

6= 0, ...,

Nn−1 = det

a11 a12 . . . a1n−1a21 a22 . . . a2n−1...

... . . ....

an−1 1 an−1 2 . . . an−1n−1

6= 0, Nn = det

a11 a12 . . . a1na21 a22 . . . a2n...

... . . ....

an1 an2 . . . ann

6= 0.

Dodatkowo oznaczmy N0 = 1. Postawmy sobie na początek zadanie znalezienia nwektorów

γ1 =

γ1100...0

, γ2 =

γ21γ220...0

, γ3 =

γ31γ32γ33...0

, . . . , γn =

γn1γn2γn3...γnn

,

tak aby dla każdego i, j ∈ {1, . . . , n}, i 6= j, zachodził warunek

(5) g(γi, γj) = 0,

oraz dla każdego i ∈ {1, . . . , n} spełniona była równość

(6) g(γi, ei) = 1,

gdzie g jest formą dwuliniową wyznaczoną przez formę kwadratową F . Zauważmy, żejeśli dla każdego l = 1, . . . , n oraz m < l zachodzi warunek

(7) g(γl, em) = 0,

to, dla j < i mamy

(8) g(γi, γj) = γTi · A · γj = γTi · A · (γj1e1 + · · ·+ γjjej) =

= γTi · (A · γj1e1 + · · ·+ A · γjjej) = γTi · (γj1A · e1 + · · ·+ γjjA · ej) =

= (γTi · γj1A · e1) + · · ·+ (γTi · γjjA · ej) = γj1(γTi · A · e1) + · · ·+ γjj(γTi · A · ej) =

= γj1g(γi, e1) + · · ·+ γjjg(γi, ej) = 0.

Jeśli i < j, to korzystając z symetryczności macierzy A oraz z równości (8) otrzymu-jemy, że również

g(γi, γj) = [g(γi, γj)]T = [γTi · A · γj]T = γTj · AT · γi = γTj · A · γi = g(γj, γi) = 0.

4. FORMY KWADRATOWE 91

Tak więc, jeśli warunek (7) jest spełniony, to także spełniony jest warunek (5). Zo-baczmy co mówi warunek (7). Ustalmy dowolne l 6 n. Wówczas dla każdego m < lmamy

(9) 0 = g(γl, em) = γTl · A · em = (γl1e1 + · · ·+ γllel)T · A · em =

= γl1eT1 · A · em + · · ·+ γlle

Tl · A · em = γl1g(e1, em) + · · ·+ γllg(el, em) =

= γl1a1m + · · ·+ γllalm.

Warunek (6) natomiast oznacza, że

(10) 1 = g(γl, el) = γTl · A · el = (γl1e1 + ·+ γllel)T · A · el =

= γl1eT1 · A · el + · · ·+ γlle

Tl · A · el = γl1g(e1, el) + · · ·+ γllg(el, el) =

= γl1a1l + · · ·+ γllall = 1,

dla każdego l = 1 . . . , n. Tak więc dla każdego l 6 n istnieją szukane liczby γl1, . . . , γll(czyli wektory γl) spełniające warunki (7) i (6) wtedy i tylko wtedy, gdy dla każdegol 6 n liczby γl1, . . . , γll spełniają układ równości

a11γl1 + . . . + a1lγll = 0a21γl1 + . . . + a2lγll = 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .al−1 1γl1 + . . . + al−1 lγll = 0al1γl1 + . . . + allγll = 1

,

czyli są rozwiązaniami układu równań liniowych

(11)

a11x1 + . . . + a1lxl = 0a21x1 + . . . + a2lxl = 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .al−1 1x1 + . . . + al−1 lxl = 0al1x1 + . . . + allxl = 1

Na mocy założenia (4) o niezerowości wyznaczników N1, N2, . . . , Nn otrzymujemy ztwierdzenia Cramera, że dla dowolnego l = 1, 2, . . . , n, układ równań postaci (11) ma(i to dokładnie jedno) rozwiązanie. Tak więc kwestia istnienia wektorów γ1, . . . , γnspełniających warunki (6) oraz (7), a przez to i warunek (5), została pozytywnie roz-strzygnięta. Obliczymy jeszcze g(γi, γi) korzystając z warunków (5) oraz (7):

g(γi, γi) = g(γi, γi1e1 + · · ·+ γiiei) = γTi · A · (γi1e1 + · · ·+ γiiei) =

= γi1γTi · A · e1 + · · ·+ γiiγ

Ti · A · ei = γi1g(γi, e1) + · · ·+ γiig(γi, ei) = γii.

92 III. UKŁADY RÓWNAŃ LINIOWYCH

Liczbę γii dla każdego i możemy wyznaczyć z układu równań (11) korzystając ze wzo-rów Cramera:

γii =

det

a11 a12 . . . 0a21 a22 . . . 0...

... . . ....

ai1 ai2 . . . 1

Ni

=Ni−1

Ni

.

Z wszystkich wektorów kolumnowych utwórzmy następującą macierz

M =

γ11 γ21 . . . γn10 γ22 . . . γn2...

... . . ....

0 0 . . . γnn

.Ponieważ

detM = γ11 · · · · · γnn =1N1· N1N2· · · · · Nn−1

Nn

=1Nn

6= 0,

więc układ równań γ11x1 + γ21x2 + . . . + γn1xn = a1

γ22x2 + . . . + γn2xn = a2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

γnnxn = an

ma na mocy twierdzenia Cramera dokładnie jedno rozwiązanie c1, . . . , cn dla dowolnychliczb rzeczywistych a1, . . . , an. Dlatego też dowlony wektor kolumnowy a o wyrazacha1, . . . , an możemy przedstawić w postaci

a =

a1a2...an

= c1γ1 + · · ·+ cnγn,

gdzie c1, . . . , cn są pewnymi liczbami rzeczywistymi. Obliczamy wartość formy kwadra-towej (1) dla wektora a:

F (a) = aT · A · a = (c1γ1 + · · ·+ cnγn)T · A · (c1γ1 + · · ·+ cnγn) =

=∑i,j

cicjγTi · A · γj =

∑i,j

cicjg(γi, γj) =n∑i=1

c2i g(γi, γi) =n∑i=1

c2i γii =n∑i=1

c2iNi−1

Ni

.

Jeśli wektor a 6= Θ, czyli jeśli nie wszystkie liczby a1, . . . , an są równe zero, to i wśródliczb c1, . . . , cn przynajmniej jedna będzie różna od zera. Ponadto, jeśli wszystkie liczby

(12)N0N1

=1N1

,N1N2

, . . . ,Nn−1

Nn

4. FORMY KWADRATOWE 93

będą dodatnie, to F (a) będzie liczbą dodatnią dla dowolnego a 6= 0. Jeśli natomiastwszystkie liczby (12) będą ujemne, to F (a) < 0 dla każdego a 6= 0. Możemy zatemsformułować jedno z najważniejszych twierdzeń o formach kwadratowych.

Twierdzenie 4.1 (Kryterium Sylvestera). Jeśli A = [aij] jest macierzą formykwadratowej F , to forma kwadratowa F jest

a) dodatnio określona, jeśli

N1 = a11 > 0, N2 = det[a11 a12a21 a22

]> 0, . . . , Nn = det

a11 a12 . . . a1na21 a22 . . . a2n...

... . . ....

an1 an2 . . . ann

> 0;

b) ujemnie określona, jeśli

N1 = a11 < 0, N3 = det

a11 a12 a13a21 a22 a23a31 a32 a33

< 0, . . .

oraz

N2 = det[a11 a12a21 a22

]> 0, N4 = det

a11 a12 a13 a14a21 a22 a23 a24a31 a32 a33 a34a41 a42 a43 a44

> 0, . . . .

94 III. UKŁADY RÓWNAŃ LINIOWYCH

5. Zadania do rozdziału III

Zadanie 64. Rozwiązać układy równań korzystając ze wzorów Cramera

(a) x1 + 2x2 + 3x3 + 4x4 = 52x1 + x2 + 2x3 + 3x4 = 13x1 + 2x2 + x3 + 2x4 = 14x1 + 3x2 + 2x3 + x4 = −5

(b) x1 + 2x2 + 3x3 − 2x4 = 62x1 − x2 − 2x3 − 3x4 = 83x1 + 2x2 − x3 + 2x4 = 42x1 − 3x2 + 2x3 + x4 = −8

(c) x1 + x2 + 2x3 + 3x4 = 13x1 − x2 − x3 − 2x4 = −42x1 + 3x2 − x3 − x4 = −6x1 + 2x2 + 3x3 − x4 = −4

(d) x2 − 3x3 + 4x4 = −5

x1 − 2x3 + 3x4 = −43x1 + 2x2 − 5x4 = 124x1 + 3x2 − 5x3 = 5

(e) 2x1 + x2 − x3 + x4 = 13x1 + x2 + 2x3 − 3x4 = 15x1 + x2 − x3 + 2x4 = 12x1 + x2 + x3 − 3x4 = 1

(f) 2x1 + 5x2 + 4x3 + x4 = 20x1 + 3x2 + 2x3 + x4 = 112x1 + 10x2 + 9x3 + 7x4 = 403x1 + 8x2 + 9x3 + 2x4 = 37

(g) x1 + 2x2 + 3x3 + 2x4 = 02x1 − 4x2 + 5x3 + 6x4 = 06x1 − 12x2 + 17x3 + 16x4 = 07x1 − 14x2 + 18x3 + 17x4 = 0

5. ZADANIA DO ROZDZIAŁU III 95

(h) 2x1 + 5x2 − 6x3 + 25x4 = 1x1 + 3x2 − 3x3 + 12x4 = 12x1 + 4x2 − 4x3 + 18x4 = 22x1 + 6x2 − 6x3 + 27x4 = 2

(i) x1 + x2 + x4 = 5x1 + 3x2 + 4x3 + 2x4 = 15x1 + 4x2 + 7x3 = 06x1 + 5x2 + 5x3 + x4 = 5

(j) x1 + x2 + x3 + x4 = 3x1 + 2x2 + 3x3 + 4x4 = 52x1 + 4x2 + x3 + 5x4 = 33x1 + 5x2 + 2x3 + 7x4 = 5

(k) 2x1 + 2x2 + 2x3 − 2x4 = 23x1 + 6x2 + 5x3 − x4 = 1x1 + 5x2 + 3x3 + 4x4 = 0x1 + 3x2 + 2x3 + 2x4 = 1

(l) 2x1 + 8x2 + 8x3 + 4x4 = 23x1 + 4x2 + 4x3 + x4 = 02x1 + 3x2 + 2x3 = 12x1 + 3x2 + 3x3 + x4 = 0

(m) 4x1 + 4x2 + 2x3 + 4x4 = 24x1 + 5x2 + 3x3 + 3x4 = 12x1 + 4x2 + 3x3 + x4 = 03x1 + 5x2 + 4x3 = 1

(n) 2x1 + 4x2 + 4x3 = 05x1 + 5x2 + 4x3 + 2x4 = 13x1 + 3x2 + x3 + 2x4 = 1

+ x2 + 2x3 − x4 = −1(o)

8x1 + 2x2 + 10x3 + 6x4 = 26x1 + 2x2 + 7x3 + 6x4 = 13x1 + x2 + 4x3 + 3x4 = 07x1 + 3x2 + 7x3 + 8x4 = 1

96 III. UKŁADY RÓWNAŃ LINIOWYCH

Odpowiedź (a): x1 = −2, x2 = 2, x3 = −3, x4 = 3. (b): x1 = 1, x2 = 2, x3 = −1,x4 = −2. (c): x1 = −1, x2 = −1, x3 = 0, x4 = 1. (d): x1 = 1, x2 = 2, x3 = 1, x4 = −1.(e): x1 = 0, x2 = 1, x3 = 0, x4 = 0. (f): x1 = 1, x2 = 2, x3 = 2, x4 = 0. (g): x1 = 0,x2 = 0, x3 = 0, x4 = 0.

Zadanie 65. Znaleźć wielomian w(x) stopnia 2-go wiedząc, że

w(1) = −1; w(−1) = 9; w(2) = −3.

Zadanie 66. Znaleźć wielomian w(x) stopnia 3-go wiedząc, że

w(−1) = 0; w(1) = 4; w(2) = 3; w(3) = 16.

Zadanie 67. Rozwiązać metodą Gaussa następujące układy równań:(a)

3x1 − 2x2 − 5x3 + x4 = 32x1 − 3x2 + x3 + 5x4 = −3x1 + 2x2 − 4x4 = −3x1 − x2 − 4x3 + 9x4 = 22

(b) 2x1 − 3x2 + 3x3 + 2x4 = 36x1 + 9x2 − 2x3 − x4 = −4

10x1 + 3x2 − 3x3 − 2x4 = 38x1 + 6x2 + x3 + 3x4 = −7

(c) 2x1 + 7x2 + 3x3 + x4 = 5x1 + 3x2 + 5x3 − 2x4 = 3x1 + 5x2 − 9x3 + 8x4 = 1

5x1 + 18x2 + 4x3 + 5x4 = 12(d)

2x1 − x2 + x3 − x4 = 34x1 − 2x2 − 2x3 + 3x4 = 22x1 − x2 + 5x3 − 6x4 = 12x1 − x2 − 3x3 + 4x4 = 5

(e) x1 + x2 + 3x3 − 2x4 + x5 = 4

3x1 + 3x2 + 5x3 − 4x4 + 3x5 = 5x1 + x2 + 7x3 − 4x4 + x5 = 11

2x1 + 2x2 + 2x3 − 3x4 + 3x5 = 6(f)

x1 + 4x2 + 2x3 + x4 + 3x5 = 5x1 + 3x2 + x3 + 2x4 + 5x5 = 2x1 + 7x2 + 5x3 − 2x4 − 3x5 = 14

5. ZADANIA DO ROZDZIAŁU III 97

Odpowiedzi: (a): x1 = −1, x2 = 3, x3 = −2, x4 = 2. (b): x1 = 12 , x2 = −23 , x3 = 2,

x4 = −3. (c): x1 = 6− 26α+ 17β, x2 = −1 + 7α− 5β, x3 = α, x4 = β, gdzie α, β ∈ R.(d): układ sprzeczny. (e): x1 = −15−4α−2β

4 , x2 = α, x3 = −3+2β4 , x4 = −5 + β, x5 = β,

gdzie α, β ∈ R.

Zadanie 68. W zależności od parametru a ∈ R rozwiązać układ równańx1 + x2 + x3 + ax4 = 1x1 + x2 + ax3 + x4 = −1x1 + ax2 + x3 + x4 = 0ax1 + x2 + x3 + x4 = 0

Odpowiedź Jeśli a 6= 1 i α 6= −3, to układ ma dokładnie jedno rozwiązanie: x1 = 0,x2 = 0, x3 = 1

1−a , x4 = 1a−1 ; jeśli a = 1, to układ jest sprzeczny; jeśli a = −3, to układ

ma nieskończenie wiele rozwiązań postaci x1 = α+ 14 , x2 = α+ 1

4 , x3 = α+ 12 , x4 = α,

gdzie α ∈ R.

ROZDZIAŁ IV

Przekształcenia liniowe

1. Pojęcie przekształcenia liniowego

Definicja 1.1. Załóżmy, że V i W są przestrzeniami liniowymi nad ciałem K, af : V → W . Mówimy, że f jest przekształceniem liniowym, jeśli dowolnych v, w ∈ V idowolnego skalara α ∈ K spełnione są następujące warunki:

(a) f(v + w) = f(v) + f(w);(b) f(αv) = αf(v).

Przekształcenia liniowe nazywamy także odwzorowaniami liniowymi. Własność (a)nazywana jest addytywnością, a własność (b) jednorodnością przekształcenia f . Za-miast warunków (a) i (b) definiujących przekształcenie liniowe można podać jedenwarunek. W istocie, aby f : V → W było przekształceniem liniowym potrzeba i wy-starcza żeby równość

(c) f(αv + βw) = αf(v) + βf(w)zachodziła dla dowolnych v, w ∈ V oraz dowolnych α, β ∈ K.

Przykład 1.1. (a) Rozważmy f : R2 → R2 określone wzorem:

f([x1, x2]) = [5x1 − 2x2, 2x1 + x2].

Bez trudu sprawdzamy, że

f(α[x1, x2] + β[y1, y2]) = f([αx1 + βy1, αx2 + βy2]) =

= [5(αx1 + βy1)− 2(αx2 + βy2), 2(αx1 + βy1) + (αx2 + βy2)] =

= [α(5x1 − 2x2) + β(5y1 − 2y2), α(2x1 + x2) + β(2y1 + y2)] =

= α[5x1 − 2x2, 2x1 + x2] + β[5y1 − 2y2, 2y1 + y2] =

= αf([x1, x2]) + βf([y1, y2]).

Tak więc f jest przekształceniem liniowym przestrzeni R2 w siebie.(b) Rozważmy przestrzeń liniową R[x] złożoną ze wszystkich wielomianów o współ-

czynnikach rzeczywistych i odwzorowanie f : R[x] → R[x] określone w następującysposób:

f(w) = w′,

tj. f przypisuje wielomianowi w jego pochodną. Ponieważ pochodna wielomianu jestwielomianem, więc f jest poprawnie określone. Z własności pochodnej wynika, że

f(αw1 + βw2) = (αw1 + βw2)′ = αw′1 + βw′2 = αf(w1) + βf(w2).

99

100 IV. PRZEKSZTAŁCENIA LINIOWE

Wobec tego f jest odwzorowaniem liniowym.(c) Zdefiniujmy J : C([0, 1])→ R wzorem:

J(h) =∫ 10h(x) dx.

Ponieważ

J(h1 + h2) =∫ 10

(h1(x) + h2(x))) dx =∫ 10h1(x) dx+

∫ 10h2(x) dx = J(h1) + J(h2),

orazJ(αh) =

∫ 10αh(x) dx = α

∫ 10h(x) dx = αJ(h),

więc J jest odwzorowaniem liniowym.

Zbiór wszystkich przekształceń liniowych f : V → W oznaczamy symbolem L(V,W ).W zbiorze L(V,W ) można wprowadzić działania sumy i mnożenia przez skalar w na-stępujący sposób. Jeśli f, g ∈ L(V,W ), to sumą przekształceń f i g nazywamy prze-kształcenie f + g określone wzorem:

(f + g)(v) = f(v) + g(v),

gdzie v ∈ V . Iloczynem przekształcenia liniowego f przez skalar α ∈ K nazywamyprzekształcenie αf zdefiniowane formułą:

(αf)(v) = αf(v),

gdzie v ∈ V . W zbiorze L(V,W ) możemy wyróżnić jeszcze przekształcenie O , którekażdemu wektorowi v ∈ V przypisuje wektor zerowy 0 ∈ W . Bez trudu można spraw-dzić, że f + g, αf ∈ L(V,W ), jeśli f, g ∈ L(V,W ) i α ∈ K. Niemal oczywistym jestfakt, że O ∈ L(V ,W ). Jeśli dla każdego f ∈ L(V,W ) określimy −f w następującysposób:

−f = (−1)f,to możemy stwierdzić, że:

Twierdzenie 1.1. Jeśli V i W są przestrzeniami liniowymi nad ciałem K, to zbiórL(V,W ) złożony ze wszystkich przekształceń liniowych f : V → W z działaniami sumy,mnożeniem przez skalar i wyróżnionym przekształceniem O jest przestrzenią liniowąnad ciałem K.

Jeśli f ∈ L(V,W ) i g ∈ L(W,Z), to złożenie g ◦ f : V → Z jest odwzorowaniemliniowym, które oznaczamy krótko gf .

Twierdzenie 1.2. Załóżmy, że V,W, Y, Z są przestrzeniami liniowymi nad ciałemK, h ∈ L(V,W ), g, g1 ∈ L(W,Y ), f, f1 ∈ L(Y, Z) oraz α ∈ K, to:

(1) (fg)h = f(gh).(2) α(fg) = (αf)g;(3) (f + f1)g = fg + f1g;(4) f(g + g1) = fg + fg1;

2. POSTAĆ MACIERZOWA PRZEKSZTAŁCEŃ LINIOWYCH 101

Przekształcenie liniowe f : V → W nazywamy monomorfizem liniowym, jeśli f jestróżnowartościowe. Jeśli f(V ) = W , to mówimy, że f jest epimorfizmem liniowym zprzestrzeni V na przestrzeń W . Przekształcenie liniowe f : V → W , które jest zarównomonomorfizmem jak i epimorfizmem liniowym nazywamy izomorfizmem liniowym.

Jeśli V jest przestrzenią liniową, a f : V → V jest przekształceniem liniowym,to mówimy, że f jest endomorfizmem liniowym przestrzeni V . Tak więc L(V, V ) jestprzestrzenią wszystkich endomorfizmów liniowych przestrzeni V . W zbiorze L(V, V )możemy wyróżnić endomorfizm tożsamościowy I , określony oczywistą formułą:

I (v) = v

dla każdego v ∈ V .

2. Postać macierzowa przekształceń liniowych

Zakładać będziemy w dalszym ciągu, że przestrzenie liniowe mają wymiar skoń-czony. Ustalmy zatem w przestrzeni liniowej V , której wymiar jest równy n, bazęuporządkowaną (v1, . . . , vn), a w przestrzeni liniowej W , której wymiar jest równy m,bazę (w1, . . . , wm). Niech v ∈ V . Zatem

v = α1v1 + · · ·+ αnvn.

Niech f ∈ L(V,W ). Zgodnie z definicją przekształcenia liniowego

f(v) = f(α1v1 + · · ·+ αnvn) = α1f(v1) + · · ·+ αnf(vn).

Ponieważ układ (w1, . . . , wm) jest bazą przestrzeni W , więc dla każdego j = 1, . . . , nistnieje dokładnie jeden taki układ skalarów α1j, . . . , αmj, że

f(vj) = α1jw1 + · · ·+ αmjwm.

Wobec tego

(1) f(v) =n∑j=1

αif(vj) =n∑j=1

αjm∑i=1

αijwi =m∑i=1

n∑j=1

αjαij

wi.Równość (1) oznacza, że jeśli (α1, . . . , αn) jest ciągiem współrzędnych wektora v wbazie uporządkowanej, to i-ta współrzędna βi, gdzie i ∈ {1, . . . ,m}, wartości f(v) wbazie (w1, . . . , wm) wyraża się formułą

βi =n∑j=1

αijαj.

Można to ująć zapisując następującą równość macierzowąβ1β2...βm

=

α11 α12 . . . α1nα21 α22 . . . α2n

......

...αm1 αm2 . . . αmn

·α1α2...αn

102 IV. PRZEKSZTAŁCENIA LINIOWE

Samą macierz α11 α12 . . . α1nα21 α22 . . . α2n

......

...αm1 αm2 . . . αmn

nazywamy macierzą przekształcenia liniowego f . Macierz tą oznaczać będziemy symbo-lem M(f). Formalnie macierz M(f) zależy jeszcze od baz uporządkowanych przestrzeniV i W .

Przykład 2.1. Rozważmy odwzorowanie liniowe f : R2 → R2

f([x1, x2]) = [5x1 − 2x2, 2x1 + x2].

opisane w przykładzie 1.1 (a). Załóżmy, że w przestrzeni R2 rozważamy bazy kanoniczne(e1, e2) (w dziedzinie i przeciwdziedzinie). Skoro

f(e1) = f([1, 0]) = [5, 2] = 5e1 + 2e2

orazf(e2) = f([0, 1]) = [−2, 1] = −2e1 + 1e2,

więc macierz przekształcenia f w bazach kanonicznych jest równa

M(f) =[5 −22 1

].

Gdybyśmy jednak rozważyli w dziedzinie bazę kanoniczną (e1, e2) a w przeciwdzie-dzinie bazę ([5, 2], [−2, 1]) (fakt, że wektory [5, 2] i [−2, 1] tworzą bazę przestrzeni R2pozostawiamy jako łatwe ćwiczenie), to macierz M(f) przyjmie postać macierzy jed-nostkowej:

M(f) =[1 00 1

].

Załóżmy, że (v1, . . . , vn), (w1, . . . , wm) oraz (z1, . . . , zk) będą bazami uporządkowa-nymi odpowiednio przestrzeni liniowych V , W i Z oraz f ∈ L(V,W ), g ∈ L(W,Z).Wówczas jak nietrudno sprawdzić

M(gf) = M(g) ·M(f).

Przykład 2.2. Załóżmy, że f : R3 → R2 i g : R2 → R4 określone jest wzorami:

f([x1, x2, x3]) = [2x1 + 3x2 + x3,−x1 + 5x2],

g([x1, x2]) = [x1, x2, x1 + x2, x1 − x2].Fakt, że f i g są liniowe nie przedstawia większych trudności. Rozważamy w każdejprzestrzeni bazy kanoniczne. Wówczas

M(f) =[

2 3 1−1 5 0

]

3. ZMIANY BAZ 103

oraz

M(g) =

1 00 11 11 −1

.Zatem macierz złożenia gf : R3 → R4 przyjmie postać:

M(gf) = M(g) ·M(f) =

1 00 11 11 −1

·[

2 3 1−1 5 0

]=

2 3 1−1 5 01 8 13 −2 1

.Twierdzenie 2.1. Jeśli (v1, . . . , vn) oraz (w1, . . . , wm) są bazami odpowiednio prze-

strzeni liniowych V i W , to funkcja M przypisująca każdemu f ∈ L(V,W ) jego macierzprzekształcenia M(f) jest izomorfizmem przestrzeni L(V,W ) na przestrzeń Kn×m.

3. Zmiany baz

Definicja 3.1. Niech B = (v1, . . . , vn) oraz C = (w1, . . . , wn) będą bazami (upo-rządkowanymi) przestrzeni liniowej V . Niech αij, 1 ¬ i, j ¬ n, będą takimi skalaramiz ciała K, że

w1 = α11v1 + α21v2 + · · ·+ αn1vnw2 = α12v1 + α22v2 + · · ·+ αn2vn

...wn = α1nv1 + α2nv2 + · · ·+ αnnvn

.

Macierz P = [αij] nazywamy macierzą przejścia od bazy B do bazy C.

Twierdzenie 3.1. (1) Macierz przejścia od bazy B do niej samej jest macie-rzą jednostkową.

(2) Jeśli P1 jest macierzą przejścia od bazy B do bazy C, a P2 jest macierząprzejścia od bazy C do bazy D, to iloczyn P1 · P2 jest macierzą przejścia odbazy B do bazy D.

(3) Jeśli P jest macierzą przejścia od bazy B do bazy C, to det(P ) 6= 0. Ponadtomacierz P−1 jest macierzą przejścia od bazy C do bazy B.

Przykład 3.1. Rozważmy bazy uporządkowaneB = ([4, 5], [7, 8]) i C = ([7, 11], [1, 5])przestrzeni R2. Ponieważ

[7, 11] = 7[4, 5] + (−3)[7, 8]oraz

[1, 5] = 9[4, 5] + (−5)[7, 8],więc macierzą przejścia z bazy B do bazy C jest macierz

P =[

7 9−3 −5

].

104 IV. PRZEKSZTAŁCENIA LINIOWE

Twierdzenie 3.2. Załóżmy, że P1 jest macierzą przejścia od bazy (v1, . . . , vn) dobazy (v′1, . . . , v

′n) przestrzeni liniowej V , a niech P2 będzie macierzą przejścia od bazy

(w1, . . . , wm) do bazy (w′1, . . . , w′m) przestrzeni liniowej W . Niech ponadto f : V → W

będzie odwzorowaniem liniowym. Jeśli M1(f) jest macierzą odwzorowania liniowego wbazach (v1, . . . , vn) i (w1, . . . , wm), a M2(f) jest macierzą tego samego odwzorowania fale w bazach (v′1, . . . , v

′n) i (w′1, . . . , w

′m), to

M2(f) = P−12 ·M1(f) · P1.

Z twierdzenia 3.2 wynika, że jeśli mamy endomorfizm liniowy f przestrzeni V idwie bazy uporządkowane B i C przestrzeni V , to

M2(f) = P−1 ·M1(f) · P,gdzie P jest macierzą przejścia od bazy B do C, M1(f) jest macierzą endomorfizmu fw bazie B, a M2(f) macierzą endomorfizmu w bazie C.

W algebrze zwykło się nazywać dwie macierze kwadratowe A i B tego samegostopnia macierzami podobnymi, jeśli istnieje macierz C, dla której det(C) 6= 0 oraz

A = C−1 ·B · C.

4. Wartości i wektory własne

Rozpoczniemy od następującej definicji.

Definicja 4.1. Załóżmy, że f ∈ L(V, V ), tj. f jest endomorfizmem liniowym prze-strzeni liniowej V nad ciałem K. Jeśli v ∈ V jest takim wektorem niezerowym, żeistnieje skalar λ ∈ K, że

f(v) = λv,

to wektor v nazywamy wektorem własnym endomorfizmu f , a skalar λ wartością własnąendomorfizmu f .

Mówimy również, że v jest wektorem własnym odpowiadającym wartości własnej λ.

Definicja 4.2. Wielomianem charakterystycznym macierzy kwadratowejA ∈ Kn×n

nazywamy wyznacznik macierzy A− λI, gdzie I jest macierzą kwadratową stopnia n,a λ ∈ K.

Wielomian charakterystyczny macierzy A oznaczać b ędziemy symbolem FA(λ).

Przykład 4.1. Wyznaczymy wielomian charakterystyczny macierzy

A =[1 11 0

].

W tym celu obliczamy wyznacznik:

det([

1 11 0

]− λI

)= det

([1 11 0

]− λ

[1 00 1

])= det

[1− λ 1

1 −λ

]= λ2 + λ− 1.

Tak więc FA(λ) = λ2 − λ− 1.

4. WARTOŚCI I WEKTORY WŁASNE 105

Odnotujmy ważną własność wielomianów charakterystycznych.

Twierdzenie 4.1. Wielomiany macierzy podobnych są takie same.

Tak więc wielomian charakterystyczny macierzy endomorfizmu liniowego przestrze-ni skończenie wymiarowej V nie zależy od wyboru bazy przestrzeni V . Zdefiniujmyzatem następujące pojęcie

Definicja 4.3. Wielomianem charakterystycznym endomorfizmu liniowego f skoń-czenie wymiarowej przestrzeni liniowej V nazywamy wielomian charakterystyczny ma-cierzy M(f) (przy dowolnej bazie przestrzeni V ).

Twierdzenie 4.2. Skalar µ jest wartością własną endomorfizmu liniowego f prze-strzeni skończenie wymiarowej V wtedy i tylko wtedy, gdy µ jest pierwiastkiem wielo-mianu charakterystycznego endomorfizmu f , to znaczy, że µ jest pierwiastkiem wielo-mianu FM(f)(λ).

Przykład 4.2. Rozważmy odwzorowanie liniowe f : R2 → R2 określone wzorem:

f([x1, x2]) = [6x1 + x2, x1 + 6x2].

Wyznaczamy macierz odwzorowania f w bazie kanonicznej:

M(f) =[6 11 6

]Wielomian charakterystyczny endomorfizmu f jest postaci

det[6− λ 1

1 6− λ

]= (6− λ)2 − 1 = λ2 − 12λ+ 35,

którego pierwiastkami są liczby λ1 = 5 oraz λ2 = 7. Tak więc liczby 5 oraz 7 są war-tościami własnymi endomorfizmu f . Znajdźmy jeszcze wektory własne odpowiadająceotrzymanym wartościom własnym. Dla wartości własnej 5 szukamy takiego wektora v,że f(v) = 5v. Przekładając to na język macierzy otrzymujemy równość[

6 11 6

]·[x1x2

]= 5

[x1x2

],

gdzie v =[x1x2

]jest szukanym wektorem własnym. Powyższa równość jest równoważna

układowi równań {6x1 + x2 = 5x1x1 + 6x2 = 5x2

.

Rozwiązaniem tego układu równań jest

x1 = −t, x2 = t

gdzie t ∈ R. Wobec tego każdy wektor postaci [−t, t] gdzie t ∈ R jest wektoremwłasnym endomorfizmu f odpowiadającym wartości własnej 5. Analogiczne rozważania

106 IV. PRZEKSZTAŁCENIA LINIOWE

prowadzą do stwierdzenia, że wektory postaci [t, t], gdzie t ∈ R, są wektorami własnymiendomorfizmu f odpowiadającymi wartości własnej 7.

Twierdzenie 4.3. Załóżmy, że v1, . . . , vm są wektorami własnymi odpowiadający-mi wartościom własnym λ1, . . . , λm endomorfizmu f przestrzeni liniowej V . Zakładamyprzy tym, że λi 6= λj dla i 6= j. Wówczas wektory v1, . . . , vm są liniowo niezależne.

Załóżmy, że endomorfizm liniowy f przestrzeni V ma n różnych wartości własnych,przy czym n = dim(V ). Wówczas dowolny układ n wektorów własnych odpowiadają-cych różnym wartościom własnych jest, na mocy twierdzenia 4.3 liniowo niezależny,a więc tworzy bazę przestrzeni V . Macierz endomorfizmu w tej bazie ma wyjątkowoprostą budowę. Istotnie, macierz ta jest macierzą diagonalną postaci

λ1 0 . . . 00 λ2 . . . 0...

......

...0 0 . . . λn

,gdzie λ1, λ2, . . . , λn są wszystkimi różnymi wartościami własnymi endomorfizmu f . Wy-nika stąd, że jeśli M(f) jest macierzą endomorfizmu f w dowolnej bazie B przestrzeniV , to na mocy twierdzenia 3.2

(1)

λ1 0 . . . 00 λ2 . . . 0...

......

...0 0 . . . λn

= P−1 ·M(f) · P,

gdzie P jest macierzą przejścia od bazy B do bazy złożonej z wektorów własnych.Spostrzeżenie to ma swój wymiar praktyczny w postaci tzw. diagonalizacji macierzykwadratowych. Diagonalizację opiszemy w następującym przykładzie.

Przykład 4.3. Rozważmy endomorfizm f : R2 → R2 określony wzorem f([x1, x2]) =[x1 + x2, x1]. Macierz endomorfizmu f w bazie kanonicznej jest równa

M(f) =[1 11 0

].

W przykładzie 4.1 wyznaczyliśmy wielomian charakterystyczny FM(f)(λ) = λ2 − λ −1. Wielomian charakterystyczny FA(λ) ma dwa pierwiastki: λ1 = 1−

√52 oraz λ2 =

1+√52 . Nietrudno sprawdzić, że wartości własnej 1−

√52 odpowiada wektor własny postaci

[1−√52 t, t], a wartości własnej 1+

√52 wektor własny postaci [1+

√52 t, t], gdzie t ∈ R. Weźmy

dla przykładu t = 1. Wówczas układ ([1−√52 , 1], [1+

√52 , 1]) jest bazą uporządkowaną R2,

w której endomorfizm f ma macierz[1−√52 00 1+

√52

].

5. ZADANIA DO ROZDZIAŁU IV 107

Macierz przejścia z bazy kanonicznej (e1, e2) do naszej bazy złożonej z wektorów wła-snych jest równa

P =[1−√52

1+√52

1 1

].

Tak więc na mocy równości (1) otrzymujemy, że[1−√52 00 1+

√52

]=[1−√52

1+√52

1 1

]−1·[1 11 0

]·[1−√52

1+√52

1 1

]lub równoważnie[

1−√52

1+√52

1 1

]·[1−√52 00 1+

√52

]·[1−√52

1+√52

1 1

]−1=[1 11 0

].

Tym samym macierz M(f) okazała się podobną do macierzy diagonalnej. Ostatniarówność pozwala obliczyć dowolną potęgę macierzy M(f). Istotnie, wykorzystując fakt,że [

1−√52

1+√52

1 1

]−1=

−1√5 1+√5

2√5

1√5−1+

√5

2√5

,otrzymujemy że

[1 11 0

]n=[1−√52

1+√52

1 1

]·[1−√52 00 1+

√52

]n·[1−√52

1+√52

1 1

]−1=

=[1−√52

1+√52

1 1

(1−√52 )n0

0(1+√52

)n ·−1√5 1+

√5

2√5

1√5−1+

√5

2√5

=

=

1√5

((1+√52

)n+1−(1−√52

)n+1) 1√5

((1+√52

)n−(1−√52

)n)1√5

((1+√52

)n−(1−√52

)n) 1√5

((1+√52

)n−1−(1−√52

)n−1) .

Uzyskana równość pozwala podać wzór na n-ty wyraz ciągu Fibbonaciego (p. zada-nie 43):

an =1√5

((1 +√

52

)n−(

1−√

52

)n)

5. Zadania do rozdziału IV

Zadanie 69. Wyznaczyć macierz przekształcenia liniowego f : R3 → R2 określo-nego wzorem:

(a) f([x1, x2, x3]) = [5x1 − 2x2 + 3x3,−x1 + x2 + x3],(b) f([x1, x2, x3]) = [x1 + 2x2 + 3x3, 3x1 + 2x2 + x3],(c) f([x1, x2, x3]) = [12x1 + 2x3, 5x2],

przy czym przestrzenie R3 i R2 rozważamy w bazach kanonicznych.

108 IV. PRZEKSZTAŁCENIA LINIOWE

Zadanie 70. Przekształcenie liniowe f : R3 → R2 dane jest wzorem:

f([x1, x2, x3]) = [5x1 + x2 + x3,−x1 − x2 + 4x3].

Znaleźć macierz przekształcenia f jeśli bazy odpowiednio przestrzeni R3 i R2 są równe:(a) ([2,−1, 0], [1, 3, 2], [0, 4, 1]) oraz ([1, 1], [1, 0]),(b) ([3, 1, 1], [5, 1, 6], [4,−1, 2]) oraz ([2, 3], [1, 3]),(c) ([1, 0, 1], [0, 1, 1], [1, 1, 0]) oraz ([3, 1], [−1,−1]).

Zadanie 71. Znaleźć macierz przejścia od bazy B do bazy C przestrzeni liniowejR3 jeśli:

(a) B = ([1, 2, 3], [1, 3, 4], [1, 5, 7]), C = ([2, 3, 4], [4, 4, 5], [6, 3, 4]),(b) B = ([5, 2, 4], [3, 1, 1], [5, 1, 2]), C = ([5, 3, 6], [6, 1, 0], [5, 2, 4]),(c) B = ([1, 1, 1], [4, 3, 5], [5, 5, 4]), C = ([6, 5, 7], [9, 9, 8], [9, 8, 9]).

Zadanie 72. Wyznaczyć wartości własne i wektory własne endomorfizmu f prze-strzeni liniowej R2 określonego wzorem:

(a) f([x1, x2]) = [3x1 − 9x2, x1 − 3x2],(b) f([x1, x2]) = [7x1 − x2, 9x1 + x2],(c) f([x1, x2]) = [x1 + 5x2, x1 + 5x2].

Zadanie 73. Obliczyć n-tą potęgę następujących macierzy:

(a)[7 −86 −7

](b)

[4 31 6

](c)

[3 2−1 6

](d)

[5 11 5

].

Skorowidz

aksjomat Dedekinda, 14argument liczby zespolonej, 24

baza przestrzeni liniowej, 32kanoniczna, 32uporządkowana, 32

ciało, 29

dopełnienie minora, 58algebraiczne, 59

forma kwadratowa, 89dodatnio (ujemnie) określona, 90

funkcja, 4różnowartościowa, 4

grupa, 27

inwersja, 8

kombinacja, 10kombinacja liniowa wektorów, 31kres górny (dolny) zbioru, 15kryterium Sylvestera, 93

macierz, 45diagonalna, 49elementarna, 80jednostkowa, 49kwadratowa, 48przejścia, 103przekształcenia liniowego, 102symetryczna, 69transponowana, 46trójkątna, 49

macierzepodobne, 104równoważne, 80

minor, 58moduł liczby zespolonej, 24

nierówność Bernoulliego, 6

permutacja, 7przekształcenia elementarne macierzy, 80przekształcenie liniowe, 99przestrzeń liniowa, 29

schemat Sarrusa, 52skalar, 29

trójkąt Pascala, 9twierdzenie

Cauchy’ego (o wyznacznikach), 64Laplace’a, 63zasadnicze arytmetyki, 18

wartość bezwzględna, 16wartość własna, 104wektor, 29

własny, 104wielomian

charakterystyczny, 104charakterystyczny endomorfizmu, 105

współczynniki Newtona, 9współrzędna wektora w bazie, 33wykres funkcji, 4wymiar przestrzeni liniowej, 32wyznacznik macierzy, 51wzór

dwumienny Newtona, 11Laplace’a, 63

zasada indukcji matematycznej, 5zasada minimum, 4zbiór

liniowo niezależny, 31

109

110 SKOROWIDZ

liniowo zależny, 31

Bibliografia

[1] A. Białynicki-Birula, Algebra, PWN, Warszawa, 1976.[2] A. Białynicki-Birula, Algebra liniowa z geometrią, PWN, Warszawa, 1976.[3] A. Błaszczyk, S. Turek, Wstęp do matematyki z elementami zastosowania w ekonomii, WSB

Dąbrowa Górnicza, 2000?.[4] B. Gleichgewicht, Algebra, PWN, Warszawa, 1975.[5] L. Jeśmianowicz, J. Łoś Zbiór zadań z algebry, PWN, Warszawa, 1966.[6] A. Mostowski, M. Stark Zarys algebry wyższej, PWN, Warszawa, 1963.[7] A. Mostowski, M. Stark Algebra liniowa, PWN, Warszawa, 1977.[8] J. Rutkowski, Algebra liniowa w zadaniach, PWN, Warszawa, 2008.[9] D. Witczyńska, K. Witczyński, Wybrane zagadnienia z algbery liniowej i geometrii, Oficyna Wy-

dawnicza Politechniki Warszawskiej, Warszawa, 2001.

111