14.numericka matematika a amatematicka statistika

179
Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ NUMERICKÁ MATEMATIKA A MATEMATICKÁ ŠTATISTIKA Stavebná fakulta Doc.Ing. Roman Vodička, PhD. RNDr. Pavol Purcz, PhD.

Upload: tranminh

Post on 02-Feb-2017

290 views

Category:

Documents


10 download

TRANSCRIPT

Page 1: 14.Numericka matematika a amatematicka statistika

Moderné vzdelávanie pre vedomostnú spoločnosťProjekt je spolufinancovaný zo zdrojov EÚ

NUMERICKÁ MATEMATIKAA MATEMATICKÁ ŠTATISTIKA

Stavebná fakulta

Doc.Ing. Roman Vodička, PhD.RNDr. PavolPurcz, PhD.

Page 2: 14.Numericka matematika a amatematicka statistika

Táto publikácia vznikla za finančnej podpory z Európskeho sociálneho fondu v rámci Operačného programu VZDELÁVANIE.

Prioritná os 1 Reforma vzdelávania a odbornej prípravy.Opatrenie 1.2 Vysoké školy a výskum a vývoj ako motory rozvoja vedomostnej spoločnosti.

Názov projektu: Balík doplnkov pre ďalšiu reformu vzdelávania na TUKEITMS 26110230093

NÁZOV: Numerická matematika a matematická štatistikaAUTORI: Vodička Roman, Purcz PavolVYDAVATEĽ: Technická univerzita v KošiciachROK: 2015VYDANIE: prvéNÁKLAD: 50 ksROZSAH: 172 stránISBN: 978-80-553-2040-3Rukopis neprešiel jazykovou úpravou.Za odbornú a obsahovú stránku zodpovedajú autori.

Page 3: 14.Numericka matematika a amatematicka statistika

Moderné vzdelávanie pre vedomostnú spoločnosťProjekt je spolufinancovaný zo zdrojov EÚ

NUMERICKÁ MATEMATIKAA MATEMATICKÁ ŠTATISTIKA

Stavebná fakulta

Doc.Ing. Roman Vodička, PhD.RNDr. PavolPurcz, PhD.

Page 4: 14.Numericka matematika a amatematicka statistika

Úvod

Poslanie

Poskytnúť teoretické poznatky potrebné v štúdiu odborných predmetov a aplikovať získané vedomosti na riešenie technicky orientovaných úloh s použitímmetód numerickej matematiky a matematickej štatistiky.

Obsah a ciele

Cieľom publikácie je oboznámiť študentov s potrebným matematickým aparátom využívaným v numerickej matematike (NM) a v matematickej štatistike(MŠ). V každej kapitole sú uvedené definície pojmov a ich vlastnosti, potrebné na riešenie úloh. Publikácia obsahuje definície všetkých potrebných pojmova potrebné matematické vety a tvrdenia,z ktorých niektoré sú ajdokázané v rámciriešených príkladov.Publikácia ďalejobsahuje riešené príklady ajúlohy na samostatné riešenie s výsledkamipodľa nasledujúceho obsahu.

1. NM — Lineárne a nelineárne rovnice

2. NM — Interpolácia a aproximácia

3. NM — Diferenciálne rovnice

4. MŠ — Teória pravdepodobnosti

5. MŠ — Popisná štatistika

6. MŠ — Odhady a hypotézy

7. MŠ — Korelácia a regresia

Prerekvizičné znalosti

Matematika I. (P. Purcz, R. Vodička, TU Košice, 2012, ISBN 978-80-553-1079-4)Matematika II. (P. Purcz, R. Vodička, TU Košice, 2012, ISBN 978-80-553-1081-7)

Úvod – 2

Page 5: 14.Numericka matematika a amatematicka statistika

Moderné vzdelávanie pre vedomostnú spoločnosťProjekt je spolufinancovaný zo zdrojov EÚ

NUMERICKÁ MATEMATIKAA MATEMATICKÁ ŠTATISTIKA

Stavebná fakulta

Doc.Ing. Roman Vodička, PhD.RNDr. Pavol Purcz, PhD.

Page 6: 14.Numericka matematika a amatematicka statistika

Táto publikácia vznikla za finančnej podpory z Európskeho sociálneho fondu v rámci Operačného programu VZDELÁVANIE.

Prioritná os 1 Reforma vzdelávania a odbornej prípravy.Opatrenie 1.2 Vysoké školy a výskum a vývoj ako motory rozvoja vedomostnej spoločnosti.

Názov projektu: Balík doplnkov pre ďalšiu reformu vzdelávania na TUKEITMS 26110230093

NÁZOV: Numerická matematika a matematická štatistikaAUTORI: Vodička Roman, Purcz PavolVYDAVATEĽ: Technická univerzita v KošiciachROK: 2015VYDANIE: prvéNÁKLAD: 50 ksROZSAH: 172 stránISBN: 978-80-553-2040-3

Rukopis neprešiel jazykovou úpravou.Za odbornú a obsahovú stránku zodpovedajú autori.

Page 7: 14.Numericka matematika a amatematicka statistika

Moderné vzdelávanie pre vedomostnú spoločnosťProjekt je spolufinancovaný zo zdrojov EÚ

NUMERICKÁ MATEMATIKAA MATEMATICKÁ ŠTATISTIKA

Stavebná fakulta

Doc.Ing. Roman Vodička, PhD.RNDr. Pavol Purcz, PhD.

Page 8: 14.Numericka matematika a amatematicka statistika

Úvod

Poslanie

Poskytnúť teoretické poznatky potrebné v štúdiu odborných predmetov a aplikovať získané vedomosti na riešenie technicky orientovaných úloh s použitímmetód numerickej matematiky a matematickej štatistiky.

Obsah a ciele

Cieľom publikácie je oboznámiť študentov s potrebným matematickým aparátom využívaným v numerickej matematike (NM) a v matematickej štatistike(MŠ). V každej kapitole sú uvedené definície pojmov a ich vlastnosti, potrebné na riešenie úloh. Publikácia obsahuje definície všetkých potrebných pojmova potrebné matematické vety a tvrdenia, z ktorých niektoré sú aj dokázané v rámci riešených príkladov. Publikácia ďalej obsahuje riešené príklady ajúlohy na samostatné riešenie s výsledkami podľa nasledujúceho obsahu.

1. NM — Lineárne a nelineárne rovnice

2. NM — Interpolácia a aproximácia

3. NM — Diferenciálne rovnice

4. MŠ — Teória pravdepodobnosti

5. MŠ — Popisná štatistika

6. MŠ — Odhady a hypotézy

7. MŠ — Korelácia a regresia

Prerekvizičné znalosti

Matematika I. (P. Purcz, R. Vodička, TU Košice, 2012, ISBN 978-80-553-1079-4)Matematika II. (P. Purcz, R. Vodička, TU Košice, 2012, ISBN 978-80-553-1081-7)

Úvod – 2

Page 9: 14.Numericka matematika a amatematicka statistika

Kapitola 1. (Lineárne a nelineárne rovnice)

Poslanie

Nájsť približné riešenie rôznych typov rovníc a ich sústav

Ciele

1. Oboznámiť študentov s niektorými numerickými metódami riešenia rovnice f(x) = 0.

2. Naučiť študentov približne riešiť sústavy lineárnych rovníc pomocou matíc a jednoduchých iteračných metód.

3. Využiť minimalizáciu kvadratických funkcionálov na riešenie sústav lineárnych rovníc.

4. Naučiť študentov metódy na približné riešenie sústav nelineárnych rovníc.

Prerekvizičné znalosti

matice; sústavy lineárnych rovníc; funkcie; derivácia a jej vlastnosti; minimum funkcie

Úvod

Cieľom tejto kapitoly je formulovať a ukázať metodiku niektorých základných úloh numerickej matematiky pri riešení rôznych typov algebraických rovníc.Začneme s nelineárnymi rovnicami typu f(x) = 0, pre ktoré ukážeme dve základné metódy. Pravda existujú aj iné, ktoré sa dajú nájsť v literatúre. Vďalšej časti sa budeme venovať sústavám rovníc. Najprv si ukážeme metódy na riešenie sústav lineárnych rovníc. Pre ne spomenieme dve skupiny metód.Jedna skupina je založená na úprave sústavy na jednoduchý iteračný vzorec, druhá zasa na tom, že riešenie istého typu sústav lineárnych rovníc je určenéminimom vhodného kvadratického funkcionálu. Metódy tohto typu sú v súčasnosti veľmi využívané v rôznych komerčných softvéroch, ktoré využívajú ajstavební inžinieri. Na záver kapitoly si predvedieme aj metódy na riešenie sústav nelineárnych rovníc.

Kapitola 1. (Lineárne a nelineárne rovnice) – 1

Page 10: 14.Numericka matematika a amatematicka statistika

Lineárne a nelineárne rovnice – Numerické metódy riešenia rovnice f(x)=0

Mnohé nelineárne rovnice sa nedajú riešiť presne, preto potrebujeme metódy, ktoré umožnia nájsť približné riešenie s ľubovoľnou presnosťou

V prvej časti sa teda zoznámime s s niektorými numerickými metódami riešenia rovnice f(x) = 0. Najprv ukážeme najprv ako sa robí tzv. separáciakoreňov a potom neskôr sa zoznámime s niektorými konkrétnymi postupmi na výpočet koreňa rovnice s jednou neznámou.

Koreňom rovnice f(x) = 0 v obore reálnych čísel rozumieme také reálne číslo x, pre ktoré je f(x) = 0. Predpokladáme, že f je spojitá funkcia. Preniektoré konkrétne typy rovníc sú známe matematické vzorce a postupy, ktoré umožňujú nájsť presne jeden alebo aj všetky ich korene. Vo všeobecnostito však neplatí a tak pre väčšinu úloh dokážeme nájsť riešenie len približne, t.j. nájsť približnú hodnotu koreňa x. Takúto hodnotu nazývame inak ajaproximáciou daného koreňa.

Pri výpočte koreňov rovnice f(x) = 0 postupujeme takto:

• metódami separácie určíme interval, v ktorom leží práve jeden reálny koreň,

• vhodnou numerickou metódou vypočítame z tohto intervalu približnú hodnotu tohto koreňa s požadovanou presnosťou.

Separáciu koreňa môžeme robiť dvojako. Prvý spôsob je grafická metóda. Rovnicu f(x) = 0 upravíme na tvar g(x) = h(x) tak, že ľahko dokážemenačrtnúť grafy oboch funkcií, g(x) aj h(x). X-ové súradnice vzniknutých priesečníkov predstavujú hľadané riešenia. Na základe uvedenej skutočnostivieme potom určiť jednotlivé intervaly, v ktorých leží už len jediný koreň.

Príklad 1.1 Separujme korene rovnice x− sinx− π4.

Riešenie. Danú rovnicu upravíme na tvar x = sinx + π4a zostrojíme grafy oboch funkcií (pozri Obr.1.1). Zároveň z tohto obrázka ľahko vyčítame, že

daná rovnica má práve jeden reálny koreň, ktorý leží niekde v intervale < 0;π > .

Príklad 1.2 Separujme korene rovnice ex − x− 2 = 0.

Riešenie. Rovnicu upravíme na tvar expx = x+ 2 a znovu zostrojíme grafy oboch funkcií (pozri Obr.1.2). Podobne, ako v predchádzajúcom príklade ajteraz ľahko vidíme, že daná rovnica má tiež len jeden reálny koreň, ktorý leží niekde v intervale < 1; 2 > .

Okrem toho môžeme koreň separovať vyšetrením časti priebehu funkcie. Najprv pomocou tabuľky hodnôt funkcie f(x) nájdeme také hodnoty a a b tak,že f(a).f(b) < 0. Ak v < a; b > naviac f ′(x) nemení znamienko, tak, že môžeme povedať, že v < a; b > leží jediný reálny koreň danej rovnice, lebo

Kapitola 1. (Lineárne a nelineárne rovnice) – 2

Page 11: 14.Numericka matematika a amatematicka statistika

Obr. 1.1: Grafy funkcií y = x a y = sinx+ π4.

Obr. 1.2: Grafy funkcií y = x+ 2 a y = ex.

funkcia je monotónna. Ak tomu tak nie je, potom pomocou tabuľky tento interval zužujeme, až kým podmienka o nemennosti znamienka f ′(x) nebudeplatiť, t.j. nájdeme nové hodnoty c a d tak, že < c; d >⊂< a, b > a f(c).f(d) < 0 a f ′(x) už nemení znamienko na < c; d >.

Podobnú vlastnosť pre separáciu koreňa môžeme formulovať aj vo vzťahu o krivosti (t.j. konvexnosti a konkávnosti) a druhej derivácie funkcie f .

Kapitola 1. (Lineárne a nelineárne rovnice) – 3

Page 12: 14.Numericka matematika a amatematicka statistika

Príklad 1.3 Separujme korene rovnice x3 + x− 1 = 0.

Riešenie. Zostrojíme Tabuľku 1.1 pre niekoľko funkčných hodnôt a porovnáme ich znamienka. Vidíme, že v intervale < 0; 1 > leží určite aspoň jeden

Tabuľka 1.1:x -1 0 1

f(x) -3 -1 1

reálny koreň. Ďalej, f ′(x) = 3x2 + 1, z čoho jasne vyplýva, že f ′(x) už nemení znamienko na < 0; 1 > a tak v tomto intervale sa nachádza len jedinýkoreň.

Príklad 1.4 Separujme kladný koreň rovnice −x4 + 2x2 + 1 = 0.

Riešenie.

Tabuľka 1.2:x 0 1

f(x) 1 -1

Zostrojíme Tabuľku 1.2 pre niekoľko funkčných hodnôt a porovnáme ich znamienka. Vidíme, že v intervale < 0; 1 > leží určite aspoň jeden reálny koreň.

Tabuľka 1.3:x 0 0,5 1

f(x) 1 1,25 -1

Ďalej, f ′(x) = −16x3 + 4x = 4x(1− 4x2). Nakoľko je jasné, že f ′(0, 5) = 0 a tak f ′(x) mení znamienko na < 0; 1 >, zostrojíme ďalšiu Tabuľku 1.3,ktorá poukazuje na fakt, že aj v zúženom intervale < 1

2; 1 > leží ten istý koreň danej rovnice a na tomto intervale už f ′(x) nemení znamienko.

Poznamenajme, že existuje aj viacero ďalších metód zaoberajúcich sa problémom separácie koreňov, o ktorých sa čitateľ môže viac dozvedieť z priloženéhozoznamu literatúry.

Ak už poznáme interval, kde koreň leží, môžeme ho nájsť so zvolenou presnosťou. Ukážeme si dve numerické metódy na riešenie rovnice f(x) = 0.

Kapitola 1. (Lineárne a nelineárne rovnice) – 4

Page 13: 14.Numericka matematika a amatematicka statistika

V numerickej matematike nepočítame koreň úplne presne, ale s určitou vopred požadovanou presnosťou. Nech xk+1 a xk sú dve za sebou vypočítanépriblíženia koreňa x. Potom xk+1 nazývame približným riešením rovnice f(x) = 0 s presnosťou ε ak platí: | xk+1 − xk |< ε. Existuje viacero iteračnýchmetód, ktoré vyžadujú splnenie rôznych vstupných predpokladov a v závislosti od charakteru zadanej úlohy majú aj odlišnú rýchlosť konvergencie, t.j.potrebné množstvo iteračných krokov na dosiahnutie konečného riešenia spĺňajúceho danú presnosť.

Prvou a veľmi jednoduchou metódou je metóda polovičného delenia intervalu. Jednoduchosť metódy spočíva v tom, že na vstupe nevyžaduje žiadnedodatočné podmienky okrem základnej, t.j. aby sme mali k dispozícii také hodnoty a a b tak, že f(a).f(b) < 0 a vedeli zaručiť, že v intervale < a; b >leží jediný reálny koreň danej úlohy typu f(x) = 0. Postup riešenia je potom nasledovný:

A1. vypočítame hodnotu f(x)v polovici intervalu< a; b >, t.j. f(c), kde c = a+b2

B1. ak f(c) = 0, potom číslo c je presným riešením rovnice f(x) = 0. V opačnom prípade interval < a; b > nahradíme jeho pravou alebo ľavoupolovicou, v závislosti od toho, v ktorej polovici leží hľadané riešenie. Ak f(a).f(c) < 0 [f(a).f(c) > 0], koreň rovnice leží v ľavej [pravej] poloviciintervalu < a; b >. Prepísaním pravej [ľavej] hranice intervalu, t.j. položením b = c [a = c] dostaneme nový interval < a; b > polovičnej dĺžky

C1. ak | b − a |< ε, za riešenie môžme považovať napr. posledne vypočítanú hodnotu c, v opačnom prípade sa vrátime na bod A1 a celý postupopakujeme znovu.

Príklad 1.5 Metódou polovičného delenia s presnosťou ε = 0, 0001 určte záporný koreň rovnice x4 + 2x2 − 25 = 0.

Riešenie.

Tabuľka 1.4:x 0 -1 -2 -3

f(x) -25 -26 -13 -50

Postupným vypočítaním viacerých funkčných hodnôt (Tabuľka 1.4) vidíme, že hľadané riešenie sa nachádza v intervale < −3;−2 >. Stredom tohtointervalu je číslo −2, 5 a pretože f(−3).f(−2, 5) > 0, hľadané riešenie sa nachádza v novom intervale < −2, 5;−2 >. Stredom tohto nového intervaluje číslo −2, 25. Nakoľko f(−2, 5).f(−2, 25) < 0, koreň rovnice treba hľadať v ďalšom intervale < −2, 5;−2, 25 >, atď. Takto pokračujeme ďalej, ažv štrnástom kroku (Tabuľka 1.5) dostaneme interval < −2, 33386;−2, 33380 >. Pretože dĺžka tohto intervalu je rovná číslu 0, 00006 môžme hodnotu−2, 3338 považovať za hľadané riešenie.

Kapitola 1. (Lineárne a nelineárne rovnice) – 5

Page 14: 14.Numericka matematika a amatematicka statistika

Tabuľka 1.5:i a b0 -3 -21 -2,5 -22 -2,5 -2,253 -2,375 -2,254 -2,375 -2,31255 -2,34375 -2,31256 -2,34375 -2,328137 -2,33594 -2,328138 -2,33594 -2,332039 -2,33398 -2,3320310 -2,33398 -2,3330111 -2,33398 -2,3335012 -2,33398 -2,3337413 -2,33386 -2,3337414 -2,33386 -2,33380

Ďalšou metódou je Newtonova metóda známa aj ako metóda dotyčníc.

Oproti predchádzajúcej metóde (polovičného delenia intervalu) je táto metóda oveľa rýchlejšia, ale vyžaduje na vstupe splnenie viacerých podmienok.Okrem základnej podmienky, t.j. existencie takých hodnôt a a b tak, že f(a).f(b) < 0 a vedeli zaručiť, že v intervale < a; b > leží jediný reálny koreňdanej úlohy typu f(x) = 0, musí ešte naviac platiť, že f ′′(x) nemení znamienko na < a; b > (t.j. f(x) je buď len konvexná alebo len konkávna na< a; b >).

Riešenie môžme začať z ľubovoľného bodu ξ ∈< a; b >, pre ktorý platí: f(ξ).f ′′(ξ) > 0. Postup riešenia je potom nasledovný:

A2. položíme x0 = ξ

B2. ďalej počítame postupne xk+1 = xk− f(xk)f ′(xk)

, pre k = 0, 1, 2, .... Dá sa ukázať, že postupnosť hodnôt x0, x1, x2, ... konverguje ku presnému riešeniux rovnice f(x) = 0. Geometrické znázornenie tohto postupu v prípade určovania 3 bodov x0, x1, x2, x3 je uvedené na obrázku Obr.1.3.

C2. ak je splnená podmienka | xk+1 − xk |< ε pre najmenšie k ∈ N potom príslušnú hodnotu xk+1 môžme považovať za riešenie danej úlohy, vopačnom prípade sa vrátime na bod A2 a celý postup opakujeme znovu.

Kapitola 1. (Lineárne a nelineárne rovnice) – 6

Page 15: 14.Numericka matematika a amatematicka statistika

Obr. 1.3: Princíp aproximácie koreňa Newtonovou metódou dotyčníc.

Z podmienok uvedených pre túto metódu vyplýva, že existujú 4 možnosti pre tvar funkcie na intervale < a; b >. Podmienka f(ξ).f ′′(ξ) > 0 v prípade I.a II. je splnená, ak napr. ξ = a, v prípade III. a IV ak napr. ξ = b (pozri Obr.1.4).

Príklad 1.6 Newtonovou metódou s presnosťou ε = 0, 0001 určte záporný koreň rovnice x4 + 2x2 − 25 = 0.

Riešenie. Postupným vypočítaním viacerých funkčných hodnôt (Tabuľka 1.6) vidíme, že hľadané riešenie sa nachádza v intervale < −3;−2 >.

Tabuľka 1.6:x 0 -1 -2 -3

f(x) -25 -26 -13 -50

Keďže f ′′(x) = 12x2 > 0 na celom intervale < −3;−2 >, podmienka f(ξ).f ′′(ξ) > 0 je splnená napr. pre ξ = −3. Položíme teda x0 = −3 a podľabodu 2.) bude x1 = −3− f(−3)

f ′(−3) = −3− 50−106 = −2, 52983. Počítame podobne ďalšie hodnoty (Tabuľka 1.7) až do x5, pričom preverujeme po každom

Kapitola 1. (Lineárne a nelineárne rovnice) – 7

Page 16: 14.Numericka matematika a amatematicka statistika

Obr. 1.4: Grafy konvexných a konkávnych funkcií.

Tabuľka 1.7:x0 -3x1 -2,5283x2 -2,35583x3 -2,33416x4 -2,33384x5 -2,333839

kroku podmienku na zadanú presnosť, ktorá je splnená prvýkrát práve pre hodnotu x5, resp. teda platí:| x5−x4 |< ε, takže môžeme hodnotu −2, 333839považovať za hľadané riešenie.

Príklad 1.7 Nájdite približnú hodnotu kladného riešenia rovnice sinhx=2x s presnosťou ε=0,001.

Riešenie. Na začiatok si pripomeňme, že funkcia g(x)= sinhx je nepárna časť prirodzenej exponenciálnej funkcie definovaná vzťahom sinhx= ex−e−x

2.

Prvým krokom je separácia koreňa x. Grafickým spôsobom je koreň určený súradnicou x priesečníka grafov funkcií g(x) a h(x)=2x pre x>0, viď obr.1.5. Obrázok zodpovedá aj počtárskemu odhadu, keď e−x zanedbáme voči ex (pre x>2,3 je e−x<0,1) a vieme, že e2<8 a e2,5>10, teda x∈〈2; 2,5〉.

Kapitola 1. (Lineárne a nelineárne rovnice) – 8

Page 17: 14.Numericka matematika a amatematicka statistika

0

2

4

6

8

10

12

0 0.5 1 1.5 2 2.5 3

y

x

g(x)h(x)

Obr. 1.5: g(x) = sinh x a h(x) = 2x

Nájdime približné riešenie Newtonovou metódou. V intervale 〈2; 2,5〉 je evidentne práve jeden koreň, zodpovedá tomu aj kladná prvá a druhá deriváciafunkcie f(x)= sinhx − 2x: f ′(x)= coshx − 2, f ′′(x)= sinhx na tomto intervale (funkcia je rastúca a konvexná). Ako začiatočnú iteráciu zvolíme tenkrajný bod ξ intervalu separácie, v ktorom (f(ξ)·f ′′(ξ))>0 a teda f(ξ)>0 — podľa odhadu vieme, že to je ξ=2,5. A tak môžeme iterovať:

x(0) = 2,5, x(1) = 2,5− f(2,5)

f ′(2,5)= 2,5−1,05

4,13.= 2,24, |x(1)−x(0)| = 0,26 ≥ ε,

x(1) = 2,24, x(2) = 2,24− f(2,24)

f ′(2,24)= 2,24−0,163

2,75.= 2,181, |x(2)−x(1)| = 0,059 ≥ ε,

x(2) = 2,181, x(3) = 2,181− f(2,181)

f ′(2,181)= 2,181−0,0091

2,4840.= 2,1773, |x(3)−x(2)| = 0,0037 ≥ ε,

x(3) = 2,1773, x(4) = 2,1773− f(2,1773)

f ′(2,1773)= 2,1773−5× 10−5

2,4679.= 2,1773, |x(4)−x(3)| < 10−4 < ε,

x(4) = 2,1773, x.= x(4).

Približná hodnota kladného koreňa danej rovnice je x .=2,1773, s presnosťou ε. To že toto číslo naozaj vyjadruje odhad riešenia je vidieť aj v čitateliposledného iteračného vzorca, podľa ktorého f(2,1773)

.=5× 10−5, teda sinhx(4)

.=2x(4).

Kapitola 1. (Lineárne a nelineárne rovnice) – 9

Page 18: 14.Numericka matematika a amatematicka statistika

Lineárne a nelineárne rovnice – Približné riešenie sústav lineárnych algebraických rovníc

Pri praktických výpočtoch, najmä na počítačoch, sa rozsiahle sústavy riešia najmä približnými metódami.

V lineárnej algebre sme sa naučili hľadať presné riešenia sústav lineárnych rovníc ako aj zodpovedať otázku ich riešiteľnosti. V niektorých častiachnumerickej matematiky, napr. pri riešení parciálnych diferenciálnych rovníc (ale aj iných, bežných úloh technickej praxe) sa stretávame s potrebou riešeniasystémov lineárnych rovníc so zaručenou jednoznačnosťou hľadaného riešenia. Vtedy je možné uplatniť o.i. aj viaceré dobre známe jednoduché a pomernerýchle numerické postupy, ktoré síce poskytnú len približné riešenie s určitou chybou, ktoré je ale postačujúce v daných aplikáciách. V tejto časti siukážeme dva takéto algoritmy, ktoré vychádzajú z jednej spoločnej platformy.

Nech je daná sústava n lineárnych rovníc s n neznámych tvaru

a11x1 + a12x2 + . . . + a1nxn = b1,a21x1 + a22x2 + . . . + a2nxn = b2,...

...... ,

an1x1 + an2x2 + . . . + annxn = bn.

(1)

V maticovom tvare je túto sústavu možné potom zapísať nasledovným spôsobom:

A · x = b,

pričom

A =

a11 a12 . . . a1na21 a22 . . . a2n...

......

...an1 an2 . . . ann

, x =

x1x2...xn

, b =

b1b2...bn

.

Z lineárnej algebry vieme, že daná sústava má jednoznačné riešenie, ak matica A = (aij) je regulárna.

Zaveďme si teraz niektoré pojmy, ktoré budeme používať. Štvorcovú maticu A = (aij) rádu n nazývame diagonálne dominantnou, ak platí:

|aii| >n∑

j=1; j 6=i

|aij|, alebo |aii| >n∑

j=1; j 6=i

|aji| pre všetky i = 1, 2, ..., n.

Kapitola 1. (Lineárne a nelineárne rovnice) – 10

Page 19: 14.Numericka matematika a amatematicka statistika

Pod riadkovou, resp. stĺpcovou normou štvorcovej matice A = (aij) rádu n rozumieme číslo:

‖A‖m = maxi=1,2,...,n

n∑j

|aij|, resp. ‖A‖e = maxj=1,2,...,n

n∑i

|aij|.

Pod Frobeniovou normou matice A = (aij) rádu n rozumieme číslo:

‖A‖k =

√√√√ n∑i=1

n∑j=1

a2ij.

Ukážme si teraz algoritmy dvoch metód. Prvou je Jacobiho iteračná metóda. Pri aplikácii tejto metódy vychádzame zo štandardného maticového tvarusústavy Ax = b. Predpokladajme, že sústava má všetky prvky na hlavnej diagonále nenulové. Potom môžme každú rovnicu upraviť na nasledovný tvar:

xi =1

aii(bi −

n∑j=1; j 6=i

aijxj); i = 1, 2, ..., n.

Vo všeobecnosti vlastne prevádzame sústavu tvaru Ax = b na tvar x = Ux+V a z tohto tvaru potom vytvoríme postupnosť iteračných vzťahov v tvare:

x(k+1) = Ux(k) + V; k = 0, 1, 2, ...

pričom x(0) je ľubovoľná počiatočná aproximácia. Ak takto vytvorená postupnosť x(k), k = 0, 1, 2, ... konverguje, hovoríme o konvergentnom iteračnomprocese, resp. o konvergentnej metóde. Pritom platí:

• Ak postupnosť x(k), k = 0, 1, 2, ... konverguje, konverguje k riešeniu danej úlohy.

• Ak niektorá z noriem matice U (riadková, stĺpcová alebo Frobeniova) je menšia než jedna, potom postupnosť x(k), k = 0, 1, 2, ... konvergujek jedinému riešeniu danej úlohy x(∗) nezávisle na voľbe počiatočnej aproximácie x(0); t.j. limk→∞ x

(k)i = x

(∗)i pre všetky i = 1, 2, ..., n.

• Ak je matica sústavy rovníc A v diagonálne dominantnom tvare, Jacobiho metóda konverguje pre ľubovoľnú voľbu počiatočnej aproximácie x(0).

• Akákoľvek sústava lineárnych rovníc s jednoznačným riešením sa ekvivalentnými úpravami dá previesť na sústavu s diagonálne dominantnou maticou.

Poznamenajme pritom, že ako počiatočnú aproximáciu x(0) volíme väčšinou nulový vektor (0, 0, ..., 0)>. Je dobré tiež spomenúť, že existujú aj inépodmienky pre konvergenciu riešenia tejto úlohy a nájdeme ich v citovanej literatúre. Keďže presné riešenie nepoznáme, používame ako kritérium

Kapitola 1. (Lineárne a nelineárne rovnice) – 11

Page 20: 14.Numericka matematika a amatematicka statistika

zastavenia iteračného postupu podmienku ‖x(k+1) − x(k)‖ < ε. Teda akonáhle pri iteračnom procese zistíme, že podmienka ‖x(k+1)i − x(k)i ‖ < ε platí

súčasne pre všetky i = 1, 2, ..., n; kde ε je dopredu zadaná presnosť, je potom aj ‖x(k+1) − x(∗)‖ < ε ‖U‖1−‖U‖ a hodnotu x(k+1) možno považovať za

dostatočne presnú aproximáciu presného riešenia x(∗).

Pre praktický výpočet používame potom plný, neskrátený zápis systému n iteračných rovníc:

x(k+1)1 = 1

a11(b1 −

∑nj=1; j 6=1 a1jx

(k)j ) ,

x(k+1)2 = 1

a22(b2 −

∑nj=1; j 6=2 a2jx

(k)j ) ,

...x(k+1)n = 1

ann(bn −

∑nj=1; j 6=n anjx

(k)j ) .

(2)

Príklad 1.8 Riešme Jacobiho metódou sústavu s presnosťou ε = 0, 001.

5x1 + 0, 12x2 + 0, 09x3 = 100, 08x1 + 4x2 − 0, 12x3 = 200, 18x1 − 0, 06x2 + 3x3 = −4, 5

.

Riešenie. Keďže daný systém spĺňa podmienku dominantnej diagonály, je zaručené, že iteračný proces bude konvergovať k presnému riešeniu úlohy.Sústavu upravíme teda na tvar:

x1 = 2 − 0, 024x2 − 0, 018x3x2 = 5 − 0, 02x1 + 0, 03x3x3 = −1, 5 − 0, 06x1 + 0, 02x2

.

Zvolíme

x(0) =

000

Potom

x(1) =

25−1, 5

, x(2) =

1, 9074, 915−1, 52

, x(3) =

1, 90944, 91626−1, 52612

, x(4) =

1, 90934, 91633−1, 52624

.

Keďže pre iterácie x(3) a x(4) je splnená podmienka pre presnosť riešenia, môžme vektor riešení x(4) považovať za konečné riešenie danej úlohy.

Kapitola 1. (Lineárne a nelineárne rovnice) – 12

Page 21: 14.Numericka matematika a amatematicka statistika

Druhou metódou je Gaussova-Seidelova iteračná metóda. Pri aplikácii tejto metódy vychádzame z toho istého tvaru sústavy ako pri Jacobiho metódeako aj jej maticového zápisu Ax = b. Na rozdiel od Jacobiho metódy pri výpočte každej novej aproximovanej zložky x(k+1)

i vektora x(k+1) používamevšetky najnovšie známe potrebné iné zložky, t.j. buď z vektora x(k+1) alebo z x(k) podľa predpisu:

x(k+1)i =

1

aii(bi −

i−1∑j=1

aijx(k+1)j −

n∑j=i+1

aijx(k)j ); i = 1, 2, ..., n; k = 0, 1, 2, ...

Pre voľbu vektora počiatočnej aproximácie ako aj pre podmienky konvergencie platia všetky poznatky uvedené pri popise Jacobiho metódy. Zdôraznimehlavne podmienku diagonálnej dominancie, ktorá postačuje ku konvergencii metódy pri ľubovoľnej voľbe počiatočnej iteráce x(0).

Príklad 1.9 Vyriešme Gaussova-Seidelovou metódou sústavu s presnosťou ε = 0, 05.

7x1 − 2x2 + x3 = 23x1 − 8x2 + 2x3 = −11x1 + 6x2 + 5x3 = −8

.

Riešenie. Keďže daný systém nespĺňa podmienku dominantnej diagonály, je potrebné ho upraviť na iný tvar, ktorý bude takejto podmienke vyhovovať,napr. pripočítaním druhej rovnice ku tretej. Dostaneme novú sústavu:

7x1 − 2x2 + x3 = 23x1 − 8x2 + 2x3 = −114x1 − 2x2 + 7x3 = −19

.

Táto sústava už spĺňa podmienku dominantnej diagonály a tak je zaručené, že iteračný proces bude konvergovať k presnému riešeniu úlohy.Pre výpočetpostupných aproximácií hľadaného riešenia pre k = 0, 1, 2, ... použijeme potom nasledovné rovnice:

x(k+1)1 = 2

7+ 2

7x(k)2 − 1

78x

(k)3

x2 = 118

+ 38x(k+1)1 + 1

4x(k)3

x3 = − 197− 4

7x(k+1)1 + 2

7x(k+1)2

.

Ako počiatočnú aproximáciu môžme zvoliť tentoraz napr. aj vektor tzv. absolútnych členov, t.j.:

x(0) =

27118

−197

Kapitola 1. (Lineárne a nelineárne rovnice) – 13

Page 22: 14.Numericka matematika a amatematicka statistika

Potom

x(1) =

1, 0663265311, 096301021−3, 010386297

, x(2) =

1, 0289983341, 008277801−3, 010386297

, x(3) =

1, 0043944280, 998096563−3, 003054941

.

Keďže pre iterácie x(2) a x(3) je splnená podmienka pre presnosť riešenia, môžeme vektor riešení x(3) považovať za konečné riešenie danej úlohy.

Príklad 1.10 Nájdite približné riešenie sústavy rovníc s presnosťou ε=0,01 pomocou Jacobiho metódy a porovnajte s riešením pomocou Gaussovej-Seidelovej metódy

2x1+7x2− x3 =−6,

6x1− x2+ x3 = 8,

5x1−2x2+4x3 = 11.

Riešenie. Pre zabezpečenie konvergencie metódy k presnému riešeniu je potrebné upraviť sústavu tak, aby jej matica bola riadkovo diagonálne dominantná.Upravme preto sústavu v maticovom zápise vymenením prvých dvoch riadkov a odčítaním druhého riadku od tretieho2 7 −1 −6

6 −1 1 8

5 −2 4 11

∼ 6 −1 1 8

2 7 −1 −6

−1 −1 3 3

6 > | − 1|+ |1|7 > |2|+ | − 1|

3 > | − 1|+ | − 1|,

čím je táto podmienka splnená. Vyjadíme z k-tej rovnice k-tu premennú a zapíšeme v iteračnom tvare pre Jacobiho metódu

x(n+1)1 =

1

6

(8 +x

(n)2 −x

(n)3

),

x(n+1)2 =

1

7

(−6−2x

(n)1 +x

(n)3

),

x(n+1)3 =

1

3

(3+ x

(n)1 +x

(n)2

).

Iterácie konvergujú k presnému riešeniu x pri akejkoľvek voľbe x(0), preto volíme nulovú začiatočnú iteráciu a iterujeme, kým nie je splnené kritérium

Kapitola 1. (Lineárne a nelineárne rovnice) – 14

Page 23: 14.Numericka matematika a amatematicka statistika

ukončenia iteračného procesu:

x(0) =

000

,

x(1) =

16(8 + 0− 0)

17(−6− 2·0 + 0)13(3 + 0 + 0)

.=

1,333−0,8571,000

, ‖x(1)−x(0)‖ =

∣∣∣∣∣∣ 1,333−0,8571,000

∣∣∣∣∣∣ = 1,333 ≥ ε

x(2) =

16(8− 0,857− 1,000)

17(−6− 2·1,333 + 1,000)13(3 + 1,333− 0,857)

.=

1,024−1,0951,159

, ‖x(2)−x(1)‖ =

∣∣∣∣∣∣ 0,309−0,2380,159

∣∣∣∣∣∣ = 0,309 ≥ ε

x(3) =

16(8− 1,095− 1,159)

17(−6− 2·1,024 + 1,159)13(3 + 1,024− 1,059)

.=

0,958−0,9840,955

, ‖x(3)−x(2)‖ =

∣∣∣∣∣∣−0,066

0,111−0,204

∣∣∣∣∣∣ = 0,204 ≥ ε,

x(4) =

16(8− 0,984− 0,955)

17(−6− 2·0,958 + 0,955)13(3 + 0,958− 0,984)

.=

1,010−0,9940,991

, ‖x(4)−x(3)‖ =

∣∣∣∣∣∣ 0,052−0,0100,036

∣∣∣∣∣∣ = 0,052 ≥ ε,

x(5) =

16(8− 0,994− 0,991)

17(−6− 2·1,010 + 0,991)13(3 + 1,010− 0,994)

.=

1,003−1,0041,000

, ‖x(5)−x(4)‖ =

∣∣∣∣∣∣−0,007−0,0100,009

∣∣∣∣∣∣ = 0,01 ≥ ε,

x(6) =

16(8− 1,004− 1,000)

17(−6− 2·1,003 + 1,000)13(3 + 1,003− 1,004)

.=

0,999−1,0011,000

, ‖x(6)−x(5)‖ =

∣∣∣∣∣∣−0,004

0,0030,000

∣∣∣∣∣∣ = 0,004 < ε.

V šiestej iterácii je konvergenčné kritérium splnené, teda xT.=(0,999 −1,001 1,000

)s presnosťou ε.

Pri použití Gaussovej-Seidelovej metódy je iteračný predpis daný vzťahmi

x(n+1)1 =

1

6

(8 +x

(n)2 −x(n)3

),

x(n+1)2 =

1

7

(−6−2x

(n+1)1 +x

(n)3

),

x(n+1)3 =

1

3

(3+ x

(n+1)1 +x

(n+1)2

),

Kapitola 1. (Lineárne a nelineárne rovnice) – 15

Page 24: 14.Numericka matematika a amatematicka statistika

a kritérium zastavenia výpočtu je splnené po menšom počte iterácií (s tým istým x(0))

x(0) =

000

, x(1) =

16(8 + 0− 0)

17(−6− 2·1,333 + 0)

13(3 + 1,333− 1,238)

.=

1,333−1,2381,032

, x(2) =

0,955−0,9830,991

, x(3) =

1,004−1,0021,001

, x(4) =

1,000−1,0001,000

, ‖x(4)−x(3)‖ < ε.

Lineárne a nelineárne rovnice – Gradientné metódy riešenia sústav lineárnych rovníc

Efektívny spôsob riešenia sústav rovníc so symetrickými maticami

V súčasnosti sa pri riešení istých druhov sústav lineárnych rovníc osvedčila metóda, ktorá je založená na nasledujúcej myšlienke. Ak máme danú kvadratickúfunkciu jednej reálnej premennej x f(x)=1

2a x2−b x, pričom predpokladáme kladné a a ľubovoľné číslo b, je minumum tejto funkcie riešením rovnice

a x=b. Pre n-ticu reálnych čísel x= (x1, x2, . . . , xn)> teda potrebujeme kvadratický funkcionál premennej x, ktorý je určený štvorcovou maticou A s nriadkami a stĺpcovým vektorom b tiež s n riadkami:

f(x)=1

2x>Ax−x>b. (1.1)

Pravda tak ako pri jednej premennej sme potrebovali a kladné, aj tu potrebujeme, aby matica A bola „kladná“ .

Príklad 1.11 Zistime podmienku pre maticu A, aby funkcionál f(x)=12x>Ax−x>b mal minimum a toto minimum bolo určené riešením rovnice Ax=b.

Riešenie. Pre x= (x1, x2, . . . , xn)> je nutná podmienka minima f v bode w ∂f(x)∂xk

=0 pre všetky k=1, 2, . . . , n. Keďže ∂xm∂xk

=1 pre k=m a inak to je 0,dostaneme pre každé k=1, 2, . . . , n

∂f(x)

∂xk=

∂xk

(1

2

n∑i=1

xi

(n∑i=1

Aijxj

)−

n∑i=1

xibi

)=

1

2

(n∑j=1

Akjxj +n∑i=1

xiAik

)− bk =

(1

2

(Ax + A>x

)− b

)k

.

Takže pre minimalizujúci bod w máme rovnicu1

2

(A + A>

)w = b.

Ak chceme, aby w bolo riešením sústavy Ax=b, matica A musí byť symetrická, teda A=A>.

Kapitola 1. (Lineárne a nelineárne rovnice) – 16

Page 25: 14.Numericka matematika a amatematicka statistika

Ak spočítame druhú deriváciu funkcie f pre každé k=1, 2, . . . , n a pre každé l=1, 2, . . . , n a pri uvažovanej symetrii matice A, dostaneme

∂2f(x)

∂xl∂xk=

∂xl

(1

2

(n∑j=1

Akjxj +n∑i=1

xiAik

))=

1

2(Akl + Alk) = Akl.

Matica A sústavy teda musí mať všetky hlavné subdeterminanty kladné, čo je podmienkou minima funkcie n premenných.

Symetrickú maticu nazývame pozitívne definitná, ak pre všetky nenulové x je súčin x>Ax kladný. Podmienkou pozitívnej definitnosti symetrickej matice,je podľa Sylvestrovho kritéria, aby všetky hlavné subdeterminanty boli kladné, teda ak platí:

x>Ax > 0 pre všetky x 6= 0⇔ A11 > 0 ∧∣∣∣∣A11 A12

A21 A22

∣∣∣∣ > 0 ∧

∣∣∣∣∣∣A11 A12 A13

A21 A22 A23

A31 A32 A33

∣∣∣∣∣∣ > 0 ∧ · · · ∧

∣∣∣∣∣∣∣∣∣A11 A12 · · · A1n

A21 A22 · · · A2n...

... . . . ...An1 An2 · · · Ann

∣∣∣∣∣∣∣∣∣ > 0 (1.2)

Pre symetrickú pozitívne definitnú maticu A nadobúda kvadratický funkcionál (1.1) minimum pre vektor x, ktorý je riešením sústavy lineárnych rovnícAx=b pri ľubovoľnom vektore b.

Príklad 1.12 Overme pozitívnu definitnosť symetrickej matice A=(

4 1 01 4 10 1 4

)z definície aj podľa Sylvestrovho kritéria.

Riešenie. Praktickejšie je použiť kritérium. Podľa neho A11=4>0 a ďalšie podmienky dostaneme výpočtom determinantov:∣∣∣∣4 11 4

∣∣∣∣ = 16− 1 = 15 > 0,

∣∣∣∣∣∣4 1 01 4 10 1 4

∣∣∣∣∣∣ = 64− 4− 4 = 56 > 0.

Všetky tri determinaty sú kladné, matica je symetrická pozitívne definitná.

Pri použití definície musíme upravovať výrazy, keď x= (x1, x2, x3)>:

x>Ax =(x1 x2 x3

)4 1 01 4 10 1 4

x1x2x3

=(x1 x2 x3

) 4x1 + x2x1 + 4x2 + x3x2 + 4x3

= 4x21 + 2x1x2 + 4x22 + 2x2x3 + 4x23 = 3x21 + (x1 + x2)

2 + 2x22 + (x2 + x3)2 + 3x23 ≥ 0.

Kapitola 1. (Lineárne a nelineárne rovnice) – 17

Page 26: 14.Numericka matematika a amatematicka statistika

Nerovnica platí, pretože v poslednom výraze sčítame nezáporné členy (druhé mocniny). Zistime ešte, kedy nastane rovnosť. To bude len v prípade, keďvšetky sčítance sú nulové, teda 3x21=0, (x1 + x2)

2 =0, 2x22=0, (x2 + x3)2 =0, 3x23=0. A to je možné iba ak x1=0, x2=0 aj x3=0 a vektor x je nulový.

To dokazuje pozitívnu definitnosť, pretože pre všetky nenulové x je výraz x>Ax kladný.

Hľadajme minimum funckionálu f (1.1) s použitím jednokrokovej iteračnej metódy, kde budeme iteráciu (k+1) hľadať v tvare x=x(k) + αd(k), kde d(k)

je niektorý, vopred určený smer, v ktorom hľadáme minimum f. V takom prípade jedinou neznámou je číslo α a jeho hodnotu, ktorou minimalizujeme foznačíme α(k) a hodnotu x zasa x(k+1), teda

f(x(k+1)) = f(x(k) + α(k)d(k)) = minα

f(x(k) + αd(k)). (1.3)

Fukncionál f má minimum, keď A je symetrická pozitívne definitná matica, takže aj pri nájdení stacionárneho bodu iba vzhľadom k α to bude pre danúfunkciu f(α)=f(x(k) + αd(k)) bod minima. Pre hľadaný stacionárny bod platí

0 =df(α)

dα=

d

(1

2

(x(k) + αd(k)

)>A(x(k) + αd(k)

)−(x(k) + αd(k)

)>b

)= α(d(k))>Ad(k)+(d(k))>Ax(k)−(d(k))>b = α(d(k))>Ad(k)−(d(k))>r(k),

(1.4)kde sme v poslednom výraze použili rezíduum r(k) pre k-tú iteráciu. Riešenie α(k) tejto rovnice je

α(k) =(d(k))>r(k)

(d(k))>Ad(k), pričom definujeme r(k) = b− Ax(k) (1.5)

Príklad 1.13 Nájdime v akom vzťahu je rezíduum k funkcionálu f.

Riešenie. Podľa príkladu 1.11 vieme, že pre symetrickú maticu A platí

∂f(x(k))

∂xi=(Ax(k) − b

)i

= −r(k)i ,

čo, ak to napíšeme pomocou vektorov, znie grad f(x(k))= − r(k). Keďže gradient určuje smer, v ktorom sa hodnoty funkcie najviac zväčšujú, rezíduumurčuje smer najväčšieho spádu funkcie.

Otázkou ostáva, ako voliť smery d(k) v iteračnom procese. Tento smer by mal zodpovedať smeru, v ktorom hodnoty funkcionálu f čo najviac klesajú.Prirodzenou voľbou pre takúto myšlienku je vziať rezíduum v danom bode, keďže v jeho smere má funkcia maximálny spád. Týmto spôsobom dostanemejednoduchú iteračnú metódu, ktorej sa hovorí metóda najväčšieho spádu, a ktorej algoritmus sa na základe vzorcov odvodených v rovniciach (1.4) a (1.5),pri voľbe d(k)=r(k) dá zapísať nasledovne:

Kapitola 1. (Lineárne a nelineárne rovnice) – 18

Page 27: 14.Numericka matematika a amatematicka statistika

A3. Zvolíme x(0) a požadovanú presnosť ε; vypočítame z definície r(0) = b− Ax(0); k=0.

B3. Vypočítame minimalizujúci koeficient α(k) pomocou vzorca (viď (1.5))

α(k) =(r(k))>r(k)

(r(k))>Ar(k)

.

C3. Nájdeme ďalšiu iteráciu riešenia a jeho rezíduum

x(k+1) = x(k) + α(k)r(k), r(k+1) = r(k) − α(k)Ar(k).

D3. Ak platí ‖x(k+1)−x(k)‖ < ε (príp. ‖r(k+1)‖ < ε), skončíme výpočet a x ≈ x(k+1). V opačnom prípade k zväčšíme o jedna a pokračujeme bodom B3.

Poznamenajme, že druhý vzorec v C3 sme dostali z toho prvého použitím druhého vzťahu v rovnici (1.5). Tento algoritmus sa však často nepoužíva,lebo obyčajne je konvergencia pomalá a algoritmus sa dá vylepšiť.

Jedným takým vylepšením je metóda združených gradientov, ktorá hľadá iterácie tak, aby všetky rezíduá boli na seba ortogonálne, teda aby spĺňali vzťah(r(k))>r(i)=0 pre všetky i6=k. Táto ortogonalita spôsobí, že r(n)=0, lebo neexistuje n+1 nenulových ortogonálnych n-tíc. Nulové rezíduum znamená, žex(n) je presným riešením sústavy rovníc Ax=b. Pravda, ak sú výsledky priebežne zaokrúhľované, nulové rezíduum nedostaneme prakticky nikdy. To všakvôbec nie je na škodu, lebo hľadáme riešenie s presnosťou ε. Takáto postupnosť rezíduí sa dá nájsť za predpokladu, že minimalizujúce združené smeryd(k) spĺňajú predpoklad A-ortogonálnosti, t.j. (d(k))>Ad(i)=0 pre všetky i6=k. Efektívny algoritmus pre metódu združených gradientov môžeme napísaťnasledovne:

A4. Zvolíme x(0) a požadovanú presnosť ε; vypočítame z definície r(0) = b− Ax(0); položíme d(0) = r(0); k=0.

B4. Vypočítame minimalizujúci koeficient α(k) pomocou vzorca (viď (1.5)), ďalšiu iteráciu riešenia a jeho rezíduum

α(k) =(r(k))>r(k)

(d(k))>Ad(k), x(k+1) = x(k) + α(k)d(k), r(k+1) = r(k) − α(k)Ad(k).

C4. Nájdeme ďalší koeficient a príslušný združený smer:

β(k) =(r(k+1))>r(k+1)

(r(k))>r(k), d(k+1) = r(k+1) + β(k)d(k)

Kapitola 1. (Lineárne a nelineárne rovnice) – 19

Page 28: 14.Numericka matematika a amatematicka statistika

D4. Ak platí ‖x(k+1)−x(k)‖ < ε (príp. ‖r(k+1)‖ < ε), skončíme výpočet a x ≈ x(k+1). V opačnom prípade k zväčšíme o jedna a pokračujeme bodom B4.

V oboch prípadoch používame pre zastavenie iteračného procesu skôr kritérium s rezíduom, pretože tieto rezíduá priamo počítame v rámci algoritmov,vo vzorcoch z C3 resp. B4. Poznamenajme ešte, že ak na nájdenie x(k+1) použijeme smer d(k), použijúc minimalizáciu zo vzťahu (1.4), a rezíduum r(k+1)

určuje najväčší spád funkcie f (1.1) v bode x(k+1), musia byť d(k) a r(k+1) ortogonálne, teda (d(k))>r(k+1)=0 pre ľubovoľné k.

Príklad 1.14 Odvoďme vzorce pre výpočet α(k) a β(k) v metóde združených gradientov.

Riešenie. Vzorec (1.5) nám udáva α(k). Pre jeho stotožnenie so vzorcom z B4, potrebujeme upraviť čitateľ. Ak druhý vzorec v C4 skalárne vynásobímer(k+1), dostaneme

(r(k+1))>d(k+1) = (r(k+1))>r(k+1) + β(k)(r(k+1))>d(k).

Posledný člen vypadne z dôvodu ortogonálnosti spomenutej v odstavci nad týmto príkladom. Zvyšok vzťahu nám určí potrebnú úpravu vzorca (1.5).

Pre nájdenie β(k) druhý vzorec v C4 skalárne vynásobíme Ad(k) a v dôsledku A-ortogonálnosti združených smerov d(k) dostaneme

0 = (d(k+1))>Ad(k) = (r(k+1))>Ad(k) + β(k)(d(k))>Ad(k),

z čoho máme β(k)=− (r(k+1))>Ad(k)

(d(k))>Ad(k). Ak chceme dostať to, čo tvrdí C4, dosaďme v čitateli za Ad(k) a následne vzorec pre α(k) zo vzťahov v B4. A tiež

potrebujeme ortogonalitu rezíduí: (r(k+1))>r(k)=0. Úpravami získame

β(k) = −(r(k+1))>Ad(k)

(d(k))>Ad(k)=

(r(k+1))> 1α(k)

(r(k+1) − r(k)

)(d(k))>Ad(k)

=

(r(k+1))> 1(r(k))>r(k)

(d(k))>

Ad(k)

r(k+1)

(d(k))>Ad(k)=

(r(k+1))>r(k+1)

(r(k))>r(k),

a to je hľadaný vzťah.

Príklad 1.15 Vypočítajte dve iterácie v riešení sústavy

8x1− x2 = 17,

−x1+8x2 =−10,

metódou združených gradientov, vypočítajte aj normy ich rezíduí.

Kapitola 1. (Lineárne a nelineárne rovnice) – 20

Page 29: 14.Numericka matematika a amatematicka statistika

Riešenie. Riešenie uskutočníme v maticovom tvare. Označme

A =

(8 −1−1 8

), b =

(17−10

).

Presvedčme sa, že matica sústavy A je symetrická a pozitívne definitná: symetria je zrejmá a keďže detA>0 aj A11>0, aj pozitívna definitnosť je splnená.Zvolíme nulovú začiatočnú iteráciu a vypočítame požadované dve iterácie

x(0) =

(00

), r(0) = d(0) = b(0), Ad(0) =

(146−97

),

α(0) =

(17−10

)>·(

17−10

)(

17−10

)>·(

146−97

) =389

3452.= 0,113, x(1) =

(00

)+ 0,113

(17−10

)=

(1,921−1,130

), r(1) =

(17−10

)− 0,113

(146−97

)=

(0,5020,961

),

β(1) =

(0,5020,961

)>·(

0,5020,961

)(

17−10

)>·(

17−10

) =1,176

389.= 0,003, d(1) =

(0,5020,961

)+ 0,003

(17−10

)=

(0,5530,931

), Ad(1) =

(3,4936,895

),

α(1) =

(0,5020,961

)>·(

0,5020,961

)(

0,5530,931

)>·(

3,4936,895

) =1,176

8,351.= 0,141, x(2) =

(1,921−1,130

)+0,141

(0,5530,931

)=

(1,999−0,999

), r(2) =

(0,5020,961

)−0,141

(3,4936,895

)=

(0,009−0,011

).

Všimnime si, ako klesali normy razíduí: ‖r(0)‖ = 17, ‖r(1)‖ = 0,961, ‖r(2)‖ = 0,011. Po dvoch iteráciách norma rezídua klesla o tri rády. Poznamenajme,že bez zaokrúhľovacích chýb by táto norma mala byť nulová, pretože sme riešili sústavu s dvoma neznámymi. Porovnajme:

x(0) =

(00

), r(0) = d(0) = b(0), Ad(0) =

(146−97

),

α(0) =

(17−10

)>·(

17−10

)(

17−10

)>·(

146−97

) =389

3452, x(1) =

(00

)+

389

3452

(17−10

)=

(66133452−19451726

), r(1) =

(17−10

)− 389

3452

(146−97

)=

(945172632133452

),

Kapitola 1. (Lineárne a nelineárne rovnice) – 21

Page 30: 14.Numericka matematika a amatematicka statistika

β(1) =

(945172632133452

)>·(

945172632133452

)(

17−10

)>·(

17−10

) =35721

11916304, d(1) =

(945172632133452

)+

35721

11916304

(17−10

)=

(71315371191630453670335958152

), Ad(1) =

(2315911559581527874099111916304

),

α(1) =

(945172632133452

)>·(

945172632133452

)(

71315371191630453670335958152

)>·(

2315911559581527874099111916304

) =3452

24507, x(2) =

(66133452−19451726

)+

3452

24507

(71315371191630453670335958152

)=

(2−1

), r(2) =

(945172632133452

)− 3452

24507

(2315911559581527874099111916304

)=

(00

).

Každopádne by však nikto nerátal s takýmito strašnými zlomkami.

Nakoniec zdôraznime, že pri použitých algoritmoch vyžadujeme, aby matica A bola symetrická pozitívne definitná. Avšak aj v opačnom prípade sa sústavaAx=b s jednoznačným riešením dá ľahko modifikovať na sústavu s pozitívne definitnou maticou. Stačí vynásobiť pôvodnú sústavu zľava maticou A> adostaneme

A>Ax=A>b. (1.6)

Matica tejto sústavy A>A je vždy symetrická a je aj pozitívne definitná, ak je matica A nesingulárna. Pravda, takéto modifikácie sústavy sa nepoužívajúčasto, pretože vlastnosti matice A>A potrebné pre numerické riešenie sústavy spôsobia pomalú konvergenciu aj v metóde združených gradientov. Vtakom prípade radšej použijeme iné gradientné metódy, vhodné pre všeobecné sústavy rovníc. Tie však v rámci tohto kurzu diskutovať nebudeme.

Lineárne a nelineárne rovnice – Približné riešenie sústav nelineárnych rovníc

Nelineárne fyzikálne zákony ponúknu na riešenie nelineárne rovnice

Aj keď samozrejme daný problém popíšeme vo všeobecnosti, prakticky sa zameriame potom len na riešenie dvoch rovníc o dvoch neznámych. Vychádzamepritom z numerického riešenia jednej rovnice o jednej neznámej, teda typu f(x) = 0, ktorej riešením sme sa sa zaoberali hneď v prvej časti tejto kapitoly.V niečom sa popis tohoto riešenia môže javiť ako dosť podobný, ale rozšírenie prináša aj viaceré zložitosti, ako napr. určovanie počiatočnej aproximácie,dôkaz konvergencie procesu iterácie na zvolenej oblasti a pod..

Ukážeme si jednu metódu a tou bude Newtonova metóda. Uvažujme sústavu nelineárnych rovníc v tvare:

fi(x1, x2, ..., xn) = 0, i = 1, 2, ..., n;

pričom x = (x1, x2, ..., xn) a F = (f1, f2, ..., fn)T . V o vektorovom tvare je potom možno danú sústavu zapísať jednoducho:

F (x) = 0.

Kapitola 1. (Lineárne a nelineárne rovnice) – 22

Page 31: 14.Numericka matematika a amatematicka statistika

Ak funkcie fi, i = 1, 2, ..., n sú spojito diferencovateľné v nejakom okolí bodu x, potom podľa Taylorovej vety platí:

fi(x1 + τ1, x2 + τ2, ..., xn + τn) = fi(x1, x2, ..., xn) =n∑j=1

∂fi(x1, x2, ..., xn)

∂xjτj + o(‖τ‖),

kde lim‖τ‖→0o(‖τ‖)‖τ‖ =0, alebo vo vektorovom tvare:

‖F (x + τττ)− F (x)− F ′(x).τττ‖ = o(‖τττ‖),

kde τττ = (τ1, τ2, ..., τn)T , ‖τττ‖ = max[|τ1|, |τ2|, ..., |τn|] a F ′(x) je matica parciálnych derivácií (∂fi(x)∂xj

)ni,j=1.

Teraz si sformulujeme, ako vyzerajú podmienky na úspešné použitie tejto metódy, teda aby sme mali zabezpečenú konvergenciu iteračného procesu.Nech v nejakom okolí Ωa = x : ‖x− x∗‖ < apre riešenia x∗ rovnice F (x) = 0 sú splnené nasledovné podmienky:

A5. ‖(F ′(x))−1‖ ≤ a1, ∀x ∈ Ωa,

B5. ‖F (x1)− F (x2)− F ′(x2)(x1 − x2)‖ ≤ a2‖x2 − x1‖2, ∀x1, x2 ∈ Ωa,

C5. x(0) ∈ Ωb, kde b = mina, (a1.a2)−1,

kde (F ′(x))−1 je inverzná matica k matici parciálnych derivácií F ′(x). Potom iteračný proces daný vzťahom

x(k+1) = x(k) − (F ′(x(k)))−1.F (x(k))

konverguje ku riešeniu x(∗).

Výraz −(F ′(x(k)))−1.F (x(k)) vyjadruje prírastok R(x(k)), ktorý vyhovuje rovnici −(F ′(x(k)))−1.R(x(k)) = F (x(k)). Výpočet podľa vyššie uvedenéhoiteračného vzťahu ukončíme, ak |R(x(k))| < ε, kde ε je dopredu zadaná presnosť výpočtu.

Výber počiatočnej iterácie x(0) je možné urobiť buď na základe grafického náčrtu alebo výpočtom tak, aby x(0) bolo dostatočne blízko hľadanému riešeniux∗, t.j. aby v nejakom okolí x(0) platili podmienky konvergencie A5 až C5, keďže na tomto mieste neuvádzame príslušný dôkaz.

Príklad 1.16 Newtonovou metódou s presnosťou ε = 0, 00003 určte približne riešenie (x1, x2), ktoré vyhovuje nasledovnej sústave nelineárnych rovníc

x1 + 0, 9x2 − 1 = 0,

x21 − x2 = 0.

Kapitola 1. (Lineárne a nelineárne rovnice) – 23

Page 32: 14.Numericka matematika a amatematicka statistika

Riešenie. Ak sa všetky prvé parciálne derivácie funkcií nemenia veľmi rýchlo, potom počiatočnú aproximáciu x(0) môžme určiť graficky alebo výpočtompomocného systému rovníc

x1 + x2 = 1,

x21 − x2 = 0.

V našom prípade situáciu vhodne popisuje Obr.1.6). Vidíme, že sústava bude mať dve rôzne dvojice riešení. Zvoľme napr. x(0) = [−1, 5; 2] a budeme

Obr. 1.6: Grafy funkcií pre určenie počiatočnej aproximácie.

aproximovať riešenie ležiace v okolí tohto bodu. V tomto prípade vektor F (x) a matica F ′(x) vyzerajú nasledovne:

F (x) =

(x1 + 0, 9x2 − 1

x21 − x2

), F ′(x) =

(1 0, 9

2x1 −1

).

Inverznú maticu (F ′(x))−1 je možné určiť známym postupom z lineárnej algebry a tak:

(F ′(x))−1 =−1

1 + 1, 8x1

(−1 −0, 9−2x1 1

).

Po dosadení do iteračného vzťahu a vykonaní všetkých potrebných aritmetických operácií dostávame postupne:

x(1) = [−1, 779411; 3, 088236],

Kapitola 1. (Lineárne a nelineárne rovnice) – 24

Page 33: 14.Numericka matematika a amatematicka statistika

x(2) = [−1, 747517; 3, 052797],

x(3) = [−1, 747089; 3, 052323],

x(4) = [−1, 747089; 3, 052322].

Vzhľadom k vopred požadovanej presnosti posledne vypočítanú iteráciu x(4) už môžme považovať za hľadanú aproximáciu riešenia danej úlohy.

Výber počiatočnej iterácie x(0) je možné urobiť aj pre druhé riešenie. Urobme to teraz výpočtom. Sústavu

x1 + x2 = 1,

x21 − x2 = 0,

je možné vyriešiť priamym výpočtom. Riešenie tvoria dve dvojice:

[−1 +

√5

2;3−√

5

2],

[−1−

√5

2;3 +√

5

2.]

Ak zvolíme teraz x(0) = [−1+√5

2; 3−

√5

2], potom po opakovaní vyššie popísaného postupu obdržíme nasledovnú postupnosť iterácií:

x(1) = [0, 636116; 0, 404316],

x(2) = [0, 635978; 0, 404468],

x(3) = [0, 635978; 0, 404468].

Vzhľadom k vopred požadovanej presnosti posledne vypočítanú iteráciu x(3) už môžme považovať za hľadanú aproximáciu riešenia danej úlohy.

Príklad 1.17 Newtonovou metódou s presnosťou ε = 0, 00003 určte približne riešenie (x1, x2), ktoré vyhovuje nasledovnej sústave nelineárnych rovníc

x21 + x22 = 1, 2,

x31 = 0, 8.

Kapitola 1. (Lineárne a nelineárne rovnice) – 25

Page 34: 14.Numericka matematika a amatematicka statistika

Obr. 1.7: Grafy funkcií pre určenie počiatočnej aproximácie.

Riešenie. Opäť situáciu vhodne popisuje obrázok Obr.1.7). Vidíme, že znovu aj táto sústava bude mať dve rôzne dvojice riešení. Zvoľme napr. x(0) = [1; 0, 5]a budeme aproximovať riešenie ležiace v okolí tohto bodu. V tomto prípade vektor F (x) a matica F ′(x) vyzerajú nasledovne:

F (x) =

(x21 + x22 − 1, 2x31 − 0, 8

), F ′(x) =

(2x1 2x23x2 0

).

Inverznú maticu (F ′(x))−1 je možné takisto určiť známym postupom z lineárnej algebry a tak:

(F ′(x))−1 =−1

6x22

(0 −2x2−3x2 2x1

).

Po dosadení do iteračného vzťahu a vykonaní všetkých potrebných aritmetických operácií dostávame postupne:

x(1) = [0, 933333; 0, 583333],

x(2) = [0, 928345; 0, 581553],

x(3) = [0, 928318; 0, 581572].

Vzhľadom k vopred požadovanej presnosti posledne vypočítanú iteráciu x(4) už môžme považovať za hľadanú aproximáciu riešenia danej úlohy. Trebapodotknúť, že úloha má ešte jedno iné riešenie, ktoré si čitateľ na základe popísaných postupov už určite bude vedieť určiť aj sám.

Kapitola 1. (Lineárne a nelineárne rovnice) – 26

Page 35: 14.Numericka matematika a amatematicka statistika

Samohodnotiace otázky a úlohy na samostatné riešenie

1. Popíšte základný rozdiel (vstupné podmienky vs. rýchlosť konvergencie) medzi Newtonovou metódou a metódou polovičného delenia intervalu!

2. Je Gaussova-Seidelova iteračná metóda v každom prípade efektívnejšia ako Jacobiho? Skúste nájsť kontrapríklad!

3. Prečo je dôležité, aby matica A bola symetrická pozitívne definitná pre metódu združených gradientov?

4. Ako zdôvodníte, že metóda združených gradientov pri presnom počítaní vedie k presnému riešeniu po konečnom počte iteračných krokov? Zamyslitesa nad odvodením všetkých vzorcov z metódy združených gradientov!

5. Viete dokázať, že matica A>A vo vzťahu (1.6) je symterická pozitívne definitná?

6. Skúste nájsť hlavnú príčinu väčšej obtiažnosti riešenia sústavy nelineárnych rovníc oproti lineárnym!

V úlohách 1. až 10. vyriešte s presnosťou nelineárne rovnice s presnosťou ε = 0, 001.

1. x− 2e−x − 5, 5 = 0 . 2. ln x2− 1

8x= 0 . 3. cos x

8− 5x = 0 .

4. sin x5− 3

2x+ 4 = 0 . 5. tanx− 1

5x2 − 1 = 0 (najmenší kladný koreň) .

6. arctanx− 2x+ 4 = 0 . 7. x4 − 2x3 − x− 1 = 0 (kladný koreň) . 8.

√x2 + 1− 1

5x2 − 4x+ 1 = 0 .

9.x

1+x− x2 + 4x+ 1 = 0 (kladný koreň) . 10. 4x3 − 25x2 − 100x+ 625 = 0 (najväčší kladný koreň) .

V úlohách 11. až 16. vyriešte s presnosťou ε = 0, 0001 nelineárne rovnice.

11. e2x + x2 − 4 = 0 . 12. e−x + x2 − 2 = 0 . 13. e−2x − lnx = 0 .

14. ln (x+ 3)− x2 = 0 . 15. x sin2 2x−1 = 0 (najmenší kladný koreň) . 16. x2(2 + ln x)− 1 = 0 .

Kapitola 1. (Lineárne a nelineárne rovnice) – 27

Page 36: 14.Numericka matematika a amatematicka statistika

V úlohách 11. až 16. vyriešte s presnosťou ε = 0, 00001 nelineárne rovnice.

17. x sin 2x− 1 = 0 (záporný koreň) . 18. x2 lnx− 1 = 0 . 19. ex lnx− 1 = 0 .

20. x2 − 2x− 4 + e−x = 0 . 21. lnx− ex + 9 = 0 .

V úlohách 22. až 25. vyriešte nasledujúce systémy lineárnych rovníc Jacobiho iteračnou metódou s presnosťou ε = 0, 001.

22.10x1 + x2 + x3 = 122x1 + 10x2 + x3 = 132x1 + 2x2 + 10x3 = 14

. 23.10, 9x1 + 2, 1x2 + 0, 9x3 = −72, 1x1 + 9, 8x2 + 1, 3x3 = 10, 30, 9x1 + 1, 3x2 + 12, 1x3 = 24, 6

.

24.−x1 + −x2 + 6x3 = 426x1 − 4x2 − x3 = 11, 33−x1 + 6x2 − x3 = 32

. 25.x1 + 3x2 − x3 = 1x1 − 0, 3x2 + 2, 4x3 = 32x1 + 0, 5x2 + x3 = 3

.

V úlohách 26. až 29. vyriešte nasledujúce systémy lineárnych rovníc Gauss-Seidlovou iteračnou metódou s presnosťou ε = 0, 001.

26.x1 + x2 − 5x3 = −8x1 − 10x2 + x3 = −125x1 − x2 − x3 = −4

. 27.0, 95x1 − 12x2 + 1, 2x3 = 2, 23, 1x1 + 0, 2x2 − 0, 64x3 = −1x1 − 1, 9x2 + 10x3 = 12

.

28.x1 + 3x2 − x3 = 12x1 + 0, 5x2 + x3 = 3x1 − 0, 3x2 + 2, 4x3 = 3

. 29.9x1 + x2 − x3 = −10x1 + x2 + 9x3 = 282x1 + 9x2 + 2x3 = 22

.

Kapitola 1. (Lineárne a nelineárne rovnice) – 28

Page 37: 14.Numericka matematika a amatematicka statistika

V úlohách 30. až 35. nájdite približné riešenie sústavy lineárnych rovníc metódou združených gradientov so zadanou presnosťou ε. Začiatočnú iteráciusi zvoľte.

30. ε = 0,5,6x1 − 3x2 = 5

−3x1 + 2x2 = 2. 31. ε = 0,05,

7x1 − 2x2 = 5

x1 − 6x2 = −5.

32. ε = 0,001,

10x1 + x2 + x3 = 12

2x1 + 10x2 + x3 = 13

2x1 + 2x2 − 10x3 = 14

. 33. ε = 0,001,

9x1 + x2 − x3 = −10

x1 + 9x2 + 2x3 = 22

−x1 + 2x2 + 6x3 = 28

.

34. ε = 0,1,

4x1 − x2 − x3 = 3

−x1 + 4x2 − x3 = −2

−x1 − x2 + 4x3 = 3

. 35. ε = 0,01,

5x1 − 2x2 − x3 = 6

−2x1 + 5x2 = −7

−x1 + 3x3 = 2

.

36. Predchádzajúce úlohy preriešte aj metódou najväčšieho spádu. Nájdite tretiu iteráciu riešenia touto metódou a vypočítajte normu rezídua tretejiterácie. Začiatočnú iteráciu si zvoľte. .

V úlohách 37. až 41. vyriešte s danou presnosťou a spôsobom voľby počiatočnej aproximácie sústavy nelineárnych rovníc.

37. x21 − x2 − 0, 2 = 0; x21 − x2 − 0, 2 = 0; ε = 0, 002; graficky .

38. 12, 01− 3x1 − 2x2 = 0; 18− 3, 01x1 − 4x2 = 0; ε = 0, 000001; výpočtom .

39. x2 − 50x21− 0, 01 = 0; 1, 05x1 − 20

x22= 0; ε = 0, 00001; výpočtom .

40. x2 − cosx1 − sin π1000

= 0; x2 − x41 − 0, 5 = 0; ε = 0, 00001; graficky .

41. 1− x2116− x22

2= 0; 1− x21

8− x22

4= 0; ε = 0, 00001; graficky .

Kapitola 1. (Lineárne a nelineárne rovnice) – 29

Page 38: 14.Numericka matematika a amatematicka statistika

Záver

V tejto kapitole sme sa venovali niektorým základným metódam používaným na riešenie rovnice f(x) = 0 a sústav lineárnych aj nelineárnych rovníc.Neprebrali sme zďaleka všetky metódy, ale ukázali sme jednak tie najzákladnejšie, ale zároveň aj dostatočne efektívne tak, aby ich bolo možné použiť pririešení rôznych úloh nielen aplikovanej matematiky ale aj ďalších odborných oblastiach v technickej praxi.

Literatúra

[1] Budinský, B., Charvát, J.: Matematika I, Praha 1987.

[2] Charvát J., Hála M., Šibrava Z.: Příklady k Matematice I, ČVUT Praha, 2002.

[3] Eliáš J., Horváth J., Kajan J.: Zbierka úloh z vyššej matematiky, časť I. (3.vyd.1980), Alfa, Bratislava.

[4] Ivan, J.: Matematika I, Bratislava 1983.

[5] Kreyszig, E.: Advanced Engineering Mathematics, New York 1993.

[6] Šoltés V., Juhásová Z.: Zbierka úloh z vyššej matematiky I, Košice 1995.

[7] G. I. Marčuk Metody numerické matematiky. Academia, Praha, 1987.

[8] Z. Dostál Optimal Quadratic Programming Algorithms. Springer, Berlin, 2009.

Riešenia úloh

Odpovede na samohodnotiace otázky, ak ich neviete sformulovať, a aj mnohé iné odpovede nájdete v odporúčanej literatúre.

1.základný interval :< 5; 6 >

Newtonova metóda : x0 = 5, x3 = 5, 50811,

metóda polovičného delenia :< 5, 508; 5, 509 >, 10 delení2.

základný interval : < 2; 3 >

Newtonova metóda : x0 = 2, x3 = 2, 12139,

metóda polovičného delenia : < 2, 121; 2, 122 >, 10 delení

3.základný interval : < 0; 1 >

Newtonova metóda : x0 = 0, x2 = 0, 2,

metóda polovičného delenia : < 0, 199; 0, 2 >, 10 delení4.

základný interval : < 3; 4 >

Newtonova metóda : x0 = 4, x3 = 3, 0484,

metóda polovičného delenia : < 3, 048; 3, 049 >, 10 delení

Kapitola 1. (Lineárne a nelineárne rovnice) – 30

Page 39: 14.Numericka matematika a amatematicka statistika

5.základný interval : < 0; 1 >

Newtonova metóda : x0 = 1, x4 = 0, 85314,

metóda polovičného delenia : < 0, 853; 0, 854 >, 10 delení6.

základný interval : < 2; 3 >

Newtonova metóda : x0 = 3, x3 = 2, 60194,

metóda polovičného delenia : < 2, 602; 2, 603 >, 10 delení

7.základný interval : < 2; 3 >

Newtonova metóda : x0 = 3, x5 = 2, 27747,

metóda polovičného delenia : < 2, 277; 2, 278 >, 10 delení8.

základný interval : < 0; 1 >

Newtonova metóda : x0 = 1, x3 = 0, 51813,

metóda polovičného delenia : < 0, 518; 0, 519 >, 10 delení

9.základný interval : < 4; 5 >

Newtonova metóda : x0 = 5, x3 = 4, 41148,

metóda polovičného delenia : < 4, 411; 4, 412 >, 10 delení10.

základný interval : < 6; 7 >

Newtonova metóda : x0 = 7, x4 = 6, 25

18.základný interval : < 1; 2 >

Newtonova metóda : x0 = 2, x5 = 1, 5315820.

základný interval : < −1; 0 >

Newtonova metóda : x0 = −1, x4 = −0, 71766;

základný interval : < 3; 4 >

Newtonova metóda : x0 = 4, x4 = 3, 22718;

22.

k = 7

x1 ≈ 1, 0001

x2 ≈ 1, 0002

x3 ≈ 1, 0002

23.

k = 7

x1 ≈ −0, 9999

x2 ≈ 1, 0001

x3 ≈ 2, 0001

24.

k = 9

x1 ≈ 4, 6657

x2 ≈ 7, 6185

x3 ≈ 9, 0471

25.

k = 9

x1 ≈ 0, 9907

x2 ≈ 0, 2945

x3 ≈ 0, 8749

26.

k = 6

x1 ≈ −0, 1579

x2 ≈ 1, 3684

x3 ≈ 1, 8421

27.

k = 4

x1 ≈ −0, 0716

x2 ≈ −0, 0696

x3 ≈ 1, 1939

28.

k = 9

x1 ≈ 0, 9894

x2 ≈ 0, 2949

x3 ≈ 0, 8746

29.

k = 5

x1 ≈ −0, 9999

x2 ≈ 1, 9999

x3 ≈ 2, 9999

30.(

5,339,00

)

31. nevhodné 32. nevhodné 33.

−0,85381,65663,9722

34.

−1,000,001,00

35.

1,000−1,0001,000

37. a)x(0) = (0; 0), x(3) ≈ (0, 033;−0, 1989); b)x(0) =

(1; 1), x(3) ≈ (1, 1787; 1, 1893) 38. x(0) = (2; 3), x(2) ≈ (2, 013376; 2, 984934) 39. x(0) = (5; 2), x(4) ≈ (5, 099588; 1, 932649) 40. a)x(0) =(π4; 0, 8), x(4) ≈ (0, 71352; 0, 759201); b)x(0) = (−π

4; 0, 8), x(4) ≈ (−0, 71352; 0, 759201) 41. a)x(0) = (2; 1), x(4) ≈ (2, 309401; 1, 1547); b)x(0) =

(2;−1), x(4) ≈ (2, 309401;−1, 1547); c)x(0) = (−2; 1), x(4) ≈ (−2, 309401; 1, 1547); d)x(0) = (−2;−1), x(4) ≈ (−2, 309401;−1, 1547)

Kapitola 1. (Lineárne a nelineárne rovnice) – 31

Page 40: 14.Numericka matematika a amatematicka statistika

Kapitola 2. (Interpolácia a aproximácia)

Poslanie

Odhadnúť hodnotu funkcie, ktorú nepoznáme, tiež jej deriváciu a určitý integrál

Ciele

1. Popísať k čomu nám slúži interpolácia.

2. Zistiť predpis polynomickej funkcie, ktorá prechádza zadanými bodmi.

3. Nájsť hodnotu polynómu, ktorý je zadaný prostredníctvom niekoľkých bodov.

4. Nájsť najvhodnejší polynóm nízkeho stupňa, ktorý aproximuje veľké množstvo experimentálnych údajov.

5. Odhadnúť hodnotu derivácie funkcie danej tabuľkou.

6. Aproximovať hodnotu určitého integrálu pomocou približných vzorcov.

Prerekvizičné znalosti

polynómy; funkcie; derivácia; minimum funkcie; Taylorova veta; určitý a neurčitý integrál

Kapitola 2. (Interpolácia a aproximácia) – 1

Page 41: 14.Numericka matematika a amatematicka statistika

Úvod

V kapitole sa venujeme základným metódam aproximácie funkcie a jej derivácie. V podstate nám pôjde o to, aby sme sa naučili z niekoľkých bodovfunkcie určiť celú funkciu alebo aspoň nájsť je približnú hodnotu v niektorom bode. Takýto postup je z praktického hľadiska potrebné použiť napr. vtedy,keď máme k dispozícii niekoľko hodnôt v nami meranej závislosti dvoch fyzikálnych veličín a potrebujeme odhadnúť hodnotu závislej veličiny, pre ktorúnemáme k dispozícii meranie. Inokedy, napr. pri počítačovom modelovaní potrebujeme nejakú krivku nahradiť jednoduchšou závislosťou, aby sa dalaalgoritmizovať nejaká naša procedúra. V neposlednom rade môžeme mať z experimentu k dispozícii veľké množstvo údajov, ktoré však obsahujú chyby.V takom prípade nie je účelné hľadať funkciu určenú týmito bodmi, ale radšej jednoduchšiu funkciu, ktorá je zadanými bodmi aproximovaná. V každomprípade je potrebné, aby funkcia bola čo najjednoduchšia. Kritérium jednoduchosti je často prisudzované najmä polynomickým funkciám s čo možnonajnižším stupňom. Aj my sa teda budeme venovať aproximácii funkcie polynómom. V ďalšej časti si ukážeme ako aproximovať deriváciu funkcie. Tomôže byť užitočné vtedy, ak experimentom meriame istú veličinu, avšak v skutočnosti máme záujem o jej deriváciu. Veď mnoho fyzikálnych veličín jeurčených diferenciálnym vzťahom. Naviac takáto aproximácia je užitočná aj v iných numerických metóodach, napr. pri riešení diferenciálnych rovníc, sktorým sa stretneme v ďalšej kapitole. Na záver sa naučíme približne počítať integrály. Jendak preto, že mnohé bežné typy integrálov sa presne spočítaťnedajú, jednak kvôli ich využitiu v inžinierskych softvéroch a tiež preto, že mnoho fyzikálnych veličín je určených integrálnym vzťahom.

V prvej časti budeme hľadať polynóm určený danými bodmi. Pritom nás buď bude zaujímať rovnica polynómu alebo iba jeho hodnota. Vychádzať budemez toho, že poznáme hodnoty polynómu v týchto bodoch. Takejto interpolácii sa hovorí Lagrangeova interpolácia. Pri výpočte hodnôt funkcie pri takejtointerpolácii využijeme algoritmizáciu pomocou konečných diferencií.

V druhej časti budeme hľadať polynóm malého stupňa, ktorý aproximuje zadané hodnoty. Právom sa očakáva, že takýto polynóm prechádza v blízkostikaždého zadaného bodu a všetky takéto vzdialenosti sú čo najmenšie. Musíme teda hľadať nejaké minimum a k tomu použijeme metódu najmenšíchštvorcov. To je veľmi užitočná metóda, ktorá sa používa nielen v numerickej matematiky, ale aj ako variačná metóda pri riešení fyzikálnych problémovalebo ako metóda regresie v matematickej štatistike.

Potom spomenieme, ako nám štandardná veta matematickej analýzy – Taylorova veta – pomôže odhadnúť deriváciu funkcie. Pritom sa sústredíme najmäna prípad takejto aproximácie pomocou konečných diferencií. No a na záver využijeme niektoré interpolačné polynómy, aby sme ukázali jednoduchévzorce pre približný výpočet určitého integrálu. Tu je tiež dobré vedieť odhadnúť chybu daného riešenia ako aj opačne, urobiť daný výpočet na základevopred požadovanej presnosti.

Kapitola 2. (Interpolácia a aproximácia) – 2

Page 42: 14.Numericka matematika a amatematicka statistika

[x0, y0]

[x1, y0]

[x2, y2]

[x3, y3]

[x4, y4]

(a) (b)

Obr. 2.1: Interpolácia a aproximácia: (a) Dané body, (b) Grafy vhodných polynómov.

Interpolácia a aproximácia – Úvod do aproximácie a interpolácie

Čo to vlastne znamená aproximovať alebo interpolovať funkciu?

Majme niekoľko bodov v rovine. Tieto body sme našli napr. meraním závislosti dvoch fyzikálnych veličín. Avšak z experimentu poznáme len niekoľkobodov tejto závislosti, matematicky povedané niekoľko bodov na grafe neznámej funkcie f. Naším cieľom je pomocou známych bodov so súradnicami[xi, yi] nájsť funkciu y = f(x). Pritom z funkcie môžeme potrebovať graf alebo rovnicu funkcie, prípadne nám možno postačujú niektoré hodnoty tejtofunkcie. Od funkcie požadujeme, aby jej graf prechádzal určenými bodmi alebo aspoň v ich blízkosti. Dané body obyčajne usporiadame podľa súradníc x,t.j. pre n+1 daných bodov so súradnicami [xi, yi], i = 0, 1, . . . n platí x0 < x1 < · · · < xn. Ak hľadáme f(x) pre x∈〈x0;xn〉 a požadujeme aby funkciaf prechádzala danými bodmi, hovoríme o interpolácii, ak je x mimo rozsah hovoríme o extrapolácii. Aby mala extrapolácia zmysel číslo x nesmie byť„ďaleko“ od intervalu 〈x0;xn〉. V prípade, že funkcia neprechádza presne danými bodmi radšej používame termín aproximácia funkcie.

Funkcia f je čo najjednoduchšia, aby sme s ňou vedeli pracovať. Najčastejšie sa za ňu zvolí nejaký polynóm, a to budeme robiť aj my v ďalších častiachkapitoly.

Príklad 2.1 Načrtnime nejaký aproximačný polynóm, ktorý bude určený piatimi bodmi na obr. 2.1(a).

Riešenie. Ak interpolujeme pomocou polynómu, tak piatimi bodmi vieme preložiť polynóm štvrtého stupňa tak, že bude prechádzať týmito bodmi.Na obr. 2.1(b) je graf takejto polynomickej funkcie nakreslený žltou farbou. Polynóm štvrtého stupňa má však päť parametrov, čo môže byť v praxiveľa. Ak by sme chceli preložiť danými bodmi polynóm nižšieho stupňa, nemôžeme splniť požiadavku, aby graf funkcie prechádzal všetkými bodmi.Na obr. 2.1 sme modrou čiarou načrtli graf kvadratickej funkcie, ktorá prechádza v blízkosti daných bodov a pomocou nej by sme mohli aproximovaťneznámu funkciu. Na obrázku, ktorý znázorňuje interpoláciu je tiež vidieť, prečo môžeme extrapoláciu robiť iba v blízkosti daných bodov. Zatiaľ, čo obeaproximačné krivky sú na intervale určenom bodmi x0 a x4 relatívne blízko pri sebe, mimo tohto intervalu sa budú rozchádzať, keďže napr. vpravo od

Kapitola 2. (Interpolácia a aproximácia) – 3

Page 43: 14.Numericka matematika a amatematicka statistika

znázorneného obrázku bude modrá funkcia rásť, ale žltá klesať a to neohraničene, keďže obe funkcie sú polynómy a žiaden ďalší extrém už mať nemôžu.

Interpolácia a aproximácia – Lagrangeova interpolácia

Preložme danými bodmi polynóm a zistime jeho rovnicu alebo aspoň niektorú jeho hodnotu.

Nech je daných n+1 bodov so súradnicami [xi, yi], i = 0, 1, . . . n a s vlastnosťou x0 < x1 < · · · < xn−1 < xn. Tieto body jednoznačne určujú polynómn-tého stupňa určený vzťahom

Ln(x) =n∑i=0

(n∏

j=0,j 6=i

(x− xj)(xi − xj)

)yi (2.1)

s vlastnosťou Ln(xk)=yk pre všetky k = 0, 1, . . . n. Tento polynóm nazývame Lagrangeov interpolačný polynóm a môžeme ho tiež rozpísať ako

Ln(x) =n∑i=0

(x− x0) · (x− x1) · · · (x− xi−1) · (x− xi+1) · · · (x− xn)

(xi − x0) · (xi − x1) · · · (xi − xi−1) · (xi − xi+1) · · · (xi − xn)yi

=(x− x1) · · · (x− x2) · · · (x− xn)

(x0 − x1) · (x0 − x2) · · · (x0 − xn)y0︸ ︷︷ ︸

i=0

+(x− x0) · (x− x2) · · · (x− xn)

(x1 − x0) · (x1 − x2) · · · (x1 − xn)y1︸ ︷︷ ︸

i=1

+

· · ·+ (x− x0) · (x− x1) · · · (x− xk−1) · (x− xk+1) · · · (x− xn)

(xk − x0) · (xk − x1) · · · (xk − xi−1) · (xk − xk+1) · · · (xk − xn)yk︸ ︷︷ ︸

i=k

+ · · ·

+(x− x0) · (x− x1) · · · (x− xn−2) · (x− xn)

(xn−1 − x0) · (xn−1 − x1) · · · (xn−1 − xn−2) · (xn−1 − xn)yn−1︸ ︷︷ ︸

i=n−1

+(x− x0) · (x− x1) · · · (x− xn−2) · (x− xn−1)

(xn − x0) · (xn − x1) · · · (xn − xn−2) · (xn − xn−1)yn︸ ︷︷ ︸

i=n

. (2.2)

Príklad 2.2 Ukážme že pre polynóm (2.1) platí vzťah Ln(xk) = yk pre všetky k = 0, 1, . . . n.

Riešenie. Ak zoberieme Lagrangeov intrpolačný polynóm v rozpísanom tvare (2.2), a dosadíme doň páve x=xk, tak vo všetkých sčítancoch, okremsčítanca pre i=k bude v čitateli činiteľ (xk−xk) a sčítanec tak bude nulový. Sčítanec pre i=k bude

(xk − x0) · (xk − x1) · · · (xk − xk−1) · (xk − xk+1) · · · (xk − xn)

(xk − x0) · (xk − x1) · · · (xk − xi−1) · (xk − xk+1) · · · (xk − xn)yk = yk.

Kapitola 2. (Interpolácia a aproximácia) – 4

Page 44: 14.Numericka matematika a amatematicka statistika

Keďže je to jediný nenulový sčítanec na pravej strane (2.2) máme pre ľubovoľné xk Ln(xk)=yk.

Príklad 2.3 Interpoláciou nájdime Lagrangeov interpolačný polynóm pre body zadané tabuľkou.

x 1,1 1,2 1,3 1,4y 1,336 1,510 1,698 1,904

Riešenie. Podľa tabuľky hodnôt so štyrmi bodmi nájdeme Lagrangeov interpolačný polynóm tretieho stupňa

L3(x) =(x− 1,2)·(x− 1,3)·(x− 1,4)

(1,1− 1,2)·(1,1− 1,3)·(1,1− 1,4)·1,336 +

(x− 1,1)·(x− 1,3)·(x− 1,4)

(1,2− 1,1)·(1,2− 1,3)·(1,2− 1,4)·1,510

+(x− 1,1)·(x− 1,2)·(x− 1,4)

(1,3− 1,1)·(1,3− 1,2)·(1,3− 1,4)·1,698 +

(x− 1,1)·(x− 1,2)·(x− 1,3)

(1,4− 1,1)·(1,4− 1,2)·(1,4− 1,3)·1,904 =

2

3x3 − 17

10x2 +

901

300x− 399

500

Asi najviac problémov urobí úprava výrazov, hlavne keď hodnoty k dispozícii sú desatinné čísla.

Ak potrebujeme iba niektorú hodnotu aproximácie, nemusíme hľadať celý polynóm. Ukážme špeciálny prípad pre výpočet hodnoty Lagrangeovho inter-polačného polynómu.

Najprv však zavedieme pojem konečných diferencií. Nech je daných n+1 bodov so súradnicami [xi, yi], i = 0, 1, . . . n a s vlastnosťou xi−xi−1=h, h>0 prevšetky i = 1, . . . n. Konečnou diferenciou prvého rádu ∆yi budeme rozumieť rozdiel hodnôt súradníc y v susedných bodoch. Konečnou diferenciou k-tehorádu ∆kyi budeme rozumieť rozdiel susedných hodnôt diferencií rádu k−1. Keďže tieto rozdiely môžeme indexovať dvojakým spôsobom, vyberiemejeden, ktorý budeme používať. Takto máme definičné vzťahy diferencií v nasledovnom tvare:

∆yi = yi+1 − yi, ∆kyi = ∆k−1yi+1 −∆k−1yi (2.3)

Diferencie obyčajne prehľadne zapisujeme do tabuľky konečných diferencií, ako je uvedené v tab. 2.1 pre n=3. Aj z tabuľky je vidieť, že maximálnemôžeme robiť diferencie rádu n.

Príklad 2.4 Zostavme tabuľku všetkých diferencií pre hodnoty zadané tabuľkou z príkladu 2.3.

Riešenie. V prvom rade si uvedomme, že podľa vzorcov (2.3) môžeme diferencie počítať, keďže x1−x0=x2−x1=x3−x2=0,1. Takže vieme zhotoviťtabuľku diferencií:

Kapitola 2. (Interpolácia a aproximácia) – 5

Page 45: 14.Numericka matematika a amatematicka statistika

Tabuľka 2.1: Tabuľka konečných diferencií všetkých možných rádov.i 0 1 2 3xi x0 x1 x2 x3yi y0 y1 y2 y3

∆yi ∆y0 = y1 − y0 ∆y1 = y2 − y1 ∆y2 = y3 − y2∆2yi ∆2y0 = ∆y1 −∆y0 ∆2y1 = ∆y2 −∆y1∆3yi ∆3y0 = ∆2y1 −∆2y0

i 0 1 2 3x 1,1 1,2 1,3 1,4y 1,336 1,510 1,698 1,904

∆y 0,174 0,188 0,206∆2y 0,014 0,018∆3y 0,004

Vráťme sa teraz naspäť k interpolácii pomocou Lagrangeovho polynómu. Majme n+1 bodov so súradnicami [xi, yi], i = 0, 1, . . . n a s vlastnosťouxi−xi−1=h, h>0 pre všetky i = 1, . . . n. Pre výpočet hodnoty Lagrangeovho interpolačného polynómu v bode x môžeme využiť Newtonov interpolačnývzorec. Literatúra uvádza rôzne formy tohto vzorca, my ho budeme používať v tvare

Ln(x) =n∑i=0

(i−1∏j=0

q − jj + 1

)∆iy0 = y0 + q∆y0 +

q(q − 1)

2!∆2y0 +

q(q − 1)(q − 2)

3!∆3y0 + · · · +

q(q − 1) · · · (q − n+ 1)

n!∆ny0, pričom q =

x− x0h

.

(2.4)

Príklad 2.5 Ukážme platnosť vzťahu (2.4) pre niektoré hodnoty n.

Riešenie. Skúsme n=1. Podľa (2.2) platí s predpokladom x1−x0=h a s dosadením z q dostaneme

L1(x) =x− x1x0 − x1

y0 +x− x0x1 − x0

y1 =qh− h−h

y0 +qh

hy1 = y0 + q(y1 − y0) = y0 + q∆y0.

A to je presne (2.4) pre n=1.

Kapitola 2. (Interpolácia a aproximácia) – 6

Page 46: 14.Numericka matematika a amatematicka statistika

Podobne

L2(x) =(x− x1)(x− x2)

(x0 − x1)(x0 − x2)y0 +

(x− x0)(x− x2)(x1 − x0)(x1 − x2)

y1 +(x− x0)(x− x1)

(x2 − x0)(x2 − x1)y2

=(qh− h)(qh− 2h)

(−h)(−2h)y0+

qh(qh− 2h)

h(−h)(y0+∆y0)+

qh(qh− h)

2h·h(y0+∆y0+∆y1) =

(q − 1)(q − 2)

2y0+

q(q − 2)

−1(y0+∆y0)+

q(q − 1)

2(y0+2∆y0+∆2y0)

=

[(q − 1)(q − 2)

2+q(q − 2)

−1+q(q − 1)

2

]y0 + q

[(q − 2)

−1+

(q − 1)

1

]∆y0 +

q(q − 1)

2∆2y0 = y0 + q∆y0 +

q(q − 1)

2∆2y0,

čo je presne (2.4) pre n=2, pretože v poslednom riadku sa na výrazy v hranatých zátvorkách môžeme dívať ako na hodnoty Lagrangeovho interpolačnéhopolynómu pre body [0, 1], [1, 1], [2, 1] v prvých zátvorkách a [1, 1], [2, 1] v druhých zátvorkách. Keďže hodnoty súradníc y sú konštantné, aj príslušnéLagrangeove interpolačné polynómy sú konštantné a v našom prípade rovné 1.

Takto by sme úpravami mohli odvodiť aj všeobecný vzorec (2.4), ak si vyjadríme ľubovoľné yi pomocou ∆ky0. Takýto vzorec je yi=∑i

k=0

(ik

)∆ky0 a

dá sa ukázať napríklad matematickou indukciou.

Príklad 2.6 Interpoláciou určte hodnotu polynómu f v bode x=1,22 pre hodnoty polynómu zadané tabuľkou z príkladu 2.3.

Riešenie. Tentokrát použijeme Newtonov interpolačný vzorec. Tabuľku diferencií vezmeme z riešenia pr. 2.4 a vypočítajme si parameter q pre dané xzo vzorca: q=1,22−1,1

0,1=1,2. Hodnoty z prvého stĺpca dosadíme do interpolačného vzorca spolu s parametrom q a dostaneme

f(1,22) = 1,336 + 1,2·0,174 +1,2·0,2

20,014 +

1,2·0,2·(−0,8)

60,004

.= 1,5463.

Hodnotu sme mohli samozrejme dosadiť do výsledného polynómu z pr. 2.3, výsledok by mal byť ten istý. Pre počítanie špeciálnych hodnôt však uprednost-níme Newtonov vzorec, ktorý je jednoduchšie aplikovať. Pre porovnanie, dosadením x do uvedeného polynómu dostaneme hodnotu f(1,22)=L3(1,22)

.=1,5463.

Pre uvedomenie si presnosti interpolácie prezraďme, že hodnoty y v tabuľke sú hodnotami funkcie y= sinhx pre zadané x, zaokrúhlené na tri desatinnémiesta. Preto hodnota interpolačného polynómu v bode x je približne rovná sinh 1,22

.=1,5460. V praxi však funkciu nepoznáme.

Kapitola 2. (Interpolácia a aproximácia) – 7

Page 47: 14.Numericka matematika a amatematicka statistika

Interpolácia a aproximácia – Metóda najmenších štvorcov

Hľadajme polynóm malého stupňa, ktorý aproximuje dané hodnoty

Častokrát máme k dispozícii hodnoty, o ktorých vieme, že sú nepresné, napr. pri meraní fyzikálnych veličín. Ak body, ktoré máme k dispozícii majú hľadaťzávislosť fyzikálnych veličín, s touto nepresnosťou môžeme počítať a pri interpolácii nepožadovať, aby interpolujúci polynóm prechádzal danými bodmi.Takže aj bodov z experimentu môže byť oveľa viac ako je stupeň polynómu. Otázkou je ako takýto polynóm nájsť. Pre úlohu tohto typu sa v matematikepoužíva metóda najmenších štvorcov. Princíp metódy ukážeme pre aproximáciu polynómom, ale dá sa použiť aj na všeobecnejšie typy funkcií, pravdavýsledná rovnica alebo sústava rovníc môže potom byť nelineárna.

Nech je daných N rôznych bodov so súradnicami [xi, yi], i = 1, 2, . . . N a stupeň n požadovaného polynómu. Všimnime si, že body nemusia maťrôzne súradnice x, ale nechceme aby boli všetky xi rovnaké. Stupeň polynómu volíme podľa požiadaviek nami riešenej úlohy, obyčajne čo najmenší, abybol počet neznámych parametrov tiež čo najmenší. Takto N>n (obyčajne Nn), pričom ak N=n+1, tak výsledkom bude Lagrangeov interpolačnýpolynóm, ako bude jasné z odvodenia. Vo všeobecnosti metódou najmenších štvorcov hľadáme takú funkciu f(x ;a) premennej x , ktorá minimalizujenezápornú funkciu S

S(a) =N∑i=1

(yi − f(xi;a))2 (2.5)

na množine všetkých prípustných vektorov parametrov a. Tu vidíme, prečo metódu tak nazývame. Pri jej použití totiž minimalizujeme druhé mocniny(alebo inak štvorce) vzdialeností daných bodov od bodov, ktoré majú tie isté súradnice x a ležia na všetkých možných grafoch funkcií f(x ;a) premennejx s parametrami a. Ak teda nájdeme také parametre a, že pre všetky dané body [xi, yi] platí yi=f(xi; a), hodnota S(a) sa rovná nule a to je určite

x2

y2

f(x2)

f(x) = a0 + a1 x + a2 x2

Obr. 2.2: Metóda najmenších štvorcov

minimum. To je aj prípad aproximačných polynómov, ak N=n+1.

Kapitola 2. (Interpolácia a aproximácia) – 8

Page 48: 14.Numericka matematika a amatematicka statistika

Hľadajme teda funkciu f ako polynóm n-tého stupňa premennej x:

f(x;a) = a0 + a1 x+ a2 x2 + · · ·+ an x

n, a = (a0, a1, . . . , an). (2.6)

Dosadením do funkcie S v (2.5) dostaneme

S(a0, a1, . . . , an) =N∑i=1

(yi − a0 − a1 xi − a2 x2i − · · · − an xni

)2 (2.7)

a minimalizácia tejto funkcie vedie na riešenie sústavy lineárnych rovníc, ktorú nazývame normálna sústava

N a0+

(N∑i=1

xi

)a1+

(N∑i=1

x2i

)a2+ · · ·+

(N∑i=1

xni

)an =

N∑i=1

yi,(N∑i=1

xi

)a0+

(N∑i=1

x2i

)a1+

(N∑i=1

x3i

)a2+ · · ·+

(N∑i=1

xn+1i

)an =

N∑i=1

yi xi,

...(N∑i=1

xni

)a0+

(N∑i=1

xn+1i

)a1+

(N∑i=1

xn+2i

)a2+ · · ·+

(N∑i=1

x2ni

)an =

N∑i=1

yi xni .

(2.8)

Za zvolených predpokladov má táto sústava jednoznačné riešenie a to určuje koeficienty aproximačného polynómu v zmysle metódy najmenších štvorcov.

Príklad 2.7 Odvoďme sústavu (2.8).

Riešenie. O sústave (2.8) tvrdíme, že pre danú N -ticu bodov [xi, yi] minimalizuje funkciu (2.7). Minimalizujúce body diferencovateľnej funkcie spĺňajúvlastnosť stacionárneho bodu: ∂S

∂ak=0 pre všetky k=0, 1, . . . , n. Takže platí

0 =∂S

∂ak= 2

N∑i=1

(yi − a0 − a1 xi − a2 x2i − · · · − an xni

)(−xki ),

z čoho dostaneme (N∑i=1

xki

)a0 +

(N∑i=1

xk+1i

)a1 +

(N∑i=1

xk+2i

)a2 + · · ·+

(N∑i=1

xk+ni

)an =

N∑i=1

yi xki ,

a to je k-ta rovnica sústavy (2.8). Aby sme mohli tvrdiť, že sústava má jednoznačné riešenie, mali by sme overiť, že matica sústavy je pozitívne definitná,čo nám zároveň zabezpečí, že stacionárny bod určuje minimum funkcie S. Tieto výpočty však robiť nebudeme.

Kapitola 2. (Interpolácia a aproximácia) – 9

Page 49: 14.Numericka matematika a amatematicka statistika

Príklad 2.8 Nájdime kubický polynóm, ktorý aproximuje hodnoty funkcie, viď tabuľka, v zmysle metódy najmenších štvorcov. Porovnajme výsledky slineárnou aproximáciou.

x 0 1 2 3 4 5y 1 4 5 3 4 7

Riešenie. Koeficienty hľadaného polynómu f3(x) = a+ b x+ c x2 + d x3 nájdeme vyriešením normálnej sústavy. Pre jej zostrojenie potrebujeme sumárneveličiny zo zadaných N=6 údajov, a to:

N∑i=1

xi = 15,N∑i=1

x2i = 55,N∑i=1

x3i = 225,N∑i=1

x4i = 979,N∑i=1

x5i = 4425,N∑i=1

x6i = 20515,

N∑i=1

yi = 24,N∑i=1

xi yi = 74,N∑i=1

x2i yi = 290,N∑i=1

x3i yi = 1256.

Sústava rovníc pre neznáme koeficienty a, b, c, d má tvar

6a+ 15b+ 55c+ 225d =24,

15a+ 55b+ 225c+ 979d =74,

55a+225b+ 979c+ 4425d =290,

225a+979b+4425c+20515d =1256.

Jej riešenie, ktoré vieme nájsť vhodnou metódou, je a = 1718, b = 607

108, c = −95

36, d = 19

54. Dosadením do rovnice aproximačného polynómu f3 dostaneme

f3(x) =17

18+

607

108x− 95

36x2 +

19

54x3.

Poznamenajme, že normálna sústava, tak ako sme ju zostrojili, obyčajne nie je veľmi príjemná na riešenie, keďže diagonálne členy majú niekoľkorádovérozdiely (o matici hovoríme, že je zle podmienená).

Hodnoty funkcie f sa v tabuľkových hodnotách x líšia od zadaných y, pravda rozdiely sú malé, ako vidieť aj na obr. 2.3.

Keby sme chceli hľadať lineárny polynóm f1 pomocou metódy najmenších štvorcov, sústava rovníc na riešenie by bola jednoduchšia, avšak funkcia bybola ďalej od bodov. Sústava rovníc pre neznáme koeficienty a, b v lineárnej závislosti y=a+bx má tvar

6a+15b =24,

15a+55b =74,

Kapitola 2. (Interpolácia a aproximácia) – 10

Page 50: 14.Numericka matematika a amatematicka statistika

x 0 1 2 3 4 5y 1 4 5 3 4 7

f3(x) 1− 118

4+ 518

5−59

3+59

4− 518

7+ 118

f1(x) 1+1 4−65

5−75

3+75

4+65

7−10

2

4

6

8

0 1 2 3 4 5

y

x

f5(x) f3(x) f1(x)

Obr. 2.3: Aproximácia pomocou metódy najmenších štvorcov polynómami rôznych stupňov.

a jej riešenie je a=2, b=45. Z tabuľky aj grafu na obr. 2.2 vidíme, že rozdiely oproti daným bodom sú väčšie. Presnosť môžeme odčítať aj s hodnôt

minimalizujúcej funkcie S z rovnice (2.7) alebo z priemernej veľkosti jedného štvorca δ=√

SN, kde dostaneme

S3 =

(− 1

18

)2

+

(5

18

)2

+

(−10

18

)2

+

(10

18

)2

+

(− 5

18

)2

+

(1

18

)2

=7

9, δ3 =

√7

54= 0,3600

S1 = (1)2 +

(−6

5

)2

+

(−7

5

)2

+

(7

5

)2

+

(6

5

)2

+ (−1)2 =44

5, δ1 =

√44

30= 1,2111

Nakoniec ešte poznamenajme, že pre N=6 aproximačný polynóm piateho stupňa je Lagrangeovým interpolačným polynómom a prechádza všetkýmizadanými bodmi, ako je vidieť aj na obr. 2.3. Polynóm vyššieho stupňa nemá zmysel hľadať.

Interpolácia a aproximácia – Aproximácia derivácie

Odhadnime hodnotu derivácie funkcie z niekoľkých jej bodov

Okrem hodnôt funkcie je potrebné tiež vedieť odhadnúť deriváciu funkcie aspoň v bodoch, kde poznáme hodnoty funkcie. Derivácia funkcie môže definovaťnejakú fyzikálnu veličinu, ktorú by sme inak experimentom nezistili. Približný výpočet derivácie je tiež užitočný pri riešení diferenciálnych rovníc, najmätých, ktoré analyticky nevyriešime.

Základom pre približný výpočet derivácie je Taylorova veta. Pripomeňme si je znenie. Nech funkcia f je n+1-krát spojito diferencovateľná v okolí bodu

Kapitola 2. (Interpolácia a aproximácia) – 11

Page 51: 14.Numericka matematika a amatematicka statistika

x0 〈x0 − δ;x0 + δ〉 a nech x je vnútorný bod tohto intervalu. Potom existuje bod ξ ležiaci medzi číslami x0 a x taký, že platí Taylorov vzorec:

f(x) = T(n)f (x) + R

(n)f (x) = f(x0) + f ′(x0) (x− x0) +

1

2!f ′′(x0) (x− x0)2 + · · ·+ 1

n!f(n)(x0) (x− x0)n +

1

(n+ 1)!f(n+1)(ξ) (x− x0)n+1 . (2.9)

Zdôraznime, že ξ v poslednom člene, označenom tiež R(n)f (x) nepoznáme a tento člen predstavuje teda chybu, ktorej sa dopustíme, ak nahradíme

hodnotu f(x) hodnotou Taylorovho polynómu T(n)f (x) v bode x. Tento člen, však vieme vhodnými metódami odhadnúť, a tak mať predstavu o tom, aká

presná je aproximácia pomocou Taylorovho polynómu.

Príklad 2.9 Odhadnime hodnotu sin 0,2 pomocou niektorého Taylorovho polynómu tak, aby chyba odhadu bola menšia ako ε=0,001.

Riešenie. Najprv musíme nájsť vhodné x0, a to tak aby sme v ňom poznali hodnoty (všetkých) derivácií finkcie y= sinx a aby toto x0 bolo blízko khodnote 0,2. Funkciu y= sinx vieme derivovať, pričom vieme, že

(sinx)(4k+1) = cosx, (sinx)(4k+2) = − sinx, (sinx)(4k+3) = − cosx, (sinx)(4k) = sinx, pre ľubovoľné prirodzené číslo k.

V bode x0=0 teda máme

(sinx)(4k+1) |x=0 = 1, (sinx)(4k+2) |x=0 = 0, (sinx)(4k+3) |x=0 = −1, (sinx)(4k) |x=0 = 0.

Aj keď zatiaľ nevieme, aké n zvolíme, v chybovom člene R(n)f (x) vystupuje hodnota f(n+1)(ξ), pre ktorú môžeme smelo písať odhad |f(n+1)(ξ)|≤1. Takže

vieme, že

|R(n)f (0,2)| ≤ 1

(n+ 1)!| (0,2− 0)n+1 | = 0,2n+1

(n+ 1)!.

Keďže chceme, aby chyba bola menšia ako 0,001 musíme nájsť n, pre ktoré |R(n)f (0,2)|<0,001. Ľahko spočítame, že 0,23

3!>0,001 a 0,24

4!<0,001. Stačí teda

voliť n=3 a dostaneme

sin 0,2 ≈ T(3)(0,2) = sin 0 + cos 0 · 0,2− 1

2sin 0 · 0,22 − 1

6cos 0 · 0,23 = 0,2− 1

60,008

.= 0,198667,

čo je hľadaná hodnota. Pre porovnanie vypočítajme kalkulačkou hľadanú hodnotu: sin 0,2.= 0,198669, aby sme videli dosiahnutú presnosť. A ešte pre

jedno porovnanie skúsme n=2

sin 0,2 ≈ T(2)(0,2) = sin 0 + cos 0 · 0,2− 1

2sin 0 · 0,22 = 0,2

a vidíme, že chyba je väčšia ako 0,001.

Kapitola 2. (Interpolácia a aproximácia) – 12

Page 52: 14.Numericka matematika a amatematicka statistika

Taylorov polynóm však vieme využiť aj abstraktne na nájdenie vzorcov pre aproximáciu derivácie funkcie v niektorých jej bodoch. Podstatu aproximačnýchvzorcov vysvetlíme na príklade s n=1 v (2.9), kde za x0 dosadíme x a za x dosadíme x+h pre vhodné malé číslo h (obyčajne hx). Dostaneme

f(x+ h) = f(x) + f ′(x)h+f ′′(ξ)

2h2 a po úprave

∣∣∣∣ f(x+ h)− f(x)

h− f ′(x)

∣∣∣∣ =

∣∣∣∣ f ′′(ξ)2

∣∣∣∣h < C h, (2.10a)

kde sme využili ohraničenosť druhej derivácie našej funkcie neznámou konštantou C. Aj keď túto konštantu nepoznáme, zo vzorca je zrejmý aproximačnýrád, ktorý je určený členom h. Vzorec vlastne hovorí, že ak h dvakrát zmenšíme, zmenší sa aj chyba v aproximačnom vzorci dvakrát, pretože aproximačnývzorec môžeme písať ako

f ′(x) ≈ f(x+ h)− f(x)

h(2.10b)

a člen Ch predstavuje chybu aproximácie. Je dobré si uvedomiť, že ak vyjadríme vo všeobecnosti chybu ako Chn, pre n>1, vzorec bude lepší, lebo preh malé (h<1) je hn<h. Pravda, konštanta C je iná.

Podobným spôsobom môžeme odvodiť aj ďalšie vzorce pre aproximáciu prvej derivácie

f ′(x) ≈ f(x+ h)− f(x− h)

2h, f ′(x) ≈ −f(x+ 2h) + 4f(x+ h)− 3f(x)

2h, f ′(x) ≈ f(x− 2h)− 4f(x− h) + 3f(x)

2h, (2.11)

v ktorých je chyba úmerná členu h2, a tiež vzorce pre derivácie vyšších rádov, napr. pre druhú deriváciu dostaneme vzorec tiež s chybou rádu h2

f ′′(x) ≈ f(x+ h)− 2f(x) + f(x− h)

h2. (2.12)

Príklad 2.10 Odvoďme vzorec (2.12) a posledný vzorec z (2.11).

Riešenie. Najprv sa pozrime na vzorec pre druhú deriváciu. Použime vzťah (2.9) pre n=3 a zapíšme ho pre x+h aj pre x−h

f(x+ h) = f(x) + f ′(x)h+f ′′(x)

2h2 +

f ′′′(x)

6h3 +

fIV (ξ+)

24h4,

f(x− h) = f(x)− f ′(x)h+f ′′(x)

2h2 − f ′′′(x)

6h3 +

fIV (ξ−)

24h4.

Ak obe rovnice sčítame a upravíme, dostaneme

f(x+ h) + f(x− h) = 2f(x) + f ′′(x)h2 +fIV (ξ+)

24h4 +

fIV (ξ−)

24h4 a teda

∣∣∣∣ f(x+ h)− 2f(x) + f(x− h)

h2− f ′′(x)

∣∣∣∣ < C h2

Kapitola 2. (Interpolácia a aproximácia) – 13

Page 53: 14.Numericka matematika a amatematicka statistika

z čoho vidíme aproximačný vzorec

f ′′(x) ≈ f(x+ h)− 2f(x) + f(x− h)

h2

aj jeho rád aproximácie h2.

Podobne pre druhý zo vzorcov použime vzťah (2.9) pre n=2 a zapíšme ho pre x−2h aj pre x−h

f(x− 2h) = f(x)− 2f ′(x)h+ 4f ′′(x)

2h2 − 8

f ′′′(ξ2)

6h3,

f(x− h) = f(x)− f ′(x)h+f ′′(x)

2h2 − f ′′′(ξ1)

6h3.

Rovnice teraz musíme sčítať tak, aby členy s druhými deriváciami vypadli. Vidíme, že stačí druhú vynásobiť (−4), pričítať k prvej a upraviť

f(x− 2h)− 4f(x− h) = −3f(x) + 2f ′(x)h− 8f ′′′(ξ2)

6h3 + 4

f ′′′(ξ1)

6h3 a teda

∣∣∣∣ f(x− 2h)− 4f(x− h) + 3f(x)

2h− f ′(x)

∣∣∣∣ < C h2.

Opäť teda máme aproximačný vzorec rádu h2, ktorý vyzerá nasledovne

f ′(x) ≈ f(x− 2h)− 4f(x− h) + 3f(x)

2h.

Všetky uvedené vzorce vieme v prípade, že hodnoty funkcie y = f(x) máme dané tabuľkou súradníc [xi, yi],i=0, 1, . . . n, s vlastnosťou xi+1−xi=h,vyjadriť pomocou konečných diferencií použitím tabuľky diferencií tab. 2.1. Najjednoduchšie to je vidieť na vzorci (2.10b), kde x=xi, x+h=xi+1 ayi=f(xi)

f ′(xi) ≈f(xi+1)− f(xi)

h=yi+1 − yi

h=

∆yih. (2.13)

Podobne vieme vyjadriť pomocou konečných diferencií aj ostatné vzorce zo vzťahov (2.11) a (2.12) (podľa poradia)

f ′(xi) ≈∆yi + ∆yi−1

2h, f ′(xi) ≈

−∆yi+1 + 3∆yi2h

, f ′(xi) ≈−∆yi−2 + 3∆yi−1

2h, f ′′(xi) ≈

∆2yi−1h2

. (2.14)

Kapitola 2. (Interpolácia a aproximácia) – 14

Page 54: 14.Numericka matematika a amatematicka statistika

Príklad 2.11 Odvoďme posledné dva vzorce z (2.14).

Riešenie. V prvom prípade vychádzame z posledného vzorca v (2.11), ktorý upravíme pre x=xi

f ′(xi) ≈f(xi − 2h)− 4f(xi − h) + 3f(xi)

2h=

f(xi−2)− 4f(xi−1) + 3f(xi)

2h=yi− 2− 4yi−1 + 3yi

2h=−yi−1 + yi− 2 + 3yi − 3yi−1

2h=−∆yi−2 + 3∆yi−1

2h.

V druhom prípade zas upravíme vzorec (2.12) pre x=xi

f ′′(xi) ≈f(xi + h)− 2f(xi) + f(xi − h)

h2=yi+1 − 2yi + yi−1

h2=

∆yi −∆yi−1h2

=∆2yi−1h2

.

Z tých najjednoduchších vzorcov pre prvú a druhú deriváciu môžeme usúdiť relatívne správny uzáver, že diferencia rádu n delená hn aproximuje hodnotun-tej derivácie danej funkcie v príslušnom bode. Naviac, vhodný vážený priemer rôznych diferencií rovnakého rádu môže zvýšiť aproximačný rád vzorca,ako sme videli napr. v (2.14)3.

Príklad 2.12 Odhadnime pomocou diferenčných formúl hodnotu prvej a druhej derivácie funkcie y= tanhx v bode x = 1,12.

Riešenie. Zvoľme h=0,01 a použime tieto približné vzorce pre derivácie:

f ′(xi) ≈∆yih

(s chybou ∼ h), f ′(xi) ≈−∆yi+1 + 3∆yi

2h(∼ h2), f ′′(xi) ≈

∆2yi−1h2

(∼ h2).

Keďže napr. v poslednom vzorci pre dosiahnutie presnosti potrebujeme druhú diferenciu počítať aspoň s presnosťou h4, počítajme hodnoty funkciey= tanhx na deväť desatinných miest. Tabuľku diferencií pripravme pre N=3 s x0 = 1,11 kvôli potrebám pre odhad druhej derivácie.

x 1,11 1,12 1,13 1,14y 0,804062391 0,807568917 0,811019262 0,814414094

∆y 0,003506526 0,003450345 0,003394832∆2y −0,000056181 −0,000055513∆3y 0,000000668

Číselné odhady derivácií podľa uvedených vzorcov sú

f ′(1,12) = f ′(x1) ≈∆y10,01

= 0,345 (s chybou ∼ 0,01),

Kapitola 2. (Interpolácia a aproximácia) – 15

Page 55: 14.Numericka matematika a amatematicka statistika

f ′(1,12) = f ′(x1) ≈−∆y2 + 3∆y1

0,02=−0,003394832 + 3·0,003450345

0,02= 0,34781 (s chybou ∼ 0,0001),

f ′′(1,12) = f ′′(x1) ≈∆2y0

0,0001= −0,56181 (s chybou ∼ 0,0001).

Pre porovnanie uveďme aj analytické hodnoty týchto derivácií

f ′(1,12) =1

cosh2 1,12

.= 0,347832445, f ′(1,12) = −2 sinh 1,12

cosh3 1,12

.= −0,561797341

a vidíme, že ani v jednom prípade chyba nepresiahla uvedené hodnoty, aj keď sme mali k dispozícii iba rádový odhad chyby.

Interpolácia a aproximácia – Numerické integrovanie

Vypočítajme integrál, pre ktorý nemáme vzorec, či funkcia je daná len v istých bodoch

Vo všeobecnosti nie stále vieme nájsť exaktne primitívnu funkciu k danej funkcii f(x). V niektorých prípadoch, aj keď by sme to teoreticky vedeli zvládnuť,prakticky by tento výpočet mohol byť príliš zložitý. V technickej praxi sa stretávame väčšinou s problémom výpočtu určitého integrálu a vtedy postačujev konkrétnych aplikáciách aj jeho približná hodnota vypočítaná s dostatočne malou chybou.

Pre numerický výpočet určitého integrálu∫ b

a

f(x) dx kde funkcia f(x) je spojitá a dostatočne hladká na intervale < a; b >, uvedieme na tomto mieste v

praxi dve najjednoduchšie a často používané metódy, a to lichobežníkovú a potom Simpsonovu, ktorá je síce trochu zložitejšia, ale aj presnejšia. Stranounateraz necháme ďalšie okruhy problémov súvisiace s numerickým výpočtom nevlastných, či viacnásobných integrálov.

Zoznámme sa najprv s Lichobežníkovou metódou. Predpokladajme delenie intervalu < a; b > na N rovnakých častí a v N+1 uzlových bodoch xi,i = 1, ..., N + 1 uvažujme funkčné hodnoty

fi = f(xi), i = 1, ..., N + 1, kde

xi = a, h = b−aN

xi+1 = xi + h, i = 1, ..., N.

Pravidlo pre približný výpočet určitého integrálu IL podľa lichobežníkovej metódy je potom dané vzorcom:∫ b

a

f(x) dx ≈ IL, kde IL =h

2(f1 + 2f2 + 2f3 + ...+ 2fN + fN+1). (2.15)

Kapitola 2. (Interpolácia a aproximácia) – 16

Page 56: 14.Numericka matematika a amatematicka statistika

Obr. 2.4: Princíp aproximácie výpočtu určitého integrálu lichobežníkovou metódou.

Odvodenie vzorca vychádza z geometrickej interpretácie lichobežníkovej metódy a je znázornené na obrázku Obr.2.4. Hodnota IL v tomto prípadepredstavuje súhrnný obsah ôsmych lichobežníkov (N = 8). Prvý lichobežník je daný vrcholmi [x1, x2, f2, f1], druhý [x2, x3, f3, f2], atď. Ak funkcia f(x)je dvakrát spojite diferencovateľná na (a; b), dá sa dokázať, že existuje taký bod ξ∈(a; b), pre ktorý platí:∫ b

a

f(x) dx = IL +RL, kde RL = −(b− a)3

12N2f ′′(ξ). (2.16)

Ak pokračujeme v duchu aproximácie funkcie ako na obr. 2.4, namiesto úsečiek použijeme časti parabol a dostaneme Simpsonovu metódu. Predpokladajmeto isté delenie intervalu ako v lichobežníkovej metóde spolu s tým istým označením uzlov a funkčných hodnôt. Pravidlo pre približný výpočet určitéhointegrálu IS podľa Simpsonovej metódy (je definovaná len pre N párne), je potom dané vzorcom:∫ b

a

f(x) dx ≈ IS, kde IS =h

3(f1 + 4f2 + 2f3 + 4f4 + 2f5 + 4f6 + ...+ 4fN + fN+1). (2.17)

Geometrická interpretácia Simpsonovej metódy je znázornená na obrázku Obr.2.5. Hodnota IS v tomto prípade predstavuje súhrnný obsah pod štyrmiparabolickými úsekmi. Prvá parabola je daná bodmi [f1, f2, f3], druhá [f3, f4, f5], atď.. Ak funkcia f(x) je štyrikrát spojite diferencovateľná na (a; b),dá sa dokázať, že existuje taký bod ξ∈(a; b), pre ktorý platí:∫ b

a

f(x) dx = IS +RS kde RS = −(b− a)5

180N4f IV (ξ). (2.18)

Kapitola 2. (Interpolácia a aproximácia) – 17

Page 57: 14.Numericka matematika a amatematicka statistika

Obr. 2.5: Princíp aproximácie výpočtu určitého integrálu Simpsonovou metódou.

Príklad 2.13 Vypočítajte približnú hodnotu integrálu pre N = 6 a odhadnite chybu výsledku pri použití oboch metód∫ 1,8

0

ln(1 + 2x) dx.

Riešenie. Najprv použijeme Lichobežníkovú metódu. V prvom kroku odhadneme chybu výsledku, a tak určíme f ′′(x) = −4(2x+1)−2. Pretože f ′′(0) = −4;f ′′(1.8) = −0, 189 a f ′′(x) je na intervale < 0; 1, 8 > rastúca, platí na danom intervale: max |f ′′(x)| = 4. Potom pre výpočet odhadu chyby RL,vzorec (2.16), platí:

|RL| ≤(b− a)3

12N2max |f ′′(x)| = 1, 83

12 · 62· 4 = 0, 054 ≤ 0, 06 = ε

a teda chyba dosiahnutého výsledku bude menšia ako 0, 06.

Približnú hodnotu daného integrálu potom vypočítame podľa vzorca (2.15), pričom rozdelíme interval < 0; 1, 8 > na N = 6 rovnakých častí a v taktozískaných 7 uzlových bodoch vyrátame príslušné funkčné hodnoty. Výsledky sú uvedené v Tabuľke (2.2). Dosadením hodnôt fi z Tabuľky 2.2 do vzťahu(2.15) dostaneme:

IL =0, 3

2(0 + 2 · 0, 47 + 2 · 0, 788 + 2 · 1, 03 + 2 · 1, 224 + 2 · 1, 386 + 1, 526) = 1, 6983

Teraz skúsme to isté vypočítať Simpsonovou metódou. Najprv odhadneme chybu výsledku a tak určíme f IV (x) = −96(2x+ 1)−4.Podobným spôsobom,ako v predchádzajúcom prípade ľahko zistíme, že na danom intervale platí: max |fIV (x)| = 96. Potom pre výpočet odhadu chyby RS s použitím

Kapitola 2. (Interpolácia a aproximácia) – 18

Page 58: 14.Numericka matematika a amatematicka statistika

Tabuľka 2.2:i 1 2 3 4 5 6 7xi 0 0,3 0,6 0,9 1,2 1,5 1,8fi 0 0,47 0,788 1,03 1,224 1,386 1,526

vzťahu (2.18) platí:

|RS| ≤(b− a)5

180N4max |f IV (x)| = 1, 85

180 · 64· 96 = 0, 0077 ≤ 0, 008 = ε

a teda chyba dosiahnutého výsledku bude menšia ako 0, 008.

Dosadením hodnôt fi z Tabuľky 2.2 do vzťahu (2.17) dostaneme:

IS =0.3

3(0 + 4 · 0, 47 + 2 · 0, 788 + 4 · 1, 03 + 2 · 1, 224 + 4 · 1, 386 + 1, 526) = 1, 70943

Presná hodnota daného integrálu (v tomto prípade sa dá určiť) je:∫ 1,8

0

ln(1 + 2x) dx =1

2

∫ 4,6

1

ln(z) dz =1

2[z · ln(z)]41, 6 = 0, 5 · [4, 6 · ln(4, 6)− 3, 6] ≈ 1, 70993.

K tejto hodnote je (podľa očakávania) bližšie výsledok dosiahnutý Simpsonovou metódou.

Príklad 2.14 S presnosťou ε = 0, 001 a použitím oboch metód vypočítajte približnú hodnotu integrálu∫ 0,5

0

e−x2

dx.

Riešenie. Opäť začneme lichobežníkovou metódou. Najprv musíme určiť najmenšie N také, pre ktoré bude podmienka dodržania predpísanej presnostiuž platiť. Preto vypočítame f ′′(x) = 2e−x

2(2x2 − 1). Dá sa ukázať, že na danom intervale je max |f ′′(x)| = 2. Ak pre výpočet odhadu chyby RL

použijeme (2.16), platí:(b− a)3

12N2max |f ′′(x)| < ε

a ďalej, pretože |RL| < ε a súčasne |RL| ≤ (b−a)312N2 max |f ′′(x)|, platí aj

N >

√(b− a)3

12 · εmax |f ′′(x)| =

√0, 5

12 · 0, 001· 2 = 4, 56.

Kapitola 2. (Interpolácia a aproximácia) – 19

Page 59: 14.Numericka matematika a amatematicka statistika

Zvoľme teda N = 5. Potom približnú hodnotu daného integrálu znovu vypočítame podľa vzorca (2.15), pričom rozdelíme interval < 0; 1, 8 > na N = 5rovnakých častí a v takto získaných 6 uzlových bodoch vyrátame príslušné funkčné hodnoty. Výsledky sú uvedené v Tabuľke (2.3). Dosadením hodnôt

Tabuľka 2.3:i 1 2 3 4 5 6xi 0 0,1 0,2 0,3 0,4 0,5fi 1 0,99 0,9608 0,9139 0,8521 0,7788

fi z Tabuľky 2.2 do vzťahu (2.15) dostaneme IL = 0, 46062.

Podobne v Simpsonovej metóde, najprv určíme najmenšie N také, pre ktoré bude podmienka dodržania predpísanej presnosti už platiť. Preto vypočítamef IV (x) = 4 exp−x2(3 − 12x2 + 4x4). Dá sa ukázať, že na danom intervale je max |f IV (x)| = 12. Ak pre výpočet odhadu chyby RS, vzorec (2.18),platí:

(b− a)5

180N4max |f IV (x)| < ε

a ďalej, pretože |RS| < ε a súčasne |RS| ≤ (b−a)5180N4 max |f IV (x)|, platí aj

N >4

√(b− a)5

180 · εmax |f ′′(x)|

Z poslednej nerovnosti je možné určiť, že pre nasledujúci výpočet stačí položiť N = 2. Dosadením príslušných hodnôt fi do vzťahu (2.17) dostaneme,že IS = 0,25

3(1 + 4 · 0, 9394 + 0, 7788) = 0, 4614.

Príklad 2.15 Lichobežníkovou metódou vypočítajte integrál∫ 3

2ex

xdx s presnosťou ε=0,01.

Riešenie. Prvým krokom v riešení je zistenie počtu dielikov N delenia intervalu v súvislosti s presnosťou výpočtu podľa vzorca (2.16). K tom potrebujemedruhú deriváciu integrovanej funkcie

f(x) =ex

x, f ′′(x) =

ex

x3(x2 − 2x+ 2

)odhadnúť na intervale 〈2; 3〉. Jednou z možností je nájsť jej maximum na tomto intervale, teda zistiť hodnoty v krajných bodoch intervalu a v stacionárnychbodoch f ′′, ak na intervale existujú. Stacionárne body xSB vyhovujú podmienke

f ′′′(xSB) =exSB

x4SB

(x3SB − 3x2SB + 6xSB − 6

)= 0⇔ g(xSB) =

(x3SB − 3x2SB + 6xSB − 6

)= 0.

Kapitola 2. (Interpolácia a aproximácia) – 20

Page 60: 14.Numericka matematika a amatematicka statistika

Funkcia g je rastúca, pretože jej derivácia g′(x)=3x2 − 6x + 6=3(x − 1)2 + 3 je kladná, a v krajných bodoch intervalu má kladné hodnoty (g(2)=2,g(3)=12). A tak stacionárny bod funkcie f ′′ na intervale 〈2; 3〉 neexistuje a maxx∈〈2;3〉 |f ′′(x)|= max(|f ′′(2)|, |f ′′(3)|)= max( e

2

4, 5e

3

27).=3,7195. Parameter

N určíme zo vzťahu

N >

√(3− 2)3

12 · 0,013,7195

volíme⇒ N = 6, h =3− 2

N.= 0,167.

Približnú hodnotu IL integrálu dostaneme dosadením funkčných hodnôt funkcie v bodoch delenia intervalu, uvedených v tabuľke, do vzorca

x 2 2,167 2,333 2,5 2,667 2,833 3f(x) 3,6945 4,0288 4,4196 4,8730 5,3970 6,0007 6,6952

∫ 3

2

ex

xdx ≈ 0,167

(1

23,6945 + 4,0288 + 4,4196 + 4,8730 + 5,3970 + 6,0007 +

1

2, 6,6952

).= 4,986.

Pritom je zrejmé, že platí ∣∣∣∣∫ 3

2

ex

xdx− 4,986

∣∣∣∣ < 0,01.

Dodajme, že ak by sme chceli mať N=10, možeme odhadnúť chybu vzťahom

|RL| <(3− 2)3

12 1023,7195

.= 0,003

a urobiť trochu presnejší výpočet.

Na záver preN=10 odhadnime aj chybu, ktorej sa dopustíme pri použití Simpsonovej metódy vzorcom (2.18). K tomu potrebujeme určiť maxx∈〈2;3〉 |f IV (x)|.Štvrtá derivácia je trocha zložitejšia, preto urobme pre ňu niekoľko odhadov (pre x ∈ 〈2; 3〉)

|f IV (x)| = ex

x5∣∣x4 − 4x3 + 12x2 − 24x+ 24

∣∣ =ex

x5∣∣x3(x− 2) + 2x2(3− x) + 6(x− 2)2

∣∣<

ex

x5(∣∣x3(x− 2)

∣∣+∣∣2x2(3− x)

∣∣+∣∣6(x− 2)2

∣∣) < ex

x5(27 + 18 + 6) <

e2

2551

.= 11,776.

Chybu výpočtu určíme zo vzťahu

|RS| <(3− 2)5

180 10411,776

.= 0,000006

Kapitola 2. (Interpolácia a aproximácia) – 21

Page 61: 14.Numericka matematika a amatematicka statistika

a porovnaním s predchádzajúcou metódou vidíme, že by sme dostali výsledok s chybou aspoň päťstokrát menšou (a to je odhad maxima relatívne hrubý).

Pokiaľ máme za úlohu vypočítať určitý integrál∫ baf(x) dx či už lichobežníkovou alebo Simpsonovou metódou, pri hľadaní nutného minimálneho počtu

deliacich bodov môže niekedy nastať problém s určením maxima pre druhú, resp. štvrtú deriváciu danej integrovanej funkcie tak, ako sme videli vposlednom príklade. S cieľom obísť túto obtiažnosť v niektorých prípadoch sa v praxi často používa ďalej popísaná metóda dvojnásobného prepočtu.Jej podstata spočíva v tom, že pri ľubovoľnej prvej voľbe počtu delenia N pri použtí lichobežníkovej, resp. Simpsonovej metódy vypočítame približnúhodnotu daného určitého integrálu IN a následne ďalšiu I2N s počtom deliacich bodov 2N . Ak je pritom splnená podmienka |I2N − IN | < ε, potom akopribližné riešenie môžeme považovať hodnotu I2N . V opačnom prípade vypočítame nasledujúcu aproximáciu I4N s počtom deliacich bodov 4N . Tentoproces opakujeme, pokiaľ pre niektoré k = 2, 3, 4, ... nebude splnená podmienka |I2kN − I2(k−1)N | < ε, a vtedy ako približné riešenie považujeme I2kN .

Príklad 2.16 Vypočítajte metódou dvojnásobného prepočtu s oboma numerickými metódami približnú hodnotu integrálu s presnosťou ε = 0, 01∫ π2

0

cosx√

3− x dx.

Riešenie. Tabuľka (2.4) obsahuje funkčné hodnoty (pre našu úlohu) v dostatočnom počte uzlových bodov. V oboch metódach začneme s N=2. Pripoužití lichobežníkovej metódy dostávame:

I2 =π

8(1, 732 + 2x1, 052 + 0) = 1, 5064

a pre N = 4:I4 =

π

16(1, 732 + 2x1, 492 + 2x1, 052 + 2x0, 517 + 0) = 1, 5421.

Pretože |I4 − I2| > 0, 01, musíme pokračovať ďalej a vypočítame hodnotu I8 = 1, 5508. Keďže |I8 − I4| < 0, 01, hodnotu I8 = 1, 5508 môžemepovažovať za dostatočne presnú aproximáciu hľadaného riešenia vzhľadom k danej požadovanej presnosti.

Tabuľka 2.4:i 1 2 3 4 5 6 7 8 9xi 1 π

162 π16

3 π16

4 π16

5 π16

6 π16

7 π16

8 π16

9 π16

fi 1,732 0,642 1,492 1,291 1,052 0,789 0,517 0,249 0

V prípade Simpsonovej metódy dostávame:I2 =

π

12(1, 732 + 4x1, 052 + 0) = 1, 551

Kapitola 2. (Interpolácia a aproximácia) – 22

Page 62: 14.Numericka matematika a amatematicka statistika

a pre N = 4:I4 =

π

24(1, 732 + 4x1, 492 + 2x1, 052 + 4x0, 517 + 0) = 1, 554.

Pretože |I4 − I2| < 0, 01, hodnotu I4 = 1, 554 môžeme považovať za dostatočne presnú aproximáciu hľadaného riešenia vzhľadom k danej požadovanejpresnosti.

Samohodnotiace otázky a úlohy na samostatné riešenie

1. Skúste sa zamyslieť nad tým, ako by vyzeral iný typ interpolácie polynómom ako je Lagrangeov polynóm!

2. Viete interpretovať rovnicu (2.2) pomocou „princípu superpozície“?

3. Implementujte postup z pr. 2.5 pre n=3! Dokážete to aj pre všeobecné n? K tomu je potrebný vzorec pre yi uvedený na konci príkladu. Ukážetejeho platnosť?

4. Dokázali by ste implementovať metódu najmenších štvorcov aj pre aproximáciu inou funkciou ako je polynóm?

5. Aký je najvyšší stupeň polynómu, ktorý pri zadanom počte bodov n môžeme nájsť metódou najmenších štvorcov?

6. Dokážte ostatné vzťahy v (2.11)! Zostavíte podobné vzťahy pre vyššie derivácie? Viete prepísať nájdené vzťahy pomocou diferencií?

7. Popíšte základný rozdiel medzi lichobežníkovou a Simpsonovou metódou v zmysle dosiahnutej presnosti výpočtu! V čom spočíva hlavná príčinu väčšíchťažkostí pri odhade chyby u Sipsonovej metódy oproti lichobežníkovej?

8. Aký je hlavný prínos metódy dvojnásobného prepočtu?

V úlohách 1. až 4. nájdite Lagrangeov interpolačný polynóm určený danými bodmi.

1.x -1 0 2y 6 7 15

. 2.x 0 1 3 6y 3 2 6 -9

.

3.x -1 0 1y 2 1 2

. 4.x -2 0 1 3y 27 5 6 2

.

Kapitola 2. (Interpolácia a aproximácia) – 23

Page 63: 14.Numericka matematika a amatematicka statistika

V úlohách 5. až 8. pomocou Newtonovho vzorca interpolujte hodnotu funkčnej závislosti v bode x0 zo všetkých zadaných hodnôt.

5. x0 = 1,25,x 1,1 1,2 1,3 1,4y 0,89 0,93 0,96 0,95

. 6. x0 = 107,x 100 105 110 115 120y 1,094 1,3151 1,504 1,782 2,221

.

7. x0 = 1,15,x 1,1 1,2 1,3y 0,371 0,370 0,382

. 8. x0 = 1002,x 1000 1010 1020 1030 1040y 3,000 3,143 3,386 3,737 3,933

.

V úlohách 9. až 12. danými bodmi preložte lineárnu alebo kvadratickú funkciu v zmysle metódy najmenších štvorcov.

9.x 0 1 2 3 4y 0 0,9 1,9 3,1 4,2

. 10.x -2 -1 0 1 2y 4,8 0,9 1,1 2,1 4,2

.

11.x 2 3 5 7 8y 8 10 15 22 25 . 12.

x 16 17 19 22 23 23 24 25 25 27y 51 57 55 62 61 66 72 74 77 82

.

V úlohách 13. až 16. pre funkciu zadanú tabuľkou odhadnite hodnoty prvej a druhej derivácie v prvých dvoch bodoch tabuľky pomocou rôznychdiferenčných formúl.

13.x 0 0,1 0,2 0,3 0,4y 0,001 0,096 0,182 0,262 0,334

. 14.x 1,1 1,2 1,3 1,4y 0,89 0,93 0,96 0,95

.

15.x 100 105 110 115 120y 1,094 1,3151 1,504 1,782 2,221

. 16.x 1 1,05 1,1 1,15 1,2y 2,719 2,863 3,002 3,157 3,321

.

V úlohách 17. až 20. pomocou rôznych diferenčných formúl odhadnite hodnoty prvých dvoch derivácií funkcií f v danom bode x0.

17. f(x) = ln(1 + x), x0 = 0,1 . 18. f(x) = xx, x0 = 1,02 .

19. f(x) = sinx, x0 = 1,3 . 20. f(x) = cosh x, x0 = 4,24 .

Kapitola 2. (Interpolácia a aproximácia) – 24

Page 64: 14.Numericka matematika a amatematicka statistika

V úlohách 21. až 23. vypočítajte lichobežníkovou metódou pre N = 8 integrály a odhadnite chybu.

21.∫ 1

0,2

ln(1 + x2) dx . 22.∫ 3,4

1

√1 + x3 dx . 23.

∫ 0,8

0

ex

x+ 4dx .

V úlohách 24. až 26. vypočítajte lichobežníkovou metódou s presnosťou ε = 0, 01 nasledujúce integrály.

24.∫ 3

1

√xe√x dx . 25.

∫ 5

4

(2x+ 3√

1 + 4x) dx . 26.∫ 0

−0,3xe3x

2

dx .

V úlohách 27. až 29. vypočítajte Simpsonovou metódou pre N = 6 integrály a odhadnite chybu.

27.∫ 0

−3

1

x+ 5dx . 28.

∫ 2

−0,5

cosx

x+ 2dx . 29.

∫ 0,6

0

ex2

dx .

V úlohách 30. až 32. vypočítajte Simpsonovou metódou s presnosťou ε = 0, 001 nasledujúce integrály.

30.∫ 3

2

√5x− 2 dx . 31.

∫ 0

−2e2+3x dx . 32.

∫ 1,5

1

(1

x+ cos 2x) dx .

V úlohách 33. až 39. vypočítajte s danou presnosťou nasledujúce integrály.

33.∫ 0,7

0

sinx2 dx; ε = 0, 001 . 34.∫ 0,1

−0,3cosx2 dx; ε = 0, 005 . 35.

∫ 0,5

0,1

√x− x2 dx; ε = 0, 001 .

36.∫ 1,2

−1x2 sin 4x dx; ε = 0, 05 . 37.

∫ 1

0

ex cosx

2dx; ε = 0, 03 . 38.

∫ 1

0,5

arctanx

xdx; ε = 0, 001 .

39.∫ 1

0

ln 2 + x2

2 + x2dx; ε = 0, 01 .

Kapitola 2. (Interpolácia a aproximácia) – 25

Page 65: 14.Numericka matematika a amatematicka statistika

Záver

V kapitole sme sa venovali základným metódam aproximácie pomocou polynómu. Naučili sme sa hľadať polynóm určený danými bodmi, pričom viemezistiť, podľa toho, čo nás zaujíma, rovnicu polynómu alebo iba jeho niektorú hodnotu. Použitý typ interpolácie sme nazvali Lagrangeova interpolácia,pretože sme vychádzali zo znalosti hodnôt polynómu v zadaných bodoch. Ďalej sme hľadali polynóm malého stupňa, ktorý aproximuje zadané hodnoty.Stupeň polynómu určuje počet neznámych parametrov funkcie, a ten chceme mať v praxi čo najmenší. V tomto kontexte sme sa oboznámili s veľmiužitočnou metódou najmenších štvorcov, s ktorou sa ešte stretneme v rámci tohto kurzu v matematickej štatistike. Nakoniec sme venovali priestoraproximácii derivácie funkcie, pri ktorej využívame vzorce odvodené na základe Taylorovej vety a pozreli sme sa tiež na niektoré základné metódy prepribližné určenie hodnoty určitého integrálu vychádzajúce z Lagrangeovej interpolácie.

Literatúra

[1] Budinský, B., Charvát, J.: Matematika I, Praha 1987.

[2] Charvát J., Hála M., Šibrava Z.: Příklady k Matematice I, ČVUT Praha, 2002.

[3] Eliáš J., Horváth J., Kajan J.: Zbierka úloh z vyššej matematiky, časť I. (3.vyd.1980), Alfa, Bratislava.

[4] Ivan, J.: Matematika I, Bratislava 1983.

[5] Kreyszig, E.: Advanced Engineering Mathematics, New York 1993.

[6] Šoltés V., Juhásová Z.: Zbierka úloh z vyššej matematiky I, Košice 1995.

[7] G. I. Marčuk Metody numerické matematiky. Academia, Praha, 1987.

[8] A. Ralston Základy numerické matematiky. Academia, Praha, 1978

Riešenia úloh

Odpovede na samohodnotiace otázky, ak ich neviete sformulovať, a aj mnohé iné odpovede nájdete v odporúčanej literatúre.

1. x2+2x+7 2. −25x3+13

5x2−16

5x+3 3. x2+1 4. −x3+3x2−x+5 5. 0,9481 6. 1.3866 7. 0,3689 8. 3,0301 9. f(x)=1,06x−0,1

10. f(x)=0,9143x2+0x+0,7914 11. f(x)=0,1531x2+1,3540x+4,6075 12. f(x)=2,6266x+7,6526

17. napr. pre h=0,01 podľa (2.14)2 f ′(0,1)=0,909, podľa (2.14)4 f ′′(0,1)=0,827 18. napr. pre h=0,01 podľa (2.14)2 f ′(0,1)=1,041, podľa (2.14)4

Kapitola 2. (Interpolácia a aproximácia) – 26

Page 66: 14.Numericka matematika a amatematicka statistika

f ′′(0,1)=2,062 19. napr. pre h=0,01 podľa (2.14)2 f ′(0,1)=0,268, podľa (2.14)4 f ′′(0,1)=−0,964 20. napr. pre h=0,01 podľa (2.14)2 f ′(0,1)=34,696,podľa (2.14)4 f ′′(0,1)=34,711 21. y′′ = 2(1−x2)

(1+x2)2, ε ≈ 0, 002, I ≈ 0, 2618 22. y′′ = 3x(4+x3)

(4(1+x3)1,5), ε ≈ 0, 05, I ≈ 8, 578 23. y′′ =

ex( 1(4+x)

− 2(x + 4)2 + 2(4+x)3

), ε ≈ 0, 02, I ≈ 0, 276 24. N = 9, I ≈ 11, 933 25. N = 1, I ≈ 11, 665 27. y(4) = 24(5+x)5

, ε ≈ 0, 0008,I ≈ 0, 9164 28. ε ≈ 0, 0005, I ≈ 0, 64852 29. ε ≈ 0, 000015,I ≈ 0, 6804991 30. N = 2, I ≈ 3, 2326 31. N = 20, I ≈ 2, 45733. lich. N = 8, I ≈ 0, 1132, Simpson N = 4, I ≈ 0, 1124 35. lich. N = 8, I ≈ 0, 1756, Simpson N = 4, I ≈ 0, 1756 38. I ≈ 0, 428739. I ≈ 0, 359

Kapitola 2. (Interpolácia a aproximácia) – 27

Page 67: 14.Numericka matematika a amatematicka statistika

Kapitola 3. (Diferenciálne rovnice)

Poslanie

Riešiť obyčajné diferenciálne rovnice prvého rádu so začiatočnou podmienkou

Ciele

1. Oboznámiť sa so všeobecným princípom numerických metód pre riešenie diferenciálnych rovníc.

2. Definovať všeobecné m-bodové metódy typu Runge-Kutta.

3. Aplikovať všeobecné vzorce na špeciálne metódy: Eulerova, Heuneova, Rungeova-Kuttova.

Prerekvizičné znalosti

diferenciálne rovnice prvého rádu; aproximácia derivácie

Diferenciálne rovnice – Numerické metódy pre riešenia Cauchyho úlohy

Mnoho fyzikálnych veličín je spojených diferenciálnymi vzťahmi, ktorých rozbor ukáže na závislosť medzi nimi.

Pod pojmom Cauchyho úloha v oblasti diferenciálnych rovníc sa myslí obyčajná diferenciálna rovnica prvého rádu u′ = f(t, u), kde u(t) je hľadaná reálnafunkcia jednej reálnej premennej, ktorá spĺňa nejakú začiatočnú podmienku u(t0) = u0. Tieto rovnice sú v praxi určené nejakou fyzikálnou závislosťoua analýzou tekejto závislosti vieme potom vyhodnotiť vzťahy medzi týmito fyzikálnymi veličinami, napr. časový vývin teploty. A presne takúto úlohumá riešenie Cauchyho úlohy. Problém s diferenciálnymi rovnicami je, že málokrát sa podarí nájsť analytické riešenie. Numerickými metódami nie je sícemožné určiť hľadanú funkciu analyticky, napr. v implicitnom tvare ako všeobecné riešenie na nejakom zvolenom intervale, ale len na konečnej množineizolovaných, v matematike nazývaných aj diskrétnych uzlových bodov. Hľadané funkčné hodnoty v týchto uzlových bodoch sú pritom vypočítavané len

Kapitola 3. (Diferenciálne rovnice) – 1

Page 68: 14.Numericka matematika a amatematicka statistika

približne.

Uvažujme diferenciálnu rovnicu tvaru

u′(t) = f(t, u(t)), pre t > t0, spĺňajúcu začiatočnú podmienku u(t0) = u0. (3.1)

Pri numerickom riešení však nemôžeme počítať funkciu do nekonečna, preto zvoľme T>t0 a ďalej uvažujme delenie intervalu < t0;T > na N rovnakýchčastí s krokom h. Potom platí:

h =T − t0N

, tn+1 = tn + h; n = 0, 1, 2, ..., N − 1. (3.2)

Tomuto procesu sa v matematike hovorí diskretizácia danej oblasti, v našom prípade uzavretého intervalu < t0;T > na množinu diskrétnych uzlovýchbodov tn, n = 0, 1, 2, ..., N . Úlohou numerických metód je potom určiť približné hodnoty hľadanej funkcie u(t) práve v týchto uzlových bodoch.Najbežnejšie používané metódy v tejto oblasti sú tzv. m-bodové metódy typu Runge-Kutta, z ktorých popíšeme prvé tri varianty, jedno-, dvoj- aštvor-bodové.

Najprv popíšeme v krátkosti základný princíp m-bodových metód typu Runge-Kutta vo všeobecnosti. Uvažujme znovu diferenciálnu rovnicu tvaru (3.1).Pre zadané T a N hľadáme v intervale < t0;T > riešenie v bodoch tn+1 = tn + h určených vzťahom (3.2).

Metódy tohto typu na riešenie vyššie popísanej Cauchyho úlohy sa potom definujú nasledujúcou postupnosťou iteračných krokov v tvare:

u0 = u(t0), un = un−1 + hm∑i=1

γiKni ; n = 1, 2, ..., N (3.3a)

kde

Kn1 = f(tn−1, un−1), Kn

i = f

(tn−1 + hαi, un−1 + h

i−1∑L=1

βiLKnL

); i = 2, 3, ..., N. (3.3b)

Konštanty γi, αi a βiL uvedené v týchto vzťahoch sú prehľadne znázornené v Tabuľke 3.1. Tieto konštanty zohrávajú dôležitú úlohu pri dosiahnutírýchlosti výpočtu a presnosti metód typu Runge-Kutta. V prípade m = 1 dostávame jednu rovnicu s jednou neznámou a γ1 = 1 je určené jednoznačne.Táto metóda je najstaršia a volá sa aj Eulerova metóda. V prípade m > 1 už existuje nekonečne veľa riešení, a preto existuje aj nekonečne veľametód daného typu. Napr. pre prípad m = 4 a voľbe koeficientov uvedených v Tabuľke 3.2 dostaneme snáď najpopulárnejšiu metódu používanú nariešenie Cauchyho úlohy a práve túto metódu nazývame bežne ako Rungeova-Kuttova metóda. Je presnejšia ako Eulerova metóda, ale zároveň aj o dosťpracnejšia. Medzi nimi sa nachádza ešte Heuneova metóda, ktorú dostaneme, ak m = 2.

Ukážme si teraz tieto jednoduché typy. Prvou metódou je Eulerova metóda. Ako sme sa dozvedeli vyššie, Eulerova metóda je vlastne najjednoduchšímprípadom všeobecne definovaných metód typu Runge-Kutta pri voľbe parametrov m = 1 a γ1 = 1. Postupnosť krokov pre výpočet jednotlivých iterácií

Kapitola 3. (Diferenciálne rovnice) – 2

Page 69: 14.Numericka matematika a amatematicka statistika

Tabuľka 3.1: Konštanty pre m-bodové metódy typu Runge-Kuttaα2 β21α3 β31 β32. .. .. .αm βm1 βm2 βm3 . . . βm(m−1)

γ1 γ2 γ3 . . . γm

Tabuľka 3.2: Konštatnty pre Rungeovu-Kuttovu metódu (m=4).0,5 0,50,5 0 0,51 0 0 1

16

13

13

16

je potom možné zapísať nasledujúcim spôsobom:

un = un−1 + h · f(tn, un), n = 1, 2, ..., N,

kdeu0 = u(t0); h =

T − t0N

.

Príklad 3.1 Eulerovou metódou riešte Cauchyho úlohu

u′(t) = 3te−t − u− u

t, u(1) = 2

na intervale < 1; 2 > s krokom h = 0, 25 (N = 4).

Riešenie. Našou úlohou je na základe zadaných parametrov daného príkladu vypočítať postupne hodnoty u1, u2, u3 a u4 ako približné riešenia hľadanejfunkcie u(t) v bodoch t1 = 1, 25, t2 = 1, 5, t3 = 1, 75 a t4 = 2. Teda:

ak n = 1 potom u1 = u0 + hf(t0;u0) = 2 + 0, 25f(1; 2) = 2 + 0, 25(−2, 8964) = 1, 2759

Kapitola 3. (Diferenciálne rovnice) – 3

Page 70: 14.Numericka matematika a amatematicka statistika

ak n = 2 potom u2 = u1 + hf(t1;u1) = 1, 2759 + 0, 25f(1, 25; 1, 2759) = 1, 2759 + 0, 25(−1, 2222) = 0, 9703

ak n = 3 potom u3 = u2 + hf(t2;u2) = 0, 9703 + 0, 25f(1, 5; 0, 9703) = 0, 9703 + 0, 25(−0, 6132) = 0, 8171

ak n = 4 potom u4 = u3 + hf(t3;u3) = 0, 8171 + 0, 25f(1, 75; 0, 8171) = 0, 8171 + 0, 25(−0, 3716) = 0, 7241

Výsledky sú zhrnuté v Tabuľke 3.3.

Tabuľka 3.3:n 0 1 2 3 4tn 1 1,25 1,5 1,75 2un 2 1,2759 0,9703 0,8171 0,7241

Ďalšou v poradí je Heuneova metóda. Postupnosť krokov pre výpočet jednotlivých iterácií Heuneovou metódou určených parametrami m = 2 a voľbekoeficientov α2 = β21 = 1 a γ1 = γ2 = 0, 5 je potom možné zapísať nasledujúcim spôsobom:

un = un−1 +h

2(Kn

1 +Kn2 ), n = 1, 2, ..., N,

kdeKn

1 = f(tn−1;un−1), Kn2 = f(tn−1 + h;un−1 + hKn

1 ), u0 = u(t0), h =T − t0N

.

Príklad 3.2 Heuneovou metódou riešte Cauchyho úlohu

u′(t) = 3te−t − u− u

t, u(1) = 2

na intervale < 1; 2 > s krokom h = 0, 25 (N = 4).

Riešenie. Našou úlohou je na základe zadaných parametrov daného príkladu vypočítať postupne hodnoty u1, u2, u3 a u4 ako približné riešenia hľadanejfunkcie u(t) v bodoch t1 = 1, 25, t2 = 1, 5, t3 = 1, 75 a t4 = 2 ako a v predchádzajúcom príklade, ale pre výpočet každej hodnoty u1 - u4 je naviacpotrebné určiť najprv dvojicu koeficientov K1 a K2.

Nech n = 1. Potom:K1

1 = f(t0;u0) = f(1; 2) = −2, 8964

K12 = f(t0 + h;u0 + hK1

1) = f(1, 25; 1, 2759) = −1, 2222

Kapitola 3. (Diferenciálne rovnice) – 4

Page 71: 14.Numericka matematika a amatematicka statistika

u1 = u0 +h

2(K1

1 +K12) = 2 +

0, 25

2(−2, 8964− 1, 2222) = 1, 4852

Nech n = 2. Potom:K2

1 = f(t1;u1) = f(1, 25; 1, 4852) = −1, 5989

K22 = f(t1 + h;u1 + hK2

1) = f(1, 5; 1, 0854) = −0, 805

u2 = u1 +h

2(K2

1 +K22) = 1, 4852 +

0, 25

2(−1, 5989− 0, 805) = 1, 1847

Výpočet približných hodnôt u3 a u4 prebieha analogicky. Všetky výsledky sú zhrnuté v Tabuľke 3.4.

Tabuľka 3.4:n 1 2 3 4Kn

1 -2,8964 -1,5989 -0,9704 -0,6471Kn

2 -1,2222 -0,805 -0,5681 -0,4339tn 1,25 1,5 1,75 2un 1,4852 1,1847 0,9924 0,8572

A ako tretiu popíšeme Rungeovu-Kuttovu metódu. Postupnosť krokov pre výpočet jednotlivých iterácií Rungeovou-Kuttovou metódou pre prípad m = 4a voľbe koeficientov uvedených v Tabuľke 3.2 je potom možné zapísať nasledujúcim spôsobom:

un = un−1 +h

6(Kn

1 + 2Kn2 + 2Kn

3 +Kn4 ), n = 1, 2, ..., N, u0 = u(t0), h =

T − t0N

.

kde

Kn1 = f(tn−1;un−1),

Kn2 = f(tn−1 +

h

2;un−1 +

h

2Kn

1 ),

Kn3 = f(tn−1 +

h

2;un−1 +

h

2Kn

2 ),

Kn4 = f(tn−1 + h;un−1 + hKn

3 ).

Kapitola 3. (Diferenciálne rovnice) – 5

Page 72: 14.Numericka matematika a amatematicka statistika

Príklad 3.3 Rungeovou-Kuttovou metódou riešte Cauchyho úlohu

u′(t) = 3te−t − u− u

t, u(1) = 2

na intervale < 1; 2 > s krokom h = 0, 25 (N = 4).

Riešenie. Našou úlohou je na základe zadaných parametrov daného príkladu vypočítať postupne hodnoty u1, u2, u3 a u4 ako približné riešenia hľadanejfunkcie u(t) v bodoch t1 = 1, 25, t2 = 1, 5, t3 = 1, 75 a t4 = 2 ako a v predchádzajúcom príklade, ale pre výpočet každej hodnoty u1 - u4 je naviacpotrebné určiť najprv štvoricu koeficientov K1 - K4.

Nech n = 1. Potom:K1

1 = f(t0;u0) = f(1; 2) = −2, 8964

K12 = f(t0 +

h

2;u0 +

h

2K1

1) = f(1, 125; 1, 6380) = −1, 9982

K13 = f(t0 +

h

2;u0 +

h

2K1

2) = f(1, 125; 1, 7502) = −2, 2103

K14 = f(t0 + h;u0 + hK1

3) = f(1, 25; 1, 4474) = −1, 531

u1 = u0 +h

6(K1

1 + 2K12 + 2K1

3 +K14) = 2 +

0, 25

6(−2, 8964− 2t1, 9982− 2t2, 2103− 1, 531) = 1, 4648

Nech n = 2. Potom:K2

1 = f(t1;u1) = f(1, 25; 1, 4648) = −1, 5623

K22 = f(t1 +

h

2;u1 +

h

2K2

1) = f(1, 375; 1, 2695) = −1, 1499

K23 = f(t1 +

h

2;u1 +

h

2K2

2) = f(1, 375; 1, 3211) = −1, 2389

K24 = f(t1 + h;u1 + hK2

3) = f(1, 5; 1, 1551) = −0, 9211

u2 = u1 +h

6(K2

1 + 2K22 + 2K2

3 +K24) = 1, 4648 +

0, 25

6(−1, 5623− 2t1, 1499− 2t1, 2389− 0, 9211) = 1, 1623

Výpočet približných hodnôt u3 a u4 prebieha analogicky. Všetky výsledky sú zhrnuté v Tabuľke 3.5.

Kapitola 3. (Diferenciálne rovnice) – 6

Page 73: 14.Numericka matematika a amatematicka statistika

Tabuľka 3.5:n 1 2 3 4Kn

1 -2,8964 -1,5623 -0,9931 -0,6166Kn

2 -1,9982 -1,1499 -0,72921 -0,5111Kn

3 -2,2103 -1,2389 -0,7703 -0,5313Kn

4 -1,5310 -0,921 -0,6115 -0,4482tn 1,25 1,5 1,75 2un 1,4648 1,1623 0,9730 0,8417

Presným riešením tejto Cauchyho úlohy, ktorá sa dá riešiť analyticky, lebo diferenciálna ronica je lineárna, je funkcia u(t) = e−t(t2 + 2e−1

t). Vypočítaním

presných hodnôt môžeme teraz porovnať presnosť Eulerovej metódy, Heuneho metódy ako aj Rungeovej-Kuttovej metódy. Porovnanie je uvedenéprehľadne v Tabuľke 3.6.

Tabuľka 3.6:t 1,25 1,5 1,75 2

u-presné 1,42955 1,07923 0,9728 0,84173u-Euler. met. 1,2759 0,9703 0,8171 0,7241u-Heun. met. 1,4852 1,1847 0,9924 0,8572

u-Runge-Kutta met. 1,4648 1,1623 0,97230 0,8417

Ako sme videli v ostatnom príklade, presnosť popísaných algoritmov je rôzna. Dôkaz presnosti všeobecných m-bodových metód typu Runge-Kutta súmimo rozsah tohto kurzu, avšak vždy je užitočné vedieť odhadnúť, aké veľké h má byť zvolené. Pre prezentované algoritmy uvedieme vzťahy, ktoré námumožnia analyzovať numerické výsledky. Označme presné riešenie Cauchyho úlohy (3.1) u = u(t) a označme interpolované riešenie získané z uzlovýchhodnôt ui ako u∗ = u∗(t). Potom pre každú z metód existuje konštanta Ci taká, že platí

A1. pre Eulerovu metódu: |u(t)− u∗(t)| < C1 h pre všetky t ∈ 〈t0;T 〉.

B1. pre Heuneovu metódu: |u(t)− u∗(t)| < C2 h2 pre všetky all t ∈ 〈t0;T 〉.

C1. pre Rungeovu-Kuttovu metódu: |u(t)− u∗(t)| < C3 h4 pre všetky t ∈ 〈t0;T 〉.

Tieto rádové odhady chýb, viď tiež odhad derivácie (2.10), ukazujú veľmi dobrú presnosť Rungeovej-Kuttovej metódy, pri ktorej rozdelením každéhočasového kroku na dva rovnakej dĺžky dostaneme odhad chyby šestnásťkrát menší (veď pre h

2dostaneme na pravej strane nerovnosti

(12

)4h4).

Kapitola 3. (Diferenciálne rovnice) – 7

Page 74: 14.Numericka matematika a amatematicka statistika

Príklad 3.4 Nájdite približné riešenie diferenciálnej rovnice u′+sin t·u=sin t so začiatočnou podmienkou u(0)=0 (i) Cauchyho metódou s N=10 a(ii) Rungeovou-Kuttovou metódou s N=2 na intervale t∈〈0; 1〉.

Riešenie. Danú rovnicu musíme upraviť na základný tvar u′=sin t(1−u) a určiť krok h pre každú metódu zvlášť.

(i) Pre Eulerovu metódu máme h=0,1 a iteračným vzorcom nájdeme približné hodnoty riešenia

t0 = 0, u0 = 0,

t1 = 0 + 0,1 = 0,1, u1 = 0 + 0,1 sin 0 · (1−0) = 0,

t2 = 0,1 + 0,1 = 0,2, u2 = 0 + 0,1 sin 0,1 · (1−0) = 0,010,

t3 = 0,2 + 0,1 = 0,3, u3 = 0,010 + 0,1 sin 0,2 · (1−0,010) = 0,030,

t4 = 0,3 + 0,1 = 0,4, u4 = 0,030 + 0,1 sin 0,3 · (1−0,030) = 0,058,

t5 = 0,4 + 0,1 = 0,5, u5 = 0,058 + 0,1 sin 0,4 · (1−0,058) = 0,095,

t6 = 0,5 + 0,1 = 0,6, u6 = 0,095 + 0,1 sin 0,5 · (1−0,095) = 0,138,

t7 = 0,6 + 0,1 = 0,7, u7 = 0,138 + 0,1 sin 0,6 · (1−0,138) = 0,187,

t8 = 0,7 + 0,1 = 0,8, u8 = 0,187 + 0,1 sin 0,7 · (1−0,187) = 0,239,

t9 = 0,8 + 0,1 = 0,9, u9 = 0,239 + 0,1 sin 0,8 · (1−0,239) = 0,294,

t10 = 0,9 + 0,1 = 1,0, u10 = 0,294 + 0,1 sin 0,9 · (1−0,294) = 0,349,

ktoré zapíšeme do tabuľky 3.7.

Tabuľka 3.7:t 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0u 0,0 0,0 0,010 0,030 0,058 0,095 0,138 0,187 0,239 0,294 0,349

Kapitola 3. (Diferenciálne rovnice) – 8

Page 75: 14.Numericka matematika a amatematicka statistika

(ii) Pre Rungeovu-Kuttovu metódu máme h=0,5 a v iteračných krokoch dostávame

t0 = 0, u0 = 0,

K(1)0 = sin 0 · (1−0) = 0,

K(2)0 = sin(0 + 0,25) · (1−(0 + 0,25 · 0)) = 0,2474,

K(3)0 = sin(0 + 0,25) · (1−(0 + 0,25 · 0,2474)) = 0,2321,

K(4)0 = sin(0 + 0,5) · (1−(0 + 0,5 · 0,2321)) = 0,4238,

t1 = 0 + 0,5 = 0,5, u1 = 0 +0,5

6(0 + 2 · 0,2474 + 2 · 0,2321 + 0,4238) = 0,1152

K(1)1 = sin 0,5 · (1−0,1152) = 0,4242,

K(2)1 = sin(0,5 + 0,25) · (1−(0,1152 + 0,25 · 0,4242)) = 0,5308,

K(3)1 = sin(0,5 + 0,25) · (1−(0,1152 + 0,25 · 0,5308)) = 0,5126,

K(4)1 = sin(0,5 + 0,5) · (1−(0,1152 + 0,5 · 0,5126)) = 0,5288,

t2 = 0,5 + 0,5 = 1,0, u2 = 0,1152 +0,5

6(0,4242 + 2 · 0,5308 + 2 · 0,5126 + 0,5288) = 0,3686.

Výsledková tabuľka 3.8 je menšia, keďže máme menšie N .

Tabuľka 3.8:t 0 0,5 1,0u 0,0 0,1152 0,3686

Úloha má aj analytické riešenie, pretože diferenciálna rovnica je lineárna. Riešením je funkcia u(t)=1−ecos t−1, ktorej hodnoty v bodoch delenia použitompri Cauchyho metóde sú zhrnuté v tabuľke 3.9. a na obr. 3.1 je grafické porovnanie vypočítaných hodnôt s analytickým riešením.

Tabuľka 3.9:t 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0u 0,0 0,0050 0,0197 0,0437 0,0759 0,1152 0,1603 0,2096 0,2616 0,3150 0,3685

Kapitola 3. (Diferenciálne rovnice) – 9

Page 76: 14.Numericka matematika a amatematicka statistika

0

0,1

0,2

0,3

0,4

0 0,2 0,4 0,6 0,8 1

u

t

uA

uE

uR

Obr. 3.1: Porovnanie numerických riešení (uE pre Eulerovu metódu a uR pre Rungeovu-Kuttovu metódu) a analytického riešenia uA.

Samohodnotiace otázky a úlohy na samostatné riešenie

1. Porovnajte výpočtovú náročnosť všetkých troch prebraných metód!

2. Porovnajte presnosť všetkých troch prebraných metód!

3. Skúste odvodiť aj iné m-bodové metódy typu Runge-Kutta.

4. Pokúste sa vysvetliť úlohu pomocných konštánt "K", (medzikrokov) v numerických metódach typu Runge-Kutta!

1. Riešte Cauchyho úlohu u′ = 2ut+ 2t3, u(1) = −1 na intervale < 1; 2 > pre N = 5 Eulerovou, Heuneovou aj Rungeovou-Kuttovou metódou .

V úlohách 2. až 10. riešte danú Cauchyho úlohu Eulerovou metódou pre N = 10, Heuneovou metódou pre N = 4 ako aj Rungeovou-Kuttovou metódoupre N = 2.

2. u′ = 4t

t2+u2, u(2) = 4, na intervale < 2; 3 > . 3. u

′ = utcos ln u

t, u(1) = 2, na intervale < 1; 2 > .

4. u = t(u′ − t cos t), u(0, 1) = 1, 6, na intervale < 0, 1; 0, 6 > . 5. u′ = t

2u+ t u

2(t2−1) , u(2) = 1, na intervale < 2; 4 > .

6. 3u′ + u2 + 2

t2= 0, u(1) = 1, na intervale < 1; 2 > . 7. 2t u

′ + u2 = 1, u(6) = 0, 5, na intervale < 6; 7 > .

Kapitola 3. (Diferenciálne rovnice) – 10

Page 77: 14.Numericka matematika a amatematicka statistika

8. u′ − 1

t−u2 = 0, u(2) = 0, na intervale < 2; 3 > . 9. u′ cos t = 1− u sin t, u(−π

4) = 0, na intervale < −π

4; 0 > .

10. u′ = cos(t2), u(−2) = 0, na intervale < −2;−1 > .

Záver

V tejto kapitole sme sa venovali niektorým základným metódam pre riešenie obyčajných diferenciálnych rovníc. Slovo niektorým je tu skutočne namieste,veď už len fakt, že veľmi, skutočne veľmi málo praktických úloh matematickej fyziky sa dá riešiť analyticky, dáva široký priestor na rozvoj približných, čiženumerických metód na riešenie všetkých typov diferenciálnych rovníc a ich sústav. Znalosti nadobudnuté v tejto kapitole sú potrebné aj pre nachádzanieriešení rôznych nových, pôvodných úloh vyplývajúcich z každodennej potreby technickej praxe.

Literatúra

[1] Budinský, B., Charvát, J.: Matematika I, Praha 1987.

[2] Charvát J., Hála M., Šibrava Z.: Příklady k Matematice I, ČVUT Praha, 2002.

[3] Eliáš J., Horváth J., Kajan J.: Zbierka úloh z vyššej matematiky, časť I. (3.vyd.1980), Alfa, Bratislava.

[4] Ivan, J.: Matematika I, Bratislava 1983.

[5] Kreyszig, E.: Advanced Engineering Mathematics, New York 1993.

[6] Minorskij, V.P.: Sbírka úloh z vyšší matematiky, Praha 1958.

[7] Šoltés V., Juhásová Z.: Zbierka úloh z vyššej matematiky I, Košice 1995.

Kapitola 3. (Diferenciálne rovnice) – 11

Page 78: 14.Numericka matematika a amatematicka statistika

Riešenia úloh

Odpovede na samohodnotiace otázky, ak ich neviete sformulovať, a aj mnohé iné odpovede nájdete v odporúčanej literatúre.

1.

E: t1 = 1, 2 t2 = 1, 4 t3 = 1, 6 t4 = 1, 8 t5 = 2

u1 ≈ −1 u2 ≈ −0, 6421 u3 ≈ 0, 272 u4 ≈ 1, 9784 u5 ≈ 4, 7508

H: t1 = 1, 2 t2 = 1, 4 t3 = 1, 6 t4 = 1, 8 t5 = 2

u1 ≈ −0, 8211 u2 ≈ −0, 1212 u3 ≈ 1, 3473 u4 ≈ 3, 3704 u5 ≈ 7, 7732

RK: t1 = 1, 2 t2 = 1, 4 t3 = 1, 6 t4 = 1, 8 t5 = 2

u1 ≈ −0, 8065 u2 ≈ −0, 0787 u3 ≈ 1, 433 u4 ≈ 4, 0167 u5 ≈ 7, 9988

2.E: u10 ≈ 8, 958

H: u4 ≈ 9, 3

RK: u2 ≈ 9, 39

3. E: u10 ≈ 3, 513

4.E: u10 ≈ 9, 835

H: u4 ≈ 9, 858

RK: u2 ≈ 9, 875

5. E: u10 ≈ 3, 27 6.E: u10 ≈ 0, 47

H: u4 ≈ 0, 497

RK: u2 ≈ 0, 4997

7. RK: u2 ≈ 0, 5556 8. RK: u2 ≈ 0, 4142 10.E: u10 ≈ −0, 499H: u4 ≈ −0, 4184

RK: u2 ≈ −0, 4437

Kapitola 3. (Diferenciálne rovnice) – 12

Page 79: 14.Numericka matematika a amatematicka statistika

Kapitola 4. (Teória pravdepodobnosti)

Poslanie

Pripomenúť študentom základné princípy z pravdepodobnosti a tiež ich oboznámiť s ďalšou teóriou súvisiacou s prácou s náhodnými veličinami potrebnýmipre štatistické výpočty.

Ciele

1. Pripomenúť si základné termíny pravdepodobnosti.

2. Naučiť sa pracovať s náhodnými veličinami a ich distribočnými funkciami.

3. Získať prehľadnú informáciu o charakteristikách náhodných veličín a ich výpočte.

4. Rozlíšiť základné typy rozdelení pravdepodobnosti náhodných veličín.

Prerekvizičné znalosti

stredoškolské znalosti z pravdepodobnosti; funkcia a jej vlastnosti; určitý integrál; nevlastný integrál

Kapitola 4. (Teória pravdepodobnosti) – 1

Page 80: 14.Numericka matematika a amatematicka statistika

Úvod

V kapitole sa venujeme základným pojmom z teórie pravdepodobnosti, keďže tento nástrojový aparát je potrebný pre správne vysvetlenie a použitiemetód matematickej štatistiky. Zo strednej školy poznáme niektoré pojmy, ktoré sa týkajú najmä tzv. kombinatorickej pravdepodobnosti, kde pracujemes náhodami, ktoré môžu nadobudnúť konečný počet možných výsledkov a hľadaná pravdepodobnosť je často získaná výpočtom priaznivých možnostízískaným niektorým kombinatorickým vzorcom. Pravda pre potreby inžinierskych výpočtov je potrebné pracovať aj s náhodami, ktoré túto vlastnosťnemajú a môžu nadobúdať všetky hodnoty napr. z nejakého intervalu.

Začneme s tým, že si pripomenieme to, čo by sme už mali poznať. Teda čo je to pravdepodobnosť, čo to je náhodný jav ap.. A súčasne si tieto svojeznalosti prehĺbime tak, aby mali širšie použitie.

Hlavná časť tejto kapitoly bude venovaná práci s náhodnou veličinou. Je to vlastne matematický popis náhody, a to aj takej, ktorej výsledkom nie súčíselné hodnoty. Zavedieme si funkcie, ktoré popisujú akým náhodným spôsobom sú hodnoty náhodnej veličiny nadobúdané a akými základnými číselnýmihodnotami vieme každú náhodnú veličinu charakterizovať.

Potom uvedieme základné typy náhodných veličín a ich charakteristiky, pričom sa sústredíme na tie, ktoré sú pre inžiniersku prax užitočné. Hlavnýdôraz bude kladený na normálne rozdelenie pravdepodobnosti, ktoré hrá kľúčovú úlohu nielen z hľadiska samotnej teórie, ale aj z hľadiska teórie prematematickú štatistiku a v neposlednej miere aj pre praktické úlohy, napr. také pri ktorých narábame s chybou merania.

V samom závere, skôr ako dodatok, predstavíme jednu špeciálnu funkciu, Eulerovu funkciu Γ, ktorá sa používa v mnohých oblastiach aplikovanejmatematiky a špeciálne aj v matematickej štatistike. Budeme sa však na túto funkciu odvolávať aj v skorších častiach.

Teória pravdepodobnosti – Náhodné javy a pravdepodobnosť

Pripomeňme a prehĺbme si znalosti o tom, čo to vlastne pravdepodobnosť je a ako ju interpretovať v matematickej teórii

Uvažujme pokus, ktorého výsledok závisí od náhodných vplyvov. Jednotlivé výsledky pokusu budem nazývať elementárnymi javmi. Množinu všetkýchmožných elementárnych javov budeme nazývať priestorom elementárnych javov a označovať ju Ω. Množinu elementárnych javov nazveme náhodný java označíme A. Triviálnymi príkladmi náhodných javov sú istý jav, jav ktorý nastane vždy, napr. A=Ω, alebo nemožný jav jav, ktorý nenastane nikdy,napr. A=∅. Pripomeňme si ešte, že s náhodnými javmi ako s množinami môžeme vykonávať množinové operácie zjednotenie (A ∪B), prienik (A ∩B),rozdiel (A \B), doplnok (do Ω) (¬A).

Kapitola 4. (Teória pravdepodobnosti) – 2

Page 81: 14.Numericka matematika a amatematicka statistika

Príklad 4.1 Popíšme priestor elementárnych javov pri hode štandardnou hracou kockou a niektoré náhodné javy.

Riešenie. Výsledkom takého pokusu obyčajne rozumieme vrchnú stenu kocky po hode, takže

Ω = 1,2,3,4,5,6 .

Istým javom je, že výsledkom pokusu je vrchná stena s aspoň jednou bodkou. Nemožným javom je, že výsledkom pokusu je 9. Obyčajne, samozrejme,hod vyjadrujeme číslom určeným počtom bodiek, nevedomky tak definujeme náhodnú veličinu, o ktorej budeme hovoriť neskôr. Takže potom náhodnýmjavom A môže byť párne číslo na kocke, t.j. A = 2,4,6.Ak výsledok pokusu závisí od náhody, je dobré poznať mieru tejto náhody. Tá je číselne vyjadrená pravdepodobnosťou náhodného javu A a budemeju označovať P(A). Pre matematicky korektné definovanie pravdepodobnosti teda potrebujeme funkciu, ktorá je definovaná na podmnožinách priestorunáhodných javov Ω. Naviac, keďže s javmi vykonávame množinové operácie, aj pre výsledky množinových operácií musíme vedieť určiť pravdepodobnosť.Z toho plynie, že pre prácu s náhodou musíme zadať pravdepodobnostný priestor ako trojicu (Ω,S,P), kde S je vhodný systém podmnožín množiny Ωa Pje funkcia definovaná na S. Z toho čo sme uviedli, vieme o S, že Ω∈S a tiež, že ak tam patrí nejaká množina A, tak aj ¬A∈S. No a určite aj keďmáme dve množiny A, B (samozrejme A⊆Ω, B⊆Ω), tak ich zjednotenie je tiež v S: A∪B∈S. Dokonca tých množín v zjednotení môže byť spočítateľneveľa. Takýto systém podmnožín množiny Ω v matematike nazývame σ-algebra.

Príklad 4.2 Uveďme príklady σ-algebier na Ω z pr. 4.1.

Riešenie. Triviálnym príkladom je vždy dvojprvková množina S=Ω, ∅, pretože Ω∪Ω=Ω, Ω∪∅=Ω, ∅∪∅=∅, ¬Ω=∅.Iným príkladom by mohla byť množina S=Ω, ∅, A,¬A, kde napr. A=1,3,5. Tu k rovnostiam z predošlého príkladu pribudnú ďalšie, napr.A∪Ω=Ω, A∪∅=A, A∪¬A=Ω atď., vždy dostaneme prvok z S.Najväčšou σ-algebrou je množina všetkých podmnožín Ω, pretože požadované množinové vzťahy platia automaticky, túto množinu obyčajne označujeme2Ω.

Kým v prípade množín Ω s konečným počtom prvkov je jednoduché popísať σ-algebru a aj definovať pravdepodobnosť P, v prípade nekonečných(nespočítateľných) množín (napr. ak Ω=R) je situácia zložitejšia, pretože od pravdepodobnosti P očakávame isté „prirodzené“ správanie, ktoré môžemezhrnúť ako základné vlastnosti pravdepodobnosti:

A1. Pre ľubovoľný náhodný jav A platí 0≤P(A)≤1.

B1. P(Ω)=1

Kapitola 4. (Teória pravdepodobnosti) – 3

Page 82: 14.Numericka matematika a amatematicka statistika

C1. Pre ľubovoľné navzájom disjunktné javy A1, A2, . . . Ak, k≤+∞ (t.j. ak i 6=j, tak Ai∩Aj=∅) platí

P (A1 ∪ A2 ∪ · · · ∪ Ak) = P(A1) + P(A2) + · · ·+ P(Ak)

Takúto funkciu nazývame pravdepodobnostná miera. Obor hodnôt funkcie Pv bode A1 súvisí s konvenciou, aby istota bola vyjadrená hodnotou jedna, čoje vlastne bod B1. Bod C1 zasa určuje prirodzeným spôsobom sčítanie možností. V prípade Ω=R je splnenie tohto bodu problematické, a to spôsobujeproblémy s definícou vhodnej množiny S. Preto ako S neuvažujeme množinu všetkých podmnožín R, ale najmenšiu σ-algebru, ktorá obsahuje všetkyintervaly (Borelova σ-algebra). Intervaly sa totiž dajú dobre „odmerať“ .

Ďalšie vlastnosti pravdepodobnosti sa dajú odvodiť z tých základných (A,B∈S)

P(¬A) = 1− P(A), P(∅) = 0, (4.1a)

P(A \B) = P(A)− P(A ∩B), (4.1b)

P(A ∪B) = P(A) + P(B)− P(A ∩B). (4.1c)

A ⊆ B ⇒ P(A) ≤ P(B). (4.1d)

Poznamenajme ešte, že definícia pravdepodobnosti, ako sme ju načrtli, sa nazýva Kolmogorovova axiomatická definícia pravdepodobnosti.

Príklad 4.3 Klasická definícia pravdepodobnosti: Uvažujme o konečnom počte elementárnych udalostí, ktoré sú nedeliteľné a naviac rovnako možné.

Riešenie. V reči symbolov to znamená že Ω=ω1, ω2, . . .Ωn pre niektoré n, ďalej pre i6=j platí ωi∩ωj=∅ a pre všetky i je P(ωi)=1n. Ľubovoľnú m

prvkovú podmnožinu A⊆Ω vieme popísať ako A=ωk1 , ωk2 , . . . ωkm a teda

P(A) = P(ωk1) + P(ωk2) + · · ·+ P(ωkm) =1

n+

1

n+ · · ·+ 1

n=m

n.

Čo interpretuje pravdepodobnosť, ako ju poznáme zo strednej školy: pomer počtu náhodnému javu priaznivých udalostí a všetkých možných udalostí.Pritom, ako sme uviedli aj vyššie, je S=2Ω.

Príklad 4.4 Geometrická definícia pravdepodobnosti: Nech je daná rovinná oblasť Ω⊆R2 a nech G⊆Ω je tiež oblasť. Pravdepodobnosť toho, že náhodnevybraný bod x∈Ω leží tiež v G je rovná pomeru plôch oblasti G a Ω.

Kapitola 4. (Teória pravdepodobnosti) – 4

Page 83: 14.Numericka matematika a amatematicka statistika

Riešenie. Zapíšme definíciu pradepodobnosti využijúc dvojný integrál

P(x∈G) =S(G)

S(Ω)=

∫∫G

dxdy∫∫Ω

dxdy.

Z vlastností integrálu plynú základné vlastnosti pravdepodobnosti a hlavne aditívnosť C1. Tiež vidíme, že G nemôže byť ľubovoľná podmnožina, lebo vovšeobecnosti integrál

∫∫G

dxdy neexistuje musí to byť tzv. merateľná množina: 2Ω teda ako S nefunguje. V konštrukcii dvojného integrálu sme začali sintegrálom po obdĺžniku, teda dvojrozmernom intervale, a postupne sme rozširovali triedu množín, cez ktoré vieme integrovať. Podobne to teda bude ajs pravdepodobnosťou a určením S, viď vyššie poznámku o Borelovej σ-algebre.

Príklad 4.5 Štatistická definícia pravdepodobnosti: Pri rovnakých podmienkach vykonáme n pokusov. Nech náhodný jav A nastal v mn z týchto npokusov. Potom P(a) = limn→+∞

mnn.

Dôležitou skutočnosťou, ktorá je veľmi užitočná nielen v teórii pravdepodobnosti ale aj v štatistike, je miera ovplyvnenia jedného náhodného javu druhým.Táto miera sa vyjadruje podmienenou pravdepodobnosťou. Ak sú A a B dve náhodné udalosti v tom istom pravdepodobnostnom priestore a ak P(B)6=0,tak podmienenou pravdepodobnosťou P(A/B) javu A za podmienky B sa rozumie pravdepodobnosť javu A, ak jav B určite nastal, teda

P(A/B) =P(A ∩B)

P(B). (4.2)

Javy, ktoré sa neovplyvňujú nazývame nezávislé. Pojem nezávislosti náhodnych javov hrá dôležitú úlohu aj v matematickej štatistike, napr. pri vyhodno-covaní experimentu, v ktorom sme robili niekoľko meraní, potrebujeme vedieť, že sa jednotlivé merania navzájom neovplyvňujú, lebo, ako budeme vidieť,mnoho štatistických výpočtov sa o túto nezávislosť opiera. Keď jav B neovplyvňuje jav A, musí platiť P(A/B)=P(A) a z definičného vzťahu (4.2)plynie, že pre nezávislé javy platí

P(A ∩B) = P(A)P(B), (4.3)

čo tiež môžeme chápať ako definíciu nezávislosti javov.

Príklad 4.6 Hádžeme dve hracie kocky červenú a modrú. Určme pravdepodobnosť javu A, že na oboch padne1. Aká je pravdepodobnosť, že „celkovýpočet bodiek bude sedem“ ( jav B), ak zabezpečíme, že aspoň na jednej kocke padne 5 (jav C).

Riešenie. Uvedomme si, že v tomto prípade máme Ω zadané usporiadanými dvojicami

Ω = (1,1), (1,2), . . . , (1,6), (2,1), (2,2), . . . (6,6).

Kapitola 4. (Teória pravdepodobnosti) – 5

Page 84: 14.Numericka matematika a amatematicka statistika

Použijeme klasickú pravdepodobnosť: všetkých dvojíc je 36 a javu je priaznivá iba jediná možnosť, takže P(A)= 136. Môžeme však využiť nezávislosť a

definovať Am ako jav, že na modrej kocke padla1 a jav Ač ako jav, že na červenej kocke padla1, takže P(Am) = P(Ač) = 16. A z dôvodu nezávislosti

kociek P(Am∩Ač) = P(Am)P(Ač)=16

16

= 136.

Výpisom všetkých možností zistíme, že P(B)=16, P(C) = 11

36a P(B∩C) = 1

18. Náhodné javy nie sú nezávislé, lebo 1

186=1

61136. Mieru ovplyvnenia javu B

javom C spočítame podmienenou pravdepodobnosťou P(B/C) =1181136

= 211. Rozdiel oproti P(B) je spôsobený tým, že predpoklad5 na niektorej z kociek

zahŕňa tiež možnosť (5,5).

Teória pravdepodobnosti – Náhodná veličina

Popíšme každý náhodný pokus pomocou číselných hodnôt a stanovme s akými pravdepodobnosťami sú tieto hodnoty nadobúdané

Náhodné javy môžu všeobecne nadobúdať ja nečíselné hodnoty. V počtárskej praxi je často výhodné ich nahradiť číselnými hodnotami, ktoré budúsamozrejme náhodné. Funkcia ξ, ktorá každému elementárnemu javu ω∈Ω priradí jednojednoznačne číselnú hodnotu x sa nazýva náhodná veličina, teda

ξ(ω) = x, pre ω∈Ω, x∈R. (4.4)

Oborom hodnôt tejto funkcie je nejaká podmnožina R. Ak náhodný jav nadobúdal číselné hodnoty, teda ak Ω je číselná množina, náhodnú veličinuobyčajne volíme tak, že ξ(ω)=ω. V prípade, že v pravdepodobnostnom priestore (Ω,S,P) je S6=2Ω z dôvodov, ktoré sme spomínali vyššie, musíme stálevedieť počítať pravdepodobnosti definovanmé na S, teda ξ musí spĺňať podmienku, že pre všetky x∈R je ω∈Ω:ξ(ω)<x∈S.Niektoré náhodné veličiny nadobúdajú len konečný počet hodnôt, prípadne nekonečný, ale spočítateľný (t.j. vieme ich očíslovať, vieme z nich urobiťpostupnosť) počet hodnôt. Takéto náhodné veličiny nazývame diskrétne.

Príklad 4.7 Definujme náhodnú veličinu, ktorá bude zodpovedať hodu klasickou hracou kockou.

Riešenie. Podľa pr. 4.1 je Ω = 1,2,3,4,5,6. Keďže ako výlsedok hodu rozumieme počet bodiek, je prirodzené definovať náhodnú veličinu ξtakto

ξ(1) = 1, ξ(2) = 2, ξ(3) = 3, ξ(4) = 4, ξ(5) = 5, ξ(6) = 6.

Definovať náhodnú veličinu vždy musíme s ohľadom na daný pravdepodobnostný priestor. Takže spolu s predpisom, ktoré hodnoty sú náhodnou veličinounadobúdané, je potrebné zadať aj pravdepodobnosti, s ktorými sú tieto hodnoty vyskytujú. Pravidlo určenia pravdepodobnosti nadobudnutých hodnôtsa nazýva rozdelenie pravdepodobnosti náhodnej veličiny.

Kapitola 4. (Teória pravdepodobnosti) – 6

Page 85: 14.Numericka matematika a amatematicka statistika

Pre diskrétnu náhodnú veličinu ξ s hodnotami xi stačí zadať pravdepodobnosti nadobudnutia jednotlivých hodnôt, t.j. určiť pi=P(ξ(ωi)=xi), a tobuď v tabuľke alebo pomocou vzorca. Z vlastností pravdepodobnosti je jasné, že súčet všetkých pi je vždy 1,

∑ni=1 pi=1, kde n je počet hodnôt, teda

prirodzené číslo alebo +∞.

Rozdelenie pravdepodobnosti je určené napr. pomocou distribučnej funkcie náhodnej veličiny. Funkcia y=Fξ(x), x∈R sa nazýva distribučnou funkciounáhodnej veličiny ξ, ak platí

Fξ(x) = P (ω : ξ(ω) < x) . (4.5)

Tento zápis často skrátime na Fξ(x)=P (ξ<x). Z toho plynie, že pre každú distribučnú funkciu platí:

A2.lim

x→−∞Fξ(x) = 0, lim

x→+∞Fξ(x) = 1.

B2. Funkcia Fξ je neklesajúca na R.

C2. Funkcia Fξ je zľava spojitá v každom bode x0∈R, t.j.limx→x−0

Fξ(x) = Fξ(x0).

Tieto vlastnosti súčasne jednoznačne deklarujú distribučnú funkciu. Ak funkcia y=F (x) spĺňa vlastnosti A2 až C2, tak to je distribučná funkcia niektorejnáhodnej veličiny ξ a určuje pre ňu rozdelenie pravdepodobnosti.

Poznamenajme ešte, že veľmi často sú hodnoty nadobúdané náhodnou veličinou iba kladné, napr. kvôli fyzikálnemu zmyslu tejto veličiny. Kvôli nimzavedieme Heavisideovu funkciu Θ, ktorá je definovaná predpisom

Θ(x) =

0, ak x ≤ 0,

1, ak x > 0.(4.6)

Príklad 4.8 Ukážme platnosť niektorých z vlastností A2, B2, C2.

Riešenie. Najjednoduchšie sa ukáže B2. Zvoľme dve čísla a, b tak, že a<b a zamyslime sa nad pravdepodobnosťami P (ω:ξ(ω)<a) a P (ω:ξ(ω)<x).Pre náhodné javy A=ω:ξ(ω)<a a B=ω:ξ(ω)<b evidentne platí A⊂B, a teda P(A)≤P(B). Posledná nerovnosť je ekvivalentným vyjadrením vzťahuFξ(a)≤Fξ(b). Čísla a a b boli zvolené ľubovoľne, takže nerovnosť potvrdzuje žiadanú monotónnosť.

Kapitola 4. (Teória pravdepodobnosti) – 7

Page 86: 14.Numericka matematika a amatematicka statistika

Ostatné vlastnosti súvisia s pojmom limity. Ukážme jednu z nich, napr. prvú z A2. Zadefinujme postupnosť náhodných javov An=ω:ξ(ω)<−n. Pre neplatí:

An+1 ⊆ An a Ak ∩ Ak+1 ∩ Ak+2 ∩ · · · ∩ Ak+100 ∩ · · · =+∞⋂j=k

Aj = ∅

pre akékoľvek n a k. Definujme Bn=An\An+1=ω:− (n+1)≤ξ(ω)<−n pre všetky možné n, u ktorých vidíme, že sú disjunktné, a tak pre ne môžemepoužiť sčítanie pravdepodobností C1. Súčasne je zrejmé, že pre každé n je An=

⋃+∞j=nBj, a tak

P(An) = P

(+∞⋃j=n

Bj

)=

+∞∑j=n

P(Bj), pričom 1 ≥ P(A1) =+∞∑j=1

P(Bj).

Posledná suma určuje konvergentný rad (t.j. Sn=∑n

j=1 P(Bj), P(Bj)≥0, takže limn→+∞ Sn=a≤1), a tak jeho zbytok Rn=∑+∞

j=n+1 P(Bj) konvergujek nule (t.j. limn→+∞Rn=0, keďže Rn+Sn=a). Z toho plynie

limn→+∞

P(An) = limn→+∞

+∞∑j=n

P(Bj) = limn→+∞

Rn−1 = 0.

Keďže x→−∞, existuje n, že x<n a teda aj 0≤Fξ(x)=P(ξ<x)≤P(An). Limita na pravej strane je nula, takže aj limx→−∞ Fξ(x)=0.

Zo základných vlastností plynú tiež ďalšie užitočné vzťahy:

A3. P(ξ ≤ x) = limz→x+

Fξ(z)

B3. P(ξ = x) = limz→x+

Fξ(z)− Fξ(x)

C3. P(a ≤ ξ < b) = Fξ(b)− Fξ(a)

D3. P(a < ξ < b) = Fξ(b)− limz→a+

Fξ(z)

E3. P(a < ξ ≤ b) = limz→b+

Fξ(z)− limz→a+

Fξ(z)

F3. P(a ≤ ξ ≤ b) = limz→b+

Fξ(z)− Fξ(a)

Kapitola 4. (Teória pravdepodobnosti) – 8

Page 87: 14.Numericka matematika a amatematicka statistika

Príklad 4.9 V spoločenskej hre sa používa hracia kocka, ktorá má na troch stenách 3, na dvoch stenách 4 a na jednej stene 2. Nájdime náhodnúveličinu pre hod touto kockou a určme jej distribučnú funkciu.

Riešenie. Množina možných výsledkov a príslušné pravdepodobnosti (za predpokladu regulárnosti kocky) sú:

Ω = 2,3,4, P(2) =1

6, P(3) =

1

2, P(4) =

1

3.

Náhodnú veličinu definujeme prirodzeným spôsobom

ξ(2) = 2, ξ(3) = 3, ξ(4) = 4,

je to diskrétna náhodná veličina.

Určme distribučnú funkciu. Zvolíme číslo x a pýtame sa na pravdepodobnosť

P(ω ∈ 2,3,4 : ξ(ω) < x) = P(w ∈ 2, 3, 4 : w < x), pričom z definície ξ je P(2) =1

6, P(3) =

1

2, P(4) =

1

3.

Z toho plynie, že pre x≤2 je P(ξ<x)=0, keďže ide o nemožný jav. Podobne pre x>4 dostaneme istý jav, a tak P(ξ<x)=1. Podobne to je aj s hodnotamiv intervale (2; 4〉. Dostaneme nasledujúcu funkciu

Fξ(x) =

0, pre x ≤ 2,

1

6, pre 2 <x ≤ 3,

2

3, pre 3 <x ≤ 4,

1, pre 4 <x.

Dôležité je uvedomiť si hlavne deliace body intervalov, z ktorých nám zostal ešte 3: P(ξ < 3) = P(ξ = 2) = 16z dôvodu ostrej nerovnosti v definícii

ditribučnej funkcie (4.5).

Z dôvodu, aby sme distribučné funkcie tohto typu nemuseli písať pomocou „svorky“ , sme definovali Heavisideovu funkciu (4.6). Pomocou nej zpíšemeFξ elegentne ako

Fξ(x) =1

6Θ(x− 2) +

1

2Θ(x− 3) +

1

3Θ(x− 4).

Všimnime si, že násobiace koeficienty sú rovné skokom hodnôt v distribučnej funkcii.

Graf distribučnej funkcie ja na obrázku 4.1. Môžeme z neho odčítať všetky vlastnosti distribučnej funkcie A2, B2, C2.

Kapitola 4. (Teória pravdepodobnosti) – 9

Page 88: 14.Numericka matematika a amatematicka statistika

0

16

13

12

23

56

1

-1 0 1 2 3 4 5 6 7

Obr. 4.1: Distribučná funkcia pre hod kockou z pr. 4.9

Príklad 4.10 Ukážme, že funkcia F (x)=1−Θ(1−x) + Θ(x(1−x))x je distribučnou funkciou nejakej náhodnej veličiny ξ.

Riešenie. Začnime tým, že funkciu F rozpíšeme pomocou elementárnych funkcií. Funkcia Θ je nespojitá v nule, zistime teda hodnoty F (x) tam, kde saΘ počíta v nule, t.j. pre x=0 a x=1

F (0) = 1−Θ(1) + Θ(0) · 0 = 0, F (1) = 1−Θ(0) + Θ(0) · 1 = 1.

Pre ostatné hodnoty dostaneme

F (x) = 1−Θ(1− x) + Θ(x(1− x))x =

x < 0 : 1− 1 + 0x = 0,

0 < x < 1 : 1− 1 + x = x,

x > 1 : 1− 0 + 0x = 1.

Na základe toho ľahko overíme vlastnosti:

limx→−∞

F (x) = limx→−∞

0 = 0, limx→−∞

F (x) = limx→−∞

1 = 1,

ukazujú platnosť A2. Vzťahylimx→0−

F (x) = limx→0−

0 = 0, limx→1−

F (x) = limx→1−

x = 1,

spolu s faktom, že funkcia F je v ostatných bodoch spojitá, zdôvodňujú C2. Funkcia je dokonca spojitá vo všetkých bodoch.

Monotónnosť dokážeme pre všetky možné voľby x vzhľadom k definícii F

x1 < x2 < 0 : F (x1) = 0 ≤ 0 = F (x2), x1 < 0 ≤ x2 < 1 : F (x1) = 0 ≤ x2 = F (x2), x1 < 0 < 1 ≤ x2 : F (x1) = 0 ≤ 1 = F (x2),

Kapitola 4. (Teória pravdepodobnosti) – 10

Page 89: 14.Numericka matematika a amatematicka statistika

0 ≤ x1 < x2 < 1 : F (x1) = x1 ≤ x2 = F (x2), 0 ≤ x1 < 1 ≤ x2 : F (x1) = x1 ≤ 1 = F (x2), 1 ≤ x1 < x2 : F (x1) = 1 ≤ 1 = F (x2).

Funkcia F je neklesajúca.

Graf funkcie z obrázku 4.2 tiež dokumentuje platnosť všetkých troch vlastností.

0

0,25

0,5

0,75

1

-1 -0,5 0 0,5 1 1,5 2

Obr. 4.2: Graf funkcie F z pr. 4.10

Predpokladajme, že distribučná funkcia Fξ náhodnej veličiny ξ je spojitá a rastúca na intervale (a; b) (a môže byť aj −∞, b môže byť aj +∞) a Fξ(a)=0,Fξ(b)=1. V takom prípade na tomto intervale k nej existuje inverzná funkcia F−1

ξ definovaná na intervale (0; 1). Táto inverzná funkcia definuje kvantilúrovne δ xδ náhodnej veličiny ξ – číslo z intervalu (a; b), pre ktoré platí

xδ = F−1ξ (δ), teda P(ω : ξ(ω) < xδ) = δ. (4.7)

Niektoré kvantily majú špeciálne pomenovanie: kvantil na hladine δ=0,5 sa nazýva medián, na hladine δ=0,25 sa nazýva dolný kvartil, na hladine δ=0,75sa nazýva horný kvartil.

Príklad 4.11 Nájdime medián, dolný a horný kvartil pre náhodnú veličinu s distribučnou funkciu z pr. 4.10.

Riešenie. Distribučná funkcia je rastúca na intervale (0; 1). Na ňom máme Fξ(x)=x, takže aj F−1ξ (t)=t. Z toho

x0,5 = F−1ξ (0,5) = 0,5, x0,25 = F−1

ξ (0,25) = 0,25, x0,75 = F−1ξ (0,75) = 0,75.

Ak budeme predpokladať, že distribučná funkcia Fξ je po čiastkach hladká, existuje funkcia pξ, pre ktorú platí pξ(x)=F ′ξ(x) pre (skoro) všetky x.Funkciu pξ nazývame hustota rozdelenia pravdepodobnosti náhodnej veličiny ξ. Z vlastnosti B2 distribučnej funkcie plynie, že pξ je nezáporná funkcia.

Kapitola 4. (Teória pravdepodobnosti) – 11

Page 90: 14.Numericka matematika a amatematicka statistika

Náhodnú veličinu, ktorá má hustotu rozdelenia pravdepodobnosti určenú integrovateľnou funkciou, nazývame spojitá. Spojité náhodné veličiny ξ obyčajnezadávame pomocou hustoty rozdelenia pravdepodobnosti a distribučnú funkciu Fξ dostaneme ako integrál

Fξ(x) =

∫ x

−∞pξ(t)dt. (4.8)

Dôležitá podmienka pre nezápornú integrovateľnú funkciu pξ, aby mohla byť hustotou rozdelenia pravdepodobnosti potom plynie z druhej vlastnosti A2distribučnej funkcie, a to

∫ +∞−∞ pξ(t)dt=1. Geometricky pravdepodobnosti nachádzame ako hodnoty distribučnej funkcie alebo ako obsahy plôch pod

grafom hustoty rozdelenia pravdepodobnosti.

Pravdepodobnosť nadobudnutia ľubovoľnej hodnoty spojitou náhodnou veličinou je nulová, pretože vo vzťahu B3 je limita sprava rovná funkčnej hodnote.Teda aj vlastnosti C3 až F3 vieme zapísať jedinou rovnosťou C3, pričom nerovnosti môžu byť ostré aj neostré.

Príklad 4.12 Nájdime hustotu rozdelenia pravdepodobnosti pre náhodnú veličinu s distribučnou funkciu z pr. 4.10.

Riešenie. Distribučná funkcia je spojitá a diferencovateľná okrem bodov 0 a 1. Vieme nájsť hustotu ako pξ(x)=F ′ξ(x):

Fξ(x) =

0, x < 0

x, 0 ≤ x ≤ 1

1, x > 1

⇒ pξ(x) =

1, 0 ≤ x ≤ 1

0, inak.

Je jedno akými hodnotami definujeme funkciu v bodoch 0 a 1.

Pri práci s náhodnými veličinami potrebujeme pracovať aj s ich súborom, nejakou n-ticou náhodných veličín zadaných na tom istom pravdepodobnostnompriestore (Ω,S,P). Dôležité je tiež, či sa tieto náhodné veličiny neovplyvňujú.

Náhodné veličiny ξ1, ξ2, . . . ξn nazveme nezávislé, ak pre ľubovoľnú n-ticu čísel (x1, x2, . . . , xn) sú náhodné javy A1=ω:ξ1(ω)<x1, A2=ω:ξ2(ω)<x2,. . . , An=ω:ξn(ω)<xn nezávislé, čo znamená, že P(A1∩A2∩. . .∩An)=P(A1)P(A2) . . .P(An).

Pravdepodobnosť na ľavej strane definuje združenú distribučnú funkciu pre náhodný vektor (ξ1, ξ2, . . . , ξn)

F (x1, x2, . . . , xn) = P((ω1, ω2, . . . , ωn) ∈ Ωn : ξ1(ω1) < x1 ∧ ξ2(ω2) < x2 ∧ · · · ∧ ξ2(ω2) < x2), (4.9)

čo sa pre spojité náhodné veličiny dá zapísať pomocou združenej hustoty rozdelenia pravdepodobnosti

F (x1, x2, . . . , xn) =

∫ xn

−∞. . .

∫ x2

−∞

∫ x1

−∞p(t1, t2, . . . , tn)dt1dt2 . . . dtn. (4.10)

Kapitola 4. (Teória pravdepodobnosti) – 12

Page 91: 14.Numericka matematika a amatematicka statistika

Nezávislosť náhodných veličín teda znamenáF (x1, x2, . . . , xn) = Fξ1(x1)Fξ2(x2) . . . Fξn(xn), (4.11)

prípadne pre spojité náhodné veličiny sa dá ukázať tiež

p(x1, x2, . . . , xn) = pξ1(x1)pξ2(x2) . . . pξn(xn). (4.12)

Ak zo spojitých náhodných veličín ξ1, ξ2, . . . ξn potrebujeme vytvoriť novú náhodnú veličinu ψ=h(ξ1, ξ2, . . . , ξn) určenú vhodnou funkciou n premennýchy=h(x1, x2, . . . , xn), distribučnú funkciu pre ψ dostaneme ako

Fψ(x) = P(ψ < x) =

∫. . .

∫ ∫h(t1,t2...,tn)<x

p(t1, t2, . . . , tn)dt1dt2 . . . dtn. (4.13)

Príklad 4.13 Pre dve spojité nezávislé náhodné veličiny ξ1 a ξ2 s hustotami p1 a p2 nájdime hustotu rozdelenia pravdepodobnosti pre ψ=ξ1+ξ2.

Riešenie. Distribučnú funkciu pre náhodnú veličinu ψ môžeme podľa definície a podľa vzťahov 4.13 a 4.12 napísať v tvare

Fψ(x) =

∫ x

−∞pψ(t)dt =

∫∫t1+t2<x

p1(t1)p2(t2)dt1dt2.

Pomocou substitúcie t=t1+t2 v integráli cez t1 a zámenou poradia integrovania dostaneme z druhého integrálu postupne∫ +∞

−∞

∫ x−t2

−∞p1(t1)p2(t2)dt1dt2 =

∫ +∞

−∞

∫ x

−∞p1(t− t2)p2(t2)dtdt2 =

∫ x

−∞

(∫ +∞

−∞p1(t− t2)p2(t2)dt2

)dt,

takže, ak namiesto t2 píšeme s, dostaneme

Fψ(x) =

∫ x

−∞pψ(t)dt =

∫ x

−∞

(∫ +∞

−∞p1(t− s)p2(s)ds

)dt.

Porovnaním dvoch integrálov pre akékoľvek x vidíme, že

pψ(t) =

∫ +∞

−∞p1(t− s)p2(s)ds,

čo je hľadaný vzťah pre hustotu rozdelenia pravdepodobnosti náhodnej veličiny ψ.

Kapitola 4. (Teória pravdepodobnosti) – 13

Page 92: 14.Numericka matematika a amatematicka statistika

Príklad 4.14 Použime výsledok pr. 4.13 na trojicu nezávislých náhodných veličín ξ1, ξ2, ξ3 s rovnakou hustotou rozdelenia pravdepodobnosti z pr.4.12.

Riešenie. Hustota všetkých troch náhodných veličín je daná jednoduchou funkciu p(x)=Θ (x(1− x)). Označme ψ1=ξ1+ξ2. Pre jej hustotu rozdeleniapravdepodobnosti platí

pψ1(t) =

∫ +∞

−∞Θ ((t− s)(1− t+ s)) Θ (s(1− s)) ds.

Integrand je nenulový, ak platia obe nasledujúce nerovnosti: 0<s<1 a 0<t−s<1. Druhú nerovnicu upravíme na tvar t−1<s<t. Z toho plynie, že pret<0 alebo pre t>2 je integrand nulový. V opačnom prípade máme dve možnosti. Ak je 0<t<1, všetky nerovnosti dajú nenulový integrand pre 0<s<t adostaneme ∫ +∞

−∞Θ ((t− s)(1− t+ s)) Θ (s(1− s)) ds =

∫ t

0

1 · 1ds = t.

Ak je 1<t<2, všetky nerovnosti dajú nenulový integrand pre t−1<s<1 a dostaneme∫ +∞

−∞Θ ((t− s)(1− t+ s)) Θ (s(1− s)) ds =

∫ 1

t−1

1 · 1ds = 1− (t− 1) = 2− t.

Hustota rozdelenia pravdepodobnosti sa dá zapísať pomocou Heavisideovej funkcie alebo pomocou „svorky“ ako

pψ1(t) = Θ(t(2− t)) (1− |t− 1|) =

t, 0 < t < 1,

2− t, 1 ≤ t < 2,

0, inak.

Náhodná valičina pre súčet všetkých troch je ψ=ψ1+ξ3. Pre jej hustotu rozdelenia pravdepodobnosti máme

pψ(t) =

∫ +∞

−∞Θ ((t− s)(1− t+ s)) Θ(s(2− s)) (1− |s− 1|) ds.

Integrand je nenulový tentokrát, ak platia obe nasledujúce nerovnosti: 0<s<2 a t−1<s<t. Z toho plynie, že pre t<0 alebo pre t>3 je integrand nulový.V opačnom prípade máme tri možnosti. Ak je 0<t<1, všetky nerovnosti dajú nenulový integrand pre 0<s<t a dostaneme∫ +∞

−∞Θ ((t− s)(1− t+ s)) Θ(s(2− s)) (1− |s− 1|) ds =

∫ t

0

(1− |s− 1|) ds =

∫ t

0

sds =1

2t2.

Kapitola 4. (Teória pravdepodobnosti) – 14

Page 93: 14.Numericka matematika a amatematicka statistika

Ak je 1<t<2, všetky nerovnosti dajú nenulový integrand pre t−1<s<t a dostaneme∫ +∞

−∞Θ ((t− s)(1− t+ s)) Θ(s(2−s)) (1− |s− 1|) ds =

∫ t

t−1

(1− |s− 1|) ds =

∫ 1

t−1

sds+

∫ t

1

(2−s)ds =1

2

(1− (t− 1)2 + 1− (2− t)2

)= −t2+3t−3

2.

Ak je 2<t<3, všetky nerovnosti dajú nenulový integrand pre t−1<s<2 a dostaneme∫ +∞

−∞Θ ((t− s)(1− t+ s)) Θ(s(2− s)) (1− |s− 1|) ds =

∫ 2

t−1

(1− |s− 1|) ds =

∫ 2

t−1

(2− s)ds =1

2(3− t)2.

Hustota pravdepodobnosti náhodnej veličiny ψ je teda daná vzťahom

pψ(t) =

12t2, 0 < t < 1,

−t2 + 3t− 32, 1 ≤ t < 2,

12(3− t)2, 2 ≤ t < 3,

0, inak,

jej graf je na obrázku 4.3.

0

0,2

0,4

0,6

0,8

-1 0 1 2 3 4

Obr. 4.3: Husota rozdelenia pravdepodobnosti náhodnej veličiny ψ z pr. 4.14

Kapitola 4. (Teória pravdepodobnosti) – 15

Page 94: 14.Numericka matematika a amatematicka statistika

Teória pravdepodobnosti – Číselné charakteristiky náhodných veličín

Niektoré vlastnosti náhodných veličín sú veľmi užitočné a vieme ich ľahko vypočítať

Úplný popis náhodnej veličiny obsahuje jej distribučná funkcia. Avšak často potrebujeme len nejakú informáciu o nej. Tieto informácie vieme získať zčíselných charakteristík náhodných veličín, ktoré popisujú základné vlastnosti náhodných veličín a obyčajne sa ľahko počítajú a interpretujú.

Týmito charkteristikami náhodnej veličiny ξ sú počiatočné momenty µ′k, ktoré sú určené vzťahmi

µ′k(ξ) =n∑i=1

pixki , pre diskrétnu náhodnú veličinu nadobúdajúcu n (aj +∞) hodnôt xi s pravdepodobnosťami pi=P(ξ=xi),

µ′k(ξ) =

∫ ∞−∞

p(t)tkdt, pre spojitú náhodnú veličinu s hustotou rozdelenia pravdepodobnosti p,

(4.14)

a centrálne momenty µk, ktoré sú určené vzťahmi

µk(ξ) =n∑i=1

pi(xi − µ′1)k, pre diskrétnu náhodnú veličinu nadobúdajúcu n (aj +∞) hodnôt xi s pravdepodobnosťami pi=P(ξ=xi),

µk(ξ) =

∫ ∞−∞

p(t)(t− µ′1)kdt, pre spojitú náhodnú veličinu s hustotou rozdelenia pravdepodobnosti p.

(4.15)

V oboch prípadoch predpokladáme absolútnu konvergenciu integrálov alebo radov, ak diskrétna náhodná veličina nadobúda nekonečne veľa hodnôt. Toznamená, že napr. v (4.14) existuje integrál

∫∞−∞ p(t)|t|

kdt. V opačnom prípade príslušný moment neexistuje.

Z týchto momentov budeme používať strednú hodnotu Enáhodnej veličiny ξ, ktorá je prvým počiatočným momentom E(ξ)=µ′1(ξ) a rozptyl (disperzia)D, ktorý je druhým centrálnym momentom D(ξ)=µ2(ξ). Vzorce pre ich výpočet sú zhrnuté tiež v tabuľke 4.1

Ak h(x) je funkcia a ξ je náhodná veličina, tak η=h(ξ) je tiež náhodná veličina a platí

Eη =n∑i=1

g(xi)pi, resp. Eη =

+∞∫−∞

g(x)p(x)dx (4.16)

opäť s predpokladom o absolútnej konvergencii.

Kapitola 4. (Teória pravdepodobnosti) – 16

Page 95: 14.Numericka matematika a amatematicka statistika

Tabuľka 4.1: Vzorce pre strednú hodnotu a rozptyl náhodných veličíndiskrétna n. v. ξ spojitá n. v. ξ

Eξ Eξ =n∑i=1

xipi Eξ =+∞∫−∞

xp(x)dx

Dξ Dξ =n∑i=1

(xi − Eξ)2pi =n∑i=1

x2i pi − (Eξ)2 Dξ =

+∞∫−∞

(x− Eξ)2p(x)dx =+∞∫−∞

x2p(x)dx− (Eξ)2

Stredná hodnota náhodnej veličiny sa interpretuje ako očakávaná hodnota náhodnej veličiny, z jej okolia nadobúda náhodná veličina svoje hodnoty sveľkou pravdepodobnosťou. Disperzia charakterizuje mieru rozptýlenosti hodnôt náhodnej veličiny okolo jej strednej hodnoty. Pri praktickom počítaničastejšie používame smerodajnú odchýlku σ=

√Dξ, a to z toho dôvodu, že fyzikálne jednotky pre ňu sú tie isté ako pre hodnoty náhodnej veličiny a tiež

pre jej strednú hodnotu.

Príklad 4.15 Uvažujme kocku z pr. 4.9 a vypočítajme pre jej náhodnú veličinu strednú hodnotu a smerodajnú odchýlku.

Riešenie. Z uvedeného príkladu máme

Ω = 2,3,4, P(2) =1

6, P(3) =

1

2, P(4) =

1

3.

a diskrétnu náhodnú veličinu ξ definovanú prirodzeným spôsobom

ξ(2) = 2, ξ(3) = 3, ξ(4) = 4.

Stredná hodnota je

Eξ = 2 · 1

6+ 3 · 1

2+ 4 · 1

3=

19

6.

Rozptyl vyjde

Dξ =

(2− 19

6

)2

· 1

6+

(3− 19

6

)2

· 1

2+

(4− 19

6

)2

· 1

3=

17

36,

takže smerodajná odchýlka je σ=√

176.

Kapitola 4. (Teória pravdepodobnosti) – 17

Page 96: 14.Numericka matematika a amatematicka statistika

Príklad 4.16 Vypočítajme strednú hodnotu a smerodajnú odchýlku pre náhodné veličiny z pr. 4.12 a pr. 4.14.

Riešenie. Najprv máme náhodnú veličinu ξ z pr. 4.12 s hustotou p(x)=Θ(x(x− 1)). Charkteristiky pre ňu sú

Eξ =

∫ +∞

−∞xΘ(x(x− 1))dx =

∫ 1

0

xdx =1

2,

Dξ =

∫ +∞

−∞(x− 1

2)2Θ(x(x− 1))dx =

∫ 1

0

(x− 1

2)2dx = 2

1

3

(1

2

)3

=1

12⇒ σ =

√3

6.

V pr. 4.14 sme našli hustotu rozdelenia pravdepodobnosti ψ=ξ1+ξ2+ξ3 v tvare

pψ(x) =

12x2, 0 < x < 1,

−x2 + 3x− 32, 1 ≤ x < 2,

12(3− x)2, 2 ≤ x < 3,

0, inak,

,

preto pre strednú hodnotu môžeme písať

Eψ =

∫ 1

0

x1

2x2dx+

∫ 2

1

x

(−x2 + 3x− 3

2

)dx+

∫ 3

2

x1

2(3− x)2dx =

1

8+ 1 +

3

8=

3

2.

Rozptyl je daný vzťahom

Dψ =

∫ 1

0

(x− 3

2

)21

2x2dx+

∫ 2

1

(x− 3

2

)2(−x2 + 3x− 3

2

)dx+

∫ 3

2

(x− 3

2

)21

2(3− x)2dx =

1

10+

1

20+

1

10=

1

4,

takže smerodajná odchýlka je σ=12.

Všimnime si, že Eψ=Eξ1+Eξ2+Eξ3=3Eξ a tiež Dψ=Dξ1+Dξ2+Dξ3=3Dξ, čo sú všeobecné vlastnosti strednej hodnoty aj rozptylu nezávislých náhod-ných veličín, ako uvidíme nižšie.

Príklad 4.17 Určte konštantu c tak, aby p bola hustota rozdelenia pravdepodobnosti náhodnej veličiny ξ. S vypočítaným c nájdite distribučnú funkciunáhodnej veličiny ξ a jej základné charakteristiky: strednú hodnotu Eξ a rozptyl Dξ. Nájdite medián rozdelenia pravdepodobnosti.

p(x) =

0, x ≤ a,

c x−av−a , a < x ≤ v,

c x−bv−b v < x ≤ b,

0, x > b,

a < v < b.

Kapitola 4. (Teória pravdepodobnosti) – 18

Page 97: 14.Numericka matematika a amatematicka statistika

Riešenie. Určme parameter c so známej podmienky jednotkového integrálu p

1 =

∫ +∞

−∞p(x)dx =

∫ v

a

cx− av − a

dx+

∫ b

v

cx− bv − b

dx =1

2c (v − a) +

1

2c (b− v) =

1

2c (b− a),

teda c= 2b−a .

Distribučnú funkciu Fξ určíme podľa vzťahu k hustote pravdepodobnosti.

Fξ(x) =

0, x ≤ a,∫ xa

2b−a

x−av−adx = (x−a)2

(b−a)(v−a), a < x ≤ v,∫ v

a2b−a

x−av−adx+

∫ xv

2b−a

x−bv−bdx = 1− (x−b)2

(b−a)(b−v)v < x ≤ b,

1, x > b.

Charakteristiky vypočítame podľa vzorcov

Eξ =

∫ b

a

x p(x)dx =

∫ v

a

x2(x− a)

(b− a)(v − a)dx+

∫ b

v

x2(x− b)

(b− a)(v − b)dx = · · · = 1

3(a+ b+ v),

Dξ =

∫ b

a

x2 p(x)dx− (Eξ)2 =

∫ v

a

x2 2(x− a)

(b− a)(v − a)dx+

∫ b

v

x2 2(x− b)(b− a)(v − b)

dx− 1

9(a+ b+ v)2

= · · · = 1

12

[(v + a)2 + (b+ v)2 + (b+ a)2]− 1

9(a+ b+ v)2 =

1

36

[(v − a)2 + (b− v)2 + (b− a)2] .

Medián x0,5 zistíme podľa distribučnej funkcie tak, aby jej hodnota bola 0,5. Teda napr.

(x0,5 − a)2

(b− a)(v − a)=

1

2⇒ x0,5 = a+

√1

2(b− a)(v − a),

avšak to iba v prípade, že a<x0,5≤v. To nastane vtedy, keď

a < a+

√1

2(b− a)(v − a) ≤ v ⇒ 1

2(a+ b) ≤ v.

Kapitola 4. (Teória pravdepodobnosti) – 19

Page 98: 14.Numericka matematika a amatematicka statistika

V opačnom prípade musíme použiť iný „riadok“ distribučnej funkcie

1− (x− b)2

(b− a)(b− v)=

1

2⇒ x0,5 = b−

√1

2(b− a)(b− v).

Zhrnutím dostaneme

x0,5 =

a+√

12(b− a)(v − a), 1

2(a+ b) ≤ v,

b−√

12(b− a)(b− v), 1

2(a+ b) > v.

Vypočítať strednú hodnotu alebo rozptyl je niekedy možné bez definičného vzorca, iba s využitím známych vlastností týchto charakteristík.

Majme ľubovoľnú náhodnú veličinu ξ s Eξ=m, Dξ=σ2, σ>0 a reálne čísla a, b. Potom platí

E(aξ + b) = am+ b, D(aξ + b) = a2σ2. (4.17)

Priamym dôsledkom tohto vzorca pre b=−mσ

a a= 1σje, že náhodná veličina η= ξ−m

σmá nulovú strednú hodnotu a jednotkový rozptyl: Eη=0, Dη=1.

Tento fakt budeme využívať v štatistike, náhodnú veličinu budeme nazývať normovaná (alebo štandardná).

Ďalšie vlastnosti súvisia so súčtom a súčinom náhodných veličín (viď tiež pr. 4.16). Nech ξ1, ξ2, . . . ξn sú nezávislé náhodné veličiny s konečnýmistrednými hodnotami, prípadne rozptylmi. Potom platí

E (ξ1 + ξ2 + · · ·+ ξn) = Eξ1 + Eξ2 + · · ·+ Eξn, (4.18a)E (ξ1 · ξ2 · · · · · ξn) = Eξ1 · Eξ2 · · · · · Eξn, (4.18b)

D (ξ1 + ξ2 + · · ·+ ξn) = Dξ1 + Dξ2 + · · ·+ Dξn. (4.18c)

Prvý z týchto vzťahov platí aj bez predpokladu a nezávislosti náhodných veličín.

Príklad 4.18 Odvoďme vzťahy (4.17) pre spojitú náhodnú veličinu.

Riešenie. Podľa rovnice (4.16) pre funkciu h(x)=ax+b dostaneme

E(aξ + b) = E(h(ξ)) =

∫ +∞

−∞h(t)p(t)dt =

∫ +∞

−∞(at+ b)p(t)dt = a

∫ +∞

−∞tp(t)dt+ b

∫ +∞

−∞p(t)dt = aEξ + b = am+ b.

Podobne

D(aξ + b) = E((aξ + b− E(aξ + b))2) =

∫ +∞

−∞(at+ b− E(aξ + b))2p(t)dt = a2

∫ +∞

−∞(t− Eξ)2p(t)dt = a2Dξ = a2σ2.

Kapitola 4. (Teória pravdepodobnosti) – 20

Page 99: 14.Numericka matematika a amatematicka statistika

Príklad 4.19 Nech ξ1, ξ2, . . . ξn sú nezávislé náhodné veličiny také, že Eξi=m, Dξi=σ2 a ξ = ξ1+ξ2+···+ξn

n. Nájdime Eξ a Dξ.

Riešenie. Podľa vlastností E a D dostaneme

Eξ =1

nE(ξ1 + ξ2 + · · ·+ ξn) =

1

nnm = m, Dξ =

1

n2D(ξ1 + ξ2 + · · ·+ ξn) =

1

n2nσ2 =

σ2

n.

„Priemerná“ náhodná veličina má teda rovnakú strednú hodnotu, ako tie z ktorých je počítaná, ale má n-krát menší rozptyl. Smerodajná odchýlka jeteda

√n-krát menšia.

Číselnými charakteristikami môžeme popísať aj vzťah dvoch náhodných veličín. Ak ξ a η sú dve náhodné veličiny, silu ich vzájomného lineárneho vzťahupopisuje korelačný koeficient %ξη, ktorý sa definuje vzťahom

%ξη =E ((ξ − Eξ)(η − Eη))√

DξDη=

E (ξη)− EξEη√DξDη

. (4.19)

Tejto relácii medzi náhodnými veličinami sa hovorí korelačná závislosť. Pre koeficient korelácie platí:

A4. |%ξη| ≤ 1

B4. %ξξ = 1

C4. Ak ψ=aη+b, a 6=0, tak %ξψ= sgn a%ξη. To znamená, že lineárna transformácia náhodných veličín nemení veľkosť korelačného koeficientu medzinimi (sgn a je „znamienko“ a: 1 pre kladné, −1 pre záporné).

Príklad 4.20 Ukážme vlastnosť A4.

Riešenie. Podľa definície (4.19) a vlastností (4.17)

%ξψ =E ((ξ − Eξ)(aη + b− E(aη + b)))√

DξD(aη + b)=aE ((ξ − Eξ)(η − Eη)))√

Dξa2Dη=

a√a2%ξη = sgn a %ξη

O sile korelačnej závislosti náhodných veličín vypovedá absolútna hodnota %ξη. Čím je ďalej od nuly, tým je korelačná závislosť silnejšia a |%ξη|=1 vypovedápodľa vlastností B4 a C4 o exaktne lineárnom vzťahu ξ a η. V prípade, že %ξη=0 hovoríme, že náhodné veličiny sú korelačne nezávislé.

Kapitola 4. (Teória pravdepodobnosti) – 21

Page 100: 14.Numericka matematika a amatematicka statistika

Závislosť náhodných veličín a ich korelačná závislosť sú dva rôzne pojmy. Pravda z definície korelačného koeficientu (posledný výraz v (4.19)) a vlastnostistrednej hodnoty súčinu nezávislých náhodných veličín (4.18b) vyplýva, že každé dve nezávislé náhodné veličiny sú aj korelačne nezávislé.

Aby sme vedeli určiť koeficient korelácie, nestačí poznať rozdelenia pravdepodobností nahodných veličiín ξ a η, ale potrebujeme poznať rozdeleniepravdepodobnosti pre náhodný vektor (ξ, η) prostredníctvom združenej distribučnej funkcie (4.10), z ktorej rozdelenia pravdepodobností pre ξ alebo ηvyplynú zo vzťahu (4.13) s h(ξ, η)=ξ alebo h(ξ, η)=η.

Príklad 4.21 Je daná združená hustota rozdelenia pravdepodobnosti pre náhodný vektor (ξ, η) vzťahom

p(x, y) =3

2Θ(x(1− x))Θ(y(1− y)) (1− |x− y|) .

Vypočítajme koeficient korelácie pre ξ a η. Nájdime rozdelenia pravdepodobnosti pre ξ a η.

Riešenie. Na základe rovnice (4.13) vieme, že hustota rozdelenia pravdepodobnosti pξ je

pξ(x) =

∫ +∞

−∞p(x, y)dy =

3

2

∫ 1

0

(1− |x− y|) dy =3

2

[∫ x

0

(1− y − x) dy +

∫ 1

x

(1− x− y) dy

]=

3

2

(1

2+ x− x2

)pre x∈(0; 1), keďže pξ je nenulové iba na tomto intervale. Pre η dostaneme to isté rozdelenie pravdepodobnosti, lebo p(x, y) je symetrické voči zámenex a y.

Stredná hodnota a rozptyl ξ sú

Eξ =

∫ 1

0

3

2

(1

2+ x− x2

)xdx =

1

2, Dξ =

∫ 1

0

3

2

(1

2+ x− x2

)(x− 1

2

)2

dx =3

40.

Strednú hodnotu súčinu dostaneme podľa vzťahov (4.13) a (4.16) nasledovne

E(ξη) =

∫ +∞

−∞

∫ +∞

−∞xy p(x, y)dxdy =

3

2

∫ 1

0

∫ 1

0

xy (1− |x− y|) dxdy =11

40.

Takže koeficient korelácie je

%ξη =E (ξη)− EξEη√

DξDη=

1140− 1

212√

340

340

=1

3.

Náhodné veličiny sú teda korelačne závislé, a tak aj závislé.

Kapitola 4. (Teória pravdepodobnosti) – 22

Page 101: 14.Numericka matematika a amatematicka statistika

Teória pravdepodobnosti – Rozdelenia pravdepodobnosti náhodných veličín

Pri praktickom zaobchádzaní s náhodnými výsledkami sa obyčajne stretávame s niektorými typickými náhodnými veličinami

Pri sledovaní náhodných javov v praktických úlohách sa stretávame s typickými rozdeleniami pravdepodobností ich náhodných veličín. Je dobré poznaťaspoň základné typy týchto náhodných veličín.

Pre náhodné veličiny s diskrétnym rozdelením pravdepodobnosti sú to alternatívne rozdelenie A(p), binomické rozdelenie B(n, p) a Poissonovo rozdelenieP(λ). V zátvorkách uvádzame parametre, od ktorých toto rozdelenie pravdepodobnosti závisí. Základný popis týchto náhodných veličín je uvedený vtabuľke 4.2. Pre zápis toho, že náhodná veličina ξ má rozdelenie daného typu G budeme používať zápis ξ∼G.Najjednoduchšou náhodnou veličinou je taká, ktorá môže nadobudnúť len dve hodnoty, tej hovoríme že má alternatívne rozdelenie a obyčajne tie hodnotyoznačíme 1 a 0. Jej charakteristiky spočitame podobne ako v pr. 4.15. Častejšie sa takýto jednoduchý jav niekoľkokrát opakuje a nás zaujíma početnosťvýskytu niektorého z výsledkov. Táto početnosť je náhodnou veličinou η s binomickým rozdelením a dá sa interpretovať ako súčet n nezávislých náhodnýchveličín ξi s alternatívnym rozdelením, teda

η∼B(n, p), η = ξ1 + ξ2 + · · ·+ ξn, ξ∼A(p) (4.20)

Z toho plynú aj hodnoty charakteristík, ktoré sa odvodia pomocou vlastností (4.18a) a (4.18c) z alternatívneho rozdelenia.

Príklad 4.22 Majme niekoľko štandardných hracích kociek. Koľko ich musíme mať, aby pravdepodobnosť toho, že nám v hode padnú aspoň tri 1,bola aspoň 0,5.

Riešenie. Označme neznámy počet kociek N . Pri hode jednou kockou je pravdepodobnosť toho, že padne 1 rovná 16. Z tohto pohľadu má kocka

alternatívne rozdelenie pravdepodobnosti: ξ(1)=1, ξ(¬1)=0 a p=16. Početnosť η 1 v hode N kockami má teda rozdelenie B(N, p). Zaujíma nás

pravdepodobnosť P(η≥3), o ktorej vieme, že má byť viac ako polovica. Úpravou dostávame

1

2≤ P(η ≥ 3) = 1− P(η < 3) = 1− P(η = 0)− P(η = 1)− P(η = 2) = 1−

(N

0

)(5

6

)N−(N

1

)(1

6

)(5

6

)N−1

−(N

2

)(1

6

)2(5

6

)N−2

= 1−(

5

6

)N (1 +

1

5N +

1

50N(N − 1)

), čo vedie k nerovnici

1

2

(6

5

)N≥ 1 +

9

50N +

1

50N2.

Keďže N je celé číslo, hľadáme postupným dosadzovaním, pre ktoré N je vzťah splnený. Vyjde nám N≥16. Potrebujeme hodiť aspoň 16 kociek, abypravdepodobnosť toho, že v hode sú aspoň tri 1 bola väčšia ako tá, že tam nie sú.

Kapitola 4. (Teória pravdepodobnosti) – 23

Page 102: 14.Numericka matematika a amatematicka statistika

Tabuľka 4.2: Popis základných diskrétnych rozdelení pravdepodobnostiAlternatívne Binomické Poissonovo

VzorecParametre

p ∈ (0; 1)P(ξ=1) = p, P(ξ=0) = 1−p

p ∈ (0; 1), n ≥ 1

P(ξ=k) =

(n

k

)pk(1−p)n−k

k = 0, 1, . . . n

λ > 0

P(ξ=k) =λk

k!e−λ

k = 0, 1, . . .

Charakteristiky Eξ = p, Dξ = p(1− p) Eξ = np, Dξ = np(1− p) Eξ = λ, Dξ = λ

Použitie

Ak ξ má iba dva výsledky: jav Abuď nastane (s pravdepodobnosťou p)alebo nenastane (s pravdepodobnos-ťou 1−p)

Pre n nezávislých rovnakých pokusov,v ktorých jav A nastane s pravdepo-dobnosťou p, ξ určuje počet výskytovjavu A v týchto n pokusoch

Pre sledovanie počtu výskytov javu Aza určený čas (počet porúch, obslúh,. . . )

Grafypravdepodobností

0

0,03

0,06

0,09

0,12

0,15

0 10 20 30 40 50

n = 50, p = 15

0

0,03

0,06

0,09

0,12

0,15

0 5 10 15 20 25

λt = 10

0

0,05

0,1

0,15

0,2

0,25

0 3 6 9 12 15

n = 15, p = 23

0

0,05

0,1

0,15

0,2

0 5 10 15 20 25

λt = 5

Kapitola 4. (Teória pravdepodobnosti) – 24

Page 103: 14.Numericka matematika a amatematicka statistika

Poissonovo rozdelenie pravdepodobnosti sleduje počet výskytov daného javu, obyčajne v istom časovom intervale. Ak dĺžka tohto intervalu je jednotková,označíme t=1, a očakávaný počet výskytov je λ·1 (podľa tabuľky 4.2 Eξ=λ), tak pre interval všeobecnej dĺžky t bude Eξt=λ t a parameter rozdeleniamá hodnotu λ t. Poissonovo aj binomické rozdelenie sledujú počet výskytov daného javu, a tak sa dá očakávať, že sa jedno môže nahradiť druhým. Preveľký počet pokusov n v binomickom rozdelení ho môžeme nechať rásť nad všetky medze, poznajúc očakávaný počet výskytov sledovaného javu np=λ.V takom prípade binomické rozdelenie nahradíme Poissonovým s parametrom λ.

Príklad 4.23 Ukážme, že pre veľký počet pokusov n v binomickom rozdelení ho môžeme nahradiť rozdelením Poissonovým.

Riešenie. Ak ξ∼B(n, p)n, označme np=λ a dosaďme do vzorca z tabuľky 4.2 za p. Dostaneme

P(ξ=k) =

(n

k

)pk(1−p)n−k =

(n

k

) (λ

n

)k(1−λ

n)n−k.

Vypočítajme teraz limitu pre n→+∞

limn→+∞

P(ξ=k) = limn→+∞

(n

k

) (λ

n

)k (1−λ

n

)n−k= lim

n→+∞

n(n− 1)(n− 2) . . . (n− k + 1)

k!

λk

nk

(1−λ

n

)n(1−λ

n

)−k= lim

n→+∞

[n(n− 1)(n− 2) . . . (n− k + 1)

nk

(1−λ

n

)−k]λk

k!

(1−λ

n

)n= 1

λk

k!e−λ,

čo je podľa tabuľky 4.2 P(ξ=k) pre Poissonovo rozdelenie.

Príklad 4.24 Odvoďme vzorec pre strednú hodnotu Poissonovho rozdelenia.

Riešenie. K nájdeniu strednej hodnoty potrebujeme poznať rozvoj funkcie y=ex do mocninového radu vyjadrený pomocou jej Taylorovho radu

ex = 1 + x+1

2x2 +

1

6x3 + · · ·+ 1

k!xk + · · · =

+∞∑j=0

xj

j!.

Teraz môžeme vypočítať strednú hodnotu náhodnej veličiny ξ s Poissonovým rozdelením pravdepodobnosti

Eξ =+∞∑j=0

j

(λj

j!e−λ)

=+∞∑j=1

λj−1

(j − 1)!e−λ)

= λe−λ+∞∑k=0

(λk

k!

)= λe−λeλ = λ.

Kapitola 4. (Teória pravdepodobnosti) – 25

Page 104: 14.Numericka matematika a amatematicka statistika

Príklad 4.25 Analýza údajov z predchádzajúceho obdobia hovorí, že priemerný počet vlakov, ktoré prejdú cez most za hodinu je 5. S akým maximálnympočtom vlakov za hodinu je potrebné pri konštrukcii nového mosta počítať, aby pravdepodobnosť takej extrémnej situácie bola 0,99.

Riešenie. Nech ξ je náhodná veličina vyjadrujúca počet vlakov, ktoré prejdú mostom za hodinu. Podľa predpokladu Eξ=5, takže parameter λ je tiež päť.Našou úlohou je zistiť pre aké k ešte platí, že P(ξ≤k)≤0,99. To znamená

0,99≥P(ξ≤k) = e−5

(1 + 5 +

1

252 +

1

653 + · · ·+ 1

k!5k).

Keďže 0,99e5 .=146,9 a suma v zátvorkách je pre k=10 približne 146,4 a pre k=11 je približne 147,6, most je potrebné konštruovať na desať vlakov zahodinu.

Náhodné veličiny so spojitým rozdelením pravdepodobnosti si spomenieme tiež tri: rovnomerné rozdelenie U(m,w), exponenciálne rozdelenie E(δ) anormálne (Gaussovo) rozdelenie N (m,σ2). V zátvorkách uvádzame parametre, od ktorých toto rozdelenie závisí. Základný popis týchto náhodnýchveličín je uvedený v tabuľke 4.3.

Náhodné veličiny ξ s rovnomerným rozdelením majú tú vlastnosť, že pre všetky intervaly I rovnakej dĺžky z intervalu 〈m−w2;m+w

2〉 je P(ξ∈I) rovnaká.

S týmto rozdelením pravdepodobnosti sme sa stretli v pr. 4.10, pr. 4.12, pr. 4.14 a pr. 4.16. Je to asi najjednoduchší typ spojitého rozdeleniapravdepodobnosti.

Vyššie sme spomínali Poissonovo rozdelenie pravdepodobnosti, ktoré sledovalo počet výskytov daného javu za určitý čas. Medzi dvoma výskytmi tohtojavu uplynie teda istá doba, ktorej dĺžka je náhodná a takáto náhodná veličina má exponenciálne rozdelenie. Nech ξ∼P(λ) a nech η vyjadruje dobumedzi výskytmi javu. Potom pre ľubovoľné t platí

Fη(t) = P(η < t) = 1− P(η > t)∗= 1− P(ξt = 0) = 1− e−λt, (4.21)

čo ukazuje na to, že η má exponenciálne rozdrozdelenie pravdepodobnosti s parametrom δ=λ. Vzťah označený ∗ sme mohli použiť, pretože za dobut nenastala ani jedna udalosť. Exponenciálne rozdelenie má ešte jednu zaujímavú vlatnosť, a to že nezávisí od minulosti, ako uvidíme v nasledujúcompríklade.

Príklad 4.26 Nech doba obsluhy η má exponenciálne rozdelenie a neskončila počas doby t. Potom pravdepodobnosť, že neskončí ani počas ďalšej dobyτ sa rovná pravdepodobnosti, že neskončí iba počas doby τ . Dokážme!

Riešenie. Zosumarizujme si, čo chceme určiť. Obsluha neskonščila počas doby t, a to má pravdepodobnosť P(η > t). Za tohto predpokladu chceme určiťpravdepodobnosť, že neskončí ani za následnú dobu τ , teda celkovo za čas t+τ . Keďže máme podmienku, počítame podmienenú pravdepodobnosť z jej

Kapitola 4. (Teória pravdepodobnosti) – 26

Page 105: 14.Numericka matematika a amatematicka statistika

Tabuľka 4.3: Popis základných spojitých rozdelení pravdepodobnostiRovnomerné Exponenciálne Normálne (Gaussovo)

Hustota rozdeleniaParametre

p(x) = Θ(w2

4− (x−m)2) 1

w

m ∈ R, w > 0p(x) = Θ(x)δe−δx

δ > 0p(x) = 1√

2πσe−

(x−m)2

2σ2

m ∈ R, σ2(σ > 0)

Distribučná funkcia F (x) = 12

(1− |x−b|−|x−a|

b−a

)F (x) = Θ(x)

(1− e−δx

)F (x) =

x∫−∞

1√2πσ

e−(t−m)2

2σ2 dt = Φ(x−mσ

)

Charakteristiky Eξ = m, Dξ = w2

12Eξ = 1

δ, Dξ = 1

δ2Eξ = m, Dξ = σ2

Použitie Generátor náhodných číselVyjadruje dobu medzi dvoma výskytmisledovaného javu (dobu životnosti,dobu obsluhy, . . . )

Vyjadruje chybu pri meraní, charakterpopulácie (výšku ľudí,. . . ); najpouží-vanejšie rozdelenie pravdepodobnostiv matematickej štatistike.

Grafyhustoty rozdeleniapravdepodobnosti

0

0,5

1

1,5

2

-2 -1 0 1 2

w = 2

w = 1

w = 0,5m = 0

0

0,5

1

1,5

2

0 2 4 6 8

δ = 1

δ = 2

δ = 0,5

0

0,2

0,4

0,6

0,8

-4 -2 0 2 4

σ = 1

σ = 2

σ = 0,5

m = 0

0

0,5

1

1,5

2

-2 -1 0 1 2

m = 1m = 0m = −1

w = 1

0

0,2

0,4

0,6

0,8

-4 -2 0 2 4

m = 0 m = 2m = −3

σ = 1

Kapitola 4. (Teória pravdepodobnosti) – 27

Page 106: 14.Numericka matematika a amatematicka statistika

definície (4.2). S použitím distribučnej funkcie pre exponenciálne rozdelnie z tabuľky 4.3 dostaneme

P(η > t+ τ/η > t) =P(η > t+ τ ∩ η > t)

P(η > t)=

P(η > t+ τ)

P(η > t)=

1−(1− e−δ(t+τ)

)1− (1− e−δt)

= e−δτ = P(η > τ),

čo je pravdepodobnosť toho, že obsluha neskončila počas doby τ . A to sme mali ukázať.

Príklad 4.27 V istom hypermarkete sa objavila tabuľa s nápisom: „Ak nie sú všetky pokladne v prevádzke a Vy čakáte v rade pri pokladni viac ako päťminút, dostanete od nás jedno euro ako darček.“ Predpokladajme, že nie všetky pokladne sú v prevádzke a jeden človek čaká v priemere sto sekúnd naobsluhu. S akou pravdepodobnosťou dostane nejaký zákazník sľúbené euro?

Riešenie. Predpokladajme, že doba obsluhy má exponenciálne rozdelenie s parametrom δ. Keďže stredná doba obsluhy je určená strednou hodnotounáhodnej veličiny ξ s exponenciálnym rozdelením a platí Eξ=1

δ, potom aj

Eξ =1

δ=

100

60(v minútach) ⇒ δ =

3

5.

Hľadanú pravdepodobnosť spočítame pomocou distribučnej funkcie exponenciálneho rozdelenia

P(ξ > 5) = 1− P(ξ ≤ 5) = 1− Fξ(5) = 1−(1− e−5δ

)= e−3 .

= 0,0498,

teda zákazník dostane sľúbené euro s pravdepodobnosťou asi päť percent.

Najdôležitejšie rozdelenie pravdepodobnosti je normálne rozdelenie. A to nielen z hľadiska teórie, ale aj aplikácií a jeho využitia v matematickej štatistike.Distribučnú funkciu tohto rozdelenia nevyjadríme pomocou elementárnych funkcií, a tak ako aj v tabuľke 4.3, ju obyčajne vyjadrujeme pomocouštandardizovanej funkcie Φ, ktorá predstavuje distribučnú funkciu štandardného normálneho rozdelenia, t.j N (0, 1)

Φ(x) =1√2π

∫ x

−∞e−

t2

2 dt. (4.22)

Hodnoty funkcie Φ čítame z tabuľky 4.4. V dôsledku symetrie rozdelenia, t.j. párnosti hustoty rozdelenia pravdepodobnosti, platí vzťah Φ(x)=1−Φ(−x),a tak tabuľka je uvedená iba pre kladné x. Normálne rozdelenie má celý rad zaujímavých a dôležitých vlastností, z ktorých si uvedieme tieto

A5. Nech ξ1∼N (m1, σ21), ξ2∼N (m2, σ

22),. . . ,ξn∼N (mn, σ

2n) sú nezávislé a nech η=c+c1ξ1 +c2ξ2 + · · ·+cnξn, kde c, c1, c2, . . . cn sú reálne nenulové

konštanty. Potom platíη ∼ N

(c+ c1m1 + c2m2 + · · ·+ cnmn, c

21σ

21 + c2

2σ22 + · · ·+ c2

2σ22

), (4.23)

teda „súčet normálnych je normálne“ .

Kapitola 4. (Teória pravdepodobnosti) – 28

Page 107: 14.Numericka matematika a amatematicka statistika

Tabuľka 4.4: Tabuľka hodnôt funkcie ΦΦ 0 1 2 3 4 5 6 7 8 90,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,99983,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,99983,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Kapitola 4. (Teória pravdepodobnosti) – 29

Page 108: 14.Numericka matematika a amatematicka statistika

B5. Nech náhodný vektor (ξ1, ξ2) má združené normálne rozdelenie určené hustotou rozdelenia pravdepodobnosti

p(x1, x2) =1

2πσ1σ2

√1− %2

e− 1

1−%2

[(x1−m1)

2

2σ21+

(x2−m2)2

2σ22−% (x1−m1)(x2−m2)

σ1σ2

], (4.24)

kde ξ1∼N (m1, σ21), ξ2∼N (m2, σ

22) a % je koeficient korelácie ξ1 a ξ2. Potom ξ1 a ξ2 sú nezávislé práve vtedy keď sú korelačne nezávislé, t.j. %=0.

C5. Nech ξ1, ξ2,. . . ,ξn,. . . je postupnosť nezávislých náhodných veličín s rovnakými strednými hodnotami aj rozptylmi: Eξi=m, Dξi=σ2 a nech

ξ(n)= ξ1+ξ2+···+ξnn

. Potom

limn→+∞

Fη(n)(x) = Φ(x), kde η(n) =ξ(n) − Eξ(n)√

Dξ(n). (4.25)

Tvrdenie sa nazýva centrálna limitná veta a hrá kľúčovú úlohu napr. v mnohých štatistických výpočtoch. Tvrdí v podstate to, že spriemerovanénáhodné veličiny po normovaní majú veľmi blízko k náhodnej veličine so štandardným normálnym rozdelením.

Príklad 4.28 Ukážme, že parametre normálneho rozdelenia určujú jeho strednú hodnotu a rozptyl.

Riešenie. Venujme sa najprv strednej hodnote

Eξ =

∫ +∞

−∞x

1√2πσ

e−(x−m)2

2σ2 dx =

∣∣∣∣∣∣∣∣t = x−m

σ

dt = 1σdx

x→ −∞ : t→ −∞x→ +∞ : t→ +∞

∣∣∣∣∣∣∣∣ =

∫ +∞

−∞(σt+m)

1√2π

e−t2

2 dt∗= 2m

∫ +∞

0

1√2π

e−t2

2 dt

=

∣∣∣∣∣∣∣∣s = t2

2, t =

√2s

dt = 1√2s

ds

t = 0 : s = 0t→ +∞ : s→ +∞

∣∣∣∣∣∣∣∣ = 2m

∫ +∞

0

1

2√π s

e−sds = 2m1

2√π

Γ

(1

2

)= m,

kde sme v rovnosti označenej ∗ využili paritu integrovaných funkcií a v poslednej úprave hodnotu funkcie Γ: Γ(

12

)=√π, viď nižšie pr. 4.33.

Podobne vypočítame aj rozptyl (substitúcie sú presne také ako pred chvíľou)

Dξ =

∫ +∞

−∞(x−m)2 1√

2πσe−

(x−m)2

2σ2 dx =

∫ +∞

−∞σ2t2

1√2π

e−t2

2 dt = 2σ2

∫ +∞

0

t21√2π

e−t2

2 dt = 2σ2

∫ +∞

0

2s1

2√π s

e−sds = 2σ2 1√π

Γ

(3

2

)= σ2,

kde sme v poslednej úprave využili hodnotu funkcie Γ: Γ(

32

)=1

2Γ(

12

)=1

2

√π, viď nižšie vzťah (4.27).

Kapitola 4. (Teória pravdepodobnosti) – 30

Page 109: 14.Numericka matematika a amatematicka statistika

Príklad 4.29 Ukážme že pre náhodnú veličinu ξ∼N (m,σ2) a ľubovoľné reálne konštanty a, b (a 6=0) platí η=aξ+b ∼ N (am+ b, a2σ2).

Riešenie. Stredná hodnota a rozptyl veličiny η sa dajú odvodiť aj z vlastnosti (4.17). Venujme sa teda iba normalite rozdelenia pre η. Pre jej distribučnúfunkciu platí

Fη(x) = P(η < x) = P(aξ+b < x).

Keďže chceme deliť a, musíme rozlíšiť kladné a záporné a. Nech a>0. Potom

P(aξ+b < x) = P

(ξ <

x− ba

)= Fξ

(x− ba

)= Φ

(x−ba−mσ

)= Φ

(x− am− b

)a posledný výraz potvrdzuje podľa vzťahu pre distribučnú funkciu z tabuľky 4.3 normalitu rozdelenia pravdepodobnosti η, dokonca aj jej strednú hodnotua rozptyl.

Nech teraz a<0. Potom

P(aξ+b < x) = P

(ξ >

x− ba

)= 1− P

(ξ <

x− ba

)= 1− Fξ

(x− ba

)= 1− Φ

(x−ba−mσ

)= 1− Φ

(x− am− b

)∗= Φ

(x− am− b−aσ

)a posledný výraz opäť potvrdzuje normalitu rozdelenia pravdepodobnosti η, ak si uvedomíme symetriu normálneho rozdelenia reprezentovanú vzťahomΦ(x)=1−Φ(−x) (použitom v rovnosti ∗) a kladnosť menovateľa −aσ.

Príklad 4.30 Ukážme že pre dvojicu nezávislých náhodných veličín ξ1∼N (m1, σ21) a ξ2∼N (m2, σ

22) platí η=ξ1+ξ2 ∼ N (m1 +m2, σ

21 + σ2

2).

Riešenie. Strednú hodnotu a rozptyl pre η môžeme zdôvodniť aj použitím vzťahov (4.18a) a (4.18c). Ťažšie bude ukázať normalitu.

Podľa výsledku pr. 4.13 vieme, že

pη(x) =

∫ +∞

−∞pξ1(t)pξ2(x− t)dt =

∫ +∞

−∞

1√2πσ1

e− (t−m1)

2

2σ211√

2πσ2

e− (x−t−m2)

2

2σ22 dt =

∣∣∣∣∣∣∣∣t−m1 = s, µ = x−m1 −m2

dt = dst→ −∞ : s→ −∞t→ +∞ : s→ +∞

∣∣∣∣∣∣∣∣ =

∫ +∞

−∞

1

2πσ1σ2

e− 1

2

(s2

σ21+

(µ−s)2

σ22

)ds.

Upravme teraz výraz v exponente na súčet štvorcov tak, aby s bolo iba v jednom z nich. Dostaneme

s2

σ21

+(µ− s)2

σ22

=

(1

σ21

+1

σ22

)s2 − 2

µ

σ22

s+µ2

σ22

=σ2

1 + σ22

σ21σ

22

(s− µσ2

1

σ21 + σ2

2

)2

+µ2

σ21 + σ2

2

.

Kapitola 4. (Teória pravdepodobnosti) – 31

Page 110: 14.Numericka matematika a amatematicka statistika

Dosadením do posledného integrálu máme

pη(x) =

∫ +∞

−∞

1

2πσ1σ2

e−σ

21+σ

22

2σ21σ22

(s− µσ21

σ21+σ22

)2

− µ2

2(σ21+σ22) ds =1√

2π (σ21 + σ2

2)e− µ2

2(σ21+σ22)∫ +∞

−∞

1√

2πσ21σ

22

σ21+σ2

2

e

(s−

µσ21σ21+σ

22

)2

2σ21σ

22

σ21+σ22

ds

=1√

2π (σ21 + σ2

2)e− µ2

2(σ21+σ22) =1√

2π (σ21 + σ2

2)e− (x−m1−m2)

2

2(σ21+σ22) ,

pretože v poslednom integráli integrujeme hustotu normálneho rozdelenia pravdepodobnosti so strednou hodnotou µσ21

σ21+σ2

2a s rozptylom σ2

1σ22

σ21+σ2

2a tento

integrál v zadaných hraniciach je jedna. Výsledná funkcia je hustotou normálneho rozdelenia pravdepodobnosti s požadovanými parametrami.

Príklad 4.31 Pre ξ∼N (m,σ2) odvoďme pravidlo „troch sigma“ : P(|ξ −m| > 3σ)<0,003.

Riešenie. Keďže η= ξ−mσ

má štandardné normálne rozdelenie, tak

P(|ξ −m| < 3σ) = P(−3 < η < 3) = Φ(3)− Φ(−3) = 2Φ(3)− 1∗= 2 · 0,9987− 1 = 0,9974 > 0,997,

a z toho mámeP(|ξ −m| > 3σ) = 1− P(|ξ −m| < 3σ) < 1− 0,997 = 0,003.

Pravdepodobnosť, že hodnota náhodnej veličiny s normálnym rozdelením padne mimo interval určený 3σ okolo strednej hodnoty je zanedbateľne malá.

Príklad 4.32 Pomocou tabuľky 4.4 nájdime P(1,3 < ξ < 2,7), kde ξ∼N (1, 3).

Riešenie. Náhodnú veličinu normalizujeme, η= ξ−1√3. Takže

P(1,3 < ξ < 2,7) = P

(1,3− 1√

3<ξ − 1√

3<

2,7− 1√3

)= P(0,173 < η < 0,981) = Φ(0,981)− Φ(0,173).

Hodnoty môžeme interpolovať z tabuľky

Φ(0,981) = Φ(0,98) +Φ(0,99)− Φ(0,98)

0,99− 0,98(0,981− 0,98) = 0,8365 + (0,8389− 0,8365) · 0,1 = 0,8367,

Kapitola 4. (Teória pravdepodobnosti) – 32

Page 111: 14.Numericka matematika a amatematicka statistika

Φ(0,173) = Φ(0,17) +Φ(0,18)− Φ(0,17)

0,18− 0,17(0,173− 0,17) = 0,5675 + (0,5714− 0,5675) · 0,3 = 0,5687

a dostanemeP(1,3 < ξ < 2,7) = Φ(0,981)− Φ(0,173) = 0,8367− 0,5687 = 0,2680.

Teória pravdepodobnosti – Funkcia Γ

Existujú funkcie, ktoré nie sú pre nás elementárne, ale vo vyššej matematike sa často vyskytujú

Eulerova funkcia Γ y=Γ(x) je definovaná pomocou nevlastného integrálu. Jej definičný vzťah je

Γ(x) =

∫ +∞

0

tx−1e−tdt, pre x > 0. (4.26)

Aj keď my sme si funkciu zaviedli iba pre kladné reálne čísla, a to kvôli existencii definičného integrálu, vo všeobecnosti sa Γ funkcia dá definovať prevšetky komplexné čísla okrem nekladných celých čísel.

Príklad 4.33 Vypočítajme hodnotu Γ(1) a Γ(

12

).

Riešenie. Použijeme definíciu

Γ(1) =

∫ +∞

0

t1−1e−tdt =

∫ +∞

0

e−tdt = limc→+∞

[−e−t

]c0

= limc→+∞

1− e−c = 1,

takže Γ(1)=1.

Pre výpočet druhej hodnoty urobíme najprv substitúciu

Γ

(1

2

)=

∫ +∞

0

t12−1e−tdt =

∫ +∞

0

e−t√tdt =

∣∣∣∣∣∣∣∣t = s2, s ≥ 0dt = 2sds

t = 0⇒ s = 0t→ +∞⇒ s→ +∞

∣∣∣∣∣∣∣∣ = 2

∫ +∞

0

e−s2

ds.

Kapitola 4. (Teória pravdepodobnosti) – 33

Page 112: 14.Numericka matematika a amatematicka statistika

Posledný integrál spočítame pomocou polárnych súradníc nasledovne

(∫ +∞

0

e−s2

ds

)2

=

∫ +∞

0

e−s2

ds ·∫ +∞

0

e−p2

dp =

∫∫〈0+∞)×〈0+∞)

e−s2−p2dsdp =

∣∣∣∣∣∣∣∣s = ρ cosϕp = ρ sinϕJ = ρ

0 ≤ ρ, 0 ≤ ϕ ≤ π2

∣∣∣∣∣∣∣∣ =

∫ π2

0

∫ +∞

0

e−ρ2

ρdρdϕ =

∣∣∣∣∣∣∣∣ρ2 = u, s ≥ 02ρdρ = du

ρ = 0⇒ u = 0ρ→ +∞⇒ u→ +∞

∣∣∣∣∣∣∣∣=π

2

∫ +∞

0

1

2e−udu =

π

4limc→+∞

[−e−u

]c0

4.

Spojením posledného výpočtu a predchádzajúceho vzťahu máme

Γ

(1

2

)= 2

∫ +∞

0

e−s2

ds = 2

√π

4=√π.

Dôležité hodnoty funkcie Γ sa dajú vypočítať pomocou nasledujúcich vzťahov:

Γ(x+ 1) = xΓ(x), (špeciálne pre n prirodzené) Γ(n+ 1) = n!, Γ

(n+

1

2

)=

1 · 3 · 5 · · · (2n− 1)

2n√π, (4.27)

Γ(x)Γ(1− x) =π

sin πx(4.28)

Z toho vidíme najmä to, že Γ funkcia je akýmsi rozšírením faktoriálu (n!) aj pre necelé čísla.

Možno je ešte dobré načrtnúť graf funkcie, ktorý je znázornený na obrázku 4.4(vľavo). V okolí nuly aj v okolí nekonečna idú hodnoty funkcie Γ donekonečna, pričom platia aproximačné vzorce

Γ(x) ≈ κ0(x) =1

x− γ +

1

12

(6γ2 + π2

)x, x→ 0,

Γ(x) ≈ κ+∞(x) =(xe

)x√2π

x

(1 +

1

12x

), x→ +∞,

(4.29)

kde sme použili Eulerovu-Mascheroniho konštantu γ= limn→+∞(∑n

k=11n− lnn

)≈0,577215664901533 známu aj z mnohých iných špeciálnych funkcií.

Obrázok 4.4(vpravo) ponúka presnosť týchto aproximačných vzorcov, kde sú na zvislú os vynesené v logaritmickej mierke relatívne rozdiely δy= |κ0(x)−Γ(x)|Γ(x)

a δy= |κ+∞(x)−Γ(x)|Γ(x)

. Vidíme, že už od asi 0,5 je rozdiel medzi Γ(x) a κ+∞(x) malý a v tesnej blízkosti nuly zasa ponúka odhad pomocou κ0 veľmi presnéhodnoty funkcie Γ.

Kapitola 4. (Teória pravdepodobnosti) – 34

Page 113: 14.Numericka matematika a amatematicka statistika

0

1

2

3

4

5

6

0 0,5 1 1,5 2 2,5 3 3,5 4y

x

10−6

10−5

10−4

10−3

10−2

10−1

0 0,5 1 1,5 2 2,5 3

δy

x

κ+∞κ0

Obr. 4.4: Funkcia y=Γ(x) a presnosť aproximácií y=κ0(x) a y=κ+∞(x).

Samohodnotiace otázky a úlohy na samostatné riešenie

1. Odvodíte zo základných vlastností, vzťahov A1 až C1, vzťahy (4.1)?

2. Ukážete platnosť tých vlastností distribučnej funkcie A2, B2, C2, ktoré neboli v pr. 4.8 dokázané?

3. Ako vyzerá distribučná funkcia akejkoľvek dikrétnej náhodnej veličiny?

4. Pokúste sa podľa pr. 4.13 odvodiť vzorec pre hustotu rozdelenia pravdepodobnosti rozdielu, súčinu, podielu, . . . náhodných veličín.

5. Vedeli by ste odvodiť vzťah podobný tomu z pr. 4.13 pre diskrétne náhodné veličiny?

6. Navrhnete spôsob odvodenia vzťahov (4.18) a (4.17)?

7. Viete zdôvodniť platnosť vlastností normálenho rozdelenia A5, B5, C5 aj pre v príkladoch nedokazované možnosti?

8. Dokážete vzťahy (4.27)?

V úlohách 1. až 7. overte, či dané funkcie F prináležia nejakým náhodným veličinám ξ ako ich distribučné funkcie, v kladnom prípade nájdite hustoturozdelenia pravdepodobnosti p a vypočítajte strednú hodnotu a rozptyl náhodnej veličiny ξ.

1. F (x) = 12

+ 1π

arctg x . 2. F (x) = Θ(x) xx+1

.

Kapitola 4. (Teória pravdepodobnosti) – 35

Page 114: 14.Numericka matematika a amatematicka statistika

3. F (x) =

ex, x ≤ 0,

1− e−x, x > 0. 4. F (x) = Θ(x)x lnx . 5.

F (x) =

0, x ≤ 0,

2x2, 0 < x ≤ 0,5,

1− 2(1− x)2, 0,5 < x ≤ 1,

1, x > 1

.

6. F (x) = Θ(x)(

1− e−( xβ )α), α>0, β>0 . 7. F (x) = Θ(x)x(x+2)

(x+1)2.

V úlohách 8. až 12. určte konštantu c tak, aby funkcia p bola hustotou rozdelenia pre nejakú náhodnú veličinu ξ a vypočítajte základné charakterisitytejto náhodnej veličiny.

8. p(x) = Θ(x)c xe−x2 . 9. p(x) = Θ(x)c x

(2+x)6.

10. p(x) = Θ(x)c xe−x2 . 11. p(x) = Θ(x)c x

x+1. 12.

p(x) =

0, x ≤ 0,

c x2, 0 < x ≤ 1,

2c− c (2− x)2, 1 < x ≤ 3,

c (4− x)2, 3 < x ≤ 4,

0, x > 4

.

V úlohách 13. až 18. zvoľte vhodné rozdelenie pravdepodobnosti pre uvažovanú náhodnú veličinu a určte príslušné pravdepodobnosti.

13. V učebni je 10 počítačov, pravdepodobnosť, že sa niektorý počas vyučovacej hodiny pokazí je 0,05. Určte pravdepodobnosť, že (i) na hodine sapokazí práve jeden počítač a (ii) na hodine sa pokazí aspoň jeden počítač .

14. Opravovateľ písomiek R.V. opraví jednu písomku v priemere za päť minút. Aká je pravdepodobnosť, že za hodinu nestihne opraviť písomky desiatimštudentom? Určte tiež, aká je pravdepodobnosť, že za päť minút stihne dve .

15. Za podmienok predchádzajúcej úlohy určte pravdepodobnosť, že niektorú písomku bude R.V. opravovať viac ako desať minút, prípadne, že tostihne do jednej minúty .

16. Predpokladajme, že stredná výška študentov je 172cm, pričom táto populácia má smerodajnú odchýlku 12cm. Koľko percent študentov by zatýchto podmienok podľa pravdepodobnosti malo byť vyšších ako 190cm? Vypočítajte tiež koľkí by mali mať výšku medzi 170cm a 180cm .

Kapitola 4. (Teória pravdepodobnosti) – 36

Page 115: 14.Numericka matematika a amatematicka statistika

17. V experimente uspejeme s konkrétnou vzorkou v 80% prípadov. Stanovte, koľko vzoriek potrebujeme, aby sme s pravdepodobnosťou 0,99 mohlitvrdiť, že aspoň dve vzorky budú v experimente úspešné .

18. Priemerný počet poistných udalostí hlásených poisťovni je dva za deň. Aká je pravdepodobnosť, že za jeden deň nebola hlásená v poisťovni žiadnapoistná udalosť? Naviac vypočítajte pravdepodobnosť, že do mesiaca nemusí poisťovňa riešiť viac ako 30 hlásených udalostí .

Záver

Kapitola nám poslúžila pre zoznámenie sa s tými faktami z teórie pravdepodobnosti, ktoré nám budú užitočné v štatistických výpočtoch. Naučili sme sačo to je náhodná veličina a ako pomocou nej popísať nejakú náhodnými účinkami ovplyvnenú situáciu napr. výsledok experimentu, ktorý je ovplyvnenýfaktorom náhody. Vieme, čo je to distribučná funkcia náhodnej veličiny, prípadne hustota rozdelenia pravdepodobnosti náhodnej veličiny. Pre každúnáhodnú veličinu sme si tiež ukázali jej základné číselné charakteristiky, ktoré určujú očakávané hodnoty a mieru odchýlky od tejto očakávanej hodnoty.Tiež poznáme charakteristiku, ktorá popisuje dôležitosť lineárneho vzťahu medzi dvoma náhodnými veličinami. Spoznali sme tiež základné typy náhodnýchveličín a ich charakteristiky, pričom sme sa sústredíli najmä na vlastnosti normálneho rozdelenia pravdepodobnosti, ktoré sa zdá byť najdôležitejšie. Pritej príležitosti sme sa tak isto zoznámili s funkciou Γ, ktorá častokrát vystupuje v aplikáciách vyššej matematiky.

Literatúra

[1] C. Török. Úvod do teórie pravdepodobnosti a matematickej štatistiky. TU Košice, 1992.

[2] M. Kalina et al. Základy pravdepodobnosti a matematickej štatistiky. STU Bratislava, 2010.

[3] G. K. Bhattacharyya, R. A. Johnson. Statistical Concepts and Methods. Wiley, New York, 1977

Riešenia úloh

Odpovede na samohodnotiace otázky, ak ich neviete sformulovať, a aj mnohé iné odpovede nájdete v odporúčanej literatúre.

1. áno 2. áno 3. nie 4. nie 5. áno 6. áno 7. áno 8. c=14,Eξ=4,Dξ=8 9. c=320,Eξ=4

3,Dξ=20

910. c=2,Eξ=

√π

2,Dξ=1−π

4

11. neexistuje 12. c=14,Eξ=2,Dξ=1

213. ξ∼B(10, 0.05),P(ξ(i)=1),P(ξ(ii)≥1) 14. ξ1∼P(12),P(ξ1<10), ξ2∼P(1),P(ξ2≥2)

15. ξ1,2∼E(15),P(ξ1>10),P(ξ2<1) 16. ξ1,2∼N (172, 144) ,P(ξ1>190),P(170<ξ2<180) 17. ξ∼B(n, 0.8),P(ξ≥2)=0.99

18. ξ1∼P(2),P(ξ1=0), ξ2∼P(60),P(ξ2≤30)

Kapitola 4. (Teória pravdepodobnosti) – 37

Page 116: 14.Numericka matematika a amatematicka statistika

Kapitola 5. (Popisná štatistika)

Poslanie

Zoznámiť študentov so základnými pojmami štatistiky, spôsobmi zápisu výsledkov merania a ich prvotnej analýzy.

Ciele

1. Pochopiť a naučiť sa správne používať základné termíny štatistiky.

2. Naučiť sa efektívne zapísať údaje do prehľadných a účelných tabuliek.

3. Získať prehľadnú informáciu o údajoch pomocou číselných charakteristík a obrázkov s grafmi.

4. Dať do súvislosti získané číselné charakteristiky s teóriou pravdepodobnosti.

5. Rozlíšiť základné náhodné veličiny používané v štatistike a porozumieť ich charakteristike.

Prerekvizičné znalosti

náhodná veličina; distribučná funkcia; rozdelenie pravdepodobnosti

Kapitola 5. (Popisná štatistika) – 1

Page 117: 14.Numericka matematika a amatematicka statistika

Úvod

V kapitole sa venujeme základom z matematickej štatistiky. Matematická štatistika sa zaoberá vlastnosťami hromadných náhodných javov na základeúdajov získaných experimentom. Experimentom tu pravda môže by fyzikálny pokus a výskledky jeho merania, zber údajov o charaktere stavebnýchmateriálov, či anketa o spokojnosti zákazníkov.

V teórii pravdepodobnosti sme si ukázali, ako pracovať s náhodnou veličinou a ako popísať jej vlastnosti. Ostala však otázka, ako zistiť v konkrétnomkontexte typ tejto náhodnej veličiny. Tomuto se venuje matematická štatistika, no pravda nielen tomu, veď aj vlastnosti náhodnej veličiny sú neznámea ak už nič iné, treba ich vedieť aspoň kvalifikovane odhadnúť.

V matematickej štatistike preto budeme analyzovať nazbierané súbory údajov s cieľom odhadnúť typ distribučnej funkcie náhodnej veličiny či odhadnúťniektoré jej parametre. Na to budeme potrebovať urobiť experiment alebo zozbierať údaje, aby sme naše pozorovanie správne zaregistrovali.

V prvom rade si kvôli tomu vyslovíme základné pojmy, ktoré pri tomto zbere budeme používať a ukážeme si, ako zozbierané údaje efektívne a účelnezapísať. Ďalej si uvedieme, ktoré číselné charakteristiky budeme pri štatistických metódach používať pre správne vyhodnotenie následnej analýzy. A tiežsi ukážeme, ako zobraziť získané údaje pomocou štatistických grafov, pretože zrakový vnem pri takejto analýze je veľmi užitočný.

Potom by mala nasledovať matematická analýza údajov s ohľadom na ich náhodnosť a tu prichádza k slovu pravdepodobnosť. V ďalšej časti tejtokapitoly budeme teda sledovať základné súvislosti nameraných údajov s teóriou pravdepodobnosti. V oblasti stavebného inžinierstva častokrát môžemeuvažovať o náhodách s normálnym rozdelením pravdepodobnosti, a tak práve toto rozdelenie pravdepodobnosti a s ním úzko súvisiace rozdelenia budúzákladom aj našej ďalšej práce v oblasti matematickej štatistiky. Preto na záver tejto kapitoly uvedieme základné fakty a vlastnosti potrebných rozdelenípravdepodobnosti pre rigorózne použitie štatistiky v praxi a ich prepojenie na číselnú analýzu údajov.

Popisná štatistika – Štatistický súbor, štatistické premenné a tabuľky

Prv než pristúpime k analýze údajov, zoznámme sa so základnou štatistickou terminológiou.

Základný súbor je množina všetkých štatistických jednotiek, ktoré prichádzajú pri experimente do úvahy.

Náhodný výber zo základného súboru je postupnosť nezávislých náhodných veličín ξ1, ξ2, . . . , ξn s rovnakým rozdelením pravdepodobnosti určenýchdistribučnou funkciou F .

Štatistický súbor chápeme buď ako súbor objektov štatistických jednotiek získaných náhodným spôsobom, ako súbor náhodných veličín získaných znáhodného výberu, alebo ako súbor údajov na vybraných štatistických vzorkách, ako hodnoty tých náhodných veličín.

Kapitola 5. (Popisná štatistika) – 2

Page 118: 14.Numericka matematika a amatematicka statistika

Príklad 5.1 Uveďme príklady aplikácie týchto pojmov v praxi.

Riešenie. Ak skúmame charakteristiku populácie Slovákov, tak každý Slovák je štatistickou jednotkou a všetci Slováci sú základným súborom. Pri testovanítejto populácie z nich náhodným výberom vyberieme niekoľko a dostaneme tak štatistický súbor, ktorý je jednak súborom objektov, to sú jednotlivíSlováci, a jednak súborom údajov, čo sú číselné alebo aj iné hodnoty znakov, ktoré nás zaujímajú, napr. výška, farba očí, povolanie.

Podobne ak skúmame penetračný náter v nádobe, tak on sám je základným súborom a štatistickou jednotkou by bola akákoľvek z neho odobraná vzorka.Pri testovaní tohto náteru z neho náhodným výberom odoberieme niekoľko vzoriek a dostaneme tak štatistický súbor, ktorý je jednak súborom objektov,to sú tie jednotlivé odobrané vzorky, a jednak súborom údajov, čo sú zas napr. číselné hodnoty znakov, ktoré nás zaujímajú, ako hustota, viskozita,permeabilita.

Východiskom pre štatistickú analýzu sú údaje reprezentujúce jednotlivé znaky, jednotlivé premenné. Údaje najčastejšie zapisujeme do tabuliek. V šta-tistických metódach budeme používať dva základné typy tabuliek, a to tabuľku prvotnú a tabuľku frekvenčnú. V prvotnej tabuľke sú uvedené všetkyhodnoty z n členného štatistického súboru zistených pre m rôznych znakov, teda jednotlivých premenných. Ak hodnoty príslušných náhodných veličínξji , kde i=1, . . . , n a j=1, . . . ,m, teda pozorované hodnoty, označíme xji , výsledkom je napr. tabuľka tab. 5.1. Tabuľku samozrejme môžeme zapísať aj

Tabuľka 5.1: Prvotná tabuľkaξ1 ξ2 . . . ξm

1 x11 x21 . . . xm12 x12 x22 . . . xm2...

...... . . . ...

n x1n x2n . . . xmn

v transponovanom tvare, ak je to prehľadnejšie.

Frekvenčnú tabuľku používame, ak máme údaje rozdelené do klasifikačných tried Ci, ako dokumentuje vzor frekvenčnej tabuľky tab. 5.2. Klasifikačnýmitriedami môžu byť hodnoty zisťovaných znakov, ak zodpovedajú diskrétnej náhodnej veličine s malým počtom možných výsledkov. Ak diskrétna náhodnáveličina nadobúda mnoho, prípadne nekonečne mnoho, možných výsledkov, alebo skúmaný znak (premenná) zodpovedá spojitej náhodnej veličine,klasifikačnými triedami sú množiny hodnôt týchto znakov, napr. vhodné disjunktné intervaly, pričom ako hodnotu triedy volíme jednu hodnotu z množiny,napr. jej strednú hodnotu. Tabuľka potom uvádza počet hodnôt ni zaradených do triedy Ci. Niekedy namiesto absolútnej početnosti ni uvádzamerelatívnu početnosť νi=ni

n, kde n=

∑mk=1 ni. Frekvenčnú tabuľku zostrojujeme, ak chceme mať prehľad o roztriedení nameraných hodnôt, teda ktorých

je viac, ktorých menej, tým vidíme, že získavame predstavu o rozdelení pravdepodobnosti náhodných veličín zo základného súboru. Preto túto tabuľkuvyužívame v štatistických metódach, v ktorých usudzujeme niečo o tomto rozdelení pravdepodobnosti.

Kapitola 5. (Popisná štatistika) – 3

Page 119: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.2: Frekvenčná tabuľkaTriedy C1 C2 . . . Cm

Početnosti n1 n2 . . . nm

Príklad 5.2 V hypermarkete urobili prieskum týkajúci sa doby obsluhy zákazníkov. Zaznamenané doby čakania zákazníkov v sekundách sú (po usporia-daní) uvedené v tabuľke tab. 5.3. Roztrieďme údaje do frekvenčnej tabuľky.

Tabuľka 5.3: Doba čakania zákazníkov2 7 10 21 26 28 32 33 38 40 41 41 4444 47 48 50 50 55 67 69 69 74 78 84 8592 92 96 103 103 104 111 118 131 133 136 138 143149 165 176 181 196 197 206 213 259 275 287 383 440

Riešenie. Tabuľka zodpovedá prvotnej tabuľke, kde sme mali iba jeden znak, a to čas. Zapísať však toľké údaje do jedného riadku alebo stĺpca tabuľkyby bolo neprehľadné a neefektívne. Počet tried vo frekvenčnej tabuľke volíme podľa uváženia tak, aby v nej bolo vidieť roztriedenie nameraných hodnôt.V našom prípade hodnoty rozdelíme do intervalov dĺžky 50s, pričom hodnota triedy je stredná hodnota intervalu, ni sú početnosti meraní v jednotlivýchtriadach a νi ich relatívne početnosti, viď tab. 5.4

Popisná štatistika – Popisná štatistika

Hodnôt z experimentu máme obyčajne veľa a je potrebné získať z nich stručnú a prehľadnú informáciu v číselnom či grafickom formáte o nich ako oštatistickom súbore.

Výberová charakteristika (alebo štatistika) T je funkcia náhodného výberu rozsahu n, pričom ju chápeme buď ako funkciu náhodných veličín ξ1,ξ2, . . . , ξn náhodného výberu, alebo ako funkciu hodnôt x1, x2, . . . , xn týchto náhodných veličín realizovaných štatistickým súborom. Teda aj samotnúvýberovú charakteristiku interpretujeme buď ako náhodnú veličinu ξ=T (ξ1, ξ2, . . . , ξn), čo je dôležité z hľadiska teórie pre naplnenie pravdepodobnostnéhocharakteru štatistickej analýzy, alebo ako číslo x=T (x1, x2, . . . , xn), čo je zasa potrebné z hľadiska praktického využitia a vysvetlenia experimentálnychhodnôt.

Najčastejšie nami využívanými štatistikami budú výberový aritmetický priemer a výberový rozptyl, prípadne výberová smerodajná odchýlka. Vzorce preich číselný výpočet pomocou hodnôt súboru x1, x2, . . . , xn sú uvedené v tab. 5.5, pričom smerodajná odchýlka Sn−1 je odmocnina z rozptylu. Je vhodné

Kapitola 5. (Popisná štatistika) – 4

Page 120: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.4: Frekvenčná tabuľka pre dobu čakania zákazníkovInterval (0, 50〉 (50, 100〉 (100, 150〉 (150, 200〉 (200, 250〉 (250, 300〉 (300, 350〉 (350, 400〉 (400, 450〉

Trieda C 25 75 125 175 225 275 325 375 425ni 18 11 11 5 2 3 0 1 1νi 0,3462 0,2115 0,2115 0,0962 0,0385 0,0577 0,0 0,0192 0,0192

poznamenať, že v praxi sa používa aj rozptyl základného súboru S2n pre základný súbor s rozsahom n, určený vzťahom S2

n =1

n

n∑i=1

(xi − X)2. Pre veľké

n je rozdiel medzi oboma vzorcami malý, avšak pre štatistické súbory s malým rozsahom je dobré si rozdiel v multiplikatívnom faktore uvedomiť, akouvidíme neskôr. Ak máme k dispozícii frekvenčnú tabuľku tab. 5.2, tieto výberové charakteristiky počítame pomocou vážených charakteristík, kde váhysú určené početnosťami ni a hodnoty xi sú určené hodnotou triedy Ci, teda

X =1

n

m∑i=1

nixi, S2n =

1

n

m∑i=1

ni(xi − X)2, kde n=m∑i=1

ni. (5.1)

Pri štatistickej analýze rozdelenia a rozptýlenosti hodnôt výberu používame tiež výberový medián, výberový dolný kvartil a výberový horný kvartil, ktoréurčujeme na základe usporiadaného výberu, t. j. v štatistickom súbore sú hodnoty x1, x2, . . . , xn usporiadané podľa veľkosti x1≤x2≤ · · · ≤xn. Tietohodnoty sú určené tak, že od výberového dolného kvartilu je vľavo od neho štvrtina všetkých pozorovaní, od výberového mediánu je vľavo od nehopolovica všetkých pozorovaní a od výberového horného kvartilu sú vľavo od neho tri štvrtiny všetkých pozorovaní. Hodnoty týchto charakteristík sú tiežuvedené v tab. 5.5

Príklad 5.3 Ukážme rovnosť pre dva vzťahy pre Sn−1 v tab. 5.5.

Riešenie. Upravíme jeden vzorecn∑i=1

(xi − X)2 =n∑i=1

(x2i − 2xiX + X2) =n∑i=1

x2i − 2Xn∑i=1

xi + nX2 =n∑i=1

x2i − nX2,

keďžen∑i=1

xi=nX. Prenásobením faktorom 1n−1 dostaneme požadovaný vzťah.

Príklad 5.4 V pr. 5.2 boli v tabuľke tab. 5.3 uvedené doby obsluhy zákazníkov (v sekundách) v hypermarkete. Určte základné číslené charakteristikytohto súboru.

Kapitola 5. (Popisná štatistika) – 5

Page 121: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.5: Základné výberové charakteristikyŠtatistika Označenie Vzorec

Výberový priemer X X =1

n

n∑i=1

xi

Výberový rozptyl S2 S2n−1 =

1

n− 1

n∑i=1

(xi − X)2 =1

n− 1

(n∑i=1

x2i − nX2

)n=4k n=4k+1 n=4k+2 n=4k+3

Výberový dolný kvartil Q13xk+xk+1

4

xk+xk+1

2

xk+3xk+1

4xk+1

n=2k n=2k+1

Výberový medián M(=Q2)xk+xk+1

2| xk+1

n=4k n=4k+1 n=4k+2 n=4k+3

Výberový horný kvartil Q33x3k+x3k+1

4

x3k+1+x3k+2

2

3x3k+2+x3k+3

4x3k+3

Riešenie. Začneme priemerom:

n = 52, X =1

52

52∑i=1

xi =1

52(2 + 7 + 10 + · · ·+ 440)

.= 111,73.

Rozptýlenosť budeme charakterizovať smerodajnou odchýlkou namiesto rozptylu

Sn−1 =

√√√√ 1

51

(52∑i=1

x2i − 52 x2

).=

√1

51(1087654− 52 · 111,732)

.= 92,73.

Keby sme tento štatistický súbor brali ako základný súbor, použili by sme vzorec pre Sn a dostali by sme

Sn =

√√√√ 1

52

(52∑i=1

x2i − 52 x2

).=

√1

52(1087654− 52 · 111,732)

.= 90,94.

Rozdiel oproti Sn−1 nie je veľký. Pôvodné údaje už sú usporiadané, takže môžeme ľahko odčítať kvartily aj medián. V každom riadku tabuľky je štvrtinaúdajov, a keďže n=52=2·26=4·13, podľa tab. 5.5 máme

Q1 =3x13+x14

4=

3·44+44

4=44, M =

x26+x272

=85+92

2=88,5, Q3 =

3x39+x404

=3·143+149

4=144,5.

Kapitola 5. (Popisná štatistika) – 6

Page 122: 14.Numericka matematika a amatematicka statistika

Spočítajme pre porovnanie aj výberové charakteristiky z frekvenčnej tabuľky tab. 5.4. Označme výberový priemer X a smerodajnú odchýlku S. Pre m=9tried dostaneme

X =9∑j=1

νiCi = (0,3462 · 25 + · · ·+ 0,0192 · 425).= 107,69,

S =9∑j=1

νiC2i − X2 =

(0,3462 · 252 + · · ·+ 0,0192 · 4252

)− 107,692 .

= 92,45

čo sú samozrejme porovnateľné hodnoty s x a Sn−1.

Okrem číselných hodnôt je vhodné používať aj grafické zobrazenie údajov. Najčastejšie sa na tento účel používa histogram, viď obr. 5.1, vľavo. Je to

ν ialeb

oni

Ci

F

x

Obr. 5.1: Histogram a empirická distribučná funkcia.

obdĺžnikový graf, ktorý zodpovedá frekvenčnej tabuľke: každá trieda má úsek na vodorovnej osi (napr. rozsah hodnôt rozdelený na m intervalov rovnakejdĺžky), výška obdĺžnika zodpovedá početnosti v príslušnej triede, prípadne relatívnej početnosti. Histogram pomôže pri analýze rozptýlenosti údajovsledovanej veličiny, pri identifikácii odľahlých hodnôt, či pri určení typu rozdelenia vo výbere, keďže pripomína hustotu rozdelenia pravdepodobnostináhodnej veličiny.

Okrem hustoty, poznáme z teórie pravdepodobnosti aj distribučnú funkciu. Tú môžeme v údajoch odhadnúť pomocou grafu empirickej distribučnejfunkcie F znázornenej na obr. 5.1, vpravo. Túto funkciu definujeme vzťahom

F (x) =nxi<xn

, (5.2)

kde nxi≤x je počet tých hodnôt xi, ktoré sú menšie ako x. Pre efektívne zostrojenie empirickej distribučnej funkcie je preto opäť výhodné merané hodnotyusporiadať.

Kapitola 5. (Popisná štatistika) – 7

Page 123: 14.Numericka matematika a amatematicka statistika

Príklad 5.5 V pr. 5.2 boli v tabuľke tab. 5.3 uvedené doby obsluhy zákazníkov (v sekundách) v hypermarkete. Zostrojte histogram a empirickúdistribučnú funckiu.

Riešenie. Frekvenčnú tabuľku sme zostavili v uvedenom príklade, na jej základe nakreslíme histogram. Histogram je na obr. 5.2, vľavo, vykreslený prerelatívne početnosti νi spolu s grafom funkcie, ktorá vyjadruje pravdepodobnosť, že hodnota náhodnej veličiny ξ s exponenciálnym rozdelením s hustotoup(x)=δe−δx a s parametrom δ=0,01 je v intervale 〈x−25, x+25〉 aby sme videli súvislosť s touto hustotou. Na základe takéhoto obrázku je celkomprirodzené predpokladať, že ak ξ vyjadruje dobu čakania zákazníka, tak má exponenciálne rozdelenie.

Vyskúšame niečo podobné aj s empirickou distribučnou funkciou. Keby sme na základe tab. 5.3 chceli napísať rovnicu pre F , vyzeralo by to nasledovne

F (x) =

0 , ak x ≤ 2,152

, ak 2 < x ≤ 7,...

5052

, ak 287 < x ≤ 383,5152

, ak 383 < x ≤ 440,

1 , ak 440 < x.

Nie je to veľmi prehľadné, a tak je lepší naozaj ten graf, ktorý je uvedený na obr. 5.2, vpravo. Aj v tomto grafe sme kvôli ilustratívnosti vložili aj graf

0

0,1

0,2

0,3

0,4

0 50 100 150 200 250 300 350 400 450

ν,P

t [s]

νi

x+25∫x−25

p(t)dt

0

0,2

0,4

0,6

0,8

1

0 50 100 150 200 250 300 350 400 450

Ft [s]

F (x)F (x)

Obr. 5.2: Histogram a empirická distribučná funkcia.

distribučnej funkcie exponeciálneho rozdelenia F (x)=(1−e−δx

), pri porovnaní s ktorým vidno exponenciálny charakter náhodnej veličiny, pre ktorú máme

k dispozícii štatistický súbor.

Kapitola 5. (Popisná štatistika) – 8

Page 124: 14.Numericka matematika a amatematicka statistika

Popisná štatistika – Základné rozdelenia pravdepodobnosti v matematickej štatistike

Náhodnosť zozbieraných údajov aj príslušných číselných charakteristík je potrebné preskúmať a vyhodnotiť na základe teórie pravdepodobnosti.

V praktických úlohách častokrát predpokladáme, že štatistický súbor pochádza s výberu s normálnym rozdelením. Normálne rozdelenie pravdepodobnostitak bude skutočným základom štatistických výpočtov, ktorým sa budeme venovať. Spolu s ním však musíme zobrať do úvahy aj ďalšie rozdeleniapravdepodobnosti, veď ak napr. vypočítame výberový priemer alebo výberový rozptyl ako charakteristiky súboru údajov, dostanenme tiež náhodnéveličiny a pre ne tiež potrebujeme vedieť alebo aspoň odhadnúť, aké rozdelenie pravdepodobnosti im prislúcha. Z tohto hľadiska sa stretneme s tromanasledujúcimi rozdeleniami.

Nech η1, η2, . . . ηn, ηn+1 . . . ηn+k, sú nezávislé náhodné veličiny so štandardným normálnym rozdelením ηi ∼ N (0, 1).

Hovoríme, že náhodná veličina ξ má rozdelenie χ2 (čítame „chí kvadrát“) s n stupňami voľnosti, ak platí

ξ = η21 + η22 + · · ·+ η2n,

a zapisujeme ako ξ ∼ χ2(n), častokrát aj samotný symbol χ2(n) budeme používať na označenie náhodnej veličiny s týmto rozdelením. Na základe tejtodefinície vieme odvodiť hustotu rozdelenia pravdepodobnosti pχ2(n), strednú hodnotu Eχ2(n) aj rozptyl Dχ2(n):

pχ2(n)(x) = Θ(x)x

n2−1e−

x2

2n2 Γ(n2

) , Eχ2(n) = n, Dχ2(n) = 2n. (5.3)

Kvantil xδ tejto náhodnej veličiny na hladine δ budeme označovať χ2δ(n).

Pre predstavu o rozdelení hodnôt náhodnej veličiny v závislosti od stupňov voľnosti je na obr. 5.3 graf hustoty pre tri rôzne n. V štatistických výpočtochbudeme potrebovať kvantily náhodných veličín blízke nule alebo jednotke. Tieto hodnoty sú zosumarizované v tab. 5.6.

Ďalej hovoríme, že náhodná veličina ξ má Studentovo t rozdelenie s n stupňami voľnosti, ak platí

ξ =ηn+1√χ2(n)n

,

kde χ2(n) je definované vyššie. Zapisujeme ξ ∼ t(n), a aj tu budeme samotný symbol t(n) používať na označenie náhodnej veličiny s týmto rozdelením.Definícia nám môže pomôcť pri odvodení hustoty rozdelenia pravdepodobnosti pt(n), strednej hodnoty E (t(n)) aj rozptylu D (t(n)) určených vzťahmi

pt(n)(x) =Γ(n+12

)√nπΓ

(n2

) (1 + x2

n

)n+12

, E (t(n)) = 0, D (t(n)) =n

n− 2, (5.4)

Kapitola 5. (Popisná štatistika) – 9

Page 125: 14.Numericka matematika a amatematicka statistika

0

0,05

0,1

0,15

0,2

0 5 10 15 20 25 30

p

x

n=5

n=10

n=20

0

0,1

0,2

0,3

0,4

-4 -2 0 2 4

p

x

n=2

n=5

n=20

N (0, 1)

Obr. 5.3: Hustoty rozdelenia pravdepodobnosti pre χ2(n) a t(n).

za predpokladu že majú zmysel, napr. D iba pre n>2.

Kvantil xδ tejto náhodnej veličiny na hladine δ budeme označovať t2δ(n). Toto rozdelenie pravdepodobnosti je symetrické, teda stačí vedieť počítať alebotabelovať, viď tab. 5.6, hodnoty kvantilov blízke k jednotke, lebo tδ(n)=−t1−δ(n).

Pre predstavu o rozdelení hodnôt náhodnej veličiny v závislosti od stupňov voľnosti je na obr. 5.3 graf hustoty pre tri rôzne n a tiež graf hustotyštandardného normálneho rozdelenia, ktoré je limitou t rozdelenia pre veľké n.

Do tretice definujeme F rozdelenie. Hovoríme, že náhodná veličina ξ má Fisherovo F rozdelenie so stupňami voľnosti n, k, ak platí

ξ =χ2(n)n

χ2(k)k

,

kde χ2(n) je definované vyššie a χ2(k) = η2n+1 + η2n+2 + · · · + η2n+k. Zapisujeme ξ ∼ F(n, k), a bežne budeme na označenie náhodnej veličiny s týmtorozdelením používať samotný symbol F(n, k). Hustota rozdelenia pravdepodobnosti pF(n,k), stredná hodnota E (F(n, k)) a rozptyl D (F(n, k)) sa dajúnájsť pomocou vzťahov

pF(n,k)(x) = Θ(x)Γ(n+k2

)n

n2 k

k2x

n2−1

Γ(n2

)Γ(k2

)(k + nx)

n+k2

, E (F(n, k)) =k

k − 2, D (F(n, k)) =

2k2(k + n− 2)

n(k − 2)2(k − 4), (5.5)

Kapitola 5. (Popisná štatistika) – 10

Page 126: 14.Numericka matematika a amatematicka statistika

za predpokladu že majú zmysel, napr. D iba pre k>4.

Pre predstavu o rozdelení hodnôt náhodnej veličiny v závislosti od stupňov voľnosti je na obr. 5.4 graf hustoty pre tri rôzne n a rôzne k. Podobne akoχ2(n) je aj F rozdelenie nesymetrické, tu však naviac vystupujú dva parametre, takže jednoduchú tabuľku kvantilov musíme zostrojiť pre každé δ zvlášť.V tabuľkách 5.7 až 5.10 sú kvantily, ktoré budeme neskôr používať.

0

0,2

0,4

0,6

0,8

0 1 2 3 4 5

p

x

n=5, k=5n=5, k=10n=5, k=20

0

0,2

0,4

0,6

0,8

0 1 2 3 4 5

p

x

n = 5, k = 5n = 10, k = 5n = 20, k = 5

Obr. 5.4: Hustoty rozdelenia pravdepodobnosti pre F(n, k) pri konštantnom n, vľavo, a pri konštantnom k, vpravo.

Poznamenajme ešte, že hľadať vyjadrenie distribučných funkcií všetkých troch štatistických rozdelení pravdepodobnosti je komplikované a obyčajne savyjadruje integrálom hustoty alebo pomocou špeciálnych funkcií, ktoré nemá zmysel na tomto mieste definovať.

Príklad 5.6 Nájdime pomocou tabuliek hodnoty nasledujúcich kvantilov: χ20,975(14), t0,05(19), F0,99(13, 14).

Riešenie. Prvý kvantil rýchlo nájdeme v tab. 5.6, vľavo: χ20,975(14)=26,1189.

Druhý v tabuľke síce nemáme, ale využijeme symetriu t rozdelenia, a dostaneme: t0,05(19)=− t1−0,05(19)=− t0,95(19)=1,7291, kde posledné číslo smenašli v tab. 5.6, vpravo.

Tretí kvantil budeme hľadať v tab. 5.9. Uvedené stupne voľnosti sa v tabuľke nenachádzajú, preto budeme trocha interpolovať. V tabuľke nájdeme

F0,99(12, 14)=3,800, F0,99(15, 14)=3,656.

Kapitola 5. (Popisná štatistika) – 11

Page 127: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.6: Tabuľky kvantilov pre χ2(n) a t(n).χ2δ(n) δ

n 0,005 0,01 0,025 0,05 0,95 0,975 0,99 0,9951 0,00004 0,0002 0,0010 0,0039 3,8415 5,0239 6,6349 7,87942 0,0100 0,0201 0,0506 0,1026 5,9915 7,3778 9,2103 10,59673 0,0717 0,1148 0,2158 0,3518 7,8147 9,3484 11,3449 12,83824 0,2070 0,2971 0,4844 0,7107 9,4877 11,1433 13,2767 14,86025 0,4117 0,5543 0,8312 1,1455 11,0705 12,8325 15,0863 16,74966 0,6757 0,8721 1,2373 1,6354 12,5916 14,4494 16,8119 18,54767 0,9893 1,2390 1,6899 2,1674 14,0671 16,0128 18,4753 20,27788 1,3444 1,6465 2,1797 2,7326 15,5073 17,5345 20,0902 21,95499 1,7349 2,0879 2,7004 3,3251 16,9190 19,0228 21,6660 23,589310 2,1559 2,5582 3,2470 3,9403 18,3070 20,4832 23,2092 25,188211 2,6032 3,0535 3,8157 4,5748 19,6751 21,9201 24,7250 26,756912 3,0738 3,5706 4,4038 5,2260 21,0261 23,3367 26,2170 28,299513 3,5650 4,1069 5,0088 5,8919 22,3620 24,7356 27,6883 29,819514 4,0747 4,6604 5,6287 6,5706 23,6848 26,1189 29,1412 31,319315 4,6009 5,2294 6,2621 7,2609 24,9958 27,4884 30,5779 32,801316 5,1422 5,8122 6,9077 7,9616 26,2962 28,8454 31,9999 34,267217 5,6972 6,4078 7,5642 8,6718 27,5871 30,1910 33,4086 35,718418 6,2648 7,0149 8,2307 9,3905 28,8693 31,5264 34,8053 37,156519 6,8440 7,6327 8,9065 10,1170 30,1435 32,8523 36,1909 38,582220 7,4338 8,2604 9,5908 10,8508 31,4104 34,1696 37,5662 39,996921 8,0337 8,8972 10,2829 11,5913 32,6706 35,4789 38,9322 41,401122 8,6427 9,5425 10,9823 12,3380 33,9244 36,7807 40,2894 42,795723 9,2604 10,1957 11,6886 13,0905 35,1725 38,0756 41,6384 44,181324 9,8862 10,8564 12,4012 13,8484 36,4150 39,3641 42,9798 45,558525 10,5196 11,5240 13,1197 14,6114 37,6525 40,6465 44,3141 46,927826 11,1602 12,1982 13,8439 15,3792 38,8851 41,9232 45,6417 48,289927 11,8076 12,8785 14,5734 16,1514 40,1133 43,1945 46,9629 49,644928 12,4613 13,5647 15,3079 16,9279 41,3371 44,4608 48,2782 50,993329 13,1211 14,2565 16,0471 17,7084 42,5570 45,7223 49,5879 52,335530 13,7867 14,9535 16,7908 18,4927 43,7730 46,9792 50,8922 53,672040 20,7066 22,1642 24,4330 26,5093 55,7585 59,3417 63,6908 66,766050 27,9907 29,7067 32,3574 34,7643 67,5048 71,4202 76,1539 79,489960 35,5345 37,4848 40,4818 43,1880 79,0819 83,2977 88,3794 91,951870 43,2752 45,4417 48,7576 51,7393 90,5312 95,0232 100,4251 104,214980 51,1719 53,5401 57,1532 60,3915 101,8795 106,6286 112,3288 116,321090 59,1963 61,7541 65,6466 69,1260 113,1453 118,1359 124,1163 128,2990100 67,3275 70,0649 74,2219 77,9295 124,3421 129,5612 135,8068 140,1695

tδ(n) δ

n 0,950 0,975 0,990 0,9951 6,3138 12,7062 31,8207 63,65662 2,9200 4,3026 6,9646 9,92493 2,3534 3,1824 4,5407 5,84094 2,1318 2,7764 3,7469 4,60415 2,0150 2,5706 3,3649 4,03216 1,9432 2,4469 3,1427 3,70747 1,8946 2,3646 2,9979 3,49958 1,8595 2,3060 2,8965 3,35549 1,8331 2,2622 2,8214 3,249810 1,8125 2,2281 2,7638 3,169311 1,7959 2,2010 2,7181 3,105812 1,7823 2,1788 2,6810 3,054513 1,7709 2,1604 2,6503 3,012314 1,7613 2,1448 2,6245 2,976815 1,7531 2,1315 2,6025 2,946716 1,7459 2,1199 2,5835 2,920817 1,7396 2,1098 2,5669 2,898218 1,7341 2,1009 2,5524 2,878419 1,7291 2,0930 2,5395 2,860920 1,7247 2,0860 2,5280 2,845321 1,7207 2,0796 2,5177 2,831422 1,7171 2,0739 2,5083 2,818823 1,7139 2,0687 2,4999 2,807324 1,7109 2,0639 2,4922 2,796925 1,7081 2,0595 2,4851 2,787426 1,7056 2,0555 2,4786 2,778727 1,7033 2,0518 2,4727 2,770728 1,7011 2,0484 2,4671 2,763329 1,6991 2,0452 2,4620 2,756430 1,6973 2,0423 2,4573 2,750040 1,6839 2,0211 2,4233 2,704550 1,6759 2,0086 2,4033 2,677860 1,6706 2,0003 2,3901 2,660370 1,6669 1,9944 2,3808 2,647980 1,6641 1,9901 2,3739 2,638790 1,6620 1,9867 2,3685 2,6316100 1,6602 1,9840 2,3642 2,6259

Kapitola 5. (Popisná štatistika) – 12

Page 128: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.7: Tabuľka kvantilov pre F(n, k), δ=0,95.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,46 19,463 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 8,745 8,703 8,660 8,634 8,6174 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,912 5,858 5,803 5,769 5,7465 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,678 4,619 4,558 4,521 4,4966 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,000 3,938 3,874 3,835 3,8087 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,575 3,511 3,445 3,404 3,3768 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 3,284 3,218 3,150 3,108 3,0799 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,073 3,006 2,936 2,893 2,86410 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,913 2,845 2,774 2,730 2,70011 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 2,788 2,719 2,646 2,601 2,57012 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,687 2,617 2,544 2,498 2,46613 3,806 3,411 3,179 3,025 2,915 2,832 2,767 2,714 2,671 2,604 2,533 2,459 2,412 2,38014 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646 2,602 2,534 2,463 2,388 2,341 2,30815 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,475 2,403 2,328 2,280 2,24716 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,425 2,352 2,276 2,227 2,19417 3,592 3,197 2,965 2,810 2,699 2,614 2,548 2,494 2,450 2,381 2,308 2,230 2,181 2,14818 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456 2,412 2,342 2,269 2,191 2,141 2,10719 3,522 3,127 2,895 2,740 2,628 2,544 2,477 2,423 2,378 2,308 2,234 2,155 2,106 2,07120 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,278 2,203 2,124 2,074 2,03921 3,467 3,072 2,840 2,685 2,573 2,488 2,420 2,366 2,321 2,250 2,176 2,096 2,045 2,01022 3,443 3,049 2,817 2,661 2,549 2,464 2,397 2,342 2,297 2,226 2,151 2,071 2,020 1,98423 3,422 3,028 2,796 2,640 2,528 2,442 2,375 2,320 2,275 2,204 2,128 2,048 1,996 1,96124 3,403 3,009 2,776 2,621 2,508 2,423 2,355 2,300 2,255 2,183 2,108 2,027 1,975 1,93925 3,385 2,991 2,759 2,603 2,490 2,405 2,337 2,282 2,236 2,165 2,089 2,007 1,955 1,91926 3,369 2,975 2,743 2,587 2,474 2,388 2,321 2,265 2,220 2,148 2,072 1,990 1,938 1,90127 3,354 2,960 2,728 2,572 2,459 2,373 2,305 2,250 2,204 2,132 2,056 1,974 1,921 1,88428 3,340 2,947 2,714 2,558 2,445 2,359 2,291 2,236 2,190 2,118 2,041 1,959 1,906 1,86929 3,328 2,934 2,701 2,545 2,432 2,346 2,278 2,223 2,177 2,104 2,027 1,945 1,891 1,85430 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211 2,165 2,092 2,015 1,932 1,878 1,841

Kapitola 5. (Popisná štatistika) – 13

Page 129: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.8: Tabuľka kvantilov pre F(n, k), δ=0,975.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,463 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,084 10,64 9,979 9,605 9,364 9,197 9,074 8,980 8,905 8,844 8,751 8,657 8,560 8,501 8,4615 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,525 6,428 6,329 6,268 6,2276 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,366 5,269 5,168 5,107 5,0657 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,666 4,568 4,467 4,405 4,3628 6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,200 4,101 3,999 3,937 3,8949 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,868 3,769 3,667 3,604 3,56010 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,621 3,522 3,419 3,355 3,31111 5,256 4,630 4,275 4,044 3,881 3,759 3,664 3,588 3,526 3,430 3,330 3,226 3,162 3,11812 5,096 4,474 4,121 3,891 3,728 3,607 3,512 3,436 3,374 3,277 3,177 3,073 3,008 2,96313 4,965 4,347 3,996 3,767 3,604 3,483 3,388 3,312 3,250 3,153 3,053 2,948 2,882 2,83714 4,857 4,242 3,892 3,663 3,501 3,380 3,285 3,209 3,147 3,050 2,949 2,844 2,778 2,73215 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 2,963 2,862 2,756 2,689 2,64416 4,687 4,077 3,729 3,502 3,341 3,219 3,125 3,049 2,986 2,889 2,788 2,681 2,614 2,56817 4,619 4,011 3,665 3,438 3,277 3,156 3,061 2,985 2,922 2,825 2,723 2,616 2,548 2,50218 4,560 3,954 3,608 3,382 3,221 3,100 3,005 2,929 2,866 2,769 2,667 2,559 2,491 2,44519 4,508 3,903 3,559 3,333 3,172 3,051 2,956 2,880 2,817 2,720 2,617 2,509 2,441 2,39420 4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,676 2,573 2,464 2,396 2,34921 4,420 3,819 3,475 3,250 3,090 2,969 2,874 2,798 2,735 2,637 2,534 2,425 2,356 2,30822 4,383 3,783 3,440 3,215 3,055 2,934 2,839 2,763 2,700 2,602 2,498 2,389 2,320 2,27223 4,349 3,750 3,408 3,183 3,023 2,902 2,808 2,731 2,668 2,570 2,466 2,357 2,287 2,23924 4,319 3,721 3,379 3,155 2,995 2,874 2,779 2,703 2,640 2,541 2,437 2,327 2,257 2,20925 4,291 3,694 3,353 3,129 2,969 2,848 2,753 2,677 2,613 2,515 2,411 2,300 2,230 2,18226 4,265 3,670 3,329 3,105 2,945 2,824 2,729 2,653 2,590 2,491 2,387 2,276 2,205 2,15727 4,242 3,647 3,307 3,083 2,923 2,802 2,707 2,631 2,568 2,469 2,364 2,253 2,183 2,13328 4,221 3,626 3,286 3,063 2,903 2,782 2,687 2,611 2,547 2,448 2,344 2,232 2,161 2,11229 4,201 3,607 3,267 3,044 2,884 2,763 2,669 2,592 2,529 2,430 2,325 2,213 2,142 2,09230 4,182 3,589 3,250 3,026 2,867 2,746 2,651 2,575 2,511 2,412 2,307 2,195 2,124 2,074

Kapitola 5. (Popisná štatistika) – 14

Page 130: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.9: Tabuľka kvantilov pre F(n, k), δ=0,99.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,473 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,58 26,504 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,91 13,845 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,888 9,722 9,553 9,449 9,3796 10,93 9,780 9,148 8,746 8,466 8,260 8,102 7,976 7,874 7,718 7,559 7,396 7,296 7,2297 9,547 8,451 7,847 7,460 7,191 6,993 6,840 6,719 6,620 6,469 6,314 6,155 6,058 5,9928 8,649 7,591 7,006 6,632 6,371 6,178 6,029 5,911 5,814 5,667 5,515 5,359 5,263 5,1989 8,022 6,992 6,422 6,057 5,802 5,613 5,467 5,351 5,257 5,111 4,962 4,808 4,713 4,64910 7,559 6,552 5,994 5,636 5,386 5,200 5,057 4,942 4,849 4,706 4,558 4,405 4,311 4,24711 7,206 6,217 5,668 5,316 5,069 4,886 4,744 4,632 4,539 4,397 4,251 4,099 4,005 3,94112 6,927 5,953 5,412 5,064 4,821 4,640 4,499 4,388 4,296 4,155 4,010 3,858 3,765 3,70113 6,701 5,739 5,205 4,862 4,620 4,441 4,302 4,191 4,100 3,960 3,815 3,665 3,571 3,50714 6,515 5,564 5,035 4,695 4,456 4,278 4,140 4,030 3,939 3,800 3,656 3,505 3,412 3,34815 6,359 5,417 4,893 4,556 4,318 4,142 4,004 3,895 3,805 3,666 3,522 3,372 3,278 3,21416 6,226 5,292 4,773 4,437 4,202 4,026 3,890 3,780 3,691 3,553 3,409 3,259 3,165 3,10117 6,112 5,185 4,669 4,336 4,102 3,927 3,791 3,682 3,593 3,455 3,312 3,162 3,068 3,00318 6,013 5,092 4,579 4,248 4,015 3,841 3,705 3,597 3,508 3,371 3,227 3,077 2,983 2,91919 5,926 5,010 4,500 4,171 3,939 3,765 3,631 3,523 3,434 3,297 3,153 3,003 2,909 2,84420 5,849 4,938 4,431 4,103 3,871 3,699 3,564 3,457 3,368 3,231 3,088 2,938 2,843 2,77821 5,780 4,874 4,369 4,042 3,812 3,640 3,506 3,398 3,310 3,173 3,030 2,880 2,785 2,72022 5,719 4,817 4,313 3,988 3,758 3,587 3,453 3,346 3,258 3,121 2,978 2,827 2,733 2,66723 5,664 4,765 4,264 3,939 3,710 3,539 3,406 3,299 3,211 3,074 2,931 2,781 2,686 2,62024 5,614 4,718 4,218 3,895 3,667 3,496 3,363 3,256 3,168 3,032 2,889 2,738 2,643 2,57725 5,568 4,675 4,177 3,855 3,627 3,457 3,324 3,217 3,129 2,993 2,850 2,699 2,604 2,53826 5,526 4,637 4,140 3,818 3,591 3,421 3,288 3,182 3,094 2,958 2,815 2,664 2,569 2,50327 5,488 4,601 4,106 3,785 3,558 3,388 3,256 3,149 3,062 2,926 2,783 2,632 2,536 2,47028 5,453 4,568 4,074 3,754 3,528 3,358 3,226 3,120 3,032 2,896 2,753 2,602 2,506 2,44029 5,420 4,538 4,045 3,725 3,499 3,330 3,198 3,092 3,005 2,868 2,726 2,574 2,478 2,41230 5,390 4,510 4,018 3,699 3,473 3,304 3,173 3,067 2,979 2,843 2,700 2,549 2,453 2,386

Kapitola 5. (Popisná štatistika) – 15

Page 131: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.10: Tabuľka kvantilov pre F(n, k), δ=0,995.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 199,0 199,2 199,3 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4 199,5 199,5 199,53 49,80 47,47 46,19 45,39 44,84 44,43 44,13 43,88 43,69 43,39 43,08 42,78 42,59 42,474 26,28 24,26 23,15 22,46 21,97 21,62 21,35 21,14 20,97 20,70 20,44 20,17 20,00 19,895 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,38 13,15 12,90 12,76 12,666 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,03 9,814 9,589 9,451 9,3587 12,40 10,88 10,05 9,522 9,155 8,885 8,678 8,514 8,380 8,176 7,968 7,754 7,623 7,5348 11,04 9,596 8,805 8,302 7,952 7,694 7,496 7,339 7,211 7,015 6,814 6,608 6,482 6,3969 10,11 8,717 7,956 7,471 7,134 6,885 6,693 6,541 6,417 6,227 6,032 5,832 5,708 5,62510 9,427 8,081 7,343 6,872 6,545 6,302 6,116 5,968 5,847 5,661 5,471 5,274 5,153 5,07111 8,912 7,600 6,881 6,422 6,102 5,865 5,682 5,537 5,418 5,236 5,049 4,855 4,736 4,65412 8,510 7,226 6,521 6,071 5,757 5,525 5,345 5,202 5,085 4,906 4,721 4,530 4,412 4,33113 8,186 6,926 6,233 5,791 5,482 5,253 5,076 4,935 4,820 4,643 4,460 4,270 4,153 4,07314 7,922 6,680 5,998 5,562 5,257 5,031 4,857 4,717 4,603 4,428 4,247 4,059 3,942 3,86215 7,701 6,476 5,803 5,372 5,071 4,847 4,674 4,536 4,424 4,250 4,070 3,883 3,766 3,68716 7,514 6,303 5,638 5,212 4,913 4,692 4,521 4,384 4,272 4,099 3,920 3,734 3,618 3,53917 7,354 6,156 5,497 5,075 4,779 4,559 4,389 4,254 4,142 3,971 3,793 3,607 3,492 3,41218 7,215 6,028 5,375 4,956 4,663 4,445 4,276 4,141 4,030 3,860 3,683 3,498 3,382 3,30319 7,093 5,916 5,268 4,853 4,561 4,345 4,177 4,043 3,933 3,763 3,587 3,402 3,287 3,20820 6,986 5,818 5,174 4,762 4,472 4,257 4,090 3,956 3,847 3,678 3,502 3,318 3,203 3,12321 6,891 5,730 5,091 4,681 4,393 4,179 4,013 3,880 3,771 3,602 3,427 3,243 3,128 3,04922 6,806 5,652 5,017 4,609 4,322 4,109 3,944 3,812 3,703 3,535 3,360 3,176 3,061 2,98223 6,730 5,582 4,950 4,544 4,259 4,047 3,882 3,750 3,642 3,475 3,300 3,116 3,001 2,92224 6,661 5,519 4,890 4,486 4,202 3,991 3,826 3,695 3,587 3,420 3,246 3,062 2,947 2,86825 6,598 5,462 4,835 4,433 4,150 3,939 3,776 3,645 3,537 3,370 3,196 3,013 2,898 2,81926 6,541 5,409 4,785 4,384 4,103 3,893 3,730 3,599 3,492 3,325 3,151 2,968 2,853 2,77427 6,489 5,361 4,740 4,340 4,059 3,850 3,687 3,557 3,450 3,284 3,110 2,928 2,812 2,73328 6,440 5,317 4,698 4,300 4,020 3,811 3,649 3,519 3,412 3,246 3,073 2,890 2,775 2,69529 6,396 5,276 4,659 4,262 3,983 3,775 3,613 3,483 3,377 3,211 3,038 2,855 2,740 2,66030 6,355 5,239 4,623 4,228 3,949 3,742 3,580 3,450 3,344 3,179 3,006 2,823 2,708 2,628

Kapitola 5. (Popisná štatistika) – 16

Page 132: 14.Numericka matematika a amatematicka statistika

Aproximáciu požadovaného kvantilu dostaneme lineárnou interpoláciou týchto dvoch hodnôt

F0,99(13, 14) = F0,99(12, 14) +13− 12

15− 12(F0,99(15, 14)− F0,99(12, 14)) = 3,800 +

1

3(3,656− 3,800) = 3,752.

Ak by sme chceli lepší odhad použijeme viac hodnôt z tabuľky a interpoláciu polynómom vyššieho stupňa, avšak použitá jednoduchá interpolácia je voväčšine prípadov postačujúca.

Príklad 5.7 Odvoďme vzorec pre pχ2(n) pre n=1 a n=2.

Riešenie. Začneme s χ2(1). Podľa definície máme χ2(1)= (N (0, 1))2. Vypočítame pravdepodobnosť P(χ2(1)<x), čo je hodnota distribučnej funkcie,ktorú síce nepoznáme, ale s využitím hľadanej hustoty môžeme zapísať

P(χ2(1)<x) =

∫ x

−∞pχ2(1)(t)dt.

Teraz využijeme definíciu:P(χ2(1)<x) = P((N (0, 1))2<x) = P(−

√x<N (0, 1)<

√x),

pričom posledná rovnica platí iba pre kladné x. Pre záporné x je jasné, že druhá pravdepodobnosť je nulová a aj hustota pravdepodobnosti χ2(1) jenulová, lebo záporné hodnoty nemôžu byť nadobudnuté. Poslednú pravdepodobnosť spočítame využitím hustoty rozdelenia pravdepodobnosti N (0, 1), spoužitím symetrie normálneho rozdelenia a substitúcie t=

√v v integráli. Dostaneme

P(−√x<N (0, 1)<

√x) =

∫ √x−√x

pN (0,1)(t)dt = 2

∫ √x0

1√2π

e−t2

2 dt = 2

∫ x

0

1√2π

e−v2

1

2√v

dv =

∫ x

0

1√2Γ(12

)e−v2 v−

12 dv.

Porovnaním výsledného integrálu, predošlej rovnice a definície funkcie Θ vidíme, že

pχ2(1)(t) = Θ(t)1

212 Γ(12

)e−t2 t−

12 ,

čo je presne podľa vzťahu (5.3) s n=1.

Pre výpočet hustoty pravdepodobnosti s n=2 využijeme definíciu χ2(2)= (N (0, 1))21 + (N (0, 1))22 = (χ2(1))1 + (χ2(1))2 a vzorec pre výpočet hustotypravdepodobnosti súčtu dvoch nezávislých náhodných veličín odvodený v pr. 4.13

pχ2(2)(x) =

∫ +∞

−∞pχ2(1)(t)pχ2(1)(x− t)dt.

Kapitola 5. (Popisná štatistika) – 17

Page 133: 14.Numericka matematika a amatematicka statistika

Teraz treba spočítať integrál, v ktorom vieme, že pχ2(1)(t) je pre záporné t nulové. To znamená, že pre záporné x je celý integrál nulový. Pre kladné xdostaneme

pχ2(2)(x) =

∫ x

0

pχ2(1)(t)pχ2(1)(x− t)dt =

∫ x

0

[1

212 Γ(12

)e−t2 t−

12

][1

212 Γ(12

)e−x−t2 (x− t)−

12

]dt = e−

x2

1

∫ x

0

dt√t(x− t)

.

Posledný integrál vypočítame ∫ x

0

dt√t(x− t)

=

∫ x

0

dt√(x2

)2 − (t− x2

)2 =

∫ x2

−x2

dv√(x2

)2 − v2 =

[arcsin

2v

x

]x2

−x2

= π,

takže so súčasným uvážením nulovosti hustoty pre záporné x dostaneme

pχ2(2)(x) = Θ(x)e−x2

1

2ππ = Θ(x)

1

2e−

x2 .

Výsledný vzorec zodpovedá vzťahu (5.3) s n=2. Všimnime si tiež, že výsledná hustota je rovná hustote rozdelenia pravdepodobnosti náhodnej veličiny sexponenciálnym rozdelením a s parametrom δ=1

2.

Poznamenajme, že podobným spôsobom by sme vedeli vypočítať vzorec hustoty z (5.3) aj pre ďalšie n.

Všetky spomenuté rozdelenia pravdepodobnosti budeme využívať v štatistických výpočtoch. Pritom už z číselnej anaýzy štatistického súboru sa dáočakávať, kedy vznikne ktorý typ náhodnej veličiny. Začnime so základnými charakteristikami. Podľa tab. 5.5 máme vzorce na výberové charakteristikyspočítané z hodnôt štatistického súboru. Ak ich napíšeme ako vzťahy náhodných veličín ξi, dostaneme

ξ =1

n

n∑i=1

ξi, ξS2 =1

n− 1

n∑i=1

(ξi − ξ

)2.

Budeme predpokladať, ako vždy pri náhodnom výbere, že tieto náhodné veličiny sú nezávislé, ale naviac, že majú normálne rozdelenie, t. j. ξi∼N (m,σ2)alebo ξi−m

σ∼N (0, 1). Potom platí, že náhodné veličiny ξ a ξS2 sú nezávislé s nasledujúcimi rozdeleniami pravdepodobnosti

ξ ∼ N(m,

σ2

n

),

n− 1

σ2ξS2 ∼ χ2(n−1). (5.6)

Náhodnú veličinu ξ sme dostali ako lineárnu kombináciu ξi, takže časť tvrdenia o ξ súvisí s vlastnosťami normálneho rozdelenia a vlastnosťami strednejhodnoty a rozptylu. Naviac toto tvrdenie môžeme prepísať pomocou štandardného normálneho rozdelenia ako

ξ −mσ

√n ∼ N (0, 1). (5.7)

To, že náhodná veličina ξS2 súvisí s rozdelením χ2 je zrejmé z jej konštrukcie, otázkou však je stupeň voľnosti.

Kapitola 5. (Popisná štatistika) – 18

Page 134: 14.Numericka matematika a amatematicka statistika

Príklad 5.8 Vyjadrime náhodnú veličinu ξS2 ako náhodnú veličinu s χ2 rozdelením.

Riešenie. Výraz pre ξS2 násobíme faktorom n−1σ2 a upravíme podobne ako v pr. 5.3 tak, aby sme mohli použiť rovnicu (5.7)

n− 1

σ2ξS2 =

1

σ2

n∑i=1

(ξi − ξ

)2=

n∑i=1

(ξi − ξσ

)2

=n∑i=1

((ξi −m)−

(ξ −m

)2

=n∑i=1

(ξi −mσ

)2

− n(ξ −mσ

)2

=n∑i=1

(N (0, 1))2i − (N (0, 1))2 = χ2(n)− χ2(1) = χ2(n− 1)

Z čoho naozaj vidíme, že stupeň voľnosti v ξS2 je n−1.

V tejto súvislosti môžeme doplniť ďalšie dva zaujímavé vzťahy, ktoré budú pre nás užitočné. Pracujúc stále s n členným náhodným výberom, mánasledujúca výberová charakteristika T t rozdelenie

T (ξ1, ξ2, . . . ξn) =ξ −m√ξS2

√n ∼ t(n− 1). (5.8)

Ak máme ešte druhý výber η1, η2, . . . ηk nezávislých náhodných veličín z normálneho rozdelenia N (m′, σ2) (rovnaké σ), pre ktorý určíme η = 1k

∑ki=1 ηi,

ηS2 = 1k−1∑k

i=1 (ηi − η)2, tak nasledujúca výberová charakteristika T má F rozdelenie

T (ξ1, ξ2, . . . ξn, η1, η2, . . . ηk) =ξS2

ηS2

∼ F(n− 1, k − 1). (5.9)

Ak chápeme výberovú charakteristiku ako číselnú hodnotu a za ξi, resp. ηi dosadíme hodnoty xi, resp. yi zo štatistického súboru, dajú vzťahy (5.8)a (5.9) nasledujúce číselné vyjadrenie

T (x1, x2, . . . xn) =x−mSn−1

√n, T (x1, x2, . . . xn, y1, y2, . . . yk) =

S2n−1(x)

S2k−1(y)

ktoré sú potom hodnotami náhodných veličín s príslušným t resp. F rozdelením.

Kapitola 5. (Popisná štatistika) – 19

Page 135: 14.Numericka matematika a amatematicka statistika

Samohodnotiace otázky a úlohy na samostatné riešenie

1. Viete použiť pojmy náhodného výberu, štatistického súboru, či základného súboru na konkrétnom experimentálnom meraní z vašej oblasti?

2. Ak pri meraní sledujeme viac znakov a skúmame ich závislosť, údaje obyčajne zapisujeme do kontingenčnej tabuľky, čo je vlastne dvojrozmernáfrekvenčná tabuľka. Nájdete príklad jej využitia? Skúste ju zostaviť.

3. Aký graf bude zodpovedať kontingenčnej tabuľke?

4. Aké iné grafické zobrazenie experimentálnych údajov navrhujete zostrojiť?

5. Navrhnete aj iné číslené charakteristiky výberu ako sme uviedli? Kde sa môžu použiť? Aké rozdelenie pravdepodobnosti im prislúcha za predpokladunormality výberu?

6. Viete pokračovať v riešení pr. 5.7 pre vyššie n? Prípadne odvodiť vzorce (5.4) alebo (5.5) z definície?

7. Dokážete matematicky zdôvodniť vzťahy (5.8) a (5.9)?

V úlohách 1. až 5. urobte číselnú a grafickú analýzu nameraných údajov, t. j. vypočítajte výberové charakteristiky, navrhnite triedenie nameraných údajova pripravte frekvenčnú tabuľku, znázornite histogram a empirickú distribučnú funkciu.

1. Meranie koncentrácie ozónu v zvolenej lokalite v priebehu letných prázdnin niekoľkých rokov.

3,5 1,4 6,6 6,0 4,2 4,4 5,3 5,6 6,8 2,5 5.4 4.4 5.44,7 3,5 4,0 2,4 3,0 5,6 4,7 6,5 3,0 4,1 3.4 6.8 1.75,3 4,7 7,4 6,0 6,7 11,7 5,5 1,1 5,1 5,6 5.5 1.4 3.96,6 6,2 7,5 6,2 6,0 5,8 2,8 6,1 4,1 5,7 5.8 3.1 5.81,6 2,5 8,1 6,6 9,4 3,4 5,8 7,6 1,4 3,7 2.0 3.7 6.83,1 4,7 3,8 5,9 3,3 6,2 7,6 6,6 4,4 5,7 4.5 3.7 9.4

.

Kapitola 5. (Popisná štatistika) – 20

Page 136: 14.Numericka matematika a amatematicka statistika

2. Meranie úrovne hluku dopravy na križovatke v dB.

64,6 55,8 58,9 60,0 67,1 56,4 60,8 62,0 64.9 77.162,1 52,0 56,7 59,4 65,7 55,9 60,2 61,0 63.8 67.963,1 55,7 57,6 59,8 67,0 54,4 60,6 61,8 64.8 69.462,7 54,5 57,0 59,0 66,8 56,2 60,5 61,7 64.6 68.962,6 54,4 56,8 59,4 66,2 55,9 60,3 61,4 64.0 68.2

.

3. Meranie prietoku vody v potoku v m3s−1.

0,381 0,800 0,291 0,686 0,437 1,029 0,230 0,634 0,399 0,840 0,334 0,751 0,464 1,164 0,181 0,534 0,504 1,647 0,5040,390 0,819 0,300 0,740 0,441 1,084 0,248 0,634 0,414 0,853 0,348 0,771 0,476 1,303 0,209 0,558 0,414 0,921 0,3610,173 0,510 0,361 0,783 0,254 0,634 0,418 0,974 0,217 0,577 0,390 0,822 0,300 0,740 0,443 1,134 1,601 0,254 0,6340,181 0,520 0,372 0,783 0,274 0,660 0,424 0,976 0,230 0,625 0,399 0,840 0,318 0,746 0,455 1,157 0,772 0,488 1,514

.

4. Zisťovanie medze pevnosti materiálu, hodnoty v MPa.

14,40 16,40 15,00 16,54 15,40 16,50 15,90 17,35 14,78 16,00 15,30 16,1014,51 16,42 15,98 17,10 15,20 16,48 15,94 16,90 15,50 16,64 14,41 17,5414,48 15,64 15,07 15,80 14,61 16,04 15,09 16,25 15,12 16,80 16,27 16,2814,35 15,60 15,90 16,42 14,70 16,50 15,50 16,30 14,50 15,63 15,90 16,3014,80 16,03 15,51 16,50 14,80 16,42 15,81 17,40 15,30 16,48 15,06 17,3314,81 15,90 15,40 16,12 14,80 16,40 15,80 16,36 15,92 15,70 16,50 16,74

.

5. Počet výpadkov počítačovej siete v univerzitnom výpočtovom centre za týždeň.

0 0 2 0 0 0 3 3 0 0 1 8 5 00 4 3 0 6 2 0 3 1 1 0 1 0 11 0 2 2 0 0 0 1 2 1 2 0 0 16 4 3 3 1 2 4 0 0 3 1 2 0 00 0 0 1 1 0 2 0 2 4 4 0 2 2

Kapitola 5. (Popisná štatistika) – 21

Page 137: 14.Numericka matematika a amatematicka statistika

.

Záver

V kapitole sme sa naučili správne používať základné termíny štatistiky a pochopili sme ich význam. Naučili sme sa zaznamenať údaje do prehľadných aúčelných tabuliek. Z tabuliek vieme získať prehľadnú informáciu o tabuľkových údajoch pomocou číselných charakteristík vyjadrujúcich niektoré špeciálnevlastnosti týchto sád hodnôt a tiež sme si vysvetlili, ako vytvoriť obrázky z grafmi, ktoré popisujú charakter údajov. Získané číselné charakteristiky smedali do súvislosti s teóriou pravdepodobnosti, a vieme tak na jej základe vyhodnotiť mieru a charakter náhodnosti v štatistických údajoch. Naviac smesa naučili rozlíšiť typy základných náhodných veličín, ktoré sú používané v štatistike a rozumieť ich charakteristikám.

Literatúra

[1] C. Török. Úvod do teórie pravdepodobnosti a matematickej štatistiky. TU Košice, 1992.

[2] M. Kalina et al. Základy pravdepodobnosti a matematickej štatistiky. STU Bratislava, 2010.

[3] J. Hendl. Přehled statistických metod spracování dat. Portál, Praha, 2004.

Riešenia úloh

Odpovede na samohodnotiace otázky, ak ich neviete sformulovať, a aj mnohé iné odpovede nájdete v odporúčanej literatúre.

1. Sn−1=2,0026, x=4,9744,M=5,3,Q1=3,55,Q3=6,175 2. Sn−1=4,8868, x=61,352,M=60,9,Q1=57,15,Q3=64,6 3. Sn−1=0,3356, x=0,6059,M=0,507, Q1=0,3693, Q3=0,783 4. Sn−1=0,8047, x=15,8226, M=15,9, Q1=15,18, Q3=16,42 5. Sn−1=1,7588, x=1,4714, M=1, Q1=0,Q3=2

Kapitola 5. (Popisná štatistika) – 22

Page 138: 14.Numericka matematika a amatematicka statistika

Kapitola 5. (Popisná štatistika)

Poslanie

Zoznámiť študentov so základnými pojmami štatistiky, spôsobmi zápisu výsledkov merania a ich prvotnej analýzy.

Ciele

1. Pochopiť a naučiť sa správne používať základné termíny štatistiky.

2. Naučiť sa efektívne zapísať údaje do prehľadných a účelných tabuliek.

3. Získať prehľadnú informáciu o údajoch pomocou číselných charakteristík a obrázkov s grafmi.

4. Dať do súvislosti získané číselné charakteristiky s teóriou pravdepodobnosti.

5. Rozlíšiť základné náhodné veličiny používané v štatistike a porozumieť ich charakteristike.

Prerekvizičné znalosti

náhodná veličina; distribučná funkcia; rozdelenie pravdepodobnosti

Kapitola 5. (Popisná štatistika) – 1

Page 139: 14.Numericka matematika a amatematicka statistika

Úvod

V kapitole sa venujeme základom z matematickej štatistiky. Matematická štatistika sa zaoberá vlastnosťami hromadných náhodných javov na základeúdajov získaných experimentom. Experimentom tu pravda môže by fyzikálny pokus a výskledky jeho merania, zber údajov o charaktere stavebnýchmateriálov, či anketa o spokojnosti zákazníkov.

V teórii pravdepodobnosti sme si ukázali, ako pracovať s náhodnou veličinou a ako popísať jej vlastnosti. Ostala však otázka, ako zistiť v konkrétnomkontexte typ tejto náhodnej veličiny. Tomuto se venuje matematická štatistika, no pravda nielen tomu, veď aj vlastnosti náhodnej veličiny sú neznámea ak už nič iné, treba ich vedieť aspoň kvalifikovane odhadnúť.

V matematickej štatistike preto budeme analyzovať nazbierané súbory údajov s cieľom odhadnúť typ distribučnej funkcie náhodnej veličiny či odhadnúťniektoré jej parametre. Na to budeme potrebovať urobiť experiment alebo zozbierať údaje, aby sme naše pozorovanie správne zaregistrovali.

V prvom rade si kvôli tomu vyslovíme základné pojmy, ktoré pri tomto zbere budeme používať a ukážeme si, ako zozbierané údaje efektívne a účelnezapísať. Ďalej si uvedieme, ktoré číselné charakteristiky budeme pri štatistických metódach používať pre správne vyhodnotenie následnej analýzy. A tiežsi ukážeme, ako zobraziť získané údaje pomocou štatistických grafov, pretože zrakový vnem pri takejto analýze je veľmi užitočný.

Potom by mala nasledovať matematická analýza údajov s ohľadom na ich náhodnosť a tu prichádza k slovu pravdepodobnosť. V ďalšej časti tejtokapitoly budeme teda sledovať základné súvislosti nameraných údajov s teóriou pravdepodobnosti. V oblasti stavebného inžinierstva častokrát môžemeuvažovať o náhodách s normálnym rozdelením pravdepodobnosti, a tak práve toto rozdelenie pravdepodobnosti a s ním úzko súvisiace rozdelenia budúzákladom aj našej ďalšej práce v oblasti matematickej štatistiky. Preto na záver tejto kapitoly uvedieme základné fakty a vlastnosti potrebných rozdelenípravdepodobnosti pre rigorózne použitie štatistiky v praxi a ich prepojenie na číselnú analýzu údajov.

Popisná štatistika – Štatistický súbor, štatistické premenné a tabuľky

Prv než pristúpime k analýze údajov, zoznámme sa so základnou štatistickou terminológiou.

Základný súbor je množina všetkých štatistických jednotiek, ktoré prichádzajú pri experimente do úvahy.

Náhodný výber zo základného súboru je postupnosť nezávislých náhodných veličín ξ1, ξ2, . . . , ξn s rovnakým rozdelením pravdepodobnosti určenýchdistribučnou funkciou F .

Štatistický súbor chápeme buď ako súbor objektov štatistických jednotiek získaných náhodným spôsobom, ako súbor náhodných veličín získaných znáhodného výberu, alebo ako súbor údajov na vybraných štatistických vzorkách, ako hodnoty tých náhodných veličín.

Kapitola 5. (Popisná štatistika) – 2

Page 140: 14.Numericka matematika a amatematicka statistika

Príklad 5.1 Uveďme príklady aplikácie týchto pojmov v praxi.

Riešenie. Ak skúmame charakteristiku populácie Slovákov, tak každý Slovák je štatistickou jednotkou a všetci Slováci sú základným súborom. Pri testovanítejto populácie z nich náhodným výberom vyberieme niekoľko a dostaneme tak štatistický súbor, ktorý je jednak súborom objektov, to sú jednotlivíSlováci, a jednak súborom údajov, čo sú číselné alebo aj iné hodnoty znakov, ktoré nás zaujímajú, napr. výška, farba očí, povolanie.

Podobne ak skúmame penetračný náter v nádobe, tak on sám je základným súborom a štatistickou jednotkou by bola akákoľvek z neho odobraná vzorka.Pri testovaní tohto náteru z neho náhodným výberom odoberieme niekoľko vzoriek a dostaneme tak štatistický súbor, ktorý je jednak súborom objektov,to sú tie jednotlivé odobrané vzorky, a jednak súborom údajov, čo sú zas napr. číselné hodnoty znakov, ktoré nás zaujímajú, ako hustota, viskozita,permeabilita.

Východiskom pre štatistickú analýzu sú údaje reprezentujúce jednotlivé znaky, jednotlivé premenné. Údaje najčastejšie zapisujeme do tabuliek. V šta-tistických metódach budeme používať dva základné typy tabuliek, a to tabuľku prvotnú a tabuľku frekvenčnú. V prvotnej tabuľke sú uvedené všetkyhodnoty z n členného štatistického súboru zistených pre m rôznych znakov, teda jednotlivých premenných. Ak hodnoty príslušných náhodných veličínξji , kde i=1, . . . , n a j=1, . . . ,m, teda pozorované hodnoty, označíme xji , výsledkom je napr. tabuľka tab. 5.1. Tabuľku samozrejme môžeme zapísať aj

Tabuľka 5.1: Prvotná tabuľkaξ1 ξ2 . . . ξm

1 x11 x21 . . . xm12 x12 x22 . . . xm2...

...... . . . ...

n x1n x2n . . . xmn

v transponovanom tvare, ak je to prehľadnejšie.

Frekvenčnú tabuľku používame, ak máme údaje rozdelené do klasifikačných tried Ci, ako dokumentuje vzor frekvenčnej tabuľky tab. 5.2. Klasifikačnýmitriedami môžu byť hodnoty zisťovaných znakov, ak zodpovedajú diskrétnej náhodnej veličine s malým počtom možných výsledkov. Ak diskrétna náhodnáveličina nadobúda mnoho, prípadne nekonečne mnoho, možných výsledkov, alebo skúmaný znak (premenná) zodpovedá spojitej náhodnej veličine,klasifikačnými triedami sú množiny hodnôt týchto znakov, napr. vhodné disjunktné intervaly, pričom ako hodnotu triedy volíme jednu hodnotu z množiny,napr. jej strednú hodnotu. Tabuľka potom uvádza počet hodnôt ni zaradených do triedy Ci. Niekedy namiesto absolútnej početnosti ni uvádzamerelatívnu početnosť νi=ni

n, kde n=

∑mk=1 ni. Frekvenčnú tabuľku zostrojujeme, ak chceme mať prehľad o roztriedení nameraných hodnôt, teda ktorých

je viac, ktorých menej, tým vidíme, že získavame predstavu o rozdelení pravdepodobnosti náhodných veličín zo základného súboru. Preto túto tabuľkuvyužívame v štatistických metódach, v ktorých usudzujeme niečo o tomto rozdelení pravdepodobnosti.

Kapitola 5. (Popisná štatistika) – 3

Page 141: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.2: Frekvenčná tabuľkaTriedy C1 C2 . . . Cm

Početnosti n1 n2 . . . nm

Príklad 5.2 V hypermarkete urobili prieskum týkajúci sa doby obsluhy zákazníkov. Zaznamenané doby čakania zákazníkov v sekundách sú (po usporia-daní) uvedené v tabuľke tab. 5.3. Roztrieďme údaje do frekvenčnej tabuľky.

Tabuľka 5.3: Doba čakania zákazníkov2 7 10 21 26 28 32 33 38 40 41 41 4444 47 48 50 50 55 67 69 69 74 78 84 8592 92 96 103 103 104 111 118 131 133 136 138 143149 165 176 181 196 197 206 213 259 275 287 383 440

Riešenie. Tabuľka zodpovedá prvotnej tabuľke, kde sme mali iba jeden znak, a to čas. Zapísať však toľké údaje do jedného riadku alebo stĺpca tabuľkyby bolo neprehľadné a neefektívne. Počet tried vo frekvenčnej tabuľke volíme podľa uváženia tak, aby v nej bolo vidieť roztriedenie nameraných hodnôt.V našom prípade hodnoty rozdelíme do intervalov dĺžky 50s, pričom hodnota triedy je stredná hodnota intervalu, ni sú početnosti meraní v jednotlivýchtriadach a νi ich relatívne početnosti, viď tab. 5.4

Popisná štatistika – Popisná štatistika

Hodnôt z experimentu máme obyčajne veľa a je potrebné získať z nich stručnú a prehľadnú informáciu v číselnom či grafickom formáte o nich ako oštatistickom súbore.

Výberová charakteristika (alebo štatistika) T je funkcia náhodného výberu rozsahu n, pričom ju chápeme buď ako funkciu náhodných veličín ξ1,ξ2, . . . , ξn náhodného výberu, alebo ako funkciu hodnôt x1, x2, . . . , xn týchto náhodných veličín realizovaných štatistickým súborom. Teda aj samotnúvýberovú charakteristiku interpretujeme buď ako náhodnú veličinu ξ=T (ξ1, ξ2, . . . , ξn), čo je dôležité z hľadiska teórie pre naplnenie pravdepodobnostnéhocharakteru štatistickej analýzy, alebo ako číslo x=T (x1, x2, . . . , xn), čo je zasa potrebné z hľadiska praktického využitia a vysvetlenia experimentálnychhodnôt.

Najčastejšie nami využívanými štatistikami budú výberový aritmetický priemer a výberový rozptyl, prípadne výberová smerodajná odchýlka. Vzorce preich číselný výpočet pomocou hodnôt súboru x1, x2, . . . , xn sú uvedené v tab. 5.5, pričom smerodajná odchýlka Sn−1 je odmocnina z rozptylu. Je vhodné

Kapitola 5. (Popisná štatistika) – 4

Page 142: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.4: Frekvenčná tabuľka pre dobu čakania zákazníkovInterval (0, 50〉 (50, 100〉 (100, 150〉 (150, 200〉 (200, 250〉 (250, 300〉 (300, 350〉 (350, 400〉 (400, 450〉

Trieda C 25 75 125 175 225 275 325 375 425ni 18 11 11 5 2 3 0 1 1νi 0,3462 0,2115 0,2115 0,0962 0,0385 0,0577 0,0 0,0192 0,0192

poznamenať, že v praxi sa používa aj rozptyl základného súboru S2n pre základný súbor s rozsahom n, určený vzťahom S2

n =1

n

n∑i=1

(xi − X)2. Pre veľké

n je rozdiel medzi oboma vzorcami malý, avšak pre štatistické súbory s malým rozsahom je dobré si rozdiel v multiplikatívnom faktore uvedomiť, akouvidíme neskôr. Ak máme k dispozícii frekvenčnú tabuľku tab. 5.2, tieto výberové charakteristiky počítame pomocou vážených charakteristík, kde váhysú určené početnosťami ni a hodnoty xi sú určené hodnotou triedy Ci, teda

X =1

n

m∑i=1

nixi, S2n =

1

n

m∑i=1

ni(xi − X)2, kde n=m∑i=1

ni. (5.1)

Pri štatistickej analýze rozdelenia a rozptýlenosti hodnôt výberu používame tiež výberový medián, výberový dolný kvartil a výberový horný kvartil, ktoréurčujeme na základe usporiadaného výberu, t. j. v štatistickom súbore sú hodnoty x1, x2, . . . , xn usporiadané podľa veľkosti x1≤x2≤ · · · ≤xn. Tietohodnoty sú určené tak, že od výberového dolného kvartilu je vľavo od neho štvrtina všetkých pozorovaní, od výberového mediánu je vľavo od nehopolovica všetkých pozorovaní a od výberového horného kvartilu sú vľavo od neho tri štvrtiny všetkých pozorovaní. Hodnoty týchto charakteristík sú tiežuvedené v tab. 5.5

Príklad 5.3 Ukážme rovnosť pre dva vzťahy pre Sn−1 v tab. 5.5.

Riešenie. Upravíme jeden vzorecn∑i=1

(xi − X)2 =n∑i=1

(x2i − 2xiX + X2) =n∑i=1

x2i − 2Xn∑i=1

xi + nX2 =n∑i=1

x2i − nX2,

keďžen∑i=1

xi=nX. Prenásobením faktorom 1n−1 dostaneme požadovaný vzťah.

Príklad 5.4 V pr. 5.2 boli v tabuľke tab. 5.3 uvedené doby obsluhy zákazníkov (v sekundách) v hypermarkete. Určte základné číslené charakteristikytohto súboru.

Kapitola 5. (Popisná štatistika) – 5

Page 143: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.5: Základné výberové charakteristikyŠtatistika Označenie Vzorec

Výberový priemer X X =1

n

n∑i=1

xi

Výberový rozptyl S2 S2n−1 =

1

n− 1

n∑i=1

(xi − X)2 =1

n− 1

(n∑i=1

x2i − nX2

)n=4k n=4k+1 n=4k+2 n=4k+3

Výberový dolný kvartil Q13xk+xk+1

4

xk+xk+1

2

xk+3xk+1

4xk+1

n=2k n=2k+1

Výberový medián M(=Q2)xk+xk+1

2| xk+1

n=4k n=4k+1 n=4k+2 n=4k+3

Výberový horný kvartil Q33x3k+x3k+1

4

x3k+1+x3k+2

2

3x3k+2+x3k+3

4x3k+3

Riešenie. Začneme priemerom:

n = 52, X =1

52

52∑i=1

xi =1

52(2 + 7 + 10 + · · ·+ 440)

.= 111,73.

Rozptýlenosť budeme charakterizovať smerodajnou odchýlkou namiesto rozptylu

Sn−1 =

√√√√ 1

51

(52∑i=1

x2i − 52 x2

).=

√1

51(1087654− 52 · 111,732)

.= 92,73.

Keby sme tento štatistický súbor brali ako základný súbor, použili by sme vzorec pre Sn a dostali by sme

Sn =

√√√√ 1

52

(52∑i=1

x2i − 52 x2

).=

√1

52(1087654− 52 · 111,732)

.= 90,94.

Rozdiel oproti Sn−1 nie je veľký. Pôvodné údaje už sú usporiadané, takže môžeme ľahko odčítať kvartily aj medián. V každom riadku tabuľky je štvrtinaúdajov, a keďže n=52=2·26=4·13, podľa tab. 5.5 máme

Q1 =3x13+x14

4=

3·44+44

4=44, M =

x26+x272

=85+92

2=88,5, Q3 =

3x39+x404

=3·143+149

4=144,5.

Kapitola 5. (Popisná štatistika) – 6

Page 144: 14.Numericka matematika a amatematicka statistika

Spočítajme pre porovnanie aj výberové charakteristiky z frekvenčnej tabuľky tab. 5.4. Označme výberový priemer X a smerodajnú odchýlku S. Pre m=9tried dostaneme

X =9∑j=1

νiCi = (0,3462 · 25 + · · ·+ 0,0192 · 425).= 107,69,

S =9∑j=1

νiC2i − X2 =

(0,3462 · 252 + · · ·+ 0,0192 · 4252

)− 107,692 .

= 92,45

čo sú samozrejme porovnateľné hodnoty s x a Sn−1.

Okrem číselných hodnôt je vhodné používať aj grafické zobrazenie údajov. Najčastejšie sa na tento účel používa histogram, viď obr. 5.1, vľavo. Je to

ν ialeb

oni

Ci

F

x

Obr. 5.1: Histogram a empirická distribučná funkcia.

obdĺžnikový graf, ktorý zodpovedá frekvenčnej tabuľke: každá trieda má úsek na vodorovnej osi (napr. rozsah hodnôt rozdelený na m intervalov rovnakejdĺžky), výška obdĺžnika zodpovedá početnosti v príslušnej triede, prípadne relatívnej početnosti. Histogram pomôže pri analýze rozptýlenosti údajovsledovanej veličiny, pri identifikácii odľahlých hodnôt, či pri určení typu rozdelenia vo výbere, keďže pripomína hustotu rozdelenia pravdepodobnostináhodnej veličiny.

Okrem hustoty, poznáme z teórie pravdepodobnosti aj distribučnú funkciu. Tú môžeme v údajoch odhadnúť pomocou grafu empirickej distribučnejfunkcie F znázornenej na obr. 5.1, vpravo. Túto funkciu definujeme vzťahom

F (x) =nxi<xn

, (5.2)

kde nxi≤x je počet tých hodnôt xi, ktoré sú menšie ako x. Pre efektívne zostrojenie empirickej distribučnej funkcie je preto opäť výhodné merané hodnotyusporiadať.

Kapitola 5. (Popisná štatistika) – 7

Page 145: 14.Numericka matematika a amatematicka statistika

Príklad 5.5 V pr. 5.2 boli v tabuľke tab. 5.3 uvedené doby obsluhy zákazníkov (v sekundách) v hypermarkete. Zostrojte histogram a empirickúdistribučnú funckiu.

Riešenie. Frekvenčnú tabuľku sme zostavili v uvedenom príklade, na jej základe nakreslíme histogram. Histogram je na obr. 5.2, vľavo, vykreslený prerelatívne početnosti νi spolu s grafom funkcie, ktorá vyjadruje pravdepodobnosť, že hodnota náhodnej veličiny ξ s exponenciálnym rozdelením s hustotoup(x)=δe−δx a s parametrom δ=0,01 je v intervale 〈x−25, x+25〉 aby sme videli súvislosť s touto hustotou. Na základe takéhoto obrázku je celkomprirodzené predpokladať, že ak ξ vyjadruje dobu čakania zákazníka, tak má exponenciálne rozdelenie.

Vyskúšame niečo podobné aj s empirickou distribučnou funkciou. Keby sme na základe tab. 5.3 chceli napísať rovnicu pre F , vyzeralo by to nasledovne

F (x) =

0 , ak x ≤ 2,152

, ak 2 < x ≤ 7,...

5052

, ak 287 < x ≤ 383,5152

, ak 383 < x ≤ 440,

1 , ak 440 < x.

Nie je to veľmi prehľadné, a tak je lepší naozaj ten graf, ktorý je uvedený na obr. 5.2, vpravo. Aj v tomto grafe sme kvôli ilustratívnosti vložili aj graf

0

0,1

0,2

0,3

0,4

0 50 100 150 200 250 300 350 400 450

ν,P

t [s]

νi

x+25∫x−25

p(t)dt

0

0,2

0,4

0,6

0,8

1

0 50 100 150 200 250 300 350 400 450

Ft [s]

F (x)F (x)

Obr. 5.2: Histogram a empirická distribučná funkcia.

distribučnej funkcie exponeciálneho rozdelenia F (x)=(1−e−δx

), pri porovnaní s ktorým vidno exponenciálny charakter náhodnej veličiny, pre ktorú máme

k dispozícii štatistický súbor.

Kapitola 5. (Popisná štatistika) – 8

Page 146: 14.Numericka matematika a amatematicka statistika

Popisná štatistika – Základné rozdelenia pravdepodobnosti v matematickej štatistike

Náhodnosť zozbieraných údajov aj príslušných číselných charakteristík je potrebné preskúmať a vyhodnotiť na základe teórie pravdepodobnosti.

V praktických úlohách častokrát predpokladáme, že štatistický súbor pochádza s výberu s normálnym rozdelením. Normálne rozdelenie pravdepodobnostitak bude skutočným základom štatistických výpočtov, ktorým sa budeme venovať. Spolu s ním však musíme zobrať do úvahy aj ďalšie rozdeleniapravdepodobnosti, veď ak napr. vypočítame výberový priemer alebo výberový rozptyl ako charakteristiky súboru údajov, dostanenme tiež náhodnéveličiny a pre ne tiež potrebujeme vedieť alebo aspoň odhadnúť, aké rozdelenie pravdepodobnosti im prislúcha. Z tohto hľadiska sa stretneme s tromanasledujúcimi rozdeleniami.

Nech η1, η2, . . . ηn, ηn+1 . . . ηn+k, sú nezávislé náhodné veličiny so štandardným normálnym rozdelením ηi ∼ N (0, 1).

Hovoríme, že náhodná veličina ξ má rozdelenie χ2 (čítame „chí kvadrát“) s n stupňami voľnosti, ak platí

ξ = η21 + η22 + · · ·+ η2n,

a zapisujeme ako ξ ∼ χ2(n), častokrát aj samotný symbol χ2(n) budeme používať na označenie náhodnej veličiny s týmto rozdelením. Na základe tejtodefinície vieme odvodiť hustotu rozdelenia pravdepodobnosti pχ2(n), strednú hodnotu Eχ2(n) aj rozptyl Dχ2(n):

pχ2(n)(x) = Θ(x)x

n2−1e−

x2

2n2 Γ(n2

) , Eχ2(n) = n, Dχ2(n) = 2n. (5.3)

Kvantil xδ tejto náhodnej veličiny na hladine δ budeme označovať χ2δ(n).

Pre predstavu o rozdelení hodnôt náhodnej veličiny v závislosti od stupňov voľnosti je na obr. 5.3 graf hustoty pre tri rôzne n. V štatistických výpočtochbudeme potrebovať kvantily náhodných veličín blízke nule alebo jednotke. Tieto hodnoty sú zosumarizované v tab. 5.6.

Ďalej hovoríme, že náhodná veličina ξ má Studentovo t rozdelenie s n stupňami voľnosti, ak platí

ξ =ηn+1√χ2(n)n

,

kde χ2(n) je definované vyššie. Zapisujeme ξ ∼ t(n), a aj tu budeme samotný symbol t(n) používať na označenie náhodnej veličiny s týmto rozdelením.Definícia nám môže pomôcť pri odvodení hustoty rozdelenia pravdepodobnosti pt(n), strednej hodnoty E (t(n)) aj rozptylu D (t(n)) určených vzťahmi

pt(n)(x) =Γ(n+12

)√nπΓ

(n2

) (1 + x2

n

)n+12

, E (t(n)) = 0, D (t(n)) =n

n− 2, (5.4)

Kapitola 5. (Popisná štatistika) – 9

Page 147: 14.Numericka matematika a amatematicka statistika

0

0,05

0,1

0,15

0,2

0 5 10 15 20 25 30

p

x

n=5

n=10

n=20

0

0,1

0,2

0,3

0,4

-4 -2 0 2 4

p

x

n=2

n=5

n=20

N (0, 1)

Obr. 5.3: Hustoty rozdelenia pravdepodobnosti pre χ2(n) a t(n).

za predpokladu že majú zmysel, napr. D iba pre n>2.

Kvantil xδ tejto náhodnej veličiny na hladine δ budeme označovať t2δ(n). Toto rozdelenie pravdepodobnosti je symetrické, teda stačí vedieť počítať alebotabelovať, viď tab. 5.6, hodnoty kvantilov blízke k jednotke, lebo tδ(n)=−t1−δ(n).

Pre predstavu o rozdelení hodnôt náhodnej veličiny v závislosti od stupňov voľnosti je na obr. 5.3 graf hustoty pre tri rôzne n a tiež graf hustotyštandardného normálneho rozdelenia, ktoré je limitou t rozdelenia pre veľké n.

Do tretice definujeme F rozdelenie. Hovoríme, že náhodná veličina ξ má Fisherovo F rozdelenie so stupňami voľnosti n, k, ak platí

ξ =χ2(n)n

χ2(k)k

,

kde χ2(n) je definované vyššie a χ2(k) = η2n+1 + η2n+2 + · · · + η2n+k. Zapisujeme ξ ∼ F(n, k), a bežne budeme na označenie náhodnej veličiny s týmtorozdelením používať samotný symbol F(n, k). Hustota rozdelenia pravdepodobnosti pF(n,k), stredná hodnota E (F(n, k)) a rozptyl D (F(n, k)) sa dajúnájsť pomocou vzťahov

pF(n,k)(x) = Θ(x)Γ(n+k2

)n

n2 k

k2x

n2−1

Γ(n2

)Γ(k2

)(k + nx)

n+k2

, E (F(n, k)) =k

k − 2, D (F(n, k)) =

2k2(k + n− 2)

n(k − 2)2(k − 4), (5.5)

Kapitola 5. (Popisná štatistika) – 10

Page 148: 14.Numericka matematika a amatematicka statistika

za predpokladu že majú zmysel, napr. D iba pre k>4.

Pre predstavu o rozdelení hodnôt náhodnej veličiny v závislosti od stupňov voľnosti je na obr. 5.4 graf hustoty pre tri rôzne n a rôzne k. Podobne akoχ2(n) je aj F rozdelenie nesymetrické, tu však naviac vystupujú dva parametre, takže jednoduchú tabuľku kvantilov musíme zostrojiť pre každé δ zvlášť.V tabuľkách 5.7 až 5.10 sú kvantily, ktoré budeme neskôr používať.

0

0,2

0,4

0,6

0,8

0 1 2 3 4 5

p

x

n=5, k=5n=5, k=10n=5, k=20

0

0,2

0,4

0,6

0,8

0 1 2 3 4 5

p

x

n = 5, k = 5n = 10, k = 5n = 20, k = 5

Obr. 5.4: Hustoty rozdelenia pravdepodobnosti pre F(n, k) pri konštantnom n, vľavo, a pri konštantnom k, vpravo.

Poznamenajme ešte, že hľadať vyjadrenie distribučných funkcií všetkých troch štatistických rozdelení pravdepodobnosti je komplikované a obyčajne savyjadruje integrálom hustoty alebo pomocou špeciálnych funkcií, ktoré nemá zmysel na tomto mieste definovať.

Príklad 5.6 Nájdime pomocou tabuliek hodnoty nasledujúcich kvantilov: χ20,975(14), t0,05(19), F0,99(13, 14).

Riešenie. Prvý kvantil rýchlo nájdeme v tab. 5.6, vľavo: χ20,975(14)=26,1189.

Druhý v tabuľke síce nemáme, ale využijeme symetriu t rozdelenia, a dostaneme: t0,05(19)=− t1−0,05(19)=− t0,95(19)=1,7291, kde posledné číslo smenašli v tab. 5.6, vpravo.

Tretí kvantil budeme hľadať v tab. 5.9. Uvedené stupne voľnosti sa v tabuľke nenachádzajú, preto budeme trocha interpolovať. V tabuľke nájdeme

F0,99(12, 14)=3,800, F0,99(15, 14)=3,656.

Kapitola 5. (Popisná štatistika) – 11

Page 149: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.6: Tabuľky kvantilov pre χ2(n) a t(n).χ2δ(n) δ

n 0,005 0,01 0,025 0,05 0,95 0,975 0,99 0,9951 0,00004 0,0002 0,0010 0,0039 3,8415 5,0239 6,6349 7,87942 0,0100 0,0201 0,0506 0,1026 5,9915 7,3778 9,2103 10,59673 0,0717 0,1148 0,2158 0,3518 7,8147 9,3484 11,3449 12,83824 0,2070 0,2971 0,4844 0,7107 9,4877 11,1433 13,2767 14,86025 0,4117 0,5543 0,8312 1,1455 11,0705 12,8325 15,0863 16,74966 0,6757 0,8721 1,2373 1,6354 12,5916 14,4494 16,8119 18,54767 0,9893 1,2390 1,6899 2,1674 14,0671 16,0128 18,4753 20,27788 1,3444 1,6465 2,1797 2,7326 15,5073 17,5345 20,0902 21,95499 1,7349 2,0879 2,7004 3,3251 16,9190 19,0228 21,6660 23,589310 2,1559 2,5582 3,2470 3,9403 18,3070 20,4832 23,2092 25,188211 2,6032 3,0535 3,8157 4,5748 19,6751 21,9201 24,7250 26,756912 3,0738 3,5706 4,4038 5,2260 21,0261 23,3367 26,2170 28,299513 3,5650 4,1069 5,0088 5,8919 22,3620 24,7356 27,6883 29,819514 4,0747 4,6604 5,6287 6,5706 23,6848 26,1189 29,1412 31,319315 4,6009 5,2294 6,2621 7,2609 24,9958 27,4884 30,5779 32,801316 5,1422 5,8122 6,9077 7,9616 26,2962 28,8454 31,9999 34,267217 5,6972 6,4078 7,5642 8,6718 27,5871 30,1910 33,4086 35,718418 6,2648 7,0149 8,2307 9,3905 28,8693 31,5264 34,8053 37,156519 6,8440 7,6327 8,9065 10,1170 30,1435 32,8523 36,1909 38,582220 7,4338 8,2604 9,5908 10,8508 31,4104 34,1696 37,5662 39,996921 8,0337 8,8972 10,2829 11,5913 32,6706 35,4789 38,9322 41,401122 8,6427 9,5425 10,9823 12,3380 33,9244 36,7807 40,2894 42,795723 9,2604 10,1957 11,6886 13,0905 35,1725 38,0756 41,6384 44,181324 9,8862 10,8564 12,4012 13,8484 36,4150 39,3641 42,9798 45,558525 10,5196 11,5240 13,1197 14,6114 37,6525 40,6465 44,3141 46,927826 11,1602 12,1982 13,8439 15,3792 38,8851 41,9232 45,6417 48,289927 11,8076 12,8785 14,5734 16,1514 40,1133 43,1945 46,9629 49,644928 12,4613 13,5647 15,3079 16,9279 41,3371 44,4608 48,2782 50,993329 13,1211 14,2565 16,0471 17,7084 42,5570 45,7223 49,5879 52,335530 13,7867 14,9535 16,7908 18,4927 43,7730 46,9792 50,8922 53,672040 20,7066 22,1642 24,4330 26,5093 55,7585 59,3417 63,6908 66,766050 27,9907 29,7067 32,3574 34,7643 67,5048 71,4202 76,1539 79,489960 35,5345 37,4848 40,4818 43,1880 79,0819 83,2977 88,3794 91,951870 43,2752 45,4417 48,7576 51,7393 90,5312 95,0232 100,4251 104,214980 51,1719 53,5401 57,1532 60,3915 101,8795 106,6286 112,3288 116,321090 59,1963 61,7541 65,6466 69,1260 113,1453 118,1359 124,1163 128,2990100 67,3275 70,0649 74,2219 77,9295 124,3421 129,5612 135,8068 140,1695

tδ(n) δ

n 0,950 0,975 0,990 0,9951 6,3138 12,7062 31,8207 63,65662 2,9200 4,3026 6,9646 9,92493 2,3534 3,1824 4,5407 5,84094 2,1318 2,7764 3,7469 4,60415 2,0150 2,5706 3,3649 4,03216 1,9432 2,4469 3,1427 3,70747 1,8946 2,3646 2,9979 3,49958 1,8595 2,3060 2,8965 3,35549 1,8331 2,2622 2,8214 3,249810 1,8125 2,2281 2,7638 3,169311 1,7959 2,2010 2,7181 3,105812 1,7823 2,1788 2,6810 3,054513 1,7709 2,1604 2,6503 3,012314 1,7613 2,1448 2,6245 2,976815 1,7531 2,1315 2,6025 2,946716 1,7459 2,1199 2,5835 2,920817 1,7396 2,1098 2,5669 2,898218 1,7341 2,1009 2,5524 2,878419 1,7291 2,0930 2,5395 2,860920 1,7247 2,0860 2,5280 2,845321 1,7207 2,0796 2,5177 2,831422 1,7171 2,0739 2,5083 2,818823 1,7139 2,0687 2,4999 2,807324 1,7109 2,0639 2,4922 2,796925 1,7081 2,0595 2,4851 2,787426 1,7056 2,0555 2,4786 2,778727 1,7033 2,0518 2,4727 2,770728 1,7011 2,0484 2,4671 2,763329 1,6991 2,0452 2,4620 2,756430 1,6973 2,0423 2,4573 2,750040 1,6839 2,0211 2,4233 2,704550 1,6759 2,0086 2,4033 2,677860 1,6706 2,0003 2,3901 2,660370 1,6669 1,9944 2,3808 2,647980 1,6641 1,9901 2,3739 2,638790 1,6620 1,9867 2,3685 2,6316100 1,6602 1,9840 2,3642 2,6259

Kapitola 5. (Popisná štatistika) – 12

Page 150: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.7: Tabuľka kvantilov pre F(n, k), δ=0,95.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,46 19,463 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 8,745 8,703 8,660 8,634 8,6174 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,912 5,858 5,803 5,769 5,7465 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,678 4,619 4,558 4,521 4,4966 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,000 3,938 3,874 3,835 3,8087 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,575 3,511 3,445 3,404 3,3768 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 3,284 3,218 3,150 3,108 3,0799 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,073 3,006 2,936 2,893 2,86410 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,913 2,845 2,774 2,730 2,70011 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 2,788 2,719 2,646 2,601 2,57012 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,687 2,617 2,544 2,498 2,46613 3,806 3,411 3,179 3,025 2,915 2,832 2,767 2,714 2,671 2,604 2,533 2,459 2,412 2,38014 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646 2,602 2,534 2,463 2,388 2,341 2,30815 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,475 2,403 2,328 2,280 2,24716 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,425 2,352 2,276 2,227 2,19417 3,592 3,197 2,965 2,810 2,699 2,614 2,548 2,494 2,450 2,381 2,308 2,230 2,181 2,14818 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456 2,412 2,342 2,269 2,191 2,141 2,10719 3,522 3,127 2,895 2,740 2,628 2,544 2,477 2,423 2,378 2,308 2,234 2,155 2,106 2,07120 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,278 2,203 2,124 2,074 2,03921 3,467 3,072 2,840 2,685 2,573 2,488 2,420 2,366 2,321 2,250 2,176 2,096 2,045 2,01022 3,443 3,049 2,817 2,661 2,549 2,464 2,397 2,342 2,297 2,226 2,151 2,071 2,020 1,98423 3,422 3,028 2,796 2,640 2,528 2,442 2,375 2,320 2,275 2,204 2,128 2,048 1,996 1,96124 3,403 3,009 2,776 2,621 2,508 2,423 2,355 2,300 2,255 2,183 2,108 2,027 1,975 1,93925 3,385 2,991 2,759 2,603 2,490 2,405 2,337 2,282 2,236 2,165 2,089 2,007 1,955 1,91926 3,369 2,975 2,743 2,587 2,474 2,388 2,321 2,265 2,220 2,148 2,072 1,990 1,938 1,90127 3,354 2,960 2,728 2,572 2,459 2,373 2,305 2,250 2,204 2,132 2,056 1,974 1,921 1,88428 3,340 2,947 2,714 2,558 2,445 2,359 2,291 2,236 2,190 2,118 2,041 1,959 1,906 1,86929 3,328 2,934 2,701 2,545 2,432 2,346 2,278 2,223 2,177 2,104 2,027 1,945 1,891 1,85430 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211 2,165 2,092 2,015 1,932 1,878 1,841

Kapitola 5. (Popisná štatistika) – 13

Page 151: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.8: Tabuľka kvantilov pre F(n, k), δ=0,975.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,463 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,084 10,64 9,979 9,605 9,364 9,197 9,074 8,980 8,905 8,844 8,751 8,657 8,560 8,501 8,4615 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,525 6,428 6,329 6,268 6,2276 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,366 5,269 5,168 5,107 5,0657 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,666 4,568 4,467 4,405 4,3628 6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,200 4,101 3,999 3,937 3,8949 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,868 3,769 3,667 3,604 3,56010 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,621 3,522 3,419 3,355 3,31111 5,256 4,630 4,275 4,044 3,881 3,759 3,664 3,588 3,526 3,430 3,330 3,226 3,162 3,11812 5,096 4,474 4,121 3,891 3,728 3,607 3,512 3,436 3,374 3,277 3,177 3,073 3,008 2,96313 4,965 4,347 3,996 3,767 3,604 3,483 3,388 3,312 3,250 3,153 3,053 2,948 2,882 2,83714 4,857 4,242 3,892 3,663 3,501 3,380 3,285 3,209 3,147 3,050 2,949 2,844 2,778 2,73215 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 2,963 2,862 2,756 2,689 2,64416 4,687 4,077 3,729 3,502 3,341 3,219 3,125 3,049 2,986 2,889 2,788 2,681 2,614 2,56817 4,619 4,011 3,665 3,438 3,277 3,156 3,061 2,985 2,922 2,825 2,723 2,616 2,548 2,50218 4,560 3,954 3,608 3,382 3,221 3,100 3,005 2,929 2,866 2,769 2,667 2,559 2,491 2,44519 4,508 3,903 3,559 3,333 3,172 3,051 2,956 2,880 2,817 2,720 2,617 2,509 2,441 2,39420 4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,676 2,573 2,464 2,396 2,34921 4,420 3,819 3,475 3,250 3,090 2,969 2,874 2,798 2,735 2,637 2,534 2,425 2,356 2,30822 4,383 3,783 3,440 3,215 3,055 2,934 2,839 2,763 2,700 2,602 2,498 2,389 2,320 2,27223 4,349 3,750 3,408 3,183 3,023 2,902 2,808 2,731 2,668 2,570 2,466 2,357 2,287 2,23924 4,319 3,721 3,379 3,155 2,995 2,874 2,779 2,703 2,640 2,541 2,437 2,327 2,257 2,20925 4,291 3,694 3,353 3,129 2,969 2,848 2,753 2,677 2,613 2,515 2,411 2,300 2,230 2,18226 4,265 3,670 3,329 3,105 2,945 2,824 2,729 2,653 2,590 2,491 2,387 2,276 2,205 2,15727 4,242 3,647 3,307 3,083 2,923 2,802 2,707 2,631 2,568 2,469 2,364 2,253 2,183 2,13328 4,221 3,626 3,286 3,063 2,903 2,782 2,687 2,611 2,547 2,448 2,344 2,232 2,161 2,11229 4,201 3,607 3,267 3,044 2,884 2,763 2,669 2,592 2,529 2,430 2,325 2,213 2,142 2,09230 4,182 3,589 3,250 3,026 2,867 2,746 2,651 2,575 2,511 2,412 2,307 2,195 2,124 2,074

Kapitola 5. (Popisná štatistika) – 14

Page 152: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.9: Tabuľka kvantilov pre F(n, k), δ=0,99.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,473 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,58 26,504 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,91 13,845 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,888 9,722 9,553 9,449 9,3796 10,93 9,780 9,148 8,746 8,466 8,260 8,102 7,976 7,874 7,718 7,559 7,396 7,296 7,2297 9,547 8,451 7,847 7,460 7,191 6,993 6,840 6,719 6,620 6,469 6,314 6,155 6,058 5,9928 8,649 7,591 7,006 6,632 6,371 6,178 6,029 5,911 5,814 5,667 5,515 5,359 5,263 5,1989 8,022 6,992 6,422 6,057 5,802 5,613 5,467 5,351 5,257 5,111 4,962 4,808 4,713 4,64910 7,559 6,552 5,994 5,636 5,386 5,200 5,057 4,942 4,849 4,706 4,558 4,405 4,311 4,24711 7,206 6,217 5,668 5,316 5,069 4,886 4,744 4,632 4,539 4,397 4,251 4,099 4,005 3,94112 6,927 5,953 5,412 5,064 4,821 4,640 4,499 4,388 4,296 4,155 4,010 3,858 3,765 3,70113 6,701 5,739 5,205 4,862 4,620 4,441 4,302 4,191 4,100 3,960 3,815 3,665 3,571 3,50714 6,515 5,564 5,035 4,695 4,456 4,278 4,140 4,030 3,939 3,800 3,656 3,505 3,412 3,34815 6,359 5,417 4,893 4,556 4,318 4,142 4,004 3,895 3,805 3,666 3,522 3,372 3,278 3,21416 6,226 5,292 4,773 4,437 4,202 4,026 3,890 3,780 3,691 3,553 3,409 3,259 3,165 3,10117 6,112 5,185 4,669 4,336 4,102 3,927 3,791 3,682 3,593 3,455 3,312 3,162 3,068 3,00318 6,013 5,092 4,579 4,248 4,015 3,841 3,705 3,597 3,508 3,371 3,227 3,077 2,983 2,91919 5,926 5,010 4,500 4,171 3,939 3,765 3,631 3,523 3,434 3,297 3,153 3,003 2,909 2,84420 5,849 4,938 4,431 4,103 3,871 3,699 3,564 3,457 3,368 3,231 3,088 2,938 2,843 2,77821 5,780 4,874 4,369 4,042 3,812 3,640 3,506 3,398 3,310 3,173 3,030 2,880 2,785 2,72022 5,719 4,817 4,313 3,988 3,758 3,587 3,453 3,346 3,258 3,121 2,978 2,827 2,733 2,66723 5,664 4,765 4,264 3,939 3,710 3,539 3,406 3,299 3,211 3,074 2,931 2,781 2,686 2,62024 5,614 4,718 4,218 3,895 3,667 3,496 3,363 3,256 3,168 3,032 2,889 2,738 2,643 2,57725 5,568 4,675 4,177 3,855 3,627 3,457 3,324 3,217 3,129 2,993 2,850 2,699 2,604 2,53826 5,526 4,637 4,140 3,818 3,591 3,421 3,288 3,182 3,094 2,958 2,815 2,664 2,569 2,50327 5,488 4,601 4,106 3,785 3,558 3,388 3,256 3,149 3,062 2,926 2,783 2,632 2,536 2,47028 5,453 4,568 4,074 3,754 3,528 3,358 3,226 3,120 3,032 2,896 2,753 2,602 2,506 2,44029 5,420 4,538 4,045 3,725 3,499 3,330 3,198 3,092 3,005 2,868 2,726 2,574 2,478 2,41230 5,390 4,510 4,018 3,699 3,473 3,304 3,173 3,067 2,979 2,843 2,700 2,549 2,453 2,386

Kapitola 5. (Popisná štatistika) – 15

Page 153: 14.Numericka matematika a amatematicka statistika

Tabuľka 5.10: Tabuľka kvantilov pre F(n, k), δ=0,995.Fδ(n,k) n

k 2 3 4 5 6 7 8 9 10 12 15 20 25 302 199,0 199,2 199,3 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4 199,5 199,5 199,53 49,80 47,47 46,19 45,39 44,84 44,43 44,13 43,88 43,69 43,39 43,08 42,78 42,59 42,474 26,28 24,26 23,15 22,46 21,97 21,62 21,35 21,14 20,97 20,70 20,44 20,17 20,00 19,895 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,38 13,15 12,90 12,76 12,666 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,03 9,814 9,589 9,451 9,3587 12,40 10,88 10,05 9,522 9,155 8,885 8,678 8,514 8,380 8,176 7,968 7,754 7,623 7,5348 11,04 9,596 8,805 8,302 7,952 7,694 7,496 7,339 7,211 7,015 6,814 6,608 6,482 6,3969 10,11 8,717 7,956 7,471 7,134 6,885 6,693 6,541 6,417 6,227 6,032 5,832 5,708 5,62510 9,427 8,081 7,343 6,872 6,545 6,302 6,116 5,968 5,847 5,661 5,471 5,274 5,153 5,07111 8,912 7,600 6,881 6,422 6,102 5,865 5,682 5,537 5,418 5,236 5,049 4,855 4,736 4,65412 8,510 7,226 6,521 6,071 5,757 5,525 5,345 5,202 5,085 4,906 4,721 4,530 4,412 4,33113 8,186 6,926 6,233 5,791 5,482 5,253 5,076 4,935 4,820 4,643 4,460 4,270 4,153 4,07314 7,922 6,680 5,998 5,562 5,257 5,031 4,857 4,717 4,603 4,428 4,247 4,059 3,942 3,86215 7,701 6,476 5,803 5,372 5,071 4,847 4,674 4,536 4,424 4,250 4,070 3,883 3,766 3,68716 7,514 6,303 5,638 5,212 4,913 4,692 4,521 4,384 4,272 4,099 3,920 3,734 3,618 3,53917 7,354 6,156 5,497 5,075 4,779 4,559 4,389 4,254 4,142 3,971 3,793 3,607 3,492 3,41218 7,215 6,028 5,375 4,956 4,663 4,445 4,276 4,141 4,030 3,860 3,683 3,498 3,382 3,30319 7,093 5,916 5,268 4,853 4,561 4,345 4,177 4,043 3,933 3,763 3,587 3,402 3,287 3,20820 6,986 5,818 5,174 4,762 4,472 4,257 4,090 3,956 3,847 3,678 3,502 3,318 3,203 3,12321 6,891 5,730 5,091 4,681 4,393 4,179 4,013 3,880 3,771 3,602 3,427 3,243 3,128 3,04922 6,806 5,652 5,017 4,609 4,322 4,109 3,944 3,812 3,703 3,535 3,360 3,176 3,061 2,98223 6,730 5,582 4,950 4,544 4,259 4,047 3,882 3,750 3,642 3,475 3,300 3,116 3,001 2,92224 6,661 5,519 4,890 4,486 4,202 3,991 3,826 3,695 3,587 3,420 3,246 3,062 2,947 2,86825 6,598 5,462 4,835 4,433 4,150 3,939 3,776 3,645 3,537 3,370 3,196 3,013 2,898 2,81926 6,541 5,409 4,785 4,384 4,103 3,893 3,730 3,599 3,492 3,325 3,151 2,968 2,853 2,77427 6,489 5,361 4,740 4,340 4,059 3,850 3,687 3,557 3,450 3,284 3,110 2,928 2,812 2,73328 6,440 5,317 4,698 4,300 4,020 3,811 3,649 3,519 3,412 3,246 3,073 2,890 2,775 2,69529 6,396 5,276 4,659 4,262 3,983 3,775 3,613 3,483 3,377 3,211 3,038 2,855 2,740 2,66030 6,355 5,239 4,623 4,228 3,949 3,742 3,580 3,450 3,344 3,179 3,006 2,823 2,708 2,628

Kapitola 5. (Popisná štatistika) – 16

Page 154: 14.Numericka matematika a amatematicka statistika

Aproximáciu požadovaného kvantilu dostaneme lineárnou interpoláciou týchto dvoch hodnôt

F0,99(13, 14) = F0,99(12, 14) +13− 12

15− 12(F0,99(15, 14)− F0,99(12, 14)) = 3,800 +

1

3(3,656− 3,800) = 3,752.

Ak by sme chceli lepší odhad použijeme viac hodnôt z tabuľky a interpoláciu polynómom vyššieho stupňa, avšak použitá jednoduchá interpolácia je voväčšine prípadov postačujúca.

Príklad 5.7 Odvoďme vzorec pre pχ2(n) pre n=1 a n=2.

Riešenie. Začneme s χ2(1). Podľa definície máme χ2(1)= (N (0, 1))2. Vypočítame pravdepodobnosť P(χ2(1)<x), čo je hodnota distribučnej funkcie,ktorú síce nepoznáme, ale s využitím hľadanej hustoty môžeme zapísať

P(χ2(1)<x) =

∫ x

−∞pχ2(1)(t)dt.

Teraz využijeme definíciu:P(χ2(1)<x) = P((N (0, 1))2<x) = P(−

√x<N (0, 1)<

√x),

pričom posledná rovnica platí iba pre kladné x. Pre záporné x je jasné, že druhá pravdepodobnosť je nulová a aj hustota pravdepodobnosti χ2(1) jenulová, lebo záporné hodnoty nemôžu byť nadobudnuté. Poslednú pravdepodobnosť spočítame využitím hustoty rozdelenia pravdepodobnosti N (0, 1), spoužitím symetrie normálneho rozdelenia a substitúcie t=

√v v integráli. Dostaneme

P(−√x<N (0, 1)<

√x) =

∫ √x−√x

pN (0,1)(t)dt = 2

∫ √x0

1√2π

e−t2

2 dt = 2

∫ x

0

1√2π

e−v2

1

2√v

dv =

∫ x

0

1√2Γ(12

)e−v2 v−

12 dv.

Porovnaním výsledného integrálu, predošlej rovnice a definície funkcie Θ vidíme, že

pχ2(1)(t) = Θ(t)1

212 Γ(12

)e−t2 t−

12 ,

čo je presne podľa vzťahu (5.3) s n=1.

Pre výpočet hustoty pravdepodobnosti s n=2 využijeme definíciu χ2(2)= (N (0, 1))21 + (N (0, 1))22 = (χ2(1))1 + (χ2(1))2 a vzorec pre výpočet hustotypravdepodobnosti súčtu dvoch nezávislých náhodných veličín odvodený v pr. 4.13

pχ2(2)(x) =

∫ +∞

−∞pχ2(1)(t)pχ2(1)(x− t)dt.

Kapitola 5. (Popisná štatistika) – 17

Page 155: 14.Numericka matematika a amatematicka statistika

Teraz treba spočítať integrál, v ktorom vieme, že pχ2(1)(t) je pre záporné t nulové. To znamená, že pre záporné x je celý integrál nulový. Pre kladné xdostaneme

pχ2(2)(x) =

∫ x

0

pχ2(1)(t)pχ2(1)(x− t)dt =

∫ x

0

[1

212 Γ(12

)e−t2 t−

12

][1

212 Γ(12

)e−x−t2 (x− t)−

12

]dt = e−

x2

1

∫ x

0

dt√t(x− t)

.

Posledný integrál vypočítame ∫ x

0

dt√t(x− t)

=

∫ x

0

dt√(x2

)2 − (t− x2

)2 =

∫ x2

−x2

dv√(x2

)2 − v2 =

[arcsin

2v

x

]x2

−x2

= π,

takže so súčasným uvážením nulovosti hustoty pre záporné x dostaneme

pχ2(2)(x) = Θ(x)e−x2

1

2ππ = Θ(x)

1

2e−

x2 .

Výsledný vzorec zodpovedá vzťahu (5.3) s n=2. Všimnime si tiež, že výsledná hustota je rovná hustote rozdelenia pravdepodobnosti náhodnej veličiny sexponenciálnym rozdelením a s parametrom δ=1

2.

Poznamenajme, že podobným spôsobom by sme vedeli vypočítať vzorec hustoty z (5.3) aj pre ďalšie n.

Všetky spomenuté rozdelenia pravdepodobnosti budeme využívať v štatistických výpočtoch. Pritom už z číselnej anaýzy štatistického súboru sa dáočakávať, kedy vznikne ktorý typ náhodnej veličiny. Začnime so základnými charakteristikami. Podľa tab. 5.5 máme vzorce na výberové charakteristikyspočítané z hodnôt štatistického súboru. Ak ich napíšeme ako vzťahy náhodných veličín ξi, dostaneme

ξ =1

n

n∑i=1

ξi, ξS2 =1

n− 1

n∑i=1

(ξi − ξ

)2.

Budeme predpokladať, ako vždy pri náhodnom výbere, že tieto náhodné veličiny sú nezávislé, ale naviac, že majú normálne rozdelenie, t. j. ξi∼N (m,σ2)alebo ξi−m

σ∼N (0, 1). Potom platí, že náhodné veličiny ξ a ξS2 sú nezávislé s nasledujúcimi rozdeleniami pravdepodobnosti

ξ ∼ N(m,

σ2

n

),

n− 1

σ2ξS2 ∼ χ2(n−1). (5.6)

Náhodnú veličinu ξ sme dostali ako lineárnu kombináciu ξi, takže časť tvrdenia o ξ súvisí s vlastnosťami normálneho rozdelenia a vlastnosťami strednejhodnoty a rozptylu. Naviac toto tvrdenie môžeme prepísať pomocou štandardného normálneho rozdelenia ako

ξ −mσ

√n ∼ N (0, 1). (5.7)

To, že náhodná veličina ξS2 súvisí s rozdelením χ2 je zrejmé z jej konštrukcie, otázkou však je stupeň voľnosti.

Kapitola 5. (Popisná štatistika) – 18

Page 156: 14.Numericka matematika a amatematicka statistika

Príklad 5.8 Vyjadrime náhodnú veličinu ξS2 ako náhodnú veličinu s χ2 rozdelením.

Riešenie. Výraz pre ξS2 násobíme faktorom n−1σ2 a upravíme podobne ako v pr. 5.3 tak, aby sme mohli použiť rovnicu (5.7)

n− 1

σ2ξS2 =

1

σ2

n∑i=1

(ξi − ξ

)2=

n∑i=1

(ξi − ξσ

)2

=n∑i=1

((ξi −m)−

(ξ −m

)2

=n∑i=1

(ξi −mσ

)2

− n(ξ −mσ

)2

=n∑i=1

(N (0, 1))2i − (N (0, 1))2 = χ2(n)− χ2(1) = χ2(n− 1)

Z čoho naozaj vidíme, že stupeň voľnosti v ξS2 je n−1.

V tejto súvislosti môžeme doplniť ďalšie dva zaujímavé vzťahy, ktoré budú pre nás užitočné. Pracujúc stále s n členným náhodným výberom, mánasledujúca výberová charakteristika T t rozdelenie

T (ξ1, ξ2, . . . ξn) =ξ −m√ξS2

√n ∼ t(n− 1). (5.8)

Ak máme ešte druhý výber η1, η2, . . . ηk nezávislých náhodných veličín z normálneho rozdelenia N (m′, σ2) (rovnaké σ), pre ktorý určíme η = 1k

∑ki=1 ηi,

ηS2 = 1k−1∑k

i=1 (ηi − η)2, tak nasledujúca výberová charakteristika T má F rozdelenie

T (ξ1, ξ2, . . . ξn, η1, η2, . . . ηk) =ξS2

ηS2

∼ F(n− 1, k − 1). (5.9)

Ak chápeme výberovú charakteristiku ako číselnú hodnotu a za ξi, resp. ηi dosadíme hodnoty xi, resp. yi zo štatistického súboru, dajú vzťahy (5.8)a (5.9) nasledujúce číselné vyjadrenie

T (x1, x2, . . . xn) =x−mSn−1

√n, T (x1, x2, . . . xn, y1, y2, . . . yk) =

S2n−1(x)

S2k−1(y)

ktoré sú potom hodnotami náhodných veličín s príslušným t resp. F rozdelením.

Kapitola 5. (Popisná štatistika) – 19

Page 157: 14.Numericka matematika a amatematicka statistika

Samohodnotiace otázky a úlohy na samostatné riešenie

1. Viete použiť pojmy náhodného výberu, štatistického súboru, či základného súboru na konkrétnom experimentálnom meraní z vašej oblasti?

2. Ak pri meraní sledujeme viac znakov a skúmame ich závislosť, údaje obyčajne zapisujeme do kontingenčnej tabuľky, čo je vlastne dvojrozmernáfrekvenčná tabuľka. Nájdete príklad jej využitia? Skúste ju zostaviť.

3. Aký graf bude zodpovedať kontingenčnej tabuľke?

4. Aké iné grafické zobrazenie experimentálnych údajov navrhujete zostrojiť?

5. Navrhnete aj iné číslené charakteristiky výberu ako sme uviedli? Kde sa môžu použiť? Aké rozdelenie pravdepodobnosti im prislúcha za predpokladunormality výberu?

6. Viete pokračovať v riešení pr. 5.7 pre vyššie n? Prípadne odvodiť vzorce (5.4) alebo (5.5) z definície?

7. Dokážete matematicky zdôvodniť vzťahy (5.8) a (5.9)?

V úlohách 1. až 5. urobte číselnú a grafickú analýzu nameraných údajov, t. j. vypočítajte výberové charakteristiky, navrhnite triedenie nameraných údajova pripravte frekvenčnú tabuľku, znázornite histogram a empirickú distribučnú funkciu.

1. Meranie koncentrácie ozónu v zvolenej lokalite v priebehu letných prázdnin niekoľkých rokov.

3,5 1,4 6,6 6,0 4,2 4,4 5,3 5,6 6,8 2,5 5.4 4.4 5.44,7 3,5 4,0 2,4 3,0 5,6 4,7 6,5 3,0 4,1 3.4 6.8 1.75,3 4,7 7,4 6,0 6,7 11,7 5,5 1,1 5,1 5,6 5.5 1.4 3.96,6 6,2 7,5 6,2 6,0 5,8 2,8 6,1 4,1 5,7 5.8 3.1 5.81,6 2,5 8,1 6,6 9,4 3,4 5,8 7,6 1,4 3,7 2.0 3.7 6.83,1 4,7 3,8 5,9 3,3 6,2 7,6 6,6 4,4 5,7 4.5 3.7 9.4

.

Kapitola 5. (Popisná štatistika) – 20

Page 158: 14.Numericka matematika a amatematicka statistika

2. Meranie úrovne hluku dopravy na križovatke v dB.

64,6 55,8 58,9 60,0 67,1 56,4 60,8 62,0 64.9 77.162,1 52,0 56,7 59,4 65,7 55,9 60,2 61,0 63.8 67.963,1 55,7 57,6 59,8 67,0 54,4 60,6 61,8 64.8 69.462,7 54,5 57,0 59,0 66,8 56,2 60,5 61,7 64.6 68.962,6 54,4 56,8 59,4 66,2 55,9 60,3 61,4 64.0 68.2

.

3. Meranie prietoku vody v potoku v m3s−1.

0,381 0,800 0,291 0,686 0,437 1,029 0,230 0,634 0,399 0,840 0,334 0,751 0,464 1,164 0,181 0,534 0,504 1,647 0,5040,390 0,819 0,300 0,740 0,441 1,084 0,248 0,634 0,414 0,853 0,348 0,771 0,476 1,303 0,209 0,558 0,414 0,921 0,3610,173 0,510 0,361 0,783 0,254 0,634 0,418 0,974 0,217 0,577 0,390 0,822 0,300 0,740 0,443 1,134 1,601 0,254 0,6340,181 0,520 0,372 0,783 0,274 0,660 0,424 0,976 0,230 0,625 0,399 0,840 0,318 0,746 0,455 1,157 0,772 0,488 1,514

.

4. Zisťovanie medze pevnosti materiálu, hodnoty v MPa.

14,40 16,40 15,00 16,54 15,40 16,50 15,90 17,35 14,78 16,00 15,30 16,1014,51 16,42 15,98 17,10 15,20 16,48 15,94 16,90 15,50 16,64 14,41 17,5414,48 15,64 15,07 15,80 14,61 16,04 15,09 16,25 15,12 16,80 16,27 16,2814,35 15,60 15,90 16,42 14,70 16,50 15,50 16,30 14,50 15,63 15,90 16,3014,80 16,03 15,51 16,50 14,80 16,42 15,81 17,40 15,30 16,48 15,06 17,3314,81 15,90 15,40 16,12 14,80 16,40 15,80 16,36 15,92 15,70 16,50 16,74

.

5. Počet výpadkov počítačovej siete v univerzitnom výpočtovom centre za týždeň.

0 0 2 0 0 0 3 3 0 0 1 8 5 00 4 3 0 6 2 0 3 1 1 0 1 0 11 0 2 2 0 0 0 1 2 1 2 0 0 16 4 3 3 1 2 4 0 0 3 1 2 0 00 0 0 1 1 0 2 0 2 4 4 0 2 2

Kapitola 5. (Popisná štatistika) – 21

Page 159: 14.Numericka matematika a amatematicka statistika

.

Záver

V kapitole sme sa naučili správne používať základné termíny štatistiky a pochopili sme ich význam. Naučili sme sa zaznamenať údaje do prehľadných aúčelných tabuliek. Z tabuliek vieme získať prehľadnú informáciu o tabuľkových údajoch pomocou číselných charakteristík vyjadrujúcich niektoré špeciálnevlastnosti týchto sád hodnôt a tiež sme si vysvetlili, ako vytvoriť obrázky z grafmi, ktoré popisujú charakter údajov. Získané číselné charakteristiky smedali do súvislosti s teóriou pravdepodobnosti, a vieme tak na jej základe vyhodnotiť mieru a charakter náhodnosti v štatistických údajoch. Naviac smesa naučili rozlíšiť typy základných náhodných veličín, ktoré sú používané v štatistike a rozumieť ich charakteristikám.

Literatúra

[1] C. Török. Úvod do teórie pravdepodobnosti a matematickej štatistiky. TU Košice, 1992.

[2] M. Kalina et al. Základy pravdepodobnosti a matematickej štatistiky. STU Bratislava, 2010.

[3] J. Hendl. Přehled statistických metod spracování dat. Portál, Praha, 2004.

Riešenia úloh

Odpovede na samohodnotiace otázky, ak ich neviete sformulovať, a aj mnohé iné odpovede nájdete v odporúčanej literatúre.

1. Sn−1=2,0026, x=4,9744,M=5,3,Q1=3,55,Q3=6,175 2. Sn−1=4,8868, x=61,352,M=60,9,Q1=57,15,Q3=64,6 3. Sn−1=0,3356, x=0,6059,M=0,507, Q1=0,3693, Q3=0,783 4. Sn−1=0,8047, x=15,8226, M=15,9, Q1=15,18, Q3=16,42 5. Sn−1=1,7588, x=1,4714, M=1, Q1=0,Q3=2

Kapitola 5. (Popisná štatistika) – 22

Page 160: 14.Numericka matematika a amatematicka statistika

Kapitola 7. (Korelácia a regresia)

Poslanie

Načrtnúť základné postupy pri zisťovaní väzieb a závislostí medzi meranými údajmi.

Ciele

1. Naučiť sa odhaliť existenciu závislosti meraných hodnôt v párovom náhodnom výbere.

2. Pochopiť rozdiel medzi koreláciou a regresiou.

3. Porozumieť postupu pre určenie parametrov lineárnej regresnej závislosti pomocou metódy najmenších štvorcov.

4. Získať vedomosti o testovaní parametrov regresnej závislosti a o intervaloch spoľahlivosti pre ne.

5. Naučiť sa používať regresiu pre jednoduché typy nelineárnych závislostí.

Prerekvizičné znalosti

náhodná veličina; charakteristiky náhodných veličín; štatistické testy; metóda najmenších štvorcov

Kapitola 7. (Korelácia a regresia) – 1

Page 161: 14.Numericka matematika a amatematicka statistika

Úvod

Praktické problémy často vedú k úlohám, v ktorých je potrebné zistiť, či medzi danými hodnotami, napr. fyzikálnych veličín, existuje nejaká súvislosť,prípadne aj aká táto súvislosť je. V kapitole sa venujeme dôležitej oblasti matematickej štatistiky, ktorá práve zisťuje a vyhodnocuje väzby a závislostimedzi meranými hodnotami.

V prvom rade nám pôjde stanovenie obyčajného faktu, že súvislosť existuje. Obmedzíme sa na overenie existencie lineárnej závislosti medzi pozorovanýmihodnotami, ktorej hovoríme korelačná závislosť. Pritom nás bude zaujímať prípad vzťahu dvoch výberov. Tu je však potrebné zdôrazniť, že, tak ako vpredošlej kapitole, aj tu sa sústredíme najmä na prípad, keď štatistické súbory prislúchajú výberom z normálneho rozdelenia.

Pravda, ak máme štatisticky potvrdené, že medzi meranými hodnotami z nášho experimentu existuje istá súvislosť, častokrát potrebujeme vedieť viac otejto súvislosti. A tak príde v druhej časti kapitoly na rad regresia, pričom v rámci tohto kurzu sa sústredíme na lineárnu regresiu. Pomocou vhodnýchnástrojov vieme určiť, alebo odhadnúť na základe meraných hodnôt, ako táto závislosť vyzerá. Regresia nám však vie ponúknuť aj viac, napr. vyhodnotiťpomocou štatistického testu, či závislosť, ktorú sme zistili experimentom je v súlade s nejakou normou, prípadne do akej miery sa od nej odlišuje.

Nakoniec v závere si ukážeme, ako použiť regresiu v niektorých prípadoch, keď lineárna závislosť medzi experimentálnymi hodnotami neexistuje alebo nieje príliš významná. Najlepším príkladom nelineárnej závislosti, ktorá je vo fyzike bežná je závislosť exponenciálna a je dobré vedieť ju nejako identifikovaťa určiť. A to platí aj o iných bežných typoch jednoduchých závislostí.

Korelácia a regresia – Korelačná analýza

Potvrďme alebo vyvráťme existenciu väzby medzi sledovanými premennými.

Korelačná analýza skúma existenciu väzby. Na vyjadrenie stupňa korelácie budeme používať Pearsonov výberový koeficient korelácie.

Nech je daný párový štatistický súbor hodnôt (x1, y1), (x2, y2), . . . , (xn, yn), zodpovedajúci výberu pre páry náhodných veličín (ξi, ηi). Pearsonov výberovýkoeficient korelácie r je definovaný vzťahom

r =

∑ni=1

(xi − X

) (yi − Y

)√∑ni=1

(xi − X

)2∑ni=1

(yi − Y

)2 =

∑ni=1 xiyi − nXY√(∑n

i=1 x2i − nX2

) (∑ni=1 y

2i − nY 2

) . (7.1)

Táto výberová charakteristika je nestranným odhadom koeficientu korelácie ρ náhodných veličín ξ a η a použivame ju na testovanie hypotéz o tomtoparametri. Podobne ako ρ aj výberový koeficient korelácie je vždy medzi -1 a 1, pričom číselná hodnota vyjadruje silu lineárnej závislosti a znamienkoindikuje sklon závislosti: kladné pre rastúcu závislosť, záporné pre klesajúcu závislosť. A takisto lineárna transformácie údajov nezmení koeficient korelácie,

Kapitola 7. (Korelácia a regresia) – 2

Page 162: 14.Numericka matematika a amatematicka statistika

teda ak hodnoty xi zmeníme na a+bxi a yi na c+dyi, pričom znamienka b a d sú rovnaké, tak r sa nezmení. Hodnota r=0 prislúcha stavu nekorelovanýchhodnôt — neexistuje medzi nimi lineárna závislosť. To však neznamená, že neexistuje iný typ závislosti. Pekne to dokumentuje obr. 7.1, kde hodnoty rblízke k +1 alebo -1 zodpovedajú meraným hodnotám zoskupeným tesne okolo niektorej priamky, napr. r=0,9 alebo r=−0,9. Pri stredných hodnotách r,napr. r=0,5 alebo r=−0,5, je lineárny tend v údajoch ešte badateľný, avšak pre r≈0 sú buď údaje náhodne rozptýlené, alebo tiež môžu byť zhormaždenéokolo grafu inej funkcie, v ktorej je lineárny trend zanedbateľný, ako to je na spodnom prostrednom grafe.

r=0,9

r=0,5

r=0,0 r=−0,5

r=−0,9r=0,0

Obr. 7.1: Pearsonov výberový koeficient korelácie a miera rozptýlenia hodnôt

V praxi sa používajú aj iné typy korelačných koeficientov ako Pearsonov, avšak v tomto kurze sa nimi nebudeme zaoberať. Pearsonov koeficient mávýhodu v prípade, že výbery, ktoré máme k dispozícii pochádzajú z normálneho rozdelenia. Vtedy totiž vieme zostaviť jednoduchý test o významnostikoeficientu korelácie ρ, pomocou jeho výberového bodového odhadu. V tomto teste testujeme hypotézu H0:ρ=0 oproti hypotéze H1:ρ6=0. V prípadezamietnutia hypotézy H0 potom hovoríme, že koeficient korelácie je významný, a teda existuje štatisticky významná závislosť medzi náhodnými veličinamiξ a η. V opačnom prípade je koeficient štatisticky nevýznamný a so štatistického hľadiska sa nemá zmysel zapodievať lineárnou závislosťou ξ a η.

Ak je daný párový štatistický súbor hodnôt (x1, y1), (x2, y2), . . . , (xn, yn), zodpovedajúci výberu pre páry náhodných veličín (ξi, ηi) s normálnymrozdelením, tak test pre vyššie spomenuté hypotézy na hladine významnosti α je určený nasledujúcou testovacou štatistikou T a kritickým oborom K:

T =

√n− 2 |r|√1− r2

, K : T > t1−α2(n− 2). (7.2)

Je to teda t test, ktorý súvisí s tým, že T má t rozdelenie, viď tiež tab. 6.2.

Kapitola 7. (Korelácia a regresia) – 3

Page 163: 14.Numericka matematika a amatematicka statistika

Príklad 7.1 Tlakovou skúškou sa zisťovala závislosť napätia τ od deformácie ∆l v íle, namerané hodnoty sú v tabuľke. Otestujme na hladine významnostiα=0,05 (lineárnu) nezávislosť τ a ∆l.

∆l [mm] 0,003 0,006 0,010 0,015 0,025 0,050 0,075 0,100 0,125 0,150 0,175 0,200τ [MPa] 0,128 0,231 0,312 0,377 0,439 0,542 0,621 0,653 0,688 0,719 0,750 0,767

Riešenie. Nájdeme charakteristiky výberu, potrebné na použitie vzťahu (7.1) a označíme xi=∆li a yi=τi, takže dostaneme

X = 0,0778, Y = 0,5189, Sn−1(x) = 0,0708, Sn−1(y) = 0,2169,n∑i=1

xiyi = 0,6390.

Pri počítaní obvykle používame druhý vzorec v (7.1) a v menovateli môžeme použiť smerodajné odchýlky, dostaneme

r =0,6390− 12 · 0,0778 · 0,5189

(12− 1) · 0,0708 · 0,2169= 0,9133.

Otestujeme hypotézu H0:ρ=0 oproti hypotéze H1:ρ6=0. Hodnota testovacej štatistiky a potrebný kvantil t rozdelenia zo vzťahu (7.2) sú

T =

√12− 20,9133√1− 0,91332

= 7,0896, t0,975(10) = 2,228,

a keďže 7,0896>2,228, hypotézu H0 zamietame, čo značí, že závislosť medzi napätím a deformáciou je významná.

Korelácia a regresia – Lineárna regresia

Určme tvar lineárnej závislosti medzi sledovanými premennými.

Koreláciou sme zisťovali iba existenciu závislosti, teraz nám pôjde o tvar tejto závislosti.

Nech náhodná veličina η závisí od nenáhodnej premennej x lineárne, čo je určené vzťahom

η = ax+ b+ ε, (7.3)

kde ε je náhodná veličina s nulovou strednou hodnotou a nenulovým rozptylom. Definovanie takejto náhodnej premennej vo vzťahu medzi dvomafyzikálnymi veličinami môže byť spôsobené napr. tým, že meranie veličiny η je nepresné, teda výsledok je náhodný, alebo aj tým že samotná závislosť jenáhodná. Takýto vzťah nazývame lineárny regresný model a parametre a, b regresnými koeficientmi.

Kapitola 7. (Korelácia a regresia) – 4

Page 164: 14.Numericka matematika a amatematicka statistika

Cieľom lineárnej regresnej analýzy je určiť regresné koeficienty a, b, či skôr ich odhady a, b pomocou párových meraní (x1, y1), (x2, y2), . . . , (xn, yn),kde yi sú hodnoty náhodnej veličiny η na štatistickom súbore ηi. Okrem toho v lineárnej regresii viem otestovať vhodnosť modelu, očakávané hodnotyregresných koeficientov, prípadne nájsť intervaly spoľahlivosti pre ne.

Na určenie odhadov regresných koeficientov sa používajú rôzne metódy, jednou z nich je metóda najmenších štvorcov, ktorú dôverne poznáme. Nájdeme

xi

yiyi

yi = axi + b

Obr. 7.2: Lineárna regesia a metóda najmenších štvorcov

regresnú priamku y=ax+ b, viď obr. 7.2, ktorá je najlepšia v zmysle tejto metódy, to znamená že minimalizuje funkciu S=S(a, b)

S(a, b) =n∑i=1

(yi − axi − b)2 ,[a, b]

= argmin[a,b]∈R2 S(a, b) (7.4)

Táto minimalizácia vedie na riešenie sústavy

a

n∑i=1

x2i + b

n∑i=1

xi =n∑i=1

xiyi

an∑i=1

xi + b n =n∑i=1

yi

(7.5)

ktorú nazývame normálna sústava. Hľadané riešenie, teda odhady parametrov metódou najmenších štvorcov, môžeme vyjadriť v tvare

a =r Sn−1 ySn−1x

, b = Y − aX (7.6)

kde sme použili štandardné označenie pre známe výberové charakteristiky.

Kapitola 7. (Korelácia a regresia) – 5

Page 165: 14.Numericka matematika a amatematicka statistika

Príklad 7.2 Ukážme, že a a b v rovnici (7.6) určujú minimum funkcie S=S(a, b) v (7.4).

Riešenie. Minimum funkcie S nájdeme pomocou diferenciálho počtu. Podmienky pre stacionárny bod sú

0 = S ′a = 2n∑i=1

(yi − axi − b) (−xi), 0 = S ′b = 2n∑i=1

(yi − axi − b) (−1),

čo po malej úprave dá presne sústavu (7.5). Druhý vzťah v (7.6) plynie rovno z druhej rovnice (7.5) po delení n. Hodnotu a nájdeme pomocou Cramerovhopravidla

D =

∣∣∣∣∣∣∣n∑i=1

x2in∑i=1

xin∑i=1

xi n

∣∣∣∣∣∣∣ = nn∑i=1

x2i − n2(X)2, Da =

∣∣∣∣∣∣∣n∑i=1

xiyin∑i=1

xin∑i=1

yi n

∣∣∣∣∣∣∣ = nn∑i=1

xiyi − n2XY ,

a =Da

D=

n∑i=1

xiyi − nXYn∑i=1

x2i − n(X)2 =

r(n− 1)Sn−1 ySn−1x(n− 1)S2

n−1x=r Sn−1 ySn−1x

.

Nakoniec ešte overme pomocou druhej derivácie, že toto riešenie je naozaj minimom. Dostaneme

S ′′aa = 2n∑i=1

x2i , S ′′bb = 2n, S ′′ab = 2n∑i=1

xi,

a keďže S ′′bb>0 (n>0) a S ′′aaS′′bb − (S ′′ab)

2>0 (4n∑n

i=1 x2i − 4 (

∑ni=1 xi)

2>0), riešenie je naozaj minimom S.

Posledná nerovnosť je dôsledkom známej nerovnice medzi kvardratickým xK a aritmetickým xA=X priemerom

xK ≥ xA, kde x2K =1

n

n∑i=1

x2i ,

pričom rovnosť platí iba v prípade, že všetky xi sú navzájom rovnaké.

Minimum S(a, b) sa obyčajne označuje SE a nazýva súčet chyby. Pre tento súčet platí nasledujúci základný vzťah lieárnej regresie

n∑i=1

(yi − Y

)2=

n∑i=1

(yi − yi)2 +n∑i=1

(yi − Y

)2, (7.7)

Kapitola 7. (Korelácia a regresia) – 6

Page 166: 14.Numericka matematika a amatematicka statistika

pomocou ktorého vieme vyjadriť súčet chyby v hodnotách iných výberových charakteristík: SE=(n−1)(S2n−1 y−S2

n−1xa2). Základný vzťah sa zapisuje

vo forme ST=SE+SM , ktorá okrem SE zavádza aj celkový súčet ST , ľavá strana (7.7), a súčet modelu SM , druhý člen na pravej strane (7.7). Jedobré vidieť, že celkový súčet nazávisí od regresného modelu a súčet modelu popisuje odchýlky v regresnom modeli. Člen SE tak vyjadruje odchýlkynevysvetlené modelom, ale náhodnou veličinou ε a tie sú pre daný model minimálne. Spoľahlivosť regresného modelu je teda určená pomerom SM

STa

číselne sa rovná druhej mocnine Pearsonovho výberového koeficientu korelácie.

Príklad 7.3 Ukážme vzťah r2=SMST

.

Riešenie. Podľa vzťahu (7.6) platí

SM =n∑i=1

(yi − Y

)2=

n∑i=1

(axi + b− aX − b

)2= a2(n− 1)S2

n−1x

a tak rovnica (7.7) a definícia ST=(n−1)S2n−1 y spolu s (7.6) dajú

SM

ST=a2(n− 1)S2

n−1x

(n− 1)S2n−1 y

=

(r Sn−1 ySn−1x

)2 S2n−1x

S2n−1 y

= r2.

Predpokladajme teraz, že náhodná veličina ε vo vzťahu (7.3) má normálne rozdelenie ε∼N (0, σ2), čo je vcelku bežný predpoklad, ak ε interpretujechybu merania pre η v závislosti od x. Vtedy môžeme tiež písať pre náhodný výber ηi

ηi ∼ N(axi + b, σ2

), η ∼ N

(aX + b,

1

nσ2

)(7.8)

a v závislosti nám teda pribudne ďalší parameter, charkterizujúci chybu, σ2. Tieto predpoklady nám umožňujú uvažovať o odhadoch a a b regresnýchparametrov a a b ako o náhodných veličinách s normálnym rozdelením a o SE ako o náhodnej veličine s rozdelením χ2. Platí

a ∼ N(a,

σ2

(n− 1)S2n−1x

), b ∼ N

(b, σ2

(1

n+

X2

(n− 1)S2n−1x

)),

SE

σ2∼ χ2(n− 2), (7.9)

a tak a je nestranný odhad parametra a, b je nestranný odhad parametra b a SEn−2 je nestranný odhad parametra σ2.

Kapitola 7. (Korelácia a regresia) – 7

Page 167: 14.Numericka matematika a amatematicka statistika

Príklad 7.4 Ukážme platnosť vzťahov (7.9) a nestrannosť odhadov

Riešenie. Podľa vzťahu (7.6) môžeme písať

a =

∑ni=1(xi − X)(ηi − η)∑n

i=1(xi − X)2=

n∑i=1

(xi − X)∑ni=1(xi − X)2

(ηi − η) ==n∑i=1

(xi − X)∑ni=1(xi − X)2

ηi.

Keďže ηi sú nezávislé a tvoria výber z normálneho rozdelenia, aj ich kombinácia bude mať normálne rozdelenie a platí

Ea = E

(n∑i=1

(xi − X)∑ni=1(xi − X)2

ηi

)=

n∑i=1

(xi − X)∑ni=1(xi − X)2

Eηi =n∑i=1

(xi − X)∑ni=1(xi − X)2

(axi + b) = an∑i=1

(xi − X)xi∑ni=1(xi − X)2

= a,

Da = D

(n∑i=1

(xi − X)∑ni=1(xi − X)2

ηi

)=

n∑i=1

(xi − X)2(∑ni=1(xi − X)2

)2Dηi =n∑i=1

(xi − X)2(∑ni=1(xi − X)2

)2σ2 = σ2 1∑ni=1(xi − X)2

=σ2

(n− 1)S2n−1x

.

Z prvého vzťahu vyplýva nestrannosť odhadu a z oboch hodnoty parametrov normálneho rozdelenia v prvom vzťahu z (7.9).

Podobne dostaneme podľa vzťahu (7.6) aj charakteristiky b:

b = η − bX =n∑i=1

(1

n− (xi − X)X

(n− 1)S2n−1x

)ηi,

a to

Eb =n∑i=1

(1

n− (xi − X)X

(n− 1)S2n−1x

)Eηi =

n∑i=1

(1

n− (xi − X)X

(n− 1)S2n−1x

)(axi+b) = aX+b−a

n∑i=1

(xi − X)xiX

(n− 1)S2n−1x

−bXn∑i=1

(xi − X)X

(n− 1)S2n−1x

= aX+b−aX = b,

Db =n∑i=1

(1

n− (xi − X)X

(n− 1)S2n−1x

)2

Dηi = σ2

n∑i=1

(1

n2− 2

n

(xi − X)X

(n− 1)S2n−1x

+(xi − X)2X2

(n− 1)2S4n−1x

)= σ2

(1

n− 2

n

n∑i=1

(xi − X)X

(n− 1)S2n−1x

+n∑i=1

(xi − X)2X2

(n− 1)2S4n−1x

)

= σ2

(1

n+

X2

(n− 1)S2n−1x

).

Z prvého vzťahu vyplýva nestrannosť odhadu a z oboch hodnoty parametrov normálneho rozdelenia v druhom vzťahu z (7.9).

Kapitola 7. (Korelácia a regresia) – 8

Page 168: 14.Numericka matematika a amatematicka statistika

Venujme sa teraz poslednému zo vzťahov (7.9). Pre chybový súčet SE máme vzťah

SE=n∑i=1

(ηi − η)2 − (n−1)S2n−1xa

2.

Vsuňme do neho regresný model a dostaneme, využijúc pri úpravách vzťahy (7.6), (7.1),

SE =n∑i=1

((ηi − axi − b)− (η − aX − b)− (aX + b− axi − b)

)2 − a2(n−1)S2n−1x

=n∑i=1

(ηi−axi− b)2 +n(η−aX− b)2 +a2(n−1)S2n−1x−2

n∑i=1

(ηi−axi− b)(η−aX− b)−2an∑i=1

(ηi−axi− b− η+aX+ b)(X−xi)− a2(n−1)S2n−1x

=n∑i=1

(ηi − axi − b)2 − n(η − aX − b)2 − a2(n−1)S2n−1x + 2a

n∑i=1

(ηi − η)(xi − X)− a2(n−1)S2n−1x

=n∑i=1

(ηi − axi − b)2 − n(η − aX − b)2 − a2(n−1)S2n−1x + 2aa(n−1)S2

n−1x − a2(n−1)S2n−1x

=n∑i=1

(ηi − axi − b)2 − n(η − aX − b)2 − (a− a)2(n−1)S2n−1x,

takžen∑i=1

(ηi − axi − b

σ

)2

=SE

σ2+

(η − aX − b

σ√n

)2

+

(a− aσ√

n−1Sn−1 x

)2

.

Z definície rozdelenia χ2, prvého vzťahu (7.9) a (7.8) plynie(η − aX − b

σ√n

)2

∼ χ2(1),

(a− aσ√

n−1Sn−1 x

)2

∼ χ2(1),n∑i=1

(ηi − axi − b

σ

)2

∼ χ2(n),

čo (spolu s predpokladom o nezávisosti náhodných veličín SE, a a η) vedie k určeniu rozdelenia pre SE podľa tretieho vzťahu (7.9). Spočítajme ešte

Kapitola 7. (Korelácia a regresia) – 9

Page 169: 14.Numericka matematika a amatematicka statistika

strednú hodnotu

E(SE) =n∑i=1

E((ηi − axi − b)2

)− nE

((η − aX − b)2

)− (n−1)S2

n−1xE((a− a)2

)=

n∑i=1

Dηi − nDη − (n−1)S2n−1xDa = nσ2 − nσ

2

n− (n−1)S2

n−1xσ2

(n− 1)S2n−1x

= (n− 2)σ2,

takže nestranný odhad pre σ2 je SEn−2 .

Ak už poznáme charaktery náhodných veličín a a b, môžeme nájsť intervaly spoľahlivosti pre regresné parametre a a b, prípadne zostaviť testy pre overenieich hodnôt. Obe náhodné veličiny majú normálne rozdelenie, a tak pre intervaly spoľahlivosti použijeme tab. ??. Dvojstranné intervaly spoľahlivosti skoeficientom spoľahlivosti γ sú určené vzťahmi

a

(1− t 1+γ

2(n− 2)

√1− r2

r√n− 2

)<a < a

(1 + t 1+γ

2(n− 2)

√1− r2

r√n− 2

)

b− at 1+γ2

(n− 2)

√1− r2

r√n− 2

√√√√ n∑i=1

x2i

n<b < b+ at 1+γ

2(n− 2)

√1− r2

r√n− 2

√√√√ n∑i=1

x2i

n

(7.10)

Vychádzajúc z týchto intervalov spoľahlivosti, môžeme odvodiť testovacie štatistiky a hranice kritických oblastí pre testy, ktoré sú určené hypotézami

H0 : a = a0, H1 : a 6= a0, príp. H0 : b = b0, H1 : b 6= b0. (7.11)

Zvoliac hladinu významnosti α, dostaneme t testy určené nasledujúcimi charakteristikami (Ta pre test a, Tb pre test b):

Ta =

√(n− 2) r

a√

1− r2(a− a0), Ka : |Ta| > t1−α

2(n− 2),

Tb =

√(n− 2) r

a√

1− r2(b− b0)√

n∑i=1

x2i

n

, Kb : |Tb| > t1−α2(n− 2).

(7.12)

Pre odvodenie testovacích charakteristík sme použili vzťahy (7.9) a základné vzťahy štatistiky (5.6).

Kapitola 7. (Korelácia a regresia) – 10

Page 170: 14.Numericka matematika a amatematicka statistika

Príklad 7.5 Tlakovou skúškou sa zisťovala závislosť napätia τ od deformácie ∆l v íle, namerané hodnoty sú v tabuľke. V pr. 7.1 sme zistili štatistickyvýznamnú lineárnu závislosť τ a ∆l. Nájdime odhady parametrov lineárneho regresného modelu a určme intervaly spoľahlivosti pre tieto parametre skoeficientom spoľahlivosti γ=0,95.

∆l [mm] 0,003 0,006 0,010 0,015 0,025 0,050 0,075 0,100 0,125 0,150 0,175 0,200τ [MPa] 0,128 0,231 0,312 0,377 0,439 0,542 0,621 0,653 0,688 0,719 0,750 0,767

Riešenie. Pripomeňme si charakteristiky, ktoré sme vypočítali v pr. 7.1 (kde sme tiež použili označenie xi=∆li a yi=τi) a dopočítajme potrebnú sumu∑ni=1 x

2i

X = 0,0778, Y = 0,5189, Sn−1(x) = 0,0708, Sn−1(y) = 0,2169, r = 0,9133,n∑i=1

x2i = 0,1279.

Najprv nájdeme odhady parametrov metódou najmenších štvorcov pomocou vzťahov (7.6)

a =0,9133 · 0,2169

0,0708= 2,7971, b = 0,5189− 2,7971 · 0,0778 = 0,3012.

V tabuľke ?? nájdeme kvantil t rozdelenia na hladine 1+γ2

=0,975: t0,975(12− 2) = 2,228. Intervaly spoľahlivosti dostaneme zo vzťahov (7.10)

2,7971

(1− 2,228

√1− 0,91332

0,9133√

10

)<a < 2,7971

(1 + 2,228

√1− 0,91332

0,9133√

10

)2,7971− 0,3945 · 2,228 <a < 2,7971 + 0,3945 · 2,228

1,9180 <a < 3,6762,

0,3012− 2,7971 · 2,228

√1− 0,91332

0,9133√

10

√0,1279

12<b < 0,3012 + 2,7971 · 2,228

√1− 0,91332

0,9133√

10

√0,1279

12

0,3012− 0,3945 · 2,228 · 0,1032 <b < 0,3012 + 0,3945 · 2,228 · 0,1032

0,2105 <b < 0,3920.

Získané intervaly sú relatívne široké, lebo je r2=0,8341, takže asi 17% chýb tvoria odchýlky od lineárneho modelu, tie rozdiely vidno aj na obrázku 7.3,podľa ktorého tušíme, že lepšie bolo robiť iný regresný model ako lineárny. To však zatiaľ nevieme.

Kapitola 7. (Korelácia a regresia) – 11

Page 171: 14.Numericka matematika a amatematicka statistika

0

0,2

0,4

0,6

0,8

0 0,05 0,1 0,15 0,2

τ[M

Pa]

∆l [mm]

meraniea∆l+b

Obr. 7.3: Namerané hodnoty spolu s lineárnym regresným modelom.

Korelácia a regresia – Linearizovateľné regresné modely

Nie vždy sledované premenné vykazujú medzi sebou lineárnu závislosť

Nech body (xi, yi), i = 1, 2, . . . , n reprezentujú hodnoty merania veličiny η oproti hodnotám x a nech sa tieto body nachádzajú „v okolí grafu“ známejjednoduchej funkcie f a to tak, aby sa závislosť medzi hodnotami xi a yi dala vyjadriť funkciou f pomocou dvoch parametrov a, b

yi = f(xi; a, b). (7.13)

Súčasne budeme požadovať, aby sa takýto vzťah dal pomocou jednoduchých transformácií Xi=gx(xi) a Yi=gy(yi) linearizovať v transformovanýchparametroch A a B, teda aby sme dostali

Yi = gy(f(g−1x (Xi); a, b)

)⇒ Yi = AXi +B. (7.14)

V takom prípade hovoríme, že η = f(x; a, b; ε) je linearizovateľný regresný model, ktorý sme linearizovali modelom Υ = AX +B + ε.

Najčastejšie budeme používať transformácie pomocou logaritmických a mocninových funkcií, v ktorých gx(t)= ln t alebo gy(t)= ln t, prípadne gx(t)=tα

alebo gy(t)=tα pre vhodné α. Tabuľka 7.1 uvádza najčastejšie transformácie, ktorými sa linearizuje príslušný nelineárny regresný model.

Príklad 7.6 Transformujme mocninovú závislosť y=b xa na lineárnu

Riešenie. Logaritmujeme obe strany rovnosti a dostaneme

ln y = ln (b xa) = ln b+ a lnx,

Kapitola 7. (Korelácia a regresia) – 12

Page 172: 14.Numericka matematika a amatematicka statistika

Tabuľka 7.1: Linearizácia regresného modeluy=f(x;a,b) X=gx(x) a Y=gy(y) Transformovaný model

y = beax

y = b xa

y =1

ax+ b

y =1

(ax+ b)2

y = ln(ax+ b)

y = a lnx+ b

y = a√x+ b

Y = ln y, X = x

Y = ln y, X = lnx

Y =1

y, X = x

Y =1√y, X = x

Y = ey, X = x

Y = y, X = lnx

Y = y, X =√x

A = a, B = ln b

A = a, B = ln b

A = a, B = b

A = a, B = b

A = a, B = b

A = a, B = b

A = a, B = b

Y=AX

+B

takže ak položíme B= ln b a A=a, dostaneme závislosť Y=AX +B, kde Y= ln y a X= lnx, presne ako tvrdí druhý riadok transformácií v tabuľke 7.1.

Celý postup pri linearizácii regresného modelu zhrnieme v nasledujúcich bodoch:

A1. Nakreslíme a pospájame body (xi, yi)

B1. Vyberieme vhodnú závislosť y=f(x; a, b) a transformujeme údaje tak, aby Y = AX +B

C1. Vypočítame koeficient korelácie r pre transformované hodnoty Xi a Yi a otestujeme jeho významnosť

D1. Pre štatisticky významný r určíme lineárnou regresiou koeficienty A a B určujúce pôvodné parametre a, b, prípadne urobíme potrebný test čizistíme interval spoľahlivosti podľa vzťahov (7.10) až (7.12).

Vo fyzikálnych vzťahoch najčastejšie nachádzame exponenciálne, logaritmické a mocninové závislosti a niekedy je ťažké rozhodnúť, o ktorú v konkrétnomprípade ide. Graficky si vtedy vieme pomôcť logaritmickou mierkou niektorej z osí, ako ukazuje aj obrázok 7.4. Vidíme, že pri vhodnej voľbe logaritmickýchmierok osí je príslušná krivka funkcie transformovaná na priamku. Transformácie osí samozrejme zodpovedajú transformačným vzťahom v tabuľke 7.1.

Príklad 7.7 Tlakovou skúškou sa zisťovala závislosť napätia od deformácie v íle, namerané hodnoty sú v pr. 7.5. Nájdite vhodný nelineárny modelpre popísanie danej závislosti a určte jeho významnosť korelačným testom. Pre vybraný model nájdite regresnou analýzou parametre závislosti a určteintervaly spoľahlivosti pre ne. Koeficient spoľahlivosti zvoľte γ=0,99.

Kapitola 7. (Korelácia a regresia) – 13

Page 173: 14.Numericka matematika a amatematicka statistika

y

x

y = b xa

y = b eax

y = a lnx+ b

Y=

lny

X = lnx

Y = AX +B

Y=

lny

X = x

Y = AX +B

Y=y

X = lnx

Y = AX +B

(a) (b) (c) (d)

Obr. 7.4: Linearizácia a logaritmická mierka: (a) netransformované údaje, (b) mocninová závislosť, (c) exponenciálna závislosť, (d) logaritmická závislosť.

Riešenie. Lineárna regresia v pr. 7.5 neposkytla celkom dobrý model pre uvedenú závislosť, preto nájdeme vhodnejší model, najlepšie z obrázku. Zobrazmenamerané hodnoty spolu s možnými typmi kriviek, ktoré cez ne preložíme: mocninová τ=b (∆l)a, 0<a<1 a logaritmická τ=a ln ∆l+b, a>0, obr. 7.5. Zdá

0

0,2

0,4

0,6

0,8

0 0,05 0,1 0,15 0,2

τ[M

Pa]

∆l [mm]

meranieb∆la

a ln ∆l + b

Obr. 7.5: Namerané hodnoty spolu s odhadovanými typmi závislosti.

sa, že logaritmická funkcia lepšie vystihuje vzťah medzi veličinami, ale urobme číslené porovnanie vrámci korelačnej analýzy. Pre analýzu linearizovanýchvzťahov (v mocninovej závislosti ln τ= ln b+ a ln ∆l) potrebujeme logaritmy nameraných hodnôt

Kapitola 7. (Korelácia a regresia) – 14

Page 174: 14.Numericka matematika a amatematicka statistika

λ= ln ∆l −5,8091 −5,1160 −4,6052 −4,1997 −3,6889 −2,9957η= ln τ −2,0557 −1,4653 −1,1648 −0,9755 −0,8233 −0,6125

λ= ln ∆l −2,5903 −2,3026 −2,0794 −1,8971 −1,7430 −1,6094η= ln τ −0,4764 −0,4262 −0,3740 −0,3299 −0,2877 −0,2653

V mocninovom modeli existuje lineárna závislosť medzi λ a η, v logaritmickom medzi λ a τ . Vypočítajme príslušné výberové koeficienty korelácie (n=12)

λ = −3,2197, η = −0,7714, τ = 0,5189,12∑i=1

λ2i = 146,9097,12∑i=1

η2i = 10,5448,12∑i=1

τ 2i = 3,7488,

12∑i=1

λiηi = 38,3184,12∑i=1

λiτi = −16,6371,

rλτ =

∑12i=1 λiτi − 12λτ√(

12∑i=1

λ2i − 12λ2)(

12∑i=1

τ 2i − 12τ 2) =

−16,6371− 12 · (−3,2197) · 0,5189√(146,9097− 12(−3,2197)2)(3,7488− 12 · 0,51892)

= 0,9996,

rλη =

∑12i=1 λiηi − 12λη√(

12∑i=1

λ2i − 12λ2)(

12∑i=1

η2i − 12η2) =

38,3184− 12 · (−3,2197) · (−0,7714)√(146,9097− 12(−3,2197)2)(10,5448− 12(−0,7714)2)

= 0,9727.

Pri teste významnosti korelačného koeficientu, kde H0 : ρ=0, H1 : ρ 6=0, potrebujeme testovaciu štatistiku T=√n−2 r√1−r2 , ktorá nadobúda tieto hodnoty

Tλτ = 113,2308, Tλη = 13,2435.

V oboch prípadoch zamietame hypotézu H0 na hladine významnosti α=0,01, pretože t1−0,005(12−2) = 3,1692. Dokonca môžeme zvoliť aj α=10−6

a hypotézu H0 stále zamietame, lebo t1−0,5×10−6(12−2) = 10,5165. Pre α=10−7 však hypotézu H0 v mocninovom modeli nezamietame, keďžet1−0,5×10−7(12−2) = 13,4395, preto logaritmický model je významnejší.

Kapitola 7. (Korelácia a regresia) – 15

Page 175: 14.Numericka matematika a amatematicka statistika

Určme parametre logaritmického regresného modelu, v ktorom τ=aλ+b. Zostavme normálnu sústavu (7.5) pre určenie odhadov parametrov a a bmetódou najmenších štvorcov

12,2425a−3,2197b =−1,3864,

−3,2197a+ b = 0,5189,⇒

a = 0,1516,

b = 1,0070,

takže môžeme písať, viď obr. 7.6,τ.= 0,1516 ln ∆l + 1,0070.

0

0,2

0,4

0,6

0,8

0 0,05 0,1 0,15 0,2

τ[M

Pa]

∆l [mm]

meranie0,1516 ln ∆l + 1,0096

Obr. 7.6: Aproximácia nameraných hodnôt logaritmickou funkciou.

Intervaly spoľahlivosti pre parametre a, b sú

a

(1− t0,995(10)

Tλτ

)<a < a

(1 +

t0,995(10)

Tλτ

),

0,1516(1− 3,1692

113,230) <a < 0,1516(1 +

3,1692

113,230),

0,1473 <a < 0,1558,

b− a t0,995(10)

Tλτ

√√√√√ 12∑i=1

λ2i

12<b < b+ a

t0,995(10)

Tλτ

√√√√√ 12∑i=1

λ2i

12,

1,0070− 0,15163,1692

113,230

√12,2425 <b < 1,0070 + 0,1516

3,1692

113,230

√12,2425,

0,9921 <b < 1,0218.

Relatívne úzke intervaly spoľahlivosti svedčia o vhodnosti a efektívnosti logaritmického modelu.

Poznamenajme ešte, že z fyzikálneho hľadiska je problém s okolím nuly, kde je logaritmus neohraničený. V blízkosti nuly by bolo potrebné hľadať inýmodel. Obyčajne potom pre malé deformácie je vhodný lineárny model, ktorý sme použili v pr. 7.5, ale na overenie by sme potrebovali ďalšie meranie.

Kapitola 7. (Korelácia a regresia) – 16

Page 176: 14.Numericka matematika a amatematicka statistika

Samohodnotiace otázky a úlohy na samostatné riešenie

1. Viete zdôvodniť, prečo výberový koeficient korelácie je v intervale 〈−1;1〉?2. Dokážete základný vzťah lineárnej regresie (7.7)?

3. Akým testom by ste testovali pomer SM a SE?

4. Viete odvodiť intervaly spoľahlivosti pre regresné parametre zo vzťahov (7.10)? Napíšete aj vzťahy pre jednostranné intervaly spoľahlivosti?

5. Ako odvodíme testovacie štatistiky testov pre regresné parametre (7.12)?

6. Prečo požadujeme, aby transformačný vzťah (7.13) závisel od práve dvoch parametrov?

7. Zdôvodníte všetky transformácie v 7.1.

8. Pokúste sa nájsť aj iné linearizačné vzťahy pre iné nelineárne závislosti než tie, ktoré sú v tabuľke 7.1.

V úlohách 1. až 3. urobte test korelačnej závislosti a zistite požadované charakteristiky pomocou lineárnej regresie..

1. Skúšajúci R.V. chcel porovnať snahu študentov o dosiahnutie dobrých študijných výsledkov. Vybral preto náhodne osemnásť študentov a porovnalich výsledky z priebežného (PH) a záverečného hodnotenia (ZH), viď tabuľka, a navrhol model závislosti. Zistite, či na hladine významnosti α=0,05existuje významná lineárna závislosť medzi výsledkami študentov. Ak podľa očakávania existuje, nájdite koeficienty lineárneho regresného modelu anavrhnite test, so záveru ktorého bude vyplývať informácia o sklone regresnej priamky. Výsledok testu vyhodnoťte v zmysle prvej vety v tomto zadaní.

PH 16 16 17 17 17 17 18 18 19 22 23 23 24 25 25 26 27 29ZH 35 38 34 35 35 40 33 35 38 40 41 43 48 49 52 51 55 58 .

2. Experimentálne sme zisťovali závislosť rýchlosti chladenia tvárnej liatiny počas fázy tepelného spracovania. Zaznamenávali sme údaje o zmeneteploty liatiny ∆T a o počte ω častíc uhlíka v liatine, namerané hodnoty sú uvedené v tabuľke. Zistite na hladine testu α=0,05, či existuje štatistickyvýznamná lineárna závislosť medzi zmenou teploty a počtom častíc. Ak áno, nájdite dvojstranné intervaly spoľahlivosti pre parametre závislosti skoeficientom spoľahlivosti γ=1−α.

ω [mm−3] 345 238 345 311 338 304 276 338 254 276 344∆T [K] 45 20 65 30 55 30 45 65 30 45 55 .

Kapitola 7. (Korelácia a regresia) – 17

Page 177: 14.Numericka matematika a amatematicka statistika

3. Pri plánoch na výstavbu ďalších bazénov zisťovali v akvaparku závislosť doterajšej návštevnosti od počtu vybudovaných bazénov. V tabuľkesú uvedené priemerné týždenné návštevnosti N v tisícoch pri prevádzke s B vybudovanými bazénmi. Zistite na hladine testu α=0,05, či existuještatisticky významná lineárna závislosť medzi návštevnosťou a počtom bazénov. Ak áno, nájdite dvojstranné intervaly spoľahlivosti pre parametre závislostis koeficientom spoľahlivosti γ=1−α. Viete potom na základe získaných intervalov spoľahlivosti dať štatisticky relevantnú informáciu o očakávanejnávštevnosti pri dobudovaní ďalších dvoch bazénov?

N 2 3 5 7 8B 8 10 15 22 25

.

V úlohách 4. až 8. zistite významnosť navrhnutého modelu zavislosti medzi premennými, prípadne pred tým, ak nie je zadaný, odhadnite typ závislostimedzi meranými hodnotami. Podľa pokynov v jednotlivých úlohách vykonajte aj ďalšiu štatistickú analýzu..

4. Meraním boli zistené hodnoty normálových napätí τ v okolí vrcholu klinového razidla v závislosti na vzdialenosti X od neho, namerané hodnotysú v tabuľke. Zistite na hladine významnosti α=0,05, či existuje závislosť typu ’τ=a lnX+b’ medzi napätím a polohou. Ak existuje štatisticky významnázávislosť tohto typu, nájdite odhady jej parametrov a určte pre ne intervaly spoľahlivosti s koeficientom spoľahlivosti γ=1−α. Vyskúšajte aj iné typyzávislosti a rozhodnite, ktorý regresný model je najvhodnejší pre popísanie rozloženia napätia.

X [cm] 0,08 0,19 0,37 0,63 1,02 1,61 2,50 3,82 5,83 8,80 13,28τ [MPa] 10,29 9,25 8,29 7,53 6,83 6,18 5,54 4,92 4,32 3,70 3,08

.

5. Meraním boli zistené hodnoty šmykových napätí v závislosti na vzdialenosti od referenčného bodu, namerané hodnoty sú v tabuľke. Zistite nahladine významnosti α=0,05, či existuje závislosť typu ’τ=beaX ’ medzi napätím a polohou. Ak existuje štatisticky významná závislosť tohto typu, nájditeodhady jej parametrov a určte interval spoľahlivosti pre parameter a s koeficientom γ=1−α.

X [cm] 1,5 5 11 16 22 27 32 38τ [MPa] 0,1 1,6 2,2 2,6 3,0 3,1 3,2 3,2

.

Kapitola 7. (Korelácia a regresia) – 18

Page 178: 14.Numericka matematika a amatematicka statistika

6. Tlakom kvádra na podložku vznikajú na hrane kvádra normálové napätia τ , ktoré podľa lineárnej teórie pružnosti majú priebeh typu ’τ=bXa’ vzávislosti na vzdialenosti X od hrany. Teória tiež poskytuje hodnotu parametra a, ktorý je podľa nej v prípade rovnakých materiálov kvádra a podložkyrovný hodnote a=−0,226. Pri numerickom riešení metódou hraničných prvkov boli získané výsledky uvedené v tabuľke. Zistite na hladine významnostiα=0,01, či existuje významná závislosť uvedeného typu pre numerické údaje a ak áno, zostavte test, v ktorom na hladine významnosti α zistite, čihodnota parameter a odhadnutá z numerického riešenia protirečí jeho teoretickej hodnote.

X [mm] 0,01 0,02 0,04 0,08 0,16 0,32 0,63 1,25 2,5 5,0τ [MPa] 429,8 419,6 349,3 300,4 256,6 219,6 188,1 161,3 138,7 119,8

.

7. Webová stránka predajcu výpočtovej techniky uvádza vývoj ceny nového typu počítača v týždňových odstupoch, viď tabuľka. Zistite na hladinetestu α=0,05, či je možné tvrdiť, že cena exponenciálne klesá od uvedenia výrobku na trh. V kladnom prípade nájdite dvojstranné intervaly spľahlivostipre parametre exponenciálnej závislosti s koeficientom spoľahlivosti γ=1−α. Vyskúšajte aj iné typy závislosti a rozhodnite, ktorý je najvhodnejší prepopísanie daného cenového vývoja.

Týždeň 1 2 3 4 5 6 7 8 9 10 11 12Cena [e] 610 610 590 575 560 560 530 530 520 500 500 500

.

8. Pri hľadaní časovej závislosti teploty pri prenose tepla cez rozhranie boli v experimente namerané hodnoty uvedené v tabuľke. Zistite na hladinetestu α=0,05, či existuje štatisticky významná exponenciálna závislosť zmeny teploty ∆T od času t. Ak áno, nájdite dvojstranné intervaly spoľahlivostipre parametre závislosti s koeficientom spoľahlivosti γ=1−α.

t [h] 0,250 0,375 0,5 0,625 0,750 0,875 1,000∆T [K] 0,001 0,019 0,146 0,511 1,191 2,203 3,519

.

Kapitola 7. (Korelácia a regresia) – 19

Page 179: 14.Numericka matematika a amatematicka statistika

Záver

Ukázali sme si ako vyhodnocovať jednoduché závislosti medzi rôznymi veličinami pomocou metód matematickej štatistiky. Najprv sme našli charakteristiku,ktorá vypovedá o existencii lineárnej závislosti medzi veličinami. Tou charakteristikou je korelačný koeficient. V prípad potvrdenia existencie korelačnejzávislosti sme sa naučili túto závislosť kvantifikovať určením jej parametrov metódami lineárnej regresie. Keďže v praktických úlohách sa stretávame aj sinými ako lineárnymi závislosťami medzi skúmanými veličinami, ukázali sme si v poslednej časti kapitoly aj jednoduché prípady vyhodnotenia nelineárnychzávislostí z hľadiska štatistiky. Popísali sme postup pre linearizáciu nelineárneho vzťahu, a tak všetky typy závislostí, ktoré sa dajú týmto spôsobompreviesť na lineárnu, vieme tak isto vyhodnotiť pomocou korelácie a lineárnej regresie.

Literatúra

[1] C. Török. Úvod do teórie pravdepodobnosti a matematickej štatistiky. TU Košice, 1992.

[2] M. Kalina et al. Základy pravdepodobnosti a matematickej štatistiky. STU Bratislava, 2010.

[3] J. Hendl. Přehled statistických metod spracování dat. Portál, Praha, 2004.

[4] G. K. Bhattacharyya, R. A. Johnson. Statistical Concepts and Methods. Wiley, New York, 1977

Riešenia úloh

Odpovede na samohodnotiace otázky, ak ich neviete sformulovať, a aj mnohé iné odpovede nájdete v odporúčanej literatúre.

1. r=0,9346, T=10,8356, a=2,6018, b=6,9208 2. r=0,772, T=3,639, a=0,289, b=− 44,532 3. r=0,998, T=26,568, a=3,077, b=1,2154. r=0,9997, a=− 1,425, b=6,828 5. r=0,673, T=2,226, bez regresie 6. r=− 0,998, T=48,661, a=− 0,216, b=171,17. r=0,985, a=− 0,0205, b=625,3 8. r=0,952, a=10,315, b=0,0003

Kapitola 7. (Korelácia a regresia) – 20