statistika skripta

123

Click here to load reader

Upload: joni-traktorista

Post on 25-Nov-2014

160 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: Statistika skripta

1. STATlsnCKÉ ZKOUMÁNÍ

1.1 Předmět statistiky

Smyslem statistického zkoumání je objektivně hodnotit jevy kolem nás na zakladě

hodnoceni provedených měřeni, objevovat statistické zákonitosti, přispívat k hluboké analýzezkoumaných ekonomických i technických jevů v reálných podminkách.

Statistika se obvykle řadí do oblasti společenských věd, za jcji hlavni část se pokládáekonomická statistika s dalšimi úsekovými statistikami. Statistika však pronikla do dalšíchvědních oborů, tak se mluvi o statistické fyzice, statistické chemíi apod., tato statistika je všakdnes součásti těchto oborů.

Statistika má i značný význam v evidencí různých jevů. Jsou tak získávány cennéinformace, které pak slouží k prováděni rozborů, k prognózování vybraných jevů, k sestaveníplánu činnosti hospodářských jednotek, k posouzeni zavislosti mezi jevy apod. Statistika takprávem patři mezi nejvýznamnějši složky informačni soustavy.

.. Statistika si pro své zkoumání vytváří svilj specifický aparát, své vlastní metody, aby coneJlepe mohla zkoumat předmět svého zájmu - kvantitativni stránku zkoumaných jevů. Každéstatistické zkoumání vychází z obecné teorie statistiky, ta se opírá především o matematiku,počet pravděpodobnosti a matematickou statistiku, s cílem stanovit obecné zákonitostichováni jevů, které jsou spjaty s existencí náhody, tj. náhodného kolísání získaných údajů

o těchto jevech. Nepochopeni existence náhody často vede k nesprávnému hodnocenisledovaných jevil a tedy i k chybným rozhodnutím. Toto nepochopení je stále i v dnešní dobědůsledkem nepochopení reality kolem nás, často je si tak třeba poopravit konvenční způsob

myšlení.

S dalším rozvojem poznam a s rozvojem výpočetní techníky se statístický přístup

k řešení významných úloh v praxi rozvíjí zejména v oblasti řizení a plánování (strategie)podnikových i nadpodnikových celků. Jde předevšim o modelování ekonomických jevů,

řízení jakostí, logístiku, ale i o oblast výzkumu. Významnou rolí v aplikaci statístíckýchmetod v praxi hraje výpočetní technika, která dnes dovoluje řešit í rozsáhlé úlohy ve velmikrátkém čase, tím výrazně klesla pracnost řešení, ale na druhé straně často tato skutečnost

svádí k rychlému řešení bez z,~ištěni určitých vstupnich podmínek. Tím se též dostává dopopředí nutnost zhodnoceni nepřesností v podkladech, potřeba stanovení a následné zajištěni

minimální přesnosti vstupujících dat.

1.2 Základni statistické pO.imy

Každá vědecká dísciplína si vytváři své základní pojmy, proto i my nejprve vymezímezákladni pojmy, se kterými se setkáváme ve statistickém zkoumání. Mezí tyto pojmy patří

předevšim statistická jednotka a statistický soubor. Statistická jednotka je jednotka, nakteré provádíme statistické zkoumání, statisticl<ý soubor představuJe soubor jednotek, kterézahrnuje~e do zkoumání. Abychom se vyvarovalí omylů v závěrech ze svých zkoumáních,musime Jednoznačně vymezit jak statistickou jednotku, tak statistický soubor pro dané

4

zkoumání. Toto vymezeni může být účelové pro konkrétní úkol daného zkoumání. V jednomzkou",lán~ vymezcný statistický soubor můžc být statístickou jednoth.", v jiném zkoumání pakstatlStlckym souborem. Jednoznačné vymezení statistické jednotky i souboru mllže v praxinarážet na určité obtíže. Jestliže bychom chtěli posoudit vývoj produktivity prácev chemickém průmyslu v několika letech, je třeba nejprve vymezit, co chápeme chemickýmprůmyslem, které všechny jednotky jej tvoři a zda je tomu tak i v jiných státech, chceme-Iiprovést mezinárodni porovnání. Statistickou jednotkou by měl být podnik (firma), ktetý patři

do oblasti chemického priimyslu. Není opravdu jednoduchou otázkou všcchny tyto jednotkystanOVIt, Jak se třeba vypořádat s tím, kdy určitá část produkce podniku patři mezi chemicképrodukty a jiná nikoli. Na vymezení těchto jednotek je závislý i závěr celého zkoumání. Jinouukázkou může být snaha stanovit kvalitu minerálního hnojiva, které bylo vyrobeno v určitém

měsici. Statistickým souborem bude hnojivo vyrobené v daném měsíci. Je zřejmé, že nelzev tomto připadě prozkoumat vše, budeme závislí na chudší informaci, tou budou údaje zevzorků, tedy odebraný vzorek bude statistickou jednotkou. Aby byl jednotkou s žádoucívypovídaci schopnosti, je třeba přesně stanovit způsob jeho odebráni, je třeba stanovit i jejichpočet, a to tak, aby ínformace získaná z těchto vzorků dala správnou informaci o celku ­statistickém souboru.

Statistické jednotky i soubory jsou nositeli celé řady vlastností více či méně důležitými

z hlediska cile našeho zkoumání. Tyto vlastnosti se nazývaji statistické znaky. Tytostatistické znah.)' mají ráz buď kvantitativni veličiny, tj. takové veličiny, která milže nabývatrůzných číselných hodnot, a to diskrétních nebo spojitých, nebo ráz kvalitativni veličiny, kdyobměnu statistíckého znaku nelze bezprostředně číselně vyjádřit, i když lze určí té vlastnostipřiřadit nějaký čiselný kód, např. výrobku lze přiřadit určité kódové číslo, to však nenívýrazem kvantity. Někdy lze považovat z praktického hlediska určitou vlastnost za spojitou,í když striktně matematicky jde o vlastnost diskrétní. Takovým případem je např. výšeměsíční mzdy pracovníků, neboť tato mzda se stanovuje na celé konmy. Zvláštní stav nastávátéž tehdy, jestliže statistický znak mllže nabývat pouze dvou hodnot, daný stav nastane lIebonenastane. Jde o alternativní veličinu neboli dvouhodnotovou veličinu, často jednéalternativě je přiřazena hodnota nula, druhé jednička, hovořime pak o nula-jedničkové

veličině. S tímto případem se setkáváme v oblasti posuzování kvality výrobku, kdy výrobekpovažujeme za dobrý nebo špatný.

Při statistickém zkoumání pracujeme se statistickými údají. Statistický údaj je číselná

nebo slovní obměna statistického znaku. Můžeme jej získat přímým zjištěnim, jako je tomunapř. při zjišťování teploty chemické reakce čí velikosti produkce 7A určitý časový úsek, nebovýpočtem jako stanovení měrné spotřeby suroviny, ukazatele produktivity práce nebopracnosti.

Údaje, které lze bezprostředně získat, označujeme jako statistické údaje neodvozené,ostatní pak údaje odvozené. Zvláštni skupinu údajů odvozených tvoři poměrné hodnoty.JImI rozUlmme hodnoty, které vzníkly poměrem dvou hodnot nebolí pomčřenim. Tytohodnoty hrají v hodnocení ekonomických jevů významnou roli, o jejich typech a jejichzpracování bude pojednáno ve druhé kapitole.

. ~t~tistické údaje se mohou vztahovat buď ke statistické jednotce, pak se mluvío IOd,vlduálních stati.tických údajích, nebo ke statistickému souboru, pak hovoříme

o statistických nkazatelich, ty mají ráz souhrnných údajů. Je zřejmé, že chceme-Ii ziskatmfo;.mace o statistickém souboru, opiráme se o indíviduální statistické údaje, přičemž sesnazlme takto získanou ínformací koncentrovat.

5

Page 2: Statistika skripta

Při konstrukci statistických ukazatelů se muzeme setkat se stavem, kdy můžeme

individuální statistické údaje sčítat, tak jako je tomu při určování velikosti měsíční produkceurčitého výrobku na základě znalosti velikosti denní produkce. Takto vzniklé statístické údajejsou závislé na délce časového úseku, za který provádíme souhrn. Těmto veličínám říkáme

veličiny či údaje extenzitni.

V jiných případech tento postup není možný, neboť součet nemá logícký smysl, alesmysl má průměrná hodnota sledované veličiny. Tyto veličiny nazýváme veličinami či údajiintenzitnimi. Můžeme konstatovat, že většina statistíckých ukazatelů má právě tento ráz.Jako příklad lze jmenovat veličiny jako měrná spotřeba suroviny, měrné náklady, ukazatelpracností, obsah účínné látky v produktu apod.

Viděli jsme, že tentýž objekt zkoumání může být v některých připadech zkoumánístatistickou jednotkou, v jiných statistickým souborem. Z toho je patrné, že ze statistickýchukazatelů tvoříme jiné, a to ukazatele vyššího řádu. Po stránce metodologické může jít io obtížný úkol. O tomto řešení bude hlouběji pojednáno v ekonomických disciplináchstudijního oboru Ekonomika a řízení chemických a potravinářských podniků.

Je třeba ještě upozornit na nutnost jednotlivé statistické ukazatele jednoznačně definovat.S touto definicí je spojena složitá pojmová stránka, která souvisi s mnohotvárnostítechnických, ale zejména ekonomických procesů. Tato otázka bude probírána v jednotlivýchpředmětech studijního oboru.

Pro řizeni podníků a i pro řizení národniho hospodářství je budována ucelená soustavastatistických ukazatelů. S vymezením této soustavy se v t?mto kursu zabývat nebudeme, budeto součástí přednášek předmětů Podniková ekonomika, Učetnictví a Financování.

Statístické údaje můžeme též rozdělit na údaje úsekové a okamžikové. Úsekový údaj jetakový údaj, který se vztahuje k určítému časově vymezenému úseku. Přikladem je třeba

objem produkce za měsíc, celkové tržby za rok. Okamžikový údaj je takový údaj, kterýzjišťujeme k určitému, tzv. rozhodnému okamžik~, p~í1<!ade~ je s~av ~rac.~vní~ů ~ prvním~lednu, slav zásob suroviny k 31.12. apod. Toto clenem statIstIckých udaJu ma vyznam pnjejich zpracování, např určeni jejich průměrných hodnot.

Statistické údaje můžeme získávat z celé řady zdrojů. Jednotka, která informaciposkytuje se nazývá zpravodajská jednotka. Za zpravodajskoujednotku obvykle volíme tu:která podává věrohodnější informaci s ohledem na včasnost IIlformace a náklady na JeJIzískání.

K posouzení kvantítatívní stránky statistických údajů a ukazatelů slouží měrné jednotky.Tyto měrné jednotky lze rozdělit na přirozené a smluvené měrné jednotky. Přirozené měrné

jednotky vystihují velikost statistíckého údaje či ukazatele bezprostředně. T~o Jedn?tk)' JSo~buď natnrální nebo peněžni. Mezi naturální patří jednotky hmotnostI, pocet kusu, casovejednotky (velikost produkce v normohodínách), délkové, plošné, objemové a další.

Smluvené měrné jednotky nacházejí své použití u bezprostředně nesrovnatelnýchvelíčín, které sí jsou podobné. Tak je tomu u paliv, mínerálních hnojiv, karbídu vápníku, kdyje udána standardní výhřevnost, obsah dusíku, obsah acetylenu.

6

1.3 Etapy statistického zkonmání

Statistické zkoumání se může opírat o pozorováni prosté, tedy takové, kdy aktivně

nezasahujeme do zkoumaného jevu a pozorováni experimentální, kdy údaje získávámez prováděného experímentu. Pozorování experimentální je obvyklejší v laboratornímzkoumání, kdy lze snadněji dosáhnout stabilizace předem zvolených parametrů experimentujako teplot, tlaku, koncentrace vstupujících látek do reakce, obsah nečistot v surovině apod.

Každé vědecké zkoumání má dvě základní fáze, a to analýzu (pozorováni a rozbor)a syntézu. Vlastní vědecké zkoumání tyto fáze nutně obsahuje a lze jej rozdělit do několika nasebe navazujících etap.

Chceme-Ii, aby statistické zkoumání bylo úspěšné, musíme nejprve provést zevrubnouanalýzu zkoumaného problému, a to s ohledem na stanovený cíl našeho statistickéhozkoumání. Tímto cílem je do jisté míry určen rozsah a hloubka zkoumání. Na základě

zhodnocení požadavků cíle zkoumání je nutné si stanovit plán statistického zkoumání. Tatočást přípravy na vlastní zkoumání je velmi důležitá.

Plán statistického zkoumání i jeho plnění má čtyří etapy:etapu statistického zjišťování,

etapu statistického zpracováni,etapu statistického rozboru,etapu sdělování výsledků.

Ačkoliv každá etapa statistického zkoumání má svůj specifický a nezastupitelný význam,lze právem tvrdít, že etapa statistického zjišťování má mezí všemi etapami největší význam,a to proto, že co je ztraceno čí zanedbáno v této etapě, je ztraceno zpravidla navždy, tentonedostatek vede k tomu, že statistické zkoumání nedá konsístentní výsledky se skutečností.

Při zkoumáni musíme jednoznačně vymezit statistickou jednotku, která je nositelemobsahu zjišťování, rozhodnout o rozsahu statístíckého souboru a o zpravodajské jednotce ­jednotce, která poskytuje informaci. Na základě cíle zkoumání musíme jednoznačně vymezitstatistické znaky, které budou předmětem našeho ~išťování, a to zejména z hlediskavěcného, místního, časového a organizačního; je tedy třeba dbát na srovnatelnost údajů.

Obzvláštní pečlivost musíme věnovat otázce přesnosti a věrohodnosti získaných údajů.

Nemáme-li kvalitní údaje, další naše práce může být naprosto zbytečná. Musíme tedyzabezpečit kvalítní měřící zařízení, mit k dispozici kvalitní obsluhu tohoto zařizení, která byk měření přistupovala naprosto zodpovědně. I když v poslední době na tomto poli docházík výraznému zlepšení, je stále co napravovat.

Statistické zjišťování lze provést v podstatě dvojím způsobem, a to jako:zjišťování vyčerpávající,

zjišťování výběrové.

Vyčerpávající zjišťování (stoprocentní zjišťování) je takové, kdy zjišťujeme statistickéznaky na všech statistických jednotkách, které zahrnujeme do zkoumání. Tento typ zkoumáníje příznačnýpro ekonomickou statistiku. Provádí se často formou výkaznictví nebo soupisů.

7

Page 3: Statistika skripta

Výběrové zjišťování nezahrnuje stanovení úrovně statistických znaků u všechstatistických jednotek, ale pouze u něja.'<ým způsobem vybraných statistických j~note~.

Výběr těchto jednotek může být záměrný, pak mluvíme o zámčrném výběru, nebo nahodny,pak se jedná o náhodný výbčr. Nejčastějšízpi.sob náhodného výb~ru. je tzv..pr~s.tý náhodn~výběr čímž se rozumí takový výběr statistických jednotek, kdy kazda stat.sllcka Jednotka mastále ;tejnou možnost být vybrána do statíckého zkoumání (jde o způsob výběru s vracení~:viz I J. kapítola). S princípem a vlastnostmi prostého náhodného výběru se budeme hlouběji

zabývat v jedenácté kapítole tohoto učebního textu.

Výběrové zjišťování má řadu předností oproti vyčerpávajícímu. Je to především větší

rychlost při získávání ínformací, získání informací s menšímí náklady. ~edos:a~kem

výběrového šetření je skutečnost, že jej nelze použít tam,. kde nelze ';'ynech~t nektere udajejako je tomu pří zjíšťování velíčin pro základní ekonom.cke ukazatele clOnost. podOlku.

Výběrové šetření je obvyklejší v podnicích v technické ~bl~sti , jako Je .stat~stickáregulace výrobního procesu, zjišťoválú kvalíty produkce, surovlO I polotovaru (jedna-I! seo destrukční zkoušky, je dokonce jediným objektivním způsobem zjišťování) ~ebo

vyhodnocování rllzných technologických zkoušek Při této příležitosti je třeba upozornIt nanutnou důslednost při uskutečňování výběru statistíckých jednotek (vzorků) a též naskutečnost, že stoprocentní šetření neznamená, že je stoprocentně účinné, že tedy n~ni bezchyb. Vždyť í při stoprocentní přejímce výrobků se pak setkáváme s výrobky nekvahtmml.

Jíný způsob zjišťování se provádí v případech, kdy ne!ze zajistít přímé ~jištěni ho~n?t

stanovených statistíckých znaků, kdy se opíráme o znalecký posudek vybranych odborn.ku,v těchto případech provádíme zjišťování pomoci odhadů nebo ankety.

Pro další zpracování statístíckých údaji, má značný význam í forma předání zjištěné

informace. Ukazuje se, že zatím nejvhodnějším technickým prostředkem je statístickýformulář. Může jít o výkaz, dotazník, přehled čí hlášení. Statistický formulář by měl býtpřehledný, měl by obsahovat název, rozhodný okamžik zjišťování, datum a lhůtu, odeslání:jakož i podpisy těch pracovníků, kteří odpovídají za správnost uv~ených. údaJu. Vla~tm

statístické formuláře mají obvykle tvar tabulky. Je výhodou posledm doby, ze Je lze pos.latv podobě, která může využít elektronické pošty. V této podobě lze tak usnadnit jejich dalšízpracování bez zbytečného opisování údajů.

V etapě zjišťování bychom také měli posoudít veYk?st chyb, .kt~rých se při ~jišťo~ání

dopouštíme. Musíme si uvědonút, že výsledkem měrem v prakt.ckem zk~u~am Je č.s~?

(číselná hodnota), které je zatíženo určítou chybou. Tedy budeme-h měrem na to';"tezvýrobku (vzorcích) opakovat, dá se očekávat, že výsledky se budou od sebe navzaJ~m

odlišovat. Je to z toho důvodu, že na výsledek měření působí různé faktory, podle kterychchyby rozdělujeme do těchto kategorií:

chyby úmyslné,chyby neúmyslné.Samozřejmě, že protí chybám musime co nejrozhodněji bojovat, tím spíše ~roti chybá~

úmyslným. Do této kategorie chyb patří zejména chyby spojen~ se .svědor~ntosll,a poct.vost.pracovníka. V praxi jde o neprovádění analýz a nahrazem Jejich vysledků odhadem,nesprávný postup při výběru respondentů v anketách apod. •

Chyby neúmyslné můžeme opět rozdělit do dvou kategorií, a to na.chyby systematické,chyby náhodné.

Mezi chyby systematické patří chyby vznikající nezapracovaností pracovníki., chybyměřících zařizení, chyby měj-i cích metod (chyba analytického stanovení) apod. Tyto chyby lzeprincípiálně odstranit, avšak často jejich odstranění či zmenšeni vede k vynakládáni značnýcha někdy neúměrných prostředkl. vzhledem k dosaženému efektu a cílí měření.

Chyby náhodné se projevují nahodíle, jejich původců je obvykle velký počet, přičemž

působení samotného jediného faktoru je samo o sobě prakticky zanedbatelné. Výsledkempůsobení samotné náhody je kolísání měřeného znaku kolem určité hodnoty, přičemž totokolísání je charakteIizováno jednovrcholovým rozdělením četností (víz další text tétokapitoly). Součet chyby systematické a náhodné dá dohromady chybu měření či stanovení.

Výsledek měření z matematického hlediska patří do kategoIie neúplných (nepřesných)

čísel, to znamená, že při výpočtech s těmito hodnotami bychom mělí zachovávat pravidla propočítáni s přibližnýmí čísly. Tato problematíka bude stručně popsána v osmé kapitole.

K zmenšování rizika v)'skytu chyb, které pří zjíšťováni vzníkají, je třeba neustáléhoprověřováni údajů - kontroly. Nejdůležitější stránkou kontroly správností údajů je jejichlogická kontrola. Ta se opírá o znalost řešené problematiky.

Druhou etapou statistického zkoumání je etapa statistického zpracování. Je to etapa, vekteré zpracováváme statistické údaje, které nemi,žeme bezprostředně použít k rozbomzkoumaných jevl', neboť se jedná často o rozsáhlou a neuspořádanou řadu statických údaj.tÚkolem statistického zpracování je též zhustit informací získanou v etapě zjišťování do řady

ukazatelů.

Zpracování údajů je provázeno shrnováním údaji., průměrovánim údajů či výpočtem

složitějšich ukazatelů. Nebudeme zde rozebírat problematiku zpracování statistických údajů

z hlediska rozmístnění zpravodajských jednotek a místem vlastního zpracování. Spokojíme ses tím, že tak dospíváme ke zpracování centralizovanému a zpracování decentralizovanému.

Při vlastním zpracování můžeme použít ri.zného stupně mechanizace. Podle tohotohlediska rozlišujeme zpracování Tuční, mechanizované a automatizované.

Ruční zpracování i v dnešni době má své misto, a to zejména při zpracování nepříliš

rozsáhlých souborl', dále v oblasti některých výzkumných prací. Toto zpracování se ještě

někdy používá při třídění statistických údajů, a to tzv. čárkovací metodou, kdy přiřazení

jednotlivých měření do určité skupiny (třídy) provádime tak, že k přislušnému třídnímu znaku(víz další text této kapitoly) zapišeme čárku. Počet čárek pak stanoví četnost příslušného

případu. Při dalším mčnim zpracování dále používáme zpravidla kalkulačku.

Mechanizované zpracov:íní vytváří přechod k automatizovanému zpracovánístatistíckých údajů. V dnešní době se opíráme o využítí počítačů a vhodného softwarovéhovybavení. Někdy je vhodné si vytvořit vlastní programové vybavení.

Automatizované zpracování je nejvyšším mechanizačním stupněm zpracování dat,opírá se o počítač. Výchozi data jsou samočínně shromažďována v paměti počítače, kde se

8 9

Page 4: Statistika skripta

vytváří banka dat. Takto ziskaná data jsou dále opět samočinně zpracovávána eventuálně

vyhodnocována. Tak je tomu pří řizení některých výrobních procesů.

Řekli jsme, že mezí základní metody zpracování statistických údajů patří metoda třídění.Třídění je postup, kterého používáme v různých vědních oborech, avšak ve statístíce máklíčové postavení. Statístícké třídění je přířazení jednotek statístického souboru do skupinjednoznačně vymezených s cílem co nej lepšího poznání zkoumaného jevu. Tříděni

vekonomícké oblasti zaujimá vlastně postavení experimentu v technických a přírodních

vědách. V ekonomické oblasti je použíti experimentu značně omezeno, mnohdy jej nelzevůbec provést, neboť hrozí nebezpečí, že změněný ekonomický systém se nám již nepodaři

vrátít do původního stavu. Metoda třídění nám vlastně pomáhá zkoumat sledovaný jev pří

stabilizovaných úrovních některých velíčin.

Účel třídění může být rozmanítý a je dán cílem statístického zkoumání. Třídění jepředevším prvořadým prostředkem statistíckého rozboru. Tříděním jevů v techníckéi ekonomícké oblasti můžeme zejména poznat složení (strukturu) zkoumaných jevů

a odhalovat a hodnotit vzájemné vztahy a souvislosti mezi ními. S metodou třídění jsou úzcespjaty další statistické metody jako např. metody zkoumáni závíslostí.

Statistické údaje můžeme třídít jak podle kvalítativního, tak í kvantitativního znaku. Při

třídění statistických údajů podle kvalitatívního znaku jednotlivé skupiny, kterým se obvykleříká třídy, vymezujeme zpravidla slovním popisem, í když někdy je tento popís nahrazenčíselným kódem. Je třeba znovu zdůraznit nutnost jednoznačného vymezení třídy, abynedocházelo k nejasnostem při zařazováni jednotlivých údajů do tříd.

Vymezení tříd u kvantítatívních znaků lze provést několíkerým způsobem. Opět je třeba

dodržet zásadu, abychom jakoukoliv hodnotu přířadili do určíté třídy jednoznačně. Jednotlivétřídy lze vymezít buď hodnotou třídního znaku, což je hodnota, která leží uprostřed třídy

a která zastupuje všechny hodnoty v této třídě ležící při výpočtech. Třídy lze též vymezithrauicemi tříd, tj. hodnotami, které jako první nebo poslední leží v příslušné třídě.

Pří vlastním tříděni je nutno rozhodnout o počtu tříd. Na tuto otázku nelze obecně

jednoznačně odpovědět. Počet tříd bude souvíset s počtem tříděných hodnot (s počtem

měření), s přesn.osti jednotlivých měření, jakož í s velíkosti chyby, které se dopustíme při

tříděni, respektíve s velikostí chyby, kterou jsme schopni nést vzhledem k závěrům

prováděného šetření. Z praktických důvodů lze doporučít vytvoření S až 15 skupín při třídění

asi stovky údajů. Naši snahou bude, aby jednotlívé třídy byly stejně dlouhé nebo vykazovalyjinou zákonítost, např. aby délka následující třídy byla konstantním násobkem délkypředcházející třídy. Ukažme nyní některé možnosti vymezení tříd.

10

Varíanta A je nejméně vhodným způsobem vymezení jednotlívých tříd, i když se s nív praxi setkáváme. Nevhodná je proto, že v případě, že některá hodnota je shodná s hranícítřídy, nemůžeme jednoznačně rozhodnout, do které třídy jí zařadíme. Je bezchybná v případě,

kdy jednotlivé hodnoty nemohou být shodné s mezní hodnotou, např. v ukázce třiděnáhodnota je celočíselná.

Varíanta B vymezuje třídy dolni mezní hodnotou, která je první hodnotou, která do danétřídy patří. První hodnotou, která do dané třídy jíž nepatří, je hodnota totožná s mezníhodnotou další třídy. Obdobným připadem vymezení tříd, je varíanta C, kde je však udánahorní hranice třídy, hodnota, která je poslední, která do dané třídy patří.

Varíanta D má určíté úskalí v tom, že hodnoty, které jsou větší než mezní hodnota určité

třídy, ale menší než mezni hodnota následující třídy, je nutné zaokrouhlovat a navic třídní

znak, který leží v polovíně daného íntervalu, musí tuto skutečnost respektovat, takžev uvedeném příkladě třídní znak nebude 14,5, avšak 14,55.

Varíanta E ukazuje na vymezení třídy v případě dískrétního znaku. V tomto případěneexístuje v pravém slova smyslu délka třídy, i když teoreticky je mezní hodnotou např. 1,5.Tato skutečnost může být významná např. pří aproximací binomického rozdělení rozdělením

normálním při jednodušším určení hodnoty distríbuční funkce (viz další text v 10. kapitole).

Pří vymezení tříd se v praxí můžeme setkat s případem, kdy krajní íntervaly jsouneuzavřené. První ínterval je označen symbolem "-" (což značí až) a poslední. "+". Např.

Sooo;- z~ačí hodnotu větší než SOOO. V takovém případě je vhodné doplnit tuto hodnotuvysvetluJlclm textem (správnou hodnotou), neboť así půjde o hodnotu větší než při standardnídélce mlervalu.

II

Page 5: Statistika skripta

Vlastní přiřazeni jednotlivých hodnot do tříd (vlastni třiděni) lze provést na počitači.

U nepříliš velkých souboru lze tuto operaci provádět i ručně. Tento postup je znám jako"čárkován]", to proto, že tříděnou hodnotu označime čárkou u příslušného třidního znaku(třídy) a každý pátý případ označíme přeškrtnutím čtyř předchozích případů. Důvodem jesnadnější součet případů. Tím získáme četnost případll. Sled 'ednotlivých četností s ohledemna třídni znak vymezuje rozdělení četností. Tvar rozděleni četnosti má značný význam při

analýze sledovaného jevu. Z povahy řešených úloh zpravidla vyplývá, že ziskané rozděleni

četností by mělo sledovat určitý teoretický typ (viz podrobněji kapitola 10). Tato rozdělení byzpravidla měla mit jeden vrchol v grafickém vyjádření, měla by být jednovrcholová. Pokudvýsledkem třídění je rozdělení četností s několíka vrcholy, vzniká důvodné podezření, žesoubor hodnot vznikal za různorodých podminek, je to signál k nalezení příčin tohoto stavu,což je např. významné při analýze výrobního procesu.

Domnívám: se,. ž~ se každý posluchač již setkal se statistickými tabulkami, a proto scne?u?eme zab~at JeJ:ch konstrukci. Považujeme za účelné připomenout požadavek, abykazda _tabulka m~:a svuJ nazev, aby byla jednoznačně popsána v hlavičce i legendč tabulky,aby vsechna pohcka v tabulce byla vyplněna. Prázdné políčko ukazuje na nedokončenootabulkl~;, Ve st~tistické tabulce se též uvádějí smluvené značky, ze kterých uvedeme alespoňneJPouzlvanějsl.

Ležatá čárka ( -) v poličku vyjadřuje, že jde o množínu prázdnou, skutečně nulový případ.

L.žatý křížek ( x) má buď význam ten, že statistický údaj je v uvedeném poličku logickynemožný (např. v součtovém řádku pro nesčitatelné údaje) nebo nástakový údaj nezajímá, v takovém případě je ve formulářích obvyklepředtíštěn

Nutno konstatovat, že s těmito zásadamí někdy nekorespondují programy v počítačích.Pro jednoznačný význam čtení grafu je však potřeba uvedené zásady tvorby grafurespektovat.

Statístické grafy rovněž umožňují předat výsledky statístické práce. 1 zde se omezimena náležitosti grafu, ve kterých se stále chybuje:

Každý graf musí obsahovat svůj název, který se umísťuje buď pod nebo nad vlastní graf.Obecné poznámky umísťujeme bezprostředně pod název.Zvláštní poznámky uvádíme pod grafický obraz, který dále osvětluje

Vysvětlivky čí klíč v grafu, který vysvětluje význam grafických prvků, umíst'ujeme navhodném místě v grafu či mimo vlastni graf.Každý graf musí mít popsány osy. Osy jsou opatřeny stupnicemí.Každá stupníce musí začinat nulou (výjimku tvoři časová osa). Tyto stupnice je vhodnépřerušit (přerušení označujeme vlnovkou na stupnici), abychom mohli zvětšit modulstupmce, a tak lépe využít plochu grafil. Přerušení stupnice je vhodné i při zakresleníextrémních hodnot. Modulem stupníce se rozumí délka stupníce pro jednotku číselnéhoIIltervalu.Časové úseky (týdny, měsice, čtvrtletí, roky) znázonlujeme úsečkou na ose pořadníe.označení zakreslujeme doprostřed úseku.Hodnoty úsekových ukazatelů se kreslí ke středu časového úseku, hodnoty okamžikovýchukazatelů pak k příslušné části úseku, dané rozhodným okamžíkem zjišťování.

Grafickým obrazem rozděleni četností je buď mnohoúhelník (polygon), a to v připadě,

kdy použijeme spojnicový graf, nebo sloupkový graf (histogram četností). Někdy bývávýhodné připojit i graf kumulativnich četnosti či graf kumulativnich relativních četnosti.

Posledně jmenovaný graf vyjadřujepodíl případů, že nastane určitá hodnota nebo menši.

Tvorba grafiI rozdělení četností je dnes součástí řady počitačových programů, a to nejenspeciálně statistických.

Častým smyslem třídění je poznáni struktury hodnoceného jevu. Tuto strukturu můžemesledovat i v různých obdobich, což nám umožňuje sledovat změny ve struktuře, jejídynamiku. Toto hodnoceni se opírá o základni statistické míry - střední hodnoty a míryvariability. Je zřejmé, že na pruběh změn bude mít vliv i moment náhody, vlastni zhodnocenimá pravděpodobnostní charakter. O těchto otázkách bude pojednáno v dalších kapitoláchtohoto učebního textu.

Je třeba též upozornit na možnost tříděni dle několika znaků zároveň, tak je tomu při

zkoumáni závislostí a vyhodnocováni řady faktoru např. při analýze výrobního procesu. Jinoumožností je třídění podle vymezených vlastností - typů, mluvíme o typologickém třiděni.

Tam, kde jde o třídění jednotek podle obměn slovních znaků, mluvime místo o třídění

O klasifikaci (např. klasifikaci odvětví národního hospodářství, klasifikaci povolání apod.).

Třetí etapou je etapa statistického rozboru. V této elapě musime zhodnotit dosaženévýsledky a vypracovat závěry ve shodě s cílem statistického zkoumáni. Musíme si uvědomit,

že nejde pouze o rozbor v úzkém slova smyslu, ale o celý soubor postupů logickéhousuzováni. Rozbor je závažnou části statistické práce, neboť zde bychom měli odpovědět navšechny otázky kladené v zadaném zkoumáni. Proto je účelné, aby se práce v této etapě

účastnili vedle statístiků technici i ekonomové, pracovnici dokonale obeznámenis problematikou řešeného úkolu.

I pro tuto etapu sí statistíka vytvoříla své postupy a metody, které jsou shrnovány ve"statistických metodách". V další části tohoto učebního textu se budeme věnovat vybranýmstatistickým metodám, a to zejména těm, které se daji dobře využít v podnicích chemickéhoa potravinářského průmyslu.

Poslední etapou je etapa sdělování výsledků. Toto sdělování se provádi jednou ze tří

možností, a to slovním textem, tabulkou nebo pomocí grafického žobrazeni.

12

Tečka (.)

Nula (O)

v poličku tabulky nás informuje o tom, že údaj zatím není znám

neznamená, že žádný údaj nenastal (viz ležatá čárka), ale dovídáme seo tom, že údaj v poličku je menší než polovina jednotky, ve které údajev tabulce uvádíme. Např. údaj 0,0 v poličku o stavu zásob určitého

výrobku, říká, že máme na skladě méně než SO kg produktu, pokudjednotkou JSou luny.

J3

Page 6: Statistika skripta

2. POMĚRNÉ HODNOTY

Mezi nejvýznamnější postupy při srovnávání patří poměrné srovnávání tj. srovnavamdvou statistických údajů nebo ukazatelů poměrným čislem - poměrnou hodnotou. Tentopostup je vhodný proto, neboť absolutní statistické údaje poskytují pouze základní představu

o povaze a vlastnostech zkoumaných veličin a zkoumaných souborů. Poměrné hodnoty takdoplňuji absolutní údaje o další informaci a přispívají tak k hlubšímu rozboru sledovanéhojevu. Další výhoda srovnávání je v jeho názornosti a přehlednosti.

Poměrné hodnoty vznikají jako podíl dvou či několika údajů. Údaj, který je vejmenovatelí zlomku, je základem pro srovnávání, a proto jej často označujeme jako základníúdaj, údaj v čitateli pak jako srovnávaný údaj. Vymezení základního i srovnávaného údajemá rozhodující význam pro obsahovou nápli\ poměrných hodnot, a proto je nutné jejich volbě

věnovat náležitou péči.

Poměrné hodnoty můžeme rozdělit do dvou velkých skupin, a to na:poměrné hodnoty stejnorodé,poměrné hodnoty různorodé.

2.1 Stejnorodé poměrné hodnoty

Stejnorodé poměrné hodnoty srovnávají údaje podle stejného obsahu, přičemž

srovnávání můžeme provádět z hlediska věcného, územního, časového. Mezi nejčastější

stejnorodé poměrné hodnoty patří poměrné hodnoty struktury, vývoje a splnění plánu.

Poměrné hodnoty struktury

Příklad 2. I Struktura měsíční produkce podniku z hlediska přínosů závodů

Závod Produkce v 1000 Kč %1. 102587 78,142. 12296 9,373. 7158 5,454. 5213 3,975. 4025 3,07

Celkem 131 279 100,00

Z posl~niho sloupce tabulky si učiníme lepší představu o váze jednotlivých závodůz hledIska JejIch objemu produkce než z absolutních údajů o velikosti produkce. Rozdílv názornosti bude tím větší, čím bude větší počet skupin. Tímto způsobem bychom mohliposoudit i váhu jednotlívých podniků v rámci určítého průmyslového odvětví.

Při rozsáhlejších zkoumáních můžeme určovat strukturu vybraného jevu i podle několikaznaků najednou, ale také odděleně podle jednotlivých znaků.

Poměrné hodnoty vývoje

Poměrné hodnoty vývoje jsou významným prostředkem při zkoumání dynamikysledovaných jevů. S vlastním zkoumáním trendů se pak dále seznámíme v kapitole 6, která jevěnována časovým řadám. Zatím ukážeme základní konstrukci poměrných hodnot vývoje.

Bazické poměrné hodnoty vývoje nám říkají kolikrát je hodnota sledované veličiny

v určitém období větší než v základním (bazickém) období. Z tohoto vymezení lze zapsatzákladní definiční vztah ve tvaru:

Poměrné hodnoty struktury slouží k poznání struktury (složení) hodnoceného jevu.Jsou pro hodnocení výhodnější než výčet absolutních údajů a jsou definovány jako poměr

velikosti srovnávaného údaje k celku v celém souboru. Jde též o poměr četnosti určité

obměny statístíckého znaku (označme jí tl,) a celkového rozsahu tl. Je celkem zřejmé, že tytopoměrné hodnoty můžeme vytvářet pouze z údajů sčitatelných.

B =~I Yo·

Význam symbolů:

Y. - hodnola ukazatele v i-tém období,

Yo - hodnota ukazatele v základním období.

(2.2)

Poměrné hodnoty struktury určíme podle vztahu:

...1l- nebok

~>,;;:;1

_.!!.L- = nJk tl .

~>,;=1

(2.1)

U, těchto poměrných hodnot je základ vždy stejný po celou řadu období. Základní obdobíse voh Jako hodnota období, které je určitým mezníkem v hospodářství společností.

Chceme-li provést přepočet bazických hodnot na Jmou bázi, můžeme se opříto následující vztah:

Velmi často tyto hodnoty násobíme stem, vyjadřujeme je tak v procentech.~=~:YAYA Yo Yo

(2.3)

14

~ěk?y se k posouzení růstu využívá též míry, která se nazývá relativní odchylkapomerne hodnoty vývoje. Ta je definována jako poměr absolutní odchylky vývoje a báze~Ire. '

15

Page 7: Statistika skripta

B' =Y, - Y. =13 -II Yo I'

(24) !'.~ 000 II o.1 y.=-' .JOOy..u plli1l up

(2.12)

Tato míra se obvykle udává v procentech a informuje nás o kolik se zvýšíla hodnotasledovaného ukazatele vzhledem k základnímu období.

Dmhou skupinu poměrných hodnot vývoje tvoří řetězové poměrné hodnoty vývoje.První mírou z této skupíny je koeficient růstn (kJ, je to míra, která nám udává kolikrát jesledovaná velíčína (ukazatel) větší než v předchozím období, tedy základ srovnávání seneustále mění. Tempo růstn je stonásobkem koeficíentu růstu, udává se tedy v procentech.Obě tyto uvedené míry lze vyjádřít vztahem:

Ukazatel splnění plánu používáme v uvedeném tvaru í tehdy, jestlíže hodnota tohotoukazatele nad 100% je nepříznívýmjevem, jako je tomu u ukazatele pracností produkce neboukazatele měrných nákladů či zmetkovítostí.

V ekonomické problematíce pří hodnocení různých jevů potřebujeme posoudít splnění

plánu určítého ukazatele i s ohledem na splnění plánu jiného ukazatele. Dostáváme se takk pojmu relatívní splnění plánu. Relativní splněni plánu lze vyjádřit vztahem:

T =~- 100%=k JOO%I • " .

Y, I

(2.5)_!!._'- 100% kde1I~' ,

p.

qp

(2. I3)

Vývoj zkoumaných jevll muzeme rovněž vyjádřit pomocí přírůstků, ty mohou býtabsolutní nebo poměrné, přičemž poměrné přírl!stky mohou být vztaženy ke stejnému základuGedná se o bazických poměrných přirůstcich) nebo k základu, který se řetězově mění

Gedná se o tempo přírůstku). Tyto definice lze psát v matematíckém tvaru:

"" U p jsou skutečné a plánované hodnoty jednoho ukazatele,

q" qp skutečné a plánované hodnoty druhého ukazatele.

absolutní přirůstek

bazický poměrný přírůstek

a, =y, - y, t·

b = Y, - Y'-I, Y. Y.

(2.6)

(2.7)

Uvedený vztah lze upravit na jiný:

(2.14)

tempo přírůstku L, = Yi - Y,-l

Yr-l

(2.8)Z tohoto tvaru vídíme, že relatívní splnění plánu lze získat jako poměr splnění plánu

hodnocených ukazatelů. Tento uvedený tvar lze ještě upravit na výraz:

Poměrné hodnoty vývoje JSou díky své definící svázány, tyto vazby lze popsatnásledujícímí vztahy:

(2.15)

b, =B, -B, .,

f, :::.: kl -I,

k, =', +1.

Poměrné hodnotv splnění plánu

(2.9)

(2.10)

(2.11)

Odtud vidíme, že relatívní splnění plánu je rovnocenné splnění plánu poměrné hodnoty !:.q

Poznamenejme ještě několik slov o konstrukci ukazatelů splnění plánu u hodnot(ukazatelů), jejíchž vzájemný součin je konstantní. S tímto problémem se setkávámeu ukazatelů, z nichž jeden je převrácenou hodnotou druhého. Jako příklad lze uvést ukazatelproduktivity práce (v) ukazatel pracnosti (t) (viz dalši ěást této kapitoly). v. ( - I, odkud:

Pro řízení ekonomíckých jednotek se vytvářejí míry pomocí kterých posuzujeme splnění

zadaných (plánovaných ) úkolů. Tyto míry se vytvářejí jak na úrovní vnítropodníkové,podníkové í nadpodníkové. Jedná se o splnění plánu. Splnění plánu můžeme sledovatu různých ukazatelů, a to absolutních í poměrných. Tak lze sledovat splnění plánu produkceurčítého produktu, dosažených tržních cen, měrné spotřeby 'surovín, pracností výrobků,

měrných nákladl! atd. Splnění plánu se udává v procentech a je dáno poměrem skutečně

dosažené hodnoty k hodnotě plánované, což lze zapsat ve tvam:

t6

~ 100%= t p .100%. (2.16)vp (~

Splnění plánu produktivity práce můžeme stanovit tedy též nepřímo přes ukazatelpracnosti. Splněni plánu pracnosti je však definováno jako:

t7

Page 8: Statistika skripta

.!.....100%.Ip

(2.17)Energii se rozumí elektrická energie, pára, voda, tlakový vzduch. Určitým problémem je

měření těchto spotřeb, ale o této otázce bude pojednáno v přednáškách z Ekonomiky výroby.Spokojme se tedy pouze s definičním vztahem.

Tato otázka je významná při aplikaci indexní metody v rozborové činnosti podníku. To

bude i předmětem kapítoly 7.

2.2 Různorodépoměrné hodnoty

Pro hodnocení využití výrobniho zařízeni je definován výkon výrobního zařízení jakopoměr objemu vyrobené produkce a spotřebovaného času. I zde se nebudeme zabývatproblémy kolem této míry jako je okamžitý výkon, normovaný výkon, problematikouzapočítání času na preventivni opravy apod. Označme T, dobu chodu zařízení, za kterou bylvyroben objem produkce Q, pak

Pro různá hodnocení je významnou veličinou využití lidské práce. Dospíváme k pojmuproduktívity práce, čímž se obvykle rozumí účinnost lídské práce. Tuto účinnost neumímebezprostředně měřit, a proto se zavádí ukazatel produktivity práce v, ten je definován jakopoměr množství vyrobené produkce za jednotku času, tedy

Při vlastním výpočtu se dostáváme do problému jak měřít produkcí í jak odpracovanýčas. Jestliže budeme sledovat ukazatel produJ..'tivity práce pro určítý výrobek, mírou velikostíprodukce daného výrobku mohou být přirozené jednotky jako kg, m2

, mJ, počel kusů, ... , alei jednotky peněžní. Tak tomu také bude pří určeni objemu produkce za podník. I jmenovatelmůže mít svůj obsah podle velikosti zvolené časové jednotky. Poznamenejme, že v případě

ukazatele produktivity práce se setkáváme s tím, že za jednotku času volíme:

Různorodé poměrné hodnoty vznikají poměřením velíčín, které mají různý věcný obsah.Údaj v čitatelí má také odlíšný rozměr od údaje ve jmenovateli. Tato skutečnost vede mnohéautory k tomu, aby tyto poměrné hodnoty označovali jako rozměro~é po~něrné hodn~ty;D~této skupiny patři tzv. technickohospodářské ukazatele, pomocI kterych se sledUjI ruzne

ekonomické děje.

Vzhledem k tomu, že přednášky z Inženýrské statistiky pro ekonomy předcházejípředmět Ekonomika výroby, je účelné a nutné i vzhledem k apl~kacím statistických metodv podnikové praxi na tomto mistě uvést základní ukazatele spoJene s objemem produkce.

Abychom získali v průmyslovém procesu produkt Q, potřebujeme, s~r.oviny ~, e?ergií, E,výrobní zařízení, pracovníky a finanční prostřed~. Pro hodno~ru ~:m?ostl vyrobmhoprocesu se vytváří soustava poměrných hodnot, ktere toto hodnocem umoznuJl.

Pro využití suroviny je definována měrná spotřeba suroviuy (S'1) jak~ po~ěr spotřebyi-té suroviny na j-tý produkt. V chemických výrobách se v Jednom vyrobmm proc~suspotřebovává i řada surovin a vedle sebe může vznikat i pestrá paleta výrobků. Lze tedy psat:

(2.21)

(2.22)

(2.18)

Veličiny S a Q mohou být vzaty jako molekulové hmotnosti podle chemické rovnice,dostáváme tak stechiometrickou měrnou spotřebu, nebo do vztahu lze zahrnout chemIckourovnováhu a reakční rychlost, tím dostaneme teoretickou měrnou spotřebu. Základem provýpočet mohou být veličiny z technologického reglementu, a tak dostaneme normo~a~ou

(plánovanou ) měrnou spotřebu. Při porovnáni. skutečné,spotřeby surovm a skutecnehoobjemu produkce získáme skutečnou měrnou spotrebu surovmy.

Převrácenou hodnotou měrné spotřeby suroviny získáme měrný výté'l:ek (q,;J

odpracovanou hodinu, čímž se rozumí každá započatá hodina, kterou pracovník pracoval,odpracovaný den, definovaný jako den, kdy pracovnik nastoupil do práce,odpracovaný měsic, vymezený jako počet pracovníků, což je totožné s hodnotou, kdyalespoň jeden den za měsíc pracovník pracoval.Podle použité časové jednotky tak rozeznáváme ukazatele produktivity práce hodinové,

denní a měsíční.

Jestliže chceme posoudit úroveň produktivity práce v celém podniku, je zřejmé, že dalšímproblémem, se kterým se setkáme, je vyřešení otázky sčitatelnosti produkce. Obvykle sipomáháme peněžními jednotkami. Nutno též rozhodnout, co rozumíme produkcí podnikua o nikoli.

- Qjq, - S, .,

Obdobným způsobem je definována měrná spotřeba energie, tedy ve tvaru

18

(2.19)

(2.20)

Mezi nejvýznamnější ukazatele, podle kterých hodnotíme kvalitu činnosti podniku, jsounáklady. Náklady průmyslového podniku představují peněžně vyjádřenou spotřebu všechvýrobních činitelů a ostatní účelně vynaložené prostředky spojené s činností podniku. Tytopoložky jsou dány legislativními předpisy, tak jsou odlišeny zejména ztráty. O členěni

n~ladů podle různých hledisek bude opět podrobně pojednáno v předmětu Ekonomikavyroby. Zde se spokojíme se vztahem nákladů a objemu produkce. Dělíme je na :

náklady fixní Nf (nepružné), které nereagují na změnu objemu produkce,náklady stupňovité N, , ty se chovají jako fixní, ale pří překročení určítého objemuprodukce se mění skokem,

19

Page 9: Statistika skripta

(2.24)

'kl d ' b'l ' (ružné) N které s rostoucím objemem produkce rostou. Tento růstna a y vana t Il1 P Y, • I ..." o .., r eární jdemůže být linearní __ jde o naklady proporcionalni. Přt rych ejslm nIst~ ~ez, mo naklady nadproporcionalni, při pomalejším růstu pak o podproporclOnallll naklady.

V raxi celkové naklady sestavají z nakladů fixních i v~riabilních. Provpr~váděni analtz

mají v~znam především měrné náklady (11), jsou to naklady vynalozene na jednot u

produkceN ~.23)

11=-.(2

V případě proporcionalních nákladu lze psát:

11= Nf+N, =!'!L~b~=!!_L~b=lIf+b.Q Q Q

Z tohoto vztahu je zřejmé Ude o hyperbolu), že při prop'orcion~~nim P:l~l~u ~:~~V!e~:lnakladů měrné náklady s rostoucim objemem produkce ldesaJ1, hovon se o n a o g ,

jde o dilsledek toho, že část nákladů je fixnich.

Vídíme že každá různorodá poměrná hodnota bude mit svou sp:.cifickou proble;n~tiku,v ovidací ~cho nost bude dána přesným vymezením jmenovatele 1 clt~tele. O tvo;be techto

YkP t lu· bude ~bširně poíednáno v dalšich ekonomických dlSClphnach studljmho °b~OnIu aza e J . 'v k' h d'ků proto se tim dále za yvatEkonomíka a řízení chemických a potravmars yc po rn , a

nebudeme.

Kontrolni otázky:

b Cď ého podle dvou hledisek2. J Určete vztahy pro stanoveni struktury sou Okru, !zn e~kd d bVre popsat parabolícky'm2.2 Celkové náklady ve vztahu k objemu produ ce e ne y o

modelem.Určete vztah pro mčrné naklady.

3. STŘEDNÍ HODNOTY

Mezi nejčastějši veličiny použivané při statistickém rozboru patří střední hodnoty vevšech jejich typech a fonnách. Středni hodnoty json miramí polohy a jsou statistickýmicharakterístíkami zkoumaných statistíckých souborů, udávaji zevšeobecňující charakteristíkusouboru z hledíska určitého kvantitativního znaku. jsou tedy výrazem určitého stupně

abstrakce. Středni hodnoty jsou představitelem zkoumaného souboru, jehož úroveň pakzastupují v dalším zkoumáni, pomáhaji odhalovat vnitřni souvislostí studovaných souborů

a umožňují srovnávat statistické soubory mezi sebou podle zadaných znaků. Rovněž pomáhajipři hledáni typičnosti hodnocených jevů.

Podle účelu zkoumáni a podle vlastnosti hodnocených statistických údajů SI můžeme

definovat rilzné středni hodnoty, a to:

průměry,

kvantily,modus,střed rozpětí.

3.1 Průměry

Průměry jsou statistické veličiny, které bezprostředně zavlsejl na všechprůměrovaných hodnotách souboru. Průměry lze obecně definovat vztahem: 'l

P('P)o[tf~~r[~::'r ,'d, ("i

x - průrněrovaná veličina,

y - váha průměrovaných veličin,

z - matematický moment, který udává řád průměru,

n ~ počet měření.

Uvedený vztah je vztahem pro vazen)' průměr. Váha průměrovaných veličin jehodnota, která respektuje sílu, kterou se jednotlivé veličiny podílejí na tvorbě průměru. Při

průměrováni absolutnich údajů je váholl zpravidla četnost, avšak při průmčrování poměrných

hodnot tomu tak zpravidla Jleni (viz dalši text). Jestliže všechny hodnoty mají stejnou váhu c,jedná se o průměr prostý.

P( ,)=[L X,,]: _[CLxi]; _[xi]:x.Y,c _ --- __LC n.c n

(3.2)

20

'lpkud 'o u sumacI nebudou označeny meze, budeme vždy zápisu rozumět tak, že se jednáo součet pro indexovanou veličinu od jedné do 11.

21

Page 10: Statistika skripta

Ze vztahů (3.1) a (3.2) lze odvodit jednotlivé typy průměril podle velikosti momentu z.Pokud veličina z je rovna jedné, dostaneme vztah pro aritmetický prilměr:

vyhovuje určujicí vlastnosti aritmetického průměru - nahradime-li všechny průměrované

hodnoty průměrem, pak se jejich součet nesmí změnil. Za základní formu aritmetickéhoprůměru lze považovat prostý aritmetický průměr, daný vztahem:

A .... vážený aritmetický průměr, (3.3) - LX,X=--.

n(3.9)

Jestliže za z dosadime trojku, .dostaneme kubický prilměr. Při volbě z = -I výsledkembude vztah pro harmonický prllměr ve tvaru:

Při volbě z~2, dostáváme vztah pro kvadratický prilměr:

(3.10)

(3.Il)X, je prilměmá hodnota v i-té skupíně.n

,L X;'Il,

x=-"'-"-'--

,Lx,.nj

x=~- , kde k udává počet skupin (tříd) .n

Základni vlastnosti aritmetického průměru

Aritmetický průměr má některé základni vlastnosti, které se pak využívají v různých

statistických metodách, uvedeme nejvýznamnější:

Váženého aritmetického průměru musime použít pro výpočet celkového průměru

souboru, známe-Ii dílčí (skupínové) průměry v jednotlivých skupinách, které tvoří celýsoubor. Váhamí budou opět četnosti v jednotlivých skupínách.

Protože v praxi jsme často nuceni počítat průměrné hodnoty z rozsáhlých souborů, ječasto velmi účelné nejprve roztřídit průměrované hodnoty a výpočet průměru pak provést jižz roztříděných údajů. V tomto případě pracujeme s třídnim znakem v každém intervalu x,.Nechť četnost v jednotlivých intervalech je ll" počet intervalů je k. Je tedy zřejmé, že každýtřídni znak Xi má různou váhu, a to n,,, výpočet musime provést podle vztahu pro váženýaritmetícký průměr, tedy:

(3.7)

(3.6)

(3.5)

(3.4)

bude nutno řešit limitním přechodem.

H.

kde fl je operátor pro součin.

. prostý aritmetický průměr.

,

(" )L~P(x,y,~O)= uxi' =G,

(Lx;'Y')-' LY,

P(x,y,-I) = LY, = IL-'Y'x,

~>P(x,c,l) = --' = A11

Jestliže za veličinu z zvolime nulu, připad

Výsledkem je výraz pro geometrický průměr:

Z uvedených definičnich vztahů pro průměry vidíme, že při 1POčtu ~růměrné h?d~o~ylze využit různých vztahů, avšak dostaneme rozdílné výsledky. Z teto ~kutec~ostl vyplyva, ~eneni jedno podle jaké formy průměru určíme průměrnou hodnotu. 1 yp prumě~u bud; danpovahou průměrovaných hodnot a cílem průměrování. MezI jednothvym. uvedenym, pruměryplati majorantni vztah podle velikostí veličiny z:

(3.8)

1. Součet všech odchylek od aritmetického průměru je roven nule. Tato vlastnost jedůsledkemdefiničníhovztahu (určující vlastnosti):

(3.12)

2. Jestliže každou hodnotu x, změníme o totéž číslo c, pak se i průměr změní o tuto hodnotu:

Vynásobime-Ii každou hodnotu x, konstantní hodnotou c, pak se i průměr změní c-krát

tedy, že hodnota průměru vypočtená podle vztahu pro harmonický průměr je maximálněrovna hodnotě vypočtené jako geometrický průměr atd. ?ilsled~em uvedene~o" vz:t~u jeztráta libovůle použít té které formy výpočtu pnlměru, nebot ta je dana povahou resene ulohy;Výběr formy průměru je dán určujicí vlastnosti průměr~. Průměry se obvykle označuJ'

symbolem pro průměrovanouveličinu s pruhem, tedy např. x.

Aritmetický průměr

Aritmetický průměr je nejpoužívanějším typem průměru. Není tomu tak proto, že jdeo jednoduchý vztah, ale proto, že velké množství úloh zejména v ekonomICké oblast.

3

LCX,--==c.x.n

(3.13)

(3.14)

22 23

Page 11: Statistika skripta

4. Aritmetický průmčr součtu

veličin

- L:(x,+ Y,) _ ·x- -I'Y-x+Y= --.fl

veličin (rozdílu) je roven součtu (rozdílu) průměrů těchto

(315)

Po Určen; třidních znaků a vynásobeni příslušnými čelnostmi získáme součet 5260. Tatohodnota je vlastně odhadem celkového počtu vyřazených lahvi. Vydělením celkovým počtemsměn (80) získáme průměrnou hodnotu 5260 = 65,75.

80

')Poslední sloupec je určen k výpočtu rozptylu (viz dalši text).

5. Součet kvadrátl' odchylek od průměru je minimální

růměmého očtu v řazen'ch lahví metodou vhodně zvolenéhoTabulka 3.2

Počet lahvi Cetnost v, v,n, V/1I~X, n,35 2 -3 -6 1845 8 -2 -16 3255 17 -1 -17 1765 26 O O O75 15 1 15 1585 7 2 14 2895 4 3 12 36105 1 4 4 4E 80 X 6 162

Metoda vhodně zvoleného počátku urychluje výpočet (zejména u složitějšíchstatísltckých metod). Při zpracování je třeba dát pozor na to, aby byly všechny intervaly stejnědlouhé, pak lze transformaci provést mechanicky, a to tak, že v místě počátku napišeme lIulu,ve směru rostoucích hodnot x napíšeme hodnoty 1,2, .... , ve směm klesajícich hodnot x, pak-I, -2, .. , .. Pokud lIa kOllci souboru má interval jinou délku, dosadíme do transformačníhopředpisu Tento stav nelze opomenout aní pří práci na počítači. Tímto způsobem lze výrazněsnižit numerické hodnoty (počet nutných číslic pro další zpracování).Při některých staršíchstahst'ckých programech velké numerické hodnoty vedly í k chybám ve výsledku. NovéP~ogramy mají tento problém ošetřen. Použitím standardních statistických programů sevyraz?ě snížila pracnost výpočtu, na druhé straně dobré statistické programy jsou 7..atím promnohe fimny neúnosně nákladné, a proto v textu bude ukázán postup výpočtu bez použitítěchto speciálních programů. Lze však využít např. tabulkový procesor EXCEL.

- 6v=-=0075.

80 '

Tato hodnota není průměrnou hodnotou vyřazeného počtu lahví v pllvodnim rozměnr,musíme dosadit do transformačního vztaJ1U, odkud dostalleme:

x =A + v.h =65 + 0,075.10 =65,75.

v = x - A ,kde A je nový počátek a h je délka intervalu. Postup výpočtu ukážeme v tabulceh3.2 na datech příkladu 3.1.

Tento postup výpočtu, i když je podstatnějednodušši než z netřiděných dat, lze dále ještězjednodušit použitim metody vhodně zvoleného počátkn. Tento postup je vhodný nejen proručni zpracování, ale i při tvorbě různých programů např. v procesoru EXCEL. Jde o postupbez ztráty přesnosti, pracuje se s transformovanýmí veličinami. Počátek je vhodné umislíl conejblíže k hodnotě průměm. Jestliže rozděleni četnosti hodnot je symetrické, půjde o hodnotus největši četnosti. Budeme postupovat podle transformačního předpisu:

(3.16)s =L:(x, -:.:)' =minimum

Výpočet aritmetického_můměm z intetvalového rozděleni četnosti

•. . -d'l . četností vypočteme podle vztahu (3.11).Aritmetícký pnlmer z mtervaloveho ro; ':. eom 'ednotlivých intervalech, tyto hodnoty

V praxi ale obvykle neznáme hodn~ty pmmerduhvd

J středy intervalů (třidní znak), a to na' dh d t N ·častě•• se volt za tyto o a y , , o , .

mUSlme o a nou. eJ , . ..., b J ,. é že chyba v urcem prumeru Jezákladě snahy o minímalizac~ ~zmkaJ~cl ~I~y t eřizla~~ Že délky intervalů jsou stejnéodvislá na kvalitč odhadu dl:ClCh P:l

um~~Lt osttP':á sy'metrickou podobu, vzniklá chyb~. ...... d praxI) a ze rozde em ceno" ade(neJčasteJsl pnpa v .' . I' l' t h ba však může výrazně vzrust v pltp

prlllněru celého soubolu Je z~ra;ldl~ m~ a.•a o c Y'm a posledním intervalu, jestliže tytonedostatečné informac~. o pmmerner~~d~~~~ ~ei.;~~t~ neni symetrické, lze vznikajicí chybuintervaly JSou ?eohram~ene. pOdk~d , P st p vy'počtu ukážeme v přikladu 3.1.zmenšit korekcI na dany typ roz e em.. o u

Příklad 3.1 Výpočet průměru z intervalového rozdělení četností

, '" I d 'e na Iněni lahve. Lahve, které nejsouPři plnění vína do lahvI se vlzualne oS e uJ 't 'hPvY'razenY'ch lahví z 80 směn určete- .. Z .znamu o pac ec .dostatečně naplněny, se ~razuJl. ,e.za 'j ích na 'ednu směnu. V jedné směně se naplmprllměmý počet vyřazenych l!Jhvl pnpadaJ c. J, h lahví byly utříděny a jsou uvedenypřibližně stejný počet lahví.. Udaje o počtu, vyrazenycv tabulce 3.1. V téže tabulce Je proveden I vypočet.

Tabulka 3.1 Výpočet pnlměrného počtu vyřazených lahvi za dobu jedné směnv

Počet lahví n, X, x,n, x/ni

2 35 70 2450- 4012008 45 360- 50

5142517 55 935- 60109850- 70 26 65 1390

- 80 15 75 1125 8437550575- 90 7 85 595

4 95 380 36100- 100110251 105 105- 110

80 X 5260 362000L

2425

Page 12: Statistika skripta

Geometrický průměr

Prostý geometrický průměr určíme jako n-tou odmocninu ze součinu průměrovaných

hodnot. Určující vlastnost geometrického průměru stanoví, že nahradíme-Ii každýprůměrovaný člen průměrem, pak se součin nesmí změnit.

G = ~(]XI

Zlogarítmováním dostaneme:

(3.17)

Tabulka 3.3 Plnění plánu v jednotliVÝch závodech

Závod Plán v Skutečnost v Procento1000 Kč 1000 Kč splněni plánu

1. 105024 102587 97,682. 12210 12296 100,703. 6052 7158 118,274. 5213 5213 109,265. 3988 4025 100,93l: 132045 131 279 (99,42)

Průměr poměrných hodnot

Příklad 3.2 Určení splnění plánu podniku za měsíc

Kvadratický a kubick)' průměr patří do oblasti mocnínových průměrů, v ekonomicképraxi nemají téměř použití.

Při určování průměru poměrných hodnot se setkáme s využitiol harmonického průměru.

Je to opět oblast, ve které se v praxi hodně chybuje.

(3.19).100%.

~Sklll, ~ Skl/I, ,L, L,--,-pian,';1 .100% = ,&'I plall;

Lplán, ±Plán,I I ;=1

Takto vypočtená hodnota Je průměrem procent splnění plánu, není průměrnýmprocentem!

Vidim~, že ~odnik jak? cel~k plán n.esplnil, ač čtyři z pěti závodů jej splnily, dva závodydokonce vyrazne. Zdanhve male nesplnem planu prvni ol závodem má však velikou váhu topr?to,. že, tento ~ávod se ~ozh~dující měrou podilí na množství produkce celého podniku.P~meme splně~'. planu p,:t, zavody nelze stanovit jako součet splnění plánu jednotlivýmizavody, vyděleny Jejich poetem, nelze tedy použít vztah pro aritmetický průměr:

, skULL:--' .100%'"' plán, 526 84

5 =-5-'- =105,37%.

," sklll-:- 1 131279';'--.100% = ---.100% = 99,42%

" " 132045L..JPlan;1::1

.. prům,ěrné.splnění plánu pěti závody je vlastně splnění plánu podniku, proto tuto hodnotuurclme z udaJu za podmk:

, ,U"..edli j~me tak první a základní cestu pro určení průměrného splnění plánu. Často sest~va, ze zname splnělÚ plánu jednotlivých závodů a máme určit jejich průměrné splněnípla~u, známe tedy jednotlivé poměrné hodnoty, tato informace však nestačí, musíme znátnavlc buď hodnoty ve jmenovateli jednotlivých poměrných hodnot nebo hodnoty v jejichčlI~tell (vahu); Probereme nejprve alternativu, kdy známe jednotlivé poměrné hodnoty a údajeve Jmenovateli těchto poměrných hodnot. Musí platit:

(3. I8)L:logx,

10gG=--·.n

Vidíme, že logaritmus geometrického prumeru lze určit jako aritmetický průměr

logaritmů pJŮměrovaných hodnot. Nutno dodat, že v praktickém využítí geometrickéhoprůměru počítáme výhradně s kladnými čísly, takže vztah (3. 18) má význam.

Dosud jsme se zabývali stanovením průměrů z neodvozených velíčin, tj. veličín, které lzezpravidla jednoduše zjistit. Při provádění ekonomíckých rozborů se však často setkávámes problémem určeni průměrů poměrných hodnot. Jde nám o stanovení průměrné hodnotyukazatele pracností, průměrných měrných nákladů, průměrné měrné spotřeby energíía stanovení splnění plánu za vyšší organizační jednotku. Stanovení průměrné hodnotyu poměrných hodnot ukážeme v příkladu 3.2 na případu splnění plánu podníku, který má5 závodů.

Podnik má 5 závodů. Určete průměrné splnění plánu pěti závodů. Plánované hodnotyí skutečně dosažené hodnoty jsou uvedeny v tabulce 3.3. V téže tabulce je též uvedenosplnění plánu v jednotlívých závodech.

Pomocí geometrického průměru musíme stanovovat průměrné tempo růstu, zde nelzepn"'měr stanovit pomocí arítmetíckého průměru. V tomto stanovení se velmí chybuje. Nutnostpoužítí geometrického průměru je důsledkem toho, že základ řetězového údaje se neustálemění, a že růst za n období lze vyjádřít součínem daných temp růstu.

pom~odnh°tyhv čítateli jsme formálně vynásobili a vydělili hodnotami plánu (jmenovatelemrnyc odnot) Vidíme že vy'sled , t h' '" . . k' ••

poměrn'ch hod' '. , ny vz a Je vazenym antmetlc ym prumeremY not, kde vahou Je Jmenovatel poměrných hodnot.

2627

Page 13: Statistika skripta

Jiný případ nastává, když známe jednotlivé poměrné hodnoty a údaje v čitateli

poměrných hodnot. Z definičního vztahu pro splněni plánu lze psát., ,Lsklll, Lskul,-'=-'--- 100% =----""------ .100% =99,42%. (3.20)" . ~ plál/, "L, pláli, L, ---.SClIl,

II skUl,

Z tvam vc vztahu (3.20) vidime, že se jedná o hannonický průměr, kde váhou je čitatel

poměrné hodnoty. Lze zevšeobecnit a stanovit poučku: pomčr poměrných hodnot určíme

pomocí váženého aritmetického průměm, a to tehdy. jestliže známe jednotlivé poměrné

hodnoty a údaje ve jmenovateli. Známe-Ii jednotlivé poměrné hodnoty a údaje v jejichčitateli, musíme použít harmonický průměr!

3.2 Kvantily (QJ

Kvantily jsou střední hodnoty, které dělí soubor na určité části, k %-ní kvantil jehodnota, kdy tuto hodnotu nebo menší hodnotu nabude právě k% případů z celku. Kvantilyjsou důležitým prostředkem popisu soubom, jejich významné postavení mezi statistickýmimírami je především při využití pravděpodobnostních metod, a to zejména v oblastistatistického odhadu a testování statistick}'ch hypotéz.

1/ - počet údajů,

f~, - četnost v intc:rvalu, kdc leží medián ("prostřední interval"),S - kumulat'~nt cetnost v lnt~rvalu, který předcházi intervalu, ve kterém leží mcdiiln,

Jde o pocet hodnot, ktery v souhrnu předchází "prostřední interval"I - rozpětí hodnot v "prostředním intelvalu ll. •

Dalšín~ významným.i kvantily v ekonomické oblasti jsou kvartily - hodnoty, které dělísoub~r na ctvrtmy. Dolnl kValtl1 Q25, horní kvartil Q75 a prostřední kvartil Q"" kterým je

medl~,n Tyto míry se využívaji v tzv. pyramidové analýze. O této metodě bude pojednánov dalSIch dlsclplmach oboru Ekonomiky a řízení chemických a potravinářských podniků.

Jinými používanými kvantily jsou pentily, které dělí soubor na pětiny, decily, dělícísoubor ~a desetmy a percentl~y, ty děJi soubor na setiny. Výpočetni vztah těchto kvantilů jeobdobny Jako vztah (3.21). Mlsto polovmy soubonl se vezme jeho daný podíl.

3,3 Modus (mo,)

,~od?s je h~dnota, kt~rá ~ná největší četnost, je tedy nejčetnější hodnotou. Určeni moduse va~e, vyhr~dne na ~'ozdelelll čelností. Statistický význam modu neni stejný pro diskrétnia spoJlte vehcmy. U dIskrétních veličin je modem ta hodnota, která má největši četnost. Tatohodnota Je z rozděleni četností zřejmá.

U spojí~ý~h ;eličín, u inte,:"alo~éh~ rozdělení četností, určení modu vyžadujeaprox,mallvm vypocet. Pro praktlcke vyuz,tl Je dostatečný lineární aproximativní vztah:

V popísné statistice, při hodnocení souborll v ekonomické oblasti se využívá především

50% kvantil. Této hodnotč je vymezen zvláštní název, a to medián. Je to hodnota, která dělí

soubor na dvě poloviny. Je to míra vhodná při popisu úrovně souboru zejména v těch

případech, kdy chybí kvalitnější informace o okrajových hodnotách v souboru, neboť je tomira, která nereaguje na extrémní hodnoty.

_ xD )/, + xH JI,mo - ------- > kde

x /I, +//, (3.22)

Poněkud složitější je výpočet mediánu ze skupinového rozdělení četností. V tomtopřípadě již neznáme jednotlivé hodnoty uvnitř každého intervalu, a proto předpokládáme, žejejich růst je v každém intervalu rovnoměrný. Výpočet mediánu pak provedeme interpolací,nejčastěji podle vztahu:

Medián stanovujeme jednak z uspořádaných hodnot podle velikosti, jednak z rozdělení

četností. Principem je nalezení prostřední hodnoty. Tuto hodnotu u lichého počtu údajů

nalezneme jako 1/ + I _ tou hodnotu. Jestliže určujeme hodnotu mediánu ze sudého počtu2

měření z uspořádaných hodnot podle velikosti, pak za medián budeme považovat hodnotu,kterou určíme jako arítmetický průměr ze dvou hodnot, které se nejvíce přibližují mediánu.Máme-li tedy k dispozici 50 měření, mediánem bude hodnota s pořadovým číslem 25,5. Jejíhodnotu určíme jako průměr z hodnot, které jsou v pořadí na 25. a 26. místě.

'!..-sme = x +1 1 - , kdex D . fl

p

(3.21)

XD - dolni mez nejčetnějšího intervalu,x/{ - horní mez nejčetnějšiho intervalu,

/I, - rozdíl mezi největší četnosti a četností v intervalu, který předchází nejčetnější,R, - rozdll mezI neJvětši četností a četností v íntervalu, který jej následuje.

Označime-li rozdíl XII - xI) = i, lze dosazením do vztahu (3.22) pSál:

_ i.RImoz-xD + --,R, +11"

3,4 Střed rozpětí (C)

Střed rozpětí je definován jako polovina ze součtu nejmenší a největši hodnoty:

c = xlnIQ + xlllll.'t

2

(323)

(333)

XD - dolní mez intervalu, kde se nacházi medián,

28

Tato mira se využívá v některých připadech při statístické regulaci výrobniho procesu.

29

Page 14: Statistika skripta

Přiklad 3.3 Určení středních hodnot

Tabulka 3.4 Měrné spotřeby elektrícké energie při výrobě karbidu vápníku

(3.35)

(3.37)

(a-h)'~o,

a' -2ah+h' > O

a'+2ah+h' ;4~h,(a+h)' ~4ah,

a+h r-->-vah2 - .

I ~ 4ab(a +b)' vynásobíme výrazem a.b,

4a'h'ah ~--- odmocněnímdostaneme

~+~' ,

.fab ~ 2ab = _2_a+b 1 1

-+-a b

Dodatek ke 3. kapitole

Vztah mezi aritmetickým, geometrickým a harmonickým průměrem

Odvození vztahů je provedeno dHodnoty a a h mají stejné znaménko. pro va prvky. Závěr lze zobecnit úplnou indukci.

Vidíme, že a:j~etický průměr není menší než průměr eometrick'vztahu (3.35) vydehme hodnotou (a+b), tím dostaneme g y. Dále obě strany

a+h~ 4aba+b'

a+b 2ab 2--~--=--

2 a +b .!. +.!. (3.36)a h

Aritmetický průměr je tedy větší nebo roven průměru harmonickémuvztahu (3.35) vydělíme výrazem (a+b)', dostaneme: . Pokud obě strany

(3.34)

Získáno postupem jako v příkladu 3.1.x= 3,662

Určete středni hodnoty měrných spotřeb elektrické energie při výrobě karbidu vápniku nazákladě hodnot uvedených v tabulce 3.4. Měrné spotřeby představují spotřebu elektrickéhoproudu v jednotlivých výrobnich dávkách, těch je hodnoceno 182.

91-61me, =3,64+0,04'60=3,660,

3.5 Vztah mezi aritmetickým průměrem, modem a mediánem

Jestliže zkoumané veličiny sleduji symetrické rozděleni, je zreJme, že hodnotaaritmetického průměru, mediánu i modu je stejná. Jestliže v jednovrcholovém rozděleni

četnosti nejprve četnosti stnněji rostou a po dosaženi maximální četnosti volněji klesaji,mluvime o levostranném rozděleni četností. V tomto připadě modus leží nalevo od mediánua ten nalevo od průměru. Je to proto, že na obou stranách od mediánu leži stejný počet

případů, avšak levá část je rozprostřena na kratšim úseku než pravá, proto také modus musíležet v levé části. U pravostrannébo rozdělení čelnosti naopak platí vztah:

Měrná spoti'eba Cetnost Kumulativní v, VIIiel. energie n, četnost

(kWh/ko CaG,1do 3,56 3 3 -3 -9

· 3,60 8 11 -2 -16

- 3,84 50 61 -1 -50

- 3,68 60 121 O O· 3,72 42 163 1 42

· 3,76 15 178 2 30

· 3,80 4 182 3 12

L 182 X X 9

Tím jsme dokáz r . h '"a I, ze armomcky pruměr neni menší než geometrický průměr.

Součet kv d '. da ratu o chylek od průměru je minimální

Hledáme odpověd' na otázku d kl .' Id' •tedy hledáme přislušnou h d A o ele 10 noty Je soucet čtverců odchylek minimální

o notu ze vztahu '

10mo, =3,64 +0,04 28 =3,654.

{. .Protože mo, < me, < x lze dané rozdělení četností považovat za levostranné. Jelikož

však rozdíly mezi uvedenýmí středními hodnotami jsou velmi malé, dané rozdělení četností

lze považovat z praktického hlediska za symetrické.

Poznamenejme ještě, že X není průměrnou měrnou sp€ltřeboll, ale průměrem z měrných

spotřeb. Pro určení průměrné měrné spotřeby el. energie je třeba ještě znát váhu, tj.buď údaje v čitateli nebo jmenovateli měrných spotřeb.

/ = L (x, - A)' = minimum,(338)

(3.39)

30

3t

Page 15: Statistika skripta

Tato podmínka je splněna pokud A = x, což plyne z určující vlaslnosti aritmetického

průměru.

Kontrolní otázky a úlohy

4. MÍRY VARIABILITY

V předchozí kapitole jsme poznali první míry, které popísují soubor dat, a to jeho úroveň.

Tyto míry však obvykle nestačí k hodnocení zkoumaného jevu. Je sice pravda, že ze vztahumezí průměrem, modem a medíánem si dovedeme zhmba představit tvar rozdělení četností,

ale tato ínformace v praxi nestačí. Je nutné definovat míry, které by popísovaly proměnlivost

hodnot, tedy variabilítu, z druhé strany můžeme hovořít o homogenitě souboru.

3.13.23.3

Charakterizujte základm vlastnosti geometrického průměru

Charakterizujte pravostranné rozděleni četností • .• .Na základě dat tab. 3.5 stanovte průměr, modus, medián. Určete t~p ~oz~elen~ cetnostl.Dále stanovte podmínky, kdy prirměr ze zadaných hodnot bude pmmernym vykonem.

Tyto míry, které nazýváme míramí varíability či mírami měnlívosti, vyjadřují téžstupeň stejnorodosti neboli homogeníty statistických údajll. Nutno konstatovat, že míryvaríability mají vedle středních hodnot největší důležítost. Mnohá praktická zkoumánísouvisejí právě se zkoumáním zdrojů variabílíty hodnot.

Tabulka3.5 Rozděleni četo"stí výkonu zařizení

Výkon . Četnost

(kg/hod) A B C

1440· 2 - 2

1460 - 9 - 9

1480 - 13 - 13

1500 - 18 2 20

1520 - 30 7 37

1540 - 28 18 46

1560 - 18 9 27

1580 - 15 12 27

1600 - 4 20 24

1620 - 7 10 17 -1640 - 1 9 10

1660 - 1 8 9

1680· - 4 4

1700 - - 1 1

L 146 100 246

4.1 Variační rozpětí R

Variaění rozpětí (často zvané krátce pouze rozpětí) je nejjednodušší mírou varíabilíty.Je definováno jako rozdíl mezi největší a nejmenší hodnotou souboru, tedy:

(4.1)

Jíž z uvedené definice vidime největší přednost této miry, a to jednoduchost výpočtu.

Nevýhodou této míry je skutečnost, že je odvíslá pouze od dvou, a to extrémních hodnot.Tedy jedíná extrémní hodnota zvýší velikost varíačního rozpětí. Z této skutečnosti vyplýváí použití této míry. Lze jí doporučít pro hodnocení varíabílity malých souborů, souborů dorozsahu 15 měření, lépe však do lO měření. Tyto případy jsou stále ještě významné např. při

uplatnění statistícké regulace výrobního procesu. O statístické regulací bude pojednánov kapitole 14.

4.2 Kvsntilové rozpěti RJO(J..li

Pří snaze využít numerickou jednoduchost variačního rozpětí a při potlačení vlivuextrémních hodnot se používá kvantilové rozpětí, které je dáno rozdílem dvou kvantilů,

obvykle symetricky rozdělených ve vztahu k mediánu, definujeme jej ve tvaru:

11'00 2i = Q,oo , - Q, , kde

QlIJO.' a Q, představují horní a dolni kvantil.

(4.2)

32

V ekonomické oblasti častým případem kvantilového rozpětí je kvs.1ílové rozpětí, jdeo rozdíl horního a dolního kvartilu:

. V technické praxi mezi nejpoužívanější patří 99% , 95% a 90% kvantilová rozpětí. Tatootázka bude probrána v kapitole, pojednávající o statistickém odhadu.

33

Page 16: Statistika skripta

4.3 Průměrná odchylka aPři snaze do míry variability zahrnout všechny prvky souboru dospívá~e k m~ře,v ve

které sčítáme všechny odchylky naměřených hodnot od určité hodnoty, neJčasteJI od, prum:,ru,někd od medíánu. Protože součet všech odchylek od průn:ěru j,e .r~ven n~le, mUSlme sCI~attyto ;ozdílY v absolutní hodnotě. Protože velíkost tohoto souctu zavlSl na poctu hodnot, soucet

vztahujeme na jedno měření, tedy:

Výpočet podle vztahu (4.5) dovoluje využít metodu vhodně zvoleného počátku. Při

přepočtu do původních veličin stačí směrodatnou odchylku zvětšit c-krát, což vyplýváz předchozích dvou vlastností rozptylu.

Připomeňme zde ještě vlastnost, že rozptyl kolem průměru je minimální, což bylodokázáno v předchozí kapítole.

4.4 Rozptyl (?) a směrodatná odchylka (s)

Jinou cestou jak překlenout skutečnost, že součet,odchyl~k ?d průměru je roven nule, jeumocnění odchylek na druhou. Získáme tím míru, ktera se nazyva rozptyl.

Jestlíže výpočet provádíme ze skupinového rozdělení, četností, hodnotu p~měrnéodchylky určíme váženým aritmetickým průměrem z absolutmch hodnot odchylek, vahc:u J~četnost. Takto lze postupovat u absolutních údajů, ,u poměrných hodnot Jde opět o vazenyaritmetický průměr, ale váhou je jmenovatel poměrne hodnoty.

2 L(X' _X)2s =

r nTento vztah lze upravit na zpravidla výhodnějši výpočetní tvar:

Ci = =L,,-Ix,,-,--,xln

~Idl - L~~_'--__, pro utřiděná data pak d =--- .n ' n

(4.3)

(4.4)

Z vlastností směrodatné odchylky uveďme ještě skutečnost, že v íntervalu (x ±k.s) leží

alespoň (I - -;-).100% hodnot hodnoceného souboru, ať je jeho rozdělení četností jakékoli.k

Půjde-Ii o jednovrcholové rozdělení četností, pak jich bude alespoň (1- __I_,J100''/0.2,25.k

Veličína k se obvykle volí 2 nebo 3. Tato vlastnost plyne z Čebyševovy nerovnosti 2. typua bude dokázána v kapítole ll. Jde o významnou vlastnost, které se používá k hrubémuposouzení správnosti výpočtu směrodatné odchylky a dále pak ve statistické regulacivýrobního procesu (viz kapitola 14).

V poslední době je rozptyl definován výrazem, kdy ve jmenovatelí nevystupuje počet

měření II, ale velíčina (n -I) nazývaná počet stupňů volnosti. V tomto textu se přidržíme

z praktických důvodů definice s počtem měření n. Tím se nám některé vztahy poněkud

zjednoduší. V oblasti statístického odhadu bude tato otázka diskutována a bude tam téžvysvětlen význam novější definice. Na tuto skutečnost je třeba upozornit s tím, že nakalkulačkách je námi definovaná směrodatná odchylka pod označením o.

Směl"Odatná odchylka je kladnou hodnou odmocniny z rozptylu, tedy:

2 -2=Xr -x

LX~ -2=---x =

n

(4.5)

(4.6)

Příklad 4.1 Výpočet rozptylu a směrodatné odchylky

Určete rozptyl a směrodatnou odchylku na základě dat z příkladu 3. 1

S.2 =362000 _ 65,752 =4525 _ 4323,06 =201,94,

80

sr = 14,21.

Při použití metody vhodně zvoleného počátku dostaneme:

Nyní poukážeme na dvě významné početní vlastnosti rozptylu.

1. Rozptyl se nezmění, jestliže ke každé hodnotě připočteme konstantu c, neboť:

2 162s. =80 -0,0752 =2,025 - 0,005625 =2,019375

n2 kr'

2. Jestliže každou hodnotu vynásobíme konstantou c, hodnota rozptylu vzroste c at.

L(CX, _ci)2 _c2 ~(x, _X)2 =s;

fl 11

34

(4.7)

(4.8)

s. = 1,421 .

Využitím vlastností rozptylu dostaneme:

2 2 2S. =h oS. =100.2,0194 =201,94,

s. = 10.1,421 = 14,21.

35

Page 17: Statistika skripta

4.5 Variačníkoeficient lIx

Všechny dosud ukázané miry variability jsou miry, které mají ráz absolutnich ukazatelů

a závisejí na měrné jednotce, ve které variabilitu měříme, pak do jisté miry je ztiženoporovnáni variability u různých sledovaných souborů. Proto se definuje poměrná miravariability - variační koeficient, který porovnává směrodatnou odchylku s průměrem, tedy:

.., Soubory ,:,.ěření ,vy~azuji vlastnč stejnou variabilitu, ale variační koeticienty se znacněhSI podle pouzlte merne, Jednotky.. V případě, že se hodnota plůměru blíží k nule, znacněnaroste hodnot~, va?ačmho koefi,clentu. Je zřejmé, že častá tvrzeni, že pokud je variačníkoeficIent mensl nez 0,05, Je dany soubor homogenní, je přinejmenšímdiskutabilní.

. Obdo,bně ~1U,sím.e být opatrní ~ři hodnoceni poměrné průměrné odchylky, definovanéJako pomer prumerne odchylky a pruměru:

Sllv.x=-=-.

X(4.9)

(4.10)

Protože směrodatná odchylka i průměr mají stejný rozměr, zdá se, že variačni koeficientnebude na rozměr citlivý. Tedy budeme-Ií porovnávat dvě měřici metody, přičemž prvnívykazuje menší hodnotu variačniho koeficíentu než druhá, zajímá nás, zda pIvní měřici

metoda dává přesnější výsledky než druhá. Bylo by tomu pouze tehdy, jestliže průměry

v obou souborech by byly stejné. V praxi tomu tak ale vždy není. Variační koeficient je totižzávislý na velikosti své báze, tedy hodnotě průměru. Tato skutečnost bude patmá z dalšíhoilustrativniho přikladu.

Příklad 4.2 Porovnání variabílilY..i1QmOci variačních koeficientů

4.6 Určení celkového rozptylu ze skupinových rozptyll.

Představme si úlohu, kdy zkoumáme výtěžky reakce při použití rllzných katalyzátorů.

Bylo provedeno /I, měřeni pro první katalyzátor, zjištěna hodnota průměru X, a také rozptyl

SI" Potom postup opakujeme pro druhý, třetí až k-tý katalyzátor. Ze ziskaných hodnot

průměrll pr?jednotlivé kat~IY::átory (sknpinové prilměry) a rozptylů (skupinové rozptyly)chceme, urclt celkovy prurner a rozptyl souboru výtěžků bez ohledu na použitý typkatalyzatoru.

Celkový rozptyl pak určíme ze vztahu:

Ozna~me rozdíl skupinového průměru a celkového průměru symbolem z , tedyZl = Xj -x.

(41 I)

(4.12)

(4.13)

( s,')

má tvar

,. Ln,z,' L(x, -x)'n,

2 ,-,IZl = -- = .------

n n

S2=S::!+Zix , ,

Určení celkového průměru (průměru výtěžků) určíme na základě poznatk!1 z kapitolypojednávající o středních hodnotách (kapitola 2) jako:

k

LXi/l,x= '-:1 _

/I

tedy celkový rozptyl určíme jako součet průměru skupinových (dílčích) rozptylů

a rozptyl skupinových (dílčich) průměrů z,' , nebot'

rozptylu, ale jde o skupinové prllměry.

Q je symbolem pro celkovy' s 't"t • d"I'" ._, .Ik 'h ouce c vercu, vy e em poclem merem /1 vede k určeni

ce OVe o rozptylu Ve r"" Qk I '. . ve Icme ,se promitá součet čtverců způsobený druhemata yzatoru mluví se o so 't čtv • , .

, IIC II erCII mezI skuplllamí, v hodnotě Q, sOllčet čtverc!1 uvnitř

Porovnejte variabilitu teploty, měřenou v různých jednotkách.

Tabulka 4.1 Tabulka naměřených hodnot, porovnáni varíačních koeficient!l

n'C = (273,2 + n)K ,5

n'C = (32 +-n)'F.9

Z tabulky je vidět, že variačni koeficient vykazuje u jednotlivých souborů značně

rozdílnou hodnotu, i když jde v podstatě o tři stejné soubory dat, o vyjádření teplotyv různých stupnicich dle známých vztahů:

Číslo x, ťC) X, (K) X3 ťF)měření

1. ·5,2 268,0 22,62. ·3,7 269,5 25,33. ·1,4 271,8 29,54. '1,0 272,2 30,25. ·0,8 272,4 30,66. 0,1 273,3 32,27. 0,9 274,1 33,38. 3,4 276,6 38,19. 3,7 276,9 38,710. 4,2 274,4 39,6

x, 0,02 273,22 32,04

s, 29,671 29,671 53,200

v, 148,355 0,0101 0,1672

3637

Page 18: Statistika skripta

skupin. Ten představuje variabilitu způsobenou všemi ostatnimi faktory kromě katalyzátoru.V praxi se obvykle urči Q podle upraveného vztallU a Q, rovněž podle upraveného vztahu,

veličina Q, se dopočte. Výpočet lze urychlit využitim procesoru EXCEL nebo využitím

speciálních programů ANOVA (ANALYSIS OF VARIANCE).

Pro zevrubné hodnocení lze vztahy (3.11) a (3.13) vyjádřit v procentech, část připadajici

na složku mezi skupinami pak vysvětluje vliv působeni katalyzátoru. Přesnějši hodnoceni,a to i s ohledem na existenci náhodného koUsáni bude popsáno v kapitole 16.

Příklad 4.3 Určeni celkového rozptylu ze skupinových rozgtylů

Dá se říci, že ze 20 měření zhruba 25% připadá na rozdílnou práci pracovníků a 75% narozdílnou variabílítu vstupujícího materiálu. Ke zevšeobecněníje třeba využít úplnou analýzurozptylu, viz kapitola 16.

V tabulce 4.4 ukážeme výpočet pomocí vhodně zvoleného počátku a využitím vztahů

(4.20) a (4.21). Je použito transformace v= (x, - 54,0) 10.

Tabulka 4.4 VÝPočet veličin pro aJJalýzu rozptylu

Q=1102+283 __(74+1)' =11037520 ).

Měření v, , v, ,v, v,1. 2 4 -5 252. 14 196 2 43. - - 6 364. 2 4 12 1445. 4 16 -2 46. 15 225 -8 647. 16 256 -2 48. 20 400 - -9. - - -1 1

10. 1 1 -1 1~ 74 1102 1 283

(Lv,)' 5476 X 1 X

Na základě údajů z tabulky 4.2 určete rozptyl váhy pláště pneumatiky způsobený

rozdílnou praci pracovníka (konfekcionéra) a rozptyl způsobený nehomogenitou karkasy(kordová vrstva pneumat.iky).

Tabulka 4.2 Váhy pláště gneumatiky u dvou pracovníků

Měřeni Pracovník 1. Pracovník 2.1. 54,2 53,5

2. 55,4 54,23. 54,0 54,64. 54,2 55,25. 54,4 .53,86. 55,5 53,27. 55,6 53,88. 56,0 54,09. 54,0 53,9

10. 54,1 53,9

~ 547,4 540,1

x, 54,74 54,01, 0,5544 0,2829s,

74' + I'Q, = 10 (74 + I)' = 266 45

20 "

Po určení skupinových pruměru a skupinových rozptylů Usou již v tabulce uvedeny)přistoupíme k vlastni výpočetní tabulce (lze i pohodlně provést v EXCEL).

Tabulka 4.3 Výpočetní tabulka analýzy rozptylu

Pracovník x, /li, ,

Z,, ,

s, /ljS; z, njz i

1 54,74 10 0,5544 5,544 0,365 0,133225 1,33225

2 54,01 10 0,2829 2,829 -0,365 0,133225 1,33225

~ (54,375) 20 X 8,373 X X 2,6645

Q, =1103,75-266,4=837,3

V % dostaneme stejný výsledek lj. 24,14% + 75,86% = 100%.

Dodatek ke 4, kapitole

Odvození vztahu Q~QLii2J

Q= /lS; = i; (x, - x)'., I

Q=2,664 + 8,373 = 11,037,24,14% + 75,86% = 100"10,mezí uvnitř celkem.

38

• K tomuto součtu můžeme dospět postupným načítáním čtverců rozdílů od celkovéhopruměru po Jednotlivých skupinách:

39

Page 19: Statistika skripta

~ ~1~ n

Q=L(X'-X)'+ L(X'-X)'+"'+ L(X'-x)'I=-I I=-I~II t·n,lnlt.+nAl~l

V první skupině je průměrná hodnota X" pak můžeme psát:

(4.14)

''1 '" '"= L(X' -x,)' +L(X'-'X)' +2L(X' -x,)(x, -x)=i"-I ,,-1 ''"1, ,

="ISI +Il I Z1 +0, neboť

(4. I S)

(416)

Obdobněpro druhou skupinu platí:

, 'L (x, - x, )(X, - x) =z,L (x, - XI) = Z,.O =O v důsledku vlastností prl,měru".1 ,-1

(421)

(')' 'n " ('n)'=±_~_"'/lX~ _2~~X"~~X"+l~t.Xlj =

1=-1 n.k Il.k

a/ll

,L(X' -x)'

s' - .!',~,,-'--­,-

Yýpočet veličin O a O, v případě k-$kupin a stejného počtu měření ve skupině ll.

a pro k-tou skupinu pak:

Dosazenim do vztahu (4. \4) získáme závěrečný tvar:

4.1 Dokažte, že platí vztah s =h.s kde v = !_::--.'i.x'·, h .

4.2 Co rozumíte veličinou ll",. Jak $e určí tato hodnota?

4.3 Určete průměr a směrodatnou odchylku na základě dat z tabulky 4.S.

Tabulka 4.5 Rozdělení četností

Kontrolní otázky a úloh)'

X Ilx Y Ily

2,10 5 5,20 12,15 16 5,30 82,20 28 5,40 292,25 49 5,50 362.30 21 5,60 332.35 14 5.70 202,40 9 5,80 112.45 3 5.90 72,50 1 6,00 52.55 2 6.10 4

1: 148 X 154

(420)

(4.19)

(4.18)

(4.17)

N =/l.k,při~. (~ )' ~ )'S2=~- ~ ~Q="'X2_~~x N N L..' N

Ze vztahu (4.5) lze psát:

"L(X, - X)2 = nks; + J1kZ; .'_III '111+' +n!_l

, ,I1S

2:::: "" 11 S2 + "" n.z

2L...Jlt L...JII·,,,1 ,,,1

X - měrné náklady na výlísek v Kčlks

y • obsah vody v surovině v., ',..

40 ~I

Page 20: Statistika skripta

u č t růměrnou hmotnost a směrodatnou4.4 Při balení výrobku se sledujeljkeh04h6m~t~?~tJ:e t~e~ae:průměru navažovat, aby byl splněn

odch lku na základě dat tabu y .. o I ?poža~avek, že minimální hmotnost nesmí klesnout pod 250 g .

Tabulka 4.6 Rozdělení četností hmotnosti baleného výrobku

5. METODY ZKOUMÁNÍ ZÁVISLOSTÍ

V předchozích dvou kapitolách jsme poznali základní statistické míry, které popisujísoubory dat. Ty10 míry rovněž, jak uvidíme, nacházejí uplatněni při zkoumání působení

jedněch veličín na veličiny jiné.

Měřeni Hmotnost Cetnostx, n,

1. 248 4

2. 249 7

3. 250 24

4. 251 56

5. 252 60

6. 253 50

7. 254 38

8. 255 5

9. 256 2

10. 257 2

L X 248

25

Metody zkoumáni závíslostí jsou metody, které umožňují posoudít vztah meziproměnnými velíčinami. Proměnnou veličínou rozumlme libovolnou měřitelnou

charakteristíku, která může nabývat různých hodnot v důsledku své proměnlivosti. Takovouveličinou může být obsah účinné látky v surovině či produktu, teplota v reaktoru, počet

odpracovaných hodin, měrná spotřeba suroviny, náklady na výrobu, tedy veličiny technickéi ekonomické. Konstantními veličínami jsou pak ty, které se neměni. Setkáváme se s nimi vespojitosti s proměnnými veličinami např. v plánovaném experimentu.

Proměnné veličiny z praktických důvodů budeme dělit do dvou skupin, a to na:nezávisle proměnné veličiny,

závisle proměnné veličiny.

Nezávisle proměnnými veličinami se obvykle označují takové proměnné veličiny, jejichžzměna má za následek změnu jiných veličin - závisle proměnných veličin. Kvalita suroviny,měřená např. obsahem účinné látky, vyvolává při reakci změnu v kvalitě produktu, vevelikosti měrných nákladů na suroviny ve výrobě, proto ji zpravidla považujeme za nezávisleproměnnou veličinu; kvalitu produktu, měmé náklady pak za závisle proměnnou veličinu. Při

řešeni úloh v praxi je stanovení nezávisle proměnné veličiny a závísle proměnné veličiny

dáno otázkou praktického přístupu k řešenému problému. Při zkoumání vztahu mezispotřebou suroviny a velikosti produkce je sice zřejmé, že produkt vzniká ze suroviny, alev praxi nás často zajímá otázka kolík suroviny si musíme opatřit, abychom splnili požadovanýobjem produkce, tedy spotřebu suroviny budeme považovat za závisle proměnnou veličinu.

V následujícím textu budeme zatím označovat nezávisle proměnnou veličinu

symbolem x, závisle proměnou veličinu symbolemy.

,

42

Ke zkoumání závislostí lze principiálně volit jeden ze dvou přístupů. Dle prvnihopřístupu můžeme stabilizovat nezávisle proměnné veličiny na určitých, předem zvolenýchúrovních. Pří těchto úrovních provádíme experiment. Pří tomto postupu lze záměrně volitúrovn.ě jednotlivých veličin (faktorů) podle vhodného schématu, mluví se o plánovanémexpenmentu nebo o experimentálním přístupu. Tento přístup dovoluje nalézt takovou strategiiexperimentování, abychom co nejrycWeji a co nejhospodáměji popsali hodnocený jev či

proces a hledalí optimálni řešení, např. vzhledem ke kvalitě produktu, výkonu zařízení neboměrných nákladů. V našich podmínkách je tento způsob zkoumání závislosti zatím omezen nalaboratorní zkoumání, výjimečně na zkoumání v poloprovozním měřitku.

I D~ým přístupem je pozorování prosté. U tohoto způsobu se omezujeme jen naedov~ h~noceného jevu, bez aktivního zasahování do něj. Tímto způsobem postupujeme

I tehdy, JestlIže zkoumání provádíme z archivovaných údajů.

Závislosti podle obecnost', m" děl' d d k "P' .. ., I .m' uzeme tt o vou ategont. rvol tvon zavls oSÍl.t~m.hcké, někdy též zvané funkčni, pevné. Pro ty10 závíslosti je příznačný pevný vztah

mez. záVIsle a nezávísle proměnnýmí veličinami. Jsou-li známy hodnoty nezávisle

43

Page 21: Statistika skripta

funkce). Jde o takové urcení konstant ab Se' .naměřeným hodnotám. Tuto úlohu lz~ řeŠ;t ,regresnl !unkce co nejvíce přibližovala kdefinovat "nejlepší přiblíženi" Za ne'č tV'V' krruznym zpusobem podle toho, jak budemed h I k . ., J as ejSI Itenum se pov v' " 'I

o c ye naměřených hodnot od h d .' azUje nlllllma ni součet čtverců

stanovení regresních konstant je ~ not n~ funkCI ~regresním modelu). Tato metodaStanovení regresních konstant se čas:Onlal~a, ~o ozn~č~ll1m metoda nejmenších ."tverců.

azyva vYlovnanlm.

Vyrovnání přímkou (lineární vyrovnání)

Vyrovnání přímkou lze formulovat jako úloh k '..takovou, která by se co nejvíce přiblížila k ěV~' dl' me~' vsemI přímkami hledámenejmenších čtverců lze kritérium Corm I t

namrenym hodnotam. Podle požadavků metody

u ova matemat.ckym vztahem:

proměnných veličin, je tím determinována hodnota závísle proměnné veličiny. S těmito

závislostmi se setkáváme při popisu základních přírodních zákonů např. ve fyzice či chemii.I

Jako příklad lze uvést dráhu volného pádu s = - gť nebo stavovou rovnici ve tvaru2

pV = RT. Pří formulací těchto zákonů hraje hlavní roli abstrakce a exístence ideálníchpodmínek, které v praktickém denním životě nebývají splněny. Tím dochází k tomu, že prostejné hodnoty nezávisle proměnných veličin dostáváme poněkud rozdílné výsledky, dokoncecelé jejich rozdělení četností. Je to dáno mimo jiné tím, že na výsledek působi i existencenáhody (působení náhodných jevů). Těmto závislostem říkáme závislosti statistické,stochastické, korelační či volné. Korelační závislost hodnotí vztah mezi reálnýmiproměnnými, je prostředkempro zkoumání přičinnosti mezi zkoumanými veličinami.

Pří vlastnilO zkoumání závislosti se setkáváme se dvěma úkoly. Prvním je úkol ,'egresní,což je úkol, jehož cilem je odpovědět na otázku, co se stane se závisle proměnnou veličinou,

jestlíže nezávisle proměnná veličina (nezávisle proměnné veličiny) nabude určité hodnoty.Řešením tohoto úkolu se zabývá regresní analýza.

"/ = L (Y, - Y,)' = minimum, kde

1.=..1 (5.1)

Výsledkem regresní analýzy je regresní model, který může mit podobu grafu či nejčastěji

podobu matematického předpisu. V případě matematické závislosti by tento model bylmodelem jediným, k jeho tvorbě by postačilo jen tolik měřeni, kolik má takový modelkonstant. V praxi se setkávám s korelačními závislostmi, a proto musíme řešit i druhý úkol,úkol korelační. Tento úkol odpovídá na otázku, do jaké míry je regresní model konsistentníse skutečností. K řešení tohoto úkolu se využívá korelační analýza. Korelačni analýza,zejména při pravděpodobnostním přístupu k řešenému úkolu má blízký vztah k analýzerozptylu.

/ - kriteriální funkcey, - výsledek i-tého měření závisle proměnné I'"1': h d tl'" ve lemy y,- o no a eZlCI na regresnim mod I ".:, ./I _ počet měření. e u pro I-te měrem nezavlsle proměnné veličiny x"

Jak známo ze základního kursu matematik" .body, neboli stanovením konstant a y, pnmku lze jednoznačně vymezit dvěmavztahem: ,., a b,., Tvar regresní přímky můžeme tedy popsat

Y=a +b x>a )~..

(52)Na zákl dě ' .a prmelpu metody nejmenších čtv ' v.

(S. I), odkud dostaneme: ercu vztah pro pnmku dosadime do vztahu

Hledání "nejlepší přímk "Id'proměnny'ch a b x) y ze te y formulovat jako hledání minima funkce (S 3) d

~. ~. - ~u

-rv~:~~~~~~~ý;~;r;hk~;;j;;~;T;;:~h;;k,:;-;r;;;:;;;-::::=::;-;=~---:-----:-_. 'mněme si, že proměn ' . ..(hledáme takové, aby regre~~:n~r;;~ hledán,í minima funkce/jsou regresní konstanty a a bty JSOU pevnými hodnotami. ce nejlepe vyhovovala danému kriteriu), nikoli led; x, ~"

5.1 Párová regresni analýza

Párová regresni analýza se zabývá tvorbou regresního modelu pro případ jedné závisleproměnné veličiny a jedné nezávisle proměnné veličiny. S tímto případem se v praxisetkáváme velmi často. Stači vzpomenout posouzeni vztahu mezi výkonem výrobníhozařízení a spotřebou elektrické energie nebo mezi spotřebou suroviny a množstvím vyrobenéprodukce.

Nejjednodušším regresním modelem je spojení skupinových průměrů v připadě, ženezávisle proměnnou veličinu utřídíme do skupin, pro každou skupinu stanovime průměrnou

hodnotu závisle proměnné veličiny a ty graficky spojíme. Vzniklá čára se nazývá empirickáčára regrese. Tento způsob popisu regresního vztahu má svou přednost v jednoduchostia v tom, že nejsme vázáni na určitý typ matematického předpisu. Na druhé straně tento modelneumoži\uje dobrý odhad hodnot závisle proměnné veličiny. Tento způsob tvorby regresníhomodelu není proto příliš rozšířen. Regresi proto častěji vystihujeme regresní funkcí,matematickým modelem. Při tomto způsobu řešeni zadaného úkolu z oblasti zkoumánízávislostí musíme nejprve rozhodnout o druhu modelu. Toto rozhodnuti lze provést nazákladě zkušeností, na základě teoretických úvah, studiem literatury o řešeném problémunebo z obrazu naměřených údajů. V dnešní době některé programy vypočtou vedle sebe řadu

regresních modelů, v dalším kroku se vybírá "nejvhodnějši" z nich. Tento způsob jemechanický, může vést k nevhodnému výběru modelu, a proto jej nelze obecně doporučit.

Po volbě regresního modelu (matematické funkci) je třeba specifikovat konstantyv daném modelu, těmto konstantám říkáme regresní konstanty (parametry regresni

44

•/ = L(Y, -a,., -b_.x)' =minimum

fl ..- .

Můžeme tedy psát:

Oj •fu =2L&,-a,.,-b_x)(_I)=O~ I~I ,- • ,

(S.3)

(S.4)

(S.S)

4.\

Page 22: Statistika skripta

Snadno nahlédneme, že obě derivace druhého řádu jsou kladné, tedy nalezené řešení budeskutečně mínímem.

Získané rovnice upravíme na tvar tzv. normálních rovnic:

(5.12)

Řešením normálních rovnic např. pomocí determinantů dostaneme vztah pro regresníkoeficient ve lvaru:

Z těchto nonnálních rovnic určíme obě regresní konstanty, větší význam má regresníkonstanta b", u přímky označovaná jako regresní koeficient. Tato veličína vyjadřuje velikost

změny závísle proměnné pří změně nezávisle proměnné veličiny o jednotku.

" "I>, =n.ay,+b,,,·I>,,1"'1 1"'1

II n /I

Lx,.y, = a""Lx, +b""L x,' .1:=1 ,,,,1 ,,,,I

(56)

(5.7)

(5.8)

nebo využítím znalostí regresniho koeficientu b", a dosazením do první nonnální rovnice,

čimž dostaneme:

" "LY, -b",Lx,

a =-'='----'.3..-=;;-b X. (5.\3))7: Jl )'%.

Tímto jsme stanovili hodnoty regresruch konstant. Větší váhu má regresní konstanta b""

která nám říká i s ohledem na znaménko, jakou změnu závisle proměnné veličiny y lzeočekávat pří jednotkové změně nezávisle proměnné veličiny x. V praxi nás velmi často zajímái vztah obrácený, tj. jak velkou změnu velíčiny x musime provést, abychom mohli očekávat

změnu závisle proměnné velíčiny y o jednotku. Tento obrácený vztah je nutno řešit zvlášť,

mluvíme o stanovení regresních konstant sdnlžené regresní přímky, ~. konstant a", a b",.

Pomamenejme zatím, že obecně neplatí vztah b",.b", = \, ten platí pouze pro

matematíckou líneární závislost. Sdružená regresru přimka má tedy tvar:

jestliže čitatele i jmenovatele vydělíme čtvercem počtu měření ,l, dospíváme k dalšimuvýpočetnímu tvaru:

X=a",+b",.y.

Regresni konstanty pak učíme podle vztahů:

(5.\4)

- -- \ ~( -)1.. -)Veličina x.y-x.y=-'L, x, -x 1)', - y

n 1==1

je definicí kovariance, kterou budeme značit cov(x,y).

můžemeuvést další tvar pro určení regresního koeficientu:

(5.9)

(5.\0)

Na základě tohoto vymezerua", =x-b",.;;.

(5.\5)

(5.\6)

Regresní konstantu lze buď stanovit přímo z normálních rovnic (5.6) a (5.7) jako:

Z posledně uvedeného vztahu vidíme, jestliže cov(x,y) je rovna nule, bude i regresrukoeficient roven nule. Lze pak tvrdit, že se nám nepodařilo prokázat, že zkoumané veličiny

jsou na sobě lineárně závislé. V tomto případě pak nemá ani smysl počítat druhou regresní

konstantu a",.tato hodnota neru obecně rovna jedné.

Phklad 5. Stanovení regresního vztahu při výrobě kyselíny sirové

:l:ovte vztah .mezi množstvím vyrobeného monohydrátu kyseliny sírové a množstvím;:~:lcev~lého pyntu na základě měsíčnich údajů. Údaje í výpočetní velíčíny jsou uvedeny

(5.\7)b .b = cov(x,y) cov(x,y)Pxy 2' 2

Sz S}'

Všimněme sí ještě, že:(5.11)b = cov(x,y)

'" S ',

4647

Page 23: Statistika skripta

Yýpočet regresního modelu z utříděný~h dat

Pracnost výpočtu i při rozsáhlých souborech dat d .' '" _ 'technIce. Není třeba vlastnit speciální program nes, ustboulPda do pozadl dlky vypocetlllprovedení výpočtu snadné, y, pomocI ta u koveho procesoru EXCEL je

Podkladem pro výpočet je kombínační tabulka K -d' I 'váhu, dano.u je.jí četno,st,í. Tato skutečnost se musí od:::;'it

a'0dnota v tabulce ma různou

V t t - d I i ve tvaru normálních rovnicom o pnpa e noma nt rovnice můžeme zapsat ve tvaru.

lzdelz .. , če pn vypo tu uplatnit metodu vhodně zvoleného počátku.

!J~í regresního koefi' t ..IClen u pro pnpad, kdy známe sl<;~pinové (podmíněmll.p,růmě[\'

V praxi se můžeme setkat s pří d kd :' _, ,_, ,kupinového rozděleni - , p~ em, y nezavlsle promenna veJrcma x Je utříděna do

/I '-noSl' h d ..cetnostl. Jestllze x, znači středy skupin nezávisle proměnné veličiny x'-Cl I o notx y o - 'h '.. • '

pak regresní k ti'" ,p,rumeme odnoty y v He skupme (skupinový, podmíněný) průměroe IClent urč,me podle vztahu' '

Tabulka 5.1 Tabulka .údaji, a-'yý.JlQčetních veličín ve výrobě monohydrátu kyseliny sír()vé

Měsíc y, x, x, XiYi y, Y,

I. 2696 2124 4511376 5726304 7268416 2548II. 2452 1945 3783025 4769140 6012304 2370III. 2688 2264 5125696 6085632 7225344 2687IV. 2418 2079 4322241 5027022 5846724 2503V. 2755 2404 5779216 6623020 7590025 2826VI. 2597 2229 4968441 5788713 6744409 2652VII. 1973 1860 3459600 3669780 3892729 2286VIII. 2512 2130 4536900 5350560 6310144 2554IX. 2018 1535 2356225 3097630 4072324 1964X. 2559 1997 3988009 5110323 6548481 2422XI. 2165 1687 2845969 3652355 4687225 2115XII. 2906 2390 5712100 6945340 8444836 2812l: 29739 24644 51388798 61845819 74642961 29739

x - spotřeba pyritu v tunách,y - produkce monohydrátu kyselíny sirové v tunách.

b = 1261845819-29739.24644 =099176,. 12.51388798-(29739)' ' ,

b = 126184581C)-29739~4644 =081910~ 12.74642961- (29739)' ' ,

b" .b" = 0,99176.0,81910 = 0.81235,

a = 29737 _ O991 762464~ = 44150yx ]2' 12 »

a =24644_0819103973.2=2374". 12' 12 '

Zhodnocení regresních konstant

Regresní koeficíent byx = 0,99176 říká, že s každým zvýšením spotřeby pyritu o jednu

tunu lze očekávat průměrné zvýšení produkce monohydrátu kyselíny sírové o 0,99 tuny.V praxi se však setkáváme s obrácenou úlohou, kdy známe požadovaný objem produkcea máme stanovit očekávanou spotřebu surovíny. Na tuto otázku v uvedeném příkladu

odpovídá regresní koeficíent b". = 0,81910, který říká, že pří zvýšení produkce o jednu tunu

lze očekávat zvýšenou spotřebu pyritu o 0,82 tuny, tato hodnota není převrácenou hodnotoubyx. Tato skutečnost je důsledkem toho, že jde o statistickou závislost, všimněme si, že

b,•.b"" = 0,81 .

48

, ," y)..n)" = n.a + h .'" x nL...J % )~L..J ,. I'

J I ,.,.1

. , .LL:x,Y},I1'1 ::.::a)'XLx,.n" h ~X211I I ,.i I-I YX~ , . , '

X, ~-tá obměna třídního znaku nezávisle proměnné veličiny x,

y, - J-tá obměna třídního znak1, závisle proměnné veličiny y,

". - okrajová četnost veličin x,

n) - okrajová četnost veličiny,

"if - četnost v kombinační tabulce.

Vztah pro výpočet regresniho koeficientu bude dán výrazem:

,f I s f

n.~~Xj'YJ.ll'J - Lx;.n,LyJ.nJ

byx = _'.1 rl. _('":__ ))"~__

I1.LX,2.n, - Lx,.n,,-I ,,,,I

~ '.11.L...., X,·Y, Jl, - '" X.n "'y- /I

I lL...." , L...t , ,__ '~I ,I

. (, )'Il.'f;. X}- .fl; - ~ x; .n,

49

(5.16)

(5 17)

(S 18)

(5.19)

Page 24: Statistika skripta

Vyrovnání exponenciálou

Při popisu řady jevů je vhodným modelem reality exponenciála ve tvaru:

Y =a",.b:X.

Vyrovnání naměřených hodnot přímkou - líneární vyrovnání - je v praxí nejčastějším

případem aplíkace regresní analýzy. Příčíny tohoto stavu lze především spatřovat v tom, žemnohé závíslosti jsou skutečně lineární a jiné se v relativně úzké oblasti od lineárníhoprůběhu přílíš nelíší.

Jestliže však skutečný průběh závíslostí nabývá lokálního extrému pro některou hodnotunezávisle proměnné veličiny, lineární vyrovnání pak nutně vede k nesprávnému závěru, protomusíme přejít na nelineární vyrovnání. Obdobně tak musíme postupovat při širším definičnim

oboru hodnot nezávisle proměnné veličiny.

(5.23)

Je celkem zřejmé, že bezprostředníaplikace metod . W h _. .V řešení si pomáháme zlogaritmovánim kdy součinoVY'YtneJm:ns~cd' ctvercu b~ ne~edla k cíh.

I var preva trne na souctovy:

Vyrovnání parabolou druhého řádu

Normální rovnice dostaneme aplikací metody nejmenšich čtverců pro vztah:

Y = a+bx +cx' . Systém normálních rovnic je pak ve tvaru:

Ý = logY,

a~ = logap-'

b;. = 10gb",.(5.24)

Vyrovnání hyperbolou

" ""I>, =na+bL.;x, +cL.; x,' ,,,,,I ,=1 i-I

Regresní konstanty a a b určíme opět metodou nejmenších čtverců. Výsledkem budouanalogické vztahy jako při lineárním vyrovnání s tím rozdílem, že se v rovnicích místo hodnot

nezávisle proměnné veličíny x objeví hodnoty .~x

YI J'; bo

·w, [>I·ii,x, x,y, Y, b,

[y]= , [Y]= , [b]= ,x, x, (5.25)

Y. Y. b, l; ,x" x"

regresi. Z první normální rovnice pak plyne rovnost

Vyrovnání skupinovými (podmíněnými) průměry

. fl Tento způsob vyrovnání nenašel širši uplatnění mezi techniky ani mezi ekono _m orm~c~ o zko~n;ané závislosti je poskytována rychle a jednoduše. Při tomto zm~o:~

~r~a;~';:~:~:~~i~a~%~~~~t;~~P~~;:~te~uZ~zg;;~~7::~~~~f~::~~~~~d;~:~aplíka~' .at~ a. se ze vsech moznych nejvíce přibližuje k naměřeným hodnotám přizaJože~lopnnclpu n~J~enších čtverců, je tedy určitým limitním stavem. Na tomto principu J'e

I posuzovam zda předpokládan. t . fu k' .Y var regresm n ce Je konSIstentní se skutečností.

Maticový přistup k řešení regresniho modelu

Zápis systému normálních " _. .vhodně defino t' . rovmce Je mozne provest využitím matIcového počtu. Je nutné

va maltce, ktere budou vstupovat do řešení. Detinujme matice:

. Nyn~.mů~eme ~pl~kovat metodu nejmenších čtvercll. Výsledné vztah budou .Jako v pnpade lmearnlho vyrovnání. V tomto případě ale žádáme b bYl .. °lbdob?e

II ' a y y minima ]ZQvan

součet čtverců funkce L.;&-Ýra nikoli funkce";;" Lv - Y)' J d .,,,,1 L.J I I . e na se o tzv. funkcionální

,-'I

r~,] .L - mallce (sloupcový vektor) . I • _'"ryj _matice (sl . vys edků měrem zavlsle proměnné veličinyy (ll. měření)

oupcovy vektor) hod t . '[hl matice (I' no regresmho modelu (hodnot regresní funkce)s oupcovy vektor) re . h k '[rl matice hod t ., gresnlC onstant (uveden i případ paraboly 2. řádu)

no nezavlsle pro ě . I" ,m nne ve lčmy (uveden i připad paraboly 2. řádu).

(5.21)

(5.22)

/I II " II

L.;x,'y, =aL.;x,' +bL.;x~ + cL.; x,' .,,,,I ,..,,] 1=] pol

11 11 11 11

L.;x,y, =aL.;x, +bL.; x; +cL.;x~,1-..1 ,=:I 1:1 1=1

bY=a+-.x

Za jednoduchosti zápisu normálnich rovnic se skrývá dosti značná pracnost při výpočtu,

ten se však snadno provede na počítači. Je třeba již na tomto místě zdůraznit náročnost napřesnost výchozích dat, což v provozním měřítku bývá často problém; jde o vztah chybyměření a variability hodnocených hodnot. Nedostatečná přesnost údajů často vedek nesprávným závěrům, toto je značný problém zejména v oblasti chemíckého průmyslu

v kontinuálních výrobách.

Při řešeni praktíckých úloh se setkáváme s případem, kdy s ,ůstem hodnot nezávisleproměnné veličiny x klesají hodnoty závisle proměnné veličiny y, přičemž se tento pokleszpomaluje. S touto problematikoo se například setkáme při zkoumání vztahu mezi měrnýmí

náklady na výrobek a množstvím vyrobené produkce. Zde diky existenci fixních nákladů

dochází k nákladové degresi, a to můžeme popsat hyperbolou. Vhodným modelem pro popistakových jevů je hyperbola ve tvaru :

5051

Page 25: Statistika skripta

Systém normálních rovníc lze vyjádřit vztahem:

[XrIY] = [xY[xJ[b] ,kde (5.26)

[x)' = [ 1x, x,

... 1]

... x. je transponovaná matíce k matíci [x] . (5.27)

1. Korelační poměr je míra bezrozměrná (j t •. Iklineární transformace výchozích dat L e

t~ cast ':.~ u), a proto na tuto TlltrU nemá vliv

bez nutností zpětného přepočtu. - ze e Y POUZlt metody vhodně zvoleného počátku

Řešenim rovnice (5.26) dostaneme:

~xY[x]) '[x),IY] = [bl· (5.28)

2. Korelační poměr poskytuje největší hodnotu 'h k "též založeny na rozkladu celko '1' zel vsec Olelaclnch měl. Ostatní míry JSOU

. . - ve 10 rozpty u. Na této sk t' ..vhodnostI zvoleneho regresního modelu. u ecnostl Je založen test

5.2 Párová korelační analýza

!<orelační noměr '7,-(5.30)

(5.3] )

(5.32)

11

• •L:(Y,-J;)' L:(Y,-y)'s: = -,~J____ ,, +....!.::-._- ;:;: S2 + Sy' ,

II y~

rozptyl regresní funkce kolem průměru

reziduální rozptyl. '

. Korelační index je mira těsností závislosti ři . . . . •vehčmou, která měří sílu regresního odhadu I tt vy~ovnanl h~ovolnou funkCI, presněji jerozptylu závísle proměnné veličíny na d .' I .~o ;,"a. Je zalozena na rozkladu celkovéhokolem celkového průměru druho . b k

ve~ oz Y'. Ivnl Je rozptyl vyrovnaných hodnot Y

, u Je z yt ovy nebolt reZIduální rozptyl.

4. Maximální hodnota korelačniho poměru 'e rovna 'cd . •..•nastane tehdy, jestliže sledované veličiny n;vykazují l;vn~;'s~Pi~~:~~b~~utento případ

5. Čtverec korelačního poměru udává tu část roz t lu z· . . ...je způsobenazměnou nezávisle proměnné veličíl;/Y. aVlsle proměnne vehcmy y, která

K r lační index '7..

3. Minímální hodnota korelačního poměru j 1 T •.všechny skupínové průměry s . e nu a:.. ento pnpad nastane tehdy, jestliže

I JSOU rovny coz Je obvykle vý tl'sledovanými proměrlllými neexístuje korel '.. .. I '. ra;em o 10, ze mezinekvalitní data. acm zaVls OSl. JlIlym duvodem mohou být

Korelační índex je definován J'ako: - ~.~: - f -;:.'7,. - . 2 - 1- -- _s ' 2

Y S}'

DOSll7enlm do VzIahu (5 31). lze dospět k dalsímu výpočetnímu vztahu:

(529), kde

Tímto zpllSobem lze pracovat na počítači, neboť nejpracnější operace při tomto zpllsohuvýpočtu, tj. stanovení inverzni matice, je součástí standardních programů.

Již na tomto místě je nutné upozornit na případ, kdy nezávisle proměnné velíčíny jsounavzájem v určitém vztahu, jsou tedy korelovány. Za korelované veličíny považujemetakové, jejichž kovarianci nelze považovat za nulovou. V tomto případě regresní model odrážívliv i ostatních, do párové regreslú analýzy nezahrnutých nezávisle proměnných veličin.

Očistění od tohoto vlivu lze provést až při použítí aparátu mnohonásobné regresní a korelační

analýzy.

K hodnocení výsledků regresní analýzy je zpravidla nutné znát i těsnost regresnihomodelu. Síla (těsnost) regresního modelu bude tím vyšší, čím těsněji se naměřené hodnotybudou přimykat k hodnotám na regresním modelu. Tím také regresní model bude mít větší

váhu pro naše další praktícké závěry.

Míry těsností závislosti jsou založeny na zkoumání variabílity hodnot závisle proměnné

veličíny y. Tato variabílita může mít příčinu v působení vyhodnocované nezávisle proměnné

veličiny x, v působeni celé řady dalších veličín, ale i v existenci náhody.

V částí, která se zabývala mírami variability jsme ukázalí, že celkový rozptyl lze rozložitna dvě složky, a to na průměr skupinových rozptylů a rozptyl skupinových průměrů. Tohotorozkladu lze použít ke stanovení vlastností korelačního poměru, který je definován jakoodmocnina poměru rozptylu skupinových průměrů a celkového rozptylu:

Korelačni poměr je míra těsnosti závislostí pří vyrovnání skupinovými prumery. Tutomíru lze tedy určit pouze v případě utříděných údajů do skupin. Výpočet korelačního poměru

neni vázán na apriorní znalost typu regresní funkce, a proto jej můžeme použít k určení sílyregresního vztahu.

5253

Page 26: Statistika skripta

. ' rovést na počítači. Tento výpočet lze provéstVýpočet korelačního mdexu se da ~nadno t t ovnané hodnoty Y

"kdy se opíráme

i bez něj použitím vztahu~ k~~ ne~uslme pObita vyrsniho modelu. Jde nejprve o výpočeto součty, jejichž hodnota Je JIl. znama z tvor y regre

reziduálniho rozptylu:

o definice matíc jako ve vztahu (5.25). Pro vyrovnání

(5.36)

Ze vztahu (5.35) je též zřejmé, že 'J' ='xy =,.

1. Korelační koeficient je míra bezrozměrná.

Vlastností korelačního koeficientu

2. Jestliže korelační koeficient je roven nule, znamená to, že zkoumané veličiny nejsoulineárně korelovány, neznamená to však, že mezí ními neexistuje žádná závislost.

(5.34)

(5.33)

n n n 2i): -aL), -b'Lx,y, -c'L x, .y,1 :;;,-;L,__.-"':!I_--:'~·-'!..-_---""<'-'_-

S)".x =- II

V tomto vztahu se opírámeparabolou lze tak dospět k výrazu:

Vlastnosti korelačniho indexu

Korelační index je bezrozměrná veliČína.]

. . d ' .de o matematickou závislost.Maximálni hodnota korelačního indexuje rovnaje ne, J

2.. I b I rokázána závislost mezi

Minimální hodnota korelačního índexu Je ro~na n~eí ne y a p3. proměnnými veličinamí při zvoleném regresmm mo e u.

. . ' .ako u korelačniho poměru. Je-Ii hodnotaHodnoceni korelačního mdexu Je podobne J ě načí to že byl vhodně vybrán typ

korelačního indexu blízká k hodnotě khorelačdmho Pyo].mad~J:eZtu čás; celkového rozptylu, která, d 1 Čt rec korelačni o m exu v , d Iregresmho mo e u. ve , . v' ličiny při zvoleném regresmm mo cu.

připadá na měnící se hodnoty nezavlsle promenne ve

Korelační koeficient ,, dl'e lineární model. Tento plípad má i svou míru

Nejčast~jším. plípadem re~r~smho ~o e ~~ to tedy zvláštní případ korelačniho inde~~protěsnosti závlsloslt, a to kore~a~DlkoeficIent. t __ d finován jako poměr kovanance veltcm x

, , v' k Korelacm koeficIent Je ez evyrovnam, pn~, ou. v datny'ch odchylek uvedených veličin, tedy:a y dělene soucmem smero

i (x, - i){y, - y) (5.35), = cov(x,y) = II 1/y" pro Y = a+bx.

)I),' sx.Sy n.sx·sy

• v ... ro 'očet korelačllího koeficientu je tvar.Nejčastějším a také neJpresněJSlm ;'zt~h~~ ~ 0:~e tedy zprostředkované hodnoty Jaka

ve kterém se objevují jen součty z naměrenyc o noprůměry či směrodatné odchylky):

3. Korelační koeficient může nabývat kladné i záporné hodnoty, a to ve shodě seznaménkem regresního koeficientu. Záporná hodnota korelačního koeficientu znamená, žejde o neplímo úměrnou závislost.

4. Korelační koeficíent v absolutní hodnotě rovný jedné poukazuje na funkční, a to ještě

lineární závislost mezi zkoumanými veličinami.

!:JQ!!nocení korelačního koeficíentu

Korelační koeficient mŮžeme hodnotit obdobně jako předchozí korelační míry. Čtverec

korelačního koeficientu ,', který se často nazývá koeficient determinace, udává podíl nacelkovém rozptylu hodnot závísle proměnné veličiny vlivem změny hodnot nezávisleproměnné veličíny při předpokládaném lineárním modelu.

Toto hodnocení je na místě pouze tehdy, jestliže korelačIÚ koeficient je statistickyvýznamný Je zřejmé, že korelační koeficient má tím větši váhu, čím větší počet údajů jek díspozíci pří jeho výpočtu. Kdybychom se opirali jen o dvě měření, je očividné, že nemŮže

exístovat žádný reziduální rozptyl, neboť dvěma body ( pokud nejsou ídentické) je určena

přímka Statistická významnost je chápána ve smyslu testování statístických hypotéz (vizkapítola 13), příčemž na korelační koeficient hledime jako na náhodnou veličinu a testujemehodnotu korelačního koeficientu p = Ox) To je případ, kdy neexistuje lineární závislosta mame k dispozici všechna možná měření. Korelační koeficient , považujeme zavyznamný, pokud jeho velikost v absolutIÚ hodnotě je větší než kritická hodnota. Kritickouhodnotu korelačniho koeficientu zjístíme v mnohých statistických tabulkách (viz též příloha4) pro různé hladiny významnosti. Hladina významností a v tomto plípadě znamená riziko(pravděp~dobnost) nesprávného závěru v tom smyslu, že prohlásíme korelační koeficient zavyznamnY,1 když ve skutečnosti Iineárni závislost neexístuje. Příslušnou kritickou hodnotukorel~čniho ko~ficíentu nalezneme pro zvolenou hladínu významnosti a pro příslušný početlupňu volnosti, který představuje počet nezávíslých veličin v systému. Pří vyrovnání

pfimkou .ztrácíme 2 stupně volnosti v důsledku existence dvou vazeb, dvou rovnic pro!anOvem regresních konstant. Tedy počet stupM volnosti se rovná (ll - 2).

'1P Je korelační koeficient v případě v , k d' .. v h ž' vv ,• ze mame Ispozlel vsec na ma na mereOl.

5554

Page 27: Statistika skripta

Příklad 52 Stanovení kritické hodnoty

Phklad 5.3 Zkoumáni působení obsahu peroxidu vodíku v destilačním zbytku naobjem produkce peroxidu vodíku

Tabulka hodnot a 'cin ' t . t· b Ik .'destílačním-zb"'k _odce 1l!-.J!...!L. a zavIslosti obsahlLperoxidu vodíku v____._~"''-.!J.Jla e'lmm oblemlLP-L0du!s.ce.J)eroxidu vodík~ ---

Při výpočtu veličiny ~ v IV . . .L, " i postupuJeme v kombmační tabulce tak že lle·iprve k. 'd'""d ,,=1 ' 'J vazem,. ku vynásobíme hodnotu lY ' , .do každého políčka vedle přÍs~~~~~st~ ~ komb~rnak1ční tabulce n,! a tuto hodnotu pak zapíšemea zapíšeme je do řádku (.. ,ce n~stl. a II získané hodnoty sečteme po sloupcích

lY ln,. soucet techto hod t "dku 'hodnot lY, 42) D'I Id' " no v ra predstavuje celkový součet" . aelOnotyvradkulV . b'/11) vynaso Jme hodnotami VI, tím získáme veličiny

v řádku označeném v lY n J" , "hod' , } Y' eJJch soucet představuje požadovaný součetL: v, w,. Jestliže

noty fadku lY .n, vydělíme hod . ,=]ty dále využijeme'k ' ,notami nI> dostaneme hodnoty skupínových průměrů

e stanoveni emplrick' v, W i ,e cary regrese a ke stanoveni korelačního poměru.

Tabulka 5.2

- .._---

y'" 79 81 83 85 87 89 91 93 95

~~

97 99 101 ni w, WPi W!ňJ1 .

155 1 ~ 2 -10 1'; 4 .2Q

1 -6 -6 36

-iss 1 ., 3 -12 5 .2Q 2 ·6

8 -5 -40 200

~ 1 ~

1

2 '1 ;:11 ·4 -44

~7.21 3 ·9

176

1,85 8.16 5 -10 I16 -3 -48 144

~ 2'13

., 17 -17 5 -5

15 -2 ·30 60

I 2,05 4 11

27 -1 -27 2712 . 3 1

2,15 2,

3 3 18 18 1 \31 O O O

1, , -26

~51°12413

1 1 26

1 2 , 26

2,35 1 3

11 2 22 44

3 '14 " 39 3

-i4s 12

1 12 38 1 4 6 " I

36 108

2,5510 51 9 4 36 144

2'652 1 5 "3 1 7 5 35 175

-TIs1 8 "3 1

,5

7

6 30 180j 1 7 7 71 1

2,85 2"

4 7 28 196

1 8

n, 1 4 8 15 27

3 8 24 192

42 45 22 11 7

v;-3 1 186 X 42

-5 -4 -3 -2

1708

-1 O 1 2 3 4 5 6 X

Vili -5 -16 -24 -30 -27 O 45 44 33 28 15 6 69

v, n, 25 64 72 60 27 O 45 88 99 112 75 36 703

wfl. -5 -17 -25 -59 -43 -23 43 80 38 34 13 6

VIN!" 25 68

42

75 118 43 O 43 160 114 136 65 36 883

1Y, -5 -4,3 -3,1 -3,9 -1,6 -0,5 0,96 3,64 3,45 4,86

z, -5,2 -4,5

4,33 6 X

-3,4 -4,2 -1,8 -0,8 0,73 3,41 3,23 4,63 4,11

z, .n, 27,31 80,13

5,77 X

89,82 259,5 89,28 25,12 23,96 255,9 114,7 150,1 5,62 33,34 1199,781

(537)I

'knl :-=k ~-C='"n-I'

Bylo získáno 186 provozních měření za období delší než plll roku Získané výsledky bylyroztřiděny do kombinační tabulky (tab 5.2). V této tabulce je proveden i výpočet potřebnýchhodnot pro hodnocení zkoumané závislosti.

Objem produkce je měřen v kílogramech, obsah peroxidu vodíku v destilační zbytkuv gramech peroxidu vodíku v litru. Praktícký význam tohoto vztahu spočívá v tom, žev destilačním zbytku zůstává určité procento peroxidu vodíku, rust tohoto procenta nepříznívěpůsobi na nákladovost v této výrobě.

Zhodnoťte závislost mezi denním objemem produkce peroxidu vodíku na jedné destilačníaparatuře (x) a obsahem peroxidu vodíku v destilačním zbytku (y)

Na základě 17 měření jsme zjistili hodnotu korelačniho koeficientu rovnou -0,45.Z přílohy 4 zjišťujeme na hladině významností et~0,05 (5% riziku) kritickou hodnotu rovnou0,4921 (počet stupňů volnosti je 15). Naše hodnota je v absolutni hodnotě menší než kritická,proto nemůžeme řici, že jsme potvrdili lineární závislost mezi zkoumanými proměnnýmí.V tomto případě nemá smysl ani hodnotit daný lineární regresní model. Toto je velmi důležitýkrok při hodnocení výsledků korelační analýzy. Poznamenejme ještě, že dle přibližného

vztahu je r,,,, ~ 1,96. ~.. ~ 0,49, cožje dobrá shoda s tabelovanou kritickou hodnotou a to za. ,,16

horších podmínek, než jsou doporučené.

Při výpočtu je použíta metoda vhodně zvoleného počátku. Ta usnadní výpočet vpřipadech, kdy nemůžeme k výpočtu použít programů na počítačích. Korelační míry zůstanOUbeze změny, protože to jsou míry bezrozměrné. Regresní koeficíent bJ" získáme přepočtem

podle vztahu bJ" ~ b~.~ , kde k představuje délku intelvalu u hodnot y a h je délka intervaluh

u hodnot x. Tento přepočet získáme dosazením transformačních předpisů do modeluW ~ a~ +b~.v. Hodnotu a," stanovime ze vztahu a). = y- bJ"'x .

Velikost konstanty k souvisí s volbou hladiny významnosti a voli se v rozmezí 1,9 až3,0. Vztah uspokojivě platí pro n> 45. Kdybychom chtěli připustit 5% ríziko (et~0,05),volime hodnotu k rovnou 1,96, pro 1% riziko pak k ~ 2,58. Podrobněji viz kapítola 13.

Jestliže nemáme k dispozici tabulky kritických hodnot; kritickou hodnotu korelačníhokoeficientu r,,,, lze přibližně určit podle vztahu:

5756

Page 28: Statistika skripta

=~1~86~.8;8~3~-~69~4~2:;;:;=;;2\ = 0,8087 ,r .. ='yx = f(186.703-69').(186.1708 42')

(5.38)6IA'

R = 1- -i=!-;j kde'1 m,(l2-1/

Vlastnosti koeficientu pořadových čísel

d, - rozdíl pořadí závisle a nezávísle proměnné veličiny,

II - počet měření.

Korelační koeficíent pořadových čísel je zvláštni typ korelačního koeficíentu, kdykorelujeme pořadí hodnot. Dříve se využíval jako "náhražka" korelačního koeficíentu s cílemsnížít pracnost výpočtu u neutříděných údajů. Jednotlívá měření byla nahrazena jejíchpořadím a pro tato pořadí byl vypočten korelační koeficíent. Koeficíent pořadových čísel seuplatňuje u tzv. bodových systémů, kdy se zkoumaný jev ohodnotí body a na tomto základě

se stanoví i pořadí. V dnešní době se výpočet tohoto koeficíentu uplatňuje při různých

sociologických zkoumáních, kdy se posuzuje shoda pořadí např. mezí dvěma hodnotiteli. Jetřeba zdůraznít, že se hodnoti lineární vztah, což vyplývá z odvozeni výpočetního vztahuz korelačního koeficientu. Výpočet tohoto koeficíentu lze provést na počítačí při uplatnění

speciálních programů. Na druhé straně jeho výpočet se dá snadno provést i bez využítívýpočetní techniky. Jeho výpočet se provede podle vztahu:

I. Jestlíže dochází k úplné shodě koeficíent pořadových čísel je roven jedné. V tomto,

případě je očívidně LA = O.1:::\

2. V případě, že dojde k "úplné neshodě" pořadí, tj. k právě obrácenému pořadí, je koeficientpořadových čísel roven (-1).

5.3 Korelace pořadových čísel - Spearmamh korelačníkoeficient Rlj

a = 2,073 _0,064089,74 = -3,670,y.<

b = 12805. 0,10 = 0,0640,'"' 2

s = 0,1.3,022 = 0,3022,y

s =2.1,908=3,816,x

x= 89,00 +0,3710.2 = 89,74,

Jí = 2,05 +0,22580,1 = 2,073,

1708 _(~I' =~9,1318 =3,022,186 186)

1Jyx =

1708,000 +0,249342-1,2805883 = 3,160,s;' = 186

1- 3,160 = jO,6539 = 0,8087,9,132 .

186.883 - 6942 1,2805,b~ = 186.703 - 69'

a = 0,2258 _1,2805.0,3710 = -0,2493,~

s =w

li =~ =0,3710,186

Veličiny pro zhodnocení zkoumané závislosti

Hodnocení: . tedy, ě větší než kritická hodnota, Je , '

Korelační koeficient je v abs.olu;m hodno~oumanými veličinami existuje Imearnl'z.namn', a proto máme právo tvr~~t" z: mezI z eroxidu vodíku v destilačním z~ytk~ Je

:vislos/Čtverec tohoto kodeficll:;ntu ~j,:%~ep~~~:~:e peroxidu vodíku Jestliže.ddenm ~~e~zhruba ze 65% závislý na enmm o , e očekávat že obsah peroxl u vO . e

rodukce peroxidu vodíku vzroste o 1 kg, ~~d: vodiku v' lítru. Ve zkoumané oblast~ I,~~estilačnim zbytku vzroste aSI o 0,.o6~ g ~er roto že není v podstatě rozdíl mezI korelacJl\

" t hodnoceny' vztah za hnearm, atp ,Povazova " ' fi' t m (O 81)" (O 84) a korelacmm koe IClen e , .pornerem ,

(5.39)

i vyjadřuje n-tici stejného pořadí, sčítáme pro všechny případy

společného pořadí s. Pro dvě stejné dvojice a jednu trojici bude:

12

Pří praktické aplíkaci se může stát, že několik hodnot bude mít stejné pořadí. V tomtopřípadě přířadíme každé takové hodnotě stejné - prostřední - pořadí. Jsou-li například

hodnoty na 5. až 7. místě stejné, všem třem hodnotám přiřadíme pořadí 6. Musíme siuvědomit, že tím dojde k určitému zkresleni korelačního koeficientu pořadových čísel.

fl II 11 fl

Sice není porušena vlastnost, že 2> = Li, ale je porušena rovnost Li' = Li' .i=l rel ,=1 l=!

Výpočet lze pak provést podle vztahu:

3

= ~6,450 = 0,8404.9,132

1119,781

1861]~ = 1]" = ~ 9,132

5859

Page 29: Statistika skripta

k =~I~~+~34 =3.12 12

Příklad SA Yýpočet korelačního_~geficientu pořadových čisel

5.4 Kend"flův koeficient konkordance r.

Kendall~v~ koe~cientu konkordance se používá k posouzení shody několika řad pořadívcelku. Pouzlva se nekdy ke stanovování kvality hodnotitelů.

II - počet jednotek,h - počet řad (hodnotitelů),

A, - součet pořadi pro určitou jednotku (výrobek)

Určete korelační koeficient a korelační koeficient pořadových čisel na základě datz přikladu 5. L Obě hodnoly spolu porovnejte.

Vstupní data, hodnoty přiřazených pořadi i výpočetni hodnoty jsou uvedeny v tabulce5.3. Hodnoty pro určení korelačního koeficientu jsou uvedeny v tabulce 5.1.

Tabulka 5.3 Yýpočetni tabulka korelačního koeficíentu pořadových čisel

= 12 ~A'_3}l+~Tk 1 2 °LJ, .

h .ll(ll -I) ,I Jl-I, kde (SAO)

Měsíc y x i j d cf'I. 2696 2124 10 7 3 9II. 2452 1945 5 4 1 1III. 2688 2264 9 10 -1 1IV. 2418 2079 4 6 -2 4V. 2755 2404 11 12 -1 1VL 2597 2229 8 9 -1 1VIL 1973 1860 1 3 -2 4VIII. 2512 2130 6 8 -2 4lX. 2018 1535 2 1 1 1X. 2559 1997 7 5 2 4XL 2165 1687 3 2 1 1XII. 2906 2390 12 11 1 1

1: 29739 24644 78 78 O 32

y - produkce monohydrátu kyseliny sirové v tunách,x - spotřeba pyrítu v tunách,i - pořadí hodnot x podle velikosti,j - pořadi hodnot y podle velikosti.

H = 1- 632_ = O888'J 12.143"

. Při absolutní shodě po!adí je koeficient konkordance roven jedné, při dokonalé neshoděJe roven nule. Postup vypoctu bude patrný z příkladu 5.5.

Příklad 55 Stanoveni koeficientu konkordance

Na základě údajů v tabulce 5 4 stanovte koeficient konkordance 4 hodnotitelé hodnotilipořadi značky piva podlc chuti. Posuďte shodu stanoveného pořadí.

Tabulka 5.4 Pořadí píva dle chuti a výpočet dat pro stanovení koeficientu konkordance

HodnotíteléZnačka

1 A,'oiva 2 3 4 A,A 2 3 3 1 9 81B 7 5 4 6 22 484C 9 7 8 7 31 961O 3 2 1 2 8 64E 10 8 9 9 36 1296F 8 10 10 10 38 1444G 1 1 2 3H 7 49

6 9 7 8 30 900I 4 4 5 5 18 324J 5 6 6 4 21 441l: 55 55 55 55 220 6044

r= - 12~618_4S819-2973924644. =-tQ,8123S =0,901.

f<l251388798 - 24644')(12.74642961- 29739')r. 12 10 t-l

4'10(10'_1) 6044-310

_1

=0912.

Korelačlú koeficient je významný, neboť je větši než kritická hodnota (viz tabulky)Došlo k velmi dobré shodě mezi korelačnim koeficientem a korelačním koeficientel1lpořadových čísel. Z výsledku se dá řici, že zhruba 80% kolísáni objemu produkce .způsobeno různým množstvim spotřebované suroviny. Na kvalitu suroviny (pyritu) a datechnologické faktory připadá asi 20%.

60

Protože vypočte . k fi·shodu pořadí za dobr~~. oe IClent konkordance není příliš vzdálen od jedné, lze považovat

61

Page 30: Statistika skripta

5.5 Hodnocení závislosti kvalitativních znaků

Hodnocené faktory považujeme za nezávislé, pokud testová charakteristika X' je menší

než kritická hodnota veličiny X' pro f = (r -I).(s -I) stupňů volnosti. Kritické hodnoty jsou

tabelovány (např. viz příloha 4). Postup řešeni ukážeme v přikladu 5.6.

Při vyhodnocováni různých anket se často vyhodnocuji závislosti v oblastikvalitativnich znaků. Jednou z možnosti je porovnat pro všechny alternativy skutečně zjištěnéčetnosti s takovými četnostmi, které by odpovídaly případu, kdy hodnocené faktory jsou nasobě nezávislé. Ty snadno zjistíme tak, že relativní četnosti jednoho faktoru vynásobímepočtem zjištěných případů druhého faktoru. Hodnotícím kriteríem je v podstatě test dobré

shody (víz kapitola 13). Určíme velíčinu

~88

C= -'- =0125507,88 ' ,r788

'C = L,- =0089, V2500 ' .

Tabulka 2 x 2

. . Na zák!adě v~likosti obou kontingenčních koeficientů lze prohlásit že zkoumanázavlslost pozadavkú na sportovní přenosy a stupně vzdělání nebyla prokázána:

Tabulka 5.5 Závislost přáni sportovnich přenosů v televizi na Slupni vzděláni

Vzdělání hodně přimčřeně málo ~ hodně přiměřeně

základní 37 55málo ~

22 114 34.656 52.212'VYUčení 46 83 52

27.132 114181 55.024 82.898 43.078 181

střední 48 72 32 152 46.208 69.616vS

36.176 15221 19 13 53 16.112 24.274 12.614 53

~ 152 229 119 500 152 229

Relativní

119 500

četnost0.304 0.458 0.238 1

(5.41)kde

,.(n-n)'X' =LL"' "

1==\ 1",1 n"

r - počet řádků,

s - počet sloupců,

nI' ~ četnost pozorovaná, výběrová)n, _četnost teoretická odpovídající modelu nezávislostí,X' _testová charakteristíka (o jejím významu bude pojednáno podrobně v kapítole 13).

Pro rychlejši hodnocení se stanovuji kontingenčni koeficienty. Pokud tylo koeficientyjsou blizké k nule, považujeme závislost za neprokázanou, pokud jsou blizké k jedničce, jde

o závislost.

. Z~láštním připadem zkoumáni závislosti kvalitativnich znaků je ten, kdy pro každ' faktoreXIstuJI pouze dvě vananty. V tomto případě lze velíčínu X' stanovit dle vztahu: y

ES'c= -­, X' +nPearsonův kontingenčníkoeficient,

(5.42) x'= n(a.d-bc)' _(a + b}(c +d}(a +c)(b +d) .

(5.44)

V uvedených vztazich n představuje počet respondentů, c je menši z hodnot (r-1), resp.

(s-I). Postup ukážeme na příkladu 5.6labu~s~~te zda hodnoceni určité činnosti souvisí s pohlavím. Údaje jsou soustředěny do

Tato veličina máv poličkách 1abulky 2".

C = lL,. VC.fl

Cramerov kontingenčníkoeficient.(5.43)

pouze jeden stupeň volnosti Veličiny

X 2. Postup bude jistě jasný z příkladu 5 7

Pnklad 5.7 Tabulka 2 X 2

a,b,c,d představuji údaje

Tabulka 5.6 Tabulk 2 x 2

x' _ 220(45.55-8.112') _ 220(2475-896)'53167157.63 - 87545241 6,27.

Příklad 5.6 Vyhodnoceni ankety.

Bylo osloveno 500 respondentů s otázkou, zda je v televizi dostatek sportovních přenosů.Odpovědi byly zkoumány s ohledem na stupeň vzděláni. Data i výpočet jsou uvedeny

v tabulce 5.6.

,(37-34,656)' (13-12,614)'X = +... +. =7,88.34,656 12,614

Z tabulek určíme kritickou hodnotu X;,o,,, (6) = 12,6. protože 7,88<12,6 hodnoceni

závislost nebyla prokázána.

Mutleny

A

a 45c 8(8+C) 53

Bbd

(b+d)

11255

167

(a+b) 157(c+d) 63n 220

62 63

Page 31: Statistika skripta

jestliže nezávisle proměnné veličiny budou v sílném korelačním vztahu, bude to mít zanásledek růst diference mezi párovým regresním koeficicntem a dílčím regresnímkoeficientem.

I v připadě korelační závislostí tři proměnných je potřebné slanovit sílu regresníhoodhadu, určit vlastně korelačni índex pro vyrovnání rovinou. Tomuto korelačnimu koeticientuse říká totální korelačníkoeficient. Tento totální korelačni koeficient označime dle zvyklostíjako r,,,, Jeho čtverci se řiká koeficient determínace, Informuje nás o tom, kolik

z variabílity (rozptylu) hodnot XI (faktom před tečkou) je Zpllsobeno změnami hodnot zatečkou, tedy veličinami x} a X3, Po dosazení do vztahu pro korelační index dostaneme:

x~o,o, (I) = 3,84,

Vypočtená hodnota je ~,ětší než kritická, je prokázána domněnka, že existuje rozdíl mezi

muži a ženami vzhledem k cmnostem A a B.

M nohonásobná regresní a korelační analýza5.6, . , ak i ekonomické oblasti zpravidla nevystačime

Při zkoumání závislostí Jak v lechn,lcke, tl d t'l r v celé řady nezávisle proměnnýchI v' ' .. '\ t' ale muslme vy 10 no I v I . , , 'I t's párovou kare acm zaV1S os 1) ...", rčiny) 1 zde zkoumam t.:avtS os 1

, eličin na veličinu závisle proměnnou (zavl sic ptomenne ve I .V v ,

obsahuje úkoly regresni a korelacm.

3

1j2n =B2·rI2 +B3 ·rlJ = LB,fl/",,,,2

(5.49)

Vyrovnání rovinou" ' .. d kdy.. vv> v> ad mnohonásobné zavlslosll, pnpa,

Probereme nejprve neJJednodu~sl,P~'P rčin (označime je jako x, a X3) na závíslehednolíme vlív dvou nezávisle ~~omenn~~ dve ~l' d' me že hodnocené veličiny jsou svázányproměnnou veličinu, kterou oznav~"nevxl' ďe ,~~ oa a ro~náni rovinou. Funkčni předpis taklineárním vztahem. V tomto pnpade te Y J vy

můžeme popsat vztahem:

Xl :;::Q123 +h l2 _3 X 2 +b112x3 ,

v" opěl metoduPro stanoveni jednotlivých regresních konstanl pouzlJeme

čtverců. Výsledkem budou vztahy:

a = x-, -b".X2 -b.,').X3._)'>1 ._J .~."

(5.45)

nejmenších

. (5.46)

Hodnocení totáhúho korelačního koeficientu se provádí obdobně jako u párovéhokorelačního koeficíentu. Rozdíl je v posouzení významnosti, které musime provádět poněkud

jinak. Tato problemalika vyžaduje hlubší znalosti z matematické statistíky, a proto ji zatímrozvíjet nebudeme,

Totální korelační koeficient není jedinou mírou těsností závíslostí v případě vyrovnánírovinou (mnohonásobné regresní závislosti). V případě hlubší analýzy hodnoceného úkolupotřebujeme odpovědět nejen na otázku spolehlivostí regresního odhadu, ale i ohodnotil sílupůsobení jednotlivých nezávisle proměnných veličin na závisle proměnnou veličínu, Tutoinformaci nám neposkytnou párové korelační koeficienty. Jejich hodnoly jsou zkreslenyřadou dalších nezávísle proměnných veličin, které jsou nějakým způsobem svázánys vyhodnocovanou nezávisle proměnnou veličinou, říkáme tak, že jsou v interkorelaci. Odtéto zkresleností můžeme jednotlivé faktory očistit buď ve fázi zjišťováni (muselo by ale jito plánovaný experiment) nebo při zpracování naměřených dat, což je obvyklejší.

(5.50)

(552)

(5.51 )

G5

(I '1;)(1 '1;,):1-(1-")(1-,.,)~ 13 12 3 .

b b _ '13 -'12·rn, , "' - ~(I-r,;)(I'-r~)

r

1',

Hodnoceni významnosti dílčích korelačních koeficientů provádime obdobným poslupemparovych korelačních koeficientů s tím rozdílem, že ztrácime další jeden slupell volnosti,J JIch počet bude (n-3), kde n značí počel měření.

n,l .ch korelačnich koeficientů můžeme využít í při stanoveni lotálniho korelačnihoI .entu Dosazením do vztahu (5.49) lze získat výhodný Ivar:

JI

Pro vyhodnocení sily působeni hodnocené nezávisle proměnné veličiny na závisleproměnnou veličinu pří stabilizaci další nezávísle proměnné veličiny se používá dílčí

korrlační koeficient definovaný jako geometrický průměr sdružených dílčích regresníchkoeficientů, tedy:(5.48)

(5.47)

SI ~ú -=-/:13.:']~ == ~:I_.B 3 .b13z =-' l' 5

')3 -r'23 . 3

, v " rochází bodem, jchož souřadnice jso~Ze vztahu (5.46) je palme, ze regresm rovl~a Pk fi' t' m b se říká ditči regresOl

h 1'V· Zí 'kany'm regresmm oe IClen u Tytprůměry hodnocenýc ve Icm. ,s v ~ kt " značeny'ch v indexu za tečkou. o

. 'h .. d a to podle poclU la OIU o , d etodykoeficienty prvm o ra, u, v' r v' kl ré byly stabilizovány proce urou mfaktory označují nezávls1e promenne. Ve"l~my. o :. e"'nu závisle proměnné veličiny rl

• V r v' b VYjadroje pmmernou zmnejmenších čtvercu, e IClna 123 . , o' t b'lizaci (konstantním působenij

v' . otkové změně nezávisle proměnné vehčmy x, a pn s a I. .

pn jedn. v' 1'" Obdobně bychom hodnotilí koefiClenl b13 "další nezáVIsle promenne ve lemy Xl'

li' tetl, , 'í1čim re resním koeficientem a regresním koe Ic:en ....

Všimněme SI rozdllu mezI d v' ~ v k hodě těchto regresních koeficlenlu, t"",v> dV' ' ese Je celkem zrejme, ze es, . ěnn'

v pnpa e palOve regr., . I' Y k I čn' Roeficient mezi nezavlsle promkd b - b - b dOjde lehdy, jesl lze ore a I

y ,.. - 12 - 123 ' 'o' • korelovány Nao'V. ',_ O tedy když nezávisle proměnné veltcmy nejsou .

vehclIlanu '23 - •

64

Page 32: Statistika skripta

Vyrovnání nadrovinou

V podnikové praxi je obvyklejši připad, kdy nezávisle proměnných veličin je celá řada

a kdy tyto veličiny působí na změnu závisle proměnné veličiny lineárně. Jde tak o případ

vyrovnání nadrovinon. Pro vyvozeni regresních konstant se používá opět metodanejmenších čtverců. Je zde výhodné (tak jako i v některých dalšich statistických metodách)přejít na směrodatné proměnné neboli proměnné v normovaném tvarn. Tyto proměnné

ziskáme transformaci, kdy od každé hodnoty odečteme průměrnou hodnotu soubom a vzniklýrozdíl vydělíme směrodatnou odchylkou soubom, tedy postupujeme dle vztahu:

Vhodnost této cesty řešeni prakticky' h 'I h . o

b· . , c u o Je v tom ze ml'- b'l'kom InaCI nezavisle promělllly'ch el'O' k' Izeme sta I Izovat líbovolnou, v ICln, a ta pro'ďt J I b k'

problemu. NYIÚ uvedeme rekurentní vztahy: va e I u o e rozbory studovaného

(557)

(558)(5.53)x -x

u j =--'- .s,

Směrodatnáodchylka směrodatných proměnných je rovna jedničce, což je opět zřejmé zdefiničniho vztahu:

Je celkem zřejmé, že průměrná hodnota směrodatných proměnných je rovna nule jakodůsledek skutečnosti, že součet odchylek od aritmetického průměm je roven nule:

i(x, -x)U=/':d =0.

n.sx

(5.54)

,,~ ..t =]-(l-Ij~)(]-/ji.2)Ú-";23) ....(1'-r.2 ). """'(',1) . (5.59)

Výpočet "pomocí rekurentních vztahů začíná v' o , o, o ,

Jde v podstate o stejný postup, který byl nkázán lP~ctem, d!lclch korelaclllch koeficíentll.se vlastně stabílizuje další faktor Cllceme I' ?t dV}l~ovnalll lovmou. Procedurou výpočtu

. -I urcl ICI korel o, k fi'Ij, .. , budeme potřebovattrojíci dílčích korelačních k fi' • acnl, o~ ,Iclent druhého řádu

oe IClentu prvmho radu a to ."23 'i2.4 • .

Tj... nebo 'i3.4

'lAl '234'

(5.55)

Výsledkem aplíkace metody nejmenšich čtverců je tato soustava normálnich rovnic:

rl2 = B 2 + B31'23 + +Bk '2k'

'I3=B2''n+ B3 + +Bk r2J: ,(5.56)

Řešením této soustavy normálních rovnic získáme dílčí regresní koeficienty posledního,tj. (k-2)-tého řádu. Výpočet lze provést na počítačí, standardní programy tuto soustavuobvykle řeší přes výpočet ínverzní matíce. V této soustavě normálních rovnic vystupují kroměhledaných regresních koeficientů všechny párové korelační koeficienty. Tímto způsobem sepostupuje i při praktických aplikacích, kdy v první etapě zjistíme párové korelačnikoeficíenty, ty zhodnotíme a provedeme výběr nezávísle proměnných veličín pro konečnou

tvorbu regresního modelu. Jíný postup je ten, kdy se jíž v první fázi rozhodne o výběru

nezávisle proměnných veličin a využije se maticového přístupu k řešení vhodnou definiCImatice [x].

Další cestou zkoumání závíslostí v praxi je vyžití rekurentních vztahů pro dílčí regre5JIIkoeficíenty, pro dílčí korelační koeficienty i totální korelační koeficient. Správnost uvedenýcllvztahů lze dokázat úplnou indukcí vztahů, se kterými jsme se setkali při vyrovnání rovin()ll.

66

Výpočet r o've Icmy r" J4 lze tedy provést dv " • b

vy šich řádů pak lze získat někol"k ' .• oJlm ,zpuso em. Dílčí korelační koeficienty~hYbu zaokrouhlením. Jestliže to~~;; zpu~oben: t7sledek musí dát stejnou hodnotu až naI nesp~vným výpočtem jedíného árov~~~I,t tre _a,hledat c~ybu, ta může být způsobenaprověfit správnost výpočtu P ,P _ o:elaclllho koe!lclentu. Touto cestou se dávytvofit program za pomoc;" ta~~I~~~hcoet pomocI rekurentních vztahů sí lze celkem snadno

procesoru v EXCEL.

V v' ní I chou nadplochou

ejjednoduššim o' d .pnpa em Je vyrovnání funkcí:

Y-h ~hx +bI I 2 X 2 +h12 X 1X 2 +b x 2 +b x 2

'" "2' (5.60)Vídime že v ří d-

normaI . h ' P pa e dvou nezávisle prom o 'h r o'

nic r~vnie; pro tři nezávisle ...; e~r~~e .~: lem dostáváme soustavu šestipf tavy lze SIce vyfešit na počítači atrome,nne ~ehc:ny JIZ ~eset nonnálních rovnic. Tyto

• no I měfení, takže v dnešních' e ~uSl,me Sl uvedomlt, ze rapídně rostou požadavk naprom) lu jde Prakticky o neřešitelntodm~;kach v podnicích chemického a potravinářsd;,ho

Iho modelu Lepší sítuace ' pro em s ohledem na vypovídací schopnost získanéhouplatněm plánovaného experimentuje v laboratornim výzkumu, ale tam bude lepší cestou

.7 Přtdpoklad 'y pro uspěšnou a rka '

J. P I CI regresní a korelační analýzy v praxinUlne konSI t. a Oval že znač' Č·

porntrn~Y~1 a potravínáfsÍeých POd~~íc~st ~echniků í ekonomů, kteří pracují v našicho a trhu jsou statistické pro~r VI o ~ne~odác~ .regresní a korelační analýzy

amy, ere znaene usnadrlují výpočet regresního

67

Page 33: Statistika skripta

modelu i korelačnich měr. Při aplikaci těchto programů často docházi k tomu, že praktickýpřínos použitých metod je malý. Pojednáme nyni krátce o hlavních příčínách neúspěchů

a poukážeme na podmínky, které musíme splnit, abychom byli v aplikací úspěšní.

Logický rozbor problému

Musime si uvědomit, že metody regresní a korelační analýzy jsou jen pomocníkem při

řešení problému. Vlastní řešení musíme vždy začít velmi solidním rozborem řešeného

problému. Při tomto rozbonl se opíráme jak o teoretické znalosti, tak o praktické zkušeností.Na hloubce rozbonl a stanoveném cíli bude závíset rozsáhlost budovaného modelu a úspěch

cele naší práce.

Mezí nejčastější pnclOY neúspěch," při aplíkaci regresní a korelační analýzy patří

nepřesnost podkladů. I když se v poslední době stav měřící techniky zlepšil, pro rozsáhlejšímodely bude třeba zajistit ještě přesnější zařizení, obzvláště tam, kde variabilita měřeného

znaku je nízká.

Problém časového posuvu

nezávisle proměnné veličiny J'sou závJ'slc' ", ". .-' . I k . - na Jmem cmlteh kt' Id'tento clIHte. :tery závislost Il překr' 'U R . > ery nes e uJcme. Musíme nalé· t

d I ',.. yva. egresn1 a korel _. I " zovo uJe reSlt zkoumaný problém pr t -. - k' '" acnl ana yza nam tak aktivně

veličinami, dostaneme tak nový sl~ěr o o~el p~~, ryvaJ,lcl faktor bude souviset se zkoumanýmipro 1 u SI analyzu zkoumaného problému.

Autokorelace

K autokorelaci dochází tehdy jestliže 'ednotl" __. ,Zkoumaný vztah je systematicky nad'hod J, lva merem neJsou na sobě nezávislá

, . '.. nocovan v těch pří d I kd' ... .proměnna, tak I vehclOa závisle prom - "fu pa ec " y Jak vehclTla nezávísle,. enna JSou nkc' - N-kbludne korelacI. I casu. e dy se mluvi o klamné či

Výskyt extrémních hodnot

Získáme-Ii již soubor dat ke statistickému zkou " _ 'tohoto souboru, obzvláště se musíme ve-n t ~an.', meh bychom posoudit homogenitu

. 'v, ova extremnuTI hodnot: vzeJmena v menslch souborech získávaJ' í Ik áh _ aru, protoze tyto hodnoty

d't 'I - . ve ou v u Extremni h d t' 'posou I, eventua ne Je odstranit na základ- " k' o no y mus,me logíckypozorování (viz kapitola 13). e statJstJC eho testu, například testu odlehlých

Dodatek k 5. kapitole

(viz vztah (5.28)).

Reziduální součet čtverců bude dán hodnotou:

VWočet reziduálního rozptylu (využití maticového počtu)

[Y)= [xJ[b),

[b)= [xf[xJ) '[xj'fyJ,

Při aplikaci v praxi se často přehlíží skutečnos žl" _požadavku, aby hodnocené veličiny sledo I ~ ~I ,odnocem Je casto vázáno na splněnímusíme být v hodnocení opatrní. va y norma nJ rozdělení. Pokud tomu tak neni,

[Y -yf[y - y]= [Yf[Y]-[Yj'fy]-fyf[Y]+ fyj'fy],

fr ][Y] = [b]'.(x]'.(xJ[b] = [bY[xY[xJ[x]'.(x]) '[xYfyJ= [b]'[xny]= [YYM

fY yf[y - yJ= -fy]'.(y]+ fyffy] = fyrfy]-fyf[xJfbJOd

(5.61)lud je výh d - -

Pod t -" o ne urcovat hodnotl 'd' I 'Iate JIŽ VYPOčteny při tvorbě reg ,~ rezl ua nI 10 rozptylu, všechny hodnoty JSou

resOl o modelu až na součet čtverců hodnot y.

J:'.!:9.!:J!ém dynamiky systému

Dalším problémem specífickým pro chemickou výrobu je kontinuální proces, kdy doreaktoru neustále přitéká malé množství surovíny, které se míchá se vznikajícím produktem,směs potom postupujc do dalšího reaktonl. S tímto problémem je možné se setkat např. při

výrobě syntetického kaučuku.

V tomto případě dokonce i silnějši krátkodobá změna v balitě surovíny na vstupu doprvního reaktoru výrazně neovlivní pri'lběh reakce a parametry vznikajícího produktu. Celyproces má značnou setrvačnost a přitom nedokážeme určit, že ze změřenéhomalého množstVJsuroviny vznikne konkrétní produk1 se svými vlastnostmi. Zde použití regresni a korelačllI

analýzy zatim nevedlo k cíli.

Překrývá,ni vlivů

Pří aplíkací regresní a korelaění analýzy v oblasti chemického průmyslu se setkávámes dalším, mnohdy velmi obtížně řešitelným problémem, který nazýváme časový posuv údajů.

S tímto problémem se setkáváme zejména u kontinuálních výrob. Na vstupujíci surovinupůsobi řada faktorů v různých časových okamžicích. Ke správné aplikaci musíme poměrně

velmi přesně určit okamžik působení zkoumaného činítele na vzníkající produkt. Jde tedy o točasově sladit zaznamenané hodnoty o výrobě přesně definovaného výrobku.U diskontinuálních výrob jde o průvodni list výrobní dávky. V reaktorech či pecích je často ažnemožné přesně určit působení vyhodnocovaných faktorů na konkrétní část vstupujícísuroviny, přes polotovary až po produkt. Někdy sí lze pomoci tak, že vezmeme údaje za delšlčasové období a dále pak pracujeme s průměrnými hodnotamí.

S timto problémem se setkáváme při existenci int~rkorelace mezi nezávisle proměnný/lll

veličinami. V praxi to znamená, že nedostaneme-li výsledek regresní a korelační anal)konzístentní se zkušeností, může to být způsobeno i tím, že oba faktory, které považujeme tJ

určeni korelačního koeficientu

flr• pro Y=a+b x)'" ,

68

69

Page 34: Statistika skripta

(5.62)

"LXII ::.:: n.a;1

(5.66)

cov(x,y)r =

Y"

I,(~, - x)(y, - y)rl =

nsr·sy

I,X,y, -nxy;"1

(5.63)

( roznásobením dostaneme:)

(vydělením /I pak:)

V dalším postupu eliminujeme konstantu a tak, že první rovnici vynásobíme součtem

hodnot x, a odečteme ji od druhé rovnice, pak prvni rovnici vynásobíme součtem hodnot x,

a odečteme ji od třetí rovnice (5.66). Nově vzniklé dvě rovnice vydělíme počtem měření n.Tímto postupem získáme dvě rovníce pro stanovení regresních konstant b, a b, ve tvaru:

(5.67)

xy-x.y _:=----- - (vynásobením čítatele í jmenovatele n':) (5.64)

S využítím vztahu (5.64) můžeme obě rovnice převést na následující formu:

II II n

n~>, y, - L x, I>,= ~,,,,-I ,,,,=I,-_,,,=I~ (přejdeme ke tvaru, který obsahuje jen součty)

'i1·SI.s2 =b2'S~ +6)·"23·S2·S3'

rl).s\.j'J = 62"23.82.83 +6).s;.

První rovnici vydělíme s" druhou s" dále budeme řešit soustavu dvou roVIllC

ramerovým pravidlem, čímž dostaneme vztahy pro určení regresních konstant:

" /I II

nLx,y, - Lx,LY'

.ki.,' ·(~··lt,t:.' .(ty,nV'

(5.65)(5.68)

(5.69)

Vyrovnání rovinou

Uplatníme metodu nejmenších čtverců na funkcí XI = a + b,x, + b,x,

. I .. .e rovny nule.Stanovíme derivace podle jednotlivých regresll\ch konstant a po oZIme J

lJpravou dospějemek obvyklému tvaru normálních ro~11IC:

,f = I,(XI - X.)' = I, (XI - a - b,x, - b,x,)

1=1

::::minimum.

V vnani_" dr vinou

Pnnclp metody nejmenších čtverců uplatníme na funkční předpis pro nadrovinu.Jed tlove proměnné jsou převedeny na směrodatné proměnné:

f i (u,•• I

Po stanovené parciálních derivací podle jednotlivých regresních konstant dostanemen rmalmch rovnic ve tvaru:

707l

Page 35: Statistika skripta

Z první rovnice vyplývá, že Ilo = o. Po vydělcní celé soustavy normálnich rovnic počtem

měření n dostaneme:

•+ B3.LU?,.U3r + ... +Bk ·L li21 ·

Ukr', ,

Tabulka 5.8 Korelačni tabulka mezi teplotou ("g a yýtěžkem

56 Posuďte vztah mezi teplotou reakce a jejim vyl'ěžkem Stanovte ." - ,d h Ik br'" '. prumery a smerodatne?dC Y Y o o~ ve ICIO, regresllI vztah, korelačni koeficient, korelačni poměr korelačni

ln ex. VSluPIll data JSOU v tabulce 5.8. '

Tabulka 5.7 Tabulka obsahu železa v titanove' běl b"' ... b"1______. .. o e a lep e ost

rlx 202 204 206 208 2100,85

212 ny- - 2 1

084- 3

- 2 8 50,83

1 - 16- 3 12 11

0,823 - 29

- 8 4 60,81

7 1 26- 2 1 2

0,80 12 3 10

- - - 1 1 3n. 1 1~ 27 25 14 5 87

MMení Obsah Bělost Měření Obsah Bělost

železa v % Železa v %

1 0,019 94,9 13 0,013 95,42 0,020 94,8 14 0,Ot3 95,93 0,019 94,9 15 0,014 95,54 0,019 95,2 16 0,012 96,25 0,019 95,0 17 0,010 96,46 0,016 95,1 18 0,010 96,17 0,016 95,0 19 0,010 96,18 0,016 95,4 20 0,010 96,09 0,014 95,3 21 0,014 95,6

10 0,014 95,4 22 0,015 95,511 0,014 95,4 23 0,014 95,5

12 0,013 95,7

(572)

(5.71)

viz (5.55)

viz (5.64)

viz (554)

n

+ ... + B,ťL:u;, ."

"+ ... +Bk ·L 1I3,·1I k1 ,

1..01

•+ ... -t Bt.Lub.

"

+ 83 "23 +···+8".r1k ,

+8, +···+B,.I'",1'" = fl,

'il :::: B2 .r23

" • •Lil" = Lil" = ... :::: LUb ::::0,, , , , ,.,-1

• • •L,,2 -= Ln;, ::::, .. :::: Lil:, =1 ,", I , I "

nLu f,.II Sl = nrts ,

"

II " " II

L.ltll.lIb :;:: BQ'LUk' +B.Z:2:U2I.ltk' + 8:;·L U 3,·II k1,,,,1 ,.-.1 r,1 ,~l

Tento systém upravíme využitim vztahů:

" . .L"Il.U21 ::::BO-'LU21 +B2·LU;rr~1 r 1 trl

= nll.

n n /I 'I

L1III

.II3l = Bo-Lll 11 +B2 ·LU 2i·U 31 +8)."'2:,11;,,,,,I Id ,-\ ,-I

Kontrolni otáz~úlohy

S 7 IIrčete vztah mezi p" ...,lJda. , omerem vstupujlclch latek (x) a čistotou produktu v % (y)je Jsou v tabulce 5.9. o .

Ika 59 Korei č' b .a III ta ulka mezI poměrem vstupuiicích látek a čistotou r d klur p o u

ylx 1,80 1,85894

1,90 1,95 2,00 2,05 ny

89,3- - 2 3. - 5

89.2- 1 7 6. - 14

891- 8 14 10

-2 34

8901 15 6 12

- 33 37

eg.g 16 - 4 1 14

1tl.

o -1

- - 25 30 29 35 6 106

5.1 Charakterizujte vztah mezi korelačnim poměrem, korelačním indexcm a korelačnímkoeficientem při řešení téže úlohy.

5.2 Posud'te možné přičiny toho, že v řešené úloze je korelační koeficient nevýznamný.

5.3 Vymezte matici [x] při vyrovnáni funkci Y ~ a+ h.x +c.x' +dx'5.4 Proveďte vyrovnání rovinou na základě těchto dílčích výslcdků:

'" = 0,2 x, = 70 s, = 8

'" =0,4 x, =40 ',=5

r13

:::: 0,8 Xl:::: 8 s) :::: 4Xl _ výkon pracovníků v kg výliskll za hodinu,Xl - stáří pracovniků v letech,Xl - praxe v profesi v letech.

5.5 Na základě tabulky 5.7 posud'te, zda existuje lineárni vztah mezi obsahem železa v"a bělosti v titanové bělobě. Dále určete průměry a směrodatné odchylky oboU

hodnocených velíčin.

72 73

Page 36: Statistika skripta

6. STATISTICKÉ ŘADY

Při analýze IŮzných hospodářských jevů nabývaji na významu statistické řady.

Statistickou řadou rozumíme uspořádané statistické údaje podle určitého hlediska. Timtohlediskem může být hledisko věcné, mistní, organizační, časové i jiné. Podle třídicího

hlediska dospiváme tak k věcným, mistnim, organizačním či časovým řadám.

Statistické řady tedy vznikaji jako výsledek tříděni zpravidla podle jednohn znaku,někdy podle několika znaků. Toto třiděni můžeme provádět podle znaku kvalitativníhoí kvantitativniho. Jestliže statistické údaje třídíme podle Kvalitativniho hlediska, zpravidlaneexistuje pevné pořadí obměn statistického znaku, i když snahou je, aby pořadí obměn

statistického znaku mělo své logické zákonitosti. Pro správné vyhodnoceni statistických řad jenutné, aby statístické údaje vykazovaly variabilitn podle zkoumaného hlediska, avšakvzhledem k ostatnim hlediskům byly pokud možno neměnné. Jestliže bychom chtěli posouditvývoj velikosti produkce určitého podniku, je nutné, abychom zvážili skutečnost, že některé

závody po určitou dobu patřily do zkoumaného podníku, později však nikoli, že v praxidocházi ke změně náplně ukazatelů, kterými hodnotíme velikost produkce, že docházi kezměně cen. Tyto změny nám ztěžuji hodnocení statistických údajů, kterými měříme velikostprodukce. Závěry z jejich vývoje pak neúplně vyjadřuji změnu objemu produkce v podnikua omezují tak i naši prognostickou činnost.

6. J Vymezeni statistických řad

Nyni budeme krátce charakterizovat jednotlivé druhy statistických řad.

Věcné řady

Věcné řady ziskáme utříděnim statistických jednotek podle obměn věcného znaku pří

stabilizaci údajů z územního, organízačniho a časového hlediska. Jako příklad věcné řady

můžeme uvést utříděni pracovníků podle pracovního zařazeni, stanovení struktury dělniků

podle pracovni třídy do které jsou zařazeni, tříděni výrobků do výrobkových skupin.

Územni (mistní) řady

Územni řady dostaneme uspořádáním statistických údajů podle územniho, (místniho,geografického) hlediska. Do této skupiny statistických řad patří mimo jiné řady, pomocikterých hodnotime zkoumané jevy podle územních celků (okresy, státy). Tyto řady majizejména svůj význam v národohospodářských úvahách.

Organizačni řady

Tyto řady, které vznikaji utříděnim podle organizačního hlediska mají význam zejménapří studiu podniku jako systému. O této problematice bude podrobněji pojednáno v dalšíchekonomických předmětech, a proto se zde omezime pouze na toto konstatování.

Řady rozděleni četnosti

Řady rozdělení četnosti zaujimají zvláštní postaveni ve statistickém zkoumáni, a~zejména ty, které jsou sestaveny podle obměn kvantitativniho znaku. PIŮběh těchto,

rozdělení četnosti má své teoretické základy v pravděpodobnostnich rozdělenich, o kteljdl

74

bude pojednáno v kapitole JO Z poval o o 'hČ·' d I o • 'Y resene o problé '0ur Ity mo e rozdeleni četností. Tyto dl' ,mu muzeme teoreticky očekávat

specitiko~at ně~o~ka základními mira:~ ~Ic~s~~zpravI?la Jed:lOv~C?olové, lze je pak blížemformacl o zmene podminek které defiln I y o k?d n~seho ocekavam JSou pro nás cennou, 'k ' ova y Oce avane rozděl " .Je pro nas pou aZem na nutnost zko " .. ,' , em cetnostl. Tato skutečnostČ 'Jd " umam pncm ktere vedl k "etnostl. e zeJmena o případy kdy ro d'l 'č " y e zmene tvaru rozdělení, ". ' z e em etnostl má d .' Ok I'

pnnclpu Je zalozena í statistická regulac 'b 'h va CI ne o Ik vrcholů. Na tomtoe vyro m o procesu.

Časové řady

, Č,asové řady vznikaji utřiděním statistíck' ch úd 'o " ,

na JejIch vypovídací schopnost je třeba ~'t ,aJu podle casoveho hledIska. S ohledemvymezení je třeba pečlivě posoudit zejm;arucI Č steJn?rod.ost, ostatnich hledisek. Toto stejnédelšich časových úseků. Někdy nelze na v asovych radac~, kdy se jedná o zhodnoceníměsiců nejsou stejné co do počtu praco~,~;c~~o~enout skute~?ost" že délky jednotlivých"standardni měsíc", který má 30 dní. m, a proto Je ucelne přepočítat hodnoty na

Při zpracováni údajů v časovou řadu s' ,statistická řada vzniká, zda jde o údaje abso/ tn:u~'me být vědomí i toho, z jakých údajůz absolutních údajů patří zejména řady r~ Il1 ,CI odvozene. K časovým řadám vzníklýchvlastnich nákladů odpracovany'cll Ilod' o ved' ,KOS!' pro~ukce, spotřeb surovin, vynaloženy'ch'd ,.' mapo casovym • ď k 'u aJU pak ukazatele produktivity práce pracn~ ( " ;a am, tere vznikly z odvozených

, s I, prumernych mezd apod.

Jiným hlediskem je to, zda časové ř d '·k" , .• ,Do časových řad z údajů úsekových a~/ ~~~' aJI z uda~u,usekových nebo okamžíkových.atd Představiteli časových řad z Údajů / •.~kc~ za meslc, oáklady na reklamace za rokk prvnímu dni v měsíci nebo řadu sta ? abmkzl ovych lze Jmenovat řadu stavu pracovniků

vu zaso posledlllmu dm v měsíci.

a vé řad extenzitních veličin

Extenzílni veličiny jsou veličin '" h' , ,Tyto veličiny můžeme sčítat a tak v~ ~,:!'~ z ,,:ehkostJe úměrná délce sledovaného obdobiřady Můžeme sledoval ob'~m rod vale nove statIstIcké údaje a z nich pak nové statistické

~vou ~du ~ěsiČní produ~ce. ~ mě~~;~c~O~;lk~ : J~notlivýc~ m,ěsících, dostáváme tak'oč VT1letlch, Jestliže sečteme objem d

UkaJu e v.sak vytVOrlt udaj o objemu produkce

r nIch objemu produkce. y pro u ce za vsechny měsíce roku, dostaneme řadu

čl Pro poSUzováni trendů může hýt účel' ".~ny teto lady získáme načítánim vel'k ne vytvaret radu kumulativnich úhrnů. Jednotlivé

~~%~iOC~bd°ktbi, ve kterém Zjišťuje~eO~~d~~~u:~~~tPrv~iho, hObdobi 5zpr~vídla počátkuI ara er extenzitnich r v· Ivm 10 u fnu. VSImneme si že tato

pru~l~že vydělíme hodnotu ;ue~~~:íi~~~t ~~učet úd~jů za několík ,období nemá reálnýodnotu sledované veličiny, o u rou poctem sledovanych období, získáme

Zvl tnom tyPem řek se . ady kumulativnich úhrnů' • ,

ph cm e POstupn~ posouvá, dospiváme t' Je r~da,. kdy Jde o stejně dlouhá obdobi, alerodu Jl se~avenl ročních klouzavých .hraJ: krade k10nzavých úhrnů. Nejčastějším

IIIIl me Zl Jka~: od II do 3I.XIJ., dalš~ h:n~~hkosti hrodukce, Prvni hodnotou je ročnipfiP<>čt J o součet velikosti r d k ' ou Je u rn produkce od 1.11. do 3 í I tu

\'flle pfírústek objemu p~O~U~C~'ZV daných měsicích nebo tak, že ke klouza~émua unOf (obJem produkce v únoru běžného roku

75

Page 37: Statistika skripta

~_~ XII__J1 _.~ r

IX

77

----------- -II III IV V VI VII VIII

--'--T

Diagram Z 1i-

m_'_17i

m3450 I400

350 If 300

r 250

i- 200

150

100

50

oo

250

y "v") . I (Xl - X )+ Y1 + Yz ( , +- _ o ~X2-X')+"·+)··'2 Y.(x•.-x.,)

(x -x )+( --)_._~(~--I o Xl -Xl + ... + X -x ) ----:

" ll-I

mil. m3

1,500

1,250

1,000

750

500

Z průběhu diagramu Z vidime že pokle t" b" • . .charakteru, neboť čára klouzavy'~h 'In o St SPO re YkVcervnu, cervencl I srpnu je sezónníhouh' kytu u nu ellto po les nezaznamenává (;' kl

mu pos je obraz o spotřebě plynu od počátku roku 1990. . ara ouzavých

sové řady intenzitnich velíčin

Časové řady intenzítních veličin tvoříme' k 'd'o, ,Tyto veličiny nejsou závíslé na déle I d J? z u aJ~ usekovych, tak i okamžikových.,hv vyvojové tendence. Tím že n', e, s ~ ovaneh~ obdob~, na JeJ~c.h vehkost má především, dělemm příslušného stati;tickéheon~;yzna':' JejIch souc,et, '~emuzeme ani průměr vytvořitzlIu Ilmou informaci o' . I' ~Je delČkou obdobt. Presto I zde potřebujeme znát

. urovm ce e rady asto po "' "e tenzllmch veličin jsme hodnotu o' , " UZlvanou mlrou je opět průměr.

počtem stejně dlouhých období pruměru, Z1SkaJI Jako součet údajů v řadě vydělenýIlalelnosti ' u mtenzltmch takto nemůžeme postupovat z důvodu

hod O 'ypočtu průměru u o " 'Inotách,. tento POstup lze a p memyc 1 h.~dno~ jsm~ ~ojednalí v kapitole o středních

'Id l 'chčín, k1eré mají r:~~OVtt I,u ZJ,lsťo~al1lpnlme.'~J poměrných hodnot u časovýchmžiku je nutno použit chron:~o u~~~c,h udoaju. a JS?U Zjlsťovány k určítému rozhodnému

mbny prúběh zkoumané veli"g,C y prumer. P:' tomto typu prúměru se předpokládáurčit podle Vztahu' cmy mezI sousedmml rozhodnými okamžiky. Průměr lze

Sestrojte diagram Z spotřeby plynu na základě dat tabulky 6.1

76

Tabulka 6.1 Tabulka spotřeb plynu v mil. m' a VÝpočetní tabulka diagramu Z

Diagram Z je graf, který slouží k rychlé oríentaci vývoje jevu během časového cyklu,nejčastěji během roku. Diagram Z má tři části. Prvni je čára běžných údajů, druhou čára

kumulativních úhrnů a třetí je čára klouzavých úhmit. Je tedy zřejmé, že díagram Z lzeuplatnit pouze u sčitatelných veličin. l3ěžné údaje by byly v diagramu Z nevýrazné, a proto sečasto pro tuto čáru volí jiný modul stupnice než pro ostatní dvě čáry. Ukazuje se jako vhodné,aby poměr mezi modulem pro klouzavé a kumulativní úhrny a modulem pro běžné hodnoty

byl zhruba.':., kde c je počet období v cyklu. U měsíčních údajů se poměr často volí I :S.2

Stupnici pro běžné údaje pak umístíme na pravou stranu grafu. Čára běžných údajů jeúsekovou řadou (body se zakresluji do středu intervalů), čára kumulativnich úhrnů sezakresluje jako čára okamžíkových údajů (body se zakreslují ke koncí časového intervalu),čára klouzavých úhrnů se rovněž zakresluje ke konci intervalu. Z čáry klouzavých úhrnů jepatrné porovnání běžného roku s rokem minulým. V těch časových úsecích, kde tato čára

stoupá jsou hodnoty běžného roku větší než v roce minulém. Postup výpočtu a zakreslenív grafu je patrné z příkladu 6.1.

Příklad 6.1 Sestrojení diagramu Z spotřeb plynu v roce 1990

6.2 Diagram Z, eliminace cyklických výkyvi.

zmenšený o objem produkce v únoru roku minulého). Postup opakujeme pro další měsíce.

Jestliže klouzavý úhrn vydělíme počtem údajů, dostaneme klouzavý průměr. Klouzavýchúhrnů i klouzavých průměrů se používá tam, kde chceme zjistit trend očíštěný odpravídelných výkyvů např. sezónních či cyklických. Tak se určuje hlavní vývojová tendence.U sezónních výkyvů je délka cyklu rok, v obchodě u prodejů často ·týden. Správná volbadélky cyklu je rozhodující pro celé zkoumání a vychází z obecných poznatků o hodnocenémJevu

Měsíc Spotřeba plynu Rozdíl Klouzavý Kumulativní1989 1990 d úhrn úhrn 1990

I. 133 131 -2 1335 131ll. 122 128 6 1341 259III. 126 138 12 1353 397IV. 107 119 12 1365 516V. 100 116 16 1381 632VI. 94 104 10 1391 736VII. 87 94 7 1398 830VIII. 87 95 8 1406 925IX. 104 113 9 1415 1038X. 121 123 2 1417 1161XI. 125 133 8 1425 1294XII. 131 134 3 1428 • 1428

Součet 1337 1428 91 X X

Page 38: Statistika skripta

Eliminace cyklických výkvvů pomocí klouzaVÝch průměrů

Příklad 6.3 Eliminace cykličnosti pomoci klouzavých průměrů a sezónního faktoru

V praxi potřebujeme odhadnout budouci průběh nějakého jevu, který je zatížencyklickými výkyvy. Tak je tomu např. pří prodeji některých předmětů částečně sezónníhocharakteru, při prodeji některých potravin. Jako ukázku jednoho z postupů ukážeme cestu přes

klouzavé průměry a "sezónní faktor". Prodej určitého výrobku ukazuje na cykličnost prodeje.Nejprve spočteme klouzavý průměr pro jednotlivá čtvrtletí v roce, a to tak, že v rocevezmeme pět příslušných čtvrtletních hodnot, okrajovým hodnotám přiřadíme poloviční

váhu. Tomuto postupu řikáme "centrování". Tento postup je nutno zvolit proto, abychommohli dále spolu srovnat údaje v jednotlivých čtvrtletích. Kdybychom roční prodej vydělili

čtyřmi, získaná hodnota průměru by byla hodnotou, kdy právě končí pololetí, my všakpotřebujemeporovnávat jednotlivá čtvrtletí, a proto se musíme o polovínu délky posunout, toprávě respektuje uvedený postup Ode o chronologický průměr ). Celý další postup je uvedenv příkladu 6.2.

Na základě dat v tabulce 6.2 ukažte na trend prodeje vybrané skupiny výrobků.

(6.2)

(6.1)

IIII

~Y'-I+Y'(X -x )~_o..--- i 1-1

I_I 2

i Y,-\ + Y, .1).

- j:ol 2y= •

LI).. ,,\ I . k'ho průměmukážeme v přikladu 6.3.

Určem chrono oglc e

Y, _ zjištěná hodnota v i-tém rozhodném okamžiku,

x - i-tý rozhodný okamžik,;0- počátečni hodnota v počátečním okamžiku Xo'

Pokud jsou intervaly mezi rozhodnými okamžiky stejné, lze vztah (6.1) upravit na tvar:

,.-1 yY. Yo+"'y,+_.2!.

Y;+Y\+"'+Y'-\+2=2 f:: 2II

Tabulka 6.3 Tabulka výchozích dat o prodejí a VÝpočetní tabulka pro eliminaci cykličnosti

ROk Č1vrtletfProdej Klouzavý "Index"

Průměrný Upravený Sezónnl Očištěný

mll. Kč nruměr "index" úda; faktor úda;1996 I. 41,5 52,0 52,0

II. 53,6 52,7 52,7III. 70,7 52,89 1,337 53,2 53,2IV. 45,2 53,41 0,846 52,8 52,8

1997 I. 42,6 54,35 0,784 53,4 53,4II. 56,7 55,64 1,019 55,7 55,7III. 75,1 56,79 1,322 56,5 56,5IV. 51,1 57,54 0,888 59,7 59,7

1998 I. 45,9 58,46 0,785 57,5 57,5II. 59,4 59,11 1,005 58,4 58,4III. 79,8 60,03 1,329 1,330 60,0 1,329 60,0IV. 51,6 61,91 0,833 0,856 60,3 0,856 60,3

1m L 52,7 63,84 0,826 0,798 66,0 0,798 66,0II. 67,7 65,78 1,029 1,018 66,5 1,017 66,5III. 86,9 65,4 65,4IV. 60,0 70,1 70,1

Soutet X 940,5 X X 4.002 940,1 4,000 940,3

Okamžik Zásoba YH +Y, x, Xi_I Y, \ +Y, (x. XJ-l)i zjišťování v t 2 2 '

O U 20,8 19,8518,9 19,85 1

1 1.11. 18,2518,25 1

2 Ull. 17,6 19,0519,05 1

3 1.iV. 20,5 19,4518,4 19,45 1

4 1.V. 1 19,7521,1 19,75

5 1VL 1 22,7524,4 22,75

6 1.VII. 2 39,607 1.IX. 15,2 19,80

13,4511,7 13,45 1

8 1X 12,0512,05 1

9 1.XI. 12,4 10,7510,75 1

10 1.XII. 9,8 12,5515,3 12,55 1

11 31 XII. 207,50X X 12

Součet X

Příklad 6.2 Určeni chronologického průměru

Na základěúdajů v tabulce 6.3 stanovte průměrný stav zásob.

Tabulka 6 2 Stav zásob suroviny v t a určení průměrného stavu zásob

Ji = 207,5 = 17,29.12

Č·' odhade11l• v v hronologícký průměr je pouze ur Itým aždélD

Je třeba upozornit na skutecnost, z~td že pohyb průměrované veličiny Je v k 'ce.skutečného stavu, což vyplývá z pře~ho a.u,ě se bude blížit skutečné hodnotě tím VI

intervalu Iíneární. Hodnota vypočt~~e o,p~m ~čím bude interval mezi okamžiky ZJlsťovam krats\.

prve počteme klo " ěI uzavy prum r s centrováním. Pro první hodnotu platí:• 426

2 53,6· 70,7+45,2+_' =52892 ,.

V.I

7978

Page 39: Statistika skripta

Regresni konslanta a je tak prostým aritmetick' "ukazatele (nemusí ale jil o průměrnou hodnotu I V' y~ prumere';! z hodnot sledovanéhoZjednodUŠIt využitím vztahu pro součet řad 't .).• ypoce,l :eglesm konstanty b lze ještě

, y c vercu. Vyuzltlm uvedené transformace půjde

o součet dvou rad čtvercll přírozených čísel při l'očtu'l o _ II - I .cenu /Jl - --. Dosazemm získáme'2 .

fv,' =2. (111)(111+ 1)(2111+ I) = ~.(~1~ 1ll-I +2 ~:.~:,:.J)_ IIf" -1\,I 6 3 2 2' I - 12 2 (6.7)

Dosazením do Zl h (66)koeficíent b jako: v a u . můžeme stanovit obvyklý výpočetni vztah pro regresni

2. "Index" je poměr hodnoty ve čtvrtletí a klouzavého průměru v daném čtvrtletí, tedy např.

70,7:52,89=1,331.3. Průměrný "índex" se získá jako prostý aritmetický průměr "índexů" v daných čtvrtletích,

tedy: (0,784+0,785+0,826):3=0,798.4. Upravený údaj ukazuje na trend po elíminaci sezónnosti a získáme jej jako podíl hodnoty

ve čtvrtletí a průměrného "indexu", např. 41,5:0,798=52,0.5. Sezónní faktor respektuje požadavek, aby průměr z průměrných "índexů" byl roven jedné,

tedy aby součet průměrných "indexů" byl roven čtyřem: 1,330. 4,00fl. = 1,329.4,002

6. Očištěný údaj v posledním sloupci stanovíme jako podíl hodnoty v daném čtvrtletí asezónního faktom Pro []J. čtvrtletí roku 1999 platí' 86,9: 1,329 = 65,4.

Získanou řadu očištěných údajů lze pak využít pro tvorbu regresního modelu, pomocíkterého lze odhadovat prodeje v dalších čtvrtletích. O tvorbě regresních modelů časových řad

bude pojednáno v další části této kapitoly.

6.3 VyrovnállÍ časových řad fllnkccmi

Časových řad pouzlvame k určeni hlavní vývojové tendence. Jednou z možnostistanoveni této tendence je použití řady klouzavých průměrů. Jinou možnosti je určit trendpomocí matematického předpisu ve tvaru regresního modelu. Jde o aplikaci regresní analýzys tou zvláštností, že nezávisle proměnná veličina (v tomto případě čas) se mění o jedníčku

Ueden rok, jeden měsíc).

Z uvedených normálních rovnicJ'c patrné' .• ze.

"L>ia= '..::.!...­II

"LV,Y,

b:::::; ''''l _"

LV,''-I

(6.5)

(6.6)

Při vyrovnání regresním modelem musíme nejprve zvolít vhodný typ modelu. Pokud lzepovažovat absolutní pt'irůstky v jednotlívých obdobích za praktícky konstantní, vhodnýmmodelem bude lineární model, pokud budou relatívní přírůstky zhruba konstantní, vhodnýmmodelem bude exponenciální. Jen v nečetných případech bude vhodným modelem parabolanebo hyperbola.

Pří vyrovnání časových řad nezávisle proměnná veličina x je čas. Tato veličina

představuje řadu přirozených čísel. Tuto veličinu můžeme transformovat tak, aby souče!

transformovaných veličin byl roven nule. To provedeme tak, že počátek posunemek prostřední hodnotě. Budeme-Ii mít lichý počet hodnot, transformované veličíny budouceločíselné, v případě sudého počtu hodnot půjde o poloviny. Transformační vztah lze zapsalve tvaru:

lenlo vztah ..Zl . " muzeme v podstatě v .. '.. . .

ogarumovamm přejdeme na ř' . Jyuz~t ! pn vyro~nanl exponenciálou Y = a.b'.o funkCIonální regresi, přejdeme ted~S~:' tva,;,earnl ho vyrovnaní hodnot logaritmů y, jde

I gY loga+x.logb=a'+b'x

(6.8)

(6.9)

Řešením normálnich rovnic dostaneme

logy,•

I zd muzeme I .pro r-esnl'~~ atUtl transformaci na velíčiny V

-~ ~onstanty.

h

(6.3)n

V= Xi -Xo' tak aby LV, = o.,I

a

V případě lineárního vyrovnáni normální rovníce nabudou tvar: 1/

(6.10)

"LY, =/1.Q,1,.,1

n "

LV,Yi =bL v,2.,::::1 j",]

80

v logy

v

8t

(6.11)

Page 40: Statistika skripta

Regresní konstanta a je vlastně geometrický pruměr pozorovaných hodnot y, regresnikonstanta b vyjadřuje pruměrné tempo rustu zkoumané veličiny y.

Existuje dalši vhodná tranformace pro výpočet regresních konstant, a to ta, kdy novýpočátek posuneme do prvni hodnoty (počátku časové řady) podle vztahu: z, = X, - xo' Tento

případ je vhodný při vyrovnáni časové řady parabolou a též proto, že snadno zjistime novéregresni konstanty přidánim dalšiho období. Využivá se toho, že jsou známy jednoduchévztahy pro určení řady aritmetické, řad čtverců, řad třetich a čtvrtých mocnin. Tyto vztahy zdepřipomeneme, plati tedy:

(612)

,~r~ výpočet konstant v obou modelech se '" .pouZ1va se metoda přibližného řešeni, nelze ted ~~da :OUZI: ~etoda neJmenšich Čtverců,uveden v dodatku k této kapitole. y pocltat orelaclll mdex. Postup výpočtu bude

Dodatek k 6. kapitole

VÝPočet konstant GompertzovJ( a Pearl Reedow křivky

Počátek hodnot X se položi do prvního zk "k,. " Ik' oumalll de tedy x - O d 'I bna tn steJne ve e skupiny. Hledané konst t Ó -,.' a e se sou or rozdělí

uvedených vztahů: an y pro ompertzovu knvku se urči podle dále

(6.13)

• d,c=­d'

I (620)

±z' = ?n' +311-1 n(n+IX2n+l) = 311' +3n-I.±z,' .1=1 ' 5 6 5 I~l

Gompertzova křivka

Gompertzova křivka je definována vztahem:

Y = a.bel>.

Zlogaritmováním můžeme tuto funkci převést na tvar

logY = loga +(Iogb).c·.

(6.14)

(6.15)

11 -

d

d

S(6.16)

S

(6.17)

I b_d,(C-I)og --__

(c' -1)' ,

loga = ~{SI --!!LJ• , kdeII c -1

počet hodnot ve skupině,

S2 -S'lS -S,.

S S .: ) Jsou SOučty hodnot logaritmů veličiny y v jednotlivých skupinách, tedy

Llogy, .

(6.21)

(6.22)

V souvislosti s prognózovalllm se použivá Pearl Reedova křivka, která ...charakteristický "esovitý" pruběh aje dána předpisem:

Tento model se použivá předevšim v marketingových studiích pro konstrukci takovéhomodelu zákona růstu, kdy sledovaná veličina neustále roste, ale rust se zpomaluje tak, že sehodnocená veličina s časem limitně blíži k maximálni hodnotě dané konstantou Q

(resp. loga ). Konstanta h je menší než jedna.

83

Pn výpočtu konstant u Pe I R d ..Je \ t že' ar ee ovy knvky postupujeme obdobným způsobem Rozdíl

om, mlsto logaritmů hd' .

pfo not y se Jedná o převrácené hodnoty, tedy ~. Získáme

'mu hodnoty a , b, c. y

_~.r.y,lnl otázky a úlohy

I Jak se pozná v día r ' .2 a z.akladě dat ta: ;:;'IU Z, ze Jde o sezónní výkyv?

prod k ky . u Y6.3 stanovte lineárn' .. ,a ~k ce selmy sírové kromě 60% olea I a<!xponen,claln, regresni model časové řady

roce I~:dě modelu odhadněte produkc' I v hSSR. (Udaje JSou ze statistické ročenky).4 I 246t a v roce 1985 I I V etec 1984 a J985. Skutečné produkce b I v

zadanem období (1971 _ 1979).298 t. Zhodnoťte výsledek, určete pruměrné tempo ~;tu

(618

(6 I

82

1- =a+b.c X

Y

Y= .a+b.c·

Pro výpočet konstant a, b, c se používá převrácené hodnoty, tedy:

Page 41: Statistika skripta

Tabulka 6.4 Údaje o produ}ci kyseliny sírové kromě 60% ol.lm-'( ČSSR7. lNDEXNÍ MKI'ODA

7.1 Pojem indexuRok produkce v kl

1971 1162

1972 1176

1973 1209

1974 1211

1975 1245

1976 1240

1977 1276

1978 1195

1979 1253

1: 10967

6.3d ' h 9 \ t Určete regresní. '.'robku v tunách za posle niC e .

Jsou známy prodeje vybranpehoľl dovy křivky. Údaje o prodejí:konstanty Gompertzovy a ear ee25,59,99,145,197,236,256,261,264

Indexni metoda patří mezi základní metody, které poullvame při srovnávání. Pří

srovnávání se můžeme setkat s porovnáváním veličin, které se vztahuji buď ke statishckéJednotce nebo ke statistickému souboru. V prvnim případě jde o porovnávání individuálníchúdajů, někdy se proto mluví o individuálních indexech. Název neni zrovna šťastný, nehol' senejedná o vlastní indexovou problematiku. O tu jde, pokud porovnáváme veličiny, které sevztahují ke statistickému souboru. Mluvime pak o indexech (souhrnných indexech).

Podle charakteristiky porovnávaných veličin sestrojujeme indexy dvojím způsobem.

U sčitatelných údajů utvoříme index jako pomčr dvou součtů. Tak můžeme postupovatv případě, kdy zkoumáme, zda došlo k růstu velikosti produkce určitého výrobku v běžném

období ve srovnání se základním obdobím. Při porovnávání nesčitatelných veličin musímenejprve soubory údajů průměrovat. V těchto případech se uplatní různá velikost vahu jednotlivých průměrů.

Při porovnávání statistických údajů musíme rozlišovat údaje extenzitní, k1eré jsou závisléna velíkostí časového úseku, územního nebo organízačního celku, za k1erý provádímerovnávání. Tyto údaje budeme podle zvyklostí označovat symbolem q. Údaje intenzitní

budeme opět podle zvyklostí označovat symbolem p. K těmto symbolům přiřazujeme ještě

mdex, a to takový, že indexcm 1 budeme označovat údaje běžného období a též údaje, kterýchbylo .kutečně dosaženo. Indexem O budeme označovat údaje základniho období a údajeplanované.

"Podle tohoto zavedeného označeni Lq" = Lq, vyjadřuje souhrn objemu stejného,.,)'Tobku u 1/ výrobců ve srovnávaném období (výrobků skutečnč vyrobených), L qo pak

J dluje souhrn výrobků v základním období (plánované množství produk1u).

Je ~řejmé, že porovnání tohoto typu nebude mnoho, daleko více případů je těch, kdyporovnaváme nestejnorodé údaje. Do této kategorie již patří porovnávání objemu produkce

Dlku jako celku. Tyto údaje můžeme porovnávat pouze za pomoci vhodně zvolenéIIn. veličiny jako je cena výrobků nebo měrné náklady. Souhrn vyrobené produkce

me pak vyjádřít ve tvaru:

(7.1)

(7.2)

84

m Jme. dospěli k hodnotovému vyjádření objemu produkce. Tohoto vztahu rovnez~1ŽI''tlm při .zkoumání so~hrnných změn intenzitních veličin. Intcnzitní vcličiny pakprl:-"'dime na sčllatelný tvar. Uroveň intenzillúch veličin charak1erizujeme jejich průměrem:

L:P.'1,q

85

Page 42: Statistika skripta

7.2 Indexy nesčitatelnýchextenzitnich veličin

V předchozí části textu jsme viděli, že pomocí intenzitní veličiny lze převést nesčitatelné

extenzitní veličiny na sčitatelné. To nám umožňuje porovnat objem produkce podnikuskutečně vyrobený s objemem produkce plánovaným. Toto porovnání provedeme pomociíndexu objemu produkce:

(7.3)

Tomuto indexu, který má tvar podílu dvou součtů (agregátů), se říká agregátní index.Výsledek řiká kolikrát je skutečně vyrobený objem produkce větší než plánovaný. Protože navýsledek má vliv změna intenzitní veličiny, nemůžeme bezprostředně rozhodnout, zda došlok růstu objemu produkce. Abychom poznali proč došlo ke změně hodnotového índexu IQ'

rozložíme jej na dvě složky. První složka bude ukazovat na změnu extenzítní veličiny (říkáme

jí index množství nebo ohjemový index), druhá pak na změnu íntenzitní složky (obecně semluví o cenovém indexn). Rozklad hodnotového indexu lze formálně provést třemi způsoby,

a to:

Rozdíl čítatelů a jmenovatelů ve vzt h (7 4 "přínos (RQ) = (R",) , přínos způsobeny' ~lluveJn' ) u:'ava v I(lodn)otovém vyjádřeni celkový

zmen cen II a ří .množství produkce (Rp). p P nos vlivem zrněny

Jestliže bychom použili při rozkladu hod t 'h 'no ove o mdexu vztah (7 5) , "

nemá velký význam, neboť vyjadřuje dří. b " ,vyraz .... J','Ioinformace je prakticky bezcenná a v podn'kve .v

yroenou pro.dukcl v dnešnich cenách, tato

, u se aru samostatne nesleduje.

Jednotlivé druhy uvedených indexů mužem t" . ,hodnot (individuálních índexu), a to podle těchtoevz~:hs~anovlt na zakladě znalosti poměrných

(7.7)

(vážený aritmetický průměr pří váze O )-.L.p,'1, L.P.'1,L.P.'1, .L.P.% ' (7.4) (7.8)

(7,9)

(7.10)

_ LipPolJ,

- L.p.'1,,

,

(vážený harmonický průměr pří váze Q,).

Obdobně mužeme vyjádřit jak indexvyrazy: cenový, tak index množství. Dostaneme tak

L.p,'1,L. p~qL .

\ olba VÝpočetního v ' . , fp

ztahu zavlsl na znalosti příslušných veličin.Pti lad 7 I R b

oz ~_~r~sp~l~ne,,'n"j~p"'laE!J'n!!ULoQ!b!1Jj~e!!ml!!ul.PJ:QQd.Y.ko~<;;'m!!lli~c!!!m~Q!I!lli;ii!~'lffiiJr!.tll;ill.)'.. Rro ukce zavodu za měsic pomoci indexn; metodya uk ladě dat tabulky 7 I '

I I ~t ~ruhuvýrobků a ~ f~~vu~~ te rozbor s~lněni plánu produkce závodu. V závodě sene le tak i zhOdnotit změnu v~irnSOy~ hzn~mklYdměrné náklady, a to jak plánové tak

C na a ech. •

, '.. 75602857576900 = 0,9978,

(7.5)

(7.6)(I', vyjadřuje stálé ceny).

L.p,'1, L.p,'1, L.P,'1.L.P.'1. - L.P,'1. ·L.P.'1. '

L.p,'1, L.P,'1, L.P,'1'L.p.'1. = L.P,'1;·L.P.'1.

L.p,'1, - vyjadřuje v hodnotovém vyjádření velikost produkce v běžném období,

L. 1'.'1. - znači hodnotu velikosti produkce v základ nim období,

L. 1'0'1, - udává produkci vyrobenou v běžném obdobi v cenách základního obdobi

(plánovaných cenách či plánovaných měrných nákladech).

I když všechny tři uvedené vztahy jsou formálně v pořádku, nejpoužívanějšim vztahem jevztah (7.4). Hodnotový index tak rozkládáme na cenový index tak, že vahou intenzitwveličiny (cen, měrných nákladů) je extenzitní veličina běžného období. U índexu množství jevahou intenzitní veličina základniho období. Výrazy v čitateli i jmenovatelí každého indexumají reálný smysl, a to:

86

87

Page 43: Statistika skripta

1 = 7321900. = O9663, 7576900 '

Tabulka 7.1 Výpoč~egátních indexll

1 = .~~60 28} = I 0326, 7321900 ' rozbor, index / , který nazýváme ' d' • , •

P III cx proDlcnh"eho slož' I.'kterém budou váhy stejné, a to hodnot bě. 'h ' ,enl, roz o~lme na index, vese řiká index stálého složení a obvykl' Y b

znc~ obdobl cxtenzitni veličiny. Tomuto ind

e se o ecne znači / V • . , exu,. YPOctemc JCJ podle vztahu:

Z předchozího vztahu 'd' ., "v čitateli tak i J'menov t I' vl.'me, ze mteozltm veličíny z· t' ..\'Zlah a e I, zat,mco váhy se mění. S d us avaJI na stejné úrovni jak

na no se přesvědčíme o tom, že platí

Ze v,!ahu (7.12) vidíme, že index stálého složen' ,u agregátruch mdexů. 1 ma stejnou povahu jako cenový index

I~de~ kterým hodnotíme změny ve struktuře vah ." ,a LnačlmeJeJ symbolem J Jeho ' • ' se nazyva IIldex struktnry veli'·

.>q. vypocet provedeme podle vztahu: cmy IJ

(7.12)

(7.14)

(7.15)

I, / ...

LPoq,LP{3LJLq, _POl/ = Lq,

LPo'lo - Po =

Lqo LP{~-J (7.13)

Lqo

1

Index proměnlivého sl. ,f ozem lze rozložit na index stálého složení a index struktury

v tochto Uvedených inde " .II ukazuje na n xech ma reaJný význam zcl'!"ny I edy Obd:eb~t~a příčinu změn průměrné inte;;'~tni v c;t~tele a jmenovatele. Tento

J Ou agregátnich indexů 01.. ~ lCmy na Jednotku extenzitnip . uzeme provest rozklad, a to dle vztahu.

p (p,-p )+(p _. .OlOl-PO)'

r. rOl· To.

Plán úplných vlastnich nákladů byl splněn na 99,78%. Bezprostředně nemůžeme říci, žetato skutečnost je přiznivým jevem. Musime provést hlubši analýzu, tedy přejit k hodnocenipomoci indexu množstvi a indexu měrných nákladů. Index množství ukazuje, že bylovyrobeno o 3,37% výrobků méně. Index měrných nákladů vyjadřuje skutečnost, že došlok růstu měrných nákladů o 3,26%, pracovali jsme tedy méně hospodárně, je to důsledek

nesplnění plánu výroby nejdražšiho výrobku. Veličiny II nás informují o tom, že jsme ušetřili

na úplných vlastnich nákladech 16615 Kč; diky tomu, že jsme nesplnili množství výrobků,

ušetřili jsme 255 OOOKč, ale diky růstu měrných nákladů jsme vynaložili o 238 385 Kč vice.

Závěry z přikladu:

RQ =7560285-7576900=-16615,

II, = 7 321900 -7576900 = -255 000,

II, =7 560285 -7321900 =+238 385.

7.3 Hodnocení změny průměrnéúrovně intenzitních nkazatelů

Jestliže budeme porovnávat průměrnou úroveň skutečných a plánovaných měrných

nákladů v připadě sčitatelné produkce dostaneme:

Při souhrnném srovnávání mají značný význam změny ve struktuře srovnávanýchsouborů. Tato otázka nabývá na dllležitosti zejména u intenzitnich ukazatelů, kteréporovnáváme jako průměrné úrovně.

Produkce Měrné náklady v Kč Celkové náklady v Kč

Výrobek'10 'I, Po P, Poqo p,IJ, Poq, i, i,

~-850 870 1210 1195 1028500 1039650 1052700 1,0235 0,9876

~_2 1840 1730 860 890 1582400 1539700 1487800 0,9402 1,03493 1200 1180 930 942 1116000 1111560 1097400 0,9833 1,01294 350 360 8600 8570 3010000 3085200 3096000 1,0286 0,99655 50 35 16800 22405 840000 784175 588000 0,7000 1,3336l: X X X X 7576900 7560285 7321900 X X

(7.16)

hodnoty sčítanců

h mo-Ii zjistil celk •Y\1Ů'M1II1'e . ovou zmenu, určim" •.

mnoŽStvlm celkOvé produkce (" )e Jl tak, z~ Jednotlivé\L.,q, , tedy Upravlme na tvar:

(p p) r'l =(p, '-Po,)·L'I, +(Po,-Po)·Lq,·

8988

Z uvedeného vztahu vidime, že na změnu průměrné úrovně působi jednak změna veli 'P (měrných nákladů), jednak změna ve struktuře vah veličin IJ. Abychom mohli provést hlu

Page 44: Statistika skripta

p,q, Poqo Poq,Po 1',2455200

Výrobce q, qo936 2471040 24180002600 930

1134000 11218502640

811 11232351

1400 8101202240 1232000 1294720

1385520

528280

22200 560

496808 3995003 2312

4425400050

1124 850 4705293323 5183500

4X X7461 7050L

(717)

(7.18)

-VI VJ VOl

Iv ::::~=-=--.-=-=lv.lsT'Vo VOl Vo

7.4 Rozklad indexu produktivity práce

Při zhodnoceni celkových úspor vidíme, že jsme uspořili J92 344 Kč, z toho díky úspořena nákladech 106 692 Kč a díky změnám ve struktuře produkce 85 652 Kč.

'o1. =-=1 1.. jl Ý- kl'

Na závěr kapitoly o índexní metodě ukážeme rozklad indexu produktivity práce.

Ukazatel Produktivity práce je definován jako v = ~, tedy jako poměr objemu produkce

a odpracovaného času. Při praktických aplikacich se setkáváme často s takovými intenzitnimiveličinami, u kterých má význam i jejich převrácená hodnota. V připadě ukazatele

1produktivity práce je tou veličinou ukazatel pracnosti ,= _. Ukazatel produktivity prácevmůžeme tak posuzovat nepřímo přes ukazatel pracnosti.

Rozklad UkilZatele produktivity práce

Pfj vyjádření ukazatele produktivity práce přes ukazatel pracnosti:

7.2. Tentýž

_ 709,47 = 0,9802,Ip - 723,77

_ 709,47 = 0,9649,1, - 735,25

, v měrných nákladůZhodnocení průměrne zmeny

- 5183500 = 735,25,Po = --7-050

- 5 293323 = 709,47,1',= 7461

_ 723,77 = 0,9844.5400050 = 723,77, 1" - 735,25POl 7461

ních změn měrných nákladů:Velíčiny pro rozbor absolut

- - 709 47 - 735,25 = -25,78,, - I' - Po - , O' - -' - =70947-723,77=-14,3 ,

'o, = f1..' -!Y..' = 72;,77 -735,25 = -11,48., = POl Po

Příklad 7.2 • 'kladě dat tabulky• , h měrných nákladu na zaZhodnoťte změnu pruměrnyc

'b' ve čtyřech závodech.výrobek se vyra I •

, ě •měrných měrných nákladuTabulka 7.2 HodnocenI zrn ny pru

~ když souhrnné indexy jsou stejné, indexy stálého složení jsou rozdílné v důsledkuovc vah ROzdíl vynikne tim Více, jestliže indexy stálého složeni převedeme na průměrový

b Ikových změn:Veličíny pro roz Ol' ce

- -25 78.7461 = -192 344," .2:q, - , 2

" --1430.7461 =-10669 ,rOl·L....J qj - •

'0 2:q, = -11,48.7461 = -85 652.

Závěry z příkladu: , I I o 351%. Tento pok1esid~k plánovanym k es y , 6% došlo k poPrůměrné měrné náklady ,:zhl'~:~ákladů o 1,98% a o dalších 1,5 o

způsoben vlast~í~ pok~~~e:. :~;~měnám ve struktuřeproílukce. želIÍ"

průměrných mernych na a u " bylo dosaženo sn~v 25 78 Kč Teto uspory ě ě ve sl• ě ě na výrobku došlo k ús~o:e v' II '48 Kč došlo díky zrn nPrum ~ • 14 30 Kč. K dalŠl uspore o ,měrných nakladu o ,

produkce.

I

(719)

(720)

(7.21)

90

91

Page 45: Statistika skripta

--------

(8.1)

(82)

M(a) ~ D(a).

m(a)~d(a)

d( ) = !)(a)a lAl'

Výsledkem každého měření je číslo (hodnota), které je zatíženo určitou chybou. Budeme_li měřeni na tomtéž vzorku čí výrobku opakovat, výsledky se budou od sebe odlíšovat. Totoodlišení je dáno nedokonalou homogcnítou výrobku, chybou měření a exístenci nJhodyZ matematického hlediska výsledek měření patří do kategoríe nepřesných (neúplných) Čísel.To znamená, že při počítání s těmito daty se musime opirat o pravidla počitání s neúplnýmičísly.

8. PŘESNOST MĚŘENÍ A STATlSTlCKÉ VVPOČTY

Nejprve musíme stanovit miry, pomoci kterých POSuzujeme chyby měřeni. Základnivelíčínou tohoto druhu je absolutní chyba D(a) čísla. Jí rozumíme absolutní hodnotu rozdílu

naměřené hodnoty a od správného čisla A (čísla nezatiženého chybou, "přesného" čísla).Protože v praxí obvykle neznáme správnou hodnotu A, užíváme v řadě úvah místo absolutníhodnoty její homi odhad, který nazýváme mezní absolutní chybou. Mezní absolutni chybaM(a) je chyba, která není nikdy menši než absolutní chyba, platí tedy:

Relativní chyba d(a) přiblížného čísla a je poměr absolutní chyby a absolutni hodnotysprávného čisla A:

I pro relativní chybu se zavádí pojem mezní relativní chyby mra). Tato chyba není opětnikdy menší než relatívní chyba. Plati proto vztah:

Kontrolní otázky a úlohy

tí na índex stálého složení a stru~ury.71 Proveďte rozklad indexu pracd~os bor ukazatele produktívity prace.

. ." b Ik 7 3 prove te roz ..7.2 Na zaklade ta u y . . , b' minerálních hnOJIV

'. d kcí a ukazatelí produktivíty prace ve vvro e

L 10

.I,q, "" . T (7.22)L'oqj tj = ~~~..l.=~= Llq LY;"L,/,q, , , d sebe odlišovat

• ., ". d x stálého složení se budo~ o (7 22)Z uvedených rozkladu vldlme" ze 10 e y T) Vzhledem k tomu, ze ve vztahu ~.v důsledku svých rozdílných vah (T,v

o re~p~ I ;ožení je odvislá i od toho, zda byl zvyse.n

vystupuje ve váze i hod~ota vo

, h~:n~~ab;;~~:~ý. Jestlíže byl zvýšen již u vysoké úrovne,ukazatel produktívity prace tam, k J

'd . k 'stu 1 oprotL 1,. .

dOJ e Iru" . h ákladů měrnych'k a rozbor vlastmc n , • b

Indexní metodu Iz~ s úsp~che~a~~~st?v;:n~ní výkonových norem, norem spotre ynákladů, ukazatele prodUktIVIty prace, psurovin či energií.

Tabulka 7.3 UdaJe o pro u

Plán Skul. prod.Produkce v tunách prod.práce práceVýrobek CenaVo (kg/hod.) v, (kg/hod)Kč/t Plán q, Skut q,

7900 2137 21826500 80001048

Superfosfát2400 9725500 2100

2127NPK

6500 6700 2052LAV 4400

(8.3)

Ze vztahů (8.1) a (8.2) vyplývá, že ínterval ve vztahu (8.4) zachycuje správnou hodnotu A:

a D(a)"A"a+D(a),

(8.4)

(85)

(8.6)

(8 7)

93

COž se někdy ne zeela přesně zapisuje jako:

A a.t D(a)

Za meznl chyby pak můžeme příjmout hodnoty:

-.(a) M(a)

a M(a)/'

At(a) m(A)[a+M(a~].

ftIen, úloh v pr'·,· v I .Čl' • . bl' h b' d • .."·-11 pfjbl'ž'h ,'~ e ml "sto p atl, ze meZlll a so utm c y a Je po statne me"s. nez' ne o č'sla a, tedy platí: M(a)«a. Mezni relativní chyba je pak Podstatně

92

Page 46: Statistika skripta

menší než jedna, tedy m(a)« I. Při splněni těchto podminek lze při výpočtech použivat

přibližnévztahy:

M(a)lII(a) '" ----,

a

M (a) '" lal. mra) .

(8.8)

(8.9)

Řešení spočivá v d .osazem do vztahu (8 ll) J '

. . e treba mít 4 platné č' I'-J3ó = 5,477. IS Ice, tedy:

N~ní krátce pojednámeoperaclch. o velikosti chvb kt' ,.' ere vzmkají ... 'kl

pn za adních POčetních

Qlyba sOučtu

Říkáme, že II prvních čislic přibližného čisla je platných, jestliže absolutni chyba tohotočisla nepřevýší polovinu jednotky řádu, který je vyjádřen 11- tou platnou čislíci zleva doprava.Tedy platí:

V tomto případě je prvních II číslic platných, tj. číslice am,am_I,···,am_,.I' Veličina mudává řád čísla a II počet platných čislic. Někdy se setkáváme s pojmem počtu platnýchčislic v širšim smyslu, čimž se rozumi připad, kdy absolutni chyba nepřekroči jednotku řádu,

danou 11- tou platnou číslici.

Pří výpočtech s přibližnými čisly (výsledky měřeni) hraje významnou roli pojem platnéčíslice. Platnou čislici je číslice rozdílná od nuly a nula tehdy, jestliže nepoukazuje na řád

čísla nebo leži mezi platnými čislicemi. Z této definice je zřejmé, že existuje rozdíl mezihodnotami 25,14 a 25,140. V prvním připadě dané čislo má čtyři platné číslice, zalímco vedruhém pět platných číslic. V případě celočíselných hodnot např. 15000 nelze jednoznačně

určit, kolik dané číslo má platných číslic. Abychom zamezili nejednoznačnému výkladu, měli

bychom dané číslo zapsat ve tvaru např. 1,50.104. Tak se dovídáme, že dané čislo má tří

platné číslice, platnou číslici by tak byla pouze jedna nula.

D(y) S; D(xl ) + D(x,) +.,.+ D(x,,).

sčitance byla příblížně 000001 V'd', . I Ime, že relativní chyba

Absolutní chyba algeb 'k'hchyb sčítanců ralc e o součtu přibližných čísel

nepřekročí součet abSOlutních

Dů?ledkem této poučky je skut _ _ , (8, 12)relal.vm chyba ze sčíta' ecnost, ze relatIvni ch ba s' '_~aménko. Pokud sČítan:~u';':fkrud Jde, o tak~vý souče;' ve O~~~~~em v~sš~,než nejvyššívyrazně vzrůst relatívní chyba J ?zdllna znamenka, může dojít ke Zl ':"~JI SCltancl stejnépři rozdilu vypadne Te souct~. Při výpočtech je třeba mít ,:~te přesnosti, můžeilustrativní případ uV~d'ment\kProblem ,vyníká pří určování ro~dt.~hkbcl',Sh~ více, kolík jich

ve I ost rozdllu hodnot I u .zkych čísel. Jako

y= 69,132-69,1 I I = O021D(y)- ' ,

- 0,0005 +0,0005 = 0,00 I

d(y)=~_0,021 - 0,05

Relativní chyba každ 'hvzrostla asi 5000 krát! e o

Du-~a SOučinu

(8.10)D(a) = la - AI S; .!.IO~'" .2

Při vymezeni počtu platných číslic v širším smyslu musíme odhady relalívních ch)~dvakrát zvětšit.

Příklad 8. I Určeni počtu platných číslic

Určete počet platných čislic pro případ, že chceme stanovit odmocninu ze l/icdla nepřekročit relativni chybu 0,001.

(813)

číscl (rozdílných od I) _ "nu y neprevysuJe

95

Určeni počtu platnÝch" /' ..- CIS Je SOUCJnU

r ete P<>čet platných č' r

/s /c SOučinu y = 12,2.73,56.e!cnl získáme " . Všechny číslice jsou platné.

VYUzlllm vztahu (8.13)

d<)) 0,05 + 0,00512.2 73,56 = 0,0042,

Y ~ 12,2.73,56 = 897 432yú(v) ~ 897 0,004 = 3 6 ' ,, ,

lid VJdlmc ., le VÝsledek ol'

a POUze 2 platné čí r ' ,s .ce, nutno Jej psát jako 897 ±4 ,

Relatívní chyba s" _,IOucet relativních chYbOt~C,lllu _~ekohka přibližných

ec Ito clsel.

ú(y) S, d(x) dI + (x')+"'+d(x,,).

lad 8 2(8.1 1)I (I )'-1d(a)s;-. -am 10

a" - prvni platná čislice čísla a, které je m-tého řádu.

Při řešelÚ řady úloh je významný vztah mezi relativní chybou přiblížného čísla apočtem jeho platných číslic. Dá se ukázat, že pokud kladné čislo a má II platných čislic,

( )

,-1

pak relativni chyba tohoto čisla nepřekročí hodnotu /0 dělenou první platnou číslicí, tj..

94

Page 47: Statistika skripta

-Chyba podíll1

Relativní chyba podílu nepřevyšuje součet relativních chyb dělítelc a dělence.

Příklad 8.3 Určení počtu platných číslic ppdí!!!

Určete počet platných číslic podílu hodnot 25,7 a 3,6.

alespOll dva aroume t •h" " n y, pozadavku na -,

mno a pnpady, proto se vkládá dalši p;e:;:~~~SI ~~~~mentů funkce lze vyhovět nekon • ,I. Předpokládáme, že všechn ..... azCIl1~třj nejobvyklejší Předpoklady.ccne

y parClalru dIferenciál uy D .chyby funkce /.J(y) V ". y &,' (x,) působi stejně na tvorbu

. YIlZltlln vztahu (8 14) J •. ze psal:

(8. I7)

Řešení získáme z poučky o chybě podílu, tedy:

d(y) = 085 + O-,-O~ = O01625,7 3,6 ' ,

D(y) = (25,7: 3,6).0,016 = 7,14.0,016 = 0,1 17,

y=7,14±0,IJ.

Výsledek má tedy pouze jednu platnou Číslící.

Chyba mocniny a odmocniny

Relativní chyba ln-té mocníny je ln-krát větší než základu, relativní chyba ln-téodmocniny je m-krát menši než rclativní chyba daného čísla.

D(x,) = D(Yl.

I(~I1ax, (8.16)

Tomuto postupu se Ilěkd "k'y fl a metoda ste;ny'ch ,. •

;J V IVU.

2. Jíným předpokladem' ,D(x ) - D( Je ten, ze absolutní chyb 'h

I - x,) = '" = D(x ) = D(x) MJ ' Y vsec argumentů jsou stejné PI 'Dosaz ' d " . UVl se o met d" , . all tedy'

emm o vztahu (8.14) dostaneme: o e stejných absolutních chYb'

D(x)= D(yL

"1 a I'L J -'=1 iJx,

Obecný vzorec pro chyby

Jestližejde o derivovatelnou Iilnkci y =j(xl,x,,"',x,,), pak v případě malých chyb, kdy

lze díference druhého řádu zanedbat, lze psát:

V praxi potřebujeme znát chybu statistického ukazatele, jestliže známe chybyjednotlivých členů tohoto ukazatele, z matematického hlediska potřebujeme znát chybufunkce, známe-Ii chyby jednotlivých argumentů této funkce.

1 Konečně třetím Čt ..ste'n '. . ' as o vyuzlvaným předpokl d .

l e, Jde o metodu stejných relativnír~ ~~~~e tg, ,že všechny relativní chYby jsou

Protože d(x,) = d(x,) = ... =d(x,,) = D(x,) = D(x,) pet ~(~dlme do vztahu (814)

D(x) _ kl I lx, I );J = .. , = -Ix1,,2 = k proto, - x, a dosazením do (8 14) 'k' "

ZlS ame tvar

(8.18)

(819)

D(y) =k fix; iJyl,'",I Ox,

k _D(y)

~Ix 0/1 a konečně:ft I ar,

(8.14)"IOJ I "lOJIDú')=ldj(xl,x,,"',x.)1 = L -.D(x,) SL --D(x,),,,,I ax, je-I ()X,

a pro relativní chybu:

(820)

97

84 'rč nižadavku Ila velík .

/J(>:.) _ x, . D(y)

tlx,~I'(8.15)

d(y) = D({2 $' fil: D(x,) = fl~_lnj(_xl_,x_"_... ,x-,,ll' D(x,) =IYI ,.1 Y ,ol Ox;

I

= flaln~l. D(x,).1+:1 ar,

96

Neméně d,lIežítá je úloha obrácená, kdy z požadavku na absolutní chybu fupotřebujeme stanovít požadavky na velikost absolutní chyby argumentů funkce, tedYpožadavku na přesnost funkce stanovit požadavky na přesnost měření. Pokud má fu

Page 48: Statistika skripta

p=a.b,

I 1 _ I = 0,0005,k =a.b+a.b =~ - 2.5200

D(a) = 5.k = 0,0025,

D(b) = 200k = 0,1000

O0005 tedy dohromady 0,001.. , h ba rovna ,

V'd' 'ze u obou stran je re\atlvm c Y ,1 tme,

98

9. POČET PRAVDĚPODOBNOSTI

9.1 Úvod

I v posledni době jsme svědky bouřlivého rozvoje výrobních sil na základě komplexníautomatizace výrobnich procesů. Docházi k neustálému tlaku na zvyšováni kvality produkcea spolehlivosti výrobků. Do popředí zájmu přicházi tlak na snižování zásob všeho druhu. Tytopotřeby vyvolávají nutnost používání objektivniho znázornění zkoumaných jevů. K tomupřispivaji matematické a matematicko-statistické metody spolu s využitím počtu

pravděpodobnosti.

Technologický proces bez vhodného systému kontroly a regulace neni schopenposkytovat výrobky, které by byly z hlediska jakosti plně homogenní. Je tomu tak proto, žežádný technický výpočet nemůže v reálných výrobních podmínkách předvídat všechny možnéfaktory, které působí na výrobni proces a i na kvalitu výrobků. Mezi těmito faktory je velkémnožstvi takových, které samy o sobě maji na chod výrobního procesu jen velmi malý vliv.Těchto faktorů bývá velmi mnoho. Diky tomuto velkému počtu výrobní proces neprobihá zastriktně konstantnich podmínek a výsledkem je i produkt s kolísajícími vlastnostmi. Kolísánívýrobního procesu je dáno existencí náhodného kolísání výrobních faktorů, krátce řečeno ­náhodou. Takto se chovaji kvalitativní znaky výrobku, měrná spotřeba surovin í energií,výkon výrobniho zařízení i počet vyrobených nekvalitních výrobků.

Náhoda existuje zcela objektivně, nezávisle na našem subjektu a má svou přičinnou

podmíněnost. Náhoda nevyplývá z nutnosti zákonitosti zkoumaného jevu, je pouze formouprojevu nutnosti. Chování jevu, který je ovlivněn náhodnou, je vázáno na určitý komplexpodminek. Při jeho změně dochází i ke změně zkoumaného jevu.

Počet pravděpodobnosti je vědní disciplína, která se zabývá studiem zákonitostipůsobení náhody. Zkoumáni hromadných procesů, při kterých provádíme řadu měřeni při

obdobných podmínkách, se neobejde bez počtu a teorie pravděpodobnosti a na ni založenématematické statistiky. Při tomto objektivnim přistupu k hodnocení hromadných jevů

procesů dovoluje využití poznatků počtu pravděpodobnosti formulovat a odhalovat různé

l onitosti, kterými se řídi výrobni proces i jeho výsledky. Tak jako matematické disciplíny,I počet pravděpodobnosti a matematická statistika zkoumaji obecné zákonitosti

omadných jevů bez příhlédnuti k zvláštnostem zkoumaných jevů. Díky tomu lze výsledkyI 10 vědnich disciplin aplikovat na jevy r'lzné povahy a podstaty, a to jak v oblasti

"ke,.lak i oblasti ekonomické. Musíme si však uvědomít, že správnost řešení je odvislá~ho. jak hlubokou jsme provedli analýzu příčinných vztahů. Matematicko-statistické

Y Jsou pouze pomocným prostředkem při zkoumání určitých jevů. Podstata řešeni~·'Wl..'ncho problému je však vždy záležitost technická čí ekonomická.

c:t be"'. náh,ody j~ významné např. ve výrobě syntetických vláken, kdy docházipO(~Pcr1 vyraběneho vlakna (doba mezi dvěma přetrhy je náhodným jevem) Správné

I tohoto je:", slouží k určení velikosti obsluhy zvlákňovacího zařízeni. V praxi má""~,..~"" 'nam odhšeni náhodného kolísání zkoumaných veličin od nenáhodného kolísáni.

proV~ěné zásahy do technologického procesu jej zhoršuji. Regulace má význam• c ceme-h odstranil nenáhodnou přičinu výkyvu. Indikace náhodného

99

Page 49: Statistika skripta

~-------

(9./)

(9.3)

(9.2)

fl prvků. Jejich po' t ..ce muzeme určit ze vztahu (9. J)

JOl

"""Ulace jsou v '4 /I Tim d anace ll-té třidy z

OSlaneme Vztah,"V I ..(11) ll. 111-- .(11 11)1 - Oj = 111 .

Tll l!lIIačí " " "II lilktoriálně ..

, • pnpomeňme, že 0'= IVanacr s o sko, PoČ p ovánim jsou takové v '

Cl těchto variaci Určímej'ako,anace, kdy se jednotlivé prvky ve sk "I '( . upme mohou

ll) ll'

jeden jev při realizaci náhodnéhv daném vymezeni tyt' ", o pokusu nastat musi

o Jevy jlZ nelze rozložit. '

Soubor všech element' 'h .arnlC nahodn' /' oyc 1 jevu tvoři základnj pr 't '

Vztah ' , os oJ.Lm!QY-'lQJlerace mezI nahodIl' ", yml~

Protože libovolné na'hod ' ,.. ne jevy lze I ..

mnozlnu, mezi náhodnými 'e ,sOZlt z elemenlárních náh . .označuji dva náhodné jevy pjo( plah vztahy a Operace množinov' °Ndnych~ jevů, a ty tvoří

, om. e, ec t symboly A a fl

AcB 'ď', , VYja rUje stav, že nastane-I"" . ,I Jev B nebo že j'ev A j'e c'a' t' ' I pn reahzacI náhodného pok '"k" ' slJevuB' - , usu jev A 'n a mkluze množjn ' CI ze Jev A má za násled k . . nutne nastaneA =B je definici ro~nocenno " • e Jev B. Tomuto Vztahu semá za následek jev A stl Jevu, tedy stavu, kdy jev A m' ,A+B = AUB j'e VYJ~a'd" . a za nasledek jev B a jev B

" rel1lm sjednoce ' (v pnpadě, že jsou neslu 'í ' " Ol součtu) náhodných 'evů "rozumime jev že nast cbtel~e (dISjunktní) je ve vyjádře '. j, . Vyznam součtu jevůtakový jev' ' ane ud jev A nebo ll. JesU" 'd ,Ol. sjednocením jevů A a BA _B zn;č~er~:~~ne ~hlesdPo,ň jeden z jevů A neb~~ j e o jevy slučitelné, pak SOučtem jekt' ", na o nych jevů R d' 'ery spoclva v nastou ' , . oz dem charakteriz 'A B =Anfl vYJ'ad' pen. je.-:u A a nenastoupeni jevu B uJeme takový náhodný jev,

, " ' ruje soucrn, tedy tako " ,A je opacny jev a je rovnoce' vy jev, kdy nastane jev A i jev B

nny s nenastoupenim j'evu A 'Vb ' .!trane pojmy z kombinatoriky

Pii řešeni někte 'ch 'uvahy, ty se o íra'i ry , pra~depodobnostních úloh 'sm '.,definiční vztahyP J o zakladnl pOjmy jako variace a Jk ebllucenl POUZlt kombinatoricke'

, Om mace N '. yru uvedeme základni

Variace k-té' "dpn' .11 YZ II P k· ,

u, pličemž na oř d' , rv u vyjadřuji tvorbu VŠe h '.Uplně pouzej:dn~u 't:dnotlivy.Ch prvků ve skupině zá~ež~~znxch skt~pín o k prvcích z II

eopakujl se) Počet vanaci bez Opak j~ ,noU:~e prvky se vyskytují

"

( J ova", je dao vztahemI II) I"

(11- k)i = 11(11-1)'''(11_ k + 1) .

100

a nenáhodného výkyvu je možná při uplatněni metod statistické regulace výrobniho procesu.O této metodě bude podrobně pojednáno v kapitole 14.

Jiným velmi důležitým pojmem je náhodná veličina. Náhodnou veličinou se v počtu

pravděpodobnosti rozumí veličina, která jako výsledek náhodného pokusu může nabývatrůzných hodnot.

Náhodný jev je takový jev, který při realizaci určitého komplexu podminek může, alenemusí nastat. Mimo tuto kategorii leží jev nemožný, tj. jev, který nemůže nikdy nastat a jevjistý, jev, který musi nastat vždy. V naši každodenni praxi se mnohokrát setkáváme právě

s náhodnými jevy. Do této skupiny patři výroba kvalitniho výrobku, výkon výrobnihozařizení, počet poruch výrobniho zařizeni za určítou dobu, velikost měrné spotřeby suroviny.Náhodný jev je výsledkem pravdčpodobnostních neboli stochastických zákonitostí.Existence jevu náhodného, jistého či nemožného je vždy vázána na přesně vymezený okruhpodminek, tak z jevu náhodného se může stát jev jístý a naopak, záleži tak na vymezenémkomplexu podminek.

V mnohých současných aplikacich statistických metod jsme nuceni zkoumat soubornáhodných veličin, který náleži různým hodnotám nějakého nenáhodného prostorového čičasového parametru. Soubor těchto náhodných veličin se nazývá náhodným procesem.

N:íhodný pokus je realizace určitého komplexu podmínek svázaného s existencináhody. Nejedná se tedy pouze o pokus jako experiment. Z hlediska počtu pravděpodobnosti

lze i výrobu určitého výrobku chápat jako pokus. Náhodným pokusem je i opakovanépozorováni. Jestliže chceme určit obsah účinné látky v surovině, často opakujeme měřeni natomtéž vzorku, z hlediska počtu pravděpodobnosti provádime náhodný pokus. Oblast využitipočtu pravděpodobnosti zajimají opakované pokusy, při kterých je zachován určitý komplexpodminek. Jevy, které probihají při mnohonásobném opakování pokusu nazýváme hromadnéjevy.

Z uvedených definic základních pojmů je patrné, že pojmy náhodného jevu, náhodneveličiny i náhodného procesu jsou spolu svázány a váží se na případy, kdy zkoumáni mlhromadný charakter. V takových případech nás nezajímá výsledek jednoho pokusu, altzákonitosti hromadného jevu jako celku. V hromadné výrobě nás tak nezajímá vlastnOllkonkrétniho výrobku - statistické jednotky - (hmotnost pneumatiky, pevnost vzorku vlál<:obsah specifické nečlsl0ty ve vzorku výrobku), ale úroveň a rozděleni vlastnosti ve veškprodukci, tedy ve vymezeném statistickém souboru.

Základnimi pojmy, se kterými počet pravděpodobnosti pracuje, jsou náhodný pokus(pokus), náhodný jev, náhodná veličina a náhodný proces.

9.2 Základní pojmy v počtu pravděpodobnosti

Pro pochopeni základni,;h pravděpodobnostnich zákónitostí je účelné mezi náhodn

jevy vydělít úplnou skupinu elementámích (prvotních) náhodných jevů. Tyto jevytyto základní vlastnosti:- jsou navzájem neslučitelné neboli disjunktní. Nastane-Ií jeden náhodný jev, nemůže

jiný, řikáme též, že nemaji žádný společný bod,

Page 50: Statistika skripta

. ". aby se jednotlivé prvky vekdy je mozne,.' j'sou permutace,pakovanlO\

Permutace sOJ .' h počet je dán výrazemskupině opakovaly eJlc (94)

103

Ul této úlohy vede na určení pravděpodobnosti podle klasické definicepr.,·~llodobnosli. Ve jmenovateli bude počet všech možných skupin O rozsahu /I, na poradí

nezaloží. takže počet všech možností je (:} Určení počtu "příznivých" případů se

.; n:~t, že vadné výrobky lze vybrat pouze ze skupíny vadných výrobklr, a těch je_ L I d'; . Y

hze, sku~InY dobrých výrobků, jichž je N, K. Počty možných výběrů

• .._ h r~~ vytobku budou dány příslušnými kombinačními čísly. Skupiny dobrýcho pak spolu kombinujeme. Výsledkem řešeni je vztah:

Je hodnocena dodávka výrobků, která obsahuje N výrobků. V této dodávce je K'u vadných. Náhodně vybereme ke kontrole /I výrobků a ptáme se, jaká je

~ipodobnost toho, že při kontrole objevime právě x vadných výrobků. Zkontrolovanév lpět do hodnoceného souboru nevracíme. Takovému druhu výběru říkáme výběr bez

rartnl

U klasické definice pravděpodobnosti se určení čitatele a jmenovatele často oprrao kombinatorické úvahy. V jiných připadech může čitatel i jmenovatel představovat oblastioapf plochy a v takových připadech se mluví o geometrické pravděpodobnosti.

Klasická definice pravděpodobnosti stanovuje pravděpodobnost jako čislo, kterévznikne jako podil počtu případů danému jevu "přiznivých" a celkového počtu případů.

V případě stanovení pravděpodobnosti toho, že na náhodně hozené minci padne rub, jezřejmé, že jde o dvě možnosti, z nichž pouze jedna je "příznivá" - padne právě rub.Pravděpodobnost toho, že padne rub je tedy jedna polovina. Tato hodnota bude skutečnou

pravděpodobností toho, že padne na minci rub jen v případě, že hod bude proveden zcelanahodně, a že mince bude dokonale homogenní. Pokud nebude homogenní, může jedna stranapadat častěji a klasickou definici skutečnou hodnotu pravděpodobnosti nezjistime, budeme semuset opřít o definici statistickou.

Z povahy obou definic je patrné, že maximální hodnota pravděpodobnosti je jedna.

Ptiklad 9.1 loha o v 'běru bez vracení

Pojem pravděpodobností je mnohými chápán intuitivně jako určítý stupeň naplnění toho,že sledovaný jev nastane. Jako jedno z prvních vymezeni pojmu pravděpodobnosti sahá dostředověku v souvislosti s hazardními hrami. Tomuto vymezení je nejbližší statistickádefinice pravděpodobností. Jde o stanoveni relativní četnosti toho, že zkoumaný jev nastanev připadě velkého počtu pokusů. Jako příklad lze uvést stanovení toho, že na náhodně hozenéminci padne rub. Lze experimentálně ověřit, že s rostoucím počtem pokusů (hodů) relativníčetnost padnutí rubu bude neustále těsněji kolísat kolem určité hodnoty. Tuto hodnotu lzenazvat pravděpodobností toho, že padne rub. Je třeba znovu zdůraznit, že všechny hody musíbýt provedeny zcela náhodně a určení pravděpodobnosti je pouze příbližné, neboť se pokaždém hodu bude relativni četnost měnit. Počet provedených pokusů musí být veliký. Natomto principu jsou založeny i některé simulační techniky, kdy na počitačí lze provést značný

počet pokusů. O těchto simulačních technikách bude podrobně pojednáno v předmětu

Operačni analýza. Uvidime pozdějí, že statistická definíce pravděpodobnosti souvisi sezákonem velkých čisel.

9.3 Definice pravděpodobnosti

(9.8)

(9 7)

(9.6)

(9.5)

běžné úlomI 000/ což je procca __ .1 10,

12.11faktoriálu pro 11>50 jeChyba při určení

r,;; - " 'n\~ -..j21t.n.n .e

". k O nezáleží. Protožekd na poradl prv u .' k té

Kombinace představujdí ~~vá~~n~ar~~~r~~;o tří~y můžeme určít počet kombmacl -

k mbinací k-té třídy lze oS a .z o o' ktřídy z n prvku ja o:

V,(n) _ n! jnlC,(n) =1:\- kl(n-k)1 ~k) , ' . dnoduchost

, očet může být pres je ."..' binačnim čislem Jeho vyP • i hodnotami 1/. EJ<.rst~~1

počet kombínacl)e. da~ ~~~nota velmi rychle roste ~ ro;~~u~:dnoty n>SO lze POUZlt

zápisu pracný, gr?tozeljeh často v hodnotách logantm~f: ktoriálu v nekonečnou řadutabulky faktonalu ve ml h který je založen na rozvOJI aužitečného Surhngova vzta u,

( 1 I +...\.n! '" .JWn"e',\1 +l2n + 288n' )

" "dobry'ol přiblíženímvztah:50 je dostatecne

Pro určení faktoriálu pro II >

P' - n" "'t fl prvků se" - . . "padě že v celkovém poc u

, "t permutact v pn, k " h

J" případem je stanovent poc u , I t' t '" i = n. počet tec tomym· " J "eimé že musr par '-' J

'tOStl l eZfJ) ,'>:'ku"e s různou ce n J'každý prvek opa j

, odle vztahu:permutad slanov1me p

n!. i)---P (i p I 2 .···) k -,' li 1... ;,'

n \" 2"

("+ k - 11C;(Il)=~ k )

, .. ' ' h se kallltdostacujlCI , h skupin ve kteryC těcl"

. akováním představuií t~orbu ,~a~í°:J~ř\ tutéž k~mbinaci PočetKonlbmace s op, . 'prvky v ruznem porak může opakovat, ale steJne

prve '01kombínací je dán vyraze

\02

Page 51: Statistika skripta

Jako numerickou ilustraci určime pravděpodobnost toho, že v dodávce o N výrobcích,z nichž je 30 vadných, nalezneme všechny výrobky dobré, jeden vadný, dva vadné a tři vadné,jestliže ke kontrole náhodně vybíráme tři výrobky. Protože jde o výběr bez vracení, stačí

dosadit do vztahu (9.10), např. pro x = O:

(N-K) (K)l1-X x

P (ll x)=----·-N.K , (~)

(9.10)

9.4 Pl'avděpodobn .oshu operace

Z axiomaticke' (/efi .lnIce pra ď. . v epodobnosti lze jednodu' .

- jesthže A c B pot P Se odvodIt tato pravidla-• jestliže A _]]' om (A):;; P(B) , .

- -, potom I'(A) = 1'(8)- P(A) = I-P(A) ' (9./4)

(9.15)Vztahu (9.16) se ři . • (9 16)

pracného výpočtu p vypoctu praktických úl h ". .

~:::~~~~~,~st ~ýS~;Ua\a:ué~~n~;:o:{~Vdě~?d~b~:uz~~:č~:~~ j::;í ~. cesta méněo VYlobku a pak stanovit pravdě muze byt jednodušší určit . r a~'e.h určit

O podobnost jevu Opač 'J P avdepodobnost_perace sčítárti ne 10.

Vidíme, že i když je v dodávce 30% vadných výrobků, pravděpodobnost toho, že při

kontrole tři výrobků budou všechny dobré, je dostí vysoká, a to 0,34.

Pravděpodobnost sjednocení konečného počtu nebo spočetně nekonečného počtu

neslučitelných jevů A" A" ... je rovna součtu jejich pravděpodobností,tedy lze psát:

Obdobně získáme další výsledky P,OO,3Q(3,1) = 0,45

P,OO.30 (3,2) = 0,19

l~oo.3Q (3,3) = 0,02

(9. J7)

(9.19)

105

~ .určeni pravděpodobn' •

loho, že nastane alesPOňjedenO;tj':?UcAtu jevů slučitelných jde o st .Vll nebo 8 V ". . anovenl pravď d .

P(A +B) . yuzltlm aXIOmu 2 lz' epo obnostl=P(A) +P(B) _ P(AB). e psat:

/nedanou pravdězmenšenou podobnost sOučtu •. .pravdě o pravděpodobnost ~rc'me jako SOUčet ravdIJIduk ~obností sOučtu Iz š~~ho, ze nastane jev AP. ěpodobností jevů A B

CI ze ze Vztahu (9 17) ;o:;~ ;'~y'~azau/.íbovolný počet sČí;a~~~. l! Vztah pl o ur~eniUplnou matematickou

!'(~ ,

4.-A.)= L;P(A.)- ~P(A A)+ "1'

" L., "J "(AAA'.J' L., ,. J' ')""'+(-1)" ' /'(1<) I,Jol"'l A A A )"Jd ,. , ..... " .(9.18)

---""'.J.JjLIQli'ení

Pro stanOVení~/lého a pravděpodobnosti

na 10 nepodmíněného' Operace násobeni 'e ř .

\)r~~mn;(a'/jiný jev i::í:~~on~íllěIlÝIll.jeve~ r~;~~i~~P;av:ov~Ymezit pojemAB) ajejí velik. ,pravdepodobnost jevu A Y jev, ktelY.le

ost určJme ze vztahu' vzhledem k jevu B8) P(A.B) .

1'(8) .

Při urČováni pravděslučitelné a kd . podobnosti součtu dvo '. .ted .' Yo jevy neslučiteln' P u jevu rozhšujeme ..

(9. r2»:~:~~~:~Vp~~odobností toho~ ž:~a~~~~íJ~~vAděpodbobnosl;:::I~~~j:~ ~:!tudc,ntá JO jevhY. ne o B se • I e nyc

Opreme o axiom 2 ( h'P(A -+8) = PIA) +1'(8).

(9.11)

(9 J2)

(9.1))

Axiom 2.

Axiom 3.

Axiom I.P(A);' O.

P(A, +A, + .. ·)=P(A,)+P(A,)+"·

P(U) = I.

Pravděpodobnostjevu jistého je rovna jedné.

104

Jednotlivé definice nejsou spolu v rozporu, ale každá definice sama o sobě. n~ní.úP~Jistě nás zajímá pravděpodobnost výskytu vadného výrobku v dodávce. Je zřeJme, zepravděpodobnost lze stanovit, či lépe řečeno odhadnout, .jen pomocí statistické defipravděpodobnosti. Klasické definice by šlo použít za předpokladu, že známe počel vadnvýrobků v dodávce, ale ten neznáme. Řikáme, že uvedené tři definíce pravděpodobnosti

bezrozporný systém definic.

Poslední definíce pravděpodobnosti je definice axiomatická, která odstraňuje některé

nedostatky předchozích definic. Předpokládá, že existuje množina elementárních náhodnýchjevů a náhodný jev je podmnožinou vzájemně se vylučujících jevů, pak každému náhodnémujevu je přiřazena pravděpodobnostP(A), cožje nezáporné čislo, tedy:

Page 52: Statistika skripta

(9.27)

(jev jistý)

107

•LP(AnB,) = iP(B,).P(AiB,)

'00]

Jevy jsou v součtu opět disjunktni, a proto platí:

(A)

T

B U8 U"'U13 = U, ,

Protože jevy B, tvoři úplnou skupínu vzájemně disjunktních jevů, platí:

,P(A) =L,P(B, ).P(AI13,) .

, ,

Dále bylo zjištěno, že 535 archů nevyhovuje v šířce, tedy P(Š) =~ = 0,02675.20000

Určete pravděpodobnostloho, že náhodně vybraný arch bude vadný.

p(D)=~+_J2~=~ =003725.20 000 20 000 20 000 '

P(V) = P(D +Š) = 1- (1- 0,03725).(1- 0,02675) = 0,0630

Pravděpodobností P(A) se v tomto případě říká úplná pravděpodobnost, a ta je rovnatu součinů pravděpodobnosti jevů 13, a podmíněných pravděpodobností jevu A jevy 13, .

Jestliže se jev A mtlŽe realízovat pouze za podmínky, že nastal jev B, ze souboru jevů

8"8''-'',13,, přičemž jevy Bi tvoří úplnou skupinu dísjunktnich jevů a jestliže známe

všechny pravděpodobnosti jevů 13, a všechny podmíněné pravděpodobnosti jevů P(AI13,) ,

pak můžeme stanovit pravděpodobnost jevu A podle vztahu:

Volná Dravděpodobnost

Prolože dodržení rozměru v délce a šířce lze považovat za jevy nezávislé, řešení úlohynás vede k určení pravděpodobnosti součtu dvou slučitelných, ale nezávíslých jevů. Dosadímelak do vztahu (9.26) a určíme pravděpodobnost výskytu vadného výrobku jako:

Příklad 9.2 Určení zmetkovitosti ve výrobě

Ze zadání je zřejmé, že jde o součet jevů neslučitelných. Označíme-Ii symbolem D, žearch nebude vyhovovat v délce, platí:

U 20 000 archů bylo zjištěno, že 620 archů je delších než připouští norma a 125 jekratších než připouští norma. Určete pravděpodobnost toho, že náhodně vybraný arch nebudevyhovovat v délce.

(9.2J)

(9 20)

.' U IJ.e rovna SOUCl"A,

pen' A) = řl P(A, ) ,P(A,A,,··A,}= '"\' ~}

že nastane jev AI i A,tedy pravděpodobnost,

d b tí ' J'sou napravděpo o noS . d lučitelných jeve\, klere

b t oučtu vou s. . ště pravděpodo noS s

Určeme nynt Je , .. . l' MO žeme tedy psal.

nezaVIS e. u 1'(13) _ P(A).P(B) =P(B)-P(AB) = P(A) +

P(A + 13) = P(A)+, 1(1- 1'(13)1= J- p(A)P(B)= I-(J-J (A)

. 13 jevem A jako:" d'" ou pravděpodobnostJevu

Obdobne po mmen

106

P(A.B) = P(B\A)P(A),

P(A.B) = P(A\B).J'(B) 'evu A nezmění, ať Jev," e pravděpodobnost J , . I'

." P(A\B) = P(A) , pak to znamena, ~e sB' u na sobě stochasticky nezaVIS e,Jesthze "' d" "'káme že Jevy A a JSo

13 nastal či nikoli V tomto pnpa e fl ,

a pak nutně platl: (922)

P(A.B) = }'(A)P(B) . ké .ev 13 je nezávislý na." .' A nezávislý na jevu 13, pak ta J

Ik m zřeJ'mé že jesthze Je JevJe ce e ' ,

ť ckou indukcI,jevu A "" zobecnit úplnou matema \

d" odobnost součinu lze rovnez

Vztah pro prav epv .sledkem bude vztah (923)Y P(A\A A .··A ,).

\A P(A,\AIA,)'" "n., ,-

P(A,A, .. ,A,) = P(AI)P(A, ,). 'estliže podmíněna, . I' . v souhrnu, J 'k že

A nazýváme nezaVIS ym\, . o v očtená za podmm y,Jevy A" A" :'" 'libovolného jevu zdané s~pmy J~:í~ě~r pravděpodobnost> JeVIl.

pravděpodobnost vyskyt~ b"hly se vždy rovna nepokterékoli jevy této skupmy pro e ,tedy když platí: (924\

P(A,\A\ .. 'A,A",,)=P(A,),kde .~A Jestliže tyto jeVY J

'vů A"A,,-", ".sou libovolné jevy ze souboru Je .

A" A,,'" J d' dokázat že platí vztah..' hrnu pakse a 'nezáVls\e v sou ,

P(AB)P(R\A)=--"

P(A) d" odobnost součinub ' prav ep •

o I 'vá i vztah pro náso em -" dchozich vztahu vyp YZ obou pre

dvoU jevů A, B.

Page 53: Statistika skripta

---------•

9.6 Rozdělení náhodné veličiny

Pro spojitou náhodnou veličinu obdobou rozděleni pravděpodobností je rozdělení hnstotpravděpodobnosti:Hustota pravděpodobnosti[(x) je definována jako derivace distribučnífunkce F(x) podle x, tedy:

(9.30)

(929)

(9.28)

(9.31 )

109

jestlíže a je dolní mez definičniho intervalu náhodné veličiny.•

/, (x,,) ~1f(x).dx,

f(x) ~ dF(x) .dx

Hodnotu distribučni funkce v bodě Xo lze stanovít ze vztahu:

Z definice distribuční funkce je patrné, že jde o funkci neklesající, tedy plati:

F(x,);;' F(x,),jestliže platí x, > XI'

F(xo) ~ P(~ <; xo)

,..qHlI'tIuS,lota pravděpodobnosti není pravděpodobnost, nelze ji rovněž bezprostředněPII'~Il(°idva~ Výraz f(x),dx se nazývá pravděpodobnostni element, který vyjadřuje

o nost, že náhodná veličina nabude hodnoty mezi x a (x+dx),

"'lOdIliPrcf8Xh i se. velmi často setkáváme s případem, kdy současně sledujeme celou řaduvehčm tzv v' • 'I d I'·' b I' 'h d' k . h-Mlení P bl" . Icerozmeľnou na 10 nou ve Icmu ne o I na o ny ve tor a Je onr~ e~ ukážeme na připadu hodnocerú dvourozměrné náhodné veličiny. Chováníe vehčmy lze popsat pomocí simnltánní distribučuí funkce F(x,y), která je

Jinou vlastnosti je ta, že distribuční funkce pro největší hodnotu náhodné velíčiny

z definovaného intervalu musi býl rovna jedné (distribučni funkce v poslednim bodě je rovnajedné). Chceme·li určit pravděpodobnost toho, že náhodná v~ičina nabude hodnot z intervalu

xl,x,), pak tato pravděpodobnost bude dána rozdílem distribučnich funkcí v daných bodech,

tedy'

Vzhledem k povaze hromadných náhodných Jevil nás nutně bude zajímatpravděpodobnostní chování náhodných veličin. Toto chování lze popsal pravdčpodobnostnímrozdělením. Toto pravděpodobnostní rozdělení lze v případě dískrétní náhodné velíčíny

stanovít množinou všech možných hodnot náhodné velíčiny spolu s pravděpodobnostmi, sekterými náhodná veličína těchto hodnot nabývá. Tuto dvojici údajů (hodnot náhodné veličiny

a příslušné pravděpodobnosti) lze stanovit tabulkou nebo funkčním předpisem; říkáme pak, žeje určeno rozdělcní pravděpodobností. Pro veličiny diskrétní i spojité lze zákon chovánináhodné veličiny popsat pomoci její distribuční funkce. Distribuční funkce F(x) v danémbodě Xo udává pravděpodobnost toho, že náhodná veličina .; nabude hodnotu menši nebo

rovnou hodnotě xo ' Tuto skutečnost můžeme zapsat jako:

. . obků vzatých do výrob): .•

P··klad 9 3 ZmetkOvitost vyr , "' bude vadná jesthzen . , . t k montazl '

ho že součástka, ktera Je vza a hcházi 50% součástek seUrčete pravděpodobn~~t~od' ' telů Od prvního dodavatele p , l% a od třetího 20%

součástky přícházejí od tild \~haOv\O% součástek se zmetkovItoSt!. 'o 5°A od rulezmetkovitosti , o.. . 0/O.' .tek se zmetkovItostI 1,5 .

soucas P(B ) ~ O20 ._ 050 1'(B) ~ 0,30 " - 0015

Ze zadáni je zřejmé, že 1'(BI ) - , -.'0005 1'(A\B,) ~ 0,01 1'(A\H,) - ,, ,. P(A\B) - ,

Dále ze zadáni úlohy vyplyva, ze I

, 'h (9 27) úlohu vyřešíme:Dosazemm do vzta u .

1'(V) ~ 0,50,005 +0,3.0,01 +0,2.0,015 ~ 0,0085.

9 5 Náhodná veličina .'. lné formě, proto za• " dřovat v clse 'h d

'mí se setkáme, budeme VYJ~ která může vlivem na. ~ YNáhodné jevy, se ktery .t měřitelnou promennou, .' Náhodné vehcmy

.•' b deme rozume .,'hodné promenne.'hodnon vehclllOU u. • někdy hovon o na

na h h dnot v hterature senabývat různýc . o kt.' k' ch důvodů rozdělují na:se z teoretických I pra IC Y

d· k 'tní náhodné veličiny,\. lS re, 'hodne' veličiny. č ' nebo2. spojlte na , • ' b' vat kone ne..' ktera muze na y , y v

, r.'na je taková vehcma, .... rvky mohou být zapsanDiskrétní n~b~dna .:~ l~~odnot, tj. takovou množinu,.Je~lz ~'kacich statistických metodčetně nekonecne mnozs VI .,' x . V praktlckyc ap I říklad lze

~~itém pořadí a tvo~i POls:oupn~::Ši:~:~YS~y~Ují jako celočisel~~1;~~;~~;"J~~č~ vadných

d' krétní náhodne ve Icmy. ch během stanovenese 1$. d vy' robku, pocet poruuvést pocet va navy'robků v dodávce. , ' která nabývá nesPoČCodtně

, k' náhodná vehčlna, akt obsah v YI,·' a Je ta ova ( I t v re oru,

S "ta' llábodná ve lcm 'm l'ntervalu tep o apOJI , vymezenenckonečné množstv~ hbo~nhotzav·r~lzení měrné náklady apod.). 'a!<o

'k vyro m o ' • vat Jv produktu, vy on • dy o hodnotách náhodných v~li~~~k~~aznoáhodnéhO

'e další úvahy budeme.,;z , každému jevu, ktery J':",;Ys .' 10 x, řil<álllc'o Čí~~~hn~áhodná veličína ItedYn~~~~!: pokusu jev, kterému je pnrazeno CIS

•' , .' 10 Nastane· I vokusu, urclte CIS . d ot x. '~

~e náhodná velíčma nabyla ho n Y . ko ~ 1) a hodnoty, klelY lil. • 'i řeckýmí pismeny Ja , • 'adřovat,

, 1'" ny se zpravidla oznacuJ ) _ O2 může napf. VYJ daI!iNáhodne ve ICI " ísmeny. Zápis P(~ ~ x -', ' obků je 0,2. V <Id"

pak nabývají, latmskY~" p 'běru nalezneme právě x vadnYC~:~lIšení zápísu, bu

pravděpodobnostdtoh~;o~~t v:e]Zdnoznačnost, s ,ohlede~o~:m,z~eto latínskýmí písmenytextu, kde n~?,o e" .. hodnoty označovat steJnym sym 'náhodnou vehcmll IJeJI

t08

Page 54: Statistika skripta

definována jako pravděpodobnost,že náhodná veličina .; nabude hodnoty menší nebo rovné

hodnotě x a současně náhodná veličina TJ nabude hodnoty menší nebo rovné hodnotě y, tedy:

pro každé (x,y).F(x,y) ~ P(';':; x,TJ':; y). (9.32)

Pok"Ud jsou náhodné veličiny q a . " ,TJ vzaJemne nezávislé, platí:

F(x,y) = l'~ (x) F, (y)

Simultánni pravděpodobnost

pravděpodobnost,že náhodná veličina

hodnoty y:

pro dískrétní náhodné velíčiny pak udává.; nabude hodnoty x a náhodná velíčína TJ nabude 2, I Charakteristíky náhodných veličín

(9.42)

F(+oo,+oo) = 1. (9.35)

F(-oo,y) ~ F(x,-oo) ~ F(-oo,-oo) ~ O a

Simultánní (sdmžená) dístribnční fnnkce je funkcí neklesající a spojitou zleva, a tovzhledem ke každé z obou funkcí, dále platí:

Jestlíže sledujeme pouze jednu náhodnou velíčinu bez ohledu na hodnoty ostatníchnáhodných veličin, mluvime o marginálním (okrajovém) zákonu rozdělení, marginálnídistribučni fnnkci a marginální hnstotě pravděpodobnosti. Někdy se setkáváme téžs podmíněným zákonem rozdělení, kde podmínkou je požadavek stability ostatníchnáhodných velíčín. Pro nezávislé náhodné velíčiny platí, že jejích podmíněná rozdělení jsourovna marginálnim rozdělením. Využítim matematíckého zápisu můžeme psát:

(943)

(9.44)

pro diskrétní veličiny, kde

(e je konstanta)

Charakteristiky náhodn .c ....vlast~osti chování sledovan 7 h ~el,cm .Jsou veličiny, které nám . -. .rozdelením. Předev" 'dYCh nahodnych velíčín J'ež J'so pomahaJJ POp,sovat hlavní

. o'm Jecha k . . ,. u vymezeny 'd'vanabílity, šikmostí a šp" . ra tenstlky polohy (střed' h' pr"v epodobnostním

Icatostl. ni odnoty) charakt . 'k' enstl Y

Střední hodnoty

Střední hodnoty J'sou I'"n" .... ve 'cmy které h akt .eJeasteJsl hOdnotou'e ..' c ar enzují úroveň ." .očekávaná hodnota či ~ate::~m:~, (p~avděpodobnostní prumě~;at'~~'.ckeho So~boru Jejich

a JC a nadeJe, definovaný vztahem: ' nve oznacovaný jako

E(q)=Ex= ix,p(x,)1=1

X, jsou možné hodnoty nál d' ',.'h . 10 ne vehcmy q a ( ) ..

na odna veličína q nabývá hodnot x P f, x, pnslušné pravděpodobnosti se letery' .,. ro sPOJ.te veličiny jde o vztah ' m,

h

E(q) =Ex =fx .J(x) dx kde

a b . a

. JSou meze definičního oborunáhodné veličiny l;.

Nyní ukážem 'kle za adní početni vlastnosti pruměnJ:

F.c =cEcx=~Ex

) !:'(c+x) = ~+Exf.'(x.y) = F r,' '. ox·J-'Y. Pouzev f d"

f.(r+ y) =Ex + Ey P 'pa e, ze veličiny x a y jsou nezávislé veli"6 ":t2.. . Ciny,7 . '" Ex F..,. = (Ex)'

1.(1, Ex) = O . '

(9.45)(9.46)(9.47)

(9.48)

(9.49)

(950)

PnimOUkazy Uvedených v • (9 Sl)cr Při řešení ř d ' ztahu snadno provedeme d '

fl van jako hodl~ y uloh v praxi se setkáváme i s o~aze~'m do definičního vztahu pro

rou je pravdě;~~:bneJvět~ípravděpodobností n:b~v~~~t~~Obnostnír~ modem, který je...., . Jedné Polovin' nostnl medián, COž je hodnot., ou pravdepodobností Jínou

dl'POdobnostní kve, !d~ o zvláštní případ ;ha;'o kterou Je distribuční funkce

nabude hOdnotyantd Je taková hodnota náhodne' aktellstlk zvaných kvantily(l a) V I veličiny pro kt ..- e 'čina a udává ' ' erou dJstnbučni

pravdepodobnost překročení daného

(9.34)

(9.33)

(936)

(9.38)

(9.37)

(9 )9

(9(marginální hustota pravděpodobností)

(marginální hustota pravděpodobnosti)

(podmíněná distribuční funkce)

(marginální distribuční funkce)

(margínální distribučni funkce)

j,(y) '" O (podmíněná hustota pravděpodobnosti).

P(x,y) ~ P('; ~ X,TJ ~ y),

F(~y)= P(';':; ~TJ ~ y),

00

f. (x) ~ fj(x,y) dy,

-00

j( )~ a'F(x,y)

x,y ,&.iJy

F; (x) ~ P('; ,:; x) ~ F(x, 00),

-00

f(x1y) =~~) ,

F~(y) ~ P(t]':; y) ~ F(oo,y) ,

00

f,(y) ~ fj(x,y) dx,

obdobně je definována simultánni hustota pravděpodobnostíjako:

110

1/1

Page 55: Statistika skripta

kvantilu. Například 5% kvantil je hodnota (bod), kde distríbuční funkce nabude hodnotu 0,05,

tedy I-a = 0,95. Při některé tabelaci rozdělení spojitých náhodných veličin se použivaji

tabulky kritických hodnot. Krítícká hodnota xa je hodnota, jejiž překročeni se děje

s pravděpodobností a, což lze obecně zapsat jako:

rozptyl navážky látky s k'd·.L

a """OU je 0,00 I g

P(!;~a)=a.

Pro medián lze napsat definiční vztah jako:

Mti b 1JJ(x) dx = JJ(x) dx ="2' kde/1 Mti

a, h jsou hodnoty mezi definičního oboru náhodné velíčíny !;.

Miry varíabílíty

(9.52)

(9.53)

S tímto případJestliže ch b' em se setkáváme ři

y YJednothvých měření Iz p ,?,hodnocOváni II o akov" ,.průměru klesá úměrně h d v I e povazOvat 2a náhOdné aPna SO~~I n:eza: 1Sj'IÝCh měření.

o note __ král. 2a\lS e, pak chybaPI ln

atnost uvedených vztahů Ize snadno dokázat do ,. '

Příklad 9.1 Určeni ch b' . 'v sazennn do definičniho vztahu~-~..wx ,lli!.'ťiJlky

Určete rozptyl ve '. I'I vaze atky . I'va rozpty Ve váze k 'd' k . , .lest lze

a III YJe také °00/, g.

Řešení je v určení roz 'pty.u rozdílu dvou I' V>ve ICln:

a'(x-Y)=a'(x)+O" _O'(x- )_ ;- (Y)-0,001+0,001=0,002

Y - '11°,002 = 0,0447. '

U měr variabílity zavádíme analogícké míry těm, které jsme poznali ve čtvrté kapitole.Nejpoužívanější mírou je pravděpodobnostní rozptyl kolem průméru (krátce jej budemenazývat pouze rozptylem). Je definován jako pravděpodobnostní průměr čtverců rozdílů

jednotlívých hodnot náhodné velíčíny od svého pravděpodobnostního průměru, tedy:

Va ' v •naCIII koeficient' .

Je , zde ve h ď .s o e s kaplt%u 4 definován . k .

V. = O'(x) ja o./:,>: .

a; =a' (x) =E(x -l.!.x)' . (9.54) Momenty (9.64)

Nyni opět ukážeme na základní početní vlastnosti rozptylu, které budeme v dalším textuvyužívat:

,Pr~vděpodobnostni průměr'. ~POPISUJI rozděleni ravdv I rozptyl JSou zvláštni ř'momenty. I' epodobností i rozdělení h I' Ipady SOustavy charakteri fk kt '

ustot pravděpodobno t' S I, ereI s J~ SOustavy zvané

Momenty počátečni (momenty kolem počátku) k-tého řád .

Jl; =10c' =l:x' U JSou definOvány jako:I . p(x,) , (pro diskrétní veličiny)

(9.65)

(9.66)

(967)

(9.68)

(9.69)

( pro spojité veličiny).

, b

Jl, =Ex' =fx' 1(x). dx

X(X-l)(r. -2). .. , (x-k+l)

11.1

2 ~ty v

stredové (centrální) k-tého řád I " vo

Jl _ E U ze vyjadnt vztahem:• - -(x-Ex)'.

M men f~oriální k t ']- e 10 řádu jsou definova'

,,' I ny ve tvaru:~I'J Ex '1,.Jtde

(955)

(9.56)

(9.57)

(9.58)

(9.59)

(960)

(9.61)

(O 62)

Směrodatná odchylka je odmocnínou z rozptylu:

J 12

1. a'(e)=O,

2. a' (e + x) = a' (x),

3. a'(e.x) = e'.a'(x),

4. a'(x±y)=a'(x)+a'(y)±2.E[(x-Ex}(y-Ey)] , kde

E[(x - Ex}(y - Ey)] = cov(x,y) = Jl", je definicí kovariance ,

5. a'(x ± y) = a' (x) +a'(y), ale pouze v případě, že velíčíny x, y jsou veličíny

na sobě nezávíslé

- x +x +···+x a' (x) 'V" v' . é6. a'(x) =a'(I' ") =--, pokud vehclllY x, JSou na sobe nezavlsl

tl fl

7. a(x) = a~) opět pro na sobě nezávíslé veličíny x,. •"n

Page 56: Statistika skripta

-

(9.80)

(981)

(9.82)

, "

h

M .. (.9) = He'8 = I;e ..,a.p(x,) pro diskrétní velíčiny,h

M.. (.9) = Je"9 f(x)dx pro Spojité veličiny,"

Momentová vytvořujícífunkce M .. (.9) je definována jako:

veličina ,9 je pomocným parametrem, a 10 lakOvým, aby sOUčel resp. integrálv definičních vztazích konvergoval alespoň pro jellO malé hodnoty.

Počáteční momenty k-lého řádu lze z momentové vytvořujíci fUnkce získat dvojimzpůsobem, a to:

I. jako hOdnotu k-té derivace momentové vytvořujicí funkce podle .9 v bodě .9 = O, tedy:

2 rozvojem momentové vytvořujicí funkce v řadu a pak určením koeficientu u veličiny .9k

.

klTento postup je zřejmý při rOzvedeni momentOvé vytvořující funkce v řadu, tedy:

(9.74)

(9.75)

(9.76)

(9.77)

(978)

(9.70)

(9.71)

(9.72)

(9.73)

. d·lenim symetrickým,d ·1 i Je roz edané roz e en levostranným,

pravostranným.

Je-li a, = O,

aJ> O,

aJ <O,

. d finován jako:. , • ičatosti a Je eDruhý koeficient Je mlrou sp

I'J _ --':':.L .a, = (p,)i - a'(x)

, .. uvcdených definic:kl ' yplyvaJ I z' vztahy erc v" "znamne ,, k: ·eme na nektere vyNym pou az o •

• . klé značeni prumeru •P; = Ex = P •coz Je obvy

J.l~ :=. Ex 2,

p,=O, 1 '() 3

,=p;-p =(1 x, ,_ '-3p;I'+2p1, )'_ '-3p'.p+31'1' _p, _P, = E(x - rel: - P, 1

Pk = t.(~}; ,(-Pl' ,

pí'l = P ,

Ji[2] = fJ~ - fJ ,

, , - 3 H' + 21' . fi' t

PIJI = 11.1 ,-, nich pak koe IClen. růměr a rozptyl, vedle•.•. i momenty JSou p

NejvýznamncJslm .. druhy' špičatost.. .e symetrII,, .ch charaktenzuJPrvm z ni

(983)

l n 82

/ 9 1, f)1t,

= +"'.JI+- II +- II +.. ,+ II +'"21 ' 31.1 k! k

Ex .9' , .9' 'J .9k Exk

=1+.9.' +--Ex + -'(ox +... +_, +.. ,=2! 3! kl

tts

ti~~

.....".. """""i'o fuok~ 00""" d~" "'"""'j" o,""""" ~""" ~ "'~.lnu Jejich momentových vytvořujícich funkci, což lze snadno dokázat jako:

r'J "'·m < E." .&'" "M.r'! M,(a) CO",)

" ""." C''', ""'0< ,. -"'"' ~o~, '·'Mo """ "'"o. i.ko ","'.'.0"O'

i' KdYž tUlo řadu budeme postupně derívovat podle .9 a stanovovat hOdnoty derivací

..., O. oh.., "'O "'" """~ jod~ ".0. "o P; T<o j. od'"""", ''",,' ",,"",

(9.79)1', _~

a, ~ f .. )' - a'(x) , 'z další lext~\1-'1 . rmované normální rozdělem ~~ o rozděl...špičatost Je no . • ·.atosti a, > 3, J š'Základnim stand~rd:m pro = 3 Je-Ii koefiCient ~pIC. k o rozděleni ploš Ik

'má koeficient splcatostl, a.. děleni v opačném pnpade patere é normalnl roz •.• ě'š' ež normovanšplcat J I n

114

"'fuke 'Ierelall' řullCI n c • cí Ol zMomentova yyjvo hodně tak, ze pomo., i Přime

' vořující funkce Je ~y:nezenl~v~ěpodobnostníchro~~~;naparátemMomentova v:: . 'momenty velke rady p . obtižné ObecneJs že nam

snadno ~rčov~~f.~i~~e:~mentů by člastoict;;~ro:~~~ých Vzhlede.'~ ;o~;~~vé vylmomentu z funkce komp exn . k' h metod, aparacharakteristické funkce, rávnou aplikaci statlstlc yc •

.. 'teone ale o sp • ,o rozvIJem '. 'Ie dostatecny.funkce bude pro nase CI

Page 57: Statistika skripta

(\0.2)

(10. \)pro x=O,pro x = 1.

pro x<O,

pro O:5x<l,

pro x"'1.

F(x) = O

F(x)=I- p=qF(x) = I

Distribučni funkci lze zapsat ve tvaru:

P(x) = \- P = qP(x) = P

S ohledem na vymezení této náhodné veličiny a skutečnost, že jde o diskrétnínáhodnou veličinu, lze zadat funkci rozděleni pravděpodobnosti ve tvaru:

10.1 Alternativní rozdělení

Alternativní rozdělení popisuje chováni náhodné veličiny, kdy sledovaný náhodný jevnastane s pravděpodobnosti p a nenastane s pravděpodobnosti 1- P = q. Jestliže sledovaný

jev nastane, pak náhodné veličině přiřadíme hodnotu x =I, v opačném případě pak x =O.S ohledem na tuto skutečnost se často hovoří jako o nula-jedníčkové veličině.

]0. ZÁKLADNÍ PRAVDĚPODOBNOSTNÍ ROZDĚLENÍ

V dalším textu se budeme zabývat vybranými pravděpodobnostnimí rozdělenímí, kterámají blízký vztah k aplikací v průmyslové praxi. Tato pravděpodobnostní rozděleni jsouzávíslá na splněni definičních podOlinek, jsou vyjádřena matematickým predpisem.Jednoznačné vymezení chování náhodné veličiny závisi na parametrech těchto rozdělení.

Parametry pravděpodobnostnich rozděleni úzce souvísejí s charakteristikami danýchrozděleni, tedy i s momenty těchto rozdělení. S ohledem na tuto skutečnost uvedeme u těchto

rozdělení vztah pro průměr a rozptyl. Nejprve uvedeme vybraná pravděpodobnostní rozděleni

diskrétni náhodné veličiny, pak spojité náhodné veličiny.

(9.87)

(9.86)

(9.85)

'Ih "druhéKontrolní otázky a UO)'J. b' I' a kombinací s opakovaOlm

" kom Inac. , opakovaOlm, . 1--_ -et variací, vanaCI s , . d é hodiny, jest lze

9.\ Urcete P,?c _ • _ setkaí během dane je n '10 časovém

9 2 ~~~;:;:~~:;;~bno:tk~j~o:n;:i:á~~~ o;~b~inut;~ Ppř~~~~~~o1~~~0:t ~~~, že přijdou. .eden na druheho poc b_ nezávislé. Urcete teZ

j I 'hodnéanasoe'nterva II na v·

I 'n' okamzlk. x-p,Přesně ve stel Y 1__ ' /I = - .

"movanoU ve lemu a• _ rozptyl pro nol ,9 3 Určete prumer a u veličinu ".

. k· fO normovanovytvořujíci fun CI P

9.4 Určete momentovOu

Nf (9) 0= Ee'I')' . .. t ukážeme určení,I') ., , ~unkce v dalslm tex u,

, ytvořUjlCI l' (x) - ex-" omentove v . () _ c+ x a g - .S ohledem n~ V,y~~\t\ ::e pro dva případy, a tO g x ­

mOlnentové vytvOnljlC\ un c

( )9 ]';,. Ee"o=e".M,(9),(9) = ]", ,H = ,e

M cu

.• ]' <\,.) - ,M Ic9) .() E o - "" - ,~ 9)

M", 9 0= 'e - ., 'f k' veličinyx parametru (c .ytvořujlCI un Cl

.. d" de o momentovOU vV tomto pnp" e]

._. . dána vztahem:~ kce náhodné vehclny je

, vytvořující funkce un2. M.omentova

Z definičního předpisu je jasné, že alternativní rozdělení má jediný parametr, a to p.Znač; se často jako A(p). Dosazením do definičního vztahu pro průměr a rozptyl snadnodostaneme:

Jl =p,

u; _ p(l_ p) = pq.

(\ 0.3)

(10.4)

Druhou cestou určení momentů je postup přes momentovou vytvořujici funkci:

1\6

I

M,(8) =Xe"P(x) = 1_ p+e'.p .=0

Pomocí derivací získáme:

I' p,

117

(10.5)

Page 58: Statistika skripta

(1017)

(10.19)

(1010)

(10.11)

(10.12)

(10.13)

(10.14)

(10.15)

(10.16)

(10 18)

u binomického rozděleni lze opět využít

P(x+ I) = P(x) fl-X fl.x+l' q

Binoll1lcké lozdělení 'vyhodnocování výsledkll ~ casto z~ač~né jako B(n" m' "I ' nket a ruznych studiich ~~Př a ,pouzltl ve statlstícké přeJ'im "

ouceni dvou b' , ' pn nOlmování prá ce, pn

momlckych rozděleni ce

Nechľ náhodn' .,.ver" a vehcma x sled' ,ná Icma y binomické rozdělení uJe bmomické rozděleni s paramet

hodných veličín (. . s parametry fl p St ry fl., p.a náhodnáx + y), jestliže obě náhodné ve~:č' Y' . anovte rozděleni součtu těchto

Zadanou úloh b d my JSou na sobě nezávisléu u cm ' " .e reslt využitím m .M omcntove vytv ' .. ,

1..,,/9) = M (9) M OruJICI funkce, tedy:

., (9) - (f' "" _ .,e +'/ )'" ( ,9. x P e + (/ )"y :oJ·

119

právě x výrobků 'vadnyeh' I"rovna hodnotě ' jest lze v dod: .p . Pokud jsou jednotlivá :;~~á~~ ~;:~~~~~:,.bnolstvýI

skytuvadného výrobk

(

tl) VIS a, ze psat: u

P(x) = p' (I _ p)"" - (")x - pX{1"··x .

Binomické čísi ..výrobků ,. o udava počet mo' , h, na poradl nám nezálež' M znyc opakováni loh 'I omenty určíme z ma 0, ze, nalezneme právě x 'd .M (9) _ ( 9 mentove vytvoruj'icl' funk va nych

• _ pe +q)", ce

II = tlp,

cr' = '" (1., ,J -p)=npq,

ll, =np(l-p)(l-2p),

Jl4 = 3n' p2(l- p)' +1_ 2 np(1- 1')(1- 6p + 6p')

a,= p -q-p ..Jnp(l- p) - J-'npq

a. =3+ 1-6p(l-p) 1-6np(I- )- =3+-

pq

p npq

Z uvedených momentů Irozděleni jsou skné R ze konstatovat že • ,je podstatně ,], " ozptyly jsou stejn" prumery u binomického hBinomické 1 v~t-,; n.ez rozsah výběru : ~ro Jedno měřeni a v připadě a, ypergeometríckéhoII bude veh:'z e ~m bude symetrickým roz:' v ~odstatě jedno, zda v;a~~ roz:~h souboru N

normální rozrěJ~~ ~~~ovv:;~ž řicl, že bínomíc~:~~~d~~:~:i~epd ~ 0,5 ,nebo k~~žc:o~:~~ac~bm,e)y rozsah vyběru u e stejne špIčaté k vy eruP" , ..' ja o normované

n urcovam jed r'rekurentniho vzorce: not Ivych pravděpodobností

(10.9)

(10.8)

(10.7)

(10.6)

P( I)_ J'( ) (tl- x)(K - x)

x+ - x ---- ­(x + I)(N - K -II + x + I)

Binomické rozdělení je základním modelem pro výběr s vracením. To znamená, že piikrn'~" """"'" '" 10,''''0"''. m. ,. ,,_ ,ob<' " ""o". ,.j _;tim. ,p" • p'",_,=' rn "'b"" "J'''o -i''''''''' J. "k ",,"UM. " ~""o" ""''''''' 'J""'"'w....""".0" p"",""","""o'" ",,,,", "'"'''' """b"" ,~OO" P . TortO po""'·,,' o""" P""""'" "k 'u p,",""'''' ,,' '" ,,'oro,"" m",robk' 're 'm"~' '''''o, ,.'" ""''''''' >od-' ",,""'''''''' -i'''''''' ~ ""'" op""", N.;;m "0'= j. ,"'J -"~~_ObM" 'o"" '" mori " k~"",~,",m' """bky ",~_.pH ,'- • ,,,,,"

Kp=tl N =tlp,

, Kl KJN-tl N-tlcr =tl- 1-- -- ="pq-• N NN-I N-I

10.3 Binonlieké rozdělení

Hypergeometrické rozdělení má 3 parametry a znači se často jako H (N ,K ,tl).

Tímto zptlSobem lze postupovat na počítači např. s využitim tabulkového procesoru

EXCEL. Hlavni uplatnění tohoto rozděleni je v oblasti statistické přejimky.

Přes jednoduchost zápisu pro určení pravděpodobnosti je výpočet dosti pracný. Prourčení hledaných pravděpodobností lze využit rekurentního vztahu, kdy nejsnáz

e

určime

pravděpodobnost pro x = O, a pak pokračujeme dle vztahu:

tedy stejné vztahy, které jsme získali přímo z definice.

cr; = p- p' = p(l- p),

Hypergeometrické rozdělení je základním modelem pro výběr bez vracení. cožznamená, že po rozhodnuti, zda výrobek je dobrý nebo špatný, jej zpět nevracíme. Jdeo úlohu, kdy dodávka obsahuje N výrobků, mezi nimi je K výrobků vadných. Ke kontrolenáhodně vybereme tl výrobků a zajímá nás pravděpodobnost, že mezi nimi bude právě xvadných výrobků. Určení této pravděpodobnosti jsme již provedli· viz vztah (9.

10

), tedy:

10.2 Hypergeometrické rozdělení

]lB

Page 59: Statistika skripta

Z tvaru momentové vytvořující funkce je zřejmé, že veličina (x +y) obecně nesleduje

binomické rozdělení. Pokud ale Px = P,,, pak ano.

Ur~eni modu binomického rozděleni

V některých úlohách je třeba určit modus binomického rozdělení. Protože binomickérozdělení je rozdělenim diskrétní náhodné veličiny s jediným vrcholem, pak modus určíme

jako veličinu, která splňuje podmínky:

. K~Ybychom mělí za .k .~a;,~:~'ků .~aximá~ně dva, j~le ~ ~::~OVlt pravděpodobnost toho, že s. .

me Jako SOUcet pravděpodob o.venl hodnoty distribučni fl k I vyrobek koupí z 12. nostl prO) t-P(I)+P(2) =O181un Ce F(2) Tuto hOdnotu

RelatlVni binomické rozde"1 . ' .---!ml

Příklad ]0.1 Binomické rozdělení

Vidíme, že hodnota modu je sevřena v nerovnosti o rozpětí jedna. Jestliže mezníhodnota je celé číslo, pak binomické rozdělení bude mít dvě hodnoty se stejnou maximálnípravděpodobností.

Řešením pro binomické rozdělení je vztah:

np-q'; m $np+ p.

0 0.21)

Pro řadu aplikací vP' .rax, Je významná .h d . •

sleduje binomické. na o na veličina.? kde n' . '.pravděpodobno t rozdělem B(n,p) Jde o I' . n ahodna vel1čma ~

s p V II poku' I V re at/vnl četnost I dsec I. yužitím vztahů (946). se ovaného jevu, kte' .

(x) . a (9.58) dOstaneme: ry maJI - =1'n '

a2(~= :q10.4 Poissonovo rozdělení

(10.22)

(10.20)

?(m)------- >]1'(111 - 1) - .

al'(m)

--- ... ;, JP(m+l)

Poissonovo rozde') . •vy. d" . em pra d" "Ja nlJe počet v'sk o. v epodobnosti o' .na. výrobku, poče(va:~em:!o yrav~ěp~dobných fe~s~~eda~h.ování náhodné veličiny, kter'POISsonovo rozděleni' h yberu nekohka výrobků ' yc~ podmmek jako je poč avelmí málo Kp' Je c araktenzováno velký , ~ocet nopu na určité délce I'k et vadza podmínek: o/SSonovu rozděleni lze přejít z~poctem .možnosti, z nichž se ~e~,na apod.

mom/ckellO rozděleni r '. "IzuJe Jenlmltnlm prechode

11-+ co mp--,>O

flP=J..<30

Poí Pro praktické podmínk sta" .ssonovo rozděleni je del .CI, aby II bylo větší než

novano vztahem:

Pravděpodobnost toho, že si zákazník při nákupu koupi určitý výrobek je.!. Určete3

pravděpodobnost toho, že z náhodně vybraných dvanácti zákazniků si tento výrobek koupí xzákazníků. Dále určete počet zákazniků z dvanácti hodnocených, kteří si koupí daný výrobek.

Jestliže je velký počet zákazniků nebo připouštíme "vracení" jsou splněny podmínky probinomický model skutečnosti. V tabulce 10. J jsou vypočteny příslušné pravděpodobnosti

podle vztahu (10.10) a (10.18).

Tabulka 10.] Pravděpodobnostibinomického rozdělení

x P(x) x P(x)

° 0,007707 7 0,0476891 0,046244 8 0,0149032 0,127171 9 0,0033123 0,211952 10 0,0004974 0,238446 11 0,0000455 0,190757 12 0,0000026 0,111275 ~ 1.000000

Pro modus tohoto rozdělení platí:

P(x) = ':'-<J..xxl

F(x)=O .

F(x) =i e '<,1,'

'''00 i'

pro X<O,

pro x;, o.

100 a p bl".Yo mensl než 0,05.

00.23)

(J 0.24)

1 2 1 I12.- --$m$12.-+-,

3 3 3 3

provedením výpočtu stanovíme hodnotu modu =4. Pro tuto hodnotu x =4 v tabulcehodnot pravděpodobnosti je též největší pravděpodobnost rovna hodnotě 0,238.

120

Momento .Va vytvořující funkce má tvar

Mx (8) = eJ.("I)

121

(10.25)

Page 60: Statistika skripta

Pomocí derivací určíme momenty'

p=}",

p; =..t:! +A,

a; :=..t.

(1026)

(1027)

(10.28)

O~dobnou úvahou jako u' .toho,. ze v /I opakovan' ch b'~olnlekého rozdělení stanoví > •

krat, Jev A, nastal x .~t :~ochast'cky nezávislých náhodný:e v~ah propravděpodobnosl, , z Jev A, nastal x, .krát. po usech Jev A, nastal x.,

Z definičního vzlahu je patrné, že Poissonovo rozdělení Je rozdělením

jednoparametrickým. Tato skutečnost umožňuje toto rozdělení tabelovat. Tabelují se hodnotypravděpodobností nebo hodnoty distribuční funkce. Tabulka distribučních hodnot se využivápří konstrnkcí statistických přejimacích plánů. Zkrácené označení tohoto rozděleni je P(}").

Příklad 10.2 Poissonovo rozděleni

Počet vzhledových vad na výrobku sleduje Poissonovo rozdělení. Na základě delšíhopozorováni bylo zjíštěno, že průměrný počet vad je roven 0,90. Určete pravděpodobnost toho,že na hodnoceném výrobku se vyskytne více než jedna vada resp. vice než dvě vady.

Ke stanovení "momentu se využívá

momentové vytv " ., ,p(x)) = IIp orUJ'cl funkce, výsledkem J'e'

)' .

a' (x).= ll') qI JI'

10.6 Negativní bínomíck . •c rozdc/cní

(10.29)

(10.30)

00.31)

Řešení:

lnformace byla zjištěna z velkého počtu měření (ustálený výrobní proces probíhádlouho). Lze proto přípustit, že x= p(r) = p, =}" = 0,90. Řešením je určení součtu

pravděpodobností S = P(2) +P(3) + P(4) + .... Tato funkce bývá někdy tabelována čí jeuvedena ve statistických programech. Nalézáme hodnotu 0,2275. Ke stejnému výsledkudospějeme i tím, že určíme pravděpodobnost jevu opačného, tedy případu , že naleznememaximálně jednu vadu a pak dopočteme do jedné. Jde vlastně o určení distríbuční funkcePoissonova rozdělení v bodě jedna pro}" = 0,90. Využitím definičního vztahu (10.23) určíme

F(J) = P(O) +P(I) = 0,4066 + 0,3659 = 0,7725.

Tuto hodnotu lze odečíst též z tabulek distribuční funkce Poíssonova rozdělení (vizpříloha 2) nebo ze statístíckých programů. Oopočtením do jedné získáme hledanoupravděpodobnost rovnou 0,2275. Pro více než dvě vady je výsledkem hodnota 0,0629. Tatohodnota je stále dostí vysoká při relatívně malé hodnotě průměrného počtu vad. Je to důsledek

toho, že Poissonovo rozdělení je pro malé hodnoty }" výrazně nesymetrické.

10.5 Multinomické rozdělení

Multinomícké rozdělení je zobecněným binomíckým rozdělením pro s-rozměrnou

náhodnou velí činu. V praxi často nevystačíme s jednoduchým modelem s vracením, alepotřebujeme rozšířít počet variant výskytu náhodného jevu. Vychází se z úplné skupínyvzájemně se vylučujících náhodných jevů A, s pravděpodobnostmi výskytu P. pro

k = I, 2, "', s. Z povahy úlohy je zřejmé, že musí platit:

p, + Jl, +... + Jl, = I a

Zkoumámd • e Posloupnost n' h d .

prav epodobnost sl d . . .a o nych pokusů·' .tému v' k e ovaneho Jevu je , Z" , pn schematu výb·Zkráce:;:~sle?ov?ného jevu. Veli~i~a ~tma nas otázka kolik po::::ů ~u~ace.nim, jestliže

znacentm l'(x )' 1 Je tedy přede e predcllázet nsled~vaného jevu nastal v (ll :~p J~ Označena pravděpodo~n~~novenéc<.;lé kladné číslo'splneny Podmínky pro b' . ~ - tem pokusu. Je zřejmé' • toho, ze IHý výskyttedy x krát) a POčet pOkus~nbomll(cke rozdělení, sledovaný s;J':: v prkedPosledním pokusu jsou

Y n+x_I)' vys ytl (n-I)k ., mus. tedy platil: rat (nenastal

1'(11- J) _("+ X_ Ij (- P'-"_"+ X - 1j11-1 q -. I'}n-, Jl

X q.

V poslednim p k (10 32)předch .'. o usu sledovan' .

OZl vyraz vynásobíme P r y. Je~ musel nastat, s ohl d, lm z'skame hledaný vztalt e em na nezávislost ve výb.

(

pro negatIvní blilo . k' eru,l'(xl1 l»_ I1+X-) () mlc erozdě/ení

). - " x tl

X P q = x p'(-q)', kde

(_') ( (J 0.33)=0(_1)' i1+X-Ijx x ) (za podminky ll> O).

Odtud pramení' .I nazev tohoto rozdělen,' .

- negattv . b' .Momenty Se ur'c" • n, tnom,cké rozdělení

, Opet po . .mOCI momentové vytvoru" ., . fi

~'CI unkce kt . .A1 ~ () , era ma tvar'

,(.9)= "ox.> -11 ( ~() .~. p" -q)' =" -ll "f '( ),,,- x :S; x ' le' -q1 =oP"6-e·'q)".

Stanovením h . (J 0.34)odnot denvací Podle

.9 v bodě .9 - O d- . ostaneme·

122

123

Page 61: Statistika skripta

(10.35)

(10.36)

Použiti tohoto rozdělení je ve statistické přejímce a v plánováni výroby.

10.7 Geometrické rozdělení

Geometrickým rozdělením se nazývá rozděleni náhodné veličiny, kdy určujeme

pravděpodobnost toho, že v prvních x pokusech sledovaný jev nenastane a nastane teprvev (x + 1) pokusu, jedná se opět o výběr s vracením.

F(x) ~ Ipro x>A+ CI .

VÝPočet počátečních moment" Iu ze provést p"nmo z defl " .

, I "IJ a ~ InJcmho Vztahu.tJ. =-. Jx' cIx _ 1 (A +a)bl ( .

2a . - -_ -.A- a)' II 2 -, " a I. -- _

" + I .Odtud určíme " ,

pn,mer a rozptyl:

p.l: :::: A.

, a'(T;c ::::

3

(10.42)

(10.43)

Tento případ je vlastně zvláštnim případem negativniho binomického rozděleni, kdepočet výskytů 11 je roven jedné. Bude jistě platit:

Zkráceným zápisem je tvar R(A,2a). Ze vztahu (10.40) integrací určíme distribuční

funkci jako:

Předchozi kapitolou jsme ukončili popis základních rozdělení diskrétni náhodné veličíny.

Nyni uvedeme nejdůležitější rozděleni pro spojité náhodné veličiny, která se uplatňuji pří

řešeni v mnohých praktických úlohách v podnikové praxi.

(10.45)

(10.46)

(10.47)

rozdělení

pro 11 <O,

pro 11 E (O ; 1),pro 11 > 1.

f(li) = I

.!(u)=O pro UE\O; I),

pro Ostatní li.

Dístribuční fuokce nabude tvar

F(1I) = O

F(li)=li

F(1I)=1

Toto rozdělení se s ." ymbohcky značí ft I )

Poeltačí . - , 1 Jeho ,. , .Je obvykle ZabUdov: ,2 vyuz,t, Je v símu/ač ' h '

an generator náhodných .. !lIc rešenich, nac'sel tohoto rozdělení

10.9 Nor '"ma Ol (Ga ussovo)

NOrm'1 'tam a n, rozdělení' .. Uto rozdělen' ", Je neJPoužívaně'"Je dostat" '. muzeme dospět b' ~s, model rozdělen' .. ,slOžení (~~,:~~llk)ý, V!{ma podm~ne~no~~c~ého rozdělení za 'p;~~~~ ~áho,dné veličíny. KPUSObením ovlí :~ vetsího počtu 17 ~e ,re ~edly k PoiSsonovu r ~ u, ,ze rozsah výbě11lrOldělení). vnuJe hOdnotu x náhodné ~t~Iych náhodných velíč7nzdelem. J:nou cestou je

e IClny ~ Jen velmí nepatr~ě (s~~h~ každá svým,NofJnální . uJe rovnoměrné

I1ahOdnÝeh' •nahOdná veličína ',.JeVll v techníc .. vYJadrUJe pravd'

e, pnrodě í společnosti. T;:~dobno~tni, chování široké k .O rozdelen'm Se řídí' alego"e

vykon výrobního

Mnohdy býv' , (10intervalu byla ro~n~Yh;ddn~ provést transformaci n' , .44)

vyhOVUJe transformač~í v:;~ha to Ještě s mezními ~:~~:et. veličíny tak, ahy délka defl " ,. am, O a I T lO,cmho

u =.!.= (A _ a) . Omuto požadavku

2a -- pak

125

(10.37)

(10.38)

(10.40)

(10.39)

(10.4 1)

pro x < A -a,

t24

pro xE(A-a;A+a}.

pro x E (A -CI; A +CI),

pro ostatni x.

qJ1:t == -,

p, q

Cfx = -, .p

P(x) = ?(x,l, p) = pqx,

If(x)=­

2afIx) = O

F(x) = O

F(x) = x-lA-a)2a

Nejjednoduššim rozdělenim spojité náhodné veličiny je rovnoměrné rozděleni. Totorozdělení představuje pravděpodobnostni rozdělení náhodné veličiny, která má konstantníhustotu pravděpodobnosti. Definičním tvarem tohoto rozděleni bude vztah:

10.8 Rovnoměrné rozdělení

Page 62: Statistika skripta

&

x

qSO

0,39891G

Obrázek 10. I

. Při tabelaci se -dlstríbu- . fi casto VYUžívá .

cnl unkce jen pro kladné hos:metne normálního rozděle ' ,noty II nebo hOdnoty Laplac:~~ ~a~se tabelují hodnoty

<P()-J" I _~ . u ce <P(II)'II - -e ' dl

o2tr tl.

(10.48)

(10.49)

pro XE(-OO,+OO).

zařízení, čistota chemíckého produktu, ale i velikost výtrusů u hub. Tato skutečnost souvisis definičními podmínkami normálního rozdělení a též s existencí centrální limitní včty, sekterou sc seznámime v další kapitole. Můžeme říci, že s tímto rozdělením se setkávámepředevším tam, kde na kolísání náhodné veličiny působí velký počet drobných a vzájemně

nezávislých vlivel.

Z dříve uvedených podmínek lze odvodit definiční vztah pro hustotu normálníhorozdělení ve tvaru:

Distribučni funkce normálniho rozděleni je dána vztahem:

Normální rozdělení má typický zvoncovítý tvar symetrícký kolcm hodnoty x = IJ .

V tomto bodě je hustota pravděpodobnosti maximální a je rovna hodnotě 0,3989. Proa

hodnoty x, které se blíži k plus či minus nekonečnu hodnota hustoty pravděpodobnosti

konverguje k nule. Průsečiky rovnoběžek s osou pořadnic, které procházej i body (IJ - a) resp.

(IJ +a) a hustot pravděpodobnosti jsou inflexními body čáry hustot pravděpodobností.

Tečny vedené inflexnimi body protínaji osu úseček v bodech (p- 2a) resp. (IJ + 2a)

a protínaj i se na ose souměmosti vedené rovnoběžně s osou pořadnic bodem x = IJ .

P - d . • "k . h d - 0,4839 1-1 d I d- db' 'I 'Iora ntce prusecl u Je rovna o note ---. o noty JUstot prav epo O noslI norma nt 10a

rozděleni se běžně tabelují, i když jejích hodnoty lze snadno stanovit pomocí tabulkovéhoprocesoru EXCEL i bez speciálního statistického programu.

Protože distlibuční funkci normálního rozděleni nelze určít v analytickém tvaru, je tato

funkce tabelována. Tabelace se vztahuje pro normovanou náhodnou veličínu II = x -IJ aa

mluví se o tabelací normovuného normálního rozdělení. Toto normované normálnírozdělení je zvláštním připadem normálního rozdělení pro hodnoty parametrů IJ = O a (J = I.

Toto rozdělení se zkráceně označuje jako N(O; 1), zatímco normální rozdělení jako

N(x;p;(J').

,1.1 1 _~

F(1I) = f-r-;-- e ' dll._<ov 2n

(1050)

S ohledem na tuto rů (10.51)znou možnost tabelace uv

~(-) ~ O, edeme několik základních vztahůJ: (O) = 0,5, <P(:,,) = - <P(1I), ./'(+«» = I, _, /'(11) = 0,5 + <P(1I) deIinítorícky<1>(0) 'OD, !'(II)-F(-II)=2<1>(II), ,

<1>(+«» = O5 2[1- F(1I)] = 1-2"'( ), , <P(' ) w 11 ,

. II -<P(-1I)=2<P(1I)Zejména v .

zaokrouh/e' poslední době Se ři .rOzděl . ne na Jednoduch' . P tabelacI vycMzí z ",

em, v tomto případě ho~n~:s~b:: (např.. 0,95 apoď)c~teta~~~noty distribuční funkce

Momenty '. rmovaneho normálního rozděl~IJ~ se kvantíl danéhonorma/mho rozděle . " nI.

ni Se urcl z~ J momentové vytvořující funk '

M z (8)==e"9-t- U ,.'9 ce, kteramátvar:

126 (10.52)

127

Page 63: Statistika skripta

u_-----. že prvním

Výsledkem Je,, 'eme momentY. 2

, vytvořující funkce urcuJ tem je rozptyl (JZ této momentove . a druhým centrálním mom

en

"1 čním momentem Je I'poca e 'lního rozděleni .

. ríbuční funkce norma , ktere nevyhOVUjePliklad 103 Dlst d kce _ dusíkatého vaP

lna,. h bylo zjištěno, že

, k t pro u r ' h ba emc d .Určete prav~ěpodlobn~~\~ž:~\J~áhle konlrol~ vl~~n:o~~~i,~lka je 1,070% Znak sle uJe

, d' kům odberate e, Je 'k' 19 717% a smeropoza av . 'h dusI u Je " soj,průměrný obsa,h v~.ane ,odavek odběratele je18, o.

a· lni rozde\en' a pozallorm

Ře~eni " 'lze připustit, že:. ' lky' počet merem,

, . k dispOZICI ve I 12)J>roto2C Je . dh d viz kapíto a ,

s = (J = 1,070 (bodovy o a,x= I' = 19,737 a

185-19,737 =-116. d'l ni"'-- , . 'h roz e e .u = 1 070 . . "funkce nonnahll o

, ..' hodnotu dlstnbucmZ tabulek zJlSume _ O12302.

0500-037698- , •_0500-<1>(1,16)= , , , k ZaJ'ímave je, ze

F(-1,16) - , . . 12 3% dodave . N '''emnáhovuJe aSI, 18 5% epnJ

, ku odběratele nevy • dovanOu hodnotu '.... ' sledkůmVídíme, že po~da;ho dusíku překračuJedPo:neho znaku. K uspokoJ~v~mp;?' poklesu

• "rn' obsah vazan ríabilitou ho nO • ěr zůstal steJnyP~;'~n~st je způsobena velko~ v;roduktu Jestliže by ~~ a Hu) = 0,0018.s ak dospět homogenlza O30 pak by bylo tl = - ,lze P . d h Iky na hodnotu , 'směrodatne o c y , '

. k normálního rozde\W! , \\čína

P"klad 104 );lli1!'íbučnl fun ce 'I 'ho rozdělení bude náhodna vefl d lu norma ni

h 'evmo ed' dobnost to o, z

Určete prav epO b) ± 2(J, c) I' ±3(J .ležet v íntervalu a) I' ± (J , I'

, h tj 1/ = ±\', . , h proměnnyC , dalšíB,.ešem . , not v normovanyc 7 Obdobně pro '

. ) určíme nejprv<:> hod \ = 2 0.34134" 0,68~" 'žádáme, abyPro vanantu a b de F(l) - F(-I) = 2 <l>(l .' s často zajÍtna pnpad, ~~ nonnálního

hledanoU hodnotoU USleS 0,9973 V pra": "a rč~"í hodnoty kvanU u tak. abydvě varianty dostane~e. O'~č~t pií~adů Jde vl~.stne. o ~usíme mčit horní hodn~~oty 0,475v intervalu I~že\ urb~~ i~terva\u ležet 95% pflp~d~75 či Laplaceova funk~e'~~5% případůrozdělení M~-l~. ~~~u~ní funkce nabyla hlo~~O%d; v íntervalu I' ±1,96 (J eZIv teto hodnote IS, " n"m J' e hodnota , '

'd' e ze reseZ tabulek VI lm , 1 .. 99% případll

1 258 (J eZIV íntervalu 1'':' ,

'I 'ho rozdělení dobnost\llvyrovnání modelem norma ni ==- , . rve zvolit vhodný prav~~popředPoklad- h '\ h muslme neJp ěřit zda nas

, děpodobnostníc u od' h veličín musíme OV ,pří řešen~ kP:a; dat o chování náho nyc

model. Po ZIS 'am

12S

o chování náhodné veličiny je správný. Po utřídění dat posuzujeme, zda rozdělení četností zezískaných dat neodporuje našemu předpokladu o jeho typu, mluvíme o vyrovnáni modelemurčítého pravděpodobnostního rozdělení. Toto vyrovnáni má tří kroky. Prvním krokem jeurčení parametrů rozdělení. Pří dostatečně velkém počtu měření u Poíssonova rozdělení lzeřicí, že průměr je parametrem A. Pří předpokladu, že jde o normální rozdělení průměr budeodhadem parametru 1', směrodatnáodchylka s odhadem parametm (J. Druhým krokem je

provedení vlastního vyrovnáni, jeho výsledkem jsou "vyrovnané" četností. Tyto vyrovnanéčetností odpovídaji teoretickému modelu s odhadnutýmí parametry. Třetím krokem jeobjektivní posouzení vzniklých rozdílů mezi pozorovanými četnostmi a llteoretickýmillčetnostmí. Tento třetí krok musí objektivně posoudít vzníklé rozdíly. Blíže se s nímseznámíme pozdějí \' kapitole věnované testováni statistických hypotéz.

Nyní se budeme věnovat druhému kroku - vlastnímu vyrovnání. U jednoparametrickýchrozdělení při znalosti parametru dosadíme do předpísu pro pravděpodobnostní rozdělem, např.

u Poissonova rozdělení dosadíme za J. a určíme všechny hodnoty P(x,) .

Postup pří vyrovnání normálním rozdělenim je v podstatě trojí:vyrovnání pomocí distribuční funkce,vyrovnání pomocí hustoty pravděpodobnosti,

vyrovnání pomocí pravděpodobnostního papílU.

a) Vyrovnání pomocí distribuční funkce

Nejprve musíme provést odhad parametrů normálního rozdělení. Protože nám v řešení

úlohy jde o vyrovnání hodnot četností, lze s výhodou použít metodu vhodně zvolenéhopočátku.

V dalším kroku provedeme vlastní vyrovnání. Abychom mohli použít tabulek distribuční

funkce nonnálního rozdělení, musíme vstupní data přetransforrnovat na normovaný tvar.Vzhledem k definici distribuční funkce musíme pracovat s horní mezí intervalu naměřených

veličin. Při stanovování mezí je vhodné, aby první ínterval začínal v (- (0) a poslední končil

hOOmmm (.~). PYIWll nY~hOm mk n~YOlnl1l, JQllnnl1J ny ~Q IJ Y~QknY!0 ngrmftInl fYZlIQIQnl·

Po stanovení normovaných veličin vyhledáme příslušné hodnoty distribuční funkce, dálepak stanovíme rozdíl sousedních hodnot distribučních funkcí. Tento rozdíl představuje

přírůstek distribuční funkce, který by měl odpovídat přírůstku kumulativních relativníchčetností. Jestliže tento přírůstek vynásobíme celkovým počtem měření, dospíváme k přírůstku

kumulatívních četností, tj. četnostem v příslušném intervalu.

b) Vyrovnání modelem normálního rozdělení pomocí hustot pravděpodobnosti

Po urče,ú parametrů JI a (J vypočteme normovanou veličinu 11. Zde pracujeme se středy

intervalů, pak odečteme z tabulek hodnotu hustoty pravděpodobnosti. Finálnim krokem je

výpočet veličiny f(lI) 1/, která je vyrovnanou hodnotou.u

Vyrovnání tímto zpi,sobem je rychlejší, avšak o něco méně přesné než postup při

vyrovnáni pomocí distribučni funkce. Je to zpilsobeno tím, že uvnitř intervalů pracujeme sestřední hodnotou hustoty pravděpodobnosti při nelineárním průběhu funkce hustot

t29

Page 64: Statistika skripta

----------- ----------

_ -6v=_=-00214

280 ' '

ělení 'pomocI hustot pravděpodobnosti

Vyrovnáni 01 d Io ~ <;;ID normáln'h..~=!ill.!!l!!!' Orozděle 'm pomocí distr'b ční funkce

je kumulativní relativní četnost (tyto hodnoty budou ,-pouzlty v kapitole 13).

čet vyro 'vnanych hodnot není ro 'ven poctu měřeni, rozdíl d'pa a na vrub p --,ouzlte metody.

F.(x)

Tabulka 10.3 Vyrov ' ,naOl modelem norm' I 'h

Tabulka 10.2 I U

vI/ U F(II)

00

óF(lI) óF(II)1I

-00 0,00000"

x I'~(x)

-6,5-

-2,63 0,00427-

-5,50,00427

- -

-2,23 0,012871,20

-4,50,00860

2 0,0071

-3,5-1,82 0,03438 0,02151

2,41 1

-1,41 0,079276,02

0,0107

-2,50,04489

5 0,0286

-1,01 0,1562512,57

-1,50,07698

15 0,0821

-0,5-0,60 0,27425 0,11800

21,55 21 0,1571

0,5-0,19 0,42074 0,14649

33,04 28

0,21 0,5831741,02

0,2571

1,50,16243

43 0,4107

0,62 0,7323745,48

2,50,14920

52 0,5964

1,02 0,8461441,78

3,50,11377

41 0,7429

1,43 0,9236431,86

4,50,07750

36 0,8714

5,51,84 0,96784 0,04420

21,70 16

2,24 0,9874512,38

0,9286

6.50,01961

8 0,9571

2,65 0,99598 0,008535,49 6

+00 +00

2,390,9786

r.1,00000 0,00402

4 0,9929

X

1,13

X 1,00000

2 1,0000

280,00 280 X

a Ol o rozd

V IIf(u)

f(lI) II ".-7 -2,84

(Y

-60,0071 0,81 2 -

-2,43 0,0208-5 -2,02

2,37-

0,05081

-45,78

-1,62 0,10745

-3 -1,2112,22 15 -

-20,1919 21,84

-0,80 0,289721

-132,97

-0,40 0,368328

o 0,0141,92 43

10,3989 45,40

0,42 0,366852

241,75

0,82 0,285041

332,44

1,23 0,187236

421,31

1,63 0,104016

I-.. 511,84

2,04 0,04988

k 6 2,455,67 6

7 2,650,0198 2,25

_l:0,0069

4

X0,79 2

X 279,36

Sou

280

~692 (-6J's ='1_- - =246..1280280 '

Tím jsme určili potřebné parametry normálniho rozdělen\. V tabulce 10.2 provedeme

vyrovnání pomocí dístribuční funkce.

Tabulka 10.1 Výpočet průměru a5měrodatné odchylky \itráže karbidu vápniku

X, ", v, vlnl,

vjWnl

270 2 -7 -14 98

271 1 -6 -6 36

272 5 -5 -25 125

273 15 -4 -60 240

274 21 -3 -63 189

275 28 -2 -56 112

276 43 -1 -43 43

277 52 o O O

278 41 1 41 41

279 36 2 72 144

280 16 3 48 144

281- 4

1288

32

282 6 5 30 150

283 4 6 24 144

284 2 7 14 98

r. 280 )( -6 1692

Na základě dat tabulky 10.1 proved'te vyrovnání modelem normálního rozděleni.K dispozici je 280 údajů o kvalitě karbídu vápníku, o jeho lítráži. Hodnoty tak představujimnožství litrů acetylénu, které získáme z jednoho litru karbidu vápníku. V této tabulce je

proveden i výpočet průměru a směrodatné odchylky.

Příklad 10.5 Vyrovnání modelem normálního rozdělení

pravděpodobnosti nollnálního rozdělen\. Nutno konstatovat, že tento způsob vyrovnání jeobvykle v praxí dostačujicí a lze jej snadno provést použítim tabulkového procesoru EXCEL.

131

130

Page 65: Statistika skripta

c) Vyrovnáni pomocí pravděpodobnostnihopapílu

Aproximace binomického a Poissonova rozdělení normálnim rozdělením

V komerčních statistických programech je obvykle dodáván program na provedenívyrovnání normálnim rozdělením.

Pří řešení řady praktických úloh se setkáváme s levostranným rozdělením. Jestližepůvodní velí činy zlogaritmujeme a pak utřídíme, často dostaneme normální rozdělení.

Takovému rozdělení se říká logaritmickollormální rozdělení.

(LO 55)

(10.56)

(l0.57)

(l0.58)

(10.59)

Matematick " d} je efinováno ve tvaru-

J(x) = " e1x "J'

j(x) '" O

F(x) = A. JXe-)~d< = íe "']""I - = I -'"o L-" -e.

o

Momenty se určí zmomentové vytvořuíící fu k .

J n ce aJsou'I .JI ~-

x ,,'

2 Ja == __... .:l?'

pro x>",pro ostatní x.

Ve1Jčina A ud' , •. ( ava cas d k 'Jev purucha) o. , o tereho sled ' .

muze nastat kdYkolI, pak A . ovany Jev n"stat nemůže V/'.f(x) =' '" Je rovno nule, detiniční vztahye~ce casto sledovaný

A,. e Ostanou tvarj(x) = O pro x·'O.

pro ostatní x.

Distribuční funk .CI stanovíme ze vztahu:

Obvyklou zkratkou (10.60)pro exponenciální rozděl ,. .

P.'kl enlje E(,,)fl adl06E . .

. Xpollellclálni rozděl .~

Průměrná doba kd . •hedvábí J' e 5 . ' y Je treba zaSáhnout d

. mlllut Urč t o zvlákň 'Jm"'ut. Bylo oVěřen~, že ;I:d~~:~dy.ěpodkobnosttoh~, že ~~~~'~~ stroje při výrobě viskózového• zna sleduje muset zasáhn d~ exponencíálni rozdělení out o 4 resp 5(10.54)

(10.53)

pro Poissonovo rozdělení.

pro binomické rozdělení,P( " ) ".(X+0,5-np )~$X"'r =

vnpq

Pro aproximaci používáme tyto vztahy:

Pravděpodobnostní papír je takový grafický papír, na kterém se distribuční funkcenormálního rozdělení jeví jako přímka. Pravděpodobnostní papír má jednu stupnicirovnoměrnou, druhá je pravděpodobnostIÚ. Pravděpodobnostní stupnice u většiny

pravděpodobnostních papirů probihá od hodnoty 0,02% do hodnoty 99,98%. Na stupnicibývají vyznačeny hodnoty 15,87% a 84,13%, někdy označené též jako -o- resp. +0-.Rovnoběžky vedené v těchto bodech s osou úseček protínaj í přímku distribučni funkcev bodech, jej íchž úsečky odpovídají hodnotám (ll - 0-) resp. (ll +0-). Obdobně rovnoběžka

vedená bodem, který je na pravděpodobnostni stupnici označen 50%, protiná přimku

v průsečíku, jehož hodnota odpovidá veličině Jl. Na pravděpodobnostnímpapíru nakreslíme

přímku, která prochází body o souřadnicích (,ll; 50) a (,ll + o- ; 84,13), tak dostaneme průběh

distribuční funkce. Tím je provedeno í vyrovnání naměřených hodnot normálním rozdělením.

Určováni hodnot dístribuční funkce binomického a Poissonova rozdělení může být provyšší hodnoty náhodné veličiny x dosti pracné. Na základě platnosti centrální limitní věty (vizdalší kapitola) můžeme přejít na normovanou veličinu, která bude sledovat normálnírozdělení. Aproximace bude tím lepší, čím původIÚ rozdělení budou symetričtější a čím majírozptyl větší, postačující je, aby byl větší než 9.

!1"(5) = I - e ' = 1- 0,37 = O63

třeba zasahovat.. ' .s pravdepodobností

0,55, do pěti minut

Úkol vede na st '", anovel1l hOdnoty dístrib • ,

určllne jako' A _ I I Ucrll funkce exponen "1 '1. ,- _ = - Cla IlIIO rOzdělen' P

x 5 I. arametrI" 4(4)=I-e' =1-0

,45 = 0,55

Do čt ř .s p • y mmut bude

ravdepod bo lIostí 0,63.

Hodnota 0,5 v obou uvedených vztazích je korekcí na skutečnost, že v bímomickém a

Poissonově rozděleni jde o diskrétní náhodné veličiny, zatímco normální náhodná veličina jeveličinou spojitou.

10,10 Exponenciální rozdělení

Exponenciální rozdělení je rozdělením, kde náhodnou veličinou je čas, ve kterém nastá~sledovaný jev, např. porucha. Své uplatnění nachází zejména v teOlii spolehlivosti a teorIIhromadné obsluhy.

132

133

Page 66: Statistika skripta

Dodatek k 10. Kapitole

Určcni momentů binomického rozdělení

(" .1~0'-= 1) = m -'1)1''" ''I'' "",

P(m) (' J' . - - nI 'III 1''"'1".". 11-11/+1/)<1.11/

(1070)

Pro binomické rozděleni platí:(1061)

Tyto nerovnosti ..po dVOjIcích dál .e upravlme na tvar

(10.71)

(l072)

(10.73)

(J O. 75)

přechází v

mlc ym rozdělením

(1'+'1= I),

pro N~co a K =1'N hypergeometrícké d-roz elení

K(K-I)(K x+l) (N Kx! - . --:~-:)(~N~-::.'K~:'I)~"~'(~N::!'-.:!:~~~c II+X+I)

N(N _ . (II x)!.__ l)···(N -11+ I)

n! -

ll!

(111 + 1)'1 > (II -'111)1'

111'1 < (II-m +1)1',

m(p+q) > "1'-'1

111(1' + 'I) < "1' +1",

"1'-'1< m <111'+ p.

= K(K -1)':-(K -x+l) (NX!(II- x)1 - -' - K)(N - K -1) ...(N(N -l)"'(N N -K -1I+x+l) N"

-11+1) ----

=("](~X~-~}-{~-~).(I_KX_K IN-'=x--.!!. N I N- N)(l<_~I){I- ~}-{I- f1~ I) --- .lL

lim P(X)N_ = ("]~p x pp ...pqq...q=(:}xqnx

Lím't -I mm přechodem

bínomícké.

(10.69)

(10.68)

(1067)

(1066)

(1065)

(1064)

(10.63)

(1062)Gde o zápis binomické věty),

(n \p*q~'"P(m) = ~m) __ =~I+1 !L>\

p(m+\) (" J'",' N" n-m Jlp qm+1

P. =3n'p'q' +npq(J-6p+6p').

P3 ="1''1(1-21'),

Analogicky lze stanovit dalši dva momenty:

p, = fl; _p' = n(n -I)P' + nI' - (np)' = npq.

( 9 )"-' 9\p=n pe +'1 pe 9.0 =np,

Určení momentůprovedeme přes výpočet hodnot derivací, tedy:

Určení modu binomického rozděleni

"lil}L. Xq"-X = (p + 'I)" = 1

r-'"O x

K témuž výsledku lze dospět sečtenim II alternatívnich rozdělení, kdy se momentovávytvořující funkce součtu nczávislých náhodných veličín rovná součinu jejích momentových

vytvořujících funkcí.

134 135

Page 67: Statistika skripta

P, = n(n + 1)'1' + "'1.- 'eq' = '!q' + I/(~ = !/{! ('1 + 1') = ntj1" fl p' p' pp,,'

. . kého a poissonov~ rozdě1~ill'htah blllomlc

". podmínek 11-+ 00,. . ké rozdelem zaUkážeme, že bm~rnlc ud A <30 (je malé číslo).

'poissonovO rozdčlem, pokv nX

I) ...-

(j il(II-1)"'~:-3_+__ p'(I-p) '7-11 "(l"-X :::.--- .t

P(x) = xl' x.

II(II-I)···(n-x,:l: I) 1. (111')'(1- p)N ==--- xl 11

1" ( x - 1" ~ Q:::fl~;={l-'~r 1- n ) xi (1--1')

1 "cházi" _> Oa "I' = A pre '

00 ( 11\Dále platí, že I J(- 'ly =(I q)" = p "

;:: o X

Využitím cesty přes derivace dostaneme:

P = p·(-nXI-e9q)"(-q)e81•.0 = J~',lIq = ~/{',1" P

, 11(11 + 1)'1' nqP,= - + .

1" P

(Newtonův vztaJl) (1083)

(10.84)

( 1085)

(1086)

.l. -A 1;(

A' e' _~.=1.--- Ilim P(x).~~ xl I X.

p-.OIIp,,,,l..::30

(10.76)Určení momentové vytvořující funkce normálního rozděleni

Pří splnění podmínek z bínomického rozdělení nebo sečtení řady rovnoměrných rozdělenise dá ukázat, že platí:

d"1 ni. ( poissonova roz e eUrčem momen II

~ 91 V ".l{e"-l)-1 Je Ol) e'",,} _ -,tetl).:::::e .00 e A.'" _e1C9_=e ~

M ,(9) = 1:e xi ,"0 x!X-"O

• . hodnoty derivace, tedy:. ět řes urcemDalši cesta Je op P

i e'Á ),' = 1, neboť

..:=0 xl

(Mac Laurinův rozvOj),(10.77)

(1078)

(10.79)

'(".)'f(x) = ce 'h .

(l088)

Vzhledem k tomu, že tato funkce je symetrická kolem a, tato hodnota budep. Dále.00 J

z podmínky, aby ff(x) cJx =I se určí konstanta c jako c = c--. (10.89)b,j21l

Z praktíckých důvodů nejprve lIrClme momentovou vytvohljící funkci normálníhorozděleni pro náhodnou veličinu (x _ p).

. . kého rozděleníMomenty negativnlho bmomlc

ytvořující funkci:v' momentovOu v

Nejprve ufCIme ) •

00(-n)[8(_ )f=p"6- e9 '1.• (-11).( '1')=1"1: te '1M,(9)=~e'\x I' - ,<o X

136

(10.80)

(10.81)

(108l)

x-pProvedeme transformaci tl =~- , tedy dx =b dll .b

Pro (u-b9)=z, du=dz.

137

(10.90)

(10.91)

(1092)

(10.93)

( 10.94)

Page 68: Statistika skripta

(10.95)(JO. 103)

V tabulce velíčina XII = 2 znamená, že do doby dvou minut bylo zjištěno 61 zásahů

do výrobního zařizení, XII = 4, že v íntervalu (2; 4) bylo zaznamenáno 44 případů.

10.7 Proveďte vyrovnání exponenciálnim rozdělením pro dále uvedený soubor dat.XII 2 4 6 8 10 12 16 2030 40 50

", 61 443931 2822292421 12 I

10.6 Na základě dat přikladu 10.3 určete nutnou variabilitu souboru, aby množství nekvalitníprodukce nebylo vyšší než 0,5%.

JO.5 Určete typ rozdělení a jeho parametry náhodnou veličinu (x +y), když velíčina x sleduje

rozděleni N(x,l'na;) a veličina y sleduje rozdělení N(Y,Il"a;).

Kontrolní otám a úlohy

10.4 Stanovte pravděpodobnost toho, že ve výrobě, kde je 5% zmetkovitost, se jako prvnívadný výrobek objeví prvni, desátý, dvacátý.

10.3 Pravděpodobnost toho, že výrobek nevyhovi požadav),,-i',m na jakost je 0,001. Určete

pravděpodobnost toho, že ze 4000 (3000) výrobků při kontrole neuspěje více než jedenvýrobek.

10.2 Určete momenty binomického rozděleni pro 11= 100 a p = 0,40.

10.1 Určete momentovou vytvořující funkci, průměr a rozptyl rovnoměrného rozdělení, je·li

definičním oborem x E (O ; I).

(1099)

(10.98)

(10.96)

-.

1 b191 b2 ~?- + ~~~:t.- +....

M (9) = e' = 1+ 21 4\ . Ude o důsledek\X-J1)\ . ou nulove

w

. .' . • e všechny liché mo::,.enty

j(x _ 1-'). Koeflcíent u clenudeného rozvoje je zrejme, z ké a že jde o vehcmu .

Z prove . . rozdělení je symetrtC , .toho že normalnl • . moment platr.

, , dy b = a .Pro č;tvrtyn' b' - a te_"_ = b' , a proto - ,2

1(10.97)

b'9' _~, atedy 1-';=1-',=3.0- 41 •.

• .. . funkce lze psat.. tové VytVOrujlCl

Z vlastnostl momen\ '.'1-19 +"2(1

(9)= e'·M(,.i9)=eM ,(9) = M(,_,.,)

dením momentovéd me rOZve

ntů k-tého řádu prove e• . •. tečnlch mome 9'

. urcem poca '.'VlastnI .' fl' entů u vehcm kl

• .. . funkce v řadu a urcenl koe tCI .VytvorujlCI

A--- ,1.-9

pro 9;;',1.,

pro 9<,1.·(10 100)

.... funkce'. ytVOrujlCI .. . omentove v

.' zdertvac, mMomenty urclme (10 101)

(10. 102)

139

Page 69: Statistika skripta

11.2 Vy'b' ,erova rozdělení

- výběrového

chování nejvýznamnějšívýběrové c11arakteristiky

Každ' 'b'" . Y vy er ze základniho .Pouzlva termín statistik ) . . souboru Je urČOván sv' .odchylka, v}"běrovy' k Y IJako Je relativni četnost vY·b,ymJ. chnrakteristikami (ne'kdb d" ore ační k fl' , erovy prů' " Y se

u ou ,h~lt u každého výběru II oe IClent. Hodnoty těchto V'b~er, .vyberová směrodatnázkoumam Je třeba blíže oz' udou tak laké náhodnou veli r. erovych charakteristik sevyběrů z téhož základnih p nat JejIch zákonité chováni ClnOU Pro cile statistickéhocharakteristik. jeho pa o souboru Statisticky řečeno •.pr~vedeme_1J řadu náhodnÝ'h

charakteristiky maji led;:~e~7asr" ,v~~ah k parametrůmz~~~:dn~~ rozděleni výběrový~hn] za ony rozdělení, kterým řík' Ol o ,s~Uboru Výběrové

ame vyberová rozděleni

Rozdělení výbfrových průměrů

U pravděpodobn 'hustotu . d' ostmch rozdělení js ' '.

" prav epodobnosti dál . .. me urcova" Jejich řed'z~!,mat jejic~ předpis, j~jiche pak Jejich momenty. U výlllrov PI~ pro ~ra~dč~odobnost čina lodne vehclny momenty a vztah te' ht yc rozdelem nas take' II d

. c o mOmenť k u eu mOlllentům Původní

o ~ejpr~e ukážeme naprumeru x.

Provedeme_lí prosty' 'h d' ,N(x' na o ny vyběr z 'klN - ,,li,,;:), pak rozděleni Výběrových průem::'i :~~~h~éžso~~oru s normálnim rozdělením

(x.t'x,--'-). Pravděpodob .' o s e oval normálni rozdělení a toII nos(ll1 promčr _G '

Veličina fl ' mstal stejný ale r ."YIvoču" ,Pfjredstavuje rOzsah výběru DOk, ' ' Ozply/ se ll-krát zmen§íl

~IC' unkce. . u az telo vlastnosti s .e Plovede vy -' ,

UZltlrn momentové

Vedle prost'h .'k l' e o náhodného 'b'

ne o Ikastupňovy' vy'b' " vy enl Se uplatňu;,' ....S b · er CI system t' k" , I Jllle typy 'b' o •e za yvat uplat ' . a IC y vybe'r l'ě . vy eru Jako obl t .nemm p . milo v'b' , as Ol v'b'využitím tabulek náh d ~~~e,~rostého náhodného výb' Y ery se zabývat nebudeme. B Jer.Počítači. K tomu je ~ře~:c .clseJ nebo dnes nejčastěji e~. Te~1 lze realizovat bud' loso~á ~mestanovit časovy' odb' a vyrobky o<'íslovat nebo' p mocI generátonl náhodny'cl " nl, m•

er vzorku. Je vymezIt souř cl" I Clse naa f1Iceml anebo náhOdně

I I.l Pojem náhodného výběru

Prostý náhodný výběr má dvě základní vlastností:

ll. NÁHODNÝ VÝBĚR

Základní soubor může obsahovat konečně ncbo nekonečně mnoho hodnot náhodnéveličíny. Příkladem souboru s konečným počtem N hodnot je dodávka s K výrobky vadnýmí aN - K výrobky dobrými. Příkladem nekonečně velkého souboru je objem produkce, který stálevzníká a bude vznikat I v budoucnu. Jíným přikladem je pevnost vyráběného vlákna, ta mácharakter spojíté náhodné veličiny. Pro základní soubor je tedy typické jehopravděpodobnostní rozděleni se svými parametry. Je zřejmé. že se nám jen výjimečně podaří

zjistít všechny hodnoty základního souboru. Základni soubor jsme tak nuceni posuzovat jenz jeho částí. z výběrového souboru.

Základním úkolem pravděpodobnostních metod ve statistickém zkoumání, metodmatematické statistiky. je činit závěry o hromadných jevech a procesech na základě výsledků

pozorování nebo experimentu. Tyto závěry se nevztahují k jednotlivým pokusům. alek celému souboru, ze kterého jsme provedli měřeni na vybraných jednotkách. Soubor zekterého vybíráme je obvykle nazýván základním souborem. Základni soubor je soubor všechmožných jevů nebo předmětů určitého druhu. Rozumí se jim množína hodnot náhodnévelíčiny s daným pravděpodobnostním rozdělením a určitými parametry tohoto rozdělení. Takza základní soubor můžeme považovat všechny výrobky, které vzníkly za určitou dobu nebovýrobky. které tvoří dodávku od dodavatele. Základním souborem mohou býl všechnyhodnoty koncentrací účinné látky v dodávce. které bychom mohli zjistít při proměření všechelementárních částí.

Výběrový soubor je částí základního souboru a obsahuje výrobky čí výsledky, kteréjsme získali podle určitého schématu. Má-Ii výběrový soubor sledované vlastností blízkévlastnostem základního souboru. jde o reprezentativní výběr. Naší snahou obvykle bude,aby výběrový soubor byl reprezentatívní. Exístuje celá řada způsobu vybírání jednotek dovýběrového souboru. Nejvýznamnější je prostý náhodný výběr. Jím rozumíme takovývýběr. kdy jednotlivé prvky souboru jsou vybírány nezávísle na sobě a nezávísle navybírajicím. Další podmínkou je. aby každý prvek měl neustále stejnou možnost být vybrándo výběrového souboru. Nelze tedy považovat za prostý náhodný výběr takový výběr. kdy seodběr vzorku provádí např. každou hodínu nebo se odebírá jen z horní částí zásobníku čí

počátku nebo konce navíjené role papíru.

j(x,)=j(x,)= ... =j(x,,). (III)

1. Existuje rovnost mezi pravděpodobnostmi nebo hustotami pravděpodobnosti jakodůsledek skutečnosti, že výběr pochází ze stejného základního souboru. Platí tedy:

2. Vzhledem k nezávislosti vybírání musí platit pro símultánní funkcí hustolpravděpodobností vztah:

141

M.(f)=M~~,. 'x.(f)=M (f)j

-;; - - (,I" Xl-f ... f:C,,) •

II

Prolože je v 'b' (11.3)y er proveden prostým náhodným v 'b'

y erem. dále platí:

M.(f) =Mx, (:JMx,(!J ... Mx. Uf) =[Mx(~YJestlíže 'b _ J (114)

rnOrneotovou vy cr, pocházi se souboru .vytvonljici funkci normálního r

Sdn?lrm~lním rozdělením, k

oz e em dostaneme: pa dosazenim za

(l12)

140

j(x,.x, .. ··.x,,) = j(x,). j(x,) ..... j(x,,).

Page 70: Statistika skripta

Rozdělení rozdílu výběrových průměrů

Z tvaru této momentové vytvořující funkce vidíme, že jde o normální rozdělení,

cr­s parametry Ji a --.

n

"l:;(x, - Jl)'

,.2 _ ''''1~o--__

II

hodnocených reakto • .ťřipadů v praxi nezn:~sou rozdilné. Tento příklad'rošení bude stc" parametr a, ale ou' ,!e pOuze ilustrativní . _praktických PříP:;\ ~e budeme muse/ po~,,-,vYber~vousměrodalnou'o~l~t~~ve většině

u u e probráno v kapitole v_Zit Jm~ pravděpodobnost .c y s, ~rincipRozděleni výběrov 'h enovane testování slalisticky~Jl hmode/, Rešení

e o rozJltyjg C I ypotéz.

U rozdělení 'b - , ,pravděpodobnostní rO';;PIe;o~eho, rozptylu Uvedeme

hJl . Jde o případ méně ča~y; adI e Jde o dvě možnosti, Prv ,pra~?ěpodobnostni prům­odnota ' e vyskytu tll Je pnpad kd ' er a

definujem~avyn~~'du ,Výsledky měření ~~I;s:J~a~lv obl~sti analytické ch~~~eZl~~lla veličinarovy rOzplyl sg jako' o em teto hOdnot k ,,' YJe znama

, y, tera Je známa. Tak

(11.5)

(116)a

Jestliže náhodná veličina x, sleduje normální rozdělení N(x" Ji, ,cr;) a veličina x,

sleduje normální rozdělení N(x" Ji" cri), pak rozdělení rozdílu výběrových průměrů rovněž

sleduje normální rozdělení, a to s parametry:

t43

(117)

(11.8)

(11.10)

(I Ul)

(I 1.12)

(IUJ)

(11.14)

(11./5)

E(so') = Jl(s;) = a'(x),

a' (s;) = Jl, -oo'(x2II

Častějším případem 'e t (11.9)I zde je účeln " Jen, kdy Jl není zná

e znat pravděpodobnostni • _ mo. Jde o rozptyl, definov 'prumer a rozptyl plal' any ve vztahu (4 4)

, , llytoVztah, ' ,E(s ) = ,,( ') _ 11- I y.

,. s - -;;-oo'(x),

a'(s') = (II-I)' ~I-IVII_J).l 114 - ~-.Q/\'-,- ,

II ll' --'a (x),

Pro velké výběry (1I-'>C<3) Iz 'e psal bez ohled

"(s') _ , u na typ rozdělení vztahy'~ -a (x), ,

0"( ') Jl _ ,,'s = _'- -!:2 = Jl, - a'(x)

fl ----"ofl

Pokud náh d 'o na veličina x sled .

uJe nonnální rozdělenia'(s;)=~ , pak dostaneme vztahy:

/I '

a'/s') 2(11-1)\' = ---- 00'( ) _ 20" (x)112 X "" __

II' .

~dělenív'b- ,erove směrodat .

I _ne odchylky Ve 'b-zde - vy erech Zn'I '

se SPokojime se zn I ' orm<LndlQ[Qzdě/enía OSll prvních d ~-

vou momentů.

142

x - Y- (Ji, - Ji,) 9,65 - 9,08 - (O)u = - = 3,68.

a' a' 0,80' 0,75'-'+-' --+--n n 50 50, ,

Posuďte, zda dva typy reaktorů mají stejný hodinový výkon. Bylo ověřeno, že hodínovévýkony reaktorů sledují normální rozdělení. Typ první se směrodatnouodchylkou cr, = 0,80

t /hod., typ druhý se směrodatnou odchylkou a, = 0,75 tlhod. U každého z reaktorů bylo

hodnoceno 50 várek. Byly získány průměrné výkony x= 9,65 tlhod. a y= 9,28 tlhod.

Příklad 11.1 Hodnocení rozdílu výběrových průměrů

Uvedený poznatek o chování rozdílu výběrových průměrů se v praxi využívá při

porovnávání dvou variant, např. zda je rozdíl v úrovní jakosti surovin od dvou dodavatelů,

zda došlo k růstu výkonu výrobního zařízení po úpravě výrobního procesu apod.

Řešení:

Veličiny n, ' n, udávají rozsahy výběrů pří stanovení průměrů. Důkaz se opět snadno

provede pomocí momentové vytvořující funkce.

Řešení musí mít pravděpodobnostní charakter. Budeme předpokládat, že oba reaktorymají stejný hodinový výkon, tedy, že plalí Ji, = ll,. Tím je jednoznačně určen model

normálního rozdělení. Vypočteme normovanou veličinu ll.

Určíme hodnotu distribuční funkce normálního rozdělení F(3,68) = 0,9999, dále určímeveličinu 1- F(3,68) = 0,0001. Tato hodnota říká, že dosažení zjištěného rozdílu nebo většíhorozdílu v případě rovných výkonů je 0,0001, tedy pravděpodobnost velmi malá, a ~ro~o ní!předpoklad nebudeme považovat za správný. Je velmi pravděpodobné, že hodinove vyk()ll)'

Page 71: Statistika skripta

3 7c = 1-·--- -_.-+'" (11.18)

, 411 32n'

Veličina c, je tabelována (viz příloha 6). Pro hodnoty ll> 30 tuto konstantu lze

s uspokojivou přesnosti zjistit ze vztahu:

lI(s)=_11) ~3a'Jx) =c,a(x), (I Ll6)

1"~1) II

a'(s)=Ul~l-c;)a'(x) (11.17)

(1125)

(J I 26)

(11.27)Nyni budeme aplikovat 1. Čeb •ysevovu nerovnost:

p[(x - Ex)' > ,'] 6-, = P6x-.&f;;, c).s: F(.r - Hx)' O"(x),--

c -7 ' tedy platí:

pDX-F.xj;;,c}" a'(x),,'

Při dlikazu 'dVYJ eme z b' .

o racene nerovnosti

lX-Ex!;;""

lx-mj' ",,".

.;emo teorém se v ", o

b~dlZ dána náhod' y~z,va k dukazu 2. Čeb š

dano libovolné kla~~,~~;~;~:\:t;;á/má koncg;;;;~:~d~~~;:~sti, kteráje formulována lakt .c !to podminek I ' nostnl prumčr i _ ,o.

li pat, nerovnost: rozptyl, aále jePVx- Iix) < c)", J _ a~(x)

,,'

(11.22)

(11.21)~

r(a + I) =fe-'I" dl =a!, dále plati

"

Připomeňme, že funkce r je zobecněný faktoriál a je definován vztahcm:

Čebyševova nerovnost 1. typu~

P(x;;, I) = LP(x) < LX. P(x) < LXP(x) = Ex.%;>\ .r~l x>o

(11.28)

(1129)

(11.30)

rozdělení

k > 1 z (J 1.29) dostaneme:

v ...yuz'Jeme vlastnosti'

Jevu opačného, tedy:

l-pDx-.&f;;,,-]=pflx _ I ·' ) ~,6 '-'J.s:" ;;, 1-::'_, .

cPoložíme_li C = k ()

a x pro

(J 1.31)

p6X Exf )6 -, .s: ku(x) ~ 1-.2.k' '

Z tohoto V t h opravd' z a u mužem ..

epodobnost toho' , e urcl! bez ohledu, ' ze nahodIlá veličina nabude h ':: typ, pravděpodobIlostnih

Zillmn velkých čísgl o not v mtervalu Ex±kU(x/

Je dáno n '. •pravdě palOve nezávislých 'těchto ~~~~ibnostní průměry (POCháze';"ahodných veličin x"x"", x 'kladné čísI n JSou konečné, přičemž ~ ze. st,eJného základního so b' "' ktere maji stejné

o, pak plati rovnost: neJvetšl z nich je menši •u.,oru) a Všechny rozptylnez clslo c. Je-li I'b y

li Ú C I ovo/néOl" ,~ p /.5 + -'i.'::.:.:.:.:':.!, _ I ]

n /1<,' =1I .

(11.23)

(11.24)

11.3 Zákon velkých čísel a centrální limitní včta

Budiž dána náhodná velíčina x, která ml,že nabývat pouze nezáporné hodnoty a mákonečný pravděpodobnostní průměr Ex, pak plati nerovnost:

Při použití statistických metod hraji významnou roli teorémy, které vyjadřuji vztah mezivýběrovými charakteristikami a parametry rozděleni náhodných veličin. P.L.Čebyšev dokázalteorém, který ukazuje, že při určitých podmínkách aritmetický průměr z náhodných veličin

bude blízký svému pravděpodobnostnímu průměru. Proto tyto teorémy nesou jeho jméno.

Obdobně lze provést důkaz i pro spojité náhodné velíčiny. Tuto první ČebyševoVU

nerovnost lze rozšířit na obecnější případ, kdy je dáno kladné číslo a a platí:

144

145

Page 72: Statistika skripta

( 11.34)

(11.35)

(11.36)

/I = _I--'.J.l-O(--'.I)<J(I)

Při platnosti podmínek centrální limítní věty plati, že normovaná veličina

, Je-I~ náhodnou veličínou směrodatná odchylka, je třeba, aby počet náhodných pok'usů byl·ětŠI nez 100, pro rozdělení korelačních koeficíentů blízkých k jedné, je třeba více než 300

Tedy tato veličina sleduje normované normální rozdělení pro dostatečně velký počet

měření ll, ač náhodná veličina x normální rozdělení nesleduje. Otázkou je, jak velké 11 musíbYl. Pro 11=50 si mllžeme být s normalitou průměru prakticky vždy jisti. Nebude-Ii rozdělení!,'hodné veličiny x od normality při1iš vzdáleno, mnohdy stačí již II = 5.

při dostatečně velkém počtu měření sleduje normované normální rozděleni. Veličina I jevýběrovou charakteristikou s momenty J.l(I) a <J(I). Je-Ii veličinou I = x, pak můžeme psát:

Tato věta se nazývá centrální proto, že je centrální nebolí ústřední větou pro výběrové

metody. Důkaz je poněkud složitý, a proto jej provádět nebudeme. Abychom mohli použítcentrální limitní větu, byly hledány podmínky, za kterých ji lze použít i v širších případech.

Tyto podmínky jsou shrnuty v Ljapunovově větě, ta v podstatě říká, že centrální limitní větu

lze použít tam, kde každá veličina, která je zahrnuta do součtu, jej sama o sobě praktickyneovlivni. To je splněno tehdy, jestliže druhý a třeti moment je konečný. Matematicky lotolze zapsat vztahem:

147

Vidíme, že jde o značný počel námčrů Jestliže víme, že pracovník pracuje alespoň z 80%,tedy p '" 0,80, pak c = pq = 0,80.0,20 = 0,16 a II bude alespoň 32 000. I tento počet

náměrů je při1íš velký, budeme muset asi slevit ze zadanýcb podmínek.

Prvnim krokem při resem úloh s náhodnými veličinami je určeni jejichpravděpodobnostniho chováni. Značný význam při uskutečnění lohoto kroku má centrálnílimitní věta. Prakticky nejdůležitějším tvarem je věta Lilldeberg-Lévyho, která tvrdí, žesoučet (a tedy i průměr) vzájemně nezávislých náhodných velíčin, které pocházejí z jednohozákladniho souboru a maji konečný pravděpodobnostni průměr i rozptyl pro dostatečně velkýpočet měření, sleduje přibližně normální rozděleni (síeduje asymptoticky normální rozdělení).

Průměr tohoto součtu bude IIJ.l(X) a rozptyl nu' (x) .

(11.33)

(11.32)

( 1132)

ČebyšeVOVU nerovnost na2.

. být alespoň 50 000 .n mUS\0,25 řešením pak

095~1-~', 11.0,01

. proložtv vy neroVnostI. . blol

v v ' ." 2 Ccbyševo 1 maxImlli'sen.h o .. t'tue ""UZltlm O95 s'" 0,0 a, ěru ZJIS I vJ • ) p "', ,

Sta:'0v:nio~~~~~~~~~~~~u(~:rnik hPra(~u;~~~ ~:~~:~~;se jedna o ln O5 '" 0,25 ze vzta uhodnota p.q '" 0,5. ,

,( x, + x, +...:':":")

1r-'S".++'-"_C+-- ., islost lze dále psat.

. OVOU nezavS ohledem na par ,

1. '1. + ... +0 Xn

\ ~ <J x, ~--

p~x,~ x, +".+ x"'-_)l\ < s j ~1--- Il'S'

\II zákona velkých

. tato formulaceguje k nule, Je . h visel

C s rostoucím II konver lace zákona velkyc c, az - ll' a formuProtože vyl' IlS' ,v lati Bernou lOV

" Obdobně lze dokazat, ze pv' I dokazana .Clse " v tnOSt ve tvaru·pro relatlVm ce

lim, ,~ pí\;-A< s1'" 1 tento případ zapsat ve~ ť kterou lze pro

ČebyševOVY nerovnoS "Důkaz se provede z 2.

tvaru:

J0,25

{m _ p ~ s ~1-7. , v O25 Stanovime-

II • " nŠI nez " , stII . . ké rozděleni, C ,:,us1 b~tm~ěření se relativm čeln

O

. vázána na bl11oml~ v' adě velkeho po uTato nerovnost Je . ' dokázáno, ze v pnp. ákladního souboru.

00 Je um v d bnosu P 1.li limitu pro 11-->, ' dl'šovat od pravdepo o

I ěmalo o I ..bude libovo n v' v'kovém pozorovam . b

vení počtu náměrů pn mZI , " liže chcete zajístll, a ~Přiklad I 12 SJ,aI!O v' Vikovém pozorovam, Jesdte'lkoU trváni operace

. ěrů pn roz . ovenouotřebných nam zdil mezi stan

Určete počet P děpodobnost a aby r? 'Ině o 1%závěr měl 95°~o yra\ operace se lišil maximaskutečnýn1 trvanlm te o

v kl dy lze aplikovatvymezené predpo a

S ohledem na + x +... +x, . Výsledkem bude'.. ".- ~---

náhodnou vehcl11UII

146

Page 73: Statistika skripta

II

,Z.-('." pro 50 Sluprlů

volnosti na zákl d' oa e Vztahu

(I J 42)/I j'e" I ' .

I a pns usný kval1tiI _nOr O1ovaného '

nonnalního rOzdělení.

veličina

Příklad /1.3Určení hit" k . I~='-"'.!!.!!Jcii!geU!!10~dUQ1YJOZdělenc Z'

Určete kritickou h(J /.41) a (1/.42) odnotu veličiny

V závěrečných částcch této kapitoly probereme ti; velmi důležitá rozděleni, která seřadí k tzv. rozdělenim exaktního typu. Tato rozdělení patři mezi nejpoužívanější

v praktíckých aplikacich v průmyslové praxi. Rozdělení X' je definováno takto: sleduje-Ii

náhodná velíčína x normované normální rozdělení N(O; 1), potom náhodná veličina vzniklá

součtem čtverců těchto velíčin sleduje rozděleni X' (chi kvadrát) s v stupni volností, kde

počet stupňů volnosti představuje počet sčitanců. Rozděleni X' je charakterizováno hustotou

pravděpodobnosti ve tvaru:

11.4 Rozděleni X'

pokusů i více. V takových připadcch se k ziskáni normality používá vhodných transformací,jak ještě ukážeme v dalšich kapitolách.

Tvar rozdělení X' je výhradně závislý na počtu stuPllů volnosti v. Z tvaru pro hustotu

pravděpodobnosti tohoto rozdělení je přímý výpočet distribuční funkce obtížný, proto sedůležité veličiny tohoto rozdělení tabelují. S ohledem na praktické využítí tohoto rozdělení se

tabeluji hodnoty distribuční funkce, hodnoty kvantilll nebo kritické hodnoty X;, které

vyhovují vztahu:

(dle Vztahu I J.4I),

(dle vztahu 1/.42)

,Z."o,O' (50) = 0,5{.J9'9 + I 645)'

t , = 67,22

Z;.o.o, (50) =5fl - 2 (-2]'--+1645/9.50 ' 1,9.50 = 67,503

Správná hOdnota je 67,50.

Pro praktické a I'kVěta" I" . Pl ace v oblasti v'b' ,

. jesllze nahOdná v /' ,. y eroveho rozptylu I . ,e ICJlla x sl d . ]faje vyzn

veličina !!:ť... e uje normální rozdělení N(x amnou, roli Cochl'anova. cr' sledUje rozděleni Z' s _ ' 1'; cr ), pak náhodná

odVodIt rozdělení v" . v - 11- I stupní volností 'ohledem na nutnost ~~erovych rozptylů a rozděle' '. . Z teto vlastnosti se dá

nutné Iransformovať í di~e~~~~~~~lčr~ fUnkce .v posle~n~~b~~~Z~~i~";,ěro~latnÝch odchylek S, pOlo do predplsu pro f(z ') d ,ode byla rovna jedné je

2 ns 2 osadJme za:% =- d 2 n

cr' ' % =;; dr', pak:(11.39)

(11.38)

(11.37)

I'(x ' ) = v,

cr' (X') = 2v.

Zkrácené označeni rozdělení X' je X'(v).

Bez důkazu uvedeme momenty:

Nutno poznamenat, že tabulky krítických hodnot obvykle končí pro 29 stupňů volnostiMáme-lí určit kritickou hodnotu pro včtší počet stupňů volnosti než 29, využivá seskutečnosti, že se vzrůstajícím počtem stupňů volnosti náhodná veličina

(I 1.40)(11.43)

sleduje normované normálni rozdělení. Krítíckou hodnotu veličiny X'lze určit

uspokojivčdle vztahu:

x.' (v) = O,sUZv -I +11,_.)' nebo přesněji dle vztahu: (11.41)

lJ(s') _ 11-- 1--cr'(x)

II '

0"(s')=3(n-l) 4

II' - O' (x). (11.44)

(11.45)

t48

149

Page 74: Statistika skripta

(11.52)

(1153)

x-p r-­t=-yn_ls

Jestlíže náhodná veličina x sleduje normální rozděleni (x; p,; o','), pak náhodná veličina

Zkrácené Označení rozdělení I je I(V) , Z defilllcního vztahlJ rozdčlení I plynou základnívlastnosti:

I, Rozděleni I je symetrické rozdělení kolem hOdnoty t = O,2, Rozdělení I je plošší než flonnovaflé normálni rozdělení3, Pro dostatečně velký počet stupňů volnosti přecházi v normální rozdělení,

Vzhledem k tomu, Že rozděleni I je jednoparametrickým rozdělenim, je výhodnévýznamné veličiny tohoto rozdělení tabelovat. Tabelují se hodnoty distribuční funkce F(I),dále hodnoty kvantilů a kritické hodnoty pro různé hodnoty a, Je třeba UPOZOrnit naSkutečnost, Že v některých tabulkách se tabelují kritiCké hodnoty, které vyplývají z užitidVOustranného testu či dvoustranného odhadu a jsou určeny definičním vztahem:

sleduje rozděleni I, Důkaz provedeme dosazením do definičniho vztahu:

(11.46)

(1147)

(11.48)

(11.43) změnou

f(s) =

b ' 'i tvar'Momenty na yvaJ '

, k' ze vzlahu' ch lek ZIS ameRozděleni výběrových,smběeroru,~l~~~~in~~ &S), ziskáme tak vztah" I tj vynasohodnoty diferencla u, ,

lJ(s) = c,a(x),

("-J -c')a'(x) ,

a' (s) = -11- , 't dle

'b· fl Jej i hodnoty se dají slanovld 'rozsah vy eru '.' 'k nstantou pro auy " 6Velicllla c, Je o 'h ' uvedeny v pnloze ,h (IJ 66) Některézmc JSouvzta u . .

11.5 Studentovo rozdělení t , 'k Studentovo rozděleni, j~ v aplika~~~!e~~~~'. d ačemm Ja o , 'na pn porovn ,Rozděleni I, známé bt,:z POY'Choz~ozděleni. Uplatň,uje ktse ~enlemVeyžaduje znalost směrodatne.'.' h vy erov d.1 1m erez nejvýznamneJslc , k 'ho procesu, Je roz e en "

variant úrovní t:chn~l~gl~o~boru, Je definováno takto, • 'N(O ' I)

odchylky a v zákla mm 'vané normální rozdelem :'

'.' která sleduje normo , 'nezávisla na'. d' áhodná vehcma 1/, "stupni volnosti a JeBudlz ana n '.' leduje rozdělem X s v'hodná vehcma v s

dále nechť na k 'hodná veličina'.' • 11 pa nanáhodné vehcme ,

očet stupňl. volnosti, který souvisi"ď 'parametr v, ato pRozdělení ,I m~Je my, Momenty rozděleni I jsou:.' volnosli veltcmy X 'stupnu

( 11.54)

( 11.55)

Il,SI2 +172s:v=:;___ ___

a'

sleduje rozděleni I s v = ", +n, - 2 stupni volnosti, přičemž velíčína s'je dána Vztahem:

DŮkaz platnosti vztahu lze provést dosazenim do definičního vztahu pro I, kdy

významnou náhodnou veličinou pro aplikace v praxi je I'ozdí/ výbě,'ových průměrů,Jestliže náhodná velíčina x, sleduje normálni rOzděleni N(x',I'"a,') a náhodná veličina x,

rOvněž sleduje normálni rozděleni N(x"p"ai) a plati, že a, =a, =a (toto je nutné ověřit• viz testOváni statistických hypotéz), pak náhodná veličina

(1150)

(IL51)

s počtem

(11.49)

b' , hodnotyNáhodná veličina I na yva

pro v>2,

1v + I ) _".,

- ( ')'I 2 I +.!.... ,f(l)=~ 1~) v

va'(/) =. -­

)1-2

IJ(/) = O,

I='! .]V

v ,

• 'I v stupni volnostI.ozdelem s ,sleduje StUd(entovo)r hustotou pravděpodobnosli' lu - 00 -t<o Sz mterva ,

150

151

Page 75: Statistika skripta

II

11.6 Fisherovo rozdělení F

(11.61)

liS:!- _ _ 2

u' -.r .

sleduje Fisherovo rozdčlení D'k

. u az se provede snadno v ".

yUzrtrm vztahu

Jest"~e náhodná v.,.x, sled . c/rCllla x, sledu'e .souborů uJe nonnální rozdělení N J. normalní rozdělení N(x ,

,potornrli'hodnável.'· (x"p"U,'), s' . 2. "P"U,) a náhodná v l."leJna I a '\2 JSou lb" . , e JClna

n,s,' vy elove rOzptyly z obou

~~ .:. 1)' ."---- _.\,11 S':? - ~ F~. 2 S;2(n, ~/)

(l1.6Z)

DOdatek k II 1< .. apltole

OdVOZení mo •~="""!!l!t!Qjmlli1en!]Jtl1u:Jr:Qogzd[@'l~·l.rme em rO?Qtv/u . ,

Jd >~a smerodat .e o případ kd ' ~-- ne odchY1kx

, y nahodná vel."Icma x sled'

uJe nonnální rozděle 'f( Z (. .-, nI. Víme, že:

J s)~ -~ ll) 2" fl.rtJ(?) W s'-'e '''',

(11.57)

(11.56)

hodnoty s hustotounezáporné

V,

Hlavni dva momenty tohoto rozděleni jsou:

Toto rozděleni je úzce spojeno s veličinou X'. Jestliže náhodná veličina 11 sleduje

rozděleni X' s v, stupni volnosti a veličina v sleduje také rozdčleni X' s v, stupni volnosti,

polom náhodná veličina F sleduje Fisherovo rozděleni. Tato veličina je definována jako:

Hlavni využití Studentova rozděleni I je v oblasti statistického odhadu a testovánístatistických hypotéz.

Definičnim oborem náhodné veličiny F JSoupravděpodobnosti:

Zkrácené označeni Fisherova rozděleni je F(v"

v,). S ohledem na složitost předpisu pro

Fisherovo rozděleni se tabeluji významné hodnoty Osou též součásti speciálnich statistickýchprogramů), a to buď hodnoty kvantilů rozděleni F nebo kritické hodnoty pro vybranéhodnoty a. V příloze je stanovena úroveň veličiny a = 0,05. Je nutno zdůraznit, že platí

vztah:

.,RSK _ 2a 2- Cf)

-If'z-~-[e ~'s 'Y'ds,

(11.63)

(1 1.58)

(11.59)

pro v,>Z,

pro v, > 4.

fJ(F) = --"Lv, -Z

u' (1') = Zv; (V, +,v, - Z)v, (v, - zHv, - 4)

(11.60)(11.64)

dz = Zas ds,

Hlavni uplatněni tohoto rozděleni je v testování rovnosti rozptylů ve dvou souborech.analýze rozptylu a plánování experimentu.

r(')-J~ -> ~V' - e ·zv-,dz = ZJe ",' I ')"-r ~

o \ClS' Cl\' cl: Jo . s:::::2aY ns12esY'dr

o '

152(ll 65)

153

Page 76: Statistika skripta

12, STATISTICKÝ ODHAD

Pro k = 1: Es = c,O" ,

(11-1 ,\ "x)0"2(S)=~-,,----C2f' .

(1166)

(1167)

(1168)

V předchozim textu jsme ukázali, že na výsledky pozorování musíme hledět jako navýběr ze základního souboru. Rozdělení četností, které získáme, považujeme za přiblížení

pravděpodobnoslnímu rozdělení základního soubOlu. Jednoznačné slanovenípravděpodobnostního rozdělení představuje významnou úlohu matematické statistiky, máznačný praktický význam při analýze, srovnávání i prognóze v podnikovém měřítku. Při

řešení praktických úloh na základě teoretických úvah i praktické zkušenosti známe tvarpravděpodobnostního rozdělení, ale neznáme parametry tohoto rozdělení, ty určujeme

statistíckým odhadem. Statistický odhad je odhad parametIů pravděpodobnostnihorozdčlení

na základě informace z výběru, provádíme jej dvojím způsobem:

J. jako bodový odhad, kdy na základě výběru určíme jednu hodnotu parametru· bod,

2. jako intervalový odhad, kdy stanovime interval, který s určítou pravděpodobností zachytíneznámou hodnotu parametru pravděpodobnostníhorozdělení.

, 2

, " dělením a rozdělemm 'LVztah mezi eXllonenclalnlm roz Obě tyto formy odhadu se nevylučují, ale zjejich rozdílu vyplývá, že pro malé soubory je

zpravidla vhodné pracovat s inte,valový odhadem, zatímco pro velké výběry se za určitých

podmínek můžeme spokojit s bodovým odhadem.

( 12.1)

Obecně mllžeme říci, že odhad parametrů S" S" "', S, převádíme na určení výběrových

charakterístik ,,(X" X,,"', x.,), f,(x"x"···,x,,).. ··,',(x,,x,,···,x,,) z výběrových hodnot

x" x" "', x". Tyto výběrové charakteristíky pouzíváme při provádění vlastniho odhadu.

Konstnlkce těchto výběrových charakterístik musí být provedena tak, aby při dostatečně

velkém rozsahu výběru byly blízké neznámým paramctn,m, tedy aby platilo:

12.1 Bodový odhad

,,(X, X ... x )",,9• 2' '/I t

Parametrem rozděleni náhodné veličiny je veličina, na které závisí její distríbučni funkce(tedy i její rozdělelÚ pravděpodobnosti a rozdělení hustot pravděpodobnosti). Parametrzákladního souboru odhadujeme pomocí výběrových charakteristik, někdy přímo, někdy

jejich funkcí. Této funkci se říká odhadová funkce. Odhadové funkce jako náhodné veličiny

mají pravděpodobnostni rozdělení příslušných výběrových charakteristík.

X>o

dz = 2A. dx

x' se 2 stupni volnosti.Tato veličina tedy sleduje rozdělení

z=2xA.,

f(X) =).e '"

, k 5 výrobků keKontrolni otaz Y d b at každou hodmu- . d ktu bylo rozhodnuto oerII 1 Při kontrole jakos;1 p;o :stu ? ?

. kontrole Jde o spravny P e~ry základniho souboru . t my byl odebrán vzorek JdeII 2 Můžeme zjistit přímo parta:

nkyseliny sírové Z každé CIS e

'k bsahuje 8 CIS er .' vé?II 3 Dodav a o 'k ntrolu jakosti kysehny slro " , _ 25 a v = 41

o stoprocentm o 'b č ' funkce veličiny X' pro Xo -\ dnotu distn u Ol 41 '?

11A Určete 10 , o a = 0,05 (0,0 I) a v = o. .,' jeho rozdělenI

II 5 Určete kritickou hodno~~ X~ pr 'běrový prllměr 30. Co muzeme ncl o. .• . 25 merem Je vy

1 1.6 Zjistili Jsme, ze z

Parametry základního souboru muzeme zpravidla odhadovat pomocí několika

.~kteristik. Jde o to, aby odhad byl co nejlepší. Pro posouzení vhodnosti odhadu sef ""lvaJÍ nejčastěji tři kritéria, a to:

kritérium konzistence neboli souhlasnosti,kritérium nestrannosti čili nevychýlenosti,

J55

154

Page 77: Statistika skripta

3. kritérium vydatnosti.

Konzistence odhadu

Nestrannost odhadu

Kritérium konzistence žádá, aby bodový odhad splňoval podminku:

(127)

(12,8)

A, = EfJ[8 ln j(x, 9)]'} 181 I j'( ]II 09 =-, - n x,.9)8.9' -.

Existuje_Ií takov'nerovno ' Y nestranný odhad t '

st, ve vztahu (12 8) k ' pro ktery rozptyl 2( ). , pa takový dh d (J" I dosajI' d '

P"'kl o a nazýváme odhad uJe olnl hranicen ad 12.1 Vrčeli i vydatného odh d vydatný.

-.......d!.dLl1arametru A. P ,DOkažte z"e vy'b" , OISSonova rozdělení

, erovy·" .prumer Je vydatným odhadem

K ře" , parametru A. P ,sem využijeme vztah,i (127) o'SSonova rozdělení

. a (128) .

..1.' -I- A.=-- 2 I jV " ,2 - -I- =_.YuzJtím d'uhé d ' " A. .

envace dostaneme stejný výsledek, tedy

A, '" -r;C!_J _J~l ..1.2 - J."

VYdatnost odhadu

, Vydatno't odhadu' .ma větší vydatnost le~eo~ravldla cMp,jna relativnč "d

rozptylů nevycl1ýlených Ch"~:~; který má menši ro~~;yr ~dvou odhadů určitého paramet' enstlk tedy' . ,ruu vydatnosť . rll

, ' . I Je poměr dvouE(I - Et)' j;-{ )'--'7"--- -',l - 8 2

E(I' - Ef') - ~-), = !'.Jl)II - 9 (J"2 (I') .

Nabizi 'e otázka st ' (12 6)Pro dosti široké podm,' Mkovem, kunzistelltniho a nest 'ncn' "'" n y se da d k'" ranneho odh d '

I mensl nez určitá dolní hranic: ;zat, ~e rozptyl odhadu, kterýa u s ,n~Jmenšim rozptylemro pnpad Jediného par se opila o rozsah výbě

(T2(t) > I ametru platí nerovnost ru ",--, kde

nAI(12.3)

(12.2)

(12.4)

EI=9.

f(x, -x)'\,12 _ .=1 _, - 1/-1 .

Odhad je považován za nestranný, platí-Ii podmínka:

/" 11-1 2()',s:::; --(T x,

1/

asymptoticky nestranným), neboť platí:

Smysl tohoto kritéria je v tom, aby s rostoucim rozsahem výběru rostla pravděpodobnost

toho, že se výběrová charakteristika bude libovolně málo odlišovat od parametl1l. Tutovlastnost splňuje výběrový průměr X jako odhad střední hodnoty Ex = 1'. Jde o důsledek

platnosti Čebyševovy nerovnosti 2. typu. Obdobně je tato podmínka splněna pro relativníčetnost jako odhadovou veličinu parametl1l p binomického rozděleni.

Pokud podmínka (12.3) je splněna pro 11--+ 00, mluví se o asymptoticky nestrannémodhadu. Pokud EI> 9, pak jde o odhad kladně vychýlený, pokud EI < 9, jedná se o odhadzáporně vychýlený. Požadavek nestrannosti je důležitý zejména při malém rozsahu výběru.

Konzistentni odhad nemusí být ale odhadem nestranným. Výběrový průměr X je odhadem

f(x, -x)'nestranným, výběrový rozptyl S2 = .!=!.---- je odhadem záporně vychýleným, (í když

11

a proto je definován výběrový rozptyl nevychýlený, kdy ve jmenovateli je počet stupňů

volnosti, tedy:

Pro tuto výběrovou charakteristi"..u platí &'2 = (>2, jde tedy o odhad nevychýlený.

V praxi dochází k situaci, kqy máme odhadnout rozptyl v základním souboru na základlk dílčích výběrových rozptylů. Castá úvaha zní tak, že rozptyl bude nejlépe odhadnut jak'palměr z dílčích rozptylů. To neni pravda, nezkresleným odhadem bude:

(125)Ze Vztahu (

12.7) vidíme, že (J"'(Xh~.II

156

157

Page 78: Statistika skripta

binomickeho

věrohodní'm odhademparametlu p

Relativni četnost J' 1 drozděleni. . e e Y maximálně

Příklad 12.3.určeni max' 'I °

'!!!ll nc věrohod ' hnyc odh dOUrčete m ' , o a u parametrů "

ax'ma/ne Včrol10dné odhad -- nOlJJ1!llrllho 'ozcLifumjŘ o , Yobou param I o_ eseJ][ e ru normálníh

f o rozdělení.

Jednou z nejdůležitějšich metod, které slouži k odhadu parametri', na základě výběru, jemetoda největš! věrohodnosti.Opirá se o věrohodnostn; funkci L, definovanou vztahem:

Dál Č ' I o ° P' dOl ' '(-) O"(x) A. V'd' oeur Jme rozpty prumeru II Olssonova roz e eo! a-- x = -- - == . 1 trne. ze seII /I

tato hodnota shoduje s minimálnim rozptylem; tedy výběrový průměr je vydatným odhademparametru A. Poissonova rozdělení. Tento parametr A. bychom mohli též odhadnout z rozptylu,ale odhad z průměru bude vydatnější.

Převedení na logaritmy je při řešení mnohých úloh snadnější, což uvidíme i z příkladu.

( 1216)

(12.17)

(12.18)

(12.19)

(12.20)

tl, a:

fl',/1 _ 1"'1 ­r--_·=x

II .

ln L=_'!., fl2 11 21l--ln 0'2 _ 2. ~( 2

2 2a2 L.. x, -p) .10::'

Nyní bUdeme hl d .e al maxIma °

verohodnostní /Unkaln L,,, ce pro paramelry

'a;- =;>L(x, - p) =O,=:/ '

aln L__ II J fJ 2

a ,----+ "(a 20" 2;?'L.. x, - p) = O.

,=:J

Z rovníce (1218) , k'. ZlS ame

Ze Vztahu (12. 19) pak:

Nejprve určím o

e verohodnoslní ful1k .CI, ta nabude lva!"

I • (" .1',_,,)22~ --------.

.~I ul

(12.9)

(12.10)

(12.12)

(12.11)

n

L = f(x" 9)f(x2 , 9)··· f(x", .9) = fl f(x" 9) pro spojité veličiny.,0-\

n

L =1'(x" 9)1'(x2 ,9)",1'(x",9) =fl 1'(x" 9) pro diskrétni velič;ny,,,,,I

aI, o o' k' I ' d'-' = , cozJe e VI va entm po mmcea9aln L _ J aln L _ O-----a9 - L -----a9 - .

Maximálně věrohodný odhad z hlediska odhadu parametru 9 je takový odhad, pro nějž

věrohodnostnífunkce, založená na výběru o rozsahu ll, nabývá maxima. Požadavekmaximalizace věrohodnostn! funkce vede k podmince:

Příklad 12.2 Určeni maximálně věrohodného odhadu parametru p binomického rozdělení

Rozhodněte, zda relativní četnost je maximálně věrohodným odhadem parametru l'binomického rozděleni, máme-li k dispozici II měření.

Parametr p je vlastně parametrem alternativního rozděleni, kdy se celý děj II krát opakujea sledovaný jev nastal m·krát. Věrohodnostn! funkce nabude tvar:

II

L=1'''(1-1')''''' ,ln I_=mln p+(II-m)ln (1-p).

Určime maxímum této funkce:

aln L = m _ 11- m = O, odkud:ap p 1-1'

nip=-.

II

(12.13)

(12.14)

(12.15)

Všimněme . o (12.21)Sl, ze ve Vztahu

pro rOzptyl vystup . .uJe P a mkolí

Ix.

2.2 lntervalový odhad

. DOsud jsme '"Ysledky Jd se zabyvali odhadem k .. . e o t 'tcry "predstaVUje o, že bodový odhad pn malém rOzsahu 'b °

\!',""ně lišít p~uz~ náhodnou veličínu kl b~z VYmezení Přesnos'J eru nemusí dávat dobré. YII1 zavedeme některé p' tO ebra, Se v dalším výběnl ~ ° spolehlivostí odhadu

o re ne pOJmy. muze od Prvního výběru

158

159

Page 79: Statistika skripta

Výběrová chyba je rozdíl mezi hodnotou výběrové charakteristiky I a hodnotouparametru 9, tedy (I - 9). Místo o výběrové chybě se často mluvi o chybě výběrového

odhadu. Lze říci, že přesnost odhadu je tím větší, čím je výběrová chyba menší a naopak. Jetřeba stanovit miru pro přesnost, tou je střední výběrová chyba.

V další části t' .pravděpodobnostní rozde~~ kapitoly ukážeme odhady

enl. parametnipro nejpoužívanější

Střední výbčrová chyba je definována jako směrodatná odchylka výběrové

charakteristiky u(l).

12,3Odhad parametni vybran .ch. .

y pravdepodobnostních rozdčlení

Uvedený interval spolehlivostí je oboustranný. Kromě něj se někdy v praxI využíváinterval jednostranný. Pro něj platí:

Spolehlivost odhadu je pravděpodobnost, že výběrová chyba (1- 9) nepřekročí

v absolutní hodnotě k·násobek středni výběrové chyby u(I). Z této definicc spolehlívosti

odhadu vyplývá určení mezi spolehlivostí, a tím í intervalu spolehlivostí ve tvaru:

(1225)

(12.26)

(1227)

(12.28)

Na základ· . .e prrnClpu íntervalového odh d ' .

x, (nt a u mUSI platIt:

L ~ (1- Pl( r" ~ ~=0 x 2'

t(nt~(I_P r-x = ~.r---Gl xl' D 2 .

Odhad llara tme ru o alternativniho b' . k'

momlc eho) rozděleni

Vydatným bodovým odh d .a em.Je relativní četnost.

Vn Pozorovánich při výbězadaným stupněm s . 111 S vracením se sledovaný jev ob'e '1 'o binomické rozděl poleh"vostl pravděpodobnost I' 'kyt ~ VI Xo krat. Je třeba určit se

enl. vys u sledovanéh .o Jevu. Jde tedy

Řešením těcht d ." , o vou rovnIc 11-1'1 "d ' ,

Speclalnlch statístických ' elO la u zlskame výsledek V'dosazením do vztahů _vizpf~ff)~amu, použitím statistických tabu·jekY~~ep~e.k lze získat pomocí

literatura (I) nebo

V, =2(n-x +1)o , v, =2xo, v, = 2(x +1) 2( )

o • v4 :;:: n- Xo .Příklad 12.4

Určeni paramet b'ru P 1D0mického rozděle '

(12.23)

(12.24)

levostranný odhad,

pravostranný odhad.

P(9 > I - o) = I - aP(9 < I +o) = l- a

Vztah (12.22) říká, že pravděpodobnost loho, že interval spolehlivosti zachytí neznámouhodnotu parametru 9 je 1- a. Nutno zdůraznit skutečnost, že interval spolehlivosti jeproměnlivý, zatimco parametr je pevná hodnota. Nelze tedy říkat, že parametr leží uvnitř

intervalu spolehlivosti I

1- a je pravděpodobnost, která se nazývá stupeň spolehlivostí. Tato hodnota se volíblízká k jedné, zpravidla 0,95 či 0,99,

k vyjadřuje koeficient spolehlivostí aje svázán se stupněm spolehlivostí,o je krítická výběrová chyba,I ± O představuje interval spolehlivostí, jinými slovy konfidenční interval,ID,I" dolní, horní mez spolehlívostí.

Interval spolehlívosti pokrývá se zvolenou pravděpodobností neznámou hodnotuparametru. Jestliže stanovíme k = 2, pak z toho vyplývá, že v připadě, že výběrová

charakteristíka I sleduje normální rozděleni, interval I ±2u(l) zachytí v průměru 954 krát

z tisíce neznámou hodnotu parametru 9. Tato skutečnost vyplývá z vlastnosti normálnihorozdělení, říkáme pak, že stupeň spolehlivosti tohoto odhadu je 0,954. Jestlíže bychomstanovíli stupeň spolehlivosti 0,95, pak v tabulce kvantilů normálního rozdělení naleznemehodnotu koeficientu spolehlivosti 1,96. Takto lze postupovat v případě, že známe hodnotusměrodatné odchylky u v základním souboru.

Volba stupně spolehlivosti je významnou otázkou při řešení praktických úloh. Je třeba Sl

uvědomit, že s rostoucím stupněm spolehlívosti klesá přesnost odhadu. Tu lze ZvýŠitrozsahem výběru, a to mllže být časově i finančně náročné. Je tedy třeba zvolit vhodn)kompromis. O této otázce pojednáme též v následující kapitole věnované testovart'statistických hypotéz. Pro vysvětlení problematiky odhadu významných parametrů "spokojíme se statistickým hlediskem, a tak budeme volit stupeň spolehlivosti 0,95.

PD~~5+ 45 Ú'ó =0,034,

[60

161

I

Page 80: Statistika skripta

(1235)

(1236)

(1237)

a A _ 42,8311- -- =214220 ' .

kvantil normálního rozdělení. Pro stllpeň sJlolehlivosti

lI a a(x)L\= -=.'__

..[fl

Z tabulek v (I) I' ..ze zjIstit že A _ 20,24, D -20-=1,012

Odhad oarametru 1/ normálního rozdělení

Vydatným bod .ovym odhadem je výběrov . • -

P

yprum&x

robereme n . ",. .eJprve prrpad, kdYJ'e Z •nam parametr a.

JiD

= X-ll a(x)~ -In-'

163

" a =k vyjadřuje (1- aJ 1000/ '2 2' /0-01

rovný 0,95 bude tato hodnota 1,96.

Při intervalovém odh dstejně vzda'J a u parametm " norma'l ", eny od h d - r- nI 10 rozďl . .pruměm _ o noty x. Rozd'l' e elll VIdíme že ob - .se casto naz' , _ I mezI hodnot ,e meze JSouplalí: yva presnost odhadli a o _ Oll meze spolehlivosti a 'b - ,znacuJe se symbolem L\ P vy eroveho

. ro tuto hodnotu

Příklad 12.5 O-Ab!!!l mmmetru AP'J _ --~~~ olSsonoya rozděltmí

I ocel vad na umak ' -de~kách bylo zjištěno 3~r~ove desce sleduje Poissonovo roz - .POIssonova rozdělení, a to ~~~t~~I~:ňrůmělrnhě.1.5 vady na de~~~n~d~a ~v,aceti kontrolovaných

sJlo e IIVOStl O95 a, nete parametr A. t hDosaz . ' . o oto

emm do vztahll (1233) a (12 34) d. ostaneme'

Av =-10 40,482=1,012 I .Alf = -- 85 654 - 240 ' - ,141.

Na základě tohohOdnotu _ to vztahu můžeme .-pozadované přesnostI L\ ~ u,rclt potřebný počet měře' . .-pomocI vztahu III plO pnpad že znám

_{'J ~("T . 'u.

(1238)

(1234)

(1233)

(1232)

(12.30)

(12.29)

v, =2(xo + I).

162

Pokud je II > ~ lze opět použít aproximace normálním rozdělením.A

Pokud odhad provádíme z II náhodných pOkUSll, postupujeme dlc vztahů:

Řešeni je opět tabelováno, např. v líteratuře (1). Meze můí,eme též stanovit podle vztahů:

Vydatným bodovým odhadem je průměr.

(1231)

6 2,09PII =--'-- -- = 0,218.

45 +6.2,09

V jednom náhodném pokusu jsme zjistili počet Xo výskytů sledovaného náhodného jevu,

který sleduje poissonovo rozdělení. Na základě principu intervalového odhadu platí.

Odhad parametru Apoissonova rozdčlení

Je-li rozsah výběru II dostatečně veliký, lze pří odhadu využit centrální limitni větya k odhadu využit normální rozdělení. Pro dobrou aproximaci je třeba, aby ll> - 9__ .p(l- p)

Z výsledku je patrné, že bodový odhad by mohl být dosti vzdálen od skutečné hodnotyparametru p. Interval spolehlivosti je dosti široký, je to důsledek toho, že informace, zda jevnastane či nenastane, je chudá. Uvidíme to i později v oblasti statístické přejimky Ke zúžení

intervalu je potřeba zvýšit počct měřeni.

Page 81: Statistika skripta

Příklad 12.6 Stanovení počtu měření Základním Vztahem je:

Stanovte potřebný počet měření pro stanoveni obsahu dusíku v dusíkatém vápně, jestlížepožadovaná přesnost je 0,15% obsahu dusíku, stupeň spolehlivostí je 0,95. Je známasměrodatná odchylka v základním souboru O" = 0,24 .

Dosazcním do vztahu (12.38) dostaneme:

t SLI = _~_~.

."rn--j'

11 = (ta ..lJ'-- +1LI .(J 2.42)

Pro splnění požadavku na přesnost odhadu je tedy třeba provést 10 měření.

11 = (!,96. 0,24)' = 9 83.0,15 '

Odhad parametru I-' normálního rozdělení v případě, kdy není známa směrodatná

odchylka v základním souboru, ale je známa výběrová směrodatná odchylka s, se provádípodobným postupem. Rozdíl je v tom, že modelem pro řešení tohoto případu budeStudentovo rozdělení I. Vyjdeme ze základního vztahu pro odhad:

(J 2.43)Příklad 12.8 Stanovení Potřebného J)Qčtu mě" ,

" renl.L1ro zada "Rešte úlohu z p"'kl d nou presnost odhadu

h d na u 126 'o notu O" . S tlm rozdílem" ,

, , ze zname hOdnotu.1'=0,24 a nikolív

Odhadneme p č ""st ". o et merení - "'kl

upnu volnosti, že, (ll) _ napn ad 12 Z tabulek 10' , k'dh d O,," - 2 59 dos d' ItlC yeh hodn t ..

o "a ované fl = 16 'e ":' a lme do vztahu (1243) ", o ",JIstíme pro IIpozadavek je třeb j kuvypoctene 17 a pro odhad ' ,a ZjlShme, že 11 - 18 P126 ' a us tečnít 17 ě" ovane fl - 17 je - ro

, je dán chudší ínformací o mb~ení. ROzdíl v počtu~ěř ,VYPOčtené 16,6 Pro zadanývana IlJlě, tedy tím, že znám em Oproh výsledku z příklad

=O=d",ha",dLrl!ouze.ptyU'1.!lu!..Qď:a.m!~":QQi!1!l~>QgW e POUze s a ne O" ua smerodatné odch lk

Y Y lTnormálního rozdělení

Vydatným bodo 'vym odhadem j'e vel'"'

leJna(12.41)

(1240)

(12.39)p( III< IJ= 1-a, odkud

1-'0 =X-I.(V) f s , pro v=fI-l,-Vll-I

1-'11 = x+t.(v) ~.-v11-1

(12.44)

(12.45)

s (11-1) stupní volnosti, Na základě príncipu

Výchozí I'č've I mou je vel'č' ,ns', I lila % _IIltervalového odhadu m'" , - ;>

uzeme psal:

i<. <%' <%:)=l-al 2 - •,

{ns' J-<0-2 ns

2

%' <---,-- =I-a~ Z CI. •2 1-_,

Plíklad 12,9Qdllad parametru

lT normálního rozděleníS pravděpod b '

Pestieidního o" nOstl 0,95 odhadněte rodlíve prostredku. Na základě ' zptyl a směrodatnou odch

bylo Ověřeno, že účí 'I" analyzy 20 vzorků byla ur" Yh'kU pro účínnou složkuMa s ozka pestícidního prost" dk cena odnota s = O1264 r

Dosazením d re u sleduje normální rozdě;,' . IZo vztahu (12 45) d CIlI.

. ostaneme pro %' (J 9)0,975 = 8,91 a %;."" (J 9) = 329', .

Kritické hodnoty la (v) jsou uvedeny v příloze 4, a to pro dvoustranný odhad.

Hledaný ínterval spolehlivostí je (17,82; 18,66).

J'I) = 18,24-3,18 o; =17,82,

1-'11 = 18,24+3,18~ = 18,66.

Příklad 12.7 Odhad parametru u normálniho rozděleni

I v tomto případě lze z požadavku na přesnost odhadu určít potřebný počet měření. Určit~potíž je v tom, že neznáme přesně krítickou hodnotu, protože je závislá na počtu stupňUvolnosti. Volí se proto íterační postup, který je patrný z příkladu 12.8.

Obsah dusíku v dusíkatém vápně sleduje normální rozdělení. Určete průměrný obsahdusíku v dusíkatém vápně, jestliže byly z dodávky analyzovány 4 vzorky. Ze získaných údajů

jsme zjistílí, že x= 18,24 a .1'= 0,23. Spolehlivost odhadu má být 0,95.

164IG5

Page 82: Statistika skripta

Odhad parametru A exponenciálniho rozděleni

Z výsledku vidime, že interval spolehlivosti je dosti široký. Je to di'tsledek relativně

malého počtu měřeni. Je 7iejmé, že bodový odhad by v tomto případě nebyl vhodný.(12.51)

(12.52)

(l2.53)

e" -1p=-~

e:2z + l .

Je výhOdné, že směl d 'postup odhadu průměn o atrIa odchylka závisi pou "

v transformované vehčin~ ~~~~elJ nOflnálniho rozdě~:n~a :eo~~. ;něř~ní, a tak lze aplikovatP POdle předpisu' a ostl a. Po urc"enl' ,. meZI

Veličina z sled .liJe normální rozd"' '. ceJJJat• o s parametry

/-I(z) = .!.'n.!..+Pp'2 1 + ---

- P 2(11 1)'

(12.46)

(12.47)

(odhad z jednoho výběru),

(odhad z II výběrů)

Xa (2)

A'H =-'­2x

x; (2n)

A.u =-~211X

x' a (2)I--

A - --'-D - 2x '

x' a (211)I--

A --~'~­O - 2nx

Vydatným bodovým odhadcm parametru A exponenciálniho rozdělení je převrácená

hodnota výběrového průměru ~.x

a' =~~0,1264 =O0768 0277D 329 ' ,av =, ,,

~, = 20 0,126.i = O2837 0533v II 8,91 ' alf =, .

Pro stanovení intervalového odhadu se využívá toho, že u exponenciálního rozděleni

veličina z = 2x.< sleduje rozdělení X' s v = 2 stupni volnosti a veličina y = 211XA též

sleduje rozděleni X' s v = 211 stupňů volnosti, kde n je počet opakovaných měřeni.

Jestliže je k dispozici dostatečně velký počet měřeni (II > 30), lze využít centrální límitní

věty, potom veličina:

,,'"Ex xL. "'"ll'II

LEx,' LEx x:::~_''''j I J ~Lx,' LEx,'

= - - --'-----. _tj) Ex,x,II II 2 --;-:-- .::=

2 Ir

-'IJ; 2- /-I, - - -11(11-1) Jl II-I (u

n -2 == - ' _ 2) II - 1II II ' Jl = -a'(x)II .

Jde tedy o 'zapomě zkreslený odhad

/( , .....l1!l!m!ní Otázh,. '1--==>.<Jl!! ohy

13 I POsud'te, zda výběro' o " _

I rOzdělení vy prumer X je vydat '32 Urč . nym odhadem para

n ete odhadovou funkcí kt . metru A exponenciálního/33 C eX~onenciálního rozděl~ní era vede k maximálně věroho .13 4 Ja~ pusobí na šíří intervalu ~ dlSpozíci je II měření dnemu odhadu parametru A

velký POčet I"" , spo ehhvostí?nerenl musíme za" .

(7' vel' -- YIStlt, abychom s 95% .b ICmy, ktelá sleduje normální rozd"1 ' o spolehlIvosti odhadlí rozptylylo Vol' e enl s chybou kl á

eZlch 0,85, 1,15)? ' er nepřekročí 15% (aby!.'0-'

(1249)

(12.48)

(12 50)

r;Jn+lla

AH = ·x.,r;;l..·

Ix--

u = -J1- asymptoticky sleduje normální rozděleni, pak

i---rn

z = .!.In 1+ r2 l-r

K určení intervalu spolehlivostí se využívá Fisherovy transformace:

Odhad korelačního koeficientu p

166

167

Page 83: Statistika skripta

(13 I)

jeduostranný test

jednostranný test

Ho :1' =1'0

H, :fI<Jio

Ilo :fI=JioH výkon je 1500 kg/hod

':Ji"'flo, výkon je rozdí/iJX od 1';00 kg/hod"

Zakladni vztah pro d dvoustranný testVOustranny' t I

est IYPOlézy H .9P [/1-.9/ > kafl)}_ o: =.90 se zapisuje ve tvalU'

\' -a, kde

rozhodováni za "-, nejIStoty t d "

oznacemm stn eň ' ': y pnpadu výběro' __symbolem a p (U~oven) významnosti n veho Setrení. VHe tohoto ',' ,

tato úloha máZ~:~~: ~~likoSli hl~diny VÝz~~/~l/:o~~~dina ~znamnosti ~~~i j:ezná~a podonom/ckyaspekt POjedname pozd-" ustalenym

S ','ej I. PoznalO 'tanovenim lJlad' . enejIne, že

na. l~esplněni našeho 1% vyznamnosti vlastně určime 'k~'llcká hodnota P, d~okJadu o nulOvé h ,meznl hodnotu, jelž' _,prijatelny'ch h d' KnllCka hOdnota dělí obl, ypoteze, Tato mezní hOdY prekrocenl ukazu;eh o not L "I' ast možn' h h nota se o -,,'

ypotézu zamítá ',e~- I testOvá charakt ,", yc odnot na kritic znacuje jakonezamítáme, ale ":,c'l jest!!ze leži v oblasti ř;"nstIka v kritiCké oblast~OU,oblast_~ oblasthypotézu přijmout e ze nc/, že tuto h of, ~atel~y,ch hOdnot, pak ov-: pak overovanouzákladního soubo s °vhle~em na skutečn~~t ~zu pn~"l1áme, Při vy'běr er?van?u_hypotézu

, ru, pnp d" ..... , ze nemam ovem setre 'zamltneme při ve-t" a e, ze ověřova h e pro rozhodova" _ nI nelze

s/m rozs h' nou ypot' I1J vsech ha u vyběrOvého so b ezu nezamitáme • ,_ ny OdllOtyN . u onI. ) mUze se stát " -.

a stanoveni' l'k . ' ze Jl, ve/oStIk"vyznamnosti vliv i. nt,cké hOdnot 'varianty konku ",zpusob vymezení k ku y, ,?a vedle testové ch ' ,

IUJic/ch hypotéz při testo~Z ' ru~ICI hypotézy. Nyní lIV adrakten~tlky a hladinynI pruměru' e eme zapls _

Ho :Ji=, ' pro moznéII ' Jio vykon je /500 kg/hod

, ,fl> 1'0 v'k ' "y On je'yxw než 1500 kg/h

od"

výkon je 1500 kg/hod

výkon je DiW. než 150; kg/hod..

- p- I. [)

• 0'(1)- k. (1-.9)

, kO'(I)'Q

je, pravděpodobnostvyběrová (testov') ,parametr (p-ed a charakteristika

_ r poklad) ,smerodatná d" 'k ' o c"ylka výběrov' h '

oeficlent vy'z ' e c araktenstiky'b - namnostl '

Vy erová Odchylka, ,kntlcká odchylk

hladina významn:sti,

VýZnam 'khyPotézy II za ladnílJo Vztahu (13 I) , 'h._, 0'.9 =.9 'bě 'je tento' pravd- d'~iU<terís ' , o vy rová odcll Ik _ '" epo obnosl toho - ")'znamno :,ky (kritickou OdChYlk)y a prekrocl k-násobek slllěrod~tz~ pn platnosti /lufové

s I a, u, nebolI spadá do kr'" ne odchylky výběrovéItlcke oblasť '

I, je rovna hladině

V průběhu testování budeme posuzovat do jaké míry jsou výsledky pozorovánikonzístentní s nulovou hypotézou, Naše úvahy budou mÍl charakter pravděpodobnostníchsoudů o chování určítých statistických charakteristik, jejichž hodnoty získáme na zákl,aděvýběrového šetřeni. Tyto charakterístiky se nazývaji testovými charakteristikami. Po jejIchvymezeni musí me stanovit pravidla, podle kterých můžeme prohlásit, že ověřovaná hypotezanení souhlasná se skutečnosti. V takovém případě ověřovanou (nulovou) hypotézu zamitáme

Pří formulaci pravidla stanovíme takovou testovací charakteristíku, jejíž výběrové rozdělem

je při dané hypotéze plně určeno,

Jako dalši krok (lépe je předchozí krok) musime stanovít vel;kost rizika vadného zav:v tom smyslu, že ověřovanou hypotézu zamÍlneme, když ve skutečnosti předpoklad ~(ověřovaná hypotéza je správná), Tomuto riziku se nevyhneme, protože vyplývá z po

13. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Testovánim statístických hypotéz rozumíme ověřování určitých předpokladů, které majistatístický charakter, Statistickou hypotézou je předpoklad o typu pravděpodobnostniho

rozděleni nebo předpoklad o parametrech určítého pravděpodobnostního rozděleni. Tomutozákladnímu předpokladu se řiká nulová hypotéza a značí se symbolem Ho' Předpoklad se

týká základniho souboru, Protí tomuto základnímu předpokladu se staví konkurujícípředpoklad, ten nazýváme konkuru.jící hypotézou, označovanou jakoH" Jako příklad

uvedeme některé možnosti:

výběr pochází ze základniho souboru, který sleduje Poissonovo rozdělení (Ho),

výběr pochází ze základního souboru, který nesleduje Poíssonovo rozdělení (H I) ;

obsah vody v dodávce je 2,5% (Ho), obsah vody je vyšší než 2,5% (H,);

výkony dvou zařízení jsou stejné (Ho), výkon jednoho zařízeni je vyšši (H,);

výkony dvou zařizení jsou stejné (Ho), výkony dvou zařízení nejsou stejné (H,),

Například na základě dosavadniho průběhu výrobního procesu víme, že průměrný výkonzařízeni je 1241 kg/hod, Po úpravě technologického procesu byl z 20 měření získánprůměrný výkon 1250 kg/hod, Máme posoudit, zda došlo ke zvýšení výkonu zařízeni. Výkonzařízeni je náhodnou veličinou s určitým pravděpodobnostnim zákonem chováni, proto takézávěr z pozorovaných výsledků o růstu výkonu musí mít pravděpodobnostní charakter.

Druhým úkolem statistické indukce je testováni statistických hypotéz, Význam aparátutestováni statistických hypotéz ocenime především při různých porovnáních, která v praxiprovádime relativně často, Máme např, určit, zda změna nějaké veličiny v technologickémprocesu jako druh dodané suroviny, druh katalyzátoru nebo změna reakčnich podminek vedeke změně objemu produkce, životnosti výrobku, výkonu výrobního zařizení atd,

Statistický odhad je prvním úkolem statistické indukce, Viděli jsme, že jen ve spojitostis respektováním existence náhody jsme schopni objektivně posoudit závěry z výhěrových

šetřeni. V praxi získaná měření maji většinou charakter výběru a s ohledem na tuto skutečnost

musime provádět hodnoceni výsledků pozorování.

13.1 Pojem testování stntistických hypotéz

168

169

Page 84: Statistika skripta

Kritickou hodnotou pak hude.

(dvoustranný test)

Volba hladinv význalJtnQsti

(133)

171

S(B) = 1- (J(9).

Výbčrová hodnota x ~ 151 neleží v kritické oblasti, ověřovanou hypotézu nezamítáme.

Silofunkce a operativní charakteristika

Silofuokcí testo nazýváme funkci parametru rozdělení, která vyjadřuje pravděpodobnost, mUnutí hypotézy Ho (pro stanovenou hladinu významnosti a) jako nesprávné hypotézy,

li pravdivá hypotéza HI s parametrem 9, tedy:

Dosud jsme uvažovali pouze o dvojicí hypotéz, nulové hypotéze a jedné alternativě.

V praxi jde o porovnáni celé řady alternativ. Tedy pro hypotézu Ho: P = Po lze postavit

alternativy p> PO' jde tedy o funkcí p. Tím se dostáváme k pojmu silofunkce.

XI/O = np ± 1,96f1,pq = 140 ± 1,96.)280 (ÚO,5 = 140 ± 1,96.8,37 ~ 156,4 (123,6).

K chybě druhého druhu dochází naopak v případě, když nezamítneme ověřovanou

hypotézu, jestliže je nesprávná. Mírou této chyby je (J. Její velikost nemůžeme volit, neboť jezávislá na rozdílu skutečnosti a testované hypotézy.

Chyba prvniho a druhého druhu

K ověření určité hypotézy lze často volit několik testlL Jedním z hlavních kritérií provolbu testu je požadavek minimalizace chyby druhého druhu při stejné chybě prvního druhu.ěkdy se místo (J používá veličina 1- (J, ta značí pravděpodobnost, že zamítneme

ověřovanou hypotézu v případě, že je nepravdivá. Tato pravděpodobnost sc nazývá síla testu.Považujemc za lepší ten test, který pří stejně veliké chybě prvního druhu má větší sílu.

K chybě prvního druhu dochází tehdy, zamítneme-Ii hypotézu, která je správná, míroutéto chyby je hladina významnosti a.

Volba hladiny významnosti je složitý úkol, který často nebývá v praktických úloháchsprávně řešen. Převládá hledisko statistické, kdy se hladina významnosti voli nejčastěji jako0,10; 0,05; 0,025; 0,0 I. Stanovení hladiny významnosti by mělo být provedeno na základě

ekonomického rozboru řešeného problému. Při testováni statistických hypotéz existuji dvě

rizika, dopouštíme se dvou druhů chyb.

Jestliže je ověřovanáhypotéza správná, pak každá hladina významnosti vede k určité výšivadného závěru, kdy ověřovanou hypotézu nesprávně zamítneme. Mírou velíkostí této chybyje hladina významností a . Čím bude hladina významnosti menší, tím bude í menší velikosttohoto vadného závěru. To ovšcm neznamená, že můžeme velikost hladíny významnostilibovolně snižovat. S poklesem tohoto rizika rostc rizíko druhé, kdy ověřovanou hypotézunezamítneme, i přestože bychom tak měli učinit.

Ho: P = 0,5

H, :pr-0,5

a = 0,05

x _~=05393t - - - ,- n 280 5586

196 O0299 = O, ,t - O50+, .,1/ - , 299-04414. tel't = 0,50 _1,96.0,0 -, 4 05586; 00) hyp<lII ' (-<x,-0441 v ,

neleži v kritické oblasti , .' _ O05Vy'běrová hodnota I I dině významnostI a -, .

, mítnout na \a. \. _ O5 nemáme pravo za , "''''. x= 15

Ho· TJ - , . ·ku zvollme počet vys~,.-haraktenstl

když za testovOu cStejný závěr nastane,

I Pravit na tvar: (132)Základni vztah ze u .

PlS _ kCJ(t) > f > S+ kCJ(f)1 = a . ,Této veličině set , h mí kritiCkoU mC7.· h

, + kCJ(t) představuji doln. a o v' oblasti uvcdené ve vzla uVcličiny 9 - kCJ(t) a S J tližc výběrová hodnota leZl ': odlišnou od parametru S

. , ká hodnota. es 'ku t za význanlUe itámečasto řiká k':lt'c vy'běrovou charakteristl, ři adě ověřovanou hypotézu zam .( 13 2) povazujeme ') a v takovem P p

. , ě vokáme žc ie významna N 'ákladě dřivějšich(zkráccn n " . 'v ., rativním připadu. a z Náhodně

, ' ukážeme jeste na Ilust "(ho jevu rovnoU Po· .Postup při testovalU d'podobnost výskytu urCI e I xkra't Chceme ověřit

kl'ďme prav e , . v nasta .informaci předp~. a: k ntrole a zjistime, že hodnoceny ~e hypotézou bude HI: P r- Po·vybereme n vehcm e.

Oted Ho: P = Po· Alternat,lVOl 'charakteristiky, toU bude

hypotézu vzhledem k Po:, ~okem je výběr vhodne testove rostou shodu výběrov~Stanovime a = 0,05. Dal~~m, hypotézy nelze požadovat ;:~em. Odchylka výběrove

Č 't K overenl , ' 'etnostl) s pararelativní etnoS. v m případě relatlvm c , 'mimuti musí mítcharakteristiky (v nase , I. v' a proto rozhodnutI o za

l ) ěv 'hodna ve .cma, 'bě '~. _ P je rovn z na ,kud odchylka vy rove

hodnoty n o ov h otézu zam.tneme, po, akter Overovanou yp

pravděpodobno stm ch~nam~á. , vo cicharakteristiky bude vy I daný jev nastal 151krat. Lze fl ,

v 280 pokusech s e ov, P -05 azeve OS?

Přepoldádejme, ze. 0,- , zd'l í o parametru P=Po = , ., 'd o výběr z binomlckeho ro e en ,základě centrálnizej e k měřem lze na ,

v = 0,5 a byl proveden dostate

, le~ovat nonnálni rozděleOlVzhledem k tomu, ze Po . (ka bude prakt.cky s é

, 'běrová charakterlS I ro stanovenlímitní věty říci, ze vy {x) ~q _ ~,5. 0,5 = 0,0299 . Proto P

d hylkou - = - - 280 k edení testuse směrodatnou o cnn v I 96 Přistoupíme prov

. k roven hodnote , .. t významnostt

a = 0,05. bude koenc.en

170

Page 85: Statistika skripta

(13.6)

Jl = Ilo

II '" JloI1 I> lu (11-1).

II = Ilo

II '" JlojllO>lI u I,,

stupňů volnosti a a = 0,05 nalézáme krilickou

Jl ?: Ilo

II < Jlo

U<IIu'

Jl " IloJl O> Ilo

u> ua >

H'o'H', '

Kritický obor:

2 Test parametru II n 'onnalního rozděleni

Zpravidla není' .. ~--znama smě rl '

podmink ro atna odchylka .y pro studentovsk'" a zakladniho soub 'K t ou vehclI\u I = x - Jl 1- oru, JSou tak spl •

estu musím t d --'\ill -I kt 'b nenye e y znát výběrový průměr .:.' .• ' era ude testovou eharakterist'kH .."b.~. . ' w.

o : Jl < u smerodatnou odchylk

H' -Ilo O> us,I . II - Jlo

Kr' . Jl O> JloItlcký obor' I Jl < Jlo.001'u(I1-I) , 1 <I'u(I1-1)

Jestliže' . 'char k ' Je znama srn' da tenstikou je no e~o atná odchylkrmovana vcli.' a a v základnl'mx _ cma /I ve tvaru: souboru, pak testovou

/I = -.11 =x.,.-II~ a(~).ji;

Ověřovanou h .nesplnil svoji zárukypotezu nemáme tedy ,bylo rozhodnuto po~r~:~~:: ~~dzdá, že,roz~r;~~k:;~~~ut, nelze tedy říci že d dnocem B 10 noty od panm ' o avatel

Na základě 26 •• Y provedeno dalšieh d etl"';' Je dosti vysok'

O

• mereni byla '.. eset analyz y,

pet byla' zJlstena no' '.nemáme vypoetena veličina X' _ 2 va vyberová směrodatná odtedy opět právo ov" - 8,67, Z tabulek od" chylka s = O00525erovanou hy oté . ectena kritick' "

Je zde třeba' p zu zalmtnout Přístroj byl • a hodnota je 37,7;

hypotézu d" upozormt na to • prevzatpo an z' ' ze tesl uel-o podmínkách t amltnout, šlo b o ze opakovat tak dlouh •

rozhodnout estu, tj především :dPOV~~e~ulacl. Před testován~' az se .nám ověřovanoune stanovit hladmu vÝz: Je treba rozhodnoutamnostl, a pak striktně

Určíme teslovou charakteristiku X':

X' =flS' =~6. 0,00530'(J' 0,005' - = 17,98.

V tabulce přiloh 4hodnotu X' lIS) Y pro 16 -I = 15

0,05 \ = 25,0,

(13.5)

(13.4)

x' < X~_a(n- I), X' O> X~(l/- I),,X' <X' .(n- I).,- -,

(51. ~ O'~

aJ. >a'lox' O> X~ (n - I) ,

Z formulace úlohy se jedná o jednostranný test a buden1e jej formulovat jako:

Ho:

H,:Kritický obor:

D"'..... mm"'i', " ,1<0"" dod'"'"'''' ,,,,mj. .-.~"' ~••d"""",,,,,,,,", i' "". P,'" N' ",,'ol' " W'''' hy" ,j""'" ~ ''''00'' ,,­směrodatnéodchylky s=' 0,00530. Dodr'íel dodavatel svoji záruku?

Příklad 13.1 Test směrodatné odchylky (J nonnáln\ho rozděleni

Ho' a =' 0,005

řl \ : (J O> 0,005

ex =' 0,05

,.."" _d", ",,,,", • ,Iod'i' ..,..'o, "odě''"' •.,- ,oj",,,",, """, .;,

, ' ..... ns'l"'"'" .."'''' "''',.. -t ,Iod'i"-~' ," .'0-' ••'0' "" ..,". "'" "'".~(J,

,"'"'''' m ,..~OO""."...,"" o,"" " • o, "",,", _,,~'''', ••moW ",,,,,.i' ire

veličiny, které ziskáme z výběru. Dále půjde o jednu z alternativ'

I. Test velikosti roz t I rl a směrodatné odch Ik a

L(.9) =' 13(8) .

13,2 l'a,'ametrieké testy nejpouživanějšiCh statistických hYI'O

téz

Ve statistické přejimce se místo silofunkce používá funkce:

o,...."."•.""..,'"i' ".>~o', ob"'" ~"."", ","'mky,,- " k o, ",,'m'

v kapitole 15 věnované statistické přejimce.

Této funkci se řiká operativní charakteristika, která udává pravděpodobnost",mm'm." ('~'i"') hy,",'" H. ,.., ",", ""'""" ",mmctm , Z "'" d,,,"'re i'

zřejmé, že plati:

171

172

Page 86: Statistika skripta

Příklad 13.2 Test parametru II nonnálního rozdělení

F' _ S;22 ---

\.""

1'>1', 'u (", - I, ", - I).

0,,0' (14,9) = 3,026.

Test 'ova charakteristika:

Kritický ubor

flo :

fl·, .

Ho: 0", c: 0"2

fJ·I .Ul <U2

a =0,05

28,11'15­F=_ 1420,49' 10 = 1,815,---

9

a l2 = U

22

a 2;t. a 2

T t 2

estová charakteristika: F max(j" ..')3 =':--_L'\2

Kritický obor' mines,",~zro 1·' F>F('zptyus'l" 3 al1-1n"_1)

. , n rozsah výběru u souboru ' -. ' kde n'je rozsah výbén • "Příklad 13.3 s menSlm rozptylem. I u vets'ho

Testován' h~----l..bQd.v rozptyl·

P" - - U u nQimálních rozděl 'n chloraci k I' em

d yselny ky ,pro ukt NCI p, anurove na di hl .

.1' osud te zda k r ' c Onzokyanurprovedeno JOměřeni, P;i pH=3o~:al;i jeho mnOžstvi je záVis~~ ::d~ Vzniká jako nežádoucí

- ' y o provedeno 15 mě' , , P reakce. PIi pH=2 8 b I':',. =194,75mgl/ _ renJ.Z,skanYbylytytOvýsledk'. yox ~-2~49.n y

,,o =225,65 mg1/ n". =10s"o = 28,11 mgI I

Posuďte, zda obsah aktivního chlóru v bělicím roztoku vyhovuje předepsané hodnotě

35,5 gll. Bylo provedeno 17 analYz. Z jejich vysledků byl vypočten průměr X= 34,9 a

směrodatná odchylka s = 1,3 5 .

Pokud obsah chlóru v bělicím roztoku vyhovuje technologickym podmínkám, a my jejvyměníme, dojde ke ztrátě. Ke ztrátě (zejména na kvalitě produktu) dojde i tehdy, jestlížeroztok měl bYt vyměněn, ale my jsme jej nevyměníli. Toto jsou podmínky pro stanoveníhladiny vyznamnosti a. Zde se spokojíme se statistickym hlediskem a zvolíme a = 0,05 . Test

proběhne takto:

Z logiky úlohy vyplYvá, že na místě by byl jednostranny test. V takovém případě bychomvzhledem ke způsobu tabelace veličiny 1 muselí hledat kritickou hodnotu pro dvojnásobnouhladínu významností, tedy pro a = 0,10. Krítícká hodnota je v tomto případě rovna 1,75.

Vidíme, že je vypočtená hodnota v absolutní hodnotě vyšší než kritická hodnota, leží tedyv krítické oblastí, a proto ověřovanou hypotézu musíme zamítnout.

Protože vypočtená hodnota 1 je v absolutní hodnotě menší než kritická hodnota,ověřovanou hypotézu nelze zamítnout.

Ho :1"=35,5

H, :1">,35,5

a = 0,05

1 = 34,9 - 35,5 -56 = -1 7781,35 '

100,(16) = 2,12.

Z této úlohy vídíme, že hladína významnosti hraje při testování statistických hypotézvýznamnou rolí a měli bychom jí věnovat patřičnou pozornost. Vídime též, že jednostrannýtest lze převést na dvoustranný a naopak, a to stanovením velikostí hladiny významnosti.

že došlo k růstu

nemáme pr'avo zamitnout,

nelze tedy tvrdit,

Ověřovanou h 'variabilit b Ypotezu

y o sahu Nel,.

4. Thst rovnosti prům' •eru /Jl$2 u "

T' , - - normA!mho rQ?dělení, ato uloha patří '. ~Jako JSou ú mezI ne)POužíva ".,od dvo pravy technOlogického ne)S1 testy, protože dovol .

u dOdavatelů apod procesu, kvalita práce d u)e Porovnávat dvě alt '. ve VOU srněnác11 h crnatlvy

Jestliže ' . v odnost surovinyrov mame výběry

~ost mezi roz tl' ze dvou soubon. kter' .

"Yužít k testu stu:e;'t~v~~~~dv~lc~.soubon, áo se ~:~~~~ít~~rmální rOzdělení a ve ktcrý I 'ICmU I ve lvaru: em o rovnosti rozpt I') c J )e

y II , pak lze

3. Test hypotézy o rovnosti rozl1tylů normálnich rozděleni

Jsou dány dva soubory, které sledují normálni rozdělení. Z prvniho je vzat výběr

o rozsahu "" ze druhého výběr O rozsahu ", a jsou vypočteny výběrové rozptyly. Tím jsou

splněny podmínky pro to, aby každá z velíčin sledovala rozdělení X' a tak za předpokladu

rovnosti rozptylů v základním souboru bude testovou charakteristikou veličína F:

174

175

Page 87: Statistika skripta

_!!J!!L .111+ 112

5. Le-'i!-paramet .ru tJ bmomického rozděleni

Jestliže ve vy'b' --

hemsvrace'·

odnotll pr d' 111m Je počet vy' k o, . av epodobnosti b" s ytu sledovaného'ktere JSou vymezeny tvaremP momlckého rozděleni podle testo !eVll x

o, pak lze testovatvych charakteristik " F

I' 2'

Varianty tohoto testu jsou:

Ho: fl, <; fl, JI, ~ fl,

H, : Jl, > Jl, Jl, < p,Kritický oboe I > I," (II, + II, - 2), I < -I,. (II, + ll, - 2),

fl, ~ p,

fl, 7' fl,\ f \ > 1.(11, + II, - 2). F; = (II-Xo)Po

(Xo +1)(1- Po) .

(13.10)

(1311)

P= Po

p7' Po

F < 1, F--~(VI'V')',

I~ > I~ (v" v4 ).,

P~Po

P<Po

",>F(v v)tl J' 4 >

PSPo

p> Po

Pro o •ruzne varianty testů plati:

H'o·

H,:

Kritický obor: F, < I_I';. (v" v,)'

Počty st 'oupnu volnosť ", pn stanoveni kritického b .v -2( O oruJSOll:

,- ll-x + 1)o ,v2 ::: 2xo'v, = 2(x +1)o ,

v4 =2(/I-x)o .

Příklad 13.5 Test parametru b'p lOomického rozděl 'S k' em

akci :0 oJe~ost s určitým výrobke ., 20 zakazníků br' ,10 V mmulém obd b' ,vyrobkem, když relativ~ ~~t~~s: u~kazníci Spokojeni

O

~~[II~i:a urokvni 30%. Při dotazovac'azuJe na 20%? spo oJenost s hodn ,I

Ho: P ~ 0,30 ocenym

H, :p<0,30a = 0,05

F _ (n-x)p, _ 0-"-__ (20 - 4).0 3(x +1)(1 - -- 'v _2(0 -Po) (4+1)(07) =1,37,

,- xo+I)=IO '1'~,,,,(l0;32)=2,14: v, =2(II-Xo)=32,

(13.8)

(13.7)

~~28615 + 10 '

225,65-194,76

I ~ -~i8,11' +1020,49'

~- 15+10-2

Počty stupňů volnosti jsou v, ~ ", -1, v, ~ /1, -1 . Pro uvedenou veličinu t se stana';

kritická hodnota podle vztahu:

t= Xl -x~ ) kdeSd

fl o : fl, ~ fl,

ll, : Jl, 7' fl,a ~ 0,05

V připadě, že neni splněn předpoklad rovnosti rozptylů v základnich souborech, musime

se spokojit s přibližným testem. Testovou charakteristikou je veličina:

Protože 10,,,(23) ~ 2,074, ověřovanou hypotézu jsme nucení zamitnout, a to pro

jednostranný test. pH reakce má vliv na obsah nežádoucího produktu.

Na základě dat přikladu 13.3 rozhodněte, zda při změně pH reakce vzniká stejné

množství nežádoucího produktu Nel,. Rovnost rozptylů nebyla zamítnuta.

Přiklad 13.4 Ověření rovnosti průměrů v normálnim rozdělení

Předpoklad rovnosti průměrů zamítáme, platí-li nerovnost I> I•.

176

PrOložeF _došl ' - 1,37 < F (10o ke sn" , 0.",32) = 2 04 o ě"lZem spok . ) v rovanou h 'oJenosti s hodnoceny" ypotezll nezamitáme I ""10 vyrobkem. ' ne ze nel, že

t77

Page 88: Statistika skripta

1x- -,10 r 32 - 50 .-

1/ = -_.- vtl =--../40 = -2 27.1 50 '

},o

U O,95 =-1,645.

2 - •X = 2nxA =2.40.32.0,02=51,2.

H, :A.>A.oa = 0,05

IHo : A. 5 ,t = . = O02

" 50 '

Ověřovanou hypotézu zamítáme, došlo ke zkrácení čekání u pokladny. K témuž závěru

dospějeme i využítím centrální límitní věty, jak je uvedeno na pravé straně výpočtu.

J, ;é ,,1.0

X' > X:.~ (2n'x) ,,, < X' 2(nx + 1) .X a

Ho:

H,:Kritický obor:

p' novarozdě\ení .Test parametru J,,- OISSO . o l' .t ou charakteristikou je6. . o'dk' 'h jevu es ov ,

" oblastI n yc' ť počet měřem a. 'znam při posuzovam v' . dřuje rozsah výběru, j.

Test ma vy . dělení X' kde n VYP'o' A. která sleduje roz '

velrcma 2n o' , o ledovaného jevu.xpruměrný počet vyskytu s

, A. " J,oA. 5 "'o.1>,,1.0 ,,1.<,,1.0., , X' 2(nx + 1) ,1 '(2nx) X > "X < XI-a '

A. poissonova .ug,lělení ,Příklad 136 I!,st parametru ~ o o o 2 vady. Bylo kontrolov~n~

" ' že na výrobku jsou prumerne v' robek). Došlo ke zhorsemd 10' obdobl je znamo, d (233 vady na jeden Y

Za e.s' Ikem se objevilo 70 va ,30 výrobku a cekvality výrobkU?

(13.!2)X(n) - X

ll" =----..\'x

Ho: jdeo výběr z N(x,lJ.a')

H, : 11(1) resp. 11(0) nepocházi z N(x,Jl,a')

a = 0,05

Kritický obor: "(1) > u. (n) nebo "lo) > 1/. (n).

Postup testu bude následujicí:

Příklad 13.8 Test odlehlého pozorováni

Ověřovanou hypotézu zamítáme pokud velíčina u(I) či "lo) překročí krítickou hodnotu

". (n). Pro hladínu významnosti a = 0,05 jsou tyto kritické hodnoty uvedeny v přiloze 4.

V provedeném náhodném výběru zjístíme pruměr, výběrovou směrodatnou odchylku,dále pak nejmenší hodnotu X(I) a nejvčtší hodnotu x(o)' Testovou charakteristikou bude:

V praxí se stává, že dochází k chybám, které nejsou důsledkem působení náhody. Tatoskutečnost se muže projevít výskytem extrémní hodnoty jako důsledku poruchy měřicího

zařízení čí náhlé změny podmínek v náhodném procesu. Je třeba najít objektívní postup prorozhodnutí, zda máme právo takovou hodnotu vyloučit z dalšího zpracování.

8. Test výskytu extrémní hodnoty ve výběru z normálního rozděleni

X' > X~(2n).2

A. = J,o

A. ;é ,,1.0

X' «~(2n),2

dříci, že došlo k poklesu

zamitnout; nelze te Y

J, " ,,1.0

A. < "oX' > X~(2n),

Ho:

H,:Kritický obor:

H A. 52o .

JI, :J,>2a = 0,05X' = 2nA.o = 2.30.2 = 120,

- '(140)-11366X;.• (2nx) = XO,95 - ,

, nemáme právoOvěřovanou hypotezuo

. 'běny'ch výrobku.kvalrty vyraoonenciálniho rozdělení -,

7 Test parametru A. ex_ t vou charakteristiku 2nx,'1l'I h a opírá se o tes o 'ho

žívá v oblasti hromadné obs u Y ... 0těná pruměrnádoba hodnoceneTest se vyu . 0et sledování a x ZjlS

, 'kdenjepoCkterá sleduje rozdčlem X ' ')

, d ěma poruchamIjevu (doba mezI v

A. 5 "oA. > A.o

X' < X~ • (2n) ,

"1 'h rozdčleníA. exponencla m o· , ravě

Příklad 13.7 Test param\1!J.1 o okladny byla '50 sekund. ~~k~~i?, b' kání zákazníku ve fro~te u

kP d Došlo ke zkráceni doby

Průmčma do a c~ 'k 'kU klesla na,2 se un .pokladny při hodnocem 40 za azOl

\18

. Bylo provedeno 10 zkoušek obsahu vody v koksu z jedné dodávky při výrobě karbiduvapniku. Bylo ověřeno, že uvedený znak sleduje normálni rozdělení. Byly zjištěny tyto~sledkY:15,23; 15,67; 14,99; 15,02; 15,21; 14,98; 16,08; 14,89; 15,02; 15,11. Zdá se,ze hOdnota 16,08 vybočuje ze souboru hodnot svou velikostí. Ověříme, že patří do získaného

J79

Page 89: Statistika skripta

O'(z) = __I _ _ 1.,fi/- i -77 = 0,3780,z= ~In l,:1-r = ~In ~0,60

2 I-r 2 1--=06931-0,60 ' ,

zo,,, =' 1,96,0,3780 =' 0,7409.

Všechny rr" ,I vananty shza:,:,ít~out. Závislost mezí odně ,konstatují, že hypotézu .me"em nestačí k tomu ab z~oun,l,anymí veličinami bud' ,Ho. p='O nemáme právo

, yc om JI mohli prokázat neexistuje nebo náš ome 'lOT ' zeny počet

, est shody rozdělení

16,08 -15,2211 _ - = 2,429 > 11 00,(10) = 2,2940,3541 '

Lze tedy konstatovat, že hodnota 16,08 je odlehlým pozorovánim, a proto ji mtlžeme

z dalšího zpracovaní vyloučit.

souboru. Ze souboru dat byl vypočten průměr x= 15,22 a výběrova směrodatná odchylka

s = 0,3541. Vypočteme testovOu charakteristiku:

(13.15)

(13,16)

Tato velíčina sledu'intervalů Je rozdělení X' s v =' k - 'ožud ' p počet parametrů ověřovanéh p -I stupm volnosti kde k ' "p avkem, aby součet zjišt' 'h o typu rozdělení. Další jed' VYJadruJe početstejný a byl roven celk ' enyc četností (tl,) a součet en stupeň volnosti se ztrácírozvedením do tvaru ovemu počtu 11, Na základě tohoto • vyrovnaných četností (tl,) bylpozadavku lze vztah (13 15)' ,upravit

Ve většině aplikací •velíčína sleduje urč't' pravdepodobnostních metočetnostmí I e rozdělení. Tento' d v praxí předpoklád' '

M

' a vyrovnanýmí četnost 'b d predpoklad je nutné o ,,' ame, ze náhodnáuSlme objekt' • ml u e exíst vent Mezi~~ay: řeS" "'::::'~O::hoW;' "~'"' roW?;~=;~,,":::;ťči~.o ....,::;"".;::;r.:::'

mrrnov-Kolmo • ou postupu, Prvním ' o I. Zadaná úloha

vyrovnávání naměřených g~:~;~~uvč' t~stem dobré Přiléh1~0:~ar~lIlův test dobré ShOd~ea) Test dob ' h Ul' Itym pravděpodobnostním ro~děl~~~mJe třetí krok při

-'-"ll..\!Q!l,!:!re~s~o!!Jdy.y .

Testovou charakteristik 'ou Je veličina:

~ ~l., - tl,,)'L... X',1::\ II

"

(1313)

(13,14)

I 1+ rz =-ln­

2 I-r

Další možností je Fisherova transfonnace na veličinu z podle předpisu:1=-/ ~.

1- r'

Jínou testovOu charakteristikou je studentovská veličina 1 ve tvaru:

o této veličině bylo pojednáno v kapitole o statistickém odhadu. Protože rozptyl tétoveličiny závisi pouze na počtu měřeni a veličina z sleduje nonnálni rozděleni, lze ji snadno

použít k ověření testu Ho: p = O,

Korelačni koeficient je mírou těsnosti zavislosti při linearním vyrovnání. Testujemehypotézu, že je roven nule, tedy p = O. Jde o případ, kdy neexistuje lineární závislost mezizkoumanými veličinami. Zde je možné použít několík testových charakteristik. Nejjednoduššípřípad je ten, kdy jsou tabelovány přimo kritické hodnoty korelačnich koeficientů ra(v)Gsou

součástí statistických programů a jsou též uvedeny v příloze 4), pak testoVOu charakteristikouje přímo korelační koeficient r, Počel stupňů volnosti je pro vyrovnání přímkou (11- 2), provyrovnání rovinou (11- 3), (odečítáme tolik stupňů volnosti, kolik regresních koeficíentůobsahuje soustava nonnálních rovnic, Je třeba zdůraznit, že jde o lineární vyrovnání).

9. Test významnosti kOlelačniho koeficientu P

Na základě 10 měření bylo zjištěno, že korelační koeficient ,,= 0,60, Lze považovat

zkoumané veličiny za lineárně nezávislé? K řešeni použijeme popsané tří možnosti,

Příklad \3,9 Tesl korelačniho koeficientu 0=0

Ho:P=O

H,: p*Oa = 0,05

r =0,60,

"0,05 (8) = 0,63 19 ,

r ,-- 060 fOt=.fi -.Jtl- 2 = R' '18=2,\2\_,,' ,1-060', ,

t0,05 (8) = 2,3060 ,

zadaného

181

ISO

Page 90: Statistika skripta

, I Tesl shody rozděleníPříklad 1.>\ vo d 13 10 v labulce\3.2.

. ázán na datech pnkla u .Postup testu Je uk

Tohoto testu se používá předevšim při porovnání úrovní ve dvou variantách, kteréoznačíme jako A a B. Ziskané hodnoty se seřadí podle velikosti, a pak se jim podle pořadí

přiřadí označení varianty, tedy A nebo H. Délka série je počet stejného označení v pořadí

hOdnot seřazených podle velikosti. Maximální délka séríe pak představuje maximální početstejného označení za sebou pro dané hodnoty. Jíným kritériem je počet sérií, čímž se rozumíPOČet změn označeni variant pro danou řadu údajů. Pro uvedená kritéria jsou tabeloványkritické hodnoty Gsou uvedeny v příloze 5). Tyto hodnoty jsou stanoveny na základěkombinatorického přístupu k řešeni. Pravděpodobnost počtu sél;í pro A se stanovi podleVztahu:

I. Počet sérií a délka série jako testové kritérium

Neparametrické postupy zaručují, že chyba prvniho druhu nepřekročí stanovenou úroveň

bez ohledu na typ pravděpodobnostního rozdělení, na druhé straně tyto testy mají menší siluve srovnání s parametrickými. Neparametrické testy využívají k rozhodováni veličin jako jsoumedián, pořadí hodnot a další veličiny přímo nesvázané s parametry určitého rozděleni.

Protože nám jde především o možnost objektivního hodnocení náhodných jevů, ukážemezde významné postupy z oblasti neparametrických testů bez ohledu na jejich přesné důkazy.

Tabulka 13.2 0věřenllli>rmality rozdl'lem

x'" ll",Ktllnulativní I';,(x) F(x) Ió I

četnost

22,5 4 4 0,0455 0,0630 0,017524,S 11 15 0,1705 0,1446 0,025926,5 10 25 0,2841 0,2776 0,008528,5 14 39 0,4432 0,4522 0,009030,5 22 61 0,6932 0,6368 0,056432,5 13 74 0,8409 0,7039 0,1370 maximum34,5 5 79 0,8977 0,9032 0,005536,5 3 82 0,9318 0,9616 0,029838,5 3 85 0,9659 0,9875 0,021642,5 3 88 1,0000 1,0000 0,0000

1,358Do os (88) = 100 = 0,1448 .

. ,,88

Protože maximálni hodnota rozdílu je rovna 0,1370, což je menši než kritická hodnota,nemáme důvod k zamitnuti hypotézy o modelu normálniho rozděleni.

13.3 Neparametrické testy statistických hypotéz

Statistické testy, které byly uvedeny v předchozí části tohoto učebního tex1u, vyžadovalysplnění některých předpokladů o rozdělení náhodné veličiny, jejíž hodnoty tvoří náhodnývýběr. V mnoha případech o rozděleni náhodné veličiny nemáme dostatek informací, protojsme nuceni použít postupů, které tuto informaci nevyžaduji. Jde o neparametrické postupy.

(13. 11)

3 1 V~l'oč<:lleslu dobré shod'i

••' • 3 proto třiI byly vetSI nez ,

rva u '. átý sloupec., žaduje, aby cctnOs~l. . ři výpočlU použity čtvrly a p

'Uvedeny postup vy • y a prolO tez JSou PI jsOU sdruz.en ,

posledni inte~~a \ poklesl na osm.počel interva u ta °

, (8- 2 - 1) d 1,07 .'_95173- 88 =7,173, Xo,os ,

X - , • kl d normalily nelze zamllnoul.

d.ho leslU vidime, že predpo a

Z prove ene

. . 'běrovou

b)Tesl dobré přiléhavoS1! . J'většihO rozdilu mezI vy

. ni velikostI ne.,' b' ek1ivním posouz~ .' funkce

Tenlo lest SpOCI:~ voJ. hodnotoU dístnbucOl .kumulativní relalivOl celnoSll a

. ik lze zapsal ve tvaruTestoVOu charaklensl u

l. \1' (x)-F(X)\> Da (II)1= a,Ptmax 'll

. lativní relativní četnost, .F.(x) vyjadřujekumu Vv vaného rozdčle11l,

" " 'funkce overo v .... ní 11.F(x) je distribucnl : 'e závíslá na počtu loere .D (II) je krítická hodnola, ktera J v .ření větší než 60 platl:

- " . . říloha 4), pro pocty me: . ké hodnoty jsOU tabelovany (VIZ p 1,628

KlltlC 1,3 58 Do.oI (II > 60) = ~.

1 224 O 05 (II > 60) = $i ,O (II > 60) = ' r: ' o.

0.\ .-"jll

Tabulka I -II'.,

ll"!lv.

flll nr,

tll'. 2,888x, 5,545,54 4 16,852

21,5 4 11 7,188,5407,18 11,71

-i:i,5 11 ~ 10 12,74410 11,71 15,38

25,5 14 29,80314 15,38 16,24

27,5 22 12,22922 16,24 13,82

29,5 13 2,59913 13,82 9,62

31,5 9,62 533,5 5

5,14 9,5183 8,51

35,5 2,27 937,5 3

1,10 95,1733 8839,5 88 88881: . v každém inte.

183

\82

Page 91: Statistika skripta

Ukážeme i využití vztahu (13.18), tedy:

1'(r,,)

(13.18)

Tabulka 13.3

, ěření u varianty A,_ " A představuJe PO:::ěřeniu varianty B,

liB představuJepo _,'e celkoVÝ počet měreru,

II J d' 'počet sérii vananty A,r II ava , .,- ,{ . t pomoci ser.!!

, i dvou vanan - 'dPříklad 13, 12 posouzení shody urovn _ u 'ako u pece B pří výrobě karbl u

d' pece A stejná měrná spO\febú~:j~fso~1uvedeny v tabulce 13 ,3,posuďte, z a Je.u 10 měření pro každou pec.

vápníku, K dispOZICI Je , kWh/k karbidu vá níku

Měrná s otřeba el ktrické ener le v

Tato pravděpodobnostje vysoká (> 0,05), neni tedy opět důvod k zamitnuti ověřované

hypotézy o rovnosti úrovní.

2. Wilcoxonův test průměrného pořadi

Tento test je vhodný v případech porovnání úrovní ve dvou variantách. Zjištěná

pozorování nejprve sestavíme podle velikosti do vzestupné řady, pak každé hodnotě přiřadíme

její pořadí, které označíme symbolem R. Jestliže se objeví stejné hodnoty v obou variantách,tuto dvojici vyloučíme z dalšího hodnocení; stejné hodnoty uvnitř varíant se ponechaji apřiřadí se jim průměrné pořadí, které připadá na tuto skupinu stejných hodnot. V dalším krokuse sečtou pořadí pro jednotlivé varianty, zjisti se tak součet. Vydělenim počtem případů

v příslušné variantě stanovíme průměrné pořadí např. RA = R"

(13.19)(veličina 0,5 představuje korekci na spojitost),li, + 0,5 - ,11(71)

11= O'(~

Kritický obor pro tento test je stejný jako u vztahu (13,6),

Příklad 13.13 Test průměrného pořadí pro velký počet měření

Pokud není k dispozici dostatečný počet měření, který by dovoloval využit centrálnílimitní věty, pak buď existuji tabulky kritíckých hodnot (např, víz lít. (16)) nebo se urči

pravděpodobnosttoho, že součet pořadí hodnot nepřekročí nalezený součet pořadí. K výpočtu

se využije kombinatorický propočet. Tento postup bude ukázán v příkladě 13.14.

Vypočteme testovou charakteristiku podle vztahu (13. ]9):

Pokud existuje dostatečný počet měření, tj, pro 11A = ", > 20 a liB = ", ~ 10, potom

veličina R (průměrné pořad i ze všech měření) v důsledku platnosti centrálni limitní věty

konverguje k nonnálnímu rozdělení, kde,u(lI)= 11+ I a 0"(71)= (11+ 1~1I" a proto pro tento2 12,11,

test lze využít testovou charakteristiku:

104 +OS-~10 ' 2", =------ = O302~21.I0 "

12.10

Jako ukázku postupu pří testu průměrného pořadí využijeme data z příkladu 13. ]2, i kdyžP<>čet měření není dostatečný,

Měřenipec A pecB

3,286 3,292t 3,3022 3,3tO

3,3413 3,357

3,3184 3,288

3,2995 3,315

3,3006 3,324

3,2957 3,312

3,3598 3,291

3,3219 3,328

3,29810 3,31 1

d ořadi podle pecí, 'daJ'ů podle velikosti je tento sle l'

Po sestaveru uBAARAB ,"

A A A B B B B B B A A A A B " tedy dohromady je zde 8 senl,

. . má rovněž 4 sene,, 4 se'rie veltčma B

I'č' A ma ' B) ,Ve 1 lna, "je6 (u varianty , , 'I i délku séfle

ma1timálni de\ka sene , ' tu rovnosti úrovní pro ,::aXl~aJ'~ch máme 20," - ro zam1tnutl tes, ~ v našem pnpa

V příloze S na\ezame, ~ p 'vy'š 14 měřem, protozeol museli mlt naneJ

rovnoU 6 bycho , 1 nezamítáme. , " 'tické hodnotY

ověřovanou hypoteZl , ' použitím kritéría celk~vého P200čtumě~~~:t:lován~tit~j,- dOJdeme I S Zde Je pro é" nenl

Ke stejnému zaveru druhé tabulce přílohy _' -'kladě se vyskytuje 8 s fll,tohoto testu JSOU u,vedeny6

vna hortÚ mezi 1S, ~ nasem pn

počet sérii na dol~1 ~e:1 kladu rovnosti úrovnIdůvod k zamítnuti pre po

185

184

Page 92: Statistika skripta

a proto hypotézu rovn .osn pevností v příčném a

P(A) > 0,5

P(A) '" 0,5

H, :

H,:

neme 3 klad ' kladna znalO'nk3 ne znaky nebo méně se rovn~ h~dn=;:~~:t~~:~t;:;~:ocže ve 20 případech

p =~(2~Jo,s30,sl7 =0,5 20 [(20J +(20J +(20J (20J] ce ve tvaru:TOl 2 + 3 =0,001293.ato pravďi'Odélném smě epodobnost je příliš m ľ

ru zamítáme a a,

3. Znaménkoyj: tesl

Příklad 13 I 5 Z 'namenkory test

, Posuďte, zda a' ,podelném smě ' p plrove tapety maí .ru. Udaje JSou uvedeny v t1b ~teJnou pevnost v tahu (MP )Tabulka 13 15 Z ' u ce 13.15. a, a to v příčném a

. namenkovv test

Jiným jednoduch .znaménkový test P ym neparametrickým testemrozdělení. Ověřo' nnclpem tohoto testu je p' . pro porovnání úrovní ve dvanou hypotézou J'e revest rozdělení náhodne' I'" vou souborech J'e. ve lemy n Ifl' P(A) a a ternativní

o . = 0,5 výskyt náhodn 'h .e o Jevu A .pravděpodobný jako jeho d • Je ~a .daných podmínek steiněJednostranný test, oplnkoveho Jevu fl. '

dvoustranný test.

Výskyt náhodného .znaménkem ll_tl. JestližeJ~VU A označíme znaménkem "+11

bude sledovat binomické r~;~~:nf~~~U!on;krát na sobě ne~á~~s~~do n:~astane t:nto jev, pak. . ' . p ovat, pocel znalO' 'k

Knt.ek' b ene, y o or znaménk 'hznamenek "+" K .. , ove o testu tvoří ....vypočítat z distribn~lcke hodnoty se tabelu'í JJflPad

y,v~d~ je přilíš mnoho ( ., '

op"'bd, n" ,~, fu.'~ bioo_''''éh~.;;;~,~..." .."",. pro ,"bo, ""I" -.,,)e em Postup použítí toh gramu) Lze je téžoto testu bude •.zreJmý

187

VzorekPevnost ve smě

1

příčném podéln~m Znaménko VzorekPevnost ve směru

244,69 44,82 -

příčném podélném Znaménko

344,92 4520

11 49,36 49,82

46,67 4Ú7- 12

4

47,73 48,25-

46,16 46,62- 13

5

48,22 47,81-

46,52 46,55- 14

6

44,71 45,28+

46,93 47,58- 15

7

46,73 4691-

44,04 44,12- 16

8

46,80 46:44-

49,10 48,69v 17

+

l- 9+

47,29 47,32

1046,47 4650

18 48,02 4812-

L... 44,92 45:18- 19 46,31 4Ú2

-- 20 49,67 50,21

-

Vidíme, že

-

nalezmáme 3

V tomto případě máme malý počet měření, a tak nemůžeme využít platnosti centrální

limitní věty. Pokud budeme mít specíálni tabulky kritických hodnot (viz lít. (16)), odečteme_""'00 ....ooW •__o, "",po""'" N~""' ",,,,,,,, "" .. ",,,,,, '.' , ,~,,,.,""" '''',,~, _._ ". ~ "",<podob"'''' """, .. _ ,,,",,' , ...,,,,,,", ~""'Y .,.;b" ,."bM' oj,""" ~'" V ._ .,,,,. j. - • SOOW,.",_"•• ~'" ,,_, m'" n.'''''''''' " """" ..rl.""b i"'"' W"" W,,·)W'''', ,,+,,',. ,,,,",,,, ~Ik"" .-"",b _""",. troj" o ("'l_, j. \~') e "S,

W"" FO""""""'''" j. _ .'- e ','" . p<>kod " "",•• .;w_,ri ,""o ',.'165

pak ověřovanouhypotézu zamítáme.

Tabulka 13.5 Wílcoxonův test průměrnéhopořadi

Měření

Měrná spotřebapořadí

A B A B

1 1,334 1,123 6 1

2 1,145 1,133 9 5

3 1,150 1,128 11 2

4 1,14810

5 1,1293

6 1,1324

7 1,1408

8 1,1387

1:X X 58 6

posuďte, zda došlo ke snižení měrné spotřeby suroviny po úpravě technologického

procesu. Údaje jsOU uvedeny v tabulce 13 .5.

Příklad 13.14 Wilcoxonův test průměrnéhopořadí

Z výsledku je patrné, že hypotézu o rovnosti měrné spotřeby proudu u hodnocených pecínelze zamítnout pro a = 0,05, a to jak v případě jednostranného, tak i dvoustranného testu.

K témuž výsledku vede i použiti speciálnich tabulek kritických hodnot - viz literatura (16).

Tabulka \3.4 Tabulka pořadi měrnýs;lupQ1řebel. proudu"p\"i výrobě karbidu vápniku

MěřeníPec A PecB

1 1 4

2 10 9

3 19 18

4 2 14

5 13 7

6 16 8

7 12 5

8 3 20

9 17 15

10 11 6

1:104 106

186

Page 93: Statistika skripta

y pak urc. me potřeb' ...ne vehcmy pro stan 'S+ =' 13,5 + 13,5 + 12 = 39 ovem testové charakteristiky:

, T, =(1.2.3)3 + 2.34 =42,

Tabulka 13.16 Wí! •coxonuv test p dro vč řady pozorování

Vzorek ,~Zdíl poradI

1v vnosti rozdllů

Vzorek Rozdíl

-0,13v""'vnosli

Poladí

2 -0,28-7 11

rozdílů

3-10 12

-0.46 -15,5

-0,10-0.52

4-5,5 13

-17

5-0,46 -15,5

0.41 13,5

-0,0314 -0.57

6-2 15

-19

7-0,65 -20

-0.18

-0,0816

-8

-40.36

8 0,4117

12

13,5-0.03

9 -0,0318

-2

10-2 19

-0.10 -5,5

-0,26 -9-0.31

20 -0.54-11

Z této tabulk

-18

..(13.20)

Testová charakteristika se opírá o centrální limitni větu a je dána vztahem:

a) určíme rozdíly párových hodnot pro posuzované dvě varíanty,

b) sestavíme pořadí absolutnich hodnot rozdílů hodnot,c) pořadovým hodnotám přiřadíme znaménko jako ve 7.naménk

ovémtestu,

d) zjistíme součet pořadí hodnot stejného znaménka,

e) určíme testovOu charakteristiku.

Obdobou znaménkového testu je Wilcoxonův test pro dvě řady pozorování. Tento test má

""" "" <cl '_""~; T~~oo """""",,,"00 ý' ~'"ho"~"".d<. Uo< ý' '''''rozdílem hodnot údajů stejného znaménka. Výpočet provádime podle tohoto postupu:

4. Wilcoxonův..1est pro d~ řady pozorování

( 1325)

(1327)

( 13.26)

příčném směru

0-'(8+)= 20.2141 4224 - 48 = 716,6,

hypotézu rovnosti pevnosti v pod 'I 'e nem a

)1(S+) = 2021---- = 1054

p •ruměmé p • ď'ora 1]e očividně )1(R) = n + I

2 '

lip; (R) = 11(11 + 1)(2f1 + 1)6 (součet řady čtverci.)

, '

(j (R)=p;-p' = 1l(1l+ 1)(2n + I) (11+1)'61l -- -2- = (11+1)[2(211+1) 3(11+1)]12

u= 39-105..}716,6 = -2,47.

P", n volbě a = O05u pap.rových tapet zam't:I ame.

Dodatek ke 13 ka '. pltole

Určeni mo •mentu průměm 'h 'e o poradí

Jedná se o 'běNechť . vy r bez vraceni 'I ", Je počet měření u ' ,zakladním modelem bu" + ", = II. Součet všech pOřa~;vmho soubom a ll, poče~em~~:~rgeOmetrickérozdělení.

Je součtem arilmetíck' _ d Ol u druhého soubor

(

e.ayodldo ua

8 = fl, + ", )(Il + II I) ll, tedy:__ 2' , + = 1I(1l + I)

2

(13.24)

(13.23)

(13.22)

(13.21 )

je průměr součtukladných hodnot a

1: =' (I, -1) t, (I, + 1),

I,To-'(S+)=':::~~~-~ kde24 48 '

N. ,Al"" dM ,"U." "" =,""''''" o plod.,k"" ro'''"' -- .p',.,,,'''. •,"""" .... Ho''''''' pro "Ý,oó' ~~,i oh'-·"'''''' ý- -"'

v tabulce 13.16.

Příklad 13.16 'b!ílcoxOnův test pro dvě řady pozorgyID:!Í

'(S) 1I.(rI +1).(211 +1) . I č kl d' dO- + _ Je rozpty sou tu a nych ho not.

24

Krii',ký 0>0< Ý' dO' "".,til~ OOM"''"O ,,,,,,,,~l PO"" -"'" ý' ,kW'

v příkladu 13.16.

I, vyjadřuje počet stejných pořadí v í-té skupině.

(S)n(1I + 1)

)1 + ='~4

v,,,,."","".'h"''''''' """ .hodoi "".d<. 00"""",",'"~"" .•1' ,""", •součet čtverců pořadí. Je proto třeba provést korekcí součtu čtvercŮ. Rozptyl určíme jako:

189

188

Page 94: Statistika skripta

(1330)

(13.28)

(II + 1)(11-1) = 11'-=2 .=-~ 12

12 " 'h (druhého) soubonl.• 'rného poradl prvnt o 'd .

Nyní je třeba stanovít průměr ~ rOdzpty~~;:~h~pergeometriCkého rozdělent, te y. . 'běr bez vracem, j e o

Protože se Jedna o vy (13.29)

~ n+\,u(R) = -i ~,

tl- n, _ 0 ~.!:'L = (II + \t'.~.cr'(R)=<:r',~R)-;~- 1211, . 11-\ 1211,,

14. STATISTICKÁ REGULACE VÝROBNÍHO PROCESU

14,1 Princip statistické regulace výrobniho procesu

Jednou ze statistických metod, které se stále více uplatňují v podnikové praxI Jestatistická regulace výrobního procesu. Statistická regulace výrobniho procesu představuje

řizeni výrobního procesu pomoci statístických metod z hlediska přesnosti a ustálenosti.Přesností výrobniho procesu se rozumi schopnost výrobního procesu dodržet technický či

technologický předpis. Tento předpis se týká znaků výrobku, jako je počet vad na výrobku,obsah specifických nečistot v chemíckém výrobku, pevnost vlákna nebo technologickýchparametrů jako teplota či tlak v probíhajíci reakci, výkon výrobniho zařizeni, měrná spotřeba

surovin čí energii, délka bezporuchového provozu výrobního zařizení apod.

Kontrolní otázky a úlohy .,'. .t kroky při testováni statistl,~kých hypotez.

13 I Stručně charaktenzu) e 'h druhu J. ak J. i lze sntZlt? - fJ?. . h ba pIVm o' ., davek a - .

\3.2 Co představuJe:. y "hypotéz byl stanoven poza I d ji exponenciální13.3 Je možné, a~y pn te~~::' 10.7 určete, zda zjíštěné hodnoty s e U ..

13 A Na zaklade dat p ,Kdy J. ej použIJete?d'l ní 'nkovym testem. , .roz e e . , H· ,u = Po zname . t . lé Linka c.l Je

13.5 Jak nahradite te,st hypotezy ';o~nich linek při výr?bě ni~rilu ST JS:a~i~~1 r~zdělení není13.6 posud'te, zda vyko~y ~~?~e:; linka č.2 odporovym dratem. No

vytápěna odporovyll\l e ,

ověřena.

Pro n, = ", platí vztah:

_) tl+\cr'(R =-.12

Výkonv výrobních linekTabulka 13.\7 - _.

VýKonMěření LinKa 1 linKa 2

326 3631

332 3532

358 3193

322 3284

347 3415

356 3216 3377 321

360 3188

330 3549

329 34210

VýKonMěření linKa 1 linKa 2

348 32711

350 3211213 342 342

329 3481415 333 356

351 3201617 344 341

321 32118

352 31519

367 32520

(1331)Ustáleností výrobního procesn (stabilitou) se rozumí schopnosl dodržet výrobni

přesnost po určitou dobu. Je důležité díagnostífikovat existenci poruchy, a pak poznat příčiny

poruch ve stabilitě výrobniho procesu. Na tento proces lze hledět jako na náhodný proces,který probihá za určitých podmínek. Na výsledek výrobního procesu působí dvě skupinyvlivů:

systematické vlivy,náhodné vlivy.

Systematické příčíny (soustavné přičiny) působi na změnu výrobního procesu zpravidlajiž samostatně s dostatečně velkou íntenzitou, působ i znatelnou výchylku znaků, pomocikterých sledujeme výrobní proces. Do této kategorie vlivů patří rozdílná úroveň vedenívýrobního procesu v jednotlivých směnách, rozdílnost kvality surovin od různých dodavatelů,

porucha měřiciho zařízeni apod.

Náhodné příčiny samy o sobě působí prakticky neznatelnou výchylku, jejich působení seprojevuje v jejich velkém počtu. Na vzniklou výchylku hodnocených znaků nelze reagovat,"seřízení" výrobního procesu v takovém případě nemůže odstranít příčinu výchylky, a takzpravidla dochází ke zhoršování stabílity výrobního procesu.

Principem statistické regulace je odlišit působení náhodných vlivů od systematických,charakterizovat stabilitu výrobního procesu pomocí parametrů pravděpodobnostních

rozdělení. Ze statístického hlediska chápeme ustálenost výrobního procesu jako schopnostdodržet parametry pravděpodobnostního rozdělení na konstantní úrovni. Výrobní procespovažujeme za ustálený, jestliže v daném časovém úseku na něj působí pouze náhodné vlívy.V tomto případě říkáme, že proces je pod statistickou kontrolou. Do výrobního procesu sesnažíme provádět zásahy pouze na základě signálu o poruše ve stabilitě výrobniho procesu.

Půjde-Ii o normální rozdělení, pak parametr fl vyjadřuje středni hodnotu sledovanéhoznaku a představuje tak hodnotu, na kterou je výrobní zařízení nastaveno, parametr cr jecharakteristikou variability hodnot a je miron pro výrobní přesnost.

&gulační meze

Základní m nástrojem statístické regulace výrobního procesu je regulační diagram, kterýZpraVIdla obsahuje dvě meze (někdy dvě dvojice mezí, případně jednu mez), ve kterých by

191

190

Page 95: Statistika skripta

. pod statistickou' bní proces Je , e. . " adě že vyro k ..vý alespon zledovaných vehčm v pllP. bniho procesu za uspo .OJI ~zi V praxi.'" ko"~' h,"':,,"%,:.~ '''''''j=~ ,d,běh~ Iko_k~,"'"";~;::~~';'b""mlk"~'",: Z.Wo,,~. Z",,'''"'ho 'O"",", jol~ "'ojl" "~,"~o': ,b" "",'''','ohstatis!lckeho c, I, Iné mit dvě dVOJIce meZI, , i mezemi PředpIS na vose ukázalo Jako uce .. . varovnými regulacmm' druhou dVOJICImezemI, . kmezí lze zapsat Ja o.

Vedle těchto veličin hraje významnou roli ukazMel přesnosti:

(149)

(14.11)

(1412)

regulaci s technickými regulačními mezemi,regulaci s přirozenými regulačními mezemi,regulaci s modifikovanýmí mezemi.

Tento ukazatel vyjadřuje schopnost výrobního zařízení dOdržet toleranci. Pokud je jehohod~" 'om. jol", ",k ",'ob,,' ~,,~" jo ~"" .'o,~ 'o,,,,, '"~"" '~""o jo jolo..~,. "",I "'" jo'''', ",k ~, "ho"" 'od"" <O,,,,"',,, V "'''''< '" jo ]<h" '''~''menši než jedna, pak říkáme, že výrobní zařízení je schopno dOdržet tolerancí lehce. významrovnosti musime brát Poněkud s nadhledem, tedy ne přesně matematicky. V normách [$0řady 9000 se mluví o koeficíentu způsobilosti, který je definován jako:

- -7;, -x x-~)

c =.- --=~- kde (14.10)p ]0' 30"

x vyjadřuje Průměr ze zjištěných průměrů. Pokud hodnota tohoto ukazatele je menší než1,33, proces Se nepovažuje za způsobilý. HOdnota koeficientu způsobílosti 1,33 je sVÝm

",m••". '''~ hod.", IV ~ " " "" """''',,"' j",~";"". ~"~"' ~ 'Ad, ""koeficient způsobilosti byl včtší než 1,67, tato hodnota odpovídá veličině W = 0,60. Podleukazatele přesnosti W rozlišujeme tři druhy statistické regulace, a to při:t. W=l

2. W>l3. W <I

XII = ,u(X)+3u(x),

XD '" ,u(X)-3u(x)

14.2 Technické regulačnímeze

193

Těchto regulačních mezí Použiváme v připadě, kdy výrobní zařízeni je právě schopnodOdržet toleranci a v případě, kdy dochází k najíždění výrobniho zařízení a my Se chceme conejdřive dostat do plánovaných technických parametrů.

Konstrukce technick .ch re ulačnich mezi ro v 'běrové růmě

Pro stanoveni mezí se opřeme o uvedený princip a vztahy (14.1) a (14.2). V mnohýchpřipadech nejsme schopni zajistit normalitu hodnoceného znaku, a proto Se uchylujemek informaci, kterou ziskáme proměřenim n výrobků (vzorků)., snahou je postihnout středníúrOveň VÝroby j její variabilitu, proto k regulaci VYPOčteme výběrový průměr X a výběrovérOZpětí R nebo směrodatnou odcllylku s. Regulační meze pro výběrový Průměr budou mittVar:

Uvedené parametryp(r) a u(x) musíme odhadnout. Naší snahou bude minimaliZovat

"~'-"N' "'- =."', •''''''' ...~ ,'" _Ol ,_ ";;,,, ~ """tOlerančního pole a budeme chtít, aby zařízeni dodrŽOvalo tolerance, proto:

(14.3)

(144)

(141)

(14.2)

(147)

(148)

regulačnich mezí,pak uvnitř

t = jJ.(t) + ku(t) ,

/' = p(t) - ku(l), kdeD

" . mez. horní regulacU! ,I" předstaVUje .

dolní regulačl1l mez; 'ho rozdělení.- ID d' a' kvantil pravděpodobnos U!

k u av 'I '- d' normální rozde eU!,' ak sle uJeJestliže regulova:IY zn

, ,ch podle vztahu.urceny

I = #(1)+30(1),

"~ (,) ~ 'u(" ,", 'o I ,,,"dO,,,",,",,!,I/) _. p " I dnot z deseti tl SIce. To J d hledat mame.

• . tedy leZl 27 10. " ,. hoto stavu bu eme • ,. důleží 9973% případu, n:lm~ na díky náhodě a pnclUu t~, mezi leží alespoň 95 Yo pnpa ,t ho ž~ tat~ výchylkajezPduso echolové rozdělení, pak uVU! r

o , I d e Je novr , , mezePokud veliči?a I s ee~m říkáme akční regnlacm. . odle předpisu:m

imo 5%. Temto m , tvo'r',t i meze varovne p. , 'elne vy

, hto mezi se ukazuje jako velmi uc (14.5)

V'" 'o "" (H,6)ť = jJ.(I) + 2u(t) , ,.

" () h ezl leZl,; ~ p('Hol ' ••, """'''", ,ml.'~~ "jl. znak bude sledovat no: ' 90% případů. I tytoV případě, .že hod~OC~~YJ' ednovrcholového roz elll

" adu V pnpa , , by , t95,45% pnp .' revencí nejakostU! vyro . .. ,. hody bude leze

významnou roh vPOdobnost toho, že v pnpade n;třebnou hodnotuh T stanovit pravděp p hodnot pak určlme pJestliže bychom c ,te ~edem stanovené procento ,

uvnitř regulačních mezI prkvantílu k.

192

'ako' " , ojmy JDruhy regulačních mezI • , v mezit některé důlezlte p

lačních diagramu, muslme yNež ukážeme druhy regu k umaného znaku,

. " stnou mez z o aku" ta udává hOflll pnpu . koumaného zn ,

horní tolerančnímez 1ff ' , "C'I dolní přípustný rozměl z• , T udavaJIdolní toleranelll mez D' 7' + T:

'R D• 'h pole 1: = - '2--střed tolerancm o •

tolerance T = 1;/ -1;,.

Page 96: Statistika skripta

(14.13) Podle uvedeneho principu můžeme psát:

Abychom mohli odhadnout potřebné parametry z technického předpisu, pomáháme siznalostí rozdělení náhodné veličiny w". Jestliže náhodná veličina x sleduje nonnálni

rozdělení pak náhodná veličina w" = !(I). sleduje pro výběr o rozsahu II pravděpodobnostníax

r-) a(x) - ~~, .!,(-x) = 'J~ a a,! = j;, - 6-Jn k' 'egulační meze

h pro techUlc e I

d lze stanovit vzta y. žadavku te Y .

Na základě uvedeneho po

pro průměry ve tvaru· (14 14)

l'l' 1'+~

xH=1~+3~6'-n= o 2.[,"ol (\4.15)

111/ ~ 1'(11)+ 3a(R),ll" = /1(11)- 3a(R)

rozdělení, kdy:

(14.18)

(14.19)

lJ(wJ= d"

a(wJ = d, a odtud:

( 14.20)

(14.21)

Obrázek 14.1

i~.1gl~IJra!!n!!;č<!!u",ic"h,-,m=ezí•. h mezIh Imiekých regulacmC -

Vrta tec -,,(R) = d,a(x),a(lI) = d,a(x)

(14.22)

(14.23)

(14.26)

(14.27)

Hodnoty konstant c" <I" d" ARD , A lIH jsou uvedeny v příloze 6.

Jako důsledek nesymetrie rozdelení výběrového rozpětí a směrodatných odchylek je dolnímez u rozpětí do rozsahu šestí rovna nule, u směrodatných odchylek o rozsahu výběru do pěti

Je dolní mez též rovna nule.

Pokud jde o zahájení výroby a v případě, že ukazatel přesnosti W > I, mluví seo statistické analýze. Pro ní je vhodné uplatnit lento postup:

Na základě předběžné znalosti výrobního procesu a možnostech měření rozhodnemeo délce kontrolního intervalu a rozsahu výběru.

RH =IJ(R)+ 30'(R) =d,a(x) + 3d,a(x) =a(xXd, + 3<1,] =~[d, +3d,] =T .AR1/ (14.24)

TR" =,,(R)-3a(R) =d,a(x)- 3d,a(x) =a(xXd, - 3d,] =-[d, -3d,] =T. ARD (14.25)6

Obdobně postupujeme pří určení techníckých regulačnich mezí pro výběrovou

směrodatnou odchylku, kdy náhodná veličina x sleduje normálni rozdělení, platí (vizrozdělení výběrových směrodatných odchylek):

Hodnoty konstant pro daný rozsah výběru jsou uvedeny v přiloze 6. Nyni již ml,žemestanovit vztahy pro výpočet regulačnich mezí pro výběrová rozpětí:

(14 \61

T T2-lTn

I T

NT2.Jfi ._0-

..fn.._0- _.0--

. • _0-_0'-

~ -----.-"_"-

To lTn

~ T T2-lTn

XIl

Tll -- _0_-

1

• a přlpad.• ' eze azn h

• . .sou užši než tolerancm ~nočet technickYc. atrné že regulacm ~eze J též zřejmé, že pro vyp

Z obrázku 14 I ~~: .edn~tlivých měř~nl Je neboť platikdy reguluJeme, po.. J oužit tolerančl\l meze,

I . 'Ich mezI muzeme pregu acn

(T T j=1' _~(1- ~J,

- T --r: II 2~ oI n )x II = II - 2. 201 /I T ( 1 j

(1' T j=T +- 1- r: .

- -1' + --- r:: D 2 01/1x" -" 2 201/1

195

194

Page 97: Statistika skripta

avery z dIagramu:

Tabulka 14.1 I-:Jodnoty pro regulaci s tl'

-ee 10lckými regul ' ' .

Výběr 1. VZOI'ek

acmml mezemi

1

2. vzorek 3. vzorek 4. vzorek

49,10

-

2 49,5849,10 49,72

x, R

49,5848,54 49,115

, s

349,56

,

50,00 50,9249,56 49,570

1,18 0,417

4 49,6249,52 49,79

0,02

49,6450,058

0,010

5 49,7650,68

1,40

649,94 49,50

49,52 49,8650,526

49,94 48,8649,78 49,745

1,16 0,473

7 49,3649,36

0,44

49,1149,23

0,158

8 50,2450,14 49,81

49,348 1,08

48,9849,605

0,388

9 49,5248,94

1,03

48,9449,54 49,425

0,398

1048,93

1,30

51,30 50,3849,83 49,305

0,527

11 51,2051,18 50,00

0,90

50,0850,715

0,386

12 50,9350,54

1,30

50,4050,30 50,530

0,544

13 48,6050,44

1,12

1449,58 51,38

49,56 50,3330,420

50,84 50,4250,04 49,900

1,37 0,492

15 51,2450,06 50,01

2,78

49,8250,333

1,000

16 49,6651,34 50,26

0,83

50,3850,665

0,333

17 50,6449,58

1,52

49,8250,16 49,945

0,645

18 50,0249,70 50,24

0,80

50,2250,100

0,335

19 51,2550,33 50,45

0,94 0,371

20 49,6551,26 51,20

50,255 0,43

49,8851,25 51,240

0,158

l: X

49,54 49,600,06 0,023

X

49,668

Průměr XX X

0,34 0,129

X X999,718 20,00

X 49,986

7,733

1,000 0,387

Z' -

1'11 = 51,5, To = 48,5 , l' = 3,0 , /I = 4 .ARII = 0,7831, c, = 0,7979, d, = 2,059 , d, = 0,8798.Dle zadání:

Z tabulek odečteme:

pří výrobě tabulek čokolády pro 50 g baleni je stanovena dolní toleranční mez 48,5 g ahorní toleranční mez 51,5 g. Stanovte technické regulační meze a posud'te přesnost výrobního

zařízení na základědvacetí výběrů o rozsahu čtyři.

J'říklad 14.1 Uplatnění techníckýeh regulačníchmezí

2. Na základě znalosti tolerančních mezí sestrojíme technické regulační meze pro průměr a

miru variability (postup u přirozených mezí - viz další text).3. Během kontrolního intervalu odebereme II vzorků (výrobků),které proměříme.4. Vypoč,teme průměr a míru variability (variační rozpětí nebo směrodatnouodchylku).

5. Vypočtené hodnoty zakreslíme do regulačních diagramů.6. Pokud všechny hodnoty leží uvnitř mezí a nevykazují málo pravděpodobnéuskupení (vízdalší text o signálech poruch ve stabilitě výrobního procesu) lze považovat výrobní proces

za ustálený.7. Pokud nějaká hodnota padne za regulační meze, budeme ihned hledat příčinu tohoto

vypadnutí. Pokud ji nalezneme, tylo hodnoty vyloučíme z dalšího zkoumání.8. Máme-li k dispozici 20 až 30 výběrů, zhodnotíme dosavadní průběh výrobního procesu,vypočteme ukazatel přesnosti. Jestliže je roven jedné, pokračujeme v regulací

s techníckými regulačními mezemi, pokud je větší než jedna, přejdeme na přírozenéregulační meze. Je-li ukazatel přesnosti menší než jedna (0,75), můžeme pokračovats modifikovanýmí regulačními mezemi (viz další text).

0,4672

w= 6.0,43283-- = 0,926 < j

I. 19. výběr leži nad h 'směs orm regulační me '. zlprop"ě2. ~~~hvýběr le!í nad horní mezí r . _, rum ry. Byla špatně zhomogenizovaná

ylku. Duvodem bylo ucpántp~i~~~a~~ls~~ZPětí i nad horní mezí pro sm - dProto_ . ero atnou

Uk" ze byla nalezena ·'č·v' azeme varíantu s odhad:~ ma, která byla odstraněna -yběry JSou z odhadu vyloučeny CY z výběrového rozpětí i' s:;,?o~em~ ukazatel přesnosti. ero atne odchylky. Vypadlé

ll. 20,00-0,06-2,78

CY"'--- 18d, - -- 2,059' _. = 0,4630

_ 3 3l 1 jx II = 50 + -r; = 51 5 - - 1- r; '" 50 752,,4 ' 2 ,,4 "

_ 3 3l ljxo = 50 _ r; = 48 5+ - 1- -r; = 49 252,,4 ' 2 ,,4 "

Sll =~(0,7979+30,33671=0,904,6

Určíme regulační meze'.

RII = ~(2,059 + 3.0,87981= 3.0,7831 = 2,349,

6

Rl) = O,

196

197

Page 98: Statistika skripta

h .cké regulační mezeObrázek 14.2 I.e"--!!L..- __

( 14.32)

(14.33)

(14.34)

(/435)

( ) . /Ia N Jako d, _ ,dl

S::.~ X 3 - - == r AI~'.(',,f;í .

HOdnoty konstant c" cl" /1" A, jsoll uvedeny pro rozsah vI'běrulI v pi i/oze 6

P(N)odhadneme jako R,

Hodnoty konstant d" d" D" D, jsou uvedeny v příloze 6.

N _~ I' - 3. -r ~ I' - A, N~

d~vrl .

Varovné meze určime podle vztahů (1428) aL (14.33) s tim rozdílem, Le misto kvantilus hOdnotou tři vezmeme jeho hOdnotu rovnou dVěma

Přirozené regulač~zg pro výběrovou směrodatnou odchylIru

-,

••

-,

••••. ..

••

..~ , -!

•R",~ _Ulu

R '.'." u i •,. .1,1 i

'.4 -1

"u.

x -, , 1

" .• : --~.~.~i_ ...x" : •~').' 1

I,,

(/4 ..16)

(14.37)

jako c, s,c,

11(1') odhadnemc jako s, a(~)

Konstanty c" B" 8 4 jsou uvedeny v příloze 6.

Jestliže je rozsah výběru malý, v dllsledku neSYmetrie rozděleni výběrových rozpětíi rozděleni výběrových směrodatných odchylek, bude dolní mez pro 11<7 u výběrovýchrOZpěti rovna nulc, obdobně u směrodatných odchylek pro II < 6.

~...mi.J!.m.y.1Í.děnlstatistické regulace s přiroz~jmí reguill~nimí mezemj

I Rozhodnemc o délce kontrolniho intervalu a rozsahu výběru.2 Shromáždimc výsledky aJespol1 ze 20 výbčrů.3 SPOčteme a zakreslíme regulační meze.

(1-131)

,. - A .~ ·_·--=x+ 1'\'=x+3 r. C., "1/ /I

-a(x) _Xv =1'(X)-3a(x)=I'(X)-3,j~ -

" ulačnÍ meze . b J' eJ" neznáme,14 3

PřÍrozene I eg I . ky' předpis ne o . . 'be'm' d • t tec lnIC . • třiceti vy. I' 'robni zařízení schopnko d.Os:~~írají o zhodnocení dvaceti azNem- I v~ . lační meze, terc. J'eme přlrozcne regusestrOJu

• . ro pmmilli' • " formace o

]

>řilozené regulacnl mez~p-_ -- . ~ něry podle mQzne to--- • , I mezI pro plUl• '. počtu legulacmc 1Ukilžeme třl mo~nostl vy

variabilitě hodnoccneho znaku (1428)

a(x) _XII = p(x) I 3a(x) = p(x)+3 .7i- - (14.2

9

)

li = ~+A,R==x+3 d ,';;;' - (I~JO)

198

199

Page 99: Statistika skripta

4. Jestliže všechny hodnoty leží uvnítř regulačních meZI, Jsme přípraveni na regulaciv dalším období. Vypočítáme i přesnost výrobniho procesu a zvážíme možnost regulaces technickými regulačnimi mezemi. Pokud nějaké hodnoty padly vně mezí, hledáme jejíchpříčinu. Při nalezení příčiny korigujeme regulační meze a jsme přípraveni na dalšíregulaci. Tento postup neustále opakujeme.

14.3 Kritéria posouzení poruchy stability výrobního procesu

I. Základním kritériem je vypadnutí bodu za regulační meze.2. Leží-Ii dva body za sebou mezi varovnou a akční mezí, je to seskupení málo

pravděpodobné, pravděpodobnost tohoto případu je 0,00052, a proto toto seskupeníbereme jako signál poruchy stability.

3. Řada bodů leží na stejné straně od střední přímky. Bereme seskupeni málopravděpodobná, těmi jsou:

7 bodů ze 7 leží na stejné straně, pravděpodobnost tohoto seskupeni je 0,016,10" 11" 0,012,12 " 14 0,013,14 " 17 0,013,16 " 20 0,012.

4. Podobné kritérium jako třetí plati i pro trend výběrových hodnot.

První dvě kritéria nás upozorní na působení významné, ale sporadické poruchy, třetí ačtvrté poukazuje na nepřetržité působení méně silné poruchy. Podle toho hledáme příčínuporuchy ve stabílitě výrobniho procesu. Podobný rozdíl je ve vypadnutí bodů v díagramu proprůměry od diagramu pro míru variability.

Přiklad 14.2 Uplatnění přirozených regulačních mezi

Při redukci oxidu wolframového na práškový wolfram je jedním z hlavních kvalitativníchukazatelů střední zrnitost výsledného produktu. Tento ukazatel není často plněn. Normazrnítostí je 2,2 mm, menši zrnítost je lepší. Bylo navrženo, aby analýza trvala 28 dní. Údajejsou v tabulce 14.2

Tabulkal4.2 Tabulka zrnitosti wolframu v J. etapě analýzy

Výběr 1. směna 2. směna 3. směna Xi R,1 1,68 2,26 2,11 2,02 0,582 1,90 2,26 1,98 2,05 0,363 2,38 1,98 2,52 2,29 0,544 1,90 1,98 2,26 2,05 0,365 1,68 1,69 1,98 1,78 0,306 1,49 1,90 2,06 1,82 0,577 2,21 2,26 1,64 2,04 0,628 1,80 1,98 1,49 1,76 0,499 1,90 2,06 2,15 2,04 0,2510 2,15 2,92 1,96 2,34 0,9611 2,15 1,79 1,59 1,84 0,5612 1,37 1,68 2,06 1,70 0,69

13 2,1314 1,98 1-r -

152,32 1,90 ,68 1,93

0,452,06 2,38 2,20

16 2,382,06

2,38 2,17 0,4817 3,36

2,602,15 2,38 0,32

18 2,702,52

2,40 2,76 0,45

19 2,452,90

2,25 2,62 0,96

20 2,102,26

2,21 2,310,65

21 2,002,45

2,40 2,32 ~~22 2,50

2,242,90 2,38 0,35

23 1,781,88

2,15 2,18 0,90

24 2,302,10

1,79 1,89 0,62

25 2,382,12

1,73 2,05 0,32

26 1,901,76

1,79 1,98 0,57

27 1,981,79

1,84 1,84 0,62

28 2,262,15

2,15 2,09 0,111,98 0,17r X 2,44 2,23

PniměrX X 0,46

X X 59,03 13,95X 2,108 0,498

Akční meze

XIl 0: 2 108+102- ' , 3 0,498 " 2 617Xo o: 2,108-1023 0498 ' ,R '" o: 1599

II o: 2,574. 0.498 o: 1282' ,Ro 0:0. "

Varovné meze

? II o: 2,108 + (1,023. 20,498)_ o: 2 448

~ 3 ' •x'o o: 2,108 - (1023 0498) 2

, " - o: J 7683 ' .

Dí/či závěr ' d'~-Yz 'agramu na str. 2QZ

Do výběn, 28 .,d 'regulač, ' , Za ny bod neleží d 'bylo II ~ez,' pro Průměry. B I p.o _dol~l regulační mezí ,_

bYlo :~~t~:;~~~~~~~:eá:c~ý po~u~ 7~~t~:~ ~:i~:~ ~~I~ byl' n~~~~:;;':I: :ulš~~e~~~~d ~~ímezI: ramu. Po vylollče' 'b- o • a e

- 59 n, vy eru 17 a J8x o: __,03 -= 2,76 - 2,62

28-2 2,063,

Ro:~5 -0,96-0 6528-2 ' '" 0,475

200

201

Page 100: Statistika skripta

b' k 14 3 Přirozené regulační Inez

eO raze .

37 1,46 1,82TI86 1,713 0,4038 1,40 1,73 1,64 1,590 0,3339 1,35 1,68 1,30 1,443 0,3840 1,33 1,37 1,13 1,277 0,2441 1,34 1,64 1.60 1,527 0,30

•14.5 Modilikované regulačnímeze

Od výběm 30 jakost výrazně vzrostla Je to dllsledek toho, že byla zavedena statistickáregulace na vlhkost vodíku a byla svědomítě sledována rychlost posuvu lodiček. Po ziskánidalších asi desetí měřeni bude provedena korekce mezí. Ty se posunou k lepšlln hodnotám abudou užší.

••

------•

•_O-

--------•

-. - ... . ----. ---.~ .--r- ••;-

---- .---.--.-.- • • 1._, ---- ...----.. .. -----------,--. .

r---"-

X

xll1.62-. ',"Xli

2.11

-, I,nXli

Xo1,60

R

20

o

Jestliže je ukazatel přesnosti W podstatně menši než jedna, pak statistická regulacepomocí přirozených i techníckých regulačnich mezí by byla zbytečně přisná. Stanovují seproto takové regulační meze, aby jejich překročeni znamenalo í nedodrženi technickéhopředpisu, tedy toleranční meze. Hodnota rozdílu mezi regulační a tolerančni mezi závisí navelikosti výbělU n. Hodnota tohoto rozdílu je i základem pro výpočet modífikovaných mezí.

Obrázek 14.4 Modífikované regulačni meze

3S

• • • • • • • • • • • ••••

• •. --r-•••I·"t .. ..• • • • • • • ••• ••• •• •o _

-.,...-- 15, 10

Akční meze

1023 0475 = 2,549,'XII =2,063+, ., 7_ 1023 0475 = 1,57 ,Xv =2,063- , .,

R= 2 574 .0,475 = 1,223.

" '

Varovné meze

X'" =2,387,

x' v =1,739

Tabulka 14.3 Zrnitost wolframového'"ku 2 obdo íras ~ .

-RAm

- -3R ~=A,R-d, dl. ..r;;

3. směna x, R,2. směna

Výběr 1. směna 2,133 0,28

2,26 1,98 2,162,010 0,42

29 2,15 2,15 0,381,73 1,993301,77 2,15 2,06

1,963 0,3331 2,12 1,98 0,3632 1,79

1,47 1,73 1,5230,61

33 1,371,96 1,35 1,610

0,4734 1,52

1,84 1,37 1,6830,26

35 1,841,64 1,90 1,740

36 1,68

202

203

Page 101: Statistika skripta

Základem tohoto diagramu je Poissonovo rozdělení, z něho odhadneme parametry:

Tento diagram je analogícký diagramu pro podíl zmetků, hodnoty jsou stokrát větši:

3. .Regulační díagram pro procento zmetků (P díaWm.lVelikost rozdílu je dána výrazem'.

3R 3R =~R_AlR=i1--Al'LRA"-----,=' d ~d,)d d,-.J n 1 o.

'ov",pak určime ze vztahu.v' eze pro prume, ,

Modifikované regulacm Ol

--. -1' -A R,XII-II III

--. -'1' +A TIx o - D m

. uvedeny v příloze 6.Konstanty Am JSou

(\4.38)

(14.39)

(14.40)

I' = P I· 3 I!!S}.<!o.-:- P2f( ~~. II '

Po = P-3 InlO~=-p) .V n

4. Regulační diagram pro počet vad ve výběru (c diagram)

( 14.45)

(14.46)

(l4.50)

(14.47)

(14.48)

(14.49)

Cf( = c+3..k,

co =c-3.fC.

Hodnotu 11 určime jako průměrný počet vad na výrobku při kontrole II výrobků.

~- "Ull =u+3 -,1/

.~lI D =u-3 -./I

Na účinnost statistické regulace má významný vliv i délka kontrolního intervalu a rozsahvýběru. Existuje řada vzorců, podle kterých se určuji tyto veličiny. Kritériem pro stanovení bymělo být kritérium ekonomické, kdy musime zvážit:

Zkušenosti s uplatněním statistické regulace výrobního procesu v podnicích chemickéhoa Plltravinářského průmyslu jsou takové, že prakticky vždy docházi ke zlepšeni ve výrobnim

205

výši ztrát souvisejících s nekvalitni produkcí,výši nákladů na kontrolu,časové a pracovni možnosti laboratoří,

časovou náročnost analýz spolu se vzorkovánínl.

Vedle uvedených typů regulačních mezi se v praxi vyskytují i regulační diagramy proextrémní hodnoty, diagramy s trendem a další.

Veličina c představuje průměrný počet vad na 1/ kontrolovaných výrobcích (výběru).

Pokud dolní mez vykazuje zápornou hodnotu, stanovime ji rovnou nule.

I tento diagram se opirá o Poissonovo rozdělení, uplatňuje se v mechanických výrobách,ve výrobě vláken apod.

5. Regulační diagram pro počet vad na výrobku (u diagr<!!!Ú

(\44~1

(14.41)

(14.42)

- ?(l- Pl={')+3 .~,PI/ll

- ?(l-Pí.Po=p-3 n

Re ulační dia ram v 'I . " b' mické rozdelenl.

, mezI Je moZákladem pro stanovenI

(np)1/ =IIP+3~P),( ) - n-p - 3f,lp(1 - p),,lip 0-

, časovém intervalu,. 'běru ve stanovenem . o

II Je rozsah vy o v ' dil vadných vyrobku,p vyjadřuje prumerny po

n~-~>9 I.. k rovnou nu e., orná klademe JI pa

Pokud by dolní mez byla zap , .o 'bvru (p diagram)

, 1'0 podíl zmetku ve VY e ze k'terych2 R~'l1lační diagram P- 'h odhadujeme parametry, ředešlel11

- . opět binomické rozdělení, ~e ~~c:~a~ symbolů je stejný jako vpZákladem Je ,Vet regulačních mezI

vyplývají vztahy pro vypOC

případě.

r 'lím 1 . pomocí14.6 Regulace srovnavat . e zabývali statistickou re~u, a~1 regulace

, k pitoly Jsme s I má uplatnem " .V vedchozím textu teto a.. 'Ol Vedle této regu ace. v oblasti řízem Jakosti

vv' I p,rho

znaku - regulací .merem 'které se uplatňují zeJmenament~ n~, Jde o regulačni diagramy,srovnavamm., ' obách . ouživanějšív mechanickych vyl' . v ' .' se omezíme na neJp

b regulacmch mezI'h principu tvor Y

Na základě obe~ne otypy těchto diagramu.

o 'bvru dia ramII. 1'0 očet zmetku ve

204

Page 102: Statistika skripta

. hl dá se včasv ě nezasahuJe, e .

•e se do výrobního procesu :~bytecnímu stavU, zlepší se kvaht~procesu, a to předevšín~pr~l~ ~istí), využijí se I "~oruc\~yr:á:~~~ ale ;e to silný nástroj pnzdroj poruch (a ty ~e o ~. ké regulace nelze p,oJ~mat oobsluhy Uplatně11l ~tatls lC '"1' na řídicím mlSte

" e'm uplatňovánI na praCOV15 1,vcasn

Kontrolní otázky a ÍJ.\Qh)'~ kO

, k rO práci beze zme1'u. " k' m testem. , I h '14 I Stanovte podmm YP ,"' diagramem a stattSUC Y . olyetylenovych a ,Vl.

14.2 Jaký je vztah :ez~~e~~~~~i mcze pro regu\~cI l~:~t:~~~roiovat v půlhodmovych143 Stanovte tec mC 'c 41+1 gram. Bylo roz lO( " o

. Stanovená hmotnost J - ". ' . b" pryžovy'ch vyhsku.• h ' , bko pn vylO e .intervalech 6 la Vl. díl vadných vyro ", "' je známa mformace

144 Určete reglllačni meze pro po 40 kusů. Z předchozlho meslce. 'b" .e stanoven na

Rozsah vy erll J . . - _ 0124.° ěrné zmetkOvItostI TJ - O,o pfllm

206

15. STATISTICKÁ PŘEJÍMKA

15.1 Pojem statistické přejimky

Statistická přejimka představuje významnou metodu využití statistických metod v oblastiřizeni jakosti. Na rozdil od statistické regulace je metodou pasivní, protože pouze konstatujedosažený stav bez aktivniho působeni na zvyšováni jakosti produkce. Jeji efekt spočivá v tom,že dovoluje objektivně posoudit kvalitu výrobni dávky či dodávky, a to nesrovnatelně

hospodárněji než při stoprocentní kontrole. Její úěinnost stoupá v návaznosti na statistickouregulaci výrobního procesu.

Rozvoj metod statistické přejímky je spojen se snahou po zvýšení hospodárnosti kontrolyv hromadných výrobách. Její výrazný rozvoj byl ve válečných letech v oblasti zbrojníhoprůmyslu a potom v dalších prllmyslových oblastech, zejména tam, kde je posouzení jakostiprodukce provázeno destrukčni zkouškou.

Při statistické kontrole hledíme na jednotlivé znaky výrobku jako na náhodné veličiny.

V mechanických výrobách se při kontrole často výrobky třídí na dobré a zmetky. Zde jenáhodnou veličinou veličina, která nabývá buď hodnoty nula nebo jedna. Jedná se tako kontrolu porovnáním. Statístíckou přejimku v této oblasti řadíme do přejímky

porovnáním. Jinou možností je hodnotit znaky výrobku měřitelnými veličinami jakohmotnost výrobku, obsah specifické škodliviny apod. Toto hodnocení vede k přejímce

měřením. Tyto spojité znaky obvykle sledují normální rozdělení.

Statistická přejímka je přejímkou výběrovou a ze statistického hlediska jde o teststatistícké hypotézy, že přejimaná dávka je dobré kvality. Alternatívou je, že to není pravda.Správné uplatnění statistické přejimky je vázáno na splnění dvou základních předpokladll,

kterými jsou:

statistícká homogenita hodnoceného znaku jakosti v kontrolované dávce,statistická stabílita procesu, kterým se vytváři hodnocený výrobek.

Požadavek statistické homogeníty vyjadřuje potřebu, aby kontrolovaná dávka vznikalaza relativně stálých výrobních podmínek a aby tak výrobky pocházely z jednohohomogenního základního souboru charakterizovaného pravděpodobnostním rozdělením,

nejčastěji normálním. Výběr určitého typu pravděpodobnostniho rozdělení je nutným krokemk výběru vhodného testu, ke stanovení vhodné výběrové charakteristiky.

Druhý požadavek není nutný, ale podstatně zvyšuje účinnost statistické přejímky.

Nástrojem statistické přejímky je přejímací plán, který je dán způsobem přejímání

(volbou typu statistické přejímky) a dvojicí čísel, a to rozsahem výběru n a rozhodným číslem

c. Rozhodné číslo je vlastně kritickou hodnou, podle které rozhodujeme o zamítnutí čí

nezamítnutí dávky. Toto rozhodné číslo lze chápat jako přijímací číslo, které je posledníhodnotou, kdy je dávka ještě přijata, nebo zamítací číslo, kterým rozumíme první hodnotu,kdy je dávka zamítnuta. U přejímky porovnáním se přijímací číslo a zamítací číslo lišío Jedníčku.

207

Page 103: Statistika skripta

Pro každý přejímaci plán je jeho významnou částí operativní charakteristika Ta udávápravděpodobnost příjetí dávky pro různé hodnoty znaku, podle kterého dávku přejímáme.

Tato funkce se často ve statistícké přejlmce značí jako L(II,C, 1').

(156)

podmínky pro

mezi dodavatelema odběratelem byly staJloveny

a=0,05;

jJ=OlO, .

Určeni rozsahu "" ,merem a rozhodného čisJa při '"

p, =0,01;

1', = 0,06;

" Pro rychlé použití v ...,speclalní programy P k dPraxl eXIstuJI tabulky pro sta 'P . o u tyto t b Ik novem přejí ,,' h '"o/ssonova rozděl ' b' a u y nemáme I ",' maclc planu exist .. '"ukážeme postu e~, ne o SI sestrojit svůj pro ram' z: vyuzJ[ tabulek distrib~čni Ujl tez:, tobo, že hled:m~:hv~Užití tabulek distribuč~í fun~~~ ,;:,ní příliš obtížné V přiklad~u/;~c~clsla O I o nou hOdnotu ' OISsonova rozd"1 '

, , . , pro Požadavek n pardmetn/ ,{ pro předpoklád ' ,e em Vycházímebudeme hledat pro zadané h d a a a jJ S ohledem na tabelaci Ia~e hodnoty rozhodného

o noty (1_ a) a jJ P 10 not dlstnbuční funkostup bude ", , cePříklad 15 J V' _ "', zrejmy z příkladu J5. J

. vpocet prellmacl'ho I' .panu

. Na základě dohodstatIstIckou přejimku: y

Určete statisticky' ,., ,p/ejIJnacl plán.

Protože máme k d' '.hledat pro zadané d ,'SPOZ'C' tabulku distribuční funkce P .J5.1 po mlOky parametr AP" OISsonova rozd"1 '

. . ostupne ziskané hod' e em bUdemenoty JSou uvedeny v tabulce

Tabulka 15.1

Rozsah výběru 1/ a rozhodné číslo c (zamítací číslo) stanovíme na základě požadavků propřejímání podle dále uvedených vztahů:

J-J o : I' :; 1',

fl, : I' > 1',.

Jak jsme již uvedli, určeni přejímacího plánu (I/,c) je vlastně řešením statístíckého testu:

15.2 Sestavení Ilřejímacího plánu při přejímce porovnánim

Dávky nebo dodávky mají podíl vadných výrobků p. Pokud hodnota tohoto podílu budenizká, dodavatel (výrobce) chce, aby taková dávka byla prakticky vždy přijata. Pokudhodnota podílu zmetků bude vysoká, odběratel požaduje, aby tuto dávku nepřijal. DodavatelI odběratel chtějí ochránit své zájmy, které jsou vlastně protichůdné. Každé rozhodnutí budepřijímáno vždy s určitým rizikem jako důsledek výběrového šetření. Pro uplatněni statisticképřejímky je třeba vymezit přípustuý podíl vadných výrobků 1'" který bude zamítnut

s pravděpodobností a (riziko výrobce), dále nepřípustný podíl vadných výrobků 1'" kterýbude převzat s pravděpodobností jJ (riziko odběratele). Tato čtveříce čisel spolu s postupempřejímání jednoznačně určuje statistický přejímací plán.

V problematice statistické přejímky se setkáváme s pojmem přípustná úroveň jakosti(AQL - Acceptance Quality Level), která je delinována jako úroveň jakosti pro spojítou sériidodávek. Ta je pro účely statístické přejímky mezní přijatelnou hodnotou průměrného

procenta neshodných jednotek Nepřípustná úroveň jakosti je u ízolované dávky takováúroveň jakosti, která je pro účely statistické přejímky spojena s malou pravděpodobností.

V dalším kroku je třeba stanovít vhodný model - pravděpodobnostní rozdělení. Pro výběr

s vracením bude modelem bínomické rozdělení, takže ze vztahů (15.1) a (15.2) dostaneme:

X-c }., A, J.,pro nJ:=.- A,

J-a '" 0,95 p, pro "2 ==-P - 0,10 p,o 0,05 5 2,31 0,35 38

2 35 3,90,82 82 653 1,37 5,3 88137 6,7 112

Z tabulek dIstribuční funk .funkce rOvna 095 h ce POISsonova rozdělen' I, a pro Odnol I na ezneme 'A = 2,3. Protože A _ /I ", u parametnl A'" 0,05 a je rovna Ó~~ pro x = Oje distribučníliší, tak budeme hl d- 'P, urCllne hodnoty rozsahů výběrů /I '. pro b~dnotu parametru

neboť dostaneme ~ a~ 18)2ro x = c = I, dále pak pro x = c = 2" An""· Vldlme, ze se obě hodnoty

N 'b " - a II - 88 P . I zde nedo h' , kej líže k sobě' ,- . rox = C = 3 s"'., c aZI rovnosti,hOdnotulI=85

JSOuhodnoty 82 a 88. Jako řešeni vezm: jlZ .'~zdll mezí n" ", zvělšuje.

me JejIch antmetický průměr t d, e yPřejímací pl' ,

naJeznelO J' an ma podobu /I ~ 85 2e- / maxlmáln' d • c = . Ke kontrole náhod "

vadné Výrobky ď ku e" va výrobky vadné dávku _ ne vybereme 85 vy'robkl"1. av vratlme. . prevezmeme·d' ,

, naj eme-h alespoň tři

(15.1)

(15.2)

(153)

(15.5)

(154)

P(~ >cl I' = 1',)= a,

P(~>cl p=p,)=jJ.

'\~("}"(I )" r <L..J I· - Pl - a .xx X

'" ("}., ( )NL.. , I - 1', ? 1- jJ .x...c X

V případě Poíssonova rozdělení určíme přejímací plán pomocí vztahů:

208

209

Page 104: Statistika skripta

, charakteristiky, kterádle operativOl

'h plánu posoudíme poÚčinnost tohoto přejímac1 o

• "mací plán doplňuje.prej'

Přiklad 15.2 ]Jrčení operativní charakteristiky" 'ľ o 11 - 85 c = 2.

tivní charakteristiku pro přej,mac\ P a - ,Stanovte opera .' neiprve hodnotu

I 'hodnoty P urctme, .

I< určeni ope;ativni.,chara;~~ri~~:: ~;~či~:o ~~~notu distribu~ní .~':cen;;IS;::::iA. = lip = 85p. Dale utc,me ,. me si í interpolaci) nebo vypoc e

rozdělení, a to bud' z ~~~~t ~~~~~~y jsou soustředěny v tabulce 15.2.tabulkového procesoru .

Vy' počet operativni charakteristikyTabulka 15.2 --

Z prtlběhu operativní charakteristiky vidíme, že pro: p, =0,0 I je a c' 1- fl =0,055

a pro. 1', = 0,06 je fl = 0,1 16

Vzniklá drobná odchylka od zadaných požadavku je dána skutečností, že rozhodne číslo

u tohoto druhu statistické přejimky je diskrétní veličinou.

15.3 Sestavení přejímacího plánu pN pi'ejímce měřeuím

Princip tvorby přejimacího plánu u přejímky měřením je analogický přejímacímu plánupři přejímce srovnáváním. I zde každá dodávka obsahuje určitý podil vadné produkce p ~ O.

Ten však nelze definovat jako počet vadných výrobku k počtu výrobki. v dodávce.U přejímky měřením považujeme za vadné ty výrobky, u kterých hodnocený znak výrobkupřekroči určitou horní specifikačni mez nebo nedosáhne dolní specífikační mez. Tak je tomuu jednostranně stanovené toleranční meze. Někdy hrají roli obě meze, a pak hovoříme

o přejímce s dvoustralmými tolerančnimi mezemi.

U dále probraného případu budeme předpokládat, že hodnocený znak sleduje normálnírozděleníN(x,I',O"), přičemž je známa hodnota směrodatné odchylky 0'. Pokud ji neznáme,

jde o jiný typ přejímacího plánu.

Přejímací plán (n,d) určíme na základě požadavkU, aby pravděpodobnost zamítnutí

dodávky při přijatelné úrovni zmetkovitosti byla a a pravděpodobnost příjetí při nepřijatelné

zmetkovitosti byla fl. Jestliže známe horní specifikační mez 1;{, platí:

P A. = "I' fJ0,005 0,425 0,990

0,01 0,85 0,945

0,02 1,7 0,757

0,03 2,5 0,531

0,04 3,4 0,340

0,05 4,25 0,204

0,06 5,1 0,116

0,08 6,8 0,034

0,10 8,5 0,009

0,12 10,2 0,002

Tff -x d---~ .

O'(15.7)

Obrázek 15. 1." 'ho plánu. 'charakteristika prellmae\

Veličina x je výběrový průměr z n měření, tak odhadujeme parametr 1'. Dodávku

přijmeme, pokud platí:

(15.8)

'7 je normovaná veličina hodnoceného znaku, která sleduje normální rozdělení. Pak platí, že:

je krítická hodnota normovaného normálního rozdělení pro stanovený podíl zmetku p.

(15.9)

(15.10)

J T )p=. ~77> ff;1' ,kde

podíl vadných výrobku I' v dodávce pak určíme ze vztahu:fJ (p)

1,0

0,9

0,8

0,7

0,6I

0,5 1

0,4 \

0,3 i I

0,2 'LL:---------------- '---:--:::===----'0,1 ---:-- -'- :~_L-_..J--

, . , ~.~ 0,00 0,10 0,11 0,12 P0,0 ~ o03 004 0,05 0,06 0,07 0,08

0,00 0,01 0,02, '

210

211

Page 105: Statistika skripta

Přejímací plán určime dosazením do vztahů (15.13) a (15.14):

Z tabulek Laplaceovy funkce odečteme tylo hodnoty'

d =1,64. 1,64 + 1,64.2,33 =19851,64 + 1,64 "

n = 2(1,64 + 1,64)' + (1,64.1,64 +1,64.2,3]2'. = 67 12 -4 682(2,33 -1,64)' '

(zaokrouhlíme nahoru).

II Pl = Ua :;:: 11 P :::. 1/0 (Ij :::: 1,64 .UA =UO.01 =2,33,

(15.13)

(15,12)

(\5.1 1)

.. 'ho odílu zmetků dále platí:

d defmíci přípustného a nepnpustne P

S ohle em na

(T-x d\TIf -jl-ll )~a,p fl _ > -=--- - Pi-a - a

(1.' -x d\I'n-J.L_ lI )?I-fJ.P ..!!-- '2: -::-- - Pl

a a

(7)) dostaneme:, (víz např, literatura

Řešením těchto rovmc -

(15.17)

(15.18)

(15.19)h=

d-lIli = - _P,

P. h

lip =d-hu pa ,

1 ď-+--- .n 2(n-l)

Obdobně pro pevnost v podélném směru.

Na základě výsledku příkladu 15.3 stanovte operatívni charakterístiku tohoto plánu.

Nejprve určíme velíčínu h podle vztahu (15.19):

x, "4 + 1,985.0,588 = 5,167

x, "10+ 1,985.0,641 = 11,272.

X, -10--" 1,985, tedy0,641

Příklad 15,4 Určení 0l1erativni charakteristiky l1řejímacího I1lánu měřením

Z uvedeného příkladu vidíme, že musíme odebrat poměrně vysoký počet vzorků, tak semůže stát, že přejímka bude velíce nákladná. Celou sítuací bude třeba ekonomícky zhodnotít,tj ztráty z odmítnutí dobré dodávky, ztráty z převzetí špatné dodávky a náklady na kontrolu.To může ve svém důsledku vésl k upřesnění podmínek pro statístíckou přejímku.

Přejímací plán je účelné doplnít o určení operatívní charakteristiky. K jejimu výpočtu

se využívá těchto vztahů:

Z dodávky tedy náhodně odebereme 68 vzorkl" Dodávku příjmeme jako vyhovujicí,jestlíže hodnota pnlměru x, splni podmínku pro pevnost v podélném směru:

(15.16)

(15.15)

stanovuje

(15.14)

"Pl +llPJd =., 2

nebo obráceným postupemv tabulkách kvantilů

11 naleznemeHodnoty Ua' Up, U"" P2 )

funkce (příloha 1 . b 'oltabulky Laplaceovy "' _ T se získá obdo ny

z , dl' speciflkačni (tolerancnl) mel. D', l' kdy je dana o m

PřejímacI pan, , příkladu 15.3postupem. Tento postup bude patmy z

, " ..mky měřenimPřiklad 15.3 Určeni statisticke meJI tí jeho pevnost

. . dnou z nejdůležitějšich"vla~t~a Přejímaci plán1'"' vy'robě papírových tap~t Je !e 10 MPa, v příčném smeru . to ~ obou směrech,

11 'pode\nem smeru " 'nak pevnosti, a d 'I ' směr

P žadovaná pevnost Je v I'"ť Bylo ověřeno, ze z , d h Ika pro po e nyo oba znaky zV as . "rodatna o c y

má být stanov,en 'prc zd" lenl. Dále byla stanove~a, sme d h dnuty tyto podmínky:sleduje nOflnalm ro" ~ " . = 0588. Pro prejlmku O oa, = 0,641 a pro přícny smel a 2 '

Po úpravách dostaneme:

ď +2l5:-+lIP J2 .>--Jl - 2 fl-tl

" " " .. 'h plánu se často. 'k'ho preJlmacl o .

tanoveni statlstlc e I dné číslo d ve tvaru,V podmínkách pro, s, . dnoduchý vztah pro roZ 10

_ fJ pak zlskame Jepožadavek a - ,

1', = 0,01;

1'2 = 0,05;

a = 0,05;

fJ = 0,05h= (l~:985~02100V6il 2(68 -1) ,

213

212

Page 106: Statistika skripta

(15.20)

(15.21)

( /5.22)

(15.23)

(15.24)pak se hypotéza Ho nezamitá a dodávka se přijimá.

~.. ~j(x".9,)j(x2,8,) ... j(x,., 8,),

fo.. ~ j(x, , 80 )j(x" 80)", j(x

m..90).

B < ~'" < A pak se ve výběru pokračuje,fo", '

A " ~ .. , hypotéza Ho se zamítá,hnlB>~m- ,

f om

Pří běžné statistické přejímce je obvykle pevně určen rozsah měření. Tento způsob lzezaměnit za hospodárnější způsob, a to využitím sekvenční analýzy. Rozsah Výbčrll Je závislýna předchozích výsledcích, je tedy sám o sobě náhodnou veličinou.

Při přejímání vi'robků, kdy je předepsána horní i dolní toleranční mez, je vÝPočetpřejímacího plánu sloŽítější. Jednou z m07.flOstí řešem je sjednocení dvou přejímacích plánůs jednostrannýmí tolerančními mezemi, kdy podil zmetků l' je symetricky rozdělen na částpod dolni toleranční mezi a část nad horní toleranční mezí. Jinou možností je grafické řešení,viz např. Jiteratura (7).

15.4 Sekvenční přejímka při přejímce srovnáváním

Pří aplikaci sekvenčního postupu na Ověřeni hypotézy Ho proti alternativni hypotéze H,Se postupuje tak, že se určí dvě kladné veličiny A a B. Po každém uskutečněném měření se

porovná vztah uvedených veličín k veličině ~.. , kde:

fo..

Velíčiny j(x" .9,) a j(x" 80 ) udávají hustotu pravděpodobnosti (u diskrétních veličinpak pravděpodobnost) i-tého měření pii platností hypotézy H" resp. Ho. Jestliže platí:

Veličiny A a B Se stanovují tak, aby byla respek10vána chyba prvního druhu (a) a chybadruhého druhu (P).

Z praktíckých důvodů je účelné přejít ve vztazich (J 5.20) a (15.2 J) na zlogaritmovanýtvar, platí tedy:0,07 P0.06OM0,040,030,02

0,9 ,,,,,,,,,,,,,,,,,,,0.1 I

-----~----o0.00 0,01

0.3

o.,

0,2

0,4

0.7 j0.6 .II0,:5

L(P)

I' z Qřikladu 15.4O-h:n~elJral1tiliva:n!Í.iJ'chha!!!I[]·a!lskllte;rril·ls:!iti!!skJ!a-IQ!!'ř!'jeiWim!!!..aaf'cíi!!h!QoclQJ.!j!;anmu!Ll'-UJ""'=~_Obrázek \5.2 l: ~

den v tabulce 15.3Výpočet operativni charakteristiky bude prove

Vy' "očet ogerativní charakteristikyTabulka 15.3 _~

h .lt r.. ph.IIP• dj> /.(1') lip,.

0,0078u

-0,431 2,420,98 -2,054

-0,345 2,33 0,00990,95 -1,6452,25 0,0122-1,282 -0,269

0,01540,90

-0,177 2,160,80 -0,8422,10 0,0179-0,524 -0,110

0,02070,70

-0,053 2,040,60 -0,2530,000 1,99 0,02330,50 0,000

1,93 0,02680,40 0,253 0,0531,87 0,03040,30 0,524 0,1101,61 0,03520,20 0,842 0,1771,72 0,04270,10 1,282 0,269

0,05050,345 1,640,05 I 1,6450,431 1,55 0,06060,02 2,0540,488 1,50 0,06680,01 2,326

1,44 0,07490,005 2,576 0,541

z ~ ln j(x".9,), j(x, ,8

0) .

(15.25)

(15.26)

214

2/5

Page 107: Statistika skripta

Jestliže vyhodnocovaná veličina sleduje binomické rozděleni, pak

Jestliže během m měřeni se sledovaný jev vyskytl x- krát, pak plati:

z=xln ll+(m-x)ln I-p, .Po l- Po

z = bl !(X"p,), f(x" Po)

ln P'- pokud sledovaný jev (výskyt zmetku) nastal,Po

= ln ~.=1i pokud sledovaný jev nenastal.1- Po

(15.27)

(15.28)

1 fl J-p {n -'·-+mln---.!! P, 1- 11- a 1-· < In-- -ln _ú) < ln 1- fl. J _ P

P, Po 1- n - -t mIn '0 .0'-0 aJ'-PI

I fl I-pn-+mln_-!' l-fJ I-I-a I-p Jn---+l1Iln~

, cr IP, 1_ <x< -P,ln _.- -In ---f!.!. P, 1_-'-

Po I-p Jn--ln P,.o PII 1- Po

Q", <x<rm • kde

(15.35)

(15.36)

Dále je nutné určit kriteriálni hodnoty A a B. Při jejich stanoveni se vycházi z požadavku,aby pravděpodobnost zamitnuti hypotézy Ho byla právě po m-tém měřeni, kdy:

B < f" < A pro i = I, 2, "', (m -I) a10' )

A < f,.- fom )

Tato hodnota je horní hranicí pro A. Zcela analogicky se stanoví dolni hranice pro B, ato z požadavku, aby nezamítnutí ("příjetí") hypotézy Ho při platnosti hypotézy H, bylo

alespoň B krát větší než při platnosti hypotézy Ho, takže platí:

(1538)

(15.39)

(1540)

(1541)

1- flln-_r :::: _--"a,,-:-__

I P, I-p'n - - ln ------!.

Po 1- Po

anI :::::a+bm.

r", ==r+hm.

In-L0= I-a

ln fl_ln J-p, 'Po I-po

0m seo •. (15.37),. '. zn~cuje přijímací číslo, nepřekročenítéto hodno . •

m je zam'tacím číslem. Jeho • k č . ty Je duvodem k přijetí dodávkpre ro em vede k . . y,

v kontrole pokračuje zamltnut! dodávky v ostatních p.' d hJ. 'npa~se

Ze vztahu (1536)' •.. Je zreJmé· •...provedených měření T .' ze pnjlmací i zamítací číslo " . . . .uplatnění tohoto typ~ Př~t:~kutecnost vede ke grafickému zobrll7;~ l~ea:1lJ fu~cí počtu

y v praxI. ' ere Je vyhodné při

In .!.= Pob= I-p,

ln P, -In 1- p~' .Po 1- Po

Příklad 155 Učr ení sekvenčního přejímacího plánu

Určete sekvenční přejímací lán ro '.P P steJne podmínky jako v příkladě 15 I

Dosazením do vztahů (1540) a (154J)d ... ostaneme:

ln g,~~

0= 0,95 _ -2,25129ln 0,06_ 1n 0,94 - 1,84358 =-1,22115,

0,01 099,

(15.31)

(1532)

(15.29)

(15.30)

(15.33)

(1534)

l-fJ?:Aa,

1- fJA,;---.

a

fJ';(I-a)B,

R?:LI-a

fJ P l-p l-fJln -- < xln --'-+(m-x)ln --' < ln --o

I-a Po t-po a

ln L < ln z <In I - fJ ,I-a a

Využití princípu sekvenčni přejimky bude ukázáno na případu přejímky kvalitativnihoznaku na základě modelu binomického rozdělení (výběr s vracením). jestliže veličina xvyjadřuje počet vadných výrohkil mezi m kontrolovanými, dosazením do vztahu (15.22) prooblast pokračování ve vYbíráni plati podminka:

A krát větší při platnosti hypotézy H, než při platnosti hypotézy Ho, takže plati:

216

2t7

Page 108: Statistika skripta

ln 0,90

r ~ _Jl,05 ~ 2,890:!2 ~ 1567801,84358 1,84358' ,

ln 0,9~

b ~ .~,94 =0,05182 =°02810.1,84358 1,84358 '

(1_ P)"

l(p)~ _~_-=l

C:PJ-C!J'" (1542)

když veličina h se VYUžiJ'e dál'e ve vztahu.

Dosazením do získaných vztahů nebo z grafického zobrazení získáme potřebné veličiny

pro rozhodováni o přijetí, zamítnutí nebo pokračovaní v přejímce.

• zde nelze dodávku zamítnout,počet měření uvedený v tabulce je celočíselná veličina, vzniklá zaokrouhlením nahoru.

Odtud určíme.

(1546)

(1547)

P=b,L r-(p)=-.

r-a

l-U-':l''-JP=(.!!,-)'h'~-(-:~ PI)" . (15.43)

Po 1- Po

lep) ln -I!...- +(1 - L(p» 1 1- P11= I-a n_- --~

pln.!i+(J_p)ln I-p, .Po J - Po

V případě že h - ° t ., -, ento vyraz lze upravit na tvar'

-(In -?Yin 1- P)11=-. I aA a

ln 12 ln ~.::p;-Po J - P,

v v ~ praxi se postupuje tak, že se zvolí .resem hnlltnim přechode S " . h a pak urč'me pa L(p). Pro h = O J'e trVeba naJ','t

m. nadno ZJlstlme, že platí:

(1544)

(1545)Rovněž lze stanovit o v. v

Z grafického b . prumerny pocet měřeni li pro 'ak .podle vztahu: ze razem stanovíme i maximální průměrný ~oč~~:~h =:7tko~itovst v dodávce.

ouse . Vypocet se provádi

9

9

364

265

8

8

329

229

7

7

293

194

3 m

m

6

6

158

257

Oblastpřijetí

5

5

123

222

4

4

87

186

3

3

51

151

Oblastpokračovaní

zkoušek

2

2

16

11580

ObJ;lstzamítnuti

o

o

44/II

//I

L- C-_

O

Qm

x

Q. ~ -1,22115 +0,028lO/I/,

t m = 1,56780 + 0,02810/1/.

Tabulka 15.4 Potřebný počet měření pro rozhodování při sekvenční přejímce

Obrázek 15.3 Sekvenční přejímka

Ze stanoveného přejímacího plánu vidíme, že pro přijetí dodávky je potřeba alespoň 44měření Při použití klasické jednostupňové přejímky je zapotřebí provést minimálně. 83měření. Účinnost tohoto sekvenčního přejímacího plánu můžemě zhodnotit z operal,vllIcharak1eristiky tohoto plánu. Lze využít vztahů (viz literatura (17»:

218

219

Page 109: Statistika skripta

0,12 P0,10

Statistícká přejímka srovnáváním,

Statistická přejímka srovnáváním pro plynulou výrobu,

Statistické přejímky srovnáváním, Přejímaci plány AQL pro kontrolukaždé dávky v sérii,

Statistické přejímky srovnáváním, Přejímací plány LQ pro kontroluizolovaných dávek,

Statistické přejímky srovnáváním, Občasná přejímka.

60

50

40

30

20

10 _

O ..

0.00 0,0

15,5 Další typy přejímacích plánů

výrobky kusového charakteru,sypké hmoty,kapaliny,plyny,pastovité látky.

Pro tylo přejímky exístují speciální tabulky či statistický software. Tabulky pro některétypy těchto přejímacích plánů jsou uvedeny i v ČSN např.:

jednostupňové, přejímky s jedním výběrem,dvoustupňové, Se dvěma výběry,mnohastupňové, s řadou stupňů.

Existuje celá řada dalších typí. přejimacích plánů. Podle počtu stup.'ů při přejimanírozdělujeme přejímky na:

n

;~ L _

Obrázek 15.5 Průměmý počet měření při sekvenční přejímce

ČSN 010254ČSN OJ 0257ČSN ISO 2859-1

ČSN ISO 2859-2

ČSN ISO 2859-3

Zejména při přejímání výrobků chemického charakteru je nutné respektovat druhpřejimaného výrobku. Podle jeho charakteru existuji přejimky pro:

.. ruměmého počtu měřeníYýpočetoperativní charaktenSll~Il.Il.Mill<!.m;=-",,===_

,,0,8 :,,,0,6 I

0,4 j i0,2 j __ ~ ;;~:::::::::~~_~ooC, , . , 008 0,10 0,12 P, 0,02 0,04 0,06 ,0,00

L(p)1,0

Tabulka 15.5

.. . rozsahem výběru) vidíme,Porovnánim tohoto přejimac~ho.p!~nu s klaslckym (s pevnymže je tento přejímací plán hospodameJsl. .

Operativní charakteristika sekvenčniho přejimacího planuObrázek 15.4 _

h P L(p) II

0,000 1,000 43,4+00

45,62,5 0,001 0,9990,005 0,987 52,31,50,010 0,950 59,71,00,013 0,916 63,40,80,017 0,828 68,70,5

70,90,3 0,021 0,73871,30,2 0,023 0,683

0,1 0,026 0,624 71,00,0 0,028 0,562 70,1

0.031 0,499 68,5-0.166,2-0,2 0,033 0,436

-0,3 0,036 0,375 63,5-0,5 0,042 0,269 57,0-0,8 0,053 0,151 46,7-1,0 0,060 0,100 40,4-1.25 0,070 0,058 33,8-1.5 0,080 0,034 28,5-2,5 0,123 0,004 16,5-3,5 0,166 0,000 11,4

1,000 0,000 1,600

220

Pří přejímání výrobků kusového charakten. lze vadné výrobky, zjištěné při přejimce,nahradít dobrými. U zamítnuté dávky pak všechny výrobky přetřídit. Tomuto typu přejimkySe říká Opravná přejímka. Jiné typy přejímek patří mezi bezopravllé přejímky.

221

Page 110: Statistika skripta

222

Kontrolní otázkVLillQ\]y--~- . .tu ňové a nčkolikastupňové přejímky.1S I porovnejte výhodnost Jednos p .' ,.. cího plánu? .

1S2 K čemu slouží operativní charaktenstlk~ P'~JI_~\rouŽkl\. Dodávka obsahUje 8 000 ks. . . ľ pro dodavku tesmc'" d . ky'

\5.3 Určete přejímacl pan . . hl d "Byly dohodnuty tyto po mm .kroužků, kvalita se posuzuJe vz e ove.

PI 'o 0,01; a = 0,05- OOS .• p" depsanou

1', = 0,04; fJ·· '.. né balcní z hledíska hmotnostI vyrobku. ro ;";0 dohodě15.4 Určcte přejímací pian P'? drob. '\' h otnost 985 g. Jc známo (5 = 1S g.

t 1000 g JC udana mimma m mhmotnospartnerů bylo stanoveno: .

a) PI =0,01; a =0,05,

1', =0,03; fJ =0,05 .

b) PI = 0,0\; a = 0,01;

I' = OOl' fJ = 0,05. . 1'" se sníží směrodatná odchylka, " ' 'd . ku pro průměrnou hmotnost, Jest lze

c) Urcete po mmnal,5g.

(16.1)

(16.2)

Zpravidla je splněn předpoklad, že chyby sleduji normálni rozděleni, jsou na sobě

nezávislé a náhodné, tedy plati, že sleduji rozdělcni N(c; O; (5;) .Vcličina fl je pevný

Xij vyjadřuje j-té měření na i-té úrovni,

fl je ef~kt celého zkoumáni (experimentu),

J; představuje efekt i-té úrovně,

/;;"1 značí náhodnou chybu v j-tém pozorování na i-té úrovni.

223

Výsledek každého měření lze též zapsat ve tvaru:

Toto je hypotéza homogenity průměrů jako celku. Jestliže k = 2, pak se jednáo Studenti"v test, jak jsme jej poznali ve 13. kapitole.

16. ANALÝZA ROZPTYLU

Nejjednodušším připadcm analýzy rozptylu je hodnoceni působeni jednoho faktoru nasledovanou veličinu. Zajimá nás, zda surovina od ,ůzných dodavatelů má vliv na kvalituproduktu, či zda ruzné typy katalyzátoru maji vliv na výkon zařizeni nebo měrnou spotřebu

suroviny. Hodnotíme tak jeden faktor (dodavatele, katalyzátor), který se vyskytujc naněkolika úrovních. Počet úrovni označime symbolem k, počet opakováni měřeni jako /I.

16.1 Jednofaktorová analýza rozptylu

Předpokládáme, že je provedeno n mčření pro každý z k úrovní hodnoceného faktoru X"

N = n. k pozorováni. Jednotlivá pozorováni jsou na sobě nezávislá, sledují normálni

rozděleni se stejným rozptylem (5'. Předpokládejmedále, že provedeme stejný počet měřeni

pro každou úroveň hodnoceného faktoru (tento předpoklad není obecně nutný). Za těchto

přcdpokladůbudemc ověřovat hypotézu:

Řešeni analýzy rozptylu je součásti řady speciálních statistických programů, výpočet lzetéž relativně snadno provést v EXCEL. Postup ukážeme na přikladech.

Ve 13. kapitole jsme se zabývali testovánim statistíckých hypotéz rovnosti prll1něrů vedvou variantách. V praxi velmi často potřebujeme porovnat celou řadu variant z hlediskajejich průměru. Lze tak posuzovat působeni vybraných faktoru na hodnoccné veličiny.

Celkový rozptyl hodnocené veličiny se rozděluje podle jednoho či několika hledisek. Protožejde o zkoumáni, kdy hodnotime zdroje rozptylu sledované veličiny, tato statistická mctoda jeznáma pod názvem analýza rozptylu, ve zkratce ANOVA (Analysis of variance). Analýzarozptylu může posuzovat působeni jednoho taktoru, pak mluvime o jednofaktorové analýzerozptylu; dvou faktorů, pak jde o dvoufaktorovou analýzu rozptylu nebo celé řady faktorl',zde se hovoři o mnohofaktorové analýze. Analýza rozptylu mtlže být prováděna

s opakovánim nebo bez opakování měřeni na daných úrovnich sledovaných faktoru.

soustředěna řada přejímacích plánůd st né literatury lze doporučit (12), kde je

Zlk o .up

obrazením operativních charaktenst'k.s tabu aml a z

Page 111: Statistika skripta

orl'

azeme lla pnkladu.

Nyn' k'·vh . I U azeme ustálené schéma ' •odne transformace původ ' h .;Ypoctu analýzy rozptylu U •.mc veltclO, což se vyplati i pro ; ~ozomeme Ještě lla vhodnost

Tabulka 16 1 S h' vypocet v EXCEL. c ema analýz)' roz(1lvlu .

Příklad 16. I Analýza roz(1t)'lu

Rozhodněte zda o·"výrobě chemíckéh p uZlty druh katalyzátoru má I'o produktu. Výsledky měřeni jsou uv~~~n~a ~~nlou spotřebu suroviny při

Tabulka 16.2 Výsledk ..' v a u ce 16.2.)' merem měrných s(1otřeb 4

Vypocet SI usnadnime t < '

h

' rans,ormacl' II - (sc ematem výpočtu J'e d . Y - Xy - 50,00).100. U· .uve eno v tabulce 16.3. rcem potřebných veličin se

Tabulka 16.3 Transft-'-"Oilll!!oi)]rJJmrua~c<!;eiJdta!1tjjaL'v'lýíco,co,ččeett v'''e· ll;í;č"i n-

(1fo katal)'zát

Typ 1 Výsledek

2měřeni měrné spotřeby suroviny

katalyzátoruI.

3 4

II.0,56 0,55 062 50,64 O61 ' 0,59 O60

III.' 050 '

0,45 O46 ' 0,55 O56

IV.,045 '

O~ O~ , O,~ O~, 0,45 0,43 0,41

.

Zdroj měnlivosti Počet stupM volnosti Součet čtverců Průměrný čtverec

Mezi skupinami

F

k 1O,

,,-Q,

~,t2. , - s,

Uvnit! skupin

k I S,2

N k

,Q, S'l - Q,

2 X

Celkem

N k

N-I Q s"Q

NX

Postup řešení uk' •

1

..

(1ro analýzu roz(1t)'lu

Typ 1Měření

2 3

,

url ll'

4 5 L1I1)

-, , ,

11 u'(Lu,)

" "U,l ll' u" u'

ll, Lu2

I."

",j u' J-'

6 36" "

Y

5 25 12"

J I

II.144 9

J-'

14 19681 10

11 121 O100 42

III. -5 25O 5 25 6 36

8,4 1'164 386

-4 16 -5 2536 7,2

IV. -8 64 -ll-11 121 -7 49

1296 378

., 121 -5 25 -7 49-32 -6,4 1024

L-9 81 -40

236

7 321 1 283

-8,0 1600 340

,-I2 194 -4 276 O 266 6 1.2 5684 1340

(169)

(16.8)

(16.7)

(166)

(16.5)

(16.3)

(164)

Tečka ve vzorcích znamená, že jde o sOllčet pro přislušný index.

Q=Q,+Q"kde

Již v kapitole 4 jsme dokázali, že plati:

Jestliže je hypotéza o rovnosti průměrů u všech úrovní faktoru správná, pak každá

veličína X, sleduje stejné normální rozdělení, a pak nutně veličína .-2.- je nezkreslenýmIl.k-l

odhadem 0-'. Veličina x,. sleduje normální rozdělení s rozptylem 0-' a veličina Y-II Il(k- l )

bude nezkresleným odhadem veličiny 5!~. Protože veličiny Q, a Q, jsoll na sobě nezávislé,II

k I

.. ' Q, Q,. •• k I' dh d 'T" I .pa' ve ICllla _ .. _ =._ Je rovnez nez res enym o a em 0-. lm JSou sp neny

k(Il-1) N-kpodmínky pro Fisherovu veličinu F :

Tato veličina sleduje FisherovO rozděleni s (k - 1; N - k) stupni volnosti. Ze vztahu

(16.5) vyplývá, že veličiny Q, a Q, jsou korelovány, a proto je volen vztah (16.9). pol.'lldhypotéza o rovnosti pn,měrů nehude pravdivá, pak tuto skutečnost zachytí pouze čitatel ve

vztahu (16.9), jmenovatele se tato změna netkne.

,".,. =0'-', '

parametr, veličiny 7;, 1; ,... ,1; jsou pevné parametry, pokud úrovnč zkoumáni jsou

konstantní, lze tedy předpokládat, že všechny veličiny r, sledují N(r; O; o-~), tedy platí:

224

225

Page 112: Statistika skripta

(16.11)

(16.12)

(1613)

(1614)Q" kde

Q, ++Q,=

"L;x,x, ::: J-_'__

flj'

"xL.., 'IX ::: 1..-_'_

I k'

fI.kX :::: X == "'1 l' I

It: II J: "

Q= L;L;(x" -i')' = L;L;(x, -x, -XI +x+x, -x+x) -x)' =1=:1 ,- t ,,.,-1 J'-'/

k " k II

= "L;(x, - x)' +kL; Ci- I .. x)' + L;L;(x, - x, _XI -1 x)' ='''I 1'-1 .=1 J"'!

Pomocí dvou faktorové analýzy rozptylu bez opakováni vyhodnocujeme působení dvoufaktorů na sledovanou veličinu, přičemž prvni faktor je sledován na k úrovnich, druhý faktorna fl úrovních. Důležilým předpokJadem je vzájemná nezávislost obou faktorů, řikáme, že jdeo model bez interakce Jestliže existuje interakce, je třeba zvolit model s opakováním. Řešenise opirá o rozkJad celkového rozplylu a výpočet veličin F Ve shodě s jednot;1ktorovouanalýzou ro7plylu zavedeme toto označeni:

16,2 Dvoufaktorová analýza rozptylu bez opakování

Q je celkový SOučet čtverců, který vede k celkovému rozptylu,

Q, je součet člverců, který vede k rozptylu mezi průměry x, ,Q, je součet čtverců, který vede k rozptylu mezi průměry x I,

Q, vyjadřuje reziduálni součet čtverců a vede k reziduálnímu rozptylu.

Pokud všechny veličinyX'I sleduji N(x; jl; a'), pak lze ověřovat hypotézu o rovnosti

průměrů obdobně jako u jednofaktorové analýzy rozptylu. Pro slanovcní veličin F využivámedále uvedené vztahy'

(celkový rozptyl).

4 ,

2::2::",; = 1340,rl J",j

N =20,

," - a' + 5a' = 378,3,jil - II m

S;2 =: 0"; :::: 12,7 , tedy

378,3-12,7 -73122 _ • ,u'" - 5

'- '_L a' = 12 7 + 73,1 = 85,5ac-u" r III ,

, ť bné veličiny pro vlastní analýzu rozptylu:Z tabulky 16.3 vypocteme po re

4' ,2::(2::11,)- = 5684,I_I J-I

.. '2 :::; (J2 + n.U;, •kde"1 u

" ), znači rozptyl uvnitř skupin (odhad chyby, s, '(Ju . ,

a;' vyjadřuje rozptyl mezi skupmamJ.

P "klad 16 I lze dále určit:ro pn .

4 ,

2::2::", = 6,1,--1 }'-I

6'Q= 1340 - 20 = 1338,2,

O _ 5684 _ ~'_ = 1135,0,-, - 5 20

O = 1338,2 -- 1135,0 = 203,2 .-,

Vlastní tabulka analýzy rozptyluT bulka 164

6) - 3 239 . ypočtená hodnota ležíV tabulkách je nalezena kritická hodnota Fo,o~ (:~měrů' zamítáme. Dnlh použítého

. a roto hypotézu o rovnostiv krítícké oblasti, P, ou spotřebu suroviny.katalyzátonJ má vlív na mem , I" , F

' h hytí čitatel ve ve Icme .k , 'ch průmerec zacI, . že změnu ve s upmovyKonstatova I Jsme,

Platí vztah (16.10)

a

Počet stupňůSoučet čtverců Průměrný čtverec FZdroj měnlivosti

volnosti1135,0 378,3 29,79Mezi katalyzátory 3

12,7 XUvnitř skupin 16 203,270,4 X19 1338,2Celkem

V

l1.k .. I

tL- __l1.k

k -1

(16.15)

(16.16)

, "L;(L;x,)',-,1 1'.1

, "LLx: - 1'-'1 }'=k'-

2 Q II l' I n.s' =_=/I.k -I

'I 'měrech'i adá na rozdl v pni73 I " ' , 850/. z celkového rozptylu pr pl' t 'e ' - °85 lze ne" ze orooz ~-- , ,85,5 h b

' I 't ') a 15% na náhodnou c y u.(vhv kata yza Oni

226

227

Page 113: Statistika skripta

n t k n

L(L X,)' (LLx,yJ'=1 I-!-___ ,=1 j~l

S" = Q, _= _--'k'-__---,_-'n""'k. _, n-I n-I

(16.17)

(16.18)

-,---r - - - _.Lu 2 T

_. -, 321 221 430.., 972, X X(LU,)' 49 81 324''''1 454 X X

Nyni v 'YPOcteme potřebné veličin _ '.y soucty ctverců:

Na základě dat tabulky 16.5 zhodnoťte vliv katalyzátoru a jeho zrnitosti na měrnou

spotřebu suroviny.

Ještě jednou zdůrazněme, že tento postup je možný pouze tehdy, jestliže efektyhodnocených faktorů jsou aditivní, což znamená, že rozdíl mezi efekty dvou úrovni prvnihofaktoru je stejný na libovolných úrovních druhého faktoru. Jestliže toto neplatí, je nutnéuplatnít postup s opakováním. Postup této analýzy rozptylu ukážeme na příkladu 16.2.

(1620)

16'Q=972-_ =950 6712 ,.

Q 454 16',= - -=9217

4 12 "

daných úrovních,

Q, = 2578 _ I~' _3 12 - 838,00,

Q, = 972 _ 257!! __45~ + '-ť _3 4 12 - 20,50,

Tabulka 16.7 VIastní tabulka analýzy rozotylu-

ZdrojSoučet

měnlivostí čtvercůPočet stupňů

PrůměrnýKatalyzátor 838,00

volnostičtverec F

Zmitost 3 279,3392,17 81,75Reziduální 2 46,0820,50 13,49Celkem 6 3,42950,67 11 X

X X..Kntlcke hodnoty jsou: F. (3 6) - 4 76

••05 , -, ;;;,., (2; 6) = 5,14

Lze tedy říci, že je prokáz' ran v Iv typu katalyzátoru i zmitosti.

; vyjadřuje efekt celého experimentu

, značí efekt i-té úrovně 1. faktoru '

~ značí efekt j-té úrovne' 2 'kt '. .13 Oni

ly představujeefekt interakce t:1ktOr~ na

eym Je náhodná chyba.

16.3 Dvoufakt -orova analýza s opakováním

. V řadě praktických aplikaci ' ,mohli odhadnout rozpt I ch nem, splnen předpoklad aditivnosti fo o

vyhodnocovaných fakt ~ yb,?' Je ,treba měření opakovat ,aktoru. AbychomN = n.k.o měření kd oni na vsech urovních. To znamená ,pr~ vsechny kombinace

popsat modelem :e tv::mbolem o Je vyjádren počet opakov,u;í ~ 'du?e":e muset provést. . az y vysledek měření lze

Xum==lJ+l;+V+!+e k) I) I)m) de

(16.19)S,2

F. = -'-2 S,2·,

Pro vyhodnocení vlivu hodnocených faktorů využijeme veličin F:

Tabulka 16.5 Měrné spotřebv suroviny

Příklad 16.2 Dvout:,ktorová analýza bez opakováni

Tabulka 16.6 Příprava dat pro analýzu rozptylu

, , 3

Z, Z, Z, LU,) Lil: (LU,j)')"" i<:'l )=)

K, 6 ° 10 16 136 256

K, 14 8 17 39 549 1521

K, -5 -6 -4 -15 77 225

K, -8 -11 -5 -24 210 576,

LU, 7 -9 18 16 972 2578,,,)

ZmilostKatalyzátor Z, Z, Z,

K 0,56 0,50 0,60,K, 0,64 0,58 0,67

K, 0,45 0,44 0,46

K, 0,42 0,39 0,45

228

229

Page 114: Statistika skripta

16.3 Dvoufaktor' ,ova analyza rozptylu s opako ' ,

Údaje

ade dat tabulk 16 JO"'4 , 3 Y . pnstoupime v výpočtu d t dL L (~:>'Jm)' = 21' + 42 + 30' + 42' a o tabulky analýzy rozptylu., I rl ml +",+(_29)' +( 15)'- = 8679

0- 63 2 •_ - 2923 - - = 281275

36 "

QI_ 23199 63'

- .- - - -- = 2467 429 36 •

Q_ 3845 63 2

,- -----=2101712 36 "

Q = 2923 _ 8679JI - = 303 '

Q" = 2812,75- 2467 42- 210 17, , -30,00= 105 16. .

emJa ovpříkladu 16.2

KatalyzátorZm~ost

Zl Z,K, 6 7 8

Z,O 1 3

K, 14

10 9

15 13

11

8 7

K,8 17 18

-5 -7

18

-8 -6 -4

K.-3 -4

-8 -7 -6

-3 -5

-11 -9 -9 -5 -6 -4

Na zákl "

- QVímltn

Zdroj Součet Počet stupňů

měnlivosti čtverců volnostiPrůměrný čtverec

Mezi

F

řádkyQI k-I \.'2 _ QI \,1?

'1 kF

. I

1I S,2

Mezi Q,

r.

sloupci II .- I \"2 _ Q, S,l

. , F- ~--

II . 1,

\,,2

Interakce Q" (k

'R

1).(11- I) .d Q".,

'\12 ::=: /';2Sl2

Reziduální

(k I) (II I) s''!

Qnk.II.(o I) Qn "

N k.1Is'

Celkem

R NX

Q

k.1I

N I X X

Příklad

(16.27)

(J626)

(1625)

(J6.24)

(1623)

(16.22)

(1621)

11.0o

. "Q" = oI. I. (X'i -x, -x, +X)2 =

,,,,1 J"'\.I: "o Ir n o

I.I.(I.X'Jm/ I.(I.I.X;,j,_ I )"'1 171,,"1 ,,-1 )':1", I::;----- ---

počet stupňů volnosti u ínterakce je (k _1).(11-1) a u reziduálniho rozptylu k.I1.(O -I).

Pro hodnocení budou v tomto případě tři hodnoty Fisherovy veličiny ji. K výpočtu sloužíspeciálni programy. Obvyklé uspořádání výsledků je v tabulce, kterou můžeme též vytvořitpomocí tabolkového procesoru EXCEL.

Dá se dokázat (viz literatura (S)), že plati:

1 " Ir" kilO

1): = I.VJ = I.I.J'J = I.I.I.s,,,, = O.1-\ J I i~l r-l ,~I rl tll-I

Při tvorbě modelu sc vychází z předpokladu, že výsledky pozorování sledují normálnírozdělení se stejným rozptylem a pro všechny faktory, že jednotlivá pozorování jsou na soběnezávislá a že dále plati:

231

230

Page 115: Statistika skripta

n

L8.Xy -x, ~t::'I- J"J

n

1

- n l'k II k LI:.'Q'=LL(x,,-X')'~L~ 8, -!.C' •

I-I Jl L- ~ J'I-I 1"',1 II

E(l· 8 ) = O ." 'h pro J, < /, (důsledek nezávislosti měření).

E Q, = ti[a: -1 n~~ +0 -2 a: -0]=~~a:(n- I),-, rl n n L. L. ---- = k.(lI-I).a'.

"] i""l II e

(16.31)

(16.32)

(16.34)

(1633)

(důsledek náhodností chyb),E8 =0•E8.~:::: (j2

I) t •

Dále platí:

l'~05(3; 24) = 3,01, F••,(2; 24) = 3,40, F••,(6; 24) = 2,51.. . .

Tabulka 16.11 Tabulka pr!L'di1.očet hodnot pro analýzu roz-J!!)1u s opakovánim

Tabulka J6.12 Vlastní tabulka analýzy rozptylu s opakováním

Z výsledku vidíme, že všechny vypočtené hodnoty F překračují krítické hodnoty (ležív kritické oblasti), a proto můžeme tvrdit, že hodnocené faktory mají vliv na měrnou spotřebu

suroviny. Vliv interakce nelze opomenout.

Zdroj měnlivosti Součet čtvercůPočet stupňů Průměmý

Fvolnosti čtverec

Mezi řádky2467,42 3 882,47 657,98IKatalvzátórl

M~~i SIOn~ci 210,17 2 105,08 84,06Zrněni

Interakce 105,16 6 17,53 14,02Reziduálni 30,00 24 1,25 X

Celkem 2812,75 35 X X

I, , , 3 , ,

Z, Z, Z, LL ",m LL ll' (LL "lJfN )2'lmJ"'I ni'"! }-'I ",,,I )'::1 m=!

K, 21 4 30 55 461 3025

K, 42 23 53 118 1704 13924

K, -20 -13 -12 -45 249 2025

K, -21 -29 -15 -65 509 4225, , ILL 1I,)m 22 -15 56 63 I 2923 23199,~I m-' --, ,LL ":m 1026 531 1366 2923,I m I, ,

(LL tl )' 484 225 3136 3845,m,=1 /71""'1

Dodatek k 16. kapitole

D Ok • I "2 2 2 2 2U az, ze p atl SI = a ,(W,iI1 +nameti = Cf II -I- n.alll •

Odtud vidíme, že E - ~ = Es" = a' _ ,k.(n-l) , , -a".

Nyni určíme E /) ."" .

(J 6.35)

, n

Q'=LL(X,-XI)',1"'1 1'=1

n

Le,XI :::: J.l +1; + ..!.=!..._-,

n

(16.28)

(16.29)

(16.30)

- l·x, =Jl+T, +_.!!.....

nJe k II

"1' ""_ L. I ~L.E'J

X = II +~ + _'~~~

k n.k (16.36)

2322JJ

Page 116: Statistika skripta

16.3

16.2 Zhodnoťte vliv karbidových 'zadány v tabulce 16.14. peCl a směny na kvalitu karbidu vápníku. Udaje jsou

Tabulka 16.14 K r k bva Ita ar idu vál1níku (Jitry acetylenuLj!l.\lno!l<Lkg karbiillLvápníkul

Pec Směna

1 2 3 41 274,5 275,4 274,62 276,1

276,5 277,1 275,8 277,33 280,1 281,34 279,6

280,0 280,0278,8 278,9 279,8

Zhodnoťte vliv dodavatele surovin a d h ti ".v produktu (kvalita produk1~). y ru u dtraclll placlletky na obsah účinné latky

Tabulka 16.15 Obsah účinné látky v produktu v %

Dodavatel Druh filtrační plachetkyP1 P2 P3 P4

97,2 97,5 97,4 97,3D1 96,9 96,9 97,0 97,197,3 96,8 97,0 97,097,4 97,5 97,0 97,4D2 96,9 97,1 97,3 97,597,6 97,4 97,5 97,297,4 97,3 97,3 97,2D3 97,2 97,4 97,6 97,497,5 97,6 97,3 97,4

(16.39)

(16.38)

(16.37)

k

Protože plati Ll; = O, lze dále psát:p::]

=Ili)[r _t.r,]+[t,eij _tt.e,])' =

"='1' k II nk

·" .Q, = LL(x, -rl' = Ln.(r, -rl' =._1 }-I ,,,,I

E i?L = Es" = IlU' +u' = IlU' + u' .k-I I T e ni II

[ ']' [ ." I' [ '][ " ."], Ll; ." LLe, LT, L~"J LLe,_ "1' ,,,,I II " ~ ,::"-1 jo,] 2 7' ,,=1 r·1 , I J-I-n·LJ ,---- +-2 L...J L.J&;} ---- + ,-- -- __ o - --- •

,,,,I k n 1:1 ]=-1 k k II Il.k

Kontrolní otázky a úlohy

16.1 Na základě dat tabulky 16.13 posuďte, zda existují rozdíly ve výkonech (kg/hod) šestikarbídových pecí. U každé pece je zaznamenám průměrný hodinový výkon z denníprodukce v průběhu jednoho týdne.

Tabulka 16.13 fIodínový výkon karbído..vých pecí

PecDen v týdnu

1 2 3 4 5 6 71 1274 1278 1283 1280 1279 1276 12802 1282 1277 1285 1276 1280 1285 12793 1278 1279 1281 1280 1280 1278 12764 1285 1288 1276 1283 1283 1270 12845 1277 1279 1276 1280 1280 1278 12816 1282 1280 1284 1281 1281 1282 1278

234

235

Page 117: Statistika skripta

17. METODY PLÁNOVÁNÍ EXPERIMENTU

Zejména v oblasli chemického výzkumu je využitelná metoda plánovaného experimentu.Jde o metodu, která dovoluje vyhodnocovat řadu faktoru, které působi na výkon výrobníhozařízení, kvalitu výrobku, nákladovost ve výrobě apod., a to s relatívně malým množstvímexperimentů. Je to takový statistický postup řešení, kdy ke stanovenému cíli dojdemenejrychleji a kdy na základě modelového přístupu lze řešit optímalizaci výrobniho procesu zaměnících se kriteriálních i omezujicích podmínek. Tohoto požadavku nelze dosáhnouttradičními postupy experimentování. Mnohde je stále zaběhnutý postup, kdy při studiupůsobení řady faktorů na hodnocenou velíčinu se mění pouze jeden faktor a ostatní seponechávají na konstantní úrovni, pak se mění druhý faktor pří konstantní úrovní ostatníchfaktoru atd. Při moderním způsobu experimentování se měni úroveň všech faktoru.

Při řešení daného úkolu pomoci experimentu je nutné před jeho prováděním vyřešit řadu

otázek jako:

jaké faktory mají být zahrnuty do zkoumání,v jakém rozmezí mají být tyto faktory měněny,

jaké jsou vztahy mezi samotnými vyhodnocovanými faktory,kolik experimentů lze provést,jaká je přesnostjednotlivých veličin.

Pří moderním přístupu k řešení konkrétních praktických úkolů je prvním cílem výzkumustudovaného procesu stanovení matematického modelu. Je zřejmé, že tento model vpraktických podmínkách nemůže obsáhnout všechny faktory, které v daném procesu existují.Takový model by byl značně rozsáhlý a kladl by často nesplnitelné požadavky na přesnost

měření. Reálný postup je takový, že po zjištění významných faktoru se sestaví zjednodušenýpočáteční model, který se v dalšim postupu zpřesňuje až se získá model, který dobře vystíhujechování hodnocených faktoru. Tento model je pak základem pro vymezení optímálníchtechnologíckých podmínek konkrétního výrobního procesu.

Postup tvorby modelu lze v podstatě rozdělít do tří etap. V první etapě jde o to nalézttakové faktory, které se významně podílejí na pruběhu studovaného procesu. Této etapě seříká "proséváníll a postupu experimentování s jeho vyhodnocováním se říká prosévací pokus.

Po stanovení významných faktoru, které působí na zkoumaný proces se pak dostávámedo druhé etapy, během které jde o nalezení oblasti, ve které leží hledaný optímální výsledekvzhledem ke stanovené kriteriální funkci. Tato oblast je charakterízována určitou kombinacívyhodnocovaných veličin (faktoru). Z matematického hlediska jde o to prozkoumatvícefaktorový prostor a v něm nalézt takový směr, ve kterém stanovené kritérium dosahujelepšich hodnot (např. roste kvalíta produkce, roste výkon výrobního zařízení, klesá obsahnečístot apod.). Pro tuto etapu se hodí taková schémata pokusů, která se daji snadnodoplňovat a zaručí maxímální spolehlívost pro odhad lineárních efektů faktoru. Tentopožadavek dobře splňují úplné faktorové pokusy typu 2" a jejich krácené varianty. Názevtohoto typu experimentů je odvozen od toho, že sledované faktory se obměňují na dvouúrovních, a to horní a dolní. Tyto úrovně lze transformovat na hodnoty -I resp. +I. Tatotransformace pak značně zjednoduší výpočet a hodnocení modelu (II je početvyhodnocovaných faktoru).

236

Ve třetí etapě jde o podrobnou anal' :. " o

sledovan~m výsledkem v oblasti kd yzu vZ~Jem,ny~h vzt~hu mezi významní'mi fakto .o staclonami oblastí) tam take' I' ,. e se kmenaln. vehcma jen málo mění (ml ,ry a

I " " eZI optunalní v' I d k M uv, se~ na ,:zem predp.su pro plochu čí nadplochu (ob tt e e

l· atematícky formulováno jde

rotoze se v této etapě jíž 'edn' '" vy e po ynomu druhého či třctího ':,ětšině případll polynom dr~hél.~ s~u~~et~~~:el~t~vn~ malé ,výsledkové plochy, po::~ft~emter~~čni efekty vyhodnocovaných fakt~ru K t

ena~:,z~ muslm~ určitlíneámí, kvadratické a

spinem tohoto úkolu se používají slo' , komu J'Z taktorove pokusy typu 2" nestačí Ke' zene po nsy nebo rotační poknsy. .

, Naznačený postup není vymezen ouze . ,VY~J:umIL Pnnc.p lze uplatnit i v prum!slové v~~~b~blast laboratorlllho čí poloprovozníhoma e: a, to proto, aby nedošlo k ohroženi ' b'~ S tou vanantou, že zrněny faktorů jsouoznacelllm metoda EVOP (evolučniplánová:J;o n. o procesu. Tento postup je znám pod

~í1em této drobné kapitoly je, vzhledempoukazat na možnosti využití metod I' k pr?filu absolventa studovaného oboru pouzetech I 'ký Y P anovaneho ex . ,

no og.c ch podmínek. Výsledkem zko " h penmentu pro stanoveni vhodnýchmodel podle kterého bychom měli vyr'b't tmalll

tec nologíckých podmínek by tedy měl býtvs~upní parametry (např. čistota surov~n;) ~~~tobma~zovat výrobní proces). Jestliže se změníte '! ideálním stavem stanovení parametrů' kt I, yc ?m ul~ět na tyto změny reagovat Nenís ~r~depsanýmí parametry pak neumíme b~z n~re mus~,,:~ vzdy splnít Pří nedostatku surovinJeste s~hopni splnit požadavky odběrater? Z ode~u reslt otazku, zda vyrábět čí nikoli. Jsmeusnadm dobrý model daného výrobníhu pr~~cs: Ja ou cenu? Odpověd' na tuto otázku nám

237

Page 118: Statistika skripta

x )OI.J1

1/

i-l jl

fl;

! I

II, 5.7 Y 5(\091-;- 14T! xO,S500

. 0,0)083,

.(\00469,

0,4.5187,

0,0338233,

0,0036337 .a

0,0162.2,

0,01153,

PacrlReedova khvka:(' (' (Jc" "

"1 J" 1)/1),), (ll

0,080296'1,

28908:J9,

b

ternpo rľí~~tu O,g~{\

Gomrícrtzow~ kh v1<.a:,(;'1 5)644>~, a\ 1,66433

6,82875, tl;, .--. 0,41'773,

'\'3 "e 7,24648, c 0,63079,

y

6. JiCi

fl lbi c(J.Q

U všech hodnot by musel b~'l ča:) při zjišťování v~'konú stcjn~l.

2.2 N o'l--bQ i

3.1 N"hradime-li každý prúrn{rovaný čkn p,ilmčrern, sooón hodnot se nesmi zmčnit. Podktohoto pr{Íll1čru se stanoví prlln'lčrné tempo rústu.

::'.2 Ivlodus a medián lcž,Í napravo od prúmčru, pjati vztah x < me <: n!o.

:~.3 a) x 154:1, tnc 1541, n!o 1537, levostranné rozdt~JeJli c:etností.,b) ,f 1600, me 1588, lIlO nemá vS1znan1; jek () dvouvrcholové rozdělení četností,

c) x 1566, me 1558, mu :;'.- 1546., levostranné rozděleni četností.

II

1,035.0,990.

1,143, 0,892.

li e xi) II.9 __ L; ,9

0,0408, a.:O:,;

II I), .í 19 "\e ,j' A1) ;1

1\ (y..

.1 J

(J,

Je nutné spodtat 1: pak J" 1,025

V hodnotov6rn vyjádj'ení I", -1,020

,v)(~) 12, V;(4) 16, C(4) 6, (4) 10.

~Jlona vede,; na gconwtrickou pravdc:podobnosi vše '1 . . .. _' '"o stranó 60 rnimlj: -P'ř:znivé 1)':-:jo'l j. ' __ .' .~' .' '- G my moznc pnpady vyplní Uvcrc_c

>. ! -'. 1. 1 , ,"cy llJU$l splnovaí. po~~ada\'clc h,: rOI,diI v prichodech

l1cpřckro6í 20 minuL, tedy mw;í nlatit '';-e i ,e ,I"" .<. ')() 1-;;" ..' ". I." ,,-• .,., f •• ", ,-' _" .' ldVll(,'I)' (j( ('I·.:r)(',s'(' 'Ií' ,. ,)'" .. ~;C ',qru Je

Pravděpodobnost pnchodu ve skin\/ okarn-řii, je nnlo\I:\ 9p-(u) 0, 1, " .I .,1\." /("

Toto HďJ-?,déicni bude

9,1

9.2

9.3

9.3

JO.2 II 40

(x, xl'

. O,9i3,

lineární rnodcl není vhocl.n)!.

0,0009325

0"i 19,0,212,

·_·O)lÚ8, 17;, 0.58:33

---3\\0779 -l 0,385825 x

0,408, r12, OJVl6.

97,42 lJ2,"l961.Y, r

;2,260, s 0,0856,,

5,588, !;',I' 0,188i.

252,07, ,"'.\' 1,564, :> .s'x 4,692.

y

x 0,0]/152, s'.\' (\003048,

r"J

fl y ;? lh "~o r

Lineúrní i/zlnh neexistuje., nízká úroveú dat, lna,l~i počet rr1l~rcní pro zkournnnou závislost,neodstranéi1)! (\a~)ov~! posun údajtJ, prckryti vIi Vel, nunlerická chybn.

i,·t)! rádek v lnatici iná tvar: 1; )(

Xl 80,68 0,:133 X 123 ,+ 1,33 Xl,)'\.4

5.1

5.6

5.3

y

4.4 .\'

Váhu-je nutné sdidit na 254,7 g.

" II (y A x A4.1 ns/o .. l~(v, 1)) -~ )' '.'

" '~l 'Ir h" .. ) J ..... )

Page 119: Statistika skripta

s

n;\,hndn.<r .,, ~;)i]nO\ij~nc

sérii

téchr.opob:u

ll!: Výkony obou linek(/ 0,05.

1.3,i)

1 .'., é( ..J.U

V)fslcdek:dostanunc

4,4; ), 0,\06.

vytvořující

, 20,6; JOJ; 19."/:

+ o.~).

lnornentové

] O. '3 Vzhlcdern k j.)()drn{nkúrn zadáni úlohu lze {cX~jt pomod t)oissomw{l nixdélcní:J) 0,,9084, (P 0.,80(9).

10./1 0..05; 0)1\ 0,018'7.10.5 Využitím

106 cr 0.7')2.10.7 \"yrovnané cetnosti jsou:

59,9; 48,.4; 39,1, 3 '1,6;

I l. 1'11.2II

11.4

IU

t 1.6

Postup j)(-.::ní spnívn)l, nejde o prost)1 náhodll)1 v~!bór.

Ano, ale. jen p6 bezchybnérn prorněřcní všech jcejnotd<. I.ákladn.ího souboru.Mohlo by :)c jednat o)oO(:'"\~ kontrolu, ale jen v případě, že. nc.cxjsíu.i(~ variabilitahodnoceného z.naku uvnitř kaž.dé cisterny, COl není v praxi reálné,

Phbližn)! výpoči.crn dom'ancmc. X;;(41) 0,0268,

Přibli;,nýrn V)'počtem dostaneme Zl:,O;, (41) 56;94" X~;,(J: (41) 64,97 ;

správné hodnoty j80U (A 1) ~~6,94; (4i) 64,95

Rozdčlcmi v;!\)črových prúrl1črú nehude vzdálc.n6 nonnálnírnu rozdčlení, více říci nelze.

]Okladných znarné1wk 8 '1 ., ' 1 '. " Z'PO!IlYC 1/,namenck.

12. j Není. \l:vdatn)/lYl odhadenl je jeho převnkc.ná hodnota.

S(!) 101.), 0(8+) ••.. 22,951, II 0,697.

IAO

J,') ,

)·ll

1(' 1.') J1,9250, x­

x>' 987,89.

ti

je to n(~j110žl1é, i\A" l',nnJfJ1f\ lZace poUu 7"11("'1.-'" .,' ""

. , ' .'" ,. '. ',1 .[1'.11 .lG pn Benzeni na j!Je tO lllozne pn seúz.c-ni na Ji'!"

je (o Jlložné, je vúle v scnzeni od 'I'':) . Tato v\1Je je chína hOl!íl0t()ll

6(j" 'f'l\

2Statistická rcO'uhce :" j' ,_ v . " • ,

Jí' 6 T ~ ( /' Je v ~~srllc síaust1C;kym tCst(~n1 v graHcké pod()h(~, "-, ,jim tl 0,8463. .. "

b) /I

c) .Y:>

lY <: 1

14.1 Pi'i W,>

W

Xl; " I[ Lil] g, 40,582,Xi!RIi !.,óS9, Rl) "u.

14,4 Pll )) 0,012'1 :1 J2·1. 0,98"7640 0,0124t 0,0175,

Pl! (0)99Pl' O.

14.2

1: . J

J5.2

j j.3

]S.4

1I"~ x, 'LIF.l

/ImnL,/I. In í! í!j'-:: x,

ic]

ln L

, odtud:II (r tJ f}

nerač·n1m postupem zjistirne, že je potřeba asi :}'/O mčřeni.

x:Spolehlivost odhadu, PO(:c1 Elči'ení, variabilita v základniJn souboru,iZcšení je ze v:r.tahu (12.45)

X

12.1112.3

.13.1 Ff,)nnulováni nulové hypotézy, stanovení konkurující hypotézy, ur(,Sení hladinyvi'zflarnnosti a, zvoleni vhodné testové dl(l,raktcrístiky (typ pravdčpodobnostniho

rozdčkní), lj,tštčni kritické hodnoty, závčr z testu13.2 Pravděpodobnost zamítnutí nulo\/ó hypotézy v pn pf-ldó.. l.e je pravdivá. Jednou

l. Hl0JJj,osti je zV)f.š"it pučet mě.ření.

i 3.3 Ano, .ií.~ to mo/.né.13,4 X.J c-: 2,20; (JO 2) 15,2, Pi'"cdpoklad o existenci exponenciálniho rozdt~lcni nelze

zamitnout. Ztrácíme dva stupu6 volnosti vl.hledem k' tomu, že ~,('.

o jcdnoparametrick6 rozdělení.

Page 120: Statistika skripta

OA9i3GS

0.'19D%

0,491\6"1

0.·tS(~G';j

OA9BS6

(l.499il:1

O,·1991~i

()..-W83'i

OAfl~;:)?

(jA~Xl(\O

(j,;'»,i:,;;)

O,.1;;;;i)/!

O.ti!clGí',"

O.'íiJ,-jl1:'i

(i,t,!~G92

0'1ino::'

C~ '-l~;'/ 'j 'I

(),'!:ú':!iJ

n.;;

(j,,'j()~),n

fIA9G;WO,l"j():,;!

(j"jWH'ii)/;9L;(iO

IH~";G!3

O.,ir):'1l:;

il."--(·J(';)'D

O.'1"Y,),,()

(lJ19"!2i3

(',,4\r;:-;(-l

0.4974'\OA97(i2

O/I!'l;'(}O

O..-í97GI'

0,49"17.-;0.4[H8i

OAH7Bll

O.'1!'rf9S0.49BO'1

OA98i)"1

OA9813(l.-j(J(\HJ

(l.49n;~5

0/1933'1

O/,9inG

OA9Mi

()N!o'lG

OA98iil

Ok!9ir!o. ,~;9ú9

2."19<,,[IQ

2.3':

2,[J!;

/...78

:~8J

?3;:

,.,'.>

:\ O'J

.-;,Ii)

O.'W:WO

()AhD:~

(),4i:\UJ

O.·HG'I;;

O.l:7G"íO

Oo47{;:;

O.'\T!"(i;

(J.'1g·i69

0.'11121.-\

0."'825i

OA((J::;;:

().,~7i!K:

úAgO:';

(lAB07"f

OA/fl31

OJl8J41

0.'183820..18·122

0.'18461

OA8S00

0..18;>370.'18574

0.-13G1

O,4iJ6A0

O,4;)(i"/3

0.487i<l

0.'11H45

0.48778

0.'16800

OA8(l'W

OA8870

OA8899

(l.489211

O.'1B9GGOA89i13

OJi\i010

O,4i)03G

OJl)()G'1

OA~;Ofj6

OA9'I')1

()."ť)'1 :~,!

OA9'iSB

OA01[;()

(jA92f.)',~

1).19'1.24

O.'!92t,(i

O,·"D;;;GnOtí!);!13i3

OA'nť.-\

I.Hr;:f/~)

OJii:::,í:O

(J.,m:'i'G

0.49·1'i:i

;)i;i:!'i:,O

(JAr>i,;

GA(:W,j

1.%

?I:G

2.16

2.n2:W

:I..'í9

2,7.0

2.2'.2.22

2.n2.7.,j

'.>.2!:;

;!.O(i

:UJ!2.0g

;um2.10

2. j i

2.12

2.13

2.14

i ':ji

/.OS

2.30/.,:').]

2.3?2,:n2.34

2.3;~

2.26

:<,;(12'?-$

O./i:'i/:W

0.'1!:iG'í8

O,'b~;Ol

OA5UN

O.,WOf)()

OAGIH

0,'16'1{'\:;

GAG:,!)?

(I,·WG:·m

0Af\h'i

(),~G71H

(I,.e/us(jA/'jll:,

CiA!?';;

017:;:'(1

OA1'i49

DAnw

OA1"G(i0';'16/1

OA'ITI/:

OA'iWA

(H7.0?:,!

0.'1n20OAZl(-;·1

OA::S(j!

0..,2647

OAl/SCOA~~g;;?

O.,130~m

OA3189

OA331U

OA3448O.<Í::;~;'(·',l

0.43689

0,'l3Sn

0.43\:'4:1

OA'1Otl2

0.4'11/9OA.-Wl;j

0.'1'11,030,44520

0,1;4630

OA'l}:JS

OA(W,C.I

(UtOG~'~\

G.,l!)i;?"

OAmJ<:,'\

0""'18,t5

0..149:;0

O,4(i{)Sa

0.'15íS40,45254

0.4r)35;~

OAli'149

0.455430.'1563/

O-'iGW(';

O,f,15miS

0.'r!Ci(i:~

i ,;)3

't!()

'1,42

1:.l2

'iď!4

'1,33

IA'i

j,S:l

1.1;·11.'15

i,!H

1.!iG

:.%157

I .• l-'J

1.31;

1,/8

1.591,GO

1.61

1,6?

1,(i3

·i.Citl

i.(lf)

1.6l1

'.Irl1.68·1.G0

1.7(J

"í"!1

U2Li3

158

lJl7

108'1,49

1,50

15':1m

iJ9

1.N:

1.11'1

O:XifUi

0.;((33l

O.?i'(:3í'

O.?'hl:l:~

O,CiH;!:>!)

O,2Hli?-1

O.28i1i'i

(),-;9103

O,?U389

0.2%"13

O.?\I!J5!j0,302:)4

0,30:)'11

0.::;078(';

lU105}0,31327

0.:'I'I::i94

O.:JH,59(U21:~1

0.32:3B·10.3263(-)

0.32894

O,33i1'(

0.3:3398

O.3::l(W':i

0,336:11

(J,:f/ii9i)

037~)(i8

OAO'I-t7

O.:-;tl1:l-1

O.:J4;37~i

O,3.-!614

O.J4llS0

0.:"60(>:10.::;5:314

(J,3S54:J

O,35'16B

O.3(i9~)3

(),:;fi2'lti

O.:j0'i3:~

o.':GG~;O

O.:l(;!lt34

O,3'íOi'G

tL'ir?liG

0.2l·;80'-\

()Aj1'i~i

0.26;\;'·1

D,~:;g6i,~;

OJe~ln

o.:)(!OU~i

O")f\Xi,

O.:!:;'íO!)

O?('?\jS

n.?,' (l', I

O.:j97f';'i

'i:I,·1

í.H'·,19

().8~j

0.84O()~i

0.86

O.GY

0.88

0.39O.f!O

051'1

0.920.93

0.84

0,96

';;ii

(UO

0,!)6O.D·j

O,ml

O,i)(-l

i,OO

1.0'j

·I.O?

1.03

1.041,0(;

I,OG

'UlY

;UI

O.'fJ

Ol:)

(),l:;

103

(U:;

Ol(i

OJ(

IU8

fUS

rUIn0.10/1

D.g?

':.:h;

O.r!Yl\JS

O.O'i'IM

C,ť)'IG0G

(l.OlS9,j

o.onwO.02"iSO

O.O:JiN~

() Jr.)~j[IO

O.OJ!·.:n:j

o.o-t:.'·)JO

O.O·i7f6

0,05177

O,iin!;

(J,"íJ308?

O:i8-'139

0,1$1(,::;

O.í!n'~(\

O:íiW·nO,i91l-j'(

O,?O'194

().;!U~'<10

O:,:(mi.\<i

0;;'1:22(;

O.:,~'i!_;IiG

O.?H'(H

O.~~?S:r(

n.?~rDi

().:(:)ť;G~;

GX'i:)9'1

O.O~i~iSi'

{i.(b~i62

li.OG',5[\

0.05"/40

O.O"li4?

0,OTG35

O.07D26

0.08317

O,OSlOfl

O.OG(}9(j

o.Gfwn0.09871

0,'10257

o,-;aG~?

o:li026

fI.n-m9O:iH9i

O:12H2

O:12S(j2

O:i2930

0.1:l30r

0.13683O.'i40fi(l

O.'I4>i3'

0.1>1[\03

O.151T~

0:I!i(i42

O.1SHiO0.16276

0.166'1O.1"ro03

1l.17:)()'1

OAS

0,13

0:14

O.1{i

0.25{Uli

0,2"1

0.7.8

0.29O},O

0.3'1

0.32

0.33

0.34

(),:-l5

O.::~6

O,:rt

0.38

0.:39

0.110

0.'1'1

iJ

O.H'O:ll

O. Hl

0.190.20

0.21

o.n0:230,7.-1

(l.(J"i

() ,o;>

o.ľn

O.lH

0.0(;

o.()[)

(Uf!

O.Oh

Q.O\!

2.. 48.(5,36)

;';"" (3,9)

(2,24) \40.

Ze zkmlilH\ných 1?,ldOfl) .ie potyrz,cn vliv dodavatele, ostatní (1)\dmy nemají vliv na

produktu.

16. Dvou1?Jdorová analýza rozptylu s opakovánim Pro výpočet ie pou>ito tran:;!ormacc:

(x,;! 97,0).10.

fabull", 18.

Výsledek analýzy ukazuje, >0 druh pece významuě. pl\sobi na kvalitu karbidu vápnlku,

vliv druhu smčny nebyl prokázán.

Z výsledku vypl)'vá, >e neni prokúzán významný rozdíl ve výl((\l1cch kHd);dových pecí.i 6 2 DVOl1faktoroYá analý;,a rozptylu. Pro výpočet le provedena trausf()rntae

e

u 'I (v" 2'/9).10. Výsledky isou uvedeny pro tuto trans(t)!'!),aci.

[Cl. JednoEddorová analýza rozptylu. Pro ie v tomlO niíkladu vhodne všcc[ll1Vhodnoty zrnenšit 01280. Pro tyto hodnoty.Je tó> uvolen v)is"lcdck

Page 121: Statistika skripta

x/A

xUcII

O,O'II~j

'j 0,9:S53 0.982!; 0.9631 0.9385 C.H"j'81 OXNI'l 0.1344.2 O.nOf.l8;> O.OSA) O.CH :38

O.OOOS (JODO? \.},oooo 0.00003 0,0028

2 O.999a O.99as 0,9064 0.9921 0.fl769 Q,97G9 0.9659 Q,95!,)3O.·j ;5'1;2

0.04240.0012 O.aOO2 0.0(0)

,1 O.OHLi3 i .0000 0.9999 0.9991 0,0090 O.$3~366 O.ODCl) 0.994·2- 0.9:109

0.2[~5 'i 0, 'i7':~o 0.09960.0049 OJ.l(ll'! ().ooo~), 0,0293

4- '1.0000 '1.0000 '1.0000 1.0000 0,0906 O.9flOG O.9f392 0.9966,) 0.445/ 0.:\00/ O.H}·í2 O.O·íS·l 0,0037 t),OO2ep o.onI1

r.l 1.0000 i .0000 '1.0000 1.0000 '1.0000 O.99;Ji3 " O ()O6~\ 0.449/ 0.3'1340.0375 O.OH)? 0.0016·i.OOOO 0,9999 O.:;~()68"l O.llf4D 0.598}

0,'130·1 O.OIí5S O.O)[)f\OA5~~O 0.3230 O.U'ian

:'S 0.84/2 0./20'1O..?2G2 0.1 <')2 0.05400.592:; O.4b0,l (Ui3/A,

t? fUJ'iC'1 U.1~30[)O<;\Y?tl 0.2320 0.0991:30.7·100 0.58/li- O.DSUD

xl iL'10 0.9574- (1,DO'íS

0.45"19 O,:hOb U.'fGS8 O.'; ·WSO.B159 O.lOGO11 O.O/SB CUHG70,5030 OA599 0..25'17O.i38WI 0,80dO O,-1134D

'f2 0.9:·)12 O.orlGO.696B O.bl03 0,:3532

1 0.T125 0J353 U.688 0.6027 O.626f) 0.5818 O.6!j}B 0.5249 I'"O.D362 O.ff75B O.7!316

O.267C

2 0.9371 0.0197 0.9004 0.8795 0.8571 0.83:3:3 0.8081l 0.1834 O.99G4 O.9B12 0.[;;658 O.D2Bi0.68B7 0,463'1 O.36:t'?

'j/.) O.99t")() 0.00430.86·15 0.7813 0,51'30

3 0,9865 0.9310 0.9743 U.9G62 0.9:369 0.9·463 U.9:144 0.9212 o.Gon O.95í3!i 0.9165OAG5l

jr 0.9095 (),Bb40 0.b7h1. ,) 0.9976 0.568·j4 O,gnTI O.9S'63 0.9846 0.G823 0,9893 0.985/ 0.9814 0.8163 i r' O.B9'W 0.9780 O.SS·iCJ 0.90"74-,0 0,9998 0,999 0.70365 0.89G/ 0.8884 0.9999 O.B985 0.98/Il 0.9968 0.9955 0.9940 1/

O.9903 0.9889 0.8730 0.94410.064'1

6 i .0000 0.9999 0.8899 0.9997 0.9996 0.9994 09881 O.8GIl70.9999 0.999[) 0.9984 0.9947

0,8355 0.1489Hl '1.0000 0.9909

0.985/ 0.9678 0.89057 1.0000 1.0000 UlOOO 1.0000 0.9999 0.9999 0.9898 0.99n7 'j()

0.9993 0.09/(j O.9n2.8 0.91l230.6196

8 1.0000 1.0000 i 1.0000 1.0000 i .OUOO 1.0000 1.0000'10000 i .0000 0(109/ 0.9989

0.9302 0.a75220 1.0000 i .0000 0.9999

0.9965 0.9907 0.957:3 0.917021 'i. 0000 1.UOOO

0,9990 0.09[34 0.9953 0,97:,)022 1.0000 0.0998 O.99f;3 0.08n

0.94691.0000 1.0000 1.0000 O.S999

0.9859 O.9G73

I···r·-· ·.··.·1 r T I

"'''-I T

. "'--,. -·'''1 23 1.0000 O.90:!1 (J.0890 0.9024xll i .8 2.0 2.5 3.0 3.5 40 4.5 I 5.0 I 10000 ·1.0000 0.9805i

0.1353 r ! ! 0.013:1 i 6.003/ I 24 1.0000100UO O.99~19 0.9995 0.9996

I

O

I0.1653

I

0.082i 0.0408 0.0302• I O.Oi·j 1 1.0000 1.0000 ·i.OOOO 0.8805

I

i ! 25 1.0000 1.0000 U1000·I.UOOO 0.0998 O(l998 0.988li1 0.4628 0.4060 0.2313 0.18rJ'i 0.B59 0.0816 0.06i 1 0.(1Lf(14 1.0000

I I 1 I i .0000 O.f)99fi 9.90892

I0.7306 0.670'1 0.5438 0.4232 0.3208 0.238i O.rn8

I0.i247 0.993li

3 O.H9·1:5 0.35/i 0.7516I

0.6412 0.5:166 0.4,3315 I 0,3423 0.2650 I4

I0.8036 0.8473 0.88i 2 0.li153 0./254 0.62g8 0.532i I 0.4405

I I I,

Ir O.08()6 0.9834 0.9580 0.9101 0.85/0 0,7851 0.7029,

0.6100,) !I

li I 0.9974 0,9055 , 0.9858 , 0.9665 0.9347 i 0.8893 0.8311 0./622., I I I, I 0.9994 O,99g9 I 0.9958 0.9881 0.9733 0.9489 O.9i34 0.8660

III I

,II O.~)H9O 0.9998 0.8888 I 0.9902 0.9901

I0.8786 0.9597 I 0.9310

9 i .0000 1.0000 I 1.0000 i 0,9981 0.9967 0.99H3 0.0828 0.9682

I I

iO i .cono i .0000 0.988B 0.9991 0.9080 I 0.99'/2 0.8833 0.9863

III i 1.0000 1.0000 I 1.0000 I 0.9999 0.8997

I0.B~;91 0.0976 0.9945

I I12 1.0000 1.0000 1.0000

I1.0000 O.mlOO 0.9997 0.80B2 U.891l0

I'13 _,.1." 1.0000 i .0000 J i.OOOO '1.0000 1.0000 L 0.9999 0.8991 L0.9993

Page 122: Statistika skripta

jJ i"iloha :1 hodnoty

),'i'/2.:2,2?,l

"hi ,I.~L:':

?3a7;~.426

2,4n'i

2.!)Ei'i2,!ST!2.600,2,G23

2.GB::;2.7012./'l'(

;2,6442.064

0.2100.'1'1)0,'\;:;4

n.3j)']

0.3"750,3()'10.349

0./j'!:)'1

O.43COAOf!

0.2131C.275

O.3HjO.3DQ

v/La.hu

0.53.240.51390.4973

0.30440,2500O,18bO

2.02:12.0001.084

íG/1l,nco

),1 '?

79. 'I B3,3'124.3 '129.6

43217,n

4..«5.01

40.5

Kritické hodiiOLv rveJ l' J J

1213'14 5.63·i5

60'100

(ll)

'19,49

2,04­2,4:>2))

2,192,'13

S,G6,1,4-'\3,7'13,272,072,1G2,502,'12'\ ,91'I )0íí ,52'lA8'I'1,43'1,4,11,39

2,'\0

.; "J')! !.),-

"I )0

2,072,002,042,031,981,97'I

4,1b3.-n:.:',4.\(3.23

'19/fl<3,856.04

3,733,20

2,002Je2,O'j2, 'i ~~

'1,93'I )~?,

'j,b?'1,66

'i ,AS·j,t.j·6

2,712,5'\2,:,32,252,202,172,142,'í32,1 'I?:i O2.,062,04,

i ,52

19,48í),57

5,684,42

I'I ,:OhL34I

3,!SO3,30

1i-,gB4,?:'\

6,,09

'j ,60

3,583,363,222,792,()()

2,422,342,292,2b2,23

1,6(3

'\ ,5G

'j ,A,:,~

'j ,40

4,443,75::j,3?3,022,80/:,(-)1(.

2,18'\,97ci ,"76

19,488,sa5,70

2,13

2,2'12,2()2,'192,14

'í ,49': Ag

19,333,9,~,

6.1C4,95J1",2B

i ,89

'19,1,78 ~o

,oJ,;'

!5,72­4,4()3,TI

1,'ln'j ,Og

1,63~: . ~)~.j

2/;32,4·~i

2,402,372,332,3~~

2.312,262.,24

3,343,0 1;

2,332,n{)

~~,20

2,902,7'1

'1,5A'j ,531,52

2.,00

3,33

'\9,30,0'16,26f),O~~

4,:1H3,973.603,'1·8

3,002,872,092,()12,562,532,502,'«92,472\464A22,40

'19,463,62!),7 fJ

4,503,8'13,3(j3,082,eG2,/02,252,(Hí ,{H

1J4'1 ,GS)1,r.:ó'\,G21,00'l,69'1.571,!.i2'l,!.)(!

b,'194,534., c( 2:

3,1343,63

19,259, '\.?,

C,3n

19,449,66!),BO4,50~),a7

3,!j~)

4,'/6'1,,354,07~,SG

3,713,293,102,92

2.,8·42,792,762,742.732,722,702,m)2,63

2,'1.2'1,93'j J)/f

1IB'i ,75

i J2'\,"/0'1,69'i /JB'1,62'1 fY!

3,1b

2/i!:­2,'11

1n,'Ít)9,:2BG,5Db,«"i

I,oa

3,36

::',153,133,113,103,093,043,03

3,14;?,,9B?S42,362,-16

2,03"1,99

'i,93'1 ,GS·j.Bc)

19,48.'1116,864}44,003,63

Ul!1,9!)

G,9A,!}J95,'!44,71:1.4,46f.~,2.6

4,102>,083,493,323,233,18

'19,00

3,6e3,39

5,'\24,n64,544,3b4,244,174,Oe4,034,00~i,9S

3,963,'353,D43,893,87

'19,3b9,B16,004,T74·,"\0

3,022,::i92,302,2'\2,L~

2,07:2,042,022,00'i ,99'j ,D7i ,93

3,'15

6,6ir;,9~,}

b,32

~\ 8,5'1'10,'1 (\

"7,71

00'\002003004·00

23

~jO

hO10BO

'~'O

40[JO0070gono100200300400

'15

9íO

2030

Page 123: Statistika skripta

6 11\'n

3 ~:'!.Í,

6 :')4

'10 8611 1!.Í/)

12 230

2. I<ritick) počet sérií pro dan\/ poc:ct rnčření

P(i)()ha (',

D" AI .ARi)

O 0.6'142O 0.7264

2.;28:< O2,,'1 'jl;.

1.9?Aí .í,i(,)4

'í.12 325<3 0.7"/85 0.284 1.717 0.3557 0.'1540 0.9320'13 ~s,33G O.n04 0.306 "1.692 0.361 :) D.1708 CL9412'14 3.40/ 0.1630 0.329 'l.6i'i () .360i i O. i BG3 0,949315 3.4T2 0.7:.'>62. tl348 1,652 0.5109 0.200li O.950S

26j-

30

I ,~O, !:;O,

I !~)

I.. 'iOO

1······fi-···r·~;;;·~L-'~'·····'T"'A:,-I··;~·r·ř;·'T' [""2"'j'T1i301 ·1~88T'r·ÍJ.IÚ"j·ir";e:4'2.. ·""·(/"i"':'i7i5B'·iI 5 I 2,~194 1.112:1 i 0.75 0.7236 O 2.092

I4 ,1.880 0.720 I o:n 0.'1979 O 2.33

5 11.590 OS!I I 0.71 I 0.8401 O ..... J 2.128

~. ~;;~~-~~~g~~r~~~~~ ~.~~~'~~~~.

1

9 '1.11S 0.3"73 0.68 i 0.9027 O.ing '1.8319 1094 0.531 I 0.01 II 6.9139 0.2211 .174

I. ~ ~ ~~;~ "'1' ~;~~ ....j... ~.~~ "", ~~~t .I~~T~ .: .~~~12 0.925 0.200 0.65 0.9359 '11 0.346 "1

1

1.654'i:) 0.884 I 0.249 0.65 0.94Hl 0.375 i .625

~ ;;,i~~~L'll ~~;~~~;.I~~~;~~ "1' ~.•~~ ~;;; ,···1

:i; II ~;~~ I I, ~;;~; I ~:~;~;~~::~ "1' ~:;~:~ I I,i ~~;~~ 1[1 ~:~~ ;;~~ I20 0.697 I 0.96'19 0.507 ..---1,.--- '1.493 .,[1

21 0,619 1 I (jS63i; O:S2014Ši'22 O.GG2 Iii ,O.qG5f.~ 0.:);\-1 'j .469 II

23 ! 0,6'f7 .Ii 0,96/0 OS«~ 'j .157

;~4 0.632 0.9684 ..1'" O_~152 1.4'-17 I__ "_W' O,ťdf; ... ~ 1--- O.96DG , O_!5G2 _L -1,43(3 .!! O.!:iG2 I i O.91!~e

00483 (),HS'! 1O.tni : OJj9Sti-O

0.350 ..Ii O.D{KiOI 0.302 C),\)92S

". _L.

66.6'75

248