bazele statistice ale hidrologiei - hidrotehnica · pdf file5. repartiºii continue...

186
MINISTERUL ¥NVźÅMÂNTULUI Program TEMPUS S_JEP 09781/1 GESTION ET PROTECTION DE LA RESSOURCE EN EAU Radu DROBOT BAZELE STATISTICE ALE HIDROLOGIEI Serie coordonatå de: Radu DROBOT - Universitatea Tehnicå de Construc¡ii Bucure¿ti Jean Pierre CARBONNEL Universitatea Pierre et Marie Curie - Paris 6 EDITURA DIDACTICÅ ªI PEDAGOGICÅ, R.A. - BUCUREªTI, 1996

Upload: lemien

Post on 06-Feb-2018

223 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

MINISTERUL ¥NVźÅMÂNTULUI

Program TEMPUS S_JEP 09781/1 GESTION ET PROTECTION DE LA RESSOURCE EN EAU

Radu DROBOT

BAZELE STATISTICE

ALE HIDROLOGIEI

Serie coordonatå de:

Radu DROBOT - Universitatea Tehnicå

de Construc¡ii Bucure¿ti

Jean Pierre CARBONNEL

Universitatea Pierre et Marie Curie - Paris 6

EDITURA DIDACTICÅ ªI PEDAGOGICÅ, R.A. - BUCUREªTI, 1996

Page 2: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

ISBN 973 - 30 - 4832 - 1

Copyright © 1997. Toate drepturile asupra acestei edi¡ii sunt rezervate Editurii Didactice ¿i Pedagogice, R.A., Bucure¿ti

Redactori: Iuliana ARHANGHELSCHI ¿i Tincu¡a ANTON

Grafician: Dumitru ªMALENIC

Page 3: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

PREFAºÅ

Cursul BAZELE STATISTICE ALE HIDROLOGIEI î¿i propune o prezentare didacticå a no¡iunilor de bazå ale statisticii matematice ¿i ale utilizårii acesteia în domeniul resurselor de apå. Materialul este prezentat gradat, trecerea de la no¡iunile elementare la cele de mare complexitate fåcându-se foarte lent. S-a urmårit, în special, în¡elege-rea pe baze intuitive a unor no¡iuni matematice considerate adesea dificile, renun¡ându-se, din acest motiv, la demonstra¡ii matematice care fac de altfel obiectul altor cursuri. Numeroase exemplificåri din domeniul practic au rolul de a permite în¡elegerea corectå a no¡iunilor prezentate, în vederea formårii unui mod de gândire statistic, atât de necesar în hidrologie ¿i gospodårirea apelor, unde informa¡iile de care se dispune sunt adesea insuficiente. Farå a idealiza calculul statistic, s-a insistat mult asupra premizelor sale, pentru a-i în¡elege corespunzåtor posibilitå¡ile, dar ¿i limitele. Nu trebuie uitat cå probabilitatea constituie o måsurå a incertitudinii ¿i cå abia pe måsura cunoa¿terii aprofundate a unui fenomen i se pot descifra corect mecanismele ¿i deci, se poate ajunge la formularea unor dependen¡e de tip determinist, de la cauzå la efect. Pânå la realizarea acestui deziderat, abordarea statisticå este în måsurå så ofere råspunsuri ¿i solu¡ii la o serie de probleme practice din domeniul cunoa¿terii ¿i utilizårii resurselor de apå. Terminologia utilizatå este în concordan¡å cu STAS-urile în vigoare, dar ¿i cu limbajul matematic al teoriei probabilitå¡ilor ¿i statisticii matematice. Lucrarea BAZELE STATISTICE ALE HIDROLOGIEI se adreseazå speciali¿ti-lor din domeniul resurselor de apå, cursan¡ilor de la cursurile ªcolii de Studii Postuniversitare INGINERIA RESURSELOR DE APÅ, ca ¿i studen¡ilor de la cursurile de zi, care au hidrologia ca obiect de studiu: Hidrotehnicå, Hidroenergeticå, Agronomie, Geografie, etc.

Autorul

Page 4: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

CUPRINS

1. GENERALITźI ...................................................................................

1.1. Statisticå matematicå. Defini¡ie......................................................... 1.2. Variabile deterministe. Variabile aleatoare ....................................... 1.3. Clasificarea variabilelor aleatoare ..................................................... 1.4. Popula¡ie statisticå. Selec¡ie .............................................................. 1.5. Frecven¡å absolutå. Frecven¡å relativå. Probabilitate.......................... 1.6. Reparti¡ii teoretice. Reparti¡ii empirice .............................................. 2. VARIABILE ALEATOARE DISCRETE .............................................

2.1. Repart¡ia unei variabile aleatoare discrete ......................................... 2.1.1. Exemple de reparti¡ii discrete ..................................................... 2.1.2. Reprezentarea graficå a reparti¡iilor discrete ............................... 2.2. Func¡ia de reparti¡ie a unei variabile discrete .................................... 2.2.1. Proprietå¡i ale func¡iei de reparti¡ie ............................................. 2.2.2.Reprezentarea graficå a func¡iei de reparti¡ie pentru o variabilå discretå ......................................................................... 2.2.3. Probabilitatea apari¡iei unei variabile discrete într-un anumit interval ............................................................................ 2.2.4. Reprezentarea func¡iei de reparti¡ie a unei variabile discrete (sau discretizate) cu valorile grupate pe intervale ........................ 2.3. Complementara func¡iei de reparti¡ie (probabilitatea de depå¿ire) ..... 2.3.1. Interpretarea geometricå a probabilitå¡ii de depå¿ire ................... 2.3.2. Reprezentarea graficå a probabilitå¡ii de depå¿ire ....................... 2.3.3. Rela¡ia de calcul a probabilitå¡ii de depå¿ire ............................... 2.3.4. Calculul probabilitå¡ii de depå¿ire a valorilor xi în hidrologie ...... 2.4. Modul de reprezentare a func¡iilor de reparti¡ie în hidrologie ............ 2.4.1. Semnifica¡ia probabilitå¡ii de depå¿ire în hidrologie .................... 3. VARIABILE ALEATOARE CONTINUE ...........................................

3.1. Densitate de reparti¡ie. Func¡ie de reparti¡ie ...................................... 3.2. Reprezentarea graficå a probabilitå¡ii de depå¿ire în hidrologie ........ 3.3. Extrapolarea reparti¡iilor empirice prin reparti¡ii teoretice ................ 4. VALORI TIPICE ALE VARIABILELOR ALEATOARE .................

4.1. Parametri ai tendin¡ei centrale ........................................................... 4.2. Parametri ai variabilitå¡ii .................................................................. 4.3. Parametri ai formei ............................................................................ 4.4. Calculul parametrilor statistici ai reparti¡iilor empirice ...................... 4.5 Evaluarea parametrilor reparti¡iilor teoretice ..................................... 4.5.1. Metoda momentelor .................................................................... 4.5.2. Metoda verosimilitå¡ii maxime ................................................... 4.5.3. Metoda celor mai mici påtrate ..................................................... 4.6. Erori ¿i limite ale calculului statistic ..................................................

7 7 7 8 9

10 12

13 13 15 17 21 22

25

27

30 32 34 35 36 39 42 45

48 48 53 54

57 57 61 67 69 73 73 75 77 81

5

Page 5: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..............

5.1. Reparti¡ia normalå ............................................................................ 5.2. Aplica¡ii ale reparti¡iei normale în hidrologie .................................... 5.3. Reparti¡ia log-normalå (logaritmic normalå) ...................................... 5.4. Reparti¡iile Gama .............................................................................. 5.4.1. Reparti¡ia Γ1 ................................................................................ 5.4.2. Reparti¡ia Γ2 ................................................................................ 5.4.3. Reparti¡ia Γ3 ................................................................................

5.4.4. Corec¡ia de siguran¡å ∆Qp% .......................................................... 5.5. Reparti¡ia Gumbell ............................................................................ 5.6. Reparti¡ii statistice auxiliare .............................................................. 6. INTERVALE DE ¥NCREDERE ...........................................................

7. VERIFICAREA IPOTEZELOR STATISTICE ...................................

8. VARIABILE ALEATOARE N-DIMENSIONALE ..............................

8.1. Func¡ie de reparti¡ie ¿i densitate de reparti¡ie .................................... 8.2. Variabile aleatoare bi-dimensionale .................................................. 8.2.1. Reparti¡ia normalå bi-dimensionalå ............................................ 8.2.2. Reparti¡ii empirice bi-dimensionale ............................................ 8.3. Reprezentåri ¿i reparti¡ii empirice bi-dimensionale în hidrologie. Corela¡ii ............................................................................................ 8.3.1. Clasificarea corela¡iilor ............................................................... 8.3.2. Coeficientul de corela¡ie al variabilelor bi-dimensionale ............ 8.3.3. Interpretarea coeficientului de corela¡ie. Proprietå¡i .................... 8.3.4. Estimarea parametrilor regresiei liniare simple ........................... 8.3.5. Intervale de încredere în cazul regresiei liniare simple ................ 8.3.6. Regresia neliniarå simplå ............................................................ 8.3.7. Raportul de corela¡ie ................................................................... 8.4. Corela¡ii liniare multiple ................................................................... 8.4.1. Coeficientul corela¡iei liniare multiple ........................................ 8.4.2. Autocorela¡ia sau corela¡ia serialå ............................................... 8.5. Generarea debitelor ...........................................................................

BIBLIOGRAFIE ....................................................................................

85 85 92

100 105 106 108 115 125 126 127

132

138

144 144 147 150 150

152 156 158 162 164 169 171 174 177 179 180 182

185

6

Page 6: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

1. GENERALITźI

1.1. STATISTICÅ MATEMATICÅ. DEFINIºIE

Prin teoria statisticii sau statisticå matematicå se în¡elege disciplina care se ocupå cu formularea ¿i interpretarea legilor de comportare atât ale fenomenelor de maså (inaccesibile metodelor deterministe), cât ¿i ale fenomenelor rare, având o frecven¡å reduså de apari¡ie (V. Bobancu, 1974). ¥n cazul fenomenelor de maså, legitå¡ile statistice trebuie interpretate ca tendin¡e predominante ¿i pot fi eviden¡iate numai în condi¡iile unui numår suficient de mare de observa¡ii asupra ansamblului studiat (C. Moineagu ¿.a., 1976). ¥n domeniul hidrologiei, sarcina de a ob¡ine informa¡ii primare asupra mårimilor hidrologice (niveluri, debite, viteze etc.) revine hidrometriei, iar totalitatea datelor privind råspândirea, cantitatea ¿i varia¡ia apelor de suprafa¡å ¿i subterane constituie fondul hidrologic. Prin prelucrarea statisticå a datelor din fondul hidrologic se ob¡in în principal parametri necesari pentru dimensionarea lucrårilor hidrotehnice.

1.2. VARIABILE DETERMINISTE. VARIABILE ALEATOARE

¥ntrucât baza teoreticå a metodelor utilizate în statistica matematicå o constituie teoria probabilitå¡ilor, este necesarå reamintirea unor no¡iuni de bazå din acest capitol al matematicii. De la început trebuie fåcutå distinc¡ia între mårimile deterministe ¿i cele aleatoare. Dacå un anumit fenomen depinde de un numår restrâns de cauze cunoscute (sau eventual influen¡ele altor factori sunt nesemnificative ¿i deci nu mai are sens cercetarea lor), variabilele care definesc acest fenomen sunt de tip determinist; caracteristic mårimilor deterministe este legåtura directå între cauzå ¿i efect (în sensul mecanicii newtoniene). ¥n alte cazuri înså, fenomenul studiat depinde de o multitudine de cauze, principale sau secundare, esen¡iale sau neesen¡iale, de multe ori greu de descifrat ¿i de naturå så imprime o mare variabilitate cazurilor singulare (C. Moineagu ¿.a., 1976); în aceste condi¡ii, fenomenul este tratat independent

7

Page 7: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

de cauzele care îl produc, iar variabilele care îl caracterizeazå capåtå un pronun¡at caracter aleator. ¥ntr-un limbaj simplist, o variabilå aleatoare este o mårime care, ca rezultat al unui experiment, poate lua o valoare oarecare din domeniul såu de defini¡ie, fårå så se poatå preciza dinainte care va fi aceastå valoare. Realizarea unei anumite valori a variabilei aleatoare are deci un caracter pur întâmplåtor; termenul sinonim de variabilå stohasticå eviden¡iazå tocmai acest aspect (în limba greacå stohosis înseamnå presupunere sau conjuncturå). De exemplu, prin aruncarea unui zar perfect omogen nu se poate anticipa care fa¡å va fi deasupra dupå cådere. La fel nu se pot preciza dinainte debitele maxime anuale care se vor realiza în viitor pe un curs de apå. ¥n hidrologie sunt utilizate atât metode ¿i modele deterministe, cât ¿i metode ¿i modele probabilistice, alegerea unei abordåri sau a celeilalte depinzând de cantitatea de informa¡ii disponibile sau de gradul de cunoa¿tere a fenomenului analizat. La transformarea precipita¡iilor în componente ale scurgerii, se poate admite de exemplu cå distribu¡ia acestora depinde numai de intensitatea ploii ¿i umiditatea solului, ignorând restul factorilor care au o influen¡å mai reduså. ¥n aceste condi¡ii este posibilå stabilirea unei legåturi cauzå-efect, de tip determinist. ¥n mod similar se petrec lucrurile ¿i la evaluarea evapotranspira¡iei de la suprafa¡a apei, considerându-se cå aceasta depinde numai de viteza vântului ¿i deficitul de umiditate al aerului. ¥n schimb, dacå se examineazå regimul debitelor maxime viitoare ale unui râu - regim care depinde atât de factori locali cum sunt cei fiziografici, cât ¿i generali, de tip climatic (¿i a cåror evolu¡ie nu este cunoscutå) - o abordare de tip determinist este imposibil de realizat, pentru evaluarea debitelor maxime necesare proiectårii construc¡iilor hidrotehnice utilizându-se metode statistice.

1.3. CLASIFICAREA VARIABILELOR ALEATOARE

Variabilele aleatoare sunt de tip discret, atunci când iau o mul¡ime finitå sau cel mult numårabilå de valori (se reaminte¿te cå o mul¡ime numårabilå este infinitå, putând fi puså în coresponden¡å cu ¿irul numerelor naturale care este infinit). Variabilele aleatoare care pot lua doar un numår finit de valori se numesc variabile simple ¿i constituie un caz particular al variabilelor discrete; acestea sunt de altfel utilizate în prelucrårile hidrologice. Variabilele aleatoare sunt continue, atunci când mul¡imea valorilor lor este nenumårabilå; cu alte cuvinte o variabilå aleatoare continuå, poate lua orice valoare în intervalul ei de varia¡ie sau la limitå între -∞ ¿i +∞. Variabilele aleatoare mai pot fi clasificate în variabile dependente ¿i independente. Din punct de vedere intuitiv, douå sau mai multe variabile aleatoare sunt independente dacå probabilitatea producerii uneia nu depinde de

8

Page 8: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

faptul dacå celelalte s-au realizat sau nu. ¥n caz contrar, variabilele vor fi dependente.

1.4. POPULAºIE STATISTICÅ. SELECºIE

Prin popula¡ie statisticå se în¡elege orice colectivitate care face obiectul unui studiu statistic. Deoarece scopul unui astfel de studiu îl constituie stabilirea unei legi cantitative referitor la colectivitatea analizatå, popula¡ia statisticå poate fi interpretatå drept mul¡imea tuturor valorilor posibile ale unei variabile aleatoare. Elementele componente ale unei popula¡ii se numesc unitå¡i ale popula¡iei. Numårul N al unitå¡ilor unei popula¡ii constituie volumul popula¡iei. ¥n func¡ie de volumul popula¡iei, se disting popula¡ii finite (cu numår finit de unitå¡i) ¿i popula¡ii infinite (cu un numår nelimitat de unitå¡i). Cercetarea statisticå a unei popula¡ii se realizeazå urmårind o anumitå caracteristicå a unitå¡ilor ce formeazå popula¡ia respectivå. Cercetarea totalå (a tuturor unitå¡ilor unei popula¡ii) nu este înså nici posibilå ¿i nici necesarå în anumite cazuri; se recurge atunci la cercetarea unor e¿antioane sau selec¡ii, putându-se trage concluzii referitoare la caracteristicile întregii popula¡ii. ¥n hidrologie, de exemplu, nu se dispune de întrega gamå de valori posibile ale unor variabile aleatoare ca: debite, niveluri, precipita¡ii, temperaturi. Aceastå situa¡ie se explicå prin faptul cå marea majoritate a sta¡iilor hidrologice sau posturilor hidrometrice au o duratå de func¡ionare care de obicei nu depå¿e¿te 30-40 ani, singura excep¡ie constituind-o la noi în ¡arå Dunårea, pentru care se dispune de înregistråri din anul 1838. Cu alte cuvinte, în locul popula¡iei statistice se dispune de o mul¡ime finitå

de elemente observate : x1, x2,... xn, adicå de o selec¡ie sau e¿antion de volum n, unde n este numårul elementelor observate. Ca urmare, în hidrologie se pune problema de a determina o serie de caracteristici (debit cu o anumitå probabilitate de depå¿ire, valoare medie, abatere medie påtraticå etc.) ale unei popula¡ii statistice, de¿i datele disponibile au un volum limitat n. Mai mult decât atât, dacå s-ar considera o altå selec¡ie, de asemenea de volum n (dar referitoare la altå perioadå de observa¡ii), parametrii celor douå selec¡ii ar fi diferi¡i, de¿i selec¡iile fac parte din aceea¿i popula¡ie statisticå. Varia¡iile rezultate de la o selec¡ie la alta se numesc fluctua¡ii de selec¡ie. Este evident cå, cu cât numårul observa¡iilor (sau volumul selec¡iei) este mai mare, cu atât semnifica¡ia rezultatelor ob¡inute va fi mai ridicatå. ¥n hidrologie se considerå în mod obi¿nuit cå o selec¡ie de volum n > 30 oferå o precizie suficientå a calculului; atunci când volumul selec¡iei este prea mic (n < 30), pentru a se elimina erorile la determinarea parametrilor statistici

9

Page 9: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

vor trebui introduse anumite corec¡ii (de exemplu pentru coeficientul de varia¡ie sau coeficientul de asimetrie). Statistica matematicå utilizeazå metode care permit ob¡inerea unor caracteristici ale unei popula¡ii, numai prin cercetarea directå a unei par¡i nu prea mari din unitåtile popula¡iei. O asemenea cercetare selectivå va conduce la concluzii care au un anumit grad de incertitudine care nu trebuie pierdut din vedere la valorificarea ¿i interpretarea rezultatelor. Pentru ca rezultatele ob¡inute prin studierea unui e¿antion så reflecte cât mai corect caracteristicile popula¡iei din care a fost selec¡ionat, trebuie îndeplinite urmåtoarele condi¡ii (C.Dinescu, V.Såvulescu, 1978): a) popula¡ia din care se extrage selec¡ia så fie cât mai omogenå; b) volumul selec¡iei så fie cât mai mare; c) toate unitå¡ile care formeazå selec¡ia så fie extrase la întâmplare din popula¡ia studiatå; d) fiecare unitate a popula¡iei så aibå aceea¿i probabilitate de a face parte din selec¡ie. ¥n cazul hidrologiei, unele condi¡ii nu sunt îndeplinite decât într-o måsurå reduså (de exemplu condi¡ia b), în timp ce despre alte condi¡ii nu se poate afirma dacå sunt sau nu îndeplinite (condi¡iile a, c ¿i d).

1.5. FRECVENºÅ ABSOLUTÅ. FRECVENºÅ RELATIVÅ.

PROBABILITATE

Fie o selec¡ie de volum n ¿i x1, x2,..., xn valorile caracteristicii în ordinea extragerii, måsurate la cele n unitåti ale e¿antionului. De obicei, aceste valori se ordoneazå crescåtor (sau eventual descrescåtor); ¡inând seama de faptul cå unele valori pot fi egale, valorile discrete consecutive

vor fi notate acum prin x1, x2, ..., xk (k ≤ n). Trebuie men¡ionat cå valorile corespunzåtoare indicilor din noua numerotare nu mai corespund cu cele din

vechea numerotare. Fie n1, n2, ..., nk numårul de apari¡ii sau frecven¡ele absolute

ale fiecårei valori; deci valoarea x1 se caracterizeazå prin frecven¡a absolutå n1,

valoarea x2 a variabilei prin frecven¡a absolutå n2 etc. Evident suma frecven¡elor absolute este egalå cu volumul selec¡iei:

n nii

k

=∑ =

1 . (1.1)

Raportând frecven¡ele absolute la volumul selec¡iei (deci numårul cazurilor favorabile, de apari¡ie a unei valori, la numårul total de cazuri posibile) se ob¡in frecven¡e relative.

10

Page 10: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Frecven¡a relativå este prin urmare definitå astfel:

fnni

i= . (1.2)

Dacå experimentul se repetå, considerând un volum n al selec¡iei din ce în ce

mai mare, se constatå cå frecven¡ele relative fi tind så se stabilizeze; valorile cåtre care tind la limitå frecven¡ele relative în condi¡iile în care fenomenul ar fi supus în acelea¿i condi¡ii unui numår nelimitat de probe, reprezintå de fapt

probabilitå¡ile pi de realizare a valorilor xi (i = 1, 2, ..., k). Aceastå lege statisticå poartå denumirea de legea numerelor mari ¿i permite ca în practicå probabilitå¡ile så fie aproximate prin frecven¡e relative; deci:

pnn

nni

n

i= ≈→∞

lim i . (1.3)

Cu alte cuvinte, frecven¡a relativå ob¡inutå dupå un numår mare de experimente, poate fi folositå pentru aprecierea probabilitå¡ilor de producere a unui eveniment aleator.

Evident, pnn n

nnni

i

ki

i

k

ii

k

= = =∑ = ∑ = ∑ = =

1 1 1

11 adicå suma probabilitå¡ilor este

unitarå. ¥n continuare vor fi prezentate câteva situa¡ii particulare interesante. a) ¥n cazul în care volumul selec¡iei nu este prea mare, se considerå pentru scopuri practice cå probabilitå¡ile de apari¡ie ale diverselor valori sunt egale între ele, având valoarea 1/n. Aceastå situa¡ie se întâlne¿te de altfel curent în prelucrarea datelor hidrologice, mai precis a curbei probabilitå¡ilor de depå¿ire. Se pot da ca exemple ¿irul debitelor maxime sau minime anuale, al debitelor medii lunare, al debitelor medii anuale, al precipita¡iilor anuale, al evapotranspira¡iei etc. ¥n toate aceste cazuri se dispune de regulå de un numår de circa 20 ... 40 valori. b) ¥n cazul în care numårul n de måsuråtori este mare, se poate recurge la o grupare a acestor valori pe intervale egale. Frecven¡a absolutå în acest caz va reprezenta numårul de apari¡ii în cadrul fiecårui interval, iar probabilitatea raportul dintre frecven¡a absolutå a intervalului ¿i numårul total de probe. ¥n hidrologie, acest procedeu este utilizat la construirea practicå a graficului de frecven¡å al nivelurilor, plecând de la hidrograful de nivel dintr-o sec¡iune datå. Pentru studiul acestor variabile, domeniul de varia¡ie al caracteristicii examinate (debit, nivel etc.) se împarte în intervale elementare, fiecare

11

Page 11: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

con¡inând un anumit numår de valori ale ¿irului de date. Mårimea intervalului se poate alege dupå formula (V. Panaite, R. Munteanu, 1982):

dx x

n=

−+

max min

, lg1 3 222 ; (1.4)

unde xmax ¿i xmin sunt valorile extreme din selec¡ia consideratå, iar n este volumul selec¡iei. Evident d se va rotunji prin lipså sau adaus la numårul întreg cel mai apropiat. ¥n rela¡ia anterioarå, numitorul reprezintå numårul total m al intervalelor de grupare. Pentru n > 100, numårul de intervale se poate calcula cu una din rela¡iile:

( )m n= −⎡⎣⎢

⎤⎦⎥

414

11

5 , (1.5)

sau

m = n . (1.6) ¥n general, se considerå (V. Panaite, R. Munteanu, 1982) cå pentru n < 250 este suficientå împår¡irea în 10 intervale; dacå n < 25 gruparea valorilor nu se mai aplicå. Frecven¡ele ob¡inute dupå grupare se atribuie mijlocului fiecårui interval, intervalul fiind considerat închis la stânga ¿i deschis la dreapta.

1.6. REPARTIºII TEORETICE. REPARTIºII EMPIRICE Prin reparti¡ia (func¡ia de probabilitate sau distribu¡ia) unei variabile aleatoare se în¡elege exprimarea legii ei probabilistice (adicå a probabilitå¡ii cu care variabila poate lua diverse valori din domeniul ei de varia¡ie). S-a aråtat cå studiul unei colectivitå¡i sau al unui fenomen de maså se efectueazå în general folosind selec¡ii de volum limitat. Din acest motiv, rezultatele investiga¡iei statistice con¡in un anumit grad de incertitudine, care nu poate fi eliminat decât prin cercetarea întregii popula¡ii statistice. Variabila aleatoare corespunzåtoare studierii întregii colectivitå¡i se nume¿te variabilå teoreticå ¿i este evident diferitå de variabila empiricå, corespunzåtoare selec¡iei efectuate. Deci pe baza datelor ob¡inute din måsuråtori se dispune de reparti¡ia variabilei empirice (numitå ¿i reparti¡ie empiricå) ¿i care este mai mult sau mai pu¡in diferitå de reparti¡ia teoreticå (necunoscutå de altfel cu certitudine), corespunzåtoare întregii popula¡ii (P. Meylan, A. Musy, 1996).

12

Page 12: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

2. VARIABILE ALEATOARE DISCRETE

2.1. REPARTIºIA UNEI VARIABILE ALEATOARE DISCRETE

Reparti¡ia unei variabile aleatoare X de tip discret constå în enumerarea tuturor valorilor posibile ale variabilei, precum ¿i a frecven¡elor (probabilitå¡ilor) corespunzåtoare; reprezentarea rezultatelor se face sub forma unui tabel, numit tabloul reparti¡iei (tab. 2.1).

Tabelul 2.1 Valori xi x1 x2 ... xn

Frecven¡e fi f1 f2 ... fn

Se mai poate utiliza una din formele:

Xx x x

f f fn

n

: 1 2

1 2

L

L

⎛⎝⎜

⎞⎠⎟ ; ; ( )X

x

f xx

fi

i

i

i

:⎛

⎝⎜

⎠⎟ =

⎛⎝⎜

⎞⎠⎟ i = 1, n (2.1)

¥n cazul reparti¡iilor empirice, fi sunt valori numerice ¿i reprezintå frecven¡e

de apari¡ie a valorilor xi. Pentru variabilele teoretice de tip discret func¡ia de probabilitate se scrie sub o formå similarå:

( ) ( )Xx

ob X x

x

p

x

f xi

i

i

i

i

i

:Pr =⎛

⎝⎜

⎠⎟ =

⎛⎝⎜

⎞⎠⎟ =

⎝⎜

⎠⎟ ; (2.2)

¥n acest caz, probabilitå¡ile pi de realizare a valorilor xi au de regulå exprimåri analitice (ex: reparti¡ia Poisson, reparti¡ia Bernoulli etc.).

Mårimile pi = Prob (X=xi) definesc probabilitå¡ile de realizare a evenimen-

telor elementare (X = xi); valorile lor sunt cuprinse în intervalul [0,1].

13

Page 13: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Deoarece evenimentele (X = xi) formeazå un sistem complet de evenimente (reuniunea lor este evenimentul sigur) trebuie ca:

pii

n

=∑ =

11 . (2.3)

Reprezentåri similare ale reparti¡iei frecven¡elor se utilizeazå ¿i în cazul în

care se dispune de un numår mare de valori discrete ale variabilei ¿i este

necesarå gruparea lor. Alteori înregistrårile din måsuråtori sunt continue (de

exemplu cazul nivelurilor måsurate cu un limnigraf), dar pentru prelucrare se

recurge la discretizare, adicå la aproximarea func¡iei continue prin valori

punctuale. ªi în aceste situa¡ii se impune gruparea valorilor pe intervale.

Tabloul reparti¡iei frecven¡elor con¡ine de regulå pe lângå intervalul de

discretizare, atât frecven¡ele absolute, cât ¿i pe cele relative.

Fie o variabilå având pe a ca limitå inferioarå ¿i pe b ca limitå superioarå a

valorilor; se împarte domeniul de varia¡ie în m intervale egale ¿i se noteazå

capetele intervalelor de discretizare prin:

x1 = a + D, x2 = a + 2D, ..., xi = a + iD, ... unde D este mårimea intervalului. ¥n acest caz tabloul reparti¡iei frecven¡elor va fi urmåtorul:

Tabelul 2.2

Intervalul Frecven¡e absolute Frecven¡e relative

[a, x1)

[x1, x2)

[x2, x3) ...

[xm-1,xm)

n1

n2

n3...

nm

f1

f2

f3...

fm

n ni

i

m

=∑ =

1 fi

i

m

=∑ =

11

14

Page 14: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Din motive de alegere a unui numår întreg de intervale de discretizare,

xm = a + m . D ≥ b, deci b sau coincide cu xm sau este situat între xm-1 ¿i xm. Numårul de valori discrete ale variabilei s-a notat prin n. 2.1.1. EXEMPLE DE REPARTIºII DISCRETE

• Distribu¡ia discretå uniformå. ¥n cazul în care probabilitå¡ile elementare

pi=f(xi) sunt egale, distribu¡ia se nume¿te uniformå. Cel mai simplu exemplu de distribu¡ie uniformå este al variabilei aleatoare X care reprezintå numårul de puncte de pe fa¡a superioarå a unui zar dupå aruncare. Dezvoltat, func¡ia de probabilitate (reparti¡ia) se poate scrie astfel:

X :

1 2 3 4 5 6

16

16

16

16

16

16

⎜⎜⎜⎜

⎟⎟⎟⎟

. (2.4)

iar condensat:

X :

xi

16

⎜⎜⎜⎜

⎟⎟⎟⎟

; xi = 1, 2, ... , 6 . (2.5)

Probabilitå¡ile evenimentelor elementare au valorile pi = f (xi) = 1/6. ¥n mod similar, fie cazul unui ¿ir de debite maxime anuale pentru o perioadå de 25 ani. Fiecare debit realizându-se o singurå datå în cei 25 ani, probabilitatea sa de apari¡ie se considerå 1/25, iar reparti¡ia variabilei aleatoare va fi:

Qmax.anual :

Qi

125

⎜⎜⎜⎜

⎟⎟⎟⎟

; i = 1, 2, ..., 25 . (2.6)

¥n acest caz, probabilitå¡ile elementare sunt pi = f(xi) = 1/25. • Distribu¡ia Bernoulli (binomialå). Reparti¡ia binomialå se aplicå acelor

variabile care au doar douå ståri posibile, dar complementare, adicå realizarea sau nerealizarea unui eveniment (zi ploioaså - zi fårå ploaie, plus-minus, zero-mai mare decât zero etc.). Pentru un numår infinit de încercåri, se noteazå cu p probabilitatea de realizare a unui eveniment aleator ¿i cu q = 1 - p nerealizarea sa. Atunci proba-

15

Page 15: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

bilitatea de realizare a evenimentului aleator de α ori în n experimente este dat de termenul general al dezvoltårii binomului lui Newton:

( )p q C p q C p q C p q C p qn

nn n o

nn p

nn

no o n o+ = + + + + +− − − −1 1 1 ... ...α α α . (2.7)

¥n aceastå formulå ( )C

nnn

α

α α=

−!

! !. Evident p ¿i q fiind complementare,

p + q = 1. Legea de reparti¡ie va fi deci de forma:

Xn n

p C p q C p q C p qnnn n

nn

nn:

...

...

−⎛⎝⎜

⎞⎠⎟− − − −

1 01 1 1 0 0 0

αα α α . (2.8)

Deoarece p + q = 1, din rela¡ia (2.7) rezultå cå suma tuturor probabilitå¡ilor va fi de asemenea egalå cu 1.

Prima valoare pn reprezintå probabilitatea ca variabila X så ia valoarea n,

adicå evenimentul aleator så se realizeze în toate cele n experimente. Se observå

cå pentru n mare, pn → 0 (p fiind subunitar), ceea ce era de a¿teptat. Termenul

general reprezintå probabilitå¡ile evenimentelor elementare ¿i

exprimå valoarea probabilitå¡ii ca în cursul celor n experimente, evenimentul så se realizeze de α ori. Cele n experimente au fost presupuse independente, dupå modelul urnei lui Bernoulli.

C p qnnα α α−

• Reparti¡ia Poisson. Dacå în reparti¡ia Bernoulli, probabilitatea p de realizare a evenimentului aleator tinde cåtre zero (p → 0, deci are valori infinit mici), dar produsul np = λ este finit ¿i destul de mic când n → ∞, se ob¡ine o altå reparti¡ie numitå distribu¡ia Poisson (sau legea evenimentelor rare, deoarece p este foarte mic). Se poate demonstra urmåtoarea rela¡ie:

( )lim ;!n

p

nn

nC p q Pe

→∞→

−−

= =0

α α αα λ

α λ λα

; λ ≥ 0 , (2.9)

unde λ = np este numårul mediu de sosiri. Aceastå formulå define¿te reparti¡ia

Poisson. Fiecårei valori întregi α = 0, 1, 2, ..., n, ..., îi corespunde o

probabilitate P(α; λ), iar legea de reparti¡ie este:

16

Page 16: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Xe e e e

:... ...

!...

!...

0 1 2

2

λ λ λα

λ λ λα

λ− − − −

⎝⎜⎜

⎠⎟⎟

(2.10)

Probabilitå¡ile elementare sunt:

( )p f eα

αλα λ

α= = −

! (2.11)

Se observå cå:

( )P e e eα λ λα

λαα

αλ

α

λα

α

λ λ;! !=

∞ −

=

∞ −

=

∞ −∑ = ∑ = ∑ = ⋅ =0 0 0

1e , (2.12)

adicå suma probabilitå¡ilor este egalå cu 1. Se reaminte¿te cå α este numårul de realizåri ale unui eveniment de probabilitate foarte micå p, într-un mare numår de încercåri n. 2.1.2. REPREZENTAREA GRAFICÅ A REPARTIºIILOR DISCRETE Un rol important într-o primå examinare a variabilelor de selec¡ie îl joacå graficele care se pot întocmi cu ajutorul lor (ele pot sugera tipul de reparti¡ie teoreticå cel mai adecvat pentru aproximarea reparti¡iei empirice). Cele mai uzuale reprezentåri sunt urmåtoarele:

• Reprezentare sub formå de batoane (fig. 2.1). Din dreptul fiecårei valori

de selec¡ie xi (i = 1, 2, ..., n) se ridicå o perpendicularå (un baton) de lungime egalå cu frecven¡a relativå (probabilitatea) sau frecven¡a absolutå corespunzåtoare.

Fig. 2.1. Reparti¡ia frecven¡elor sub formå de batoane ¿i de poligon:

a - variabile discrete cu numår redus de valori; b - variabile discrete grupate.

17

Page 17: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Aceastå modalitate de reprezentare se utilizeazå ¿i în cazul reparti¡iilor teoretice, iar batoanele vor fi propor¡ionale cu mårimea probabilitå¡ilor de realizare a diverselor valori ale variabilei. Fie reparti¡ia discretå empiricå:

Xx x x

f f fn

n

:...

...1 2

1 2

⎛⎝⎜

⎞⎠⎟ (2.13)

Reprezentarea reparti¡iei sub formå de batoane se poate urmåri în figura 2.1. ¥n cazul variabilelor grupate, frecven¡ele absolute sau relative se vor reprezenta de asemenea propor¡ional cu valoarea lor, dar în mijlocul fiecårui interval de grupare.

• Poligonul frecven¡elor (poligonul reparti¡iei probabilitå¡ilor). Fiecare

punct din reprezentarea sub formå de batoane are coordonatele (xi , fi) în cazul

reparti¡iilor empirice ¿i (xi , pi) în cazul reparti¡iilor teoretice discrete. Unind aceste puncte se ob¡ine o reprezentare mai expresivå (fig. 2.1 - linia întreruptå) numitå poligonul frecven¡elor (în cazul reparti¡iilor empirice) sau poligonul reparti¡iei probabilitå¡ilor (în cazul reparti¡iilor teoretice). Tot ca o exemplificare a acestui mod de reprezentare se prezintå poligonul reparti¡iei probabilitå¡ilor în cazul distribu¡iei binomiale (reparti¡ie teoreticå) pentru diferite valori ale lui n (fig. 2.2).

Fig. 2.2. Poligonul reparti¡iei probabilitå¡ilor pentru distribu¡ia binomialå.

18

Page 18: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

• Histograma (reprezentarea sub formå de dreptunghiuri). Considerând cå

fiecare valoare xi a variabilei discrete de selec¡ie reprezintå mijlocul bazei unui

dreptunghi de înål¡ime ni sau fi se ob¡ine reprezentarea sub formå de histogramå. Pentru a sesiza diferen¡a între modul de reprezentare graficå utilizând poligonul frecven¡elor, respectiv histograma, se va recurge la un exemplu din domeniul hidrologiei. Fie ¿irul precipita¡iilor zilnice, înregistrate la o sta¡ie meteo; numårul de zile consecutive în care precipita¡iile depå¿esc zilnic 10 mm este prezentat în tabelul 2.3 (V.Al.Stånescu, 1985).

Tabelul 2.3

Numår zile 1 2 3 4 5 6 7 Numår cazuri 189 370 280 155 83 46 23 Plecând de la tabelul 2.3 se poate defini o variabilå aleatoare cu func¡ia de probabilitate:

X :, , , , , , ,

1 2 3 4 5 6 7

0 165 0 322 0 244 0 135 0 073 0 040 0 021

⎛⎝⎜

⎞⎠⎟ . (2.14)

Reprezentarea graficå se poate urmåri în figura 2.3.

Fig. 2.3. Reprezentarea sub formå de histogramå (a) ¿i poligon al frecven¡elor (b)

pentru numårul zilelor consecutive cu precipita¡ii mai mari de 10 mm. Reprezentarea sub formå de histogramå sau de poligon al frecven¡elor (probabilitå¡ilor) se folose¿te ¿i în cazul unei variabile aleatoare continue, dar discretizate pentru prelucrare; numårul de valori fiind de regulå destul de mare, se recurge la gruparea acestora pe intervale.

19

Page 19: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n reprezentarea graficå, fiecare interval constituie baza unui dreptunghi al histogramei; unind mijloacele laturilor de sus ale acestor dreptunghiuri prin segmente de dreaptå, se ob¡ine poligonul reparti¡iei (absolute sau relative). Fie, de exemplu, ¿irul debitelor maxime anuale de pe Dunåre pentru o perioadå de 129 ani. Tabloul reparti¡iei frecven¡elor va fi urmåtorul:

Tabelul 2.4

Intervalul Numår de apari¡ii (frecven¡e absolute)

Frecven¡e relative

[5.000 - 6.000) 2 1,55% [6.000 - 7.000) 6 4,65% [7.000 - 8.000) 18 13,95% [8.000 - 9.000) 22 17,05% [9.000 - 10.000) 24 18,61% [10.000 - 11.000) 20 15,50% [11.000 - 12.000) 13 10,80% [12.000 - 13.000) 6 4,65% [13.000 - 14.000) 11 8,53% [14.000 - 15.000) 3 2,33% [15.000 - 16.000) 4 3,10%

Total: 129 100,00% Repartizarea sub formå de histogramå ¿i poligon al frecven¡elor se poate urmåri în figura 2.4.

Fig. 2.4. Histograma ¿i poligonul reparti¡iei frecven¡elor în cazul debitelor maxime anuale ale Dunårii (dupå gruparea valorilor pe intervale).

20

Page 20: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

2.2. FUNCºIA DE REPARTIºIE A UNEI VARIABILE DISCRETE

Nota¡iile utilizate în continuare sunt cele de la reparti¡iile discrete teoretice; considera¡iile expuse sunt valabile ¿i pentru reparti¡iile empirice (la care intervin frecven¡e relative ¿i nu probabilitå¡i). Singura diferen¡iere între cele douå categorii de reparti¡ii se va face la reprezentarea graficå, când se va utiliza denumirea de poligon al frecven¡elor sau al probabilitå¡ilor, dupå cum este cazul. ¥n mod obi¿nuit nu se insistå prea mult asupra diferen¡elor de limbaj referitoare la cele douå categorii de reparti¡ii, având în vedere legea numerelor mari (de¿i în hidrologie, în general nu se dispune de un numår suficient de mare de måsuråtori). O altå modalitate de a caracteriza reparti¡ia unei variabile aleatoare discrete, în afara celei prezentate în cadrul paragrafului 2.1 o constituie utilizarea func¡iei de reparti¡ie. Fie variabila aleatoare X cu func¡ia de probabilitate:

Xx x x

p p pn

n

:...

...1 2

1 2

⎛⎝⎜

⎞⎠⎟ . (2.15)

Se reaminte¿te cå valorile x1, x2, ..., xn sunt ordonate în ordine crescåtoare:

x1< x2 < ... < xn. Prin defini¡ie, func¡ia de reparti¡ie F(x) reprezintå probabilitatea ca variabila aleatoare X så fie mai micå decât o valoare oarecare, particularå x:

F(x) = Prob (X < x) . (2.16) Cu alte cuvinte func¡ia de reparti¡ie reprezintå o probabilitate de nedepå¿ire.

Variabila aleatoare X va lua valori la stânga lui x, în intervalul [xmin , x), cu o probabilitate egalå cu F(x).

Fie reparti¡ia anterioarå ¿i o valoare oarecare x fixatå între xk ¿i xk+1.

x

Xx x x x x

p p p p pk k n

k k n

:... ...

... ...1 2 1

1 2 1

+

+

⎛⎝⎜

⎞⎠⎟ (2.17)

21

Page 21: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Singurele valori pe care le poate lua X la stânga lui x sunt doar x1, x2, ..., xk, variabila aleatoare fiind discretå.

Deoarece evenimentele constând în realizarea valorilor x1, x2, ..., xk, sunt incompatibile douå câte douå, rezultå cå probabilitatea ca variabila aleatoare X så fie mai micå decât valoarea fixatå x poate fi calculatå cu rela¡ia:

( ) ( ) ( )

( ) ( )

Pr Pr Pr ...

... Pr Pr ...

ob X x ob X x ob X x

ob X x ob X x p p pk ix x

ki

< = = + = +

+ = = =∑ = + + +<

1 2

1 2

. (2.18)

Deci probabilitatea de nedepå¿ire a valorii x este egalå cu suma probabilitå¡ilor pentru acele valori ale variabilei care sunt mai mici decât x. Din acest motiv func¡ia de reparti¡ie se mai nume¿te ¿i func¡ia probabilitå¡ilor cumulate sau func¡ia cumulativå a probabilitå¡ilor. 2.2.1. PROPRIETźI ALE FUNCºIEI DE REPARTIºIE Func¡ia de reparti¡ie are urmåtoarele proprietå¡i: a) Deoarece func¡ia F(x) reprezintå o probabilitate, conform defini¡iei probabilitå¡ilor va avea valori cuprinse între 0 ¿i 1 (sau 0% ¿i 100%):

0 ≤ F(x) ≤ 1 (2.19)

b) Fie o serie de pozi¡ii particulare ale lui x: xI, x

II, x

III etc., aceste valori fiind

situate între valorile discrete x1, x2, ..., xn.

x I

↓x II

↓x III

↓x IV

↓x N

Xx x x x x

p p p p pk n

k n

:... ...

... ...1 2 3

1 2 3

⎛⎝⎜

⎞⎠⎟ (2.20)

Examinând tabloul (2.20) se constatå urmåtoarele:

F(xI) = Prob(X < x

I) = 0 (deoarece la stânga lui x

I nu se gåse¿te nici o

valoare posibilå a variabilei aleatoare X.

22

Page 22: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

F(xII) = Prob(X < x

II) = Prob(X = x1) = p1 (deoarece singura valoare

posibilå a variabilei, mai micå decât xII este x1).

¥n mod similar:

F(xIII

) = Prob(X < xIII

) = Prob(X = x1) + Prob(X = x2) = p1 +p2

F(xIV

) = Prob(X < xIV

) = Prob(X = x1) + Prob(X = x2) = p1 +p2

Atât xIII

cât ¿i xIV

au la stânga acelea¿i douå valori posibile ale variabilei X (¿i

anume x1 ¿i x2) ¿i ca urmare probabilitå¡ile lor de nedepå¿ire vor fi egale.

Se observå cå: xI < x

II → F(x

I) < F(x

II);

¥n schimb pentru xIII

< xIV

→ F(xIII

) = F(xIV

); Se poate deduce urmåtoarea regulå, care så înglobeze ambele situa¡ii:

x(i)

< x(j)

→ F(x(i)

) ≤ F(x(j)

) (2.21) adicå func¡ia de reparti¡ie este nedescrescåtoare.

c) Fie acum cazul în care xI = x1 (deci x

I nu mai este situat la stânga lui x1, ci

coincide chiar cu x1).

Conform defini¡iei: F(xI) = Prob(X < x

I) = Prob(X < x1).

Dar aceastå probabilitate este nulå, pentru cå la stânga lui x1 variabila aleatoare X nu mai poate lua nici o altå valoare.

Deci: F(x) = Prob(X < x) = 0, dacå x = x1. Aceea¿i valoare a lui F(x) se ob¡ine înså ¿i pentru x ocupând o pozi¡ie

oarecare la stânga lui x1. A rezultat cå valoarea func¡iei F(x) la stânga punctului

x1 este egalå cu valoarea func¡iei în x1 adicå func¡ia F(x) este continuå la stânga. Simbolic acest lucru se va exprima astfel:

F(x - 0) = F(x) (2.22)

¥n momentul în care punctul x în deplasarea lui pe axå depå¿e¿te valoarea x1

func¡ia de reparti¡ie are un salt ¿i F(x) = p1. Cu alte cuvinte, valoarea func¡iei la

23

Page 23: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

dreapta punctului x1 notatå F(x1 + 0) diferå de valoarea în punctul x1 prezentând o discontinuitate; simbolic acest lucru se exprimå astfel:

F(x + 0) ≠ F(x) (2.23)

Discontinuitå¡ile se vor manifesta la dreapta oricårui punct xi, între aceste

puncte func¡ia fiind continuå ¿i prezentându-se sub forma de palier. Mai trebuie aråtat cå în ciuda faptului cå variabila aleatoare X este discretå, func¡ia F(x) este definitå pentru orice valoare a lui x.

d) Fie acum valoarea particularå xN; se observå cå toate valorile posibile ale

lui X sunt mai mici decât xN ¿i deci:

F(xN) = Prob (X < x

N) = Prob (X = x1) + Prob (X = x2) + ... + Prob (X = xn) =

= p1 + p2 + ... + pn = 1 . (2.24)

Deci F(xN) = 1 (unde x

N este situat la dreapta celei mai mari valori posibile a

lui x).

De asemenea, F(xI) = 0 (unde x

I este situat la stânga celei mai mici valori

posibile a lui x). Aceste observa¡ii pot fi sintetizate în urmåtoarea regulå: dacå variabila aleatoare poate lua valori doar în cadrul intervalului [a, b), probabilitatea de nedepå¿ire este nulå la stânga intervalului analizat ¿i unitarå la dreapta lui.

)[X a b F xdacå x a

dacå x b∈ → =

≤>

⎧⎨⎩

, ( ),

,

0

1 (2.25)

Ca o consecin¡å rezultå: F(-∞) = 0 ¿i F(+∞) = 1 (trebuie subliniat cå aceste rela¡ii sunt valabile atât în cazul în care domeniul de defini¡ie al variabilei aleatoare este întreaga dreaptå realå, cât ¿i în cazul în care este un interval mai restrâns). Rezumând proprietå¡ile prezentate pânå în prezent, rezultå cå fiind datå o variabilå aleatoare discretå cu reparti¡ia (2.15):

Xx x x

p p pn

n

:...

...1 2

1 2

⎛⎝⎜

⎞⎠⎟ ,

24

Page 24: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

func¡ia sa de reparti¡ie are urmåtoarele valori:

F x

dacå x x

p dacå x x x

p p dacå x x x

p dacå x x x

p dacå x x x

dacå x x

ii

k

k k

ii

n

n n

n

( ) =

−∞ < ≤< ≤

+ <

∑ < ≤

∑ < ≤

< < ∞

⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪

=+

=

0

1

1

1 1

1 2 2 3

11

1

1

1

L L

L L

≤2

(2.26)

Acest mod de definire al func¡iei de reparti¡ie råmâne valabil ¿i în cazul

grupårii valorilor pe intervale, fiecare interval [xk, xk+1) fiind caracterizat de

probabilitatea de realizare pk. Func¡ia de reparti¡ie poate fi scriså ¿i sub altå formå (Gh. Mihoc ¿.a., 1976).

Se noteazå prin Sx = F(x+0) - F(x-0) saltul func¡iei în punctul x.

Dacå Sx = 0, x este un punct de continuitate al func¡iei F(x) (corespunde unui

palier), iar dacå Sx > 0, atunci x este un punct de discontinuitate (func¡ia are un salt).

Func¡ia de reparti¡ie poate fi deci definitå ca suma salturilor din punctele xi situate la stânga punctului x:

F x Sxx x

ii

( ) = ∑<

, (2.27)

între punctele de discontinuitate, func¡ia fiind constantå.

2.2.2. REPREZENTAREA GRAFICÅ A FUNCºIEI DE REPARTIºIE PENTRU O VARIABILÅ DISCRETÅ Reprezentarea graficå a func¡iei de reparti¡ie se face fie sub formå de diagramå discontinuå în trepte, fie sub formå de poligon al frecven¡elor (probabilitå¡ilor) cumulate (fig. 2.5).

25

Page 25: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 2.5. Reprezentarea distribu¡iei ¿i a func¡iei de reparti¡ie pentru variabila aleatoare (2.14): a - distribu¡ia variabilei sub formå de batoane; b - idem, sub formå de histogramå; c - construc¡ia diagramei în trepte;

d - ob¡inerea poligonului frecven¡elor cumulate.

Fie variabila aleatoare (2.14) reprezentând numårul de zile consecutive cu precipita¡ii superioare valorii de 10 mm (fig. 2.5,a ¿i 2.5,b):

X :, , , , , , ,

1 2 3 4 5 6 7

0 165 0 322 0 244 0 135 0 073 0 040 0 021

⎛⎝⎜

⎞⎠⎟ .

Func¡ia ei de reparti¡ie va fi:

26

Page 26: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

F x

x

x

x

x

x

x

x

x

( )

,

,

,

,

,

,

,

,

=

≤< ≤< ≤< ≤< ≤< ≤< ≤<

⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪

0 000 1

0 165 1 2

0 487 2 3

0 731 3 4

0 866 4 5

0 939 5 6

0 979 6 7

1 000 7

(2.28)

Diagrama în trepte (fig. 2.5,c) poate fi puså în coresponden¡å cu reparti¡ia probabilitå¡ilor sub formå de batoane. Func¡ia prezintå salturi în dreptul fiecårui baton (de valoare egalå cu acesta) ¿i este constantå între batoane. Reprezentarea sub formå de poligon a func¡iei de reparti¡ie (fig. 2.5,d) este asociatå în general cu histograma frecven¡elor (probabilitå¡ilor) ¿i se ob¡ine construind în prealabil histograma valorilor cumulate, dupå care se unesc col¡urile din dreapta ale figurii astfel ob¡inute. Dupå cum se observå din figura 2.5,d, valoarea func¡iei de reparti¡ie F(x) pentru o valoare x fixatå (în reprezentarea sub formå de poligon al frecven¡elor cumulate) reprezintå acea parte a ariei histogramei situatå la stânga lui x. Fie de exemplu x = 2,2; din poligonul frecven¡elor, rezultå:

F( , ) ,, ,, ,

( , , ) , , ,2 2 0 1652 2 1 52 2 1 5

0 487 0 165 0 165 0 2254 0 3904= + −−

− = + =

Aceea¿i valoare se ob¡ine calculând aria histogramei de la stânga lui x = 2,2. ¥ntr-adevår, aria ha¿uratå (fig. 2.5,b) este egalå cu:

(1,5 - 0,5) 0,165 + (2,2 - 1,5) 0,322 = 0,165 + 0,2254 = 0,3904 Poligonul frecven¡elor cumulate se mai poate ob¡ine unind mijloacele palierelor diagramei în trepte a func¡iei de reparti¡ie (fig. 2.5,c). 2.2.3. PROBABILITATEA APARIºIEI UNEI VARIABILE DISCRETE ÎNTR-UN ANUMIT INTERVAL Pentru a calcula probabilitatea ca variabila aleatoare X så ia valori în intervalul [a, b), domeniul de varia¡ie va fi definit (fig. 2.6) ca diferen¡å a unor segmente cuprinse între (-∞, b), respectiv (-∞, a).

27

Page 27: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 2.6. Exprimarea segmentului [a, b) ca diferen¡å a douå segmente de lungime infinitå.

Deci:

[a, b) = (-∞, b) - (-∞, a) . (2.29) Mai departe se poate scrie:

Prob (a ≤ X < b) = Prob (X ∈ [a, b)) =

= Prob (X ∈ (-∞, b)) - Prob (X ∈ (-∞, a)) =

= Prob (X < b) - Prob (X < a) = F(b) - F(a) (2.30)

Acest rezultat se poate verifica de altfel ¿i geometric (fig. 2.7).

Pentru exemplificare se considerå: a = 2,5 ¿i b = 5,5 ¿i se calculeazå aria

histogramei cuprinså între aceste valori:

Prob (2,5 ≤ X < 5,5) = Prob (2,5 ≤ X < 3,5) + Prob (3,5 ≤ X < 4,5) +

+ Prob (4,5 ≤ X < 5,5) = 0,244 + 0,135 + 0,073 = 0,452

Acela¿i rezultat se ob¡ine utilizând graficul func¡iei F(x) sub formå de

poligon al frecven¡elor. ¥ntr-adevår F(5,5) = 0,939, iar F(2,5) = 0,487, deci:

F(b) - F(a) = 0,939 - 0,487 = 0,452

28

Page 28: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 2.7. Interpretarea geometricå a apartenen¡ei variabilei la intervalul [a, b).

Rezultå cå probabilitatea apartenen¡ei la un anumit interval [a, b) se poate

ob¡ine fie prin calculul ariei histogramei cuprinså între a ¿i b, fie prin diferen¡a

ordonatelor corespunzåtoare lui a ¿i b din poligonul frecven¡elor cumulate

(adicå F(b) - F(a)).

¥n exemplul prezentat, s-a considerat cå valorile xi (i = 1, 2, ..., 7) sunt

echidistante. Considera¡iile expuse ¿i modul de calcul råmân adevårate ¿i în

cazul în care valorile variabilei sunt oarecare.

Fie acum cazul în care limita inferioarå a = -∞ , iar b este o valoare finitå. ¥n

acest caz se poate scrie:

Prob (-∞ < X < ∞) = Prob (X < b) =F(b) - F(-∞) = F(b) - 0 = F(b) (2.31)

29

Page 29: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

S-a ajuns la un rezultat cunoscut ¿i anume cå probabilitatea de nedepå¿ire a unei valori oarecare este egalå cu aria histogramei situatå la stânga punctului respectiv. Fie acum cazul în care amândouå limitele intervalului devin infinite:

a = -∞ ¿i b = +∞

Prob (-∞ < X < ∞) = F(+∞) - F(-∞) = 1 - 0 = 1 (2.32)

ªi acest rezultat era de a¿teptat, întrucât probabilitatea ca variabila aleatoare

så ia o valoare oarecare în cadrul intervalului såu de varia¡ie este evident egalå

cu 1 (sau 100%). Ca interpretare geometricå rezultå faptul cå aria histogramei

calculatå pe întreg domeniul de varia¡ie al variabilei este unitarå.

Rezultatul ob¡inut este în concordan¡å ¿i cu faptul cå în cazul variabilei

aleatoare discrete X, care ia valorile x1, x2, ..., xn, cu probabilitå¡ile p1, p2, ..., pn,

suma probabilitå¡ilor este unitarå. Considera¡iile expuse råmân valabile ¿i în cazul în care domeniul de varia¡ie

nu mai este întreaga axå realå, ci un interval mai restrâns: [xmin, xmax); de fapt în

acest din urmå caz, considerând intervalul de varia¡ie al variabilei de la -∞ la +∞ se ob¡ine o problemå echivalentå, deoarece aria histogramei cuprinså între

(-∞, xmin) ¿i [xmax, +∞) este nulå. Din acest motiv, pentru generalitate se va

considera ca limitå inferioarå a valorilor variabilei -∞, iar ca limitå superioarå a acestora +∞.

2.2.4. REPREZENTAREA FUNCºIEI DE REPARTIºIE A UNEI VARIABILE DISCRETE (SAU DISCRETIZATE) CU VALORILE GRUPATE PE INTERVALE Calculul func¡iei de reparti¡ie, ¿i reprezentårile grafice sunt similare ca în

cazul variabilelor aleatoare negrupate.

Pentru exemplificare se va considera (C. Diaconu, D. Låzårescu, 1977) cazul

debitelor medii anuale ale unui râu (tab. 2.5), la care valorile au fost grupate pe

intervale.

30

Page 30: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Tabelul 2.5

Intervalul

(m3/s)

Frecven¡e relative (probabilitå¡i)

30-40 4% 40-50 20% 50-60 24% 60-70 32% 70-80 12% 80-90 8%

Distribu¡ia frecven¡elor ¿i func¡ia de reparti¡ie a acestei variabile sunt prezentate în rela¡iile (2.33), respectiv (2.34):

( ) ( )

)[)[)[)[)[)[

f x ob X x

x

x

x

x

x

x

= = =

∈∈

⎪⎪⎪⎪

⎪⎪⎪⎪

Pr

, ,

, ,

, ,

, ,

, ,

, ,

0 04 30 40

0 20 40 50

0 24 50 60

0 32 60 70

0 12 70 80

0 08 80 90

(2.33)

( ) ( )F x ob X x

x

x

x

x

x

x

x

= < =

≤< ≤< ≤< ≤< ≤< ≤<

⎪⎪⎪⎪

⎪⎪⎪⎪

Pr

,

,

,

,

,

,

,

0 00 30

0 04 30 40

0 24 40 50

0 48 50 60

0 80 60 70

0 92 70 80

1 00 80

(2.34)

Palierele histogramei ¿i ale reprezentårii func¡iei de reparti¡ie sub formå de

diagramå cumulatå a probabilitå¡ilor corespund acum intervalelor de grupare

(fig. 2.8); poligonul frecven¡elor cumulate se ob¡ine unind punctele din partea

dreaptå a palierelor diagramei în trepte.

31

Page 31: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 2.8. Reprezentarea graficå a func¡iei de reparti¡ie sub formå

de diagramå în trepte ¿i de poligon al frecven¡elor cumulate.

Ca ¿i în cazul variabilei discrete simple, valorile poligonului frecven¡elor

cumulate pentru o valoare oarecare a lui x sunt egale cu ariile histogramei

situate la stânga lui x (mårimea intervalului de grupare ∆x fiind consideratå

unitarå); de asemenea probabilitatea apartenen¡ei la un anumit interval [a, b) se

ob¡ine ca diferen¡å a valorilor F(b) ¿i F(a), ceea ce reprezintå în fond aria

histogramei cuprinså între punctele de absciså a ¿i b.

2.3. COMPLEMENTARA FUNCºIEI DE REPARTIºIE

(PROBABILITATEA DE DEPŪIRE)

S-a aråtat cå func¡ia de reparti¡ie F(x) reprezintå probabilitatea de nedepå¿ire a valorii x, cu alte cuvinte F(x) måsoarå probabilitatea ca variabila aleatoare X så ia valori la stânga lui x. ¥n multe cazuri, în hidrologie înså intereseazå probabilitatea de depå¿ire a unei valori oarecare x. De exemplu, probabilitatea de depå¿ire a unui nivel minim (care încå mai permite naviga¡ia pe un râu)

32

Page 32: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

constituie o måsurå a posibilitå¡ii de valorificare a râului respectiv drept cale de naviga¡ie. De asemenea, probabilitatea de depå¿ire a nivelului care încå mai permite accesul la priza de apå a unui debit egal cu cerin¡a unei folosin¡e reprezintå gradul de asigurare cu apå al folosin¡ei respective. Probabilitatea de depå¿ire a cotei coronamentului unui dig de apårare împotriva inunda¡iilor constituie o måsurå a riscului de inundare, etc. ¥n loc de niveluri, în practicå se folosesc în mod curent debite cu diverse probabilitå¡i de depå¿ire; aceasta nu schimbå prea mult datele problemei, debitul putând fi exprimat în func¡ie de nivel prin intermediul cheii limnimetrice (sau cheia debitelor). Pentru calculul probabilitå¡ii de depå¿ire a unei valori oarecare x de cåtre variabila aleatoare X se poate pleca de exemplu de la rela¡ia apartenen¡ei la un anumit interval:

Prob (a ≤ X < b) = F(b) - F(a) . (2.35) Fie acum b = +∞. Se ob¡ine:

Prob (a ≤ X < +∞) = F(+∞) - F(a) = 1 - F(a) . (2.36) Dar:

Prob (a ≤ X < +∞) = Prob (X ≥ a) (2.37) sau:

Prob (X ≥ a) = 1 - F(a) (2.38) ¥n cazul general, se poate scrie:

Prob (X ≥ x) = 1 - F(x) (2.38') Acela¿i rezultat se putea ob¡ine ¿i prin ra¡ionamentul urmåtor:

Prob (X < x) + Prob (X ≥ x) = Prob (-∞ < X < +∞) = 1 ,

deci Prob (X ≥ x) = 1 - Prob (X < x) = 1 - F(x) . (2.39) Deoarece Prob (X ≥ x) = 1 - F(x), aceastå func¡ie se mai nume¿te ¿i func¡ie de reparti¡ie complementarå. ¥n continuare, pentru probabilitatea de depå¿ire a

valorii x se va utiliza atât nota¡ia 1 - F(x), cât ¿i . F xc( )

33

Page 33: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

2.3.1. INTERPRETAREA GEOMETRICÅ A PROBABILITźII DE DEPŪIRE Se reaminte¿te cå, pentru o valoare fixatå x, mårimea func¡iei de reparti¡ie

F(x) este egalå cu aria histogramei situatå la stânga lui x.

Având în vedere faptul cå aria întregii histograme este unitarå, aria de la

dreapta lui x va fi egalå cu 1 - F(x). Dar aceasta este chiar func¡ia de reparti¡ie

complementarå . Rezultå cå, probabilitatea de depå¿ire a valorii x

(probabilitatea ca variabila aleatoare X så ia valori mai mari sau egale cu x) este

egalå cu aria histogramei situatå la dreapta lui x (fig. 2.9).

F xc( )

La reprezentarea func¡iei de reparti¡ie sub formå de poligon, ordonata

cuprinså între axa Ox ¿i curba F(x) reprezintå probabilitatea de nedepå¿ire a lui

x. Rezultå cå probabilitatea de depå¿ire a lui x, deci 1-F(x), va fi egalå cu

segmentul complementar cuprins între curba F(x) ¿i paralela la absciså duså prin

punctele de ordonatå egalå cu 1.

Fig. 2.9. Interpretarea geometricå a probabilitå¡ii de depå¿ire.

34

Page 34: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

2.3.2. REPREZENTAREA GRAFICÅ A PROBABILITźII DE DEPŪIRE Reprezentarea graficå se poate face ca ¿i la func¡ia de reparti¡ie fie sub formå de diagramå în trepte, fie sub formå de poligon al frecven¡elor (probabilitå¡ilor) cumulate. ¥n mod obi¿nuit, pentru scopuri hidrologice se preferå ultimul mod de reprezentare. Din interpretarea geometricå a probabilitå¡ii de depå¿ire, rezultå cå aceasta va avea valoarea maximå pentru cea mai micå valoare a lui x; într-adevår, dacå

x = xmin, atunci variabila X poate lua orice valoare din domeniul ei de varia¡ie:

x1 = xmin, x2, ..., xn = xmax ¿i deci Prob(X ≥ xmin) = 100%. Valorile probabilitå¡ii de depå¿ire vor fi apoi din ce în ce mai mici pe måsurå ce numårul x ales este mai mare.

¥n reprezentarea sub formå de diagramå în trepte, func¡ia este constantå sau descrescåtoare; poligonul frecven¡elor se va reprezenta ca o func¡ie descrescåtoare.

F xc( )

Fig. 2.10. Reprezentarea graficå a probabilitå¡ilor de depå¿ire ¿i nedepå¿ire pentru func¡ia de probabilitate (2.14).

¥n figura 2.10 sunt desenate comparativ atât func¡ia de reparti¡ie (2.28), cât ¿i func¡ia de reparti¡ie complementarå (cu linie plinå) pentru variabila aleatoare (2.14). ¥n figura 2.11 s-a procedat la reprezentarea graficå a probabilitå¡ilor de depå¿ire ¿i de nedepå¿ire în cazul reparti¡iei (2.33).

35

Page 35: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Valorile probabilitå¡ii de depå¿ire rezultå fie din rela¡ia = 1 - F(x), fie

prin calculul suprafe¡elor din histogramå situate la dreapta valorilor particulare x ale variabilei; la calculul suprafe¡elor se va avea în vedere cå intervalul de discretizare ∆x este considerat de mårime unitarå.

F xc( )

Fig. 2.11. Reprezentarea graficå a probabilitå¡ii de nedepå¿ire ¿i depå¿ire în cazul variabilelor grupate definite de reparti¡ia (2.33).

2.3.3. RELAºIA DE CALCUL A PROBABILITźII DE DEPŪIRE Se reaminte¿te cå pentru o variabilå aleatoare discretå cu reparti¡ia 2.15:

Xx x x

p p pn

n

:...

...1 2

1 2

< < <⎛⎝⎜

⎞⎠⎟ ,

36

Page 36: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

probabilitatea de nedepå¿ire F(x) = Prob (X < x) este definitå prin rela¡ia

2.26:

( ) ( )F x ob X x

x x

p x

p p x x x

p x x

p x

p x x

ii

k

k k

ii

n

n n

ii

n

n

= < =

−∞ < ≤< ≤

+ <

∑ < ≤

∑ < ≤

∑ = <

⎪⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪⎪

=+

=

=

Pr

0

1

1

1 1

1 2 2 3

11

1

1

1

1

L L

L L

x x

x

x x

< +∞

2

x

x

n

+∞

2

Dupå cum se observå, valorile variabilei xi au fost ordonate crescåtor:

x1 < x2 < ... < xn.

ºinând seama de rela¡ia existentå între probabilitatea de depå¿ire ¿i

probabilitatea de nedepå¿ire F(x), rezultå cå F x este definitå prin:

F xc( )c( )

( ) ( )F x ob X x

x x

p x x

p x x

p p x x x

p x x

ci

i

k

k k

ii

n

n n

ii

n

n

= ≥ =

−∞ < ≤− <

− ∑ < ≤

− ∑ = <

− ∑ = < <

⎪⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪⎪

=+

=

=

Pr

,

,

... ...

,

... ...

,

... ...

,

1

1

1

1

1 0

1

1 1

11

1

1

1

1

(2.40)

¥n general înså, în cazul în care se calculeazå probabilitatea de depå¿ire,

valorile variabilei aleatoare nu se mai ordoneazå crescåtor, ci descrescåtor (de la

cea mai mare valoare a variabilei pânå la cea mai micå).

37

Page 37: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Ca atare, se recurge la o opera¡ie de renumerotare a valorilor variabilei, în

noua numerotare ele fiind notate tot prin x1, x2, ..., xn, dar fiind ordonate de data aceasta descrescåtor (fig. 2.12).

Fig. 2.12. Renumerotarea variabilelor în vederea calculårii probabilitå¡ilor de depå¿ire.

Probabilitatea de depå¿ire a variabilei aleatoare cu func¡ia de probabilitate:

Xx x x

p p pn

n

:...

...1 2

1 2

> > >⎛⎝⎜

⎞⎠⎟ (2.41)

va fi definitå prin:

( ) ( )F x ob X x

x x

p x

p p x x x

p x

p p x x x

p x

ci

i

k

k

i ni

n

n n

ii

n

n

= ≥ =

< ≤ ∞< ≤

+ <

∑ < ≤

= −∑ < ≤

∑ = −∞ <

⎪⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪⎪

=+

=

=

Pr

0

1

1

1

1 2

1 2 3 2

11

1

1

1

1

L L

L L

x x

x x

x

k

<

1

(2.42)

38

Page 38: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n cazul particular în care cele n valori ale variabilei au probabilitå¡i egale de realizare (¿i anume 1/n), probabilitatea de depå¿ire se va calcula cu rela¡ia:

F x ob X x

x x

nx x x

nx x x

in

x x x

nn

x x x

nn

x x

c

i i

n n

n

( ) Pr ( )= ≥ =

< < ∞

< ≤

< ≤

< ≤

−< ≤

− ∞ < ≤

⎪⎪⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪⎪⎪

+

01

2

1

1

2 1

3 2

1

1

L L

L L

(2.43)

2.3.4. CALCULUL PROBABILITźII DE DEPŪIRE A VALORILOR xi ÎN HIDROLOGIE ¥n practica hidrologicå intereseazå de cele mai multe ori probabilitatea cu

care valorile discrete xi ob¡inute din måsuråtori sunt egalate sau depå¿ite.

Considerând în rela¡ia de calcul anterioarå cå x = xi se va ob¡ine:

F x

nx x

nx x

in

x x

nn

x x

nn

x x

ci i

n

n

( ) =

=

=

=

− =

=

⎪⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪⎪

1

2

1

1

2

1

L L

L L

(2.44)

Fie, deocamdatå, exemplul banal al zarului perfect omogen, la care

probabilitå¡ile de apari¡ie ale celor 6 fe¡e sunt egale cu 1/6.

¥n figura 2.13 este construitå atât func¡ia de probabilitate elementarå sub formå de histogramå cât ¿i histograma cumulativå a probabilitå¡ilor de depå¿ire.

39

Page 39: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 2.13. Func¡ia de probabilitate elementarå ¿i probabilitatea de depå¿ire în cazul zarului cu 6 fe¡e.

Având în vedere faptul cå la reprezentarea sub formå de poligon probabilitå¡ile de depå¿ire sunt egale cu suma ariilor histogramei situate la

dreapta punctului curent, rezultå cå probabilitå¡ile de depå¿ire se vor afla

pe dreapta marcatå cu linie continuå în figura 2.13 (dreapta care une¿te col¡urile din stânga ale histogramei cumulative).

F xci( )

Probabilitå¡ile de depå¿ire calculate cu rela¡ia:

pin

ii = =

6 (2.45)

(unde i este numårul de ordine din ¿irul ordonat descrescåtor al celor 6 valori

posibile: x1= 6; x2 = 5; ..; x6 = 1) sunt majorate în mod artificial, ele situându-se pe linia întreruptå, decalatå fa¡å de linia plinå cu valoarea 1/12 (adicå 1/2 din probabilitatea de apari¡ie a fiecårei valori). ¥n hidrologie, o problemå frecvent întâlnitå este aceea a determinårii probabilitå¡ii de depå¿ire a debitelor maxime anuale; numårul n de valori de care se dispune este în general cuprins între 20 ... 40. Se admite analog ca în cazul zarului cå cele n debite maxime anuale au probabilitå¡i egale de apari¡ie (¿i anume 1/n). Un aspect asupra cåruia trebuie atraså aten¡ia este faptul cå, în cazul zarului perfect omogen probabilitatea de apari¡ie a unei fe¡e (egalå cu 1/6), rezultå în urma unui numår extrem de mare de experimente (teoretic un numår infinit). ¥n cazul ¿irului debitelor maxime anuale se admite de asemenea cå valorile

40

Page 40: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

acestora sunt egal probabile, de¿i fiecare valoare în sine nu s-a realizat decât o singurå datå. Acest mod de evaluare a probabilitå¡ii de apari¡ie a diverselor valori are la bazå defini¡ia clasicå a probabilitå¡ii (aproximatå prin raportul dintre numårul cazurilor favorabile ¿i numårul total de cazuri posibile); fiecare valoare realizându-se o singurå datå, probabilitatea ei de realizare este apreciatå la 1/n. Evident, acest mod de abordare constituie o aproximare, dar este singura posibilå în condi¡iile unei perioade de måsuråtori relativ reduse. Calculul probabilitå¡ii de depå¿ire a debitelor maxime anuale cu rela¡ia (2.45) ar conduce urmând un ra¡ionament similar ca în cazul zarului cu 6 fe¡e la

o majorare artificialå a valorilor pi egalå cu 1/(2n). Probabilitatea realå de depå¿ire a valorilor respective este deci:

pin n

ini = − = −1

22 1

2 . (2.46)

Aceastå rela¡ie pentru calculul probabilitå¡ii de depå¿ire a fost de altfel propuså de Hazen încå din anul 1930. Cea mai micå valoare a ¿irului de date ordonat descrescåtor (deci valoarea cu rangul i = n) are conform acestei rela¡ii probabilitatea de depå¿ire:

pn

nn =−2 1

2 . (2.47)

Tabelul 2.6

Formula Anul

pi = Prob (X ≥ xi )

Hazen 1930

2 12i

n−

Weibull 1939

in +1

Cegodaev 1955

in−+

0 30 4,,

Blum 1958

in−+

3 81 4

//

Tukey 1962

3 13 1

in−+

Gringorten 1963

in−+

0 440 12,,

41

Page 41: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Se observå cå valoarea lui pn este diferitå de 100%, cum s-ar fi ob¡inut pentru valoarea de rang n în cazul aplicårii rela¡iei necorectate de tip i/n. Acest rezultat era de altfel de a¿teptat ¿i din punct de vedere intuitiv. Cea mai

micå valoare înregistratå în perioada de måsuråtori xn nu este în mod obligatoriu ¿i cea mai micå valoare a popula¡iei statistice. Existå deci posibilitatea înregistrårii în viitor ¿i a unor valori mai mici; ca atare, probabilitatea de

depå¿ire a lui xn este mai micå de 100%, chiar dacå este foarte apropiatå de

aceastå valoare. Diferen¡a de la 100% pânå la pn% reprezintå riscul apari¡iei

unor valori inferioare lui xn. ¥n afarå de formula lui Hazen, pentru evaluarea probabilitå¡ilor de depå¿ire se mai utilizeazå ¿i alte rela¡ii (I.Vladimirescu, 1978), care au ca element comun faptul cå pentru i=n se ob¡in probabilitå¡i de depå¿ire subunitare (tab.2.6). Dupå cum s-a mai aråtat, în toate aceste rela¡ii i reprezintå numårul de ordine

al valorii xi din ¿irul ordonat descrescåtor (x1 > x2 > ... > xi > ... > xn). ¥n hidrologie, pentru calculul probabilitå¡ii de depå¿ire se utilizeazå, în mod curent, rela¡ia Weibull:

pi

ni = +1 , (2.48)

în timp ce în gospodårirea apelor este preferatå formula lui Cegodaev:

pini =−+

0 30 4,,

. (2.49)

2.4. MODUL DE REPREZENTARE A FUNCºIILOR DE REPARTIºIE

¥N HIDROLOGIE

¥n toate exemplele precedente variabila aleatoare X a fost consideratå variabilå independentå, iar probabilitatea reprezenta variabila dependentå. ¥n hidrologie înså, de cele mai multe ori intereseazå determinarea valorii variabilei care corespunde unei probabilitå¡i prestabilite prin STAS-urile în vigoare. De exemplu, în STAS 4068/2-82, sunt definite probabilitå¡ile de depå¿ire ale debitelor de calcul ¿i verificare ale construc¡iilor hidrotehnice. Probabilitatea capåtå deci caracter de variabilå independentå, iar mårimea

42

Page 42: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

corespunzåtoare acestei probabilitå¡i este variabila dependentå, care trebuie evaluatå. Ca urmare, se procedeazå la o rotire ¿i råsturnare a tuturor reprezentårilor uzuale în matematicå, astfel încât abscisa så devinå ordonatå ¿i ordonata absciså. Ca exemplificare, în figura 2.14, sunt desenate comparativ, în ambele sisteme de reprezentare, o serie de grafice prezentate anterior. ¥n hidrologie, probabilitatea de nedepå¿ire intereseazå mai rar; ca urmare, pe graficele hidrologice se reprezintå numai curba probabilitå¡ilor de depå¿ire. Deoarece variabila aleatoare notatå în matematicå prin X se reprezintå acum pe ordonatå, în continuare pentru a nu crea confuzii ea se va identifica prin Y, iar valorile sale particulare prin y. Valoarea variabilei Y corespunzåtoare probabilitå¡ii de depå¿ire p% va fi

notatå prin yp%

Fig. 2.14. Reprezentåri ale reparti¡iei frecven¡elor (a) ¿i

ale func¡iilor de reparti¡ie (b), utilizate în matematicå ¿i în hidrologie.

43

Page 43: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fie din nou cazul zarului perfect omogen, pentru care probabilitå¡ile de depå¿ire sunt calculate cu rela¡ia (2.46); deoarece valorile variabilei sunt echidistante ¿i echiprobabile, probabilitå¡ile de depå¿ire se situeazå dupå cum s-a mai aråtat pe o dreaptå. Cu totul altfel stau lucrurile în cazul valorilor hidrologice. Fie de exemplu ¿irul debitelor maxime anuale; debitele sunt considerate tot echiprobabile, dar nu mai sunt echidistante. Ca urmare, probabilitå¡ile lor de depå¿ire nu se vor situa pe o dreaptå, ci pe o curbå (fig.2.15).

Fig. 2.15. Reprezentarea comparativå a probabilitå¡ilor de depå¿ire: a - valori echidistante (cazul zarului); b - valori oarecare (cazul debitelor maxime anuale).

Aceastå curbå va avea gradien¡i diferi¡i în zona centralå unde se înregistreazå valori în mod frecvent, comparativ cu zona debitelor extreme (foarte mari sau foarte mici) unde variabila ia mai rar valori. O reprezentare aproximativå a alurii graficului probabilitå¡ilor de depå¿ire (în cazul zarului omogen ¿i al debitelor maxime anuale) se poate urmåri în figura 2.15. Pentru ambele grafice, probabilitå¡ile de depå¿ire au fost calculate conform celor aråtate anterior cu rela¡ia lui Hazen. Aceea¿i alurå a graficelor s-ar fi ob¡inut ¿i în cazul utilizårii formulei Weibull (preferatå în hidrologie, deoarece conduce pentru o probabilitate de depå¿ire datå, la valori mai mari ale variabilelor aleatoare ¿i deci la un calcul mai acoperitor). O exemplificare a modului de reprezentare a curbei probabilitå¡ilor de depå¿ire în hidrologie în cazul valorilor grupate se poate urmåri în figura 2.16 (a se vedea comparativ cu fig. 2.8 ¿i fig. 2.11). Probabilitatea de depå¿ire a unei valori y oarecare, se ob¡ine prin calculul suprafe¡ei histogramei situatå deasupra lui y (aria ha¿uratå); probabilitatea de nedepå¿ire a valorii y este egalå cu aria neha¿uratå.

44

Page 44: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 2.16. Reprezentarea hidrologicå a probabilitå¡ilor de depå¿ire în cazul valorilor grupate pentru reparti¡ia (2.33).

2.4.1. SEMNIFICAºIA PROBABILITźII DE DEPŪIRE ÎN HIDROLOGIE ¥n practicå, pentru probabilitatea de depå¿ire se mai utilizeazå ¿i denumirea de asigurare, denumire care cel pu¡in în anumite cazuri este nejustificatå. No¡iunea de asigurare a fost preluatå din gospodårirea apelor medii, domeniu în care se pune problema livrårii apei la beneficiari, cu o probabilitate ridicatå (95%, 97% etc.). ¥n aceste cazuri, probabilitatea reprezintå într-adevår gradul de asigurare cu apå al folosin¡ei respective. ¥n hidrologie în schimb, intereseazå în special probabilitå¡i de depå¿ire foarte mici (5%, 1%, 0,1% etc.) în vederea dimensionårii la debitele corespunzåtoare a unor lucråri hidrotehnice. Fie de exemplu, debitul maxim anual cu probabilitatea de depå¿ire de 1%; în acest caz 1% reprezintå probabilitatea ca într-un an oarecare (deci în oricare an)

så se producå un debit mai mare sau egal cu Q1%. Considerând cå s-au executat lucråri de combatere a inunda¡iilor dimensionate la acest debit, gradul de siguran¡å al sistemului este de 99 %, iar 1% reprezintå riscul anual de depå¿ire a capacitå¡ii sistemului ¿i care evident, nu poate fi interpretat ca asigurare (el semnificând de fapt o neasigurare). Prin urmare, probabilitatea de depå¿ire p% capåtå semnifica¡ia unui risc

anual R1 de depå¿ire a valorii Qp%.

¥n aceste condi¡ii, începe så prezinte interes riscul de depå¿ire a valorii Qp% într-o perioadå de n ani, corespunzåtoare duratei de func¡ionare a lucrårii hidrotehnice. Dacå p% reprezintå un risc anual, atunci 1 - p% semnificå siguran¡a sistemului în decurs de 1 an. ¥n cazul în care realizarea valorii

45

Page 45: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

debitului maxim dintr-un anumit an poate fi consideratå independentå de valorile din ceilal¡i ani, gradul de siguran¡å dintr-un numår de n ani poate fi

apreciat cu rela¡ia: (1 - p)n.

Rezultå atunci cå riscul hidrologic Rn ca debitul Qp% så fie egalat sau depå¿it într-o perioadå de n ani, are o valoare complementarå siguran¡ei sistemului pentru acela¿i interval de timp:

Rn = 1 - (1 - p)n . (2.50)

Cu cât n este mai mare, cu atât Rn tinde cåtre 1 (sau 100%); deci într-o

perioadå foarte mare riscul de a se produce debite superioare lui Qp% se apropie de certitudine. Fie, pentru exemplificare, cazul în care p = 1%, iar n = 100 (C. Pârvulescu, 1978):

R100 = 1 - (1 - 0,01)100

= 1 - 0,37 = 0,63 = 63% Cu alte cuvinte probabilitatea ca într-o sutå de ani så se producå un debit

egal sau mai mare decât Q1% nu este de loc neglijabilå (deci dimensionarea evacuatorilor de ape mari, a îndiguirilor, etc. trebuie fåcutå foarte atent, întrucât

este posibilå o solicitare a lucrårilor la acest debit). ¥n acela¿i timp, riscul R100 este încå departe de certitudine, ceea ce înseamnå cå în decurs de 100 de ani

este foarte posibil ca debitul Q1% sau debite superioare acestuia så nu se producå niciodatå. De asemenea, pot exista intervale de 100 ani în care acest debit sau debite superioare så se producå de douå, trei sau chiar de mai multe ori. ¥n figura 2.17 este reprezentatå o situa¡ie posibilå a depå¿irii sau egalårii

debitelor Q1% într-o perioadå lungå de timp. Ca medie, aceste debite se produc o datå la 100 de ani, fårå a exista înså nici o regularitate în realizarea lor (deci

dacå debitul Q1% s-a înregistrat într-un anumit an, nu înseamnå cå el se va mai realiza exact dupå 100 de ani).

Fig. 2.17. Depå¿irea sau egalarea valorilor Q1% în timp.

46

Page 46: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Perioada de repetare T, definitå prin raportul:

Tp

= 1%

(2.51)

trebuie în¡eleaså ca o valoare medie, caracteristicå unei perioade foarte lungi de timp (de ordinul miilor sau zecilor de mii de ani).

¥n practicå, se utilizeazå pentru Q1%, Q1‰ etc, în mod frecvent formularea: debitul care apare o datå la 100 de ani, o datå la 1.000 de ani etc. Aceastå exprimare trebuie în¡eleaså cu rezerva expuså anterior, de timp mediu de repetare, calculat pe perioade lungi de ordinul timpului geologic. Mult mai indicatå este cealaltå formulare de risc anual de depå¿ire de 1%, 1‰ etc.

47

Page 47: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

3. VARIABILE ALEATOARE CONTINUE

3.1. DENSITATE DE REPARTIºIE. FUNCºIE DE REPARTIºIE Variabila aleatoare X fiind continuå poate lua orice valoare din domeniul ei de varia¡ie. ¥n mod obi¿nuit în hidrologie acest interval este semiaxa [0, +∞) sau chiar un interval mai restrâns [a, b); pentru generalitate, în continuare se va admite ca domeniu de varia¡ie axa numerelor reale (-∞, +∞). Acest domeniu este divizat în intervale infinitezimale de lungime dx. Probabilitatea elementarå ca variabila aleatoare X så ia valori în cadrul intervalului [x, x + dx) este egalå (fig. 3.1) cu produsul dintre lungimea intervalului ¿i valoarea func¡iei f (denumitå densitate de probabilitate sau densitate de reparti¡ie) în punctul x:

Prob (X ∈(x; x+dx)) = f(x) dx . (3.1) Denumirea de densitate pentru func¡ia f(x) este preluatå din fizicå (prin analogie cu densitatea ρ(x) a unei bare neomogene).

Fig. 3.1. Densitatea de reparti¡ie a unei variabile aleatoare continue. Se reaminte¿te cå reparti¡ia unei variabile discrete X, se reprezintå simbolic prin:

Xx

f xi:

( )⎛⎝⎜

⎞⎠⎟ , (3.2)

48

Page 48: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

unde f(xi) este probabilitatea elementarå. ¥n mod similar, în cazul variabilei continue, la care probabilitatea elementarå este dupå cum s-a aråtat f(x)⋅dx, ar trebui utilizatå nota¡ia:

)[Xx x dx

f x dx:

,

( )

+⋅

⎝⎜

⎠⎟ . (3.3)

¥n practicå înså se folose¿te reprezentarea simplificatå:

Xx

f x:

( )⎛⎝⎜

⎞⎠⎟ , (3.4)

unde, a¿a cum s-a mai aråtat, f(x) define¿te o densitate de probabilitate:

)[( )f x

ob X x x x

xx( ) lim

Pr ,=

∈ +

→∆

∆0 . (3.5)

Cu alte cuvinte f(x) ≠ Prob(X = x), care este de altfel nulå; ra¡ionând chiar intuitiv probabilitatea aferentå unei valori punctuale (în condi¡iile în care variabila poate lua o infinitate de astfel de valori) este zero:

Prob (X = x) = 0 . (3.6) O reparti¡ie continuå poate fi privitå ¿i ca limitå a unei reparti¡ii discrete, care ia un numår din ce în ce mai mare de valori (în final, o mul¡ime de puterea continuului). Ca urmare, toate considera¡iile expuse la variabilele discrete se påstreazå, cu mici diferen¡e. Una dintre aceste diferen¡e este faptul cå semnul sumå se va înlocui prin operatorul de integrare. De exemplu, suma probabilitå¡ilor elementare la variabilele discrete este unitarå:

pii

n=∑

=1

1 . (3.7)

¥n cazul variabilelor continue rela¡ia echivalentå este urmåtoarea:

f x dx( )−∞

+∞

∫ = 1 . (3.8)

49

Page 49: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n mod similar se va defini func¡ia de reparti¡ie F(x). ¥n cazul variabilei discrete probabilitatea de nedepå¿ire a valorii particulare x rezultå prin însumarea probabilitå¡ilor aferente valorilor variabilei mai mici decât x:

F x ob X xix xi

( ) Pr ( )= =∑<

. (3.9)

¥n cazul variabilei continue, semnul sumå se transformå în integralå; limita

inferioarå de integrare este xmin sau pentru generalitate -∞, iar limita superioarå este evident valoarea particularå x. Probabilitatea de nedepå¿ire în cazul unei variabile aleatoare continue este prin defini¡ie:

F x f x dxx

( ) ( )= ∫−∞

. (3.10)

Valoarea probabilitå¡ii de nedepå¿ire a lui x este egalå deci cu aria densitå¡ii de reparti¡ie situatå la stânga punctului x (fig. 3.2).

Fig. 3.2. Interpretarea geometricå a probabilitå¡ii de nedepå¿ire. ¥n mod similar se poate ob¡ine probabilitatea apartenen¡ei la un anumit interval:

Prob (x1 ≤ X < x2) = Prob (X ∈ (-∞, x2)) - Prob (X ∈ (-∞, x1)) =

= Prob (X < x2) - Prob (X < x1) = F(x2) - F(x1) . (3.11)

50

Page 50: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dar:

Pr ( ) Pr ( ) ( ) ( ) ( )ob X x ob X x f x dx f x dx f x dxx x

x

x

< − < = ∫ − ∫ = ∫−∞ −∞

2 1

2 1

1

2

. (3.12)

Rezultå deci:

Pr ( ) ( )ob x X x f x dxx

x

1 21

2

≤ < = ∫ (3.13)

Cu alte cuvinte, probabilitatea apartenen¡ei la un interval este egalå cu aria trapezului curbiliniu ha¿urat pe graficul din figura 3.3; aceea¿i probabilitate se poate ob¡ine ¿i ca diferen¡å a ordonatelor func¡iei de reparti¡ie corespunzåtoare

absciselor x2, respectiv x1.

Fig. 3.3. Probabilitatea apartenen¡ei la un anumit interval.

Dacå intervalul [x1, x2) devine din ce în ce mai mic, fie el [x, x + ∆x), raportul:

F x x F xx

( ) (+ −∆ )∆

reprezintå valoarea tangentei (derivata) func¡iei de reparti¡ie în punctul x.

Dar acest raport este chiar densitatea de reparti¡ie f(x). ¥ntr-adevår, din rela¡iile

(3.5), respectiv (3.11) rezultå:

51

Page 51: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

)[[ ]f x

ob X x x x

xF x x F x

xF x

x x( ) lim

Pr ,lim

( ) ( )'( )=

∈ += + − =

→ →∆ ∆

∆∆∆0 0

. (3.14)

Cu alte cuvinte densitatea de reparti¡ie f(x) este derivata func¡iei de reparti¡ie F(x) în punctul x. Acest lucru era, de altfel, de a¿teptat, opera¡iile de integrare ¿i derivare fiind opera¡ii inverse. ¥n practicå, a¿a cum s-a aråtat, intereseazå în mare måsurå pe lângå probabilitatea de nedepå¿ire ¿i probabilitatea evenimentului contrar Prob(X ≥ x) numitå probabilitate de depå¿ire:

F x ob X x ob X x F x f x dx

f x dx f x dx f x dx f x dx f x dx

cx

x

x x

( ) Pr ( ) Pr ( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) .

= ≥ = − < = − = − ∫ =

= ∫ − ∫ = ∫ + ∫ = ∫

−∞

−∞

+∞

−∞

−∞

−∞

+∞ +∞

1 1 1 (3.15)

¥n figura 3.4 se poate urmåri reprezentarea graficå a celor 2 curbe; se observå caracterul de complementaritate în raport cu valoarea 1 (sau 100%).

Fig. 3.4. Probabilitatea de nedepå¿ire ¿i probabilitatea de depå¿ire.

Fig. 3.5. Interpretarea geometricå a probabilitå¡ii de depå¿ire.

52

Page 52: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n timp ce probabilitatea de nedepå¿ire F(x) reprezintå acea parte a ariei densitå¡ii de reparti¡ie situatå la stânga punctului x, probabilitatea de depå¿ire este egalå cu valoarea ariei de la dreapta aceluia¿i punct x (fig. 3.5). 3.2. REPREZENTAREA GRAFICÅ A PROBABILITźII DE DEPŪIRE

¥N HIDROLOGIE

Dupå cum s-a mai aråtat, în hidrologie probabilitatea capåtå caracter de variabilå independentå; ca urmare, se va proceda la o råsturnare ¿i rotire a reprezentårilor precedente în a¿a fel încât ordonata så devinå absciså, iar abscisa ordonatå. Procedând în acest mod, graficul din figura 3.5 devine cel din figura 3.6.

Probabilitatea de depå¿ire a valorii yp% este egalå cu aria ha¿uratå a densitå¡ii de reparti¡ie, iar probabilitatea de nedepå¿ire cu aria neha¿uratå. Dupå cum s-a mai aråtat, în hidrologie intereseazå în special probabilitatea de depå¿ire; din acest motiv probabilitatea de nedepå¿ire nici nu a mai fost reprezentatå pe graficul din figura 3.6.

Cu cât valoarea yp% este mai mare, cu atât aria cuprinså între densitatea de

reparti¡ie, ordonatå ¿i paralela duså prin yp% la absciså este mai micå (deci pro-babilitatea de depå¿ire p% este mai reduså).

Fig. 3.6. Reprezentarea curbei probabilitå¡ilor de depå¿ire în hidrologie. De aici rezultå cå unei probabilitå¡i de depå¿ire mai mici îi vor corespunde

valori ale variabilei aleatoare mai mari. Deci, dacå p1% < p2% atunci

yp1% > yp2%.

53

Page 53: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

De exemplu, debitul cu probabilitatea de depå¿ire 1 % este mai mare decât debitul cu probabilitatea de depå¿ire 10%, dar este mai mic decât valoarea corespunzåtoare probabilitå¡ii de 0,1% etc. (fig. 3.7).

Fig. 3.7. Curba probabilitå¡ilor de depå¿ire a debitelor maxime anuale.

3.3. EXTRAPOLAREA REPARTIºIILOR EMPIRICE

PRIN REPARTIºII TEORETICE

La proiectarea unei lucråri hidrotehnice sunt necesare anumite mårimi hidrologice (debite, niveluri etc.) caracterizate de probabilitå¡i de depå¿ire care nu se situeazå de obicei în domeniul valorilor måsurate. Astfel, dacå måsuråtorile hidrologice sistematice au o duratå de 20 de ani, utilizând formula i/(n+1), rezultå cå debitele måsurate corespund unor probabilitå¡i empirice de depå¿ire cuprinse aproximativ între 5% ¿i 95%; pentru 50 de ani de måsuråtori domeniul probabilitå¡ilor empirice este cuprins între 2% ¿i 98%. De fapt acesta este cazul râurilor interioare din ¡arå, unde måsuråtorile hidrologice acoperå în general o perioadå de 20 - 40 ani. Dar la proiectarea sau verificarea unor pår¡i ale sistemelor hidrotehnice sunt necesare mårimi (de ex.: debite) cu probabilitå¡i de depå¿ire de 1% sau 0,1% etc. ¥n aceste condi¡ii se recurge la prelungirea reparti¡iilor empirice prin reparti¡ii teoretice (fig. 3.8), care permit extrapolåri în afara domeniului valorilor måsurate. Cu alte cuvinte, aproximând reparti¡iile empirice prin reparti¡ii teoretice este posibilå extinderea rezultatelor cercetårii unei selec¡ii la întreaga popula¡ie, cu un grad de siguran¡å relativ ridicat; legitå¡ile statistice descifrate pe e¿antion sunt considerate ca reprezentative pentru întreaga popula¡ie statisticå. Dupå cum se ¿tie, reparti¡iile teoretice caracterizeazå întreaga popula¡ie statisticå ¿i sunt definite prin expresii analitice depinzând în general de 2-3 parametri. Reparti¡iile empirice sunt ob¡inute în urma cercetårii unei selec¡ii

54

Page 54: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

(e¿antion) de volum redus ¿i sunt definite prin mul¡imea cuplurilor {(xi, pi)},

unde pi este probabilitatea empiricå de depå¿ire.

Fig. 3.8. Extrapolarea reparti¡iei empirice printr-o reparti¡ie teoreticå: M - domeniul valorilor måsurate; E - domeniul valorilor extrapolate.

Pentru unele cazuri particulare, func¡iile de reparti¡ie teoretice sunt cunoscute apriori. ¥n mare majoritate a cazurilor înså, alegerea func¡iei de reparti¡ie teoreticå este mai dificilå; uneori douå sau trei func¡ii teoretice se preteazå la fel de bine pentru aproximarea reparti¡iei empirice. Selec¡ionarea unei func¡ii de reparti¡ie cu un numår mai mare sau mai mic de parametri, constituie în fond o problemå de optimizare, având de ales între flexibilitatea func¡iei ¿i gradul de siguran¡å al parametrilor estima¡i. Astfel, dacå numårul de parametri este mai mare (3-4, de ex.), erorile de calcul la aprecierea lor sunt mai mari ¿i deci sunt mai pu¡in precis determina¡i; invers, la un numår mic de parametri, precizia evaluårii acestora este ridicatå, dar func¡ia teoreticå este prea pu¡in flexibilå ¿i deci aproximarea reparti¡iei empirice va fi grosolanå. Adevårata func¡ie de reparti¡ie a popula¡iei statistice este, de altfel, greu de ob¡inut; astfel, dacå dintr-o popula¡ie statisticå se realizeazå o selec¡ie de volum n ¿i se determinå func¡ia de reparti¡ie, aceasta poate så difere de func¡ia gåsitå pentru altå selec¡ie de acela¿i volum ¿i, de asemenea, ambele pot så difere de func¡ia de reparti¡ie a popula¡iei statistice. ¥n principiu, în cazul setului de date hidrologice înregistrate, trebuie propuse mai multe func¡ii teoretice pentru aproximarea distribu¡iei empirice; dupå determinarea parametrilor acestor func¡ii, pe baza testelor de verificare a ipotezelor statistice, se re¡ine o singurå func¡ie teoreticå. Calitatea aproximårii reparti¡iei empirice prin reparti¡ia teoreticå va depinde de mårimea e¿antionului,

55

Page 55: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

alegerea adecvatå a func¡iei ¿i utilizarea celor mai corespunzåtoare metode de estimare a parametrilor. ¥n practica hidrologicå acest proces de cåutare a celei mai adecvate reparti¡ii teoretice nu mai are loc, admi¡ându-se cå distribu¡ia mårimilor analizate urmeazå o lege de tip Gama (cu 2 sau 3 parametri) sau o lege logaritmic normalå. Experien¡a a aråtat de fapt cå aceste func¡ii se preteazå foarte bine pentru analiza fenomenelor hidrologice din România. Estimarea variabilelor (parametrilor) care intervin în func¡iile de reparti¡ie teoretice are la bazå prelucrarea informa¡iilor con¡inute în ¿irul de date måsurat. Plecând de la valorile înregistrate se calculeazå o serie de valori tipice (caracteristice) ale variabilelor de selec¡ie cum sunt: valoarea medie, dispersia, abaterea medie påtraticå etc. Se considerå apoi cå aceste valori tipice sau parametri ai reparti¡iei empirice sunt în acela¿i timp ¿i parametrii reparti¡iei teoretice, utilizate pentru ajustarea ¿i extrapolarea reparti¡iei empirice (cu alte cuvinte parametrii popula¡iei statistice sunt estima¡i pe baza selec¡iei de care se dispune prin måsuråtori); evident acest procedeu reprezintå o aproxima¡ie, care constituie o surså de erori a calculului statistic.

56

Page 56: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

4. VALORI TIPICE ALE VARIABILELOR ALEATOARE Variabilele aleatoare sunt complet caracterizate prin densitatea de reparti¡ie sau func¡ia de reparti¡ie. De multe ori, în practicå este necesarå o definire mai sumarå a variabilelor aleatoare analizate; în acest scop se utilizeazå anumite valori caracteristice ata¿ate variabilelor aleatoare ¿i care pot fi grupate în parametri ai tendin¡ei centrale, ai variabilitå¡ii ¿i ai formei.

4.1. PARAMETRI AI TENDINºEI CENTRALE

Ace¿ti parametri definesc zona de grupare a celor mai frecvente valori.

• Valoarea medie. Fie o variabilå aleatoare discretå X, definitå prin distribu¡ia:

Xx x x

p p pn

n

:...

...1 2

1 2

⎛⎝⎜

⎞⎠⎟ . (4.1)

¥n aceast caz valoarea medie a variabilei X, notatå prin M(X), m sau µ este prin defini¡ie egalå cu:

M X x pi ii

n( ) = ∑

=1 . (4.2)

Dacå cele n valori sunt echiprobabile (pi = 1/n), atunci se ob¡ine cunoscuta rela¡ie a mediei aritmetice (denumitå ¿i medie de selec¡ie):

M Xn

xn

xii

n

ii

n( ) = ∑ = ∑

= =

1 1

1 1 . (4.3)

Media de selec¡ie va fi notatå în continuare prin x pentru a o deosebi de media m a popula¡iei. Se poate demonstra cå valoarea x poate fi consideratå drept indicator de estimare a mediei m a întregii popula¡ii; acest procedeu de estimare are o deplinå justificare teoreticå ¿i este utilizat în practicå, chiar ¿i pentru valori ale lui n < 30. Estimarea mediei pe baza acestei rela¡ii este cea mai

57

Page 57: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

bunå, în sensul cå dispersia ei este mai micå decât cea care se poate ob¡ine cu ajutorul oricårui alt procedeu de estimare a mediei. Totu¿i, dacå spa¡iul de selec¡ie este redus, apari¡ia din întâmplare a unor valori foarte mari sau foarte mici poate influen¡a media aritmeticå. Pentru numeroase mårimi hidrologice, densitatea de reparti¡ie a valorilor înregistrate este asimetricå; prin logaritmare se ob¡in distribu¡ii simetrice, iar media aritmeticå a acestor valori poate fi utilizatå ca parametru al tendin¡ei centrale. Se poate scrie:

log log ... log log( ... )

log( ... ) log ./

x x xn

x x xn

x x x X

n n

nn

g

1 2 1 2

1 21

+ + +=

⋅ ⋅ ⋅=

= ⋅ ⋅ ⋅ = (4.4)

Mårimea X g = (x1 . x2 . ... . xn)1/n

se nume¿te medie geometricå. Prin calculul mediei geometrice ¿i logaritmarea ei se ob¡ine destul de comod media

aritmeticå a logaritmilor valorilor xi ale variabilei aleatoare. ¥n cazul în care variabila aleatoare este continuå, suma din expresia (4.2) se

transformå în integralå, iar probabilitå¡ile pi se înlocuiesc prin probabilitå¡ile elementare f(x)⋅dx. Deci, în cazul unei variabile aleatoare continue, valoare medie este prin defini¡ie:

M X x f x dx( ) ( )= ∫−∞

+∞ . (4.5)

Ca interpretare geometricå (M. Mihåilå, 1965), valoarea medie reprezintå abscisa centrului de greutate al ariei delimitate de graficul distribu¡iei probabilitå¡ilor ¿i absciså (fig. 4.1).

Fig. 4.1. Interpretarea geometricå a valorii medii a unei variabile aleatoare: a - variabilå discretå; b - variabilå continuå.

58

Page 58: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

• Mediana. Mediana Me reprezintå valoarea centralå a unei reparti¡ii statistice. Cu alte cuvinte, probabilitatea ca variabila aleatoare X så ia valori mai mici

decât Me este egalå cu probabilitatea ca X så ia valori mai mari decât Me . Având în vedere faptul cå:

F(Me) + Fc(Me) = 1 (4.6)

¿i cå:

F(Me) = Fc(Me) , (4.7)

rezultå:

Prob (X < Me) = Prob (X ≥ Me) = 0,5 . (4.8) Fie, pentru început, cazul unei variabile discrete, având valorile ordonate crescåtor sau descrescåtor. Dacå reparti¡ia are 2k+1 valori, mediana este valoarea având rangul k+1. Dacå reparti¡ia are 2k valori, mediana este între valorile de rangul k ¿i k+1, ¿i în general se ob¡ine ca medie aritmeticå a celor douå valori. Reprezentând probabilitå¡ile empirice de depå¿ire ¿i nedepå¿ire, mediana este situatå la intersec¡ia celor douå grafice. ¥n cazul unei variabile aleatoare continue, mediana reprezintå abscisa acelui punct de pe curba densitå¡ii de reparti¡ie, a cårui ordonatå împarte suprafa¡a cuprinså între curbå ¿i axa x în douå suprafe¡e egale. Interpretarea geometricå a medianei se poate urmåri în figura 4.2.

Fig. 4.2. Interpretarea geometricå a medianei: a - variabilå discretå; b - variabilå continuå.

59

Page 59: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

• Modul. Modul Mo sau valoarea dominantå reprezintå acea valoare a variabilei care corespunde frecven¡ei celei mai mari.

Pentru o variabilå aleatoare de tip discret, având valorile xi ordonate,

crescåtor sau descrescåtor, caracterizate de probabilitå¡ile empirice pi, punctul

xm se nume¿te mod dacå este satisfåcutå rela¡ia:

pm > pi ; i ≠ m . (4.9)

Cu alte cuvinte, probabilitatea de realizare a valorii xi este mai mare decât probabilitatea aferentå oricårei alte valori a variabilei. Pentru o variabilå continuå se nume¿te mod orice punct de maxim al

densitå¡ii de reparti¡ie (deci pentru care dfdx

= 0 ¿i d fdx

2

20< ).

Densitatea de reparti¡ie f(x) se nume¿te unimodalå, bimodalå sau multimodalå, dupå cum admite unul, douå sau mai multe moduri. ¥n cazul unei reparti¡ii unimodale simetrice, media aritmeticå, mediana ¿i modul sunt identice; pentru o reparti¡ie u¿or asimetricå ¿i unimodalå, mediana se gåse¿te între medie ¿i mod, distan¡a sa fa¡å de mod fiind aproximativ, dublul distan¡ei sale fa¡å de media aritmeticå (fig. 4.3).

Fig. 4.3. Pozi¡ia relativå a mediei aritmetice, medianei ¿i modului.

• Momente de ordin superior. ¥n cazul unei variabile aleatoare discrete,

momentul de ordinul r este prin defini¡ie:

M xr ir

i

n

i= ∑=1

p , (4.10)

60

Page 60: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

unde, prin pi s-au notat probabilitå¡ile de apari¡ie a valorilor xi.

Dacå valorile xi sunt echiprobabile pni =

⎛⎝⎜

⎞⎠⎟

1, rezultå:

Mn

xrr

i

n= ∑

=

1

1i . (4.11)

Pentru r = 1, se ob¡ine chiar expresia mediei aritmetice (media de selec¡ie):

M xn

xii

n

1

1

1= = ∑

= . (4.3')

¥n cazul unei variabile aleatoare continue definite prin densitatea de reparti¡ie f(x), momentul de ordinul r se calculeazå cu expresia:

M x f xrr= ∫

−∞

+∞( )dx

x

. (4.12)

ªi în acest caz, pentru r = 1 se ob¡ine valoare medie a variabilei:

M m x f x d1 = = ∫−∞

+∞( ) . (4.5')

Denumirea de moment este împrumutatå din mecanicå: probabilitå¡ile

elementare joacå rolul for¡elor al cåror moment se calculeazå, iar valorile xi ale variabilei reprezintå bra¡ul for¡ei. Conform defini¡iei, momentul se calculeazå în raport cu originea axelor de coordonate. Un interes special îl prezintå momentele centrate, care se calculeazå în raport cu valoarea medie a variabilei. Deoarece momentele centrate de ordin superior intervin în calculul unor parametri ai variabilitå¡ii ¿i formei, ele vor fi definite dupå prezentarea acestor parametri.

4.2. PARAMETRI AI VARIABILITźII

Valorile tipice prezentate anterior caracterizeazå pozi¡ia centrului de grupare, aceste mårimi nefurnizând nici un fel de informa¡ii privind gradul de dispersare al valorilor pe care le poate lua variabila aleatoare fa¡å de valoarea centralå.

61

Page 61: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

S-au imaginat mai mul¡i parametri pentru måsurarea dispersiei, baza¡i în general pe no¡iunea de abatere:

• Amplitudinea sau extinderea reparti¡iei reprezintå abaterea dintre cea

mai mare valoare observatå xmax ¿i cea mai micå xmin:

a = xmax - xmin . (4.6) Este cel mai simplu parametru din aceastå categorie, dar ¿i cel mai aproximativ.

• Abaterea medie reprezintå media abaterilor în valoare absolutå dintre valorile curente ¿i media aritmeticå x :

ex x

nM

ii

n

=−∑

=1 . (4.7)

Cu acest parametru nu se pot efectua înså calcule algebrice.

• Dispersia sau varian¡a. Un alt mod de a eviden¡ia valorile absolute ale abaterii fa¡å de medie constå în definirea dispersiei variabilei aleatoare. Dispersia se calculeazå cu expresia:

D x mii

n2 2 2

1= = − ⋅∑

=σ ( ) pi

x dx

, (4.8)

în cazul variabilelor aleatoare discrete ¿i cu:

D x m f2 2 2= = −∫ ⋅−∞

+∞σ ( ) ( ) , (4.9)

pentru variabilele continue.

¥n cazul unei selec¡ii de volum limitat, pentru dispersie în loc de σ2

(rezervatå pentru popula¡ia statisticå) se va utiliza nota¡ia s2 (care reprezintå, de

fapt, un indicator de estimare al dispersiei popula¡iei analizate).

¥n cazul unei selec¡ii de volum n > 30 ÷ 40, admi¡ând cå valorile xi ale variabilei sunt egal probabile, pentru calculul dispersiei se poate utiliza rela¡ia:

s x x pn

x xii

n

i ii

n2

1

2

1

1= −∑ ⋅ = −∑

= =( ) ( 2) , (4.10)

unde x este media de selec¡ie (media aritmeticå a valorilor înregistrate).

62

Page 62: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dacå numårul de valori n < 30, dispersia se poate estima cu ajutorul rela¡iei:

sn

x xii

n2

1

11

=−

−∑=

( 2) . (4.11)

Pentru a exemplifica modul în care dispersia reflectå gradul de împrå¿tiere al valorilor variabilei, în figura 4.4, s-au considerat douå densitå¡i de reparti¡ie continue ¿i simetrice, având aceea¿i valoare medie.

Fig. 4.4. Caracterizarea împrå¿tierii valorilor variabilei prin intermediul dispersiei.

Este evident cå la reparti¡ia f2(x) punctele mai depårtate de valoarea medie m,

de¡in o pondere mai mare decât în cazul reparti¡iei f1(x) ¿i deci

(dispersia valorilor celei de-a doua reparti¡ii este mai mare decât dispersia asociatå primei reparti¡ii). Este de remarcat faptul cå dispersia accentueazå efectul abaterilor mari, acestea intervenind în formula de defini¡ie la puterea a doua.

s s22

12>

• Abaterea medie påtraticå (abaterea standard). Dispersia prezintå dezavantajul cå se exprimå în unitå¡ile de måsurå ale variabilei ridicate la påtrat. Pentru a elimina acest neajuns s-a introdus un alt indicator ¿i anume abaterea medie påtraticå, definit ca radicalul de ordinul doi al dispersiei:

σ σ= 2 (pentru popula¡ii statistice) (4.12) sau:

s s= 2 (pentru selec¡ii) . (4.12') Având în vedere numårul în general redus al valorilor hidrologice din måsuråtori (selec¡ii cu n < 30), pentru calculul abaterii medii påtratice se utilizeazå rela¡ia:

63

Page 63: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

sx x

n

ii

n

=−∑

−=

( )2

1

1 . (4.13)

• Coeficientul de varia¡ie. Pentru a elimina complet influen¡a unitå¡ilor de

måsurå ale variabilei, s-a introdus un parametru de dispersie relativ, definit ca raportul dintre abaterea medie påtraticå ¿i media aritmeticå:

Cmv =σ

, respectiv Csxv = , (4.14)

dupå cum este vorba de popula¡ia statisticå sau de o selec¡ie. Rezultå cå acest coeficient de varia¡ie are aceea¿i semnifica¡ie ca ¿i dispersia

sau abaterea medie påtraticå: cu cât coeficientul de varia¡ie Cv este mai mare, cu atât valorile variabilei aleatoare au o împrå¿tiere mai mare (sau ceea ce este acela¿i lucru, au un domeniu de varia¡ie mai larg). ¥n cazul unei selec¡ii de volum limitat n, coeficientul de varia¡ie se calculeazå cu formula:

Cx

x x

n

x x

n x

nx x

x nxx

v

ii

n

ii

n

i

i

ni

i

n

=−∑

−=

−∑

−=

=−

−⎛⎝⎜

⎞⎠⎟

∑ =−

−⎛⎝⎜

⎞⎠⎟

= =

= =

11 1

11

11

1

2

1

2

12

2

1

2

1

( ) ( )

( )

. (4.15)

Notând cu:

kxxi

i= , (4.16)

rela¡ia de calcul devine:

Ck

nv

ii

n

=−∑

−=

( )1

1

2

1 . (4.17)

Coeficientul de varia¡ie este cuprins de regulå între zero ¿i doi, având o valoare medie de 0,5.

64

Page 64: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Valoarea coeficientului de varia¡ie exercitå o influen¡å directå asupra dimensiunilor lucrårilor de gospodårire a apelor; pentru râuri cu variabilitate

mare a debitelor (deci cu Cv mare) sunt necesare volume mai mari de lacuri de acumulare pentru a putea realiza acela¿i grad de regularizare a debitelor cursului de apå respectiv.

• Momente centrate. La momentele de ordin superior s-a aråtat cå acestea sunt calculate în raport cu originea axelor de coordonate. Efectuând calculul momentelor fa¡å de valoarea medie a variabilei se ob¡in a¿a numitele momente centrate. Momentul centrat de ordinul r este prin defini¡ie:

m x mr ir

ii

n= − ⋅∑

=( )

1p

dx

(pentru variabile discrete) (4.18)

¿i:

m x m f xr ir= −∫

−∞

+∞( ) ( ) (pentru variabile continue) (4.19)

Momentele de ordin par au valori pozitive, în timp ce momentele de ordin impar pot fi pozitive sau negative. ¥n cazul unei selec¡ii, la care toate valorile variabilei sunt echiprobabile, momentul centrat de ordinul r se calculeazå cu rela¡ia:

mn

x xr ir

i

n= −∑

=

1

1( ) . (4.20)

Particularizând expresia lui mr pentru r = 1, se ob¡ine:

( )

( )

mn

x xn

x x

nx

nx x x

nx

n x

nx x

ii

n

ii

n

i

n

ii

n

ii

n

11 1 1

1 1

1 1

1 1 10

= −∑ = ∑ − ∑⎛⎝⎜

⎞⎠⎟=

= ∑ − + + + = ∑ − = − =

= = =

= =...

. (4.21)

Deci momentul centrat de ordinul 1 (valoarea medie a abaterilor fa¡å de medie) este nul.

65

Page 65: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Momentul centrat de ordinul 2 este chiar dispersia variabilei aleatoare; într-adevår:

( )mn

x x sii

n

22

1

21= −∑ =

= . (4.22)

¥n acela¿i timp, abaterea medie påtraticå este radicalul momentului centrat de ordinul 2:

s m= 2 , (4.23)

iar coeficientul de varia¡ie Cv este:

Csx

m

Mv = = 2

1

, (4.24)

unde M1 este media aritmeticå sau momentul de ordinul unu al variabilei. Momentul centrat de ordinul 2 (sau dispersia) poate fi calculat numai în func¡ie de momentele centrate de ordinul unu ¿i doi:

( )mn

x xn

x xn

xn

xii

n

ii

n

ii

n

i

n

22

1

2

1 1

2

1

1 12

1 1= −∑ = ∑ − ∑ + ∑= = = =

(4.25)

Dar:

1

1nxi

i

n

=∑ = x , (4.26)

iar:

1 2

1

22

nx

nxn

xi

n

=∑ = = . (4.27)

Se ob¡ine deci:

mn

x x xn

x xii

n

ii

n

22

1

2 2 2

1

212

1= ∑ − + = ∑ −= =

. (4.28)

Deoarece:

66

Page 66: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

1 2

12n

x Mii

n

=∑ = , (4.29)

x M212= , (4.30)

rezultå:

m s M M22

22= = − 1 . (4.31)

Aceastå rela¡ie este deosebit de utilå pentru calculul dispersiei (respectiv al abaterii medii påtratice ¿i al coeficientului de varia¡ie), întrucât mic¿oreazå mult volumul de calcule. ¥n practica hidrologicå aceastå rela¡ie este mai pu¡in utilizatå, preferându-se rela¡ia de defini¡ie:

( )m sn

x xii

n

22 2

1

1= = −∑=

.

¥n mod similar, se poate aråta cå momentul centrat de ordinul 3 se poate calcula cu rela¡ia:

m M M M M3 3 2 133 2= − + 1 . (4.32)

ªi în acest caz, în hidrologie este preferatå rela¡ia de defini¡ie a momentelor de ordinul 3, de¿i calculele sunt mai laborioase. Pentru a ¡ine cont de numårul limitat de valori disponibile din înregistråri (selec¡ii de volum redus), în expresia momentului centrat de ordinul 2 sau 3, numitorul nu va avea valoarea n, ci n - 1.

¥n final, mai trebuie aråtat cu cât ordinul r al momentului centrat mr este mai

mare, cu atât apari¡ia din întâmplare în cadrul selec¡iei a unor valori foarte mari sau foarte mici (deci care se abat mult de la medie) va influen¡a în mai mare måsurå valoarea momentului. Rezultå cå cu cât r este mai mare, cu atât parametrii statistici ai selec¡iei diferå mai mult de parametrii popula¡iei analizate.

4.3. PARAMETRI AI FORMEI Dacå valorile variabilei sunt egal dispersate de o parte ¿i de alta a valorii centrale, variabila aleatoare are o reparti¡ie simetricå; în caz contrar reparti¡ia este asimetricå. Pentru o reparti¡ie simetricå media, mediana ¿i modul coincid, iar valorile densitå¡ii de reparti¡ie sunt egale în raport cu valoarea medie:

67

Page 67: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

f(m - x) = f(m + x) . (4.33)

Singurul indicator utilizat în hidrologie pentru caracterizarea formei este

coeficientul de asimetrie, notat prin Cs.

Prin defini¡ie:

Cm

s = 33σ

, (4.34)

unde m3 este momentul centrat de ordinul 3, iar σ este abaterea medie påtraticå. ¥n cazul unei variabile aleatoare de selec¡ie coeficientul de asimetrie se calculeazå cu rela¡ia:

( ) ( )( )

Cn

x xs n

x xx C

n

x x

x C n

x

x C

s ii

n

ii

n

v

i

i

n

v

i

i

n

v

= −∑ = −∑⋅

=

=−⎛

⎝⎜⎞⎠⎟

∑ = −⎛⎝⎜

⎞⎠⎟

= =

= =

1 1 1 1

1 1 11

1

3

13

3

13

3

13

3

13

. (4.35)

Notând, ca ¿i la calculul coeficientului de varia¡ie, raportul xx

i prin ki, rela¡ia

devine:

( )C

k

nCs

ii

n

v

=−∑

=1

3

13

. (4.36)

¥n cazul în care n < 30, în rela¡ia (4.36) la numitor n va fi înlocuit prin n-1.

Coeficientul de asimetrie este nul în cazul unei reparti¡ii simetrice, deoarece

ponderea punctelor din stânga valorii medii este egalå cu ponderea celor din

dreapta, semnele fiind înså contrare (fig.4.5).

68

Page 68: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 4.5. Alura densitå¡ii de reparti¡ie pentru valori ale lui Cs pozitive, nule sau negative (variabile aleatoare continue).

¥n cazul unei reparti¡ii asimetrice, deplasatå spre zona valorilor mici,

coeficientul de asimetrie este pozitiv, deoarece, de¿i mai pu¡ine, valorile xi > x

conduc la o sumå ( )x xi −∑3

mai mare decât valorile xi < x (mai numeroase,

dar cu abateri mai mici fa¡å de medie). ¥n mod similar, dacå distribu¡ia este deplasatå spre zona valorilor mari, coeficientul de asimetrie este negativ. ¥n general, în cazul variabilelor hidrologice, coeficientul de asimetrie este pozitiv. Rareori (de exemplu la prelucrarea ¿irului nivelurilor maxime în cazul unui râu la care albia majorå are o capacitate ridicatå de transport) coeficientul de asimetrie rezultå negativ. Pentru caracterizarea formei se mai poate utiliza ¿i coeficientul de boltire; în expresia lui intervin înså momente de ordinul 4 care sunt evaluate mai pu¡in precis. Din acest motiv coeficientul de boltire nu este utilizat în hidrologie.

4.4. CALCULUL PARAMETRILOR STATISTICI

AI REPARTIºIEI EMPIRICE

Datele hidrologice se prezintå în general în ordine cronologicå, mul¡imea

valorilor înregistrate formând seria hidrologicå completå. De obicei, nu sunt

utilizate seriile complete, ci se practicå selectarea din serie a valorilor care

prezintå interes în func¡ie de scopul urmårit, restul valorilor excluzându-se.

Rezultå astfel serii de date par¡iale (STAS 4068/1 - 82).

Deosebit de utilizate sunt seriile valorilor extreme (maxime sau minime),

care se ob¡in discretizând axa timpului în intervale egale ¿i alegând în cadrul

69

Page 69: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

fiecårui interval de timp valorile care intereseazå. Dacå intervalul de timp ales

este de 1 an, rezultå serii extreme anuale (de exemplu ¿irul debitelor maxime

anuale); pentru intervale mai mici rezultå serii sezoniere.

¥n marea majoritate a cazurilor, prelucrårile statistice din hidrologie au ca

scop trasarea curbei teoretice a probabilitå¡ilor de depå¿ire a debitelor maxime

sau minime anuale. Calculele respective au la bazå aproxima¡ia cå parametrii

popula¡iei statistice (deci parametrii curbei teoretice a probabilitå¡ilor) sunt

aceea¿i cu parametrii ¿irului de date înregistrate (adicå parametrii curbei

empirice a probabilitå¡ilor).

Justificarea teoreticå a acestui mod de rezolvare o constituie teorema lui

Glivenko (Gh. Mihoc ¿.a., 1976). Conform teoremei lui Glivenko rezultå cå

odatå cu cre¿terea volumului selec¡iei, func¡ia empiricå de reparti¡ie tinde cåtre

func¡ia de reparti¡ie teoreticå a variabilei X. ¥n studiul reparti¡iilor empirice se

pot, deci, utiliza reparti¡iile teoretice.

Ca urmare, prima opera¡ie constå în calculul parametrilor de selec¡ie. Dupå

aceea este util så se cunoascå erorile de care sunt afecta¡i parametrii astfel

determina¡i, aducând eventual corec¡ii unora dintre ei. ¥n sfâr¿it cu parametrii

astfel ale¿i se construie¿te curba teoreticå a probabilitå¡ilor de depå¿ire, curbå

care permite extrapolarea ¿irului de date înregistrate în afara domeniului de

måsuråtori curente.

Succesiunea opera¡iilor pentru construirea curbei empirice a probabilitå¡ilor

de depå¿ire ¿i calculul parametrilor statistici ai ¿irului de date înregistrate este

urmåtoarea:

− Se selec¡ioneazå din hidrograful debitelor ¿irul valorilor maxime (sau minime) anuale;

− Se reordoneazå acest ¿ir în ordine descrescåtoare, de la cea mai mare valoare înregistratå la cea mai micå; fie i (i = 1, ..., n) numårul de ordine al debitului din ¿irul ordonat descrescåtor;

− Se atribuie fiecårui debit Qi probabilitatea de depå¿ire empiricå:

pi

ni = +1 ; (4.37)

− Se reprezintå grafic punctele de coordonate (pi , Qi), ob¡inându-se astfel curba empiricå a probabilitå¡ilor de depå¿ire (fig. 4.6);

70

Page 70: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 4.6. Curba empiricå a probabilitå¡ilor de depå¿ire.

− ¥n continuare, se calculeazå valoarea medie a ¿irului de date:

Qn

Qii

n= ∑

=

1

1 .

Suma se poate calcula utilizând atât coloana valorilor înregistrate în ordine cronologicå, cât ¿i coloana valorilor rearanjate în ordine descrescåtoare, rezultatul fiind evident acela¿i.

− Se calculeazå valorile:

kQQi

i=

Calculul se conduce, dupå cum urmeazå în tabelul 4.1. Ultimele douå coloane servesc pentru calculul coeficientului de varia¡ie, respectiv de asimetrie (rela¡iile 4.17, respectiv 4.36). Dupå cum se va vedea mai departe, de multe ori coeficientul de asimetrie nu se mai calculeazå, fiind ales

func¡ie de Cv . De o deosebitå utilitate la determinarea parametrilor curbei probabilitå¡ilor

de depå¿ire este debitul istoric (determinat dupå urme).

71

Page 71: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Tabelul 4.1

Anul

Q

(cronologic)

Qi(ordonat

descrescåtor)

i

pi

kQ

Qii=

(ki-1)2

(ki-1)3

19... Q19... Q1

1

1

1n +

19... Q19... Q2

2

21n +

19... Q19...

. . .

19... Q19...

. . .

... ... ... ... ... 19...

Q19... Qn

n

n

n + 1

Q

Qin

=∑ ( )k i

i

n−∑

=1

2

1( )k i

i

n−∑

=1

3

1

¥n cazul în care se dispune de ¿irul debitelor maxime anuale Qi pentru o

perioadå de n ani ¿i de debitul maxim istoric QN dintr-o perioadå de N ani (care înså nu s-a produs în intervalul cu date înregistrate), pentru calculul parametrilor se utilizeazå formulele (C. Mociorni¡a ¿.a., 1979):

QN

QN

nQN

i

n' = + −∑

⎛⎝⎜

⎞⎠⎟=

1 1

1i ; (4.38)

( ) ( )CN

kN

nkv N i

i

n' = − + − −∑⎡⎣⎢

⎤⎦⎥=

11

11

2

1

2 . (4.39)

Dacå în ¿irul celor n valori maxime anuale ale debitelor existå o valoare foarte mare în raport cu celelalte (¿i care constituie debitul maxim istoric pentru o perioadå de N > n ani), pentru calcul se vor utiliza rela¡iile (C. Mociorni¡a ¿.a., 1979):

QN

QN

nQN

i

n' = +

−∑

⎛⎝⎜

⎞⎠⎟=

−1 1

1

1

i ; (4.40)

72

Page 72: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( ) ( )CN

kNn

kv N ii

n' =

−− +

−−

−∑⎡⎣⎢

⎤⎦⎥=

−11

111

12

1

1 2 (4.41)

¥n rela¡iile anterioare:

k Q QN N= / ' . (4.42)

Parametrii, Q , Cv ¿i Cs au fost calcula¡i prin metoda momentelor (în evaluarea lor au intervenit momente de ordinul unu, doi, respectiv trei); aceastå metodå este de altfel ¿i cea mai utilizatå în practicå. Pentru estimarea parametrilor se mai poate folosi metoda verosimilitå¡ii maxime, metoda celor mai mici påtrate, metoda intervalelor de încredere etc. (M. Shahin, ¿.a., 1993). ¥n continuare vor fi prezentate câteva aspecte metodologice referitoare la unele din aceste metode de calcul.

4.5. EVALUAREA PARAMETRILOR REPARTIºIILOR TEORETICE

¥n hidrologie tipul de reparti¡ie teoreticå este cunoscut în general, din experien¡a trecutå. ¥n practica hidrologicå din ¡ara noastrå sunt utilizate curbele de reparti¡ie triparametrice Kri¡ki - Menkel ¿i curbele de reparti¡ie binomialå Pearson III. ¥n principiu, legea de reparti¡ie teoreticå se intuie¿te pe baza reprezentårilor grafice ale variabilelor de selec¡ie; calculele urmåtoare se vor efectua apoi pe baza ipotezei de reparti¡ie teoretice admise. Presupunând tipul de reparti¡ie cunoscut se pune acum problema evaluårii (estimårii) parametrilor reparti¡iei teoretice. Numai dupå aceastå opera¡iune reparti¡ia este complet determinatå. Valorile parametrilor variabilei teoretice (care caracterizeazå popula¡ia statisticå) sunt estimate pe baza variabilelor de selec¡ie (adicå a valorilor înregistrate). 4.5.1. METODA MOMENTELOR Fie f(x, a, b, c, ...), func¡ia de probabilitate (în cazul unei reparti¡ii discrete), respectiv densitatea de reparti¡ie (în cazul unei reparti¡ii continue), func¡ie care depinde de un numår de parametri a, b, c, ... necunoscu¡i ¿i care trebuie determina¡i. Fie k numårul acestor parametri. Metoda momentelor constå în calcularea primelor k momente atât ale variabilei teoretice având reparti¡ia f(x, a, b, c, ...), cât ¿i ale variabilei de

73

Page 73: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

selec¡ie. Momentele teoretice vor avea expresii func¡ie de parametrii necunoscu¡i a, b, c, ...:

M1(a, b, c, ...); M2(a, b, c, ...); ... ; Mk(a, b, c, ...)

Fie M M - primele k momente empirice ale variabilei de selec¡ie,

calculate cu ajutorul valorilor înregistrate x

Mk1 2* *, , ,K *

1, x2, ..., xn. Prin egalarea celor 2 rânduri de momente se ob¡ine un sistem (neliniar în general) de k ecua¡ii cu k necunoscute, ale cårei solu¡ii estimeazå parametrii reparti¡iei teoretice. Fie, de exemplu, reparti¡ia Gama cu 2 parametri:

f x a ba b

x ea

a x( , , )( )

/= − −1 1

Γb

b=

2+

(x≥0; a>0; b>0) (4.43)

Se pune problema evaluårii parametrilor a ¿i b, utilizând metoda momentelor. Momentele teoretice de ordinul 1 ¿i 2, ¡inând seama ¿i de defini¡ia func¡iei euleriene de spe¡a a doua (func¡ia gama), sunt (C. Dinescu, V. Såvulescu, 1978):

M xf x a b dx a10

= ∫∞

( , , ) ; (4.44)

M x f x ab dx a a b22

0

1= =∫∞

( , ) ( ) . (4.45)

Primele douå momente empirice sunt:

Mn

xii

n

11

1* = ∑=

; (4.46)

Mn

xii

n

22

1

1* = ∑=

. (4.47)

Egalând momentele teoretice cu momentele empirice se ob¡ine un sistem de douå ecua¡ii cu douå necunoscute:

abn

xii

n= ∑

=

1

1 ; (4.48)

74

Page 74: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

a a bn

xii

n( )+ = ∑

=1

12

1

2 . (4.49)

Rezolvarea acestui sistem conduce la evaluarea parametrilor a ¿i b ; cu aceasta, reparti¡ia variabilei teoretice este complet determinatå. Metoda momentelor este dupå cum s-a mai aråtat cea mai utilizatå în practica hidrologicå. 4.5.2. METODA VEROSIMILITźII MAXIME

Aceastå metodå pleacå de asemenea de la valorile înregistrate x1, x2, ..., xn ¿i de la expresia func¡iei f(x, a, b, ...), unde a, b, ... sunt parametrii care trebuie estima¡i. Se nume¿te func¡ie de verosimilitate func¡ia:

( ) ( ) ( ) ( ) ( )V a b f x a b f x a b f x a b f x a bn ii

n, , ... , , , ... , , , ... , , , ... , , , ...= ⋅ ⋅ = ∏

=1 2

1 . (4.50)

Valorile cele mai verosimile pentru a, b, c, ... sunt acelea care maximizeazå func¡ia V(a, b, c, ...). ¥n continuare trebuie aplicate tehnici de gåsire a extremului unei func¡ii care depinde de mai multe variabile (derivarea func¡iei de verosimilitate V în raport cu cele k necunoscute, anularea celor k derivate par¡iale ¿i rezolvarea sistemului rezultat). Pentru efectuarea mai comodå a calculelor acest procedeu nu se aplicå func¡iei de verosimilitate V, ci logaritmului ei, ¡inând seama de faptul cå o func¡ie oarecare î¿i atinge maximul odatå cu logaritmul såu natural. Fie, de exemplu, densitatea de reparti¡ie:

( )f x a bb

ex a

b, , =−

−⎛⎝⎜

⎞⎠⎟1

2

12

2

π ; x∈R , (4.51)

¿i valorile de selec¡ie x1, x2, ..., xn. ¥n acest caz func¡ia de verosimilitate este (C. Dinescu, V. Såvulescu, 1978):

( )( )

V a bb

eb

ei

nx a

b

nn

x aii

i

n

( , ) = ∏ =∑

=

− −⎛⎝⎜

⎞⎠⎟

− −=

1

2

1

21

12

1

2b

2

2

2

1

π π . (4.52)

75

Page 75: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Prin logaritmare se ob¡ine:

( ) ( )ln , ln lnV a b n b nb

x aii

n= − ⋅ − ⋅ − −∑

=2

12 2

2

1π . (4.53)

¥n continuare se calculeazå derivatele par¡iale de ordinul unu ale func¡iei ln V, în raport cu necunoscutele a ¿i b:

( )∂∂

ln ( , )V a ba b

x aii

n= ∑

=

12

1− (4.54)

( )∂∂

ln ( , )V a bb

nb b

x aii

n= − + −∑

=

13

2

1 (4.55)

Anulând cele douå derivate se ob¡ine urmåtorul sistem:

( )x aii

n−∑ =

=10 (4.56)

( )− + −∑ ==

nb b

x aii

n10

3

2

1 . (4.57)

Din ecua¡ia (4.56) rezultå:

( )x a x a x naii

n

ii

n

i

n

ii

n−∑ = ∑ − ∑ = −∑ =

= = = =1 1 1 10 (4.58)

Deci:

na x ii

n= ∑

=1 (4.59)

sau:

an

xii

n= ∑

=

1

1 . (4.60)

Cu alte cuvinte, estimatorul de maximå verosimilitate al parametrului a este chiar media de selec¡ie x .

76

Page 76: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥nlocuindu-l pe a prin x în ecua¡ia (4.57), se ob¡ine:

( )nb b

x xii

n= −∑

=

13

2

1 , (4.61)

adicå:

( )bn

x xii

n2 2

1

1= −∑=

sau b = s . (4.62)

Rezultå cå parametrul b are drept estimator de maximå verosimilitate abaterea medie påtraticå de selec¡ie s. Cu alte cuvinte parametrii a ¿i b din expresia densitå¡ii de reparti¡ie teoreticå sunt chiar valoarea medie m, respectiv abaterea medie påtraticå σ a popula¡iei. Func¡ia având densitatea de reparti¡ie:

( )f x m ex m

, ,σσ π

σ=−−

−⎛⎝⎜

⎞⎠⎟1

2

12

2

, x ∈ R (4.63)

poartå numele de reparti¡ie normalå ¿i poate fi luatå drept model teoretic pentru cercetarea probabilisticå a unui numår foarte mare de fenomene aleatoare. 4.5.3. METODA CELOR MAI MICI PÅTRATE Fie f(x, a, b, c, ...) densitatea de reparti¡ie ai cårei parametri trebuie determina¡i. Din punct de vedere matematic, problema constå în gåsirea acelei configura¡ii a parametrilor a, b, c, ... astfel încât suma påtratelor (sau suma

modulilor) abaterilor dintre probabilitå¡ile teoretice pit ¿i probabilitå¡ile empirice

pie så fie minimå:

( )F p p iit

ie

i

n= −∑ →

=

2

1min m

dx

. (4.64)

Probabilitå¡ile teoretice p de depå¿ire ale valorilor înregistrate xit

i se

evalueazå cu rela¡iile:

( )p f x a b cit

xi

= ∫+∞

, , , , ... , (4.65)

77

Page 77: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

în timp ce probabilitå¡ile empirice pie se ob¡in cu rela¡ia Weibull:

pi

nie =

+ 1 . (4.66)

Func¡ia obiectiv are deci expresia (R. Drobot, 1989):

F f x a b c dxi

nim

xi

n

i

= −+

∫⎡

⎣⎢

⎦⎥∑ →

+∞

=( , , , ,...) min

11

2

. (4.67)

Pentru integrarea densitå¡ii de reparti¡ie se utilizeazå metode numerice, ca de exemplu metoda Gauss cu 8 sau 16 puncte (G. Vraciu, A. Popa, 1982). ¥n vederea cre¿terii preciziei calculului, integrarea se poate efectua din aproape în

aproape între douå valori succesive xi , respectiv xi+1, iar acolo unde ecartul

între douå valori succesive este prea mare, se poate recurge chiar la divizarea acestuia. Cåutarea minimului se face prin procedee numerice de programare neliniarå care nu apeleazå la calculul derivatelor func¡iei obiectiv; cele mai bune rezultate se ob¡in cu algoritmul Nelder-Mead. Avantajul metodei celor mai mici påtrate constå în flexibilitatea sa în evaluarea parametrilor. Astfel, în metoda momentelor calculul ordonatelor curbei Kri¡ki-Menkel a probabilitå¡ilor de depå¿ire are loc admi¡ând valori fixe,

prestabilite ale raportului Cs /Cv , care variazå de la 1,0 la 4,0 cu un pas de

discretizare de 0,5. Metoda celor mai mici påtrate permite ob¡inerea optimului global al func¡iei (4.67), valorile optime ale parametrilor a, b, c, ... , putând

conduce la orice raport Cs /Cv , fårå nici o restric¡ie.

Dupå evaluarea parametrilor, probabilitatea de depå¿ire teoreticå

corespunzåtoare unei valori xi oarecare se ob¡ine prin integrarea rela¡iei (4.65).

Dacå intereseazå valoarea xi , cåreia îi corespunde o probabilitate de depå¿ire datå (de ex: p%=1%), calculul se efectueazå prin încercåri succesive: se propun

diverse valori xi ca limitå inferioarå de integrare în rela¡ia (4.65), ob¡inându-se

valorile corespunzåtoare pentru probabilitå¡ile teoretice ; prin interpolare

rezultå imediat valoarea x cåutatå, procedeul fiind rapid convergent.

pit

78

Page 78: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Pentru exemplificare, se considerå ca reparti¡ie teoreticå, distribu¡ia Gama cu

trei parametri, care va fi utilizatå pentru calculul probabilitå¡ilor teoretice de

depå¿ire în cazul unui ¿ir scurt (n = 25) de debite maxime anuale:

( )f x x e x( )( )

( ) ( ) /= −− − −1 1

β αγα

α γ β

Γ , (4.68)

unde nota¡iile au urmåtoarea semnifica¡ie: α este parametrul de formå; β - parametrul de scarå; γ - limita inferioarå a valorilor distribu¡iei. Fie reparti¡ia empiricå:

x Q pi

ni i i= =+

⎛⎝⎜

⎞⎠⎟

⎧⎨⎩

⎫⎬⎭

;1

,

unde debitele Qi sunt ordonate în ordine descrescåtoare, i fiind numårul de ordine din acest ¿ir:

Q1 > Q2 > ... > Qi > ... > Qn . (4.69)

Probabilitå¡ile teoretice pit de depå¿ire ale debitelor înregistrate se ob¡in cu

rela¡ia:

p f x dx x eit

Q Q

x

i i

= ∫ = ∫ −+∞ +∞

− − −( ) ( )( ( )/1 1)

βγα α

α γ β

Γdx . (4.70)

Func¡ia obiectiv are expresia:

F x e dxi

nim

Q

x

i

n

i

= ∫ − −+

⎣⎢

⎦⎥∑ →

+∞− − −

=

11

1)

1

2

βγα α

α γ β

Γ( ) min( ( )/ (4.71)

Coordonatele minimului sunt în cazul de fa¡å cei trei parametri necunoscu¡i α, β ¿i γ care asigurå aproximarea cea mai bunå a curbei empirice de cåtre curba teoreticå.

79

Page 79: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Pentru reparti¡ia Gama cu 3 parametri, momentul de ordinul 1 (media aritmeticå), respectiv momentele centrate de ordinul 2 ¿i 3 au expresiile (V. Yevdjevitch, 1972):

m xf x dx= ∫ = ++∞

( )γ

γ αβ ;

( )m x m f x dx22 2 2= = −∫ =

+∞σ

γ( ) αβ ; (4.72)

( )m x m f x dx33 32= −∫ =

+∞( )

γαβ .

Ca urmare, coeficien¡ii de varia¡ie ¿i asimetrie sunt:

Cmv = =

+σ β α

γ αβ ,

(4.73)

Cm

s = =33

2σ α

.

De aici rezultå imediat raportul Cs /Cv în func¡ie de parametrii α, β, ¿i γ determina¡i prin procedeul de optimizare.

Fig. 4.7. Trasarea curbei teoretice a probabilitå¡ilor de depå¿ire prin procedeul clasic ¿i prin optimizare.

80

Page 80: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n figura 4.7 sunt reprezentate curba empiricå a probabilitå¡ilor de depå¿ire precum ¿i curbele teoretice calculate cu parametrii ob¡inu¡i prin metoda momentelor (curba 1), respectiv prin optimizare (curba 2).

Chiar ¿i în cazul unei alegeri foarte bune a raportului Cs /Cv (ceea ce nu este întotdeauna sigur în practicå), aproximarea curbei empirice este mai slabå decât în cazul utilizårii parametrilor ob¡inu¡i prin optimizare.

4.6. ERORI ªI LIMITE ALE CALCULULUI STATISTIC

Efectuând mai multe selec¡ii de acela¿i volum dintr-o popula¡ie statisticå ¿i calculând parametrii statistici uzuali (valoare medie, coeficient de varia¡ie ¿i coeficient de asimetrie) se ob¡in valori ale acestora, diferite de la selec¡ie la selec¡ie. Cu cât volumul selec¡iei este mai mare, cu atât fluctua¡iile parametrilor vor fi mai mici, tinzând la limitå cåtre parametrii popula¡iei examinate; invers, pentru un volum redus al selec¡iei, parametrii statistici corespunzåtori pot prezenta abateri importante de la parametrii popula¡iei. Cu alte cuvinte, înså¿i parametrii statistici sunt ni¿te variabile aleatoare, valorile acestora depinzând în general de lungimea ¿irului de date de bazå.

Abaterea medie påtraticå a coeficien¡ilor Cs ¿i Cv se calculeazå cu rela¡iile:

σCs n= 6

(4.74)

σCv

vv

C

nC= +

21 2 2 . (4.75)

Volumul redus al selec¡iei constituie o importantå surså de erori în calculul

statistic. Luând drept måsurå a erorii abaterea medie påtraticå a parametrilor Cs

¿i Cv se constatå cå cel mai afectat de lungimea ¿irului statistic este coeficientul de asimetrie.

Astfel, considerând o popula¡ie pentru care Cv = 0,5, din formulele (4.74) ¿i (4.75) rezultå cå, pentru o selec¡ie de volum n = 100, eroarea la determinarea lui

Cs este de 25%, în timp ce pentru Cv este 4,25%. Pentru n = 20, respectiv 25,

erorile pentru Cv sunt 9,7%, respectiv 8,6%, în timp ce pentru Cs sunt inacceptabile depå¿ind 50%. Admi¡ând erori în calculul statistic de pânå la 10%,

rezultå cå pentru un ¿ir de date cu cel pu¡in 20 ÷ 25 valori, pentru Cv se poate admite valoarea calculatå, în timp ce coeficientul de asimetrie trebuie ales pe

81

Page 81: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

bazå de experien¡å în func¡ie de valorile coeficientului de varia¡ie (care este determinat cu o precizie mult mai bunå). Coeficientul de asimetrie are (C. Mociorni¡å ¿.a., 1979) urmåtoarele valori

(func¡ie de Cv):

Cs = 2 Cv - pentru debite maxime provenite din topirea zåpezilor;

Cs = 4 Cv - pentru debite maxime provenite din ploi;

Cs = (3 ÷ 4) Cv - pentru debite maxime anuale indiferent de genezå, adoptându-se valoarea minimå în cazurile în care marea majoritate a debitelor din ¿ir provin din opirea zåpezilor ¿i valoarea maximå în cazul în care sunt cauzate de ploi.

Alte valori ale lui Cs sunt urmåtoarele (Hâncu ¿.a., 1975):

Cs = 0 - pentru niveluri maxime;

Cs = 1,5Cv - pentru debite medii anuale pe râurile care seacå;

Cs = (3 ÷ 3,5)Cv - pentru precipita¡ii maxime;

Cs = (3,5 ÷ 4)Cv - pentru debite maxime pe râuri mici;

Cs = 2Cv - pentru debite medii anuale ¿i debite minime de varå. ¥n sfâr¿it, pentru calculul volumelor maxime de duratå T cu diverse probabilitå¡i de depå¿ire, coeficientul de asimetrie are urmåtoarele valori (C. Mociorni¡å ¿.a., 1979):

Cs = 2Cv - pentru volume maxime provenite din topirea zåpezilor;

Cs = 4Cv - pentru volume maxime provenite din ploi;

Cs = (2 ÷ 4)Cv - pentru volume maxime indiferent de genezå, func¡ie de provenien¡a celei mai mari pår¡i a datelor din ¿irul analizat.

Dupå calculul parametrilor ¿irului de date de care se dispune din måsuråtori se procedeazå la calculul ordonatelor curbei teoretice având aceia¿i parametri. Urmeazå apoi reprezentarea pe un format special a curbei teoretice ¿i a curbei empirice; în mod normal curba teoreticå trebuie så treacå printre punctele curbei empirice.

82

Page 82: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n anumite situa¡ii acest lucru poate så nu se realizeze. ¥n acest caz sunt de suspectat erori de determinare a unora dintre debitele din ¿ir; se mai poate întâmpla ca în cadrul intervalului de n ani analizat så se fi produs debite cu probabilitå¡i de apari¡ie extrem de reduse (prima sau primele valori din ¿irul ordonat descrescåtor pot avea probabilitå¡i de depå¿ire cu mult mai mici decât frecven¡ele empirice calculate cu rela¡ii de tipul i/(n+1)). Pentru ob¡inerea unei concordan¡e cât mai bune între conturul curbei teoretice ¿i valorile måsurate se pot adopta diverse måsuri (C. Mociorni¡å ¿.a., 1979, R. Drobot, 1989):

− Modificarea valorii parametrilor Cv ¿i Cs; admi¡ând cå eroarea la determinarea coeficientului de varia¡ie este în limitele ±σCv

se vor

propune noi valori pentru coeficientul de varia¡ie cuprinse în domeniul

[Cv- σCv; Cv + σCv

]. ¥n ceea ce prive¿te coeficientul de asimetrie, acesta va fi

ales în func¡ie de noua valoare a lui Cv. − Utilizarea altor curbe teoretice de probabilitate (în afara curbelor Kri¡ki-

Menkel sau Pearson III) cum sunt de exemplu curbele log-normale, Johnson etc; tipul de curbå adecvat ¿irului statistic de valori înregistrate se va alege pe

baza unor teste de concordan¡å ca de exemplu criteriul χ2 sau testul lui

Kolmogorov. − Utilizarea metodei celor mai mici påtrate pentru determinarea

parametrilor care intervin în rela¡iile de defini¡ie ale densitå¡ii de reparti¡ie sau func¡iei de reparti¡ie ¿i implicit ale parametrilor statistici uzuali; trebuie men¡ionat cå metoda celor mai mici påtrate are o flexibilitate superioarå metodei bazatå pe calculul momentelor, care este condi¡ionatå de utilizarea unor

valori fixe, prestabilite ale raportului Cs /Cv (curbele Kri¡ki-Menkel sunt definite pentru valori ale acestui raport egale cu 1,0; 1,5; 2,0; ... ; 4,0, excluzându-se valorile intermediare). Principala cauzå a erorilor inerente calculului statistic o constituie volumul relativ redus al ¿irului de date din înregistråri. Se reaminte¿te cå în hidrologie perioada de måsuråtori este cuprinså în general între 20 - 40 de ani. Chiar dacå s-ar dispune de date pe perioade îndelungate, aceasta nu constituie o garan¡ie deplinå în special în cazul unor bazine mici sau foarte mici. La aceste bazine influen¡a activitå¡ilor umane (despåduriri masive, urbanizare progresivå etc.) se resimte foarte puternic, conducând în timp la o cre¿tere a valorii coeficientului de scurgere ¿i o mic¿orare a timpului de concentrare a precipita¡iilor în re¡eaua hidrograficå); ca urmare se constatå o cre¿tere a frecven¡ei cu care se înregistreazå debite de probabilitå¡i considerate reduse. ¥n aceste situa¡ii este necesarå renun¡area la valorile mai vechi ale ¿irului (care nu mai reflectå corect actuala situa¡ie a bazinului hidrografic), cu toate implica¡iile

83

Page 83: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

defavorabile pe care le are mic¿orarea numårului de valori disponibile pentru prelucrarea statisticå.

84

Page 84: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE

5.1. REPARTIºIA NORMALÅ

Aceastå reparti¡ie, cunoscutå ¿i sub denumirea de legea lui Gauss sau legea Gauss-Laplace, ocupå un loc deosebit printre distribu¡iile teoretice, constituind de altfel o lege limitå cåtre care tind unele distribu¡ii (binomialå, Poisson) în anumite condi¡ii. Pentru ca o variabilå aleatoare så aibå distribu¡ie normalå, trebuie ca ea så depindå de un mare numår de factori, cu o influen¡å individualå relativ reduså, efectul fiecårui factor så fie aditiv ¿i independent de al celorlal¡i factori cauzali (V. Yevjevich, 1972). Distribu¡ia normalå de parametri m ¿i σ este definitå dupå cum s-a aråtat (§4.5.2) prin urmåtoarea densitate de reparti¡ie:

( )f x m e x Rx m

; , ;σσ π

σ= ∈−

−⎛⎝⎜

⎞⎠⎟1

2

12

2

(5.1)

Reparti¡ia normalå are urmåtoarele proprietå¡i:

− func¡ia f(x; m, σ) este continuå, fiind definitå pentru orice valoare realå a lui x de la -∞ la +∞;

− densitatea de reparti¡ie normalå are un singur maxim (este o reparti¡ie unimodalå) pe care îl atinge în punctul x = m; valoarea maximå a func¡iei este:

( )f m x R= 1

2σ π; ∈ (5.2)

− densitatea de reparti¡ie normalå este simetricå fa¡å de verticala duså prin

x=m ¿i scade simetric la stânga ¿i la dreapta de aceastå valoare, tinzând cåtre axa absciselor care este asimptotå orizontalå. ¥ntr-adevår:

lim ( ; , ) lim ( ; , )x x

f x m f x m→−∞ →+∞

= =σ σ 0 . (5.3)

85

Page 85: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

− reparti¡ia normalå fiind simetricå media, mediana ¿i modul coincid; în plus, coeficientul de asimetrie este nul (se reaminte¿te cå la reparti¡iile asimetrice acest coeficient este diferit de zero);

− func¡ia f(x; m, σ) are formå de clopot (de altfel, se mai nume¿te ¿i clopotul lui Gauss) cu punctele de inflexiune în x = ±σ. Reprezentarea graficå a reparti¡iei normale (exprimatå prin intermediul densitå¡ii de reparti¡ie) este redatå în figura 5.1.

Fig. 5.1. Graficul densitå¡ii de reparti¡ie pentru distribu¡ia normalå.

Referitor la forma func¡iei f(x; m, σ) trebuie aråtat (fig. 5.2) cå, cu cât abaterea medie påtraticå σ este mai micå, clopotul este mai ascu¡it, iar cu cât σ este mai mare clopotul este mai turtit (împrå¿tierea este mai mare).

Fig. 5.2. Influen¡a lui σ asupra densitå¡ii de reparti¡ie ¿i a func¡iei de reparti¡ie.

86

Page 86: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Deoarece parametrii distribu¡iei normale sunt m ¿i σ, rezultå cå având media ¿i dispersia variabilei aleatoare, func¡ia de reparti¡ie este perfect determinatå. Fåcând, în expresia densitå¡ii de reparti¡ie schimbarea de variabilå:

tx m= −

σ , (5.4)

se ob¡ine distribu¡ia normalå de parametri m = 0 ¿i σ = 1:

( )f t e t Rt; ; ;/0 11

2

2 2= −

π∈ . (5.5)

Variabila tx m= −

σ se nume¿te variabilå standard sau normatå, iar

distribu¡ia f(t; 0; 1) poartå numele de reparti¡ie normalå normatå. Valorile densitå¡ii de reparti¡ie a distribu¡iei normale normate sunt date în tabelul 5.1; valorile oricårei alte reparti¡ii normale, având parametrii estima¡i pe baza datelor din måsuråtori se ob¡in cu rela¡iile (V. Yevjevich, 1972):

x = m + tσ , (5.6) respectiv:

( )f x f m t e f tt= + = =−( ) /σσ π σ

1

2

12 2 ( ) . (5.7)

Mai trebuie aråtat cå variabila aleatoare normatå având media egalå cu zero este simetricå fa¡å de verticala duså prin origine.

Fig. 5.3. Trecerea de la reparti¡ia normalå normatå (a) la o reparti¡ie normalå de medie m ¿i abatere σ (b).

87

Page 87: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

88

Page 88: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n figura 5.3 este prezentat graficul densitå¡ii de reparti¡ie f(t; 0; 1) ¿i respectiv graficul func¡iei f(x; m, σ) ob¡inut din aceasta. Func¡ia de reparti¡ie a varibilei normale normate, numitå func¡ia lui Laplace este:

Φ ( )x e tx

= ∫−

−∞

1

2

2 2

πdt . (5.8)

Fiind o func¡ie de reparti¡ie, Φ(-∞) = 0, iar Φ(+∞) = 1. ¥n plus, deoarece f(t; 0; 1) este simetricå fa¡å de dreapta m = 0, rezultå cå:

Φ Φ( ) ( ) ( ) ( ) ( )− = =∫ =∫ − =∫ −−∞

− +∞

−∞x f t dt f t dt f t dt x

x

x

x1 1 . (5.9)

Func¡ia lui Laplace este, de asemenea, tabelatå (tab.5.2) ¿i serve¿te la calculul probabilitå¡ilor evenimentelor referitoare la orice variabilå aleatoare normalå. De exemplu, probabilitatea ca o variabilå normalå så ia valori în intervalul

[x1, x2) poate fi evaluatå cu ajutorul func¡iei Φ(x). Efectuând schimbarea de variabilå (5.6), rezultå:

dx = σ dt . (5.10) Limitele de integrare se schimbå dupå cum urmeazå:

− pentru X = x1, tx m

11= −σ

; (5.11)

− pentru X = x2, tx m

22= −σ

. (5.11')

¥n acela¿i timp, dx = σdt. Ca urmare:

Prob(x1 ≤ X < x2) = 1

2

2

1

2

2

σ πσ

σ

σe dtt

x m

x m

⋅ =∫ /

(5.12)

= ∫ − ∫

⎜⎜⎜

⎟⎟⎟

−∞

−∞

1

2

2

2

2

1

2 2

π

σ σe dt e dtt

x m

t

x m

/ /

89

Page 89: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

90

Page 90: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

ºinând seama de defini¡ia (5.8) a func¡iei de reparti¡ie normalå normatå, cu parametrii m = 0 ¿i σ = 1, rezultå:

( )Pr ob x X xx m x m

1 22 1≤ < = −⎛

⎝⎜⎞⎠⎟

− −⎛⎝⎜

⎞⎠⎟

Φ Φσ σ

. (5.13)

Din rela¡ia apartenen¡ei la intervalul [x1, x2) se poate calcula ¿i probabilitatea de nedepå¿ire a unei valori oarecare a variabilei aleatoare de distribu¡ie normalå.

Considerând, de pildå, x1 = -∞ în rela¡ia (5.13) se ob¡ine:

( ) ( )Prob X xx m

− ∞ < < =−⎛

⎝⎜⎞⎠⎟

− − ∞22Φ Φσ

. (5.14)

Dar Φ(-∞) = 0, deci:

( ) ( )Prob X xx m

t< =−⎛

⎝⎜⎞⎠⎟

=Φσ

Φ . (5.15)

Cunoscând media m ¿i abaterea σ a variabilei aleatoare, se calculeazå variabila normalå normatå t. Probabilitatea de nedepå¿ire a lui t este în acela¿i timp ¿i probabilitatea de nedepå¿ire a valorii x. ¥n mod similar se calculeazå probabilitatea de depå¿ire, ob¡inându-se:

( ) ( )Pr ob X xx m

t≥ = − −⎛⎝⎜

⎞⎠⎟

= −1 1Φσ

Φ . (5.16)

Rela¡ia apartenen¡ei la un anumit interval poate servi ¿i pentru determinarea probabilitå¡ii ca abaterea variabilei X fa¡å de medie så nu depå¿eascå o anumitå mårime. Astfel:

( ) ( )Pr Prob X m ob m X m− < = − + ≤ < + =

= ⎛⎝⎜

⎞⎠⎟

− −⎛⎝⎜

⎞⎠⎟

α α α

ασ

ασ

Φ Φ

. (5.17)

91

Page 91: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dar:

Φ(-x) = 1 - Φ(x), (5.18) deci:

( )Prob X m− < = ⎛⎝⎜

⎞⎠⎟

−α ασ

2Φ 1 . (5.19)

Dacå α = 3σ ¿i ¡inând cont de faptul cå Φ(3) = 0,9987 rezultå:

( ) ( )Pr ,ob X m− < = − =3 2 3 1 0 9974σ Φ . (5.20)

Deci domeniul (m - 3σ, m + 3σ) acoperå marea majoritate a observa¡iilor (99,74%) ¿i doar 0,26% se gåsesc în afarå. Aceastå rela¡ie foarte importantå poartå numele de regula celor trei sigma. ¥n mod similar, în domeniul (m - σ, m + σ) sunt situate aproape 68% din valori ¿i mai pu¡in de 32% în afara acestui interval.

5.2. APLICAºII ALE REPARTIºIEI NORMALE ¥N HIDROLOGIE

1. Ca oricare alte date ob¡inute pe bazå de måsuråtori, mårimile hidrologice sunt afectate de erori sistematice ¿i erori aleatoare. Erorile aleatoare sunt în marea majoritate a cazurilor simetric distribuite ¿i pot fi exprimate printr-o distribu¡ie normalå; ca indicator al erorilor se va utiliza abaterea standard. 2. Anumite reparti¡ii care nu sunt normale pot fi aduse la distribu¡ia normalå printr-o schimbare de variabilå. De exemplu, o variabilå distribuitå asimetric poate fi simetrizatå prin logaritmare, sau considerând radicalii variabilei etc.; dacå coeficientul de asimetrie al noii variabile este cuprins în intervalul (-0,10; +0,10) sau, ¿i mai strict, între (-0,05; 0,05), se poate admite pentru aceastå variabilå ipoteza reparti¡iei normale ¿i deci se pot utiliza toate rezultatele ob¡inute la reparti¡ia normalå. 3. Func¡ia de reparti¡ie normalå este de asemenea utilizatå în probleme de generare a debitelor. Pentru început se genereazå numere aleatoare distribuite uniform în intervalul [0, 1]. O variabilå aleatoare discretå U este uniformå dacå toate valorile ei sunt egal probabile (fiecare valoare are probabilitatea de apari¡ie egalå cu 1/n).

92

Page 92: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dacå variabila este continuå, densitatea de reparti¡ie este de forma:

[ ][ ]f x

k dacåx a b

dacåx a b( )

, ,

, ,=

∈∉

⎧⎨⎪

⎩⎪0 (5.21)

Constanta k va fi determinatå din condi¡ia ca f(x) så reprezinte o densitate de reparti¡ie:

f x dx k dx kx k b aa

b

a

b

ab( ) ( )∫ = ∫ = = − = 1 . (5.22)

Rezultå:

kb a

=−1

. (5.23)

Pentru generarea numerelor aleatoare uniform distribuite în intervalul [0, 1] se folosesc fie procedee fizice (de exemplu, o urnå cu 10, 100 sau 1000 de bile din care se fac extrac¡ii la întâmplare cu revenire), fie procedee matematice. Procedeele matematice, utilizând rela¡ii de recuren¡å, conduc de fapt la ob¡inerea unor numere pseudo-aleatoare (func¡ie de capacitatea calculatorului folosit, la un moment dat, numerele generate încep så se repete). Cel mai frecvent, pentru generarea numerelor pseudo-aleatoare uniform repartizate în intervalul [0, 1] se folose¿te metoda congruen¡ialå liniarå:

Xn+1 = (a Xn + c) (mod M), n = 0, 1, 2, ... (5.24) unde a, c ¿i M sunt întregi nenegativi.

Numårul întreg pozitiv Xo este termenul ini¡ial al ¿irului de numere pseudo-

aleatoare. Din cerin¡a ca perioada de repetare så fie cât mai mare, modulul M este suficient de mare (fiind egal cu mårimea cuvântului calculatorului minus 1, sau apropiat de acesta); constantele a ¿i c trebuie så respecte de asemenea anumite criterii astfel încât perioada de revenire så fie maximå (Våduva, 1977). Dispunând de numerele pseudo-aleatoare uniform distribuite pe intervalul [0, 1] , se pot genera imediat numere pseudo-aleatoare de distribu¡ie normalå normatå.

93

Page 93: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Din punct de vedere practic lucrurile decurg ca în figura 5.4.

Fig. 5.4. Generarea numerelor aleatoare cu densitatea de reparti¡ie f(x) cerutå.

Fie yn un numår aleator uniform repartizat pe [0, 1], generat ini¡ial. Se

determinå valoarea abscisei xn, pentru care valoarea func¡iei de reparti¡ie

F(xn) = yn. Valorile xn astfel ob¡inute reprezintå numere aleatoare cu densitatea f(x) cerutå. Din punct de vedere matematic, procedeul expus revine la inversarea func¡iei

de reparti¡ie (Såcuiu, Zorilescu, 1978). Se noteazå prin {yn} un ¿ir de numere uniform repartizate pe [0, 1] ¿i prin F(x) func¡ia de reparti¡ie a variabilei aleatoare X (presupuså continuå):

yn = F(xn) , (5.25)

unde xn sunt realizåri ale variabilei aleatoare X. Deoarece F(x) este continuå, admite inverså ¿i deci:

x F yn = −1( n ) . (5.26)

94

Page 94: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dacå func¡ia F -1

se poate explicita algebric, valorile xn rezultå imediat ce au

fost generate valorile yn.

¥n cazul reparti¡iei normale, func¡ia F -1

nu poate fi exprimatå algebric; ca atare se utilizeazå o aproximare a acesteia sau se folosesc tabele ale reparti¡iei

normale normate, care permit determinarea numårului xn care corespunde

probabilitå¡ii de nedepå¿ire yn (Såcuiu, Zorilescu, 1978). ¥n continuare, se aplicå procedee de transformare a variabilelor normale

normate în variabile normale oarecare (de medie m ¿i abatere medie påtra-

ticå σ); alte transformåri permit trecerea la variabile cu distribu¡ii asimetrice.

4. Func¡ia de reparti¡ie normalå normatå constituie elementul de plecare

pentru construirea formatului de probabilitate pe care se reprezintå curbele

asimetrice care caracterizeazå fenomenele hidrologice.

Acest format este conceput astfel încât så permitå transformarea curbei în

formå de S a func¡iei de reparti¡ie normale normate într-o linie dreaptå (fig.5.5),

dilatând zona probabilitå¡ilor foarte mari ¿i foarte mici.

Fig. 5.5. Reprezentarea func¡iei de reparti¡ie în format aritmetic (a) ¿i în format de probabilitate (b).

Modul de realizare al acestui format va fi explicat pe baza unui exemplu. Se cautå un format astfel încât orice curbå din familia:

y = f(x) = a + b x2 (5.27)

så se reprezinte sub forma unei drepte (fig. 5.6).

95

Page 95: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 5.6. Construirea formatului care liniarizeazå curbele y = a + bx2:

a - schemå de principiu; b - exemplificare pentru curba y = 8 + 0,5 x2.

Fie, pentru început, func¡ia y = f (x) = x2.

Atât pe absciså, cât ¿i pe ordonatå se utilizeazå un format aritmetic sau cartezian (la intervale egale corespund segmente egale, indiferent de pozi¡ia acestora pe axå), rezultând curba cu linie plinå din figura 5.6, a. ¥n continuare, fiecårei valori x' = y de pe absciså i se asociazå o valoare:

~ ( )x f y y= =−1 , (5.28)

ceea ce reprezintå un alt mod de divizare pentru absciså. Påstrând vechiul format pentru ordonatå ¿i utilizând noul format pentru absciså, func¡ia:

( )~ (~) ~ 'y f x x y y x= = = = =22

(5.29)

constituie de fapt func¡ia identicå ¿i deci se reprezintå ca o dreaptå (fig. 5.6,a curba = x′). ~y

¥n acela¿i format, o curbå de tipul y = f(x) = a + bx2 devine de asemenea o

dreaptå; într-adevår:

96

Page 96: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( ) ( ) ( )~ (~) ' 'y f x f y f x a b x a bx= = = = + = +2

' ; (5.30)

rezultå deci o dreaptå de ordonatå la origine a ¿i pantå b. Fie de reprezentat de exemplu curba:

y = f(x) = 8 + 0,5 x2 .

Dupå cum se observå ¿i din figura 5.6,b, pe formatul ob¡inut anterior, aceastå curbå se reprezintå sub forma unei drepte. Procedeul folosit se poate rezuma astfel: se stabile¿te o scarå aritmeticå de

divizare a axei Ox ¿i se trec deasupra axei absciselor valorile yi = f(xi);

corespunzåtor, în dreptul fiecårui punct yi astfel ob¡inut se trece valoarea

= f~x i -1

(yi) , aceste valori constituind noul sistem de divizare a abscisei.

Utilizând aceste grada¡ii pentru absciså ¿i vechiul sistem de divizare pentru ordonate, curba y = f(x), ca ¿i orice curbå din aceea¿i familie, se reprezintå în noul sistem de coordonate sub forma unei drepte (M. Shahin, ¿.a., 1993). Acela¿i procedeu se va folosi ¿i în cazul reparti¡iei normale normate. Fie graficul reparti¡iei pe care s-au trecut valorile func¡iei (10%, 20%, 30%, etc.), precum ¿i abscisele corespunzåtoare atât în reprezentare matematicå uzualå (fig.5.7), cât ¿i în cea utilizatå în hidrologie (fig.5.8).

Fig. 5.7. Func¡ia de reparti¡ie normalå normatå ¿i câteva din valorile ei.

97

Page 97: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 5.8. Func¡ia de reparti¡ie normalå normatå în reprezentarea hidrologicå. ¥n continuare se utilizeazå un format aritmetic pentru reprezentarea valorilor

yp% (care vor fi trecute deasupra axei); în dreptul acestora, sub absciså se vor marca probabilitå¡ile (fig. 5.9):

p% = f -1

(yp%)

Fig. 5.9. Construirea formatului de probabilitate.

Valoarea yp% = 0 va fi reprezentatå la mijlocul axei absciselor, acestei valori particulare corespunzându-i probabilitatea de 50%. Luând ca origine punctul 0,00 se va figura la stânga ¿i la dreapta lui segmentul de valoare -0,253, respectiv +0,253. Punctele astfel ob¡inute corespund probabilitå¡ii de nedepå¿ire de 40%, respectiv de 60%. ¥n mod similar, se pozi¡ioneazå punctele -0,524 ¿i +0,524 corespunzând probabilitå¡ilor de 30%, respectiv 70% etc. Pe un astfel de format, func¡ia de reparti¡ie F ca ¿i probabilitatea de depå¿ire

Fc a reparti¡iei normale normate (m=0; σ=1) se vor reprezenta sub forma unor

drepte, paralele cu prima, respectiv a doua bisectoare (fig. 5.10).

98

Page 98: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 5.10. Reprezentarea func¡iei de reparti¡ie normale normate ¿i a curbei probabilitå¡ilor de depå¿ire pe formatul de probabilitate.

¥n realitate, reparti¡iile normale au parametrii m ¿i σ oarecare; mai mult decât atât, reparti¡iile sunt definite numai pentru valori pozitive ale variabilei. Ca urmare, curba probabilitå¡ilor de depå¿ire a unei reparti¡ii normale oarecare este o dreaptå care se deseneazå doar în primul cadran ¿i a cårei pantå depinde de mårimea lui σ (fig. 5.11).

Fig. 5.11. Reprezentarea curbei probabilitatilor de depa¿ire a distribu¡iei normale pe formatul de probabilitate.

99

Page 99: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Proprietatea reparti¡iei normale de a se reprezenta ca o dreaptå pe formatul de probabilitate poate fi utilizatå pentru testarea ipotezei de normalitate: dacå curba empiricå a probabilitå¡ilor de depå¿ire se situeazå aproximativ dupå o dreaptå, poate fi luatå în considerare ipoteza unei reparti¡ii normale. Dimpotrivå, dacå se manifestå o tendin¡å de curbare a reparti¡iei empirice, distribu¡ia este asimetricå ¿i deci pentru modelarea statisticå a fenomenului analizat trebuie utilizatå altå reparti¡ie teoreticå (lognormalå, Pearson III etc.).

5.3. REPARTIºIA LOG-NORMALÅ (LOGARITMIC - NORMALÅ)

Pentru anumite mårimi hidrologice (precipita¡ii, debite) se constatå cå logaritmii datelor måsurate sunt normal distribui¡i; reparti¡ia acestor variabile va fi numitå logaritmic normalå sau log-normalå. Aceastå distribu¡ie se realizeazå atunci când efectul factorilor cauzali este multiplicativ (se reaminte¿te cå la distribu¡ia normalå este aditiv). Densitatea de reparti¡ie normalå a logaritmilor valorilor variabilei este:

ϕσ π

µσ

(ln ) expln

xx

n

n

n

= − −⎛⎝⎜

⎞⎠⎟

⎣⎢⎢

⎦⎥⎥

1

2

12

2

, (5.31)

unde µn ¿i σn sunt media, respectiv abaterea medie påtraticå a logaritmilor valorilor pe care le ia variabila x. Aceastå reparti¡ie este simetricå (fig. 5.12, b), rezultând din distribu¡ia asimetricå (fig. 5.12, a) a lui f(x) prin logaritmarea valorilor variabilei.

Fig. 5.12. Trecerea de la o distribu¡ie asimetricå (a) la o reparti¡ie simetricå (b) prin logaritmarea valorilor variabilei.

100

Page 100: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Se poate pune ¿i problema inverså de a trece de la distribu¡ia simetricå ϕ(lnx)

la distribu¡ia f(x); cu alte cuvinte, se cautå expresia matematicå a densitå¡ii de

reparti¡ie asimetricå f(x).

Probabilitatea elementarå ca variabila så ia valori în cadrul unui interval dat

trebuie så fie aceea¿i în ambele reprezentåri. Se poate scrie deci (V. Yevjevich,

1972):

f x dx x d x xx

dx xx

dx( ) (ln ) (ln ) (ln ) (ln )⋅ = ⋅ = ⋅ = ⋅ ⋅ϕ ϕ ϕ1 1 . (5.32)

Rezultå:

f xx

x( ) (ln )= 1 ϕ . (5.32')

Densitatea de reparti¡ie f(x) a distribu¡iei log-normale este definitå numai pentru valori pozitive ale lui x (x>0) ¿i are expresia:

f xx

x

n

n

n

( ) expln=

⋅ ⋅− −⎛

⎝⎜

⎞⎠⎟

⎣⎢⎢

⎦⎥⎥

1

2

12

2

σ πµ

σ (5.33)

Parametrii statistici ai distribu¡iei sunt (V. T. Chow, 1964):

( )( )

µ σ

σ µ

µ

σ

σ

= +

= −

= −

= +

e

e

C e

C C C

n

n

n

n

v

s v v

2

1 2

1 2

3

2

1

1

3

2

2

(5.34)

Distribu¡ia f(x) este asimetricå, a¿a cum se vede ¿i din figura 5.13 în care

s-au reprezentat pentru compara¡ie mai multe reparti¡ii log-normale

(V. Yevjevich, 1972).

101

Page 101: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 5.13. Reprezentarea comparativå a unor reparti¡ii log-normale. Cazurile reprezentate sunt urmåtoarele:

µn = 0 ¿i σn2 = 0,1; 0,5 ¿i 2,0 (linia plinå),

σn2 = 0,5 ¿i µn = 0; 0,5 ¿i 1,0 (linia punctatå).

Reparti¡ia log-normalå are urmåtoarele proprietå¡i: are ca limitå inferioarå valoarea zero ¿i este unimodalå (prezintå un singur maxim). Mai trebuie men¡ionat cå ecua¡ia densitå¡ii de reparti¡ie nu depinde de baza logaritmilor, aceasta intervenind ca o constantå. Utilizând un format special: logaritmic pentru ordonate ¿i format de probabilitate pentru abscise, func¡ia de reparti¡ie pentru distribu¡ia log-normalå se va reprezenta ca o dreaptå. ¥n cazul unei reparti¡ii empirice, dacå valorile måsurate se distribuie aproximativ dupå o dreaptå pe acest format, se poate admite ipoteza reparti¡iei log-normale. ¥n general, o valoare x a unei variabile aleatoare poate fi reprezentatå prin valoarea medie x la care se adunå o abatere ∆x de la medie (V. T. Chow, 1964):

x x xp% p%= + ∆ . (5.35)

102

Page 102: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Mårimea ∆xp% depinde de abaterea medie påtraticå a variabilei ¿i de un

factor de frecven¡å Kp%: Deci:

∆xp% = σKp% . (5.36) Se ob¡ine:

x x Kp% p%= + σ . (5.37)

ºinând seama de faptul cå Cv = σ / x rezultå:

( )x x C Kp% v p%= +1 . (5.38)

Valorile factorului de frecven¡å Kp% sunt date în tabelul 5.3 (V. T. Chow,

1964) ¿i sunt exprimate în func¡ie de valorile lui Cs (ales drept parametru), care

la rândul lui se calculeazå în func¡ie de Cv, conform rela¡iei (5.34). ¥n tabel mai sunt trecute ¿i valorile probabilitå¡ii corespunzåtoare valorii

medii a variabilei.

Factorul de frecven¡å este pozitiv pentru probabilitå¡ile de 0,01; 0,1; 5; 20%

etc. ¿i negativ pentru probabilitå¡i mai mari de 50% (fig. 5.14).

Fig. 5.14. Semnifica¡ia factorului de frecven¡å.

103

Page 103: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

104

Page 104: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

5.4. REPARTIºIILE GAMA

¥n formula densitå¡ii de reparti¡ie a tuturor acestor func¡ii intervine func¡ia gama a cårei expresie este:

Γ ( )α α= ∫− −

∞x e dxx1

0

. (5.39)

Convergen¡a integralei este asiguratå pentru α > 0. Valorile func¡iei gama pentru α cuprins între 1 ¿i 2 sunt date în tabelul 5.4. Valoarea func¡iei gama pentru α > 2 se poate exprima în func¡ie de valorile func¡iei pentru α cuprins între 1 ¿i 2. ¥ntr-adevår:

Γ ( )

( )

α α

α αΓ α

α α α

α

+ = ∫ = −∞

+ ∫ =

= ∫ =

−∞

− −∞

− −∞

100

1

0

1

0

x e dx e x x e dx

x e dx

x x x

x

(5.40)

Tabelul 5.4

Func¡ia gama x Γ(x) x Γ(x) x Γ(x)

1,00 1,0000 1,34 0,8922 1,68 0,9050 1,02 0,9888 1,36 0,8902 1,70 0,9086 1,04 0,9784 1,38 0,8885 1,72 0,9126 1,06 0,9687 1,40 0,8873 1,74 0,9168 1,08 0,9597 1,42 0,8864 1,76 0,9214 1,10 0,9513 1,44 0,8858 1,78 0,9262 1,12 0,9436 1,46 0,8856 1,80 0,9314 1,14 0,9364 1,48 0,8857 1,82 0,9368 1,16 0,9298 1,50 0,8862 1,84 0,9426 1,18 0,9237 1,52 0,8870 1,86 0,9487 1,20 0,9182 1,54 0,8882 1,88 0,9551 1,22 0,9131 1,56 0,8896 1,90 0,9618 1,24 0,9085 1,58 0,8914 1,92 0,9688 1,26 0,9040 1,60 0,8935 1,94 0,9761 1,28 0,9007 1,62 0,8959 1,96 0,9837 1,30 0,8975 1,64 0,8986 1,98 0,9917 1,32 0,8946 1,66 0,9017 2,00 1,0000

De exemplu: Γ(3,7) = 2,7 ⋅ Γ(2,7) = 2,7 ⋅ 1,7 Γ(1,7) = 2,7 ⋅ 1,7 ⋅ 0,9086.

105

Page 105: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dacå 0 < α < 1, din rela¡ia (5.40) se ob¡ine:

Γ(α) = 1/α ⋅ Γ(α + 1) (5.41) De exemplu Γ(0,7)=1/0,7 ⋅ Γ(1,7) Alte proprietå¡i ale acestei func¡ii sunt urmåtoarele:

Γ ( )10

10

= ∫ = −∞

=−∞

−e dx ex x . (5.42)

Dacå numårul α este întreg, rela¡ia de recuren¡å devine:

Γ(n + 1) = n(n-1) ... 2⋅Γ(1) = n! (5.43)

5.4.1. REPARTIºIA Γ1

Reparti¡ia Gama cu 1 parametru (Γ1) este definitå numai pentru valori nenegative ale lui x (x ≥ 0) ¿i are densitatea de reparti¡ie (fig. 5.15):

f x x e x( ; )( )

αα

α= − −1 1

Γ , (5.44)

unde α este un parametru al formei curbei. Din figura 5.15 (V. Yevjevich, 1972), se constatå cå:

− pentru 0 ≤ α < 1, curba este asimptoticå la amândouå axele;

− pentru α = 1, se ob¡ine o func¡ie exponen¡ialå f(x) = e-x;

− pentru α > 1, curba are formå de clopot cu atât mai turtit cu cât α ia valori mai mari; pentru α > 30, distribu¡ia Gama cu un parametru tinde cåtre reparti¡ia normalå.

Fig. 5.15. Alura reparti¡iei Γ1 pentru diferite valori ale parametrului α .

106

Page 106: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Parametrii distribu¡iei sunt urmåtorii:

m = α ;

σ2 = α ; σ α= ; C

mυσ

α= = 1

;

Cs = =22

α υC . (5.45)

Reparti¡ia Gama cu un parametru, Γ1, nu are aplica¡ii directe în hidrologie, din cauza flexibilitå¡ii ei reduse. ¥n schimb este utilizatå ca etapå intermediarå în generarea numerelor aleatoare distribuite asimetric.

Dacå X este o variabilå normal distribuitå luând valorile xi, atunci variabila Y, cu valorile:

yx m

ii=−⎛

⎝⎜⎞⎠⎟

12

2

σ , (5.46)

urmeazå distribu¡ia Γ1, parametrul α fiind egal cu 1/2.

Suma a douå variabile independente distribuite Γ1 cu parametrii α1,

respectiv α2 este distribuitå de asemenea Γ1 cu parametrul α = α1 + α2. Prin

generalizare, suma a n variabile aleatoare independente, urmând reparti¡ia Γ1 cu

parametrii αi (i = 1, 2, ..., n) va urma aceea¿i distribu¡ie Γ1, parametrul α fiind (V. Yevjevich, 1972):

α = ∑=

ii

n

1α . (5.47)

Fie cazul a n variabile independente normal distribuite, care se standardizeazå cu rela¡ia (5.4).

Variabila 12

2

1ti

i

n

=∑ va urma legea de reparti¡ie Γ1 (V. Yevjevich, 1972), cu

parametrul:

α α= ∑ = ∑ == =

ii

n

i

n n

1 1

12 2

. (5.48)

107

Page 107: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Acest rezultat este util pentru a genera numere aleatoare distribuite Γ1, plecând de la numere aleatoare cu reparti¡ie normalå.

5.4.2. REPARTIºIA Γ2

Reparti¡ia Gama cu 2 parametri (Γ2) se ob¡ine din reparti¡ia Γ1, înlocuind

variabila independentå x prin x/β. Densitatea de reparti¡ie Γ2 este definitå numai pentru valori nenegative (x ≥ 0) ale lui x:

f x x e x( ; , )( )

/α ββ αα

α β . (5.49) = − −1 1

Γ Se reaminte¿te cå parametrul de formå α trebuie så fie mai mare decât zero, pentru a avea asiguratå convergen¡a func¡iei gama. ¥n ceea ce îl prive¿te pe β, acesta este un parametru de scarå, care este de asemenea pozitiv; pentru β = 1,

se ob¡ine reparti¡ia Γ1. O reprezentare graficå a reparti¡iei Γ2 pentru α constant (α = 2) se poate urmåri în figura 5.16. Parametrii reparti¡iei sunt (V. Yevjevich, 1972):

m = αβ ; ; σ αβ2 2= σ β α= ; Cv = 1

α ; Cs v= =2

C . (5.50)

Se observå cå Cs = 2Cv în condi¡iile în care originea axelor este aleaså în punctul în care f(x) = 0.

Fig. 5.16. Densitatea de reparti¡ie Γ2 .

108

Page 108: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 5.17. Transla¡ia func¡iei Γ2 cu valoarea xmin . La schimbarea originii axelor de coordonate (ceea ce revine la o transla¡ie de

valoare xmin, fig. 5.17), coeficientul de varia¡ie se modificå, în timp ce

coeficientul de asimetrie este invariant; ca urmare, raportul ~

~C

Cs

v

≠ 2 (prin ¿i

s-au notat parametrii variabilei translatate).

~Cs

~Cv

Fie ui = xi + xmin noile valori ale abscisei. Valoarea medie este:

( )u

u

n

x x

nx x

ii

n

ii

n

=∑

=+∑

= += =1 1min

min . (5.51)

Abaterea medie påtraticå a variabilei u (notatå prin ~σ ) este:

( ) ( )~σ σ=

−∑

−=

−∑

−== =

u u

n

x x

n

ii

n

ii

n2

1

2

1

1 1 . (5.52)

Noul coeficient de varia¡ie , se modificå astfel: ~Cv

~ ~

min min min

Cu x x x

xx x

xx x

Cv v= =+

= ⋅+

=+

1 σ σ σ . (5.53)

109

Page 109: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Coeficientul de asimetrie, dupå cum s-a aråtat este invariant la transla¡ie:

( ) ( )~~C

nu u

nx x Cs i

i

n

ii

n

s= −∑ ⋅ = −∑ ⋅ == =

1 1 1 13

13

3

13σ σ

. (5.54)

Se noteazå cu ρ raportul x x

x+ min , care pentru xmin > 0 este evident

supraunitar:

ρ > 1 . (5.55) Ca urmare:

~

~C

C

C

C

CC

s

v

s

v

s

v

= =1ρ

ρ . (5.56)

Deoarece Cs /Cv = 2, iar ρ > 1, rezultå / > 2 pentru x~Cs

~Cv min > 0.

O formå echivalentå a reparti¡iei Γ2 a fost ob¡inutå de K. Pearson studiind

limitele unor reparti¡ii binomiale asimetrice; în expresia densitå¡ii de reparti¡ie

intervin 3 parametri, dar numai doi dintre ace¿tia sunt independen¡i.

Densitatea de reparti¡ie în forma datå de Pearson (fig. 5.18) este:

f x f a d f exa

x da d

( ; , , ) //

0 0 1= +⎛⎝⎜

⎞⎠⎟

− . (5.57)

Nota¡iile au urmåtoarea semnifica¡ie:

fo este ordonata maximå (corespunzåtoare modului); d - distan¡a dintre medie ¿i mod;

a - diferen¡a dintre mod ¿i xmin (valoarea variabilei pentru care f(x) = 0).

110

Page 110: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 5.18. Semnifica¡ia nota¡iilor din forma Pearson III a distribu¡iei Γ2.

Domeniul de valabilitate al func¡iei este cuprins între x = - a ¿i x = +∞ (M. Constantinescu ¿.a., 1956).

Un parametru din forma Pearson III (de regulå fo) poate fi eliminat impunând condi¡ia ca f(x) så reprezinte o densitate de reparti¡ie (deci suprafa¡a cuprinså între curbå ¿i axa Ox så fie egalå cu unitatea):

f exa

dxx da d

0 1−

−∞

+∞+⎛

⎝⎜⎞⎠⎟∫ =/

/

1 . (5.58)

Ca rezultat al integrårii, fo va fi exprimat în func¡ie de ceilal¡i doi parametri: a ¿i d. Func¡iile:

f x x e x( ; , )( )

/α ββ αα

α= − −1 1

Γβ (5.59)

¿i:

f x f a d f exa

x da d

( ; , , ) //

0 0 1= +⎛⎝⎜

⎞⎠⎟

− (5.59')

reprezintå aceea¿i distribu¡ie Γ2 ¿i amândouå au doar doi parametri independen¡i. Rela¡iile dintre ace¿ti parametri sunt urmåtoarele:

ad

= −α 1 . (5.60)

111

Page 111: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

d = β (5.61) De aici rezultå:

a =β (α - 1) (5.62) ¿i:

d = β (5.63) De asemenea, se pot ob¡ine parametrii α ¿i β în func¡ie de a ¿i b:

β = d (5.64)

α = + = +1

ad

a dd

.

Dupå cum s-a aråtat, curbele de tip Pearson III sunt deosebit de adecvate pentru studiul reparti¡iei debitelor maxime de pe râurile din România; în general d ≠ 0, iar asimetria este pozitivå.

Rela¡ia de calcul a debitelor Qp% cu probabilitatea de depå¿ire p% prin metoda momentelor este similarå cu cea utilizatå la reparti¡ia log-normalå:

( )Q Q Cp% v p%= +1 φ . (5.65)

¥n aceastå rela¡ie Q este debitul mediu, Cv coeficientul de varia¡ie, iar φp% reprezintå abaterile ordonatelor curbei probabilitå¡ilor de depå¿ire fa¡å de medie,

în cazul unei curbe standardizate având Q =1 ¿i Cv =1 (fig. 5.19).

Fig. 5.19. Semnifica¡ia abateriiφp% .

112

Page 112: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

113

Page 113: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

114

Page 114: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Prin calcule se determinå valoarea medie Q ¿i coeficientul de varia¡ie Cv;

coeficientul de asimetrie se alege în func¡ie de Cν. Valorile φp% sunt date în

tabelul 5.5, în func¡ie de coeficientul de asimetrie Cs ¿i de probabilitatea de depå¿ire p%. Se reaminte¿te cå reparti¡ia Pearson III este valabilå pentru

Cs > 2Cν (deoarece xmin > 0).

Pentru Cs = 0, curba ob¡inutå este simetricå, reprezentând de fapt ordonatele probabilitå¡ii de depå¿ire a reparti¡iei normale. Utilizând pentru reprezentare formatul de probabilitate, reparti¡ia normalå se va desena ca o dreaptå. Pe

acela¿i format, curbele Pearson III având Cs > 0 au o curburå cu atât mai pronun¡atå, cu cât coeficientul de asimetrie este mai mare.

¥n figura 5.20 se poate urmåri influen¡a parametrilor Cν ¿i Cs asupra curbei

probabilitå¡ilor de depå¿ire: cu linie punctatå s-au figurat situa¡ii în care Cs = 0

(variind Cν), iar cu linie plinå s-au desenat curbe ale probabilitå¡ilor de depå¿ire

pentru valori crescåtoare ale lui Cs, men¡inând Cν constant (Cν = 1). Metoda momentelor reprezintå un mod de calcul, deosebit de expeditiv, dar

cu o flexibilitate reduså, utilizând valori prestabilite ale raportului Cs /Cv . O metodå cu performan¡e superioare este metoda celor mai mici påtrate care conduce direct la evaluarea parametrilor α ¿i β ai densitå¡ii de reparti¡ie. ¥n continuare, dispunând de valorile lui α ¿i β se poate ob¡ine prin încercåri

debitul Qp% care corespunde unei probabilitå¡i p% date; acest debit reprezintå limita inferioarå de integrare a densitå¡ii de reparti¡ie f(x; α, β ):

( )f x dx pQp

; , %%

α β+∞

∫ = . (5.66)

5.4.3. REPARTIºIA Γ3

Reparti¡a Gama cu 3 parametri (Γ3) se ob¡ine dacå în reparti¡ia Γ1 se

înlocuie¿te x prin x − γ

β:

( ) ( ) ( )f x x e x; , ,( )

/α β γβ α

γα

α γ β= − − − −1 1

Γ , (5.67)

unde:

115

Page 115: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

α este parametrul de formå; β - parametrul de scarå; γ - limita inferioarå a valorilor distribu¡iei: 0 ≤ γ ≤ x <∞ (γ ≠ 0).

Schimbarea de variabilå y=x-γ reduce distribu¡ia Γ3 la Γ2, iar rela¡ia

z = (x -γ)/β transformå repati¡ia Γ3 în Γ1. Transformårile inverse sunt utilizate în procedeele de generare a numerelor aleatoare, pentru a ob¡ine din variabile

aleatoare independente distribuite Γ1 variabile cu reparti¡ia Γ2 sau Γ3. O reparti¡ie Γ triparametricå a fost ob¡inutå de S. N. Kri¡ki ¿i M. F. Menkel

din distribu¡ia Pearson III printr-o transformare de tipul u = axb.

Curbele binomiale-exponen¡iale Kri¡ki-Menkel sunt valabile pentru orice

raport Cs /Cν (se reaminte¿te cå în cazul reparti¡iei Pearson III Cs > 2Cν); densitatea de reparti¡ie este (Manoliu, Roman, 1983):

f(u) = uγ-1

e-u

/ Γ(γ) , (5.68) unde:

( )( )

ub x

m

b

=+

⋅⎛

⎝⎜⎜

⎠⎟⎟

ΓΓγ

γ

1

. (5.69)

Cei trei parametri ai reparti¡iei sunt: γ, b ¿i m; parametrul m este chiar valoarea medie a reparti¡iei. Din cauza expresiei foarte complicate a densitå¡ii de reparti¡ie, ace¿ti parametri nu pot fi exprima¡i direct în func¡ie de datele empirice. ¥n aceste condi¡ii ordonatele teoretice ale curbei probabilitå¡ilor de depå¿ire sunt tabelate pentru anumite situa¡ii particulare ( Q = 1 ¿i valori precizate ale raportului

Cs /Cν). Pentru utilizarea practicå a acestor tabele, trebuie ca pe baza datelor empirice så se evalueze coeficientul de varia¡ie ¿i coeficientul de asimetrie (calculul are la bazå metoda momentelor).

Dupå determinarea lui Cs ¿i Cν , ordonatele teoretice cu diverse probabilitå¡i de depå¿ire p% se ob¡in cu rela¡ia:

Q Q kp% p%= , (5.70)

unde kp% reprezintå coeficien¡i modul, tabela¡i de Kri¡ki-Menkel, ¿i care sunt

defini¡i în func¡ie de raportul Cs /Cν de valoarea lui Cν ¿i de probabilitatea de depå¿ire p% (tab. 5.6).

116

Page 116: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

117

Page 117: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

118

Page 118: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

119

Page 119: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

120

Page 120: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

121

Page 121: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

122

Page 122: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

123

Page 123: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fåcând compara¡ia cu rela¡ia:

( )Q Q Cp% v p%= +1 φ ,

utilizatå la reparti¡ia Pearson III, rezultå cå mårimea kp% joacå acela¿i rol ca

factorul 1 + Cν φp%. Cu alte cuvinte, coeficien¡ii modul reprezintå înså¿i ordonatele curbei pro- babilitå¡ilor de depå¿ire pentru o reparti¡ie Kri¡ki-Menkel având valoarea medie unitarå (fig. 5.21).

Fig. 5.21. Interpretarea coeficien¡ilor modul.

¥n cazul în care raportul Cs /Cν = 2, ordonatele curbei probabilitå¡ilor de depå¿ire sunt acelea¿i, indiferent dacå s-au folosit curbele Kri¡ki-Menkel sau

Pearson III; cu alte cuvinte, în acest caz particular, valorile kp% ¿i (1 + Cν φp%) sunt egale. ¥n general înså, în zona probabilitå¡ilor mici, curbele Kri¡ki-Menkel conduc la calcule mai acoperitoare (valori ale debitelor maxime mai mari pentru o

probabilitate datå ¿i pentru acela¿i Cν ¿i Cs) fa¡å de reparti¡ia Pearson III (Diaconu, Låzårescu, 1977). Diferen¡e sensibile între cele douå curbe se înregistreazå de asemenea în cazul unor coeficien¡i de varia¡ie mari. ªi în cazul reparti¡iei Kri¡ki-Menkel, utilizarea metodei celor mai mici påtrate permite o determinare rapidå a parametrilor cu condi¡ia de a dispune de un program de calcul adecvat; în lipsa acestuia calculele pot fi efectuate, în mod expeditiv, utilizând procedeul expus anterior.

124

Page 124: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

5.4.4. CORECºIA DE SIGURANºÅ ∆QP% Debitele maxime teoretice cu probabilitatea de depå¿ire p% (notate prin

Qp%) calculate conform metodologiei expuse în paragrafele 5.3, 5.4.2 ¿i 5.4.3 sunt utilizate pentru dimensionarea unor lucråri hidrotehnice (evacuatori de ape mari la baraje, alegerea înål¡imii batardourilor ¿i a diametrului galeriilor de deviere a apelor în faza de construc¡ie, stabilirea cotei digurilor de apårare împotriva inunda¡iilor etc.)

Subevaluarea mårimii debitului Qp% ar avea, consecin¡e foarte grave; se apreciazå cå circa 20% din accidentele înregistrate la baraje în exploatare se datoresc subdimensionårii descårcåtorilor de ape mari. Ca urmare, pentru construc¡ii din clasa I, II, III de importan¡å, stabilite conform STAS 4273-80, la debitele maxime corespunzåtoare probabilitå¡ilor de

verificare se adaugå o corec¡ie de siguran¡å ∆Qp% evaluatå cu formula (C. Mociorni¡a ¿.a., 1979, M. Constantinescu ¿.a., 1956):

∆Qa E

nQp%

p%p%= . (5.71)

Fig. 5.22. Valorile coeficientului de corec¡ie Ep%.

125

Page 125: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n aceastå rela¡ie:

Qp% este debitul cu probabilitatea de depå¿ire p%; a - un factor care ¡ine cont de calitatea observa¡iilor ¿i are urmåtoarele valori: a = 0,70 pentru râurile care se gåsesc în regiuni bine studiate din punct de vedere hidrologic; a = 0,50 pentru fluviul Dunårea; a = 1,00 pentru râurile din zone slab studiate din punct de vedere hidrologic.

Ep% - un factor de corec¡ie care depinde atât de valoarea coeficientului de

varia¡ie Cv, cât ¿i de probabilitatea de calcul p%.

Valorile corec¡iei Ep% se ob¡in din figura 5.22 (C. Mociorni¡a ¿.a., 1979).

Mai trebuie men¡ionat cå valoarea corec¡iei ∆Qp% nu trebuie så depå¿eascå 20% din valoarea debitului la care se aplicå.

5.5. REPARTIºIA GUMBEL

Spre deosebire de reparti¡iile analizate pânå în prezent, care erau definite prin densitatea f(x), în acest caz distribu¡ia este exprimatå sub forma func¡iei de reparti¡ie, datoritå simplitå¡ii acesteia:

( ) ( ) ( )F x a c ob X x

a x

c; , Pr exp exp= < =

− +⎡

⎣⎢⎢

⎦⎥⎥

⎧⎨⎪

⎩⎪

⎫⎬⎪

⎭⎪ (5.72)

unde x ∈ (-∞, +∞); a ¿i c sunt parametrii distribu¡iei ¿i pot fi evalua¡i prin metoda momentelor (V. T. Chow, 1964):

a = γ c - m ;

c = 6π

σ . (5.73)

Constanta lui Euler are valoarea γ = 0,57721; m ¿i σ sunt: valoarea medie,

respectiv abaterea standard. Coeficientul de asimetrie Cs este constant:

Cs = 1,139.

126

Page 126: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Prin transformarea y = (a + x)/c, se ob¡ine:

F x e e y

( ) = − −

. (5.74) Dezvoltând aceastå expresie în serie de puteri ¿i neglijând termenii de ordinul 2, rezultå:

F x e y( ) ≅ − −1 , (5.75) care constituie o expresie aproximativå pentru func¡ia de reparti¡ie. Considerând func¡ia:

F x e e y

( ) = − −

. (5.76) prin dublå logaritmare se ob¡ine rela¡ia liniarå:

( ) [1c

x a F x+ = − −ln ln ( )]

2

. (5.77)

Deci o scarå dublu logaritmicå pe absciså ¿i o scarå cartezianå pentru ordonatå vor conduce la o distribu¡ie liniarizatå (V. Yevjevich, 1972). Gumbel a utilizat primul aceastå reparti¡ie pentru studiul probabilistic al debitelor de viiturå; distribu¡ia Gumbel conduce înså, pentru probabilitå¡i de

depå¿ire p% reduse, la valori Qp% mai mici decât cele ob¡inute prin utilizarea reparti¡iei Pearson III sau Kri¡ki - Menkel ¿i din acest motiv este mai pu¡in folositå.

5.6. REPARTIºII STATISTICE AUXILIARE Aceste reparti¡ii nu sunt folosite ca modele ale distribu¡iei unor variabile hidrologice, ci pentru verificarea ipotezelor statistice sau pentru ob¡inerea intervalelor de încredere pentru media sau dispersia teoreticå (J.W. van der Made, 1987).

• Reparti¡ia χ2 (hi - påtrat). Dacå X1, X2, ..., Xn sunt variabile aleatoare

independente, normale, normate, atunci suma påtratelor variabilelor Xi

reprezintå o variabilå aleatoare, notatå prin χ2:

χ 212

22= + + +X X X n... . (5.78)

127

Page 127: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Densitatea de reparti¡ie a distribu¡iei χ2 cu n grade de libertate este definitå

numai pentru valori nenegative ale lui x:

( )f x nn

x en

n x

;/

=⎛⎝⎜

⎞⎠⎟

− −1

22

2

21

2

Γ . (5.79)

Numårul gradelor de libertate reprezintå numårul valorilor variabilei ale cåror probabilitå¡i de realizare sunt independente.

Distibu¡ia χ2 este de tip continuu, fiind definitå pentru orice valoare din

intervalul [0, +∞). Argumentul x rezultând ca o sumå de påtrate, va fi notat în continuare prin

χ2; func¡iile f(x) sau f(χ2

) sunt asimetrice pentru valori mici ale lui n, tinzând cåtre reparti¡ia normalå pe måsurå ce n cre¿te (fig. 5.23).

Fig. 5.23. Densitatea de reparti¡ie ¿i func¡ia de reparti¡ie a distribu¡iei χ2.

Media reparti¡iei este n, iar dispersia este egalå cu 2n. ¥n practicå, pentru verificarea ipotezelor statistice, prezintå interes func¡ia de

probabilitate complementarå Fc(χ2

):

( ) ( )F obc χ χ χα2 2 2= ≥Pr α= . (5.80)

¥n rela¡ia de defini¡ie a lui Fc(χ2

), valoarea a reprezintå o probabilitate care se nume¿te prag de semnifica¡ie; valorile uzuale ale lui α sunt: α = 0,01; 0,05 ¿i

0,10 (Iliescu, Vodå, 1977). Mårimea (notatå ¿i prin sau ) se mai

nume¿te punct critic ¿i reprezintå acea valoare a variabilei χ

χα2 χ0

2 χ cr2

2 a cårei

probabilitate de depå¿ire este α (fig. 5.24).

128

Page 128: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

129

Page 129: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 5.24. Semnifica¡ia punctului critic în distribu¡ia χ2.

Valorile punctului critic sunt tabelate în func¡ie de numårul de grade de

libertate ¿i de probabilitatea α de a fi depå¿ite (tab. 5.7).

χ02

Reparti¡ia χ2 este de asemenea utilizatå în definirea unor intervale de

încredere. Aceste intervale con¡in cu o probabilitate (1 - α) valoarea adevåratå a parametrului; probabilitatea ca valoarea teoreticå så se gåseascå în afara

intervalului ( ) este deci egalå cu α (aria ha¿uratå din fig. 5.25). χ χmin max;2 2

Fig. 5.25. Interval de încredere ( )χ χmin max,2 2 .

Reparti¡ia χ2 intervine în definirea altor douå distribu¡ii auxiliare; reparti¡ia t

(sau Student) a lui Gosset ¿i reparti¡iile Z ¿i F ale lui Fischer. • Reparti¡ia t (Student). Dacå X ¿i Y sunt douå variabile aleatoare

independente, X urmând o reparti¡ie normalå de medie 0 ¿i abatere medie

påtraticå σ, iar Y o reparti¡ie χ2, cu n grade de libertate, atunci variabila

aleatoare:

tx

y n=

/ (5.81)

130

Page 130: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

urmeazå o reparti¡ie Student cu n grade de libertate. Variabila t este continuå ¿i apar¡ine intervalului (-∞, +∞), iar densitatea ei de reparti¡ie este:

( )f t nn

n

ntn

n

; = ⋅

+⎛⎝⎜

⎞⎠⎟

⎛⎝⎜

⎞⎠⎟

+⎛

⎝⎜

⎠⎟

−+

11

2

2

12

1

2

π

Γ

Γ . (5.82)

Aceastå func¡ie este simetricå: f(-t)= f(t) ¿i F(-t)= 1 - F(t); când numårul gradelor de libertate cre¿te foarte mult, reparti¡ia t tinde cåtre reparti¡ia normalå. Valorile t, corespunzåtoare unei probabilitå¡i de depå¿ire α sunt de asemenea tabelate (Panaite, Munteanu, 1982; Moineagu ¿.a., 1976).

• Reparti¡ia F a lui Fisher-Snedecor. Dacå Y1 ¿i Y2 sunt douå variabile

aleatoare independente, urmând amândouå o reparti¡ie χ2 cu n1, respectiv n2

grade de libertate, atunci raportul:

xy n

y n= 1 1

2 2

/

/ , x > 0 . (5.83)

reprezintå o variabilå aleatoare care are densitatea de reparti¡ie:

( ) ( )f x n nn n

n n

n nx n n x

n nn n n

; ,

/ /

1 2

12

22 1 2

1 2

21

2 1 2

1 2

1 1 22

2 2

=⋅ ⋅

+⎛⎝⎜

⎞⎠⎟

⎛⎝⎜

⎞⎠⎟

⋅ ⎛⎝⎜

⎞⎠⎟

+− −

Γ Γ . (5.84)

Aceastå densitate de reparti¡ie define¿te distibu¡ia F a lui Fisher cu n1 ¿i n2 grade de libertate; aceastå reparti¡ie este, de asemenea, tabelatå (Panaite, Munteanu, 1982; Moineagu ¿.a., 1976).

131

Page 131: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

6. INTERVALE DE ¥NCREDERE Valorile teoretice ale parametrilor reparti¡iilor statistice sunt estimate în

func¡ie de valorile de selec¡ie (x1, x2, ..., xn ) prin diverse metode (metoda momentelor, metoda verosimilitå¡ii maxime sau metoda celor mai mici påtrate). Valorile teoretice astfel calculate au un caracter punctual; în acela¿i timp, valorile rezultate depind de volumul selec¡iei. Este evident cå, cu cât volumul selec¡iei va fi mai mare, cu atât estima¡iile punctuale ale parametrilor se apropie din ce în ce mai mult de valorile reale ale parametrilor popula¡iei. Cu alte cuvinte, fiecare parametru determinat pe baza unei selec¡ii aleatoare este el însu¿i o variabilå aleatoare, a cårei distribu¡ie depinde de volumul selec¡iei. O metodå de evaluare a valorii teoretice, care så ¡inå seama ¿i de volumul selec¡iei, constå în definirea unui interval de încredere care så con¡inå (cu o anumitå probabilitate) valoarea teoreticå a parametrului estimat pe bazå de måsuråtori. Se noteazå cu (1-α) coeficientul de încredere sau probabilitatea apartenen¡ei la interval; α reprezintå deci probabilitatea ca parametrul så se gåseascå în afara intervalului estimat. Evident, α trebuie så fie cât mai redus (de obicei calculul se efectueazå considerând α = 1% sau 5%). Stabilirea intervalului de încredere constituie o opera¡ie ulterioarå evaluårii punctuale a parametrilor. ¥n mod uzual se stabilesc intervale de încredere pentru media ¿i dispersia teoreticå.

• Interval de încredere pentru media teoreticå. Fie m ¿i σ2 media,

respectiv dispersia teoreticå, iar x ¿i s2 media, respectiv dispersia de selec¡ie.

Media de selec¡ie x este o variabilå aleatoare, având:

− media M( x ) = m . (6.1)

− dispersia D2( x )=

σ 2

n .

Se poate aråta ca media m este cuprinså în intervalul:

( ) ( )x zs

nx z

s

n− +

⎛⎝⎜

⎞⎠⎟α α; , (6.2)

132

Page 132: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

unde z(a) se determinå, dupå cum se va aråta în continuare, din tabelele reparti¡iei normale sau Student, func¡ie de volumul n al selec¡iei. Se va nota prin U, valoarea normatå a mediei de selec¡ie:

( )( )

Ux M x

D x

x m

n=

−= −

2 σ , (6.3)

unde pentru M( x ), ¿i D2( x ) s-au utilizat expresiile (6.1), respectiv (6.2).

Se considerå intervalul (-z, z) simetric în raport cu originea, care con¡ine variabila normatå U cu o probabilitate egalå cu 1-α:

Prob ( |U| < z ) = 1 - α . (6.4) Referitor la distribu¡ia variabilei U, se disting urmåtoarele cazuri (Dinescu, Såvulescu, 1978): a) Pentru un volum mare al selec¡iei (n > 30), variabila U are o reparti¡ie normalå (indiferent care este reparti¡ia variabilei teoretice); proprietatea se

men¡ine ¿i în cazul în care σ2 este necunoscutå fiind estimatå prin dispersia de

selec¡ie s2.

Se reaminte¿te cå în cazul reparti¡iei normale normate se poate scrie:

Prob ( |U| < z ) = Prob (-z < U < z) = Φ(z) - Φ(-z) =

= Φ(z) - (1 - Φ(z)) = 2Φ(z) - 1 (6.5) Deci:

2Φ(z) - 1 = 1 - α (6.6) sau:

Φ( )z = −12α

. (6.6')

¥n aceastå ecua¡ie, probabilitatea (1 - α) a apartenen¡ei la interval este cunoscutå, fiind fixatå apriori; din tabelul func¡iei lui Laplace rezultå imediat necunoscuta z(α). Astfel, pentru 1 - α = 90% rezultå z = 1,64 ; 1 - α = 95% z = 1,96 ; 1 - α = 99% z = 2,58 .

133

Page 133: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

b) Pentru un volum redus al selec¡iei (n < 30), dacå reparti¡ia variabilei este

normalå, iar dispersia σ2 este aproximatå prin s

2, variabila U are o reparti¡ie

Student cu (n - 1) grade de libertate. Reparti¡ia Student este tabelatå cu ajutorul func¡iei complementare

Fc(z)=1-F(z). Prin urmare, marginile intervalului (-z, +z) corespunzåtoare

coeficien¡ilor de încredere (1 - α) se determinå prin rezolvarea ecua¡iei:

Prob ( |U| < z ) = α , (6.7) unde variabila U urmeazå o repati¡ie Student cu n-1 grade de libertate. ¥n continuare se dau orientativ valorile z(α) corespunzåtoare lui (1-α)=95%, respectiv 99% pentru grade de libertate cuprinse între 11 ¿i 30.

Tabelul 6.1

n-1 1-α

11 12 13 14 15 16 17 18 19 20

1-α=95% 2,201 2,179 2,160 2,144 2,131 2,120 2,110 2,100 2,093 2,086 1-α=99% 3,106 3,054 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845

n-1

1-α 21 22 23 24 25 26 27 28 29 30

1-α=95% 2,080 2,074 2,069 2,064 2,059 2,055 2,052 2,048 2,045 2,042 1-α=99% 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750

Dupå determinarea valorilor z = z(α), intervalul de încredere pentru media teoreticå rezultå imediat:

− <−

<zx m

nz( ) ( )α

σα (6.8)

sau, aproximând dispersia teoreticå prin dispersia de selec¡ie, rezultå a¿a cum s-a aråtat deja:

x zs

nm x z

s

n− < < +( ) ( )α α . (6.9)

• Interval de încredere pentru dispersia teoreticå. Ca estimator punctual al

dispersiei teoretice σ2 se va utiliza dispersia de selec¡ie:

134

Page 134: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( )sn

x xii

n2 2

1

11

=−

−∑=

. (6.10)

Dispersia de selec¡ie este o variabilå aleatoare (Dinescu, Såvulescu, 1978) având:

− media ( )M sn

2 2 11

= −⎛⎝⎜

⎞⎠⎟≈σ 2σ ; (6.11)

(pentru n suficient de mare media acestui estimator este egalå cu dispersia teoreticå);

− dispersia ( )D sm

n2 2 4

4

≈ −σ . (6.12)

Presupunând în plus cå reparti¡ia dispersiei de selec¡ie este normalå,

momentul centrat de ordinul patru m4 = 3σ4 ¿i deci:

( )D sn

2 2 42≈ σ . (6.13)

Intervalul de încredere pentru dispersia teoreticå se calculeazå cu rela¡ia (Dinescu, Såvulescu, 1978):

( ) ( )n s n s−< <

−1 12

22

2

2χσ

χmax min

. (6.14)

Dacå coeficientul de încredere (1-α) este foarte apropiat de 1 (probabilitatea α% este micå), cele douå suprafe¡e ha¿urate din figura 5.26 pot fi presupuse egale, fiecare având o probabilitate egalå cu α/2. Marginea inferioarå ¿i superioarå a intervalului de încredere rezultå deci din rezolvarea ecua¡iilor:

( )Pr maxob χ χ α2 2

2> = ; (6.15)

( )Pr minob χ χ α2 2 12

> = − . (6.16)

135

Page 135: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

De exemplu, pentru α = 5% ¿i un numår de grade de libertate cuprins între 9 ¿i 20, marginile ¿i au urmåtoarele valori (tab. 6.2): χmin

2 χmax2

Tabelul 6.2

n-1

χ2

9 10 11 12 13 14 15 16 17 18 19 20

χmin2 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,81 7,56 8,23 8,91 9,59

χmax2 19,00 20,50 21,90 23,30 24,70 26,10 27,50 28,80 30,20 31,30 32,90 34,20

Dupå ob¡inerea lui ¿i ¿i evaluarea dispersiei de selec¡ie sχmin2 χmax

2 2,

intervalul care con¡ine cu probabilitatea (1 - α) valoarea adevåratå σ2 a

dispersiei se calculeazå cu rela¡ia (6.14). • Interval de încredere pentru abaterea standard. Abaterea standard, la fel

ca ¿i dispersia din care derivå, este de asemenea o variabilå aleatoare. Valoarea medie a acestei variabile este (V. Yevjevich, 1972):

M(s) = σ , (6.17) iar dispersia:

D sm

n2 4

4

24( ) = −σ

σ . (6.18)

Admi¡ând cå abaterea standard de selec¡ie este normal distribuitå

(deci m4=3σ4), se pot utiliza urmåtoarele expresii simplificate:

M(s) = σ (6.17')

D sn

22

2( ) = σ

. (6.18')

Intervalul de încredere pentru abaterea standard de selec¡ie va fi deci:

s z s n s z s n− ⋅ < < + ⋅( ) / ( ) /α σ α2 2 . (6.19)

De cele mai multe ori în hidrologie intereseazå intervalele de încredere pentru doi sau trei parametri simultan (adicå pentru to¡i parametrii din distribu¡iile hidrologice uzuale).

136

Page 136: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 6.1. Elipsa de încredere pentru parametrii m ¿i σ. ¥n acest caz vor fi definite regiuni de încredere: pentru doi parametri rezultå o elipså, iar pentru trei parametri un elipsoid de încredere (V. Yevjevich, 1972). Cu alte cuvinte zona de încredere nu este un dreptunghi sau un paralelipiped construit prin limitele intervalelor de încredere al fiecårui parametru ci are o extindere mai restrânså. O exemplificare pentru cazul a doi parametri (m ¿i σ) se poate urmåri în figura 6.1.

137

Page 137: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

7. VERIFICAREA IPOTEZELOR STATISTICE O problemå importantå în hidrologie o constituie determinarea probabilitå¡ii de depå¿ire a debitelor maxime anuale; poate fi necesarå de asemenea reparti¡ia nivelurilor sau a debitelor minime dintr-o anumitå sec¡iune. ¥n toate aceste situa¡ii intereseazå care este reparti¡ia teoreticå cea mai adecvatå datelor din observa¡iile empirice. Ca urmare, se propune o anumitå ipotezå statisticå (de exemplu o reparti¡ie de tip log-normalå), urmând ca pe baza unui test statistic aceastå ipotezå så fie confirmatå sau respinså. Acceptarea sau respingerea unei ipoteze statistice are un caracter probabilistic ¿i nu implicå siguran¡å absolutå (certitudine sau probabilitate de 100%). ¥n limbaj statistic, ipoteza ini¡ialå (care trebuie testatå) se nume¿te ipoteza

nulå ¿i se noteazå prin H0. Erorile care se fac în verificarea ipotezelor statistice sunt de douå tipuri (B. Bobée, 1991):

a) respingerea ipotezei H0 când ea este adevåratå; riscul acceptat al acestei situa¡ii notat prin α are în mod uzual valori reduse: α = 0,01 ; 0,05 sau 0,10;

α = Prob (respingere H0⏐H0 adevåratå) , (7.1)

b) acceptarea ipotezei H0 când ea este falså; riscul respectiv se noteazå prin β:

β = Prob (acceptare H0⏐H0 falså) . (7.2) Probabilitatea α se nume¿te pragul de semnifica¡ie al testului, iar 1-β

(probabilitatea de respingere a lui H0 când ea este falså) puterea testului. Cele mai utilizate teste statistice în hidrologie sunt urmåtoarele (Cicioni ¿.a., 1984): hi - påtrat, Kolmogorov - Smirnov ¿i Cramer - Von Mises.

• Testul hi - påtrat (χ2). Fie un numår de n valori ob¡inute din înregistråri

(niveluri de exemplu pentru construirea graficului de frecven¡å ¿i duratå).

Aceste date se grupeazå într-un numår de k intervale; se noteazå cu ni numårul de valori din intervalul i.

138

Page 138: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Evident, este verificatå rela¡ia:

n1 + n2 + ... +nk = n , (7.3)

unde ni reprezintå frecven¡e absolute empirice (numårul de apari¡ii ale variabilei în cadrul fiecårui interval). ¥n acela¿i timp, numårul de grade de libertate ale variabilei este k-1 (numårul intervalelor minus unu); cu alte cuvinte

cunoscând k-1 valori ale lui ni, valoarea nk rezultå din rela¡ia (7.3). Se presupune cå variabila empiricå urmeazå o anumitå reparti¡ie teoreticå (sugeratå eventual ¿i de reprezentarea graficå a datelor din måsuråtori).

Pentru fiecare claså (interval) i se poate calcula probabilitatea teoreticå pi a

apartenen¡ei la acel interval. Dacå xi-1 ¿i xi sunt marginile intervalului, pi se va ob¡ine cu una din rela¡iile:

p f xix

x

i

i

= ∫−

( )1

dx (7.4)

sau:

pi = F(xi) - F(xi-1) . (7.5) Pentru orice reparti¡ie teoreticå, f(x) sau F(x) sunt cunoscute ¿i deci evaluarea

lui pi nu ridicå probleme. Cunoscându-l pe pi se pot calcula imediat frecven¡ele

absolute teoretice ale fiecårui interval, acestea fiind reprezentate de produsul npi

Abaterile ni - npi dintre frecven¡ele absolute teoretice ¿i cele empirice reprezintå o variabilå aleatoare; se poate demonstra cå variabila auxiliarå:

χ χcalculat ci i

ii

k

k k

k

n np

np

n np

np

n np

np

n np

np

2 22

1

1 12

1

2 22

2

2

= =−

∑ =

=−

+−

+ +−

=

( )

( ) ( )...

( )

(7.6)

urmeazå la limitå o reparti¡ie χ2. Numårul de grade de libertate al acestei

variabile nu este, înså, k - 1, ci k - λ - 1, unde λ reprezintå numårul parametrilor reparti¡iei teoretice, care au fost estima¡i cu ajutorul datelor din måsuråtori.

139

Page 139: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Variabila χ urmeazå deci o reparti¡ie χc2 2

cu ν = k - λ - 1 grade de libertate.

Pentru un numår ν dat de grade de libertate din tabelele reparti¡iei χ2 se poate

determina valoarea (sau ) corespunzåtoare pragului de semnifica¡ie α

ales; reprezintå valoarea χχν α,

2 χc2

χν α,2 2

cu ν grade de libertate ¿i a cårei probabilitate

de depå¿ire este α (fig. 5.23). Ipoteza statisticå propuså este acceptatå dacå < (concordan¡a între reparti¡ia teoreticå propuså ¿i cea empiricå este bunå) ¿i este respinså dacå:

> .

χcalculat2 χν α,

2

χcalculat2 χν α,

2

Fie de exemplu cazul unor niveluri hidrologice la care domeniul de varia¡ie a fost împår¡it în 11 clase; se testeazå ipoteza distribu¡iei normale (λ=2, deoarece doi parametri: m ¿i σ sunt estima¡i pe baza datelor din måsuråtori). Numårul de

grade de libertate este : ν = 11 - 2 - 1 = 8; variabila χ2 cu 8 grade de libertate ¿i

un prag de semnifica¡ie de 1% are valoarea = 20,1. χ 8 1%2;

Presupunând cå χ = 18, ipoteza normalitå¡ii poate fi acceptatå,

deoarece < .

calculat2

χcalculat2 χ 8 1%

2;

¥mpår¡irea în clase de echivalen¡å egale a domeniului de varia¡ie al variabilei presupune existen¡a unui numår mare de valori din måsuråtori (cel pu¡in câte 5 în fiecare claså - Dinescu, Såvulescu, 1978); aceastå situa¡ie se întâlne¿te mai rar în hidrologie. ¥n cazul în care n < 30 se recurge (Cicioni ¿.a., 1984) la împår¡irea în clase de probabilitå¡i empirice egale, probabilitatea fiecårei clase fiind egala cu 1/k (unde k este numårul intervalelor). ¥n acest caz intervalele corespunzåtoare cårora li se calculeazå probabilitå¡ile teoretice nu mai sunt egale; marginile

intervalelor sunt: xi-(xi-xi-1)/2, respectiv xi+(xi+1-xi)/2.

• Testul Kolmogorov - Smirnov. Fie F*(x) func¡ia de reparti¡ie empiricå a

celor n date ob¡inute pe bazå de måsuråtori ¿i F(x) func¡ia de reparti¡ie teoreticå propuså pentru aproximarea distribu¡iei empirice. Se noteazå cu d valoarea maximå a diferen¡ei dintre valorile celor douå func¡ii:

d F x F= −max ( ) ( )* x , (7.7) unde F

*(x) este calculat cu formula i/(n+1).

Conform teoremei lui Kolmogorov:

Pr ( )ob dn

K≤⎛⎝⎜

⎞⎠⎟= − =λ α1 λ . (7.8)

140

Page 140: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

unde:

K ek k( ) ( )λ λ= −∑ −

−∞

+∞1 2 2 2

, (7.9)

iar λ este un numår real care depinde de valoarea aleaså pentru pragul de semnifica¡ie α: λ=λ(α). Func¡ia K(λ) se calculeazå conform rela¡iei (7.9) ¿i este tabelatå; ca urmare pentru un prag de semnifica¡ie α ales rezultå imediat λ. De exemplu: pentru α = 1% → K(λ) = 0,99 → λ = 1,63 ; α = 5% → K(λ) = 0,95 → λ = 1,36 ; α = 10% → K(λ) = 0,90 → λ = 1,23 .

Cu λ astfel determinat se calculeazå raportul λ / n ; dacå d < λ / n se acceptå ipoteza concordan¡ei dintre reparti¡ia teoreticå ¿i cea empiricå; în caz contrar, ipoteza este respinså.

• Testul Cramer - von Mises. ªi în acest caz se calculeazå abaterile dintre valorile func¡iei de reparti¡ie empirice ¿i cele ale unei reparti¡ii teoretice propuse. Se noteazå cu C aceastå variabilå aleatoare, definitå ca o integralå Stieltjes:

[ ]C F x F x df= −∫−∞

+∞* ( ) ( ) ( )

2x . (7.10)

¥n practicå se folose¿te o rela¡ie mai comodå pentru calcule (Cicioni ¿.a., 1984):

Cn

F xi

ncalculat ii

n= + −

−⎡⎣⎢

⎤⎦⎥

∑=

112

2 121

2

( . (7.11)

Variabila C este distribuitå dupå legea definitå de Anderson-Darling în anul 1952. Valorile cele mai des utilizate ale lui sunt: C1−α

α = 1% C0,99 = 0,743

α = 5% C0,95 = 0,461

α = 10% C0,90 = 0,347

141

Page 141: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Ipoteza H0 este acceptatå dacå Ccalculat ≤ ¿i este respinså în caz contrar. C1−α

Cele trei teste prezentate (χ2, Kolmogorov - Smirnov ¿i Cramer von Mises)

au fost utilizate comparativ pentru verificarea ipotezelor statistice privind debitele maxime anuale la circa 108 sta¡ii hidro (Cicioni ¿.a., 1984) ¿i perioade cuprinse între 27 ¿i 46 de ani. Pragul de semnifica¡ie α a fost considerat de 5%

¿i 10%. Cea mai mare satisfac¡ie a oferit testul χ2, iar dintre reparti¡iile

examinate distribu¡ia lognormalå cu 2 parametri. Testele χ2, Kolmogorov -

Smirnov ¿i Cramer von Mises pot fi aplicate indiferent de ipoteza privind tipul reparti¡iei statistice teoretice. Existå o serie de alte teste (Lilliefors, Massey, Shapiro Wilk, D'Agostino etc.), utilizabile numai pentru verificarea ipotezei de normalitate ¿i care pot fi aplicate chiar în cazul unui numår mai mic de valori. Evident, pentru aplicarea acestor teste valorile variabilelor trebuie simetrizate prin logaritmare.

• Teste pentru analiza omogenitå¡ii hidrologice. Deducerea unor rela¡ii de sintezå este posibilå numai pe zone omogene din punct de vedere hidrologic. Pentru testarea ipotezei de omogenitate se poate folosi testul F (care utilizeazå reparti¡ia F a lui Fisher - Snedecor). Omogenitatea se referå la o anumitå caracteristicå hidrologicå (Vladimirescu, 1978): debit mediu anual, precipita¡ie medie anualå etc. Dacå dispersiile teoretice ale acestor variabile pentru douå sta¡ii sunt egale omogenitatea poate fi admiså. Din punct de vedere matematic problema poate fi formulatå astfel: fiind date douå popula¡ii normale (sau eventual normalizate prin logaritmare) având

dispersiile teoretice ¿i se cere så se verifice ipoteza statisticå: σ 12 σ 2

2

H0 : = cu alternativa Hσ 12 σ 2

21 : ≠ σ 1

2 σ 22

Dispersiile teoretice sunt estimate cu ajutorul dispersiilor de selec¡ie

¿i , unde este o variabilå aleatoare cu ns12 s2

2 s12

1 - 1 grade de libertate, iar

are n

s22

2 - 1 grade de libertate (n1, respectiv n2 reprezintå numårul de valori înregistrate la fiecare sta¡ie). Se calculeazå raportul:

Fsscalculat =

22

12

(unde > ) (7.12) s12 s2

2

142

Page 142: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dacå Fcalculat > ipoteza HFn n2 11 1 1− − −; ; α 0 este respinså (α este pragul de

semnifica¡ie al testului, iar se ob¡ine din tabelele reparti¡iei

Fisher - Snedecor).

Fn n2 11 1 1− − −; ; α

¥n cazul în care intereseazå omogenitatea unui teritoriu mai larg (care

cuprinde mai multe sta¡ii), se calculeazå coeficientul de neomogenitate Fcalculat cu rela¡ia (7.12); dacå aceasta depå¿e¿te limita criticå F, omogenitatea este excluså (V. T. Chow, 1964; Vladimirescu, 1978). Dacå se pune problema excluderii unei singure sta¡ii (dispersia ata¿atå variabilei examinate este diferitå de a celorlalte sta¡ii) se poate utiliza testul Cochran (Iliescu, Vodå, 1977).

143

Page 143: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

8. VARIABILE ALEATOARE N - DIMENSIONALE

8.1. FUNCºIE DE REPARTIºIE ªI DENSITATE DE REPARTIºIE

Prin generalizare, no¡iunile de func¡ie de reparti¡ie ¿i densitate de reparti¡ie de la variabilele unidimensionale se pot extinde ¿i la variabilele aleatoare n-dimensionale.

Dacå X = (X1, X2, ....., Xn) este o variabilå aleatoare n-dimensionalå (sau un

vector aleator de componente X1, X2, ....., Xn), atunci func¡ia:

F(x)= F(x1, x2, ..., xn) = Prob [(X1 < x1), (X2 < x2), ..., (Xn < xn)] (8.1)

se nume¿te func¡ie de reparti¡ie a variabilei n-dimensionale X; x reprezintå un

punct aleator de coordonate xi în spa¡iul n-dimensional. Cu alte cuvinte, func¡ia de reparti¡ie reprezintå în acest caz (Moineagu ¿.a.,

1976) probabilitatea realizårii simultane a unui numår de n inegalitå¡i de tipul:

Xi < xi (i = 1, ...., n). (8.2) Func¡ia f cu proprietatea cå:

... ( , ,..., ) ... ( , ,..., )−∞−∞ −∞∫∫ =∫xx

n n

x

f u u u du du du F x x xn21

1 2 1 2 1 2 n (8.3)

se nume¿te densitatea de reparti¡ie sau densitatea de probabilitate a variabilei n-dimensionale X. ªi pentru cazul n-dimensional se påstreazå o serie de proprietå¡i de la variabilele uni-dimensionale; de exemplu:

f(x) = f(x1,, x2, ..., xn) ≥ 0 (8.4)

144

Page 144: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

... ( , ,..., ) ...−∞−∞ −∞

+∞

∫∫ =∫xx

nf u u u du du du21

1 2 1 2 1n (8.5)

f(x) = f(x1,, x2, ..., xn)= ∂

∂ ∂ ∂

nn

n

F x x xx x x( , , ... , )

...1 2

1 2

. (8.6)

Cunoscând func¡iile F(x) sau f(x), adicå reparti¡ia întregului sistem de variabile aleatoare, se pot ob¡ine expresiile func¡iei de reparti¡ie sau a densitå¡ii de reparti¡ie pentru orice variabilå (a¿a numitele reparti¡ii marginale). Astfel func¡ia de reparti¡ie a unei variabile oarecare, rezultå fåcând så tindå la +∞ restul argumentelor din func¡ia de reparti¡ie a sistemului:

F1(x1) = F(x1, ∞ ,∞ ,...,∞) . (8.7) Densitatea de reparti¡ie a unei variabile oarecare se ob¡ine integrând densitatea de reparti¡ie a sistemului pentru toate celelalte variabile ¿i pe întregul lor domeniu de defini¡ie:

f x f x x x dx dxn1 1 1 2 2( ) ( , ,..., ) ...= ∫∫−∞

+∞

−∞

+∞

n

n

. (8.8)

Prin generalizare, se pot defini subsisteme de variabile aleatoare ¿i reparti¡iile marginale ale acestora.

Din sistemul de variabile aleatoare X1, X2, ..., Xn se poate separa subsistemul

X1, X2, ..., Xk, având func¡ia de reparti¡ie:

F1, 2, ..., k(x1, x2, ..., xk) = F(x1, x2, ...,xk, ∞ ,∞ ,...,∞) (8.9) ¿i densitatea de reparti¡ie:

f x x x f x x x dx dxk k n k1 2 1 2 1 2 1, ,..., ( , ,..., ) ... ( , ,..., ) ...= ∫∫ +−∞

+∞

−∞

+∞ . (8.10)

O altå no¡iune care se poate defini în legåturå cu un sistem de variabile aleatoare este aceea de reparti¡ie condi¡ionatå.

Un subsistem (X1, X2, ..., Xk) are reparti¡ia condi¡ionatå dacå legea sa de

reparti¡ie se calculeazå dupå ce restul variabilelor din sistem (Xk+1, Xk+2, ..., Xn)

au luat valorile particulare xk+1, xk+2, ..., xn.

145

Page 145: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Densitatea de reparti¡ie condi¡ionatå se calculeazå cu rela¡ia:

f x x x x x xf x x x

f x xn k k nn

k n k n

( , , ... , , , ... , )( , , ... , )

( , ... , )...,1 2 1 2

1 2

1, 1+ +

+ +

= . (8.11)

ªi în cazul variabilelor n-dimensionale se pot defini o serie de valori tipice (sau caracteristice) ale sistemului de variabile aleatoare. Acestea sunt:

− valorile medii mi (i = 1, ..., n) ale celor n variabile aleatoare, caracterizând tendin¡a de grupare;

− dispersiile D2(Xi) (i = 1, ..., n) sau abaterile medii påtratice σ (Xi)

(i=1,...,n) definind împrå¿tierea valorilor variabilelor;

− momentele de corela¡ie Kij = M[(Xi - mi)(Xj - mj)], caracterizând rela¡iile

reciproce dintre variabilele Xi ¿i Xj ; momentele Kij sunt definite ca valorile medii ale produsului abaterilor dintre valorile fiecårei variabile ¿i media acesteia, sau altfel spus, momentele de corela¡ie reprezintå valoarea medie a

variabilei (Xi - mi) (Xj - mj).

Momentul de corela¡ie Kij se mai nume¿te ¿i corela¡ie sau covarian¡å a

variabilelor Xi ¿i Xj, ¿i se noteazå prin cov(Xi, Xj). Se observå cå momentul de corela¡ie al unei variabile fa¡å de ea înså¿i este chiar dispersia variabilei respective:

Kii = M(Xi - mi)2 = D

2(Xi) = σ2

(Xi) . (8.12)

Din defini¡ia momentului de corela¡ie rezultå de asemenea: Kij = Kji (proprietate de simetrie). Cu ajutorul momentelor de corela¡ie se poate alcåtui matricea de corela¡ie a variabilelor sistemului:

K

K K K

K K K

K K K

n

n

n n nn

=

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

11 12 1

21 22 2

1 2

...

....

.

.

...

...

. (8.13)

¥n baza proprietå¡ilor de simetrie a momentelor de corela¡ie, rezultå cå ¿i matricea de corela¡ie este simetricå în raport cu diagonala principalå.

146

Page 146: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Douå variabile Xi ¿i Xj din sistem se numesc corelate (sau dependente), dacå

momentul Kij ≠ 0 (aceasta înseamnå cå varia¡ia variabilei Xi antreneazå ¿i

varia¡ia variabilei Xj ). Când variabilele sunt necorelate (adicå sunt indepen-

dente) Kij = 0. Se atrage înså aten¡ia cå propozi¡ia reciprocå nu este adevåratå, deci dacå covarian¡a este nulå, nu rezultå neapårat cå variabilele respective sunt independente (Mihåilå, 1965). Având în vedere dependen¡a dintre variabilele unui sistem, rezultå cå proprietå¡ile acestuia nu pot fi complet ¿i corect descrise numai prin proprietå¡ile variabilelor componente, fiind necesarå ¿i examinarea rela¡iilor reciproce dintre aceste variabile. Momentele de corela¡ie intrå în definirea coeficien¡ilor de corela¡ie, care reprezintå de fapt momente de corela¡ie normate:

( )r

K X X

D X D Xij

ij

i j

i j

i j

= =⋅σ σ

cov ,

( ) ( )2 2 . (8.14)

Mårimile rij sunt coeficien¡i adimensionali; matricea coeficien¡ilor de corela¡ie este:

r

r r r

r r

rij

n

n

n

=

⎢⎢⎢⎢

⎥⎥⎥⎥

1

1

1

1

12 13 1

23 2

3

...

...

...

...

. (8.15)

ºinând seama de proprietatea de simetrie a coeficien¡ilor s-a completat numai partea superioarå a acestei matrici.

Dupå cum se remarcå, deoarece Kii = σi2, elementele de pe diagonala

principalå sunt egale cu unitatea. Dacå variabilele din sistem ar fi necorelate s-ar ob¡ine o matrice bandå, având valoarea 1 pe diagonala principalå, iar restul elementelor ar fi nule.

8.2. VARIABILELE ALEATOARE BI-DIMENSIONALE

¥n practicå, un interes special îl prezintå reparti¡iile bi-dimensionale (definite

deci de variabilele aleatoare X1 ¿i X2 sau pentru comoditatea scrierii, de variabilele X ¿i Y).

147

Page 147: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Foarte multe fenomene hidrologice sunt de tip bi-dimensional, ca de exemplu perechile de valori: debitul maxim - volumul undei de viiturå; debitul râului - debitul solid transportat, etc.. Chiar dacå anumite fenomene hidrologice ar fi mai complexe (de tip tri sau n-dimensional) lipsa datelor din måsuråtori face necesarå simplificarea dependen¡elor constatate sau estimate ¿i conduce la utilizarea unui aparat matematic mai simplu (reparti¡ii unidimensionale, cel mult bi-dimensionale). Prin particularizarea no¡iunilor de la sistemele de variabile n-dimensionale, în cazul bi-dimensional se ob¡in urmåtoarele rela¡ii de defini¡ie:

− func¡ia de reparti¡ie F(x,y) = Prob [(X < x);(Y < y)]; (8.16)

− densitatea de reparti¡ie f(x,y) = ∂∂ ∂

2F x yx y( , )

; (8.16')

¿i în plus: (8.17) f x y dxdy F x yyx

( , ) ( , )=∫∫−∞−∞

− reparti¡iile marginale ale lui X ¿i Y sunt definite prin:

F1(x) = F(x, ∞) ; F2(y) = F(∞, y) (8.18) sau:

f x f x y dy f x f x y dx1 2( ) ( , ) ; ( ) ( , )= ∫ = ∫−∞

+∞

−∞

+∞ ; (8.19)

− reparti¡iile condi¡ionate:

f x yf x yf y

( )( , )

( )=

2

; (8.20)

(adicå densitatea de reparti¡ie a lui X condi¡ionat de o valoare fixå y a lui Y este raportul dintre densitatea de reparti¡ie bi-dimensionalå f(x,y) ¿i densitatea

de reparti¡ie f2(y) a lui Y); similar:

f x yf x yf x

( )( , )

( )=

1

; (8.21)

− matricea de corela¡ie a sistemului de variabile aleatoare:

148

Page 148: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

KK K

K Kxx xy

yx yy

=⎡

⎣⎢

⎦⎥ , (8.22)

unde:

Kxx = M[(X - mx)(X - mx)] = σx2 , (8.23)

Kxy = M[(X - mx)(Y - my)] = Kyx , (8.24)

Kyy = M[(Y - my)(Y - my)] = σy2 , (8.25)

Prin mx ¿i my s-au notat valorile medii ale variabilelor X ¿i Y, iar prin

¿i dispersiile acelora¿i variabile. σ x2 σ y

2

Kxy = Kyx = cov (X,Y) = cov (Y,X) (8.26) reprezintå corela¡ia sau covarian¡a varibilelor X ¿i Y.

− coeficientul de corela¡ie:

r X YX Y

D X D Yr Y X( , )

cov ( , )

( ) ( )( , )=

⋅=

2 2 (8.27)

Notând pentru simplificare:

r = r(X,Y) ; σ x D X= 2( ) ¿i σ y D Y= 2( ) (8.28)

se poate scrie:

cov(X,Y) = cov(Y,X) = r⋅σx⋅σy (8.29) Matricea de corela¡ie devine deci în cazul variabilei bi-dimensionale:

Kr

rx x

x y y

=⋅ ⋅

⋅ ⋅

⎣⎢⎢

⎦⎥⎥

σ σσ σ σ

2

2yσ

(8.30)

8.2.1. REPARTIºIA NORMALÅ BI-DIMENSIONALÅ

149

Page 149: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Este cea mai utilizatå reparti¡ie bi-dimensioanlå. Din punct de vedere teoretic se pot formula, la fel ca ¿i la variabilele unidimensionale, o multitudine de reparti¡ii (simetrice sau asimetrice). Practic înså se admite apriori cå reparti¡ia normalå bi-dimensionalå aproximeazå satisfåcåtor aproape toate tipurile de valori experimentale. Densitatea de reparti¡ie a variabilei bi-dimensionale, normal distribuitå, este datå de formula:

f x yr

E

rx y

( , ) exp=−

−−

⎝⎜

⎠⎟

1

2 1

12 12

2

2πσ σ

, (8.31)

unde r este coeficientul de corela¡ie, exp semnificå func¡ia exponen¡ialå, iar

E2 are expresia:

( ) ( ) ( )( )E

x m y mr

x m y mx

x

y

y

x

x y

2

2

2

2

22=

−+

−−

− −

σ σ σ σy

. (8.32)

Reparti¡ia variabilelor X, respectiv Y este datå de formulele:

( )f x

x m

x

x

x

( ) exp= −−⎛

⎝⎜⎜

⎠⎟⎟

1

2 2

2

2σ π σ , (8.33)

respectiv:

( )f y

y m

y

y

y

( ) exp= −−⎛

⎜⎜

⎟⎟

1

2 2

2

2σ π σ . (8.34)

Reparti¡ia este simetricå în x ¿i y dupå cum rezultå din înså¿i rela¡ia de defini¡ie. 8.2.2. REPARTIºII EMPIRICE BI-DIMENSIONALE Fie o popula¡ie statisticå descriså prin douå variabile aleatoare X ¿i Y; notând

valorile observate prin x1, x2, ..., xm, respectiv y1, y2, ..., yn ¿i prin fij numårul

unitå¡ilor popula¡iei statistice care au caracteristica X = xi ¿i Y = yj, reparti¡ia poate fi descriså ca în tabelul 8.1.

Tabelul 8.1

150

Page 150: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

y

x

y1

y2

.

.

.

yi

.

.

.

yn

Reparti¡ia marginalå

a lui X

x1 f11 f12. . .

f1j. . .

f1n f1•

x2 f21 f22. . .

f2j. . .

f2n f2•. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

xi fi1 fi2. . .

fij. . .

fin fi•. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

xm fm1 fm2. . .

fmj. . .

fmn fm•Reparti¡ia marginalå

a lui Y

f•1

f•2

.

.

.

f•j

.

.

.

f•n

f••

Acest tip de tabel se utilizeazå atât în cazul variabilelor discrete, cât ¿i al variabilelor continue (în acest caz coloanelor ¿i rândurilor li se asociazå

intervale din domeniul de varia¡ie, iar prin xi ¿i yj se noteazå centrul intervalelor). Efectuând totalurile pe linii:

f fij ij

n=∑ •

=1 (i = 1, ..., m) , (8.34)

respectiv pe coloane:

f fij ji

m=∑ •

=1 (j = 1, ..., n) , (8.35)

se ob¡in la marginile tabelului douå reparti¡ii simple: reparti¡ia integralå a variabilei X, respectiv reparti¡ia integralå a variabilei Y în popula¡ia totalå (cu alte cuvinte reparti¡iile marginale ale celor douå variabile). Reparti¡ia marginalå a lui X este deci:

Xx x x x

f f f fi

i m

: 1 2

1 2• • • •

⎛⎝⎜

⎞⎠⎟m , (8.36)

iar reparti¡ia marginalå a lui Y:

151

Page 151: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Yy y y y

f f f fj

j n

: 1 2

1 2• • • •

⎝⎜

⎠⎟n

n

. (8.36′)

Reparti¡iile marginale ale unei variabile sunt reparti¡ii libere, în sensul cå nu depind de loc de valorile celeilalte variabile. ¥n opozi¡ie cu acestea sunt reparti¡iile condi¡ionate, în care reparti¡ia unei variabile este func¡ie de valoarea celeilalte variabile. De exemplu, reparti¡ia lui

y condi¡ionatå de valoarea particularå X=xi este urmåtoarea:

Yy y y y

f f f fi

i i ij in

: 1 2

1 2

⎝⎜

⎠⎟ . (8.37)

Pentru fiecare valoare xi (i = 1, ..., m) a lui X se poate defini reparti¡ia lui Y

condi¡ionat de xi ; în mod similar pentru fiecare valoare yj (j = 1, ..., n) a lui Y

existå o reparti¡ie a lui X condi¡ionat de yj. Cu alte cuvinte, reparti¡ia bi-dimensionalå f(x, y) mai define¿te în afarå de cele douå reparti¡ii marginale ¿i m + n reparti¡ii condi¡ionate. Fiecare reparti¡ie condi¡ionatå este caracterizatå sintetic printr-o valoare medie condi¡ionatå ¿i o abatere medie påtraticå condi¡ionatå. Un interes special în prelucrårile statistice îl prezintå mul¡imea valorilor medii condi¡ionate, care definesc a¿a-numitele curbe de regresie sau curbe de dependen¡å statisticå între valorile medii ale variabilei explicate (sau deter-minate) ¿i valorile variabilei explicative (sau determinante).

8.3. REPREZENTÅRI ªI REPARTIºII EMPIRICE

BI-DIMENSIONALE ¥N HIDROLOGIE. CORELAºII

¥n hidrologie, numårul de måsuråtori este redus, ceea ce face ca o bunå parte

a frecven¡elor absolute fij så fie egale cu zero. De regulå, unei valori a lui x îi corespunde o valoare y, care se înregistreazå o singurå datå; ca urmare, tabelul 8.1 al reparti¡iei este påtrat (m=n). Variabila aleatoare bi-dimensionalå va lua

valorile (xi , yi ; i=1,...,n), astfel încât doar termenii diagonali ai matricii sunt egali cu unitatea, restul termenilor fiind nuli. Aceasta face så se renun¡e la ideea definirii unei densitå¡i de reparti¡ie bi-dimensionale f(x,y), preferându-se så se recurgå la grafice pe care se

152

Page 152: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

reprezintå punctele de coordonate (xi , yi). Imaginea graficå ob¡inutå permite formularea unor ipoteze privind dependen¡a sau independen¡a componentelor X ¿i Y ale variabilei aleatoare bi-dimensionale analizate. Stabilirea acestui lucru este foarte importantå: dacå variabilele sunt independente, ele pot fi analizate separat, ca reparti¡ii uni-dimensionale; în cazul în care variabilele sunt dependente este important så se determine cel pu¡in care este influen¡a modificårii unei variabile asupra valorilor celeilalte variabile. Se ajunge astfel la prelucråri statistice mai simple de o deosebitå importan¡å practicå, cunoscute sub numele de analize de corela¡ie ¿i regresie. Fie de exemplu precipita¡iile X cåzute pe un bazin hidrografic, respectiv debitele Y ale râului în profilul de închidere al bazinului. Reprezentând diversele situa¡ii înregistrate se ob¡ine în principiu dependen¡a din figura 8.1.

Fig. 8.1. Legåtura dintre precipita¡ii ¿i debitul unui râu:

1 - densitatea de reparti¡ie a variabilei Y condi¡ionatå de valoarea X = xi ; 2 - densitatea de reparti¡ie marginalå a lui Y; 2' - densitatea de reparti¡ie

marginalå a lui X; 3 - dreapta de regresie a lui Y fa¡å de X.

Valorile (xi , yi) definesc o variabilå aleatoare bi-dimensionalå, între compo-

nente existând o rela¡ie de dependen¡å probabilisticå; unei valori a lui X

153

Page 153: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

(sau mai corect unei vecinåtå¡i a acesteia) îi corespund o multitudine de valori

ale lui Y.

Acest lucru se explicå prin influen¡a pe care o are gradul de umiditate ini¡ialå

a solului asupra descompunerii precipita¡iilor în scurgere de suprafa¡å ¿i

infiltra¡ie. Pentru o precipita¡ie datå, dacå solul este uscat o mare parte se

infiltreazå, deci scurgerea de suprafa¡å (¿i implicit debitul râului) au valori mai

mici; dimpotrivå, dacå umiditatea ini¡ialå a solului este ridicatå, scurgerea

superficialå respectiv debitul râului vor fi mai mari.

Considerând cå punctul xi de pe absciså reprezintå centrul unui interval:

xx

xx

i i− +⎡⎣⎢

⎤⎦⎥

∆ ∆2 2

, ,

se ob¡ine densitatea de reparti¡ie a lui Y condi¡ionatå de valoarea X = xi

(curba 1 din fig. 8.1). ¥n mod similar se ob¡in reparti¡iile condi¡ionate ale lui X

de valorile lui Y.

¥n figura 8.1 s-a reprezentat ¿i reparti¡ia marginalå a lui Y, liberå deci de

valorile lui X (curba 2). Aceastå reparti¡ie se poate ob¡ine divizând domeniul de

varia¡ie al lui Y în intervale ∆y ¿i contorizând numårul de puncte din cadrul

fiecårui interval; rezultå o reparti¡ie empiricå a lui Y, care este apoi ajustatå

printr-o lege teoreticå. Similar, se construie¿te reparti¡ia marginalå a lui X

(curba 2' din fig. 8.1).

¥n sfâr¿it, pe aceea¿i figurå s-au reprezentat (curba 3) ¿i valorile medii ale lui

Y condi¡ionate de valorile lui X (dreapta de regresie a lui Y fa¡å de X). ªi în acest

caz se poate defini, respectiv reprezenta, dreapta de regresie a lui X fa¡å de Y.

Trebuie men¡ionat cå cele douå drepte de regresie nu coincid decât în cazuri cu

totul speciale ¿i anume atunci când dependen¡a dintre Y ¿i X este de tip

determinist, deci când se poate defini o rela¡ie de tipul Y=f(X). ¥n mod normal,

cele douå drepte de regresie fac între ele un unghi, care este cu atât mai mare, cu

cât legåtura dintre variabilele Y ¿i X este mai slabå.

¥n opozi¡ie cu dependen¡a func¡ionalå dintre Y ¿i X este independen¡a

variabilelor, caz în care cele douå drepte de regresie sunt perpendiculare.

O reprezentare graficå a celor 3 tipuri de situa¡ii este datå în figura 8.2.

154

Page 154: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 8.2. Tipuri de dependen¡å între variabilele Y ¿i X: a - legåturå deterministå între Y ¿i X (variabile total dependente); b - legåturå statisticå (dependen¡a dintre cele douå variabile mai slabå decât în primul caz); c - lipsa oricårei legåturi între

Y ¿i X (variabile independente). Rezumând, o legåturå de tip determinist între variabilele X ¿i Y este de tipul:

Y = f(X), (8.38) în timp ce o legåturå probabilisticå implicå un element aleator ε :

Y = f(X) + ε (8.39) ¥n rela¡ia (8.39), f(X) reprezintå curba de regresie a lui Y fa¡å de X (deci valorile medii condi¡ionate ale lui Y), iar ε este o variabilå aleatoare, indicând abaterile lui Y fa¡å de curba de regresie. ¥n practicå intereseazå în special ecua¡ia curbei de regresie, ceea ce face ca o legåturå de tip probabilistic så se exprime simplificat tot sub forma (8.38). ¥n acest caz, curba f(X) trece printre punctele provenite din måsuråtori, puncte care nu mai sunt pe curbå ca în cazul dependen¡ei de tip determinist, ci sunt situate de o parte ¿i de alta a ei.

Fig. 8.3. Corela¡ie L-tcr. Fig. 8.4. Corela¡ie H F h/ − 1% .

155

Page 155: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n mod similar se pot stabili (I.M.H., 1971) corela¡ii între:

− timpul de cre¿tere tcr al unei unde de viiturå ¿i L sau L/ I r (fig. 8.3),

unde L este lungimea, iar Ir panta râului;

− durata totalå Tt a undei de viiturå ¿i L, L / Ib sau F / I Ib r , unde L

este lungimea râului, Ib - panta bazinului, Ir - panta râului, iar F suprafa¡a bazinului hidrografic;

− stratul scurs h1% ¿i H/ F (fig. 8.4), unde H este altitudinea medie a bazinului hidrografic;

− coeficientul scurgerii medii η ¿i altitudine; − coeficientul evapora¡iei multianuale ¿i altitudine, etc.

¥n toate aceste exemple, cunoscând caracteristicile fizico-geografice ale

re¡elei hidrografice sau bazinului (H, F, Ib, Ir, L etc.) din graficele dependen¡elor rezultate se pot determina o serie de mårimi hidrologice (caracteristici ale undelor de viiturå, scurgere medie, evapora¡ie etc.). Din reprezentårile grafice se observå cå valorile variabilei explicate (Y) prezintå abateri mai mult sau mai pu¡in importante fa¡å de curba valorilor medii;

cu cât punctele (xi , yi) sunt mai apropiate de curba de regresie, cu atât dependen¡a (sau corela¡ia) dintre cele douå variabile este mai strânså. 8.3.1. CLASIFICAREA CORELAºIILOR a) ¥n func¡ie de numårul variabilelor care intervin în corela¡ie se deosebesc:

− corela¡ii simple, în care valorile medii ale variabilei explicate (Y) se exprimå în func¡ie de o singurå variabilå explicativå (X):

Y = F(X) (8.40)

− corela¡ii multiple, în care intervin mai multe variabile explicative

(X1, X2, ... Xn):

Y = f(X1, X2, ...). (8.41) Cu cât numårul variabilelor explicative este mai mare, cu atât dependen¡a dintre variabila explicatå Y ¿i ansamblul variabilelor explicative este mai bunå. La limitå, dacå s-ar introduce toate variabilele care definesc un proces sau fenomen, s-ar ob¡ine legåturi legice, de tip determinist. ¥n general înså, în

156

Page 156: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

practica nu este nici necesar si nici posibil så se evalueze influen¡ele tuturor acestor factori. Ca urmare, se recurge la alegerea unui numår de factori care intervin în mod esen¡ial în definirea variabilei explicate Y, restul factorilor neglijându-se; ei intervin sub forma factorului aleator ε, deci a unor perturba¡ii

ale valorilor lui Y în raport cu valoarea sa medie, deduså pe baza variabilelor X1,

X2, ..., re¡inute. Influen¡ele factorilor re¡inu¡i se evalueazå fie individual (permi¡ând corela¡ii multiple), fie global, sub formå de produs al acestor factori în general (rezultând corela¡ii simple între Y ¿i ansamblul factorilor considera¡i).

− corela¡ii par¡iale; în anumite cazuri intereseazå doar influen¡a unui factor sau a unui grup de factori asupra valorilor lui Y. De exemplu, se ¿tie cå

Y=f(X1,X2) ¿i intereseazå doar corela¡ia par¡ialå Y = f(X1) sau Y = f(X2), pentru a determina variabila care intervine în mod esen¡ial în varia¡ia lui Y. Variabila re¡inutå poate fi supuså apoi unor procedee mai atente de måsurare sau control, în vederea întåririi sau diminuårii influen¡ei ei, dupå cum implica¡iile dependen¡ei rezultate sunt favorabile sau defavorabile. b) ¥n func¡ie de tipul legåturii dintre variabile se deosebesc:

− corela¡ii liniare: simple:

Y = A + BX (8.42) multiple

Y = A + BX1 + CX2 + ... (8.43)

− corela¡ii neliniare: simple sau multiple. c) O altå clasificare a corela¡iilor este în func¡ie de sensul varia¡iei variabilelor (fig. 8.5):

− dacå la cre¿terea valorii variabilei explicative X corespunde o cre¿tere a variabilei explicate Y, atunci legåtura dintre cele douå variabile este directå (fig, 8.5, a);

− dacå la cre¿terea lui X corespunde o mic¿orare a lui Y, legåtura este inverså (fig. 8.5, b).

157

Page 157: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 8.5. Corela¡ie directå (a) ¿i inverså (b) între variabilele X ¿i Y. Gradul de intensitate (sau tårie) a unei corela¡ii se apreciazå cu doi indicatori diferi¡i, dupå cum corela¡ia este liniarå sau neliniarå. Ace¿tia sunt:

− coeficientul de corela¡ie (în cazul dependen¡ei liniare între Y ¿i X); − raportul de corela¡ie (în cazul legåturii neliniare).

8.3.2. COEFICIENTUL DE CORELAºIE AL VARIABILELOR BI-DIMENSIONALE Dupå cum s-a aråtat, coeficientul de corela¡ie al variabilelor aleatoare X ¿i Y este prin defini¡ie:

rX Y

D X D Y=

cov( , )

( ) ( )2 2 (8.44)

¥n cazul în care variabilele X ¿i Y sunt continue ¿i au densitatea de reparti¡ie bi-dimensionalå f(x, y), covarian¡a sau momentul de corela¡ie care reprezintå

valoarea medie a variabilei (X-mx)(Y-my) are urmåtoarea expresie:

( )( )[ ]

( )( )

cov( , )

( , )

X Y K M X m Y m

x m y m f x y dxdy

XY x y

x y

= = − −

= − −∫∫−∞

+∞

−∞

+∞

=

. (8.45)

158

Page 158: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Valoarea medie a variabilei bi-dimensionale s-a ob¡inut dupå acelea¿i reguli ca valoarea medie a variabilei aleatoare uni-dimensionale. Se reaminte¿te cå, în cazul variabilei unidimensionale X cu densitatea de reparti¡ie f(x), valoarea sa medie M(X) este:

M X x f x dx( ) ( )= ∫−∞

+∞ . (8.46)

¥n cazul bi-dimensional, variabila este [(X - mx)(Y - my)] iar densitatea de reparti¡ie f(x, y); rela¡ia de calcul a valorii medii rezultå acum imediat. ¥nlocuind valoarea covarian¡ei în expresia lui r, se ob¡ine în cazul variabilei continue:

( )( ) ( )rX Y

D X D Yx m y m f x y dxdyx y=

⋅− −∫∫

−∞

+∞

−∞

+∞cov( , )

( ) ( ),

2 2 (8.47)

¥n cazul variabilei bi-dimensionale discrete, notând cu:

pij = Prob (X=xi; Y= yj) (8.48) ¿i cu r coeficientul de corela¡ie de selec¡ie, rezultå:

( )( )rD X D Y

x x y y pi ij

n

i

m= −∑∑

==

12 2 11( ) ( )

ij− . (8.49)

Se reaminte¿te cå valoarea medie a variabilei unidimensionale X luând

valorile xi cu probabilitå¡ile pi este:

M X x pi ii

n( ) = ∑

=1 . (8.50)

Cu o rela¡ie similarå s-a ob¡inut în cazul bi-dimensional valoarea medie pentru variabila ( )( )X x Y y− − .

¥n expresia coeficientului de corela¡ie s-a notat prin pij raportul:

pf

fijij≈••

, (8.51)

159

Page 159: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

unde fij reprezintå frecven¡e absolute, adicå numårul de cazuri în care

variabila X ia valorile xi (i = 1, ..., m), iar Y ia valorile yj (j = 1, ..., n); f•• este volumul selec¡iei:

f ijj

n

i

m

••==

= ∑∑11

f . (8.52)

¥n hidrologie, dupå cum s-a mai aråtat, numårul de valori de care se dispune din måsuråtori este redus.

Admi¡ând cå fiecare pereche de valori (Xi, Yj) s-a înregistrat o singurå datå,

rezultå fij = 1 ¿i deci:

pnij =1

. (8.53)

Considerând cå unei valori Xi îi corespunde o singurå valoare a variabilei

explicate (notatå Yi), suma dupå j dispare din rela¡ia (8.49), care devine:

( )( )r

s X s Y

x x y y

n

x y

ns si i

i

n i ii

n

x y

=− −

∑ =⋅∑

=

=12 2 1

1

( ) ( )

∆ ∆ . (8.54)

Lucrând cu o selec¡ie de volum limitat, în expresia (8.54) s-au înlocuit dispersiile ¿i abaterile medii påtratice teoretice prin valorile lor de selec¡ie; prin

∆xi ¿i ∆yi s-au notat abaterile valorilor xi ¿i yi fa¡å de media x , respectiv y .

Se reaminte¿te cå:

( ) ( )sn

x xn

xx ii

n

ii

n= −∑ = ∑

= =

1 12

1

2

1∆ (8.55)

( )sn

yyi

n= ∑

=

1 2

1∆ i . (8.55')

Deci expresia lui r devine:

160

Page 160: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( ) ( )r

x y

x y

i ii

n

i ii

n

i

n=

∑∑

=

==

∆ ∆

∆ ∆

1

2 2

11

. (8.56)

Calculul coeficientului de corela¡ie se desfå¿oarå tabelar, dupå urmåtorul model (tab.8.2):

Tabelul 8.2

i xi yi ∆xi ∆yi ∆xi . ∆yi ∆xi2 ∆yi

2

1 . . . n

.

.

.

.

.

.

.

.

.

.

x y Σ Σ Σ

Calculul se poate simplifica, dezvoltând factorii care intervin în expresia coeficientului de corela¡ie. Se reaminte¿te cå:

σ2 = M2 - M1

2 (8.57)

unde M1 ¿i M2 sunt momentele de ordinul 1, respectiv 2 ale variabilei. ¥n cazul selec¡iei de volum n se ob¡ine:

sn

xn

xn

n x xx ii

n

ii

n

ii

n

ii

n= ∑ − ∑⎛⎝⎜

⎞⎠⎟

= ∑ − ∑⎛⎝⎜⎞⎠⎟= = = =

1 1 12

12

1

22

1 1

2

(8.58)

sn

n y yy ii

n

ii

n= ∑ − ∑⎛⎝⎜

⎞⎠⎟= =

1 2

1 1

2

. (8.58')

¥n ceea ce prive¿te covarian¡a cov (X, Y), se poate scrie:

cov (X, Y) = M[(X - mx)(Y - my)] = M(XY - Xmy - mxY + mxmy) = (8.59)

= M(XY) - M(X)M(Y) - M(X)M(Y) + M(X)M(Y) = M(XY) - M(X)M(Y) .

161

Page 161: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n cazul unei selec¡ii de volum n, prin particularizare covarian¡a se calculeazå cu expresia:

cov( , )X Yn

x yn

xn

yi ii

n

ii

n

ii

n= ∑ − ∑ ⋅ ∑

= =

1 1 1

1 1 =1 . (8.60)

¥nlocuind rela¡iile (8.60) ¿i (8.18) în expresia coeficientului de corela¡ie (8.49), se ob¡ine:

rn x y x y

n x x n y y

i ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

=∑ − ∑ ∑

∑ − ∑⎛⎝⎜⎞⎠⎟

⎣⎢⎢

⎦⎥⎥

∑ − ∑⎛⎝⎜⎞⎠⎟

⎣⎢⎢

⎦⎥⎥

= = =

= = = =

1 1 1

2

1 1

22

1 1

2 . (8.61)

Calculul lui r se desfå¿oarå tabelar dupå urmåtorul model (tab.8.3):

Tabelul 8.3

i xi yi xi . yi x2

i y2

i

1 . . . n

Σ Σ Σ Se observå cå spre deosebire de tabelul 8.2, nu mai este necesar calculul

mediei ¿i al diferen¡elor ∆xi ¿i ∆yi. 8.3.3. INTERPRETAREA COEFICIENTULUI DE CORELAºIE. PROPRIETźI Coeficientul de corela¡ie are urmåtoarele proprietå¡i:

− Coeficientul de corela¡ie reprezintå o måsurå simetricå globalå a dependen¡ei dintre variabilele X ¿i Y, privite ca reparti¡ii marginale ale unor variabile bi-dimensionale (Dinescu ¿.a., 1986). Deoarece cov (X, Y) = cov (Y, X), din rela¡ia de defini¡ie a coeficientului de corela¡ie rezultå cå acesta este acela¿i (proprietate de simetrie), indiferent dacå

162

Page 162: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

se evalueazå dependen¡a probabilisticå (stohasticå) a lui Y fa¡å de X sau a lui X fa¡å de Y.

− Coeficientul de corela¡ie nu se poate utiliza decât în cazul a douå variabile X ¿i Y cu reparti¡ii normale, pentru alte situa¡ii conceptul respectiv nefiind fundamentat teoretic ¿i putând caracteriza cel mult un grad de asociere al variabilelor respective (Panaite, Munteanu, 1982). ¥n practica hidrologicå se stabilesc de exemplu corela¡ii liniare între debitele maxime anuale (având distribu¡ie asimetricå) ¿i volumele undelor de viiturå respective. Este evident cå în acest exemplu premiza normalitå¡ii variabilelor nu mai este verificatå.

− Coeficientul de corela¡ie are valori cuprinse între -1 ¿i +1. Se poate demonstra matematic (Mihoc ¿.a., 1986) cå între douå variabile aleatoare existå

o rela¡ie liniarå, dacå ¿i numai dacå r2 = 1.

Coeficientul de corela¡ie constituie o måsurå a gradului de dependen¡å dintre variabile. Cu cât r este mai apropiat de 1, cu atât legåtura probabilisticå dintre variabile este mai puternicå (atingând maximul în cazul dependen¡ei deterministe de tip liniar). Dacå cele douå variabile aleatoare sunt independente, atunci r = 0. Reciproca acestei propozi¡ii nu este adevåratå, deci dacå r = 0 nu rezultå cå variabilele sunt independente (Mihoc ¿.a., 1986), dependen¡a între variabile putând fi neliniarå (Moineagu ¿.a., 1976). Valorile coeficientului de corela¡ie sunt pozitive în cazul în care cre¿terea variabilei explicative antreneazå cre¿terea variabilei explicate (corela¡ie pozitivå) ¿i negative în caz contrar (corela¡ie negativå). ¥n figura 8.6 sunt reperezentate câteva situa¡ii caracteristice de drepte de regresie ¿i valorile corespunzåtoare ale coeficientului de corela¡ie (Panaite, Munteanu, 1982).

Fig. 8.6. Diverse situa¡ii de drepte de regresie ¿i valorile corespunzåtoare

ale coeficientului de corela¡ie.

163

Page 163: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n aceste reprezentåri s-a notat prin A dreapta de regresie a lui Y în func¡ie de X, iar prin B dreapta de regresie a lui X în func¡ie de Y. Este de remarcat faptul cå, în cazul dependen¡ei de tip determinist, dreptele A ¿i B coincid, în timp ce, în cazul variabilelor independente, dreptele A ¿i B sunt perpendiculare ¿i paralele cu cele douå axe (Dinescu ¿.a., 1986). Din examinarea celorlalte cazuri se constatå cå, cu cât A ¿i B fac un unghi mai mic între ele, cu atât coeficientul de corela¡ie r este mai mare în valoare absolutå, deci corela¡ia este mai bunå. 8.3.4. ESTIMAREA PARAMETRILOR REGRESIEI LINIARE SIMPLE Prin defini¡ie func¡ia de regresie a variabilei aleatoare Y fa¡å de variabila aleatoare X constå în exprimarea analiticå a valorii medii condi¡ionate M(Y | X) a variabilei Y în func¡ie de valorile lui X. Fie o regresie liniarå simplå pentru care M(Y | X) = a + bX. Ecua¡ia acestei drepte va fi notatå mai departe pentru comoditate prin:

y = a + bx . (8.62) Valorile y ale dreptei de regresie reprezintå valori teoretice ¿i sunt evident

diferite de valorile empirice (måsurate) ye pentru acela¿i x (fig. 8.7).

Fig. 8.7. Semnifica¡ia valorilor ¿i ale corela¡iei. yit yi

e

Deoarece, de regulå, se dispune de un numår finit de valori ale lui x, acestea

vor fi notate prin xi, iar valorile variabilei explicate prin , respectiv , dupå

cum este vorba despre valori teoretice sau empirice.

yit yi

e

164

Page 164: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Estimarea parametrilor dreptei de regresie se face de regulå prin metoda celor mai mici påtrate a lui Gauss: se impune condi¡ia ca suma påtratelor abaterilor dintre valorile empirice (din måsuråtori) ¿i cele teoretice (situate pe dreaptå ¿i deci verificând ecua¡ia) så fie minimå:

( )G y yit

ie

i

n= −∑ →

=

2

1minim . (8.63)

Deoarece y verificå ecua¡ia dreptei de regresie se poate scrie: it

yit = a + bxi (8.64)

¿i înlocuind în expresia lui G, se ob¡ine:

( )G a bx yi ie

i

n= + −∑

=

2

1 . (8.65)

A rezultat o func¡ie de doi parametri (a ¿i b), care pot fi determina¡i impunând condi¡iile necesare pentru existen¡a unui punct de extrem (anularea derivatelor de ordinul unu în raport cu a ¿i b):

( )∂∂Ga

a bx yi ie

i

n= + − ⋅∑ =

=2

11 0 (8.66)

( )∂∂Gb

a bx y xi ie

i

n

i= + − ⋅∑ ==

21

0 . (8.67)

Se ob¡ine sistemul:

a bx yi

n

ii

n

ie

i

n

= = =∑ + ∑ = ∑

1 1 1 (8.68)

ax bx x yii

n

ii

n

i ie

i

n

= = =∑ + ∑ = ∑

1

2

1 1 (8.69)

sau:

na b x yii

n

ie

i

n+ ∑ = ∑

= =1 1 (8.70)

165

Page 165: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

a x b x x yii

n

ii

n

i ie

i

n

= = =∑ + ∑ = ∑

1

2

1 1 . (8.71)

A rezultat un sistem de douå ecua¡ii cu douå necunoscute; utilizând determinan¡ii, dupå dezvoltårile respective se ob¡ine:

ay x x x y

n x x

ie

i

n

ii

n

ii

n

i ie

i

n

ii

n

ii

n=

∑ ∑ − ∑ ∑

∑ − ∑⎛⎝⎜⎞⎠⎟

= = = =

= =

1

2

1 1 1

2

1 1

2 (8.72)

bn x y x y

n x x

i ie

i

n

ii

n

ie

i

n

ii

n

ii

n=

∑ − ∑ ∑

∑ − ∑⎛⎝⎜⎞⎠⎟

= = =

= =

1 1

2

1 1

21 (8.73)

O altå evaluare pentru parametrii a ¿i b se ob¡ine împår¡ind în expresia lui b

atât numåråtorul, cât ¿i numitorul cu n2:

b nx y

nx

ny

nx

nx

nx

i ie

i

n

ii

n

ie

i

n

ii

n

ii

n

ii

n=

∑ − ∑ ⋅ ∑

∑ − ∑ ⋅ ∑

= =

= = =

1 1 1

1 1 11 1

2

1 1 1

=1 (8.74)

Conform rela¡iei (8.59), covarian¡a variabilelor X ¿i Y se poate scrie sub forma:

cov (X, Y) = M(XY) - M(X) ⋅ M(Y) . ¥n expresia (8.74) se fac urmåtoarele înlocuiri:

1

1nx y M XYi i

e

i

n e

=∑ = ( ) (8.75)

1 1

1 1nx

ny M X M Yi

i

n

ie

i

ne

= =∑ ⋅ ∑ = ⋅( ) ( ) (8.76)

Conform rela¡iei (8.59), numåråtorul lui b reprezintå covarian¡a cov (X, Ye).

166

Page 166: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Deoarece:

1

1nx i

i

n

=∑ = x , (8.77)

rezultå cå numitorul se poate scrie sub forma:

1 2

1

2

nx xi

i

n

=∑ −

Dar, conform rela¡iilor (4.25), respectiv (4.28) aceasta este tocmai dispersia

de selec¡ie a variabilei X:

( )sn

x xn

x xx ii

n

ii

n2 2

1

2

1

1 1= −∑ = −∑= =

2 (8.78)

Cu alte cuvinte, b se poate scrie sub forma:

( )b

X Y

s

e

x

=cov ,

2 . (8.79)

Pe de altå parte, se ¿tie cå:

( )r

X Y

s sx y

=⋅

cov ,2 2

, (8.80)

adicå:

cov (X,Y) = r ⋅ sx ⋅ sy . (8.81)

Rezultå:

br s s

sr

s

sx y

x

y

x

=⋅ ⋅

=2

. (8.82)

¥n ceea ce îl prive¿te pe a, acesta se poate ob¡ine în func¡ie de b din rela¡ia:

167

Page 167: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

∂∂Ga

na b x yii

n

ie

i

n= → + ∑ = ∑

= =0

1 1 (8.83)

sau:

an

y bn

x y bie

i

n

ii

n= ∑ − ⋅ ∑ = −

= =

1 1

1 1x . (8.84)

Aceea¿i expresie pentru a se putea ob¡ine aplicând operatorul medie ecua¡iei (8.62):

M(y) = M(a + bx) = a + b M(x) . (8.85) Rezultå:

a M y b M x y bx= − = −( ) ( ) . (8.86)

ºinând cont de rela¡ia (8.82) se ob¡ine:

a y bx y rs

sxy

x

= − = − (8.87)

Calculul corela¡iei ¿i regresiei liniare se defå¿oarå deci în modul urmåtor: se determinå coeficientul de corela¡ie r ¿i dacå acesta pune în eviden¡å o legåturå puternicå între cele douå variabile (în hidrologie se admite existen¡a unei corela¡ii pentru |r| ≥ 0,7), se procedeazå la estimarea parametrilor dreptei de regresie cu rela¡iile (8.82), respectiv (8.87). Utilizând acelea¿i rela¡ii, dreapta de regresie a lui Y fa¡å de X se poate scrie ¿i sub forma:

y a bx y bx bx y b x x= + = − + = + −( ) . (8.88)

sau:

( )y y rs

sx xy

x

− = − . (8.89)

¥n mod similar, dreapta de regresie a lui X fa¡å de Y are expresia:

168

Page 168: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( )x x rss

y yx

y

− = − . (8.89')

Din aceste rela¡ii rezultå cå în sens geometric r este panta dreptei de regresie în unitå¡i ale abaterii standard (Moineagu ¿.a., 1976). Constantele:

rs

sy

x

¿i rss

x

y

se numesc coeficien¡i de regresie liniarå. 8.3.5. INTERVALE DE ÎNCREDERE ÎN CAZUL REGRESIEI LINIARE SIMPLE

• Intervale de încredere bilaterale ale parametrilor a ¿i b cu un prag de semnifica¡ie α. Pe baza datelor din înregistråri se calculeazå conform rela¡iilor (8.72), (8.73) sau a rela¡iilor (8.82) ¿i (8.87) parametrii a ¿i b ai dreptei de regresie. Valorile ob¡inute reprezintå ni¿te estimåri ale valorilor adevårate ale parametrilor, care se gåsesc în cadrul unor intervale de încredere, cu a ¿i b ca valori centrale. Limitele intervalelor pot fi ob¡inute cu rela¡iile:

A = a ± t . σa (8.90)

B = b ± t . σb . (8.91) Dispersiile parametrilor a ¿i b se calculeazå cu formulele (Panaite, Munteanu, 1982):

( )

σσ

ay

ii

nnx

x x

22

2

2

1

1=

+−∑

=

(8.92)

169

Page 169: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( )σ

σb

y

ii

nx x

22

2

1

=−∑

=

(8.93)

Deoarece dispersia σ y2 nu este cunoscutå, ea se evalueazå prin dispersia

rezidualå definitå de abaterile valorilor måsurate fa¡å de dreapta de regresie,

ai cårei parametri au fost ob¡inu¡i cu rela¡iile (8.72) ¿i (8.73) sau (8.82) ¿i (8.87):

yie

( )sn

y a bxy ie

ii

n2 2

1

12

=−

− −∑=

. (8.94)

De notat cå dispersia rezidualå este o variabilå aleatoare Student cu n-2 grade de libertate (pe baza celor n valori au fost determina¡i 2 parametri: a ¿i b). Fåcând înlocuirile respective, rezultå pentru un nivel de semnifica¡ie α urmåtoarele expresii ale intervalelor de încredere:

( )A a t sn

x x xn

yi

n= ± ⋅ + −∑

− =22

2 2

1

1;

/α i (8.95)

( )B b t s x xn

y ii

n= ± ⋅ −∑

− =22

2

1;α , (8.96)

unde t

n−22

;α este o variabilå Student cu n-2 grade de libertate ¿i pragul

bilateral α2

.

• Interval de încredere bilateral a valorii medii y* ob¡inutå prin regresie

pentru o valoare x* oarecare. ¥n principiu, dacå a ¿i b sunt cunoscu¡i, valoarea

medie y* a variabilei explicate se calculeazå pentru o valoare oarecare x

* a

variabilei explicative cu rela¡ia:

y* = a + bx

* . (8.97)

Intervalul de încredere bilateral care con¡ine valoarea medie y* cu un prag de

semnifica¡ie α este (Panaite, Munteanu, 1982):

170

Page 170: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( )( )

Y y t sx x

x xny

ii

n* *

;

*

= ± ⋅ +−

−∑−

=

12

2

2

1

1α (8.98)

• Interval de încredere bilateral pentru panta dreptei de regresie care

trece prin origine. ¥n foarte multe cazuri practice dreapta de regresie trece prin origine, adicå x = 0 → y = 0. Ecua¡ia dreptei va fi: y = bx. Dispersia lui b este:

σ σb yi

nx2 2

1= ∑

=/ i

2 (8.99)

Pentru un nivel de semnifica¡ie α, conform rela¡iei (8.91) intervalul bilateral care îl con¡ine pe b este:

B b t s xn

yi

n= ± ⋅ ∑

− =12

2

1;α i , (8.100)

unde:

( )sn

y bxy ie

ii

n=

−−∑

=

11

2

1 , (8.101)

iar t

n−12

;α are n-1 grade de libertate (s-a determinat un singur parametru ¿i

anume b). 8.3.6. REGRESIA NELINIARÅ SIMPLÅ ¥n cazul în care curba de regresie este neliniarå, parametrii curbei pot fi determina¡i prin urmåtoarele metode:

− aplicarea metodei celor mai mici påtrate, care revine la anularea derivatelor func¡iei obiectiv în raport cu parametrii, rezultând un sistem de ecua¡ii neliniare, dificil de rezolvat în general;

− prin trecerea la un nou sistem de coordonate, în care dependen¡a între variabile este de tip liniar (J. Llamas, 1993).

171

Page 171: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Ultimul procedeu este aplicat curent în hidrologie. Fie de exemplu legåtura

între debitele maxime specifice cu probabilitatea de depå¿ire de 1% (q1%) ¿i suprafe¡ele F ale bazinelor de recep¡ie. Evident, dependen¡a dintre cele douå rânduri de valori este neliniarå (fig. 8.8, a); prin logaritmare rezultå înså o rela¡ie liniarå (fig. 8.8, b).

Fig. 8.8. Dependen¡a F-q1% (a) ¿i log F - log q1% (b).

Ecua¡ia dreptei prin tåieturi în noul sistem de coordonate este:

log logqa

Fb

1% 1+ = . (8.102)

¥n continuare, se ob¡ine:

log log log log logq aab

F A B FAFB1% = − = − = . (8.103)

Rezultå tipul de dependen¡å în vechiul sistem de coordonate:

qAFB1% = , (8.104)

unde A ¿i B reprezintå parametrii rela¡iei neliniare dintre F ¿i q1%. ¥n acest caz tipul de dependen¡å a rezultat indirect, pornind de la reprezentarea graficå a datelor din måsuråtori.

172

Page 172: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Fig. 8.9. Liniarizarea prin schimbarea sistemului de coordonate: a - sistemul ini¡ial; b - noul sistem de coordonate.

¥n general, func¡ia de regresie neliniarå cea mai adecvatå pentru diversele dependen¡e hidrologice este cunoscutå ¿i se pune doar problema determinårii parametrilor. Ace¿tia se ob¡in a¿a cum s-a aråtat prin liniarizarea ecua¡iei propuse.

Fie de exemplu o curbå exponen¡ialå de tipul: y = aebx

. Prin logaritmare se ob¡ine: ln y = ln a + bx, care poate fi scriså sub forma Y = A + BX (ecua¡ia unei drepte). Se ob¡ine deci coresponden¡a (fig. 8.9):

Y = ln y; X = x

A = ln a; B = b . (8.105)

Cu alte cuvinte, un punct având coordonatele (xi, yi) în vechiul sistem se va

transforma în punctul (Xi, Yi) din noul sistem de coordonate dupå regula:

Xi = xi

Yi = ln yi . (8.106) ¥n acest sistem de coordonate se cautå apoi parametrii A ¿i B ai dreptei de regresie care trece cel mai bine printre puncte (ponderea punctelor de deasupra dreptei så fie egalå cu ponderea celor de dedesubtul ei). Dupå determinarea lui A ¿i B, se ob¡in prin transformare inverså parametrii a ¿i b. Astfel, în cazul considerat:

a = eA

173

Page 173: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

b = B . (8.107) Dispunând acum de a ¿i b, se pot calcula valorile cele mai probabile (valorile medii) ale variabilei explicate Y pentru orice valoare X = x a variabilei explicative. Câteva exemple de liniarizare a rela¡iilor neliniare curent utilizate în hidrologie sunt prezentate în tabelul 8.4 (Vladimirescu, 1984).

Tabelul 8.4

Ecua¡ia Schimbarea de variabile Ecua¡ia liniarizatå

y = abx Y = log y X = x Y = log a + X log b

y = axb Y = log y X = log x Y = log a + bx

y = aebx Y = ln y X = x Y = ln a + bx

ya

b cx=

+ Y

y=

1 X = x Y

ba

ca

X= +

8.3.7. RAPORTUL DE CORELAºIE Raportul de corela¡ie sau indicele de corela¡ie curbilinie constituie o måsurå nesimetricå a dependen¡ei stohastice a douå variabile aleatoare. Prin defini¡ie, raportul de corela¡ie al variabilei Y în raport cu variabila X este:

RY

yxye X= −12

02

σσ

, (8.108)

unde:

σ ye XY2 - reprezintå dispersia valorilor empirice fa¡å de valorile

teoretice (estimate prin ecua¡ia de regresie neliniarå

yie

Y X );

σ02 - dispersia valorilor empirice de la media acestora: yi

e

yn

yie

i

n

01

1= ∑=

. (8.109)

Expresiile dispersiilor sunt:

σy Xe Y2 = ( )1 2

1nY yX i

e

i

n

i−∑

= (8.110)

174

Page 174: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

σ 02

10

21= ∑ −=n

y yie

i

n( ) . (8.111)

¥n expresia dispersiei valorilor empirice fa¡å de valorile teoretice, Y X i

reprezintå valoarea medie condi¡ionatå a lui Y X pentru valoarea X=xi a

variabilei explicative. Fåcând înlocuirile în expresia raportului de corela¡ie se ob¡ine:

( )( )

RY y

y yyx

X ie

i

n

ie

i

n

i

= −−∑

−∑

=

=

1

2

1

0

2

1

. (8.112)

¥n continuare se va ob¡ine o expresie echivalentå pentru calculul lui Ryx.

Fie varia¡ia totalå ( y yie

i

n

=∑ −

10

2) a valorilor variabilei empirice fa¡å de

valoarea medie y 0 .

Se poate scrie:

( ) ( )

( ) ( ) ,

y y y Y Y y

y Y Y y

ie

i

n

ie

i

n

X X

ie

i

n

Xi

n

X

i i

i i

= =

= =

∑ − = ∑ − + −

= ∑ − + ∑ −

10

2

10

2

1

2

10

2

= (8.113)

deoarece ( )( )y Y Y yie

i

n

X Xi i=∑ − −

10 0= .

Rezultå:

( ) ( ) (y Y y y Y yie

i

n

X ie

i

n

i

n

Xi i= = =∑ − = ∑ − − ∑ −

1

2

10

2

10

2) . (8.114)

¥nlocuind rela¡ia (8.114) în expresia raportului de corela¡ie se ob¡ine:

( )( )

RY y

y yyx

Xi

n

ie

i

n

i

=−∑

−∑

=

=

0

2

1

0

2

1

(8.115)

175

Page 175: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

¥n aceastå rela¡ie Y X i reprezintå valorile teoretice ale variabilei Y (ob¡inute

prin particularizarea variabilei explicative X = xi în ecua¡ia neliniarå de

regresie); yie sunt valorile înregistrate, iar y 0 media lor.

Raportul de corela¡ie este în fond o compara¡ie între dispersia valorilor

teoretice (de pe ecua¡ia de regresie) fa¡å de medie ¿i dispersia valorilor empirice

fa¡å de medie (Moineagu ¿.a., 1976).

Este evident cå: Ryx ≠ Rxy (raportul de corela¡ie este nesimetric spre

deosebire de coeficientul de corela¡ie care este simetric: ryx = rxy). ¥n principiu, sunt valabile urmåtoarele rela¡ii:

0 ≤ r2

x,y ≤ R2

x,y ≤ 1 ¿i (8.116)

0 ≤ r2

y,x ≤ R2

y,x ≤ 1 . Dacå curba de regresie este o dreaptå, raportul de corela¡ie ¿i coeficientul de

corela¡ie sunt egale. ¥n general înså coeficientul de corela¡ie este inferior

raportului de corela¡ie.

Explica¡ia constå în faptul cå coeficientul de corela¡ie presupune automat o

rela¡ie liniarå de dependen¡å stohasticå între variabile; în condi¡iile în care

legåtura dintre variabile este curbilinie, este evident cå o rela¡ie neliniarå va

aproxima mai bine aceastå dependen¡å ¿i deci intensitatea legåturii (exprimatå

prin raportul de corela¡ie) va fi mai bunå decât în cazul liniar (adicå mai aproape

de 1).

Dacå legåtura dintre variabile este de tip liniar, coeficientul de corela¡ie se

poate calcula ¿i cu formula raportului de corela¡ie:

( )( )

rY y

y y

xi

n

ie

i

n

i

=−∑

−∑

=

=

0

2

1

0

2

1

. (8.115')

176

Page 176: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Se atrage înså aten¡ia cå valorile teoretice Y x i sunt ob¡inute cu o rela¡ie de

tipul:

Y a bx i= + x i (8.117)

(cu alte cuvinte trebuie întâi estima¡i parametrii a ¿i b ai dreptei de regresie). Dacå variabilele X ¿i Y sunt independente, atunci:

r = 0 ; Rx,y = 0 ; Ry,x = 0 , (8.118) iar graficele func¡iilor de regresie sunt drepte paralele cu axele de coordonate. ¥n sfâr¿it, dacå variabilele sunt în dependen¡å de tip determinist y = f(x),

atunci Rx,y = Ry,x = 1, iar graficele func¡iilor de regresie coincid cu graficul func¡iei y = f(x).

8.4. CORELAºII LINIARE MULTIPLE

Principiile care stau la baza calculelor unei corela¡ii liniare simple se aplicå ¿i în cazul corela¡iei liniare multiple. Fie de exemplu o regresie de tipul:

Y a b x b x bx x m mm1 1 1 2 2,..., ...= + + + + x . (8.119)

Calculul parametrilor se face tot prin metoda celor mai mici påtrate, urmårindu-se gåsirea hiperplanului care trece cel mai bine printre punctele

empirice yie.

( )G Y yx x x ie

i

n

mi= −∑ →

=1 2

2

1, ..., minim (8.120)

∂∂Ga= 0 ;

∂∂

Gb1

0= ; ... ; ∂∂

Gbm

= 0 . (8.121)

Rezultå urmåtorul sistem de ecua¡ii:

177

Page 177: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

na b x b x b x y

a x b x b x x b x x y x

a x b x x b x b x x

ii

n

i

n

m mii

n

ie

i

n

ii

n

ii

n

ii

n

m i mii

n

ie

ii

n

i

n

ii

n

i

n

m mii

+ ∑ + ∑ + + ∑ = ∑

∑ + ∑ + ∑ + + ∑ = ∑

∑ + ∑ + ∑ + +

= = = =

= = = = =

= = = =

1 11

2 2i1 1 1

11

1 12

12 1 2i

11

11

1

2i1

1 1 2i1

2 2i2

12i

...

...

...1

2i1

11 1

12 2i

1

2

1 1

n

ie

i

n

mii

n

i mii

n

mii

n

m mii

n

ie

mii

n

y x

a x b x x b x x b x y x

∑ = ∑

∑ + ∑ + ∑ + + ∑ = ∑

=

= = = = =

...........................................................................

...

(8.122)

sau scris matricial:

AX = B , (8.123)

unde X = (a, b1, b2, ....., bm)t este vectorul necunoscutelor, A matricea

coeficien¡ilor, iar B termenul liber. De aici rezultå:

X = A-1

⋅ B (8.124) adicå evaluarea necunoscutelor presupune inversarea matricii coeficien¡ilor ¿i înmul¡irea cu vectorul termenilor liberi. La o rela¡ie asemånåtoare se ajunge ¿i în cazul în care ecua¡ia de regresie este de tipul:

Y a b x b x bx x x m mm

m1 2 1 1 2 22

... ...= + + + + x (8.125)

(ecua¡ia este o regresie liniarå multiplå în raport cu parametrii a, b1, b2, ... etc). ¥n sfâr¿it, dacå regresia este de tipul:

Y ax xx x xb b

mb

m

m

1 2

1 21 2... ...= x , (8.126)

prin logaritmare se ajunge din nou la o regresie liniarå multiplå ¿i deci se poate aplica procedeul expus anterior.

178

Page 178: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

8.4.1. COEFICIENTUL CORELAºIEI LINIARE MULTIPLE Intensitatea legåturii liniare multiple între variabila explicatå Y ¿i variabilele

explicative X1, X2, ..., Xm se måsoarå prin coeficientul corela¡iei multiple (Moineagu ¿.a., 1976): ryx x x m1 2 ...

( )( )

rY y

y yyx x x

x x x ie

i

n

ie

i

nm

m i

1 2

1 2

1

2

1

0

2

1

...

...

= −−∑

−∑

=

=

(8.127)

Cu cât valorile empirice se abat mai pu¡in fa¡å de curba de regresie

multiplå, cu atât coeficientul de corela¡ie are o valoare mai mare ¿i corela¡ia este mai intenså.

yie

La limitå, dacå toate punctele verificå ecua¡ia de regresie atunci:

( )y Y xie

x x x im=

1 2 ... (8.128) ¿i deci:

ryx x x m1 21... = . (8.129)

Coeficientul de corela¡ie liniarå multiplå se poate determina ¿i cu

rela¡ia (Moineagu ¿.a., 1976):

ryx x x m1 2 ...

( )r

a y b x y b x yn

y

yn

yy x x x

ie

i

n

i ie

i

n

m mi ie

i

n

ie

i

n

ie

i

n

ie

i

nm1 2

11 1

1 1

2

2

1 1

2

1

1...

...=

∑ + ∑ + + ∑ − ∑⎛⎝⎜⎞⎠⎟

∑ − ∑⎛⎝⎜⎞⎠⎟

= = = =

= =

1 . (8.130)

Acest coeficient måsoarå influen¡a globalå a ansamblului variabilelor

X1, X2, ... Xm asupra variabilei Y. Se pot defini ¿i coeficien¡i ai corela¡iei par¡iale

dintre variabila Y ¿i o singurå variabilå Xj, j ∈ {1, ..., n}, restul variabilelor fiind considerate constante. Astfel, în cazul a trei variabile se pot defini:

− coeficientul corela¡iei par¡iale dintre Y ¿i X1, variabila X2 fiind constantå

(se eliminå în acest fel influen¡a varia¡iei lui X2):

179

Page 179: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

rr r r

r ry x x

y x y x x x

y x x x

1 2

1 2 1 2

2 11 12 2

⋅ =2

− ⋅

− − (8.131)

− coeficientul corela¡iei par¡iale dintre Y ¿i X2, variabila X1 fiind constantå:

rr r r

r ry x x

y x y x x x

y x x x2 1

2 1 1 2

1 11 12 2⋅ =

2

− ⋅

− − . (8.132)

¥n aceste rela¡ii coeficien¡ii corela¡iei simple ( )r r ry x y x x x1 2 1 2, , se numesc

coeficien¡i de ordinul zero, iar ¿i - coeficien¡ii corela¡iei par¡iale

de ordinul 1.

ryx x1 2⋅ ryx x2 1⋅

Cu ajutorul coeficien¡ilor corela¡iei simple se poate calcula ¿i coeficientul

corela¡iei multiple; astfel:

rr r r r r

ry x x

y x y x y x y x x x

x x1 2

1 2 1 2 1

1 2

2 2

2

2

1=

+ − ⋅ ⋅

−2 . (8.133)

¥n cazul a patru variabile, coeficien¡ii corela¡iei par¡iale se calculeazå cu

ajutorul coeficien¡ilor par¡iali de ordinul 1 (Moineagu ¿.a., 1976):

rr r r

r ry x x x

y x x y x x x x x

y x x x x x

1 2 3

1 2 3 2 1 3 2

3 2 1 3 21 12 2

⋅ ⋅⋅ ⋅

⋅ ⋅

= ⋅

− − . (8.134)

Ceilal¡i coeficien¡i ( ¿i )ry x x x2 1 3⋅ ( )ry x x x3 1 2⋅ se ob¡in din rela¡ia anterioarå prin

permutåri circulare ale indicilor. 8.4.2. AUTOCORELAºIA SAU CORELAºIA SERIALÅ

¥n hidrologie prezintå interes în ce måsurå fenomenele analizate au memorie; considerând de exemplu ¿irul debitelor medii lunare, medii anuale sau maxime anuale se pune problema dacå valorile dintr-un anumit interval sunt dependente de valorile din intervalul sau intervalele anterioare.

180

Page 180: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

Dacå o asemenea corela¡ie poste fi identificatå, regularizarea debitelor

necesitå volume mai mari ale lacurilor de acumulare decât în lipsa corela¡iei

respective.

Dependen¡a dintre o mårime luând valorile xi ¿i ea înså¿i dar decalatå (având

valorile xi-k) se nume¿te autocorela¡ie sau corela¡ie serialå. Decalajul k, având

semnifica¡ia unui numår de intervale, reprezintå ordinul autocorela¡iei.

O corela¡ie serialå de ordinul 1 înseamnå o legåturå între ¿irurile:

{x1 x2 ... xn}

{x2 x3 ... xn+1} iar o corela¡ie serialå de ordinul 2 va urmåri stabilirea dependen¡ei dintre ¿irurile:

{x1 x2 ... xn}

{x3 x4 ... xn+2} Gradul de legåturå dintre aceste ¿iruri poartå numele de coeficient de corela¡ie serialå sau de autocorela¡ie. Coeficientul de ordinul k se calculeazå cu rela¡ia (Vladimirescu, 1984):

( )

( ) ( )

rn k

x xn k

x x

n kx

n kx

n kx

n kx

k

i i k ii

n k

i ki

n k

i

n k

ii

n k

ii

n k

i ki

n k

i ki

n k

=−

−−

∑⎛⎝⎜⎞⎠⎟ ∑⎛⎝⎜

⎞⎠⎟∑

−∑ −

−∑⎛⎝⎜

⎞⎠⎟ −

∑ −−

∑⎛⎝⎜⎞⎠⎟

+=

+=

=

=

=

+=

+=

1 1

1 1 1 1

21 11

2

12

1

22

12

1

2

(8.135)

Cu cât ordinul k este mai mare, cu atât coeficientul de autocorela¡ie rk este

mai slab. ¥n practicå prezintå un interes special coeficientul de autocorela¡ie de

ordinul unu, care este utilizat în problemele de generare matematicå a debitelor.

181

Page 181: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

8.5. GENERAREA DEBITELOR

Existå numeroase situa¡ii în hidrologie ¿i în special în gospodårirea apelor în care ¿irul de date înregistrate este insuficient. De exemplu, se pune problema stabilirii volumului unui lac de acumulare pentru care se cunosc cerin¡ele de apå care trebuie satisfåcute în perspectivå (peste 10 ... 20 ani sau chiar mai mult). Este evident cå nu se pot anticipa debitele râului (¿i mai ales succesiunea lor) în situa¡ia corespunzåtoare func¡ionårii lacului. Se folosesc atunci debitele medii lunare înregistrate în trecut (debite care acoperå în general o perioadå de 20 ... 40 ani). Bineîn¡eles aceste debite nu se vor înregistra identic în viitor, dar dacå au fost prinse situa¡ii caracteristice pe râu (ani ploio¿i, ani seceto¿i, succesiuni de ani ploio¿i ¿i ani seceto¿i etc.) atunci se pot trage concluzii de naturå statisticå privind volumul necesar al lacului de acumulare, care så satisfacå cu o probabilitate datå cerin¡ele de apå. Eventual, pentru a ob¡ine ¿i alte succesiuni de debite în afara celor înregistrate se poate proceda la amestecarea ¿irurilor de date anuale (de exemplu se pot grupa to¡i anii seceto¿i la începutul perioadei de calcul, iar anii ploio¿i la sfâr¿it); evident procedeul este criticabil. O modalitate mai elegantå de a produce alte succesiuni de date în afara celor înregistrate, constå în generarea artificialå de noi valori hidrologice. Dintr-un ¿ir de 20 .... 40 de ani de valori înregistrate se pot ob¡ine debite generate pentru perioade oricât de mari (100, 500, 1000 de ani etc.). Ca o condi¡ie esen¡ialå, procedeul de generare utilizat trebuie så conducå la conservarea valorii medii, a coeficientului de varia¡ie ¿i asimetrie; cu alte cuvinte se urmåre¿te ob¡inerea unor valori ale ¿irului generat sau sub¿irurilor sale cu caracteristici statistice apropiate de ale ¿irului de date de bazå. Generarea de valori sintetice nu conduce la ob¡inerea de noi informa¡ii privind hidrologia râului, ci permite doar ob¡inerea unei diversitå¡i de succesiuni posibile ale debitelor în condi¡iile conservårii informa¡iei ini¡iale sau a celei mai mari pår¡i a acesteia. Dispunând de aceastå varietate de situa¡ii posibile a se realiza în viitor, dimensionarea ¿i exploatarea lacului sunt mai temeinic fundamentate. Un aspect important de care trebuie så se ¡inå seama este faptul cå debitele unui râu reprezintå în general ¿iruri cu autocorela¡ie; cel mai des este utilizatå autocorela¡ia dupå un pas. Pentru exemplificarea procedeului de generare se vor prezenta cazurile debitelor medii anuale cu autocorela¡ie. Fie pentru început cazul generårii debitelor anuale cu reparti¡ie normalå. Rela¡ia de recuren¡å a modelului de generare este (Simon, Vi¿an, 1974):

182

Page 182: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

( )Q Q r Q Q t ri i i= + − + −−1 1 121σ , (8.136)

unde:

Qi este debitul mediu generat al anului i;

Qi-1 are aceia¿i semnifica¡ie, dar pentru anul i-1; Q este debitul mediu multianual al datelor întegistrate; σ - abaterea standard a acelora¿i valori;

r1 - coeficientul de autocorela¡ie de ordinul 1 al valorilor înregistrate;

ti - variabila aleatoare normalå normatå, generatå, având media zero ¿i abaterea standard unu. Acest model conservå media, abaterea medie påtraticå ¿i coeficientul de autocorela¡ie introdu¿i ca parametri ini¡iali. ¥n cazul generårii debitelor medii anuale autocorelate cu alte reparti¡ii decât cea normalå, rela¡ia de generare utilizatå este asemånåtoare (Simon, Vi¿an, 1974):

( )Q Q r Q Q ri i i= + − + −−1 1 121σγ , (8.137)

unde:

γ isr

sr i sr

srCC t C

C= + −⎡

⎣⎢⎤⎦⎥−2

16 36

23

, (8.138)

iar:

( )C C

r

rsr s= −

1

1

13

12 3 2/ . (8.139)

Restul mårimilor î¿i påstreazå semnifica¡iile anterioare. Acest model asigurå

conservarea în procesul de generare a parametrilor Q , σ, Cs ¿i r1. Generarea debitelor medii lunare autocorelate constituie o problemå mai delicatå din cauza caracterului nesta¡ionar al procesului (mediile lunare

183

Page 183: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

multianuale ca ¿i abaterea medie påtraticå, coeficientul de autocorela¡ie ¿i coeficientul de asimetrie diferå de la lunå la lunå). ªi mai dificilå este generarea debitelor medii lunare în mai multe sec¡iuni ale unui bazin hidrografic, caracterizat de existen¡a unor legåturi spa¡iale ¿i temporale ale variabilelor aleatoare (Simon, Vi¿an, 1974; Giurma, Hogea, 1985 etc).

184

Page 184: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

BIBLIOGRAFIE 1. Bobée, B., Eléments de statistiques. Université Pierre et Marie Curie - Paris 6; Ecole des Mines de Paris, Paris, 1991. 2. Chow, V. T., Handbook of applied hydrology, New York, 1964. 3. Cicioni, G., Giuliano, G., Spaziani, F., Best fitting of probability functions to a set of data for flood studies, Institute for Water Research, National Research Council, Italy, 1982. 4. Constantinescu, M., Goldstein, M., Haram, V., Solomon, S., Hidrologie, Editura Tehnicå, Bucure¿ti, 1956. 5. Diaconu, C., Låzårescu, D., Hidrologie generalå; prelegeri pentru cursuri postuniversitate, I.C.B., 1977. 6. Diaconu, C., Låzårescu, D., Hidrologie, Editura Didacticå ¿i Pedagogicå, Bucure¿ti, 1965. 7. Dinescu, C., Såvulescu, V., Decizii în probleme economice, Probleme, cazuri, Editura Didacticå ¿i Pedagogicå, Bucure¿ti, 1978. 8. Dinescu, C., Såvulescu, B., Vasiliu, D., Metode matematice pentru fundamentarea deciziilor în produc¡ie, Editura Tehnicå, Bucure¿ti, 1986.

9. Drobot, R., Estimarea raportului Cs/ Cv, utilizând tehnici ale cercetårii opera¡ionale, Revista Hidrotehnica, Bucure¿ti, vol. 34, nr. 10, 1989. 10. Giurma, I., Hogea, V., Contribu¡ii la generarea de ¿iruri de valori hidrologice, care se succed în mod cronologic, Revista Hidrotehnica, Bucure¿ti, vol. 30, nr. 6, 1985. 11. Hâncu, S., Stånescu, P., Platagea, Gh., Hidrologie agricolå, Editura Ceres, Bucure¿ti, 1975.

185

Page 185: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

12. Iliescu, D. V., Vodå, V., Gh., Statisticå ¿i toleran¡e, Editura Tehnicå, Bucure¿ti, 1977. 13. Llamas, J., Hydrologie générale. 2e édition. Gaëtan Morin - éditeur, Québec, 1993. 14. van der Made, J.W., Casebook of methods for computing hydrological parameters of water projects, UNESCO, 1987. 15. Manoliu, M., Roman, P., Metode statistice de calcul ¿i prelucrare a datelor hidrologice ¿i de calitate a apelor, Institutul Politehnic Bucure¿ti, 1983. 16. Meylan, P., Musy, A., Hydrologie fréquentielle, EPFL, 1996. 17. Mihåilå, M., Introducere în teoria probabilitå¡ilor ¿i statisticå matematicå, Editura Didacticå ¿i Pedagogicå. Bucure¿ti, 1965. 18. Mihoc, Gh., Muja, A., Diatcu, E., Bazele matematice ale teoriei fiabilitå¡ii, Editura Dacia, Cluj-Napoca, 1976. 19. Mociorni¡å, C., Dincå, A., Blindåråu, Al., Instruc¡iuni pentru calculul viiturilor teoretice pe râuri mari, I.M.H., 1979. 20. Moineagu, C., Negurå, I., Urseanu, V. , Statisticå, Editura ªtiin¡ificå ¿i Enciclopedicå, Bucure¿ti, 1976. 21. Panaite, V., Munteanu, R., Control statistic ¿i fiabilitate. Editura didacticå ¿i Pedagogicå, Bucure¿ti, 1982. 22. Pârvulescu, C., Economia apelor, I.C.B., 1978. 23. Såcuiu, I., Zorilescu, D., Numere aleatoare. Editura Academiei, Bucure¿ti, 1978. 24. Schulz, E.F., Problems in Applied Hydrology, Water Resources Publications, 1989. 25. Shahin, M., van Oorschot, H.J.L., de Lange, S.J., Statistical Analysis in Water Resources Engineering. A.A. Balkema, Rotterdam, 1993.

186

Page 186: BAZELE STATISTICE ALE HIDROLOGIEI - Hidrotehnica · PDF file5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE ..... 5.1. Reparti¡ia normalå

26. Simon, Al., Vi¿an, V., Generarea debitelor medii lunare în mai multe sec¡iuni ale bazinului hidrografic. Studii de Economia apelor. ICPGA-CNA, Bucure¿ti, 1974. 27. Stånescu, V. Al., Statisticå matematicå aplicatå în hidrologie (nepublicatå), Bucure¿ti, 1985. 28. STAS 4068/1-82, Determinarea debitelor ¿i volumelor maxime ale cursurilor de apå. 29. Våduva, I., Modele de simulare cu calculatorul, Editura Tehnicå, Bucure¿ti, 1977. 30. Vladimirescu, I., Hidrologie, Prelegeri pentru cursurile postuniversitare, I.C.B., 1978. 31. Vladimirescu, I., Hidrologie, Editura Didacticå ¿i Pedagogicå, Bucure¿ti, 1978. 32. Vladimirescu, I., Bazele hidrologiei tehnice, Editura Tehnicå, Bucure¿ti, 1984. 33. Yevjevich, V., Probability and statistics in Hydrology, Water Resources Publications, Fort Collins, Colorado, USA, 1972. 34. XXX, Râurile României. Monografie hidrologicå. I.M.H. Bucure¿ti, 1971. 35. XXX, Dic¡ionar de matematici generale, Editura Enciclopedicå Românå, Bucure¿ti, 1974.

187