seriile independente - tipuri de legaturi statistice

50
Capitolul 6 SERIILE INTERDEPENDENTE Statistica studiază legăturile cauzale dintre fenomenele şi procesele economice. Datorită caracterului complex al fenomenelor şi datorită multitudinii de factori esenţiali şi întâmplători care intervin, aceste legături se manifestă sub formă de tendinţă; ele pot fi identificate în condiţiile acţiunii legii numerelor mari, în colectivităţile de volum ridicat. O problemă importantă în cadrul analizei seriilor interdependente o reprezintă identificarea legăturilor cu adevărat semnificative şi stabile. În cazul în care s-a stabilit că între două variabile există un raport de dependenţă, se ridică o altă problemă, mult mai dificilă: găsirea unei măsuri a acestei legături, prin intermediul unui indicator sintetic de corelaţie. Există însă şi situaţii înşelătoare, în care variaţiile (creşterea sau scăderea) celor două fenomene aparent interdependente sunt similare, dar nu există nici o legătură logică între ele. De exemplu, în ultimii ani în România cresc simultan atât rata sărăciei, cât şi înzestrarea populaţiei cu telefoane mobile. Alteori explicaţia tendinţei de asociere a celor două variabile este dată de existenţa unei cauze comune. De exemplu, creşterea simultană şi semnificativă a vânzărilor la pulovere de lână şi la medicamente antigripale are aceeaşi cauză: venirea iernii. Analiza calitativă a datelor statistice rezolvă probleme de acest tip. 6.1 TIPURI DE LEGĂTURI Analiza seriilor interdependente urmăreşte verificarea existenţei şi măsurarea intensităţii legăturilor dintre fenomene. Cu cât fenomenele sunt mai complexe, cu atât numărul factorilor care le influenţează este mai mare, ceea ce face legăturile cauzale dificil de evidenţiat. Analiza dependenţelor se complică atunci când factorii de influenţă intercondiţionează determinând apariţia de cauzalităţi în lanţ. Pentru a putea determina intensitatea relaţiilor de corelaţie, este necesar să se analizeze, în primul rând, conţinutul şi forma acestor relaţii.

Upload: giuliano69

Post on 27-Jun-2015

627 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Seriile Independente - Tipuri de Legaturi Statistice

Capitolul 6

SERIILE INTERDEPENDENTE

Statistica studiază legăturile cauzale dintre fenomenele şi procesele economice. Datorită caracterului complex al fenomenelor şi datorită multitudinii de factori esenţiali şi întâmplători care intervin, aceste legături se manifestă sub formă de tendinţă; ele pot fi identificate în condiţiile acţiunii legii numerelor mari, în colectivităţile de volum ridicat.

O problemă importantă în cadrul analizei seriilor interdependente o reprezintă identificarea legăturilor cu adevărat semnificative şi stabile. În cazul în care s-a stabilit că între două variabile există un raport de dependenţă, se ridică o altă problemă, mult mai dificilă: găsirea unei măsuri a acestei legături, prin intermediul unui indicator sintetic de corelaţie.

Există însă şi situaţii înşelătoare, în care variaţiile (creşterea sau scăderea) celor două fenomene aparent interdependente sunt similare, dar nu există nici o legătură logică între ele. De exemplu, în ultimii ani în România cresc simultan atât rata sărăciei, cât şi înzestrarea populaţiei cu telefoane mobile. Alteori explicaţia tendinţei de asociere a celor două variabile este dată de existenţa unei cauze comune. De exemplu, creşterea simultană şi semnificativă a vânzărilor la pulovere de lână şi la medicamente antigripale are aceeaşi cauză: venirea iernii. Analiza calitativă a datelor statistice rezolvă probleme de acest tip.

6.1 TIPURI DE LEGĂTURI

Analiza seriilor interdependente urmăreşte verificarea existenţei şi măsurarea intensităţii legăturilor dintre fenomene.

Cu cât fenomenele sunt mai complexe, cu atât numărul factorilor care le influenţează este mai mare, ceea ce face legăturile cauzale dificil de evidenţiat. Analiza dependenţelor se complică atunci când factorii de influenţă intercondiţionează determinând apariţia de cauzalităţi în lanţ.

Pentru a putea determina intensitatea relaţiilor de corelaţie, este necesar să se analizeze, în primul rând, conţinutul şi forma acestor relaţii.

Page 2: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

În cele ce urmează vom nota cu y fenomenul a cărui variaţie este influenţată (variabilă dependentă sau rezultativă) şi cu x factorul de influenţă (variabila independentă sau factorială).

• După natura legăturilor de interdependenţă deosebim două

categorii de relaţii: funcţionale (deterministe) şi stohastice (statistice).

a) Funcţionale: y = f (x). Fenomenul cauză x determină în mod univoc fenomenul efect y,

astfel încât unei valori a variabilei x îi corespunde o valoare unică a variabilei y. De exemplu, valoarea investiţiilor finalizate într-o perioadă determină direct valoarea sporului de capital fix.

Frecvente în domeniul tehnic, legăturile funcţionale sunt rareori întâlnite în economie.

b) Stohastice: y = f (x1 , x2 ,..., xn). Fenomenul efect este influenţat de o multitudine de factori,

esenţiali şi întâmplători. Unei valori a fenomenului cauză xi îi pot corespunde mai multe valori diferite ale fenomenului efect y, în funcţie de acţiunea combinată a celorlalţi factori de influenţă. De exemplu, mărimea profitului depinde de cantitatea produsă, preţurile unitare ale produselor, costul unitar, impozitul pe profit etc.; cheltuielile de consum ale unei persoane depind de venituri, vârstă, sex, situaţia familială, starea de sănă-tate etc.

Fiecare caracteristică xi determină numai o parte a variaţiei fenomenului y, restul variaţiei fiind explicat prin alte caracteristici, care din punct de vedere al legăturii xi -y sunt întâmplătoare.

Variaţia fenomenului y poate fi analizată în funcţie de unul sau mai mulţi factori de influenţă (x1, x2,... , xn), dar întotdeauna va rămâne o variaţie neexplicată, determinată de factorii neînregistraţi.

În cazul în care se identifică şi se analizează factorii de influenţă esenţiali, componenta aleatoare, care sintetizează acţiunea factorilor întâmplători, va avea o pondere redusă şi nu va influenţa semnificativ veridicitatea rezultatelor.

Legăturile stohastice sunt specifice fenomenelor din societate şi economie.

Extrema diversitate a legăturilor stohastice impune sistematizarea lor după mai multe criterii.

Page 3: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

• După numărul caracteristicilor analizate, legăturile stohastice pot fi simple sau multiple.

a) Legături simple - se alege o singură caracteristică determinantă pentru variaţia fenomenului y, toate celelalte caracteristici care îl influenţează, fie că sunt esenţiale sau întâmplătoare, fiind considerate cu acţiune constantă.

De exemplu, analiza legăturii dintre salariu şi productivitate, dintre producţie şi numărul muncitorilor, dintre recolta totală şi suprafaţa cultivată.

b) Legături multiple - se analizează variaţia fenomenului y în funcţie de mai multe caracteristici esenţiale x1, x2,..., xn. Rămâne şi în acest caz o componentă aleatoare, care sintetizează acţiunea, presupusă constantă, a celorlalţi factori de influenţă.

De exemplu, analiza variaţiei salariului într-o colectivitate în funcţie de productivitate, vechime şi calificare.

• După natura caracteristicii pot exista legături stohastice de asociere sau de corelaţie.

a) Asocierea statistică se referă la raporturile de interdependenţă dintre caracteristicile calitative, sau dintre o caracteristică numerică şi una calitativă. De exemplu, legătura dintre locul de muncă şi studii, calificare şi productivitate, între ramurile economice şi salariul mediu, între domeniul de activitate şi dimensiunile întreprinderii, între zona geografică şi clasa de fertilitate a terenurilor agricole etc.

Analiza statistică a raporturilor de asociere este posibilă doar dacă se găseşte o modalitate de exprimare numerică a variantelor. De exemplu, clasele de calitate ale produselor pot fi codificate şi ierarhizate: 0 - produs inferior, 1 - produs mediu, 2 - produs superior.

b) Corelaţia statistică exprimă raporturile de cauzalitate dintre două sau mai multe caracteristici exprimate cantitativ. De exemplu, analiza cifrei de afaceri în funcţie de numărul salariaţilor şi valoarea capitalului fix.

• După sensul relaţiei de cauzalitate, legăturile stohastice pot fi directe sau inverse.

a) Legături directe există atunci când modificarea într-un anumit sens (creştere sau scădere) a fenomenului cauză x determină modificarea în acelaşi sens a fenomenului efect y.

Page 4: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

De exemplu, legătura dintre numărul salariaţilor şi volumul producţiei, dintre mărimea creditului şi masa dobânzii, dintre costul unitar şi costul total etc.

b) Legăturile inverse există atunci când modificarea într-un anumit sens a lui x determină o modificare în sens contrar a lui y.

De exemplu, legătura dintre profitul unitar şi costul unitar de producţie, dintre impozitul pe profit şi profitul net, dintre mărimea dividentelor şi profitul reinvestit etc.

• După forma matematică a legăturilor, acestea pot fi liniare sau neliniare.

a) Liniare: legătura se realizează după ecuaţia dreptei. b) Neliniare: exponenţiale, hiperbolice, parabolice, logistice. Forma legăturii este, de regulă, vizibilă pe grafic. Atunci când

legătura grafică nu este clară, se poate continua analiza pe variantele sugerate de grafic folosind metode analitice şi folosind anumite criterii pentru a alege varianta cea mai bună.

• După momentul producerii lor deosebim legături sincrone şi asincrone.

a) Sincrone - modificarea lui x determină modificarea imediată a lui y. De exemplu, creşterea veniturilor populaţiei determină mărirea imediată a cererii de consum, creşterea producţiei se obţine concomitent cu creşterea cheltuielilor etc.

b) Asincrone - fenomenul x determină variaţia fenomenului efect y după o perioadă de timp. De exemplu, legătura dintre investiţii şi creşterea producţiei sau legătura dintre rata dobânzii şi volumul masei monetare.

6.2 METODE ELEMENTARE DE VERIFICARE A EXISTENŢEI LEGĂTURILOR

Studierea legăturilor dintre fenomenele economice presupune parcurgerea mai multor etape:

• depistarea factorilor care influenţează variaţia fenomenului analizat şi ierarhizarea acestora;

• alegerea factorului sau factorilor esenţiali a căror influenţă asupra fenomenului dependent urmează să fie analizată;

Page 5: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

• culegerea şi sistematizarea datelor referitoare la variabilele studiate; verificarea gradului de cuprindere a datelor înregistrate (dacă datele provin dintr-un sondaj interpretarea rezultatelor se va face în sens probabilistic);

• verificarea existenţei şi formei legăturii dintre caracteristicile corelate în vederea alegerii corecte a procedeelor statistico-matematice de măsurare a dependenţei statistice;

• măsurarea intensităţii legăturii cu ajutorul indicatorilor de corelaţie selectaţi în funcţie de forma de legătură şi de natura informaţiilor de care dispunem;

• testarea semnificaţiei indicatorilor de corelaţie calculaţi când datele au provenit dintr-un sondaj.

În analiza legăturilor statistice dintre fenomenele economice se folosesc metode de verificare a existenţei legăturilor şi metode de apreciere a formei şi intensităţii legăturilor.

Verificarea existenţei legăturilor se poate face cu ajutorul unor metode simple:

• metoda seriilor paralele interdependente; • metoda grupărilor; • metoda tabelului de corelaţie; • metoda grafică; • analiza dispersională. Metodele elementare evidenţiază direcţia legăturii, iar unele dintre

ele pot indica şi forma acesteia. Aplicarea acestor metode trebuie completată cu o analiză calitativă a fenomenelor, bazată pe conţinutul lor economic, pe legătura logică dintre ele.

• Metoda seriilor paralele interdependente Se ordonează, crescător sau descrescător, datele referitoare la

factorul de influenţă x (caracteristica factorială) şi se înscriu pe o coloană paralelă valorile corespunzătoare ale fenomenului dependent y (caracteristica dependentă). Din comparaţia celor două şiruri de date se apreciază dacă variaţia lui x este însoţită de o variaţie corespunzătoare, într-un sens bine definit, a lui y.

Page 6: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Se constată astfel dacă există sau nu o legătură între x şi y şi sensul acestei legături (directă sau inversă). În situaţia afirmativă, datele vor fi supuse în continuare unor prelucrări analitice pentru determinarea intensităţii legăturii.

Metoda este uşor de aplicat şi poate folosi date deja existente în publicaţii statistice sau economice (vezi tabelul 6.2.1). De exemplu, datele din tabelul următor indică tendinţa unei legături directe între exportul şi importul României în/din ţările Uniunii Europene.

Exportul şi importul României în/din ţările Uniunii Europene în luna ianuarie 2002

Tabelul 6.2.1 mil.USD Ţara Export Import

Luxemburg 0,1 0,3 Finlanda 0,3 2,4 Irlanda 1,4 6,3 Danemarca 1,8 3,3 Portugalia 2,9 3,0 Suedia 5,1 10,8 Spania 10,8 16,9 Belgia 13,2 15,5 Austria 30,3 37,1 Olanda 31,6 20,4 Grecia 36,7 20,5 Marea Britanie 43,0 44,7 Franţa 86,8 74,8 Germania 151,2 177,1 Italia 244,1 256,2

Sursa: Buletin statistic lunar, nr.1,2002,INS.

• Metoda grupărilor Întrucât metoda precedentă este aplicabilă doar în cazul

colectivităţilor de volum mic, o variantă a ei o reprezintă gruparea prealabilă a unităţilor colectivităţii după caracteristica factorială x.

Pentru fiecare grupă astfel formată, se calculează media caracteristicii dependente y. Se înscriu, în coloane paralele, grupările ordonate ale caracteristicii x şi mediile corespunzătoare ale lui y.

Page 7: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

Compararea variaţiei celor două caracteristici, x şi y, permite formularea unor concluzii privind existenţa, sensul şi intensitatea legăturii dintre ele. În cazul corelaţiei multiple, se înregistrează pe grupe valorile caracteristicilor factoriale, înscriindu-se valorile respective în coloane distincte, în ordinea importanţei lor pentru caracteristica rezultativă. Pentru caracteristica rezultativă se calculează valori medii condiţionate pe grupe.

Utilizarea acestei metode este sensibil influenţată de aplicarea cu discernământ a metodei grupărilor. Utilitatea metodei este dată în primul rând de faptul că sistematizează datele statistice referitoare la variabilele implicate, pregătind astfel aplicarea unor metode avansate de studiu al corelaţiei.

În tabelul 6.2.2. este prezentat un exemplu de aplicare a metodei grupărilor. Populaţia feminină a fost împărţită pe grupe de vârstă şi s-au calculat valori medii condiţionate de variaţia vârstei pentru variabila dependentă - rata fertilităţii. Exceptând prima grupă de vârstă, se observă o corelaţie inversă foarte puternică între grupa de vârstă (factor de influenţă) şi rata fertilităţii (caracteristica dependentă).

Ratele de fertilitate pe grupe de vârstă în anul 2000

Tabelul 6.2.2 Grupa de vârstă

(ani) Număr femei

(mii persoane) Rata medie de fertilitate

(născuţi vii la 1000 femei) 15 - 19 814,3 39,0 20 - 24 957,0 90,2 25 - 29 888,0 78,5 30 - 34 904,6 38,7 35 - 39 638,3 13,4 40 - 44 802,2 3,1 45 - 49 808,9 0,2

Sursa: Anuarul statistic al României, anul 2000,p.52 şi 68.

• Tabelul de corelaţie Această metodă presupune gruparea ambelor caracteristici, x şi y

într-un tabel cu dublă intrare. Tabelul de corelaţie este un tabel cu dublă intrare în care pe

coloane se trec grupele formate după variaţia caracteristicii factoriale x, ordonate crescător, iar pe linii se înscriu grupele referitoare la variaţia caracteristicii dependente y, de preferinţă ordonate descrescător.

Page 8: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Se recomandă să se utilizeze intervale egale de grupare, un număr suficient de grupe şi acelaşi număr de grupe pentru ambele caracteristici (atunci când este posibil).

Fiecare rubrică a tabelului se află la întretăierea unei anumite grupe după x, cu o altă grupă după y; în rubrica respectivă se trece numărul unităţilor care se înscriu simultan în cele două grupe considerate (după variaţia lui x şi după variaţia lui y).

Atunci când frecvenţele din tabel tind să se concentreze în jurul unei diagonale, între cele două caracteristici reprezentate există legătură de corelaţie. În caz contrar (frecvenţe distribuite neuniform în tot tabelul) variabilele x şi y sunt independente.

Tabelul de corelaţie arată atât existenţa, cât şi sensul legăturii; dacă majoritatea frecvenţelor sunt localizate pe diagonala principală ( / ), legătura este directă, iar când se situează pe diagonala secundară ( \ ), legătura este inversă.

Prin această interpretare a concentrării frecvenţelor, valabilă în cazul ordonării descrescătoare a grupelor referitoare la variaţia caracteristicii dependente y, tabelul de corelaţie se apropie de metoda grafică. În situaţia ordonării crescătoare a valorilor lui y (tabelul 6.2.3), interpretarea sensului legăturii este opusă.

Tabelul cu dublă intrare nr. 6.2.3 permite interpretarea corelaţiei dintre rangul născutului viu (caracteristică dependentă) şi grupa de vârstă a mamei (caracteristica factorială). Datele indică o corelaţie directă destul de puternică.

Născuţii vii după rangul născutului-viu şi grupa de vârstă a mamei în anul 2000

Tabelul 6.2.3 Rangul Grupa de vârstă a mamei (ani)

născutului sub 14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 I 508 25777 52749 30050 10123 1421 263 11 II 21 5236 24336 24852 12450 1717 245 6 III - 689 6481 7849 5021 1287 306 13 IV - 60 2072 3674 2797 959 324 11 V - 2 518 1828 1802 792 264 13 VI - - 99 898 1207 690 269 16 VII - - 28 377 761 508 183 14

VIII şi peste - - 2 219 871 1205 589 47 Sursa: Anuarul statistic al României, anul 2000, p.67.

Page 9: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

• Metoda grafică Este un procedeu simplu şi sugestiv de vizualizare a relaţiilor de

dependenţă dintre două variabile. Toate unităţile colectivităţii analizate se reprezintă grafic prin

puncte în sistemul de coordonate rectangulare. Valorile caracteristicii factoriale x se trec pe abscisă, iar valorile caracteristicii dependente y se înscriu pe ordonată. Unităţile colectivităţii se situează la intersecţia celor două axe de coordonate care corespund valorilor pe care le iau după caracteristica x, respectiv y. Scara de reprezentare influenţează interpretarea rezultatelor.

Atunci când punctele de pe grafic tind să se concentreze sub forma unei linii drepte sau a unei curbe (fig. 6.1.), cele două variabile, x şi y, sunt în relaţii de dependenţă. Atunci când punctele sunt împrăştiate pe grafic, fără nici o regularitate (fig. 6.2.), cele două variabile sunt independente.

Fig. 6.2.1 Legătură liniară Fig. 6.2.2 Variabile directă independente

Graficul permite aprecierea existenţei, formei şi sensului legăturii

statistice dintre variabile. Fiind o metodă simplă apreciere a formei după care se realizează

legătura dintre variabile, metoda grafică are o mare importanţă pentru alegerea metodelor analitice de studiu al corelaţiei.

Pe lângă aceste metode simple, care evidenţiază legăturile de corelaţie, dar nu le pot măsura intensitatea, există şi metode analitice, mai elaborate.

x

. . . . .

.

.

.

.

.

y y

x

.

. .

. .

.

.

.

. .

.

.

.

.

.

.

. .

.

.

.

.

Page 10: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

• Analiza dispersională Această metodă poate fi considerată ca un caz particular de

regresie. Este folosită în studiul modalităţilor în care unul sau mai mulţi factori influenţează asupra unei caracteristici rezultative.

Analiza dispersională arată mărimea şi frecvenţa cu care valorile reale ale unei caracteristici statistice se abat de la valorile teoretice calcu-late (indicatorii sintetici care caracterizează colectivitatea în ansamblu) şi măsura în care aceste abateri depind de factorul de grupare.

Analiza dispersională poate înregistra variaţia unei caracteristici în funcţie de unul sau mai mulţi factori de grupare.

Atunci când caracteristica dependentă y este influenţată de un singur factor de grupare x, prin analiza dispersională se determină cât din variaţia totală a lui y este produsă de factorul de grupare, restul reprezentând rezultatul acţiunii factorilor reziduali (neînregistraţi).

Atunci când y este dependent de mai mulţi factori de grupare, variaţia explicată a lui y se repartizează pe factorii de influenţă (x1, x2,... , xn), iar variaţia neexplicată este considerată variaţie reziduală, produsă de factori neînregistraţi.

Analiza dispersională unifactorială poate fi utilizată pentru a verifica dependenţa unei variabile de factorul de grupare. Ea permite verificarea gradului şi formei de variaţie a caracteristicii dependente în funcţie de factorul de grupare.

Pentru aceasta, unităţile statistice ale colectivităţii analizate se împart după un factor de grupare, considerat factor de influenţă şi se analizează dispersia termenilor în cadrul fiecărei grupe şi între grupele astfel formate.

Cu cât factorul de grupare are un rol mai important în variaţia caracteristicii dependente y, cu atât dispersia în interiorul grupelor este mai mică, iar dispersia dintre grupe este mai mare.

Analiza dispersională presupune calcularea următorilor indicatori: varianţa dintre grupe şi din interiorul grupelor, coeficienţii de determinaţie şi de nedeterminaţie şi coeficientul raportului dintre dispersii.

Se porneşte de la împărţirea colectivităţii în r grupe, fiecare grupă i conţinând ni valori (yi1 , yi2 ,... , yini).

Se calculează media valorilor din fiecare grupă ( iy ) şi media generală ( 0y ).

Page 11: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

Varianţa totală se calculează ca sumă a pătratelor abaterilor tuturor unităţilor colectivităţii de la media lor generală, conform relaţiei:

∑=

−=n

jjy )y(yS

1

20

2 ,

unde: 2yS - varianţa totală a variabilei dependente y;

yj - valorile variabilei dependente, j = 1 , 2 ,... , n; 0y - media tuturor termenilor din colectivitatea generală. Varianţa totală exprimă în mărime absolută gradul de împrăştiere a

tuturor valorilor individuale ale colectivităţii înregistrate. Varianţa pe seama factorului de grupare x se calculează ca

sumă a pătratelor abaterilor mediilor de grupă de la media generală, conform relaţiei:

ir

iix/y n)yy(S ∑

=−=

1

20

2 ,

unde: 2x/yS - varianţa produsă de factorul de grupare x;

iy - media aritmetică a valorilor individuale din fiecare grupă (medie condiţionată de factorul de grupare x), i = 1, 2,... , r;

ni - numărul termenilor din fiecare grupă; Varianţa pe seama factorilor reziduali (neînregistraţi) se calcu-

lează ca sumă a pătratelor abaterilor termenilor individuali de la mediile lor de grupă, conform relaţiei:

∑∑= =

−=r

i

n

jijz/y

i)yy(S

1 1

22 ,

unde: yj -toate valorile individuale ale caracteristicii y, j=1, 2,..., ni; iy -mediile parţiale (de grupă), i =1, 2,..., r; ni -numărul termenilor din fiecare grupă; r - numărul de grupe.

Între cele trei varianţe există următoarea relaţie: varianţa totală este suma dintre varianţa pe seama factorului de grupare şi varianţa pe seama factorilor reziduali.

Page 12: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

2z/y

2x/y

2y SSS += .

Coeficientul de determinaţie ( 2xη ) a factorului de grupare x arată

cât din variaţia totală a unei caracteristici dependente y este produsă de factorul de grupare x, conform relaţiei:

2

22

y

x/yx

S

S=η

Coeficientul de nedeterminaţie ( 2zη ) arată cât din variaţia totală

a caracteristicii dependente y este rezultatul acţiunii unor factori reziduali, întâmplători. Se calculează cu formula:

2

22

y

z/yz S

S=η .

Cei doi indicatori sunt complementari:

122 =+ zx ηη .

Cu cât coeficientul de determinaţie are o valoare mai mare, cu atât acţiunea factorului de grupare x asupra variabilei dependente Y este mai puternică şi acţiunea factorilor întâmplători mai slabă.

Coeficientul raportului dintre dispersii (coeficientul Fisher) reprezintă o măsură a gradului de semnificaţie a factorului de grupare. Se calculează ca raport între varianţele corectate cu numărul gradelor de libertate (numărul de elemente independente al colectivităţii):

rnS

:rS

F z/yx/ycalc −−

=22

1.

Se selectează din tabele statistice (vezi anexa nr.1) valoarea teoretică a coeficientului Fisher, în funcţie de nivelul de semnificaţie α ales şi de numărul gradelor de libertate pentru cele două variabile:

f1 = r - 1;

f2 = n - r.

Page 13: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

Aceasta arată nivelul de la care începe să fie semnificativă legătura dintre cele două variabile: x şi y. Aşadar, dacă Fcalc > Ftab , factorul de grupare x este cu adevărat determinant pentru variaţia caracteristicii dependente y. În caz contrar, variaţia lui y este efectul acţiunii altor factori, care au rol predominant.

6.3 METODE PARAMETRICE DE MĂSURARE A LEGĂTURILOR

Metodele analitice (parametrice) de studiere a corelaţiei permit o mai bună cunoaştere a dependenţei dintre fenomene prin exprimarea ei într-o ecuaţie matematică. Metodele parametrice sunt: regresia, metoda coeficientului şi raportului de corelaţie.

METODA REGRESIEI Regresia este o metodă analitică de studiere a legăturilor dintre

două sau mai multe variabile cu ajutorul unor funcţii matematice care exprimă forma legăturii dintre variabile.

Funcţia de regresie are forma generală:

Y =f (x1 , x2 ,..., xn)+ε, unde: Y- variabila dependentă, fenomenul efect;

x1 , x2 ,..., xn - variabilele independente, factorii de influenţă; n - numărul variabilelor independente; ε - constantă care sintetizează influenţa factorilor neînregistraţi.

Regresia poate fi unifactorială sau multifactorială, în funcţie de numărul factorilor de influenţă înregistraţi.

6.3.1 Regresie unifactorială

Atunci când se studiază variaţia unei caracteristici y în funcţie de un singur factor x, toţi ceilalţi factori fiind consideraţi neglijabili şi cu acţiune constantă, regresia este unifactorială sau simplă:

Yx = f(x) + ε

Funcţia de regresie simplă poate fi liniară, exponenţială, parabolică, hiperbolică, logaritmică etc., alegerea ei făcându-se pe baza

Page 14: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

unui grafic de corelaţie.Cel mai frecvent utilizat model, datorită simplităţii sale relative, este cel liniar, având forma

ix bxaYi

+= ,

unde: Yxi - valorile teoretice, calculate, în funcţie de x ale variabilei dependente y;

x - variabila independentă, factorială; a - parametrul care reflectă influenţa factorilor neînregistraţi (cu

acţiune constantă asupra lui y); b - parametru denumit coeficient de regresie; arată cu cât se

modifică în medie caracteristica dependentă y atunci când x se modifică cu o unitate.

Coeficientul de regresie b arată şi sensul legăturii dintre x şi y: când b > 0, legătura este directă, iar când b < 0, legătura este inversă. Dacă b=0, variabila Yx = a, deci nu depinde de x, ci de ceilalţi factori cuantificaţi prin constanta a. Parametrii a şi b au caracter de mărimi medii.

Parametrii a şi b pot fi analizaţi şi din punct de vedere geometric. Astfel, constanta a este punctul în care dreapta care exprimă ecuaţia de regresie întâlneşte axa ordonatelor Oy (figura 6.3.1). În funcţie de direcţia şi panta dreptei, a poate fi pozitiv sau negativ. Atunci când a=0, fenomenul y depinde univoc de factorul x, deci legătura este funcţională.

Fig. 6.3.1 - Funcţia liniară (legătura inversă)

Parametrul b are semnificaţia geometrică de pantă a dreptei de regresie.

Pentru determinarea mărimilor concrete ale parametrilor a şi b, pornind de la valorile înregistrate de caracteristicile analizate x şi y, se utilizează metoda celor mai mici pătrate. Conform acestei metode, pentru

y

x

a

Page 15: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

ca funcţia de regresie aleasă să fie cu adevărat semnificativă, trebuie să îndeplinească următoarea condiţie:

min,)Yy(n

ixi i

=−∑=1

2

unde: n - numărul unităţilor statistice observate. Aşadar, suma pătratelor abaterilor valorilor reale (yi) de la valorile

exprimate prin ecuaţia de regresie (ixY ) trebuie să fie minimă.

În cazul modelului liniar, condiţia devine:

.min)]bxa(y[n

iii =+−∑

=1

2

Această condiţie se verifică atunci când derivatele parţiale, în raport cu a şi în raport cu b ale funcţiei precedente se anulează. Aşadar:

∑=

=−−⋅n

iii )bxay(

102 şi

.)bxay(xn

iiii 02

1=−−⋅⋅∑

=

Ţinând seama de faptul că a şi b sunt constante, sistemul precedent se poate rescrie sub forma:

=+

=+

∑∑∑∑∑

iiii

ii

yxxbxa

yxbna2

Soluţia sistemului este:

( )

( )

−⋅

⋅−⋅=

−⋅

⋅−=

∑∑∑∑∑∑

∑ ∑∑∑∑

.xxn

yxxxya

xxn

yxyxnb

ii

iiiii

ii

iiii

22

2

22

Pentru parametrul a se mai poate scrie relaţia: xbya −= .

Page 16: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

În continuare, se calculează valorile teoretice ajustate ale variabilei y, pe baza ecuaţiei de regresie:

ix bxaYi

+=

Pentru verificarea calculului parametrilor funcţiei de regresie

folosim relaţia: ∑∑==

=n

ix

n

ii i

Yy11

, ceea ce arată că prin ajustare nu se face

decât o redistribuire a influenţei factorilor.

Sistematizarea calculelor necesare pentru determinarea valorilor teoretice ale caracteristicii y:

xi yi xi

2 xi yi yi2 ix bxaY

i+=

x1 Μ xi Μ xn

y1 Μ yi Μ yn

x12

Μ xi

2 Μ

xn2

x1 y1 Μ

xi yi Μ

xn yn

y12

Μ yi

2 Μ

yn2

11xbaYx ⋅+=

Μ ix xbaY

i⋅+=

Μ nx xbaY

n⋅+=

∑ ix ∑ iy ∑ 2ix ii yx ⋅∑ ∑ iy ∑ ixY

Relaţiile anterioare de calcul se utilizează în cazul datelor negrupate,

sistematizate sub forma unor serii paralele interdependente. Se poate lucra cu date negrupate atunci când numărul observaţiilor este mic. Dacă se dispune de un mare număr de valori ale caracteristicilor x şi y se poate realiza gruparea acestora, simplu sau combinat.

Atunci când se utilizează gruparea simplă, perechile de valori xi şi yi au frecvenţe comune ni. Algoritmul de calcul al parametrilor a şi b prin metoda celor mai mici pătrate se aplică identic. Diferenţa constă în utilizarea frecvenţelor ni la toate sumele existente.

Sistemul de ecuaţii normale devine:

iiiiiii

iiiii

nyxnxbnxa

nynxbna

=⋅+⋅

=⋅+⋅

∑ ∑ ∑∑ ∑ ∑

2

Page 17: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

cu soluţia:

( )∑ ∑∑ ∑ ∑∑

−⋅

⋅−⋅= 22

2

iiii

iiiiiiiii

nxnxnnyxnxnxny

a

( )∑ ∑∑ ∑ ∑

−⋅

⋅−⋅= 22

iiii

iiiiiii

nxnxnnynxnyxn

b

În continuare, folosind parametrii a şi b astfel determinaţi se calculează valorile ajustate ale variabilei y:

ix xbaYi

⋅+=

Calculele necesare pot fi organizate într-un tabel asemănător celui precedent, cu deosebirea că apar în plus frecvenţele ni.

Modelul de calcul se complică şi mai mult atunci când se utilizează gruparea combinată. În acest caz, sistemul de ecuaţii normale devine:

⋅⋅=⋅⋅+⋅⋅

⋅=⋅⋅+⋅

∑ ∑ ∑∑

∑∑ ∑ ∑

i i i jiji.i

2i.ii

i j i jj.j.iii

nyxnxbnxa

nynxbna

Page 18: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Calculele necesare pot fi sistematizate în următorul tabel:

yj xi

y1 ... yj ... yn ni. xini. xi2ni. ∑

jijji nyx ix bxaY

i+=

x1

Μ xi

Μ xr

n11 ... n1j ... n1n

Μ ni1 ... nij ... nin

Μ nr1 ... nrj ... nrn

n1. Μ ni. Μ nr.

x1n1. Μ

xini. Μ

xrnr.

x12n1. Μ

xi2ni. Μ

xr2nr.

∑j

jj nyx 11

∑j

ijji nyx

∑j

rjjr nyx

1xY

ixY

rxY

n.j n.1... n.j ... n.n ∑∑i j

ijn

∑i

.iinx

∑i

.ii nx2 ∑∑i j

ijji nyx ∑i

xiY

yjn.j y1n.1... yjn.j... ynn.n ∑j

j.j ny

j.jny2 121 .ny ... j.j ny2 ... n.ny2 ∑

jj.j ny2

Atunci când legătura dintre x şi y are forma unei funcţii exponenţiale (fig. 6.4.), ecuaţia de regresie este:

ii

xx baY ⋅= , unde a şi b sunt parametrii funcţiei.

Fig. 6.3.2 - Exponenţiala

Modelul exponenţial poate fi uşor transformat într-unul liniar prin logaritmare:

blgxalgylg ii ⋅+=

y

x

Page 19: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

În continuare, se procedează ca la modelul liniar pentru a determina parametrii a şi b ai funcţiei exponenţiale. Se obţine un sistem de ecuaţii normale de forma:

⋅=⋅+⋅

=⋅+⋅

∑ ∑ ∑∑∑

iiii

ii

ylgxxblgxalg

ylgxblgalgn2

Atunci când se utilizează parabola de gradul doi (fig. 6.3.3) pentru a reflecta legătura dintre x şi Y, forma ecuaţiei de regresie este:

2iix xcxbaY

i⋅+⋅+= ,

unde a, b, c sunt parametri.

Fig. 6.3.3 - Tipuri de parabole de gradul doi

Conform metodei celor mai mici pătrate, se pune condiţia:

∑=

⋅−⋅−−n

iiii xcxbay(

1

2 )2 = minim.

Anulând cele trei derivate parţiale, în raport cu a, b şi c, se obţine sistemul de ecuaţii normale a cărui rezolvare oferă valorile celor trei parametri.

⋅=⋅+⋅+⋅

⋅=⋅+⋅+⋅

=⋅+⋅+⋅

∑ ∑ ∑ ∑

∑ ∑ ∑ ∑∑ ∑ ∑

iiiii

iiii

iii

yxxcxbxa

yxxcxbxa

yxcxban

i

2432

32

2

Odată determinaţi parametrii ecuaţiei de regresie, se pot calcula valorile ajustate ale variabilei y.

y

x

y

x

Page 20: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Funcţia logaritmică se exprimă prin relaţia:

ix xlgbaYi

⋅+= .

Procedând ca la modelul liniar, obţinem sistemul de ecuaţii normale:

( )

⋅=⋅+⋅

=⋅+⋅

∑ ∑ ∑∑∑

iiii

ii

xlgyxlgbxlga

yxlgban2

Funcţia hiperbolică (fig. 6.3.4) este:

bx

aYi

xi⋅+=

1 .

Fig. 6.3.4 - Hiperbola

Folosind metoda celor mai mici pătrate, în cazul modelului hiper-

bolei, sistemul de ecuaţii normale pentru calcularea parametrilor a şi b este:

⋅=⋅+⋅

=⋅+⋅

∑ ∑ ∑

∑ ∑

iiii

ii

yxx

bx

a

yx

ban

111

1

2

Parametrii acestor două funcţii se estimează tot prin metoda celor mai mici pătrate, aşa cum s-a explicitat pentru modelul liniar.

y

x

Page 21: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

6.3.2 Regresia multifactorială

Modelul regresiei unifactoriale reprezintă o simplificare extremă a vieţii economice reale, care înregistrează influenţe multiple chiar şi asupra celor mai simple fenomene şi procese. Mai apropiat de realitate este modelul regresiei multiple (multifactoriale), de tipul:

Yxi=f (x1 , x2 ,... , xn) + ε.

În acest caz, fenomenul efect y este supus influenţei unei multitudini de factori: x1, x2 ,... , xn.

Dată fiind complexitatea abordării multifactoriale, modelul cel mai accesibil (şi, în consecinţă, cel mai des utilizat) este cel liniar:

nini22i110x xaxaxaayi

++++= Λ ,

unde: Yxi - valorile teoretice ajustate ale variabilei dependente y; x1 , x2 ,... , xn - factorii de influenţă înregistraţi; a0 - parametru care exprimă influenţa factorilor neînregistraţi; a1 , a2 ,... , an - parametri, coeficienţi de regresie care arată cu cât se

modifică Yx atunci când x1 , x2 ,... , xn se modifică cu o unitate.

Parametrii funcţiei liniare se determină prin metoda celor mai mici pătrate. Pornind de la condiţia:

.min)xa...xaxaay(n

ininiii =−−−−−∑

=1

222110 ,

se anulează derivatele parţiale în raport cu a0 , a1 , a2 ,... , an şi se rezolvă sistemul de ecuaţii normale obţinut. Dacă variabila y este condiţionată numai de doi factori x1 şi x2, sistemul de ecuaţii normale utilizat pentru determinarea parametrilor a0, a1 şi a2 este:

=++

=++

=++

∑∑∑∑∑ ∑∑∑

∑∑∑

iiiiii

iiiiii

iii

yxxaxxaxa

yxxxaxaxa

yxaxana

222221120

121221110

22110

În acest fel se determină forma concretă a ecuaţiei de regresie, pe baza căreia se pot calcula în continuare valorile ajustate ale variabilei dependente y:

Page 22: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

iix xaxaaYi 22110 ⋅+⋅+=

O problemă legată de aplicarea regresiei multifactoriale este posibilitatea existenţei unor interdependenţe între factorii de influenţă (multicoliniaritate). Efectele acesteia influenţează concluziile analizei.

6.3.3 Metoda corelaţiei

Comparativ cu metodele precedente, metoda corelaţiei prezintă avantajul că oferă o măsură sintetică a legăturilor dintre variabilele statistice.

Indicatorii calculaţi sunt: covarianţa, coeficientul de corelaţie şi raportul de corelaţie.

Covarianţa se calculează sub forma mediei aritmetice simple a produselor abaterilor celor două variabile corelate, x şi y, de la mediile lor aritmetice x şi y , conform relaţiei:

.)yy()xx(n

)y,xcov(n

iii∑

=−⋅−=

1

1

Indicatorul ia valori pozitive dacă legătura dintre variabile este directă şi valori negative în caz contrar. Valori apropiate de zero semnifică lipsa oricărei legături între x şi y; valori ridicate ale indicatorului arată o legătură puternică.

Coeficientul de corelaţie simplă măsoară intensitatea legăturilor liniare dintre două variabile.

Fenomenele care se află în relaţii strânse de interdependenţă prezintă o poziţie similară a valorilor individuale ale fiecărui fenomen în parte (xi, yi) faţă de media corespunzătoare ( x , respectiv y ). Rezultă de

aici că şi abaterile normale normate x

i xxσ−

, respectiv y

i yyσ−

au mărimi

apropiate pentru valorile perechi xi, yi. Pentru a obţine o mărime sintetică a abaterilor normale normate la nivelul întregii colectivităţi se calculează

Page 23: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

coeficientul de corelaţie, sub forma mediei produselor acestor abateri:

n

yyxx

ry

i

x

i

x/y

−⋅

=

∑ σσ sau

( ) ( )yx

iix/y n

yyxxr

σσ ⋅⋅−⋅−

= ∑

Indicatorul are mai multe forme echivalente de calcul, dintre care cea mai uşor de utilizat este următoarea:

( ) ( ).

]yyn[]xxn[

yxyxnr

iiii

iiiix/y 2222 ∑∑∑∑

∑∑∑−⋅−

−=

Coeficientul de corelaţie are valori cuprinse între -1 şi 1. Semnul indicatorului arată sensul legăturii: pozitiv - legătură directă, negativ - legătură inversă. Atunci când coeficientul ia valoarea zero, cele două variabile nu sunt corelate liniar. La celălalt capăt al plajei de variaţie, valori apropiate de ±1 arată o legătură extrem de puternică între x şi y apropiată de legăturile de tip funcţional. Valorile intermediare ale indicatorului (între 0 şi ±1) corespund unor intensităţi diferite ale corelaţiei, mergând de la o legătură slabă (sub 0,5) până la o legătură puternică (peste 0,75).

Formula anterioară se utilizează pentru calcularea intensităţii legăturilor dintre variabile pentru care se cunoaşte un număr redus de valori individuale. Pentru observaţii mai ample, datele statistice sunt sistematizate prin grupare simplă sau combinată.

În cazul în care s-a utilizat o grupare simplă, variabilele xi şi yi au frecvenţe comune ni şi formula de calcul a coeficientului de corelaţie simplă devine:

( ) ( ) ]nynyn[]nxnxn[

nynxnyxnr

iiiiiiiiii

i iiiiiiiii

x/y∑ ∑ ∑∑ ∑ ∑

∑ ∑ ∑ ∑

−⋅−

⋅−=

2222

Page 24: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

În varianta unei distribuţii bidimensionale, variabilele xi şi yi au atât frecvenţe distincte (ni., respectiv n.j), cât şi frecvenţe comune nij. Formula de calcul a coeficientului de corelaţie liniară simplă va fi în acest caz:

⋅−

=

∑ ∑ ∑∑ ∑ ∑

∑∑ ∑∑ ∑ ∑

j j jj.jj.jj.

i i i.ii.ii.i

i j i j i jj.j.iiijjiij

x/y

nynynnxnxn

nynxnyxnr

22

22

Pentru a verifica semnificaţia coeficientului de corelaţie liniară simplă se utilizează testul "t". Valoarea calculată a mărimii t se determină cu relaţia:

21 2

−−

= nr

rt

x/y

x/ycalc ,

unde: x/yr - coeficientul de corelaţie liniară simplă; n - numărul observaţiilor; n-2 - numărul gradelor de libertate.

Valoarea rezultată din calcul se compară cu valoarea teoretică din tabelul valorilor repartiţiei Student (anexa 3.) în funcţie de nivelul de semnificaţie α ales (complementul probabilităţii cu care se garantează rezultatul) şi de numărul gradelor de libertate (f = n - 2). Pentru a considera semnificativ coeficientul de corelaţie dat, trebuie îndeplinită condiţia: tcalc ≥ ttab. În caz contrar, influenţa caracteristicii factoriale x asupra caracteristicii dependente y nu este reală.

În situaţia unei corelaţii liniare multiple, se calculează coeficienţi de corelaţie liniară simplă luând pe rând câte un factor xi pentru a măsura intensitatea legăturii sale cu variabila dependentă y. Se obţine câte un coeficient de corelaţie liniară simplă pentru fiecare caracteristică factorială înregistrată:

1x/yr , 2x/yr ,...

nx/yr .

Raportul de corelaţie măsoară intensitatea legăturilor dintre variabile. Se determină după ce s-a aplicat metoda regresiei, întrucât calculul său utilizează valorile teoretice ale caracteristicii dependente y.

Page 25: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

Modelul de calcul al raportului de corelaţie porneşte de la faptul că variaţia totală a caracteristicii y are două părţi: o parte determinantă explicată prin influenţa caracteristicii factoriale x (componentă esenţială) şi o parte supusă influenţei factorilor neînregistraţi aleatori (componenta reziduală).

Rezultă că apar trei feluri de abateri: • abaterea valorilor empirice de la medie ( )yyi − , sintetizată la

nivelul întregii serii în dispersia totală 2yσ ; reflectă influenţa

tuturor factorilor întâmplători şi esenţiali; • abaterea valorilor teoretice de la valorile empirice de la

( )ixi Yy − exprimată pe total prin dispersia reziduală r/yσ ,

care măsoară influenţa factorilor aleatori; • abaterea valorilor teoretice de la medie ( )yY

ix − reprezentată

la nivelul întregii serii de către dispersia sistematică 2x/yσ , ce

arată influenţa variabilei înregistrate x, considerată factor determinant al variaţiei lui y.

La nivelul fiecărei valori individuale yi există relaţia:

( ) ( )yYYyyyii xxii −+−=− .

Pe total, aceasta se transformă într-o relaţie între dispersii: 222

x/yr/yy σσσ +=

unde:

( ) ( ) ( )n

yY;

n

Yy;

nyy ii x

x/yxi

r/yi

y∑∑∑ −

=−

=−

=

22

22

22 σσσ .

Împărţind relaţia anterioară la 2yσ , se obţine:

2

2

2

2

1y

x/y

y

r/y

σ

σ

σ

σ+= .

Page 26: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Primul termen al sumei este coeficientul de nedeterminaţie:

2

22

y

r/yx/yN

σ

σ= ,

care arată ponderea factorilor aleatori în variaţia totală a fenomenului y. Al doilea termen reprezintă coeficientul de determinaţie

2

22

y

x/yx/yR

σ

σ=

care arată în ce proporţie variaţia totală este explicată prin influenţa factorului înregistrat x.

Pe baza relaţiei de complementaritate dintre cei doi coeficienţi se poate scrie:

2

222 11

y

r/yr/yx/y NR

σ

σ−=−= .

Raportul de corelaţie se obţine ca rădăcină pătrată a coeficientului de determinaţie, conform relaţiei:

( ) ( )∑

−−=

−=−= 2

2

2

2

2

2

111yy

Yy

nyy

nYy

Ri

xi

i

xi

y

r/yx/y

)()(

i

i

σ

σ

Valorile indicatorului sunt cuprinse între 0 şi 1. Raportul de corelaţie este nul în cazul variabilelor independente şi 1 în cazul varia-bilelor foarte puternic corelate.

Pentru legăturile liniare, raportul de corelaţie este egal cu coeficientul de corelaţie.

Formula anterioară se utilizează în cazul unui volum mic de date negrupate.

Page 27: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

În cazul unei grupări simple, în care variabilele x şi y au frecvenţe egale, raportul de corelaţie se calculează cu formula:

( )∑

∑⋅−

⋅−−=

ii

2i

ii

2xi

x/ynyy

n)Yy(1R

i

.

Pentru distribuţiile bidimensionale, formula de calcul devine:

( )∑

∑∑

⋅−

⋅−−=

jj.

2

j

i jij

2xj

x/ynyy

nYy1R

)(i

.

Calcularea raportului de corelaţie în ultima variantă presupune utilizarea unui tabel special în care se înscriu valorile empirice yj, valorile teoretice

ixY (calculate prin aplicarea metodei regresiei) şi frecvenţele comune nij:

Tabelul 6.3.1 yj

ixY y1 ... yj ... ym ( )∑ −

jijxj nYy

i2

1xY ( ) 112

1 1nYy x−

( ) jxj nYy 12

1−

( ) mxm nYy 12

1− ( )∑ −

jjxj nYy 1

21

n11 n1j n1m Μ Μ

ixY ( ) 12

1 ix nYyi

− ( ) ijxj nYy

i2−

( ) imxm nYyi

2−

( )∑ −j

ijxj nYyi

2

ni1 nij nim Μ Μ

rxY ( ) 12

1 rx nYyr

− ( )jr rxj nYy 2−

( ) rmxm nYyr

2−

( )∑ −j

rjxj nYyr

2

nr1 nrj nrm Total: ( )∑∑ −

i jijxj nYy

i2

Page 28: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Raportul de corelaţie este egal cu coeficientul de corelaţie în cazul legăturilor liniare. Dacă, în urma calculării celor doi indicatori, se constată egalitatea lor, aceasta este o confirmare a liniarităţii legăturii.

Atunci când se analizează modificarea unei variabile independente y în funcţie de variaţia mai multor factori de influenţă x1 , x2 ,... , xn , intensitatea legăturii se măsoară cu ajutorul raportului de corelaţie multiplă:

=

=

−−= n

1i

2i

n

1i

2x...xxi

)yy(

)Yy(1R

n21

.

În situaţia în care au fost calculaţi anterior coeficienţi de corelaţie liniară simplă în funcţie de fenomenul dependent y şi fiecare caracteristică factorială x1, x2,... , xn luată separat, determinarea raportului de corelaţie liniară multiplă se poate face pe baza rezultatelor. Întâlnim două situaţii: factorii de influenţă sunt independenţi unul de altul sau interdependenţi.

Considerând cazul a doi factori independenţi, raportul de corelaţie liniară multiplă se poate calcula pe baza coeficienţilor de corelaţie liniară simplă

1x/yr şi 2x/yr , astfel:

222121 x/yx/yxx/y rrR +=

Dacă cei doi factori de influenţă asupra lui y sunt interdependenţi, formula de calcul a raportului de corelaţie liniară multiplă devine:

2

22

21

21212121 1

2

xx

xxx/yx/yx/yx/yxx/y

r

rrrrrR

⋅⋅⋅−+=

Se poate observa că pentru 021=xxr (caracteristici factoriale

independente) cele două formule sunt identice. Dacă se calculează coeficienţii de corelaţie simplă între fiecare

caracteristică factorială xi şi caracteristica dependentă y, luaţi în valoare absolută, se observă că valoarea coeficientului de corelaţie multiplă este

Page 29: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

întotdeauna superioară. Acest indicator exprimă efectul combinat al tuturor caracteristicilor factoriale asupra celei rezultative, dependente.

Testarea raportului de corelaţie calculat se poate face cu ajutorul testului "F" de analiză dispersională. Mărimea Fcalc se determină cu ajutorul formulei următoare:

( )

( )rnYy

1ryY

F 2xi

2x

calc

−−

=∑

∑,

unde: n - numărul unităţilor statistice; r - numărul grupelor.

Valoarea calculată se compară cu valoarea tabelată Ftab identificată în funcţie de nivelul de semnificaţie α ales şi de numărul gradelor de libertate f1 = r - 1, f2 = n - r (vezi anexa 1).

Valoarea tabelată arată nivelul de la care începe să fie semnificativ raportul de corelaţie. Aşadar, pentru Fcalc ≥ Ftab, raportul de corelaţie este acceptat, iar pentru Fcalc < Ftab este respins.

Aplicaţia 1 Numărul mediu de angajaţi şi profitul anual înregistrat de 10 firme

dintr-o subramură industrială se prezintă astfel:

Tabelul 6.3.2 Nr. crt.

Număr mediu de angajaţi (persoane) Profit anual (mil. lei)

0 1 2

1 13 115 2 4 45 3 12 100 4 5 50 5 6 55 6 8 85 7 3 40 8 4 50 9 5 45 10 7 70

Total 67 655

Page 30: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Se cere: 1. să se analizeze existenţa, direcţia şi forma legăturii; 2. să se determine parametrii funcţiei de regresie; 3. să se calculeze valorile funcţiei de regresie; 4. să se măsoare intensitatea corelaţiei dintre cele două variabile

folosind coeficientul şi raportul de corelaţie. Rezolvare 1. În relaţia dintre cele două variabile factorul de influenţa este

numărul mediu de angajaţi ( )ix , iar variabila rezultativă este mărimea profitului ( )iy .

Dintre metodele simple de evidenţiere a corelaţiei dintre două variabile am ales metoda grafică, aceasta oferind cele mai multe informaţii.

Din figura 6.2. reiese că între numărul de angajaţi şi mărimea profitului există o legătură directă, de tip liniar.

0

20

40

60

80

100

120

140

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

xi (pers.)

yi (mil. lei)

Figura 6.2 Legătura dintre numărul mediu de angajaţi ( ix ) şi valoarea profitului ( iy )

Page 31: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

2. Sistemul de ecuaţii normale necesar pentru aflarea parametrilor a şi b ai funcţiei liniare este:

=+

=+

∑ ∑ ∑∑ ∑

iiii

ii

yxxbxa

yxban2

Folosind rezultatele calculelor intermediare prezentate în tabelul

6.3.3 (coloanele 1 - 4), se obţine sistemul:

=+=+

5170553676556710

baba

,

cu soluţiile:

50727201715

,b,a

==

3. Valorile teoretice ale profitului (ixY ) se vor calcula înlocuind

fiecare valoare a variabilei factoriale ix în funcţia de regresie:

ix x,,Yi

50727201715 += Rezultatele calculelor efectuate sunt prezentate în tabelul nr. 6.3.3,

coloana 5.

Tabelul 6.3.3

ix iy ii yx 2ix 2

iy ixY ( )2ixi Yy −

1 2 4 3 5 6 7

13 115 1.495 169 13.225 112,80 4,86 4 45 180 16 2.025 45,23 0,05

12 100 1.200 144 10.000 105,29 27,96 5 50 250 25 2.500 52,74 7,50 6 55 330 36 3.025 60,24 27,51 8 85 680 64 7.225 75,26 94,88 3 40 120 9 1.600 37,72 5,18 4 50 200 16 2.500 45,23 22,75 5 45 225 25 2.025 52,74 59,87 7 70 490 49 4.900 67,75 5,05 67 655 5.170 553 49.025 655,00 225,62

Page 32: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

4. Rezultatele calculelor efectuate pentru determinarea

parametrilor a şi b ai funcţiei liniare de regresie pot fi utilizate şi pentru aplicarea formulei de calcul simplificat a coeficientului de corelaţie:

( )[ ] ( )[ ]

[ ] [ ] 9789065549025106755310

6556751701022

2222

,

yynxxn

yxyxnr

iiii

iiiixy

=−⋅−⋅

⋅−⋅=

=−−

−=

∑ ∑∑ ∑∑ ∑ ∑

Această valoare apropiată de 1 indică o legătură foarte puternică

între cele două variabile. Raportul de corelaţie se determină cu formula:

( )( )

56510655

1 2

2

,ny

yunde

,yy

YyR

i

i

xixy

i

===

−−=

∑∑

Utilizând datele din tabelul 6.3.3., calculăm:

97890506122622551 ,,

,R xy =−=

Coeficientul şi raportul de corelaţie au valori egale, ceea ce confirmă liniaritatea legăturii.

Page 33: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

Aplicaţia 2

Într-o subramură industrială s-au înregistrat într-o lună următoarele informaţii privind cheltuielile de producţie şi producţia obţinută:

Tabelul 6.3.4 Cheltuieli de producţie (mil. lei) Producţie

(mii buc.) sub 30 30-60 60-90 90-120 120 şi peste Total

0 1 2 3 4 5 6 31-36 1 - 3 3 - 7 26-31 1 6 4 1 2 14 21-26 1 3 4 - - 8 16-21 5 2 - - - 7 11-16 2 2 - - - 4 Total: 10 13 11 4 2 40

Pe baza acestor date se cere să se determine funcţia de regresie

care exprimă legătura dintre cele două variabile şi să se măsoare intensitatea legăturii.

Rezolvare Distribuţia frecvenţelor în tabel indică o tendinţă de corelaţie

liniară. În cazul distribuţiei bidimensionale de frecvenţe, sistemul de ecuaţii normale are forma:

=+

=+

∑∑∑∑

∑∑

i jjiji

i.ii

i.ii

jj.i

i.ii

nyxnxbnxa

nynxban

2

Calculul elementelor necesare pentru aflarea parametrilor sistemului de ecuaţii este sistematizat în tabelul nr. 6.3.5. Pentru uşurinţă, în tabel se trec direct centrele de interval pentru cele două variabile.

Page 34: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Tabelul 6.3.5

jy

ix

15 45 75 105 135 .in .ii nx .2

ii nx ∑j

jiji nyx

0 1 2 3 4 5 6 7 8 9 33,5 1 - 3 3 - 7 234,5 7855,75 18592,5

28,5 1 6 4 1 2 14 399,0 11371,50 27360,0

23,5 1 3 4 - - 8 188,0 4418,00 10575,0

18,5 5 2 - - - 7 129,5 2395,75 3052,5

13,5 2 2 - - - 4 54,0 729,00 1620,0

jn 10 13 11 4 2 40 1005,0 26770,00 61200,0

j.j ny

150 585 825 420 270 2250

jj ny .2

2250 26325 61875 44100 36450 171000

ixY 20,5255 35,8905 51,255 66,6205 81,9855 -

Cu elementele calculate în tabelul 6.3.5., obţinem sistemul de două ecuaţii:

=+=+

612002677010052250100540ba

ba

Rezolvând sistemul, obţinem: 96,20−=a şi 073,3=b . Rezultă că dreapta de regresie va avea ecuaţia:

ix x,,Yi

07339620 +−=

Înlocuind în această relaţie pe fiecare ix cu centrul de interval corespunzător, am obţinut valorile numerice ale ecuaţiilor de regresie (vezi tabelul 6.3.6.).

Fiind o repartiţie de frecvenţe pentru măsurarea gradului de corelaţie, calculăm raportul de corelaţie utilizând formula de calcul

Page 35: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

prezentată în continuare:

( )

( )∑

∑∑

−=

jj.j

i jjixj

xynyy

nYyR

i

2

2

1 , unde ∑

∑=

jj.

jj.j

n

nyy

Pentru aplicarea acestei formule vom folosi datele conform calculelor efectuate în tabelul 6.3.6. Se observă, că pentru determinarea raportului de corelaţie este necesar să calculăm în prealabil media şi dispersia pe total (56,25 mii buc. şi 1110,937).

Tabelul 6.3.6

ixY jy jin ( ) jixj nYyi

2−

15 2 61,062 20,5255 45 2 1198,002 15 5 2182,065 35,8905 45 2 165,966 15 1 1314,425 45 3 117,375 51,255 75 4 2255,300 15 1 2664,676 45 6 2804,676 75 4 280,864

105 1 1472,986 66,6205

135 2 9351,512 15 1 4487,057 75 3 146,392 81,9855

105 3 1589,002 Total 30091,36

568049944437360300911 ,,,R xy =−=

Valoarea raportului de corelaţie indică o legătură de intensitate

medie între cele două variabile luate în studiu. Pentru verificarea liniarităţii funcţiei care estimează legătura dintre cele două variabile se calculează coeficientul de corelaţie utilizând în acest scop datele din tabelul 6.3.5.

Page 36: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

( )( ) 57022501710004010052677040

10052250612004022

22

22

,

nynynnxnxn

nynxnyxn

r

jj.jj.

jj

i.ii

i.ii

i jj.j

i.ii

jjiji

xy

=−⋅−⋅

⋅−⋅=

=

=

∑∑∑∑

∑ ∑∑∑

În exemplul luat, egalitatea dintre cei doi indicatori sintetici de corelaţie ne permite să afirmăm că legătura este liniară. Efectuând deci calculul şi comparând rezultatele, se poate accepta că legătura este liniară dacă: xyxy rR = , iar în caz contrar se respinge ipoteza şi, în această situaţie, se recurge la o altă funcţie de ajustare care să verifice forma de legătură dintre cele două variabile. Pentru verificarea obiectivităţii funcţiei de regresie se pot folosi şi rezultatele analizei dispersionale.

6.4 METODE NEPARAMETRICE DE MĂSURARE A LEGĂTURILOR

Atunci când nu se cunoaşte forma legăturii de corelaţie între două variabile, precum şi în situaţia în care caracteristicile analizate au caracter calitativ şi nu se pot exprima numeric dar este posibilă ierarhizarea lor, se recomandă utilizarea metodelor neparametrice de măsurare a intensităţii legăturilor statistice. Se mai folosesc în cazul distribuţiilor asimetrice şi atunci când dispunem de un număr mic de observaţii.

Cei mai utilizaţi indicatori din această categorie sunt coeficientul de asociere şi coeficienţii de corelaţie a rangurilor Spearman şi Kendall.

Metoda tabelului de asociere şi a coeficientului de asociere se

utilizează în cazul caracteristicilor alternative (care admit numai două forme de manifestare sau valori). Practic, orice caracteristică statistică poate fi transformată într-o caracteristică alternativă. De exemplu, pentru caracteristicile numerice se calculează media, după care se poate împărţi

Page 37: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

colectivitatea în două grupe alternative, una cuprinzând unităţile statistice cu valori sub medie, iar cealaltă valorile superioare mediei.

Tabelul de asociere este o formă particulară a tabelului cu dublă intrare. În subiectul tabelului se înscrie variaţia caracteristicii factoriale x iar în predicat variaţia caracteristicii dependente y (tabelul 6.4.1). Rubricile tabelului conţin frecvenţele cu care unităţile colectivităţii se înscriu în cele patru grupe formate prin intersecţia variaţiei caracteristicilor x şi y.

Tabelul de asociere

Tabelul 6.4.1 y x

y1 y2 Total

x1 a b a + b x2 c d c + d

Total a + c b + d n=a+b+c+d

Intensitatea legăturilor dintre x şi y se măsoară cu ajutorul coeficientului de asociere propus de Yulle:

bcadbcadQ

+−

= .

Valorile indicatorului sunt cuprinse între -1 şi 1. Semnul indicato-rului arată sensul asocierii: directă, atunci când Q > 0 şi inversă, atunci când Q < 0. Dacă indicatorul are valoare nulă, nu există legătură de asociere între x şi y. Dacă Q tinde către 1± , legătura este foarte puternică (apropiată de o legătură de tip funcţional). Asocierea completă (Q = 1± ) se produce atunci când una din frecvenţe (a, b, c sau d) este nulă.

Metoda corelaţiei rangurilor Această metodă constă în înlocuirea valorilor observate ale celor

două caracteristici x şi y, cu numere de ordine care indică poziţia fiecărei valori în şir (rangul). Dacă există concordanţă între rangurile caracteristicii factoriale x şi rangurile caracteristicii dependente y

Page 38: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

înseamnă că cele două caracteristici sunt corelate. O măsură sintetică a corela’iei dintre cele două şiruri de ranguri, după x şi după y, o oferă coeficientul de corelaţie a rangurilor Spearman:

)1n(n

d61r 2

n

1i

2

i

s −

⋅−=

∑= ,

unde: rs - coeficientul Spearman de corelaţie a rangurilor;

di - diferenţa de rang între caracteristicile x şi y pentru aceeaşi unitate de observare i;

n - umărul unităţilor statistice din colectivitatea înregistrată (perechile de valori corelate).

Indicatorul ia valori cuprinse între -1 şi 1; interpretarea rezultatului este similară celei efectuate pentru coeficientul de asociere.

Un alt indicator care se poate calcula în cadrul metodei corelaţiei rangurilor este coeficientul lui Kendall, dat de formula:

)n(nSrK 1

2−⋅⋅

= ,

unde: rK - coeficientul Kendall de corelaţie a rangurilor; n - numărul unităţilor statistice observate.

∑∑∑===

−==n

ii

n

ii

n

ii QPSS

111,

unde: Pi - numărul rangurilor următoare (de la termenul i până la sfârşitul seriei) care sunt mai mari decât rangul termenului i;

Qi - numărul rangurilor următoare (până la sfârşitul seriei) care sunt mai mici decât rangul termenului i.

Mărimile Pi şi Qi se determină numai pentru caracteristica y, aranjată în funcţie de caracteristica x ordonată crescător. Valorile coeficientului Kendall sunt cuprinse între -1 şi 1,

interpretarea lor fiind similară indicatorilor precedenţi. De regulă, coefi-cientul Kendall înregistrează valori inferioare coeficientului Spearman (în valoare absolută).

Coeficienţii de corelaţie a rangurilor se folosesc frecvent pentru analiza legăturilor dintre două caracteristici calitative sau între o

Page 39: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

caracteristică de tip calitativ şi una cantitativă, dacă este posibilă ierarhizarea variantelor caracteristicii calitative.

Un exemplu de calcul a coeficienţilor de corelaţie a rangurilor este prezentat în tabelele 6.4.2 şi 6.4.3.

Calcularea coeficientului de corelaţie a rangurilor Spearman

privind legătura dintre exportul şi importul României în/din tările Uniunii Europene în ianuarie 2002

Tabelul nr. 6.4.2 Rang după: Ţara Export

(mil.USD) Import

(mil.USD) export (x ) import

( y ) Diferenţa de

rang (di) Austria 30,3 37,1 9 11 -2 Belgia 13,2 15,5 8 7 1 Danemarca 1,8 3,3 4 4 0 Franţa 86,8 74,8 13 13 0 Finlanda 0,3 2,4 2 2 0 Germania 151,2 177,1 14 14 0 Grecia 36,7 20,5 11 10 1 Irlanda 1,4 6,3 3 5 -2 Italia 244,1 256,2 15 15 0 Luxemburg 0,1 0,3 1 1 0 Olanda 31,6 20,4 10 9 1 Portugalia 2,9 3,0 5 3 2 Spania 10,8 16,9 7 8 -1 Suedia 5,1 10,8 6 6 0 Marea Britanie

43,0 44,7 12 12 0

Total 659,3 689,3 - - - Sursa: Buletin statistic lunar, nr.1/2002, INS,p.20

Coeficientul de corelaţie a rangurilor Spearman este:

97,03360961

)1225(15])1()2(1)2(11)2[(61

)1n(n

d61r

2222222

2i

2i

s

=−=

=−⋅

−+++−+++−⋅−=

⋅−=

Page 40: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

Pentru calcularea coeficientului Kendall (tabelul 6.4.3) se ordonează crescător ţările Uniunii Europene după variabila x (export) înscriind în coloana alăturată rangurile corespunzătoare după import. Se determină apoi pentru fiecare ţară, pe baza rangurilor la import:

Pi - numărul de ţări (de la rândul i până la sfârşitul seriei) având la import ranguri superioare rangului ţării i;

Qi - numărul de ţări (de la rândul i până la sfârşitul seriei) având la import ranguri inferioare rangului ţării i.

Calcularea coeficientului de corelaţie a rangurilor Kendall

privind legătura dintre exportul şi importul României în/din tările Uniunii Europene în ianuarie 2002

Tabelul nr. 6.4.3 Rang după: Ţara Export

(mil.USD)Import

(mil.USD) export

(x ) import

( y ) Pi

Qi

Si

Luxemburg 0,1 0,3 1 1 14 0 14 Finlanda 0,3 2,4 2 2 13 0 13 Irlanda 1,4 6,3 3 5 10 2 8 Danemarca 1,8 3,3 4 4 10 1 9 Portugalia 2,9 3,0 5 3 10 0 10 Suedia 5,1 10,8 6 6 9 0 9 Spania 10,8 16,9 7 8 7 1 6 Belgia 13,2 15,5 8 7 7 0 7 Austria 30,3 37,1 9 11 4 2 2 Olanda 31,6 20,4 10 9 5 0 5 Grecia 36,7 20,5 11 10 4 0 4 Marea Britanie 43,0 44,7 12 12 3 0 3 Franţa 86,8 74,8 13 13 2 0 2 Germania 151,2 177,1 14 14 1 0 1 Italia 244,1 256,2 15 15 0 0 0 Total 659,3 689,3 - - 99 6 93

Sursa: Buletin statistic lunar, nr.1/2002, INS, p.20 Se determină apoi, pentru fiecare ţară diferenţa:

Si = Pi - Qi.

Pe total:

∑ ∑ =−=−= 93699ii QPS .

Page 41: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

Coeficientul Kendall este:

886,0)115(15

932)1n(n

S2rK =−⋅

⋅=

−⋅⋅

= ,

unde:

∑=i

iSS .

Valorile celor doi coeficienţi de corelaţie a rangurilor arată o legătură directă foarte puternică între exportul şi importul României în/din ţările Uniunii Europene.

6.5 ÎNTREBĂRI ŞI TESTE-GRILĂ 6.5.1 Întrebări recapitulative

1. Prin ce se caracterizează legăturile statistice? 2. Prin ce se deosebesc legăturile statistice de alte tipuri de

legături? 3. Ce înţelegeţi prin legătură simplă? Exemplificaţi. 4. Ce înţelegeţi prin legătură multiplă? Exemplificaţi. 5. Ce înţelegeţi prin legătură directă? Exemplificaţi. 6. Ce înţelegeţi prin legătură inversă? Exemplificaţi. 7. Ce înţelegeţi prin asociere statistică? Exemplificaţi. 8. Ce înţelegeţi prin corelaţie statistică? Exemplificaţi. 9. Ce metode simple se pot utiliza pentru verificarea existenţei

legăturii? 10. Ce metode simple se pot utiliza în cazul în care dispunem de un

număr mic de perechi de valori pentru care nu este necesară, în prealabil, sistematizarea datelor prin grupare?

11. Ce metode simple se pot utiliza în cazul în care dispunem de un număr mare de perechi de valori pentru care este necesară, în prealabil, sistematizarea datelor prin grupare?

12. Prin ce se reprezintă grafic legătura dintre două variabile statistice?

13. Ce se poate evidenţia cu ajutorul metodei grafice cu privire la legăturile statistice?

Page 42: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

14. Ce este un tabel de corelaţie? 15. Ce condiţii trebuie să îndeplinească un tabel de corelaţie pentru

a permite analiza legăturii între două variabile statistice? 16. Ce este un tabel de asociere? 17. Pentru ce se poate utiliza un tabel de asociere? 18. Pentru ce se utilizează metoda regresiei? 19. Care este semnificaţia statistică a parametrilor modelului liniar

de regresie? 20. Care este semnificaţia geometrică a parametrilor modelului

liniar de regresie? 21. Ce arată semnul coeficientului de regresie? 22. Prin ce se măsoară intensitatea legăturii în cazul legăturii

liniare? 23. Prin ce se măsoară intensitatea legăturii în cazul legăturii

neliniare? 24. Ce semnificaţie are valoarea coeficientului de corelaţie? 25. Între ce limite ia valori coeficientul de corelaţie? 26. Ce semnificaţie are valoarea raportului de corelaţie? 27. Cum se poate verifica ipoteza privind liniaritatea legăturii? 28. Între ce limite ia valori raportul de corelaţie? 29. Ce indicator se poate calcula pe baza raportului de corelaţie? 30. Când se utilizează metodele parametrice pentru analiza

legăturilor dintre variabilele statistice? 31. Când se utilizează metodele neparametrice pentru analiza

legăturilor dintre variabilele statistice? 32. Care sunt cele mai utilizate metode neparametrice pentru

analiza legăturilor dintre variabilele statistice? 33. Când se utilizează coeficientul de asociere propus de Yule? 34. Ce înţelegeţi prin ranguri şi care sunt cei mai utilizaţi indicatori

calculaţi pe baza acestora? 35. Ce relaţie este între coeficienţii de asociere a rangurilor propuşi

de Spearman şi Kendall?

Page 43: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

6.5.2 Teste-grilă

1. După natura relaţiei de cauzalitate, legăturile dintre fenomene

pot fi : a) asociere sau corelaţie ; b) simple sau multiple ; c) funcţionale sau statistice ; d) directe sau inverse.

2. După numărul de caracteristici luate în consideraţie, legăturile

statistice dintre fenomene pot fi : a) directe sau inverse ; b) simple sau multiple ; c) asociere sau corelaţie ; d) liniare sau neliniare.

3. După modul de exprimare a caracteristicilor analizate,

legăturile statistice dintre fenomene pot fi : a) asociere sau corelaţie ; b) liniare sau neliniare ; c) sincrone sau asincrone; d) directe sau inverse.

4. După direcţia de realizare, legăturile statistice dintre fenomene

pot fi : a) simple sau multiple ; b) liniare sau neliniare ; c) funcţionale sau statistice ; d) directe sau inverse.

5. După forma de realizare, legăturile statistice dintre fenomene

pot fi : a) liniare ; b) parabolice ; c) hiperbolice ; d) exponenţiale ; e) oricare din formele anterioare.

Page 44: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

6. După momentul realizării, legăturile statistice pot fi: a) concomitente sau cu decalaj; b) sincrone sau asincrone; c) directe sau inverse; d) asociere sau corelaţie; e) “a” sau “b”.

7. Dependenţa vânzărilor de mărfuri de suprafaţa comercială

reprezintă o legătură : a) simplă ; b) asincronă ; c) indirectă ; d) de corelaţie ; e) directă.

Alegeţi combinaţia corectă: A(a,b,c,d,e); B(a,b,e); C(a,d,e); D(c,d).

8. Creşterea producţiei datorată procesului investiţional reprezintă o legătură : a) simplă ; b) asincronă ; c) indirectă ; d) de corelaţie ; e) directă.

Alegeţi combinaţia corectă: A(a,b,c,d,e); B(a,b,e); C(a,d,e); D(a,b,d,e).

9. Legătura dintre ramura de activitate şi salariul mediu reprezintă

o legătură : a) funcţională şi directă ; b) liniară şi inversă ; c) de asociere şi simplă ; d) de corelaţie şi sincronă.

10. Dependenţa profitului de cifra de afaceri şi cheltuielile de

producţie reprezintă o legătură statistică : a) de asociere ; b) asincronă ; c) inversă ; d) multiplă.

Page 45: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

11. Atunci când unei anumite valori a fenomenului cauză îi corespunde o singură valoare a fenomenului efect, legătura este : a) funcţională; b) stochastică; c) directă; d) sincronă.

12. Atunci când fenomenul efect depinde de mai multe fenomene

cauză, legătura este : a) multiplă ; b) statistică ; c) indirectă ; d) de corelaţie.

13. Atunci când efectul se transformă în cauză prin intermediul

unor relaţii de cauzalitate în lanţ, legăturile sunt : a) reciproce ; b) inverse ; c) de asociere ; d) multiple.

14. Legătura de asociere relevă raportul de cauzalitate dintre :

a) două sau mai multe caracteristici exprimate numeric ; b) o caracteristică exprimată numeric şi o caracteristică

exprimată prin cuvinte ; c) două sau mai multe caracteristici exprimate prin cuvinte ; d) “a” sau “b” ; e) “b” sau “c”.

15. Atunci când modificarea nivelului de dezvoltare a caracteristicii

factoriale determină modificarea în acelaşi sens a nivelului caracteristicii rezultative, legătura este : a) inversă; b) sincronă; c) directă; d) multiplă; e) liniară.

Page 46: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

16. Metodele simple (elementare) de analiză a legăturilor dintre fenomenele economico-sociale permit evidenţierea: a) existenţei sau lipsei legăturii; b) direcţiei de realizare a legăturii; c) formei de realizare a legăturii; d) intensităţii acesteia;

e) a,b,c şi d.

17. Dintre metodele de stabilire a existenţei şi formei de legătură dintre fenomenele economico-sociale nu face parte : a) metoda regresiei; b) metoda grupărilor; c) metoda analizei dispersionale; d) metoda grafică ; e) metoda tabelului de corelaţie.

18. Metoda seriilor paralele interdependente oferă posibilitatea de a

cunoaşte : a) existenţa legăturii; b) direcţia de realizare a legăturii; c) forma aproximativă a legăturii; d) intensitatea legăturii.

Alegeţi combinaţia corectă: A(a); B(a,b); C(a,b,c); D(a,b,c,d); E(b.d).

19. În funcţie de modul de repartizare a frecvenţelor în tabelul de

corelaţie se poate aprecia : a) direcţia legăturii; b) intensitatea legăturii; c) existenţa legăturii; d) forma legăturii. Alegeţi afirmaţia incorectă.

20. Graficul de corelaţie :

a) se mai numeşte şi corelogramă ; b) are aspectul unui nor de puncte ; c) indică existenţa legăturii ; d) arată forma şi direcţia legăturii ;

Page 47: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

e) fiecare valoare a caracteristicii rezultative şi a celei factoriale se reprezintă pe grafic prin câte un punct.

Alegeţi afirmaţia incorectă.

21. Alegerea funcţiei de regresie se face cu ajutorul : a) corelogramei; b) seriilor paralele independente; c) metodei grupării ; d) tabelului de corelaţie.

22. În sens economic, parametrul “b” al funcţiei liniare de regresie arată :

a) cu cât se schimbă în medie variabila dependentă Y atunci când variabila X se modifică cu o unitate ;

b) nivelul mediu al variabilei Y determinat de variabila factorială X ;

c) nivelul mediu al variabilei Y determinat de alţi factori decât variabila X ;

d) gradul de influenţă a variabilei factoriale X şi a factorilor cu acţiune constantă asupra variabilei rezultative Y.

23. Indicatorii sintetici ai corelaţiei :

a) măsoară variaţia caracteristicii dependente ; b) măsoară la nivelul întregii colectivităţi intensitatea

legăturilor de tip statistic dintre două sau mai multe variabile ;

c) se determină cu analiza dispersională ; d) sunt : covarianţa, coeficientul de corelaţie şi raportul de

corelaţie. Alegeţi combinaţia corectă: A(a,b); B(b,c); C(c,d); D(b,d).

24. Covarianţa:

a) se calculează ca medie aritmetică a produselor abaterilor variabilelor faţă de medie;

b) este nulă dacă variabilele sunt independente; c) nu are limită superioară; d) creşte odată cu intensitatea corelaţiei; e) scade odată cu intensitatea corelaţiei. Alegeţi afirmaţia incorectă.

Page 48: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

25. Coeficientul de corelaţie : a) este un indicator sintetic al intensităţii legăturii dintre două

variabile ; b) se calculează ca o medie a produselor abaterilor normale

normate ; c) ia valori în intervalul [-1,1] ; d) este egal cu raportul de corelaţie în cazul legăturilor liniare ; e) este semnificativ în cazul legăturilor neliniare. Alegeţi afirmaţia incorectă.

26. Legătura dintre două variabile este foarte slabă sau inexistentă

dacă valoarea coeficientului de corelaţie se situează în intervalul: a) [0-0,2); b) [0,2-0,5); c) (-0,2-0); d) (0,75-1). Alegeţi combinaţia corectă: A(a); B(a,b); C(d); D(a,c).

27. Atunci când coeficientul de corelaţie ia valoarea 1:

a) legătura este de tip funcţional; b) variabilele sunt independente; c) corelaţia este puternică; d) legătura este liniară.

28. Coeficientul de corelaţie calculat pentru o legătură liniară

inversă poate lua valori în mulţimea: a) (-1; 0); b) (0; 1); c) mulţimea numerelor întregi pozitive; d) mulţimea numerelor reale pozitive.

29. Coeficientul şi raportul de corelaţie au valori egale atunci când:

a) legătura dintre variabile este liniară; b) legătura dintre variabile este directă; c) legătura dintre variabile este inversă; d) colectivitatea este omogenă .

Page 49: Seriile Independente - Tipuri de Legaturi Statistice

Seriile interdependente

30. Intervalul de variaţie a raportului de corelaţie este: a) (0; 1); b) (0; 1]; c) [0; 1]; d) [-1; 1]; e) (-1; 1).

31. Raportul de corelaţie:

a) este un indicator sintetic al intensităţii legăturilor dintre variabilele statistice;

b) se calculează ca rădăcină pătrată din coeficientul de determinaţie;

c) are valori între 0 şi 1; d) are valori între -1 şi 1; e) măsoară intensitatea legăturii indiferent de forma acesteia; Alegeţi combinaţia corectă: A(a,b); B(a,b,c,e); C(a,b,d); D(a,c,e).

32. Determinaţi ecuaţia dreptei de regresie având coeficientul

unghiular –9 şi ordonata la origine 16. a) Y= -9 +16x; b) Y= 16 - 9x; c) Y= 9 +16x; d) nu se poate determina.

33. Legătura dintre vechime şi productivitatea muncii

(buc./muncitor) este exprimată prin ecuaţia de regresie: Y=20+0,2x . Productivitatea unui muncitor cu vechime de 10 ani va fi: a) 22; b) 20,2; c) 24; d) nu se poate calcula.

34. Într-o unitate economică a fost analizată legătura dintre

cheltuielile de producţie şi profit obţinându-se un coeficient de corelaţie de –0,9. Profitul depinde de cheltuielile de producţie în proporţie de: a) 81%;

Page 50: Seriile Independente - Tipuri de Legaturi Statistice

STATISTICA

b) 9%; c) 90%; d) 0,81%.

35. Se cunosc următoarele date privind producţia şi costurile unitare

înregistrate într-o unitate economică: Producţie (buc.) 2 3 4 5 6 7 8 9 10 Cost unitar (mii lei/buc.) 32 30 27 23 22 25 29 30 31

Legătura dintre variabile este exprimată printr-o: a) funcţie liniară; b) exponenţială; c) parabolă; d) hiperbolă; e) nu se poate preciza.

36. În cazul legăturilor liniare inverse, mulţimea valorilor raportului

de corelaţie este: a) (-1,1); b) (0,1]; c) (-1,0); d) mulţimea numerelor reale.

37. Intensitatea legăturii dintre două variabile a fost măsurată prin

intermediul coeficientului şi raportului de corelaţie, obţinându-se în ambele cazuri valoarea 0,9. Legătura nu este: a) directă; b) foarte puternică, c) liniară; d) curbilinie.

38. Legătura dintre două variabile se exprimă printr-o funcţie

exponenţială. Intensitatea legăturii dintre cele două variabile se va măsura cu: a) coeficientul de corelaţie; b) raportul de corelaţie; c) coeficientul de regresie; d) coeficientul de variaţie.

Soluţii: 1.c; 2.b; 3.a; 4.d; 5.e; 6.e; 7.C; 8.D; 9.c; 10.d; 11.a; 12.b; 13.a;

14.e; 15.c; 16.e; 17.a; 18.B; 19.d; 20.e; 21.a; 22.a; 23.D; 24.e; 25.e; 26.D; 27.a; 28.a; 29.a; 30.c; 31.B; 32.b; 33.a; 34.a; 35.c; 36.b; 37.d; 38.b.