proiect analiza datelor

44

Upload: dan-loredana

Post on 01-Jul-2015

2.042 views

Category:

Documents


9 download

TRANSCRIPT

Page 1: Proiect Analiza Datelor

CUPRINS

Page 2: Proiect Analiza Datelor

1. Prezentarea datelor .............................................................................. pag. 3

2. Analiza componentelor principale(PCA).............................................. pag. 5

3. Analiza Cluster......................................................................................pag. 17

4. Bibliografie........................................................................................... pag. 32

5. Anexe................................................................................................................

1. PREZENTAREA DATELOR

În vederea realizării prezentului proiect, ceea ce implică utilizarea pachetului de programe

SPSS pentru analiza componentelor principale şi respectiv, pentru tehnicile de clasificare ierarhică, a

fost consultat pentru început site-ul Bursei de Valorii Bucureşti – Piaţa RASDAQ (

2

Page 3: Proiect Analiza Datelor

http://www.rasd.ro/ ), de unde s-a extras un număr de 25 de firme din industria mobilei (mai exact

acele firme cu codul CAEN: 3614 – Producţia altor tipuri de mobilier) tranzacţionabile pe piaţa

RASDAQ, pentru care au fost selectaţi 6 indicatori din situaţiile finanicar-contabile disponibile

pentru anul 2004.

Astfel pentru colectarea şi prezentarea datelor sub forma unui tabel s-a procedat astfel:

1. http://www.rasd.ro/ - apoi din meniul din stânga se alege Societăţi listate → Alte informaţi →

Căutare după CAEN, după care se alege Diviziunea: D → Produse ale industrie

prelucrătoare; Secţiunea: 36 → Producţia de mobilier şi alte activităţi industriale n.c.a;

Grupa: 361 → Producţia de mobilier; Clasa: 3614 → Producţia altor tipuri de mobilier; şi

apoi se face o sortare după Stare, alegându-se acele firme tranzacţionabile.

2. Pentru fiecare firmă despre care se doreşte să se afle informaţii financiar-contabile, se dă click

pe Simbolul acesteia, după care de la Infornaţii Financiare găsim rubrica Raportări

financiare şi se va selecta de aici indictori necesari efectuării analizei.

3

Page 4: Proiect Analiza Datelor

3. După care am sintetizat informaţii despre cele 25 de firme şi cei 6 indicatori financiar contabili

pentru anul 2004, în tabelul următor:

COD FIRMA FIRMA CA VT VE SAL AI AC

F1 DUMBRAVA SA 58.312.488 72.199.284 71.566.665 248 21.535.270 23.784.070F2 ELBAC SA 79.162.740 84.717.047 84.212.115 285 29.701.136 55.110.734F3 FAMOS SA 269.885.450 320.770.370 313.997.410 877 176.282.750 141.875.000F4 FURNIMOB SA 128.782.128 161.486.636 160.572.357 617 151.004.326 58.223.122F5 ILEFOR SA 357.688.665 81.979.274 75.882.886 957 120.846.077 61.810.167F6 IMIX SA 13.246.037 15.430.348 15.426.285 99 12.052.101 10.574.774F7 LEMEXIM SA 80.739.726 91.212.647 91.042.793 199 106.639.771 74.465.603F8 MONTANA SA 75.908.148 37.805.115 35.397.300 976 79.511.674 72.052.043F9 METAL LEMN SA 27.217.212 29.128.153 29.047.118 92 141.185.825 35.592.719F10 MOBAR SA 105.589.580 144.563.816 95.778.244 320 50.215.580 22.071.103F11 MOBIRIS SA 11.651.860 12.164.583 12.164.201 78 2.466.680 9.288.467F12 MOBAM SA 111.713.332 114.462.957 113.125.008 420 38.962.541 28.315.612F13 MOBEX SA 447.760.027 47.327.379 42.224.764 1.589 51.012.348 87.027.345F14 MOBILEXTRA SA 85.156.605 96.051.747 93.964.875 288 25.654.364 35.422.208F15 MOBIHAR SA 27.041.921 28.043.279 27.458.501 201 46.891.781 15.909.282F16 MOBILA RAD SA 232.093.689 242.893.925 240.621.074 829 120.856.727 55.566.517F17 MOBICRASNA 49.883.950 151.806.712 149.453.359 576 64.669.410 55.603.630F18 MOBILA BAR SA 12.152.219 12.289.098 12.259.346 50 9.842.304 6.802.885F19 MOBICOR SA 12.027.015 13.527.336 13.416.760 77 9.352.794 8.601.526F20 MOV SA 11.816.749 13.023.448 13.022.283 73 2.877.415 5.739.967F21 SAMUS MEX SA 47.192.074 578.135.083 558.145.820 1.153 145.898.544 190.442.209F22 SIMEX SA 179.126.464 202.360.664 190.652.347 511 121.000.175 74.829.736F23 SAMOBIL SA 25.753.221 247.300.426 245.889.761 536 112.637.360 124.580.813F24 SPECIAL SA 49.729.126 90.347.515 89.155.975 174 23.312.131 30.916.700F25 VICTORIAMOB SA 73.592.612 76.343.446 74.797.166 197 139.024.541 113.994.269

Unde cei 6 indicatori financiar-contabili sunt:

4

TABELUL NR. 1

Page 5: Proiect Analiza Datelor

a) CA – Cifra de afaceri (exprimată în milioane lei) reprezintă volumul tuturor încasărilor de pe

urma rezultatelor obţinute în activitatea de exploatare a întreprinderii şi este unul dintre cei

mai reprezentativi indicatori ai volumului de activitate al unei întreprinderi.

b) VT – Veniturile totale(exprimate în milioane lei) reprezintă totalitate avantajelor obţinute de

către întreprindere din desfăşurarea celor 3 activităţii: de exploatare, financiară, şi

excepţională.

c) VE – Veniturile din activitatea de exploatare(exprimate în milioane lei) reprezintă acele

avantaje dobândite de către întreprinderi numai pe seamă desfăşurării activităţii de exploatere.

d) SAL – Numărul mediu anual de salariaţi (exprimat în număr salariaţi/anual)

e) AI – Activele imobilizate (exprimate în milioane lei) reprezintă bunuri şi valori destinate a

servi o perioadă îndelungată în activitatea unităţilor patrimoniale (de regulă mai mare de un

an), deci care nu se consumă la prima lor utilizare, valoarea lor recuperându-se treptat prin

includerea în cheltuielile mai multor exerciţii financiare în funcţie de durata de folosire.

f) AC – Activele circulante (exprimate în milioane lei) reprezintă aceea parte din capitalul tehnic

care se consumă în fiecare ciclul de exploatare (de producţie), participând cu întrega lui

expresie banească la formarea costurilor şi se înlocuieşte după fiecare consumare, o dată cu

reluarea unui nou ciclu de exploatare.

După ce au fost trecute în revistă toate aceste lucruri, vom trece la analiza matricei de date

prezentată în tabelul de mai sus, cu scopul de a identifica câţiva „indicatori relevanţi” (de regulă doi

sau trei), pe baza cărora să putem obţine o clasificare cât mai precisă a firmelor; astfel problema

formulată în acest mod ne conduce spre ideea utilizării tehnicii analizei componentelor principale,

dublată şi de o analiză a clasificării.

2. ANALIZA COMPONEMTELOR PRINCIPALE (PCA)

Scopul acestei analize fiind ca pentru matricea noastră de date să identifice noi variabile ce să

exprime sintetic vechile variabile astfel încât cantitatea totală de informaţie să nu se piardă decât în

mod contralat.

Astfel, după încarcarea matricei de date în SPSS, vom începe analiza prin a remarca faptul că

toate caracteristicile urmărite, anume indicatorii financiar contabili sunt variabile continue, scara lor

de măsură fiind uşor de identificat. Prin urmare pentru fiecare variabilă în parte, pentru început, vom

calcula indicatorii de centrare şi de împrăştiere cum ar fi media, valoarea minimă, valoarea maximă,

precum şi abaterea standard.

5

Page 6: Proiect Analiza Datelor

Pentru aceasta în SPSS, alegem Analyse → Descriptive Statistics → Descriptives..., după care

alegem toţii indicatorii, iar la Options... bifăm căsuţa pentru Mean, Std. Deviation, Minimum,

Maximum şi apoi dăm Continue şi apoi OK.

Şi astfel obţinem următorul tabel:

TABELUL NR. 2Descriptive Statistics

N Minimum Maximum Mean Std. DeviationCA 25 11.651.860 447.760.027 102.928.921,52 113.148.029,688VT 25 12.164.583 578.135.083 118.614.811,52 126.896.630,117VE 25 12.164.201 558.145.820 113.970.976,52 123.210.246,893

SAL 25 50 1.589 456,88 403,794AI 25 2.466.680 176.282.750 72.137.345,00 55.706.649,327AC 25 5.739.967 190.442.209 55.944.020,04 46.967.102,150

6

Page 7: Proiect Analiza Datelor

După cum putem observa elementele matricei de date iniţiale ar necesita şi o standardizare,

deoarece abaterile standar ale celor 6 indicatori sunt destul de diferite, fapt pentru care am bifat în

căsuţa de dialog Descriptives → Save standardized values as variables, şi astfel la matricea de date

iniţiale se vor adăuga şi cei 6 indicatori standardizaţi (adică de medie 0 şi dispersie 1), prezentaţi în

următorul tabel:

TABELUL NR. 3

COD FIRMA FIRMA ZCA ZVT ZVE ZSAL ZAI ZAC

F1 DUMBRAVA SA -0,39432 -0,36577 -0,34416 -0,51729 -0,90837 -0,68473F2 ELBAC SA -0,21005 -0,26713 -0,24153 -0,42566 -0,76178 -0,01774F3 FAMOS SA 1,47556 1,59307 1,62346 1,04043 1,86953 1,82960F4 FURNIMOB SA 0,22849 0,33785 0,37823 0,39654 1,41576 0,04853F5 ILEFOR SA 2,25156 -0,28870 -0,30913 1,23855 0,87438 0,12490F6 IMIX SA -0,79262 -0,81314 -0,79981 -0,88629 -1,07860 -0,96598F7 LEMEXIM SA -0,19611 -0,21594 -0,18609 -0,63864 0,61936 0,39435F8 MONTANA SA -0,23881 -0,63682 -0,63772 1,28561 0,13238 0,34296F9 METAL LEMN SA -0,66914 -0,70519 -0,68926 -0,90363 1,23950 -0,43331F10 MOBAR SA 0,02351 0,20449 -0,14766 -0,33898 -0,39352 -0,72121F11 MOBIRIS SA -0,80670 -0,83887 -0,82628 -0,93830 -1,25067 -0,99337F12 MOBAM SA 0,07764 -0,03272 -0,00687 -0,09133 -0,59553 -0,58825F13 MOBEX SA 3,04761 -0,56178 -0,58231 2,80371 -0,37922 0,66181F14 MOBILEXTRA SA -0,15707 -0,17781 -0,16237 -0,41823 -0,83442 -0,43694F15 MOBIHAR SA -0,67069 -0,71374 -0,70215 -0,63369 -0,45319 -0,85240F16 MOBILA RAD SA 1,14156 0,97937 1,02792 0,92156 0,87457 -0,00804F17 MOBICRASNA -0,46881 0,26157 0,28798 0,29500 -0,13406 -0,00725F18 MOBILA BAR SA -0,80228 -0,83789 -0,82551 -1,00764 -1,11827 -1,04629F19 MOBICOR SA -0,80339 -0,82813 -0,81612 -0,94078 -1,12706 -1,00799F20 MOV SA -0,80525 -0,83211 -0,81932 -0,95068 -1,24330 -1,06892F21 SAMUS MEX SA -0,49260 3,62122 3,60502 1,72395 1,32410 2,86367F22 SIMEX SA 0,67343 0,65995 0,62236 0,13403 0,87715 0,40211F23 SAMOBIL SA -0,68208 1,01410 1,07068 0,19594 0,72702 1,46138F24 SPECIAL SA -0,47018 -0,22276 -0,20140 -0,70056 -0,87647 -0,53287F25 VICTORIAMOB SA -0,25927 -0,33312 -0,31794 -0,64360 1,20070 1,23598

După ce am standardizat datele, prin acesta supunând faptul că ne-am detaşat de scara de

măsurare a variabilelor, matricea coeficienţilor de corelaţii va fi echivalentă cu matricea de covarianţă

şi astfel vom începe analiza compomentelor principale utilizând matricea de date strandardizate,

astfel:

Pas 1 – avem matricea de date standardizate în SPSS

Pas 2 – apelăm Analyse → Data Reduction → Factor...

7

Page 8: Proiect Analiza Datelor

Pas 3 – Alegem variabilele după care să se facă analiza şi anume acele variabile standardizate cele

care încep cu litera Z, după care în parte de jos a căsuţei de dialog avem mai multe opţiuni ca:

Descriptives, Extraction, Rotation, Scores, Options; care vor fi prezentate în următoarele print screen-

uri:

După parcurgerea tuturor opţiunilor din parte de jos se va da OK şi se vor obţine datele prezenta în Anexa Nr.1,

ceea ce conţine listingul din SPSS cu privirea la analiza componentelor proncipale.

1.) În această căsuţa de dialog vom alege să ne

prezinte informaţii legate de o variabilă (medie,

dispersie etc) precum si afisarea coeficientilor

matricei de corelaţie, după care dăm Continue.

8

Page 9: Proiect Analiza Datelor

2.)

Aici vom alege metoda componentelor

principale, care va fi aplicată pe matricea

corelaţiilor, dar la fel de bine puteam să folosim

şi matricea de covariaţă întrucât datele sunt

standardizate, după câţi factori dorim să facem

analiza (2) şi să ne afişeze graficul ataşat

valorilor proprii (Sree plot), după care

Continue.

3.)

Aici alege tehnica de rotire Varimax, apoi

Continue.

4.) Aici alegem ca scorurile firmelor pe fiecare

dintre cele două axe analizate să fie salvate ca

variabile în tabelul SPSS imediat după

variabilele standardizate, şi totodată selectând şi

a doua opţiune vom obţine versorii axelor „u”,

apoi Continue.

9

Page 10: Proiect Analiza Datelor

După parcurgerea paşilor de mai sus, vom trece la interpretarea rezultatelor obţinute. Astfel

primul tabel din Anexa Nr.1, ne oferă informaţii cu privire la media şi abatarea standard a fiecărui

indicator şi având în vedere faptul că media este 0 iar dispersia este 1, confirmă faptul că datele sunt

standardizate, după cum puteţi observa în următorul tabel:

TABELUL NR. 4

Descriptive Statistics

Mean

Std. Deviation

Analysis N

CA 0 1 25VT 0 1 25VE 0 1 25

SAL 0 1 25AI 0 1 25AC 0 1 25

Apoi pentru a vedea dacă indicatori calculaţii sunt independenţi sau nu vom analiza matricea

coeficienţilor de corelaţie din tabelul următor:

TABELUL NR. 5Correlation Matrix

CA VT VE SAL AI ACCA 1 0,164 0,156 0,769 0,378 0,327VT 0,164 1 0,997 0,516 0,618 0,807VE 0,156 0,997 1 0,514 0,625 0,816SAL 0,769 0,516 0,514 1 0,477 0,648AI 0,378 0,618 0,625 0,477 1 0,758AC 0,327 0,807 0,816 0,648 0,758 1

La o primă vedere, putem afirma faptul că în matricea coeficienţilor de corelaţie, există numai

corelaţii în sens prozitiv, cele în sens negativ lipsind cu desăvârşire. Astfel identificăm în matricea de

mai sus, un coeficient foarte mare de corelaţie apropriat de valoarea 1, şi anume între indicatorul VT

(Venit Total) şi indicatorul VE (Venit din Exploatare) având o valoare de 0,997, existând posibilitatea

de a se renunţa la unul dintre având în vederea şi domeniul contabil conform căruia VE intră în

10

Page 11: Proiect Analiza Datelor

alcătuirea VT. Totodată se mai identifică coeficienţi de corelaţie destul de mari între indicatorul CA şi

indicatorul SAL, indicatorul VT şi indicatorul AC, indicatorul VE şi indicatorul AC, precum şi între

indicatorul AI şi indicatorul AC. Ca urmare a acestor constatării am putea totuţi să eliminăm unii

indicatori, dar problema este pe care să-i eliminăm; pentru a elimina subiectivismul decizie, vom

folosi tehnicile de analiză a componentelor principale implementate în SPSS, şi ne propunem să

identificăm doi indicatori sintetici cu care ne-am mulţumi în atingerea scopului propus.

Mai departe vom trece la analiza calităţii norului de puncte (în cazul nostru a firmelor)

urmărind informaţiile din tabelul următor:

TABELUL NR. 6Total Variance Explained

Component

Eigenvalues

Eigenvalue% of

VarianceCumulative

%1 3,944 65,733 65,7332 1,273 21,220 86,9533 0,482 8,033 94,9864 0,201 3,355 98,3415 0,097 1,614 99,9556 0,003 ,045 100,000

Extraction Method: Principal Component Analysis.

Acest tabel ne prezintă în coloana „Eigenvalue” , toate valorile proprii asociate spectrului

matricei, în ordine descrescătoare, şi anume: =3,944 , =1,273 etc. Dar cum pe noi ne interesează

explicitarea norului de puncte prin două axe şi cum rangul matricei coeficienţilor de corelaţie este 6,

atunci putem să explicăm uşor conţinutul coloanei „% of Varinace”, astfel: ajustând norul de puncte

printr-o axă factorială (adică acceptând doar un singur indicator sintetic) se explică 65,733% din

totalul variaţiei datelor; apoi ajustând norul de puncte prin două axe factoriale (adică acceptând doi

indicatori sintetici), recuperăm încă 21,220% din variaţia totală, adică un total de 86,953% din această

varianţă, ceea ce reprezintă un rezultat foate bun pentru analiza noastră. Iar dacă am fi solicitat trei

axe factoriale am fi explicitat aproximativ 95% din varianţa totală, dar în această analiză ne-am

propus doar ajustarea norului de puncte doar prin 2 axe factoriale.

Odată cu tabelul de mai sus, SPSS-ul asociază un grafic al nivelurilor valorilor proprii,

denumit Scree Plot-ul şi prezent în cele ce urmează:

11

Page 12: Proiect Analiza Datelor

654321

Component Number

4

3

2

1

0

Eig

enva

lue

Figura 1. Scree Plot

În continuarea analizăm informaţiile despre axele principale care sunt prezente în următorul

tabel:

TABELUL NR. 7Component Score Coefficient Matrix

Factor Score Coefficients

Factor 1 Factor 2CA -0,202 0,632VT 0,341 -0,152VE 0,344 -0,157

SAL -0,026 0,456AI 0,191 0,075AC 0,254 0,024

Acest tabel de mai sus, de fapt este matricea ce ne dă versorii axelor, iar coloana unui factor ne oferă

infornaţii despre ponderile (coeficienţii) cu care participă fiecare indicator financiar-contabil (CA,

VT, VE, SAL, AI, AC) la descrierea factorului respectiv. Acest factor putând fi exprimat, prin

urmare, ca o combinaţie liniară de indicatori financiari-contabili, avându-se în vedere coeficienţii cu

care participă fiecare indicator în parte.

12

Page 13: Proiect Analiza Datelor

Apoi vom avea în vedere informaţiile despre scorurile firmelor, care sunt proiecţiile acestor

firme (considerate ca puncte în spaţiul indivizilor) pe cele două axe principale, ele fiind salvate în

matricea de date iniţială, imediat după valorile indicatorilor standardizaţi, fiind prezentate în

următorul tabel:

TABELUL NR. 8

Factor ScoresRotation: VarimaxCODFIRMA Factor1 Factor2

F1 -0,498 -0,460 F2 -0,271 -0,306 F3 1,600 1,095 F4 0,472 0,322 F5 -0,492 2,149 F6 -0,821 -0,761 F7 0,138 -0,297 F8 -0,310 0,651 F9 -0,192 -0,537

F10 -0,236 -0,195 F11 -0,875 -0,799 F12 -0,290 -0,045 F13 -0,984 3,370 F14 -0,345 -0,311 F15 -0,637 -0,549 F16 0,599 0,897 F17 0,247 -0,257 F18 -0,862 -0,819 F19 -0,849 -0,792 F20 -0,888 -0,807 F21 3,511 -0,472 F22 0,570 0,364 F23 1,357 -0,574 F24 -0,335 -0,630 F25 0,391 -0,237

Astfel cel două coloane (Factor1 şi Factor2) conţin componentele principale sau noii indicatori

sintetici calculaţii pentru cele 25 de firme. Aşadar apelăm Graphs → Scatter/Dot... (1.) → Alegem

„Simple Scatter” (2.)

1.) 2.)

(3.)

13

Page 14: Proiect Analiza Datelor

După care (3.) alegem cordonatele axelor X – factorul 1 şi Y – factorul 2, iar la Label Case by

– alegem CodFirma, şi pentru a ne afişa codurile firmelor pe grafic din Options... bifăm căsuţa

corespunzătoare „Display chart with case labels” , apoi Continue şi în final OK şi vom obţine

următorul grafic:

14

Page 15: Proiect Analiza Datelor

4,00003,00002,00001,00000,0000-1,0000-2,0000-3,0000-4,0000

Figura 2. Scorurile firmelor în planul axelor principale 1 şi 2

4,00000

3,00000

2,00000

1,00000

0,00000

-1,00000

-2,00000

-3,00000

-4,00000

F25

F24

F23

F22

F21

F20

F19F18

F17

F16

F14

F13

F12

F9

F8

F5

F4

F3

În acest grafic putem observa un grup destul de compact ce par a avea un comportament

asemănător în raport cu noii indicatori, dar şi trei firme, anume F5, F13, F21, care se detaşează de

grup.

Şi în finalul analizei componentelor principale vom analiza informaţiile privind interpretarea

componentelor principale care se obţin analizând coeficienţii de corelaţii calculaţi între cele trei

componente principale şi indicatori financiar-contabili, acest lucru se face analizând „Component

Matrix” – fiind matricea corelaţiilor Person între variabile iniţiale ale modelului şi noile variabile

formate, şi „Rotated Component Matrix” – folosită pentru a obţine o interpretare mai clară şi corectă,

prin selectarea opţiuni de Rotation astfel încât să se realizeze corelaţii mari cu una din componente şi

mici cu celelalte componente rămase.

Întorcându-ne la aplicaţia noastra, se obţin aşa-numiţii „Factor Loadings” din explicitarea

tabelului SPSS – „Component Matrix” la care se adaugă şi valorile proprii şi ponderile lor cu privire

la cantitatea de informaţie recuperată, obţinându-se următorul tabel:

TABELUL NR. 9

Component Matrix

15

2

4

1

3

Page 16: Proiect Analiza Datelor

Factor Loadings (Unrotated)

Factor 1 Factor 2CA 0,506 0,829

VT 0,888 -0,379

VE 0,890 -0,386

SAL 0,777 0,525

AI 0,804 -0,034

AC 0,925 -0,129

Expl. Var 3,94 1,27

Prp. Totl 0,65 0,21

Aşadar, componenta principală 1 este puternic corelată (pozitiv) cu indicatorul financiar-

contabil AC (Active Circulante), dar totodată este „slab corelată cu cealaltă componentă principală,

fapt pentru care putem afirma că indicatorul AC poate fi considerat un indicator sinteză pentru

aplicaţia noastră. Dar în ciuda acestui fapt a doua componentă principală este mai greu de interpretat,

ea având un coeficient de corelaţie relativ mare (pozitiv) cu indicatorul CA (Cifra de afaceri), dar nu

înregistrează un coeficient de corelaţie mic cu cealaltă componentă principală.

Fapt pentru apelăm la folosirea unei opţiuni de „rotire a axelor”, cu scopul de a obţine

coeficienţi de corelaţie cât mai mici pe cealaltă componentă principală şi pentru o analiză mai

relevantă şi o interpretare mai apropriată de realitate. Astfel apelăm la una dintre cele mai utilizate

tehnici de rotire a axelor, şi anume, tehnica Varimax – în acest fel interpretarea componentelor

principale devine mai semnificativă.

Iar pentru aplicaţia noastră, apleând la opţiunea de rotire a axelor (Varimax), obţinem

informaţiile din tabelul „Factor Loadings” următor:

TABELUL NR. 10

Rotated Component Matrix

Factor Loadings (Rotated)

Factor 1 Factor 2CA 0,043 0,970

VT 0,961 0,096

VE 0,966 0,091

SAL 0,428 0,835

AI 0,721 0,358

AC 0,872 0,333

Expl. Var 3,32 1,89

Prp. Totl 0,55 0,31

Şi odată cu întocmirea de către SPSS a tabelului de mai sus, SPSS mai asociază şi o

reprezentare grafică a celor şase indicatori financiari-contabili în spaţiul rezultat ca urmare a rotirii

axelor, astfel:

16

Page 17: Proiect Analiza Datelor

1,00,50,0-0,5-1,0

Factor 1

1,0

0,5

0,0

-0,5

-1,0

Fac

tor 2

ZACZAI

ZSAL

ZVE

ZVT

ZCA

Figura 3. Component Plot in Rotated Space

Astfel de data aceasta se observă că am obţinut coeficienţi de corelaţie mari pentru câte o

componentă şi mici pentru cealaltă componentă principală. Acum componenta principală 1 poate fi

interpretată în termenii indicatorul VT sau eventual VE (corelaţie pozitivă), dar cum matricea

corelaţiilor ne arată că aceştia sunt puternic corelaţi între ei, coeficientul de corelaţie alor având

valoarea de 0,997, putem aşa bine să renunţăm la unul dintre ei, astfel renunţam la indicatorul VE

deoarece el intră şi în alcătuirea indicatorului VT.

Componenta principală 2 este cum a fost interpretată şi mai devreme, tot în termenii

indicatorului CA (corelaţie pozitivă), adică este un indicator sintetic reprezentând volumul tuturor

încasărilor de pe urma rezultatelor obţinute în activitatea de exploatare a întreprinderii şi este unul

dintre cei mai reprezentativi indicatori ai volumului de activitate al unei întreprinderi.

În final după ce am dat o interpretare a acestor 2 componente principale,putem să obţinem o

clasificare a firmelor, utilizând proiecţiile în planul axelor principale, şi astfel ne folosim de scorurile

acestor firme şi graficul din figura 2, dar mai înanite de acestea remarcăm faptul că cele două

componente principale au scorul cu atât mai bun cu cât acesta este mai mare, lucru datorat corelaţie

pozitive prezente. Prin urmare, cele 25 de firme în planul indicatorilor CA şi VT se clasifică astfel:

Clasa 1. Conţine firmele F3, F4, F16, F22 care au scoruri bune pe ambele componente;

17

Page 18: Proiect Analiza Datelor

Clasa 2. Conţine firmele F5, F8, F13 care au scoruri bune la indicatorul Cifra de afaceri dar

au o situaţie mai proastă la indicatorul Venit total;

Clasa 3. Conţine firmele F9, F17, F21, F23, F25 care au scoruri mai slabe la indictorul Cifra

de afaceri dar o situaţie mai bună la indicatorul Venit total;

Clasa 4. Conţine firmele F1, F2, F6, F7, F10, F11, F12, F14, F15, F18, F19, F20, F24 care au

scoruri slabe la ambii indicatori de sinteză, atât la Venit total cât şi la Cirfa de afaceri.

3. ANALIZA CLUSTER

În continuare, tot pentru aceiaşi matrice a datelor standardizate vom aplica tehnici de

clasificare bazate pe algoritmi ierarhici pentru a putea exemplifica atât gruparea firmelor cât şi

gruparea indicatorilor.

În vederea aplicării tehnicii de clasificare în SPSS vom parcurge următorii paşii:

Pas 1 – avem matricea de date standardizate în SPSS

Pas 2 – apelăm Analyse → Classify → Hierarchical Cluster...

Pas 3 – Alegem variabilele după care să se facă analiza şi anume acele variabile standardizate cele

care încep cu litera Z, după care în parte de jos a căsuţei de dialog avem mai multe opţiuni ca:

Statistics, Plots, Merhod, Save; care vor fi prezentate în următoarele print screen-uri:

18

Page 19: Proiect Analiza Datelor

După parcurgerea tuturor opţiunilor din parte de jos se va da OK şi se vor obţine datele prezenta în Anexa Nr.2,

ceea ce conţine listingul din SPSS cu privirea la analiza cluster. Dar tot în această fereastră, avem de ales la

câmpul „Cluster” între „Cases” (ceea ce ne va permite aplicarea tehnicilor de clasificare pentru gruparea

firmelor în clase cât mai omogene, luând în considerare toţi cei 6 indicatori) şi „Variables” (ceea ce ne va

permite aplicarea tehnicilor de clasificare pentru gruparea celor 6 indicatori în clase cât mai omogene)

1.)

În această căsuţă de dialog vom alege să ne afişeze

în outputul SPSS modul în care se agregrează

firmele (variabilele) pas cu pas şi matricea de

proximitate de dimensiune 25 x 25 (pentru firme) şi

6 x 6 (pentru indicatori) şi simetrică; după care dăm

Continue.

2.)

În această căsuţă de dialog vom alege să ne afişeze

în outputul SPSS, reprezentarea grafică a nivelului

de agregare al firmelor (variabilelor) prin

intermediul dendogramei, aici bifându-se căsuţa

aferentă „Dendogram”; după care dăm Continue.

3.) În această căsuţă de dialog vom alege metoda după

19

Page 20: Proiect Analiza Datelor

care să se facă gruparea firmelor şi anume: Nearest

neighbor (vecinii cei mai apropriaţi), Furthest

neighbor ( vecinii cei mai îndepărtaţi ), sau

Between-groups sau Within-groups linkage

(înlănţuirea prin medii ) – deci vom avea 3 aplicaţii

câte una pentru fiecare metodă. Tot aici alegem şi

modul de calcul a distanţei dintre două obiecte

(clase), şi anume distanţa euclidiană. Şi tot aici dacă

datele nu erau standardizate am fi putut alege să fie

standardizate la „Transform Values”, după care dăm

Continue.

4.)

În această ultimă căsuţă de dialog putem alege

salvarea clusterelor obţinute în urma analizei ca

variabile în matricea de date iniţiale din SPSS, dar

nu dorim acest lucru şi lăsăm opţiunea „None”

activată, şi dăm apoi Continue.

După ce am trecut în revistă principalii paşi de urmat în SPSS pentru analiza cluster, vom

trece pentru început la gruparea firmelor în clase cât mai omogene, luând în considerare toţi cei 6

indicatori, şi folosind cei trei algoritmi învaţaţi şi anume: vecinii cei mai apropriaţi, vecinii cei mai

depărtaţii şi agregarea prin medii. Dar mai întâi de toate va fi calculată matricea de proximitatea (de

dimensiune 25 x 25, simetrică), în care care fiecare element al ei este reprezentat de distanţa

euclidiană între firmele corespunzătoare, distanţă calculată în funcţie de toţi cei 6 indicatori observaţi

(folosind distanţa euclidiană ca măsură a disimilarităţii). Această matrice fiind prezentată în următorul

tabel:

20

Page 21: Proiect Analiza Datelor

TABELUL NR. 11

Proximity Matrix

0,00 0,73 5,26 2,86 3,73 0,90 1,90 2,36 2,27 0,91 1,01 0,86 5,01 0,45 0,76 3,43 1,59 1,02 0,97 1,03 7,36 2,81 3,43 0,32 2,86

0,73 0,00 4,72 2,52 3,40 1,47 1,46 2,04 2,24 0,96 1,57 0,81 4,67 0,45 1,21 3,08 1,24 1,59 1,54 1,62 6,88 2,36 2,89 0,65 2,34

5,26 4,72 0,00 2,91 3,44 6,08 3,97 4,28 4,95 4,55 6,22 4,52 4,64 4,85 5,54 2,29 3,91 6,20 6,16 6,25 3,71 2,52 2,73 5,15 3,76

2,86 2,52 2,91 0,00 2,44 3,56 1,62 2,17 2,23 2,18 3,73 2,24 4,37 2,58 2,91 1,50 1,71 3,67 3,64 3,74 5,60 0,92 2,07 2,82 1,93

3,73 3,40 3,44 2,44 0,00 4,39 3,11 2,65 3,73 3,17 4,52 3,05 2,26 3,44 3,89 2,18 3,16 4,50 4,46 4,54 6,79 2,36 3,89 3,83 3,35

0,90 1,47 6,08 3,56 4,39 0,00 2,43 2,87 2,39 1,72 0,19 1,73 5,62 1,33 0,71 4,28 2,38 0,16 0,09 0,21 8,15 3,62 4,14 1,04 3,29

1,90 1,46 3,97 1,62 3,11 2,43 0,00 2,08 1,36 1,61 2,59 1,70 4,87 1,69 1,86 2,71 1,46 2,53 2,50 2,62 6,43 1,69 2,27 1,78 1,04

2,36 2,04 4,28 2,17 2,65 2,87 2,08 0,00 2,61 2,25 3,01 2,04 3,67 2,21 2,38 2,85 1,70 3,02 2,96 3,05 6,65 2,45 2,94 2,48 2,42

2,27 2,24 4,95 2,23 3,73 2,39 1,36 2,61 0,00 2,16 2,56 2,35 5,60 2,31 1,76 3,57 2,33 2,45 2,45 2,57 7,41 2,70 3,33 2,24 1,82

0,91 0,96 4,55 2,18 3,17 1,72 1,61 2,25 2,16 0,00 1,85 0,45 4,66 0,68 1,32 2,63 1,19 1,82 1,78 1,85 6,79 2,08 2,99 0,91 2,62

1,01 1,57 6,22 3,73 4,52 0,19 2,59 3,01 2,56 1,85 0,00 1,85 5,70 1,43 0,89 4,41 2,51 0,16 0,13 0,08 8,26 3,76 4,27 1,14 3,45

0,86 0,81 4,52 2,24 3,05 1,73 1,70 2,04 2,35 0,45 1,85 0,00 4,41 0,54 1,38 2,60 1,08 1,85 1,80 1,86 6,75 2,11 2,98 0,91 2,68

5,01 4,67 4,64 4,37 2,26 5,62 4,87 3,67 5,60 4,66 5,70 4,41 0,00 4,73 5,29 3,76 4,54 5,74 5,69 5,73 7,52 4,17 5,27 5,16 5,08

0,45 0,45 4,85 2,58 3,44 1,33 1,69 2,21 2,31 0,68 1,43 0,54 4,73 0,00 1,10 3,06 1,29 1,45 1,40 1,46 6,99 2,44 3,10 0,44 2,66

0,76 1,21 5,54 2,91 3,89 0,71 1,86 2,38 1,76 1,32 0,89 1,38 5,29 1,10 0,00 3,75 1,91 0,82 0,79 0,90 7,74 3,06 3,68 0,90 2,75

3,43 3,08 2,29 1,50 2,18 4,28 2,71 2,85 3,57 2,63 4,41 2,60 3,76 3,06 3,75 0,00 2,25 4,39 4,35 4,43 5,04 1,13 2,46 3,40 3,10

1,59 1,24 3,91 1,71 3,16 2,38 1,46 1,70 2,33 1,19 2,51 1,08 4,54 1,29 1,91 2,25 0,00 2,51 2,46 2,54 5,89 1,67 2,03 1,51 2,23

1,02 1,59 6,20 3,67 4,50 0,16 2,53 3,02 2,45 1,82 0,16 1,85 5,74 1,45 0,82 4,39 2,51 0,00 0,08 0,14 8,27 3,73 4,26 1,14 3,40

0,97 1,54 6,16 3,64 4,46 0,09 2,50 2,96 2,45 1,78 0,13 1,80 5,69 1,40 0,79 4,35 2,46 0,08 0,00 0,13 8,22 3,69 4,22 1,10 3,37

1,03 1,62 6,25 3,74 4,54 0,21 2,62 3,05 2,57 1,85 0,08 1,86 5,73 1,46 0,90 4,43 2,54 0,14 0,13 0,00 8,29 3,79 4,31 1,16 3,49

7,36 6,88 3,71 5,60 6,79 8,15 6,43 6,65 7,41 6,79 8,26 6,75 7,52 6,99 7,74 5,04 5,89 8,27 8,22 8,29 0,00 5,27 4,23 7,18 6,27

2,81 2,36 2,52 0,92 2,36 3,62 1,69 2,45 2,70 2,08 3,76 2,11 4,17 2,44 3,06 1,13 1,67 3,73 3,69 3,79 5,27 0,00 1,82 2,72 2,04

3,43 2,89 2,73 2,07 3,89 4,14 2,27 2,94 3,33 2,99 4,27 2,98 5,27 3,10 3,68 2,46 2,03 4,26 4,22 4,31 4,23 1,82 0,00 3,25 2,21

0,32 0,65 5,15 2,82 3,83 1,04 1,78 2,48 2,24 0,91 1,14 0,91 5,16 0,44 0,90 3,40 1,51 1,14 1,10 1,16 7,18 2,72 3,25 0,00 2,74

2,86 2,34 3,76 1,93 3,35 3,29 1,04 2,42 1,82 2,62 3,45 2,68 5,08 2,66 2,75 3,10 2,23 3,40 3,37 3,49 6,27 2,04 2,21 2,74 0,00

21

Page 22: Proiect Analiza Datelor

După care pentru exemplificarea agregării firmelor prezentăm în tabelul următor etapele de constituire a claselor, în care se poate observa

modul de formare a uni grup precum şi nivelul de agregare corespunzător pentru fiecare algoritm în parte, astfel:

1. Pentru Single linkage

TABELUL NR. 12

Nivel ul

agregării

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

0,078 C11 C20

0,079 C18 C19

0,088 C6 C18 C19

0,125 C6 C18 C19 C11 C20

0,323 C1 C24

0,438 C1 C24 C14

0,445 C1 C24 C14 C2

0,446 C10 C12

0,536 C1 C24 C14 C2 C10 C12

0,709 C6 C18 C19 C11 C20 C15

0,758 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15

0,919 C4 C22

1,040 C7 C25

1,083 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17

1,129 C4 C22 C16

1,362 C7 C25 C9

1,459 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9

1,622 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16

1,701 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8

1,820 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23

2,179 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5

2,257 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5 C13

2,286 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5 C13 C3

3,708 C1 C24 C14 C2 C10 C12 C6 C18 C19 C11 C20 C15 C17 C7 C25 C9 C4 C22 C16 C8 C23 C5 C13 C3 C21

22

Page 23: Proiect Analiza Datelor

2. Pentru Complete linkage

TABELUL NR. 13

Nivel ul

agregării

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

0,078 C11 C20

0,079 C18 C19

0,155 C6 C18 C19

0,207 C6 C18 C19 C11 C20

0,323 C1 C24

0,445 C2 C14

0,446 C10 C12

0,727 C1 C24 C2 C14

0,904 C6 C18 C19 C11 C20 C15

0,919 C4 C22

0,961 C1 C24 C2 C14 C10 C12

1,040 C7 C25

1,496 C4 C22 C16

1,587 C1 C24 C2 C14 C10 C12 C17

1,817 C7 C25 C9

2,257 C5 C13

2,457 C4 C22 C16 C23

2,479 C1 C24 C2 C14 C10 C12 C17 C8

2,859 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9

2,911 C3 C4 C22 C16 C23

3,490 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9 C6 C18 C19 C11 C20 C15

5,272 C3 C4 C22 C16 C23 C5 C13

6,254 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9 C6 C18 C19 C11 C20 C15 C3 C4 C22 C16 C23 C5 C13

8,289 C1 C24 C2 C14 C10 C12 C17 C8 C7 C25 C9 C6 C18 C19 C11 C20 C15 C3 C4 C22 C16 C23 C5 C13 C21

23

Page 24: Proiect Analiza Datelor

3. Pentru Average linkage

TABELUL NR. 14

Nivel ul

agregării

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

0,078 C11 C20

0,079 C18 C19

0,121 C6 C18 C19

0,158 C6 C18 C19 C11 C20

0,323 C1 C24

0,444 C1 C24 C14

0,446 C10 C12

0,608 C1 C24 C14 C2

0,822 C6 C18 C19 C11 C20 C15

0,822 C1 C24 C14 C2 C10 C12

0,919 C4 C22

1,040 C7 C25

1,313 C4 C22 C16

1,318 C1 C24 C14 C2 C10 C12 C17

1,534 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15

1,589 C7 C25 C9

2,115 C4 C22 C16 C23

2,257 C5 C13

2,370 C7 C25 C9 C8

2,431 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8

2,612 C3 C4 C22 C16 C23

3,457 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8 C3 C4 C22 C16 C23

4,218 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8 C3 C4 C22 C16 C23 C5 C13

6,737 C1 C24 C14 C2 C10 C12 C17 C6 C18 C19 C11 C20 C15 C7 C25 C9 C8 C3 C4 C22 C16 C23 C5 C13 C21

24

Page 25: Proiect Analiza Datelor

Pentru algoritmii mai sus prezentaţii, în SPSS se întocmeşte câte o dendrogramă pentru fiecare

în parte, şi sunt prezentate în cele ce urmează:

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

11 20 18 19 6 15 1 24 14 2 10 12 17 7 25 9 4 22 16 8 23 5 13 3 21

Figura 4. Dendrogram using Single Linkage

25

Page 26: Proiect Analiza Datelor

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

11 20 18 19 6 15 7 25 9 10 12 1 24 2 14 17 8 5 13 4 22 16 23 3 21

Figura 5. Dendrogram using Complete Linkage

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

26

Page 27: Proiect Analiza Datelor

11 20 18 19 6 15 10 12 1 24 14 2 17 7 25 9 8 4 22 16 23 3 5 13 21

Figura 6. Dendrogram using Average Linkage (Between Groups)

Iar în final, înainte de a trage concluziile acestei analize cluster a firmelor, prezentăm într-un

mod mai sintetizat, etapele de grupare ale firmelor pentru cele trei metode de agregare Single linkage

(vecinii cei mai apropiaţi), Complete linkage (vecinii cei mai îndepărtaţi) şi Average linkage

(înlănţuirea prin medii), în următorul tabel:

TABELUL NR. 15

Nivelul de agregare

Single linkage. Clase Complete linkage. Clase Average linkage. Clase

<0,1C1=(3,9); C2=(18,19);C3=(6,C2)

C1=(11,20); C2=(18,19) C1=(11,20); C2=(18,19)

0,1 – 0,2 C4=(C3,11) C3=(6,C2) C3=(6,C2); C4=(C3, C1)0,2 – 0,4 C5=(1,24) C4=(C3,C1); C5=(1,24) C5=(1,24)

0,4 – 0,5 C6=(C1,14); C7=(C6,2);C8=(10,12)

C6=(2,14); C7=(10,12) C6=(C5,14); C7=(10,12)

0,5 – 0,8C9=(C7,C8); C10=(C4,15)C11=(C9,C10)

C8=(C5,C6) C8=(C6,2)

0,8 – 1,0 C12=(4,22)C9=(C4,15); C10=(4,22)C11=(C8,C7)

C9=(C4,15); C10=(C8,C7)C11=(4,22)

1,0 – 1,2C13=(7,25); C14=(C11,17)C15=(C12,16)

C12=(7,25) C12=(7,25)

1,2 – 1,5 C16=(C13,9); C17=(C14,C16) C13=(C10,16) C13=(C11,16); C14=(C10,17)

1,5 – 1,9C18=(C17,C15); C19=(C18,8)C20=(C19,23)

C14=(C11,17); C15=(C12,9) C15=(C14,C9); C16=(C12,9)

27

Page 28: Proiect Analiza Datelor

1,9 – 2,5C21=(C20,5); C22=(C21,13)C23=(C22,3)

C16=(5,13); C17=(C13,23)C18=(C14,8)

C17=(C13,23); C18=(5,13)C19=(C16,8); C20=(C15,C19)

2,5 – 4,0 C24=(C23,21)C19=(C18,C15); C20=(3,C17)C21=(C19,C9)

C21=(3,C17); C22=(C20,C21)

>4,0 –C22=(C20,C16); C23=(C21,C22)C24=(C23,21)

C23=(C22,C18); C24=(C23,21)

Pentru a trage concluziile acestei analize cluster, vom analiza cele trei dendrograme asociate

fiecărei metode înparte, astfel câteva concluzii sunt evidente:

- în dendrograma din figura 4 putem distinge două grupe de firme şi anume grupa

formată din firmele (F11, F20, F18, F19, F6) şi (F1, F24, F2, F10, F12), în rest

firmele par destul de omogene, cu excepţia uneia (F21), care întoate cele trei

dendrograme se detaşează evident faţă de celelate firme, lucru ce poate sugera că

algoritmul celor mai apropriaţi vecini nu este indicat de folosit în acest caz.

- în schimb în dendrograma din figura 5 apar unele clase distincte, mai precis 4 grupe

disticte formate astfel (F11, F20, F18, F19, F6) , (F7, F25, F9) , (F10, F12, F1, F24,

F2, F14, F17, F8) şi (F5, F13, F4, F22, F16, F23, F3), dar şi o firmă ca în cazul

anterior ce se detaşează evident de celelalte, aceasta fiind tot firma F21.

- în final în dendrograma din figura 6, avem o evoluţie asemănătoare cu evoluţia din

figura 4, putând distenge şi aici 2-3 clase omogene, dar şi o firmă ce se detasează de

celelalte, aceasta fiind tot firma 21.

Şi facând o paralelă între clasele de firme formate în planul primelor două axe factoriale, este

interesant de văzut dacă clasele obţinute prin tehnicile analizei cluster, bazate pe distanţa euclidiană,

ne conduce la acelaşi rezultate. Acest lucru poate fi luat în discuţie numai în cazul aplicării metodei

vecinilor celor mai îndepărtaţii şi a înlănţuirii bazate pe medii, putem afirma că existe şi firme ale

căror poziţionare în clase se păstrează (de exemplu putem Clasa 1 – (F3,F4, F16,F22) ), dar şi firme

care care se grupează cu altele ce nu aparţineau îniţial în clasa lor, dar în general clasificarea realizată

conform componentelor principale este mult mai elocventă şi explicativă.

În finalul acestui proiect prezentăm şi o grupare a celor 6 indicatori financiar contabili în clase

cât mai omogene, şi pentru aceasta vor fi urmaţi paşii descrişi la începutul analizie cluster, numai că

în prima fereastră de dialog la câmpul „Cluster” în loc de „Cases” alegem „Variables”, şi mai întâi

vom obţine în outputul SPSS, matricea distanţelor euclidiene între coloanele matricei, rezultând astfel

matricea simetrică a disimilarităţilor (matrice de ordin 6 x 6), în următorul tabel:

TABELUL NR. 16

0,0 6,3 6,4 3,3 5,5 5,7

6,3 0,0 0,4 4,8 4,3 3,0

6,4 0,4 0,0 4,8 4,2 3,0

3,3 4,8 4,8 0,0 5,0 4,1

28

Page 29: Proiect Analiza Datelor

5,5 4,3 4,2 5,0 0,0 3,4

5,7 3,0 3,0 4,1 3,4 0,0

După care pentru exemplificarea agregării indicatorilor prezentăm în tabelul următor etapele

de constituire a claselor, în care se poate observa modul de formare a uni grup precum şi nivelul de

agregare corespunzător pentru fiecare algoritm în parte, astfel:

1. Pentru Single Linkage

TABELUL NR. 17

Nivel ul agregării 1 2 3 4 5 6

0,374 I2 I3

2,970 I2 I3 I6

3,329 I1 I4

3,408 I2 I3 I6 I5

4,111 I1 I4 I2 I3 I6 I5

2. Pentru Complete Linkage

TABELUL NR. 18

Nivel ul agregării 1 2 3 4 5 6

0,374 I2 I3

3,042 I2 I3 I6

3,329 I1 I4

4,282 I2 I3 I6 I5

6,364 I1 I4 I2 I3 I6 I5

3. Pentru Average Linkage

TABELUL NR. 19

Nivel ul agregării 1 2 3 4 5 6

0,374 I2 I3

3,006 I2 I3 I6

3,329 I1 I4

3,979 I2 I3 I6 I5

5,327 I1 I4 I2 I3 I6 I5

Pentru algoritmii mai sus prezentaţii, în SPSS se întocmeşte câte o dendrogramă pentru fiecare

în parte, şi sunt prezentate în cele ce urmează:

29

Page 30: Proiect Analiza Datelor

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

VT 2 VE 3 AC 6 AI 5 CA 1 SAL 4

Figura 7. Dendrogram using Single Linkage

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

VT 2 VE 3 AC 6 AI 5 CA 1 SAL 4

Figura 8. Dendrogram using Complete Linkage

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

VT 2 VE 3 AC 6 AI 5 CA 1 SAL 4

Figura 9. Dendrogram using Average Linkage (Between Groups)

Iar în final, înainte de a trage concluziile acestei analize cluster a indicatorilor, prezentăm într-

un mod mai sintetizat, etapele de grupare ale firmelor pentru cele trei metode de agregare Single

linkage (vecinii cei mai apropiaţi), Complete linkage (vecinii cei mai îndepărtaţi) şi Average linkage

(înlănţuirea prin medii), în următorul tabel:

30

Page 31: Proiect Analiza Datelor

TABELUL NR. 20

Nivelul de agregare

Single linkage. Clase Complete linkage. Clase Average linkage. Clase

<2 C1=(2,3) C1=(2,3) C1=(2,3)

2 – 4 C2=(C1,6); C3=(1,4)C4=(C2,5)

C2=(C1,6); C3=(1,4)C2=(C1,6); C3=(1,4)C4=(C2,5)

>4 C5=(C3,C4) C4=(C2,5); C5=(C3,C4) C5=(C3,C4)

După cum se poate observa în informaţiile de mai sus, pentru toate cele trei metode folosite

obţinem aceleaşi grupări ale indicatorilor în clase, doar nivelul agregării în clase diferind de la o

metodă la altă, fapt pentru care în vederea extragerii a unor concluzii privind omogenitatea celor 6

indicatori financiar-contabili, putem urmării etapele constituirii claselor numai pentru una dintre

metode, şi fie aceasta metoda ce foloseşte algoritmul agregării vecinilor celor mai îndepărtaţii

(Complete Linkage).

Atunci cei mai apropriaţii, la un nivel minim de 0,374, sunt indicatorul VT (Venit total) şi

indicatorul VE (Venit din exploatare) formând o primă clasă. După care urmează un salt foarte mare

de aproximativ 2,668 până la un nivel de 3,042, unde primei clase formate i se adugă şi indicatorul

AC (Active circulante). După aceea la un nivel de 3,329 se formează o a doua clasă din indicatorul

CA (Cifra de afaceri) şi indicatorul SAL (Număr mediu de salariaţi anual). Urmând ca mai apoi la

nivelul de 4,282 primei clase formate să se mai aduge şi indicatorul AI (Active Imobilizate). Şi în

final cele două clase formate se agregă la nivelul de 6,364.

Concluzia interpretării prezentată în paragraful anterior, este aceea că folosind algoritmul de

clasificare putem supune că indicatori financiar-contabili urmăriţii prin nivelele lor pentru cele 25 de

firme se pot grupa în două clase:

C1 – formată din indicatorii VT, VE, AC şi AI

C2 – formată din indicatorii CA şi SAL

Şi în final vom compara clasele de indicatori obţinute pe baza matricei euclidiene cu gruparea

indicatorilor după coeficienţii lor de corelaţie liniară claculaţii în etapa de analiză a componentelor

principale, şi avem următorul tabel:

TABELUL NR. 21

CA VT VE SAL AI AC

CA C2Corelaţie puternică

VT C1Corelaţie puternică

Corelaţie puternică

VE C1Corelaţie puternică

SAL C2

AI C1Corelaţie puternică

31

Page 32: Proiect Analiza Datelor

AC C1

Astfel pentru comparaţie putem urmării tabelul anterior ce ne informează atât despre

corelaţiile puternice între indicatorii financiar-contabili, corelaţii exprimate prin coeficienţii de

corelaţie „mari”, cât şi despre clasa căruia aparţie un indicator (informaţiile de pe diagonala

principală), clasă obţinută prin tehnica agregării. Şi care urmare a acestui lucru, putem observa că

împarţirea indicatorilor în clasele mai sus memţionate este justă, acest lucru fiind întărit şi de anumite

informaţii din domeniul financiar-contabil, conform cărora cifra a afacerii ca indicator de output este

corelată cu numărul de salariaţi care este un indicator de input în cadrul activităţii unei firme, iar

venitul total care are în componenţa sa şi venitul de exploatare reprezintă tot nişte indicatori de output

rezultaţii ca urmare a intrării în procesul de desfăşurarea al activităţii firmei a unor indicatori de input

ca activele imobilizate şi activele circulante.

4. BIBLIOGRAFIE

1. Liliana SPIRCU – „Analiza datelor. Aplicaţii economice” , Editura ASE, Bucureşti, 2005

2. Mihai RISTEA – „Contabilitate financiară”, Editura Universitară, Bucureşti, 2004.

3. Valentina CAPOTĂ – „Contabilitate. Monografii contabile”, Editura Niculescu, Bucureşti,

2002.

4. http://www.rasd.ro/ (Bursa de valori Bucureşti – Piaţa RASDAQ)

32