probleme rezolvate analiza dispersionala anova

18
Analiza dispersionala – ANOVA Problema rezolvata Un cercetător face un studiu asupra unor firme, privind şansele pe care acestea le oferă tinerilor angajaţi de a promova repede şi de a avansa în carieră. Pentru aceasta el a cuprins în studiu un număr de 20 de companii producătoare de tehnologie de vârf şi a înregistrat timpul scurs de la angajarea iniţială a unui salariat în firmă până la  prima promovare a acestuia. Firmele au fost grupate după mărime, iar datele înregistrate sunt: Mărimea firmelor Număr de săptăni de la angajare până la prima promovare Mici 30; 26; 30; 32; 38; 24; 32; 28; Medii 34; 32; 25; 36; 33 Mari 47; 41; 43; 48; 40; 49; 40. Se cere să se determine, folosind testul F de analiză dispersională, dacă variaţia timpului scurs până la prima promovare este influenţată semnificativ de mărimea firmei? (nivel de semnificatie 5%) Rezolvare: o Populatia statistica este multimea companiilor producatoare de tehnologie de varf. o Unitatea statistica este o companie (firma). o Caracteristicile urmarite sunt:  X - variabila ce arata marimea unei firme; - variabila nenumerica avand r =3 categorii sau variante: firme mici, firme mijlocii si firme mari: aceste categorii ale variabilei X vor determina impartirea populatiei statistice in r =3 grupe si anume: Grupa 1 (grupa firmelor mici), Grupa 2 (grupa firmelor mijlocii), Grupa 3 (grupa firmelor mari); - astfel, variabila X , marimea firmei, se mai numeste si factor de grupare. si Y - variabila ce arata durata de timp, in saptamani, de la angajare la prima  promovare a unui s alariat al unei firme produ catoare de tehnologie de varf; - variabila numerica de interes. o Fie 2 1 1 1 , ~ σ  µ  N Y variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui salariat al unei firme mici – Grupa 1, unde 1  µ este media variabilei la nivelul intregii grupe. Din Grupa 1 (grupa firmelor mici) se selecteaza un subesan tion de volum 8 1 = n  firme pentru care se inregistreaza valorile variabilei Y 1:

Upload: -

Post on 29-Oct-2015

988 views

Category:

Documents


58 download

TRANSCRIPT

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 1/18

Analiza dispersionala – ANOVA

Problema rezolvata

Un cercetător face un studiu asupra unor firme, privind şansele pe care acesteale oferă tinerilor angajaţi de a promova repede şi de a avansa în carieră. Pentru aceastael a cuprins în studiu un număr de 20 de companii producătoare de tehnologie de vârf şi a înregistrat timpul scurs de la angajarea iniţială a unui salariat în firmă până la

 prima promovare a acestuia. Firmele au fost grupate după mărime, iar dateleînregistrate sunt:

Mărimea firmelor Număr de săptămâni de la angajare până la primapromovare

Mici 30; 26; 30; 32; 38; 24; 32; 28;Medii 34; 32; 25; 36; 33Mari 47; 41; 43; 48; 40; 49; 40.

Se cere să se determine, folosind testul F de analiză dispersională, dacă variaţiatimpului scurs până la prima promovare este influenţată semnificativ de mărimeafirmei? (nivel de semnificatie 5%)

Rezolvare:o Populatia statistica este multimea companiilor producatoare de tehnologie de

varf.o Unitatea statistica este o companie (firma).o Caracteristicile urmarite sunt:

 X  - variabila ce arata marimea unei firme;- variabila nenumerica avand r =3 categorii sau variante: firme mici, firme

mijlocii si firme mari:aceste categorii ale variabilei X vor determina impartirea populatieistatistice in r =3 grupe si anume:

Grupa 1 (grupa firmelor mici),Grupa 2 (grupa firmelor mijlocii),Grupa 3 (grupa firmelor mari);

- astfel, variabila X , marimea firmei, se mai numeste si factor de grupare.

si

Y  - variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui salariat al unei firme producatoare de tehnologie de varf;

- variabila numerica de interes.

o Fie 2111 ,~ σ  µ  N Y  variabila ce arata durata de timp, in saptamani, de la angajare

la prima promovare a unui salariat al unei firme mici – Grupa 1, unde 1 µ  estemedia variabilei la nivelul intregii grupe.Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum 81 =n  

firme pentru care se inregistreaza valorile variabilei Y 1:

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 2/18

}28,32,24,38

,32,30,26,30{

1,18,17,16,15,1

4,13,12,11,1

=====

====

n y y y y y

 y y y y

Media de selectie de grupa este 308

240...

1

,12,11,1

1

1==

+++=

n

 y y y

 y

n

saptamani,iar dispersia de selectie de grupa este

( ) ( ) ( )2857,18

1

...

1

21,1

212,1

211,12

11 =

−++−+−=

n

 y y y y y y s

n .

o Fie ( )2222 ,~ σ  µ  N Y  variabila ce arata durata de timp, in saptamani, de la angajare

la prima promovare pentru un salariat al unei firme mijlocii – Grupa 2, unde 2 µ   este media variabilei la nivelul intregii grupe.Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum

52 =n firme pentru care se inregistreaza valorile variabilei Y 2:}33,36,25,32,34{

2,25,24,23,22,21,2 ====== n y y y y y y .

Media de selectie de grupa este 325

160...

2

,22,21,2

22 ==

+++=

n

 y y y y

nsaptamani,

iar dispersia de selectie de grupa este( ) ( ) ( )

5,171

...

2

2

2,2

2

22,2

2

21,222

2 =−

−++−+−=

n

 y y y y y y s

n .

o Fie ( )2333 ,~ σ  µ  N Y  variabila ce arata durata de timp, in saptamani, de la angajare

la prima promovarepentru un salariat al unei firme mari – Grupa 3, unde 3 µ  estemedia variabilei la nivelul intregii grupe.Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum 73 =n  firme pentru care se inregistreaza valorile variabilei Y 3:

}40,49,40,48,43,41,47{2,37,36,35,34,33,32,31,3 ======== n y y y y y y y y .

Media de selectie de grupa este 447

308...

3

,32,31,3

33 ==

+++=

n

 y y y y

nsaptamani,

iar dispersia de selectie de grupa este

( ) ( ) ( )3333,151

...

3

23,3

232,3

231,32

33

=−

−++−+−

= n

 y y y y y y

 sn

.

o Media totala la nivelul intregului esantion de volum 20321 =++= nnnn firme este

20

744532830

321

332211 ⋅+⋅+⋅=

++

⋅+⋅+⋅

=

nnn

n yn yn y y

4,35=⇒ y saptamani.

2

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 3/18

o Ipotezele statistice sunt:

3210 : µ  µ  µ  == H  (factorul de grupare – marimea companiei nu influenteaza

semnificativ variatia duratei de timp pana la prima promovarea unui salariat){ } l k l k  H  ≠∈∃ ,3,2,1,:1 astfel incat l k  µ  µ  ≠ (cel putin doua medii sunt semnificativ

diferite, adica factorul de grupare – marimea companieiinfluenteaza semnificativ variatia duratei de timp pana la prima

 promovare a unui salariat)

o Statistica testului este

( )17,211

=−=−∈

−== r nr  Fisher 

r n

SSW r 

SSB

 MSW 

 MSB F  .

o Pe baza datelor de selectie calculam:• Variatia dintre grupe

( ) ( ) ( )

( ) ( ) ( ) 74,354454,353284,3530222

32

322

212

1

⋅−+⋅−+⋅−=

=⋅−+⋅−+⋅−= n y yn y yn y ySSB

8,808=⇒SSB

• Variatia din interiorul grupelor ( ) ( ) ( )

( ) ( ) ( ) 3333,15175,17152857,1818

111 233

222

211

⋅−+⋅−+⋅−=

⋅−+⋅−+⋅−= sn sn snSSW 

290=⇒ SSW 

• Variatia totala

2908,808 +=

+= SSW SSBSST 

8,1098=⇒SST 

• Dispersia factoriala corectata (cu gradele de libertate 21 =−r  )

2

8,808

1=

=r 

SSB MSB

4,404=⇒ MSB

• Dispersia reziduala corectata (cu gradele de libertate 17=− r n )

17290

=

=

r nSSW  MSW 

0588,17=⇒ MSW 

• Valoarea calculata a statisticii testului este

0588,17

4,404==

 MSW 

 MSB F calc

7062,23=⇒ calc F 

o  Nivelul de semnificatie al testului este 05,0=α  ,iar valoarea critica a testului este 59,317,2;05,0,1; ===

−−F  F  F  r nr critic α   ,

deci regiunea critica este ( ) ( )∞+=+∞= ;59,3;criticc F  R .

3

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 4/18

o Cum ccalccriticcalc R F  F  F  ∈⇒> , respingem ipoteza nula H0 si acceptam ipotezaalternativa H1, concluzionand ca la un nivel de semnificatie de 5% si pe bazaacestor date de selectie, marimea companiei influenteaza semnificativ variatiaduratei de timp pana la prima promovare pentru un salariat.

o Calculele pot fi organizate in urmatorul tabel ANOVA

Source

of variation(Sursa variatiei)

SS(sum

of squares(suma

 patratelor)

df – degreesof freedom(gradele delibertate)

MS mean of sum

of squares(dispersiilecorectate)

F F critic

 Between groups

(Factorulde grupare X)

SSB = 404,4 r -1 = 3 1−=

SSB MSB

= 404,4 MSW 

 MSB F calc =

=23,0762

Fcritic=F0,05; 2, 17

=3,59

Within Groups

(Reziduala) SSW = 290 n-r = 17 r n

SSW  MSW 

=

=17,0588

TotalSST =SSB+SS 

= 1098,8n-1 = 19

Problema poate fi rezolvata in Excel dupa cum urmeaza: Intr-o foaie de lucru se introduc datele din cele trei subesantioane pe coloane,

asa cum apare in Figura 1; In Excel 2003, din meniul principal Tools, submeniul Data Analysis, se alege

Anova: Single Factor; In Excel 2007 , din meniul principal Data, submeniul Data Analysis, se alege

Anova: Single Factor;

Figura 1. Introducerea datelor si alegerea Anova: Single Factor

din submeniul Data Analysis. Fereastra de dialog este prezentata in Figura 2.

4

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 5/18

Figura 2. Fereastra de dialog pentru Anova: Single Factor.

Output-ul consta din doua tabele: primul contine rezultatele obtinute in urma prelucrarii datelor din fiecare grupa, iar cel de-al doilea este tabelul ANOVA.

 Anova: Single Factor 

SUMMARY

Groups Count  ( in ) Sum Average ( i y ) Variance (

2

i s )

Grupa 1(firme mici)

8 1n=

240

∑=

=8

11

  j  j y 30 1 y= 18.2857 2

1 s=

Grupa 2(firme mijlocii)

5 2n= 160 ∑=

=5

12

 j j y 32 2 y= 17.5 2

2 s=

Grupa 3(firme mari)

7 3n=

308

∑=

=7

13

  j  j y 44 3 y= 15.3333

23 s=

 ANOVA

Source of Variation SS df MS F P-value F crit  

Between Groups 808.8=SSB 2=r-1 404.4=MSB 23.7062=F calc 1.21E-05 3.59

Within Groups 290=SSW  17=n-r 

17.0588=MS 

Total 1098.8=SST  19=n-1  

5

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 6/18

Observatii:

In Excel 2007 , submeniul Data Analysis se instaleaza astfel:- intr-o foie obisnuita de lucru, dati click pe Office Button (cerculetul stanga sus)

- click pe Excel Options- apoi click pe Add Ins- selectati cu un singur click Analisys Toolpack din partea deapta a ferestrei de la

Add Ins si apoi click GO

- apare o noua fereastra in care bifati Analysis ToolPack si de asemenea AnalysisToolPack VBA, iar apoi click pe OK 

- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul principal Data.

In Excel 2003, submeniul Data Analysis se instaleaza astfel:- intr-o foie obisnuita de lucru, din meniul principal Tools, alegeti Add Ins

- apare o fereastra in care bifati Analysis ToolPack si de asemenea AnalysisToolPack VBA, iar apoi click pe OK 

- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul principal Tools.

Alte probleme analiza dispersionala (ANOVA)

Problema 1. Un producător de sucuri de mere a realizat un nou produs: concentratlichid. Acest nou produs are următoarele avantaje faţă de vechiul produs: este mai practic de utilizat, are o calitate cel puţin la fel de bună şi cost semnificativ mai mic.Pentru a decide pe care dintre cele trei avantaje să-şi axeze strategia de marketing,directorul acestui departament a realizat un studiu în trei oraşe. În oraşul A campaniade publicitate s-a axat pe uşurinţa de utilizare a noului produs. În oraşul B campania de

 publicitate s-a axat pe calitatea noului produs. În oraşul C campania de publicitate s-aaxat pe preţul mai mic al noului produs. În toate cele 3 oraşe s-a înregistrat numărul de

 bucăţi vândute în 20 de săptămâni.

Uşurinţa

 folosirii:

529 658 793 514 663 719 711 606 461 529

498 663 604 495 485 557 353 557 542 614

Calitate:804 630 774 717 679 604 620 697 706 615492 719 787 699 572 523 584 634 580 624

 Preţ:672 531 443 596 602 502 659 689 675 512691 733 698 776 561 572 469 581 679 532

Directorul de marketing ar dori să ştie dacă există diferenţe semnificative întrenumărul de bucăţi vândute, în medie pe săptămână, în cele trei oraşe după terminareacampaniei de publicitate, considerand un nivel de semnificatie de 5%.

(Se cere rezolvarea in Excel ).

6

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 7/18

Problema 2. Directorul unei companii pentru fabricarea mobilei de birou, crede ca productivitatea lucratorilor depinde, printre altele si de succesiunea operatiilor pe caretrebuie sa le execute muncitorul. Pentru producerea unui birou ergonomic suntconsiderate doua variante de realizarea a acestuia ( din punctul de vedere al succesiuniioperatiilor). Pentru a decide care varianta este mai buna au fost selectati aleator 50 de

muncitori care asamblau birouri si au fost inregistrati timpii de asamblare.Timpii de asamblare (ore)Varianta A 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6;

6,0; 7,1; 6,1; 5,0; 6,3; 7,0; 6,4; 6,1; 6,6; 7,7; 6,4; 5,2; 6,7Varianta B 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9;

7,1; 5,8; 7,0; 5,7; 5,9; 4,9; 5,3; 4,2; 7,1Directorul doreste sa afle daca pentru un nivel de semnificatie de 5%, timpii deasamblare in cele doua variate difera.(Se cere rezolvarea in Excel ).

Problema 3. Pentru 7 magazine situate în cartierul A al unui oraş si 5 magazine situatein cartierul B al aceluiasi oras, se cunosc valorile vânzărilor (mil. lei). In urma aplicariimetodei de analiza dispersionala ANOVA si a prelucrarii datelor cu Excel, s-au obtinuturmatoarele rezultate:

 ANOVA

Source of Variation SS df MS F F crit  

Between Groups ………. 1 ………. 17,96283 4,964603

Within Groups ………. ……. 7,891429

Total ……….. ……

Se cere să se determine datele lipsa si sa se interpreteze rezultatele prelucrarii.Influenteaza cartierul in care sunt amplasate magazinele variatia vanzarilor in mod

semnificativ? Testati pentru un nivel de semnificatie de 5%.

Problema 4. Managerul unui lanţ de supermarketuri doreşte să deschidă un noumagazin în unul din cele 4 cartiere principale ale unui oras. Unul din factoriiimportanti luati in considerare in luarea deciziei de amplasare este venitul mediu lunar al rezidentilor fiecarui cartier. Se selectează astfel un eşantion de 80 gospodarii şi seînregistrează veniturile (mii lei). În urma prelucrării datelor in Excel s-au obţinutrezultatele:

Groups Count Sum AverageVarianc 

e

Cartierul A 19 44,2 2,33 0,24Cartierul B 24 78,3 3,26 0,33Cartierul C 16 33,6 2,10 0,17Cartierul D 21 57,3 2,73 0,46

Testaţi, folosind testul Fisher, pentru o probabilitate de 95% ( Fcritic = 2,73) dacăexistă diferenţe semnificative între veniturile gospodariilor, diferenţe generate decartierul de rezidenţă.

7

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 8/18

Problema 1. Rezolvare:

o Unitatea statistica este noul produs concentrat lichid al respectivului producator de sucuri.

o Caracteristicile urmarite sunt:

 X  - variabila ce arata tipul de publicitate pe care s-a axat campania de promovarea noului produs;

- variabila nenumerica avand r =3 categorii sau variante de raspuns: avantajelegate de usurinta folosirii, avantaje legate de calitate si avantaje legate de

 pret;

- aceste categorii ale variabilei X vor determina impartirea populatiei statisticein r =3 grupe si anume:

Grupa 1 (grupa produselor promovate in orasul A unde campania de publicitate s-a axat pe usurinta folosirii),

Grupa 2 (grupa produselor promovate in orasul B unde campania de

 publicitate s-a axat pe calitate),Grupa 3 (grupa produselor promovate in orasul C unde campania de publicitate s-a axat pe pret);

- astfel, variabila X , marimea firmei, se mai numeste si factor de grupare.

si

Y  - variabila ce arata numarul de bucati vandute intr-o saptamana;- variabila numerica de interes.

o Fie ( )2111 ,~ σ  µ  N Y  variabila ce arata numarul de bucati vandute intr-o saptamana

in orasul A – Grupa 1, unde 1 µ  este media variabilei la nivelul intregii grupe.In Grupa 1 se realizeaza o selectie de volum 201 =n saptamani pentru care seinregistreaza valorile variabilei Y 1 – numarul de bucati vandute:

}614...,,658,529{1,120,12,11,1 ==== n y y y y bucati.

Media de selectie de grupa este

55,57720

11551...

1

,12,11,1

11

==

+++

=

n

 y y y y

nbucati/saptamana,

iar dispersia de selectie de grupa este

( ) ( ) ( )10775

1

...

1

21,1

212,1

211,12

11 =

−++−+−=

n

 y y y y y y s

n .

o Fie ( )2222 ,~ σ  µ  N Y  variabila ce arata numarul de bucati vandute intr-o saptamana

in orasul B – Grupa 2, unde 2 µ  este media variabilei la nivelul intregii grupe.In Grupa 2 se realizeaza o selectie de volum 202 =n saptamani pentru care seinregistreaza valorile variabilei Y 2 – numarul de bucati vandute:

}624,...,630,804{2,220,22,21,2 ==== n y y y y bucati.

Media de selectie de grupa este

65320

13060...

2

,22,21,2

22

==+++

=n

 y y y y

nbucati/saptamana,

8

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 9/18

iar dispersia de selectie de grupa este( ) ( ) ( )

105,72381

...

2

2

2,2

2

22,2

2

21,22

2

2 =−

−++−+−=

n

 y y y y y y s

n .

o Fie ( )2333 ,~ σ  µ  N Y  variabila ce arata numarul de bucati vandute intr-o saptamana

in orasul C – Grupa 3, unde 3 µ  este media variabilei la nivelul intregii grupe.In Grupa 3 se se realizeaza o selectie de volum 203 =n firme pentru care seinregistreaza valorile variabilei Y 3 – numarul de bucati vandute:

}532,...,531,672{2320,32,31,3 ==== n y y y y bucati.

Media de selectie de grupa este

65,60820

12173...

3

,32,31,3

33

==+++

=n

 y y y y

nbucati/saptamana,

iar dispersia de selectie de grupa este

( ) ( ) ( ) 239,86701

...

3

2

3,3

2

32,3

2

31,32

33 =

−−++−+−=

n y y y y y y s n .

o Media totala la nivelul intregului esantion de volum 60321 =++= nnnn este

60

2065,608206532055,577

321

332211 ⋅+⋅+⋅=

++

⋅+⋅+⋅=

nnn

n yn yn y y

06,613=⇒ y bucati/saptamana.

o Ipotezele statistice sunt:

3210 : µ  µ  µ  == H  (factorul de grupare – tipul de publicitate pe care s-a axat campaniade promovare a noului produs nu influenteaza semnificativvariatia numarului de bucati vandute intr-o saptamana)

{ } l k l k  H  ≠∈∃ ,3,2,1,:1 astfel incat l k  µ  µ  ≠ (cel putin doua medii sunt semnificativdiferite, adica factorul de grupare – tipul de publicitateinfluenteazasemnificativ variatia numarului de bucati vandute intr-osaptamana)

o Pragul de semnificatie al testului este 05,0=α  .

o Statistica testului este

( )57,211

=−=−∈

−== r nr  Fisher 

r n

SSW r 

SSB

 MSW 

 MSB F  .

o Introducerea datelor intr-o foaie de lucru in  Excel , apelarea optiunii  Data Analysis

si Anova: Single Factor , precum si rezultatele prelucrarii datelor sunt prezentate in

imaginile de mai jos.

9

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 10/18

 Anova: Single Factor 

SUMMARYGroups Count Sum Averag Variance

10

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 11/18

e

Grupa 1 Usurinta folosirii 20 11551 577,55 10775

Grupa 2 Calitate 20 13060 653 7238,105

Grupa 3 Pret 20 12173 608,65 8670,239

 ANOVA

Source of Variation SS df MS F P-value F crit  

Between Groups 57512,23 2 28756,12 3,233041 0,046773 3,158846

Within Groups 506983,5 57 8894,447

Total 564495,7 59

o Valoarea calculata a statisticii testului este 233,3=calc F  ,iar  158,357,2;05,0,1;

===−−

 F  F  F  r nr critic α   ,

deci regiunea critica este ( ) ( )∞=∞= ;158,3;criticc F  R

o Cum ccalc R F  ∈= 233,3 , respingem ipoteza nula H 0 si acceptam ipoteza alternativa H 1, concluzionand ca tipul de publicitate pe care se bazeaza campania de promovare, adica prezentarea diferitelor avantaje ale noului produs, are o influentasemnificativa asupra variatiei numarului de bucati vandute.

Problema 2. Rezolvare:o Populatia statistica este multimea birourilor realizate intr-o fabrica de mobila.o Unitatea statistica este un birou.o Caracteristicile urmarite sunt:

 X  - variabila ce arata varianta de realizare a unui birou;

- exista are r =2 variante numite simbolic varianta A si varianta B; astfel camultimea birourilor realizate in acea fabrica va fi impartita in r =2 grupe sianume:

Grupa 1 (grupa birourilor realizate in varianta A),Grupa 2 (grupa birourilor realizate in varianta B);

- variabila X , varianta de realizare, se mai numeste si factor de grupare.

si

Y  - variabila ce arata durata de timp, in ore, in care un muncitor asambleaza un birou;

- variabila numerica de interes.

o Fie ( )2111 ,~ σ  µ  N Y  variabila ce arata durata de timp, in ore, in care un muncitor 

asambleaza un birou prin varianta A – Grupa 1, unde 1 µ  este media variabilei lanivelul intregii grupe.Din Grupa 1 se selecteaza 271 =n muncitori pentru care se inregistreaza timpii derealizare a birourilor prin varianta A, adica se inregistreaza valorile variabilei Y 1:

}7,6...,;0,5;8,6{1,127,12,11,1 ==== n y y y y ore.

Media de selectie de grupa este

11

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 12/18

2629,627

1,169...

1

,12,11,1

11

==+++

=n

 y y y y

nore,

iar dispersia de selectie de grupa este( ) ( ) ( )

8339,01

...

1

2

1,1

2

12,1

2

11,12

11 =

−++−+−=

n

 y y y y y y s

n .

o Fie ( 2

222 ,~ σ  µ  N Y  variabila ce arata durata de timp, in ore, in care un muncitor 

asambleaza un birou prin varianta B – Grupa 2, unde 2 µ  este media variabilei la

nivelul intregii grupe.Din Grupa 2 se selecteaza 231 =n muncitori pentru care se inregistreaza timpii derealizare a birourilor prin varianta B, adica se inregistreaza variabilei Y 2:

}1,7...,;6,6;7,5{2,223,22,21,2 ==== n y y y y ore.

Media de selectie de grupa este

0217,623

5,138...

2

,22,21,2

22

==

+++

= n

 y y y

 yn

ore,

iar dispersia de selectie de grupa este( ) ( ) ( )

3699,11

...

2

2

2,2

2

22,2

2

21,22

22 =

−++−+−=

n

 y y y y y y s

n .

o Media totala la nivelul intregului esantion de volum 5021 =+= nnn este

50

230217,6272629,6

21

2211 ⋅+⋅=

+

⋅+⋅=

nn

n yn y y

1519,6=⇒ y ore.

o Ipotezele statistice sunt:

210 : µ  µ  = H  (factorul de grupare – varianta de asamblare a unui birou nuinfluenteaza semnificativ variatia timpului de realizare a cestuia)

211 : µ  µ  ≠ H  (mediile sunt semnificativ diferite, cu alte cuvinte varianta de asamblarea unui birou influenteaza semnificativ variatia timpului de realizare acestuia)

o Pragul de semnificatie al testului este 05,0=α  .

o Statistica testului este

( )48,111

=−=−∈

−== r nr  Fisher 

r n

SSW r 

SSB

 MSW 

 MSB F  .

Grupa 1(Varianta A)

Grupa 2(Varianta B)

6,8 5,7

5 6,6

7,9 8,55,2 6,5

7,6 5,9

12

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 13/18

5 6,7

5,9 6,6

5,2 4,2

6,5 4,2

7,4 4,5

6,1 5,3

6,2 7,9

7,1 7

4,6 5,9

6 7,1

7,1 5,8

6,1 7

5 5,7

6,3 5,9

7 4,9

6,4 5,3

6,1 4,2

6,6 7,17,7

6,4

5,2

6,7

Rezultatele prelucrarii datelor in Excel se prezinta sub forma urmatoarelor doua tabele:

 Anova: Single Factor 

SUMMARY

Groups Count Sum Average VarianceGrupa 1(Varianta A) 27 169,1 6,262963 0,83396

Grupa 2(Varianta B) 23 138,5 6,021739 1,36996

 ANOVA

Source of Variation SS df MS F P-value F crit  

Between Groups 0,722707 1 0,722707 0,669404 0,417303 4,042647

Within Groups 51,82209 48 1,079627

Total 52,5448 49

o Valoarea calculata a statisticii testului este 669,0=calc F  ,iar  042,4

48,1;05,0,1;===

−− F  F  F  r nr critic α   ,

deci regiunea critica este ( ) ( )∞=∞= ;042,4;criticc F  R

o Cum ccalcR F  ∉= 669,0 , nu avem suficiente motive pentru a respinge ipoteza nula

 H 0, deci o acceptam, concluzionand ca varianta de realizare a unui birou nuinfluenteaza semnificativ variatia timpului in care un muncitor lucreaza pentruasamblare.

Problema 3. Rezolvare:o Unitatea statistica este un magazin.

13

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 14/18

o Caracteristicile urmarite sunt:

 X  - variabila ce arata cartierul din oras unde se gaseste magazinul;

- orasul are r =2 cartiere numite simbolic A si B, astfel ca multimeamagazinelor din oras va fi impartita in r =2 grupe si anume:

Grupa 1 (grupa magazinelor situate in cartierul A),Grupa 2 (grupa magazinelor situate in cartierul B);

- astfel, variabila X , cartierul, se mai numeste si factor de grupare.siY  - variabila ce arata valoarea vanzarilor, in mil. lei, a unui magazin intr-o

anumita perioada;

- variabila numerica de interes.

o Fie ( )2111 ,~ σ  µ  N Y  variabila ce arata valoarea vanzarilor unui magazin situat in

cartierul A – Grupa 1, unde 1 µ  este media variabilei la nivelul intregii grupe.In Grupa 1 se realizeaza o selectie de volum 71 =n magazine pentru care seinregistreaza valorile variabilei Y 1 – valoarea vanzarilor:

}...,,,{1,17,12,11,1 n y y y y = mil. lei.

Media de selectie de grupa este 1 y mil.lei si dispersia de selectie de grupa este 2

1 s .

o Fie ( )2222 ,~ σ  µ  N Y  variabila ce arata valoarea vanzarilor unui magazin situat in

cartierul B – Grupa 2, unde 2 µ  este media variabilei la nivelul intregii grupe.In Grupa 2 se realizeaza o selectie de volum 52 =n magazine pentru care se

inregistreaza valorile variabilei Y 2 – valoarea vanzarilor:},...,,{2,25,22,21,2 n y y y y = mil. lei.

Media de selectie de grupa este 2 y mil.lei si dispersia de selectie de grupa este 2

2 s .

o Volumul intregului esantion este 1221 =+= nnn magazine.

o Ipotezele statistice sunt:

210 : µ  µ  = H  (cartierul in care este amplasat magazinul nu influenteaza semnificativvariatia vanzarilor)

211 : µ  µ  ≠ H  (mediile sunt semnificativ diferite, cu alte cuvinte factorul de grupare – 

cartierul influenteaza semnificativ variatia vanzarilor)o Pragul de semnificatie al testului este 05,0=α  .

o Statistica testului este

( )10,111=−=−∈

−== r nr  Fisher 

r n

SSW r 

SSB

 MSW 

 MSB F  .

In urma prelucrarii datelor de selectie s-a obtinut urmatorul tabel ANOVA:

 ANOVA

Source of SS df MS F F crit  

14

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 15/18

Variation

BetweenGroups

SSB=141,7523976 r-1 = 1 MSB=141,7523976 Fcalc =17,9628 4,9646

Within Groups SSW=78,91429 n-r = 10 MSW=7,891429

Total SST=220,66 n-1 = 11  

Cum =⋅=⇒= calccalc F  MSW  MSB MSW 

 MSB F 

  96283,17891429,7 ⋅=

7523976,141=⇒ MSB

Cum ( ) =⋅−=⇒−

= MSBr SSBr 

SSB MSB 1

1

  ( ) 7523976,14112 ⋅−=

7523976,141=⇒SSB

Cum ( ) =⋅−=⇒−

= MSW r nSSW 

r n

SSW  MSW 

  ( ) 891429,7212 ⋅−=

91429,78=⇒SSW 

Cum SSW SSBSST  += 66,220=⇒SST  .

o Regiunea critica a testului este ( ) ( )∞=∞= ;96,4;criticc F  R si cum

ccalc R F  ∈= 96,17 , atunci respingem ipoteza nula  H 0 si acceptam ipotezaalternativa H 1, cartierul in care este amplasat magazinul influenteaza semnificativvariatia vanzarilor.

Problema 4. Rezolvare:o Populatia statistica este multimea gospodariilor rezidentilor dintr-un oras.o Unitatea statistica este o gospodarie.o Caracteristicile urmarite sunt:

 X  - variabila ce arata cartierul din oras unde se afla gospodaria;

- orasul are r =4 cartiere numite simbolic A, B, C si D, astfel ca populatiastatistica a gospodariilor rezidentilor acelui oras va fi impartita in r =4 grupesi anume:

Grupa 1 (grupa gospodariilor situate in cartierul A),

Grupa 2 (grupa gospodariilor situate in cartierul B),Grupa 3 (grupa gospodariilor situate in cartierul C),

15

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 16/18

Grupa 4 (grupa gospodariilor situate in cartierul D);

- astfel, variabila X , cartierul, se mai numeste si factor de grupare.

si

Y  - variabila ce arata venitul lunar, in mii lei, al unei gospodarii;

- variabila numerica de interes.

o Fie ( )2111 ,~ σ  µ  N Y  variabila ce arata arata venitul lunar, in mii lei, al unei

gospodarii din cartierul A –  Grupa 1, unde 1 µ  este media variabilei la nivelulintregii grupe.In Grupa 1 se realizeaza o selectie de volum 191 =n gospodarii pentru care seinregistreaza valorile variabilei Y 1:

}...,,,{1,119,12,11,1 n y y y y = mii lei/luna.

In urma prelucarii datelor din acest subesantion, se obtine media de selectie degrupa este

33,219

2,44...

1

,12,11,1

11

==+++

=n

 y y y y

nmii lei/luna,

iar dispersia de selectie de grupa este 24,02

1 = s .

o Fie ( )2222 ,~ σ  µ  N Y  variabila ce arata venitul lunar, in mii lei, al unei gospodarii

din cartierul B – Grupa 2, unde 2 µ  este media variabilei la nivelul intregii grupe.In Grupa 2 se realizeaza o selectie de volum 242 =n gospodarii pentru care seinregistreaza valorile variabilei Y 2:

},...,,{2,224,22,21,2 n y y y y = mii lei/luna.

In urma prelucarii datelor din acest subesantion, media de selectie de grupa este

26,324

3,78...

2

,22,21,2

22

==+++

=n

 y y y y

nmii lei/luna,

iar dispersia de selectie de grupa este 33,02

2 = s .

o Fie ( )2333 ,~ σ  µ  N Y  variabila ce arata venitul lunar, in mii lei, al unei gospodarii

din cartierul C – Grupa 3, unde 3 µ  este media variabilei la nivelul intregii grupe.In Grupa 3 se se realizeaza o selectie de volum 163 =n gospodarii pentru care seinregistreaza valorile variabilei Y 3:

},...,,{2,316,32,31,3 n y y y y = mii lei/luna.

In urma prelucarii datelor din acest subesantion, media de selectie de grupa este

10,216

6,33...

3

,32,31,3

33

==+++

=n

 y y y y

nmii lei/luna,

iar dispersia de selectie de grupa este 17,023 = s .

o Fie ( 2

444 ,~ σ  µ  N Y  variabila ce arata venitul lunar, in mii lei, al unei gospodarii

din cartierul D – Grupa 4, unde 4 µ  este media variabilei la nivelul intregii grupe.

In Grupa 4se se realizeaza o selectie de volum 214 =n de gospodarii pentru carese inregistreaza valorile variabilei Y 4:

16

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 17/18

},...,,{4,421,42,41,4 n y y y y = mii lei/luna.

In urma prelucarii datelor din acest subesantion, media de selectie de grupa este

73,221

3,57...

4

,42,41,4

44

==+++

=n

 y y y y

nmii lei/luna,

iar dispersia de selectie de grupa este 46,02

4 = s .

o S-au selectat astfel, la nivelul intregului oras, 804321 =+++= nnnnn degospodarii.

o Ipotezele statistice sunt:

210 : µ  µ  = H  (cartierul de rezidenta al gospodariilor nu influenteaza semnificativvariatia venitului lunar al acestora)

{ } l k l k  H  ≠∈∃ ,4,3,2,1,:1 astfel incat l k  µ  µ  ≠ (cel putin doua medii suntsemnificativ diferite, adica factorul de grupare – cartierul influenteazasemnificativ variatia venitului lunar al unei gospodarii)

o  Nivelul de incredere al testului este 95%, deci nivelul de semnificatie este05,0=α  .

o Statistica testului este

( )76,311=−=−∈

−== r nr  Fisher 

r n

SSW r 

SSB

 MSW 

 MSB F  .

o In urma prelucrarii datelor de selectie se obtine:

• Media totala la nivelul intregului esantion de volum 804321 =+++= nnnnn  este

80

2173,21610,22426,31933,2

4321

44332211 ⋅+⋅+⋅+⋅=

+++

⋅+⋅+⋅+⋅=

nnnn

n yn yn yn y y

668,2=⇒ y mii lei/luna.• Variatia dintre grupe

( ) ( ) ( ) ( )

( ) ( )

( ) ( ) 21668,273,216668,210,2

24668,226,319668,233,2

22

22

4

2

43

2

32

2

21

2

1

⋅−+⋅−+

+⋅−+⋅−=

=⋅−+⋅−+⋅−+⋅−= n y yn y yn y yn y ySSB

82448,15=⇒SSB

• Variatia din interiorul grupelor ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) 46,012117,011633,012324,0119

1111 2

44

2

33

2

22

2

11

⋅−+⋅−+⋅−+⋅−=

=⋅−+⋅−+⋅−+⋅−= sn sn sn snSSW 

66,23=⇒SSW 

• Variatia totala

66,2382448,15 +=

+= SSW SSBSST 

48448,39=⇒SST 

Dispersia factoriala corectata (cu gradele de libertate31 =−r 

)

17

7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA

http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 18/18

3

82448,15

1=

=r 

SSB MSB

274826,5=⇒ MSB

• Dispersia reziduala corectata (cu gradele de libertate 76=− r n )

76

66,23=

=

r n

SSW  MSW 

311315,0=⇒ MSW 

• Valoarea calculata a statisticii testului este

311315,0

274826,5==

 MSW 

 MSB F calc

9436,16=⇒ calc F 

Tabelul ANOVA:

 ANOVA

Source of Variation SS df MS F F crit  

Between Groups SSB=15,82448 r-1 = 3 MSB=5,274826 Fcalc =16,9436 2,73Within Groups SSW=23,66 n-r = 76 MSW=0,311315

Total SST=39,48448 n-1 = 79  

o Cum ( )∞=∈= ;73,294,16 ccalc R F  , atunci respingem ipoteza nula H 0 si acceptamipoteza alternativa  H 1, cartierul in care se gaseste gospodaria influenteazasemnificativ variatia veniturilor.

18