probleme rezolvate analiza dispersionala anova
TRANSCRIPT
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 1/18
Analiza dispersionala – ANOVA
Problema rezolvata
Un cercetător face un studiu asupra unor firme, privind şansele pe care acesteale oferă tinerilor angajaţi de a promova repede şi de a avansa în carieră. Pentru aceastael a cuprins în studiu un număr de 20 de companii producătoare de tehnologie de vârf şi a înregistrat timpul scurs de la angajarea iniţială a unui salariat în firmă până la
prima promovare a acestuia. Firmele au fost grupate după mărime, iar dateleînregistrate sunt:
Mărimea firmelor Număr de săptămâni de la angajare până la primapromovare
Mici 30; 26; 30; 32; 38; 24; 32; 28;Medii 34; 32; 25; 36; 33Mari 47; 41; 43; 48; 40; 49; 40.
Se cere să se determine, folosind testul F de analiză dispersională, dacă variaţiatimpului scurs până la prima promovare este influenţată semnificativ de mărimeafirmei? (nivel de semnificatie 5%)
Rezolvare:o Populatia statistica este multimea companiilor producatoare de tehnologie de
varf.o Unitatea statistica este o companie (firma).o Caracteristicile urmarite sunt:
X - variabila ce arata marimea unei firme;- variabila nenumerica avand r =3 categorii sau variante: firme mici, firme
mijlocii si firme mari:aceste categorii ale variabilei X vor determina impartirea populatieistatistice in r =3 grupe si anume:
Grupa 1 (grupa firmelor mici),Grupa 2 (grupa firmelor mijlocii),Grupa 3 (grupa firmelor mari);
- astfel, variabila X , marimea firmei, se mai numeste si factor de grupare.
si
Y - variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui salariat al unei firme producatoare de tehnologie de varf;
- variabila numerica de interes.
o Fie 2111 ,~ σ µ N Y variabila ce arata durata de timp, in saptamani, de la angajare
la prima promovare a unui salariat al unei firme mici – Grupa 1, unde 1 µ estemedia variabilei la nivelul intregii grupe.Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum 81 =n
firme pentru care se inregistreaza valorile variabilei Y 1:
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 2/18
}28,32,24,38
,32,30,26,30{
1,18,17,16,15,1
4,13,12,11,1
=====
====
n y y y y y
y y y y
Media de selectie de grupa este 308
240...
1
,12,11,1
1
1==
+++=
n
y y y
y
n
saptamani,iar dispersia de selectie de grupa este
( ) ( ) ( )2857,18
1
...
1
21,1
212,1
211,12
11 =
−
−++−+−=
n
y y y y y y s
n .
o Fie ( )2222 ,~ σ µ N Y variabila ce arata durata de timp, in saptamani, de la angajare
la prima promovare pentru un salariat al unei firme mijlocii – Grupa 2, unde 2 µ este media variabilei la nivelul intregii grupe.Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum
52 =n firme pentru care se inregistreaza valorile variabilei Y 2:}33,36,25,32,34{
2,25,24,23,22,21,2 ====== n y y y y y y .
Media de selectie de grupa este 325
160...
2
,22,21,2
22 ==
+++=
n
y y y y
nsaptamani,
iar dispersia de selectie de grupa este( ) ( ) ( )
5,171
...
2
2
2,2
2
22,2
2
21,222
2 =−
−++−+−=
n
y y y y y y s
n .
o Fie ( )2333 ,~ σ µ N Y variabila ce arata durata de timp, in saptamani, de la angajare
la prima promovarepentru un salariat al unei firme mari – Grupa 3, unde 3 µ estemedia variabilei la nivelul intregii grupe.Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum 73 =n firme pentru care se inregistreaza valorile variabilei Y 3:
}40,49,40,48,43,41,47{2,37,36,35,34,33,32,31,3 ======== n y y y y y y y y .
Media de selectie de grupa este 447
308...
3
,32,31,3
33 ==
+++=
n
y y y y
nsaptamani,
iar dispersia de selectie de grupa este
( ) ( ) ( )3333,151
...
3
23,3
232,3
231,32
33
=−
−++−+−
= n
y y y y y y
sn
.
o Media totala la nivelul intregului esantion de volum 20321 =++= nnnn firme este
20
744532830
321
332211 ⋅+⋅+⋅=
++
⋅+⋅+⋅
=
nnn
n yn yn y y
4,35=⇒ y saptamani.
2
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 3/18
o Ipotezele statistice sunt:
3210 : µ µ µ == H (factorul de grupare – marimea companiei nu influenteaza
semnificativ variatia duratei de timp pana la prima promovarea unui salariat){ } l k l k H ≠∈∃ ,3,2,1,:1 astfel incat l k µ µ ≠ (cel putin doua medii sunt semnificativ
diferite, adica factorul de grupare – marimea companieiinfluenteaza semnificativ variatia duratei de timp pana la prima
promovare a unui salariat)
o Statistica testului este
( )17,211
=−=−∈
−
−== r nr Fisher
r n
SSW r
SSB
MSW
MSB F .
o Pe baza datelor de selectie calculam:• Variatia dintre grupe
( ) ( ) ( )
( ) ( ) ( ) 74,354454,353284,3530222
32
322
212
1
⋅−+⋅−+⋅−=
=⋅−+⋅−+⋅−= n y yn y yn y ySSB
8,808=⇒SSB
• Variatia din interiorul grupelor ( ) ( ) ( )
( ) ( ) ( ) 3333,15175,17152857,1818
111 233
222
211
⋅−+⋅−+⋅−=
⋅−+⋅−+⋅−= sn sn snSSW
290=⇒ SSW
• Variatia totala
2908,808 +=
+= SSW SSBSST
8,1098=⇒SST
• Dispersia factoriala corectata (cu gradele de libertate 21 =−r )
2
8,808
1=
−
=r
SSB MSB
4,404=⇒ MSB
• Dispersia reziduala corectata (cu gradele de libertate 17=− r n )
17290
=
−
=
r nSSW MSW
0588,17=⇒ MSW
• Valoarea calculata a statisticii testului este
0588,17
4,404==
MSW
MSB F calc
7062,23=⇒ calc F
o Nivelul de semnificatie al testului este 05,0=α ,iar valoarea critica a testului este 59,317,2;05,0,1; ===
−−F F F r nr critic α ,
deci regiunea critica este ( ) ( )∞+=+∞= ;59,3;criticc F R .
3
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 4/18
o Cum ccalccriticcalc R F F F ∈⇒> , respingem ipoteza nula H0 si acceptam ipotezaalternativa H1, concluzionand ca la un nivel de semnificatie de 5% si pe bazaacestor date de selectie, marimea companiei influenteaza semnificativ variatiaduratei de timp pana la prima promovare pentru un salariat.
o Calculele pot fi organizate in urmatorul tabel ANOVA
Source
of variation(Sursa variatiei)
SS(sum
of squares(suma
patratelor)
df – degreesof freedom(gradele delibertate)
MS mean of sum
of squares(dispersiilecorectate)
F F critic
Between groups
(Factorulde grupare X)
SSB = 404,4 r -1 = 3 1−=
r
SSB MSB
= 404,4 MSW
MSB F calc =
=23,0762
Fcritic=F0,05; 2, 17
=3,59
Within Groups
(Reziduala) SSW = 290 n-r = 17 r n
SSW MSW
−
=
=17,0588
TotalSST =SSB+SS
W
= 1098,8n-1 = 19
Problema poate fi rezolvata in Excel dupa cum urmeaza: Intr-o foaie de lucru se introduc datele din cele trei subesantioane pe coloane,
asa cum apare in Figura 1; In Excel 2003, din meniul principal Tools, submeniul Data Analysis, se alege
Anova: Single Factor; In Excel 2007 , din meniul principal Data, submeniul Data Analysis, se alege
Anova: Single Factor;
Figura 1. Introducerea datelor si alegerea Anova: Single Factor
din submeniul Data Analysis. Fereastra de dialog este prezentata in Figura 2.
4
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 5/18
Figura 2. Fereastra de dialog pentru Anova: Single Factor.
Output-ul consta din doua tabele: primul contine rezultatele obtinute in urma prelucrarii datelor din fiecare grupa, iar cel de-al doilea este tabelul ANOVA.
Anova: Single Factor
SUMMARY
Groups Count ( in ) Sum Average ( i y ) Variance (
2
i s )
Grupa 1(firme mici)
8 1n=
240
∑=
=8
11
j j y 30 1 y= 18.2857 2
1 s=
Grupa 2(firme mijlocii)
5 2n= 160 ∑=
=5
12
j j y 32 2 y= 17.5 2
2 s=
Grupa 3(firme mari)
7 3n=
308
∑=
=7
13
j j y 44 3 y= 15.3333
23 s=
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 808.8=SSB 2=r-1 404.4=MSB 23.7062=F calc 1.21E-05 3.59
Within Groups 290=SSW 17=n-r
17.0588=MS
W
Total 1098.8=SST 19=n-1
5
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 6/18
Observatii:
In Excel 2007 , submeniul Data Analysis se instaleaza astfel:- intr-o foie obisnuita de lucru, dati click pe Office Button (cerculetul stanga sus)
- click pe Excel Options- apoi click pe Add Ins- selectati cu un singur click Analisys Toolpack din partea deapta a ferestrei de la
Add Ins si apoi click GO
- apare o noua fereastra in care bifati Analysis ToolPack si de asemenea AnalysisToolPack VBA, iar apoi click pe OK
- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul principal Data.
In Excel 2003, submeniul Data Analysis se instaleaza astfel:- intr-o foie obisnuita de lucru, din meniul principal Tools, alegeti Add Ins
- apare o fereastra in care bifati Analysis ToolPack si de asemenea AnalysisToolPack VBA, iar apoi click pe OK
- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul principal Tools.
Alte probleme analiza dispersionala (ANOVA)
Problema 1. Un producător de sucuri de mere a realizat un nou produs: concentratlichid. Acest nou produs are următoarele avantaje faţă de vechiul produs: este mai practic de utilizat, are o calitate cel puţin la fel de bună şi cost semnificativ mai mic.Pentru a decide pe care dintre cele trei avantaje să-şi axeze strategia de marketing,directorul acestui departament a realizat un studiu în trei oraşe. În oraşul A campaniade publicitate s-a axat pe uşurinţa de utilizare a noului produs. În oraşul B campania de
publicitate s-a axat pe calitatea noului produs. În oraşul C campania de publicitate s-aaxat pe preţul mai mic al noului produs. În toate cele 3 oraşe s-a înregistrat numărul de
bucăţi vândute în 20 de săptămâni.
Uşurinţa
folosirii:
529 658 793 514 663 719 711 606 461 529
498 663 604 495 485 557 353 557 542 614
Calitate:804 630 774 717 679 604 620 697 706 615492 719 787 699 572 523 584 634 580 624
Preţ:672 531 443 596 602 502 659 689 675 512691 733 698 776 561 572 469 581 679 532
Directorul de marketing ar dori să ştie dacă există diferenţe semnificative întrenumărul de bucăţi vândute, în medie pe săptămână, în cele trei oraşe după terminareacampaniei de publicitate, considerand un nivel de semnificatie de 5%.
(Se cere rezolvarea in Excel ).
6
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 7/18
Problema 2. Directorul unei companii pentru fabricarea mobilei de birou, crede ca productivitatea lucratorilor depinde, printre altele si de succesiunea operatiilor pe caretrebuie sa le execute muncitorul. Pentru producerea unui birou ergonomic suntconsiderate doua variante de realizarea a acestuia ( din punctul de vedere al succesiuniioperatiilor). Pentru a decide care varianta este mai buna au fost selectati aleator 50 de
muncitori care asamblau birouri si au fost inregistrati timpii de asamblare.Timpii de asamblare (ore)Varianta A 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6;
6,0; 7,1; 6,1; 5,0; 6,3; 7,0; 6,4; 6,1; 6,6; 7,7; 6,4; 5,2; 6,7Varianta B 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9;
7,1; 5,8; 7,0; 5,7; 5,9; 4,9; 5,3; 4,2; 7,1Directorul doreste sa afle daca pentru un nivel de semnificatie de 5%, timpii deasamblare in cele doua variate difera.(Se cere rezolvarea in Excel ).
Problema 3. Pentru 7 magazine situate în cartierul A al unui oraş si 5 magazine situatein cartierul B al aceluiasi oras, se cunosc valorile vânzărilor (mil. lei). In urma aplicariimetodei de analiza dispersionala ANOVA si a prelucrarii datelor cu Excel, s-au obtinuturmatoarele rezultate:
ANOVA
Source of Variation SS df MS F F crit
Between Groups ………. 1 ………. 17,96283 4,964603
Within Groups ………. ……. 7,891429
Total ……….. ……
Se cere să se determine datele lipsa si sa se interpreteze rezultatele prelucrarii.Influenteaza cartierul in care sunt amplasate magazinele variatia vanzarilor in mod
semnificativ? Testati pentru un nivel de semnificatie de 5%.
Problema 4. Managerul unui lanţ de supermarketuri doreşte să deschidă un noumagazin în unul din cele 4 cartiere principale ale unui oras. Unul din factoriiimportanti luati in considerare in luarea deciziei de amplasare este venitul mediu lunar al rezidentilor fiecarui cartier. Se selectează astfel un eşantion de 80 gospodarii şi seînregistrează veniturile (mii lei). În urma prelucrării datelor in Excel s-au obţinutrezultatele:
Groups Count Sum AverageVarianc
e
Cartierul A 19 44,2 2,33 0,24Cartierul B 24 78,3 3,26 0,33Cartierul C 16 33,6 2,10 0,17Cartierul D 21 57,3 2,73 0,46
Testaţi, folosind testul Fisher, pentru o probabilitate de 95% ( Fcritic = 2,73) dacăexistă diferenţe semnificative între veniturile gospodariilor, diferenţe generate decartierul de rezidenţă.
7
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 8/18
Problema 1. Rezolvare:
o Unitatea statistica este noul produs concentrat lichid al respectivului producator de sucuri.
o Caracteristicile urmarite sunt:
X - variabila ce arata tipul de publicitate pe care s-a axat campania de promovarea noului produs;
- variabila nenumerica avand r =3 categorii sau variante de raspuns: avantajelegate de usurinta folosirii, avantaje legate de calitate si avantaje legate de
pret;
- aceste categorii ale variabilei X vor determina impartirea populatiei statisticein r =3 grupe si anume:
Grupa 1 (grupa produselor promovate in orasul A unde campania de publicitate s-a axat pe usurinta folosirii),
Grupa 2 (grupa produselor promovate in orasul B unde campania de
publicitate s-a axat pe calitate),Grupa 3 (grupa produselor promovate in orasul C unde campania de publicitate s-a axat pe pret);
- astfel, variabila X , marimea firmei, se mai numeste si factor de grupare.
si
Y - variabila ce arata numarul de bucati vandute intr-o saptamana;- variabila numerica de interes.
o Fie ( )2111 ,~ σ µ N Y variabila ce arata numarul de bucati vandute intr-o saptamana
in orasul A – Grupa 1, unde 1 µ este media variabilei la nivelul intregii grupe.In Grupa 1 se realizeaza o selectie de volum 201 =n saptamani pentru care seinregistreaza valorile variabilei Y 1 – numarul de bucati vandute:
}614...,,658,529{1,120,12,11,1 ==== n y y y y bucati.
Media de selectie de grupa este
55,57720
11551...
1
,12,11,1
11
==
+++
=
n
y y y y
nbucati/saptamana,
iar dispersia de selectie de grupa este
( ) ( ) ( )10775
1
...
1
21,1
212,1
211,12
11 =
−
−++−+−=
n
y y y y y y s
n .
o Fie ( )2222 ,~ σ µ N Y variabila ce arata numarul de bucati vandute intr-o saptamana
in orasul B – Grupa 2, unde 2 µ este media variabilei la nivelul intregii grupe.In Grupa 2 se realizeaza o selectie de volum 202 =n saptamani pentru care seinregistreaza valorile variabilei Y 2 – numarul de bucati vandute:
}624,...,630,804{2,220,22,21,2 ==== n y y y y bucati.
Media de selectie de grupa este
65320
13060...
2
,22,21,2
22
==+++
=n
y y y y
nbucati/saptamana,
8
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 9/18
iar dispersia de selectie de grupa este( ) ( ) ( )
105,72381
...
2
2
2,2
2
22,2
2
21,22
2
2 =−
−++−+−=
n
y y y y y y s
n .
o Fie ( )2333 ,~ σ µ N Y variabila ce arata numarul de bucati vandute intr-o saptamana
in orasul C – Grupa 3, unde 3 µ este media variabilei la nivelul intregii grupe.In Grupa 3 se se realizeaza o selectie de volum 203 =n firme pentru care seinregistreaza valorile variabilei Y 3 – numarul de bucati vandute:
}532,...,531,672{2320,32,31,3 ==== n y y y y bucati.
Media de selectie de grupa este
65,60820
12173...
3
,32,31,3
33
==+++
=n
y y y y
nbucati/saptamana,
iar dispersia de selectie de grupa este
( ) ( ) ( ) 239,86701
...
3
2
3,3
2
32,3
2
31,32
33 =
−−++−+−=
n y y y y y y s n .
o Media totala la nivelul intregului esantion de volum 60321 =++= nnnn este
60
2065,608206532055,577
321
332211 ⋅+⋅+⋅=
++
⋅+⋅+⋅=
nnn
n yn yn y y
06,613=⇒ y bucati/saptamana.
o Ipotezele statistice sunt:
3210 : µ µ µ == H (factorul de grupare – tipul de publicitate pe care s-a axat campaniade promovare a noului produs nu influenteaza semnificativvariatia numarului de bucati vandute intr-o saptamana)
{ } l k l k H ≠∈∃ ,3,2,1,:1 astfel incat l k µ µ ≠ (cel putin doua medii sunt semnificativdiferite, adica factorul de grupare – tipul de publicitateinfluenteazasemnificativ variatia numarului de bucati vandute intr-osaptamana)
o Pragul de semnificatie al testului este 05,0=α .
o Statistica testului este
( )57,211
=−=−∈
−
−== r nr Fisher
r n
SSW r
SSB
MSW
MSB F .
o Introducerea datelor intr-o foaie de lucru in Excel , apelarea optiunii Data Analysis
si Anova: Single Factor , precum si rezultatele prelucrarii datelor sunt prezentate in
imaginile de mai jos.
9
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 10/18
Anova: Single Factor
SUMMARYGroups Count Sum Averag Variance
10
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 11/18
e
Grupa 1 Usurinta folosirii 20 11551 577,55 10775
Grupa 2 Calitate 20 13060 653 7238,105
Grupa 3 Pret 20 12173 608,65 8670,239
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 57512,23 2 28756,12 3,233041 0,046773 3,158846
Within Groups 506983,5 57 8894,447
Total 564495,7 59
o Valoarea calculata a statisticii testului este 233,3=calc F ,iar 158,357,2;05,0,1;
===−−
F F F r nr critic α ,
deci regiunea critica este ( ) ( )∞=∞= ;158,3;criticc F R
o Cum ccalc R F ∈= 233,3 , respingem ipoteza nula H 0 si acceptam ipoteza alternativa H 1, concluzionand ca tipul de publicitate pe care se bazeaza campania de promovare, adica prezentarea diferitelor avantaje ale noului produs, are o influentasemnificativa asupra variatiei numarului de bucati vandute.
Problema 2. Rezolvare:o Populatia statistica este multimea birourilor realizate intr-o fabrica de mobila.o Unitatea statistica este un birou.o Caracteristicile urmarite sunt:
X - variabila ce arata varianta de realizare a unui birou;
- exista are r =2 variante numite simbolic varianta A si varianta B; astfel camultimea birourilor realizate in acea fabrica va fi impartita in r =2 grupe sianume:
Grupa 1 (grupa birourilor realizate in varianta A),Grupa 2 (grupa birourilor realizate in varianta B);
- variabila X , varianta de realizare, se mai numeste si factor de grupare.
si
Y - variabila ce arata durata de timp, in ore, in care un muncitor asambleaza un birou;
- variabila numerica de interes.
o Fie ( )2111 ,~ σ µ N Y variabila ce arata durata de timp, in ore, in care un muncitor
asambleaza un birou prin varianta A – Grupa 1, unde 1 µ este media variabilei lanivelul intregii grupe.Din Grupa 1 se selecteaza 271 =n muncitori pentru care se inregistreaza timpii derealizare a birourilor prin varianta A, adica se inregistreaza valorile variabilei Y 1:
}7,6...,;0,5;8,6{1,127,12,11,1 ==== n y y y y ore.
Media de selectie de grupa este
11
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 12/18
2629,627
1,169...
1
,12,11,1
11
==+++
=n
y y y y
nore,
iar dispersia de selectie de grupa este( ) ( ) ( )
8339,01
...
1
2
1,1
2
12,1
2
11,12
11 =
−
−++−+−=
n
y y y y y y s
n .
o Fie ( 2
222 ,~ σ µ N Y variabila ce arata durata de timp, in ore, in care un muncitor
asambleaza un birou prin varianta B – Grupa 2, unde 2 µ este media variabilei la
nivelul intregii grupe.Din Grupa 2 se selecteaza 231 =n muncitori pentru care se inregistreaza timpii derealizare a birourilor prin varianta B, adica se inregistreaza variabilei Y 2:
}1,7...,;6,6;7,5{2,223,22,21,2 ==== n y y y y ore.
Media de selectie de grupa este
0217,623
5,138...
2
,22,21,2
22
==
+++
= n
y y y
yn
ore,
iar dispersia de selectie de grupa este( ) ( ) ( )
3699,11
...
2
2
2,2
2
22,2
2
21,22
22 =
−
−++−+−=
n
y y y y y y s
n .
o Media totala la nivelul intregului esantion de volum 5021 =+= nnn este
50
230217,6272629,6
21
2211 ⋅+⋅=
+
⋅+⋅=
nn
n yn y y
1519,6=⇒ y ore.
o Ipotezele statistice sunt:
210 : µ µ = H (factorul de grupare – varianta de asamblare a unui birou nuinfluenteaza semnificativ variatia timpului de realizare a cestuia)
211 : µ µ ≠ H (mediile sunt semnificativ diferite, cu alte cuvinte varianta de asamblarea unui birou influenteaza semnificativ variatia timpului de realizare acestuia)
o Pragul de semnificatie al testului este 05,0=α .
o Statistica testului este
( )48,111
=−=−∈
−
−== r nr Fisher
r n
SSW r
SSB
MSW
MSB F .
Grupa 1(Varianta A)
Grupa 2(Varianta B)
6,8 5,7
5 6,6
7,9 8,55,2 6,5
7,6 5,9
12
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 13/18
5 6,7
5,9 6,6
5,2 4,2
6,5 4,2
7,4 4,5
6,1 5,3
6,2 7,9
7,1 7
4,6 5,9
6 7,1
7,1 5,8
6,1 7
5 5,7
6,3 5,9
7 4,9
6,4 5,3
6,1 4,2
6,6 7,17,7
6,4
5,2
6,7
Rezultatele prelucrarii datelor in Excel se prezinta sub forma urmatoarelor doua tabele:
Anova: Single Factor
SUMMARY
Groups Count Sum Average VarianceGrupa 1(Varianta A) 27 169,1 6,262963 0,83396
Grupa 2(Varianta B) 23 138,5 6,021739 1,36996
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0,722707 1 0,722707 0,669404 0,417303 4,042647
Within Groups 51,82209 48 1,079627
Total 52,5448 49
o Valoarea calculata a statisticii testului este 669,0=calc F ,iar 042,4
48,1;05,0,1;===
−− F F F r nr critic α ,
deci regiunea critica este ( ) ( )∞=∞= ;042,4;criticc F R
o Cum ccalcR F ∉= 669,0 , nu avem suficiente motive pentru a respinge ipoteza nula
H 0, deci o acceptam, concluzionand ca varianta de realizare a unui birou nuinfluenteaza semnificativ variatia timpului in care un muncitor lucreaza pentruasamblare.
Problema 3. Rezolvare:o Unitatea statistica este un magazin.
13
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 14/18
o Caracteristicile urmarite sunt:
X - variabila ce arata cartierul din oras unde se gaseste magazinul;
- orasul are r =2 cartiere numite simbolic A si B, astfel ca multimeamagazinelor din oras va fi impartita in r =2 grupe si anume:
Grupa 1 (grupa magazinelor situate in cartierul A),Grupa 2 (grupa magazinelor situate in cartierul B);
- astfel, variabila X , cartierul, se mai numeste si factor de grupare.siY - variabila ce arata valoarea vanzarilor, in mil. lei, a unui magazin intr-o
anumita perioada;
- variabila numerica de interes.
o Fie ( )2111 ,~ σ µ N Y variabila ce arata valoarea vanzarilor unui magazin situat in
cartierul A – Grupa 1, unde 1 µ este media variabilei la nivelul intregii grupe.In Grupa 1 se realizeaza o selectie de volum 71 =n magazine pentru care seinregistreaza valorile variabilei Y 1 – valoarea vanzarilor:
}...,,,{1,17,12,11,1 n y y y y = mil. lei.
Media de selectie de grupa este 1 y mil.lei si dispersia de selectie de grupa este 2
1 s .
o Fie ( )2222 ,~ σ µ N Y variabila ce arata valoarea vanzarilor unui magazin situat in
cartierul B – Grupa 2, unde 2 µ este media variabilei la nivelul intregii grupe.In Grupa 2 se realizeaza o selectie de volum 52 =n magazine pentru care se
inregistreaza valorile variabilei Y 2 – valoarea vanzarilor:},...,,{2,25,22,21,2 n y y y y = mil. lei.
Media de selectie de grupa este 2 y mil.lei si dispersia de selectie de grupa este 2
2 s .
o Volumul intregului esantion este 1221 =+= nnn magazine.
o Ipotezele statistice sunt:
210 : µ µ = H (cartierul in care este amplasat magazinul nu influenteaza semnificativvariatia vanzarilor)
211 : µ µ ≠ H (mediile sunt semnificativ diferite, cu alte cuvinte factorul de grupare –
cartierul influenteaza semnificativ variatia vanzarilor)o Pragul de semnificatie al testului este 05,0=α .
o Statistica testului este
( )10,111=−=−∈
−
−== r nr Fisher
r n
SSW r
SSB
MSW
MSB F .
In urma prelucrarii datelor de selectie s-a obtinut urmatorul tabel ANOVA:
ANOVA
Source of SS df MS F F crit
14
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 15/18
Variation
BetweenGroups
SSB=141,7523976 r-1 = 1 MSB=141,7523976 Fcalc =17,9628 4,9646
Within Groups SSW=78,91429 n-r = 10 MSW=7,891429
Total SST=220,66 n-1 = 11
Cum =⋅=⇒= calccalc F MSW MSB MSW
MSB F
96283,17891429,7 ⋅=
7523976,141=⇒ MSB
Cum ( ) =⋅−=⇒−
= MSBr SSBr
SSB MSB 1
1
( ) 7523976,14112 ⋅−=
7523976,141=⇒SSB
Cum ( ) =⋅−=⇒−
= MSW r nSSW
r n
SSW MSW
( ) 891429,7212 ⋅−=
91429,78=⇒SSW
Cum SSW SSBSST += 66,220=⇒SST .
o Regiunea critica a testului este ( ) ( )∞=∞= ;96,4;criticc F R si cum
ccalc R F ∈= 96,17 , atunci respingem ipoteza nula H 0 si acceptam ipotezaalternativa H 1, cartierul in care este amplasat magazinul influenteaza semnificativvariatia vanzarilor.
Problema 4. Rezolvare:o Populatia statistica este multimea gospodariilor rezidentilor dintr-un oras.o Unitatea statistica este o gospodarie.o Caracteristicile urmarite sunt:
X - variabila ce arata cartierul din oras unde se afla gospodaria;
- orasul are r =4 cartiere numite simbolic A, B, C si D, astfel ca populatiastatistica a gospodariilor rezidentilor acelui oras va fi impartita in r =4 grupesi anume:
Grupa 1 (grupa gospodariilor situate in cartierul A),
Grupa 2 (grupa gospodariilor situate in cartierul B),Grupa 3 (grupa gospodariilor situate in cartierul C),
15
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 16/18
Grupa 4 (grupa gospodariilor situate in cartierul D);
- astfel, variabila X , cartierul, se mai numeste si factor de grupare.
si
Y - variabila ce arata venitul lunar, in mii lei, al unei gospodarii;
- variabila numerica de interes.
o Fie ( )2111 ,~ σ µ N Y variabila ce arata arata venitul lunar, in mii lei, al unei
gospodarii din cartierul A – Grupa 1, unde 1 µ este media variabilei la nivelulintregii grupe.In Grupa 1 se realizeaza o selectie de volum 191 =n gospodarii pentru care seinregistreaza valorile variabilei Y 1:
}...,,,{1,119,12,11,1 n y y y y = mii lei/luna.
In urma prelucarii datelor din acest subesantion, se obtine media de selectie degrupa este
33,219
2,44...
1
,12,11,1
11
==+++
=n
y y y y
nmii lei/luna,
iar dispersia de selectie de grupa este 24,02
1 = s .
o Fie ( )2222 ,~ σ µ N Y variabila ce arata venitul lunar, in mii lei, al unei gospodarii
din cartierul B – Grupa 2, unde 2 µ este media variabilei la nivelul intregii grupe.In Grupa 2 se realizeaza o selectie de volum 242 =n gospodarii pentru care seinregistreaza valorile variabilei Y 2:
},...,,{2,224,22,21,2 n y y y y = mii lei/luna.
In urma prelucarii datelor din acest subesantion, media de selectie de grupa este
26,324
3,78...
2
,22,21,2
22
==+++
=n
y y y y
nmii lei/luna,
iar dispersia de selectie de grupa este 33,02
2 = s .
o Fie ( )2333 ,~ σ µ N Y variabila ce arata venitul lunar, in mii lei, al unei gospodarii
din cartierul C – Grupa 3, unde 3 µ este media variabilei la nivelul intregii grupe.In Grupa 3 se se realizeaza o selectie de volum 163 =n gospodarii pentru care seinregistreaza valorile variabilei Y 3:
},...,,{2,316,32,31,3 n y y y y = mii lei/luna.
In urma prelucarii datelor din acest subesantion, media de selectie de grupa este
10,216
6,33...
3
,32,31,3
33
==+++
=n
y y y y
nmii lei/luna,
iar dispersia de selectie de grupa este 17,023 = s .
o Fie ( 2
444 ,~ σ µ N Y variabila ce arata venitul lunar, in mii lei, al unei gospodarii
din cartierul D – Grupa 4, unde 4 µ este media variabilei la nivelul intregii grupe.
In Grupa 4se se realizeaza o selectie de volum 214 =n de gospodarii pentru carese inregistreaza valorile variabilei Y 4:
16
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 17/18
},...,,{4,421,42,41,4 n y y y y = mii lei/luna.
In urma prelucarii datelor din acest subesantion, media de selectie de grupa este
73,221
3,57...
4
,42,41,4
44
==+++
=n
y y y y
nmii lei/luna,
iar dispersia de selectie de grupa este 46,02
4 = s .
o S-au selectat astfel, la nivelul intregului oras, 804321 =+++= nnnnn degospodarii.
o Ipotezele statistice sunt:
210 : µ µ = H (cartierul de rezidenta al gospodariilor nu influenteaza semnificativvariatia venitului lunar al acestora)
{ } l k l k H ≠∈∃ ,4,3,2,1,:1 astfel incat l k µ µ ≠ (cel putin doua medii suntsemnificativ diferite, adica factorul de grupare – cartierul influenteazasemnificativ variatia venitului lunar al unei gospodarii)
o Nivelul de incredere al testului este 95%, deci nivelul de semnificatie este05,0=α .
o Statistica testului este
( )76,311=−=−∈
−
−== r nr Fisher
r n
SSW r
SSB
MSW
MSB F .
o In urma prelucrarii datelor de selectie se obtine:
• Media totala la nivelul intregului esantion de volum 804321 =+++= nnnnn este
80
2173,21610,22426,31933,2
4321
44332211 ⋅+⋅+⋅+⋅=
+++
⋅+⋅+⋅+⋅=
nnnn
n yn yn yn y y
668,2=⇒ y mii lei/luna.• Variatia dintre grupe
( ) ( ) ( ) ( )
( ) ( )
( ) ( ) 21668,273,216668,210,2
24668,226,319668,233,2
22
22
4
2
43
2
32
2
21
2
1
⋅−+⋅−+
+⋅−+⋅−=
=⋅−+⋅−+⋅−+⋅−= n y yn y yn y yn y ySSB
82448,15=⇒SSB
• Variatia din interiorul grupelor ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) 46,012117,011633,012324,0119
1111 2
44
2
33
2
22
2
11
⋅−+⋅−+⋅−+⋅−=
=⋅−+⋅−+⋅−+⋅−= sn sn sn snSSW
66,23=⇒SSW
• Variatia totala
66,2382448,15 +=
+= SSW SSBSST
48448,39=⇒SST
•
Dispersia factoriala corectata (cu gradele de libertate31 =−r
)
17
7/15/2019 Probleme Rezolvate Analiza Dispersionala ANOVA
http://slidepdf.com/reader/full/probleme-rezolvate-analiza-dispersionala-anova 18/18
3
82448,15
1=
−
=r
SSB MSB
274826,5=⇒ MSB
• Dispersia reziduala corectata (cu gradele de libertate 76=− r n )
76
66,23=
−
=
r n
SSW MSW
311315,0=⇒ MSW
• Valoarea calculata a statisticii testului este
311315,0
274826,5==
MSW
MSB F calc
9436,16=⇒ calc F
Tabelul ANOVA:
ANOVA
Source of Variation SS df MS F F crit
Between Groups SSB=15,82448 r-1 = 3 MSB=5,274826 Fcalc =16,9436 2,73Within Groups SSW=23,66 n-r = 76 MSW=0,311315
Total SST=39,48448 n-1 = 79
o Cum ( )∞=∈= ;73,294,16 ccalc R F , atunci respingem ipoteza nula H 0 si acceptamipoteza alternativa H 1, cartierul in care se gaseste gospodaria influenteazasemnificativ variatia veniturilor.
18