diszkriminanciaanalízis az spss -ben
TRANSCRIPT
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Diszkriminancia-analízisaz SPSS-benaz SPSS-ben
Petrovics PetraDoktorandusz
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Diszkriminancia-analízis folyamata
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
FeladatMegnyitás: Employee_data.sav
Milyen tényezőktől függ a dolgozók beosztása?
Független változó (x)Független változó (x)
Nem metrikus Metrikus
Fü
ggő
vált
ozó
(y)
Nem
met
riku
s
Kereszttábla
elemzés
Diszkriminancia-analízis,
Logisztikus regresszió
Met
riku
s
VarianciaanalízisKorreláció- és
regresszióelemzés
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
1. Adatok, változók
X: Metrikus változók / Dummy változók
(age, education level, current salary, beginning salary,
2.• Feltételek vizsgálata
(age, education level, current salary, beginning salary, month since hire, previous experience, minorityclassification)
Adatok kizárólagossága:
Pl. aki vezető, az nem hivatalnok
Mindenki valamelyik csoport tagja, stb
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
2. Normális eloszlásGraph / Histogram
Nonparametric Tests / 1-Sample K-S Test
2.• Feltételek vizsgálata
Stb.
• n• Mahalanobis
távolság
Nonparametric Tests / 1-Sample K-S Test
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
3. Multikollinearitás (vagy Pooled Within-Groups Matrices)
2.• Feltételek vizsgálata
Faktoranalízis (?)
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
4. Outlier: Mahalanobis távolság
5. Homoszkedaszticitás: Box’s M
Analyze / Classify / Discriminant…
2.• Feltételek vizsgálata
Elemzés lefuttatásával
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Multikollinearitás (r)
Homoszkedaszticitás:nemcsak varianciaállandóság, de variancia-kovariancia mátrixokegyezősége is feltétel
Változók bevonása: • milyen mértékben csökken a
Wilks’ λ• Milyen mértékben csökken a
nem magyarázott variancia• Kisebb M-távolság• Legnagyobb F-érték• Rao’s V értékének növekedése
OutlierNormál eloszlás
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
mert nem ugyanannyimenedzser van, mint pl.hivatalnok
5.• Érvényesség
vizsgálat5. vizsgálat
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output
Megmutatja, hogy vannak-e különbségek a csoportosító változó által kialakított
- Month since hire- Minority- Age (?)STEPWISE
Magas F érték, alacsony Wilks’ Lambda !!!A kevés diszkriminatív értékkel bíró változók astepwise diszkriminanciaelemzés segítségéveleltávolíthatók.
Megmutatja, hogy vannak-e különbségek a csoportosító változó által kialakítottcsoportok átlagai között: ha a csoportosító változó a varianciának nagy részétmagyarázza, akkor a csoportok átlagai között szignifikáns eltérés mutatkozik, ésa mutató értéke 0-hoz közelít. Így az egyes változók az alapján kerülhetnekbevonásra a diszkriminanciaelemzésbe, hogy milyen mértékben képesek aWilks’ λ értékét csökkenteni.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet OutputStepwise Statistics:
1. Education Level2. Previous Experience3. Current Salary4. Age5. Beginning Salary
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Group Statistics
Employment Category Mean Std. DeviationValid N (listwise)
Unweighted Weighted
Clerical Educational Level (years) 12.86 2.330 362 362.000
Current Salary 27818.90 7569.196 362 362.000
Beginning Salary 14079.05 2893.376 362 362.000
Months since Hire 81.11 10.093 362 362.000
Previous Experience (months) 85.12 95.393 362 362.000
Minority Classification .24 .428 362 362.000
age 33.06 12.140 362 362.000
Custodial Educational Level (years) 10.19 2.219 27 27.000
Current Salary 30938.89 2114.616 27 27.000
Beginning Salary 15077.78 1341.235 27 27.000
Months since Hire 81.56 8.487 27 27.000
Output
Months since Hire 81.56 8.487 27 27.000
Previous Experience (months) 298.11 101.426 27 27.000
Minority Classification .48 .509 27 27.000
age 48.59 9.532 27 27.000
Manager Educational Level (years) 17.25 1.612 84 84.000
Current Salary 63977.80 18244.776 84 84.000
Beginning Salary 30257.86 9980.979 84 84.000
Months since Hire 81.15 10.410 84 84.000
Previous Experience (months) 77.62 73.260 84 84.000
Minority Classification .05 .214 84 84.000
age 31.50 6.433 84 84.000
Total Educational Level (years) 13.49 2.886 473 473.000
Current Salary 34418.45 17093.723 473 473.000
Beginning Salary 17009.25 7877.562 473 473.000
Months since Hire 81.14 10.048 473 473.000
Previous Experience (months) 95.95 104.680 473 473.000
Minority Classification .22 .415 473 473.000
age 33.67 11.784 473 473.000
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output
Vs.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet OutputEgyező log determinánsok
(nagyon alacsony log determinánssal
rendelkező csoportokat célszerű
törölni, ha M szignifikáns – minél
magasabb kritikus p-érték)
H0: homoszkedasztikus (egyező kovariancia mátrixok)
H1: heteroszkedasztikus
p<0.000 szignifikancia-szintenfogadjuk el, hogy homoszkedasztikus
(nagy mintaelemszámnál a szignifikancia eredménye kevésbé jelentős)
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Kevésbé járul a
magyarázó erő
Nő a magyarázó erő
Output3. • Diszkriminancia függvény
Stepwise:
magyarázó erő
növekedéséhez Szignifikáns diszkriminancia függvény p=0.000λ=22,3% a nem magyarázott variancia (≈ ANOVA H2 inverze)
KANONIKUS DISZKRIMINANCIA FÜGGVÉNY
Min {p;Y kategóriáinak száma-1} = 2
A különbözőség azon része, amit a DF1 nem foglal magába
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output
DF külső szórásnégyzetDF belső szórásnégyzet
DF által magyarázott különbözőség
• Többszörös korreláció a magyarázó változók és a diszkriminancia fv. között
• H komplementere• 1 fv. esetében a négyzete ≈R2 (modell
illeszkedés) • A DF1 0,8262=68,23%-ban magyarázza
a csoportosító változó varianciáját
DF által magyarázott különbözőségDF által nem magyarázott különbözőség
DF-k a magyarázottkülönbözőség hány %-tmagyarázzák (∑100%)
Az DF1 83,4%-ban járul
hozzá a különbözőség
magyarázatához, míg a
DF2 csak 16,6%-ban.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output3-4. • DF, Értelmezés
Diszkrimináló hatás értelmezése → DF elnevezése
• DF-k és a magyarázó változókközötti korreláció• Változók relatív fontossága (a
korreláció abszolút mértékéneksorrendjében)• ≈ faktor loading (határ: >0,3 fontos)
• Változók fontossága • Kapcsolat iránya• ≈ β együtthatók (parciális)Pl. DF1-t a leginkább a
jelenlegi fizetés, míg DF2-t a
korábbi munkatapasztalat
határozza meg
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output
bi együtthatók
Diszkriminancia függvény paraméterei:
(A mértékegységek különbözősége miatt nem látszik a jelentősége, de ezek is diszkriminálnak)
1,748age 0,038experience previous 0,013leveleducation -0,201DF
4,923-age 0,019experience previous 0,002-leveleducation 0,082DF
2
1
+−+=
+=
b: a változók parciális hozzájárulása a DF-ekhez (a többi változó változatlansága mellett)
Dummy változók használata esetén: elemzés a használatuk nélkül → használatukkal (a kanonikus korreláció négyzetében mért különbség a Dummy változók magyarázó ereje)
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Átlagos D értékek
OutputEgy egyed ahhoz a csoporthoztartozik, amely csoport centroidjáhoza legközelebb esik a diszkriminanciaértéke (discriminant score)(Mahalanobis távolság alapján)Pl: 1. személy: manager
DiscriminantPredicted group Discriminant
score
Predicted group
membership
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet Output
5.• Érvényesség
vizsgálat
Találati arány Helyes kategorizálás
Új dolgozó: abba csoportba tartozik, amelyik centroidjától a kiszámított Mahalanobis távolság értéke a legalacsonyabb
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Köszönöm a figyelmet!Köszönöm a figyelmet!