statisztika ii. empirikus eloszlások elemzése előadó: prof. dr. besenyei lajos
DESCRIPTION
STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos. TÉMAKÖRÖK Gyakorisági sorok fajtái Kvantilisek Középértékek Szóródás. Empírikus eloszlás: A megfigyelések (kísérletek) eredményeként kapott adatok eloszlása. (elméleti eloszlás – valószínűségszámítás). - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/1.jpg)
STATISZTIKA II.
Empirikus eloszlások elemzése
Előadó: Prof. Dr. Besenyei Lajos
![Page 2: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/2.jpg)
TÉMAKÖRÖK
1. Gyakorisági sorok fajtái
2. Kvantilisek
3. Középértékek
4. Szóródás
![Page 3: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/3.jpg)
A számszerű adatok rendezési módja:
- Gyakorisági sor készítése
- Kvantilis értékek megadása
Empírikus eloszlás:
A megfigyelések (kísérletek) eredményeként
kapott adatok eloszlása.
(elméleti eloszlás – valószínűségszámítás)
![Page 4: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/4.jpg)
Gyakorisági sor:
Valamely sokaságnak egy mennyiségi
ismérv szerinti csoportosítása
Tipikus eset: osztályközös gyakorisági sor
(kiosztott példa)
![Page 5: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/5.jpg)
A gyakorisági sorból képezhető további
mennyiségi sortípusok:
- Értékösszeg sor
- Relatív gyakorisági és relatív értékösszegsor
- Kumulált (halmozott) gyakorisági és értékösszeg sorok
- Kumulált relatív gyakorisági és relatív értékösszegsor
(kiosztott példa)
![Page 6: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/6.jpg)
Kvantilisek:
Az ismérvértékek elhelyezkedésének tömör
leírását adják.
Elnevezésük:
Medián (Me) ha két részre osztjuk
Kvartilis (Qj) ha négy részre osztjuk
Kvintilis (Kj) ha öt részre osztjuk
Decilis (Dj) ha tíz részre osztjuk
Percentilis (Pj) ha száz részre osztjuk
![Page 7: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/7.jpg)
Meghatározásuk:
a) Rangsort készítünk (növekvő sorrend)
b) Meghatározzuk a kvantilis értékek sorszámát
(osztópontját).
Ahol:n= az adatok számak= az egyenlő részek számaj= 1,2,…k-1 az adott kvantilis értékeken belüli
sorszám
1 nk
js j
![Page 8: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/8.jpg)
c) A rangsorban az sj sorszámhoz tartozó
ismérvértékek megkeresése.
![Page 9: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/9.jpg)
A KIOSZTOTT PÉLDA ALAPJÁN:
Medián:
Kvartilisek: (Qj)
481952
1s
721954
3
481954
2
241954
1
3
2
1
s
s
s Q1=159 ezer forint
Q2= 201 ezer forint
Q3= 269 ezer forint
Me=201 ezer Ft
![Page 10: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/10.jpg)
Decilis:
j Sorszám (sj) Decilis érték (Dj)
1 9,6 105,6
2 19,2 140,4
3 28,8 174,0
4 38,4 190,8
5 48,0 201,0
6 57,6 223,0
7 67,2 258,2
8 76,8 299,8
9 86,4 385,4
102+0,6 (108-102)=105,6
2,19962,019510
22 s
D2=140+0,2(142-140)=140,4
6,910
96195
10
11 s
![Page 11: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/11.jpg)
Box-and-wishkers ábra:
(az adatok középső, 50%-át „dobozba” zárva tünteti fel)
xmin xmaxQ1 Me Q3
![Page 12: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/12.jpg)
A vizsgált jövedelmek Box-and wishkers ábrája
A családok havi jövedelme 54 ezer és 490 ezer Ft között ingadozik. A családok középső 50%-a 159 ezer és 269 ezer Ft között jövedelemmel rendelkezik.
50 200150100 250 300 350 400 450 500
Xmin=54 Xmax=490Q1(159) Me Q3(269)
![Page 13: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/13.jpg)
KÖZÉPÉRTÉKEK
A mennyiségi ismérv megfigyelt értékeit
- a centrális tendenciát - egyetlen számmal
mérik. A jellemző közös vonást emelik ki.
Értékelésükhöz elengedhetetlen a szóródás
ismerete, amellyel az eltérő sajátosságokat
lehet kiemelni.
![Page 14: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/14.jpg)
KÖZÉPÉRTÉKEK FAJTÁI
Átlagok Helyzeti középértékek
számtani átlag Módusz (Mo)
mértani átlag Medián (Me)
(geometriai)
harmonikus átlag
négyzetes átlag
x
gx
hx
qx
![Page 15: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/15.jpg)
a) Számtani átlag:
Egyszerű:
(tehát: ha a megfigyelt értékek helyébe a számtani átlagot tesszük, ezek kösszege egyenlő az eredeti értékek összegével.)
n
xx
f
fxx
Súlyozott:
xxn
![Page 16: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/16.jpg)
Érzékeny a kiugró értékekre (outlierek)
A súlyok lehetnek a relatív gyakoriságok
(megoszlási viszonyszámok) is.
A súlyozott számtani átlag nagysága két
tényezőtől függ:
a) Átlagolandó értékek abszolút nagyságától és a
b) Súlyok arányaitól
![Page 17: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/17.jpg)
Számítás a kiosztott példa alapján, egyedi adatokból:
Gyakorisági sorból:
4,22195
21036
95
449....6654
x ezer Ft
8,20095
20975
95
4752....12514758
x ezer Ft
![Page 18: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/18.jpg)
b) Mértani átlag:
Egyszerű: Súlyozott:
Ha a megfigyelt értékek helyébe a mértani átlagot tesszük, azok szorzata megegyezik az eredeti adatok szorzatával.
Akkor használjuk, ha az értékek szorzata értelmezhető.
ng xx f fxx
![Page 19: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/19.jpg)
c) Harmonikus átlag:
Egyszerű: Súlyozott:
d) Négyzetes átlag:
Egyszerű Súlyozott:
x
nxh 1
xff
xh
n
xxq
2
f
fxxq
2
![Page 20: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/20.jpg)
Átlagok nagyságrendje:
Leggyakoribb a számtani átlag, használata
maxmin xxxxxx qgh
![Page 21: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/21.jpg)
HELYZETI KÖZÉPÉRTÉKEK
Módusz (Mo)
A leggyakrabban előforduló, a „legdivatosabb – la mode”- érték
Medián (Me)
A ténylegesen középen lévő érték – ugyanannyi kisebb mint nagyobb érték található nála.
Diszkrét ismérveknél egyszerű a meghatározása. Osztályközök esetén becslést kell végezni.
![Page 22: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/22.jpg)
Számítás a kiosztott példa alapján:
9,1905021231423
14230,150
oM ezer Ft
95,2055021
455,47200
Me ezer Ft
![Page 23: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/23.jpg)
SZÓRÓDÁS
Az értékek különbözőségét, változékonyságát
szóródásnak nevezzük.
Mérőszámai:
a) a szóródás terjedelme (range) T
b) interkvartilis terjedelem (IQT)
c) átlagos abszolút eltérés (δ)
d) szórás (σ)
e) relatív szórás (v)
![Page 24: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/24.jpg)
95 család havi jövedelmének adatai (ezer Ft)
2007. január 1-én
54 66 70 77 85 90 95 99 102 108 111
116 119 120 125 131 135 135 140 142 148 149
153 159 163 170 172 174 174 176 176 177 180
182 183 184 189 190 192 193 195 195 196 197
199 200 201 201 203 204 206 208 211 214 215
216 220 225 228 230 231 233 235 237 238 248
258 259 260 264 266 269 276 285 297 299 300
305 308 315 326 328 335 344 355 384 388 390
396 405 410 432 440 462 490
![Page 25: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/25.jpg)
50 ezer forintos osztályközzel
Havi jövedelem( ezer Ft) Családok száma
50,0 – 99,9 8
100,0 – 149,9 14
150,0 – 199,9 23
200,0 – 249,9 21
250,0 – 299,9 10
300,0 – 349,9 8
350,0 – 399,9 5
400,0 – 449,9 4
450,0 – 499,9 2
Összesen: 95
![Page 26: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/26.jpg)
jövedelem családok száma jövedelem összegeOsztályköz felső hatásánál kisebb
osztályközOsztályközép
Gyakori-ság
Relatív gyakoriság tényleges Becsült
Családok
száma
Jövedelem
összege
95 család havi jövedelmi adatai (1000 Ft)
2007. február 15-én
![Page 27: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/27.jpg)
A struktúraváltozásról:
A megoszlási és dinamikus viszonyszámok
alakulása – a közöttük lévő összefüggés.
Példa: Egy település lakosságának száma és
megoszlása iskolai végzettség szerint 2000-ben
és 2006-ban:
![Page 28: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/28.jpg)
Számítás
Megnevezés 2000. (I. 1.) 2006. (I. 1)AlapKözépFelső
12.5009.0003.700
10.20010.8005.100
Összesen: 25.200 26.100
Megnevezés Megoszlás % Változás % Vd
2000. I. 1. 2006. I. 1.
AlapKözépFelső
49,6
35,7
14,7
39,1
41,4
19,1
81,6
120,0
137,6Összesen: 100,0 100,0 103,6
![Page 29: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/29.jpg)
Töltse ki tetszőleges számokkal az alábbi táblázatokat:
Egy vállalkozás adatai:Beosztás Megoszlás % Változás %
December JanuárBeosztottKözépvezetőFelsővezető
100118125
Összesen 100,0 100,0 118
Beosztás Megoszlás % Vd %December Január
BeosztottKözépvezetőFelsővezető
265222
30 5218
Összesen 100,0 100,0 92
![Page 30: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos](https://reader036.vdocuments.mx/reader036/viewer/2022062315/5681545a550346895dc27281/html5/thumbnails/30.jpg)
Szórás a leggyakrabban használt szóródási mérőszám.
Kiszámítása:
egyszerű: súlyozott:
Azt mutatja, hogy az egyes (egyedi) értékek mennyivel térnek el átlagosan a számtani átlagtól, a centrális értéktől.
n
xx
2
f
xxf 2