statistik i - 6. vorlesung · prof. dr. rolf hüpen | modul „statistik i“ | sommersemester 2013...
Post on 03-Nov-2019
5 Views
Preview:
TRANSCRIPT
WISTAWIRTSCHAFTSSTATISTIK
PROF. DR. ROLF HÜPEN
FAKULTÄT FÜR
WIRTSCHAFTSWISSENSCHAFT
Seminar für Theoretische Wirtschaftslehre
Vorlesungsprogramm 28.05.2013
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße
1. Konzentrationsbegriff
2. Lorenzkurve
3. Gini-Koeffizient
Literatur: Degen, Horst / Lorscheid, Peter: Statistik-Lehrbuch, 2. Aufl., München-Wien 2002, S. 54 –
61.
Mosler, Karl und Schmid, Friedrich: Beschreibende Statistik und Wirtschaftsstatistik, 4. Aufl.,
Berlin-Heidelberg-New York 2009, S. 79 – 109 .
von der Lippe, Peter: Deskriptive Statistik, Stuttgart 1993, S. 141 – 191.
Bruckmann, Gerhart: Konzentrationsmessung, in: Bleymüller, Josef / Gehlert, Günther /
Gülicher, Herbert: Statistik für Wirtschaftswissenschaftler, 15. Aufl., München 2008, S. 191 –
196.
Übungsaufgaben: Semesterabschlussklausuren WS 03/04, A2; SS 05, A2; SS 08, A2; WS 10/11, A3.
2Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Begriff und Fragestellung
absolut statisch relativ
Konzentration absolut dynamisch relativ
Begriff der „Konzentration“
Unter Konzentration versteht man die (ungleiche) Verteilung der Merkmalssumme
eines Erhebungsmerkmals auf die Merkmalsträger.
Beispiele: Marktformen Polypol – Oligopol – Monopol
(Anzahl der Anbieter, Marktanteil, Marktmacht)
Personelle Einkommens- oder Vermögensverteilung
(„Die ärmsten 10% der Bevölkerung beziehen 4,1% des Volkseinkommens“, „die
reichsten 10% beziehen 21,1% des Volkseinkommens“)
3Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Begriff und Fragestellung
Statische Konzentration
Zeitpunktbetrachtung, Konzentration als Zustand.
„Das Vermögen ist ungleich verteilt, es konzentriert sich auf wenige Personen“
Dynamische Konzentration
Zeitraumbetrachtung, Konzentration als Prozess.
„In der Landwirtschaft hat zwischen 1960 und 1990 ein Konzentrationsprozess
stattgefunden.“
Absolute Konzentration
Konzentration der Merkmalssumme auf absolut wenige Merkmalsträger. Ein Großteil
des gesamten Merkmalsbetrages konzentriert sich auf eine kleine Zahl von
Merkmalsträgern. „Die drei größten Unternehmen haben auf dem Markt x einen
Marktanteil von zusammen 90%.“
Relative Konzentration (Disparität)
Konzentration der Merkmalssumme auf einen geringen Anteil der Merkmalsträger.
„1,7% der Bevölkerung besitzen mehr als 70% des Produktivvermögens.“
4Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Begriff und Fragestellung
Beispiel: Umsatzverteilung von Unternehmen einer Branche1)
Unter-
nehmen
Verteilung
A B C D E F G H
a 1000 360 200 500 1000 180 100 199
b 0 300 200 140 280 180 100 199
c 0 200 200 130 260 150 100 199
d 0 80 200 120 240 150 100 199
e 0 60 200 110 220 100 100 199
f 100 100 1
g 40 100 1
h 40 100 1
i 30 100 1
j 30 100 1
Gesamt-
umsatz1000 1000 1000 1000 2000 1000 1000 1000
1) Beispiel entnommen aus: Bleymüller/Gehlert/Gülicher, Statistik für Wirtschaftswissenschaftler, 15. Aufl.,
München 2008, S. 191.
5Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Begriff und Fragestellung
Messung der Konzentration
Maßzahlen der absoluten Konzentration
• Konzentrationsrate
• Herfindahl-Index
• (normierte) Entropie
Maßzahlen der relativen Konzentration
• Lorenzkurve
• Gini-Koeffizient
= Anteil der j größten Merkmalsträger
an der Merkmalssumme
= Summe der quadrierten Anteile an
der Merkmalssumme
6Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve
LorenzkurveMax Otto Lorenz (1876 – 1959), amerikanischer Ökonom
• Fragestellung: Verteilung der Merkmalssumme auf die Merkmalsträger.
• Vorgehen: Zuordnung der kumulierten relativen Häufigkeiten zum kumulierten
Anteil an der Merkmalssumme.
• Charakterisierung: Bei der Lorenzkurve handelt es sich um eine graphische
Darstellung der relativen Konzentration.
• Voraussetzungen:
• Das statistische Merkmal ist mindestens verhältnisskaliert.
• Die Merkmalsausprägungen sind nicht negativ.
• Die Merkmalssumme kann sinnvoll berechnet werden.
7Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve
Beispiele für sinnvolle Merkmalssummen
Merkmal Merkmalsträger Merkmalssumme
Umsatz
(Mio € / Monat)
Unternehmen einer Branche Branchenumsatz
Bruttolohn
(€ / Monat)
Arbeitnehmer Lohnsumme der
Arbeitnehmer
Landwirtschaftliche
Nutzfläche
(ha)
Landwirtschaftlicher Betrieb Gesamtfläche für
landwirtschaftliche Nutzung
8Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage A
Berechnung der Lorenzkurve bei Datenlage A
Gegeben: Geordnete Urliste der n Beobachtungswerte: 𝑥(1) ≤ 𝑥(2) ≤ ⋯ ≤ 𝑥(𝑛)
Merkmalssumme: 𝑆 =
𝑖=1
𝑛
𝑥(𝑖)
Kumulierte relative Häufigkeit: 𝐹𝑖 =𝑖
𝑛
Kumulierter Anteil an der Merkmalssumme: 𝐺𝑖 =1
𝑆⋅
𝑗=1
𝑖
𝑥(𝑗)
Dann entsteht die Lorenzkurve in einem F/G-Koordinatensystem als Streckenzug, der
die Punkte 0,0 , 𝐹1, 𝐺1 , 𝐹2, 𝐺2 , … , 𝐹𝑛−1, 𝐺𝑛−1 , 1,1 miteinander verbindet.
9Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage A
Beispiel: Umsatzverteilung von Unternehmen einer Branche1)
Unter-
nehmen
Verteilung
A B C D E F G H
a 1000 360 200 500 1000 180 100 199
b 0 300 200 140 280 180 100 199
c 0 200 200 130 260 150 100 199
d 0 80 200 120 240 150 100 199
e 0 60 200 110 220 100 100 199
f 100 100 1
g 40 100 1
h 40 100 1
i 30 100 1
j 30 100 1
Gesamt-
umsatz1000 1000 1000 1000 2000 1000 1000 1000
1) Beispiel entnommen aus: Bleymüller/Gehlert/Gülicher, Statistik für Wirtschaftswissenschaftler, 15. Aufl.,
München 2008, S. 191.
Vorgehen: 1. Merkmale der Größe nach aufsteigend ordnen,
2. Arbeitstabelle erstellen,
3. zeichnen!
10Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage A
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
ku
mu
lie
rte
r A
nte
il a
m U
ms
atz
kumulierter Anteil Unternehmen
Verteilung B
i xi Fi gi Gi
1 60 0,2 0,06 0,06
2 80 0,4 0,08 0,14
3 200 0,6 0,2 0,34
4 300 0,8 0,3 0,64
5 360 1 0,36 1
1000 1
11Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage A
Verteilung B
i xi Fi gi Gi
1 60 0,2 0,06 0,06
2 80 0,4 0,08 0,14
3 200 0,6 0,2 0,34
4 300 0,8 0,3 0,64
5 360 1 0,36 1
1000 1
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
ku
mu
lie
rte
r A
nte
il a
m U
ms
atz
kumulierter Anteil Unternehmen
Verteilung C: Gleichverteilung
i xi Fi gi Gi
1 200 0,2 0,2 0,2
2 200 0,4 0,2 0,4
3 200 0,6 0,2 0,6
4 200 0,8 0,2 0,8
5 200 1 0,2 1
1000 1
Lorenzkurve
Verteilung B
Gleichverteilung,
Konzentration = 0
12Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage A
Verteilung B
i xi Fi gi Gi
1 60 0,2 0,06 0,06
2 80 0,4 0,08 0,14
3 200 0,6 0,2 0,34
4 300 0,8 0,3 0,64
5 360 1 0,36 1
1000 1
Verteilung A
i xi Fi gi Gi
1 0 0,2 0 0
2 0 0,4 0 0
3 0 0,6 0 0
4 0 0,8 0 0
5 1000 1 1 1
1000 1
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
ku
mu
liert
er
An
teil
am
Um
satz
kumulierter Anteil Unternehmen
Vergleich Verteilungen A und B
Gleichverteilung
Verteilung B
Verteilung A
13Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage A
Verteilung D - Arbeitstabelle
i xi Fi gi Gi
1 110 0,2 0,11 0,11
2 120 0,4 0,12 0,23
3 130 0,6 0,13 0,36
4 140 0,8 0,14 0,5
5 500 1 0,5 1
1000 1
Verteilung E - Arbeitstabelle
i xi Fi gi Gi
1 220 0,2 0,11 0,11
2 240 0,4 0,12 0,23
3 260 0,6 0,13 0,36
4 280 0,8 0,14 0,5
5 1000 1 0,5 1
2000 1
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
ku
mu
liert
er
An
teil
am
Um
satz
kumulierter Anteil Unternehmen
Lorenzkurve Verteilungen D und E
14Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage A
Verteilung B
i xi Fi gi Gi
1 60 0,2 0,06 0,06
2 80 0,4 0,08 0,14
3 200 0,6 0,2 0,34
4 300 0,8 0,3 0,64
5 360 1 0,36 1
1000 1
Verteilung D
i xi Fi gi Gi
1 110 0,2 0,11 0,11
2 120 0,4 0,12 0,23
3 130 0,6 0,13 0,36
4 140 0,8 0,14 0,5
5 500 1 0,5 1
1000 1
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
ku
mu
liert
er
An
teil
am
Um
satz
kumulierter Anteil Unternehmen
Vergleich Verteilungen B und D
Gleichverteilung
Verteilung B
Verteilung D
15Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage B
Berechnung der Lorenzkurve bei Datenlage B
Gegeben: 𝑚 voneinander verschiedene mögliche Merkmalsausprägungen
𝑥1 < 𝑥2 < ⋯ < 𝑥𝑚 mit den absoluten Häufigkeiten ℎ1, ℎ2, … , ℎ𝑚
Anzahl der Merkmalsträger: 𝑛 =
𝑖=1
𝑚
ℎ𝑖 mit 𝑚 ≤ 𝑛
Kumulierte relative Häufigkeiten: 𝐹𝑖 =1
𝑛⋅
𝑗=1
𝑖
ℎ𝑗
Merkmalssumme: 𝑆 =
𝑖=1
𝑚
ℎ𝑖 ⋅ 𝑥𝑖
Kumulierter Anteil an der Merkmalssumme: 𝐺𝑖 =1
𝑆⋅
𝑗=1
𝑖
ℎ𝑗 ⋅ 𝑥𝑗
Dann entsteht die Lorenzkurve in einem F/G-Koordinatensystem als Streckenzug, der
die Punkte 0,0 , 𝐹1, 𝐺1 , 𝐹2, 𝐺2 , … , 𝐹𝑚−1, 𝐺𝑚−1 , 1,1 miteinander verbindet.
16Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage B
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
ku
mu
liert
er
An
teil
am
Um
satz
kumulierter Anteil Unternehmen
Lorenzkurve Verteilung FVerteilung F - Arbeitstabelle
i xi hi fi Fi xihi gi Gi
1 30 2 0,2 0,2 60 0,06 0,06
2 40 2 0,2 0,4 80 0,08 0,14
3 100 2 0,2 0,6 200 0,2 0,34
4 150 2 0,2 0,8 300 0,3 0,64
5 180 2 0,2 1 360 0,36 1
10 1 1000 1
17Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage C
Berechnung der Lorenzkurve bei Datenlage C
Die Merkmalsausprägungen sind in 𝑘 Klassen eingeteilt: 𝑖 = 1,2, … , 𝑘
Grenzen der Klasse 𝑖: 𝑎𝑖−1, )𝑎𝑖
Mittelpunkt der Klasse 𝑖: 𝑥𝑖 =1
2⋅ 𝑎𝑖−1 + 𝑎𝑖
Anzahl der Merkmalsträger in Klasse 𝑖: ℎ𝑖
Gesamtzahl der Merkmalsträger: 𝑛 =
𝑖=1
𝑘
ℎ𝑖
Kumulierte relative Häufigkeit: 𝐹𝑖 =1
𝑛⋅
𝑗=1
𝑖
ℎ𝑗
Näherungswert für die Merkmalssumme: 𝑆 =
𝑖=1
𝑘
ℎ𝑖 ⋅ 𝑥𝑖
Näherungswert für den kumulierten Anteil an der
Merkmalssumme: 𝐺𝑖 =
1
𝑆⋅
𝑗=1
𝑖
ℎ𝑗 ∙ 𝑥𝑗
Dann entsteht die Lorenzkurve in einem F/G-Koordinatensystem als Streckenzug, der die Punkte 0,0 , 𝐹1, 𝐺1 , 𝐹2, 𝐺2 , … , 𝐹𝑚−1, 𝐺𝑚−1 , 1,1 miteinander verbindet.
18Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage C
Landwirtschaftlich genutzte Fläche
in Deutschland 19991)
Klasse Nr.Betriebsgröße in ha
Zahl der Betriebevon bis unter
i ai-1 ai hi
1 2 5 79.797
2 5 10 73.949
3 10 15 47.749
4 15 20 39.619
5 20 30 51.772
6 30 50 62.575
7 50 100 54.311
8 100 und mehr 24.358
Summe 434.1301) Quelle: Statistisches Jahrbuch für Deutschland 2000, eigene Berechnungen.
Ergebnis der Landwirtschaftszählung 1999. Nur Betriebe mit 2 ha und mehr
Nutzfläche wurden berücksichtigt.
19Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage C
Arbeitstabelle zur näherungsweisen Berechnung der Lorenzkurve
Landwirtschaftlich genutzte Fläche in Deutschland 1999
Klasse
Nr.
Betriebsgröße in ha Zahl der
Betriebe
Relative
Häufigkeit
Kumulierte
rel. Häufigk.
Klassen-
mitte
Fläche (Ap-
proximation)
Flächen-
anteil
Kumulierter
Flächenanteilvon bis unter
i ai-1 ai hi fi Fi xi 𝑠𝑖 = ℎ𝑖 ∙ 𝑥𝑖 𝑔𝑖 𝐺𝑖
1 2 5 79 797 0,1838 0,1838 3,5 279 289,5 0,0205 0,0205
2 5 10 73 949 0,1703 0,3541 7,5 554 617,5 0,0406 0,0611
3 10 15 47 749 0,1100 0,4641 12,5 596 862,5 0,0437 0,1048
4 15 20 39 619 0,0913 0,5554 17,5 693 332,5 0,0508 0,1556
5 20 30 51 772 0,1193 0,6747 25 1 294 300,0 0,0948 0,2505
6 30 50 62 575 0,1441 0,8188 40 2 503 000,0 0,1834 0,4339
7 50 100 54 311 0,1251 0,9439 75 4 073 325,0 0,2984 0,7323
8 100 und mehr 24 358 0,0561 1 150 3 653 700,0 0,2677 1
Summe 434 130 1 13 648 427,0 1
20Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage C
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
ku
mu
liert
er
An
teil d
er
lan
dw
irts
ch
aft
lich
ge
nu
tzte
n F
läch
e
kumulierter Anteil der landwirtschaftlichen Betriebe
Konzentration der landwirtschaftlich genutzten Fläche- Lorenzkurve -
Gleichverteilung Deutschland 1999
21Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage C
Landwirtschaftlich genutzte Fläche in Deutschland
19991)
Klasse
Nr.
Betriebsgröße in haZahl der
Betriebe
Genutzte
Fläche in
1.000 havon bis unter
i ai-1 ai hi si
1 2 5 79 797 266,0
2 5 10 73 949 534,3
3 10 15 47 749 591,0
4 15 20 39 619 693,0
5 20 30 51 772 1 280,9
6 30 50 62 575 2 426,8
7 50 100 54 311 3 738,6
8 100 und mehr 24 358 7 589,9
Summe 434 130 17 120,51) Quelle: Statistisches Jahrbuch für Deutschland 2000, Ergebnis der
Landwirtschaftszählung 1999. Nur Betriebe mit 2 ha und mehr Nutzfläche wurden
berücksichtigt.
In der Originalquelle lagen noch zusätzliche Informationen zur genutzten Fläche in den jeweiligen
Größenklassen vor:
Mit diesen Zusatzinformationen lässt sich die Lorenzkurve exakt ermitteln.
22Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage C
Landwirtschaftlich genutzte Fläche in Deutschland 19991)
Klasse
Nr.
Betriebsgröße in ha Zahl der
Betriebe
Genutzte Fläche
in 1.000 ha
Kumulierter
Anteil der
Betriebe
Kumulierter
Flächenanteilvon bis unter
i ai-1 ai hi si Fi Gi
1 2 5 79 797 266,0 0,1838 0,0155
2 5 10 73 949 534,3 0,3541 0,0467
3 10 15 47 749 591,0 0,4641 0,0813
4 15 20 39 619 693,0 0,5554 0,1217
5 20 30 51 772 1 280,9 0,6747 0,1966
6 30 50 62 575 2 426,8 0,8188 0,3383
7 50 100 54 311 3 738,6 0,9439 0,5567
8 100 und mehr 24 358 7 589,9 1 1
Summe 434 130 17 120,5
23Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Lorenzkurve Datenlage C
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
ku
mu
liert
er
An
teil d
er
lan
dw
irts
ch
aft
lich
ge
nu
tzte
n F
läch
e
kumulierter Anteil der landwirtschaftlichen Betriebe
Konzentration der landwirtschaftlich genutzten Fläche- Lorenzkurve -
Gleichverteilung approximierte Lorenzkurve tatsächliche Lorenzkurve
24Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Gini-Koeffizient
Gini-KoeffizientCorrado Gini (1884 – 1965), italienischer Statistiker und Demograph
• Maßzahl für die relative Konzentration
• Der Gini-Koeffizient wird aus dem Inhalt der Fläche zwischen der Diagonalen und der
Lorenzkurve berechnet.
• Normierung auf einen Wertebereich zwischen 0 und 1.
Berechnung der Fläche L unter der Lorenzkurve:
Datenlage A: 𝐿 =1
2𝑛∙
𝑖=1
𝑛
𝐺𝑖−1 + 𝐺𝑖 , wobei 𝐺0 = 0 gesetzt wird.
Datenlage B: 𝐿 =1
2𝑛∙
𝑖=1
𝑚
𝐺𝑖−1 + 𝐺𝑖 ∙ ℎ𝑖 , wobei 𝐺0 = 0 gesetzt wird.
Datenlage C: 𝐿 =1
2𝑛∙
𝑖=1
𝑘
𝐺𝑖−1 + 𝐺𝑖 ∙ ℎ𝑖 , wobei 𝐺0 = 0 gesetzt wird.
Daraus erhält man den Gini-Koeffizienten als: 𝑐𝐺 = 1 − 2 ⋅ 𝐿
25Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Gini-Koeffizient
Die Fläche M zwischen der
Diagonalen und der Lorenzkurve
misst die Konzentration. Je größer
M, umso konzentrierter ist die
Verteilung.
Es gilt:
𝑀 = 0,5 − 𝐿,
wobei L die Fläche unter der
Lorenzkurve ist.
Bei maximaler Konzentration wäre
𝐿 = 0 und somit
𝑀 = 0,5
Der Gini-Koeffizient wird daher als
𝑐𝐺 = 2 ⋅ 𝑀 = 1 − 2 ⋅ 𝐿
definiert und ist damit auf denWertebereich:
0 ≤ 𝑐𝐺 < 1
normiert.0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,2 0,4 0,6 0,8 1
ku
mu
lie
rter
An
teil
am
Um
satz
kumulierter Anteil Unternehmen
Lorenzkurve Verteilung B
L
M
26Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Gini-Koeffizient
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,2 0,4 0,6 0,8 1
ku
mu
liert
er
An
teil
am
Um
satz
kumulierter Anteil Unternehmen
Lorenzkurve Verteilung B
Datenlage A:
𝐹𝑖 − 𝐹𝑖−1 = 𝑓𝑖 = 1 𝑛
𝐿 =
𝑖=1
𝑛
𝐿𝑖
𝐿 =1
2𝑛∙
𝑖=1
𝑛
𝐺𝑖−1 + 𝐺𝑖
Datenlage B:
𝐹𝑖 − 𝐹𝑖−1 = 𝑓𝑖 = ℎ𝑖 𝑛
𝐿 =
𝑖=1
𝑚
𝐿𝑖
𝐿 =1
2𝑛∙
𝑖=1
𝑚
ℎ𝑖 ∙ 𝐺𝑖−1 + 𝐺𝑖
Datenlage C wie Datenlage B, nur
statt m die Zahl der Klassen k
einsetzen.
Gi – Gi-1
Gi-1
Fi – Fi-1
Fi-1 Fi
𝐿𝑖 = 𝐹𝑖 − 𝐹𝑖−1 ⋅ 𝐺𝑖−1
+12
⋅ 𝐹𝑖 − 𝐹𝑖−1 ⋅ 𝐺𝑖 − 𝐺𝑖−1
= 12
⋅ 𝐹𝑖 − 𝐹𝑖−1 ⋅ 𝐺𝑖 + 𝐺𝑖−1
27Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Konzentrationsmaße Gini-Koeffizient
Verteilung B
i xi Fi gi Gi Gi-1 + Gi
1 60 0,2 0,06 0,06 0,06
2 80 0,4 0,08 0,14 0,2
3 200 0,6 0,2 0,34 0,48
4 300 0,8 0,3 0,64 0,98
5 360 1 0,36 1 1,64
1000 1 3,36
Fläche unter der Lorenzkurve: 𝐿 = 0,336
Gini-Koeffizient: 𝒄𝑮 = 𝟎, 𝟑𝟐𝟖
top related