folien zur vorlesung - wirtschaftswissenschaftliche fakultät · folien zur vorlesung statistik i...

365
Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr orsaal: Aula am Aasee Prof. Dr. Bernd Wilfling Westf¨ alische Wilhelms-Universit¨ atM¨unster

Upload: vannhan

Post on 16-May-2019

222 views

Category:

Documents


0 download

TRANSCRIPT

Folien zur Vorlesung

Statistik I(Deskriptive Statistik)

Wintersemester 2010/2011Donnerstag, 10.00 - 11.30 Uhr

Horsaal: Aula am Aasee

Prof. Dr. Bernd Wilfling

Westfalische Wilhelms-Universitat Munster

Inhalt

1 Einleitung1.1 Was ist Statistik und warum ist Statistik wichtig?1.2 Beispiele fur statistische Fragestellungen in der Okonomik1.3 Deskriptive und schließende Statistik

2 Mathematische Grundlagen

2.1 Endliche Summen und Produkte2.2 Exponentialfunktion und Logarithmus

3 Merkmale und Daten3.1 Grundgesamtheiten3.2 Merkmale

3.3 Daten und ihre Erhebung3.4 Amtliche und nichtamtliche Statistik

4 Auswertung eindimensionaler Daten4.1 Beliebig skalierte Daten

4.2 Mindestens ordinal skalierte Daten4.3 Metrisch skalierte Daten4.3.1 Lagemessung4.3.2 Weitere Mittelwerte

4.3.3 Streuungsmaße4.3.4 Additionssatze fur arithmetische Mittel und Varianzen

4.3.5 Stetig klassierte Daten4.3.6 Schiefemessung

5 Verhaltniszahlen, Messzahlen und Indexzahlen

5.1 Verhaltniszahlen5.2 Messzahlen des zeitlichen Vergleichs5.2.1 Umbasierung und Verkettung von Messzahlen

5.2.2 Zuwachsraten und Zuwachsfaktoren5.2.3 Logarithmische Zuwachsraten

5.3 Indexzahlen5.3.1 Preisindizes

5.3.2 Mengenindizes

i

5.3.3 Wertindizes5.3.4 Umbasierung und Verkettung von Indizes

5.3.5 Formale Indexkriterien (Fisher-Proben)

6 Auswertung mehrdimensionaler Daten6.1 Grundbegriffe6.1.1 Kontingenztafel und Haufigkeiten

6.1.2 Bedingte Verteilungen

6.1.3 Deskriptive Unabhangigkeit

6.1.4 Arithmetische Mittel und Varianzen6.2 Zusammenhangsmaße6.2.1 Metrische Daten: Korrelationskoeffizient6.2.2 Ordinale Daten: Rangkorrelationskoeffizient6.2.3 Nominale Daten: Kontingenzkoeffizient

6.3 Deskriptive Regression6.3.1 Regression 1. Art6.3.2 Regression 2. Art: Die lineare Einfachregression

6.4 Lineare Mehrfachregression

7 Konzentrations- und Disparitatsmessung

7.1 Disparitat und Konzentration

7.2 Konzentrationsmessung7.2.1 Konzentrationsraten und Konzentrationskurve

7.2.2 Konzentrationsindizes7.3 Disparitatsmessung

7.3.1 Lorenzkurve7.3.2 Der Gini-Koeffizient

ii

Literatur

EViews:

EViews 7 User Guide (2009). Estimation, Forecasting, Statistical Analysis, Graphs, Data

Management, Simulation. QMS Quantitative Micro Software, Irvine, California.

Statistik:

Hartung, J. (2005). Statistik – Lehr- und Handbuch der angewandten Statistik (14. Aufla-

ge). Oldenbourg Verlag, Munchen.

Mosler, K. und F. Schmid (2009). Beschreibende Statistik und Wirtschaftsstatistik (4. Auf-

lage). Springer Verlag, Heidelberg.

iii

1. Einleitung

Ziel der Vorlesung:

• Einfuhrung in deskriptive Statistik + Wirtschaftsstatistik

Internet-Seite der Vorlesung:

• http://www1.wiwi.uni-muenster.de/oeew/

−→ Studium −→ Veranstaltungen im Wintersemester 2010/2011

−→ Bachelor −→ Statistik I

1

Vorlesungsstil:

• Freier Vortrag anhand von Projektor-Folien

• Folien stehen als PDF-Dateien auf Internetseite zur Verfugung(Beschaffung der Folien wird unbedingt empfohlen)

Literatur:

• K. Mosler und F. Schmid (2009). Beschreibende Statistikund Wirtschaftsstatistik (4. Auflage), Springer-Verlag

• Formelsammlung ”Definitionen, Formeln und Tabellen zurStatistik” (6. Auflage) von Bomsdorf/Grohn/Mosler/Schmid(notwendiges Hilfsmittel, in der Klausur zugelassen)

2

Klausurvorbereitung:

• Stoff der Vorlesung

• Aufgaben des Tutoriums

Ansprechpartner: Herr Sascha Leweling

• Klausurtraining durch Ferienarbeitsgruppen

3

Zugelassene Hilfsmittel in der Klausur:

• Taschenrechner (nicht programmierbar)

• Formelsammlung ”Definitionen, Formeln und Tabellen zurStatistik” von Bomsdorf/Grohn/Mosler/Schmid, 6. (aktuelleund fruhere) Auflage(n)Akzeptierte außere Form fur die Klausur:

– Zulassig sind nur Unter- bzw. Uberstreichungen, Verweiseauf Seiten bzw. Nummern

– Nicht zulassig sind somit z.B. verbale Erlauterungen, math-ematische Umformungen, grafische Darstellungenu.a., die als Losungshilfen fur Klausuraufgaben angese-hen werden konnen

4

Ansprechpartner:

• Herr Sascha Leweling(Koordinator der Tutorien)

• Tutorinnen und Tutoren(Adressen und Nummern: siehe Tutorien)

5

1.1 Was ist Statistik und warum ist Statistik wichtig?

Typischer Lexikon-Eintrag fur den Begriff ’Statistik’:

• Methode zur Untersuchung von Massenerscheinungen

• Versuch, den Umfang, die Gliederung oder Struktur einerMasse, die zeitliche Entwicklung einer oder das Verhaltnismehrerer Massenerscheinungen zueinander zu erkennen

• Aufgabe der Statistik besteht in der Darstellung, Analyse undDeutung von Daten

6

Anwendungsbereiche fur statistische Methoden:

• heutzutage in allen Wissenschaftsbereichen, z.B. in

der Biologie / Medizin (Biometrie)

den Ingenieurswissenschaften (Technometrie)

den Verhaltenswissenschaften (Psychometrie)

Besonders wichtig fur WiWis:

• Empirische Wirtschaftsforschung

• Okonometrie

7

Ziele der Statistik: [I]

• Aufdeckung von Zusammenhangen, z.B.

Zusammenhang Arbeitslosigkeit ←→ InflationZusammenhang Arbeitslosigkeit ←→ WachstumAuswirkungen von Geldpolitik auf wirtschaftliche Aktivitat

• Uberwachung okonomischer Aktivitat, z.B.

ArbeitslosenquoteWachstumsraten (BIP, Konsum)Aktienkurse, Wechselkurse, Zinssatze, Rohstoff- und Im-mobilienpreise

8

Ziele der Statistik: [II]

• Uberprufung von WiWi-Theorien anhand von Daten, z.B.

Zusammenhang zwischen verfugbarem Einkommen undKonsumausgaben

Einfluss demokratischer Strukturen auf wirtschaftliche Ak-tivitat

Bedeutung des Wahrungssystems fur den wirtschaftlichenErfolg

9

1.2 Beispiele fur statistische Fragestellungen inder Okonomik

(a) Preis eines Gutes:

• Preis einer Feinunze Gold auf verschiedenen Markten

Kurse (in US-$) vom 11.10.2010

Marktplatz KursFrankfurt 1348.30

Luxemburg 1347.95London 1348.65Zurich 1348.38Paris 1347.89

10

Aufgaben der Statistik:

• Charakterisierung der Datenreihe durch Kennzahlen

• Grafische Darstellung der Daten

• Eventuell Bereinigung der Daten (Ausreißer etc.)

11

(b) Kursverlaufe von Aktien, Wahrungen, Immobilien:

• Wechselkurs der griechischen Drachme zum Euro

Aufgabe der Statistik:

• Messung der unterschiedlichen Schwankungen

12

94

96

98

100

102

15/12/98 3/07/99 19/01/00 6/08/00

Greek Drachme (GRD / EURO)ERM parity (100): 340.75

24/09/200025/09/2000

-1.5

-1.0

-0.5

0.0

0.5

1.0

15/12/98 3/07/99 19/01/00 6/08/00

Greek Drachme (daily changes in %)24/09/200025/09/2000

(c) Anstieg des ’allgemeinen Preisniveaus’

Wichtige Frage fur die Wirtschaftspolitik:

• Um wieviel Prozent ist das Preisniveau in der BRD im MonatOktober 2010 gegenuber dem Vorjahresmonat gestiegen?

Aufgaben der Statistik:

• Welche Preise sind gemeint?

• Bestimmung eines geeigneten Preisindexes

13

(d) Entwicklung der Arbeitslosigkeit

Wichtige Frage fur die Wirtschaftspolitik:

• Ist die Arbeitslosenquote innerhalb des letzten Monats ge-sunken?

Aufgaben der Statistik:

• Beschaftigungssituation ist jahreszeitlichen Fluktuationenausgesetzt

• Bestimmung der ’Saisonfigur’

• Bereinigung der AL-Quote um die ’Saisonfigur’

14

1.3 Deskriptive und schließende Statistik

Unterteilung der Statistik in 2 Saulen:

• Deskriptive Statistik (Statistik I)(Wie bringe ich die Daten zum Sprechen?)

• Wahrscheinlichkeitsrechnung und induktive Statistik(Was konnen mir die Daten wirklich sagen?)

Weitere gebrauchliche Ausdrucke fur ’induktive Statistik’:

• schließende Statistik

• statistische Inferenz

15

Ziele der induktiven Statistik:

• Datenanalyse auf der Basis von Wahrscheinlichkeitsmodellen

• Verifikation theoretischer Modelle anhand von Daten

Methoden der induktiven Statistik:

• Schatzen von unbekannten Parametern

• Testen von Hypothesen uber unbekannte Parameter

16

Beispiel:

• Die Wirkung von Werbemaßnahmen auf den Absatz von Un-ternehmen

Stichprobe:

• 84 Unternehmen eines bestimmten Sektors in den USA imJahre 1990

17

Stichprobenergebnisse der 84 Unternehmen

18

480

500

520

540

560

0 20 40 60 80 100

Werbeausgaben in Mill. US-$

Abs

atz

in M

ill. U

S-$

Schätzung: Absatz = 502.92 + 0.218 * Werbeausgaben

Offensichtlich:

• ’Hohere Werbeausgaben’ bewirken ’hohere Absatze’(moglicherweise auch umgekehrte Beziehung)

• Zusammenhang ist nicht exakt(vgl. eingezeichnete Regressionslinie)

Theoretisches Modell:

Y = β0 + β1 ·X + Fehler

mit

• Y = Absatz, X = Ausgaben fur Werbung

• β0, β1 unbekannte Parameter

19

Aufgaben der induktiven Statistik:

• ’Gute’ Schatzungen fur die Parameter β0 und β1

• Testen der Hypothese β1 = 0 gegen β1 6= 0(Variable X hat keinerlei Einfluss auf Y

gegen

X hat einen signifikanten Einfluss auf Y )

20

2. Mathematische Grundlagen

Erforderliche mathematische Hilfsmittel:

• Summen und Produkte

• Exponential- und Logarithmusfunktionen

21

2.1 Endliche Summen und Produkte

Betrachte n reelle Zahlen a1, a2, . . . , an ∈ R. Die Summe derZahlen notiert man wie folgt:

a1 + a2 + . . . + an =n

i=1ai =

i∈Iai

Bezeichnungen:

• i heißt Summationsindex

• I = {1, . . . , n} heißt Indexmenge

22

Bemerkungen:

• Die Indexmenge I darf eine beliebige Menge ganzer Zahlensein (I ⊂ Z), z.B. I = {−4,−3,−2,−1,0,1,2,3}. Fur dieSumme gilt dann:

i∈Iai =

3∑

i=−4ai = a−4 + a−3 + a−2 + a−1 + a0 + a1 + a2 + a3

• Die Indexmenge I kann auch leer sein, d.h. I = {}. Fur dieSumme definiert man dann

i∈Iai = 0.

23

Fragen:

• Warum ist das Summenzeichen wichtig?

• Wie kann man formal mit Summen rechnen?

Antworten:

• Das Summenzeichen vereinfacht die Schreibweise in der ge-samten Statistik

• Es gibt Rechenregeln fur Summen, die allesamt formal be-wiesen werden mussen(Aufgabe der Mathematik)

24

Rechenregeln fur endliche Summen: [I]

Dazu seien a1, . . . , an sowie b1, . . . , bn reelle Zahlen

• Mit den beliebigen reellen Zahlen α, β gilt:n

i=1(α · ai + β · bi) =

n∑

i=1α · ai +

n∑

i=1β · bi

= α ·n

i=1ai + β ·

n∑

i=1bi

• Falls a1 = a2 = . . . = an ≡ a, so folgt:n

i=1ai =

n∑

i=1a = n · a

25

Rechenregeln fur endliche Summen: [II]

• Fur jedes (ganzzahlige) m mit 0 ≤ m ≤ n gilt:

n∑

i=1ai =

m∑

i=1ai +

n∑

i=m+1ai

• Fur jedes ganzzahlige m gilt:

n∑

i=1ai =

n+m∑

i=1+mai−m

26

Spezielle endliche Summen: [I]

•n

i=1i = 1 + . . . + n =

n · (n + 1)2

•n

i=1i2 =

n · (n + 1) · (2n + 1)6

•n

i=1i3 =

n2 · (n + 1)2

4

27

Spezielle endliche Summen: [II]

• Es seien a1, b ∈ R, ai = a1 + (i − 1) · b fur i = 2, . . . , n. Dannheißt a1, a2, . . . , an endliche arithmetische Folge 1. Ordnungund es gilt:

n∑

i=1ai =

n2· (2a1 + (n− 1) · b)

• Es seien a1, q ∈ R, ai = a1 · qi−1 fur i = 2, . . . , n. Dann heißta1, a2, . . . , an endliche geometrische Folge und es gilt fur q 6=1:

n∑

i=1ai = a1 ·

qn − 1q − 1

28

Doppelsummen: [I]

• Es sei

a11 a12 · · · a1ma21 a22 · · · a2m... ... . . . ...

an1 an2 · · · anm

eine Matrix (Tabelle) reeller Zahlen

29

Doppelsummen: [II]

• Die Summe uber alle diese Zahlen notiert man als Doppel-summe:

n∑

i=1

m∑

j=1aij = a11 + a12 + . . . + a1m

+ a21 + a22 + . . . + a2m...

+ an1 + an2 + . . . + anm

• Es gilt:n

i=1

m∑

j=1aij =

m∑

j=1

n∑

i=1aij

30

Weiteres Beispiel fur eine Doppelsumme:

n∑

i=1

n∑

j=iaij = a11 + . . . + . . . + . . . + a1n

+ a22 + . . . + . . . + a2n

+ a33 + . . . + a3n

...

+ ann

(Der Laufbereich des 2. Index hangt vom 1. Index ab)

31

Endliche Produkte

Betrachte n reelle Zahlen a1, a2, . . . , an ∈ R. Mit der IndexmengeI = {1,2, . . . , n} notiert man das Produkt der Zahlen wie folgt:

a1 · a2 · . . . · an =n∏

i=1ai =

i∈Iai

Bemerkung:

• Die Indexmenge I kann wiederum leer sein, d.h. I = {}. Furdas Produkt definiert man dann

i∈I ai = 1

32

Rechenregeln fur endliche Produkte:

Es seien a1, . . . , an sowie b1, . . . , bn reelle Zahlen

• Mit den beliebigen reellen Zahlen α, β gilt:

n∏

i=1α · ai · β · bi = αn · βn ·

n∏

i=1ai ·

n∏

i=1bi

• Falls a1 = a2 = . . . = an ≡ a, so folgt:

n∏

i=1ai =

n∏

i=1a = an

33

2.2 Exponentialfunktion und Logarithmus

Zwei wichtige mathematische Funktionen:

• Naturliche Exponentialfunktion

• Naturlicher Logarithmus

Hier:

• Mathematische Definition und Eigenschaften

34

Anwendung in der gesamten Wirtschaftstheorie, z.B.

• in der Wachstumstheorie (VWL)

• in Mikro- und Makromodellen (VWL)

• im gesamten Finance-Bereich (BWL)

• im Operations-Research (BWL)

• in der Statistik / Okonometrie

35

Definition der Exponentialfunktion: [I]

• Betrachte die unendliche Reihe∞∑

k=0

xk

k!= 1 + x +

x2

2+

x3

6+

x4

24+ · · ·

(k! bezeichnet das Produkt der ersten k ganzen Zahlen, alsok! = 1 · 2 · . . . · k)

• Man kann zeigen, dass die Summe fur jedes x ∈ R gegen eineendliche Zahl konvergiert

36

Definition der Exponentialfunktion: [II]

• Fur jedes x ∈ R definiert man

exp(x) =∞∑

k=0

xk

k!

• Die Funktion exp : R → R heißt naturliche Exponentialfunk-tion

37

Graph der naturlichen Exponentialfunktion

38

0

5

10

15

20

25

-2 -1 0 1 2 3

x

exp(

x)

Eigenschaften der Exponentialfunktion: [I]

• Es gilt:

exp(0) = 1exp(1) = e ≈ 2.71828 (Eulersche Zahl)

• Fur alle x ∈ R gilt:

exp(x) > 0

• Fur alle x ∈ R gilt:

exp′(x) ≡d exp(x)

d x= exp(x)

(Ableitung ist gleich der Funktion selbst)

39

Eigenschaften der Exponentialfunktion: [II]

• Die Funktion exp ist streng monoton wachsend

• Fur beliebige x, y ∈ R gilt die Beziehung:

exp(x + y) = exp(x) · exp(y)

(Funktionalgleichung)

• Fur alle x ∈ R gilt

exp(x) = limn→∞

(

1 +xn

)n

(Aquivalente Darstellung zur Summendefinition)

40

Jetzt:

• Die exp-Funktion besitzt eine eindeutig bestimmte Umkehrfunk-tion

• Diese Umkehrfunktion ist definiert auf (0,∞)

Definition des naturlichen Logarithmus

Die Umkehrfunktion der naturlichen Exponentialfunktion

exp : R→ (0,∞)

heißt naturlicher Logarithmus und wird bezeichnet mit

ln : (0,∞) → R

41

Graph des naturlichen Logarithmus

42

-6

-4

-2

0

2

4

0 2 4 6 8 10

x

ln(x

)

Eigenschaften des naturlichen Logarithmus:

• Die Funktion ln ist streng monoton wachsend

• Fur x > 0 gilt:

ln′(x) =d ln(x)

d x=

1x

• Fur beliebige x, y > 0 gilt die Beziehung

ln(x · y) = ln(x) + ln(y)

(Funktionalgleichung)

43

Weitere Definitionen und Eigenschaften: [I]

• Die allgemeine Potenz ist fur alle x > 0, y ∈ R definiert durch

xy = exp(y · ln(x))

Insbesondere ist fur x ∈ R

ex = exp(x)

• Es sei a > 0 und a 6= 1. Der allgemeine Logarithmus vonx > 0 zur Basis a ist definiert durch

y = loga(x) ⇐⇒ x = ay

44

Weitere Definitionen und Eigenschaften: [II]

• Es gelten die folgenden Beziehungen:

ln(x) = loge(x)

ln(x) = loga(x) · ln(a)

loga(x) =ln(x)ln(a)

• Es sei f : R → (0,∞) eine differenzierbare Funktion. Furjedes x ∈ R heißt die Ableitung

(ln(f(x))′ =d ln(f(x))

d x=

f ′(x)f(x)

die logarithmische Ableitung von f an der Stelle x(auch: stetige Wachstumsrate)

45

3. Merkmale und Daten

Ziel dieses Kapitels:

• Vermittlung des statistischen Grundvokabulars

Zu klarende Begriffe:

• Grundgesamtheit

• Merkmale (Skalenniveau etc.)

• Stichprobe

46

3.1 Grundgesamtheiten

Definition 3.1: (Grundgesamtheit, Merkmalstrager)

Die Grundgesamtheit ist die Gesamtheit aller Einheiten, die statis-tisch untersucht werden sollen. Die Grundgesamtheit ist eineMenge und wird mit G bezeichnet. Ihre Elemente heißen Unter-suchungseinheiten oder Merkmalstrager. Wir schreiben

G = {e1, e2, . . . , en}.

Die Anzahl n der Elemente von G bezeichnet den Umfang derGrundgesamtheit. Wir notieren die Anzahl der Elemente von Gmit |G| = n.

47

Weitere Begriffe:

• Bestandsmasse:GG, die durch einen Zeitpunkt abgegrenzt wird

• Bewegungsmasse:GG, die durch einen Zeitraum abgegrenzt wird

Beispiele fur Bestandsmassen:

• Lagerbestand eines Unternehmens am 31.12.2010

• Handwerksbetriebe im Munsterland am 01.01.2010

48

Beispiele fur Bewegungsmassen:

• Neugegrundete Betriebe in Munster im Jahr 2010

• Studierende an der Uni Munster im WS 2010/2011

Offensichtlich:

• Bestands- und Bewegungsmassen hangen zusammen, undzwar uber die sogenannte Bestandsveranderung

49

3.2 Merkmale

Definition 3.2: (Merkmal, Merkmalsauspragung)

Unter einem Merkmal versteht man eine Eigenschaft der Merk-malstrager, die statistisch untersucht werden soll. Ein Merkmalhat gewohnlich verschiedene Merkmalsauspragungen. Merkmalenotieren wir meist mit Großbuchstaben (X, Y etc.). Merkmal-sauspragungen notieren wir meist mit indizierten griechischenBuchstaben (z.B. ξ1, ξ2 etc.).

50

Bisherige Notationszusammenfassung:

• Merkmalstrager: e1, e2, . . . , en

• Grundgesamtheit: G = {e1, . . . , en}

• Merkmal (interessierende Eigenschaft): X, Y etc.

• Merkmalsauspragungen (Merkmalswerte): ξ1, ξ2, . . .

51

Beispiele:

Grundgesamtheit Merkmal Auspragungen

Haushalte in der verfugbares [0,∞) EuroBRD am 1.1.2010 Monatseinkommen

Studierende der Geschlecht weibl., mannl.WWU am 1.10.2010

52

Typisierungen von Merkmalen: [I]

• Diskrete vs. stetige Merkmale

Ein Merkmal heißt diskret, falls es nur eine ’abzahlbare’Menge von Auspragungen annehmen kann(Vorsicht: ’abzahlbar’ bedeutet nicht endlich!)

Beispiele:

– Typischerweise Zahlmerkmale wie Anzahl von Kindern,Anzahl von Fachsemestern etc.

Ein Merkmal heißt stetig, falls es theoretisch alle reellenZahlen (eines Intervalls) annehmen kann

Beispiele:

– Gewichte, Temperaturen, Preise, Einkommen

53

Typisierungen von Merkmalen: [II]

• Qualitative vs. quantitative Merkmale

Ein Merkmal heißt qualitativ, wenn seine Auspragungendurch verbale Ausdrucke gegeben sind

Beispiele:

– Beruf, Geschlecht, Farbe, Status

Ein Merkmal heißt quantitativ, wenn seine AuspragungenZahlen sind

Beispiele:

– Alter, Einkommen, Noten (falls Note durch Zahl aus-gedruckt wird)

54

Wichtige Frage fur den Statistiker:

• Welche Rechenoperationen sind mit den erhobenen Wertenmoglich?

Antwort uber Skalenniveaus der Daten: [I]

• Nominalskala

Merkmalswerte haben nur Bezeichnungsfunktion(Codes)

Rechenoperationen (Addition, Multiplikation etc.) sindsinnlos

Beispiele: Geschlecht, Religionszugehorigkeit

55

Skalenniveaus: [II]

• Ordinalskala

Es existiert eine naturliche Ordnung der MerkmalswerteGroße der Abstande zwischen den Merkmalswerten ist ir-relevant−→ Rechenoperationen sind sinnlosBeispiele: Klausurnoten, Windstarken

• Intervallskala

Differenzen von je zwei Merkmalswerten konnen sinnvollverglichen werdenFrei wahlbarer MaßstabBeispiel: Temperaturen (in Grad Celsius oder Fahrenheit)

56

Skalenniveaus: [III]

• VerhaltnisskalaBesitzt naturlichen Nullpunkt, aber keine naturliche Mess-einheitBeispiele: Einkommen, Geldmenge(wenn keine Messeinheit vorgegeben ist)

• Absolute SkalaIst eindeutig bestimmt(naturlicher Nullpunkt und naturliche Messeinheit)Beipiele: Einkommen in Euro, Alter in Jahren etc.

Ausdrucksweise:

• Intervall-, Verhaltnis- und absolute Skala werden auch me-trische Skalen genannt

57

3.3 Daten und ihre Erhebung

Begriffserklarung:

• Unter dem Begriff Daten versteht man die beobachtetenWerte eines oder mehrerer Merkmale

Schreibweisen fur Daten:

• Bei einem Merkmal X:

x1, . . . , xn

• Bei 2 Merkmalen X und Y :

(x1, y1), . . . , (xn, yn)

58

Weitere Begriffe: [I]

• Urliste:

Die Gesamtheit aller erhobenen Daten nennt man Urliste

• Haufigkeitsverteilung:

Die Haufigkeitsverteilung gibt fur jeden Merkmalswert dieHaufigkeit an, mit der dieser in den erhobenen Datenvorkommt

Haufigkeitsverteilung (inklusive grafischer Darstellung)ausfuhrlich in Kapitel 4

59

Weitere Begriffe: [II]

• Vollerhebung / Teilerhebung

Vollerhebung: Ermittlung der Merkmalswerte aller Unter-suchungseinheiten der Grundgesamtheit(z.B. Volkszahlung)

Teilerhebung: Auswertung nur eines Teils der Grundge-samtheit

Mogliche Grunde:

– GG ist zu groß (Vollerhebung zu teuer)

– Beobachtung des Merkmals zerstort den Merkmalstra-ger (Qualitatskontrolle)

60

Weitere Begriffe: [III]

• Querschnitte / Zeitreihen / Panels

Querschnitt: Erhebung der Werte eines Merkmals zur sel-ben Zeit an verschiedenen Untersuchungseinheiten(z.B. Umsatze von Unternehmen im Jahre 2002)

Zeitreihen: Erhebung der Werte eines Merkmals an dersel-ben Untersuchungseinheit zu verschiedenen Zeitpunkten(z.B. BSP eines Landes uber verschiedene Jahre)

Panel: Kombination von Querschnitten und Zeitreihen(z.B. Jahrliche Befragung von Haushalten nach ihrem Ein-kommen)

61

3.4 Amtliche und nichtamtliche Statistik

Trager der Wirtschafts- und Sozialstatistik in der BRD:

• Amtliche Statistik

• Nichtamtliche Statistik

Institutionen der amtlichen Statistik:

• Statistisches Bundesamt

• Bundesministerien

• Deutsche Bundesbank

• Bundesanstalten

62

Trager der nichtamtlichen Statistik:

• Unabhangige Wirtschaftswissenschaftliche Institute

IFO (Institut fur Wirtschaftsforschung, Munchen)DIW (Deutsches Institut fur Wirtschaftsforschung, Berlin)IfW (Institut fur Weltwirtschaft, Kiel)RWI (Rheinisch-Westfalisches Institut fur Wirtschaftsfor-schung, Essen)

• Wirtschaftsforschungsinstitute von Interessenverbanden

• Unabhangige, quasi ’halbamtliche’ Institutionen(z.B. Sachverstandigenrat, Monopolkommission)

• Markt-, Meinungs- und Umfrageinstitute

63

4. Auswertung eindimensionaler Daten

Ziel dieses Kapitels:

• Prasentation von Methoden zur statistischen Auswertung eineseinzelnen Merkmals

64

Bezeichnungen (Wiederholung):

• Merkmalstrager: e1, . . . , en

• Grundgesamtheit: G = {e1, . . . , en}

• Zu untersuchendes Merkmal: X

• Mogliche Merkmalswerte: ξ1, . . . , ξJ

• Daten in Urliste: x1, . . . , xn

65

Fragestellungen:

• Formale und grafische Darstellung der Daten

• Berechnung aussagekraftiger Kenngroßen der Daten

Vorgehensweise:

• Vorstellung der statistischen Methoden anhand des Skalen-niveaus des Merkmals X

66

4.1 Beliebig skalierte Daten

Skalenniveau des zu untersuchenden Merkmals X:

• Nominalskala (oder hoher)

Haufigkeiten des Merkmals X mit Auspragungen ξ1, . . . , ξJ:

• Absolute Haufigkeit der Auspragung ξj (j = 1, . . . J):

nj = Anzahl von Daten mit Merkmalswert ξj

• Relative Haufigkeit der Auspragung ξj (j = 1, . . . J):

fj =nj

n= Anteil von Daten mit Merkmalswert ξj

67

Offensichtlich gilt:

• 0 ≤ nj ≤ n sowie∑J

j=1 nj = n (warum?)

• 0 ≤ fj ≤ 1 sowie∑J

j=1 fj = 1 (warum?)

Jetzt:

• Mit den Begriffen der absoluten und relativen Haufigkeitengelangt man zur 1. Darstellungsform des Merkmals X, nam-lich zur Haufigkeitstabelle

68

Definition 4.1: (Haufigkeitstabelle)

Unter der Haufigkeitstabelle des Merkmals X versteht man diefolgende tabellarische Darstellung:

j ξj nj fj = nj/n1 ξ1 n1 f12 ξ2 n2 f2... ... ... ...J ξJ nJ fJSumme: n 1

69

Beispiel (Verkehrsmittelbenutzung):

• Grundgesamtheit bestehe aus 20 Beschaftigten eines Be-triebes, d.h. G = {e1, . . . , e20}

• Zu untersuchendes Merkmal X:Benutztes Verkehrsmittel zum Arbeitsplatz

• Merkmalsauspragungen:

ξ1 = Busξ2 = PKWξ3 = Motorradξ4 = Fahrradξ5 = zu Fuß

70

Erhobene Urliste:

1,1,2,2,2,4,3,5,2,2,5,2,4,1,1,2,2,1,2,1

Haufigkeitstabelle:

j ξj nj fj = nj/n1 Bus 6 6/20 = 0.302 PKW 9 9/20 = 0.453 Motorrad 1 1/20 = 0.054 Fahrrad 2 2/20 = 0.105 zu Fuß 2 2/20 = 0.10

Summe: 20 1.00

71

Man beachte den folgenden ’Trade-Off’:

• Ubergang von Urliste zur Haufigkeitstabelle

erhoht die Ubersichtlichkeit

fuhrt zu einem Informationsverlust

Grafische Darstellungen von Haufigkeitstabellen durch

• Saulendiagramme

• Balkendiagramme

72

Balken- oder Stabdiagramm (absolute Häufigkeiten)

0

2

4

6

8

10

Bus PKW Motorrad Fahrrad zu Fuß

Kuchen- oder Kreisdiagramm (relative Häufigkeiten)

Bus30%

PKW45%

Motorrad5%

Fahrrad10%

zu Fuß10%

Vorsicht bei der Interpretation von Grafiken:

• Grafiken konnen auf viele Weisen manipuliert werden

• Manipulation muss nicht immer schlecht sein

• Verzerren der Achsen

Bestimmte Bereiche werden hervorgehobenBestimmte Bereiche werden unterdruckt

• Skalierungen der Y -Achsen

Bestimmte Entwicklungen werden dramatisiertBestimmte Entwicklungen werden verschwiegen

74

Wichtige Kennzahl einer Datenreihe ist der Modus:

Definition 4.2: (Modus)

Ein Merkmalswert ξj heißt Modus, wenn seine (absolute oderrelative) Haufigkeit mindestens so groß ist wie die aller anderenMerkmalswerte, d.h. wenn nj ≥ nk fur alle k ∈ {1, . . . , J} gilt.

Offensichtlich:

• Eine Datenreihe kann mehrere Modi aufweisen

75

4.2 Mindestens ordinal skalierte Daten

Jetzt:

• Daten seien mindestens ordinal skaliert, d.h. erhobene Datenkonnen sinnvoll geordnet werden

Wichtige Darstellungsform der Daten:

• Empirische Verteilungsfunktion

76

Definition 4.3: (Empirische Verteilungsfunktion)

Gegeben seien die Daten x1, . . . , xn einer Urliste. Fur jede reelleZahl x ∈ R definiert man die empirische Verteilungsfunktionan der Stelle x (in Zeichen: F (x)) als den Anteil der Datenx1, . . . , xn, die kleiner oder gleich x sind:

F (x) =Anzahl aller xi ≤ x

n.

Bemerkung:

• Es gibt alternative Moglichkeiten, die empirische Verteilungs-funktion auszudrucken. Z.B. kann man alle Merkmalsauspra-gungen ξj (j = 1, . . . , J) betrachten, die kleiner oder gleich xsind und deren relative Haufigkeiten fj = nj/n aufsummieren:

F (x) =∑

ξj≤xfj

77

Beispiel (Klausurnoten): [I]

• 16 Studierende erzielten in einer Klausur die folgenden ganz-zahligen Noten:

3,4,2,1,2,4,5,5,2,1,4,5,3,3,2,4

• Zur Berechnung der emp. VF sortieren wir die Urliste vonder kleinsten zur großten Beobachtung

1,1,2,2,2,2,3,3,3,4,4,4,4,5,5,5

78

Beispiel (Klausurnoten): [II]

• Die emp. VF ergibt sich wie folgt:

F (x) =

016 = 0.0000 furx < 1

216 = 0.1250 fur 1 ≤ x < 2

616 = 0.3750 fur 2 ≤ x < 3

916 = 0.5625 fur 3 ≤ x < 4

1316 = 0.8125 fur 4 ≤ x < 5

1616 = 1.0000 furx ≥ 5

79

Bemerkung:

• Wir notieren die vom kleinsten Datenwert (Minimum) zumgroßten Datenwert (Maximum) geordnete Urliste als

x(1) ≤ x(2) ≤ . . . ≤ x(n).

(x(1) = Minimum der Urliste, x(n) = Maximum)

80

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5 6

Eigenschaften der empirischen Verteilungsfunktion: [I]

• F (x) = 0 fur alle x < x(1)

• F (x) = 1 fur alle x ≥ x(n)

• F (x) ist eine Treppenfunktion. Sprunge erfolgen an denStellen, die als Daten in der Urliste vorkommen. Die Sprunghohean der Stelle x = ξj betragt fj = nj/n.

• F (x) ist rechtsseitig stetig

• Ist die Urliste sehr lang (d.h. n sehr groß), so wird F (x)immer ’glatter’

81

Eigenschaften der empirischen Verteilungsfunktion: [II]

• Aus F (x) lassen sich die beobachteten Merkmalswerte undderen relativen Haufigkeiten rekonstruieren. Kennt man zu-satzlich noch n, so folgen aus F (x) auch die absoluten Hau-figkeiten

Wichtige Kennzahlen einer Datenreihe:

• Quantile

• Definition der Quantile uber emp. Verteilungsfkt. F (x)

82

Definition 4.4: (p-Quantil)

Gegeben seien die Daten x1, . . . , xn einer Urliste. Man betrachteeine beliebige reelle Zahl p mit 0 < p < 1. Das p-Quantil (oderder p · 100%-Punkt) der Daten (in Zeichen: xp) ist definiert als

xp = min {x ∈ R |F (x) ≥ p}

= kleinstes x ∈ R fur das gilt F (x) ≥ p.

Bemerkung:

• Das p-Quantil xp ist also der kleinste Wert x ∈ R mit derEigenschaft, dass mindestens p ·100% der Daten kleiner odergleich xp sind

83

Bisher:

• Bestimmung von Quantilen uber emp. VerteilungsfunktionF (x)

Jetzt:

• Technische Vorschrift (Algorithmus) zur Bestimmung vonQuantilen aus der Urliste x1, . . . xn (ohne Berechnung deremp. VF F (x))

Betrachte dazu:

• Geordnete Urliste der Daten

x(1) ≤ x(2) ≤ . . . x(n)

84

Das p-Quantil ist dann gegeben durch:

xp =

{

x(n·p), falls n · p ganzzahlig istx(bn·pc+1) sonst

(bn · pc bezeichnet den ganzzahligen Anteil von n · p)

Definition 4.5: (Spezielle Quantile)

Einige p-Quantile haben besondere Namen:

• Median (p = 0.5): x0.5

• Quartile (p = 0.25,0.5,0.75): x0.25, x0.5, x0.75

• Quintile (p = 0.2,0.4,0.6,0.8): x0.2, x0.4, x0.6, x0.8

85

Beispiel (Klausurnoten): [I]

• Urliste (ungeordnet)

x1 x2 x3 x4 x5 x6 x7 x83 4 2 1 2 4 5 5

x9 x10 x11 x12 x13 x14 x15 x162 1 4 5 3 3 2 4

• Geordnete Urliste

x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8)1 1 2 2 2 2 3 3

x(9) x(10) x(11) x(12) x(13) x(14) x(15) x(16)3 4 4 4 4 5 5 5

86

Beispiel (Klausurnoten): [II]

• Berechnung des 0.25-Quantils:

n = 16, p = 0.25 ⇒ n · p = 16 · 0.25 = 4 (ganzzahlig)

⇒ x0.25 = x(n·p) = x(4) = 2

• Berechnung des Medians:

n = 16, p = 0.5 ⇒ n · p = 16 · 0.5 = 8 (ganzzahlig)

⇒ x0.5 = x(n·p) = x(8) = 3

• Berechnung des 0.8-Quantils:

n = 16, p = 0.8 ⇒ n·p = 16·0.8 = 12.8 (nicht ganzzahlig)

⇒ x0.8 = x(bn·pc+1) = x(b12.8c+1) = x(12+1) = x(13) = 4

87

4.3 Metrisch skalierte Daten

Jetzt:

• Metrisch skaliertes Merkmal X (vgl. Folie 29)

• Rechenoperationen mit Daten x1, . . . , xn sinnvoll

Unter dieser Voraussetzung:

• Einfuhrung von Kennzahlen zur Beschreibungder Lage (Abschnitte 4.3.1, 4.3.2)der Streuung (Abschnitt 4.3.3)der Symmetrie (Abschnitt 4.3.6)

der metrisch skalierten Daten x1, . . . , xn

88

4.3.1 Lagemessung

Wichtige Frage der deskriptiven Statistik:

• Beschreibung des ’Lagezentrums’ der erhobenen Datenx1, . . . , xn durch geeignete Kennzahlen(Lagekennziffern, Lagemaße)

Man beachte:

• Je nach Skalenniveau der Daten kommen unterschiedlicheLagemaße in Betracht

89

Beispiele:

• Fur ordinal skalierte Daten kennen wir bereits

den Modus (haufigster Wert einer Datenreihe)den Median (0.5-Quantil, 50%-Wert)

Wichtigstes Lagemaß fur metrisch skalierte Daten:

Definition 4.6: (Arithmetisches Mittel)

Fur die metrisch skalierten Daten x1, . . . , xn ist das arithmetischeMittel (auch: Mittelwert oder Durchschnitt) definiert durch

x =1n· (x1 + x2 + . . . + xn) =

1n

n∑

i=1xi.

90

Eigenschaften des arithmetischen Mittels: [I]

• Arithm. Mittel und Merkmalssummen

i=1xi = n · x = x + x + . . . + x

︸ ︷︷ ︸

n mal

• x liegt zwischen Minimum und Maximum:

x(1) = min{x1, . . . , xn} ≤ x ≤ max{x1, . . . , xn} = x(n)

• Schwerpunkteigenschaft:n

i=1(xi − x) =

n∑

i=1xi − n · x = n · x− n · x = 0

91

Eigenschaften des arithmetischen Mittels: [II]

• Minimumeigenschaft:Fur x gilt:

n∑

i=1(xi − x)2 = min

c∈R

n∑

i=1(xi − c)2

Weitere Berechnungsmoglichkeiten fur x:

• Anhand von relativen bzw. absoluten Haufigkeiten(vgl. Folie 67)

x =1n

n∑

i=1xi =

1n

J∑

j=1ξj · nj =

J∑

j=1ξj · fj

92

Beispiel:

• Grundgesamtheit: n = 520 Haushalte eines Vorortes

• Merkmal: Anzahl der Haushaltsmitglieder

ξj nj1 1882 1733 794 565 206 4

Summe: 520

• Durchschnittliche Haushaltsgroße:

x =1

520· (1 · 188 + 2 · 173 + . . . + 6 · 4) = 2.1519

93

Verallgemeinerung des arithmetischen Mittels:

• Das gewogene arithmetische Mittel:

xw =n

i=1wi · xi

mit den Gewichten w1, . . . , wn, wobei

0 ≤ wi ≤ 1

n∑

i=1wi = 1

94

Bemerkungen:

• Mit w1 = w2 = . . . = wn = 1/n ergibt sich das arithmetischeMittel als Spezialfall

• Das gewogene Mittel ist zu verwenden, falls das relativeGewicht einzelner Untersuchungseinheiten an der Grundge-samtheit von Bedeutung ist. Soll z.B. der durchschnittlicheStrukturwandel in der BRD statistisch erfasst werden, so sindbei der Durchschnittsbildung uber die einzelnen Bundeslanderderen wirtschaftliche Kapazitaten zu berucksichtigen. Z.B.erhalt in der Strukturberichterstattung der gemessene Struk-turwandel in NRW ein hoheres Gewicht als der des Saarlan-des.

95

Arithmetisches Mittel vs. Median

Wiederholung (vgl. Folie 85):

• Median ist 0.5-Quantil

x0.5 =

{

x(n/2), falls n geradex(bn/2c+1), falls n ungerade

Man beachte:

• Sowohl das arithmetische Mittel x als auch der Median x0.5sind populare Lagemaße

96

Vergleich Mittelwert / Median:

• In die Berechnung von x fließen alle Beobacht. ein

Vorteil: Es wird keinerlei Information verschenkt

Nachteil: x reagiert empfindlich auf extreme Ausreißer inden Daten

• x0.5 wird durch Ermittlung der mittleren Position der geord-neten Urliste bestimmt

Vorteil: x0.5 ist robust gegenuber extremen Datenaus-reißern

Nachteil: Es wird Information verschenkt, da nur die Po-sition der Beobachtungen eine Rolle spielt

97

4.3.2 Weitere Mittelwerte

Neben dem (gewogenen) arithmetischen Mittel gibt es eine Reiheweiterer Mittelwerte:

Definition 4.7: (Harmonisches, geometrisches Mittel)

Es seien x1, . . . , xn metrisch skalierte Daten mit xi > 0 fur i =1, . . . , n. Das harmonische Mittel xH sowie das geometrischeMittel xG sind definiert als

xH =1

1n

n∑

i=1

1xi

=

1n

n∑

i=1x−1

i

−1

98

bzw.

xG = n√x1 · x2 · . . . · xn =

n∏

i=1xi

1n

.

Spezielle Anwendungsgebiete:

• Harmonisches Mittel: Indizes vom Typ Paasche(Kapitel 5)

• Geometrisches Mittel: Wachstumsfaktoren und Wachstum-sraten(Kapitel 5)

99

4.3.3 Streuungsmaße

Weitere Frage der dekriptiven Statistik:

• Wie stark streuen die Daten x1, . . . , xn um ein geeignet defi-niertes Zentrum?(Kennzahlen: Streuungs- oder Dispersionsmaße)

Man beachte:

• Mit alternativen Lagemaßen fur das Zentrum ergeben sichunterschiedliche Streuungsmaße

Wichtigste Streuungsmaße fur metrische Daten:

• Varianz und Standardabweichung

100

Definition 4.8: (Varianz, Standardabweichung)

Fur die metrisch skalierten Daten x1, . . . , xn ist die Varianz (inZeichen: s2) definiert durch

s2 =1n·

n∑

i=1(xi − x)2 .

Die Standardabweichung (in Zeichen: s) ist definiert als dieWurzel aus der Varianz, d.h.

s =√

s2 =

1n·

n∑

i=1(xi − x)2.

Bemerkung:

• Meist wird bei der Berechnung von s2 bzw. s nicht durch n,sondern durch n− 1 dividiert(Begrundung: in Statistik II)

101

Eigenschaften von s2 und s: [I]

• s2 hat quadratische Dimension, s hat gleiche Dimension wiedie Daten x1, . . . , xn

• Es gilt stets: s2 ≥ 0 und s ≥ 0

• Ferner:

s = 0 ⇐⇒ s2 = 0 ⇐⇒ x1 = x2 = . . . = xn,

d.h. Varianz und Std.Abwch. sind genau dann gleich 0, wennalle Daten gleich sind(keine Streuung)

102

Eigenschaften von s2 und s: [II]

• Alternative Darstellungen:

s2 =1n

n∑

i=1x2

i − x2 (Proseminar)

s2 =1

2n2

n∑

i=1

n∑

j=1

(

xi − xj)2

103

Zwei weitere zentrale Eigenschaften: [I]

• Es seien a, b ∈ R und x1, . . . , xn erhobene Daten eines Merk-mals X. Das Merkmal Y sei eine lineare Transformation vonX, d.h. Y = a ·X + b, so dass fur die Daten des Merkmals Ygilt

yi = a · xi + b fur alle i = 1, . . . , n.

Dann folgt fur die Varianz s2Y bzw. die StandardabweichungsY des Merkmals Y :

s2Y = a2 · s2X bzw. sY = |a| · sX

104

Zwei weitere zentrale Eigenschaften: [II]

• Fur jede reelle Zahl c ∈ R gilt der Verschiebungssatz:

1n

n∑

i=1(xi − c)2 = s2 + (x− c)2

Hieraus folgt die Minimumeigenschaft des arithmetischen Mit-tels (vgl. Folie 92):

”Die durchschnittliche quadratische Abweichung der Datenvon einem Bezugspunkt c wird minimal, wenn man c = xwahlt”

105

Alternative Streuungsmaße: [I]

• Mittlere absolute Abweichung vom Median:

d =1n

n∑

i=1|xi − x0.5|

Es gilt die Minimierungseigenschaft:

d = minc∈R

1n

n∑

i=1|xi − c|

• Quartilsabstand Q

Q = x0.75 − x0.25

(Lange des Bereichs mit mittleren 50% der Daten)

106

Alternative Streuungsmaße: [II]

• Spannweite R

R = maxi=1,...,n

{xi} − mini=1,...,n

{xi} = x(n) − x(1)

(Lange des gesamten Datenbereichs)

Jetzt:

• Berechnung von Streuungsmaßen anhand von Haufigkeiten

Zur Erinnerung (vgl. Folie 67):

• Merkmal X hat die J Auspragungen ξ1, . . . , ξJ mit den jew-eiligen absoluten Haufigkeiten n1, . . . , nJ

107

Damit folgende Formeln fur die Streuungsmaße:

s2 =1n

J∑

j=1

(

ξj − x)2· nj

s =

1n

J∑

j=1

(

ξj − x)2· nj

d =1n

J∑

j=1

∣ξj − x0.5∣

∣ · nj

R = maxj=1,...,J

{ξj|nj > 0} − minj=1,...,J

{ξj|nj > 0}

108

4.3.4 Additionssatze fur arithmetische Mittel undVarianzen

Ausgangssituation:

• Grundgesamtheit G gliedert sich in K TeilgesamtheitenG1, . . . , GK

• Mittelwerte bzw. Varianzen in den K Teilgesamtheiten sindx1, . . . , xK bzw. s21, . . . , s2K

• Umfange der Teilgesamtheiten seien n1, . . . , nKDamit ist der Umfang der Grundgesamtheit

n =K∑

k=1nk

109

Frage:

• Zusammenhange zwischen dem Mittelwert x bzw. der Vari-anz s2 der Grundgesamtheit und den Mittelwerten bzw. Vari-anzen der Teilgesamtheiten?

Additionssatz fur Mittelwerte:

x =K∑

k=1xk ·

nkn

(Mittelwert der Grundgesamtheit ist gewichtetes Mittel der Mit-telwerte der Teilgesamtheiten)

110

Additionssatz fur Varianzen:

s2 =K∑

k=1s2k ·

nkn

︸ ︷︷ ︸

=s2int

+K∑

k=1(xk − x)2 ·

nkn

︸ ︷︷ ︸

=s2ext

Bedeutung der internen bzw. externen Varianzen s2int, s2ext:

• Interne Varianz ist gewichtetes Mittel aus den Varianzen derTeilgesamtheiten

• Externe Varianz ist gewichtete quadratische Abweichung derMittelwerte xk der K Teilgesamtheiten vom Mittelwert x derGrundgesamtheit

111

Offensichtlich:

• Gesamtvarianz lasst sich exakt in Summe aus interner undexterner Varianz zerlegen:

s2 = s2int + s2ext

Beispiel:

• 100 (Wieder-)Erwerbstatige wurden nach der Dauer X derfruheren Arbeitslosigkeit befragt (in Monaten)

Frauen MannerAnzahl 60 40Mittlere Arbeitslosigkeitsdauer 9.2 7.4Std.-Abwchg. der Arbeitslosigkeitsdauer 4.1 3.2

112

Berechnungen:

x = 9.2 ·60100

+ 7.4 ·40100

= 8.48

s2int = 4.12 ·60100

+ 3.22 ·40100

= 14.182

s2ext = (9.2− 8.48)2 ·60100

+ (7.4− 8.48)2 ·40100

= 0.7776

s2 = s2int + s2ext = 14.182 + 0.7776 = 14.9596

s =√

14.9596 ≈ 3.9

113

4.3.5 Stetig klassierte Daten

Haufiges praktisches Problem:

• Daten liegen nicht als Urliste x1, . . . , xn vor (Einzeldaten),sondern zusammengefasst nach Klassen(stetig klassierte oder Gruppendaten)

Beispiel:

• Verfugbares Monatseinkommen (in Euro) von 5000 Studieren-den

114

j EK-Klasse Kj Studierende nj fjfj

xoj−xu

j1 0 bis 250 300 0.06 0.000242 mehr als 250 bis 500 1000 0.20 0.000803 mehr als 500 bis 750 2000 0.40 0.001604 mehr als 750 bis 1000 1000 0.20 0.000805 mehr als 1000 700 0.14

Summe: 5000 1.00

Grund fur stetige Klassierung:

• Bei sehr langen Datenreihen ist die Angabe von Haufigkeitenjedes einzelnen Datenpunktes oft sinnlos

115

Notationen zur Auswertung stetig klassierter Daten:

• Betrachte die J Klassen (Intervalle)

K1 = [xu1, xo

1], Kj = (xuj , xo

j], j = 2, . . . , J,

wobei fur die Intervallgrenzen gelten soll

xu1 < xo

1 = xu2 < xo

2 = xu3 < xo

3 < . . . < xoJ−1 = xu

J < xoJ

Bemerkungen:Die untere Grenze xu

1 der 1. Klasse kann −∞ seinDie obere Grenze xo

J der J. Klasse kann ∞ sein

• nj ist die Anzahl der Daten in Klasse Kj

• fj =njn ist der Anteil der Daten in Klasse Kj

116

Damit:

• Die Haufigkeitsverteilung der stetig klassierten Daten ist gegebendurch

(K1, n1), (K2, n2), . . . , (KJ , nJ)

bzw. durch

(K1, f1), (K2, f2), . . . , (KJ , fJ)

Bemerkung:

• Es wird nichts uber die Datenverteilung innerhalb der Klassenausgesagt−→ Informationsverlust

117

Probleme bei der stetigen Klassierung:

• Wieviele Klassen J soll man wahlen?Faustregel: Wahle bei n Daten J ≈ 10 · log10 n

• Soll man die J Klassen alle gleich breit wahlen?

• Ist es moglich, die oberste Klasse durch eine endliche Ober-grenze sinnvoll abzuschließen?

118

Definition 4.9: (Empirische Dichte, Histogramm)

Den Quotientennj

n · (xoj − xu

j )=

fj

xoj − xu

j

bezeichnet man als empirische Dichte der Daten in der KlasseKj, j = 1,2, . . . , J. Tragt man die empirischen Dichten als waage-rechte Linien uber den Klassen ab und zeichnet an den Klas-sengrenzen senkrechte Linien in Hohe der jeweiligen emprischenDichten ein, so entsteht ein Histogramm der Daten.

119

Empirische Dichten und Histogramm zum Beispiel ’Studierende’

120

0

0,0004

0,0008

0,0012

0,0016

0,002

0 250 500 750 1000 1250 1500

Bemerkungen zum Histogramm:

• Das Rechteck uber der Klasse j hat die Flache

(xoj − xu

j ) ·fj

xoj − xu

j= fj

• Die Gesamtflache unter dem Histogramm betragt 1, denn

Gesamtflache = Summe der Rechteckflachen

=J

j=1(xo

j − xuj ) ·

fj

xoj − xu

j

=J

j=1fj = 1

121

Jetzt:

• Berechnung statistischer Kenngroßen bei stetig klassiertenDaten

Zunachst:

• Empirische Verteilungsfunktion und Quantile

Erinnerung: (vgl. Folie 77, Definition 4.3)

• Der Wert der emp. Verteilungsfunktion F (x) ist definiert alsAnteil der Daten, die kleiner oder gleich x sind

122

Problem bei stetiger Klassierung:

• Verteilung der Daten in Klasse Kj ist unbekannt

−→ Fur ein x ∈ Kj (x nicht auf der Ober- oder Untergrenze)ist der Anteil nicht bestimmbar

Vorgehensweise:

• Betrachte zunachst die x ∈ R, fur die die emp. Verteilungs-funktion F (x) exakt berechenbar ist

123

Zunachst gilt:

F (x) =

0 fur x < xu1

1 fur x ≥ xoJ

Weiterhin gilt an den Obergrenzen aller Klassen:

F (xoj) =

j∑

r=1fr fur alle j = 1,2, . . . , J

Ubrig bleibt:

• Berechnung von F (x) fur x ∈ (xuj , xo

j]

124

Vorgehensweise:

• Lineare Interpolation von F (x) fur x ∈ (xuj , xo

j]:

F (x) ≈ F (xuj ) +

fj

xoj − xu

j(x− xu

j )

= F (xoj−1) +

fj

xoj − xu

j(x− xu

j )

=j−1∑

r=1fr +

fj

xoj − xu

j(x− xu

j )

125

Beispiel: (vgl. Folien 114, 115) [I]

• Monatseinkommen von 5000 Studierenden

• Obergrenze der letzten Klasse wurde willkurlich auf 1500Euro gesetzt

j EK-Klasse Kj fj F (xoj)

1 0 bis 250 0.06 0.062 mehr als 250 bis 500 0.20 0.263 mehr als 500 bis 750 0.40 0.664 mehr als 750 bis 1000 0.20 0.865 mehr als 1000 bis 1500 0.14 1.00

126

Beispiel: [I]

• Zwischen Klassengrenzen wird linear interpoliert, z.B.

F (650) ≈ f1 + f2 +f3

xo3 − xu

3(x− xu

3)

= 0.26 +0.4

750− 500(650− 500) = 0.5

Empirische Verteilungsfunktion zum Beispiel ’Studierende’

127

0,06

0,26

0,66

0,86

1

0

0,2

0,4

0,6

0,8

1

0 500 1000 1500

x

F(x)

Jetzt:

• Berechnung von Quantilen bei stetiger Klassierung uber em-pirische Verteilungsfunktion F (x)(vgl. Folie 83, Definition 4.4)

Zusatzannahme:

• Keine der Klassen Kj besitzt die Haufigkeit 0

=⇒ Emp. VF F (x) ist streng monoton wachsend=⇒ Fur jedes p ∈ (0,1) hat die Gleichung

F (x) = p

eine eindeutige Losung, namlich das p-Quantil xp

128

Explizite Berechnung von xp: [I]

1. Bestimme die Klasse Kj in der xp liegt,d.h. bestimme das j fur das gilt F (xu

j ) < p ≤ F (xoj)

2. Lose die Gleichung

p = F (xuj ) +

fj

xoj − xu

j(x− xu

j )

nach x auf. Die Losung approximiert das Quantil xp.

129

Explizite Berechnung von xp: [II]

p = F (xuj ) +

fj

xoj − xu

j(x− xu

j )

⇐⇒ x− xuj =

p− F (xuj )

fj(xo

j − xuj )

⇐⇒ x = xuj +

p− F (xuj )

fj(xo

j − xuj )

⇐⇒ x = xuj +

p− F (xuj )

F (xoj)− F (xu

j )(xo

j − xuj )

︸ ︷︷ ︸

≈ xp

130

Beispiel: (vgl. Folie 126, ’Einkommen Studierende’)

• Gesucht: unteres Quartil x0.25

Berechnung von x0.25:

1. 0.06 = F (xu2) < 0.25 ≤ 0.26 = F (xo

2),

d.h.

x0.25 ∈ K2 = (250,500]

2. Damit folgt:

x0.25 ≈ 250 +0.25− 0.060.26− 0.06

(500− 250) = 487.5

131

Es verbleibt:

• Berechnung weiterer statistischer Kennzahlen, z.B.

Arithmetisches Mittel

Varianz bzw. Standardabweichung

(Nicht in der VL)

132

4.3.6 Schiefemessung

Situation:

• Betrachte Urliste x1, . . . , xn (keine stetige Klassierung)

Wichtige praktische Feststellung:

• In der empirischen Wirtschaftsforschung werden Kennzahlenwie arithmetisches Mittel, Varianz, Standardabweichung etc.in der Praxis nicht per Hand ausgerechnet, sondern mit spe-zieller Auswertungssoftware (z.B. EViews)

133

Beispiel: (vgl. Folie 12)

• Tagliche Wechselkursveranderungsraten der griechischenDrachme zum Euro

Stabdiagramm und statistische Kennzahlen fur GRD-Veranderungsraten

134

0

100

200

300

400

500

-1.0 -0.5 0.0 0.5

Series: GRD_RETSample 16/12/1998 1/01/2001Observations 748

Mean 0.005082Median 0.000000Maximum 0.817738Minimum -1.295992Std. Dev. 0.114130Skewness -1.693633Kurtosis 38.21140

Jarque-Bera 38999.36Probability 0.000000

0

100

200

300

400

500

600

-4 -3 -2 -1 0 1 2 3

Series: SYMMETRIESample 1 5000Observations 5000

Mean -0.007964Median 0.004551Maximum 3.433310Minimum -3.982642Std. Dev. 0.994190Skewness -0.019422Kurtosis 2.939408

Jarque-Bera 1.079224Probability 0.582974

Symmetrische Verteilung

0

100

200

300

400

500

600

0.0 0.1 0.2 0.3 0.4 0.5 0.6

Series: RECHTSSample 1 5000Observations 5000

Mean 0.168041Median 0.150735Maximum 0.661654Minimum 0.002084Std. Dev. 0.102757Skewness 0.865684Kurtosis 3.650617

Jarque-Bera 712.6960Probability 0.000000

Rechtsschiefe Verteilung

0

100

200

300

400

500

600

0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Series: LINKSSample 1 5000Observations 5000

Mean 0.830835Median 0.851905Maximum 0.996949Minimum 0.280793Std. Dev. 0.104683Skewness -0.896282Kurtosis 3.619218

Jarque-Bera 749.3160Probability 0.000000

Linksschiefe Verteilung

Fazit:

• Datenreihen zeigen unterschiedliches Symmetrieverhalten

Jetzt:

• Kennzahl fur Symmetrieverhalten

136

Definition 4.10: (Schiefe)

Die Schiefe einer Urliste x1, . . . , xn ist definiert durch

g =1n

n∑

i=1

(xi − xs

)3,

wobei wie ublich

x =1n

n∑

i=1xi

und

s =

1n

n∑

i=1(xi − x)2

das arithmetische Mittel sowie die Standardabweichung der Datenbezeichnen.

137

Bemerkungen:

• Der zentrale Term in Definition 4.10 ist∑n

i=1(xi − x)3

• Liegen ’viele’ Daten xi rechts von x, so ist g tendenziell posi-tiv

• Liegen ’viele’ Daten xi links von x, so ist g tendenziell negativ

• Insgesamt gelten die folgenden Relationen:

g < 0 =⇒Verteilung ist linksschiefg ≈ 0 =⇒Verteilung ist symmetrischg > 0 =⇒Verteilung ist rechtsschief

138

5. Verhaltniszahlen, Messzahlen und Indexzahlen

Ziel dieses Kapitels:

• Grundlegende Maßzahlen der praktischen Wirtschaftsstatistik

5.1 Verhaltniszahlen

Definition 5.1: (Verhaltniszahl)

Eine Verhaltniszahl ist allgemein der Quotient zweier statistis-cher Großen. Die den beiden Großen zugrunde liegenden Grund-gesamtheiten konnen identisch oder verschieden sein. Als spezi-elle Verhaltniszahlen unterscheidet man Gliederungszahlen, Be-ziehungszahlen und Messzahlen.

139

Gliederungszahl:

• Aussage uber die Struktur der Grundgesamtheit G eines (me-trisch skalierten) Merkmals U

• Annahme: G zerfallt in J Teilgesamtheiten, d.h.

G = G1 ∪G2 ∪ . . . ∪GJ

• Es bezeichne uj die Merkmalssumme von U in der Teilge-samtheit Gj (j = 1, . . . , J), so dass gilt

u =J

r=1ur = Merkmalssumme von U auf ganz G

• Definiere nun fur j = 1, . . . , J die Gliederungszahlen

gj =uj

u

140

Bemerkungen:

• Die Gliederungszahlen gj sind Anteile, d.h. es gilt

gj ≥ 0∑J

r=1 gr = 1

Beispiele:

• Anteile der Studierenden der unterschiedlichen Disziplinenam Fachbereich WiWi der WWU(Betriebs-, Volkswirte, Wirtschaftsinformatiker)

• Anteile von Bund, Landern und Kommunen an der Gesamtver-schuldung der BRD

141

Beziehungszahl: [I]

• Aussage uber die Struktur der Grundgesamtheit G in Bezugauf 2 (metrisch skalierte) Merkmale U und V

• Annahme: G zerfallt in J Teilgesamtheiten, d.h.

G = G1 ∪G2 ∪ . . . ∪GJ

• Es bezeichnen uj und vj die Merkmalssummen von U und Vin der Teilgesamtheit Gj (j = 1, . . . , J), so dass gilt

u =J

r=1ur = Merkmalssumme von U auf ganz G

v =J

r=1vr = Merkmalssumme von V auf ganz G

142

Beziehungszahl: [II]

• Definiere nun die Beziehungszahlen

b =uv

bzw. fur j = 1, . . . , J

bj =uj

vj

Beispiel: (Bundeslanderstatistik)

• Amtliche Statistik der BRD

143

Bundesland Einw. in 1000 BIP (Mrd. DM)Baden-Wurttemberg 10397 520.36Bayern 12066 614.97Berlin 3426 154.81Brandenburg 2573 75.72Bremen 674 40.34Hamburg 1705 141.25Hessen 6032 340.91Meck.-Vorpommern 1808 47.91Niedersachsen 7845 315.75NRW 17975 799.51Rheinland-Pfalz 4018 156.04Saarland 1081 43.92Sachsen 4522 124.08Sachsen-Anhalt 2702 69.71Schleswig-Holstein 2757 113.79Thringen 2478 64.93Summe 82059 3624.00

144

Gliederungszahlen: (vgl. Folie 146)

• Bevolkerungsanteil

• Anteil am BIP

Beziehungszahlen: (vgl. Folie 147)

• BIP pro Kopf

145

Bundesland Bev.-Anteil Anteil am BIPBaden-Wurttemberg 0.1267 0.1436Bayern 0.1470 0.1697Berlin 0.0418 0.0427Brandenburg 0.0314 0.0209Bremen 0.0082 0.0111Hamburg 0.0208 0.0390Hessen 0.0735 0.0941Meck.-Vorpommern 0.0220 0.0132Niedersachsen 0.0956 0.0871NRW 0.2190 0.2206Rheinland-Pfalz 0.0490 0.0431Saarland 0.0132 0.0121Sachsen 0.0551 0.0342Sachsen-Anhalt 0.0329 0.0192Schleswig-Holstein 0.0336 0.0314Thringen 0.0302 0.0179Summe 1 1

146

Bundesland BIP pro Kopf in DMBaden-Wurttemberg 50049.05Bayern 50967.18Berlin 45186.81Brandenburg 29428.68Bremen 59851.63Hamburg 82844.57Hessen 56516.91Meck.-Vorpommern 26498.89Niedersachsen 40248.57NRW 44479.00Rheinland-Pfalz 38835.24Saarland 40629.05Sachsen 27439.19Sachsen-Anhalt 25799.41Schleswig-Holstein 41273.12Thringen 26202.58Deutschland insgesamt 44163.35

147

Einige Zusammenhange: [I]

• Es gilt:

b =uv

=1v

J∑

j=1uj =

J∑

j=1

uj

v

=J

j=1

vj

v·uj

vj

=J

j=1hj ·

uj

vj

−→ Beziehungszahl b = uv ist gewogenes arithmetisches Mittel

der Beziehungszahlenujvj

mit den Gewichten hj =vjv

148

Einige Zusammenhange: [II]

• Ferner gilt:

b =(v

u

)−1=

∑Jj=1 vj

u

−1

=

J∑

j=1

uj

u·vj

uj

−1

=

J∑

j=1gj

(

uj

vj

)−1

−1

=1

∑Jj=1 gj · 1

bj

−→ b = uv ist gewogenes harmonisches Mittel der bj =

ujvj

mit den

Gewichten gj =uju

149

Messzahl:

• Quotient zweier sachlich aufeinander bezogener Maßzahlenfur zwei statistische Massen

Beispiele: [I]

• Geschlechterverhaltnis

Geschl.-Verhaltn. =Manner in der BRD am 1.1.2010Frauen in der BRD am 1.1.2010

(Messzahl des sachlichen Vergleichs)

150

Beispiele: [II]

• Einwohnerrelation zwischen 2 Landern

Einwohnerel. =Einwohner der BRD am 1.1.2010

Einwohner Frankreichs am 1.1.2010(Messzahl des raumlichen Vergleichs)

• Einwohnerrelation eines Landes an 2 Zeitpunkten

Einwohnerel. =Einwohner der BRD am 1.1.2010Einwohner der BRD am 1.1.2005

(Messzahl des zeitlichen Vergleichs)

151

5.2 Messzahlen des zeitlichen Vergleichs

Ausgangssituation und Begriffe: [I]

• Betrachte eine zeitlich geordnete Folge von Zeitpunkten t0 ≤t1 ≤ . . . ≤ tT sowie die Auspragungen eines (metrischen)Merkmals X zu diesen Zeitpunkten:

xt0, xt1, . . . , xtT

(alternative Schreibweise: xt, t = t0, . . . , tT )

• Der Index t steht fur die Zeit (time). Deshalb nennt man dieobige Urliste xt0, . . . , xtT eine Zeitreihe

152

Ausgangssituation und Begriffe: [II]

• Sind die Abstande zwischen den Zeitpunkten t0, t1, . . . , tT im-mer gleich, d.h.

t1 − t0 = t2 − t1 = . . . = tT − tT−1,

so spricht man von aquidistanten Zeitpunkten. In diesemFall benennt man die Zeitpunkte t0, t1, . . . , tT der Einfachheithalber um in 0,1, . . . , T und notiert die obige Zeitreihe als

x0, x1, . . . , xT

Beispiele fur Zeitreihen:

• Monatliche Arbeitslosenquoten

• Tagliche Wechselkurse zwischen Euro und US-$

153

Haufiges Vorgehen in der Empirischen Wirtschaftsforschung:

• Wahle aus der Menge aller moglichen Zeitpunkte einen Ba-siszeitpunkt s ∈ {t0, . . . , tT} und setze die gesamte Zeitreihext, t = t0, . . . , tT , ins Verhaltnis zur Beobachtung xs des Ba-siszeitpunktes. Fur einen beliebigen Berichtszeitpunkt t be-trachtet man also den Quotienten

ms,t =xt

xsfur t = t0, . . . , tT

• Begrundung:Man interessiert sich fur die Entwicklung der Zeitreihe relativzur Auspragung des Basiszeitpunktes s(in praxi wird oft s = t0 gewahlt)

154

Definition 5.2: (Messzahl mit fester Basiszeit)

Fur einen konkreten Basiszeitpunkt s ∈ {t0, . . . , tT} nennt manden Quotienten

ms,t =xt

xs

die Messzahl fur die Berichtszeit t.

Man beachte:

• Aus Definition 5.2 folgt unmittelbar:

mt,t = 1

ms,t =xt

xs=

1xs/xt

=1

mt,s

155

Beispiel:

• Wechselkurszeitreihe ’Griechische Drachme zum Euro’(Tagesdaten)

Offensichtlich:

• Qualitativer Verlauf gleich

• Untere Grafik betont Kursverlauf relativ zum Startwert

156

320

325

330

335

340

345

15/12/98 3/07/99 19/01/00 6/08/00

Originale Zeitreihe

0.96

0.98

1.00

1.02

1.04

15/12/98 3/07/99 19/01/00 6/08/00

Zeitreihe zum Basiszeitpunkt s=0 (Basiswert: 328.388)

5.2.1 Umbasierung und Verkettung von Mess-zahlen

Definition 5.3: (Umbasierung)

Unter der Umbasierung einer Messzahl zum Basiszeitpunkt s ver-steht man den Ubergang zu einer Messzahl mit anderer Basiszeitr ∈ {t0, . . . , tT}.

Rechenregel fur Umbasierung: [I]

• Offensichtlich gilt fur jedes t ∈ {t0, . . . , tT}

mr,t =xt

xr=

xt/xs

xr/xs=

ms,t

ms,r

158

Rechenregel fur Umbasierung: [II]

−→ Zirkularitat von Messzahlen:

ms,t = ms,r ·mr,t

Verkettung von Messzahlen:

• Betrachtete aquidistante Zeitreihe x0, x1, . . . , xT und Folgenvon Messzahlen zu den Basiszeiten 0 bzw. s

m0,t fur t = 0,1, . . . , sms,t fur t = s, s + 1, . . . , T

• Gesucht: durchgehende (vollstandige) Folgen von Messzahlenzu den Basiszeiten 0 bzw. s

159

Losung:

• Messzahlenfolge fur die Basiszeit 0:

m0,t =

{

m0,t fur t = 0,1, . . . , sm0,s ·ms,t fur t = s + 1, s + 2, . . . , T

• Messzahlenfolge fur die Basiszeit s:

ms,t =

m0,tm0,s

fur t = 0,1, . . . , s− 1

ms,t fur t = s, s + 1, . . . , T

Zahlenbeispiel:

• In den Tutorien

160

5.2.2 Zuwachsraten und Zuwachsfaktoren

Betrachte:

• Aquidistante Zeitreihe xt, t = 0,1, . . . , T

• Messzahl mit fester Basiszeit

ms,t =xt

xs

(vgl. Definition 5.2, Folie 155)

161

Definition 5.4: (Zuwachsfaktor, Zuwachsrate)

Die Messzahl ms,t bzeichnet man auch als Zuwachsfaktor bzw. alsWachstumsfaktor. Die absolute Anderung xt − xs bezogen aufden Wert zur Zeit s

ws,t =xt − xs

xs= ms,t − 1

bezeichnet man als Zuwachsrate bzw. Wachstumsrate.

Bemerkungen:

• Zuwachsfaktoren und -raten werden oft in Prozent angegeben

• Es gilt

xt = ms,t · xs bzw. xt − xs = ws,t · xs

162

Beispiel:

• Bargeldumlauf in der BRD

Jahr Umlauf Zuwachsfaktor Zuwachsrate(in Mio. DM) (in Prozent)

1992 2272851993 238641 1.04996 4.9961994 250907 1.05140 5.1401995 263510 1.05023 5.0231996 275744 1.04643 4.6431997 276242 1.00181 0.1811998 270981 0.98096 −1.9041999 289972 1.07008 7.0082000 278143 0.95921 −4.0792001 162205 0.58317 −41.683

163

Definition 5.5: (Durchschnittlicher Zuwachsfaktor)

Als durchschnittlichen Zuwachsfaktor zwischen Anfangs- undEndzeitpunkt bezeichnet man das geometrische Mittel (vgl. Def-inition 4.7, Folie 98) der 1-periodigen Zuwachsfaktoren:

mG = T√

m0,1 ·m1,2 · . . . ·mT−1,T .

Bemerkungen: [I]

• Es gilt:

mG = T√

m0,1 ·m1,2 · . . . ·mT−1,T

= T

x1

x0·x2

x1·x3

x2· . . . ·

xT−1

xT−2·

xTxT−1

= T

xTx0

(Durchschnittl. Zuwachsfaktor hangt nur von x0 und xT ab)

164

Bemerkungen: [II]

• Wenn x0 jede Periode um den durchschnittlichen Zuwachs-faktor steigt, ergibt sich nach T Perioden xT :

t = 0 : x0

t = 1 : x0 ·mG

t = 2 : x0 ·mG ·mG = x0 ·m2G

... ...

t = T : x0 ·mTG = x0 ·

(

T

xTx0

)T= xT

165

Definition 5.6: (Durchschnittliche Zuwachsrate)

Als durchschnittliche Zuwachsrate bezeichnet man den um 1 ver-minderten durchschnittlichen Zuwachsfaktor:

w = mG − 1 = T

xTx0

− 1.

166

5.2.3 Logarithmische Zuwachsraten

Definition 5.7: (Logarithmische Zuwachsrate)

Unter der logarithmischen Zuwachsrate (auch stetige Zuwach-srate) zwischen den Zeitpunkten s, t versteht man die Große

rs,t = ln(xt

xs

)

= ln(xt)− ln(xs).

Bemerkungen: [I]

• Es gilt:

xt = xs · ers,t

167

Bemerkungen: [II]

• Zwischen der log. Wachstumsrate rs,t und der Zuwachsratews,t aus Definition 5.4 gilt in ’guter’ Naherung:

rs,t = ln(xt)− ln(xs) ≈xt − xs

xs= ws,t

Vorteile der logarithmischen Wachtumsrate: [I]

• Addierbarkeit:

r0,T = ln(xT )− ln(x0) =T

t=1

[

ln(xt)− ln(xt−1)]

=T

t=1rt−1,t

(Wachstumsrate r0,T ist Summe der 1-periodigen Wachs-tumsraten rt−1,t)

168

Vorteile der logarithmischen Wachtumsrate: [II]

−→ Durchschnittliche logarithmische Zuwachsrate r zwischen denZeitpunkten 0 und T ist arithmetisches Mittel der 1-periodigenlogarithmischen Wachstumsraten

r =1T·

T∑

t=1rt−1,t =

1T· r0,T

• ’Symmetrie’:Verandert sich der Wert xt in der Folgeperiode t+1 auf xt+1und fallt dann in t+2 auf xt zuruck (also xt+2 = xt), so sinddie log. Wachstumsraten rt,t+1 und rt+1,t+2 vom Betrage hergleich (mit entgegengesetzen Vorzeichen)

169

Beispiel: Symmetrische Aktienkursbewegung

Periode Kurs rt,t+1 wt,t+1t 100

t + 1 110 0.0953 0.1t + 2 100 −0.0953 −0.0909

Summe: 0 0.0091

Anwendungsgebiete der log. Zuwachsrate:

• Finanzmathematik (stetige Verzinsung)

• Finanzmarkte (Aktien- und Wechselkursanderungen)

• Modelle der Wachstums- und Konjunkturtheorie

170

5.3 Indexzahlen

Bisher:

• Zeitliche Entwicklung einer okonomischen Große uber Mess-zahlen

Jetzt:

• Zeitliche Entwicklung mehrerer Großen gleichzeitig

171

Beispiele:

• Preisentwicklung fur Guter des privaten Konsums

Problem:Preise einiger Guter steigen, Preise anderer Guter fallen

−→ Aggregation aller Messzahlen zu einer Indexzahl (Index)

• Aktienindizes (DAX, Dow Jones, Euro Stoxx)

Aggregation von Kursen verschiedener Aktien zu einemAktienkorb

Ziel:Darstellung der Entwicklung des Gesamtmarktes

172

Voraussetzungen und Notationen:

• Betrachte einen Warenkorb (Kollektion von Gutern)

• Jedes Gut des Korbes hat einen Preis und eine Menge

• n: Anzahl der Guter im Warenkorb

• pt(i): Preis des Gutes i zur Zeit t

• qt(i): Menge des Gutes i zur Zeit t

• vt(i) = pt(i) · qt(i): Wert des Gutes i zur Zeit t

173

Benennungen:

• Preise: GeldeinheitenMengeneinheit (z.B. 1 Euro / Liter)

• Mengen: Mengeneinheiten

• Wert: Geldeinheiten

Betrachtung zweier Zeitpunkte:

• Berichtszeit (notiert mit t)

• Basiszeit (Setzung auf 0)

174

Generelles Ziel:

• Beschreibung der Veranderungen von Preisen, Mengen undWerten des gesamten Warenkorbes zwischen der Berichtszeitt und dem Basiszeitpunkt 0

Zunachst fur einzelnes Gut i (i = 1, . . . , n):

• pt(i)p0(i)

: Preismesszahl fur das Gut i

• qt(i)q0(i)

: Mengenmesszahl fur das Gut i

• vt(i)v0(i)

: Wertmesszahl fur das Gut i

175

Offensichtlich:

vt(i)v0(i)

=pt(i) · qt(i)p0(i) · q0(i)

=pt(i)p0(i)

·qt(i)q0(i)

(Wertmesszahl = Preismesszahl × Mengenmesszahl)

Bisher:

• Anderungen des Warenkorbes durch 3 · n Messzahlen

Jetzt:

• Aggregation einzelner Messzahlen zu Indexzahlen

176

5.3.1 Preisindizes

Ziel:

• Indexzahlen zur Messung der Preisentwicklung

Definition 5.8: (Laspeyres-Preisindex)

Die Mittelwertform des Preisindexes vom Typ Laspeyres ist defi-niert durch

IpLa;0,t =

n∑

i=1

pt(i)p0(i)

·p0(i) · q0(i)

∑nj=1 p0(j) · q0(j)

.

177

Bemerkungen: [I]

• In seiner Mittelwertform ist der Preisindex IpLa;0,t ein gewo-

genes arithmetisches Mittel der Preismesszahlen

pt(i)p0(i)

, i = 1, . . . , n.

• Die Gewichtep0(i) · q0(i)

∑nj=1 p0(j) · q0(j)

sind die Ausgabenanteile fur jedes einzelne Gut i zum Ba-siszeitpunkt 0

178

Bemerkungen: [II]

• Durch Kurzen von p0(i) ergibt sich die Aggregatform desLaspeyres-Indexes:

IpLa;0,t =

∑ni=1 pt(i) · q0(i)

∑ni=1 p0(i) · q0(i)

Definition 5.9: (Paasche-Preisindex)

Die Mittelwertform des Preisindexes vom Typ Paasche ist definiertdurch

IpPa;0,t =

1n

i=1

1pt(i)p0(i)

·pt(i) · qt(i)

∑nj=1 pt(j) · qt(j)

.

179

Bemerkungen: [I]

• In seiner Mittelwertform ist der Preisindex IpPa;0,t ein gewo-

genes harmonisches Mittel der Preismesszahlen

pt(i)p0(i)

, i = 1, . . . , n.

• Die Gewichtept(i) · qt(i)

∑nj=1 pt(j) · qt(j)

sind die Ausgabenanteile fur jedes einzelne Gut i zum Bericht-szeitpunkt t

180

Bemerkungen: [II]

• Durch Umformung des Doppelbruchs ergibt sich die Aggre-gatform des Paasche-Indexes:

IpPa;0,t =

∑ni=1 pt(i) · qt(i)

∑ni=1 p0(i) · qt(i)

Beispiel: [I]

• Warenkorb mit n = 3 Gutern

Gut Basiszeit t = 0 Berichtszeit t = 1i p0(i) q0(i) p1(i) q1(i)1 14.30 2.20 14.70 1.802 1.19 8.00 1.05 18.003 0.94 18.00 0.99 14.00

181

Beispiel: [II]

• Arbeitstabelle zur Indexberechnung in Aggregatform

i p1(i) · q0(i) p0(i) · q0(i) p1(i) · q1(i) p0(i) · q1(i)1 32.34 31.46 26.46 25.742 8.40 9.52 18.90 21.423 17.82 16.92 13.86 13.16∑

58.56 57.90 59.22 60.32

• Berechnung der Indizes:

IpLa,0,t =

58.5657.90

= 1.0114, IpPa,0,t =

59.2260.32

= 0.9818

182

Offensichtliches Dilemma:

• Laspeyres-Index zeigt Preiserhohung an, Paasche-Index dage-gen Preissenkung

Frage:

• Wie hangen die beiden Indizes zusammen?

183

Mathematisches Resultat:

• Es gilt

IpPa,0,t < Ip

La,0,t

genau dann, wenn die beiden Folgen der Preis- und Mengen-messzahlen (fur i = 1, . . . , n)

pt(i)p0(i)

undqt(i)q0(i)

’negativ korreliert’ sind(Zum Begriff der Korrelation, vgl. Kapitel 6)

Jetzt:

• Ein letzter Preis-Index-Typ

184

Definition 5.10: (Fisher-Preisindex)

Der Preisindex vom Typ Fisher ist definiert durch

IpF i;0,t =

IpLa;0,t · I

pPa;0,t.

Bemerkungen:

• Fisher-Index ist geometrisches Mittel aus Laspeyres- undPaasche-Index

• Es gilt:

min{

IpLa;0,t, I

pPa;0,t

}

≤ IpF i;0,t ≤ max

{

IpLa;0,t, I

pPa;0,t

}

• Fur das obige Warenkorbbeispiel gilt:

IpF i;0,t =

√1.0114 · 0.9818 = 0.9965

(Preisreduktion des Warenkorbes um 0.35%)

185

5.3.2 Mengenindizes

Jetzt:

• Ubertragung des Konzeptes der Preisindizes auf Mengenin-dizes durch einfache Vertauschung der Rollen von Preisenund Mengen

186

Definition 5.11: (Mengenindizes)

Die Mittelwert- bzw. Aggregatformen des(a) Mengenindexes nach Laspeyres sind definiert durch

IqLa;0,t =

n∑

i=1

qt(i)q0(i)

·p0(i) · q0(i)

∑nj=1 p0(j) · q0(j)

=∑n

i=1 qt(i) · p0(i)∑n

i=1 q0(i) · p0(i),

(b) Mengenindexes nach Paasche sind definiert durch

IqPa;0,t =

1n

i=1

1qt(i)q0(i)

·pt(i) · qt(i)

∑nj=1 pt(j) · qt(j)

=∑n

i=1 qt(i) · pt(i)∑n

i=1 q0(i) · pt(i).

(c) Der Mengenindex nach Fisher ist definiert durch

IqF i;0,t =

IqLa;0,t · I

qPa;0,t.

187

5.3.3 Wertindizes

(Kanonische) Definition eines Wertindexes:

• Man beachte hierbei, dass die Werte des Warenkorbes zu denZeitpunkten 0 bzw. t gegeben sind durch

n∑

i=1v0(i) =

n∑

i=1p0(i) · q0(i) bzw.

n∑

i=1vt(i) =

n∑

i=1pt(i) · qt(i)

Definition 5.12: (Wertindex)

Ein geeigneter Wertindex ist in naturlicher Weise definiert durch

Iv0,t =

∑ni=1 vt(i)

∑ni=1 v0(i)

=∑n

i=1 pt(i) · qt(i)∑n

i=1 p0(i) · q0(i).

188

Bemerkungen:• Strukturell analog zu den Preis- und Mengenindizes konnte

man Wertindizes vom Typ Laspeyeres, Paasche bzw.Fisher definieren als

IvLa;0,t =

n∑

i=1

vt(i)v0(i)

·v0(i)

∑nj=1 v0(j)

IvPa;0,t =

1n

i=1

1vt(i)v0(i)

·vt(i)

∑nj=1 vt(j)

IvF i;0,t =

IvLa;0,t · I

vPa;0,t

• Man uberpruft leicht, dass gilt:

IvLa;0,t = Iv

Pa;0,t = IvF i;0,t = Iv

0,t

189

5.3.4 Umbasierung und Verkettung von Indizes

Jetzt:

• Umbasierung und Verkettung beliebiger Indizes (Preis, Menge,Wert) in Analogie zur Umbasierung und Verkettung von Mess-zahlen(vgl. Folien 158, 159)

190

Definition 5.13: (Umbasierung von Indizes)

Gegeben sei eine Folge von Indizes zur Basiszeit s:

I∗s,t, t = t0, t1, . . . , tT .

Eine Folge von Indizes Ir,t zu einer alternativen Basiszeit r ∈{t0, t1, . . . , tT}, r 6= s, erhalt man durch

Ir,t =I∗s,tI∗s,r

, t = t0, t1, . . . , tT .

191

Definition 5.14: (Verkettung von Indizes)

Gegeben seien zwei Folgen von Indizes zu aquidistanten Zeiten:

I∗0,t fur t = 0,1, . . . , s,

I∗∗s,t fur t = s, s + 1, . . . , T.

Als verkettete Folge zur Basiszeit 0 verwendet man

I0,t =

{

I∗0,t fur t = 0,1, . . . , sI∗0,s · I

∗∗s,t fur t = s + 1, . . . , T

.

Durch Umbasierung der Indizes I∗0,t erhalt man die verketteteFolge zur Basiszeit s:

Is,t =

I∗0,tI∗0,s

fur t = 0,1, . . . , s− 1

I∗∗s,t fur t = s, s + 1, . . . , T.

192

Problem:

• Umbasierung und Verkettung von Indizes ist im allgemeinennicht typerhaltend

Beispiel: [I]

• Umbasierung des Laspeyres-Preisindexes IpLa;91,t vom Basiszeit-

punkt 91 auf Basiszeitpunkt 95

193

Beispiel: [II]

• Fur den Berichtszeitpunkt t = 96 ergibt sich:

I95,96 =IpLa;91,96

IpLa;91,95

=

∑ni=1 p96(i) · q91(i)

∑ni=1 p91(i) · q91(i)

∑ni=1 p95(i) · q91(i)

∑ni=1 p91(i) · q91(i)

=∑n

i=1 p96(i) · q91(i)∑n

i=1 p95(i) · q91(i)

6=∑n

i=1 p96(i) · q95(i)∑n

i=1 p95(i) · q95(i)= Ip

La;95,96

194

5.3.5 Formale Indexkriterien (Fisher-Proben)

Offensichtlich:

• Es gibt mehrere Indizes fur ein Messproblem

Frage:

• Welcher Index ist der ’beste’?

Losungsmoglichkeit:

• Postuliere ’sinnvolle’ Kriterien, die ein Index erfullen sollte

195

Vorschlag von I. Fisher (1922): [I]

• Ein Index Is,t (zur Basiszeit s und Berichtszeit t) sollte diefolgenden 7 Kriterien erfullen:

(1) Identitatsprobe

It,t = 1

(2) Zeitumkehrprobe

It,0 =1

I0,t

(3) Rundprobe (fur die Zeitpunkte t1, t2, . . . , tT )

It1,tT = It1,t2 · It2,t3 · . . . · ItT−1,tT

196

Vorschlag von I. Fisher (1922): [II](4) Faktorumkehrprobe

Iv0,t = Ip

0,t · Iq0,t

(5) Proportionalitatsprobe

Ip0,t = 1 + α,

wenn alle Preise um α · 100% steigen

(6) DimensionswechselsprobeDer Wert der Indizes hangt nicht davon ab, in welchen Ein-heiten Preise und Mengen gemessen werden

(7) BestimmtheitsprobeDer Index soll auch dann bestimmt sein, wenn einzelne Preiseoder Mengen gleich 0 sind

197

Frage:

• Welche Kriterien (Fisherproben) erfullen die alternativen In-dizes vom Typ Laspeyres, Paasche, Fisher?

Fisherprobe Laspeyres Paasche FisherIdentitatsprobe + + +Zeitumkehrprobe − − +Rundprobe − − −Faktorumkehrprobe − − +Proportionalitatsprobe + + +Dimensionswechselprobe + + +Bestimmtheitsprobe + + +

Fazit:

• Der Fisher-Index erfullt die meisten, aber auch nicht alle Kri-terien (6 von 7)

198

6. Auswertung mehrdimensionaler Daten

Bisher:

• Auswertungsmethoden fur Daten eines einzelnen Merkmals,z.B.

Diskrete Klassierung

Grafische Darstellungen (Verteilungsfunktion)

Lagemaße

Streungsmaße

Schiefemaße

199

Jetzt:

• Methoden zur Auswertung von Daten uber mehrere Merk-male gleichzeitig(mehrdimensionale oder multivariate Daten)

Ziele:

• Simultane Beschreibung durch Tabellen und Grafiken

• Mehrdimensionale Messung von Lage und Streuung

• Aufdecken von Beziehungen zwischen den Merkmalen(Korrelationen)

200

6.1 Grundbegriffe

Ausgangssituation: [I]

• n Merkmalstrager e1, e2, . . . , en

• Grundgesamtheit: G = {e1, e2, . . . , en}

• 2 Merkmale X und Y , die jeweils am Merkmalstrager ei, i =1, . . . , n, beobachtet werden konnen

201

Ausgangssituation: [II]

• Urliste lautet dann:

(x1, y1), (x2, y2), . . . , (xn, yn)

oder in Matrix-Schreibweise

x1 y1x2 y2... ...

xn yn

(n× 2 Matrix)

202

Beispiel: [I]

• Ausgaben fur Werbung und Absatze von 84 Unternehmen inden USA im Jahr 1990

• Merkmale

X: Ausgaben fur Werbung (in Mill. US-$)

Y : Absatz (in Mill. US-$)

203

Beispiel: [II]

• Datensatz:

i Werbeausgaben (X) Absatze (Y)1 11.22487 508.83022 31.08904 517.04253 70.32822 524.7197... ... ...

82 31.50510 502.037883 55.39850 515.297684 48.43819 501.1283

• Falls X und Y metrisch skaliert sind (wie hier), kann man dien Datenpunkte (x1, y1), . . . , (xn, yn) in einem Streudiagrammdarstellen

204

Streudiagramm ’Werbeausgaben gegen Absatzzahlen’

205

480

500

520

540

560

0 20 40 60 80 100

Werbeausgaben in Mill. US-$ (X)

Abs

atz

in M

ill.

US-

$ (Y

)

Jetzt:

• Betrachte p ≥ 2 Merkmale X1, . . . , Xp mit Beobachtungen(xi1, xi2, . . . , xip) fur die Untersuchungseinheit ei−→ Urliste bzw. n× p Datenmatrix:

(x11, x12, . . . , x1p), (x21, x22, . . . , x2p), . . . , (xn1, xn2, . . . , xnp)

x11 x12 . . . x1px21 x22 . . . x2p... ... . . . ...

xn1 xn2 . . . xnp

206

6.1.1 Kontingenztafel und Haufigkeiten

Gegeben:

• 2 Merkmale X und Y

• n× 2 Datenmatrix

x1 y1x2 y2... ...

xn yn

bzw. Urliste mit n Zahlenpaaren

(xi, yi), i = 1, . . . , n,

207

Ziel:

• Beschreibung von absoluten und relativen Haufigkeiten

Notation:

• ξ1, . . . , ξJ seien die J moglichen Werte von X

• η1, . . . , ηK seien die K moglichen Werte von Y

208

Definition 6.1: (Gemeinsame und Randhaufigkeiten) [I]

Fur jedes j = 1, . . . , J und k = 1, . . . , K versteht man

1. unter der gemeinsamen absoluten Haufigkeit die Anzahl njkaller Datenpaare (xi, yi) fur die gilt xi = ξj und yi = ηk.

2. unter den absoluten Randhaufigkeiten der X-Auspragung ξjbzw. der Y -Auspragung ηk die Summen

nj· =K∑

k=1njk bzw. n·k =

J∑

j=1njk.

209

Definition 6.1: (Gemeinsame und Randhaufigkeiten) [II]

3. Die gemeinsamen absoluten Haufigkeiten zusammen mit denabsoluten Randhaufigkeiten stellt man ubersichtlich in derfolgenden Haufigkeitstabelle dar, die man Kontingenztafeloder Kontingenztabelle nennt:

Y =η1 η2 . . . ηK−1 ηK∑

ξ1 n11 n12 . . . n1(K−1) n1K n1·ξ2 n21 n22 . . . n2(K−1) n2K n2·

X = ... ... ... ... ... ...ξJ−1 n(J−1)1 n(J−1)2 . . . n(J−1)(K−1) n(J−1)K n(J−1)·

ξJ nJ1 nJ2 . . . nJ(K−1) nJK nJ ·∑

n·1 n·2 . . . n·(K−1) n·K n

210

Beispiel: [I]

• Erhebung folgender Merkmale bei n = 1000 Personen:

Berufszugehorigkeit X

Ausmaß sportlicher Betatigung Y

211

Beispiel: [II]

• Kontingenztabelle:

Y (sportliche Betatigung)X (Berufsgruppe) nie gelegentlich regelmaßig

Arbeiter 240 120 70 430Angestellte 160 90 90 340Beamte 30 30 30 90Landwirte 37 7 6 50sonstige 40 32 18 90∑

507 279 214 1000

• Offensichtlich:Aus gemeinsamen Haufigkeiten lassen sich Randhaufigkeiteneindeutig bestimmen(Umkehrung gilt nicht!)

212

Definition 6.2: (Relative Haufigkeiten, Randverteilung)

Fur jedes j = 1, . . . , J und k = 1, . . . , K heißen

1. fjk =njkn die gemeinsame relative Haufigkeit von ξj und ηk,

2. fj· =∑K

k=1 fjk bzw. f·k =∑J

j=1 fjk die relative Randhaufigkeitvon ξj bzw. ηk.

3. Die relativen Randhaufigkeiten f1·, f2·, . . . , fJ · der Werte vonX nennt man die Randverteilung des Merkmals X. Entspre-chend bilden die relativen Randhaufigkeiten f·1, f·2, . . . , f·K dieRandverteilung des Merkmals Y .

213

Kontingenztafel mit relativen Haufigkeiten:

Y =η1 η2 . . . ηK−1 ηK∑

ξ1 f11 f12 . . . f1(K−1) f1K f1·ξ2 f21 f22 . . . f2(K−1) f2K f2·

X = ... ... ... ... ... ...ξJ−1 f(J−1)1 f(J−1)2 . . . f(J−1)(K−1) f(J−1)K f(J−1)·

ξJ fJ1 fJ2 . . . fJ(K−1) fJK fJ ·∑

f·1 f·2 . . . f·(K−1) f·K 1

214

Bemerkung:

• Offensichtlich gilt:

J∑

j=1

K∑

k=1fjk =

J∑

j=1fj· =

K∑

k=1f·k = 1

(Die Summe uber den relativen Randhaufigkeiten eines jedenMerkmals ist 1)

215

Kontingenztabelle mit relativen Haufigkeiten fur das obige Beispiel:

Y (sportliche Betatigung)X (Berufsgruppe) nie gelegentlich regelmaßig

Arbeiter 0.240 0.120 0.070 0.430Angestellte 0.160 0.090 0.090 0.340Beamte 0.030 0.030 0.030 0.090Landwirte 0.037 0.007 0.006 0.050sonstige 0.040 0.032 0.018 0.090∑

0.507 0.279 0.214 1.000

216

6.1.2 Bedingte Verteilungen

Jetzt:

• Weiteres wichtiges Konzept der mehrdimensionalen Daten-analyse

Definition 6.3: (Bedingte relative Haufigkeiten)

Fur ein festes k ∈ {1, . . . , K} sowie fur jedes j = 1, . . . , J nenntman die Große

fj|Y =ηk=

fjk

f·kdie bedingte relative Haufigkeit von ξj unter der Bedingung Y =ηk.

217

Bemerkung:

• Die bedingte relative Haufigkeit fj|Y =ηkist die relative Haufigkeit

der X-Auspragung ξj in der Teilgesamtheit aller derjenigenEinheiten, welche die Y -Auspragung ηk aufweisen, denn

fj|Y =ηk=

fjk

f·k=

njk

nn·kn

=njk

n·k

Definition 6.4: (Bedingte Verteilung)

Gemaß Definition 6.3 kann man insgesamt J bedingte relativeHaufigkeiten betrachten:

f1|Y =ηk, f2|Y =ηk

, . . . , fJ |Y =ηk.

Die Gesamtheit dieser J Werte heißt die bedingte Verteilung vonX unter (der Bedingung) Y = ηk.

218

Bemerkungen: [I]

• Analog zu Definition 6.3 definiere fur ein festes j ∈ {1, . . . , J}sowie fur beliebige k = 1, . . . , K

fk|X=ξj=

fjk

fj·.

Diese Große heißt bedingte relative Haufigkeit von ηk unter(der Bedingung) X = ξj.

• Analog zu Definition 6.4 heißt

f1|X=ξj, f2|X=ξj

, . . . , fK|X=ξj

die bedingte Verteilung von Y unter X = ξj

219

Bemerkungen: [II]

• Offensichtlich gilt:

J∑

j=1fj|Y =ηk

=J

j=1

njk

n·k= 1 fur jedes k = 1, . . . , K

K∑

k=1fk|X=ξj

=K∑

k=1

njk

nj·= 1 fur jedes j = 1, . . . , J

220

Beispiel: (Berufsgruppe ←→ Sport, vgl. Folien 211 ff.)

Gesucht: [I]

• Verteilung der sportlichen Aktivitat bei Arbeiternoder statistisch ausgedruckt:Die bedingte Verteilung von Y unter X = ξ1

f1|X=ξ1 =n11

n1·=

240430

= 0.558 (nie)

f2|X=ξ1 =n12

n1·=

120430

= 0.279 (gelegentlich)

f3|X=ξ1 =n13

n1·=

70430

= 0.163 (regelmaßig)

221

Gesucht: [II]

• Verteilung der Berufsgruppen bei regelmaßig Aktivenoder statistisch ausgedruckt:Die bedingte Verteilung von X unter Y = η3

f1|Y =η3=

70214

= 0.327 (Arbeiter)

f2|Y =η3=

90214

= 0.421 (Angestellte)

f3|Y =η3=

30214

= 0.140 (Beamte)

f4|Y =η3=

6214

= 0.028 (Landwirte)

f5|Y =η3=

18214

= 0.084 (sonstige)

222

6.1.3 Deskriptive Unabhangigkeit

Jetzt:

• Frage nach dem Zusammenhang zwischen X und Y

Definition 6.5: (Deskriptive Unabhangigkeit)

Die Merkmale X und Y heißen deskriptiv unabhangig, falls sichfur alle j = 1, . . . , J und fur alle k = 1, . . . , K die gemeinsamenrelativen Haufigkeiten als Produkt der relativen Randhaufigkeitenergeben, d.h. falls gilt

fjk = fj· · f·k.

223

Beispiel: (Geschlecht (X) ←→ gewahlte Partei (Y ))

Kontingenztafel mit absoluten Haufigkeiten:

Y (Partei)X (Geschlecht) A B C

mannlich 200 120 80 400weiblich 300 180 120 600

500 300 200 1000

224

Kontingenztafel mit relativen Haufigkeiten:

Y (Partei)X (Geschlecht) A B C

mannlich 0.20 0.12 0.08 0.40weiblich 0.30 0.18 0.12 0.60

0.50 0.30 0.20 1.00

f11 = 0.20 = 0.40 · 0.50 = f1· · f·1f12 = 0.12 = 0.40 · 0.30 = f1· · f·2f13 = 0.08 = 0.40 · 0.20 = f1· · f·3f21 = 0.30 = 0.60 · 0.50 = f2· · f·1f22 = 0.18 = 0.60 · 0.30 = f2· · f·2f23 = 0.12 = 0.60 · 0.20 = f2· · f·3

Fazit: X und Y sind deskriptiv unabhangig225

Betrachte nun:

• Bedingte Verteilungen von X unter Y = η1, Y = η2, Y = η3

• Bedingte Verteilungen von Y unter X = ξ1, X = ξ2

Bedingte Verteilungen von X: [I]

• unter Y = η1:

f1|Y =η1=

f11

f·1=

0.200.50

= 0.40

f2|Y =η1=

f21

f·1=

0.300.50

= 0.60

226

Bedingte Verteilungen von X: [II]

• unter Y = η2:

f1|Y =η2=

f12

f·2=

0.120.30

= 0.40

f2|Y =η2=

f22

f·2=

0.180.30

= 0.60

• unter Y = η3:

f1|Y =η3=

f13

f·3=

0.080.20

= 0.40

f2|Y =η3=

f23

f·3=

0.120.20

= 0.60

227

Offensichtlich:

• Bedingte Verteilungen von X unter Y = η1, Y = η2, Y = η3sind alle gleich

• Man uberpruft leicht, dass die bedingten Verteilungen von Yunter X = ξ1, X = ξ2 ebenfalls beide gleich sind

228

Allgemein gilt:X und Y sind genau dann deskriptiv unabhangig, sobald eine derfolgenden aquivalenten Bedingungen erfullt ist:

• Fur alle j = 1, . . . , J und alle k = 1, . . . , K gilt:

fjk = fj· · f·k (= Definition 6.5)

• Fur alle j = 1, . . . , J und alle k = 1, . . . , K gilt:

njk =nj· · n·k

n

• Fur alle j = 1, . . . , J gilt:

fj|Y =η1= fj|Y =η2

= . . . = fj|Y =ηK= fj·

• Fur alle k = 1, . . . , K gilt:

fk|X=ξ1 = fk|X=ξ2 = . . . = fk|X=ξJ= f·k

229

6.1.4 Arithmetische Mittel und Varianzen

Annahmen:

• X und Y sind metrisch skaliert(sinnvolle Arithmetik)

• Daten liegen in Kontingenztafeln vor(absolute oder relative Haufigkeiten)

230

Jetzt:

• Ubertragung von Mittelwert und Varianz auf mehrdimension-ale Daten

−→ Mittelwert- und Varianzbildung uber Rand- bzw. bedingteVerteilungen

Definition 6.6: (Arithmetische Mittel)

Die arithmetischen Mittel von X und Y sind definiert als diearithmetischen Mittel der jeweiligen Randverteilung:

x =1n

J∑

j=1ξj · nj· =

J∑

j=1ξj · fj·,

y =1n

K∑

k=1ηk · n·k =

K∑

k=1ηk · f·k.

231

Bemerkung:

• In mehrdimensionalen Datensatzen sind die arithmetischenMittel einzelner Merkmale einfach die Mittelwerte der einzel-nen Datenreihen

Definition 6.7: (Bedingte arithmetische Mittel)

Das bedingte arithmetische Mittel von X unter Y = ηk (k fest)sowie das bedingte arithmetische Mittel von Y unter X = ξj(j fest) sind jeweils definiert als die arithmetischen Mittel derentsprechenden bedingten Verteilungen von X und Y :

xk =1

n·k

J∑

j=1ξj · njk =

J∑

j=1ξj · fj|Y =ηk

,

yj =1

nj·

K∑

k=1ηk · njk =

K∑

k=1ηk · fk|X=ξj

.

232

Bemerkungen:

• Sind X und Y deskriptiv unabhangig, so stimmen samtlichebedingte Verteilungen von X mit der Randverteilung von Xuberein (vgl. Folie 229). Da das bedingte arithmetische Mit-tel von X unter Y = ηk der Mittelwert der entsprechendenbedingten Verteilung von X ist, stimmt im Fall der deskrip-tiven Unabhangigkeit fur jedes k der bedingte Mittelwert xkmit dem gewohnlichen Mittelwert uberein:

x1 = x2 = . . . = xK = x

• Analog gilt im Fall der deskriptiven Unabhangigkeit fur diebedingten Mittelwerte von Y :

y1 = y2 = . . . = yJ = y

233

Jetzt:

• Definition von Varianzen und bedingten Varianzen von X undY

Definition 6.8: (Varianz)

Die Varianzen von X und Y sind definiert als die Varianzen derjeweiligen Randverteilungen, d.h.

s2X =1n

J∑

j=1

(

ξj − x)2· nj· =

1n

J∑

j=1ξ2j · nj· − x2,

s2Y =1n

K∑

k=1(ηk − y)2 · n·k =

1n

K∑

k=1η2k · n·k − y2.

234

Bemerkung:

• In mehrdimensionalen Datensatzen sind die Varianzen dereinzelnen Merkmale einfach die Varianzen der einzelnen Daten-reihen

Definition 6.9: (Bedingte Varianz)

Die bedingte Varianz von X unter Y = ηk (k fest) sowie diebedingte Varianz von Y unter X = ξj (j fest) sind definiert alsdie Varianzen der entsprechenden bedingten Verteilungen von Xund Y :

s2X|Y =ηk=

J∑

j=1

(

ξj − xk)2·njk

n·k=

J∑

j=1ξ2j ·

njk

n·k− x2

k,

s2Y |X=ξj=

K∑

k=1

(

ηk − yj)2·njk

nj·=

K∑

k=1η2k ·

njk

nj·− y2

j .

235

Bemerkungen:

• Sind X und Y deskriptiv unabhangig, so stimmen samtlichebedingte Verteilungen von X mit der Randverteilung von Xuberein (vgl. Folie 229). Da die bedingte Varianz von X unterY = ηk die Varianz der entsprechenden bedingten Verteilungvon X ist, stimmt im Fall der deskriptiven Unabhangigkeit furjedes k die bedingte Varianz s2X|Y =ηk

mit der gewohnlichenVarianz uberein:

s2X|Y =η1= s2X|Y =η2

= . . . = s2X|Y =ηK= s2X

• Analog gilt im Fall der deskriptiven Unabhangigkeit fur diebedingten Varianzen von Y :

s2Y |X=ξ1= s2Y |X=ξ2

= . . . = s2Y |X=ξJ= s2Y

236

Beispiel: (Wohnraum)

• Betrachte n = 1000 Wohnungen

• Merkmale:

X: Anzahl der Wohnraume pro Wohnung

Y : Anzahl der Personen pro Wohnung

237

Y = 1 Y = 2 Y = 3 Y = 4 Y = 5∑

X = 1 200 40 0 0 0 240X = 2 200 100 30 10 0 340X = 3 80 40 100 60 10 290X = 4 20 15 10 20 20 85X = 5 0 5 10 10 20 45

500 200 150 100 50 1000

Berechnung von (bedingten) Mittelwerten und Varianzen

• Im Proseminar

238

6.2 Zusammenhangsmaße

Gegeben:

• Zwei Merkmale X und Y mit Urliste der Lange n

Gesucht:

• Maßzahl fur den Zusammenhang zwischen X und Y

239

Beispiele:

• Zusammenhang zwischen Korpergroße (X) und Korperge-wicht (Y )

• Zusammenhang zwischen Inflationsrate (X) und Arbeitslo-senquote (Y )(Phillips-Kurve)

• Zusammenhang zwischen Arbeitslosigkeit (X) und Wirt-schaftswachstum (Y )(Okunsches Gesetz)

240

Wichtiges Charakteristikum:

• Datenniveau von X und Y

Metrische Skalierung

Ordinale Skalierung

Nominale Skalierung

241

6.2.1 Metrische Daten: Korrelationskoeffizient

Situation:

• X und Y sind metrisch skaliert

• Urliste: (x1, y1), . . . , (xn, yn)

Frage:

• Wie hangen X und Y zusammen?

242

Zunachst:

• Betrachte fur ein festes i ∈ {1, . . . , n} die Große

T1 = (xi − x) · (yi − y)

Offensichtlich gilt:

• T1 > 0

=⇒ xi und yi sind beide jeweils großer oder beide jeweils kleinerals ihre Mittelwerte

• T1 < 0

=⇒ xi und yi verhalten sich jeweils umgekehrt bzgl. ihrer Lagezum jeweiligen Mittelwert

243

Jetzt:

• Summenbildung uber alle Daten

T2 =n

i=1(xi − x) · (yi − y)

• T2 � 0:

=⇒ Die positiven Summanden in T2 uberwiegen die negativenerheblich. Zu ’hohen’ bzw. ’niedrigen’ xi gehoren tenden-ziell ’hohe’ bzw. ’niedrige’ yi(positiver Zusammenhang)

244

Summenbildung uber alle Daten: [II]

• T2 � 0:

=⇒ Die negativen Summanden in T2 uberwiegen die positivenerheblich. Zu ’hohen’ bzw. ’niedrigen’ xi gehoren tenden-ziell nun ’niedrige’ bzw. ’hohe’ yi(negativer Zusammenhang)

• T2 ≈ 0:

=⇒ Positive und negative Summanden in T2 heben sich ten-denziell auf. Zu ’hohen’ (’niedrigen’) xi gehoren nunsowohl ’niedrige’ als auch ’hohe’ yi(kein Zusammenhang)

245

Definition 6.10: (Kovarianz)

Die Kovarianz zwischen X und Y ist definiert durch

sXY =1n

n∑

i=1(xi − x) · (yi − y) =

1n

n∑

i=1xi · yi − x · y.

Bemerkungen: [I]

• Die Kovarianz sXY ist ’symmetrisch’, d.h.

sXY = sY X

246

Bemerkungen: [II]

• Die Kovarianz eines Merkmals mit sich selbst ist gleich derVarianz des Merkmals:

sXX =1n

n∑

i=1(xi − x)2 = s2X

• Liegt die Datenurliste in Form einer Haufigkeitstabelle vor,so ist die Kovarianz gegeben durch

sXY =1n

J∑

j=1

K∑

k=1

(

ξj − x)

· (ηk − y) · njk

=1n

J∑

j=1

K∑

k=1ξj · ηk · njk − x · y

247

Jetzt:

• Normierung der Kovarianz sXY durch Division durch das Pro-dukt der Standardabweichungen von X und Y

248

Definition 6.11: (Korrelationskoeffizient von Bravais-Pearson)

Der Korrelationskoeffizient zwischen X und Y ist definiert durch

rXY =sXY

s2X ·√

s2Y=

n∑

i=1(xi − x) · (yi − y)

n∑

i=1(xi − x)2 ·

n∑

i=1(yi − y)2

=

n∑

i=1xi · yi − n · x · y

n∑

i=1x2

i − n · x2 ·

n∑

i=1y2i − n · y2

.

249

Bemerkungen: [I]

• Der Korrelationskoeffizient rXY ist ’symmetrisch’:

rXY = rY X

• Der Korrelationskoeffizient ist normiert, d.h. es gilt immer

−1 ≤ rXY ≤ 1

• Wenn rXY = 0 ist, so sagt man:

’Die Merkmale X und Y sind unkorreliert’

250

Bemerkungen: [II]

• Sind X und Y deskriptiv unabhangig, so gilt: rXY = 0(Deskrip. Unabhangigkeit impliziert Unkorreliertheit)

• Vorsicht:Die Umkehrung gilt im allgemeinen nicht(Unkorreliertheit (rXY = 0) impliziert nicht die deskriptiveUnabhangigkeit von X und Y )

• Ist rXY = 1 oder rXY = −1, so sagt man:

’Die Merkmale X und Y sind perfekt korreliert’

251

Zentrales Resultat:

• Es gilt rXY = 1 genau dann, wenn es Zahlen a > 0, b ∈ Rgibt, so dass yi = a · xi + b fur alle i = 1, . . . , n gilt

(Alle Daten liegen auf einer Geraden mit positiver Steigung)

• Es gilt rXY = −1 genau dann, wenn es Zahlen a < 0, b ∈ Rgibt, so dass yi = a · xi + b fur alle i = 1, . . . , n gilt

(Alle Daten liegen auf einer Geraden mit negativer Steigung)

252

Offensichtlich:

• Der Korrelationskoefizient rXY ist ein Maß fur den linearenZusammenhang zwischen X und Y

Vorsicht:

• rXY = 0 (bzw. rXY ≈ 0) bedeutet nur, dass kein (bzw. nurein schwacher) linearer Zusammenhang zwischen X und Ybesteht. Es konnen aber trotzdem starke andere (nicht-lineare) Zusammenhange zwischen X und Y bestehen

253

-4

-2

0

2

4

6

-4 -2 0 2 4

X

Y

Korrelation zwischen X und Y: -0.008

-6

-4

-2

0

2

4

6

-4 -2 0 2 4

X

Y1

Korrelation zwischen X und Y1: 0.7020

-6

-4

-2

0

2

4

6

-4 -2 0 2 4

X

Y2

Korrelation zwischen X und Y 2: -0.7054

0

5

10

15

20

-4 -2 0 2 4

X

Y3

Korrelation zwischen X und Y3: 0.0225

Weitere Aspekte zur Korrelation: [I]

• Korrelation und Kausalitat

• Scheinkorrelation:Die zu untersuchenden Merkmale X und Y hangen beidevon einem 3. Merkmal Z ab, das nicht Gegenstand der Un-tersuchung ist. Ein hoher Wert fur rXY kann daher zus-tandekommen, weil sowohl X als auch Y von Z abhangen(indirekter Zusammenhang)

Beispiel:

X: Wortschatz eines KindesY : Korpergroße eines KindesZ: Alter eines Kindes

255

Weitere Aspekte zur Korrelation: [II]

• Nonsens-Korrelation:Hohe Korrelation zwischen vollig sachfremden Merkmalen Xund Y

Beispiel:

Hohe Korrelation zwischen (menschlicher) Geburtenrate(X) einer Region und deren Population von Klapperstor-chen (Y )

256

6.2.2 Ordinale Daten: Rangkorrelationskoeffizient

Jetzt:

• X und Y sind ordinal skaliert

=⇒ Berechnung vonarithmetischem MittelVarianz und Kovarianz

nicht sinnvoll

Gesucht:

• Sinnvolles Korrelationsmaß fur ordinale Daten

257

Zunachst Zusatzannahme:

• Alle Daten eines Merkmals sind verschieden, d.h.

xi 6= xj und yi 6= yj fur alle i 6= j

Damit:

• Einfache Definition der Rangzahl einer Merkmalsauspragungxi bzw. yi

258

Definition 6.12: (Rangzahl eines Datenpunktes)

Gegeben seien die ungeordnete Urliste x1, . . . , xn sowie die geord-nete Urliste x(1) < x(2) < . . . < x(n) eines Merkmals X. Unter derRangzahl (kurz: Rang) eines Datenwertes xi, in Zeichen RX(xi),versteht man die Position, die xi in der geordneten Urliste ein-nimmt, d.h.

RX(xi) = r, falls xi = x(r).

259

Zahlenbeispiel:

• Ungeordnete Urliste

x1 x2 x3 x4 x5 x61 4 7 3 6 8

• Geordnete Urliste

x(1) x(2) x(3) x(4) x(5) x(6)(= x1) (= x4) (= x2) (= x5) (= x3) (= x6)

1 3 4 6 7 8

• Damit ergeben sich folgende Rangzahlen:

RX(x1) = 1, RX(x2) = 3, RX(x3) = 5,

RX(x4) = 2, RX(x5) = 4, RX(x6) = 6

260

Sinnvolles Korrelationsmaß fur ordinale Daten:

• Korrelationskoeffizient aus Definition 6.11 angewendet aufdie Range RX(xi) und RY (yi)

Definition 6.13: (Rangkorrelationskoeff. von Spearman)

Es bezeichnen RX und RY die arithmetischen Mittel der Rangzahlender Merkmale X und Y . Der Rangkorrelationskoeffizient zwis-chen X und Y ist definiert durch

rRXY =

n∑

i=1

(

RX(xi)−RX)

·(

RY (yi)−RY)

n∑

i=1

(

RX(xi)−RX)2·

n∑

i=1

(

RY (yi)−RY)2

.

261

Man beachte:

• Fur die arithmetischen Mittel RX und RY gilt:

RX = RY =1n

n∑

i=1i =

1n·n · (n + 1)

2=

n + 12

(vgl. Folie 27)

Hieraus folgt:

rRXY =

n∑

i=1

(

RX(xi)−n + 1

2

)

·(

RY (yi)−n + 1

2

)

n∑

i=1

(

RX(xi)−n + 1

2

)2·

n∑

i=1

(

RY (yi)−n + 1

2

)2

262

Bemerkungen:

• Es gibt weitere, aquivalente Formeln fur rRXY , z.B.

rRXY =

n∑

i=1RX(xi) ·RY (yi)−

n · (n + 1)2

4√

n∑

i=1RX(xi)

2 −n · (n + 1)2

n∑

i=1RY (yi)

2 −n · (n + 1)2

4

• Sind alle xi und yi verschieden (wie hier zunachst angenom-men), so ergibt sich die vereinfachte Formel

rR,OBXY = 1−

6n

i=1[RX(xi)−RY (yi)]

2

n · (n2 − 1)

263

Beispiel: (Schulnoten)

• 6 Schuler haben folgende Punktzahlen auf einer von 1 bis 10reichenden Ordinalskala fur Klausuren in Mathematik (X)und Physik (Y ) erreicht:

x1 x2 x3 x4 x5 x6 y1 y2 y3 y4 y5 y61 4 7 3 6 8 1 2 9 4 10 5

Es gilt:

rRXY = rR,OB

XY = 1−6 · 10

6 · (62 − 1)= 0.714

264

Wichtige Eigenschaften von rRXY : [I]

• rRXY ist symmetrisch, d.h. rR

XY = rRY X

• rRXY ist invariant gegenuber streng monoton wachsenden

Transformationen:

Sind f und g streng monoton wachsende Funktionen unduberfuhrt man die Ursprungsdaten (xi, yi) in

x′i = f(xi) und y′i = g(yi) fur alle i = 1, . . . , n

so gilt fur alle i:

RX ′(x′i) = RX(xi) RY ′(y′i) = RY (yi)

und damit

rRXY = rR

X ′Y ′

265

Wichtige Eigenschaften von rRXY : [II]

• rRXY ist normiert:

−1 ≤ rRXY ≤ 1

• Extremfalle:

rRXY = 1 ⇐⇒ RX(xi) = RY (yi) fur alle i = 1, . . . , n

(vollig gleich gerichteter monoton wachsender Zusammen-hang)

rRXY = −1 ⇐⇒ RX(xi) = n−RY (yi)+1 fur alle i = 1, . . . , n

(vollig gegenlaufiger monoton fallender Zusammenhang)

266

Jetzt:

• Berucksichtigung von Bindungen durch Anwendung der Meth-ode der Durchschnittsrange

Zahlenbeispiel: [I]

• Ungeordnete Urliste

x1 x2 x3 x43.7 3.9 3.1 3.7

267

Zahlenbeispiel: [II]

• Geordnete Urliste

x(1) x(2) x(3) x(4)(= x3) (= x1) (= x4) (= x2)3.1 3.7 3.7 3.9

• Vergabe von Rangen

RX(x3) = 1, RX(x1) = 2, RX(x4) = 3︸ ︷︷ ︸

(wegen x1 = x4 = 3.7)RX(x1) = 2.5, RX(x4) = 2.5

, RX(x2) = 4

268

Bei Auftreten von Bindungen:

• Vergabe von Durchschnittsrangen sowohl fur die xi als auchdie yi

• Die vereinfachte Formel rR,OBXY (vgl. Folie 263) nicht mehr

zulassig

Stattdessen:

Anwendung der aquivalenten Formeln fur rRXY auf den

Folien 262, 263

269

6.2.3 Nominale Daten: Kontingenzkoeffizient

Jetzt:

• X und Y sind nominal skaliert

• Daten in Kontingenztafel (absolute Haufigkeiten)

Geeignetes Zusammenhangsmaß:

• Der Kontingenzkoeffizient

270

Voruberlegung:

• X und Y sind deskriptiv unabhangig, wenn

njk =nj· · n·k

nfur alle j = 1, . . . , J und k = 1, . . . , K(vgl. Folie 229)

Abweichungsmaß von der deskriptiven Unabhangigkeit:

χ2 =J

j=1

K∑

k=1

(

njk −nj· · n·k

n

)2

nj· · n·kn

= n ·

J∑

j=1

K∑

k=1

n2jk

nj· · n·k− 1

271

Bemerkung:

• Damit χ2 definiert ist, muss gelten: nj· > 0 und n·k > 0 furalle j und alle k. Ist einer der beiden Ausdrucke fur irgendeinj oder k gleich 0, so konnen die zugehorigen Merkmalswerteξj bzw. ηk aus der Kontingenztafel gestrichen werden

Jetzt:

• Normierung von χ2 liefert Kontingenzkoeffizient

272

Definition 6.14: (Kontingenzkoeffizient)

Als Zusammenhangsmaß zwischen den nominal skalierten Merk-malen X und Y verwendet man den Kontingenzkoeffizienten, derdefiniert ist als

CXY =

χ2

χ2 + n·

min{J, K}min{J, K} − 1

.

Bemerkung:

• Der Kontingenzkoeffizient CXY ist streng monoton wachsendin χ2 und normiert, d.h.

0 ≤ CXY ≤ 1

273

Zentrales Ergebnis:

• Der Kontingenzkoeffizient CXY wird genau dann gleich 0,wenn χ2 = 0 gilt, d.h. genau dann, wenn X und Y deskriptivunabhangig sind

Weitere Bemerkungen:

• Gilt CXY = 1, so spricht man von einem vollstandigen Zusam-menhang zwischen X und Y

• CXY misst nur die Starke des Zusammenhangs zwischen Xund Y , nicht jedoch die Richtung

• Jedoch misst CXY beliebige Zusammenhange, also nicht nurlineare (wie rXY ) oder monotone wie rR

XY

274

Zur praktischen Anwendung von rXY , rRXY , CXY :

• Unterschiedliche Datenniveaus von X und Y :

Wahle Zusammenhangsmaß fur das ’schwachste’ Daten-niveau der Variablen X und Y(vgl. Folie 276)

• Ermittlung des allgemeinen Zusammenhangs von X und Y :

Verwende CXY

275

Behandlung unterschiedlicher Datenniveaus:

Y Nominal Ordinal MetrischXNominal CXY CXY CXY

Ordinal CXY rRXY rR

XY

Metrisch CXY rRXY rXY

276

6.3 Deskriptive Regression

Bedeutung des Begriffes ’Regression’:

• Untersuchung des Zusammenhangs zwischen einer abhangi-gen Variablen (auch Regressand oder endogene Variable) undeiner oder mehrerer unabhangiger Variablen (auch Regres-soren oder exogene Variablen)

Allgemeines mathematisches Modell:

Y = f(X1, X2, . . . , Xk; ~β) + u

277

Bezeichnungen:

• Y : abhangige Variable, Regressand

• X: unabhangige Variablen, Regressoren

• f(·): funktionaler Zusammenhang

• ~β: unbekannter Parametervektor

• u: Fehler

278

Ziel der Regressionsrechnung:

• Moglichst ’genaue’ Aussagen uber den Zusammenhang zwis-chen Regressand und Regressor(en)

Beispiele: [I]

• Keynesianische Konsumfunktion

Y = a + b ·X + u

Y = privater Konsuma = autonomer Konsumb = marginale KonsumquoteX = verfugbares Einkommen

279

Beispiele: [II]

• Zusammenhang zwischen Inflation und Geldmengenwachs-tum (Quantitatstheorie)

Y = a + b ·X + u

Y = InflationsrateX = Wachstumsrate der Geldmenge (M2)

• Zusammenhang zwischen Inflation und Arbeitslosigkeit (Phillip-skurve)

Y = a + b ·1X

+ u

Y = InflationsrateX = Arbeitslosenquote(Vorsicht: f ist eine Hyperbel, nicht-linear)

280

Hier:

• Nur lineare Funktionen, d.h.

Y = a + b ·X + u (vgl. Abschnitt 6.3.2)

281

6.3.1 Regression 1. Art

Zunachst:

Y wird zuruckgefuhrt (regressiert) auf verschiedene Auspra-gungen von X(ohne funktionalen Zusammenhang)

Voraussetzungen:

• Y ist metrisch skaliert(mindestens intervallskaliert)

• X ist beliebig skaliert mit moglichen Auspragungen ξ1, . . . , ξJ

282

Jetzt:

• Bilde die bedingten Mittelwerte yj unter der Bedingung X =ξj fur j = 1, . . . , J(vgl. Definition 6.7, Folie 232)

Definition 6.15: (Deskriptive Regression 1. Art)

Die J Paare (ξj, yj), j = 1, . . . , J, nennt man deskriptive Regres-sion 1. Art von Y auf X.

283

Beispiel: (Haushaltseinkommen) [I]

• Y : verfugbares Haushalts-Nettoeinkommen(Durchschnitte)

• X: Haushaltstyp

284

Beispiel: (Haushaltseinkommen) [II]

• Daten:

Einkommen Y Anz. Haushaltej Haushaltstyp X (in DM) (in (1000)1 Selbstandige 8470 22482 Beamte 7977 17343 Angestellte 6150 104524 Arbeiter 4967 72405 Arbeitslose 2892 19836 Nichterwerbstatige 3756 13124

Summe: 36781

285

Hier:

• Regressionsergebnis dargestellt als Balkendiagramm

286

0100020003000400050006000700080009000

j=1 j=2 j=3 j=4 j=5 j=6

Offensichtlich:

• Durch die J Auspragungen von X kann die Grundgesamtheitin J Teilgesamtheiten zerlegt werden

• Die J Teilgesamtheiten haben die Umfange n1·, n2·, . . . , nJ ·

=⇒ Anwendung der Additionssatze fur arithmetische Mittelund Varianzen des Merkmals Y(vgl. Abschnitt 4.3.4)

287

Es gilt:

y =1n

J∑

j=1yj · nj·

s2Y =1n

J∑

j=1s2Y |X=ξj

· nj·

︸ ︷︷ ︸

=s2int

+1n

J∑

j=1

(

yj − y)2· nj·

︸ ︷︷ ︸

=s2ext

Hieraus:

• Maßzahl fur den Erklarungswert der unabhangigen VariablenX fur die abhangige Variable Y

288

Definition 6.16: (Bestimmtheitsmaß)

Die Große

B =s2exts2Y

heißt Bestimmtheitsmaß der deskriptiven Regression 1. Art.

Bemerkungen: [I]

• Es gilt stets:

0 ≤ B ≤ 1

289

Bemerkungen: [II]

• Es gilt B = 0 genau dann, wenn s2ext = 0 , d.h. wenn

y1 = y2 = . . . = yJ = y

=⇒ Alle bedingten Mittel yj sind gleich

=⇒ X hat keinen Erklarungswert fur Y

• Es gilt B = 1 genau dann, wenn s2Y = s2ext und s2int = 0

=⇒ Fur alle bedingten Varianzen gilt sY |X=ξj= 0

=⇒ X hat hochsten Erklarungswert fur Y

290

Bemerkungen: [III]

• B gibt den Anteil der durch die Regression 1. Art erklartenVarianz an der Gesamtvarianz von Y an

291

6.3.2 Regression 2. Art: Die lineare Einfachregre-ssion

Jetzt:

• X und Y sind beide metrisch skaliert

Ziel:

• Erklarung der Abhangigkeit zwischen X und Y durch eineGerade

292

Ausgangssituation:

• Urliste (x1, y1), . . . , (xn, yn)

• Regressionsgleichung

yi = a + b · xi + ui (i = 1, . . . , n)

• a, b sind aus den Daten zu bestimmende Parameter

• ui ist die Abweichung (auch Fehler oder Residuum)

293

Problemstellung:

• Bestimme die Parameter a und b aus den Daten derart, dassein ’geeignet definiertes Abweichungsmaß’ fur die Residuenminimal wird

Definition 6.17: (Lineare Einfachregression)

Das Regressionsproblem von Folie 293 nennt man lineare Ein-fachregression von Y auf X.

Beispiel:

• Zusammenhang zwischen Ausgaben fur Werbung (X) undden Absatzen (Y ) gemessen an 84 Unternehmen in den USAim Jahr 1990

294

Lineare Einfachregression

295

480

500

520

540

560

0 20 40 60 80 100

Werbeausgaben in Mill. US-$

Abs

atz

in M

ill. U

S-$

Absatz = 502.92 + 0.218 * Werbeausgaben + Fehler

Jetzt:

• ’Sinnvolle Ermittlung’ der Parameter a und b aus den Daten(x1, y1), . . . , (xn, yn)

Dafur zunachst:

• Geeignetes Abweichungsmaß fur die Residuen

ui = yi − (a + b · xi)

(vertikaler Abstand des Datenpunktes (xi, yi) von der Regres-sionsgeraden)

296

Sinnvolles Abstandsmaß ist:

Q(α, β) =n

i=1[yi − (α + β · xi)]

2

Bemerkungen:

• Die Großen α, β ∈ R sind ’formaler Ersatz’ fur die unbekan-nten Parameter a, b

• Die unbekannten Parameter a, b der Regressionsgeraden wer-den gleich durch spezielle Wahlen von α bzw. β ermittelt

297

Jetzt:

• Ermittle a und b durch Minimierung des Abstandsmaßes Q(α, β)bezuglich α und β

Bemerkungen:

• a und b werden also derart gewahlt, dass die Summe derquadrierten Abstande zwischen den Datenpunkten (xi, yi) undder Regressionsgeraden minimal wird

• Die Regressionsgerade yi = a + b · xi beschreibt dann die(xi, yi)-Punktwolke im Sinne des gewahlten Abstandsmaßesoptimal

298

Jetzt:

• Mathematische Bestimmung der Parameter a und b

Formaler Ablauf: [I]

• Bilde die (partiellen) Ableitungen von Q(α, β)

∂∂α

Q(α, β) = 2n

i=1[yi − (α + β · xi)] · (−1)

∂∂β

Q(α, β) = 2n

i=1[yi − (α + β · xi)] · (−xi)

299

Formaler Ablauf: [II]

• Die jeweiligen Nullstellen der partiellen Ableitungen (bezeich-net mit a und b) liefern das potenzielle Minimum (d.h. diegesuchten Parameterwerte)(notwendige Bedingung)

• Es bleibt zu uberprufen, ob die Nullstellen tatsachlich einMinimum darstellen(hinreichende Bedingung)

300

Endergebnisse:

• Die gesuchten Nullstellen ergeben sich als

b =

n∑

i=1xi · yi − n · x · y

n∑

i=1x2

i − n · x2=

sXYs2X

= rXY ·sYsX

,

a = y − b · x

Definition 6.18: (Kleinste-Quadrate-Methode)

Die obige Vorgehensweise zur Bestimmung der Regressionskoef-fizienten a und b nennt man die Methode der Kleinsten Quadrate.

301

Offensichtlich:

• Zur Berechnung der Kleinste-Quadrate-Koeffizienten beno-tigt man nur die 4 Großen x, y, s2X und sXY

302

Bemerkungen:

• Fur die Regressionsgerade gilt also:

y(x) = a + b · x

= y −sXYs2X

· x︸ ︷︷ ︸

= a

+sXYs2X

︸ ︷︷ ︸

= b

·x

Fur die Regresssionsgerade gilt somit:

y(x) = y

=⇒ Die Regressionsgerade verlauft durch den Punkt (x, y)

• Interpretation der Regressionsgeraden nicht fur alle x-Wertesinnvoll

303

Beispiel:

• X = Werbeausgaben, Y = Absatze, n = 84

• Es gilt:

x = 50.7276, y = 513.9912, s2X = 297.5332, sXY = 64.9557

Damit ergibt sich:

b =64.9557297.5332

= 0.2183

a = 513.9912− 0.2183 · 50.7276 = 502.9174

304

Erinnerung:

• Bestimmtheitsmaß B bei Regression 1. Art beschreibt Anteilan der Varianz s2Y , der durch die Regression erklart wird

Jetzt:

• Ubetragung dieses Konzeptes auf Regression 2. Art

Betrachte dazu:

• Werte der Regressionsgerade (yi) an den Stellen xi:

yi = a + b · xi, i = 1, . . . , n

305

Offensichtlich gilt fur die y-Daten:

yi = a + b · xi + ui = yi + ui

Bedeutung:

• Datenwert yi ist Summe aus Wert auf Regressionsgeradenplus Fehler

Nun gilt folgende Varianzzerlegung:

s2Y = s2Y + s2U

306

Fazit:

• Varianz der Y -Werte lasst sich in 2 Teile zerlegen

s2Y : Varianz der exakt auf der Regressionsgeraden liegen-

den Werte yi(den durch die Regression erklarten Teil der Varianz derY -Werte s2Y )

s2U : Varianz der Residuen ui(Residualvarianz oder den durch die Regression nicht er-klarten Teil der Varianz der Y -Werte s2Y )

307

Definition 6.19: (Bestimmtheitsmaß)

Das Bestimmtheitsmaß der deskriptiven Regression 2. Art definiertman als

R2 =s2Ys2Y

= 1−s2Us2Y

.

Bemerkungen: [I]

• Das R2 ist der Anteil an der Varianz der y-Werte, der durchdie Regression erklart wird

• Es gilt:

0 ≤ R2 ≤ 1

308

Bemerkungen: [II]

• R2 = 0:Es ist dann s2U = s2Y , d.h. die Residualvarianz entspricht exaktder Varianz der y-Werte. Die Regression selbst liefert keinenErklarungsbeitrag fur die y-Werte

• R2 = 1:Es ist dann s2Y = s2Y . Die Regression erklart die Varianz dery-Werte vollstandig(Alle Punkte (xi, yi) liegen auf der Regressionsgeraden)

309

Bemerkungen: [III]

• Praktische Berechnungsmoglichkeit:

R2 =

sXY√

s2X ·√

s2Y

2

= (rXY )2

(R2 entspricht dem Quadrat des Korrelationskoeffizientenvon Bravais-Pearson)

310

Beispiel:

• Im Beispiel Werbeausgaben ←→ Absatz gilt:

R2 =

sXY√

s2X ·√

s2Y

2

=

(

64.9557√297.5332 ·

√159.309

)2

= 0.0890

311

6.4 Lineare Mehrfachregression

Jetzt:

• Ubertragung des Konzeptes auf k Regressoren X1, . . . , Xk(alle metrisch)

Regressionsmodell:

yi = a + b1 · x1i + . . . + bk · xki + ui, i = 1, . . . , n

312

Analog zu Abschnitt 6.3.2:

• Kleinste-Quadrate-Methode:

minα,β1,...,βk

Q(α, β1, . . . , βk)

mit

Q(α, β1, . . . , βk) =n

i=1[yi − (α + β1 · x1i + . . . + βk · xki)]

2

• Definition des R2:

R2 =s2Ys2Y

= 1−s2Us2Y

313

7. Konzentrations- und Disparitatsmessung

Betrachte:

• Merkmal X, bei dem alle Daten xi ≥ 0 sind und die Merk-malssumme

∑ni=1 xi eine sinnvolle Interpretation besitzt

(extensives Merkmal)

314

Beispiel:

• X: Haushaltseinkommen

=⇒

Alle xi sind großer oder gleich Null

∑ni=1 xi ist Gesamteinkommen der Population

Fragestellung:

• Wie ist die Merkmalssumme∑n

i=1 xi auf die einzelnen Merk-malstrager verteilt?(Konzentration, Ungleichheit)

315

7.1 Disparitat und Konzentration

Jetzt:

• Klarung der Begriffe

Ungleichheit (= Disparitat)

Konzentration

316

Messung von Disparitat:

• Welcher Anteil der Merkmalssumme fallt auf einen bestimmtenAnteil der Merkmalstrager?

• Beispiel:Welchen Anteil am Gesamteinkommen einer Bevolkerung vere-inigen die 10% Reichsten auf sich?(Anteil des Gesamt-EK ←→ Anteil der Bevolkerung)

317

Messung von Konzentration:

• Welcher Anteil der Merkmalssumme fallt auf eine bestimmteAnzahl von Merkmalstragern?

• Beispiel:Welchen Anteil am Gesamtumsatz eines Industriesektors habendie 5 großten Unternehmen?(Anteil des Gesamtumsatzes ←→ Anzahl von Unternehmen)

318

7.2 Konzentrationsmessung

Wichtige Grundvoraussetzung:

• Die Daten x1, . . . , xn sind absteigend geordnet:

x1 ≥ x2 ≥ . . . ≥ xn ≥ 0

Bemerkungen und Bezeichnungen: [I]

• An dieser Stelle verzichten wir auf die Schreibweise der geord-neten Urliste x(n) ≥ x(n−1) ≥ . . . ≥ x(1) ≥ 0

319

Bemerkungen und Bezeichnungen: [II]

• Stattdessen ordnen wir (notigenfalls) unsere Urliste einfachso um, dass gilt

x1 ≥ x2 ≥ . . . ≥ xn ≥ 0

• Es bezeichne

hr =xr

n∑

i=1xi

=xr

n · x, r = 1, . . . , n

den Merkmalsanteil des r-ten Merkmalstragers an der Merk-malssumme

• Wegen x1 ≥ x2 ≥ . . . ≥ xn ≥ 0 gilt fur die Merkmalsanteile:

h1 ≥ h2 ≥ . . . ≥ hn ≥ 0

320

7.2.1 Konzentrationsraten und Konzentrationskurve

Definition 7.1: (Konzentrationsrate i-ter Ordnung)

Die Summe der i großten Merkmalsanteile,

CR(i) =i

r=1hr =

i∑

r=1xr

n∑

r=1xr

heißt Konzentrationsrate der Ordnung i. CR(i) ist der Merkmal-santeil, der auf die i großten Merkmalstrager entfallt. Fur i = 0wird CR(0) = 0 gesetzt.

321

Definition 7.2: (Konzentrationskurve)

Zeichnet man fur i = 0, . . . , n die Punkte (i, CR(i)) in ein Koordi-natensystem und verbindet man die Punkte durch einen linearenStreckenzug, so erhalt man die Konzentrationskurve.

Bemerkung:

• Per Definition beginnt die Konzentrationskurve im Punkt(0, CR(0)) = (0,0) und endet im Punkt (n, CR(n)) = (n,1).

322

Beispiel: [I]

• Funf Unternehmen eines Marktes weisen die folgenden Umsatzeauf (in Mill. Euro)

x1 = 330, x2 = 120, x3 = 90, x4 = 30, x5 = 30

Man beachte:Die Daten sind bereits absteigend geordnet

323

Beispiel: [II]

• Arbeitstabelle:

i xi hi CR(i)0 01 330 0.55 0.552 120 0.20 0.753 90 0.15 0.904 30 0.05 0.955 30 0.05 1.00∑

600 1.00

324

Beispiel: [III]

• Verbinden der Punkte (i, CR(i)) ergibt die Konzentrationskurve:

325

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Eigenschaften der Konzentrationskurve: [I]

• Die Konzentrationskurve ist der Graph einer Funktion, diedas Intervall [0, n] auf das Intervall [0,1] abbildet. Die Funk-tion ist stuckweise linear und streng monoton wachsend vomAnfangspunkt (0,0) bis zum Endpunkt (n,1)

• Die Steigung des r-ten Segmentes (r = 1, . . . , n) betragt

CR(r)− CR(r − 1)1

= hr.

Die Steigungen hr nehmen mit wachsendem r ab. Somit istdie Konzentrationskurve konkav

326

Eigenschaften der Konzentrationskurve: [II]

• Der Fall maximaler Konzentration:

Ein Merkmalstrager vereinigt die gesamte Merkmalssummeauf sich:

h1 = 1, h2 = h3 = . . . = hn = 0

Es folgt:

CR(0) = 0, CR(1) = CR(2) = . . . = CR(n) = 1

327

Eigenschaften der Konzentrationskurve: [III]

• Der Fall minimaler Konzentration (egalitare Verteilung):

Jeder Merkmalstrager hat denselben Anteil 1/n an der Merk-malssumme. Es gilt:

h1 = h2 = . . . = hn =1n

Es folgt:

CR(i) =in

, i = 0, . . . , n

328

Offensichtlich gilt:

• Jede Konzentrationskurve liegt zwischen den Extremen dermaximalen Konzentration und der minimalen Konzentration

329

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Naheliegende Vorgehensweise:

• Benutze die Konzentrationskurven zweier Grundgesamtheiten(Markte) zum Vergleich des Ausmaßes der Konzentration inbeiden Grundgesamtheiten (Markten), z.B. zum Vergleich

der Konzentration eines Merkmals auf ein und demselbenMarkt zu verschiedenen Zeitpunkten(zeitlicher Vergleich der Konzentration)

der Konzentration eines Merkmals auf zwei unterschied-lichen Markten zum gleichen Zeitpunkt(raumlicher Vergleich der Konzentration)

330

Beispiel: [I]

• Umsatze auf 2 Markten:

Markt I:

38,12,106,34,10

Markt II:

25,20,39,7,9

• Man beachte:

Daten mussen zunachst geordnet werden

331

Beispiel: [II]

• Arbeitstabelle:

i xi hi CRI(i) xi hi CRII(i)0 0 01 106 0.53 0.53 39 0.39 0.392 38 0.19 0.72 25 0.25 0.643 34 0.17 0.89 20 0.20 0.844 12 0.06 0.95 9 0.09 0.935 10 0.05 1.00 7 0.07 1.00∑

200 1.00 100 1.00

332

Beispiel: [III]

• Konzentrationskurven CRI und CRII:

333

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Offensichtlich:

• Markt I weist gleichmaßig hohere Konzentration als Markt IIauf

Haufiges praktisches Problem:

• Konzentrationskurven CRI und CRII schneiden sich

−→ Kein eindeutiger Konzentrationsvergleich moglich

334

Ausweg:

• Beschreibe Konzentrationsausmaß in einer Grundgesamtheitdurch geeignete Zahlen (Indizes)

−→ Eindeutiger Konzentrationsvergleich durch Vergleich vonZahlen ist immer moglich

335

7.2.2 Konzentrationsindizes

Hier nur zwei Indizes:

• Herfindahl- und Rosenbluth-Index

Definition 7.3: (Herfindahl-Index)

Die Summe der quadrierten Merkmalsanteile

KH =n

i=1h2

i

bezeichnet man als Herfindahl-Index.

336

Bemerkungen:

• Der Herfindahl-Index ist normiert. Es gilt

1n≤ KH ≤ 1

• Es gilt KH = 1/n genau dann, wenn minimale Konzentrationvorliegt

• Es gilt KH = 1 genau dann, wenn maximale Konzentrationvorliegt

337

Jetzt:

• Index, der die ’Biegung’ der Konzentrationskurve ausnutzt

Erinnerung:

• Bei maximaler Konzentration ist die Konzentrationskurve ’max-imal gebogen’

• Bei egalitarer Verteilung ist die Konzentrationskurve gar nichtgebogen (sondern eine Gerade)

338

Dehalb:

• Flache A innerhalb des Rechtecks [0, n]× [0,1], die oberhalbder Konzentrationskurve liegt, ist sinnvolle Maßzahl fur dieKonzentration des Merkmals

’Kleines’ A −→ ’hohe Konzentration’

’Großes’ A −→ ’geringe Konzentration’

Jetzt:

• Formale Berechnung des Flacheninhaltes A

339

Zur Berechnung des Rosenbluth-Index

340

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Zunachst:

• Berechnung der Flacheninhalte A1, . . . , A5

A1 =h1

2= h1 ·

2 · 1− 12

A2 = h2 · 2−12· h2 =

32· h2 = h2 ·

2 · 2− 12

A3 = h3 · 3−12· h3 =

52· h3 = h3 ·

2 · 3− 12

A4 = h4 · 4−12· h4 =

72· h4 = h4 ·

2 · 4− 12

A5 = h5 · 5−12· h5 =

92· h5 = h5 ·

2 · 5− 12

341

Allgemein gilt fur alle i = 1, . . . , n:

Ai = hi ·2i− 1

2

Somit folgt fur den gesuchten Flacheninhalt A:

A =n

i=1Ai =

n∑

i=1hi ·

2i− 12

=n

i=1hi · (i−

12)

=n

i=1hi · i−

12

n∑

i=1hi

=n

i=1hi · i−

12

342

Jetzt:

• Definition eines Konzentrationsindexes basierend auf demFlacheninhalt A

Definition 7.4: (Rosenbluth-Index)

Der Rosenbluth-Index ist definiert als

KR =12A

=1

2n

i=1i · hi

− 1

.

343

Bemerkungen:

• Der Rosenbluth-Index ist normiert. Es gilt

1n≤ KR ≤ 1

• Es gilt KR = 1/n genau dann, wenn minimale Konzentrationvorliegt

• Es gilt KR = 1 genau dann, wenn maximale Konzentrationvorliegt

344

7.3 Disparitatsmessung

Wichtige Grundvoraussetzung:

• Die Daten x1, . . . , xn sind aufsteigend geordnet:

0 ≤ x1 ≤ x2 ≤ . . . ≤ xn

(vgl. Folie 319)

345

Weitere Bezeichnungen:

• Wie bei der Konzentrationsmessung bezeichne

hr =xr

n∑

i=1xi

den Anteil des r-ten Merkmalstragers an der Merkmalssumme

• Wegen 0 ≤ x1 ≤ . . . ≤ xn gilt fur die Merkmalsanteile:

0 ≤ h1 ≤ h2 ≤ . . . ≤ hn

Frage:

• Welchen Anteil an der Merkmalssumme vereinigen bestimmteAnteile der Population auf sich?

346

7.3.1 Lorenzkurve

Definition 7.5: (Lorenzkurve)

Fur i = 1, . . . , n bezeichne

L( i

n

)

=i

r=1hr =

i∑

r=1xr

n∑

r=1xr

den Anteil der i kleinsten Merkmalstrager an der Merkmalssumme.Zeichnet man nun die Punkte

(0,0),(1

n, L

(1n

))

,(2

n, L

(2n

))

, . . . ,(n− 1

n, L

(n− 1n

))

, (1,1)

in ein Koordinatensystem und verbindet man diese durch einenlinearen Streckenzug, so erhalt man die Lorenzkurve der Datenx1, . . . , xn.

347

Bemerkung:

• Die Lorenzkurve ordnet dem Anteil i/n der i kleinsten Merk-malstrager der Population den dazugehorigen MerkmalsanteilL(i/n) an der Grundgesamtheit zu. Die Lorenzkurve tragtsomit zwei Anteile gegeneinander ab

Beispiel: [I] (vgl. Folie 323)

• Funf Unternehmen eines Marktes weisen die folgenden Umsatzeauf (in Mill. Euro)

x1 = 330, x2 = 120, x3 = 90, x4 = 30, x5 = 30

348

Beispiel: [II]

• Umordnung (vom kleinsten zum großten) ergibt folgende Ar-beitstabelle:

i xi hi L( i5) =

∑ir=1 hr

1 30 0.05 0.052 30 0.05 0.103 90 0.15 0.254 120 0.20 0.455 330 0.55 1.00∑

600 1.00

349

Lorenzkurve:

350

0

0,2

0,4

0,6

0,8

1

0 0,2 0,4 0,6 0,8 1

i/n

L(i/n

)

Eigenschaften der Lorenzkurve: [I]

• Der Graph der Lorenzkurve befindet sich im Einheitsquadrat.Es gilt L(0) = 0 und L(1) = 1. Die Lorenzkurve ist stuckweiselinear, streng monoton wachsend und konvex.

• Der Fall minimaler Disparitat (absolute Gleichheit):

Gilt x1 = x2 = . . . = xn, so folgt

h1 = h2 = . . . = hn

Dies impliziert

L(i/n) = i/n, i = 0, . . . , n

(Lorenzkurve ist die Diagonale im Einheitsquadrat)

351

Eigenschaften der Lorenzkurve: [II]

• Der Fall maximaler Disparitat (absolute Ungleichheit):

Die gesamte Merkmalssumme entfallt auf einen (den großten)Merkmalstrager:

x1 = x2 = . . . = xn−1 = 0, xn =n

i=1xi

Es folgt

h1 = h2 = . . . = hn−1 = 0, hn = 1

Dies impliziert

L(1

n

)

= L(2

n

)

= . . . = L(n− 1

n

)

= 0, L(1) = 1

(Lorenzkurve ist ’maximal’ gebogen)

352

Lorenzkurven minimaler und maximaler Disparitat:

353

0

1

0 1

i/n

L(i/n

)

Es gilt:

• Jede Lorenzkurve liegt zwischen den Extremen der mini-malen Disparitat (absolute Gleichheit) und der maximalenDisparitat (absolute Ungleichheit)

• Wenn sich zwei Lorenzkurven nicht schneiden, weist die hohereLorenzkurve eindeutig weniger Disparitat auf als die niedrigereLorenzkurve

354

Praktisches Problem:

• Lorenzkurven schneiden sich in vielen Fallen

−→ Kein eindeutiger Disparitatsvergleich moglich

Ausweg:

• Beschreibe Ausmaß der Disparitat durch einen Index

−→ Disparitatsvergleich anhand von Zahlen

355

7.3.2 Der Gini-Koeffizient

Bekanntester Disparitatsindex:

• Der Gini-Koeffizient

Intuition:

• Gini-Koeffizient nutzt ’Biegung’ der Lorenzkurve aus

356

Definition 7.6: (Gini-Koeffizient)

Der Gini-Koeffizient (in Zeichen: DG) ist definiert als das Zweifacheder Flache zwischen der Lorenzkurve und der Diagonalen im Ein-heitsquadrat.

Formale Darstellung: [I]

• Es bezeichne B die Flache unterhalb der Lorenzkurve im Ein-heitsquadrat.

Dann gilt:

DG = 2 ·(12−B

)

= 1− 2B

357

Zur Berechnung des Gini-Koeffizienten

358

0

1

0 1

i/n

L(i/n

)

Formale Darstellung: [II]

• Man kann zeigen, dass gilt:

B =n

i=1Bi =

n∑

i=1hi ·

2n− 2i + 12n

• Damit folgt

DG = 1− 2B = 1−n

i=1hi ·

2n− 2i + 1n

=n

i=1hi −

n∑

i=1hi ·

2n− 2i + 1n

=n

i=1hi ·

(

1−2n− 2i + 1

n

)

=n

i=1hi ·

2i− n− 1n

359

Bemerkungen:

• Der Gini-Koeffizient ist normiert. Es gilt

0 ≤ DG ≤ 1−1n

• Es gilt DG = 0 genau dann, wenn minimale Disparitat (ab-solute Gleichheit) vorliegt

• Es gilt DG = 1− 1/n genau dann, wenn maximale Disparitat(absolute Ungleichheit) vorliegt

360

Beispiel: (vgl. Folie 348)

• Gini-Koeffizient fur die 5 Unternehmen eines Marktes

Arbeitstabelle:

i xi hi L( i5) =

∑ir=1 hr

2i−5−15

2i−5−15 hi

1 30 0.05 0.05 −0.8 −0.042 30 0.05 0.10 −0.4 −0.023 90 0.15 0.25 0.00 0.004 120 0.20 0.45 0.4 0.085 330 0.55 1.00 0.8 0.44∑

600 1.00 0 0.46 = DG

361