1 besc hreib ende und explorativ e statistik - web4.wzw.tum.de · 1.1 besc hreibung...
Post on 05-Sep-2019
5 Views
Preview:
TRANSCRIPT
1 Beschreibende und explorative Statistik
Die beschreibende oder deskriptive Statistik und die explorative Statistik be-trachten eine vorliegende Menge von Objekten, von denen f�ur jedes Objekt ein Merk-mal oder mehrere Merkmale beobachtet oder gemessen wurden. Um Ordnung in einesolche Datenmenge zu bringen, kann man z.B. ausz�ahlen, wie oft die einzelnen Merk-malsauspr�agungen vorkommen oder wie oft diese in ein bestimmtes Intervall fallen.Die graphische Darstellung der Ergebnisse f�uhrt zur sog. empirischen H�au�gkeits-
verteilung der gegebenen Datenmenge. Diese Verteilung gibt das Datenmaterial in
�ubersichtlich aufbereiteter Form wieder. Die Gewinnung einer solchen Verteilung stellteine Hauptaufgabe der beschreibenden Statistik dar.
W�ahrend eine H�au�gkeitsverteilung die wesentliche Information, die in einer Daten-menge steckt, nahezu unver�andert enth�alt, geben statistische Ma�zahlen, wie z.B.Mit-
telwert und Streuung stellvertretend f�ur die ganze Menge von Einzelwerten jeweilseine einzige Zahl als Parameter an.
Neben den empirischen H�au�gkeitsverteilungen und entsprechenden Ma�zahlen werdensp�ater die theoretischen Verteilungen und analoge Ma�zahlen vorgestellt. Sie dienen zurAngabe der Wahrscheinlichkeit f�ur das Eintre�en bestimmter zuf�alliger Ereignisse.
1.1 Beschreibung eindimensionaler Stichproben
Wird f�ur jedes Objekt einer Menge lediglich ein Merkmal beobachtet oder gemessen,so ist die entsprechende H�au�gkeitsverteilung dieses Merkmals eine eindimensionale
H�au�gkeitsverteilung. Bestimmt man z.B. bei einer Anzahl von Autos die Koh-lenmonoxidkonzentration der Abgase, so ist die zugeh�orige Verteilung des Merkmals\Kohlenmonoxid\ eindimensional. Eine zus�atzliche Messung der Stickoxidkonzentrati-on f�uhrt zu zwei Me�werten pro Auto. Dieses Zahlenmaterial kann in einer zweidi-mensionalen H�au�gkeitsverteilung zusammengefa�t werden (Abschnitt 1.3).
1.1.1 Stichprobe und Grundgesamtheit
Das Ergebnis einer statistischen Erhebung liegt in der Regel zun�achst in Form einerUrliste vor. Darunter versteht man ein Protokoll, auf dem die beobachteten Werte inder Reihenfolge stehen, wie sie beobachtet und notiert wurden.
Wird z.B. eine gewisse Anzahl von Studenten der Technischen Universit�at M�unchen-Weihenstephan zuf�allig ausgew�ahlt und ihre Gr�o�e bestimmt, so erhebt man eine Stich-probe �uber die K�orpergr�o�e der Studenten. Die notierten Me�werte in der Urliste, alsodie Gr�o�e der ausgew�ahlten Studenten, sind die Stichprobenwerte.
Eine zuf�allige Teilmenge aus einer Menge von beliebigen Objekten (Personen, Tiere,Gegenst�ande usw.), die sich durch ein oder mehrere gemeinsame Merkmale auszeich-nen, hei�t eine Stichprobe. Umfa�t diese Teilmenge genau n Objekte, so spricht manvon einer Stichprobe vom Umfang n. Wenn zuk�unftig von Stichproben die Rede ist,dann ist damit meistens die Stichprobe der Merkmalswerte und weniger die der Objekte
6 1 Beschreibende und explorative Statistik
gemeint. Die Grundgesamtheit ist die Menge aller m�oglichen oder denkbaren Objek-te, die sich durch die gleiche Eigent�umlichkeit auszeichnen, z.B. die Grundgesamtheitaller Weihenstephaner Studenten.
Aus �okonomischen, zeitlichen oder praktischen Gr�unden arbeitet man fast ausschlie�-lich mit Stichprobenerhebungen und nur in Ausnahmef�allen mit Vollerhebungen,d.h. mit einer Erhebung der ganzen Grundgesamtheit. Es ist z.B. praktisch ausge-schlossen, alle Weihenstephaner Studenten zu vermessen, da immer ein Teil davonim Praktikum ist. Eine ann�ahernd vollst�andige Vollerhebung liegt beispielsweise beiVolksz�ahlungen vor, die mit einem erheblichen Finanz- und Arbeitsaufwand durch-gef�uhrt werden. Ziel einer Stichprobenerhebung ist also, aufgrund einer Stichproberealistische Aussagen �uber die Grundgesamtheit zu machen, also beispielsweise die un-bekannte tats�achliche K�orpergr�o�enverteilung der Studenten durch die Verteilung derStichprobenwerte abzusch�atzen.
Eine gegebene Datenmenge soll im folgenden als eine Stichprobe aus einer Grundge-samtheit angesehen werden. Die Aufgabe der beschreibenden Statistik ist, die in einerUrliste gegebene Menge von Daten zu ordnen, �ubersichtlich darzustellen und mit sta-tistischen Ma�zahlen zu kennzeichnen, um einen �Uberblick �uber die Verteilung derMerkmalswerte zu bekommen.
Beispiele:
1. Tab. 1.1 zeigt die Urliste einer Stichprobe von 100 Jungsauen, bei denen das Merk-mal \Anzahl der Ferkel pro Wurf\ betrachtet wurde. Es liegt eine eindimensionaleStichprobe vor, denn f�ur jedes Element, also f�ur jede Sau, wurde ein Merkmalswertgemessen.
11 13 7 15 6 11 8 7 4 129 14 11 10 10 8 14 7 12 109 12 6 7 8 12 9 10 7 913 10 8 10 12 11 9 8 6 109 13 14 9 11 9 11 10 11 712 10 12 11 9 11 9 10 12 816 11 9 10 11 9 12 10 13 1110 7 9 11 10 9 11 10 14 87 9 10 9 10 11 8 13 9 1012 8 12 11 10 7 15 9 10 8
Tabelle 1.1: Urliste �uber die Anzahl der Ferkel pro Wurf bei einer Stichprobe vonn = 100 Jungsauen
1.1 Beschreibung eindimensionaler Stichproben 7
2. Eine zweidimensionale Stichprobe vom Umfang n = 20 erh�alt man beispielsweise,wenn man bei 20 zuf�allig ausgew�ahlten Rindern jeweils zwei Merkmale mi�t. InTabelle 1.2 ist der Brustumfang und die Kreuzh�ohe von 20 Rindern festgehalten.
Tier Brustum- Kreuz-Nr: fang [cm] h�ohe [cm]
1 180 1212 168 1163 170 1144 167 1165 177 1196 164 1157 180 1218 169 1209 164 11210 180 117
Tier Brustum- Kreuz-Nr: fang [cm] h�ohe [cm]
11 170 12312 170 11813 175 11514 172 11715 175 11916 172 12317 171 11418 167 11719 168 11520 155 115
Tabelle 1.2: Brustumfang und Kreuzh�ohe bei 20 Rindern
3. Allgemein erh�alt man eine m-dimensionale Stichprobe vom Umfang n, wenn anjedem der n Elemente jeweils m Merkmale (x1; x2; : : : ; xm) gemessen werden. Tab.1.3 enth�alt eine f�unfdimensionale Stichprobe vom Umfang n = 10.
28 Tage- Alter bei t�agliche Stallend- Schlacht-Nr: Gewicht Mastende Zunahme gewicht gewicht
[kg] [Tage] [g] [kg] [kg]
1 8:3 179 745 98 76:52 9:5 164 814 103 78:53 9:2 166 778 102 76:04 10:7 166 761 102 78:55 9:6 175 761 101 78:56 8:4 186 700 98 75:07 9:1 178 745 98 76:58 10:2 183 707 100 76:09 7:5 184 778 103 80:010 7:3 197 700 97 70:0
Tabelle 1.3: Schweinedaten �uber f�unf verschiedene Merkmale der Mastleistung
8 1 Beschreibende und explorative Statistik
1.1.2 Einteilung der Merkmale
Bei Merkmalen einer Stichprobe wird zun�achst zwischen quantitativen, d.h. zah-lenm�a�ig erfa�baren und qualitativen, d.h. artm�a�ig erfa�baren Merkmalen unter-schieden.
Beispiele f�ur qualitative Merkmale sind Geschlecht, Farbe, Schadens- oder Handelsklas-se, Sorte, Beruf usw. Eine genauere Einteilung der qualitativen Merkmale unterscheidetordinal und nominal erfa�bare Merkmale.
Bei einem ordinalen Merkmal kann man die einzelnen Auspr�agungen nicht mehrmessen im �ublichen Sinne, wohl aber noch in eine Reihenfolge bringen oder ordnen. Einsolches Stichprobenelement besitzt jeweils einen Rang 1, Rang 2, Rang 3 usw., das hei�taber nicht, da� mittels dieser Rangzahlen ein echtes quantitatives metrisches Merkmalvorliegt. Mit einer solchen Rangskala kann man zwar eine Rangordnung konstatieren,aber nicht sagen, der Abstand zwischen Rang 1 und Rang 3 ist zweimal so gro� wiezwischen Rang 1 und Rang 2.
Bei einem nominalen Merkmal kann man nur noch die einzelnen Auspr�agungen desMerkmals feststellen und willk�urlich nebeneinander aufreihen, ohne eine Abstufungdurchzuf�uhren oder eine Angabe �uber Abst�ande zu machen.
Beispiele f�ur ordinale Merkmale sind Schadens- oder Handelsklassen, Schulnoten, An-gaben �uber die Befallsh�au�gkeit einer bestimmten Krankheit bei P anzen oder dieStadien eines Tumors. Beispiele f�ur nominale Merkmale sind Konfession, Farbe, Ge-schlecht, Sorte oder Beruf.
Quantitative odermetrischeMerkmale k�onnen durch einen Me�- oder Z�ahlvorgangerfa�t werden. Beispiele daf�ur sind K�orpergr�o�e, Gewicht, Ferkel- oder Kinderzahl, Ein-kommen. Quantitative Merkmale unterteilt man dar�uberhinaus in diskrete und stetigeMerkmale.
Stetige Merkmale k�onnen jeden beliebigen Wert innerhalb eines gewissen Intervallsannehmen, z.B. die K�orpergr�o�e oder das K�orpergewicht.Diskrete Merkmale habennur ganz bestimmte Auspr�agungen, die man abz�ahlen kann, wie z.B. Ferkel- und Kin-derzahl oder die Anzahl der Bl�atter bei P anzen. Die Merkmalsauspr�agungen diskreterMerkmale sind also ganze, meist nichtnegative Zahlen.
Eine zweite Art der Unterteilung der quantitativen Merkmale di�erenziert, ob Merk-male mit einer Intervall- oder mit einer Verh�altnisskala erfa�t werden.
Bei einer Intervallskala ist charakteristisch, da� die Erfassung des Abstands, d.h.
Bildung der Di�erenz zwischen zwei Merkmalsauspr�agungen, m�oglich ist. Beispiel daf�urist die Temperaturmessung in Grad Celsius oder Fahrenheit.
Bei einer Verh�altnisskala hat man zus�atzlich einen wahren, absoluten Nullpunkt, aufden die einzelnen Merkmalsauspr�agungen bezogen werden k�onnen. Beispiele sind dieTemperaturmessung in Grad Kelvin, die L�angen-, Gewichts- und Zeitmessung.
Der �Ubergang zwischen diskreten und stetigen Merkmalen ist zum Teil ie�end. Wennman die L�ange eines Werkst�ucks, die ein stetiges Merkmal darstellt, auf volle Zenti-meter abrundet, so nimmt dieses Merkmal den Charakter eines diskreten Merkmalsan. Au�erdem kann man jedes stetige Merkmal gruppieren und erh�alt so ein diskretesMerkmal.
1.1 Beschreibung eindimensionaler Stichproben 9
Eine zusammenfassende �Ubersicht der Merkmalseinteilung mit Beispielen enth�alt Tab.1.4.
qualitativ quantitativ (metrisch)
artm�a�ig zahlenm�a�ig
nominal ordinal diskret stetig
Auspr�agungen Rangfolge ganzzahlig beliebig
Religion Handelsklassen Kinder GewichtGeschlecht Schulnoten P anzen ZeitArt Schadensstufen Tiere Sto�gehalt
Typ Merkmal
qualitativ nominal Baumart Tanne, Fichte, Kiefer,Buche, Eiche
ordinal Sch�adigung ohne, schwach, mittel,stark, tot
quantitativ diskret Rehe/ha 0� 20stetig Bleigehalt 0:0� 100:0 ppm
Tabelle 1.4: Einteilung der Merkmale
1.1.3 H�au�gkeitsverteilungen bei diskreten Merkmalen
Betrachtet wird das Merkmal \Anzahl der Ferkel pro Wurf\ in Tab. 1.1 auf Seite 6.Dieses Merkmal nimmt nur ganze Zahlen gr�o�er oder gleich Null als Werte an undstellt damit ein diskretes Merkmal dar.
Wenn man ausz�ahlt, wie oft die verschiedenen Ferkelzahlen vorkommen, erh�alt mandie H�au�gkeitstabelle, bzw. Verteilung der Merkmalswerte in Tab. 1.5.
Ferkel pro Wurf 4 5 6 7 8 9 10 11 12 13 14 15 16
H�au�gkeit 1 0 3 9 10 18 20 16 11 5 4 2 1
Tabelle 1.5: H�au�gkeitstabelle f�ur die Ferkelzahlen von Tab. 1.1
Beim Ausz�ahlen der Urliste kann man sich mit einer Strichliste behelfen. In der Strich-liste geben die Summen der einzelnen Striche in einer Zeile die absolute H�au�gkeitni f�ur den i-ten Merkmalswert xi an (Tab. 1.6).
Auf kariertem Papier kann man ebenfalls bequem eine Urliste ausz�ahlen, indem man
�uber dem entsprechenden Merkmalswert ein Kreuz malt (Bild 1.1). Die Summe derKreuze �uber einem Merkmalswert ist die absolute H�au�gkeit ni.
Wenn man die absoluten H�au�gkeiten auf den Umfang n der Stichprobe bezieht, erh�altman die relativen H�au�gkeiten hi f�ur die Merkmalswerte xi.
10 1 Beschreibende und explorative Statistik
4 j56 jjj7 jjjj jjjj8 jjjj jjjj9 jjjj jjjj jjjj jjj10 jjjj jjjj jjjj jjjj11 jjjj jjjj jjjj j12 jjjj jjjj j13 jjjj14 jjjj15 jj16 j
Tabelle 1.6: Strichliste der Ferkelzahlen von Tab. 1.1
0
5
10
15
20
absolute Häufigkeit
0 2 4 6 8 10 12 14 16 18 20 Ferkel
Bild 1.1: Kreuztabelle der Ferkelzahlen aus Tabelle 1.1
Sei mit h(xi) = hi die relative H�au�gkeit f�ur den Merkmalswert xi bezeichnet. Danngilt:
hi = h(xi) =Anzahl der Stichprobenwerte mit xi als Ergebnis
Stichprobenumfang n(1.1)
Im Beispiel hat die Wurfzahl 8 die H�au�gkeit h8 = h(8) = 10=100 = 0:10 oder auch10%. Es ist klar, da� die relative H�au�gkeit einer Merkmalsauspr�agung (hier: einerWurfzahl) zwischen 0 und 1 liegt bzw. zwischen 0% und 100%, die beiden Zahlenjeweils eingeschlossen. Es gilt also: 0 � hi � 1.
Tab.1.7 zeigt die absoluten und relativen H�au�gkeiten der Ferkelzahlen aus Tab. 1.1.
1.1 Beschreibung eindimensionaler Stichproben 11
Ferkel pro Wurf absolute H�au�gkeit relative H�au�gkeit
4 1 0:015 0 0:006 3 0:037 9 0:098 10 0:109 18 0:1810 20 0:2011 16 0:1612 11 0:1113 5 0:0514 4 0:0415 2 0:0216 1 0:01
Summe 100 1:00
Tabelle 1.7: H�au�gkeitstabelle der Ferkelzahlen von Tabelle 1.1
1.1.4 H�au�gkeitsfunktion einer Stichprobe
Einer Stichprobe vom Umfang n mit m verschiedenen Werten x1; x2; : : : ; xm kann maneine Funktion ef(x), die sog. H�au�gkeitsfunktion, zuordnen. Wenn hi die relativeH�au�gkeit h(xi) f�ur i = 1; 2; : : : ;m bezeichnet, so erfolgt die Zuordnung:
ef(x) = � hi f�ur x = xi (i = 1; 2; : : : ;m)0 sonst
(1.2)
Die Funktion ef(x) nimmt also an den m Stellen xi (i = 1; 2; : : : ;m) die Werte hi anund ist sonst �uberall gleich Null (vgl. Bild 1.2).
0 2 4 6 8 10 12 14 16 Ferkel0.00
f~
0.04
0.08
0.02
0.06
0.100.120.140.16
0.180.20
Bild 1.2: H�au�gkeitsfunktion ef(x) der Ferkelzahlen aus Tabelle 1.1
Man verwendet jedoch als graphische Darstellung meist ein Balken-, S�aulendia-gramm oder Histogramm. Dies ist eine optisch etwas ansprechendere graphische
12 1 Beschreibende und explorative Statistik
Form der H�au�gkeitsfunktion ef(x). Man zeichnet einfach eine S�aule bzw. einen Bal-ken �uber den Stichprobenwert dessen H�ohe der absoluten oder relativen H�au�gkeit desStichprobenwerts entspricht. Man erh�alt dann eine Auftragung wie in Bild 1.3, in derdie absoluten H�au�gkeiten als Balken dargestellt sind.
0 2 4 6 8 10 12 14 16 Ferkel0.00
f~
0.04
0.08
0.02
0.06
0.100.120.140.16
0.180.20
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
Bild 1.3: Histogramm der Ferkelzahlen aus Tabelle 1.1
Wenn man die Punkte der H�au�gkeitsfunktion bzw. die Mitten der S�aulen beim Balken-diagramm durch Geradenst�ucke miteinander verbindet, erh�alt man ein sog. H�au�g-keitspolygon. Das kann n�utzlich sein, um z.B. die zeitliche Entwicklung eines Merk-mals deutlich zu machen.
1.1.5 H�au�gkeitsverteilungen bei stetigen Merkmalen
Hat eine Stichprobe einen sehr gro�en Umfang und kommen viele zahlenm�a�ig ver-schiedene Werte vor, so ist die Zeichnung der H�au�gkeitsfunktion wenig �ubersichtlich.Auch wenn die Stichprobenwerte keine ganzen Zahlen sind, wie im Beispiel mit derAnzahl der Ferkel, sondern Zahlen aus einem gewissen Intervall, wenn z.B. ein Ertrag,ein Gewicht oder eine L�ange gemessen werden, ist eine Klassenbildung sinnvoll.
Das Intervall, in dem alle vorkommenden Stichprobenwerte liegen, wird in eine zweck-m�a�ige Anzahl von Teilintervallen oder Klassenintervallen unterteilt. Es ist dabeioft n�utzlich, da� alle Klassen gleich gro� sind, also konstante Klassenbreite haben. EineKlasse wird entweder mit Hilfe der unteren (linken) und oberen (rechten) Klassengrenzeoder mit der Klassenmitte und Klassenbreite festgelegt.
Die Anzahl von Stichprobenwerten, die in eine bestimmte Klasse fallen, hei�t abso-lute Klassenh�au�gkeit dieser Klasse. Die relative Klassenh�au�gkeit erh�alt mannach Division der absoluten Klassenh�au�gkeit durch den Stichprobenumfang. Vor derZuordnung der Stichprobenwerte zu den einzelnen Klassen legt man eine sich nicht
�uberlappende Klassenteilung fest, so da� die Zuordnung der Stichprobenwerte zu deneinzelnen Klassen eindeutig ist.
Man w�ahlt au�erdem entweder die Klassenmitten oder die Klassenenden so, da� siem�oglichst einfachen Zahlen entsprechen. Bei der Klassenbildung geht nat�urlich Infor-mation verloren. Die Menge aller Stichprobenwerte wird reduziert auf die H�au�gkeitenin den einzelnen Klassen.
1.1 Beschreibung eindimensionaler Stichproben 13
Will man nachtr�aglich aufgrund einer Klassi�zierung den arithmetischen Mittelwert x(vgl. Kap. 1.2) berechnen bzw. sch�atzen, so nimmt man zweckm�a�igerweise an, da� alleWerte in einer Klasse auf der Klassenmitte liegen. Der Fehler, den man dabei macht,ist umso kleiner, je gleichm�a�iger sich die Merkmalswerte �uber das ganze Intervallverteilen.
Man sollte generell nicht \zu klein\ klassi�zieren, weil dabei noch \zuviel\ Informationaus der Urliste �ubrig bleibt. Andererseits sollte auch nicht \zu gro�\ klassi�ziert werden,da in diesem Fall \zuviel\ Information �uber die H�au�gkeitsverteilung der Stichprobeverloren geht. Als Faustregel gilt: Die Anzahl der Klassen sollte kleiner oder h�ochstensgleich der Wurzel aus der Anzahl der Stichprobenwerte sein (
pn), wobei jedoch minde-
stens 5 und h�ochstens 25 Klassen vorkommen sollen. Au�erdem sollten m�oglichst keineleeren Klassen auftreten. Die H�au�gkeit in Abh�angigkeit von den Klassenmitten hei�tdie H�au�gkeitsfunktion der klassi�zierten Stichprobe.
Tab. 1.8 zeigt die Urliste der j�ahrlichen Milchleistung einer Stichprobe von 100 K�uhen.Es liegt eine eindimensionale Stichprobe vor, denn f�ur jedes Element, also f�ur jede Kuh,wurde ein Merkmalswert gemessen.
5614 5662 4344 5268 4629 4273 5754 5197 5448 45525866 5601 6799 4834 4113 5548 3760 4599 5560 56503952 5952 4951 4875 3702 5262 4986 6352 5614 55775626 6627 5884 5908 6532 4201 4593 5770 4702 44915170 5142 5250 5329 4891 5055 5659 5292 5542 56624870 4935 5700 5397 5296 4689 5899 5155 5580 58516270 4908 5046 6505 4555 3867 4305 4660 4947 45045566 5436 4254 5569 5611 4618 6235 5065 5242 56085049 5067 4558 5613 5898 4611 4593 5259 5059 49335358 4938 5875 5626 3916 4381 5221 4999 4318 5832
Tabelle 1.8: Milchleistung von 100 Milchk�uhen in kg/a
Es liegt ein stetiges Merkmal vor, auch wenn die Me�werte auf ganze Kilogramm ge-rundet sind. Die meisten Werte kommen nur einmal vor. Aus diesem Grund nimmtman eine Klasseneinteilung vor und z�ahlt, wieviele Messungen in eine bestimmte Klas-se fallen. In Tab. 1.9 wurde eine konstante Klassenbreite von 400 kg=a festgelegt. Dieuntere Grenze der am weitesten links liegenden Klasse (sog. Reduktionslage) wurdeauf 3600 kg=a gesetzt, so da� man wie folgt klassi�zieren kann:
1. Klasse: [3600 : : :4000), 2. Klasse: [4000 : : :4400), usw.
Die vorletzte Spalte von Tab. 1.9 zeigt die absolute H�au�gkeitsverteilung, die letzteSpalte die relative H�au�gkeitsverteilung dieser Stichprobe.
Graphisch stellt man meistens die H�au�gkeitsverteilung einer klassi�zierten Stichpro-be in Form eines Histogramms oder Treppenpolygons dar. Man repr�asentiert dieH�au�gkeit der einzelnen Klassen durch Rechtecke, deren Fl�achen �uber den verschiede-nen Intervallen den H�au�gkeiten in diesen Intervallen proportional sind. Dieses Prinzipder Fl�achentreue sollte man insbesondere beachten, wenn man verschiedene Klassen-breiten w�ahlt. Wenn man eine konstante Klassenbreite (xi � xi�1) = �x gew�ahlt hat,
14 1 Beschreibende und explorative Statistik
Klassen- Klassen- Absolute Klassenh�au�gkeit Relative Klassen-intervall mitte Strichliste n h�au�gkeit h
3600 : : :4000 3800 jjjj 5 0:054000 : : :4400 4200 jjjj jjj 8 0:084400 : : :4800 4600 jjjj jjjj jjjj 14 0:144800 : : :5200 5000 jjjj jjjj jjjj jjjj jj 22 0:225200 : : :5600 5400 jjjj jjjj jjjj jjjj 20 0:205600 : : :6000 5800 jjjj jjjj jjjj jjjj jjjj 24 0:246000 : : :6400 6200 jjj 3 0:036400 : : :6800 6600 jjjj 4 0:04
100 1:00
Tabelle 1.9: H�au�gkeitsverteilung zur Stichprobe aus Tabelle 1.8
braucht man nur die H�ohe der einzelnen Rechtecke proportional zur H�au�gkeit hi zuzeichnen.
Das Histogramm zur Verteilungstafel in Tab. 1.9 ist in Bild 1.4.a wiedergegeben. AlsOrdinate ist dort die relative H�au�gkeit ef(x) in Prozent aufgetragen. Man kann jedochgenauso gut die absoluten H�au�gkeiten darstellen.
680064006000560052004800440040003600
30
25
20
15
10
5
0
Milchleistung [kg/a]
rela
tive
Häu
figke
it [%
]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
a)
690065006100570053004900450041003700
30
25
20
15
10
5
0
Milchleistung [kg/a]
rela
tive
Häu
figke
it [%
]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
b)
70006500600055005000450040003500
35
30
25
20
15
10
5
0
Milchleistung [kg/a]
rela
tive
Häu
figke
it [%
]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
c)
70006000500040003000
60
50
40
30
20
10
0
Milchleistung [kg/a]
rela
tive
Häu
figke
it [%
]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
d)
Bild 1.4: Histogramme zur Stichprobe aus Tab. 1.8
1.1 Beschreibung eindimensionaler Stichproben 15
Das Histogramm einer Stichprobe h�angt von der Festlegung der Klassenbreite und derReduktionslage ab. F�ur das Beispiel der Milchleistungsstichprobe wurden in Bild 1.4verschiedene Reduktionslagen und Klassenbreiten gew�ahlt. Wenn man die Reduktions-lage von 3600 kg=a (Bild 1.4.a) auf 3700 kg=a erh�oht (Bild 1.4.b), dann verschwindetder bei 5200 kg=a zu beobachtende sog. R�uckschlag, d.h. ein Abfall und anschlie-�ender Anstieg der H�au�gkeiten. Bild 1.4.c zeigt ein Histogramm mit sieben Klassen.In Bild 1.4.d mit einer Klassenbreite von 1000 kg=a sind nur vier Klassen besetzt.Diese Art der Darstellung ist aufgrund einer zu geringen Anzahl von Klassen f�ur eineH�au�gkeitsverteilung ungeeignet.
1.1.6 Summenh�au�gkeitsfunktion einer Stichprobe
Die Stichprobe ist nicht in Klassen eingeteilt
Will ein Tierz�uchter bei der Stichprobe �uber die Ferkelzahl von 100 Jungsauen wissen,wieviel Prozent der Tiere Ferkelzahlen von 10 oder weniger aufweisen, so kann er dasaus der H�au�gkeitstabelle 1.7 bzw. aus der H�au�gkeitsfunktion nicht sofort entnehmen.Er mu� die H�au�gkeiten f�ur die Ferkelzahlen 4; 5; : : : ; 10 aufsummieren:
0:01 + 0:00 + 0:03 + 0:09 + 0:10 + 0:18 + 0:20 = 0:61
61% der Tiere dieser Stichprobe haben also Ferkelzahlen von 10 oder weniger. Mankann nun f�ur jede in Tab. 1.7 vorkommende Ferkelzahl xi fragen, wieviel Prozent derTiere weisen Ferkelzahlen von xi oder weniger auf und die entsprechenden relativenSummenh�au�gkeiten berechnen. Damit hat man die Summenh�au�gkeitsfunkti-
on oder die empirische Verteilungsfunktion eF (x) der Stichprobe gewonnen.Die Summenh�au�gkeitsfunktion eF (x) einer diskreten Stichprobe ist also gleich derSumme der relativen H�au�gkeiten aller Stichprobenwerte t, die kleiner als x oder gleichx sind.
Tabelle 1.10 zeigt die Berechnung der Summenh�au�gkeitsfunktion f�ur die Ferkelzahlenvon Tab. 1.1.
Als Formel geschrieben lautet die De�nition der Summenh�au�gkeitsfunktion:
eF (x) =Xt�x
ef(t) (1.3)
Bild 1.5 enth�alt die graphische Darstellung der Summenh�au�gkeitsfunktion (1.3) f�urdie Ferkelzahlen von Tab. 1.1.
Die Stichprobe ist in Klassen eingeteilt
In diesem Fall mu� man die De�nition der Summenh�au�gkeitsfunktion etwas modi-�zieren. In einer Klasse sind genau so viele Werte enthalten wie der absoluten Klas-senh�au�gkeit entspricht.
Die Summenh�au�gkeitsfunktion an der Stelle x soll nach der bisherigen Au�assung an-geben, wieviele Werte kleiner oder gleich x sind. Bei einer klassi�zierten Stichprobe l�a�t
16 1 Beschreibende und explorative Statistik
Anzahl der Fer- relative H�au- relative Summen-
kel pro Wurf xi �gkeit ef(xi) h�au�gkeit eF (xi)4 0:01 0:015 0:00 0:016 0:03 0:047 0:09 0:138 0:10 0:239 0:18 0:4110 0:20 0:6111 0:16 0:7712 0:11 0:8813 0:05 0:9314 0:04 0:9715 0:02 0:9916 0:01 1:00
Tabelle 1.10: Relative Summenh�au�gkeit der Ferkelzahlen aus Tab. 1.1
0 2 4 6 8 10 12 14 16 Ferkel
F~
0.0
0.2
0.4
0.6
0.8
1.0
0 2 4 6 8 10 12 14 16 Ferkel0.0
f~
0.1
0.2
Bild 1.5: H�au�gkeits- und Summenh�au�gkeitsfunktion der Stichprobe aus Tabelle 1.1
sich diese De�nition nicht exakt anwenden, weil die Werte in einer Klasse zusammen-gefa�t wurden und eine Zuordnung zu den x-Werten des Klassenintervalls nicht mehrm�oglich ist. Die beste M�oglichkeit ist, die Stichprobenwerte gedanklich in einer Klassegleichm�a�ig �uber die Intervallbreite zu verteilen. Man kann dann die Summenh�au�g-keitsfunktion als Polygonkurve zeichnen. eF (x) verl�auft dabei in jedem Klassenintervallals Geradenst�uckchen, welches jeweils vom linken bis zum rechten Klassenende um
1.1 Beschreibung eindimensionaler Stichproben 17
die betre�ende Klassenh�au�gkeit ansteigt. Diese Version der Summenh�au�gkeitsfunk-tion l�a�t sich in vielen F�allen sinnvoll anwenden. Als Beispiel dient noch einmal dieStichprobe aus Tab. 1.8 (siehe Tab. 1.11).
Klassen relative Klassen- relative Summen-
h�au�gkeit ef(x) h�au�gkeit eF (x): : : 3600 0:00 0:00
3600 : : :4000 0:05 0:00 : : :0:054000 : : :4400 0:08 0:05 : : :0:134400 : : :4800 0:14 0:13 : : :0:274800 : : :5200 0:22 0:27 : : :0:495200 : : :5600 0:20 0:49 : : :0:695600 : : :6000 0:24 0:69 : : :0:936000 : : :6400 0:03 0:93 : : :0:966400 : : :6800 0:04 0:96 : : :1:006800 : : : 0:00 1:00
Tabelle 1.11: Relative Summenh�au�gkeit der Stichprobe von Tab. 1.8
Bild 1.6 zeigt die zugeh�orige Summenh�au�gkeitsfunktion.
3600 4000 4400 4800 5200 5600 6000 6400 6800
F~
0.0
0.2
0.4
0.6
0.8
1.0
0.0
f~
0.1
0.2
kg/a
3600 4000 4400 4800 5200 5600 6000 6400 6800 kg/a
0.3
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
Bild 1.6: Histogramm und Summenh�au�gkeitsfunktion der Stichprobe aus Tabelle 1.8
18 1 Beschreibende und explorative Statistik
1.1.7 Streudiagramme und Punkteplots
Eindimensionale Streudiagramme oder Scatter Plots stellen alle Einzelwerte
�uber einem Zahlenstrahl dar. Sie sind besonders f�ur stetige Merkmale geeignet. Bild1.7 zeigt das Streudiagramm f�ur die Milchleistungen aus Tab. 1.8.
Bild 1.7: Streudiagramm der Milchleistung aus Tabelle 1.8
Das Merkmal Ferkelzahl ist diskret. Infolgedessen werden im Streudiagramm gleicheWerte mehrmals �ubereinander gezeichnet. Besser ist in diesem Fall ein Punkteplot
oderDotplot, bei dem gleiche gro�eWerte als Punkte �ubereinander gezeichnet werden.Er besitzt deshalb starke �Ahnlichkeit mit einem H�au�gkeitsdiagramm. Bild 1.8 zeigteinen Punkteplot f�ur die Ferkelzahlen aus Tab. 1.1.
:
: :
: : :
: : :
: : : .
. : : : : :
: : : : : :
: : : : : : .
. : : : : : : : :
. : : : : : : : : : : .
-+-------+-------+-------+-Ferkel
4.0 8.0 12.0 16.0
Bild 1.8: Punkteplot der Ferkelzahlen aus Tab. 1.1
1.1.8 H�au�gkeitsverteilungen bei nominalen Merkmalen
Tab. 1.12 zeigt die H�au�gkeitsverteilung von zehn Unkr�autern auf einem Acker �achen-st�uck.
Bei einem nominalen Merkmal wird die absolute oder relative H�au�gkeit in der Regeldurch ein Balkendiagramm mit Zwischenr�aumen zwischen den S�aulen pr�asentiert. Bild1.9 zeigt das Balkendiagramm der Unkrautverteilung in Tab. 1.12.
Da bei einem nominalen Merkmal die Reihenfolge der Stichprobenwerte beliebig variiertwerden kann, ist es nicht sinnvoll, eine Summenh�au�gkeitsfunktion zu berechnen unddarzustellen.
H�au�g erfolgt die Darstellung der nach aufsteigenden oder abfallenden H�au�gkeitengeordneten Werte im Balkendiagramm (Bild 1.10).
1.1 Beschreibung eindimensionaler Stichproben 19
Unkraut Anzahl
G�ansefu� 13Vogelmiere 30Ehrenpreis 18Ackerstiefm�utterchen 9Franzosenkraut 2Hirtent�aschel 8Klettenlabkraut 17Kamille 33Kornblume 4Klatschmohn 4
138
Tabelle 1.12: Unkrautverteilung auf einem Acker �achenst�uck
Klatschmohn
KornblumeKamille
Klettenlabkraut
Hirtentäschel
Franzosenkraut
Ackerstiefmütterchen
Ehrenpreis
VogelmiereGänsefuß
35
30
25
20
15
10
5
0
abso
lute
Häu
figke
it
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Bild 1.9: Balkendiagramm der Unkrautverteilung von Tab. 1.13
Franzosenkraut
Klatschmohn
Kornblume
Hirtentäschel
AckerstiefmütterchenGänsefuß
Klettenlabkraut
Ehrenpreis
VogelmiereKamille
35
30
25
20
15
10
5
0
abso
lute
Häu
figke
it
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Bild 1.10: Verteilung der Unkr�auter in Tab. 1.12 nach fallenden H�au�gkeiten
20 1 Beschreibende und explorative Statistik
1.1.9 H�au�gkeitsverteilungen bei ordinalen Merkmalen
Bei einem ordinalen Merkmal wird die absolute oder relative H�au�gkeit wie bei no-minalen Merkmalen dargestellt. Allerdings sollte die Anordnung der Merkmalswertein aufsteigender Form erfolgen, so da� auch die Berechnung der Summenh�au�gkeitenSinn macht. Tab. 1.13 zeigt das Ergebnis der Schadklassenkartierung einer Stichprobevon B�aumen in einem Untersuchungsgebiet.
Schadstufe B�aume relative H�au�gkeit Summenh�au�gkeit
ohne 31 0.248 0.248schwach 48 0.384 0.632mittel 19 0.152 0.784stark 22 0.176 0.960tot 5 0.040 1.000
125 1.000
Tabelle 1.13: H�au�gkeitsverteilung von Baumsch�aden
Bild 1.11 zeigt das Balkendiagramm der Stichprobe aus Tab. 1.13.
totstarkmittelschwachohne
50
40
30
20
10
0
Schadstufe
abso
lute
Häu
figke
it
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Bild 1.11: Balkendiagramm der Schadstufen aus Tabelle 1.13
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 21
1.2 Statistische Ma�zahlen eindimensionaler Stichproben
Bei vielen praktischen Fragestellungen will man eine Reihe von Stichprobenwertendurch einige charakteristische Ma�zahlen beschreiben. Man unterscheidet Ma�zahlender Lage oder der zentralen Tendenz (Mittelwerte), der Variabilit�at (Streuungsma�e)sowie der Schiefe und W�olbung.
1.2.1 Arithmetischer Mittelwert
Zun�achst soll die Stichprobe vom Umfang n mit den quantitativen Stichprobenwer-ten x1; x2; : : : ; xn durch einenMittelwert gekennzeichnet werden. Mittelwerte werdenauch als Lageparameter bezeichnet. Der wichtigste Mittelwert ist der arithmetische
Mittelwert x der Stichprobenwerte. Er ist de�niert als:
x =x1 + x2 + : : :+ xn
n=
1
n�
nXi=1
xi (1.4)
Beispiel:
Bei 5 K�uhen wurden folgende j�ahrlichen Milchleistungen (in kg=a) gemessen:
x1 = 5250, x2 = 4955, x3 = 4763, x4 = 5538, x5 = 4994
Die mittlere Milchleistung ist: x =25500
5= 5100
Eine weitere Stichprobe von 5 K�uhen brachte folgende Ergebnisse:
y1 = 5032, y2 = 4270, y3 = 4922, y4 = 5430, y5 = 5846
Die mittlere Milchleistung ist: y =25500
5= 5100
Die Summe der Stichprobenwerte betr�agt bei beiden Stichproben 25500. Damit sindauch beide Mittelwerte x = y = 5100 gleich gro�.
1.2.2 Spannweite und mittlere absolute Abweichung
Die Mittelwerte oder die durchschnittlichen Jahresmilchleistungen betragen in beidenoben angef�uhrten Stichproben 5100 kg. Die zweite Stichprobe unterscheidet sich jedochau�allend von der ersten Stichprobe durch die weiter auseinanderliegenden Stichpro-benwerte. Also wird der arithmetische Mittelwert zur Kennzeichnung einer Stichprobei.a. nicht ausreichen. Aus diesem Grund werden zus�atzlich Ma�e f�ur die Streubreite derStichprobe eingef�uhrt.
Als einfachstes Ma� bietet sich die sogenannte Spannweite, Variationsbreite oderRange R an. Sie ist de�niert als Di�erenz zwischen dem gr�o�ten Stichprobenwert xmaxund dem kleinsten Stichprobenwert xmin:
R = xmax � xmin (1.5)
22 1 Beschreibende und explorative Statistik
Die Spannweite R ist ein brauchbares Ma� f�ur die Streuung, wenn die Stichprobenur wenige Me�werte umfa�t (etwa bis zu 10 Me�werten). Innerhalb der Spannweitevon xmin bis xmax liegen alle Stichprobenwerte. Die Spannweite spielt eine Rolle beider Festlegung der Klassenbreite, wenn man eine gr�o�ere Stichprobe klassi�ziert. Sieist aber weniger geeignet zur Kennzeichnung der Streuung einer gro�en Anzahl vonStichprobenwerten, vor allem weil sie stark von der Zahl der Stichprobenwerte abh�angigist. Je gr�o�er die Anzahl der Beobachtungen ist, desto gr�o�er ist die Wahrscheinlichkeit,da� einzelne vomMittelwert x stark abweichende Me�werte in der Stichprobe enthaltensind.
Seltener wird die mittlere absolute Abweichung a vom Mittelwert x verwendet:
a =1
n�
nXi=1
jxi � xj (1.6)
Dabei wird die Abweichung jxi � xj des Wertes xi vom Mittelwert x absolut genom-men, obwohl die Handhabung mit den Absolutwerten etwas umst�andlich ist. F�ur kleineStichproben kann man jedoch die mittlere absolute Abweichung vom Mittelwert sowohlaus rechentechnischen als auch aus sachlichen Gr�unden als Streuungsma� benutzen.
Beispiel:
F�ur die Stichproben des Beispiels von Seite 21 berechnen sich folgende Spannweitenund mittleren absoluten Abweichungen in kg=a:
Stichprobe x Stichprobe y
max 5538 5846min 4763 4270
R 775 1576a 235 430
Bei identischen Mittelwerten von x = y = 5100 sind Spannweite und mittlere absoluteAbweichung bei der Stichprobe y praktisch doppelt so gro� wie bei der Stichprobe x.
1.2.3 Empirische Varianz und Standardabweichung
�Uberwiegend wird bei quantitativen Daten als Streuungsma� die mittlere quadrati-
sche Abweichung oder empirische Varianz verwendet. Dieses Streuungsma� wird
�ublicherweise mit s2 abgek�urzt. Die Gr�o�e s2 ist f�ur n > 1 de�niert als:
s2 =1
n� 1�
nXi=1
(xi � x)2 (1.7)
Wenn die Stichprobenwerte nicht alle gleich gro� sind, ist die Varianz immer gr�o�er alsNull. Die positive Quadratwurzel aus der Varianz s2 hei�t Standardabweichung derStichprobe oder empirische Standardabweichung und wird mit s bezeichnet. Die
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 23
Standardabweichung s hat die gleiche Dimension wie die Stichprobenwerte. Es f�allt auf,da� die Quadratsumme in Gleichung (1.7) durch n�1 und nicht durch n dividiert wird.Der Grund ist, da� die Varianz s2 bestimmte Eigenschaften erf�ullen mu�, die erst imZusammenhang mit der Wahrscheinlichkeitstheorie erkl�art werden k�onnen (vgl. Kap.4.5.2). Anschaulich l�a�t sich die Summe von n Summanden in Gleichung (1.7) auf eineSumme von n� 1 Summanden reduzieren, da der Wert des n-ten Summanden bei festgegebenen Werten von s2 und x dann �x ist. Man sagt auch, die Quadratsumme in(1.7) hat n� 1 Freiheitsgrade.
Eine zu Gleichung (1.7) alternative Berechnungsformel f�ur die empirische Varianzfolgt durch Umformung der sog. Summe der Abweichungsquadrate oder Abwei-chungsquadratsumme:
nXi=1
(xi � x)2 =
nXi=1
(x2i � 2xix+ x2) =
nXi=1
x2i � 2nx2 + nx2 =
=
nXi=1
x2i � nx2 =
nXi=1
x2i � n � 1
n
nXi=1
xi
!2
=
=
nXi=1
x2i �1
n�
nXi=1
xi
!2
(1.8)
Aus Gleichung (1.7) und (1.8) folgt:
s2 =1
n� 1�
0@ nX
i=1
x2i �1
n�
nXi=1
xi
!21A (1.9)
Gleichung (1.9) ist gegen�uber (1.7) bei Handrechnung vorzuziehen. Bei Anwendung von(1.9) in Computern k�onnen jedoch in bestimmten F�allen sehr gro�e Rundungsfehlerauftreten, und zwar dann, wenn die beiden Ausdr�ucke in der obigen Klammer nahezugleich gro� sind, d.h. wenn die Varianz im Vergleich zum Mittelwert sehr klein ist.
Beispiel:
Die Varianz der Stichprobe x des Beispiels von Seite 21 wird nach Gleichung (1.7)berechnet, die der Stichprobe y nach Gleichung (1.9):
xi � x (xi � x)2
150 22500�145 21025�337 113569438 191844
�106 11236
360174
yi y2i5032 253210244270 182329004922 242260845430 294849005846 34175716
25500 131440624
24 1 Beschreibende und explorative Statistik
s2x =1
4� 360174 = 90043:5 ) sx = 300 [kg=a]
s2y =1
4��131440624� 1
5� 255002
�= 347656 ) sy = 590 [kg=a]
Die empirische Varianz in der Stichprobe y ist also trotz gleicher Mittelwerte gr�o�er.
1.2.4 Mittelwert und Varianz bei klassi�zierten Stichproben
H�au�g ist die Stichprobe in einer H�au�gkeitstabelle oder in einem Histogramm zusam-mengefa�t, d.h. es kommen insgesamtm verschiedene Werte xi (i = 1; 2; : : : ;m) vor mitjeweils den absoluten H�au�gkeiten ni (i = 1; 2; : : : ;m), wobei n1 + n2 + : : :+ nm = n,wenn n der Umfang der gesamten Stichprobe ist. Anstatt der absoluten H�au�gkeitenni k�onnen auch die relativen H�au�gkeiten hi zur Berechnung herangezogen werden.Dies ist insbesondere dann n�otig, wenn der Gesamtstichprobenumfang n nicht bekanntist, weil er nicht in der H�au�gkeitstabelle oder im Histogramm angegeben wurde.
Das arithmetische Mittel x berechnet sich dann zu:
x =1
n�
mXi=1
(ni � xi) =mXi=1
(hi � xi) (1.10)
Entsprechend lautet die Berechnungsformel f�ur die Varianz:
s2 =1
n� 1�0@ mX
i=1
(ni � x2i )�1
n�
mXi=1
(ni � xi)!21A �
�mXi=1
(hi � x2i )�
mXi=1
(hi � xi)!2
(1.11)
Es ist zu beachten, da� bei der Varianzsch�atzung �uber die relativen H�au�gkeiten derStichprobenumfang eigentlich durch n statt durch n�1 geteilt wird. F�ur gr�o�ere Stich-
proben ist dieser Fehler sehr gering, weil dann1
n� 1
n� 1ist.
Beispiel:
Die mittlere Ferkelzahl pro Wurf der Stichprobe aus Tab. 1.1 und ihre empirischeVarianz wird mit Hilfe der absoluten H�au�gkeiten aus Tab.1.7 berechnet.
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 25
xi ni ni � xi ni � x2i4 1 4 165 0 0 06 3 18 1087 9 63 4418 10 80 6409 18 162 145810 20 200 200011 16 176 193612 11 132 158413 5 65 84514 4 56 78415 2 30 45016 1 16 256P
100 1002 10518
x =1
100� 1002 = 10:02, s2 =
1
99��10518� 1
100� 10022
�= 4:828 ) s = 2:197
Auch bei klassi�ziertem Datenmaterial einer Stichprobe berechnet man Mittelwert undVarianz mit Hilfe der Gleichungen (1.10) und (1.11). Man verf�ahrt so, als ob alle Stich-probenwerte einer Klasse auf der Klassenmitte liegen, allerdings unter der Vorausset-zung, da� keine o�en endenden Intervalle wie z.B. x < a oder x > b vorkommen. ImFalle klassi�zierter Stichproben f�allt der Fehler bei der Varianzsch�atzung �uber die re-lativen H�au�gkeiten nicht sehr ins Gewicht, da die Gr�o�e von Mittelwert und Varianzvon der Klasseneinteilung abh�angen
Beispiel:
Als Beispiel dient die klassi�zierte Stichprobe der Milchleistungen aus Tab. 1.8. Es wirdangenommen, da� der Stichprobenumfang unbekannt ist, also lediglich die relativenH�au�gkeiten bekannt sind.
xi (Klassenmitte) hi hi � xi hi � x2i3800 0:05 190 7220004200 0:08 336 14112004600 0:14 644 29624005000 0:22 1100 55000005400 0:20 1080 58320005800 0:24 1392 80736006200 0:03 186 11532006600 0:04 264 1742400P
1:00 5192 27296800
x = 5192 [kg=a], s2 = (27296800� 51922) = 339936 ) s = 583 [kg=a]
26 1 Beschreibende und explorative Statistik
1.2.5 Gewogener arithmetischer Mittelwert
Der gewogene arithmetische Mittelwert wird verwendet, wenn die einzelnen Stich-probenwerte xi nicht gleichberechtigt bei der Durchschnittsbildung mitwirken, son-dern gewichtet werden sollen. Bei einer Diplompr�ufung gehen z.B. nicht alle Noten xi(i = 1; 2; : : : ;m) der Pr�ufungsf�acher mit gleichem Gewicht in die Endnote x ein, son-dern entsprechend den in der Pr�ufungsordnung festgelegten Gewichten g1; g2; : : : ; gm,wobei g1 + g2 + : : :+ gm = n. Das gewogene Mittel xgew berechnet sich dann zu:
xgew =1
n�
mXi=1
(gi � xi) (1.12)
Wenn man Mittelwerte x1; x2; : : : ; xm von mehreren Stichproben verschiedenen Um-fangs vorliegen hat, kann man einen gemeinsamen Mittelwert x ausrechnen, indem manentsprechend den Stichprobenumf�angen n1; n2; : : : ; nm gewichtet:
x =n1x1 + n2x2 + : : :+ nmxm
n1 + n2 + : : :+ nm=
mXi=1
(ni � xi)mXi=1
ni
(1.13)
Beispiel:
Auf einem Versuchsgut in Weihenstephan wurden folgende Ernteertr�age erzielt:
dt=ha ha
Winterweizen 63:4 15:1Sommerweizen 54:8 14:5Wintergerste 56:4 7:0Sommergerste 51:2 8:1Hafer 45:9 8:3
53:0
Der durchschnittliche Getreideertrag aller Fl�achen errechnet sich dann durch Gewich-tung der einzelnen Ertr�age mit ihren Fl�achen:
x =63:4 � 15:1 + 54:8 � 14:5 + 56:4 � 7:0 + 51:2 � 8:1 + 45:9 � 8:3
53:0= 55:52
Das gewogene arithmetische Mittel wird insbesondere in der amtlichen Statistik zurBerechnung von sog. Indizes verwendet (z.B. Lebenshaltungskostenindex, Index derGro�handelspreise, Aktienindex usw.).
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 27
1.2.6 Geometrischer Mittelwert
Die De�nition des geometrischenMittels xgeom aus n positiven Beobachtungswertenx1; x2; : : : ; xn lautet:
xgeom = n
px1 � x2 � : : : � xn (1.14)
Es ist log xgeom =1
n� (log x1 + logx2 + : : : + logxn), d.h. der Logarithmus des geo-
metrischen Mittels xgeom ist gleich dem arithmetischen Mittel der Logarithmen derStichprobenwerte.
Das geometrische Mittel ist stets kleiner als das arithmetische Mittel (nur wenn al-le Stichprobenwerte gleich sind, fallen die beiden Mittel zusammen). Eine sinnvolleAnwendung des geometrischen Mittels ist angebracht, wenn man relative �Anderungenmitteln will, z.B. bei Wachstumsvorg�angen, bei denen sich eine Variable mit der Zeit inann�ahernd konstantem Verh�altnis �andert oder wenn die Variationsbreite der Stichpro-benwerte im Vergleich zum arithmetischen Mittelwert sehr gro� ist. Das geometrischeMittel wird n�amlich durch Extremwerte nicht so stark beein u�t wie das arithmetischeMittel oder anders ausgedr�uckt, wenn die Stichprobenwerte ann�ahernd logarithmischnormalverteilt sind (siehe Kap. 3.2).
Beispiel:
Gegeben seien die Absatzsteigerungen eines Unternehmens von 5%, 7% und 12% in dreiaufeinanderfolgenden Jahren. Die Prozentzahlen sind dabei jeweils auf den vorj�ahrigenAbsatz bezogen. Wie gro� ist die durchschnittliche Absatzsteigerung x?
Man mu� x so berechnen, da� die dreimalige Anwendung der durchschnittlichen Ab-satzsteigerung x zum gleichen Ergebnis f�uhrt wie die oben angef�uhrten verschiedenenSteigerungsraten x1 = 0:05, x2 = 0:07 und x3 = 0:12, also:
(1 + x)3 = (1 + x1) � (1 + x2) � (1 + x3) = 1:05 � 1:07 � 1:12 )1 + x = 3
p1:05 � 1:07 � 11:2 ) x = 3
p1:25832� 1 = 0:0796 � 8%
Der durchschnittliche Multiplikationsfaktor 1 + x ist also das geometrische Mittel ausden drei unterschiedlichen Multiplikationsfaktoren 1:05, 1:07 und 1:12.
Man kann zeigen, da� das geometrische Mittel xgeom von Stichprobenwerten xi > 0mit dem arithmetischen Mittel x sehr gut �ubereinstimmt, wenn die relative Abweichungxi � x
xder Stichprobenwerte dem Betrag nach sehr klein ist.
1.2.7 Variationskoe�zient
Sehr oft interessiert nicht die Standardabweichung s allein, sondern ihre Relation zumMittelwert. Dieses relative Ma� der Standardabweichung prozentual bezogen auf denarithmetischen Mittelwert hei�t Variationskoe�zient (VK).
VK =s
x(1.15)
28 1 Beschreibende und explorative Statistik
Mit Hilfe des Variationskoe�zienten kann man die Streuung oder die Variation zweierMerkmale miteinander vergleichen, die in verschiedenen Ma�einheiten gemessen wur-den.
Wenig Sinn hat die Verwendung des Variationskoe�zienten, wenn in die Berechnungvon x auch negative Beobachtungswerte eingehen.
Beispiel:
Tab. 1.14 zeigt die Mittelwerte und Standardabweichungen f�ur eine Reihe verschiede-ner Merkmale (Stichprobenumfang n = 30), die bei der Schweinemastpr�ufung erfa�twerden. Aus der Spalte des Variationskoe�zienten ist zu entnehmen, da� die Merkmaleder Mastleistung (t�agliche Zunahme, Futterverwertung) weniger variabel sind als dieMerkmale der Schlachtk�orperqualit�at.
Merkmal x s VK [%]
t�agl. Zunahme 720.2 g 46.3 g 6.43Futterverwertung 3.016 0.164 5.44K�orperl�ange 99.53 cm 2.78 cm 2.79Schlachtk�orpergewicht 77.083 kg 2.535 kg 3.29R�uckenspeckdicke 2.86 cm 0.35 cm 12.24Seitenspeckdicke 3.08 cm 0.62 cm 20.13Fleisch �ache 33.30 cm2 3.70 cm2 11.11Fett �ache 24.91 cm2 4.14 cm2 16.62
Tabelle 1.14: Mittelwert x, Standardabweichung s sowie Variationskoe�zient VKverschiedener Merkmale einer Stichprobe �uber die Mastleistung undSchlachtk�orperqualit�at bei Schweinen
1.2.8 Median oder Zentralwert
Wenn man die Me�werte xi der Gr�o�e nach ordnet, so liegt der Zentralwert oderMedian ex in der Mitte dieser Stichprobenwerte. Links und rechts von ex liegen gleichviele Stichprobenwerte oder Beobachtungen. Wenn eine ungerade Zahl von Beobach-tungen vorliegt, so ist der Zentralwert eindeutig als die mittlere Beobachtung de�niert.Bei einer geraden Zahl von Beobachtungen ist der Zentralwert nicht mehr eindeutig,sondern eine Zahl zwischen den beiden mittleren Beobachtungen. Meist nimmt mandann die Mitte dieser beiden mittleren Beobachtungen (vgl. Bild 1.12).
-
x1 x2 x3 x4 x5 x6 x7
exn = 7
-
x1 x2 x3 x4 x5 x6
Bereich f�ur exn = 6
Bild 1.12: Median bei einer ungeraden und geraden Anzahl von Stichprobenwerten
Der Median hat z.B. den Vorteil, da� man ihn bei einer Rangskala, also bei ordinalenDaten verwenden kann, bei der die Berechnung des arithmetischen Mittels nicht mehrm�oglich ist.
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 29
Beispiele:
1. Der Median bei der Schadklassenkartierung von B�aumen in Tab. 1.13 ist die Schad-stufe des 63: Baums, also ex = schwach. Das hei�t, die eine H�alfte aller B�aumeist schwach oder nicht gesch�adigt, die andere H�alfte ist schwach oder schlimmergesch�adigt. Man kann auch die H�au�gkeiten f�ur die Schadstufen berechnen und an-schlie�end die Summenh�au�gkeiten bestimmen. Der Median der Verteilung nimmtdann den Wert an, an dem die Summenh�au�gkeitsfunktion den Wert 0:5 erreicht.
2. Aus Tab. 1.10 �uber die Stichprobe der Ferkelzahlen ist der Median leicht als ex = 10abzulesen, da die Summenh�au�gkeitsfunktion bei 10 Ferkeln den Wert 0:5 �uber-schreitet. Im vorliegenden Fall gibt es auch keine Probleme mit dem geradzahligenStichprobenumfang, da die n�achst niedrigere und h�ohere Ferkelzahl ebenfalls 10betr�agt. Die H�alfte aller Sauen hat also 10 oder weniger Ferkel/Wurf, die ande-re H�alfte 10 oder mehr. Mittelwert x = 10:2 und Median ex = 10 sind hier fastidentisch.
Der Median wird von den speziellen Werten der gr�o�ten und kleinsten Beobachtungnicht ber�uhrt und er stellt daher ein \robusteres\ Ma� der Lage oder der zentralenTendenz dar als der arithmetische Mittelwert. Robust bedeutet in diesem Zusammen-hang, da� ex von m�oglichen \Ausrei�erwerten\ der Stichprobe nicht oder viel wenigerabh�angig ist als der Mittelwert x.
Wenn die Stichprobenwerte bei einer stetigen Variablen klassi�ziert sind, gibt man alsZentralwert entweder nur dieMedianklasse an, also die Klasse, in der der Zentralwertliegt, oder man liest in der Summenh�au�gkeitsfunktion den zu eF (x) = 0:5 geh�origenWert auf der Abszisse ab. Eine lineare Interpolation mit Hilfe der Summenh�au�gkeits-funktion kann auch �uber folgende Interpolationsformel erfolgen:
ex = u+ b � 0:5�eF (u)efMedian
; (1.16)
wobei u die untere Klassengrenze der Medianklasse, b die Klassenbreite, eF (u) der Wert
der Summenh�au�gkeitsfunktion an der unteren Grenze der Medianklasse und efMedian
die relative H�au�gkeit der Medianklasse ist.
Beispiel:
Es wird die klassi�zierte Stichprobe der Milchleistungen von Tab. 1.11 betrachtet. DieMedianklasse ist das Intervall von 5200 : : :5600. In der Summenh�au�gkeitsfunktion vonBild 1.6 kann man bei eF (0:5) den Median zu etwa ex = 5200 absch�atzen. Dies korre-spondiert auch mit den Werten in Tab. 1.11, denn bei 5200 hat die Summenh�au�g-keitsfunktion bereits den Wert 0:49 und 0:50 wird bei einem geringf�ugig h�oheren Werterreicht. Mit Hilfe von Gleichung (1.16) wird der Median zu
ex = 5200+ 400 � 0:5� 0:49
0:20= 5220
gesch�atzt. Der wahre Median, der aus den Originaldaten von Tab. 1.8 berechnet wurde,liegt zwischen 5221 und 5242. Das Mittel aus diesen beiden Werten ist 5231:5. Dasarithmetische Mittel x = 5188:67 ist hier etwas kleiner als der Median.
30 1 Beschreibende und explorative Statistik
Der Zentralwert hat die charakteristische Eigenschaft, da� die Summe der absolutenAbweichungen der Beobachtungen xi von ihrem Zentralwert ex kleiner ist als von jederanderen Zahl. Diese Summe ist also ein Minimum.
1.2.9 Modus oder Dichtemittel
Der Modalwert, Modus oder das Dichtemittel xd ist derjenige Stichprobenwert,der am h�au�gsten vorkommt.
Beispiel:
Bei der Stichprobe mit den Ferkelzahlen von Tab. 1.1 ist die Ferkelzahl xd = 10 derModalwert (vgl. Bild 1.3).
Es k�onnen in einer Stichprobe mehrere modale Werte vorkommen. So unterscheidetman neben unimodalen oder eingip igen Verteilungen auch bimodale oder zwei-gip ige und schlie�lich multimodale oder mehrgip ige Verteilungen. Ein Dichte-mittel ist in solchen F�allen jeweils als ein Wert bestimmt, der h�au�ger vorkommt alsseine Nachbarwerte. So spricht man auch genauer vom h�au�gsten Wert als demabsoluten Dichtemittel oder dem 1. Modalwert und bezeichnet weitere relative Dich-temittel als 2. Modalwert usw.
Beispiel:
Bei der Stichprobe in Bild 1.11 ist die Schadstufe schwach der erste Modus und dieSchadstufe stark der zweite Modus.
Bei nominalen bzw. kategorialen Daten ist nur die Bestimmung des ersten Dichtemittelsm�oglich. Andere Mittel k�onnen in diesem Fall nicht bestimmt werden.
Beispiel:
Bei der Unkrautverteilung in Bild 1.9 macht nur das erste Dichtemittel bei der Kamilleals Lageparameter Sinn, da die Anordnung der Nominaldaten auf der Abszisse beliebigvariiert werden kann (vgl. Bild 1.10).
Es ist einleuchtend, da� bei einer ausgepr�agten Mehrgip igkeit einer Verteilung dieDichtemittel diese Verteilung besser beschreiben k�onnen als das arithmetische Mitteloder der Median, da deren Gr�o�e in einem Bereich liegen k�onnen, in denen sehr wenigeoder im Extremfall gar keine Me�werte liegen.
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 31
Beispiel:
Bild 1.13 zeigt die H�au�gkeitsverteilung der in einer zweiw�ochigen Beobachtungsperi-ode gelegten Eier von H�uhnern.
13121110987654
0.25
0.20
0.15
0.10
0.05
0.00
Anzahl der Eier
rela
tive
Häu
figke
it
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAA
2
14
29
13
6
15
23
13
4
1
Bild 1.13: Histogramm der Anzahl von H�uhnereiern
Mittelwert und Median x = ex = 9 fallen genau in einen Bereich, in denen die H�au�gkeitsehr gering ist. Der erste Modus bei 11 und der zweite Modus bei 7 beschreiben dieVerteilung als Lageparameter viel besser. Dies wird auch klar, wenn man wei�, da�das Histogramm in Bild 1.13 die Eianzahl zweier H�uhnerrassen ist, deren Mittelwertegetrennt nach Rassen jeweils 7 und 11 betr�agt.
Bei diskreten Merkmalsauspr�agungen ist die Bestimmung der Dichtemittel relativ ein-fach und klar. Wie geht man jedoch bei stetigen Merkmalswerten vor, wenn also eineklassi�zierte Verteilung in Form eines Histogramms vorliegt? Entweder nimmt man diegesamte Klassenbreite oder die Klassenmitte als Modus oder man pa�t der Verteilungin der Umgebung des zu bestimmenden Dichtemittels, also an der am st�arksten besetz-ten Klasse sowie den beiden Nachbarklassen, eine Interpolationsparabel an und nimmtdie Stelle, an der die Parabel ihr Maximum hat, als Dichtemittel an dieser Stelle.
Beispiel:
Bild 1.14 zeigt die Verteilung der Schlafdauer von 150 Probanden beim Test einesSchlafmittels.
Die h�au�gsten Schlafdauern liegen zwischen 7 und 8 Stunden. Die Klassenmitte diesesIntervalls von 7:5 als Dichtemittel anzugeben ist hier nicht sehr elegant. Eine Sch�atzungkann durch Interpolation erfolgen, wenn man eine Parabel durch die Punkte (6:5; 44),(7:5; 61) und (8:5; 26) legt. Diese Parabel bestimmt man leicht zu �26x2+381x�1334.Die erste Ableitung gleich Null gesetzt ergibt �52x + 381 = 0. Daraus folgt xd =7:3296 � 7:33.
Auch bei sehr schiefen Verteilungen (vgl. Kap. 1.2.13) kann das Dichtemittel ein geeig-netes Ma� f�ur die Verteilung sein.
32 1 Beschreibende und explorative Statistik
98765432
60
50
40
30
20
10
0
Schlafdauer [h]
abso
lute
Häu
figke
it
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAA
26
61
44
8632
Bild 1.14: Histogramm der Schlafzeiten von 150 Personen
Beispiel:
Es liegen folgende DM-Betr�age als Stichprobenwerte einer Spendenaktion vor:
100000.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 50.{ DM
Das arithmetische Mittel x ist rund 16741.{ DM. Wenn man behauptet, da� im Durch-schnitt rund 16741.{ DM gespendet wurden, so ist dies zwar mathematisch richtig, tri�taber nicht den Kern der Sache. Hier verwendet man besser den Modalwert, und mankann in diesem Falle sagen: Die h�au�gste Spende betrug 100.{ DM.
1.2.10 Standardfehler des arithmetischen Mittels
Das arithmetische Mittel x einer Stichprobe wird h�au�g als Approximation oder Sch�atz-wert des unbekannten Mittelwerts der dazugeh�origen Grundgesamtheit verwendet. DieVarianz s2 der Stichprobe ist entsprechend ein Sch�atzwert f�ur die unbekannte Varianzin der Grundgesamtheit (vgl. 4.5).
Entnimmt man einer unendlich gro�en Grundgesamtheit mehrere Stichproben und be-rechnet jeweils das Stichprobenmittel, so stellt man fest, da� diese Stichprobenmittel-werte weniger streuen als die Einzelbeobachtungen einer Stichprobe. Die Standardab-weichung dieser Stichprobenmittelwerte ist ein Ma� f�ur die Variabilit�at der Stichpro-benmittelwerte. Es ist einsichtig, da� die Abweichung eines Stichprobenmittels x vom
unbekannten Mittelwert der Grundgesamtheit umso kleiner ist, je kleiner die Streuungf�ur die Einzelwerte in der Grundgesamtheit ist und je gr�o�er der Stichprobenumfangist.
Stellt man sich nun gedanklich eine unendliche Wiederholung der Stichprobenziehungmit anschlie�ender Berechnung des arithmetischen Mittelwerts vor, so kommt manzu einer (hypothetischen) Grundgesamtheit von Stichprobenmittelwerten, die jeweilsaus einem Umfang n berechnet wurden. Es besteht eine einfache Beziehung zwischender Standardabweichung in der Grundgesamtheit der arithmetischen Mittelwerte undder Standardabweichung in der Grundgesamtheit der Einzelwerte, deren genaue Be-gr�undung im Zusammenhang mit der Verteilung von Zufallsgr�o�en ersichtlich wird.
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 33
Indem man diese Beziehung auf die Sch�atzwerte �ubertr�agt, wird der sp�ateren Her-leitung (vgl. 3.1.3) vorausgegri�en. Der Sch�atzwert f�ur die Standardabweichung desarithmetischen Mittels x hei�t auch Standardfehler des arithmetischen Mittel-
werts sx.
Es gilt:
sx =spn
=
vuut 1
n � (n� 1)�
nXi=1
(xi � x)2 =
=
vuuut 1
n � (n� 1)�
0@ nX
i=1
x2i �1
n
nX
i=1
xi
!21A
(1.17)
In der Physik bezeichnet man sx auch als mittleren Fehler. Jede Stichprobe liefertn�amlich zuf�allige Werte f�ur die einzelnen xi und somit auch f�ur den Mittelwert x. DasStreuungsma� der Standardabweichung wird dabei als \mittlere\ Abweichung inter-pretiert. So wird die Standardabweichung s als mittlerer Fehler f�ur ein xi bzw. eineEinzelbeobachtung bezeichnet, und der Standardfehler sx wird als mittlerer Fehler desMittelwerts bezeichnet.
1.2.11 Zur Wahl eines Mittelwerts
Jeder Mittelwert gibt stellvertretend f�ur eine ganze Reihe von Einzelwerten einen ein-zigen Wert als Lageparameter an. Ein Mittel kann deshalb nicht kurz in einer einzigenZahl das Wesentliche ausdr�ucken und gleichzeitig alle Details der H�au�gkeitsvertei-lung enth�ullen. Ein Mittelwert verdeckt und gl�attet unter Umst�anden Extremwerteund wird je nach De�nition mehr oder weniger von ihnen beein u�t. Um das richti-ge Mittel zu �nden, �uberlegt man sich vorher, welcher Lageparameter am besten zurCharakterisierung der Daten geeignet ist.
Am h�au�gsten wird das arithmetische Mittel verwendet. Die Vorteile des arithmeti-schen Mittels sind:
1. Multiplikation mit der Anzahl n ergibt die Summe der insgesamt beobachtetenMerkmalswerte.
2. Die arithmetischen Mittelwerte verschiedener Gruppen k�onnen kombiniert werden.Durch ein gewogenes Mittel �ndet man das arithmetische Mittel der kombiniertenGruppen.
3.
nXi=1
(xi � x) = 0, d.h. die Summe der positiven und der negativen Abweichungen
sind der Gr�o�e nach gleich.
4. Die Summe der quadratischen Abweichungen
nXi=1
(xi � x)2 ist kleiner als f�ur jede
andere Zahl.
34 1 Beschreibende und explorative Statistik
Der zweitwichtigste Mittelwert ist der Zentralwert oder Median. Er teilt die Beobach-tungen in zwei H�alften, d.h. links und rechts von ihm liegen jeweils 50% der Beobach-tungswerte. Bei ungeradem n f�allt der Median genau auf den mittelsten Beobachtungs-wert, den man \halb zur linken und halb zur rechten Gruppe\ der Beobachtungswertez�ahlt. Wenn man wei�, da� die betrachtete Verteilung symmetrisch ist, kann man denleichter zu bestimmenden Zentralwert als gute Sch�atzung f�ur das arithmetische Mittelheranziehen. Der Zentralwert kann im Gegensatz zum arithmetischen Mittel bei ei-ner klassi�zierten H�au�gkeitsverteilung auch berechnet werden, wenn diese Verteilungo�en-endende Klassen enth�alt. Bei ordinalen Daten ist der Zentralwert das Mittelwerts-ma� der Wahl.
Der Modalwert oder das Dichtemittel ist sinnvoll, wenn man den gew�ohnlichsten oderh�au�gsten Wert charakterisieren will, insbesondere bei stark unsymmetrischen oderschiefen Verteilungen. Bei nominalen Daten kann als Lageparameter ausschlie�lich dasDichtemittel angegeben werden.
Das geometrische Mittel ist zur Messung des Mittels einer Ver�anderung angebracht,wenn man eine durchschnittliche Ver�anderungsrate berechnen m�ochte. Das geometri-sche Mittel oder auch der Median charakterisieren solche unsymmetrischen Verteilun-gen von positiven Werten gut, die durch �Ubergang auf die Logarithmen dieser Wertein eine symmetrische Verteilung transformiert werden.
Bei einer symmetrischen eingip igen Verteilung fallen Modalwert, Median und arithme-tisches Mittel zusammen. Bei unsymmetrischen Verteilungen weichen diese drei Mittelmehr oder weniger voneinander ab. Es reicht in solchen F�allen nicht immer aus, nur einbestimmtes Mittel anzugeben, um die Lage der Verteilung zu charakterisieren. NebenMittelwert gibt man dann noch Schiefe und evtl. W�olbung an (vgl. Kap. 1.2.13).
In der beurteilenden Statistik wird bei quantitativen Beobachtungen vorwiegend dasarithmetische Mittel x als Lageparameter und die Standardabweichung s als Variabi-lit�atsma� verwendet. Der Grund ist, da� diese Ma�zahlen einer Stichprobe optimaleApproximationseigenschaften (vgl. Kap. 4.5.2) in Bezug auf die analogen Ma�zahlender Grundgesamtheit haben, insbesondere wenn man f�ur die Verteilung der Grundge-samtheit die Normalverteilung (vgl. Kap. 3.1) voraussetzt.
So besitzt das arithmetische Mittel die kleinste Varianz unter allen m�oglichen Mittel-werten (vgl. Eigenschaft 4 oben) und strebt mit wachsendem Umfang der Stichprobe\am besten\ gegen den unbekannten Mittelwert der Grundgesamtheit.
L�a�t man jedoch die Annahmen der Normalverteilung fallen und setzt beispielsweiseeine Laplace-Verteilung (vgl. Kap. 4.5.2) f�ur die Grundgesamtheit voraus, dann ist derMedian als Lageparameter dem arithmetischen Mittel eindeutig vorzuziehen.
Normalverteilung und Laplace-Verteilung sind beide symmetrische Verteilungen, un-terscheiden sich aber dadurch, da� die Laplace-Verteilung \dickschw�anziger\ ist, d.h.gr�o�ere Abweichungen vom Mittelwert sind wahrscheinlicher als bei der Normalvertei-lung.
Nimmt man f�ur die Grundgesamtheit eine gegen�uber der Laplace-Verteilung noch dick-schw�anzigere Verteilung an, z.B. eine Cauchy-Verteilung (vgl. Kap. 4.5.2), dann kannman zeigen, da� das arithmetische Mittel x als Ma� der zentralen Tendenz sinnlos wird.Auch in diesem Fall ist es angebracht, den Median als Lageparameter zu verwenden.
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 35
Neben arithmetischem Mittelwert und Median verwendet man im Rahmen der sog. ro-busten Statistik weitere Mittelwerte zur Beschreibung und Sch�atzung der zentralenTendenz. Diese \robusten\ Mittelwerte versuchen, unabh�angig von der Verteilung derzugrundeliegenden Grundgesamtheit, aus der man sich die Stichprobe gezogen denkt,m�oglichst e�ziente Sch�atzungen der zentralen Tendenz zu liefern (vgl. Kap. 4.5.2).Solche Mittelwerte sind z.B. die getrimmten Mittelwerte. Diese werden berechnet,indem man vom oberen und unteren Ende der geordneten Stichprobenwerte jeweilseinen bestimmten Prozentsatz der Beobachtungen wegl�a�t und das arithmetische Mit-tel aus den restlichen Beobachtungen errechnet. F�ur das 5%-getrimmte Mittel x5%(manchmal sagt man auch gestutztes Mittel) werden also jeweils die 5% gr�o�tenund kleinsten Werte der Stichprobe abgeschnitten und aus den restlichen 90% derWerte wird das arithmetische Mittel berechnet. Diese getrimmten Mittelwerte habenden Vorteil, robust gegen�uber Ausrei�ern zu sein. Ausrei�er sind Beobachtungen, dieweit entfernt vom �uberwiegenden Teil der Beobachtungen liegen, z.B. falsch notier-te Werte, also grobe Fehler. Die Identi�zierung von Ausrei�ern ist nicht einfach. Eineinziger Ausrei�er kann aber das arithmetische Mittel als Sch�atzwert f�ur den Lagepara-meter v�ollig unbrauchbar machen. Der 5%-getrimmte Mittelwert dagegen toleriert 5%Ausrei�er auf beiden Seiten der Stichprobenwerte. Er verliert andererseits nur wenigeProzent an E�zienz bei der Sch�atzung des Lageparameters (vgl. Kap. 4.5.2).
1.2.12 Zur Wahl eines Streuungsma�es
Anschaulich ist die Streuung einer Verteilung durch die Spannweite R, also die Dif-ferenz zwischen gr�o�ter und kleinster Beobachtung, charakterisierbar. Bei Stichpro-benumf�angen bis etwa 10 kann man die Spannweite noch gut als Streuungsma� imbeschreibenden Sinne verwenden. Bei gr�o�eren Stichproben sagt die Spannweite aberwenig dar�uber aus, wie die Einzelwerte um den Mittelwert streuen, weil mit wachsen-dem n auch die Wahrscheinlichkeit zunimmt, da� Ausrei�er auftreten, die die Spann-weite als Streuungsma� verzerren.
Bei quantitativen Daten verwendet man in der Regel die Standardabweichung s bzw.die Varianz s2 als Streuungsma�. In Verbindung mit dem arithmetischen Mittel gibtdie Standardabweichung einen brauchbaren �Uberblick �uber die empirische Verteilungder Stichprobe, wenn man Normalverteilung voraussetzt. Die Standardabweichung istneben dem Mittelwert ein entscheidender Parameter der Normalverteilung. In Kapitel3.1 wird gezeigt, da� rund 68% aller Beobachtungen um h�ochstens eine Standardabwei-chung vom Mittelwert nach links oder rechts entfernt und rund 95% aller Beobachtun-
gen um h�ochstens zwei Standardabweichungen nach links oder rechts vom Mittelwertentfernt liegen.
Bei ordinalen Daten, aber auch im Rahmen der explorativen Statistik, verwendet manals Streuungsma� den sog.Quartilsabstand. Dieser ist unemp�ndlich gegen Ausrei�erund stellt daher ein robustes Streuungsma� dar. Um den Quartilsabstand zu erkl�aren,denkt man sich die Stichprobenwerte der Gr�o�e nach geordnet und teilt die Daten inetwa gleich gro�e Gruppen auf. Bei 4 Gruppen gelangt man zu den Quartilen Q1,Q2, Q3. Diese teilen die gesamte Spannweite xmin bis xmax so auf, da� vier Gruppenentstehen, welche jeweils 25% der Stichprobenwerte enthalten (Bild 1.15). Als Streu-ungsma� bietet sich dann der Interquartilsabstand Q3�Q1 an, also der Bereich, indem die mittleren 50% der Beobachtungen liegen.
36 1 Beschreibende und explorative Statistik
xmin Q1 Q2 = Median Q3 xmax
� -Q3 �Q1
25% 50% 25%
Bild 1.15: Interquartilsabstand Q3 �Q1 als Streuungsma�
Ein weiteres sehr robustes Streuungsma� ist die sog.Median-AbweichungMAD (vonengl. median absolute deviation). Man erh�alt sie, wenn man in Gleichung (1.6) f�ur dieBerechnung der mittleren absoluten Abweichung jeweils die arithmetische Mittelwert-bildung durch den Median ersetzt:
MAD = Median (jxi � exj) (1.18)
Auch im Bereich (ex�MAD : : : ex+MAD) liegen 50% der Stichprobenwerte. Zum Ver-gleich: Im Bereich (x� s : : : x+ s) liegen ca. 2=3 der Stichprobenwerte.
1.2.13 Schiefe
Das Dichtemittel weicht bei quantitativen Daten umso st�arker vom arithmetischenMittel ab, je unsymmetrischer eine Verteilung ist. Bild 1.16 zeigt eine solche unsym-
metrische Verteilung. Darin sind Weizenbl�atter auf ihren Befall nach einer Skalavon 0 (kein Befall) bis 9 (Totalbefall) bonitiert.
9876543210
25
20
15
10
5
0
Mehltaubonitur
abso
lute
Häu
figke
it
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
133
57
10
15
21
24
1
Bild 1.16: Bonitur des Mehltaubefalls von Weizenbl�attern
Der Modus der Verteilung in Bild 1.16 ist xd = 1, das arithmetische Mittel ist x = 3.Der Median ex = 2 liegt zwischen Dichtemittel und arithmetischem Mittelwert undteilt die Verteilung in zwei gleiche H�alften. Das arithmetische Mittel ist in diesem Falldas gr�o�te Mittel. Man nennt die Verteilung in Bild 1.16 linkssteil, linksschief oderpositiv schief. Eine linksschiefe Verteilung ist typisch f�ur Bonituren, da starke Bef�allewesentlich weniger h�au�g auftreten als geringe Bef�alle.
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 37
Eine Verteilung wie in Bild 1.14 nennt man rechtssteil, rechtsschief oder negativschief . F�ur die Stichprobe der Schlafdauern in Bild 1.14 ist im Unterschied zur links-schiefen Verteilung von Bild 1.16 das arithmetische Mittel x = 7:0 h der kleinste, derMedian ex = 7:2 der mittlere und der Modalwert xd = 7:3 h der gr�o�te Lageparameter.
Eine extrem linksschiefe Verteilung, deren Modalwert ganz links liegt, wird als L-Verteilung bezeichnet. Bild 1.17 zeigt eine L-Verteilung des Betriebseinkommens einerStichprobe von 25 landwirtschaftlichen Betrieben.
240000220000
200000180000
160000140000
120000100000
8000060000
40000
10
8
6
4
2
0
Reineinkommen [DM]
abso
lute
Häu
figke
it
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Bild 1.17: Betriebseinkommen Landwirtschaftlicher Betriebe
Eine extrem rechtsschiefe mit dem Modalwert rechts au�en hei�t entsprechend J-
Verteilung. Die Bezeichnungen kommen von der Form der Buchstaben L und J, dieann�ahernd wie solche Verteilungen aussehen.
Bei L- und J-Verteilungen sind arithmetisches Mittel x und Modalwert xd keine geeig-neten Parameter. Der Median ex ist in diesen F�allen vorzuziehen, da er die Stichprobein zwei H�alften teilt. Aus Bild 1.17 kann man z.B. das arithmetische Mittel nach Glei-chung (1.10) zu x = 72800 DM sch�atzen. In der Klasse dieser Gr�o�e liegen jedoch nurzwei Beobachtungen. Auch die Klasse des Modus mit der Klassenmitte von 40000 DMcharakterisiert die Einkommensverteilung nicht sehr gut. Es emp�ehlt sich hier dieAngabe des mittelsten Betriebs, da dieser Betrieb mindestens genauso viel wie die 12schlechteren und weniger als die 12 besseren Betriebe erwirtschaftet hat. Dieser Betriebliegt in der Medianklasse mit der Klassenmitte 60000 DM.
Es gibt mehrere M�oglichkeiten, die Schiefe einer Verteilung durch eine Ma�zahl zucharakterisieren.
Ein einfaches Ma� ist das Pearsonsche Schiefheitsma� S1. Es verwendet die Dif-ferenz zwischen arithmetischem Mittel x und Dichtemittel xd bezogen auf die Stan-dardabweichung s, weil die Schiefe einer Verteilung umso weniger au��allt, je gr�o�er dieStreuung einer Stichprobe ist.
S1 =x� xd
s(1.19)
38 1 Beschreibende und explorative Statistik
Falls x > xd und damit S1 > 0 ist, handelt es sich um eine linksschiefe Verteilung. Fallsx < xd und damit S1 < 0 ist, handelt es sich um eine rechtsschiefe Verteilung.
Weil in manchen F�allen die Bestimmung des Dichtemittels nicht einfach bzw. auch nichteindeutig ist, verwendet ein anderes Schiefema� S2 die dreifache Di�erenz zwischenarithmetischem Mittel x und Median ex, ebenfalls bezogen auf die Standardabweichungs.
S2 =3 � (x� ex)
s(1.20)
Auch hier gilt: Falls x > xd und damit S2 > 0 ist, ist die Verteilung linksschief, imumgekehrten Fall (S2 < 0) rechtsschief.
Am h�au�gsten verwendet man jedoch als Schiefema� das sog. 3. Moment bez�uglich
des Mittelwerts x, also M3 =1
n�
nXi=1
(xi � x)3), bezogen auf die dritte Potenz der
Standardabweichung s:
S3 =M3
s3=
nXi=1
(xi � x)3
n � s3 (1.21)
Auch S3 nimmt f�ur linksschiefe Verteilungen positive und f�ur rechtsschiefe Verteilungennegative Werte an.
Beispiele:
1. Die H�au�gkeitsverteilung der Stichprobe mit den Ferkelzahlen in Bild 1.3 ist relativsymmetrisch. Deshalb liegen alle Schiefheitsma�e in der Umgebung von 0:
S1 =10:02� 10
2:197= 0:009
S2 =3 � (10:02� 10)
2:197= 0:027
S3 =183:321
100 � 2:1973 = 0:173
2. Die H�au�gkeitsverteilung der Stichprobe der Milchleistungen aus Tab. 1.8 ist eben-falls relativ symmetrisch. Da der Modus je nach Klasseneinteilung di�eriert, werdennur die Schiefheitsma�e S2 und S3 berechnet. Diese liegen nat�urlich auch in der Um-gebung von 0:
S2 =3 � (5188:7� 5231:5)
655:4= �0:196
S3 =�1130173824100 � 655:43 = �0:040
1.2 Statistische Ma�zahlen eindimensionaler Stichproben 39
3. Die Verteilung der Bonituren in Bild 1.16 ist o�ensichtlich linksschief. Dies dr�ucktsich auch in den Schiefheitsma�en aus, die alle sehr viel gr�o�er als 0 sind:
S1 =3� 1
2:033= 0:984
S2 =3 � (3� 2)
2:033= 1:476
S3 =744
90 � 2:0333 = 0:984
4. Die Verteilung der Schlafzeiten in Bild 1.14 ist o�ensichtlich rechtsschief.
S1 =7:02� 7:33
1:196= �0:259
S2 =3 � (7:02� 7:20)
1:196= �0:452
S3 =�357:746150 � 1:1963 = �1:394
In diesem Fall gibt das Schiefheitsma� S3 die Rechtssteilheit am besten wieder.
1.2.14 Kurtosis oder Exze�
Symmetrische H�au�gkeitsverteilungen von Stichproben haben in vielen F�allen eineann�ahernd glockenf�ormige Gestalt, die man durch eine sog. Gau�sche Glockenkur-ve approximieren kann (vgl. Kap. 3.1). Das Histogramm der Ferkelzahlen in Bild 1.3besitzt z.B. eine solche Form.
Andere Verteilungen sind jedoch wesentlich spitzer. Bild 1.18 zeigt eine solche steil-gip ige Verteilung von Ferkelzahlen.
16151413121110987654
35
30
25
20
15
10
5
0
Ferkelzahl
abso
lute
Häu
figke
it
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAA
AAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAA
AAAAAAAAAA
1013
10
19
31
22
8
3110
Bild 1.18: Steilgip ige Verteilung mit positiver Kurtosis
Im umgekehrten Fall kann die Verteilung auch breiter als eine Glockenkurve sein. Bild1.19 zeigt eine extrem achgip ige Verteilung von Ferkelzahlen.
40 1 Beschreibende und explorative Statistik
16151413121110987654
35
30
25
20
15
10
5
0
Ferkelzahl
abso
lute
Häu
figke
it
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
000
1416
14
11
1617
12
000
Bild 1.19: Flachgip ige Verteilung mit negativer Kurtosis
Man verwendet zum Vergleich einigerma�en symmetrischer Verteilungen, die ann�a-hernd gleiche Streuung, aber unterschiedlicheW�olbung besitzen, dieKurtosis oder denExze�. Die W�olbung wird im wesentlichen erfa�t durch das auf x bezogene Moment 4.
Ordnung M4 =1
n
nXi=1
(xi � x)4, dividiert durch s4. Da f�ur die wichtige standardisierte
Normalverteilung mit glockenf�ormiger Gestalt (vgl. Kap. 3.1) diese Gr�o�e den Wert 3
hat, w�ahlt man als Kurtosis K einer Verteilung den Wert vonM4
s4�3, also die Di�erenz:
K =
nXi=1
(xi � x)4
n � s4 � 3 (1.22)
Die Kurtosis h�angt vom Moment M4 sowie der Standardabweichung s ab. Wenn z.B.eine Verteilung eine positive Kurtosis hat, so hei�t das in etwa, da� die Anzahl \gr�o�e-rer\ Abweichungen von x gr�o�er ist als bei einer Gau�schen Glockenkurve mit gleicherStreuung. Die Verteilung wird also eine spitzere Form aufweisen (Bild 1.18). Ganz ana-log wird im Falle einer negativen Kurtosis diese Verteilung eine stumpfere Form haben(Bild 1.19).
Beispiel:
Die Stichproben mit den Ferkelzahlen in den Bildern 1.3, 1.18 und 1.19 haben alle denMittelwert x = 10:02 und ungef�ahr die gleiche Standardabweichung. Die Kurtosis ist:
Bild 1.3 : K =7122:2
100 � 2:1974 � 3 = 0:057
Bild 1.18 : K =3240:3
100 � 1:6204 � 3 = 1:705
Bild 1.19 : K =2661:4
100 � 2:0004 � 3 = �1:337
1.3 Beschreibung zweidimensionaler Stichproben 41
1.3 Beschreibung zweidimensionaler Stichproben
Es werden im folgenden zwei Merkmale X und Y betrachtet. Das Merkmal X soll mitden Auspr�agungen x1; x2; : : : xm, das Merkmal Y mit den Auspr�agungen y1; y2; : : : ynvorkommen. Zugelassen sind nominale, ordinale und quantitative Auspr�agungen, dieauch schon klassi�ziert sein k�onnen. Die Urliste einer zweidimensionalen Stichprobezeigt z.B. Tab. 1.2.
1.3.1 H�au�gkeitsverteilungen
Das allgemeine Schema einer zweidimensionalen H�au�gkeitsverteilung zeigt Tab.1.15.
y1 y2 : : : yj : : : yl R:H:
x1 n11 n12 : : : n1j : : : n1l n1:x2 n21 n22 : : : n2j : : : n2l n2:...
......
......
...xi ni1 ni2 : : : nij : : : nil ni:...
......
......
...xk nk1 nk2 : : : nkj : : : nkl nk:R:H: n:1 n:2 : : : n:j : : : n:l n
Tabelle 1.15: Zweidimensionale H�au�gkeitsverteilung als Kontingenztafel
Eine solche Tabelle wird auch als Kontingenztafel bezeichnet.
Die xi bzw. yi k�onnen im Falle quantitativer Daten diskrete Werte sein oder im Falleeiner gruppierten Verteilung auch Klassenmitten. nij gibt die absolute H�au�gkeit f�urdas Auftreten von Elementen mit der Auspr�agung xi bzgl. des x-Merkmals und mitder Auspr�agung yi bzgl. des y-Merkmals an. Interessiert nur die Verteilung der Merk-malswerte eines Merkmals, so braucht man die sog. Randh�au�gkeiten R.H. oderRandverteilungen.
Will man wissen, wie die x-Werte sich verteilen ohne R�ucksicht auf die y-Werte, dannmu� man in der obigen H�au�gkeitstafel die Zeilensummen bilden und erh�alt die Rand-verteilung bez�uglich x:
ni: =
lXj=1
nij (i = 1; 2; : : : ; k) (1.23)
Die Randverteilung von y ergibt sich aus den Spaltensummen:
n:j =
kXi=1
nij (j = 1; 2; : : : ; l) (1.24)
42 1 Beschreibende und explorative Statistik
Beispiel:
Tab. 1.16 zeigt die Kontingenztafel f�ur die Anzahl der betriebseigenen Schlepper auf-geteilt nach Betriebs- und Schlepperleistungsklassen einer landwirtschaftlichen Region.
Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90 R:H:
< 30 6 8 2 1630� 50 16 44 7 6750� 70 5 29 25 1 60> 70 5 2 7
R:H: 6 29 75 37 3 150
Tabelle 1.16: Kontingenztafel der Anzahl betriebseigener Schlepper aufgeteilt nachBetriebsgr�o�en- und Schlepperleistungsklassen
Die zweidimensionale H�au�gkeitsverteilung der Kontingenztafel in Tab. 1.16 zeigt Bild1.20.
<30 40 60 >700
5
10
15
20
25
30
<30
40
60
80
>90
Betriebsgröße [ha] Schlep
perle
istun
g [k
W]
abso
lute
Häu
figke
it
Bild 1.20: Zweidimensionale H�au�gkeitsverteilung der Anzahl betriebseigener Schlep-per aufgeteilt nach Betriebsgr�o�en- und Schlepperleistungsklassen
Die H�au�gkeiten k�onnen absolut (mit nij bezeichnet) oder relativ (mit hij bezeichnet)angegeben sein. Bei einer relativen H�au�gkeitsverteilung k�onnen jedoch die einzelnenH�au�gkeiten hij auf verschiedene Summen bezogen sein. Man kann sie erstens auf dieSpaltensummen, zweitens auf die Zeilensummen und drittens auf die gesamte Anzahln von untersuchten Elementen beziehen.
Beispiel:
Die M�oglichkeiten zur Darstellung der relativen H�au�gkeiten am Beispiel der Schlepperin Tab. 1.16 zeigen die Tab. 1.17 { 1.19.
1.3 Beschreibung zweidimensionaler Stichproben 43
In Tab. 1.17 sind die Schlepperzahlen auf die Spaltensummen bezogen. Sie zeigt, wiesich Schlepper einer bestimmten Leistungsklasse auf einzelne Gr�o�enklassen der Be-triebe verteilen.
Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90
< 30 100:0 27:6 2:730� 50 55:2 58:7 18:950� 70 17:2 38:7 67:6 33:3> 70 13:5 66:7
100 100 100 100 100
Tabelle 1.17: Relative H�au�gkeiten [%] der Schlepper in Tab. 1.16 bezogen auf dieRandh�au�gkeiten der Spalten
In Tab. 1.18 sind die Schlepperzahlen auf die Zeilensummen bezogen. Sie zeigt, wie sicheine bestimmte Betriebsgr�o�enklasse bei der Auswahl der Leistung ihres Schleppersverh�alt.
Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90
< 30 37:5 50:0 12:5 10030� 50 23:9 65:7 10:5 10050� 70 8:3 48:3 41:7 1:7 100> 70 71:4 28:6 100
Tabelle 1.18: Relative H�au�gkeiten [%] der Schlepper in Tab. 1.16 bezogen auf dieRandh�au�gkeiten der Zeilen
Tab. 1.19 bezieht alle Schlepper in den einzelnen Gruppen auf die Gesamtzahl deruntersuchten Schlepper und stellt die eigentliche zweidimensionale Verteilung dar, dieVerteilung der Schlepper in Abh�angigkeit von den Leistungsklassen und den Betriebs-gr�o�enklassen.
Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90
< 30 4:0 5:3 1:3 10:730� 50 10:7 29:3 4:7 44:750� 70 3:3 19:3 16:7 0:7 40:0> 70 3:3 1:3 4:7
4:0 19:3 49:9 24:7 2:0 100
Tabelle 1.19: Relative H�au�gkeiten [%] der Schlepper in Tab. 1.16 bezogen auf dieGesamtzahl der Schlepper
44 1 Beschreibende und explorative Statistik
Es stellt sich die Frage, nach welcher Richtung (horizontal oder vertikal, d.h. Zeilen-summen oder Spaltensummen als Bezugsbasis) man die absoluten H�au�gkeiten pro-zentuieren soll. Wenn man in einer solchen Kreuztabellierung zwei Merkmale oder zwei\Faktoren\ zusammenbringt und man eindeutig einen Faktor als Ursache und denanderen als Wirkung betrachten kann, so ist es sinnvoll, in der Richtung des Ursa-chenfaktors zu prozentuieren. Wenn die Stichprobe, aus der die Kreuztabelle errechnetwird, jedoch nicht \repr�asentativ\1 ist, ist stets gro�e Vorsicht geboten, eine Ursache-Wirkungs-Relation auf eine Grundgesamtheit zu verallgemeinern. Zwei Merkmale oderFaktoren m�ussen auch nicht immer in einem direkten Ursache-Wirkungs-Verh�altnisstehen. Sehr h�au�g sind jedoch auch Merkmale in einer zweidimensionalen H�au�g-keitsverteilung miteinander verkn�upft, bei denen keine eindeutige Wirkungsrichtungvon einem Merkmal auf das andere festzustellen ist. So h�angen z.B. die MerkmaleBrustumfang und Kreuzh�ohe beim Rind voneinander ab (sie sind miteinander korre-liert), ohne da� man sagen k�onnte, die eine Variable ist Kausalursache f�ur die andere.Der Zusammenhang zwischen zwei solchen Merkmalen ist wechselseitig. F�ur das Fol-gende wird unterstellt, da� eine zuf�allige Stichprobe zugrundeliegt. Daraus wird einezweidimensionale, empirische H�au�gkeitsverteilung aufgestellt. In der Regel wird dabeivon der absoluten H�au�gkeitsverteilung ausgegangen.
1.3.2 Zusammenhang zweier Merkmale
In vielen F�allen kann man aus der H�au�gkeitsverteilung einer zweidimensionalen Stich-probe auf einen Zusammenhang zwischen zwei Merkmalen schlie�en (Bild 1.21).
<30 kW AAAAAAAA 30-50 kW
50-70 kWAAAAAAAAAAAA
70-90 kWAAAAAAAAAAAA
>90 kW
>70 ha50-70 ha30-50 ha<30 ha
80
70
60
50
40
30
20
10
0
Betriebsgröße
Rel
ativ
e H
äufig
keit
[%]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAA AAAAAA AAAAAAAA
AAAA
Bild 1.21: Relative H�au�gkeitsverteilung der Schlepperleistung von Tab. 1.16 getrenntnach Betriebsgr�o�en
1Man benutzt gelegentlich nur eine Teilmenge aus einer endlichen Grundgesamtheit und zieht dieStichprobe dann aus dieser Teilmenge. In der Regel zeigt diese Teilmenge eine �ahnliche Struktur wiedie Grundgesamtheit. Man nimmt daher an, da� die Stichprobe repr�asentativ ist bzgl. der Grund-gesamtheit. Damit man diese Teilmenge aus einer endlichen Grundgesamtheit richtig ausw�ahlt, mu�man jedoch die Struktur der Grundgesamtheit gut kennen.
1.3 Beschreibung zweidimensionaler Stichproben 45
Aus den Tabellen 1.17 � 1.19 wird deutlich, da� in gr�o�eren Betrieben tendenziell auchSchlepper mit h�oheren Leistungen vorkommen. Dies ist auch o�ensichtlich, wenn dierelativen H�au�gkeiten der Schlepperleistungsklassen innerhalb der jeweiligen Betriebs-gr�o�e f�ur jede Betriebsgr�o�e getrennt aufgetragen werden (Bild 1.21). Dies entsprichtden Werten in Tab. 1.18. Die relativen H�au�gkeiten innerhalb einer Betriebsgr�o�en-klasse addieren sich zu 100%.
Diese Abh�angigkeit zweier Merkmale kann man in einem zweidimensionalen Streu-
diagramm oder engl. Scatter Plot darstellen. Dabei tr�agt man die Me�werte jedesObjekts gegeneinander auf.
Beispiel:
Bild 1.22 zeigt das Streudiagramm von Betriebsgr�o�e und Schlepperleistung der ur-spr�unglichen Stichprobenwerte von Tab. 1.16.
8070605040302010
100
90
80
70
60
50
40
30
20
Betriebsgröße [ha]
Sch
lepp
erle
istu
ng [k
W]
Bild 1.22: Streudiagramm von Betriebsgr�o�e und Schlepperleistung
Es existiert o�ensichtlich eine positive lineare Abh�angigkeit der beiden Merkmale. DerZusammenhang ist jedoch nicht exakt linear, da die Me�werte mehr oder weniger umeine Gerade streuen.
Bild 1.23 zeigt vier verschiedene zweidimensionale Streudiagramme.
In Bild 1.23 a) ist der Zusammenhang zwischen den beiden Merkmalen streng linear,d.h. die Beobachtungen liegen exakt auf einer Geraden. Ein linearer Zusammenhangkann auch in Bild 1.23 b) angenommen werden, allerdings streuen dieWerte in gewissemUmfang um eine Gerade. Bei Bild 1.23 c) existiert kein Zusammenhang zwischen denMerkmalen. Die Beziehung ist mehr oder weniger zuf�allig. Schlie�lich ist in Bild 1.23 d)durchaus ein Zusammenhang zwischen den Merkmalen abzuleiten, allerdings ist diesero�ensichtlich nicht linear.
46 1 Beschreibende und explorative Statistik
a)
r = �1
b)
r = 0:62
c)
r = 0
d)
(r = 0:91)
Bild 1.23: Streudiagramme zweier Merkmale mit verschiedenen Korrelationen
Eine Quanti�zierung der St�arke des linearen Zusammenhangs zweier Merkmale istmit der Korrelationsanalyse m�oglich. Dabei wird untersucht, ob zwei Merkmalevoneinander linear abh�angig, d.h. korreliert, oder linear unabh�angig, also unkorreliert,sind2.
Ein Ma� f�ur die St�arke des linearen Zusammenhangs soll weder vom Nullpunkt derMe�skalen noch von den Ma�einheiten der Merkmale X und Y abh�angen. Aus diesemGrund werden die Variablen X und Y auf den Mittelwert 0 und die Standardabwei-chung 1 skaliert.
Die Skalierung auf den Mittelwert 0 erfolgt durch die Bildung der Di�erenz der Stich-probenwerte xi bzw. yi minus den Mittelwerten x bzw. y. Haben die Di�erenzen xi�xund yi � y das gleiche Vorzeichen, so deutet dies auf einen positiven Zusammenhanghin. Ein negativer Zusammenhang wird durch verschiedene Vorzeichen der Di�erenzenangezeigt.
2Es erfolgt hier lediglich eine kurze Einf�uhrung in die Korrelationsanalyse. Eine umfassende Be-handlung beinhaltet Band 2.
1.3 Beschreibung zweidimensionaler Stichproben 47
Die Summe
SPxy =
nXi=1
(xi � x)(yi � y) (1.25)
hei�t Summe der Abweichungsprodukte in Analogie zur Summe der Abwei-
chungsquadrate
SQx =
nXi=1
(xi � x)2 bzw. SQy =
nXi=1
(yi � y)2: (1.26)
Die Gr�o�e
sxy =1
n� 1
nXi=1
(xi � x)(yi � y) =1
n� 1SPxy (1.27)
hei�t Kovarianz zwischen X und Y .
Dividiert man die Di�erenzen xi�x und yi�y durch die jeweilige Standardabweichungsx bzw. sy, so erh�alt man die transformierten Variablen U und V , die den Mittelwert0 und die Standardabweichung 1 haben:
ui =xi � x
sx; vi =
yi � y
sy(1.28)
Der lineare Zusammenhang zwischen X und Y ist jetzt umso gr�o�er, je ausgepr�agterdie Tendenz ist, da� U und V entweder gleiches Vorzeichen oder ungleiches Vorzei-chen haben. Im ersten Fall spricht man von positivem linearen Zusammenhang bzw.positiver Korrelation, im zweiten Fall von negativem linearen Zusammenhang bzw.negativer Korrelation.
Das Produkt ui � vi ist ein einfaches Ma� f�ur die Tendenz bzw. den linearen Zusam-menhang zwischen xi und yi. Ein Ma� f�ur den linearen Zusammenhang der ganzenStichprobe ist das Mittel der einzelnen Betr�age, wobei in Analogie zur Berechnung der
Varianz nach Gleichung (1.7) anstatt durch n wieder durch n� 1 dividiert wird:
rxy =1
n� 1
nXi=1
ui � vi =1
n� 1
nXi=1
xi � x
sx� yi � y
sy(1.29)
rxy ist der empirische Korrelationskoe�zient zwischenX und Y . Dieser kann nachGleichung (1.28), (1.25) und (1.29) auch ausgedr�uckt werden als:
r = rxy =sxy
sx � sy=
SPxypSQx � SQy
(1.30)
48 1 Beschreibende und explorative Statistik
Der Korrelationskoe�zient r kann Werte zwischen �1 und +1 annehmen. UnkorrelierteDaten haben einen Korrelationskoe�zienten von r = 0 oder nahe 0 (Bild 1.23 c). F�urjrj = 1 liegen die (xi; yi)-Werte im Streudiagramm exakt auf einer Geraden (Bild1.23 a). F�ur jrj < 1 streuen die Punkte mehr oder weniger um eine AusgleichsgeradeDer Datensatz in Bild 1.23 b) ist korreliert mit einem Koe�zienten von r = 0:62.Eine positive Steigung dieser Geraden liegt vor, wenn r > 0 ist (Bild 1.23 b). DieSteigung ist negativ f�ur r < 0 (Bild 1.23 a). Je gr�o�er r dem Betrag nach ist, destogeringer ist die Streuung um diese Ausgleichsgerade. F�ur die Stichprobe in Bild 1.23d) berechnet sich rein formal ein Korrelationskoe�zient von r = 0:91. Dieser ist jedochnicht interpretierbar, da der Zusammenhang nicht linear ist.
Beispiele:
1. F�ur den Spezialfall xi = yi f�ur alle Stichprobenwerte liegt eine extreme lineareAbh�angigkeit vor. Die Korrelation ist rxy = 1, denn es gilt:
SPxy =
nXi=1
(xi � x) � (yi � y) =
nXi=1
(xi � x)2 = SQx =
nXi=1
(yi � y)2 = SQy
Also folgt nach Gleichung (1.30) f�ur r:
rxy =SPxyp
SQx � SQy
=SPxyp
SPxy � SPxy
= 1
2. Wenn die Punkte exakt auf einer beliebigen Geraden yi = y0 +m � xi liegen, dannist yi � y = m � (xi � x) und es gilt nach Gleichung (1.27):
sxy =1
n� 1�
nXi=1
(xi � x) � (yi � y) =1
n� 1�m �
nXi=1
(xi � x)2 = m � s2x
Au�erdem gilt s2y = m2 � s2x. Der Korrelationskoe�zient ist deshalb:
rxy =m � s2x
sx � jmj � sx=
m
jmjF�ur m > 0 ist rxy = 1 und f�ur m < 0 ist rxy = �1. Ein Koe�zient bei einerGeraden mit der Steigung m = 0 ist nicht de�niert.
3. Der Korrelationskoe�zient zwischen der Betriebsgr�o�e und der Schlepperleistungin Bild 1.22 ist r = 0:78.
1.3 Beschreibung zweidimensionaler Stichproben 49
Zur Berechnung von r per Hand emp�ehlt es sich, folgende Berechnungsformel zuverwenden, welche analog zur Berechnungsformel (1.9) f�ur die empirische Varianz her-geleitet werden kann:
r =SPxyp
SQx �pSQy
=
nXi=1
(xi � x) � (yi � y)
vuut nXi=1
(xi � x)2 �vuut nX
i=1
(yi � y)2
=
=
nXi=1
xi � yi �1
n�
nXi=1
xi
!�
nXi=1
yi
!vuut nX
i=1
x2i �1
n�
nXi=1
xi
!2
�
vuut nXi=1
y2i �1
n�
nXi=1
yi
!2
(1.31)
Es sind also folgende Summen mit einem Taschenrechner auszurechnen:
Xxi,X
x2i ,X
yi,X
y2i ,X
xiyi
An dieser Stelle sei nochmals an die Tatsache erinnert, da� bei einer Programmierungvon Gleichung (1.31) die Gefahr von \Stellenausl�oschung\ und damit gro�er Rundungs-fehler im Computer besteht, falls die beiden Ausdr�ucke im Z�ahler nahezu gleich gro�sind.
Beispiel:
Die folgende Tabelle zeigt die Baumh�ohe und den Stammdurchmesser von sechs Ka-stanienb�aumen.
Baumh�ohe [m] 12:3 10:1 5:4 2:6 14:1 7:3
Stammdurchmesser [cm] 31:9 30:2 15:7 10:0 40:9 23:1
Der Korrelationskoe�zient wird nach Gleichung (1.31) bestimmt:
i xi yi x2i y2i xiyi1 12:3 31:9 151:29 1017:61 392:372 10:1 30:2 102:01 912:04 305:023 5:4 15:7 29:16 246:49 84:784 2:6 10:0 6:76 100:00 26:005 14:1 40:9 198:81 1672:81 576:696 7:3 23:1 53:29 533:61 168:63P
51:8 151:8 541:32 4482:56 1553:49
r =1553:49� 51:8 � 151:8=6p
541:32� 51:82=6 �p4482:56� 151:82=6
= 0:98836 � 0:99
50 1 Beschreibende und explorative Statistik
1.4 Beschreibung mehrdimensionaler Stichproben
Werden mehrere Merkmale f�ur eine Beobachtung gemessen, so erh�alt man multiva-
riate Daten. In Tab. 1.20 liegt z.B. eine Stichprobe von 20 Getreidesorten �uber dieMerkmale Ertrag, Tausendkorngewicht, Kornzahl pro �Ahre und P anzen pro Quadrat-meter vor.
Ertrag [dt/ha] TKG [g] Kornzahl/�Ahre P anzen/m2
76:0 46:7 43 42769:5 54:9 34 43065:0 56:0 37 36473:0 46:8 44 40369:1 47:6 43 38678:5 47:1 44 42672:3 48:6 38 44568:7 46:8 46 36675:7 41:3 41 49774:1 40:5 41 49964:2 52:9 35 40767:2 49:6 42 37365:6 52:0 38 38479:1 45:5 44 45074:7 49:5 41 41160:8 54:6 37 35271:8 50:7 40 39964:8 52:1 39 36964:5 51:5 45 32263:4 57:5 38 343
Tabelle 1.20: Ertragsmerkmale von 20 Getreidesorten
Allgemein hei�t ein Schema der Art
x11 x12 : : : x1j : : : x1mx21 x22 : : : x2j : : : x2m...
.... . .
......
...... xij
......
......
. . ....
xn1 xn2 : : : xnj : : : xnm
eine Datenmatrix, wobei xij der Wert des j-ten Merkmals bzw. der j-ten Variablenf�ur die i-te Beobachtung ist. Man sagt in diesem Fall, da� die Daten die Dimension
m haben. Eine Datenmatrix ist auch die grundlegende Struktur f�ur die Eingabe vonDaten in Statiskikprogrammen auf Computern. In Tab. 1.20 stehen die Daten jederSorte in den n = 20 Matrixzeilen, die Werte der einzelnen Merkmale stehen in denSpalten der Datenmatrix. Die Dimension der Daten betr�agt also m = 4.
1.4 Beschreibung mehrdimensionaler Stichproben 51
1.4.1 H�au�gkeitsverteilungen
Ein H�au�gkeitsverteilung f�ur Datens�atze mit einer Dimension von m � 3 ist anschau-lich nicht mehr m�oglich, da mindestens 4 Dimensionen zur Darstellung ben�otigt werden.Man mu� sich auf die H�au�gkeitsverteilungen der Einzelmerkmale beschr�anken. Bild1.24 zeigt die Histogramme jedes einzelnen Merkmals der Tab. 1.20.
8075706560
40
30
20
10
0
Ertrag [dt/ha]
rela
tive
Hä
ufig
keit
[%]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
6055504540
40
30
20
10
0
Tausendkorngewicht [g]
rela
tive
Hä
ufig
keit
[%]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
45.042.540.037.535.0
30
20
10
0
Körner/Ähre
rela
tive
Hä
ufig
keit
[%]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
500450400350300
30
20
10
0
Pflanzen/m2
rela
tive
Hä
ufig
keit
[%]
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Bild 1.24: Histogramme der Ertragsmerkmale von 20 Getreidesorten
1.4.2 Streumatrizen
Streudiagramme wie bei zweidimensionalen Datens�atzen sind f�ur h�ohere Dimensionenebenfalls nicht mehr anschaulich darstellbar. Man tr�agt deshalb die Streudiagrammef�ur jeweils zwei Merkmale in einer Streumatrix oder einer Scatter-Plot-Matrix auf.Bild 1.25 zeigt die Streumatrix der Ertragsmerkmale von Tab. 1.20.
Das Merkmal Ertrag ist in der ersten Zeile der Streumatrix von Bild 1.25 als Ordinateund in der ersten Spalte als Abszisse abgetragen. In der zweiten Zeile bzw. Spalte istdie Ordinate bzw. Abszisse das Tausendkorngewicht. Entsprechendes gilt f�ur die dritteund vierte Zeile bzw. Spalte f�ur die Merkmale Kornzahl/�Ahre und P anzen/m2. Esgibt nun f�ur jedes Merkmal das Streudiagramm in Bezug auf alle anderen Merkmale.Bei den Darstellungen gegen�uber der Diagonalen, ist lediglich Abszisse und Ordinatevertauscht. Die Abbildungen sind also �aquivalent. Es existiert o�ensichtlich ein nega-tiver linearer Zusammenhang zwischen Tausendkorngewicht und Kornzahl pro �Ahre
52 1 Beschreibende und explorative Statistik
74.525
65.375
53.25
44.75
43
37
74.52565.375
454.75
366.25
53.2544.75 4337
454.75366.25
Ertrag
TKG
Ko/Aehre
Pfl/m2
Bild 1.25: Streumatrix der Ertragsmerkmale von 20 Getreidesorten
sowie P anzen pro Quadratmeter. Eine Korrelation zwischen Kornzahl pro �Ahre undP anzen pro Quadratmeter ist nicht erkennbar. Zwischen Ertrag und P anzen pro Qua-dratmeter besteht eine deutlich positive Korrelation. Die positive Beziehung zwischenErtrag und Kornzahl pro �Ahre ist weniger stark ausgepr�agt. Auf den ersten Blick �uber-rascht die negative Beziehung zwischen Ertrag und Tausendkorngewicht. Betrachtetman jedoch die negative Korrelation des Tausendkorngewichts mit den anderen beidenertragsbildenden Merkmalen, dann ist klar, da� bei geringen Tausendkorngewichtendie Ertragsbildung im wesentlichen �uber die Kornzahl pro �Ahre und die P anzen proQuadratmeter erfolgt.
1.4.3 Zusammenhang mehrerer Merkmale
Die Streumatrix ist die graphische Variante einer Zusammenstellung der einfachenKorrelationen zwischen den beobachteten Merkmalen. Die Korrelationsmatrix istein Schema, das die Korrelationskoe�zienten zwischen jeder Variable enth�alt. F�ur dieMerkmale in Tab. 1.20 bzw. die Streumatrix in Bild 1.25 lautet die Korrelationsmatrix:
1:000 �0:756 0:484 0:764�0:756 1:000 �0:617 �0:7380:484 �0:617 1:000 0:0040:764 �0:738 0:004 1:000
Jedes Merkmal mit sich selbst ist nat�urlich zu r = 1 korreliert. Au�erdem sind Ko-e�zienten oberhalb der Diagonalen identisch mit Koe�zienten unterhalb davon. In-folgedessen kann die Korrelationsmatrix zum Dreiecksschema in Tab. 1.21 vereinfachtwerden:
Die Korrelationsmatrix in Tab. 1.21 best�atigt die Schlu�folgerungen aus der Streuma-trix in Bild 1.25 und gibt dar�uberhinaus quantitative Ma�e f�ur den linearen Zusam-menhang der Merkmale an.
1.4 Beschreibung mehrdimensionaler Stichproben 53
Ertrag [dt/ha] TKG [g] Kornzahl/�Ahre
TKG [g] �0:756Kornzahl/�Ahre 0:484 �0:617P anzen/m2 0:764 �0:738 0:004
Tabelle 1.21: Korrelationsmatrix f�ur die Ertragsmerkmale in Tab. 1.20
1.4.4 Sterndiagramme
Mit Sterndiagrammen k�onnen im Prinzip beliebig viele Variablen dargestellt werden.Die Merkmale werden als Strahlen in verschiedene Richtungen der Ebene interpretiert.Die L�ange der Strahlen entspricht der Gr�o�e der Merkmalswerte. Da die Merkmalswerteals L�ange von Strahlen dargestellt werden, m�ussen sie alle positiv und etwa von gleicherGr�o�e sein. Aus diesem Grund werden die Werte jeder Variablen auf das Intervall[c; 1] skaliert, wobei c das Verh�altnis der L�angen des kleinsten und gr�o�ten Strahls ist.Bezeichnet xij den i-ten Me�wert der j-ten Variable, dann ist die skalierte Variablex�ij :
x�ij = (1� c) � xij �minj(xij )
maxj(xij)�minj(xij )+ c (1.32)
Wurden m Variablen gemessen, so w�ahlt man m Strahlen, die in m Richtungen derZeichenebene zeigen. Der Winkel � zwischen allen Strahlen ist gleich, also � = 360�=m.F�ur jedes beobachtete Objekt i wird ein Stern mit m Strahlen gezeichnet, deren L�angeden skalierten Merkmalswerten x�ij proportional ist.
Bild 1.26 zeigt das Sterndiagramm f�ur die Ertragsmerkmale von Tab. 1.20.
Bild 1.26: Sterndiagramm der Ertragsmerkmale aus Tab. 1.20
54 1 Beschreibende und explorative Statistik
Jedes Merkmal wird in Bild 1.26 durch einen Strahl in vier verschiedene Richtungendargestellt. Der Winkel zwischen den Strahlen ist � = 360�=4 = 90�. Die Richtungist im Diagramm oben rechts f�ur die einzelnen Variablen angegeben. Je l�anger einStrahl innerhalb einer Variablen ist, desto gr�o�er ist der gemessene Stichprobenwertder Variablen.
Sterndiagramme erm�oglichen einen schnellen �Uberblick �uber Objekte, die in mehre-ren oder allen Merkmalen sehr gro�e oder sehr kleine Werte besitzen. Sorte 9 bringtbeispielsweise einen hohen Ertrag, der v.a. durch die Ertragskomponenten P anzenpro Quadratmeter und Kornzahl pro �Ahre bei geringem Tausendkorngewicht zustandekommt, w�ahrend bei Sorte 1 alle ertragsbestimmenden Komponenten an der Ertrags-bildung beteiligt sind. Dar�uberhinaus kann man auch bestimmte Gruppen erkennen,bei denen der Ertrag auf �ahnliche Weise gebildet wird. Sorte 1, 6 und 14 haben bei ho-hem Ertrag auch hohe Werte in allen drei ertragsbildenden Komponenten. Alle Sorten,die lediglich hohe Tausendkorngewichte aufweisen, wie z.B. 3, 11, 16 und 20, erreichennicht ann�ahernd die Ertr�age mit hohen Werten der beiden anderen Komponenten.Daraus kann man schlie�en, da� die Ertragsh�ohe vorwiegend durch die KomponentenP anzen pro Quadratmeter und Kornzahl pro �Ahre beein u�t wird.
1.5 Explorative Statistik 55
1.5 Explorative Statistik
In den letzten Jahren fanden sog. explorative Methoden im Vorfeld einer statisti-schen Analyse immer mehr Verbreitung. Diese Methoden gehen �uber die bisher dar-gestellten Verfahren der beschreibenden Statistik hinaus und versuchen, vor allem mitgraphischen Hilfsmitteln die Daten augenf�allig und pr�agnant zu beschreiben und Be-sonderheiten bzw. Au��alligkeiten einer Stichprobe deutlicher darzustellen, als dies mitden klassischen Mitteln der beschreibenden Statistik m�oglich ist. Dar�uberhinaus kannman bei der Erforschung und der Suche nach Zusammenh�angen zwischen verschiedenenMerkmalen unabh�angig von restriktiven Verteilungsannahmen vorgehen. ExplorativeMethoden werden in diesem Zusammenhang auch als hypothesenerzeugende Me-
thoden bezeichnet, im Gegensatz zu den hypothesenbest�atigenden Methoden
der Inferenzstatistik. Die Vielfalt der explorativen Methoden, kurz EDA-Verfahrengenannt (ExploratoryData Analysis), geht auf Tukey zur�uck, der 1977 in seinem Buch\Exploratory Data Analysis\ eine gro�e Anzahl solcher Methoden erstmals umfassendvorstellte.
Hier sollen einige ausgew�ahlte Methoden als Erg�anzung des bisher gebrachten Instru-mentariums vorgestellt werden.
1.5.1 Stem-and-Leaf-Diagramme
Stem-and-Leaf-Diagramme oder Stamm-und-Blatt-Diagramme geben �ahnlichwie Histogramme die H�au�gkeitsverteilung einer Reihe von Beobachtungswerten wie-der. Allerdings gehen die numerischen Werte in individueller, augenf�alliger Weise indas Diagramm ein.
Die Konstruktion eines Stem-and-Leaf-Diagramms wird anhand einer Stichprobe �uberdas Gewicht von 25 Versuchspersonen in Bild 1.27 erl�autert. Die Merkmalswerte wer-den unter Ber�ucksichtigung eines Ma�stabfaktors und eventueller Rundung auf zweif�uhrende Zi�ern transformiert. Die erste Zi�er stellt die Stem-Zi�er, die zweite dieLeaf-Zi�er dar.
Stem Leaf4 95 45 686 36 555778897 113347 56798 018 7
Bild 1.27: Stem-and-Leaf-Diagramm der Gewichtsverteilung von Versuchspersonen
In der ersten, d.h. in der linken Spalte des Diagramms werden die Stem-Zi�ern derGr�o�e nach eingetragen, bei Bedarf mehrfach. In Bild 1.27 sind in dieser Spalte die
56 1 Beschreibende und explorative Statistik
Zehner-kg abgetragen. Rechts von den Stem-Zi�ern werden die dazugeh�orenden Leaf-Zi�ern notiert, so da� waagrechte H�au�gkeitss�aulen mit den individuellen Leaf-Zi�ern(hier die Einer-kg), entstehen. Die dritte Zeile stellt also die Me�werte 56 kg und 58 kgdar. Das Stem-and-Leaf-Diagramm in Bild 1.27 enth�alt demnach neben der gesamtenInformation �uber die einzelnen Me�werte gleichzeitig die graphische Darstellung derH�au�gkeitsverteilung.
1.5.2 Letter-Value-Tabellen
Letter-Value-Tabellen dienen dazu, Beobachtungswerte summarisch durch Angabecharakteristischer Ma�zahlen (Letter-Values oder Buchstabenwerte) zu beschrei-ben. Solche Ma�zahlen sind derMedian (teilt die Datenreihe in 2 H�alften), die Quar-tile (teilt die Datenreihe in etwa 4 Viertel) und weitere Quantilswerte, welche mandurch fortgesetzte Halbierung der entsprechend geordneten Datenmenge erh�alt.
Bevor die Letter-Values de�niert werden, sind die Werte einer Beobachtungsreihe derGr�o�e nach zu ordnen. F�ur jeden Wert wird dann bestimmt, wie weit er vom oberenoder unteren Ende der geordneten Zahlenreihe entfernt ist. Damit ist die Tiefe t ei-nes Wertes gemeint, d.h. die Nummer der Position, welche bei demjenigen Ende derReihe mit 1; 2; : : : zu z�ahlen beginnt, welches dem betre�enden Wert n�aher ist. Diebeiden �au�ersten Werte, also der kleinste und der gr�o�te haben jeweils die Tiefe 1, derzweitkleinste und der zweitgr�o�te jeweils die Tiefe 2 usw.
Bei einer ungeraden Anzahl n von Werten gibt es einen tiefsten Wert, n�amlich denMedian oder den mittelsten Wert, kurz mit M bezeichnet. Seine Tiefe t(M) ist dannn+ 1
2. Bei einem geraden Stichprobenumfang, gibt es zwei mittelste Werte. Gew�ohnlich
sind diese Werte verschieden und keiner von ihnen teilt die Stichprobe exakt in zweiH�alften. �Ublicherweise nimmt man dann den Mittelpunkt zwischen den zwei mittelsten
Werten, von denen jeder die Tiefen+ 1
2� 1
2hat. Dieser Median spaltet also die Reihe
in zwei H�alften auf, und man kann nun wieder nach der Mitte dieser H�alften fragen,welche dann die sog. Hinges oder Fourth3 darstellen.
Die Tiefe der Hinges berechnet sich zu:
t(H) =
�[t(M)] + 1
�2
(1.33)
Mit [ ] ist die Entier-Funktion gemeint. [t(M)] bedeutet also die gr�o�te ganze Zahl,welche kleiner oder gleich t(M) ist.
Ist die berechnete Tiefe keine ganze Zahl, so nimmt man analog zum obigen Vorgehenbei der Festlegung des Medians in einem solchen Fall das arithmetische Mittel derbenachbarten Werte als Letter-Value. (vgl. folgendes Beispiel).
3Die Hinges bzw. die Fourth sind den Quartilen Q1 und Q3 (vgl. Bild 1.15) sehr �ahnlich. DieQuartilen Q1 und Q3 werden als Teilpunkte der Datenmenge so de�niert, da� 25% der Werte unterhalbvon Q1 bzw. 25% der Werte oberhalb von Q3 liegen. Die Berechnung der Hinges mit Hilfe des Begri�sder Tiefe ist dagegen etwas einfacher. Die Unterschiede zwischen Hinges und Quartilen sind gering.Es kann sein, da� die Hinges etwas n�aher als die Quartilen Q1 und Q3 beim Median liegen.
1.5 Explorative Statistik 57
Man kann in dieser Weise fortfahren und mittlere Werte f�ur die beiden �au�eren Viertelder Stichprobe �nden. Diese Werte sind etwa ein Achtel der ganzen \L�ange" zwischenMaximum und Minimum von den beiden Enden der geordneten Reihen entfernt undsie werden daher auch Achtel genannt bzw. mit E wie Eighth abgek�urzt. Ihre Tiefeberechnet sich zu:
t(E) =
�[t(H)] + 1
�2
(1.34)
Die Letter-Values au�erhalb der Achtel-Werte werden seltener benutzt und habenkeine als Standard akzeptierten Namen. Sie werden eventuell mit den BuchstabenD;C;B;A; Z; Y; : : : bezeichnet.
Die n�achsten Letter-Values nach den Achtel-Werten w�aren die D-Werte und ihre Tiefe�ndet man mit:
t(D) =
�[t(E)] + 1
�2
(1.35)
Die beiden extremsten, also die �au�ersten Werte der Stichprobe haben die Tiefe t = 1.
Tab. 1.22 zeigt anschaulich, wie man die Letter-Values der Gewichtsstichprobe von Bild1.27 berechnet.
Die in Tab. 1.22 gefundenen Letter-Values werden i.a. in einer Tabelle �ubersichtlichzusammengestellt, wobei zusammengeh�orige Letter-Values (oberer und unterer Wert)zeilenweise notiert werden. Au�erdem wird der Mittelwert zusammengeh�orender Letter-Values (Mitte) und die Spannweite (Weite) zwischen diesen beiden Letter-Values an-gegeben.
Tab. 1.23 zeigt die zu den Gewichten in Bild 1.27 geh�orige Letter-Value-Tabelle.
Wenn die Mitten oder Mittelwerte ungef�ahr gleich sind, liegen die Letter-Values etwasymmetrisch um den Median. Wenn jedoch die H-, E-, D-Mitten usw. im Vergleichzum Median mehr nach der einen oder anderen Seite tendieren (also jeweils gr�o�er oderkleiner sind), deutet dies auf eine entsprechende Schiefe der Stichprobenverteilung hin.
Wie die Mitten werden auch die Weiten mit dem entsprechenden Letter-Value-Symbolversehen. Man spricht also von H-Weite, E-Weite usw. und von der Range oderder Spannweite, wenn die Di�erenz der Extremwerte gemeint ist.
Die Mitten dienen dazu, Abweichungen einer Stichprobenverteilung von der Symmetrie,also Schiefe, anzuzeigen.
Man m�ochte nun h�au�g Stichprobenwerte so transformieren, da� ihre Verteilung ei-ne symmetrische Gestalt erh�alt. Die Verwendung und die Beobachtung der oben ein-gef�uhrten Mitten ist dabei ein n�utzliches Hilfsmittel, die richtige Transformation derStichprobenwerte herauszu�nden.
58 1 Beschreibende und explorative Statistik
Tiefenberechnung Tiefe Wert Letter-Value
1 50 Extremwert 50t(C) = (2 + 1)=2 = 1:5 C = 51:5
2 53t(D) = (4 + 1)=2 = 2:5 D = 56:5
3 60t(E) = (7 + 1)=2 = 4 4 60 E = 60
5 616 62
t(H) = (13 + 1)=2 = 7 7 62 H = 628 639 6310 6411 6412 65
t(M) = (25 + 1)=2 13 67 M = 6712 6811 6910 699 718 72
t(H) = 7 7 72 H = 726 735 75
t(E) = 4 4 79 E = 723 80
t(D) = 2:5 D = 80:52 81
t(C) = 1:5 C = 83:51 86 Extremwert 86
Tabelle 1.22: Berechnung der Letter-Values f�ur die Gewichte von Bild 1.27
Letter-ValueTiefe unterer oberer Mitte Weite
M 13 67 67H 7 62 72 67 10E 4 60 79 69:5 19D 2:5 56:5 80:5 68:5 24C 1:5 51:5 83:5 67:5 32
1 50 86 68 36
Tabelle 1.23: Letter-Value-Tabelle f�ur die Gewichte von Bild 1.27
1.5 Explorative Statistik 59
1.5.3 Box-Plots
Box-Plots oder Schachtel-Plots stellen die wesentlichen summarischen Charakteri-stika einer Reihe von Beobachtungswerten graphisch sehr anschaulich dar.
Die f�unf Letter-Values Median, die beiden Hinges (bzw. Quartilen Q1 und Q3) sowiedie zwei Extremwerte werden in einen sog. Box-and-Whiskers-Plot gezeichnet. Diemittlere H�alfte der Werte, also vom oberen bis zum unteren Hinge wird durch einRechteck oder eine Box dargestellt. Der Median wird markiert, z.B. mit einem +-Zeichen oder mit einem Strich quer durch die Box. Von jedem Hinge bzw. von jedemEnde der Box aus wird eine Linie bis zum Extremwert bzw. zum �au�erstenWert gezogen(vgl. Bild 1.28). Auf diese Weise erh�alt man einen groben, aber schnellen �Uberblick �uberdie Stichprobe (Spannweite, Median, H-Weite, Symmetrie).
Bild 1.28 zeigt den Box-and-Whiskers-Plot f�ur die Gewichte aus Bild 1.27.
9080706050
Gewicht [kg]
Bild 1.28: Box-and-Whiskers-Plot der Gewichte aus Bild 1.27
Manchmal enthalten Stichproben Werte, die so extrem niedrig oder hoch sind, da� sienicht zur Stichprobe geh�orig erscheinen. Solche Werte nennt manAusrei�er. Ausrei�erk�onnen z.B. durch falsches Messen oder Notieren entstehen. Solche Fehler will manverst�andlicherweise korrigieren, bzw. wenn das nicht mehr m�oglich ist, wird man diesezweifelhaften Werte von der weiteren statistischen Untersuchung ausschlie�en. Nichtalle Ausrei�er m�ussen falsche Werte sein. Sie k�onnen nat�urlich auch sehr ungew�ohnlicheWerte in einer Stichprobe darstellen und man wird dann dem Grund ihres Auftretensganz besondere Aufmerksamkeit widmen. Um Ausrei�er explorativ zu erfassen, kannman folgenderma�en vorgehen (vgl. Tukey bzw. Vellemann/Hoaglin):
60 1 Beschreibende und explorative Statistik
Ausgehend von den Hinges und der H-Weite de�niert man die inneren Z�aune (innerfences) als folgende Punkte:
untere innere Z�aune: unterer Hinge � 1:5 �H-Weiteobere innere Z�aune: oberer Hinge + 1:5 �H-Weite
(1.36)
Die �au�eren Z�aune (outer fences) sind de�niert als:
untere �au�ere Z�aune: unterer Hinge � 3 �H-Weiteobere �au�ere Z�aune: oberer Hinge + 3 �H-Weite
(1.37)
Wenn Stichprobenwerte au�erhalb der inneren Z�aune liegen, werden sie als au�en oderals �au�ere Werte bezeichnet, und Stichprobenwerte, die au�erhalb der �au�eren Z�auneliegen, werden als weit au�en oder als weit �au�ere Werte bezeichnet.
Die Werte auf jeder Seite des Medians, welche innerhalb der inneren Z�aune diesen amn�achsten liegen, werden als Adjacent-Werte oder Anrainer-Werte bezeichnet.
F�ur die Gewichte in Bild 1.27 waren die Hinges 62 kg und 72 kg (vgl. Tab. 1.23). DieH-Weite ist also 10 kg. Damit erh�alt man die inneren Z�aune zu 62� 1:5 � 10 = 47 und72+ 1:5 � 10 = 87 und die �au�eren Z�aune zu 62� 3 � 10 = 32 und 72+ 3 � 10 = 102. Diebeiden Extremwerte 50 und 86 liegen nicht au�en, sie sind in diesem Fall gleich denAnrainer-Werten.
Neben dem einfacheren Box-and-Whiskers-Plot verwendet man h�au�g den sog. Box-Plot. Er wird folgenderma�en konstruiert. Zuerst zeichnet man die Box von Hinge zuHinge mit Kennzeichnung des Medians, genauso wie im Box-and-Whiskers-Plot. Dannzeichnet man Linien auf beiden Seiten der Box, jedoch nicht bis zu den Extremwerten,sondern nur bis zu den Adjacent-Werten. �Au�ere Werte werden durch \�\ weit �au�ereWerte durch \�\ gekennzeichnet. Weil f�ur die Gewichte in Bild 1.27 die Extremwertegleich den Anrainer-Werten sind, sind Box-Plot und Box-and-Whiskers-Plot identisch(Bild 1.28).
1.6 Beschreibende und explorative Statistik mit MINITAB 61
1.6 Beschreibende und explorative Statistik mit MINITAB
Die statistische Datenanalyse ist f�ur gro�e Datenmengen �au�erst rechenaufwendig. Ausdiesem Grund benutzt man heute Statistikprogramme auf Computern. Es existierenviele anwenderfreundliche Softwareprodukte f�ur Personalcomputer am Markt. Das Pro-grammsystem MINITAB ist ein preiswertes und einfach zu erlernendes Statistikpaket.In den folgenden Abschnitten werden einige Verfahren der beschreibenden und explora-tiven Statistik mit MINITAB durchgef�uhrt. In der Windows-Version kann man nahezualle statistischen Verfahren �uber die gra�sche Benutzerober �ache steuern. MINITABsetzt dann entsprechende Kommandos im Session-Fenster (Bild 1.29) ab, in dem auchdie Ergebnisse der Analyse ausgegeben werden. Da die Kommandos im Session-Fensterauch vom Benutzer nach der Eingabeau�orderung MTB > selbst eingegeben werdenk�onnen, erfolgt die Benutzung dieser Befehle auf Kommandoebene, was die Darstel-lung in den folgenden Abschnitten drastisch verk�urzt.
1.6.1 Datenformat und Dateneingabe
Die zu analysierenden Daten werden in MINITAB in Spalten c (von engl. column =Spalte) abgelegt. Auf die einzelnen Spalten kann entweder �uber die Spaltennummer,also c1, c2, c3 usw. oder �uber individuell vergebene Namen, z.B. 'Ertrag', 'N min','Ozongeh.' zugegri�en werden. Die Vergabe von Namen hat den Vorteil, da� man sichnicht merken mu�, welches Merkmal in welcher Spalte steht.
Der zu analysierende Datensatz kann entweder direkt in das Data-Fenster (Bild 1.29)geschrieben und mit Namen belegt oder aus einer ASCII-Datei eingelesen werden. Diefolgende Befehlssequenz liest den Datensatz von Tab. A.10 aus einer Datei KUEHE.DATvon der Festplatte in die Spalten c1 bis c8 in MINITAB ein.
MTB > read 'kuehe.dat' c1-c8
Entering data from file: kuehe.dat
120 rows read.
MTB > name c1 'Rasse' c2 'ML(kg)' c3 'Fett(%)' c4 'Eiw(%)'
MTB > name c5 'Fett(kg)' c6 'Gew(kg)' c7 'KH(cm)' c8 'BU(cm)'
MTB > save 'kuehe.mtw'
Saving worksheet in file: kuehe.mtw
MINITAB best�atigt das Einlesen von 120 Zeilen (rows). Anschlie�end werden vomBenutzer Namen f�ur die Spalten mit den das jeweilige Merkmal erkl�arenden Namenvergeben (vgl. Tab. A.10 im Anhang). Das resultierende Data-Fenster zeigt Bild 1.29.Der Datensatz wird als MINITAB-Arbeitsblatt mit dem save-Befehl abgespeichert.MINITAB f�ugt die Endung .MTW (von engl. Minitab Worksheet) auch automatischan den Dateinamen an und best�atigt die Speicherung. Es existiert nun eine DateiKUEHE.MTW, die durch das Kommando retrieve 'kuehe' nach einem Neustart wiedergeladen werden kann.
62 1 Beschreibende und explorative Statistik
Bild 1.29: MINITAB Session- und Data-Fenster
1.6.2 Statistische Ma�zahlen
Der Befehl describe gibt einige wichtige statistische Ma�zahlen der angegebenen Spal-ten aus.
MTB > describe 'ML(kg)'
N MEAN MEDIAN TRMEAN STDEV SEMEAN
ML(kg) 120 5513.0 5503.0 5511.6 722.6 66.0
MIN MAX Q1 Q3
ML(kg) 4123.0 7002.0 4921.7 6140.2
Es werden Stichprobenumfang n = N, arithmetisches Mittel x = MEAN, der Zentralwertoder Median ex = MEDIAN, empirische Standardabweichung s = STDEV (engl. standarddeviation) und der Standardfehler des Mittelwerts sx = SEMEAN (engl. standard errorof mean) ausgegeben. F�ur TRMEAN (engl. trimmed mean) werden jeweils die 5% gr�o�tenund kleinsten Werte abgeschnitten und aus den restlichen 90% der Mittelwert berech-
1.6 Beschreibende und explorative Statistik mit MINITAB 63
net. MIN und MAX sind jeweils die kleinsten und gr�o�ten Stichprobenwerte. Q1 und Q3
bezeichnen die erste und dritte Quartile.
Man kann die statistischen Ma�zahlen auch f�ur mehrere Spalten ausgeben.
MTB > describe c2-c8
N MEAN MEDIAN TRMEAN STDEV SEMEAN
ML(kg) 120 5513.0 5503.0 5511.6 722.6 66.0
Fett(%) 120 4.0208 4.0300 4.0231 0.2050 0.0187
Eiw(%) 120 3.5072 3.4950 3.5048 0.1966 0.0179
Fett(kg) 120 221.27 219.00 221.15 28.19 2.57
Gew(kg) 120 699.92 702.00 700.36 41.21 3.76
KH(cm) 120 141.99 142.00 142.06 4.97 0.45
BU(cm) 120 197.92 198.00 197.96 4.45 0.41
MIN MAX Q1 Q3
ML(kg) 4123.0 7002.0 4921.7 6140.2
Fett(%) 3.3200 4.4400 3.8800 4.1700
Eiw(%) 3.0600 4.0100 3.3900 3.6300
Fett(kg) 167.00 278.00 198.00 246.00
Gew(kg) 602.00 799.00 674.25 727.75
KH(cm) 129.00 158.00 139.00 145.00
BU(cm) 184.00 206.00 195.00 201.00
Die Bestimmung der Ma�zahlen f�ur die Rasse macht keinen Sinn, da es sich um einnominales Merkmal handelt. Es ist jedoch sinnvoll, die Anzahl der Tiere verschiedenerRasse aufzulisten.
MTB > table 'Rasse'
ROWS: Rasse
COUNT
1 40
2 50
3 20
4 10
ALL 120
Die Rassenverteilung ist also 40 Schwarzbunte, 50 Fleckvieh, 20 Braunvieh und 10Gelbvieh, was zusammen den Gesamtstichprobenumfang von 120 ergibt.
Wenn man die statistischen Ma�zahlen f�ur die Rassen getrennt ausgeben will, mu�nach dem describe-Kommando ein Strichpunkt eingegeben werden. MINITAB wartetdann auf ein Subkommando, das mit einem Punkt abgeschlossen werden mu�.
64 1 Beschreibende und explorative Statistik
MTB > describe 'ML(kg)';
SUBC> by 'Rasse'.
Rasse N MEAN MEDIAN TRMEAN STDEV SEMEAN
ML(kg) 1 40 5990.2 6007.0 5988.9 267.9 42.4
2 50 4973.5 4959.0 4964.3 231.4 32.7
3 20 6464.5 6426.5 6472.6 319.7 71.5
4 10 4398.3 4275.5 4383.5 254.0 80.3
Rasse MIN MAX Q1 Q3
ML(kg) 1 5471.0 6566.0 5762.2 6171.0
2 4533.0 5715.0 4870.8 5115.2
3 5783.0 7002.0 6216.0 6737.5
4 4123.0 4792.0 4168.0 4644.0
Die mittlere Milchleistung von Schwarzbunten (1) und Braunvieh (3) liegt also imBereich von 6000 kg, w�ahrend Fleckvieh (2) und Braunvieh (4) im Bereich unter 5000 kgliegt.
1.6.3 H�au�gkeitsverteilungen
Der Befehl histogram liefert die H�au�gkeitsverteilung eines Merkmals.
MTB > histogram 'ML(kg)'
Bild 1.30 zeigt das von MINITAB erstellte Histogramm.
7000650060005500500045004000
40
30
20
10
0
ML(kg)
Fre
quen
cy
7000650060005500500045004000
40
30
20
10
0
ML(kg)
Fre
quen
cy
Bild 1.30: Histogramm der Milchleistung
Au��allig in Bild 1.30 ist die mehrgip ige Verteilung der Milchleistung. Dies wird jedochverst�andlich, wenn man beachtet, da� sich die Stichprobe aus mehreren Rassen mitunterschiedlicher mittlerer Milchleistung zusammensetzt.
1.6 Beschreibende und explorative Statistik mit MINITAB 65
1.6.4 Stem-and-Leaf-Diagramme
Der Befehl stem-and-leaf erzeugt ein Stem-and-Leaf-Diagramm. Dieses wird nun f�urden Milcheiwei�gehalt erstellt.
MTB > stem-and-leaf 'Eiw(%)'
Stem-and-leaf of Eiw(%) N = 120
Leaf Unit = 0.010
2 30 69
9 31 3559999
17 32 03344589
31 33 11355567777999
60 34 00123334444455566677778889999
60 35 00001122222334444555678
37 36 0001133344556777778
18 37 2336678
11 38 05566799
3 39 56
1 40 1
MINITAB gibt die Meldung Leaf Unit = 0.010 aus. Das bedeutet, da� z.B. die bei-den Werte in der ersten Zeile als 3:06 und 3:09 zu interpretieren sind. In der erstenSpalte werden lediglich die Anzahl der Stichprobenwerte bis zum Median hochgez�ahltund anschlie�end wieder abgez�ahlt. Das Stem-and-Leaf-Diagramm ist recht informativ,da es einerseits die H�au�gkeitsverteilung und andererseits die Stichprobenwerte selbstzeigt.
1.6.5 Letter-Value-Tabellen
Der Befehl lvals erzeugt eine Letter-Value-Tabelle:
MTB > lvals 'Eiw(%)'
DEPTH LOWER UPPER MID SPREAD
N= 120
M 60.5 3.495 3.495
H 30.5 3.390 3.630 3.510 0.240
E 15.5 3.265 3.745 3.505 0.480
D 8.0 3.190 3.860 3.525 0.670
C 4.5 3.150 3.890 3.520 0.740
B 2.5 3.110 3.955 3.533 0.845
A 1.5 3.075 3.985 3.530 0.910
1 3.060 4.010 3.535 0.950
Es werden die Letter-Values mit ihren Tiefen (DEPTH), unteren (LOWER) und oberen(UPPER) Grenzen sowie deren Mitte (MID) ausgegeben. Die Weite (SPREAD) ist die Dif-ferenz zwischen oberem und unterem Letter-Value.
66 1 Beschreibende und explorative Statistik
1.6.6 Box-Plots
Der Befehl boxplot erzeugt einen Box-Plot,
MTB > boxplot 'Eiw(%)'
4.0
3.9
3.8
3.7
3.6
3.5
3.4
3.3
3.2
3.1
3.0
Eiw
(%)
4.0
3.9
3.8
3.7
3.6
3.5
3.4
3.3
3.2
3.1
3.0
Eiw
(%)
Bild 1.31: Boxplot des Eiwei�gehalts
Die Verteilung besitzt rechts au�en einen Anrainer-Wert.
Beim boxplot-Befehl kann man die Merkmale nach Rassen getrennt darstellen.
MTB > boxplot 'ML(kg)'*'Rasse'
Bild 1.32 zeigt die einzelnen Verteilungen der Stichprobenwerte getrennt nach Rassenals Boxplot. Dabei werden die Rassenunterschiede in der Milchleistung deutlich.
4321
7000
6000
5000
4000
Rasse
ML(
kg)
4321
7000
6000
5000
4000
Rasse
ML(
kg)
Bild 1.32: Boxplots der Milchleistung getrennt nach Rassen
1.6 Beschreibende und explorative Statistik mit MINITAB 67
1.6.7 Streudiagramme
Die Analyse des Zusammenhangs zwischen zwei Variablen erfolgt im einfachsten Falldurch eine Auftragung der einen Variablen �uber der anderen. Interessiert z.B. derZusammenhang zwischen Fettertrag in kg und Milchleistung, so kann man f�ur jedeuntersuchte Kuh deren Milchleistung auf der Abszisse und deren Fettmenge auf derOrdinate abtragen. Es entsteht dann eine Punktewolke im Streudiagramm bzw. ScatterPlot (Bild 1.33).
MTB > plot 'Fett(kg)'*'ML(kg)'
7000600050004000
280
230
180
ML(kg)
Fet
t(kg
)
7000600050004000
280
230
180
ML(kg)
Fet
t(kg
)
Bild 1.33: Streudiagramm von Fettmenge und Milchleistung
Es besteht o�ensichtlich ein linearer Zusammenhang zwischen der Fettmenge undMilchleistung. Dies ist einleuchtend, da eine h�ohere Milchmenge nat�urlich auch einenh�oheren Fettertrag zur Folge hat. Dar�uberhinaus wurde der Fettertrag in kg aus demProdukt von Milchleistung und Fettgehalt in % berechnet. Der Zusammenhang istjedoch nicht exakt linear, da durch den unterschiedlichen Fettgehalt der Milch eineStreuung verursacht wird. Au�erdem sind im Streudiagramm von Bild 1.33 auch wie-der die beiden Gruppen der Milchleistungen erkennbar.
1.6.8 Streumatrizen
H�au�g interessiert der Zusammenhang zwischen mehreren Merkmalen. Beispielsweiseist eine Abh�angigkeit zwischen Gewicht, Kreuzh�ohe und Brustumfang wahrscheinlich.Man kann nun jede Variable �uber der anderen in einem Streudiagramm auftragen.Eine Darstellung dieser Diagramme in einem einzigen Bild f�uhrt zur Streumatrix oderScatter Plot-Matrix (Bild 1.34).
Eine Streumatrix wird mit dem Kommando matrixplot erzeugt.
MTB > matrixplot 'Gew(kg)'-'BU(cm)'
68 1 Beschreibende und explorative Statistik
749.75
651.25
150.75
136.25
749.75651.25
200.5
189.5
150.75136.25
200.5189.5
Gew(kg)
KH(cm)
BU(cm)
Bild 1.34: Streumatrix von Gewicht, Kreuzh�ohe und Brustumfang
Links oben steht das Gewicht in kg, d.h. die Abszisse der Einzelbilder in der 1. Spalteund die Ordinate der Einzelbilder in der 1. Zeile der Matrix sind mit dem Gewichtskaliert. Entsprechendes gilt f�ur die Kreuzh�ohe in Spalte und Zeile 2 sowie f�ur denBrustumfang in der 3. Spalte und Zeile.
Ein Zusammenhang ist f�ur alle drei Variablen in Bild 1.34 ersichtlich. Dies ist auchklar, da gr�o�ere Tiere in allen drei Merkmalen h�ohere Werte haben als kleinere.
1.6.9 Korrelationskoe�zienten und Korrelationsmatrix
Das correlate-Kommando berechnet den empirischen Korrelationskoe�zienten zwi-schen zwei Merkmalen.
MTB > correlate 'ML(kg)' 'Fett(kg)'
Correlation of ML(kg) and Fett(kg) = 0.921
Der Korrelationskoe�zient als Ma� f�ur die St�arke des linearen Zusammenhangs zwi-schen Milchleistung und Fettmenge betr�agt also r = 0:921. Dieser relativ hohe Wertbest�atigt die o�ensichtlich enge lineare Beziehung der Werte in Bild 1.33.
Der correlate-Befehl kann auch f�ur die Bestimmung der Korrelationskoe�zientenmehrerer Variablen verwendet werden und liefert dann die Korrelationsmatrix.
1.6
Besch
reibendeundexplorativ
eStatistik
mitMIN
ITAB
69
MTB>correlatec2-c8
ML(kg)
Fett(%)
Eiw(%)Fett(kg)
Gew(kg)
KH(cm)
Fett(%)
-0.276
Eiw(%)
-0.228
-0.133
Fett(kg)
0.921
0.117
-0.286
Gew(kg)
-0.577
-0.150
0.026
-0.661
KH(cm)
-0.721
-0.011
0.094
-0.753
0.857
BU(cm)
-0.535
-0.045
0.131
-0.577
0.838
0.797
Ausdieser
Korrela
tionsm
atrix
istz.B
.ersich
tlich,da�dieMilch
leistungmitder
Fett-
mengein
kghoch
positiv
korreliert
ist,mitdem
Fettg
ehaltin
%jed
och
einenegativ
eKorrela
tionaufweist.
Esist
also
beih� oheren
Milch
mengen
einVerd
� unnungse�
ektim
Fettg
ehalterk
ennbar.Dadie
Fettm
engedasProduktausMilch
leistungundFettg
e-haltist,
wird
dieser
Verd
� unnungse�
ektbeim
Fettg
ehaltdurch
die
hoheMilch
menge
kompensiert.
1.6.10
Balkendiagramme
Balkendiagramme(en
gl.barcharts)
eignen
sichseh
rgutzurDarstellu
ngderH� au�g-
keitsv
erteilungnominaler
Merk
male.
DieAuftra
gungder
nominalen
Merk
malsa
uspr� a-
gungerfo
lgtanderAbszisse.
�Uberderjew
eiligen
Merk
malsa
uspr� agungwird
einBalken
gezeich
net,
dessen
H� oheder
H� au�gkeit
des
entsp
rechenden
Merk
malsentsp
richt.
ZurErstellu
ngein
esBalkendiagrammsin
MINITABdien
tder
Befeh
lchart.
MTB>chart'Rasse'
DieRassen
verteilu
ngder
K� uhe,dieaufSeite
63mitdem
table-Befeh
lerzeu
gtwurde,
zeigtBild
1.35alsBalkendiagramm.Dabeiist
zubeachten
,da�dienominalen
Merk
-maleanderAbszisse
belieb
igverta
usch
twerd
enk� onnen,dasie
nich
tinein
efestg
elegte
Reih
enfolgegebrachtwerd
enk� onnen,wiedasbeiordinalen
Merk
malen
der
Fallist.
43
21
50403020100
Rasse
Number Nonmissing of Rasse
43
21
50403020100
Rasse
Number Nonmissing of Rasse
Bild
1.35:Balkendiagramm
der
Rassen
verteilu
ngvonK� uhen
70 1 Beschreibende und explorative Statistik
1.6.11 Kuchendiagramme
Eine Alternative zu den Balkendiagrammen sind die h�au�g verwendeten Kuchen-
diagramme (engl. pie charts). Der zugeh�orige Wert einer diskreten oder nominalenMerkmalsauspr�agung wird als Segment aus einem Kreis herausgeschnitten. Die Seg-mentgr�o�e ist proportional zur Gr�o�e dieses Werts bzw. der entsprechenden H�au�gkeit.
Kuchendiagramme werden mit dem Makro4 %pie erzeugt. Das entsprechende Kuchen-diagramm zum Balkendiagramm f�ur die Rassenverteilung von Bild 1.35 zeigt Bild 1.36.
MTB > %pie 'Rasse'
1 (40, 33.3%)
4 (10, 8.3%)
3 (20, 16.7%)
2 (50, 41.7%)
Pie Chart of Rasse
Bild 1.36: Kuchendiagramm der Rassenverteilung von K�uhen
4Ein Makro ist eine Folge von Befehlen, die in einer eigenen Datei abgespeichert sind und bei Aufrufdes Makros abgearbeitet werden. In MINITAB haben Makros die Dateierweiterung .MAC. Ihr Aufruferfolgt durch ein vorangestelltes %-Zeichen.
top related