betrachtung der realität aus der sicht der statistik variabilitÄt scuola secondaria 1°grado;...
TRANSCRIPT
Betrachtung der Realität aus Betrachtung der Realität aus der Sicht der Statistik der Sicht der Statistik
VARIABILITÄTVARIABILITÄT
Scuola Secondaria 1°grado; Argomento: Leggiamo - Variabilità; (30.09.13); Pacchetto: S1.A.4
Übersetzung: / Tradotto da:
VARIABILITÄT
1) Was ist die VARIABILITÄT?2) Wie misst man die Variabilität?3) Die Variabilität als Distanzmaß4) Die Variabilität als Distanzmaß von
einem Zentrum5) Varianz6) Standardabweichung7) Relative Streuungsmaße
3
Darunter versteht man, dass ein Phänomen bei den einzelnen Erhebungseinheiten der Grundgesamtheit verschiedene Ausprägungen annehmen kann.
Die Variabilität ist umso größer, je größer die Unterschiede zwischen den einzelnen Fällen sind.
Die Lagemaße wie Mittelwert, Median oder Modus geben keine Auskunft darüber, wie die Einheiten dazu tendieren, unterschiedliche Werte anzunehmen.
Was ist die VARIABILITÄT?
4
Reicht der Mittelwert, um die Daten darzustellen?
Semesterende – um die schulischen Leistungen einzuschätzen, berechnen wir den Mittelwert der Noten in Mathematik. Das sind die Noten, die drei Schüler bekommen haben:
MARCO 6 5 6 7 MITTELWERT=6LUCA 6 6 6 6 MITTELWERT=6LUIGI 4 4 8 8 MITTELWERT=6
Die Schüler haben den gleichen Durchschnitt, aber die Noten sind sehr… UNTERSCHIEDLICH
5
Wie misst man die Variabilität?
Der Mittelwert sagt nichts über die Variabilität der Daten aus. Dazu müssen wir ein STREUUNGSMASS verwenden.
Nehmen wir an, dass jede Kugel eine Erhebungseinheit ist…
6
Die Variabilität als Distanzmaß
Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen zunimmt.
Das ist das einfachste Maß, da es nur die Positionen von zwei Erhebungseinheiten berücksichtigt. Sie ist die Differenz zwischen dem beobachteten Maximum und Minimum.
SPANNWEITE=MAX-min
7
Welcher unserer Schüler hat die größte Variabilität?
Wir berechnen die SPANNWEITE, indem wir das Maximum heranziehen und das Minimum davon abziehen.
MARCO 6 5 6 7 SPANNWEITE=7-5=2LUCA 6 6 6 6 SPANNWEITE=6-6=0LUIGI 4 4 8 8 SPANNWEITE=8-4=4
Luigi hat die unterschiedlichsten Noten, während Lucas Noten überhaupt nicht variieren.
8
Die SPANNWEITE ist ein unmittelbares Maß, aber…
…es ist sensibel: es berücksichtigt nur die Extremwerte, die durch außergewöhnliche und unnormale Werte beeinflusst sein können, während alle anderen beobachteten Werte außer Acht gelassen werden.
Ein besser geeignetes Maß muss ALLE ERHEBUNGSEINHEITEN BERÜCKSICHTIGEN!
Aber alle möglichen Unterschiede zwischen allen Erhebungseinheiten zu berücksichtigen ist zu aufwändig! Eine Lösung ist…
9
Die Variabilität als Distanzmaß von einem Zentrum
Ein besser geeignetes Streuungsmaß muss also als Distanzmaß jeder Beobachtung vom Mittelwert der Daten funktionieren.
Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen und dem Zentrum der Beobachtungen steigt.
10
Lasst uns versuchen, ein Streuungsmaß zu erstellen!
Um die Distanz jeder Beobachtung vom Mittelwert zu messen, können wir die Operation Differenz verwenden!
Wir definieren unsere DatenX ist das beobachtete Phänomen (statistische Variable)x1,x2,x3,…,xi,…,xn sind die beobachteten Werte der n Erhebungseinheiten
x1 x2
x3
x4x6
x5x7
x8
x8M
ist der arithmetische Mittelwert von n beobachteten Werten
Abweichungen oder Differenzen vom Mittelwert
Mit welcher mathematischen Formel kann ich die Distanz zwischen zwei beobachteten Werten messen? Mit der Differenz!
Wenn wir alle Differenzen (auch ABWEICHUNGEN genannt) nehmen und die Summe bilden erhalten wir jedoch…
0)(...)( 21 MxMxMx n
Der arithmetische Mittelwert ist der Punkt, an dem die Daten im Gleichgewicht sind. Der Mittelwert gleicht die niedrigsten und die höchsten Werte aus und genau deshalb ist die Summe der Abweichungen vom Mittelwert gleich NULL.
Die kleinsten Quadrate!!!
Von den verschiedenen Eigenschaften des arithmetischen Mittelwerts könnten wir jene der kleinsten Quadrate nutzen. Diese besagt, dass
die Summe der Quadrate der Abweichungen vom arithmetischen Mittelwertdas Minimum der Summe der Abweichungen von jedem anderen Wert ist.
min)(...)( 222
21 MxMxMx n
Die Summe der Quadrate der Abweichungen…
ist immer größer als null
ist nur dann gleich null, wenn die Variable nicht variiert
steigt mit der Zunahme der Dispersion der Beobachtungen
vom Mittelwert
steigt auch mit der Zunahme der Anzahl der Beobachtungen
(n)
wird als Quadrat der Maßeinheit der Variablen ausgedrückt
222
21 )(...)( MxMxMx n
14
Varianz
Teilt man die Summe der Abweichungen zum Quadrat durch n, um die Auswirkung aufgrund der Anzahl der Beobachtungen auszuschalten,
erhält man die VARIANZ. Sie wird allgemein mit („Sigma hoch 2“) angegeben.
Um ein Streuungsmaß in derselben Maßeinheit der beobachteten Daten zu erhalten, müssen wir die Quadratwurzel der Varianz ziehen!
222
22
1 )(...)(
n
MxMxMx n
Die Varianz wird als Quadrat der Maßeinheit der beobachteten Variablen ausgedrückt. Ihr Wert ist also nicht unmittelbar verständlich.Häufiger wird die Standardabweichung verwendet.Eigenschaften:
Gleiche Maßeinheit wie beim Merkmal Definiert die durchschnittliche Distanz der Beobachtungen vom arithmetischen Mittelwert
Bei n Beobachtungen x1,x2,…,xn lautet die Formel
Standardabweichung
n
MxMxMx n22
22
1 )(...)(
Wir rechnen mit Marcos Noten
Noten von MARCO
Abweichun-gen vom
Mittelwert
Quadrate der Abweichun-
gen
6 (6-6)=0 05 (5-6)=-1 16 (6-6)=0 07 (7-6)=1 1
Insgesamt 24 0 2Varianz 0,5Standard-abweichung 0,71
Im Falle von Daten in einer REIHE
Und jetzt auch für Luca und Luigi!
Noten von LUCA
Abwei-chungen
vom Mittelwert
Quadrate der
Abwei-chungen
Noten von LUIGI
Abwei-chungen
vom Mittelwert
Quadrate der
Abwei-chungen
6 0 0 4 (4-6)=-2 46 0 0 4 (4-6)=-2 46 0 0 8 (8-6)=2 46 0 0 8 (8-6)=2 4
24 0 0 24 0 16Varianz 0 Varianz 4Standard-abweichung 0
Standard-abweichung 2
Luigis Noten sind am unterschiedlichsten – wir bestätigen das, was wir bereits mit der SPANNWEITE erkannt haben!
Wenn die Daten in einer Häufigkeitstabelle zusammengefasst sind, wird jede Abweichung mit der entsprechenden absoluten Häufigkeit gewichtet.
Standardabweichung
n
nMxnMxnMx kk
22
221
21 )(...)(
Wir erstellen eine Häufigkeitstabelle mit den Daten der drei Schüler und berechnen den Mittelwert und die Standardabweichung. Insgesamt haben wir n=12 Beobachtungen.
19
Üben wir mit Daten in der Tabelle!
22,1
12
18)(...)( 22
221
21
n
nMxnMxnMx kk
Sie messen die Variabilität eines Phänomens, einer Variablen, einer Verteilung.
Man unterscheidet zwischen:
absoluten Maßen, die in derselben Maßeinheit ausgedrückt werden wie das untersuchte Phänomen:
Spannweite Standardabweichung …
• relativen Maßen, die unabhängig von der Maßeinheit sind und sich deshalb dazu eignen, unterschiedliche Phänomene zu vergleichen. Man erhält sie, indem man ein absolutes Maß mit einem Mittelwert oder mit dem Maximum in Beziehung setzt.
Streuungsmaße
Relative Streuungsmaße
Sie erlauben Vergleiche der Variabilität von Verteilungen, die mit unterschiedlichen Maßeinheiten dargestellt werden (z.B. Gewicht und Größe)
von Verteilungen, die mit derselben Maßeinheit dargestellt werden, aber von der unterschiedlichen Intensität desselben Phänomens beeinflusst werden (z.B. Gewicht der Neugeborenen und Gewicht der Mütter).
Das bekannteste Streuungsmaß ist der Variationskoeffizient.
100M
22
Sein Bruder besucht die Universität und hat im letzten Semester die folgenden Noten (in Dreißigsteln) bekommen.
Marco vergleicht sich mit seinem Bruder!
Noten von Marcos Bruder
Abweichungen vom
Mittelwert
Quadrate der Abweichungen
25 (25-22)=3 9
20 (20-22)=-2 4
22 (22-22)=0 0
21 (21-22)=-1 1
88 0 14
23
Wer weist die größere Variabilität auf?
Fassen wir alles in einer Tabelle zusammen!
Die größere Variabilität hat derjenige, der den höheren Variationskoeffizienten hat: Marco!
Versuchen wir es nun mit realen Daten!
Quelle: Ministero di agricoltura, industria e commercio (fino al 1923); Istituto di economia e statistica agraria (anni 1924-1926); Istat, Stima delle superfici e produzioni delle coltivazioni agrarie, floricole e delle piante intere da vaso (dal 1927)
Produktion einiger Getreidearten - Jahre 1921-2011 (Zentner je Hektar)
Welche der drei Getreideproduktionen (Weizen, Reis oder Mais) ist am variabelsten?
Die Produktion von Mais hat die größte Spannweite. Die Produktion von Weizen hingegen schwankt am wenigsten!
……und jetzt…und jetzt…Gute Arbeit!Gute Arbeit!
Rete per la promozione della cultura statistica
Übersetzung: / Tradotto da: