seminarplan stochastik 3 prof. dr. dörte haftendorn, leuphana universität lüneburg, 2015 ...

18
Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de W.-Rechner Folie 1 Das war Stochastik 3 • Normalverteilung, • Standardabweichung, Messwerte • Gaußsches Wurzel(n)-Gesetz, Standardfehler •Irrtumswahrscheinlichkeit,( P- Wert). english translation 4 is another

Upload: falko-abel

Post on 06-Apr-2016

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Seminarplan Stochastik 3

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

W.-Rechner

Folie 1

Das war Stochastik 3• Normalverteilung,• Standardabweichung, Messwerte• Gaußsches Wurzel(n)-Gesetz, Standardfehler•Irrtumswahrscheinlichkeit,( P-Wert).

The english translation 4 is another file.

Page 2: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Seminarplan Stochastik 4

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

W.-Rechner

Folie 2

Überblick über Vorgehensweisen der Stochastik:• Angabe von Messwerten• Gauß-Test mit Messwerten• Regression, Korrelation• Elemente der beschreibenden Statistik,• Weitere Verteilungen, • Empirisches Forschen

The english translation is another file.

Stochastik ist der Oberbegriff von beschreibender und beurteilender Statistikund Wahrscheinlichkeitstheorie

Page 3: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Mathix hat den Eindruck, sein Messgerät zeige zu kleine Werte an. Er betrachtet einen Vorgang, bei dem bekanntermaßen 20 mA mit sigma=1.6 mA gemessen werden. Er misst xi={18,19,17,18} mA . Zeigt sein Messgerät signifikant andere Werte?

Hypothesentest bei Messwerten

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 3

Velangt sind die Elemente der folgenden Seite

Page 4: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Hypothesentest bei Messwerten

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 4

Der Test ist links-einseitig, weil er vor der Messung zu kleine Werte vermutet hat.

Mittelwert

grün:Verteilung der Einzelwerte

Dieser Wert heißt Standardfehler

Ist der Mittelwert in kritischenGebiet muss man H1 annehmen und H0 verwerfen.

Verteilung sol-cher Mittelwerte

Messprotokoll

Beibehaltungsbereich für H0

Ist der Mittelwert im Beibehaltungsbereich von H0, ist nichts bewiesen.

Page 5: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Regression, Ausgleichsgerade

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 5

Gegeben sind Messpunkte. Das Ziel ist, eine beste Gerade durch die Punkt-wolke zu finden. Gezeigt sind in Braun die Fehlerquadrate, auch Residuen-quadrate. In Blau ist deren Summe links gezeigt. Sie muss minimal sein.

Page 6: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Regression, Regeressionsgerade

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 6

in Optimierung S. 208 ffund StochastikS. 259

Es gibt zwei Parameter für die Gerade, m und k. Also ist die Summe der Fehler-quadrate eine Funktion von zwei Variablen, gezeigt als 3D-Raumfläche. Ihr Minimalpunkt (m,k) ist das Ziel.

Oft ist es möglich, eine Ausgleichsgeradenach Augenmaß zu finden.

Andere Regressionskurven sind möglich. In Excel und GeoGebra werden die

Ausgleichskurven Trendlinien genannt.Hiermit kann man exakte Polynome n-Grades durch n+1 Punkte legen.

Page 7: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Regressionsgerade, Ausgleichs-, Trendlinie

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 7Links sind die x- und y-Varianz und die gemischte Varianz zu sehen.

Die Parabeln hier sind die aus der 3D-Sicht, nunaber in derselben Ebene dargestellt.

Page 8: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Regression, Korrelationskoeffizient

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 8r = 0.974 r = 0.674 r = - 0.968

starke Korrelationschwache Korrelation

starke Korrelation

Page 9: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Beschreibende Statistikfalsche Darstellungen

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 9

Arbeitslohn von Männern und Frauen

StochastikS. 258

Bild b) ist falsch, weil die y-Achse bei 1500€beginnt. So werden erscheint das Einkommens-verhältnis kleiner als es in Wahrheit ist.

Bild c) ist falsch, weil man die Größe des Ein-kommens der Frauen nicht erkennen kann. DieseDarstellung wäre allenfalls sinnvoll, wenn es umdas Familieneinkommen bei zwei Verdienernginge.

Page 10: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Beschreibende Statistikfalsche Darstellungen

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 10

Arbeitslohn von Männern und FrauenWerte wie oben

d) Hier ist die dritte Wurzel aus den Werten von a) berechnet. Wenn der Lohn inEuromünzen vorläge, hätten die Würfel exakt. Durch den perspektivischen Effekt, wird die Information verschleiert.Das Bild ist richtig, aber die Nutzer von Excel machendas nicht so.

Bild e) ist falsch, da Excel dazu verleitet, dieLöhne aus a) als Kantenlängen zu nehmen.Die so gezeigten Volumina werden falsch. Überlege: Ein Würfel mit der halben Kanten-länge hat nur ein Achtel das Volumens.

Bild e) ist aus demselben Grund falsch.Für die Ikosaeder ist der Effekt noch deutlicher.

Page 11: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Vierfeldertafeln

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 11

nicht für die

Klausur

Wenn das Verhältnis , dann sind auch die anderen passsenden Verhältnisse fast gleich. Dann sind die Gruppen bezüglich E nicht unterscheidbar.Nullhypothese H0: Die Gruppen bezüglich E nicht unterscheidbar.Forschungshypothese H1: B hat deutlich weiniger E (entspr. oben)

e ea ebn e e

Page 12: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Vierfeldertafeln

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 12

Beispiel A sind die Studis, die die Aufgaben machen, B diejenigen, die die Klausur bestehen.

nicht für die Klausur

Page 13: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Die W. für ein falsch-positves Erg. ist P(K|T+)=591:721=82%. Mathilde wartet mitGelassenheit auf weitere Tests. Oft denkt man nicht an die Prävalenz P(K)=0.0150.

Vierfeldertafeln

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.deFolie 13

Dieses Beispiel hatte ich vorbereitet, musste es dann aber weglassen. Daher ist es nun nicht klausurrelevant.Es ist aber so interessant und wichtig für Lebenspraxis, dass ich es nicht weglassen möchte.

Situation: Mathilde geht zur Vorsorgeuntersuchung. Es geht um eine Krankheit K.Der Test fällt positiv aus, T+. Das heißt aber nicht, dass Mathilde die Krankheit wirklich hat. Wie groß ist die Wahrscheinlichkeit, dass sie trotz T+ gesund ist?

T+ T-K 130 150

n K

10000

Beispiel aus Sachs,Hedderich: Angewandte Statistik, Springer 2006 S. 135

Bekannt ist die Spezifität des Testes, die Wahrscheinlichkeit, dass ein Gesunder doch T- erhält. Das ist P(T-| n K)=94%

Damit kann man in dieser Tabelle alle leeren Plätze füllen. Zuerst den freien Platz rechts 10000-150=9850, dann (n K, T-)=0.94*9850=9259.Der Rest ergibt sich durch Ergänzungen. Dann kann man die Sensitivität des Testes.

T+ T-K 130 20 150

n K 591 9259 9850

721 9279 10000

ausrechnen P(T+| K)=130:150=86,7%, die W., dass ein Kranker T+ bekommt. Mit Sensitivität undSpezifität werden richtige Entscheidungen be-schrieben. Mathilde hofft, in dem Feld mit der 591zu sein, in dem die Gesunden sind, die T+ hatten.

nicht für die Klausur

Page 14: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Datentypen, Merkmalstypen

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 14

• nominal, qualitative Daten

• ordinal, Rangdaten

• metrisch, Maßdaten • Intervalldaten

•Verhältnisdaten

Maßdaten sind diskret oder stetig

Haarfarbe, Religion, Herkunftsland, Familientand..

man kann sie sinnvoll ordnen: Schulnoten, Zustimmumgsgrad , Platzierungen in Wettbewerben, Schwierigkeit von Ski-Abfahrtencreditpoints

Größen ohne natürlichen Nullpunkt, z.B. Temperatur, „doppelt“ geht nicht

Größen mit natürlichem Nullpunkt, die man ins Verhältnis setzen kann.z.B. Masse, Länge, Zeit, , Anzahl Treffer , „doppelt“ ist sinnvoll

Page 15: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Benfordverteilung

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 15

HistorischesIm Jahre 1881 entdeckte der Mathematiker Simon Newcomb, dass die Seiten einer fünfstelligen Logarithmentafel für die kleine führende Ziffernfolgen wesentlich stärker abgegriffen waren als für große.

Newcomb veröffentlichte seine Beobachtung, stellte auch schon eine logarithmische Formel auf, aber seine Arbeit wurde nicht beachtet. Im Jahr 1938 entdeckte der Physiker Frank Benford das Gestetz neu und untermauerte es mit Daten.

Er bewies es aber nicht.

Page 16: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Benfordverteilung

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 16

Erst 1995 deckte der Mathematik Theodore Hill genaueres auf und bewies auch noch weitereZusammenhänge. Diese setzte der Mathematiker Mark Negrini in einem Analyseprogrammum, mit dem man die Echtheit von Daten prüfen kann, die „Benford-verteilt“ sein müssten.Dazu gehören vor allem Daten aus exponentiellen zusammenhängen, aber aggregierte Daten,die selbst nicht benford-verteilt sind, folgen der Benford-Verteilung. Auf diese Weise kann manWirtschafts- und Bankdaten, wissenschaftliche Messdaten u.a. prüfen und Betrug aufdecken.

Page 17: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Seminarplan Stochastik 4

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

www.mathematik-sehen-und-verstehen.de

W.-Rechner

Folie 17

Überblick über Vorgehensweisen der Stochastik:• Angabe von Messwerten• Gauß-Test mit Messwerten• Regression, Korrelation• Elemente der beschreibenden Statistik,• Weitere Verteilungen, • Empirisches ForschenStochastik ist der Oberbegriff von beschreibender und beurteilender Statistikund Wahrscheinlichkeitstheorie

Page 18: Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015  W.-Rechner Folie

Stochastik

Vorlesung in vier Teilen im Rahmen von Mathematik für alle, Leuphanasemester

Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Folie 18

Ich hoffe, es hat Sie bereichert!