vorlesung biometrie für studierende der veterinärmedizin 03.11.2005 zur kommunikation von...

32
Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich leichter zu erfassen als Wahrscheinlichkeitsaussagen: „An 30 von 100 solchen Tagen wie morgen regnet es“ „Von 100 Männern im Alter von 40, die Nichtraucher sind erleiden 3 in den nächsten 10 Jahren einen Herzinfarkt“ „In einem von 20 Fällen ist meine Prognose falsch“ „10 von 100 Lesern missfällt diese Werbung“ Wahrscheinlichkeiten sind keine relativen Häufigke

Upload: leni-drum

Post on 05-Apr-2015

107 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Zur Kommunikation von Wahrscheinlichkeiten

Relative Häufigkeiten sind grundsätzlich leichter zu erfassenals Wahrscheinlichkeitsaussagen:

• „An 30 von 100 solchen Tagen wie morgen regnet es“

• „Von 100 Männern im Alter von 40, die Nichtraucher sind erleiden 3 in den nächsten 10 Jahren einen Herzinfarkt“

• „In einem von 20 Fällen ist meine Prognose falsch“

• „10 von 100 Lesern missfällt diese Werbung“

Aber: Wahrscheinlichkeiten sind keine relativen Häufigkeiten

Page 2: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Beispiel: Lotto

• Beim Lotto ist die Wahrscheinlichkeit bei einem Spiel einen 6er zu bekommen:

000000071.013983816

1

6

491

• „Einmal in 13 Millionen Spielen“

• „Einmal in 268 000 Jahren“

• „Es ist wahrscheinlicher, den Tag der Ziehung nicht mehr zu erleben, als zu gewinnen“

• Simulationsexperiment

Page 3: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Zur Risikokommunikation

– Absolutes Risiko– Relatives Risiko– Anzahl der zusätzlich geschädigten Individuen

Es gibt drei Arten der Beschreibung von Risikenfür die Gesundheit:

Page 4: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Beispiel 2 : Perinatale Sterblichkeit und Reaktorunfall von Tschernobyl

örblein und Küchenhoff (1997):

• Sterblichkeit 1987 von 0.8% auf 0.836 % erhöht

• Risiko um 4.5 % erhöht (relatives Risiko 1.045)

• ca. 317 zusätzlich verstorbene Kinder in Deutschland

Page 5: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Beispiel 3 : Wirkung von Pravastatin

„ Menschen mit hohem Cholesterinspiegel können das Risiko eines erstmaligem Herzinfarkts sehr schnell um 22 Prozent vermindern, wenn sie einen häufig angewandten Wirkstoff namens Pravastatin einnehmen“

• Reduktion der Todesfälle von 41 auf 32 pro 1000 Patienten mit hohem Cholesterin 4.1% auf 3.2%. Differenz 0.9%.

• Reduktion um 22% (relatives Risiko 0.78) „22% werden gerettet“

• Es müssen 111 Patienten behandelt werden, um ein Menschenleben zu retten

Page 6: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Medizinische Tests

10 Erkrankt

Personen

Gesund

9 Test P 1 Test N 10 Test P 980 Test N

Page 7: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Bedingte Wahrscheinlichkeiten

Beachte: Die Bedingung entspricht der Bezugspopulation:

Sensitivität: 9 von 10 Kranken werden als solche erkannt:P(Test positiv| Patient krank) = 9/10

Spezifität: 980 von 990 Gesunden werden als solche erkannt:P (Test negativ| Patient gesund) = 98/99

Positiver prädiktiver Wert: 9 von 19 Test P sind krank:P (Patient krank|Test positiv) = 9/19

Prävalenz: 1 von 100 Personen ist krank: P (krank) = 1/100

Bezugspopulation von zentraler Bedeutung

Page 8: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Fehlspezifikationswahrscheinlichkeiten

(bedingte) Klassifikationswahrscheinlichkeiten

Diagnose:

Klassifikation

wahrer Status

positiv negativ

positiv

negativ

Sensitivität

Empfindlichkeit

P(T+|K+)

Spezifität

Treffsicherheit

P(T-|K-)

Page 9: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Krankheitswahrscheinlichkeiten im Diagnosetest

In der Praxis interessieren in der Regel die Klassifikationswahrscheinlichkeiten weniger, wohl aber die Frage, ob ein Test-positives Tier wirklich krank ist, d.h. (bedingten) Krankheitswahrscheinlichkeiten

Klassifikation

Test

Wahrheit (goldener Status)

positiv negativ

positiv

negativ

positiver

prädiktiver Wert

P(K+|T+)

negativer

prädiktiver Wert

P(K-|T-)

Page 10: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Beispiel

Wie hoch ist die Wahrscheinlichkeit, dass ein positiv getestetes Tier wirklich krank ist ?

Prädiktiver Wert = ????

• Sensitivität P(T+|K+) = 0.98

• Spezifität P(T-|K-) = 0.95

• Prävalenz P(K+) = 0.2

Page 11: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Lösung durch hypothetische Population

200 krank

800 gesund

196 positiv 4 negativ 40 positiv 760 negativ

Positiver prädiktiver Wert: 83.040196

196

Page 12: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Theorie: Satz von Bayes

)|()()( ABPAPBAP

)(

)()|(

)(

)()|(

BP

APABP

BP

BAPBAP

Def.:

Satz von Bayes:

Multiplikationssatz:

)(

)()|(

BP

BAPBAP

Page 13: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Satz von Bayes: Diagnosetests

)1()1(

)|()()|()(

)|()(

)()(

)()|(

)(

)()|(

)|(

SpezPvSensPv

SensPv

KTPKPKTPKP

KTPKP

KTPKTP

KPKTP

TP

KPKTP

TKP

Kennt man Sensitivität, Spezifität und Prävalenz, so gilt für den positiven prädiktiven Wert

Page 14: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Lösung durch Satz von Bayes

Dann gilt für den positiven prädiktiven Wert

• Sensitivität P(T+|K+) = 0.98

• Spezifität P(T-|K-) = 0.95

• Prävalenz P(K+) = 0.2

040.0196.0

196.0

05.08.098.02.0

98.02.0)|(

TKP

Page 15: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Diagnosetests: Beispiel II

Dann gilt für den positiven prädiktiven Wert

• Sensitivität P(T+|K+) = 0.98

• Spezifität P(T-|K-) = 0.95

• Prävalenz P(K+) = 0.01

18.005.099.001.098.0

01.098.0)|(

TKP

Page 16: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Lösung durch hypothetische Population

100 krank

9 900 gesund

98 positiv 2 negativ 495 positiv 9 405 negativ

Positiver prädiktiver Wert: 18.049598

98

Page 17: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Diagnosetests: Beispiel BSE ???

Dann gilt für den postitiven prädiktiven Wert

P(K+|T+)

Übung

• Sensitivität P(T+|K+) = 0.99 (???)

• Spezifität P(T-|K-) = 0.99 (???)

• Prävalenz P(K+) = 0.001 (???)

Page 18: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Diagnosetests und (kleine) Prävalenzen

Achtung:

Bei der Bewertung von diagnostischen Verfahren, falls die Prävalenz der Erkrankung sehr klein ist (BSE, HIV, …)

• ist die (absolute) Anzahl falsch positiver Diagnosen hoch

• ist der positive prädiktive Wert gering

Wenn die Prävalenz gering ist,

Page 19: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Begriff der Zufallsgröße

Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:

Beispiele: • Punkte beim Werfen zweier Würfel• Zeit beim Warten auf den Bus• Ja= 1 nein = 0

Formal Abbildung:

:X

Im Beispiel:

4)2,2(

3)1,2(

3)2,1(

2)1,1(

Page 20: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Verteilungsfunktion einer Zufallsgröße

Zur Charakterisierung von Zufallsgrößen benutzt

man die Verteilungsfunktion. Sie ist für eine

Zufallsgröße definiert als )()( xXPxF X

36/)321()4(

36/)21()3(

36/1)2(

0)1(

XP

XP

XP

XPIm Beispiel:

Page 21: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Wahrscheinlichkeitsfunktion einer diskreten Zufallsgröße

Zur Charakterisierung von diskreten Zufallsgrößen

benutzt man die Wahrscheinlichkeitsfunktion.

Sie ist definiert als .)()( xXPxf

36/3)4(

36/2)3(

36/1)2(

0)1(

XP

XP

XP

XPIm Beispiel:

Page 22: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Erwartungswert und Varianz diskreter Zufallsgrößen

sei eine diskrete Zufallsgröße mit den möglichen

Werten .

Dann sind der Erwartungswert und die Varianz

wie folgt definiert:

)(

)())(()))((()(

)()(

1

22

1

XVar

xXPXExXEXEXVar

xXPxXE

x

n

iii

n

iii

nxx ,...1

X

)(XE )(XVar

Page 23: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Beispiel: Einfacher Würfel

5.36*6

15*

6

14*

6

13*

6

12*

6

11*

6

1)( XE

7.1

9.2)5.36(*6

1)5.35(*

6

1)5.34(*

6

1

)5.33(*6

1)5.32(*

6

1)5.31(*

6

1)(

222

222

X

XV

Page 24: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Erwartungswert von linear transformierten Zufallsgrößen

Für eine Zufallsvariable gilt (mit beliebigen Konstanten

a und b):

)()(

)()(2 XVarbXbaVar

XEbaXbaE

X

Page 25: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Binomialverteilung: Idee

Frage:

Wenn man aus diesem Bestand zufällig n Tiere auswählt (mit Zurücklegen), wie groß ist die Wahrscheinlichkeit, dass hiervon m Tiere erkrankt sind?

• insgesamt N Tieren

• davon sind M erkrankt

• und (N-M) nicht erkrankt

Betrachtet wird ein Bestand mit

Page 26: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Binomialverteilung: Formal

iX

erkranktnichtTiergezogenestesifalls

erkranktTiergezogenestesifallsX i ,0

,1

n

iiXXmitmXP

1

?,)(Frage:

ist Zufallsvariable mit möglichen Realisierungen

Dann gilt:

PN

MXP i )1(

Page 27: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Binomialverteilung: Definition

mnm PPm

nmXP

)1()(

Die Zufallsvariable der Summe aus n unabhängigen

0-1-Variablen , heißt binomial-verteilt mit

Parametern n und P, kurz X~Bin(n, P)

Es gilt

n

iiXX

1

Page 28: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Binomialkoeffizient: Definition

))(...21()...21(

)...21(

)!(!

!

mnm

n

mnm

n

m

n

Beispiel

Die Größe

1062

120

)321()21(

)5...21(

2

5

heißt Binomialkoeffizient.

Page 29: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Binomialverteilung: Anwendungen

• krank vs. gesund

• schwarzbunt vs. braun

• Niedersachsen vs. Bayern

• Grenzwert überschritten vs. unterschritten

• Versuch war erfolgreich vs. nicht erfolgreich

Die Binomialverteilung kann stets angewendet werden, wenn dichotome bzw. binäre, d.h. nomial skalierte Merkmale mit nur zwei Merkmalsausprägungen vorliegen

Page 30: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Binomialverteilung: Beispiel

Wahrscheinlichkeit für Antibiotika positiv P = 1/10

gezogene Stichprobe n = 5

• Hormonuntersuchung bei Kälbern

0729.0729.001.010)9.0(1.02

5)2(

329.0656.01.05)9.0(1.01

5)1(

591.0591.011)9.0(1.00

5)0(

32

41

50

XP

XP

XP

etc.

Page 31: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Binomialverteilung: Eigenschaften

• Anzahl der erwarteten erkrankten Tiere

E(X) = n P

Beispiel: E(X) = 5 0.1 = 0.5

• Varianz

Var(X) = n P (1-P)

Beispiel: Var(X) = 5 0.1 0.9 = 0.45

Page 32: Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich

Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005

Weitere diskrete Verteilungen

• hypergeometrische Verteilung

wenn die Auswahl ohne Zurücklegen erfolgt und die

Gesamtheiten klein sind

• Poisson-Verteilung

wenn die Ereignisse sehr selten sind