1
MethodenNormalverteilungIntelligenzSkalentypenKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
www.hans.strasburger.de
2
VorbemerkungDie Folien enthalten weitgehend vollständig den gesamten GK-Stoff zur Methodik im Rahmen der Medizinischen Psychologie/Medizinischen Soziologie und dienen der Vorbereitungauf das Physikum.
Die Beispiele stammen nicht aus der Methodik, aber aus dem GK.
Korrekturen, Hinweise, Ergänzungen, Fragen gerne an mich schicken:[email protected]
3
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
4
NormalverteilungCarl-Friedrich Gauß
1777-1855
5
Normalverteilung
-3 -2 -1 0 1 2 3
y = ex2
x
MittelwertMittelwertStandardabweichungStandardabweichung
1/1/ee≈≈40%40%34%34%
FlFlääche=Hche=Hääufigkeitufigkeit!!
HHää u
figke
itsuf
igke
its-- D
icht
eD
icht
e=
H=
Hää u
figke
it pr
o x
ufig
keit
pro
x --In
terv
all
Inte
rval
l
1/e1/e²²≈≈14%14%
221xey
0,4
Wendepunkt
6
Statistische Grundbegriffe
n
i nx1
Mittel arithm. 2/Median nx„„Zentrale TendenzZentrale Tendenz““::
Unterschied Grundgesamtheit Unterschied Grundgesamtheit StichprobeStichprobe
VarianzVarianz = mittlere quadratische Abweichung vom Mittelwert:= mittlere quadratische Abweichung vom Mittelwert:
StandardabweichungStandardabweichung = Wurzel aus der Varianz= Wurzel aus der Varianz (( Kennzeichnung)Kennzeichnung)
StandardfehlerStandardfehler = Standardabweichung / Wurzel aus n= Standardabweichung / Wurzel aus n (( Mittelwerte)Mittelwerte)
KonfidenzintervallKonfidenzintervall = 1,96 = 1,96 ×× StandardfehlerStandardfehler
n
i nxxVarianz1
2)(
7
00
1
Normalverteilung: 95%
1.961.96
-3 -2 -1 0 1 2 3
y = ex2
x
HHää u
figke
itsuf
igke
its--
Dic
hte
Dic
hte
221 xey
0,4
Verteilung der Mittelwerte
8
HHää u
figke
itsuf
igke
its--
Dic
hte
Dic
hte
Standardfehler = Standardfehler = std. std. errorerror of of thethe meanmean (SEM)(SEM)
signifikantsignifikantbeibei 1,96 SEM1,96 SEM
n/
Brauchen wir fBrauchen wir füür Unterschied Streuung r Unterschied Streuung StandardfehlerStandardfehler
Grundlage fGrundlage füür r InferenzInferenz--StatistikStatistik
d.h. nicht-zufällig
= statistischbedeutsam
(GK 1.3.8)
9
eduVoteausprobieren
Zu schnell? Zu langsam?
A Zu schnellB Tempo richtigC Zu langsam
00,20,40,60,81
A B C
10
Anwendung der Normalverteilung:
SkalentypenIntelligenzmessung
11
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
12
99,999,997,897,8
..AbwStdMittelwertWertz
13
Multiple-Choice Frage
In einer neurologischen Klinik werden die neuropsychologischen Testergebnisse in Form von Prozentrangwerten aufgezeichnet. Patient A. wurde in einem Gedächnistest zum Aufnahmezeitpunkt ein Prozentrangwert von 25 zugeordnet. Bei der Entlassung wurde ein Prozentrang von PR=50 ermittelt.Bei der Entlassung …
A entspricht die Gedächtnisleistung dem Durchschnitt der ReferenzgruppeB entspricht die Gedächtnisleistung etwa 50% gelöster ItemsC hat sich die Gedächtnisleistung signifikant verbessertD hat sich die Gedächtnisleistung verdoppeltE hat die Gedächtnisleistung um 25% zugenommen.
14
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
15
•Intelligenz ist ein Konstrukt, das die Fähigkeit eines Menschen beschreibt, sich flexibel auf wechselnde Umweltanforderungen undProbleme einzustellen und diese effektiv (d.h. mit minimalem kognitiven Aufwand) zu bewältigen.
•Maß für Intelligenz: Intelligenzquotient IQ
Stern (1912):rLebensalte
zalterIntelligenIQ
Wechsler (1932): Abweichungs-IQ:Intelligenz bezüglich der Altersgruppe normiert (Mittelwert = 100; Standardabw. = 15)
Beispiel:Beispiel: = = 120%120%Leistung eines 12Leistung eines 12--JJäährigenhrigenAlter 10 JahreAlter 10 Jahre
Problem: ?Problem: funktioniert nicht im Erwachsenenalter
Binet (1905): Intelligenzalter
16
IQ im HAWIE / HAWIK
Mittelwert = 100 gesetztMittelwert = 100 gesetzt
Standardabweichung Standardabweichung = 15 gesetzt= 15 gesetzt
55 70 85 100 115 130 1450,0
0,5
1,0
Häuf
igke
itHH
ää ufig
keits
ufig
keits
--D
icht
eD
icht
e
17
heute aktuelle
Intelligenztheorien... bauen alle auf Faktorenanalyse auf ... bauen alle auf Faktorenanalyse auf ……
kommen wir drauf zurkommen wir drauf zurüück.ck.
18
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
19
Korrelation
n
ii nyyxxr1
21))(( PearsonPearson‘‘ss r:r:
In welchem Bereich liegt In welchem Bereich liegt r?r? ––1 1 r r +1+1
r r ≈≈ 11 r r ≈≈ 0,50,5 r r ≈≈ 00 r r ≈≈ –– 0,50,5
(r(r²² = erkl= erkläärte Varianz in %, anschauliches Marte Varianz in %, anschauliches Maßß))
Steigung sagt nix aus, nur wieweit Punkte von der Geraden weg liSteigung sagt nix aus, nur wieweit Punkte von der Geraden weg liegenegen
r r ≈≈ –– 11
20
Beispiele zum Determinationskoeffizient r²
Kurzsichtigkeit korreliert mit IntelligenzKurzsichtigkeit korreliert mit Intelligenz
Abitursnote korreliert mit Abitursnote korreliert mit Erfolg im MedizinstudiumErfolg im Medizinstudium
r=0,1r=0,1
r=0,4r=0,4
rr²²=1%=1%
rr²²=16%=16%
r² ist die erklärte Varianz … anschauliches Maß, Beispiel für ein
Maß der Effektstärke und inhaltlichen Bedeutsamkeit (GK 1.3.7)
unerklunerkläärterte VarianzVarianz: 1: 1––rr²²=84%=84%
(r lässt sich aber auch direkt interpretieren: Als Reduktion des Klassifikationsfehlers. Z.B.: Klassifikation zugelassen/abgelehnt hat Zufallsfehler von 50%.r=0,4 reduziert ihn um 40% (von 50%) auf 30%)
21
Korrelation
22
Beispiel: Yerkes-Dodson-Gesetz
Die Beziehung zwischen der Leistung bei einer Aufgabe und dem optimalen Erregungsniveau
Was steht an den Achsen?
Yerkes & Dodson (1908)
23
Beispiel: Yerkes-Dodson-Gesetz (1908)
Yerkes & Dodson (1908)
Die Beziehung zwischen der Leistung bei einer Aufgabe und dem optimalen Erregungsniveau
ARASARAS
kogn
itive
kogn
itive
Leis
tung
Leis
tung
oder Stresslevel
24
Beispiel: Yerkes-Dodson-Gesetz
Yerkes & Dodson (1908), aus Zimbardo et al. 2004
Die Beziehung zwischen der Leistung bei einer Aufgabe und dem optimalen Erregungsniveau
25
Korrelation,Beispiel
normalerweise normalerweise nichtnichtdurch Ursprungdurch Ursprung!! x
y
±±Std.AbwStd.Abw
26
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientFaktorenKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
27
Regression (von x auf y)rote Linie: erklärte Varianz
gepunktete Abweichungen von roter Linie: Restvarianz
Gesamt-varianz
Restvarianz
28
Faktorenanalyse
Faktor 1 erklFaktor 1 erkläärt rt viel Varianzviel Varianz
Faktor 2Faktor 2
Die Faktorenanalyse ist ein mathematischDie Faktorenanalyse ist ein mathematisch--statistisches statistisches Verfahren, um auf der Basis der Korrelationsstruktur neue, Verfahren, um auf der Basis der Korrelationsstruktur neue, erklerkläärende Variablen (Faktoren) zu findenrende Variablen (Faktoren) zu finden
Gesamtvarianz = erklGesamtvarianz = erkläärte + unerklrte + unerkläärte Varianzrte Varianz
29
heute aktuelle
Intelligenztheorien
SpearmanSpearman (1904)(1904): Generalfaktortheorie : Generalfaktortheorie (g)(g)(HAWIE hat 11 Untertests)(HAWIE hat 11 Untertests)
ThurstoneThurstone (1931)(1931): 7: 7--Faktorentheorie Faktorentheorie Sprachverständnis, Wortflüssigkeit, Rechengewandtheit, räumliches Denken, Auffassungsgeschwindigkeit, Merkfähigkeit, schlussfolgerndes Denken
CattellCattell (1963)(1963): : kristalline/fluidekristalline/fluide IntelligenzIntelligenz
GuilfordGuilford (1956)(1956): Intelligenzstrukturmodell: Intelligenzstrukturmodell
... bauen alle auf Faktorenanalyse auf... bauen alle auf Faktorenanalyse auf
30
Einige verbale Intelligenzdefinitionen (aus Rost 2009)
▶▶ Allgemeine FAllgemeine Fäähigkeit eines Individuums, sein Denken bewusst auf neue higkeit eines Individuums, sein Denken bewusst auf neue ForFor--derungenderungen einzustellen; sie ist die allgemeine geistige Anpassungsfeinzustellen; sie ist die allgemeine geistige Anpassungsfäähigkeit an neue higkeit an neue Aufgaben und Bedingungen des Lebens bzw. FAufgaben und Bedingungen des Lebens bzw. Fäähigkeit, sich unter zweckmhigkeit, sich unter zweckmäßäßiger iger VerfVerfüügung gung üüber Denkmittel auf neue Forderungen einzustellen (W. Stern, 1912ber Denkmittel auf neue Forderungen einzustellen (W. Stern, 1912).).
▶▶ Was ein Intelligenztest misst (Boring, 1923).Was ein Intelligenztest misst (Boring, 1923).
▶▶ Zusammengefasste oder globale KapazitZusammengefasste oder globale Kapazitäät des Individuums, zweckvoll zu t des Individuums, zweckvoll zu handeln, rational zu denken und sich effektiv mit seiner Umwelt handeln, rational zu denken und sich effektiv mit seiner Umwelt auseinanderzuauseinanderzu--setzensetzen (Wechsler, 1944).(Wechsler, 1944).
▶▶ Sehr allgemeines geistiges Potential, das u. a. die FSehr allgemeines geistiges Potential, das u. a. die Fäähigkeit zum higkeit zum schlussfolschlussfol--gerndengernden Denken, zum Planen, zur ProblemlDenken, zum Planen, zur Problemlöösung, zum abstrakten Denken, zum sung, zum abstrakten Denken, zum VerstVerstäändnis komplexer Ideen, zum schnellen Lernen und zum Lernen aus Endnis komplexer Ideen, zum schnellen Lernen und zum Lernen aus Erfahrung rfahrung umfasst. Es ist nicht reines Bumfasst. Es ist nicht reines Büücherwissen, cherwissen, keinekeine enge akademische enge akademische SpezialSpezial--begabungbegabung, keine , keine TesterfahrungTesterfahrung. Vielmehr reflektiert Intelligenz ein breites und . Vielmehr reflektiert Intelligenz ein breites und tieferes Vermtieferes Vermöögen, unsere Umwelt zu verstehen, gen, unsere Umwelt zu verstehen, „„zu kapierenzu kapieren““, , „„Sinn in Dingen zu Sinn in Dingen zu erkennenerkennen““ oder oder „„herauszubekommen, was zu tun istherauszubekommen, was zu tun ist““. (. („„ErklErkläärung zur rung zur MehrheitsMehrheits--meinungmeinung““ von 52 fvon 52 füührenden Intelligenzforschern, 1994)hrenden Intelligenzforschern, 1994)
31
Anderes Beispiel für Faktoren:
Big Five
aus der Persönlichkeitstheorie:
Verträglichkeit
Offenheit für Erfahrungen
Gewissenhaftigkeit
Extraversion
Labilität/Stabilität = Neurotizismus
32
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientFaktorenKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
33
Beispiele zu Korrelation / Kausalität
•• In Taiwan korreliert der Gebrauch von In Taiwan korreliert der Gebrauch von VerhVerhüütungsmitteln positiv mit der Zahl elektrischer tungsmitteln positiv mit der Zahl elektrischer HaushaltsgerHaushaltsgeräätete
•• Die AuftretenshDie Auftretenshääufigkeit von Stufigkeit von Stöörchen korreliert rchen korreliert positiv mit der Zahl der Geburtenpositiv mit der Zahl der Geburten
•• Die von Schulkindern vor dem Fernseher verbrachte Die von Schulkindern vor dem Fernseher verbrachte Zeit korreliert negativ mit den Leistungen in Lesen Zeit korreliert negativ mit den Leistungen in Lesen und Mathematikund Mathematik
•• Kurzsichtigkeit korreliert mit IntelligenzKurzsichtigkeit korreliert mit Intelligenz
34
Vermittelnde Variablen
•• intervenierende Variableintervenierende Variable
•• StStöörvariablervariable
•• konfundierendekonfundierende VariableVariable
•• MediatorvariableMediatorvariable
•• ModeratorvariableModeratorvariable
Baron & Kenny (1986)“…we differentiate between two often-confused functions of third variables: (a) the moderator function of third variables, which partitions a focal independent variable into subgroups that establish its domains of maximal effectiveness in regard to a given dependent variable, and (b) the mediator function of a third variable, which represents the generative mechanism through which the focal independent variable is able to influence the dependent variable of interest.”
35
Mediator- vs. Moderatorvariable(a) the moderator function of third variables, which partitions a focal independent variable into subgroups that establish its domains of maximal effectiveness in regard to a given dependent variable …
… die Moderatorfunktion von dritten Variablen, die eine unabhängige Variable in Untergruppen aufteilt, die ihrerseits größtmögliche Wirkung auf die abhängige Variable haben.
zur ModeratorvariablenFarbe = Moderatorvariable
R2 = 0
00.5
11.5
22.5
33.5
4
0 2 4 6 8 10
X
Y
Gruppe A
Gruppe B
beide
Linear (
36
Mediator- vs. Moderatorvariable(b) the mediator function of a third variable, which represents the generative mechanism through which the focal independent variable is able to influence the dependent variable of interest.”
Y ist die Mediator-Variable zwischen
X und Z
y = 0.481x + 0.4582R2 = 0.9488
0
2
4
6
8
10
0 2 4 6 8 10
X
Y
y = -2x + 10R2 = 1
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
Y
Z
y = -0.9619x + 9.0836R2 = 0.9488
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
X
Z
rxy ryz = rxz
Die Unterscheidung von M. & M. ist aber oft nicht klar
37
Kausalität und Korrelation
KausalzusammenhangKausalzusammenhang
korrelativerkorrelativer ZusammenhangZusammenhang
Schluss Schluss immer immer
mmööglichglich
Schluss nur Schluss nur durch durch ExperimentExperiment
38
Kausalität kann nur im Experiment nachgewiesen werden, nicht in anderen Studendesigns. Deshalb jetzt einiges zum Thema
Experiment und Studiendesigns
39
Experiment
• Kriterien (Wilhelm Wundt):– Willkürlichkeit: Jederzeit auslösbar– Variierbarkeit: Vorhandensein von unabhängigen
Variablen– Wiederholbarkeit: Wiederholung unter gleicher
Bedingung --> vergleichbare Resultat
• Prüft Ursache-Folge-Beziehung (Kausalzusammenhang)
• Nachteil: Künstliche Bedingungen (alltagsfern)
40
Andere Studiendesigns
• Korrelative Studie • Felduntersuchung
(im „normalen Leben“); Unkontrollierbarkeit der unabhängigen Variablen, Störvariablen
• Längsschnittstudie:mehrmalige Untersuchung einer Person in bestimmten Abständen
• Querschnittsstudie:Untersuchung zu einem Zeitpunkt mit Personen verschiedener Altersgruppe
41
Andere Studiendesigns
• Kohortenstudie (Kohorte = bestimmtes biographisches Ereignis ~ zum selben Zeitpunkt, z.B. Geburtskohorte)
• Fall-Kontroll-Studie (retrospektive Untersuchung einer Gruppe Erkrankter (=Fälle), mit parallelisierter Stichprobe Gesunder)(d.h. der Krankheitsstatus ist bekannt und die Exposition unbekannt.)
• Einzelfallstudie• Evaluationsstudie
42
Andere Studiendesigns
• Blindstudie: Vpn nicht aufgeklärt• Doppelblindstudie: Vpn und Versuchsleiter nicht
aufgeklärt (Ziel ist Vermeidung des Rosenthal-Effekts)
43
Beobachtungs- und Beurteilungsfehler
Es sind 11Es sind 11
RosenthaleffektSelbst-erfüllende ProphezeiungHaloeffektLogischer FehlerKontrastfehlerStrenge-/MildefehlerProjektionHawthorne-EffektJa-Sage-TendenzSoziale ErwünschtheitSuggestionTendenz zur Mitte
44
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
45
Begriff stammt aus der Messtheorie; hat nichts mit der GBegriff stammt aus der Messtheorie; hat nichts mit der Güüte einer te einer Skala zu tun, sondern damit, welche Rechenoperationen Skala zu tun, sondern damit, welche Rechenoperationen „„erlaubterlaubt““–– d.h. d.h. sinnvollsinnvoll sind.sind.
Messen = Zuordnung von Messen = Zuordnung von a) Zahlen zu Merkmalen unda) Zahlen zu Merkmalen undb) b) RelationenRelationen zwischen Zahlen zu zwischen Zahlen zu RelationenRelationen zwischen Merkmalen.zwischen Merkmalen.
Zuordnung muss eineindeutig sein (Zuordnung muss eineindeutig sein („„1 zu 11 zu 1““))
Relationen mRelationen müüssen im Merkmalsbereich gelten.ssen im Merkmalsbereich gelten.
BeipielBeipiel: Bei einer Ordinalskala gilt die : Bei einer Ordinalskala gilt die OrdnungsrelationOrdnungsrelation im im Zahlenbereich und MerkmalsbereichZahlenbereich und Merkmalsbereich::wenn wenn a<ba<b und und b<cb<c, dann , dann a<ca<c ((„„ZahlenraupeZahlenraupe““))
Beispiel Hausnummern: Ordnungsrelation gilt im Merkmalsbereich Beispiel Hausnummern: Ordnungsrelation gilt im Merkmalsbereich nicht.nicht.
Skalenniveaus
46
•• NominalskalaNominalskala
•• OrdinalskalaOrdinalskala
•• IntervallskalaIntervallskala
•• VerhVerhäältnisskalaltnisskala
••
Eigentlich keine SkalaEigentlich keine SkalaBsp.: Bsp.: mmäännl./weiblnnl./weibl..
••
Ordnung Ordnung angebbarangebbarBsp.: Schulnoten, Rangfolge Marathon, Bsp.: Schulnoten, Rangfolge Marathon, LikertLikert--SkalenSkalen
••
Definierte Intervalle. Z.B. 6 Definierte Intervalle. Z.B. 6 –– 4 = 3 4 = 3 –– 11Bsp.: Celsius, IQBsp.: Celsius, IQ
••
Definierte VerhDefinierte Verhäältnisse. Z.B. 6/3 = 4/2ltnisse. Z.B. 6/3 = 4/2Es gibt einen sinnvollenEs gibt einen sinnvollen absoluten Nullpunkt absoluten Nullpunkt undund ProportionalitProportionalitäät t zw. Mazw. Maßß und und GemessenemGemessenemBsp.: Temperatur in Kelvin, LBsp.: Temperatur in Kelvin, Läänge, Blutdruck?nge, Blutdruck?
Skalenniveaus
47
Skalenniveaus
Nominal-skala
Ordinal-skala
Intervall-skala
Verhältnis-skala
definierte Relationen
= zusätzlich
zusätzlich+ –
zusätzlich* /
zuläss. Transfor-mationen
jede eindeutige nurjede monotone
nurx bx + a
nurx bx
Interpre-tationen
gleich / ungleich kleiner / größer
Differenzen haben Sinn
Brüche haben Sinn
Beispiele HausnummernModalwert
WindstärkeMedian
IQarithm.Mittel
Körpergrößearithm.+geom.
Mittel
48
Beispiel: Fechnerskala
Fechner (1860) postulierte, dass der Zuwachs der Fechner (1860) postulierte, dass der Zuwachs der EmpfindungsstEmpfindungsstäärke der (von Weber gefundenen) rke der (von Weber gefundenen) Unterschiedsschwelle entspricht.Unterschiedsschwelle entspricht.
Daraus ergibt sich ein logarithmischer Daraus ergibt sich ein logarithmischer Zusammenhang, die sogenannte FechnerZusammenhang, die sogenannte Fechner--SkalaSkala
Sie wird heute z.B. zur LautstSie wird heute z.B. zur Lautstäärkemessung in dB rkemessung in dB benutzt.benutzt.
49
0
2
4
6(S
ubje
ktiv
e W
ert e
)Em
pfin
dun g
sstä
rke
E
0 10 20 30 40 50 60Just noticeable differences (JND)
(physikalische Werte)
Fechner Skala
S / S = const.
S
( = Weber'sches Gesetz)
S
S
S
S
S
E = log S
Beispiel: Fechnerskala (z. B. Lautstärke)
50
Beispiel: Lautstärke
Schalldruck in dB: logarithmisch.Schalldruck in dB: logarithmisch.Phon: zusPhon: zusäätzlich mit Htzlich mit Höörkurven gewichtetrkurven gewichtet
51
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
52
Gerechtigkeit
Wie beurteilt man einen Test?
53
Testgütekriterien
Wie heißen die drei wichtigsten Testgütekriterien?
Objektivität
Reliabilität
Validität
Unabhängigkeit vom Untersucher
Gültigkeit
Zuverlässigkeit (egal was man misst)
54
Testgütekriterien, Definition
Objektivität bezeichnet die Unabhängigkeit des Messergebnisses vom Untersucher. Man unterscheidet Durchführungs-, Auswertungs- und Interpretationsobjektivität.
Reliabilität bezeichnet die Zuverlässigkeit einer Messung. Man kennt z.B. Re-Test-, Parallel-Test- und Split-half-Reliabilität.
Validität bezeichnet die Gültigkeit eines Messverfahrens:Misst der Test das, was er vorgibt zu messen?
Man unterscheidet z.B. Inhalts-, Kriteriums-, Vorhersage- undKonstruktvalidität (faktorielle, konvergente, diskriminante Val.).
55
Wie gut können die Gütekriterien sein?
Validität Reliabilität Objektivität
Entscheidend ist die Validität!
ValiditätReliabilität
Objektivität
Korrelationskoeffizient0 1
56
Wie gut können die Gütekriterien sein?
Verbessern der Objektivität und Reliabilität verbessert nicht die Validität.
ValiditätReliabilität
Objektivität
(Korrelationskoeffizient)0 1
ValiditätReliabilität
Objektivität
(Korrelationskoeffizient)0 1
vorhervorher
nachher?nachher?
57
MC-Frage
Das Testgütekriterium Reliabilität beschreibt• (A) das Ausmaß, in dem ein Test das erfasst, was er auch
tatsächlich messen soll. • (B) Den Grad der Genauigkeit, mit dem ein Test ein
Merkmal misst.• (C) Die Übereinstimmung der Testergebnisse mit einem
Außenkriterium• (D) Die Unabhängigkeit der Testbogenergebnisse vom
Untersucher• (E) Ob ein Test in angemessener Zeit durchzuführen ist.
58
Noch zwei TestgütekriterienSensitivität: Spricht der Test an, wenn die Krankheit vorliegt?
Spezifität: Spricht der Test nicht an, wenn die Krankheit nicht vorliegt?
Typische Denkfehler:
• Bei positivem Aids-Test und Testsensitivität von 98% habe ich mit 98% Wahrscheinlichkeit Aids (P).
(Man muss Sensitivität, Spezifität, und Prävalenz kennen!)
)Spezifität–(1 Prävalenz)–(1 ät SensitivitPrävalenztät Sensitivi Prävalenz
wertVorhersagePos
.
59
BeispielPrävalenz: 1%, Sensitivität 92%, Spezifität 93%
Ich gehe zum Arzt … Der Test fällt positiv aus …
10.000 Personen
100Glaukom
9.900normal
8 normal(falsch negativ)
92 Glaukom(richtig positiv)
9207 normal(richtig negativ)
693 Glaukom(falsch positiv)
92+693 werden als Glaukom diagnostiziert (grün), 92 davon haben es wirklich= 92 / (92+693) = 11,7%
= positiver prädiktiver Wert = Relevanz (= Wirksamkeit = Genauigkeit)
Die Wahrscheinlichkeit, wirklich Glaukom zu haben, beträgt nur ~12%
tatsächlich:
Dia-gnose:
Sensi- Spezi-
Positiver & Negativer Vorhersagewert (Wikipedia)
Sensitivität(grün/links) und
Falsch-Negativ-Rate (rot/links)
Ein Test soll kranke und gesunde Menschen voneinander unterscheiden. Jeder Mensch wird durch einen Punkt dargestellt, der links (krank) bzw. rechts (gesund) von der schwarzen Linie liegt. Die Punkte im Oval sind die von dem Test als krank klassifizierten Menschen. Die Farben entsprechen den vier Fällen, die bei dieser Klassifikation auftreten können.positiver Vorhersagewert = Relevanz = Wirksamkeit = Genauigkeitnegativer Vorhersagewert = Segreganz = Trennfähigkeit = NPVKlassifikationsfehler = Falschklassifikationsrate = (falschpos+falschneg) / alleVertrauenswahrscheinlichkeit = Korrektklassifikationsrate = (richtigpos+richtigneg) / alle
Spezifität(grün/rechts) und Falsch-Positiv-Rate
(rot/rechts)
PositiverVorhersagewert
(grün/(grün+rot))
NegativerVorhersagewert (grün/grün+rot)
krank
gesund
krank krank krank
gesund gesund gesund
61
Beispiel: Sensitivitäten & Spezifitäten von Glaukomtests
62
BeispielPrävalenz: 1%, Sensitivität 85%, Spezifität 90%
Ich gehe zum Arzt … Der Test fällt negativ aus …
10.000 Personen
100Glaukom
9.900normal
15 normal(falsch negativ)
85 Glaukom(richtig positiv)
8910 normal(richtig negativ)
990 Glaukom(falsch positiv)
15+8910 werden als gesund diagnostiziert (rot), 8910 davon sind es wirklich= 8910 / (15+8910) = 99,8%
= negativer prädiktiver Wert
Die Wahrscheinlichkeit, doch krank zu sein, beträgt nur 0,2%
tatsächlich:
Dia-gnose:
Sensi- Spezi-
63
Beispiel: Abhängigkeit von der Prävalenz
S: Symptom K: Krankheit
Beispiel 1 Beispiel 2
Prävalenz: p(K) % der Erkrankten 0,1% 1%
Positiver Vorhersagewert
p(K|S) % krank bei pos. Test
16,4% 66%
Negativer Vorhersagewert
p(¬K|¬S)
% nicht krank bei neg. Test
99,998% 99,98%
Sensitivität p(S|K) % pos. Test bei Krankheit
98% dto.
Spezifität p(¬S|¬K)
% neg. Test bei Gesundheit
99,5% dto.
PrPräävalenzvalenz Aids (Deutschland 2006): 0,7Aids (Deutschland 2006): 0,7‰‰, Sensitiv. ELISA 99,9%, , Sensitiv. ELISA 99,9%, SpezifSpezif. 99,8%. 99,8%
64
(andere Darstellung:) VierfeldertafelWirklichkeit
krank (=pos) gesund (=neg) Summen
lautTest
krank (=pos)
richtig pos.A
Sensitivität= A/(A+C)
falsch pos.B
A+BPos.
Prädiktionswert
A/(A+B)
gesund (=neg)
falsch neg.C
richtig neg.D
Spezifität= D/(B+D)
C+DNeg.
Prädiktionswert
D/(C+D)
Summen A+C B+D 100%
65
Welchen Test wählen?
Hohe SensitivitHohe Sensitivitäät = t = ScreeningScreening TestTest
(niemand (niemand üübersehen)bersehen)
Hohe Hohe SpezifitSpezifitäätt ==
Sicherheit gegen Sicherheit gegen falschfalsch--positive positive DiagnoseDiagnose
krank gesund
Sensitivität 80% Spezifität 80%
Sensitivität 90%
Sensitivität 60%
Spezifität 60%
Spezifität 90%
KriteriumKriterium
66
Alpha- und Beta-Fehler(Inferenzstatistik, GK 1.3.7
NullhypotheseNullhypothese
kein Effektkein Effekt
AlternativAlternativ--HypotheseHypothese
Effekt vorhandenEffekt vorhanden
-Fehler
-Fehler = falsche Annahme der Alternativhypothese-Fehler = falsche Annahme der Nullhypothese
-FehlerMesswert
Häu
figke
itsdi
chte
„Wahrheit“
67
Effektstärke und Teststärke (Power)(Inferenzstatistik, GK 1.3.7
ohne ohne BehandlungBehandlung
Effektstärke = meist Cohen‘s d = Abstand / StdAbwPower = 1– = richtige Annahme der Alternativhypothese
mitmitBehandlungBehandlung
1–
=Power
d StdAbw
68
Welche Aussage zur Effektstärke als Maß für einen Treatmenteffekt trifft am ehesten zu?
(A) Mit steigender Effektstärke steigt auch die Number needed to treat. (B) Mit zunehmender Effektstärke sinkt die Testpower. (C) Mit zunehmendem Signifikanzniveau sinkt die Effektstärke. (D) Mit zunehmender Stichprobengröße steigt die Effektstärke. (E) Mit zunehmender Streuung verringert sich die Effektstärke.
aus Physikum SoSe 2013:
69
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
70
Epidemiologische BegriffePrävalenz = Krankheitshäufigkeit in der Population
Inzidenz = Anzahl der Neuerkrankungen in der Population… wird gemessen durch die
Inzidenzrate = die Anzahl der Neuerkrankungen (Inzidenz) in einer Zeitspanne (z.B. 1 Jahr) dividiert durch Individuenzahl (z.B. 100.000):
Inzidenzrate = Inzidenz / Individuenzahl (pro Jahr)
= (Absolutes) Risiko (= Erkrankungsrisiko in einer bestimmten Population).
(Inzidenzrate und Risiko ist oft dasselbe)
Relatives Risiko = Risiko (exponiert) / Risiko (nicht exponiert)(gibt an um welchen Faktor sich ein Risiko in zwei Gruppen unterscheidet, z.B. alt vs. jung.)
Attributables Risiko = Risiko (exponiert) – Risiko (nicht exponiert).(gibt an, um welchen Prozentsatz man eine Krankheitshäufigkeit senken kann, würde man den Risikofaktor ausschalten)
71
RE = Risiko_exponiert = a / (a+c) (meist %)
RNE = Risiko_nicht_exponiert = b / (b+d) (meist %)
Attributables Risiko: (meist %)
Relatives Risiko:
nochmal mit Vierfeldertafel
exponiert nicht exponiertAnzahl erkrankt a b
Anzahl nicht erkrankt c d
Summe Anzahl a+c b+d
dbb
caaRNEREAR
cadb
ba
dbb
caaRNERERR
//
72
RE = Risiko_exponiert = a / (a+c) (meist %)
RNE = Risiko_nicht_exponiert = b / (b+d) (meist %)
Attributables Risiko: (meist %)
R1 = Risiko_1 = a / (a+c) (meist %)
R2 = Risiko_2 = b / (b+d) (meist %)
Risiko-Unterschied: (meist %)
NNT = 1/ Risiko-Unterschied:weil R × NNT ≥ 1 Person
aus dem attributablen Risiko kann man dieNumber needed to treat (NNT) bestimmen:
exponiert nicht exponiertAnzahl erkrankt a b
Anzahl nicht erkrankt c d
Summe Anzahl a+c b+d
NNT = Anzahl der Patienten, die behandelt werden müssen, um bei einer einzigen Person einen negativen Ausgang zu vermeiden.Misst Effektgröße einer Behandlung
Methode 2Methode 1
Ziel erreicht
Ziel nicht erreicht
dbb
caaRRR
NNT
1
2111db
bca
aRNEREAR
db
bca
aRRR
21
Risiko-Reduktion
https://www.youtube.com/watch?v=eHxaDQNyfV4
NNT
dbb
caaRRRARR
NNT
1
21111
weil mindestens eine Person weniger betroffen sein muss, (halbe Personen gibt es nicht)Risiko-Reduktion mal Zahl der Behandelten = 1 PersonalsoARR × NNT ≥ 1
NNT anschaulich. RRR irreführend
74
Vierfeldertafel bei Fall-Kontrollstudie:exponiert nicht exponiert Summe
Anzahl erkrankt a b 1
Anzahl Kontrollen c d 1
Odds = Chance = Quote= Wahrscheinlichkeit/Gegenwahrscheinlichkeit
)(1)(AP
AP
Odds Ratio = Chancenverhältnis= bcad
dcba
OR
Odds
Beispiel: Rauchen erhöht Erkrankungsquote auf das x-facheUnterschied zu relativem Risiko: Bezieht sich auf Quoten, nicht WahrscheinlichkeitenAnwendung: Fall-Kontroll-Studien, Querschnitt-, InterventionsstudienVorteil: Leichteres RechnenTutorial auf dem Internet: http://gim.unmc.edu/dxtests/
75
Methoden
NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe
76
Statistische Grundbegriffe
n
i nx1
Mittel arithm. 2/Median nx„„Zentrale TendenzZentrale Tendenz““::
Unterschied Grundgesamtheit Unterschied Grundgesamtheit StichprobeStichprobe
VarianzVarianz = mittlere quadratische Abweichung vom Mittelwert:= mittlere quadratische Abweichung vom Mittelwert:
StandardabweichungStandardabweichung = Wurzel aus der Varianz= Wurzel aus der Varianz (( Kennzeichnung)Kennzeichnung)
StandardfehlerStandardfehler = Standardabweichung / Wurzel aus n= Standardabweichung / Wurzel aus n (( Mittelwerte)Mittelwerte)
KonfidenzintervallKonfidenzintervall = 1,96 = 1,96 ×× StandardfehlerStandardfehler
n
i nxxVarianz1
2)(
77
Grundgesamtheit:
Alle Medizinstudisim 4. FSn=250
Stichprobe:Kurs
n=23
Wichtigste Stichprobenarten:
randomisierte St. = Zufalls-St.
Quoten-St. = Quote der GG
78
Beispiele zu den Grundbegriffen
Mittelwert 23,5Mittelwert 23,5Median 13Median 13
Median Median anwenden beianwenden bei OrdinalskalenniveauOrdinalskalenniveau
79
Beispiele zu den Grundbegriffen3 m3 möögliche Fehlerbalken:gliche Fehlerbalken:
Beurteilung der/des Beurteilung der/des ……StreuungStreuung
derder MittelwerteMittelwerteVertrauensVertrauens
in in MittelwerteMittelwerteStreuungStreuungderder WerteWerte
80
WHO (Fünf) Fragebogenzum Wohlbefinden nach dem Methodenrepetitorium
Nach der Methodenvorlesung ... (in den letzten zwei Wochen)1 = nie5 = die ganze Zeit
... war ich froh und guter Laune
… habe ich mich ruhig und entspannt gefühlt
... habe ich mich energisch und aktiv gefühlt
... bin ich aufgewacht und habe mich frisch und ausgeruht gefühlt
... war mein Abend voller Dinge die mich interessierten
AuffAuffäällig, wenn Summe < 13 Punkten (d.h.<50%)llig, wenn Summe < 13 Punkten (d.h.<50%) Summe
••ValiditValiditäät: Korrelation mit Beck Depressionsinventar sehr gut. t: Korrelation mit Beck Depressionsinventar sehr gut. ••SensitivitSensitivitäät: ~ 93%t: ~ 93%
81
Schönen Tag noch ...