math candel universiteit maastricht. 1.heldere en haalbare probleemstelling 2.keuze van het design...
TRANSCRIPT
Math Candel
Universiteit Maastricht
1. Heldere en haalbare probleemstelling2. Keuze van het design3. Keuze van onderzoeks/analyse-eenheid4. Operationalisatie van variabelen5. Keuze van statistische technieken6. Afbakening van populatie7. Steekproefmethode, steekproefomvang en “power”8. Tijdschema en procedures
Dit is ook de volgorde van het verslag !!
Als rode draad een voorbeeld
- Wel of geen interventie ?- Wel of niet longitudinaal ?
Leidt langdurige blootstelling aan harde muziek in disco’s tot gehoorbeschadiging ?
L O N G I T U D I N A A L
I____________________________________________
N ja neeT____________________________________________
E ja Experiment
R Quasi-experimentV
E nee Cohort studie Dwarsdoorsnede
N (Steekproef uit basispopulatie)
T Patiënt-controle
I (Selectie van zieken)
E ____________________________________________
Voorbeeld
• Interventie:
Onmogelijk, expositie aan harde muziek niet ethisch
• Longitudinaal: meer zicht op causatie
• Geen individuele informatie omtrent blootstelling aan muziek prospectieve
cohort studie
Vaak geneste structuur (voorbeeld)
Vaak geneste structuur (voorbeeld)
Randstad Zuid-Limburg Twente Utrecht e.o. Niveau 3
Niveau 2
Niveau 1
Vaak geneste structuur (voorbeeld)
Randstad Zuid-Limburg Twente Utrecht e.o. Niveau 3
Niveau 2
Niveau 1
Vaak geneste structuur (voorbeeld)
Randstad Zuid-Limburg Twente Utrecht e.o. Niveau 3
Niveau 2
Niveau 1
Vragen: Keuze analysetechniek:
• Zijn de niveau’s fixed of random ?
• Op welk niveau speelt de vraagstelling zich af ?
• Is het design gebalanceerd ?
• Bij random niveaus: Random-effects of Multilevel Analyse
• Uitzondering:
Hoogste niveau + gebalanceerd design: Aggregeer metingen tot op hoogste niveau
Hoe zet ik begrippen als “blootstelling aan harde muziek” en “gehoorschade” om in meetbare grootheden ?
• Afhankelijke variabele slechts op 1 manier operationaliseren multiple testing
• Metingen dienen betrouwbaar te zijn (doe hermetingen en neem gemiddelde)
• Metingen dienen valide te zijn (voorkom bijv. antwoordtendenties bij vragenlijsten)
Multiple testing
• Dubbelzinnige resultaten: Sommige operationalisaties laten wel een effect zien, andere niet
• Veel type I foutenOplossing: Bonferroni correctieBij K toetsen, neem dan als significantieniveau:
* = /K
Illustratie Bonferroni correctie
Aantal toetsen (K) Aantal toetsen
121086420
Kans op m
instens 1 typ
e I fout
.5
.4
.3
.2
.1
0.0
Bonferroni correctie
Geen correctie
Aantal toetsen
Voorbeeld• Effectmaat: Gehoorverlies in dB,
gemiddeld over een reeks toonhoogten
• Onafhankelijke variabelen: – Duur van blootstelling:
Via een vragenlijst het aantal uren in 5 jaar(gemiddelde per week x aantal weken)
– Intensiteit:Aantal dB via audiometer
(meerdere metingen over 5 jaar in gefrequenteerde
disco’s)
• Confounders / Effectmodificatoren:
Geslacht, leeftijd, expositie aan ander lawaai
(via vragenlijst)
• Aantal variabelen:– Onafhankelijke variabelen– Afhankelijke variabelen
• Type variabele:– Binair– Polytoom– Continu
• Type design:– Tussen-subject design– Binnen-subject design
Y continu Y binair
1 X
binair T-toets
Mann-Whitney
2- toets voor
kruistabel
polytoom 1-weg ANOVA
Kruskal-Wallis test
2- toets voor
kruistabel
continu (Rang)correlatie
Lineaire regressie
Logistische
regressie
Meerdere X’en
Lineaire regressie
ANOVA
Logistische
regressie
Y continu Y binair
1 X
binair T-toets
Mann-Whitney
2- toets voor
kruistabel
polytoom 1-weg ANOVA
Kruskal-Wallis test
2- toets voor
kruistabel
continu (Rang)correlatie
Lineaire regressie
Logistische
regressie
Meerdere X-en
Lineaire regressie
ANOVA
Logistische
regressie
Y continu Y binair
1 X
binair T-toets
Mann-Whitney
2- toets voor
kruistabel
polytoom 1-weg ANOVA
Kruskal-Wallis test
2- toets voor
kruistabel
continu (Rang)correlatie
Lineaire regressie
Logistische
regressie
Meerdere X-en
Lineaire regressie
ANOVA
Logistische
regressie
Y continu Y binair
1 X
binair T-toets
Mann-Whitney
2- toets voor
kruistabel
polytoom 1-weg ANOVA
Kruskal-Wallis test
2- toets voor
kruistabel
continu (Rang)correlatie
Lineaire regressie
Logistische
regressie
Meerdere X-en
Lineaire regressie
ANOVA
Logistische
regressie
Y continu Y binair
1 X
binair T-toets
Mann-Whitney
2- toets voor
kruistabel
polytoom 1-weg ANOVA
Kruskal-Wallis test
2- toets voor
kruistabel
continu (Rang)correlatie
Lineaire regressie
Logistische
regressie
Meerdere X-en
Lineaire regressie
ANOVA
Logistische
regressie
Y continu Y binair
1 X
binair T-toets
Mann-Whitney
2- toets voor
kruistabel
polytoom 1-weg ANOVA
Kruskal-Wallis test
2- toets voor
kruistabel
continu (Rang)correlatie
Lineaire regressie
Logistische
regressie
Meerdere X-en
Lineaire regressie
ANOVA
Logistische
regressie
Voorbeeld
• Afhankelijke variabele: Gehoorbeschadiging (GB)
• Blootstellingsduur (DUUR) is een effectmodificator van de muziekintensiteit (INT)
• Potentiële confounders: Overig lawaai (LAWAAI), geslacht (GESL) en leeftijd (LEEFT)
Meervoudige lineaire regressie: GB = B0 + B1*INT + B2*DUUR + B3*INT*DUUR +
B4*LAWAAI + B5*GESL + B6*LEEFT +
Gehoorbeschadiging als functie van
intensiteit en blootstellingsduur
Intensiteit (in dB)
16014012010080604020
Gehoorb
eschadig
ing (
dre
mpelw
aard
e in d
B)
50
40
30
20
10
0
Blootstellingsduur
550 uren
450 uren
350 uren
250 uren
150 uren
50 uren
• Ethische redenen (bijv. geen ernstig zieken)
• Praktische redenen (beperkte hoeveelheid tijd en geld)
• Methodologische redenen:– Minder onverklaarde variantie– Minder storende factoren (“confounders”)– Voldoende variatie op risicofactor
Voorbeeld
• Praktische reden:
Alleen Zuid-Nederland
• Methodologische redenen:
Alleen jongeren tussen de 14 en 20 jaar
Minder variatie wat betreft gehoorsbeschadiging t.g.v. andere factoren (bijv. werk)
Tast afbakening de generaliseerbaarheid aan ?
Vraag: De generaliseerbaarheid van wat ?
Het gemiddelde ?
GB
Randstad
Parkstad
Muziekintensiteit
RG B
PG B
Relatie tussen gehoorbeschadiging en intensiteit ?
GB
Randstad
Parkstad
Muziekintensiteit
Conclusies:
• Gemiddelde is niet generaliseerbaar;Dit is anders voor Randstad en Parkstad
• Bestudeerde effect is wel generaliseerbaar;Gemiddelde toename in gehoorbeschadiging t.g.v. een bepaalde toename in muziekintensiteit is hetzelfde voor Randstad als voor Parkstad
• Dus:Een effect kan wel generaliseerbaar zijn naar andere populaties, ook als het gemiddelde dat niet is !
• Eenvoudige toetsende statistiek gaat uit van:– Een aselecte/willekeurige steekproef– Een populatie die veel groter is dan de steekproef
• In de praktijk:– Steekproef > 10% van de populatie
– Gestratificeerde steekproef: Bijv. prestratificatie op geslacht of sociaal-economische status Deze variabelen als covariaat in de analyse opnemen
Voorbeeld: Reden voor stratificatie ?
• Effectmodificatie:Het effect van muziekintensiteit is anders voor lange dan voor korte blootstellingsduren
• Confouding: Vrouwen en mannen verschillen wat betreft de mate van blootstelling aan harde muziek
In beide gevallen: Stratificatie-factor als extra covariaat in de analyse opnemen
– Tweestaps- of clustersteekproef: Men trekt een groot aantal eenheden (bedrijven, scholen, ziekenhuizen, gezondheidscentra, steden), en daarbinnen weer:
een aantal individuen: tweestapssteekproef alle individuen: clustersteekproef
Geschikte analyse: Multilevel of Random-effects
analyse
Hoe krijgen we de gewenste power ?
: Moet klein zijn om type I fouten te vermijden (vaak 0.05 of 0.01)
• Signaal: Contrast op interventie of risico-factor verhogen
• Ruis:
– Invloed van variatie op andere factoren minimaliseren middels design of statistische correctie
– Minimaliseren van meetfout
1- : gewenste power, zeg 0.90
Z : waarde uit standaardnormale verdeling;
Z 0.90 = 1.28
• Steekproefomvang voldoende groot laten zijn.
Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
N Z Z x 2 1 1 2
2 2
21( )/ ( )
: kans op het type I fout, zeg 0.05
Z : waarde uit standaardnormale verdeling;
Z 0.975 = 1.96
• Steekproefomvang voldoende groot laten zijn.
Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
N Z Z x 2 1 1 2
2 2
21( )/ ( )
: kleinste correlatie die ontdekt moet worden,zeg 0.30
• Steekproefomvang voldoende groot laten zijn.
Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
N Z Z x 2 1 1 2
2 2
21( )/ ( )
• Steekproefomvang voldoende groot laten zijn.
Voorbeeld: Model zonder interactie Formule voor correlatie (tweezijdige toetsing)
N x 2 1 2 8 1 9 62 2
21 0 3
0 3 1 0 8 1 4( . . ) ( ) ...
Nog aanpassingen van deze N :
A. Er zijn covariabelen:
NA = N x VIF = 108.14 x 2 (naar schatting)
= 216.28
B. Er is uitval te verwachten:
Bij k % uitval: NAA = 100/(100-k) x NA
Bij 10 % uitval: NAA = 100/90 x 216.28 = 241
Relatie power, steekproefomvang en signaal
Steekproefomvang
2001000
Po
wer 1.0
.8
.6
.4
.2
0.0
Correlatie:
0.40
0.35
0.30
0.25
• Overzicht van stappen en tijdsplanning
Voorbereiden van onderzoek (testen vragenlijsten, werven proefpersonen,….)
Dataverzameling
Tussentijdse analyses
Eindrapportage en/of presentatie
Hoe om te gaan met:
1. Non-response: niet deelnemen2. Uitval: voortijdig uit the onderzoek stappen3. Non-compliance: niet naleven van instructies
• Procedures
Waarborgen anonimiteit, werven van proefpersonen, “informed consent”, blindering e.d.
Effecten van uitval/nonresponse:
Effecten van uitval/nonresponse:
Intensiteit muziek (kernvariabele)
Gehoorbeschadiging
Effecten van uitval/nonresponse:
Intensiteit muziek (kernvariabele)
Gehoorbeschadiging
Leeftijd (covariaat)
0
5
10
15
20
25
IntensiteitMuziek
Geh
oorb
esch
adig
ing
jong (40%)
0
5
10
15
20
25
IntensiteitMuziek
Geh
oorb
esch
adig
ing
jong (40%)oud (60%)
0
5
10
15
20
25
IntensiteitMuziek
Geh
oorb
esch
adig
ing
jong (40%)oud (60%)gemiddeld
0
5
10
15
20
25
IntensiteitMuziek
Geh
oorb
esch
adig
ing
jong (40%)oud (60%)gemiddeld
Leeftijd is geen confounder
Effecten van uitval/nonresponse:
Intensiteit muziek (kernvariabele)
Gehoorbeschadiging
Uitval
Leeftijd (covariaat)
Uitval houdt verband met kernvariabele :
Intensiteit muziek (kernvariabele)
Gehoorbeschadiging
Uitval
Leeftijd (covariaat)
Uitval houdt verband met kernvariabele en covariaat:
Intensiteit muziek (kernvariabele)
Gehoorbeschadiging
Uitval
Leeftijd (covariaat)
Uitval houdt verband met kernvariabele en covariaat:
Intensiteit muziek (kernvariabele)
Gehoorbeschadiging
Uitval
Leeftijd (covariaat)
Confouding door covariaat; betrek covariaat in de analyse
0
5
10
15
20
25
IntensiteitMuziek
Geh
oorb
esch
adig
ing
jong oud
Vooral uitval bij hoge muziekintensiteiten
Uitval treedt met name op onder ouderen
0
5
10
15
20
25
IntensiteitMuziek
Geh
oorb
esch
adig
ing
jong oud
Vooral uitval bij hoge muziekintensiteiten
Uitval treedt met name op onder ouderen
0
5
10
15
20
25
IntensiteitMuziek
Geh
oorb
esch
adig
ing
jong oud gemiddeld
Uitval houdt verband met afhankelijke variabele en kernvariabele :
Intensiteit muziek (kernvariabele)
Gehoorbeschadiging
Uitval
Leeftijd (covariaat)
Uitval zelf is confounder:
uitval als extra covariaat in de analyse betrekken
Gevolg:
Relatie tussen uitval en afhankelijke variabele kan niet geschat worden
Probleem:
Voor uitvallers kennen we de waarden niet op de
afhankelijke variabele
Hoe om te gaan met non-compliance ?
• Intention-to-treat:
Non-compliers betrekken in de analyse
Adequaat beeld van de effectiviteit van een behandeling in de praktijk
• Statistische correctie:
Effect van interventie kan weggepoetst worden