ventura - peruskur · normanin ja steinerin ’biostatistics, the bare essentials’ on hauskasti...

154
Sisällysluettelo Johdanto 1 Tilastollisten menetelmien käytöstä . . . . . . . . . . . . . . 1 Oppikirjoista . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Ohjelmistoista . . . . . . . . . . . . . . . . . . . . . . . . . 3 Lääketieteellisten artikkelien laatu tilastollisesti tarkasteltuna . 5 Tutkimusprosessi . . . . . . . . . . . . . . . . . . . . . . . . 5 Tilastollinen päättely . . . . . . . . . . . . . . . . . . . . . . 6 Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Kirjallisuutta . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Ohjelmia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Tutkimustyypit ja -asetelmat 11 Kokeelliset tutkimukset . . . . . . . . . . . . . . . . . . . 11 Kokonaistutkimukset . . . . . . . . . . . . . . . . . . . . . 13 Otantatutkimukset . . . . . . . . . . . . . . . . . . . . . . 14 Meta-analyysi . . . . . . . . . . . . . . . . . . . . . . . . 17 Kirjallisuutta . . . . . . . . . . . . . . . . . . . . . . . . . 19 Aineistokoko ja tutkimuksen voima-analyysi 21 Johdanto . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Otoskoon määrittämiseen liittyvät avainkysymykset . . . . 23 Yhden binomijakaumaa noudattavan suhdeluvun testaaminen . . . . . . . . . . . . . . . . . . . . . 24 Kahden binomijakaumaa noudattavan suhdeluvun vertailu . 25 Kahden suhdeluvun ekvivalenttisuuden testaaminen . . . . 30 Kvantitatiivinen lopputulos, kahden keskiarvon vertailu . . 31 Muita otoskoon laskentatilanteita . . . . . . . . . . . . . . 36 Kommentteja . . . . . . . . . . . . . . . . . . . . . . . . . 36 Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Kirjallisuutta . . . . . . . . . . . . . . . . . . . . . . . . . 38 Ohjelmia . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Satunnaistaminen ja sokkouttaminen 39 Yleistä . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Yksinkertainen (rajoittamaton) satunnaistaminen . . . . . . 41 Korvaamismenettely . . . . . . . . . . . . . . . . . . . . . 42 “ Korttipakan sekoittamis” -menettely . . . . . . . . . . . . 42 Satunnaiset permutoidut lohkot . . . . . . . . . . . . . . . 42 Harhaisen kolikon menetelmä . . . . . . . . . . . . . . . . 43 Ositettu satunnaistaminen (’stratified randomization’) . . . 43 Minimointimenettely . . . . . . . . . . . . . . . . . . . . . 44 Epäsymmetrisesti tasapainotetut menetelmät . . . . . . . . 46 Lähtötason vertailut ja puutteet satunnaistamisessa . . . . . 46 Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Biostatistiikan peruskurssi 1998 i Sisällysluettelo

Upload: others

Post on 02-Jun-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

SisällysluetteloJohdanto 1

Tilastollisten menetelmien käytöstä . . . . . . . . . . . . . . 1Oppikirjoista . . . . . . . . . . . . . . . . . . . . . . . . . . 1Ohjelmistoista . . . . . . . . . . . . . . . . . . . . . . . . . 3Lääketieteellisten artikkelien laatu tilastollisesti tarkasteltuna . 5Tutkimusprosessi . . . . . . . . . . . . . . . . . . . . . . . . 5Tilastollinen päättely . . . . . . . . . . . . . . . . . . . . . . 6Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8Kirjallisuutta . . . . . . . . . . . . . . . . . . . . . . . . . . 9Ohjelmia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Tutkimustyypit ja -asetelmat 11Kokeelliset tutkimukset . . . . . . . . . . . . . . . . . . . 11Kokonaistutkimukset . . . . . . . . . . . . . . . . . . . . . 13Otantatutkimukset . . . . . . . . . . . . . . . . . . . . . . 14Meta-analyysi . . . . . . . . . . . . . . . . . . . . . . . . 17Kirjallisuutta . . . . . . . . . . . . . . . . . . . . . . . . . 19

Aineistokoko ja tutkimuksen voima-analyysi 21Johdanto . . . . . . . . . . . . . . . . . . . . . . . . . . . 21Otoskoon määrittämiseen liittyvät avainkysymykset . . . . 23Yhden binomijakaumaa noudattavan suhdeluvun testaaminen . . . . . . . . . . . . . . . . . . . . . 24Kahden binomijakaumaa noudattavan suhdeluvun vertailu . 25Kahden suhdeluvun ekvivalenttisuuden testaaminen . . . . 30Kvantitatiivinen lopputulos, kahden keskiarvon vertailu . . 31Muita otoskoon laskentatilanteita . . . . . . . . . . . . . . 36Kommentteja . . . . . . . . . . . . . . . . . . . . . . . . . 36Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37Kirjallisuutta . . . . . . . . . . . . . . . . . . . . . . . . . 38Ohjelmia . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Satunnaistaminen ja sokkouttaminen 39Yleistä . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39Yksinkertainen (rajoittamaton) satunnaistaminen . . . . . . 41Korvaamismenettely . . . . . . . . . . . . . . . . . . . . . 42“Korttipakan sekoittamis” -menettely . . . . . . . . . . . . 42Satunnaiset permutoidut lohkot . . . . . . . . . . . . . . . 42Harhaisen kolikon menetelmä . . . . . . . . . . . . . . . . 43Ositettu satunnaistaminen (’stratified randomization’) . . . 43Minimointimenettely . . . . . . . . . . . . . . . . . . . . . 44Epäsymmetrisesti tasapainotetut menetelmät . . . . . . . . 46Lähtötason vertailut ja puutteet satunnaistamisessa . . . . . 46Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Biostatistiikan peruskurssi 1998 i Sisällysluettelo

Page 2: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Aineiston kerääminen ja sen alustava käsittely 51Otantamenetelmiä . . . . . . . . . . . . . . . . . . . . . . . 51Aineiston käsittely . . . . . . . . . . . . . . . . . . . . . . 53Keskiluvut . . . . . . . . . . . . . . . . . . . . . . . . . . 58Hajonnan mitat . . . . . . . . . . . . . . . . . . . . . . . . 59Jakauman vinous ja huipukkuus . . . . . . . . . . . . . . . 60Jakauman normaalisuus . . . . . . . . . . . . . . . . . . . . 60Graafiset kuvaajat . . . . . . . . . . . . . . . . . . . . . . . 60Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61Ohjelmia ja kirjallisuutta . . . . . . . . . . . . . . . . . . . 61

Luottamusväliestimointi 63Yleistä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63Normaalijakaumaan perustuvat luottamusvälit . . . . . . . . 66Keskiarvon luottamusväli . . . . . . . . . . . . . . . . . . . 66Keskiarvojen erotuksen luottamusväli . . . . . . . . . . . . 67Mediaanien ja muiden prosenttipisteiden luottamusvälit . . . 68Mediaanien erotuksen luottamusväli . . . . . . . . . . . . . 69Suhdeluvun luottamusväli (tarkka väli) . . . . . . . . . . . . 70Suhdelukujen erotuksen luottamusväli . . . . . . . . . . . . 70Lukumäärän luottamusvälit . . . . . . . . . . . . . . . . . . 73Lukumäärien suhteen luottamusväli Poisson-jakauman tapauksessa . . . . . . . . . . . . . . . . . . . . . 74Luottamusvälit preferensseille . . . . . . . . . . . . . . . . 75Multinomijakaumaan perustuva luottamusväli . . . . . . . . 76Negatiiviseen eksponenttijakaumaan perustuva luottamusväli . . . . . . . . . . . . . . . . . . . . 76Vaarasuhteen luottamusväli seurantatutkimuksessa . . . . . 77Viitteet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78Ohjelmia . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

Tilastollisten testien valinta ja toteuttaminen 79Hypoteesien testaaminen . . . . . . . . . . . . . . . . . . . 79Monivertailut . . . . . . . . . . . . . . . . . . . . . . . . . 80Parametrinen ja ei-parametrinen testi . . . . . . . . . . . . . 81P-arvon käyttöön liittyviä rajoitteita ja ongelmia . . . . . . . 82Tilastollisten testien valintaperusteet . . . . . . . . . . . . . 83Normaalisuuden testaaminen . . . . . . . . . . . . . . . . . 89Varianssien homogeenisuustestit . . . . . . . . . . . . . . . 89Permutaatiotesti riippuville otoksille . . . . . . . . . . . . . 90Wilcoxonin parittainen testi . . . . . . . . . . . . . . . . . . 91McNemarin testi . . . . . . . . . . . . . . . . . . . . . . . 94Bowkerin testi . . . . . . . . . . . . . . . . . . . . . . . . . 96LR-testi siirtymätodennäköisyysmatriiseille . . . . . . . . . 96Mann-Whitneyn U-testi . . . . . . . . . . . . . . . . . . . . 98Wilcoxonin järjestyslukujen summatesti . . . . . . . . . . . 99χ2-trenditesti N×2 taulukoille . . . . . . . . . . . . . . . . 100

Sisällysluettelo ii Seppo Sarna

Page 3: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

χ2-nelikenttätesti . . . . . . . . . . . . . . . . . . . . . . . 101Fisherin tarkka nelikenttätesti . . . . . . . . . . . . . . . . 103Fisherin kontingenssitaulutesti 2×k taulukoille . . . . . . . 104Mantel-Haenszelin nelikenttätesti . . . . . . . . . . . . . . 105Kruskal-Wallisin yksisuuntainen varianssianalyysi . . . . . 108Monivertailut - Dunnin testi . . . . . . . . . . . . . . . . . 108Friedmanin kaksisuuntainen varianssianalyysi . . . . . . . . 111Kaksisuuntainen ei-parametrinen varianssianalyysi . . . . . 112Eloonjäämiskäyrien vertailu . . . . . . . . . . . . . . . . . 113Toistomittausanalyysit . . . . . . . . . . . . . . . . . . . . 113Yhtäpitävyyden mitta kappa κ . . . . . . . . . . . . . . . . 114Kirjallisuutta . . . . . . . . . . . . . . . . . . . . . . . . . 114

Biostatistisia näkökohtia artikkelin kirjoittamisessa 115Sanastoa 119

Englannista suomeen . . . . . . . . . . . . . . . . . . . . . 135

Tilastollisia taulukoita

Biostatistiikan peruskurssi 1998 iii Sisällysluettelo

Page 4: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Sisällysluettelo iv Seppo Sarna

Page 5: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Johdanto

Tilastollisten menetelmien käytöstä Tilastollisten menetelmien käyttö lääketieteellisissä julkaisuissa on erittäin yleistä. On arvioi-tu (Emerson & Colditz 1983), että noin kolmessa neljästä julkaistusta tutkimuksesta on käytet-ty merkittävässä määrin tilastollisia menetelmiä. Tästä johtuen useimmissa arvostetuissa tie-teellisissä lehdissä on viime vuosina alettu kiinnittää erityistä huomiota tilastollisten menetel-mien riittävälle ja oikealle käytölle. Monet lehdet, kuten. esim British Medical Journal jaLancet ovat luoneet erillisen tilastollisen arviointijärjestelmänsä tavanomaisen arviointijärjes-telmän täydennykseksi. Näissä lehdissä on julkaistu myös hyviä ohjeistoja tilastollisten mene-telmien asiallisesta käytöstä ja siitä mihin asioihin lääketieteellisiin lehtiin kirjoittavien tutki-joiden tulisi kiinnittää erityistä huomiota (Altman ym. 1983, Gore ym. 1992).

Kliinisissä kokeissa (’clinical trials’) edellytetään nykyisin, että tilastollista asiantuntemustakäytetään jo tutkimuksen suunnitteluvaiheesta alkaen. Myös muuntyyppisissä kliinisissä tutki-muksissa, joissa tilastollisten menetelmien käyttö on relevanttia, tulisi tilastollista asiantunte-musta hyödyntää mahdollisimman varhaisesta vaiheesta alkaen. Hyvin suunnitellun ja toteute-tun, mutta huonosti tai puutteellisesti analysoidun tutkimuksen voi yleensä saada julkaisukun-toon uudelleenanalysoinnilla. Huonosti suunnitellun, hallinnoidun ja toteutetun tutkimuksentuloksia ei hyvälläkään tilastollisella analyysilla saa tieteellisesti luotettaviksi.

Vain osassa lääketieteellisistä julkaisuista tilastotieteen asiantuntija on tutkimuksen tekijöidenjoukossa. Tästä syystä lääkäritutkijoiden tulisikin myös itse perehtyä tilastotieteen peruskäsit-teisiin ja -menetelmiin riittävässä määrin, jotta heidän tutkimuksiensa laatu olisi myös tilastol-lisesti pätevää. Valtaosa kliinikoista ei itse suorita tutkimuksia, vaan he ovat muiden suoritta-mien tutkimusten hyödyntäjiä, tutkimustulosten siirtäjiä kliiniseen käyttöön. Myös tämän ryh-män kohdalla tilastollisten menetelmien tuntemisesta on hyötyä; on tärkeää kyetäerottelemaan jyvät akanoista ja ottamaan kliiniseen käyttöön vain tieteellisesti luotettavia tu-loksia.

OppikirjoistaViime vuosina on ilmestynyt ilahduttavan paljon hyviä biostatistiikan kirjoja, jotka tarjoavatlääketieteellisiin lehtiin kirjoittaville ja kirjoituksia hyödyntäville hyvän perustietopaketin tut-kimusasetelmista ja tavallisimmin käytetyistä tilastollisista menetelmistä sekä niiden oikeastakäytöstä. Monissa kirjoissa sisällön pääpaino on selkeästi asetettu menetelmävalintoihin, käyt-töedellytyksiin ja analyysien tuottamien tulosten tulkintaan, eikä niinkään analyysien tekni-seen suorittamiseen. Tilastollisten algoritmien sisältö matemaattisine kaavoineen ja erilaisetestimointitekniikat ovat asioita, joista ohjelmia hyödyntävän ei tarvitse tietää juuri mitään.

Mitä biostatistiikan peruskirjoja lääketieteen tutkijan ja kliinikon kannattaa kirjahyllyynsähankkia? Valintaan vaikuttaa aikaisempi perehtyneisyys biostatistiikkaan, kuinka paljon bio-statistisia menetelmiä työssään tarvitsee ja ehkä jossain määrin kirjan hinta. Joitakin peruskir-

Biostatistiikan peruskurssi 1998 1 Johdanto

Page 6: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

joja tutkijan tai tutkijayhteisön kirjahyllyssä olisi kuitenkin hyvä olla. Seuraavassa esitelläänjoukko sellaisia alkeis- tai peruskirjoja, joista erityisesti kliinisten alojen tutkijat hyötyvät eni-ten.

Campbellin ja Machinin ’Medical Statistics. A Commonsense Approach’ on nimensä mukai-sesti helppotajuinen peruskirja. Kirja on tarkoitettu lääketieteen ja sairaahoitoalan opiskelijoil-le, mutta se on hyödyllinen myös potilaita hoitaville lääkäreille muistuttamaan tilastollistentutkimusasetelmien ja tulosten tulkinan olennaisimmista asioista. Kirjan sisältää paljon hyviäkäytännön ohjeita myös lääketieteellisiin lehtiin kirjoittaville tutkijoille. Kirja on selkeästi kir-joitettu ja siinä on hyvät lähdeviitteen niihin menetelmiin, esim. monimuuttujamenetelmiin,jotka on rajattu kirjan ulkopuolelle. Molemmilla kirjan tekijöistä laaja opetus ja konsultointi-kokemus. Se näkyy erityisesti esimerkkien valinnassa. Esimerkit ovat aitoja ja ne on otettu te-kijöiden omista tutkimuksista tai lääketieteellisestä kirjallisuudesta. BMJ:n lukijoille monetesimerkeistä ovat hyvinkin tuttuja. Kirja sisältää runsaasti tehtäviä vastauksineen. Niiden avul-la lukijan on helppo evaluoida asioiden omaksumista. Hyvä kirja perusopetukseen. Hinnal-taan se on edullinen, n. 250 mk.

Altmanin kirja ’Practical Statistics for Medical Research’ on erittäin hyvä biostatistiikan pe-rusoppikirja ja vankka lähdeteos. Kirja on tarkoitettu ennenkaikkea lääketieteen tutkijoille jakliinikoille, jotka haluavat saada hyvän yleiskäsityksen tilastollisista pääperiaatteista ja mene-telmistä, mutta se on erinomainen kirja myös lääketieteen opiskelijoille ja statistikoille, jotkahaluavat suuntautua kliiniseen biostatistiikkaan. Avainkäsitteet on määritelty selkeästi ja sisäl-lön pääpaino on ennenkaikkea lääketieteellisten tutkimusten suunnittelun ja analysoinnin käy-tännön näkökohdissa. Kirjan sisältö on kattava sisältäen jopa joidenkin monimuuttujamenetel-mienkin perusteet, tosin hyvin suppeasti. Kirjan rakennuselementteinä on käytetty Altmanininlukuisia yleistajuisia biostatistisia, mm. BMJ:ssä julkaistuja, artikkeleita vuosien varrelta. Kir-ja sisältää paljon sellaista hyödyllistä tietoa, mitä ei yleensä ole saatavilla yhdestä lähteestä.Siinä on paljon hyviä esimerkkejä ja harjoitustehtäviä todellisista kliinisistä tutkimuksista täy-dellisine tutkimusaineistoineen, joten kirjaa voidaan erinomaisesti hyödyntää sekä perus- ettäjatko-opetuksessa. Kirjan hinta on n. 500 mk.

Dunnin ja Everittin kirjan ’Clinical biostatistics, An Introduction to Evidence-Based Medi-cine’ alaotsikko paljastaa, että kyseessä ei ole tavanomainen oppikirja vaan nykysuuntauksenmukainen ongelmalähtöinen esitys. Kirja on mielenkiintoisesti kirjoitettu, mutta on sisällöl-tään se on melko suppea ja aihevalinnoiltaan tavallisista oppikirjoista poikkeava; mm. tilastol-lista testausta siinä ei käsitellä juuri ollenkaan, eikä monia muitakaan alkeisoppikirjojen käsit-telemiä aiheita, kuten yksinkertaista regressioanalyysiä. Yksinään tämä kirja ei tutkijalle riitä.Runsas melko vaikeasti todettavien painovirheiden määrä häiritsee jonkin verran lukemista.Suositeltavaa luettavaa kaikesta huolimatta. Kirjan hinta 11 Sterlingin puntaa.

Glantzin ’Primer of Biostatistics’ on nimensä mukaisesti vasta-alkajille tarkoitettu biostatistii-kan alkeisoppikirja, joka on ollut jo vuosia tutkijoiden käytössä. Uusin painos ilmestyi syksyl-tä -97. Rakenteeltaan kirja on tavanomainen oppikirja, joka kattaa kliinisen tutkijan kannaltakaikki olennaiset perusasiat ja se on hyvin kirjoitettu. Painoasu ei ole luettavuuden kannaltaparas mahdollinen. Kirjan hinta on n. 200 mk luokkaa.

Wassertheil-Smollerin ’Biostatistics and Epidemiology’ on terveydenhuoltohenkilöstöllesuunnattu alkeisoppikirja, joka sisältää biostatistiikan ohella myös tärkeimmät epidemiolo-gian peruskäsitteet ja määritelmät. Kirja on helppolukuinen, hinnaltaan edullinen (150 mk) ja

Johdanto 2 Seppo Sarna

Page 7: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

soveltuu hyvin perusopetukseen lääketieteen opiskelijoille. Se ei edellytä juuri mitään lähtötie-toja.

Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettukirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan sisällössä ja esimerkeissä näkyy teki-jöiden monialainen koulutus ja suuntautuneisuus ennenkaikkea kliiniseen psykologiaan ja kas-vatustieteisiin. Kirja soveltuu hyvin myös itseopiskeluun. Käsitteet on selkeästi määritelty jateksti on helposti omaksuttavaa. Kirjan ulkoasu on hyvä. Sisältö on peruskirjaksi hyvinkinkattava. Kirjaa voi varauksetta suositella aloittelijallekin.

Satunnaistetut kliiniset kokeet näyttelevät tärkeää roolia uusien hoitojen ja lääkkeiden kehitte-lyssä. Tutkimustulosten oikeellisuus riippuu oleellisesti siitä kuinka hyvin tutkimus on organi-soitu ja toteutettu. Pocockin kirja ’Clinical Trials, A Practical Approach’ tarjoaa lyhyen mie-lenkiintoisen katsauksen kliinisten kokeiden historiaan ja tiiviin ja kattavan esityksen niidenyleisperiaatteista, suunnittelusta ja toteuttamisesta. Kirjoittajan laaja käytännön kokemus ja sy-vällinen perehtyneisyys aihepiiriin näkyy kirjan sisällössä ja tekstissä. Tilastollisia menetel-miä käsittelevä osa on suppea, mutta sisältää kuitenkin kaikkein olennaisimman. Kaikkien nii-den, jotka joutuvat jollain muotoa kliinisten kokeiden kanssa tekemisiin kannattaa ehdotto-masti lukea tämä kirja ja mahdollisesti hankkia se kirjahyllyynsä. Tekijä on kirjoittamut myösmonia hyviä yleistajuisia artikkeleita tästä aiheesta (esim. Pocock 1985 ja 1987).

Biostatistiikan perusasiat jo osaavalle voi suositella Altmanin kirjan vaihtoehdoksi Armitagenja Berryn ’Statistical Methods in Medical Research’. Se on uusittu versio perinteikkäästä pel-kastään Armitagen nimissä kulkeneesta monelle tutkijalle hyvinkin tutusta oppikirjasta. Olen-naisimmat muutokset aiempiin painoksiin verrattuna on tapahtunut niissä kappaleissa, jotkakäsittelevät eloonjäämismenetelmiä, sekventiaalisia ja epidemiologisia menetelmiä. Aihepiiril-tään se kattaa suunnilleen samat asiat kuin Altmanin kirja, mutta se on esitykseltään jonkinverran syvällisempi ja edellyttää lukijalta enemmän perustietoja. Kirja on kuitenkin kirjoitettuei-matematiikoille. Sisältö kattaa hyvin kaikki ne tilastolliset perustekniikat, joita useimmitenlääketieteellisissä tutkimuksissa käytetään.

Suomenkielisiä biometrian oppikirjoja on niukasti saatavilla. Rannan, Ritan ja Koukin kirjoit-tama ’Biometria’ niminen kirja on suunnattu ekologeille, mikä tarkoittaa ennenkaikkea esi-merkkien substanssivalikoimaa. Sinäsä kirja kattaa hyvin myös ne tilastolliset perusmenetel-mät, joita lääketieteilijätkin käyttävät. Kirja on selkeästi ja hyvin kirjoitettu. Jonkinasteisia vai-keuksia kliinikolle voi syntyä, kun hän yrittää muodostaa analogioita kirjan esimerkeistäomaan tutkimustilanteeseensa.

Lääketieteessä käytetään paljon ns. ei-parametristen tilastollisten menetelmiä. Niiden perusasi-at on yleensä riittävästi kuvattu yllä luetelluissa perusoppikirjoissa. Mikäli joku kuitenkin ha-luaa yksityiskohtaisempaa tietoa näistä menetelmistä, niin kannattaa tutustua klassiseenSiegelin ja Castellanin kirjaan ’Non-parametric Statistics for the Behavioral Sciences’.

OhjelmistoistaMikrotietokoneiden helpot käyttöliittymät ja uudet ohjelmistot ovat viime vuosina mahdollis-taneet tilastollisten menetelmien käytön kohtuullisella vaivannäöllä myös muillekin kuin am-

Biostatistiikan peruskurssi 1998 3 Johdanto

Page 8: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

mattilaisille. Monissa ohjelmissa on lisäksi sisäänrakennettuna tilastollisten menetelmien käy-töstä opastavia ’tutor’-järjestelmiä.

Ohjelmistopaketeista SPSS, Statistica, Systat, BMDP, SAS ja S-Plus lienevät tavallisimminkäytettyjä yleisohjelmia lääketieteilijöiden keskuudessa PC-puolella. Näistä kaikista on saata-vissa myös Windows versiot, jotka toimivat Windows 3.1x, Windows 95 ja Windows NT ym-päristöissä. SPSS:n uusin versio 7.5 on helppokäyttöinen ja sen menetelmätarjonta on riittä-vän monipuolinen vaativammallekin käyttäjälle. BMDP:n New System on vielä melko kes-keneräinen, joskin ohjelmistotoimittaja on lupaillut kehittyneempää versiota lähiaikoina.Statistican ja Systatin etuja ovat mm. hyvä grafiikka. Monipuolisimmat mahdollisuudet ko-keneemmille käyttäjälle tarjoavat SAS, S-Plus ja BMDP Professional (Classic tai Dynamic).Ohjelmiston valinnan ratkaisee paljolti ympärillä toimiva tiedeyhteisö ja erilaiset tottumis-kysymykset. Tiedostojen siirtoa eri tilastopakettien, tietokanta- ja taulukkolaskinohjelmien vä-lillä voidaan kätevästi suorittaa DBMS/Copy -ohjelmalla.

Yleisohjelmien ohella tarjolla on myös hyviä erityisohjelmia. Esimerkiksi eksakteihin testei-hin erikoistunut StatXact 3 ja epidemiologisten aineistojen mallittamiseen ja testaamiseen so-veltuva Egret ovat hyviä ja paljon käytettyjä ohjelmistoja. Mac-puolella tilastollisten ohjelmi-en tarjonta on perinteisesti ollut aina niukempaa kuin PC-puolella. Yleisohjelmista StatView,Systat ja Statistica lienevät yleisimmin käytettyjä lääkäritutkijoiden keskuudessa.

Kliinisissä tutkimuksissa voimalaskelmat ovat tärkeitä. nQuery 2.0 ja PASS 6.0 ovat tähän tar-koitukseen soveltuvia helppokäyttöisiä ja monipuolisia erityisohjelmia. Egret Siz on tärkeätyöväline epidemiologisten tutkimusten suunnittelussa. Se on helppokäyttöinen, tehokas ja so-fistikoitu paketti aineistokoon arviointiin epälineaarisia malleja käytettäessä. Yleisohjelmillaaineistokoon arviointimahdollisuuksia ei juurikaan ole.

Varsinaisten tilastopakettien ohella perusstatistiikkaa voidaan laskea myös useimmilla tauluk-kolaskinohjelmilla, esim. Excel, joka on suunnilleen sama ohjelma sekä PC- että Mac-puolel-la. Perehtymällä näihin ohjelmiin vähän syvällisemmin, käyttäjä voi helposti itse täydentää oh-jelman tarjoamaa perusvalikoimaa tekemällä ns. makroja, sellaisista tilastollista suureista, joi-den algoritmi (ratkaisumenetelmä) on verrattain helppo, esimerkiksi useimmat tässämonisteessa olevat laskentakaavat.

Satunnaistamislistojen (’randomization list’) tekeminen on keskeisellä osalla monien kliinis-ten tutkimusten alkuvaiheessa. Niitä voidaan helposti tehdä MedStat-ohjelmalla useimpiinkliinisissä tutkimuksissa esille tuleviin tilanteisiin. Excel-käyttäjien on myös helppo ohjelmoi-da kaikki tässä monisteessa kuvatut satunnaistamisalgoritmit.

Nykysin useimmat arvostetut lehdet vaativat perinteisesti lääketieteellisissä julkaisuissa esitet-tyjen p-arvojen (tilastollinen merkitsevyys, ’statistical significance’) ohella myös luottamusvä-lejä (’confidence interval’), esimerkiksi hoitokokeissa lopputulosmuuttujien (’outcome measu-re’) arviota esitettäessä. Tilastollisten yleispakettien tulosteisiin on mahdollista saada jonkinverran luottamusvälejä. Hämmästyttäviä puutteita tässä suhteessa niissä kuitenkin esiintyy.Läheskään kaikkia aivan tavallisimpiakaan kliinisissä tutkimuksissa tarvittavia luottamusväle-jä ei niistä löydy ja tutkija joutuu turvautumaan erityisohjelmiin tai rakentamaan taulukkolas-kinohjelmaansa niistä makron. Hyvä eritysohjelma PC-puolella luottamusvälilaskentaan onBMJ:n markkinoima CIA-ohjelma, johon sisältyy myös pieni kirja (Gardner ja Altman 1989).Ohjelma on erittäin helppokäyttöinen.

Johdanto 4 Seppo Sarna

Page 9: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Lääketieteellisten artikkelien laatutilastollisesti tarkasteltuna

Nykyisin monet lääkäritutkijat käyttävätkin jo näitä paketteja sujuvasti ja asiantuntemuksella.Hyvistä tilastotieteen kirjoista ja ohjelmista on ollut selkeästi havaittavissa oleva hyöty. Tilas-tollisten menetelmien tietämys ja käyttö on selvästi viime vuosina parantunut lääketieteellisis-sä tutkimuksissa. Silti runsaasti parantamisen varaa on vielä olemassa, minkä osoittaa Lance-tissa julkaistu tutkimus (Gore, Jones ja Thompson 1992). Kun yhteensä 191 Lancet-lehdenalustavan arvioinnin läpäissyttä tutkimusta aikaväliltä marraskuu 1990 ja kesäkuu 1991 arvioi-tiin uudelleen tilastolliselta kannalta erityisen refereeryhmän toimesta, niin tulos oli pääpiir-teissään seuraava:

• Vain 54% käsikirjoituksista katsottiin hyväksyttäviksi tai hyväksyttäviksi korjauk-sen jälkeen.

• Muita joko suositeltiin hylättäviksi (14%) tai olennaista korjausta vaativiksi (32%).• Menetelmien kuvaukset olivat puutteellisia noin puolessa käsikirjoituksista.• Noin joka neljännessä oli abstrakti tai johtopäätökset puutteellisia.• Huomattavia virheellisyyksiä tilastollisessa päättelyssä (’statistical inference’)

esiintyi 48 artikkelissa. Näissä artikkeleissa esiintyi puutteellisuuksia myös tutki-muksen suunnittelun (’study design’) suhteen.

Tilastollinen raati kiinnitti erityistä huomiota siihen olivatko tehdyt johtopäätökset perusteltu-ja tutkimusasetelman ja suoritettujen tilastollisten analyysien pohjalta.

Ohjeita lääketieteellisiin lehtiin kirjoittaville tutkijoille on julkaistu useita: Altman, Gore,Gardner ja Pocock 1983, Gardner ja Altman 1989 ovat suositeltavaa luettavaa. Näissä kirjoi-tuksissa olevien ohjeiden suhteen lienee statistikkojen keskuudessa laaja konsensus.

TutkimusprosessiTutkimus on monivaiheinen ja monimutkainen kokonaisuus. Sitä voidaan luonnehtia prosessi-na, joka alkaa tutkimuksen suunnittelusta ja joka useimmiten päätyy tulosten julkaisemiseenja niiden hyödyntämiseen. Tutkimusprosessin eri vaiheita ovat:

• Ongelman realisoituminen(tiedostamisen aste ja tärkeys)

• Tutkimuksen yleissuunnittelu(resurssien kartoitus, aikaisempien tutkimusten arviointi)

• Ongelman tieteellinen lähestymistapa(tutkimustyypin, -asetelman ja -menetelmien valinta)

• Aineiston valinta(kohdeperusjoukon ’populaation’ määrittely, otantamenetelmien valinta)

• Tietojen kerääminen(mittarit ja mittaamismenetelmät, tietojen luotettavuus ja sen turvaaminen)

• Tietojen tallennus, muokkaaminen ja esikäsittely(virheiden tarkistus, poikkeavien arvojen ’outlier’ etsintä, jakaumien muodot)

Biostatistiikan peruskurssi 1998 5 Johdanto

Page 10: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

• Tulosten analysointi (menetelmävalinnat)

• Tulosten tiivistäminen ja esittäminen(tunnusluvut, taulukointitekniikka ja graafiset kuvaajat)

• Tulosten tulkinta ja johtopäätöstenteko(laajuus, yleistettävyys ja kliininen merkitys)

• Tieteellinen julkaisu tai tutkimusraportti(julkaisufoorumin valinta)

• Tulosten käyttö (väärinkäyttö)(tiedon vastaanotto, tulkinta ja sovellukset)

Kaikkiin edellä mainittuihin tutkimusprosessin vaiheisiin liittyy monia virhe- ja harhamahdol-lisuuksia (’bias’) sekä salakuoppia (’pitfalls’), joihin kokenutkin tutkija saattaa langeta. Tilas-tolliseen tutkimukseen liittyvät harhat voidaan määritellä sellaisina tulkintoina ja toimenpitei-nä missä tahansa tutkimusprosessin vaiheessa, jotka johtavat systemaattiseen poikkeamaan to-dellisuudesta. Harhasta voidaan myös käyttää nimitystä systemaattinen virhe (’systematicerror’). Erilaisia harhatyyppejä on kirjallisuudessa kuvattu useita kymmeniä (Sackett 1979).

Kriittisen tutkimuksen olennainen osa on harhamahdollisuuksien jatkuva arviointi tutkimuk-sen kaikissa vaiheissa. Harhamahdollisuuksien painottuminen vaihtelee kliinisen tutkimukseneri osa-alueilla, tutkimustyypistä riippuen.

Kliinisiä kokeita varten on laadittu erityinen normisto, GCTP (’Good Clinical Trial Practice’),jossa yksityiskohtaisesti määritellään kuinka tulisi menetellä, jotta tutkimus täyttäisi kaikiltaosin mahdollisimman hyvin tieteellisyyden kriteerit. GCTP:stä on olemassa myös ns. Pohjois-maiset ohjeet (NLN Publ 28, 1989), jotka ovat lähes yhteneväiset kansainvälisten ohjeidenkanssa. Laboratoriopuolella on vastaavankaltaiset ohjeet, GLP (’Good Laboratory Practice’),joissa laboratoriotutkimusten ja -käytäntöjen normit. Monia näissä normistoissa määriteltyjäasioita tulisi noudattaa suunniteltaessa ja toteutettaessa myös muun tyyppisiä kliinisiä tutki-muksia.

Tilastollinen päättelyTilastollisen päättelyn (’Statistical inference’) perusideana on tehdä johtopäätöksiä (päätel-miä) otoksesta (tai otoksista, ’samples’) perusjoukkoa (’population’) koskeviksi. Perusjoukko-ja on käsitteellisesti kahta tyyppiä:

• tavoiteperusjoukko (’target population’) ja• otosperusjoukko (’population sampled’).

Mikäli otanta on asianmukaisesti suoritettu siten, että tutkittavat on valittu toisistaan riippu-matta ja satunnaisesti, niin otantatutkimuksen tulokset ovat yleistettävissä otosperusjoukkoakoskeviksi otoskoon sallimalla varmuudella. Tavoiteperusjoukkoa koskeviksi saatuja tuloksiaei kuitenkaan ilman muuta voida yleistää. Pitää ensin tutkia, onko otosperusjoukko mahdolli-sesti valikoitunut jollakin mekanismilla tavoiteperusjoukosta ja mitkä tekijät ovat olleet syynätähän valikoitumiseen.

Johdanto 6 Seppo Sarna

Page 11: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Esim. Tutkitaan nivelreuman etenemiseen vaikuttavia tekijöitä ja niidenvälisiä riippuvuussuhteita. Otosperusjoukon muodostaa esimerkiksiReumasäätiön sairaalassa hoidettavat potilaat. Otos (tutkimusaineisto)kerätään jollain otantamenetelmistä näiden potilaiden joukosta.Saadut tulokset voidaan yleistää sairaalassa hoidettuihin potilaisiin,mutta ei välittömästi kaikkiin nivelreumatapauksiin. Valikoivanatekijänä on tässä tapauksessa mm. taudin vaikeusaste. Lievimpiänivelreumatapauksia ei hoideta erikoissairaalassa ja riippuvuus-suhteet saattavat lievemmissä tapauksissa olla aivan erilaiset kuinvaikeimmissa tapauksissa.

Kliinisissä tutkimuksissa, erityisesti hoitokokeissa tutkittavien joukko ei yleensä muodostaselkeää otosta mistään perusjoukosta, vaan se valikoituu sisäänotto- ja poisuljentakriteerienperusteella tutkimuksen tavoitteiden kannalta mahdollisimman tarkoituksenmukaiseksi. Tilas-tollisia päätelmiä tehtäessä tämä pitää ottaa huomioon, yleistyksiä esim. hoituloksista tai hoi-toeroista ei voi varauksettomasti tehdä jotakin muuta kuin tutkittavien edustamaa perusjouk-koa koskeviksi.

Esim. SAVE-tutkimus (Moyé et al. 1991) Satunnaistettu lumehoitokontrolloitukaksoissokkotutkimus ACE-estäjähoidon vaikutuksesta sydäninfarktin jälkeiseen kuolleisuuteen vasemman kammion vajaatoimintaa potevilla potilailla.

Kyseessä oli monikeskustutkimus, jonka potilasmateriaali seulottiin sepelvaltimotautihoitoyksiköistä USA:ssa kolmen vuoden ajalta. Seulot-tavien määrä oli kaikkiaan 95 856. Näistä 36 010:lla potilaalla todettiin kliininen sydäninfarkti, olivat selvinneet hengissä 72 tuntia infarktin jäl-keen ja olivat iältään 21-79 vuotiaita (potilasjoukko A). Erilaisin pois-suljennoin potilasjoukkoa rajattiin ja päädyttiin 2231:een potilaaseen (potilasjoukko B), jotka satunnaistetiin SAVE-tutkimukseen. Merkittä-vin poissulku tapahtui, kun kaikki ne potilaat, joilla ejektiofraktio oli 40% suljettiin tutkimuksen ulkopuolelle. Potilasjoukko B oli siten 6.1% potilasjoukosta A.

Tutkimuksessa todettiin selvä myönteinen vaikutus kuolleisuuteen ACE-estäjähoidolla. Tutkimuksen tuloksia hyödynnettiin välittömästi mm. lääkemainonnassa ja rohkeasti yleistettiin hoidon myönteiset vaikutukset lähes kaikkiin infarktitapauksiin. Näin rajuihin yleistyksiin ei voida kuitenkaan yllä kuvatun tutkimuksen perusteella mennä, sillä todettu myönteinen tulos pätee ainoastaan sellaiseen perusjoukkoon, jota potilasjoukko B, satunnaistetut potilaat, edustaa. Myöhemmin on tosin suoritettu tutkimuksia, joiden perusteella ACE-hoidon käyttöindikaatioita on voitu olennaisestikin laajentaa.

Tilastollinen päättely voidaan jakaa kahteen päätyyppiin:• estimointiin ja• hypoteesien testaamiseen.

Biostatistiikan peruskurssi 1998 7 Johdanto

Page 12: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Estimointia on kahta tyyppiä:

piste-estimointia (’point estimation’) jaluottamusväliestimointia (’confidence interval estimation’).

Piste-estimointi tarkoittaa sitä, että perusjoukon tuntemattomia suureita arvioidaan yhdelläotoksesta laskettavalla luvulla, piste-estimaatilla. Esim. jakauman keskeisyyttä jollakin keski-luvulla. Piste-estimaatin luotettavuutta arvioidaan keskivirheellä (’standard error’), SE(⋅).

Hypoteesien testaamisessa voidaan erottaa kaksi päätyyppiä:• yksi testattava suure• simultaaniset testaukset; monta samanaikaisesti testattavaa suuretta

Menetelmätyypit:• parametriset menetelmät (’parametric methods’)• ei-parametriset menetelmät (’non-parametric methods’)

Mallien rakentaminen:• yhden muuttujan mallit (’univariate models’), esim. y = a + bx

• monimuuttujamallit (’multivariate models’), esim. logit(y) = a + Σ bi xi

Mallien rakentamiseen (’modelling’) liittyy sekä mallin parametrien (a, b, ...) estimointia ettäerilaisia testejä

• muuttujien merkitsevyys• muuttujien väliset yhdysvaikutukset (’interactions’)• mallin hyvyys (’goodness of the fit’)

ViitteetAltman DG, Gore SM, Gardner MJ, Pocock SJ. Statistical guidelines for contributors to medi-

cal journals. BMJ 1983; 286: 1489-1493.

Emerson JD, Colditz GA. Use of statistical analysis in the New England Journal of Medicine.N. Eng. J. Med. 309, 709-713.

Gore S, Jones G, Thompson SG. Lancet’s statistical review process: areas for improvementsby authors. Lancet 1992; 340: 100-102.

Moyé LA, Pfeffer MA, Braunwald E for the SAVE investigators. Rationale, Design and Base-line Characteristics of the Survival and Ventricular Enlargement Trial. Am J Cardiol 68:70D-79D, 1991.

Pocock SJ. Current issues in the design and interpretation of clinical trials. BMJ 1985; 290:39-42.

Sackett DL. Bias in analytic research. J Chron Dis 1979; 32: 51-63.

Good clinical trial practice. Nordic guidelines. NLN publ. No 28. Nordiska Läkemedelsnämn-den, Nordic Council on Medicines, Uppsala 1989.

Johdanto 8 Seppo Sarna

Page 13: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

KirjallisuuttaAltman DG. Practical statistics for medical research. Chapman & Hill, London 1991.

ISBN 0 412 27630 5 (HB).

Armitage P, Berry G. Statistical methods in medical research. Blackwell Sci. Publ., Boston1987. ISBN 0-632-01501-2.

Campbell MJ, Machin D. Medical statistics, a commonsense approach. John Wiley & Sons,Chichester 1993. ISBN 0-471-93764-9.

Dunn G, Everitt B. Clinical Biostatistics. An introduction to Evidence-Based Medicine. Edward Arnols, London 1995. ISBN 0 340 59531 0.

Glantz SA. Primer of biostatistics. Second edition. McGraw-Hill, Singapore 1997. ISBN 0-07-024268-2.

Norman GR, Steiner DL. Biostatistics, the bare essentials. Mosby year book, Inc, St Louis1994. ISBN 1-55664-369-1.

Pocock SJ. Clinical Trials, A practical approach. John Wiley & Sons, Chichester 1983. ISBN 0-471-90155-5.

Pocock SJ, Hughes MD, Lee RJ. Statistical problems in the reporting of clinical trials. A Survey of Three Medical Journals. N Eng J Med 1987; 317: 426-32.

Ranta E, Rita H, Kouki J. Biometria. Yliopistopaino, Helsinki 1994. ISBN 951-570-085-X.

Senn S. Cross-over trials in clinical research. John Wiley & Sons, Chichester 1993. ISBN: 0-471-93493-3.

Siegel S, Castellan NJ. Nonparametric statistics for the behavioral sciences. McGraw-Hill,Singapore 1988. ISBN 0-07-100326-6.

OhjelmiaAxum versio 5.0. Maahantuoja Zenex. Fax: 09-692 4389

• Grafiikkaohjelma, hinta 1600,- mk

BMDP New System. Statistical Solutions, LTD, Irlanti, 1995. Fax: +353-21-319630.

CIA (Confidence Interval Analysis). Gardner MJ, Gardner SB, Winter PD. CIA (Versio 0.5).BMJ, Tavistock Square, London WC1H 9JR.

DBMS/COPY versio 6. Conceptual Software, Inc. Houston, Texas. Fax +1-713-721 4298

FigP versio 7.0. Biosoft, USA. Fax: (314) 524-8129. www: http://www.biosoft.com• Hyvä julkaisugrafiikkaohjelma, hinta $500.

nQuery Advisor versio 2.0. Statistical Solutions, LTD, Irlanti, 1997. Fax: +353-21-319 630• Aineistokoon arviointiohjelma, hinta £395.

Biostatistiikan peruskurssi 1998 9 Johdanto

Page 14: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Medstat versio 2.12. The Astra Group A/S, Denmark, 1991.• Vanha DOS-ohjelma, hankala käyttöliittymä.

SAS 6.12. Suomessa ohjelmaa myy mm. SAS-Instituutti.

S-PLUS 4.0. Suomessa ohjelmaa myy mm. Invarianssi Tietojärjestelmät Oy, fax: 09-640 261,www: http://www.clinet.fi/~invari/

Solas versio 1.0. Statistical Solutions, LTD, Irlanti, 1997. Fax: +353-21-319630• Puuttuvien tietojen käsittelyohjelma

SPSS 7.5. SPSS ASC International bv. Suomessa ohjelmaa myy mm. Action Office Oy, fax 09-524 854

• Monilla yliopistoilla ja korkeakouluilla on SPSS:stä edullinen kampuslisenssi.

Statistica. StatSoft. Tulsa, USA. Fax: +1-918-749 2217. Suomessa ohjelmaa myy mm.SmartSystems, fax: 02-233 3386.

StatXact 3 for Windows. CYTEL Software Corporation 1992, 675 Massachusetts Ave., Cam-bridge, MA 02139, USA. Fax: (617) 661-4405. Kaikkia CYTEL:in tuotteita myy jousta-vasti nk. ’päivän hintaan’ myös tanskalainen Spadille Biostatistics Aps. Fax: +45-48 484200, http://www.cytel.com

SYSTAT 6.0 for Windows. Statistical Solutions, LTD. Fax: +353-21-319 630.

Johdanto 10 Seppo Sarna

Page 15: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Tutkimustyypit ja -asetelmat

Lääketieteessä samaa ongelmaa voidaan lähestyä monin eri tutkimustyypein ja -asetelmin. Ti-lastollista käsittelyä vaativat lääketieteelliset tutkimukset voidaan jakaa kahteen päätyyppiin:1) kokeelliset (’experimental’, ’intervention’) tutkimukset ja 2) havainnoivat (’survey’) tutki-mukset. Kokeellisille tutkimuksille on tyypillistä tutkijan aktiivinen rooli havaintoyksiköiden(esim. potilaiden) jakamisessa tutkittaviin ryhmiin ja koejärjestelyitä ja -olosuhteita luonnehti-vien parametriasetusten määrittelyssä (esim. annosten määrittely annos-vaste-tutkimuksissa).Kokeellisissa tutkimuksissa tutkittavien (koe-eläimet, ihmiset,...) jako ryhmiin tapahtuu koe-suunnitelman mukaisesti. Havainnoivissa tutkimuksissa tutkijalla on passiivisempi rooli rekis-teröidessään tutkittavaan ilmiöön liittyviä tapahtumia tutkimussuunnitelman mukaisissa ryh-missä. Näissä tutkimuksissa tutkijalla ei ole mahdollisuutta suoranaisesti vaikuttaa tutkittavi-en jakautumiseen tutkittaviin ryhmiin, esimerkiksi jollekin vaaratekijälle altistuneisiin(’exposed group’) ja altistumattomiin (’non-exposed group’).

Havainnoivia tutkimuksia on kahta tyyppiä:• kokonaistutkimukset (’population studies’) ja • otantatutkimukset (’sample studies’).

Otantatutkimukset voidaan edelleen jakaa kahteen tyyppiin riippuen siitä suoritetaanko otantataudin tai vaikutuksen vai altistustekijän, ominaisuuden tai oletetun syytekijän suhteen.

Tutkimuksen aikasuuntauksen ja tutkittavien tietojen rekisteröintitavan mukaan tutkimuksetvoidaan edelleen jakaa

• poikkileikkaustutkimuksiin (’cross-sectional’),• takeneviin (’retrospective’),• eteneviin (’prospective’) ja• molempisuuntaisiin (’ambispective’) tutkimuksiin.

Kokeelliset tutkimukset Käyttö: Lääke- ja hoitokokeet, interventiotutkimukset (väestökokeet)

Havaintoyksiköt: koe-eläimet, ihmiset, mallit

Kliininen koe (’clinical trial’) on mikä tahansa ihmisillä suoritettu kokeellinen tutkimus, jokaperustuu tarkkaan etukäteissuunnitelmaan (’protocol’) ja jonka tavoitteena on löytää mahdolli-simman hyvä hoitomenetelmä uusille tuleville potilaille. Lääkekokeet luokitellaaan tavallises-ti koesuunnittelultaan neljään eri vaiheeseen (faasiin, ’phase’). Faasi I:n tutkimukset suorite-taan tavallisesti terveillä vapaaehtoisilla ja ne tähtäävät lähinnä lääkkeen imeytymisen ja meta-boloitumisen selvittelyyn sekä turvallisten lääkeannosten löytämiseen. Faasi II:npienimuotoisilla, aineistokooltaan yleensä korkeintaan 100-200 potilaan tutkimuksilla haetaanalustavaa selvyyttä lääkkeiden tehoon ja sivuvaikutuksiin. Faasi III:n tutkimukset ovat täyslaa-

Biostatistiikan peruskurssi 1998 11 Tutkimustyypit ja -asetelmat

Page 16: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

juisia lääkkeen tai hoidon tehon luotettavaan selvittelyyn tähtääviä tutkimuksia. Lääkkeenmarkkinoille tulon tai hoidon laajamittaisen käyttöönoton jälkeisiä seuranta- ja monitorointi-tutkimuksia kutsutaan faasi IV:n tutkimuksiksi.

Huomattava osa faasi III:n tutkimuksista on sellaisia, että niissä vertaillaan kokeiltavana ole-vaa hoitoa tai interventiotoimenpidettä johonkin kontrollina olevaan hoitoon tai toimenpitee-seen. Vertailtavia ryhmiä voi olla myös useita ja niiden tulee olla mahdollisimman samankal-taisia muiden paitsi tutkittavan tekijän (esim. lääkehoidon) suhteen. Vertailtavien ryhmien sa-mankaltaisuudella taustatekijöiden (esim. ikä, sukupuoli, taudin vaikeusaste) suhteen pyritäänvarmistamaan se, että mikäli tutkittavien ryhmien välillä todetaan ero, niin se todella johtuututkittavasta tekijästä eikä taustatekijöistä. Samankaltaisuus pyritään takaamaan siten, että tut-kimukseen soveltuvien henkilöiden sijoittelussa vertailtaviin ryhmiin käytetään satunnaista-mismenettelyä (’randomization’). Valtaosa faasi III:n tutkimuksista on nykyisin satunnaistet-tuja.

Yksi satunnaistamismenettelyn syistä on estää subjektiivisuuden vaikutus tutkimuksen tulok-siin. Satunnaistamismenettelyllä vertailtavista ryhmistä tulisi lähtötilanteessa täysin samankal-taisia, mikäli satunnaistamismenettelyä voitaisiin jatkaa rajatta. Käytännössä kuitenkin joudu-taan tyytymään melko pieniin ryhmäkokoihin ja huomattaviakin eroja taustatekijöiden suh-teen saattaa ryhmien välillä esiintyä. Jokaisessa satunnaistetussa kliinisessä kokeessa on syytäsuorittaa ryhmien vertailu kaikkien relevanttien taustatekijöiden suhteen, jotta voitaisiin var-mistua siitä, kuinka hyvin ryhmät ovat lähtötilanteessa tasapainossa.

Mikäli käytetään yksinkertaista satunnaistamista ja ryhmäkoot ovat pieniä, niin ryhmistä voitulla huomattavastikin erisuuruiset. Samansuuruisten ryhmien aikaansaamiseksi täytyy käyt-tää nk. rajoitettuja tai lohkosatunnaistamismenetelmiä (’block randomization’).

Mikäli satunnaistaminen on suoritettu siten, että tutkittavat henkilöt eivät tiedä mihin ryh-mään he kuuluvat, mutta tutkija ja/tai muu hoitohenkilökunta tietää, kyseessä on yksöissokko-koe (’single blind’), mutta jos kumpikaan osapuoli ei tiedä ryhmiin sijoittelua ennen tutkimuk-sen päättymistä (mieluiten ennen tutkimusten analysointia), niin kyseessä on kaksoissokko-koe (’double blind’). Näistä jälkimmäinen sisältää vähemmän harhamahdollisuuksia.

Yksinkertaisen satunnaistamismenettelyn asemesta voidaan käyttää monimutkaisempiakinmenetelmiä takaamaan vertailtavien ryhmien vertailukelpoisuutta lähtötilanteessa. Eräs tällai-nen menettely on ositettu satunnaistaminen (’stratified randomization’). Tällöin potilaat jae-taan taustatekijöiden mukaan ositteisiin ja suoritetaan satunnaistaminen kussakin ositteessaerikseen. Kliinisessä kokeessa päästään harvoin täysin satunnaiseen valintaan. Varsin tavalli-nen on esim. tilanne, että tutkija ottaa hoitoryhmään ne potilaat, jotka tulevat hänen klinikal-leen ja naapuriklinikalla hoidetut potilaat muodostavat verrokkiryhmän. Tällainen asetelmaon kuitenkin varsin altis kritiikille ja harhamahdollisuuksille.

Toisinaan on epäeettistä tai mahdotonta suorittaa puhdas satunnaistaminen (esim. fataalit sai-raudet, potilaan saama hyöty jne.). Näissä tilanteissa on erityisen tärkeää tutkimustuloksia ana-lysoitaessa tutkia huolella ryhmien vertailukelpoisuutta ja käyttää tarvittaessa erilaisia adjus-tointitoimenpiteitä analyysivaiheessa, esim. erilaisten tilastollisten mallien avulla.

Monissa lääkekokeissa voidaan säästää tutkittavien määrässä suorittamalla nk. ristikkäistutki-mus (’cross-over trial’). Tässä tutkimussuunnitelmassa potilaat jaetaan satunnaistamalla tutki-

Tutkimustyypit ja -asetelmat 12 Seppo Sarna

Page 17: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

muksen alkaessa esim. ryhmiin A ja B, jotka saavat tiettyä hoitoa määrätyn pituisen ajan, jon-ka jälkeen seuraa nk. puhdistumisajanjakso, (’wash-out’), jolloin koehenkilöt eivät saa mitääntutkimustuloksiin vaikuttavaa hoitoa. Tämän jälkeen seuraa kolmas tutkimusajanjakso, jolloinne potilaat, jotka aloittivat hoidolla A saavat ajanjaksona hoitoa B ja päinvastoin. Ristikkäis-tutkimusasetelmassa ei siten ole erillistä kontrolliryhmää, vaan potilaat toimivat itsensä kont-rolleina. Lueteltujen kolmen tutkimusvaiheen lisäksi tutkimukseen liitetään usein lumehoito-jaksot eri tutkimusvaiheiden alkuun ja loppuun.

Ristikkäistutkimusasetelma soveltuu sellaisiin tutkimuksiin, joissa hoidon tai lääkkeen vaiku-tus on lyhytkestoinen, sillä muuten ei voida yhdistää tutkimustuloksia tutkimusjaksoista 1 ja 3ja siten menetetään asetelman käytön peruste, säästövaikutus potilasmäärissä. Mikäli edellises-tä tutkimusvaiheesta lääkkeen tai hoidon efekti jää päälle (’carry-over effect’), niin tutkimus-periodi pitää ottaa huomioon tutkimustuloksia analysoitaessa. Tällaisissa tilanteissa tutkimus-tulosten tulkinta on usein vaikeaa.

Kliinisissä tutkimuksissa suoritetaan usein samoista potilaista toistomittauksia, käytetään tois-tomittausasetelmia (’repeated measures designs’). Niiden käytön perusideana on vähentää yk-silöiden välisen vaihtelun vaikutusta tutkittavaan asiaan, esimerkiksi hoitojen vaikutukseen.Samoin kuin ristikkäsiasetelmassa, toistoasetelmassakin aikaansaadaan säästöjä koe-eläin taihenkilömäärissä. Sama voima (’power’) saavutetaan pienemmällä tutkittavien määrällä kuinjos jokaisesta tutkittavasta olisi vain yksi mittausarvo. Toistoasetelmat antavat monia mahdol-lisuuksia tutkia mm. ajan ja erilaisten olosuhteiden sekä niiden yhdysvaikutusten (’interacti-on’) vaikutusta koe- tai hoitotuloksiin.

Valtaosa kliinisistä kokeista ovat luonteeltaan vertailevia, ja todettu ero ryhmien (esim. hoito-ja vertailuryhmän) välillä voi johtua seuraavista syistä:

• Otosvaihtelusta tai sattumasta• Sisäisistä eroavuuksista ryhmien välillä

(esim. prognoosiin vaikuttavat tekijät)• Eroista ryhmien käsittelyssä ja seurannassa

(esim. hoitoryhmän intensiivisempi seuranta)• Todellinen ero ryhmien välillä tutkittavan asian suhteen

KokonaistutkimuksetKäyttö: hallinnolliset kartoitukset, väestötilastot

Havaintoyksiköt: henkilöt, kuolintodistukset, sairaalastapoistot, väestö- ja tautiryhmät

Kokonaistutkimus kohdistuu koko perusjoukkoon; esim. rutiinisti suoritetut väestötilastoinnit,ovat luonteeltaan kokonaistutkimuksia. Niitä käytetään silloin, kun halutaan saada ehdotto-man tarkka tieto tutkittavista asioista.

Kokonaistutkimus luo usein hypoteeseja ja antaa vihjeitä mahdollisista riippuvuuksista sekätarjoaa tutkimusaineistoja muun tyyppisille tutkimuksille. Kokonaistutkimuksen haittoja ovatkalleus, hitaus ja usein laadunvalvonnan vaikeus.

Biostatistiikan peruskurssi 1998 13 Tutkimustyypit ja -asetelmat

Page 18: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Otantatutkimukset

Poikkileikkaustutkimukset (’cross-over studies’)

Käyttö:• Yleiskartoitukset• Vallitsevuudet (’prevalence’)• Riippuvuudet tautien tai riskitekijöiden välillä• Seurantatutkimusten osana

Koska poikkileikkaustutkimukset eivät sisällä aikatekijää, ei todettujen riippuvuuksien perus-teella voida päätellä mitään syy-seuraus -suhteesta.

Kohorttitutkimusten (seurantatutkimusten) tiedonkeruujärjestelmä pohjautuu usein poikkileik-kaustutkimuksiin.

Tapaus-verrokkitutkimukset (’case-control’ tai ’case-referent’ studies)

Tapaus-verrokkitutkimuksen perusasetelmassa on kyse vertailusta kahden ryhmän välillä. Toi-sen ryhmän ( ’tapaukset’) muodostavat ne henkilöt, joilla on tutkimuksen kohteena oleva tautija toisen ne henkilöt, joilla tätä tautia ei ole (’verrokit’). Tapaus-verrokki -tutkimusta nimite-tään myös sairauslähtöiseksi tutkimukseksi. Tutkimuksessa kerätään altistus- ja vaaratekijätie-toja kummastakin ryhmästä (yleensä takenevasti, retrospektiivisesti) ja tutkitaan, esiintyyköjokin tietty tekijä tai tekijäyhdistelmä useammin tai voimakkaampana tapauksilla kuin verro-keilla.

Tapaus-verrokkiasetelmasta on olemassa kaksi variaatiota• kaltaistettu (’matched’) ja• kaltaistamaton asetelma (’unmatched’).

Kaltaistetussa asetelmassa tapaukset ja verrokit on valittu siten, että ne ovat samankaltaisiatiettyjen tekijöiden (ikä, sukupuoli jne. suhteen). Kaltaistus on eräs vakiointikeinoista, jollapyritään poistamaan kaltaistustekijöiden vaikutus tutkittavasta ilmiöstä, eli vaara- tai altistus-tekijän ja taudin välisestä yhteydestä. Yleensä tekijöitä, joiden suhteen kaltaistus suoritetaanei saisi olla kovin monta, sillä muuten vaanii ylikaltaistuksen vaara; kaltaistuksella poistetaanosa tutkittavaa vaikutusta. Kaltaistamattomassa asetelmassa tutkittavien tulisi olla otoksia vas-taavista perusjoukoista.

Tapaus-verrokkitutkimusta edeltää tavallisesti sairastavuus tai kuolleisuustutkimus, jonka poh-jalta todettu (tai todetut) yhteydet tiettyjen altistus- tai vaaratekijöiden ja taudin (tai tekijöidenaiheuttaman vaikutuksen) välillä halutaan varmentaa. Pääasiallisin ero poikkileikkaustutki-mukseen verrattuna on aikatekijän olemassaolo.

Tapaus-verrokkitutkimuksesta saatavien tulosten oikeellisuuden kannalta keskeisiä seikkojaovat:

• tapausten ja verrokkien määrittelykriteerin (tai kriteerien) oikeellisuus

Tutkimustyypit ja -asetelmat 14 Seppo Sarna

Page 19: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

• sekä tapaus- että verrokkiryhmän edustavuus• tapaus- ja verrokkiryhmän vertailukelpoisuus• altistus- ja vaaratekijätietojen tarkkuus ja oikeellisuus

Kaikkiin näihin kohtiin liittyy lukuisia harhamahdollisuuksia. Mikäli ryhmien määritettelykri-teeri (tai kriteerit) ovat puutteellisia, saattaa osa tapauksista olla sellaisia, ettei heillä olekaantutkimuksen kohteena olevaa tautia (väärät positiiviset), vastaavasti osa verrokkiryhmään kuu-luvista saattaa kuulua sinne virheellisesti (väärät negatiiviset). Nämä luokitusvirheet voivatpeittää alleen todellisen riippuvuuden joko täydellisesti tai osittain tai ne saattavat synnyttääharhaisen riippuvuuden altistus- tai vaaratekijöiden ja taudin välillä.

Mikäli edustavuus on puutteellinen, putoaa tutkimukselta pohja pois joko täysin tai osittain,sillä tilastollisessa tutkimuksessa pyritään siihen, että todetut tulokset voidaan yleistää perus-joukkoa koskeviksi.

Verrokkiryhmän valinta tapaus-verrokkitutkimuksissa on usein vaikea tehtävä. Usein verrok-kiryhmä joudutaan keräämään eri lähteistä kuin tapaukset ja tällöin vertailukelpoisuus saattaaolla puutteellinen. Riippuvuudet voivat tällöin tulla joko liian voimakkaiksi tai liian heikoiksiriippuen siitä onko verrokkiryhmä liian ’huono’ tai ’hyvä’.

Tietojen keruu tapaus-verrokkitutkimuksissa joudutaan usein suorittamaan takenevasti ja täl-laisten historiatietojen luotettavuus ei aina ole paras mahdollinen. Myös tästä saattaa syntyäharhaisia tutkimustuloksia. Esimerkiksi tapauksilta altistus- ja vaaratekijätiedot saattavat ollahuolellisemmin ja/tai useammin tallennettuja kuin verrokeilta ja haastattelu- ja kyselytutki-muksissa tapaukset saattavat muistaa verrokkeja paremmin altistus- ja vaaratekijähistoriansa.Tällöin seurauksena on harhainen tai liian voimakas riippuvuus altistus- tai vaaratekijän ja tau-din välillä.

Myös usein ne henkilöt, joilla on sekä tutkimuksen kohteena tauti että jokin siihen liittyvävaaratekijä, saattavat tulla suuremmalla todennäköisyydellä valituksi tutkimusaineistoon(otokseen) kuin ne henkilöt, joilla on pelkästään ko. tauti tai vaaratekijä. Tuloksena on harhai-sen korkea vaaratekijän esiintyvyys tapausten joukossa.

Tapaus-verrokkitutkimuksessa ei ole mahdollista suoraan arvioida altistus- tai vaaratekijänvaikutuksen suuruutta, lisääntynyttä vaaraa tapauksilla. Epäsuorasti arviointi on kuitenkinmahdollista. Arviointi perustuu olettamuksiin:

• taudin ilmaantuvuus on alhainen perusjoukossa• sekä tapaukset että verrokit muodostavat kumpikin erikseen satunnaisotoksen

vastaavista perusjoukoista

Vain harvoissa tapaus-verrokkitutkimuksissa tämä jälkimmäinen olettamus on tarkalleen voi-massa, mutta käytännössä poikkeamat siitä eivät yleensä ole ratkaisevia tulosten merkitsevyy-den kannalta.

Tapaus-verrokki -asetelman etuja ovat:• taloudellisuus• nopea toteuttaminen• riittävät määrät tapauksia helposti saatavissa• aineisto helposti kerättävissä.

Biostatistiikan peruskurssi 1998 15 Tutkimustyypit ja -asetelmat

Page 20: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Kohorttitutkimukset, seurantatutkimukset (’cohort study’ tai ’follow-up study’)

Sana kohortti merkitsee henkilöjoukkoa, jolla on jokin yhteinen ominaisuus ja jota seurataantietyn ajan tutkimuksen kohteena olevien tapahtumien rekisteröimiseksi. Tämä yhteinen omi-naisuus voi olla esimerkiksi tietyn altistus- tai vaaratekijän olemassaolo tai puuttuminen tainiiden voimakkuus. Pääasiallisin ero tapaus-verrokkitutkimukseen verrattuna on, että vertailta-vat ryhmät muodostetaan altistus- tai vaaratekijätietojen perusteella ja seurannan tarkoitukse-na on rekisteröidä kuinka paljon tutkimuksen kohteena olevaa tautia ilmaantuu eri ryhmissä jatehdä tämän perusteella johtopäätökset altistus- tai vaaratekijän ja taudin ilmaantuvuuden väli-sestä yhteydestä.

Tässä tutkimusasetelmassa on mahdollista suoraan arvioida johonkin altistus- tai vaarateki-jään (olemassaoloon tai voimakkuuteen) liittyvä lisääntynyt tai vähentynyt sairastumisvaara.

Tietojen keruu kohorttitutkimuksessa voi tapahtua ajallisesti myös takenevasti tai molem-pisuuntaisesti. Kohorttitutkimus aloitetaan lähtötutkimuksella (poikkileikkaustutkimus), jonkayhteydessä

• varmistutaan, että seurattavista ryhmistä poissuljetaan ne henkilöt, jotka tutkimuk-sen lähtötilanteessa sairastavat seurannan kohteena olevaa tautia tai eivät voi siihenjostain teknisestä syystä johtuen sairastua

• määritellään altistus- tai vaaratekijätietoihin perustuvat kriteerit, joiden perusteellaseurattavat ryhmät muodostetaan.

Tässä tutkimusasetelmassa on lukuisia etuja verrattuna tapaus-verrokki-asetelmaan:• voidaan tutkia ryhmien vertailukelpoisuutta jo tutkimuksen lähtöhetkellä ja tarkas-

tella jo ennakkoon, minkä muuttujien suhteen erilaiset korjaukset (adjustoinnit)analyysivaiheessa ovat tarpeen

• lisääntyneen vaaran suora arviointi on mahdollista• on helpompi välttää harhaisuutta kerättävässä tiedossa (esim. muistamattomuus-

harha)• on helpompi kartoittaa altistus- ja vaaratekijöissä seurannan aikana tapahtuneita

muutoksia• voidaan tutkia samanaikaisesti myös muita tauteja ja niiden yhteyksiä varsinaiseen

tutkimuksen kohteena olevaan tautiin• toisin kuin useimmissa tapaus-verrokkitutkimuksissa tutkimusaineistosta ei vali-

koidu pois henkilöitä, jotka ovat esimerkiksi eläneet hyvin lyhyen ajan altistukses-ta.

Asetelman haittoja ovat:• tarvitaan tapaus-verrokki -tutkimuksiin verrattuna huomattavasti suurempi tutki-

musaineisto ryhmien välisten vaaraerojen tai vaarasuhteen merkitsevyyden toteen-näyttämiseksi. Tästä on seurauksena tutkimustulosten viivästyminen jatutkimuksen kalleus

• tutkimukseen kuuluvien henkilöiden tieto tutkimukseen kuulumisestaan saattaaaiheuttaa sen, että henkilöt muuttavat elintapojaan ym., jolla saattaa olla vaikutustasairastumisvaaraan

Tutkimustyypit ja -asetelmat 16 Seppo Sarna

Page 21: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

• on mahdollista, että otantasuhde tulee eri ryhmissä erilaiseksi valikoitumisme-kanismeista johtuen. Esimerkiksi lähtötutkimuksessa, missä seurattavat ryhmätmuodostetaan, terveet tupakoitsijat saattavat jättää vastaamatta kyselyyn useam-min kuin terveet tupakoitsemattomat (esim. johtuen kyselylomakkeen komp-lisoidusta rakenteesta tupakkamuuttujien osalta). Tästä aiheutuu keinotekoisestiterveiden liian suuri edustus tupakoitsemattomien ryhmässä.

Meta-analyysi

Yleistä

Kun tarkastellaan useiden samoja hoitoja vertailevien kliinisten tutkimusten tuloksia, niin voi-daan joskus todeta yllättävänkin suurta vaihtelua todetuissa hoitoeroissa, osa selittyy luonnol-lisesti satunnaisvaihtelulla osa selittyy tutkimuksissa käytettyjen potilasaineistojen eroilla.Vaikka tutkimusprotokollat olisivatkin lähes samanlaisia niin potilasaineistoissa on usein suu-riakin eroja. Viimeisten kymmenen vuoden aikana on ollut voimakas suuntaus kehittää tilas-tollisia analyysimenetelmiä, joiden avulla voitaisiin formaalisesti analysoida kaikki tieto sekäjulkaistuista että julkaisemattomista samoja hoitoja vertailevista tutkimuksista. Analyysistäkäytetään nimitystä meta-analyysi (’meta-analysis’). Se tarkoittaa analyysiä, joka suoritetaankahden tai useamman samaa ongelmaa tarkastelevan tutkimuksen tulosten pohjalta. Tavoittee-na on tehdä johtopäätöksiä, jotka olisivat luotettavampia kuin mihin yksittäisissä tutkimuksis-sa on päädytty ja analysoida lisäksi yksittäisten tutkimustulosten välistä vaihtelua. On tärkeääselvittää vaihtelevatko tulokset esim. tutkimusaineiston koon tai jonkin muun tutkimuksen eri-tyispiirteen suhteen. Perussyyt meta-analyysin suorittamiselle ovat siten:

• lisätä voimaa (vähentää väärien negatiivisten johtopäätösten todennäköisyyttä) • lisätä tarkkuutta (parantaa estimaattien luotettavuutta)• vähentää harhan mahdollisuutta (vähentää väärien positiivisten johtopäätösten

todennäköisyyttä)

Meta-analyysin tilastollisen perustan on esittänyt esimerkiksi Fleiss (1993).

Yleensä tukimuksia suunniteltaessa ei erityisesti oteta huomioon, että tuloksia tultaisiin mah-dollisesti myöhemmin käyttämään meta-analyysin aineistona (ad hoc meta-analysit). Vasta-kohtana ovat sellaiset meta-analyysit, jotka perustuvat kahteen tai useampaan tutkimukseen,jotka on erityisesti suunniteltu myöhempää meta-analyysikäyttöä varten (’designed meta-ana-lysis’)

Käytettyjen tietolähteiden perusteella meta-analyysit luokitellaan A) kirjallisuuteen perustu-viin, B) tutkijoilta saatuihin yksittäisiin potilastietoihin perustuviin, ja C) tutkijoilta tai tutki-musrekistereistä saatuihin yhteenvetotietoihin perustuviin.

Tyypin A tutkimuksiin sisältyy mm. seuraavia vaaroja ja ongelmia:• positiivisia tuloksia julkaistaan lääketieteellisissä lehdissä herkemmin kuin nega-

tiivisia (Begg ja Berlin. 1988.)

Biostatistiikan peruskurssi 1998 17 Tutkimustyypit ja -asetelmat

Page 22: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Näin ollen on helpompi saada julkaistuksi sellaisen tutkimuksen tulos,jossa todetaa merkitsevä hoitoero kuin sellaisen, missä ero ei saavutamaagisena pidettyä tilastollisen merkitsevyyden rajaa p < 0,05. Näitä jälkimmäisiä myös tutkijat jättävät helpommin pöytälaatikkoonsa.

• tutkimustulokset julkaistu epäyhtenäisesti tai huonosti hyödynnettävässä muodos-sa (esim. elossaolokäyrät ’survival curves’)

• julkaistut tulokset eivät ole käyttökelpoisia esim. perusteettomasta poissuljennois-ta tai ristikkäisasetelman purkaimisesta johtuen

Tyypin B tutkimuksissa on monia etuja verrattuna A:an ja C:en• erilaiset tarkistukset mahdollisia (tärkeää harhojen välttämiseksi)• ei menetetä informaatiota (saavutetaan maksimaalinen voima)• enemmän analyysimahdollisuuksia (esim. voidaan tehdä prognostisten tekijöiden

suhteen adjustointeja tai osaryhmäanalyyseja, jotka eivät tosin ole kovin suositel-tavia)

• paremmat mahdollisuudet antaa deskriptiivisia tietoja aineistona olevista tutki-muksista

• eri tutkimusten tutkijoilla mahdollisuus kontribuutioon

Tyyppiä C olevia tutkimuksia käytetään yleensä seuraavissa tilanteissa:• voimanmenetyksellä B-tyypin tutkimuksiin verrattuna ei ole ratkaisevaa merki-

tystä

Yleensä asia on näin. Poikkeuksena eloonjäämistutkimukset, joissa onkorkea kuolleisuus (Buyse ja Ryan 1987)

• tulokset ovat helposti tiivistettävissä; yksinkertaiset lopputulosmittarit (esim. re-duktio kokonaiskuolleisuudessa)

• paljon pieniä tutkimuksia• tutkimukset liian vanhoja, potilaskohtaisia tietoja ei ole enää käytettävissä tai

niiden uudelleen kerääminen on liian kallista

On arviotu (Cook et al. JAMA 269:2749-53,1993), että vain 30%:ssa meta-analyysejä on hyö-dynnetty myös julkaisematonta tietoa. Julkaisemattoman tiedon käyttämättä jättäminen aiheut-taa meta-analyysien tuloksiin helposti ns. julkaisuharhan (’publication bias’), jota on käytettyvoimakkaipana argumenttina kritisoitaessa meta-analyysejä (esimerkiksi Oakes 1993).

Lancetissa ja BMJ:ssä on viime aikoina julkaistu runsaasti meta-analyysiin kriittisesti suhtau-tuvia artikkeleita (Eggert 1997a-d, Smith et al. 1997), osassa näistä on ehdotettu testejä jul-kaisuharhan toteamiseksi ja menetelmiä sen korjaamiseksi. Julkaisemattomien tutkimusten tu-loksia on viime vuosina pyritty enenevässä määrin tallentamaan myös erityisiin tutkimusrkis-tereihin, mm. lääketeollisuus noudattaa yleisesti tätä käytäntöä. Vaikkakin suositeltavaa, niinon erittäin vaikeaaa hyödyntää julkaisemattomien tutkimuksien tuloksia meta-analyysissä (ks.esim Yusuf ym. 1985)

Tutkimustyypit ja -asetelmat 18 Seppo Sarna

Page 23: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Meta-analyysi vastaan suuri lääkekoe

Meta-analyysien antamien tulosten oikeellisuutta on viime vuosina, etenkin USA:ssa, pyrittytarkistamaan suorittamalla lääkekokeita (’mega trials’) kymmenien tuhansien suuruisilla tutki-musaineistoilla. Ristiriitaisiakin tuloksia on todettu. Esimerkiksi magnesiumhoito akuutissasydäninfarktissa osoittautui lumehoitoa selvästi tehokkaammaksi mega-analyysissä, mutta eisuuressa ISIS-4 tutkimuksessa Mahdollisiksi selityksiksi tälle ristiriidalle on ehdotettu muitalääkehoitoja ja eroja magnesiumhoidon ajoituksessa (Borzak ja Ridker 1995).

Allaolevassa kuvassa on esitetty magnesiumhoidon tuloksia pienistä tutkimuksista, kahdestasuuresta tutkimuksesta (LIMIT-2 ja ISIS-4, sekä kahdesta meta-analyysistä, joissa on käytettykahta eri mallia: satunnaisten vaikutusten (’random effects’) malli (A) ja kiinteitten vaikutus-ten (’fixed effects’) malli (B). Lopputulosmuuttujana on kuoleman vaarasuhteen arvio (OR) jasen 95%:n luottamusväli.

Kuvasta todetaan, että pienissä tutkimuksissa luottamusvälit ovat laveat. Kahdessa (Rasmus-sen ja Shechter) saatiin magnesiumhoito lumehoitoa paremmaksi, mutta muissa näyttöä ei saa-tu; ykkönen sisältyi väliin. Meta-analyysi A:ssa vaarasuhteen piste-estimaatti oli selvästi edul-lisen vaikutuksen puolella. Luottamusvälin yläraja tosin piti ykkösen niukasti sisällään. Sa-mankaltainen tulos tuli LIMIT-2 tutkimuksesta. Meta-analyysi kiinteitten vaikutusten mallillatuotti hyvin samankaltaisen tuloksen kuin ISIS-4 tutkimus, ei eroa ja luottamusväli kapea,mikä kuvastaa tuloksen varmuutta.

Meta-analyysejä voidaan suorittaa myös käyttäen ns. Bayesilaisia lähestymistapaa (Bayesianapproach’). Kyseessä on eräällä tavalla yleistys satunnaisten vaikutusten mallille. Bayesilaisetmenetelmät saattavat olla hyödyllisiä etenkin tutkimuskohtaisia kovariaatteja käsiteltäessä.Ongelmana Bayesilaisessa lähestymistavassa on aina se, että tarvitaan tietoa a priori jakaumis-ta, ne ovat laskennallisesti hankalia ja ohjelmia on niukasta saatavilla.

Biostatistiikan peruskurssi 1998 19 Tutkimustyypit ja -asetelmat

Page 24: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

KirjallisuuttaBegg CB and Berlin JA. Publication bias: a problem in interpreting medical data J Roy. Sta-tist. Soc A,151:419-63,1988.

Borzac and Ridker. Ann Intern Med 123: 873-7, 1995.

Buyse M and Ryan LM. Issues of Efficiency in Combining Proportions of Deaths from Seve-ral Clinical Trials. Stat in Med 6:565-576, 1987.

Cook DJ, Gyatt GH, Ryan G, Clifton J, Buckingham L, Willan A et al. Should unpublisheddata be included in meta-analyses? Current convictions and controversies. JAMA 269; 2749-52, 1993.

Egger M, Smith GD. Meta-analysis: potentials and promise. BMJ 315: 1371-4, 1997.

Egger M, Smith GD, Phillips AN. Meta-analysis: principles and procedures. BMJ 315: 1533-7, 1997.

Smith GD, Egger M, Phillips AN. Meta-analysis: beyond the grand mean? BMJ 315: 1610-4,1997.

Egger M, Smith GD. Meta-analysis: bias in location and selection of studies. BMJ 315: 61-66, 1997.

Egger M, Smith GD, Schneider M, Minder CE. Bias in meta-analysis detected by simple,graphical test. BMJ 315: 629-34, 1997

Egger M, Schneider M, Smith GD. Spurious precision? Meta-analysis of observational stu-dies. BMJ 316: 140-144, 1997.

Fleiss JL. The statistical basis of meta-analysis. Statistical Methods in Medical Research 2:121-45, 1993.

ISIS-4 (Fourth International Study of Infarct survival) Collaborative Group. ISIS-4, a rando-mized factorial trial assessing early oral captopril, oral mononitrate, and intravenous mag-nesium sulphate in 58,050 patients with suspected acute myocardial infarction. Lancet 345;669-85, 1995.

Oakes M. The logic and role of meta-analysis in clinical research. Statistical Methods in Me-dical Research 2: 147-60, 1993.

Teo KK, Yusuf S, Collins R, Held PH, Peto R. Effects of intravenous magnesium in suspec-ted acute myocardial infarction: overview of randomized trials. BMJ 303; 1499-503, 1991.

Yusuf S, Collins R Peto R et al. Intravenous and intracoronary fibrinolytic therapy in acutemyocardial infarction. overview of results on mortality, reinfarction and side-effects from 33randomized controlled trials. Eur. Heart J 6:556-85, 1985.

Woods KL, Fletcher S, Roffe C, Haidar Y. Intravenous magnesium sulphate in suspected acu-te myocardial infarctions: results of the second Leicester intravenous magnesium trial (LIMIT-2). Lancet 339; 1553-8, 1992.

Tutkimustyypit ja -asetelmat 20 Seppo Sarna

Page 25: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Aineistokoko jatutkimuksen voima-analyysi

JohdantoAineisto- eli otoskoon arviointi (’sample size determination’) ja tutkimuksen voima-analyysi(’power analysis’) ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä kysymyksiä. Neriippuvat monista eri tekijöistä. Näitä ovat mm. ryhmien välillä oletettu kliininen ero, so. vai-kutuksen suuruus (’effect size’) (∆) lopputulosmuuttujassa (’outcome measure’) ja sen mittaa-mistapa, tutkijan sopivaksi katsoma tilastollinen merkitsevyystaso (’significance level’) (α) jatestin voima (’power of test’) (1− β), eli mahdollisuus todeta ero ∆, mikäli se on olemassa.Suurilla otoksilla kyetään näyttämään toteen pieniäkin eroja tilastollisesti merkitseviksi, vaik-ka niillä ei ehkä olisi kliinistä merkitystä. Paljon suurempi ongelma on kuitenkin liian piententutkimusaineistojen käyttö. Tästä syystä huolelliset otoskokolaskelmat tulisikin sisällyttää jo-kaiseen hyvin tehtyyn tutkimussuunnitelmaan.

Erityisesti ns. "negatiivissa" satunnaistetuissa kliinisissä kokeiluissa β-virheen merkitys koros-tuu. Kun todetaan, että hoitojen välille ei saatu tilastollisesti merkitsevää eroa, herää automaat-tisesti kysymys: kuinka suuri ero tärkeimmässä lopputulosmuuttujassa oli mahdollista todetakäytetyllä aineistokoolla, eli mikä oli tutkimuksella voima.

Kirjallisuudessa on runsaasti heikkovoimaisia tutkimuksia, joissa eroa vertailtavien hoitojenvälille ei ole saatu. Pöytälaatikkoon näitä tutkimuksia jää myös runsaasti aiheuttaen meta-ana-lyyseihin julkaisuharhaa.

Freiman et al. (1978) on suorittanut arvioinnin 71:stä julkaistusta kahta eri hoitoa vertailevistasatunnaistetuista kontrolloiduista tutkimuksista, joissa kaikissa oli päädytty toteamukseen:’Kahden hoidon vertailu ei saavuttanut tilastollista merkitsevyyttä (p > 0.05). Kaikissa päälop-putulosmuuttuja oli binomiaalinen, kaksiarvoinen. Tutkimukset uudelleenarvioitiin siten, ettäolivatko tutkijat käyttäneet riittävän suurta aineistokokoa, jotta he olisivat voineet todeta to-dennäköisyydellä (P > 0.90) 25% ja 50% hoitovaikutuksen. Todettiin, että 67:llä (94%) tutki-muksella oli yli 10%:n riski olla toteamatta 25%:n hoitoeroa ja 50 (70%) tutkimusta ei olisi to-dennut edes 50%:n hoitoeroa, jota yleensä pidetään jo suurena erona satunnaistetuissa tutki-muksissa. Kun todellista hoitoeroa arvioitiin 90%:n luottamusvälien (tarkempi käsittelymyöhemmin tässä monisteessa) avulla, niin todettiin, että 57:ssä (80%) tutkimuksessa 25%:nhoitoero olisi ollut mahdollinen ja 34:ssä (48%) tutkimuksessa jopa 50% olisi voinut jäädä to-teamatta.

Esimerkkinä heikkovoimaisesta negatiivisesta tutkimuksesta voidaan mainita Cappuccion etal. (1985) BMJ:ssä julkaisema verenpainetutkimus, missä dietaarista magnesiumhoitoa verrat-tiin lumehoitoon lievää ja keskivaikeaa essentielliä hypertensiota potevilla henkilöillä. Tutki-mus oli satunnaistettu kahden periodin ristikkäistutkimus. Tutkimuksessa päätyttiin erittäinvarmaan johtopäätökseen: "Tulokset eivät anna mitään evidenssiä siitä, että oraalisella mag-nesiumhoidolla olisi merkitystä verenpaineen säätelyssä". Tutkimuksessa oli kuitenkin yhteen-

Biostatistiikan peruskurssi 1998 21 Aineistokoko ja tutkimuksen voima

Page 26: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

sä vain 17 potilasta, joten voima oli erittäin heikko kohtalaisillekin eroille. Tutkimuksessa oli-si ehdottomasti pitänyt antaa hoitoeron luottamusväli, joka olisi ollut melko lavea paljastaensiten tutkimuksen heikon voiman.

Otoskoko-ongelmaan ei yleensä ole olemassa yksinkertaista ratkaisua. Otoskokoa kasvatta-malla saadaan tunnuslukujen arvioita tarkennettua, mutta kasvattaminen lisää kuitenkin tutki-muskustannuksia, jotka monissa kliinisissä tutkimuksissa per tutkittava ovat suuria. Tämän ta-kia tutkija joutuu yleensä tasapainoilemaan toisaalta arvioitavien suureiden tarkkuuden, toi-saalta määrityskustannusten välillä. Myös tutkimukseen käytettävissä oleva aika rajaakäytännössä tutkimusaineiston keräämismahdollisuuksia. Lisäksi tilannetta vielä yleensäkomplisoi se, että yhden tutkittavan suureen asemesta ollaan kiinnostuneita samanaikaisestimonista eri suureista. Tällöin otoskoko, joka on riittävä jonkin tietyn suureen suhteen, ei vält-tämättä ole riittävä enää jonkin toisen suureen suhteen. Tällaisissa tilanteissa voidaan menetel-lä siten, että lasketaan kunkin tärkeimmän lopputulosta mittaavan suureen osalta erikseenotoskokovaatimukset ja valitaan suurin näin saatavista vaatimuksista. Otoskokolaskelmat toi-mivat käytännössä kuitenkin vain yleisenä ohjenuorana tehtäessä päätöstä aineistokoosta.Muita asiaan vaikuttavia tekijöitä ovat potilaiden saatavuus sekä eettiset ja taloudelliset kysy-mykset.

Ellei ilmoiteta tutkimuksen voimaa (= 1− β), niin jää epäselväksi:

a) sitä ei ole ennalta määritetty b) ei ole saavutettu aiottua otoskokoa c) otoskokoa on kasvatettu alunperin suunnitellusta paremman tilastollisen voiman

saavuttamiseksi d) tulokset on raportoitu ennen kuin suunniteltu otoskoko on saavutettu,

esim. hyvien välianalyysin (’interim analysis’) tulosten takia.

Mikäli näistä vaihtoehdoista a) tai b) on tosi ja tutkimuksessa on saatu negatiivinen tulos, he-rää epäily tutkimuksen voiman puutteesta. Luottamusväli auttaisi!

Mikäli a) tai c) tai d) ovat tosia ja on saatu positiivinen tulos, herää epäily että on suoritettutoistettuja välianalyysejä ja tulokset raportoitu, kun toivottu merkitsevä ero on saavutettu. Täs-tä ilmiöstä käytetään nimitystä raportoinnin ajoittamisesta johtuva harha, ja sen vaikutuksestaα-virhe kasvaa.

Kliinisten tutkimusten aineistokoon arviointiin on olemassa hyviä taulukkokokoelmia. Erit-täin hyvä ja monipuolinen on Machinin ja Campbellin ’Statistical Tables for the Design ofClinical Trials’. Se soveltuu mm. mukana kannettavaksi esim. kliinisten tutkimusten suunnit-telukokouksiin. Nykyisin on saatavissa myös hyviä ja helppokäyttöisiä Windows-ympäristös-sä toimivia erityistilasto-ohjelmistoja, esim. nQyery 2.0, Pass 6.0, Egret Siz. Näistä jälkimmäi-nen on suunnattu erityisesti epidemiologisiin tutkimusasetelmiin. Aineistokoon arvioinnistakannattaa kuitenkin pitää mielessä seuraava tosiseikka: eksakteilla hienoilla laskentakaavoillaja ohjelmilla synnytetään helposti väärä illuusio aineistokoon arvioinnin tarkkuudesta, vaikkaarviointi perustuu usein huomattavan karkeisiin lähtöoletuksiin esim. vaikutuksen suuruudes-ta.

Tyypillinen ongelma: Suunnitellaan satunnaistettua kliinistä hoitotutkimusta, missä vertail-laan perinteistä ja uutta hoitoa keskenään. Hoidon vaikutusta mitataan joko a) binomiaalisella

Aineistokoko ja tutkimuksen voima 22 Seppo Sarna

Page 27: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

astekoilla, esim. parantunut/ei parantunut tai b) jatkuvalla asteikolla, esim. verenpaineen laskutai elossaoloajan pidentyminen.

Tavallisimpia laskentatilanteita ovat• kahden suhdeluvun vertaaminen• kahden keskiarvon vertaaminen• kahden eloonjäämiskäyrän vertaaminen• vaarasuhteen testaaminen

tapaus-verrokkitutkimuskohorttitutkimus.

• suhdelukujen vertailu parittaisissa asetelmissa• kahden suhdeluvun yhtäsuuruuden testaaminen

Otoskoon määrittämiseen liittyvätavainkysymykset

Arvioitaessa otoskokoa tutkijan täytyy määritellä seuraavat asiat:• Tutkimuksen keskeisin lopputulosmuuttuja (’main outcome measure’) ja sen mit-

taluku.

• Vaikutuksen suuruus (’effect size’) (∆).

• Tilastollinen merkitsevyystaso (’statistical significance level’) α = ’väärän positii-visen tuloksen riski’ — suositus: α ≤ 0.05

• Testin voima 1− β, missä β = ’väärän negatiivisen tuloksen riski. Suositus:0.80 ≤ 1− β ≤ 0.95. Testin voima on varmuus todeta ∆:n suuruinen ero, jos se onolemassa.

• Analysointimenetelmä eron toteamiseksi.

Otoskoon arviointikaava on muotoa

n = ƒ (α, 1− β, ∆)

missä n on kuhunkin ryhmään tarvittava aineistokoko ja ƒ on parametreista α, 1− β ja ∆ riip-puva funktio. Parametrit α, β, ∆ ja n riippuvat toinen toisistaan siten, että kaikkien välillä onkäänteinen riippuvuus; jos jokin niistä kasvaa, täytyy toisen pienentyä ja päinvastoin. Esimer-kiksi aineistokoko (n) kasvaa, kun α-tasoa tiukennetaan (pienennetään) pitäen kaksi muutasuuretta β ja ∆ kiinteinä. Laskentakaavan perusteella voidaan kääntäen ratkaista myös mikä ta-hansa parametreista α, 1− β tai ∆. Yksinkertaisimmissa tilanteissa ongelmille on olemassa al-gebrallinen ratkaisu. Tavallisimmin kuitenkin joudutaan käyttämään numeerista ratkaisu-menetelmää (Newton-Raphson).

Useimmissa aineistokoon arviointiohjelmissa (esimerkiksi nQuery) voidaan mikä tahansa pa-rametreista n, α, 1− β ja ∆ ratkaista joustavasti toistensa funktioina, ja lisäksi kullekin para-metrille voidaan vuorollaan antaa vaihteluväli, jolloin saadaan taulukko arviointipäätöksen te-kemisen helpottamiseksi. Ohjelmassa nQuery on lisäksi mukana esitysgrafiikka ja mahdolli-

Biostatistiikan peruskurssi 1998 23 Aineistokoko ja tutkimuksen voima

Page 28: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

suus tuottaa protokollaa varten aineistokoon arviointilaskelma. MedStatin ohjelmassa BA eiole käänteistä ratkaisumahdollisuutta, paitsi kokeilemalla.

Yhden binomijakaumaa noudattavansuhdeluvun testaaminen

Käyttötilanne: Suunnitellaan tutkimusta, jonka tavoitteena on arvioda esim. jonkin taudin vallitsevuutta (P) tietyssä väestöryhmässä (perusjoukossa). Ase-tetaan kysymys: Kuinka suuri otos (n) (tutkittavien määrä) tarvitaan, jotta arvioitavan suureen virhe olisi korkeintaan ± e.

Tämän ongelman ratkaiseminen edellyttää suhdeluvun P luottamusvälin määrittelyä (yksi-tyikohtaisempi tarkastelu myöhemmin). Luottamusvälin pituus riippuu otoksen suuruudestaja arvioinnin varmuudesta. Normaalijakaumaan perustuva arvio binomiaaliselle suureelle saa-daan kaavalla:

P ± z1 − α ∗ √P (1 − P)n

missä z1 − α on Normaalijakauman prosenttipiste ja 100 ∗ (1 − α) ilmaisee luottamustason.

Tavallisimmin käytettyjä luottamustasoja ovat 90%, 95% tai 99%, jolloin vastaavat z-arvot

ovat 1.64, 1.96 ja 2.58. Asettamalla z1 − α ∗ √P (1 − P)n

= e saadaan n arvioksi:

n = P(1 − P) ∗ z1 − α2

e2 (1)

Tämä kaava on likimääräinen ja pätee ainoastaan suurilla otoksilla (nQuery käyttää tätä arvi-ointikaavaa). Mikäli arvioitava suhdeluku P on pieni / suuri (alle 0.05 / yli 0.95), niin binomi-aalinen väli toimii huonosti. Tällöin kannattaa käyttää Poisson-jakaumaa perustuvaa väliä (tar-kastellaan myöhemmin).

Esim. Oletetaan, että P = 0.60 ja sallitaan virheeksi e = 0.05 ja luottamus-tasoksi halutaan 95%. Yllä olevan kaavan perusteella saadaan n = 368.8 eli tarvittava aineistokoko on 369.

Huom. Useimmissa tutkimuksissa halutaan arvioida monia suhdelukuja. Tällöin on vaikea valita kaavassa tarvittavaa yksittäistä lukua P. Koska kaava antaa maksimaalisen arvon n:lle silloin kun P = 0.5, sen antama arvo kannattaa tällöin ottaa aineistokooksi. Yllä olevassa esimerkissä saatai-siin n = 385.

Aineistokoko ja tutkimuksen voima 24 Seppo Sarna

Page 29: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Kahden binomijakaumaa noudattavansuhdeluvun vertailu

Oletetaan, että kyseessä on kaksi vertailtavaa ryhmää ja hoidon tehoa arvioidaan binomiaali-sella asteikolla, esim. parantunut / ei parantunut.

Kaksi toisistaan riippumatonta ryhmää

Käyttötilanne: Suunnitellaan tutkimusta, jonka tavoitteena on vertailla esimerkiksi kahta eri lääkehoitoa saavaa, eri potilaista koostuvaa ryhmää toisiinsa. Lopputulosta arvioidaan suhdeluvuilla PE (esim. uusi hoito) ja PC (esim. traditionaalinen hoito).

Aineistokoon (n) arviointiin tässä tilanteessa on olemassa useita vaihtoehtoisia kaavoja, jotkaeroavat toisistaan ainoastaan suhdelukujen varianssien erilaisten arviointitapojen osalta.Useimmissa käytännön tilanteissa n voidaan laskea kaavalla

n = ƒ (α, β) PC (1− PC) + PE (1− PE)

∆2 (2)

jossa n = aineistokoko per ryhmä, ƒ (α, β) = (zα + zβ)2 , ∆ = PE – PC on suhdelukujen erotus,

α on yksi- tai kaksipuolinen ja β on aina yksipuolinen todennäköisyys. Kokonaisaineistokook-si tulee siten 2 * n koska kaava edellyttää, että halutaan yhtä paljon potilaita kumpaankinryhmään.

Alla olevassa taulukossa on tavallisimmin tarvittavat funktion ƒ ja z:n arvot:

Taulukko 1: ƒ:n ja z:n arvoja

Merkitsevyystaso (α) Testin voima (1− β)zαyksi-

puolinenkaksi-

puolinen70% 80% 85% 90% 95%

0.5% 1% 9.6 11.7 13.0 14.9 17.8 2.582.5% 5% 6.2 7.9 9.0 10.5 13.0 1.96

5.0% 10% 4.7 6.2 7.2 8.6 10.8 1.6410.0% 20% 3.3 4.5 5.4 6.6 8.6 1.28

Esim. Polviartroosiin liittyvien kipujen hoitokokeilun suunnittelu (Smith et al, 1983). Hoitona käytetään ihon läpi annettavaa sähköstimulaatiota (TNS-hoito). Aikaisemman kokemuksen perusteella tiedetään, että lume-hoidolla saadaan noin 25%:n vaste neljän viikon seurannassa. Tutkija arvioi, että TNS-hoidolla voitaisiin saavuttaa 65%:n vaste vastaavana ajanjaksona, eli ∆ = 0.40. Kuinka monta potilasta kumpaankin hoito-ryhmään tarvitaan, jos α = 0.05 (yksipuolinen) ja 1− β = 0.90?

Lopputulos: vaste neljän viikon seurannassa (parantui / ei parantunut)

Biostatistiikan peruskurssi 1998 25 Aineistokoko ja tutkimuksen voima

Page 30: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Ratkaisu: Sijoittamalla kaavaan (2) PC = 0.25, PE = 0.65, ∆ = 0.40,ƒ (α, β) = 8.6 saadaan n = 8.6 (0.25 0.75 + 0.65 0.35) /0.402 = 22.3Näin ollen tarvitaan 23 potilasta kumpaankin ryhmään (huom. korotuslähinnä suurimpaan kokonaislukuun).

Huom. Kaava (2) perustuu olettamukseen, että lopputuloksen arvioinnissakäytetään χ2 -testiä ilman jatkuvuuskorjausta.Ohjelman nQuery laskentakaavassa on mukana jatkuvuuskorjaus ja tulokseksi saadaan siten n = 29,4, eli n = 30. Jatkuvuuskorjauksen käyt-tö antaa yleensä melko konservatiivisen arvion. Machinin ja Campbellin taulukot antavat n = 25, koska laskenta perustuu kaavaan jossa on mukana korjaustermi. Oikea tulos lienee tässä tapauksessa välillä 23 – 30.

Kaavan (2) perusteella on mahdollista suorittaa myös testin voiman arviointia seuraavalla ta-valla:

Esim. Kahden lääkkeen vertailu mahahaavan hoidossa (Familiari et al. 1981).Hoidon kesto neljäkymmentä vuorokautta. Vertailtavat lääkehoidot: trithioziini (C), pirenzepiini (E). Hoitoaika 40 vrk. Lopputuloksenatodettiin, että hoidolla C 18⁄31 (58%) ja hoidolla E 23⁄30 (77%) parani. Ero ei ole tilastollisesti merkitsevä riskitasolla α = 0.05(kaksisuuntainen testi).

a) Jos edellä olevan tuloksen perusteella tehdään johtopäätös ’lääkkeiden välillä ei oletilastollisesti merkitsevää eroa’, niin kuinka suuri on todennäköisyys, että esimerkiksi19%:n todellinen ero jäisi käytetyllä otoskoolla toteamatta?

b) Kuinka suuri todellinen ero 80%:n voimalla ja merkitsevyystasolla 5% (kaksisuun-tainen testi) käytetyllä aineistokoolla voitaisiin todeta?

Ratkaisu a): Koska ryhmäkoot n1 = 31 ja n2 = 30 ovat erisuuria, kaavaan (2)

voidaan sijoittaa niiden harmoninen keskiarvo, eli n = 2n1n2

n1 + n2

= 30.5.

Lisäksi siihen sijoitetaan PC = 0.58, PE = 0.77, ∆= 0.19. Ratkaisemallaƒ (α, β):n suhteen saadaan arvo 2.6. Taulukosta 1 todetaan, että koska2.6 < 6.2, niin testin voima on alle 70%. Jos halutaan tarkka arvo,niin menetellään seuraavasti:

Ratkaistaan yhtälö 2.6 = (zβ + 1.96)2 zβ:n suhteen. Tällöin saadaan

zβ = − 0.35, joka vastaa β:n arvoa 0.64 (katsottavissa normaalijakauman

taulukoista tai ohjelmalla StaTable).Testin voima 1− β on siten 0.36 (36%) ja voidaan tehdä johtopäätös:’Aineistokoko ei ole riittävä nollahypoteesin (lääkkeiden välillä ei oleeroa) hyväksymiseen’.

Ohjelma nQuery antaa voimaksi 25%, tässä on mukana jatkuvuuskorjaus.

Aineistokoko ja tutkimuksen voima 26 Seppo Sarna

Page 31: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Ratkaisu b): Sijoittamalla kaavaan (2) arvot n = 30, ƒ(α, β) = 7.9, PC = 0.58,PE = 0.77 saadaan ∆ = 0.33.

Käytetyllä aineistokoolla voitaisiin siten 80% varmuudella ja 5% merkit-sevyystasolla todeta 33% ero lopputulosmuuttujassa ryhmien välillä, mikäli ero on olemassa. Ohjelmalla nQuery saadaan ratkaisuksi 34%.

Yksi otos

Mikäli PC tunnetaan, esimerkiksi aikaisempien vastaavien tutkimusten perusteella, niin kaa-van (2) antama otoskoko n voidaan tällöin karkeasti ottaen puolittaa edellyttäen, että PC ja PEovat suunnilleen yhtä suuria. Tarvittavaksi kokonaisaineistokooksi tulee siten vain 25%

(100 n⁄22n

= 25%) verrattuna tilanteeseen, missä molempien ryhmien varianssit pitää estimoida.

Esimerkiksi jos TNS-hoitoesimerkissä on vain yksi ryhmä ja vertailu suoritetaan hypoteetti-seen arvoon 0.25, nQuery antaa aineistokooksi 12.

Yleistyksiä

Kaavasta (2) on olemassa yleistykset mm. seuraaviin tilanteisiin:• vertailtaviin ryhmiin halutaan erisuuri määrä tutkittavia

(Machin & Campbell, s.11)• halutaan käyttää jatkuvuuskorjausta (Machin & Campbell, s.11).

Esim. Syöpäkuolleisuus. Seuranta-aika viisi vuotta. Oletetaan, että PC = 0.60ja että kliinisesti merkittäväksi reduktioksi arvioidaan ∆ = 0.20.Päätetään käyttää kaksisuuntaista testiä ja merkitsevyystasojaα = 0.05, 1 − β = 0.80

Kuinka suuri aineisto tarvitaan?

Ratkaisu: ƒ (α, β) = 7.8, n = 7.8 ∗ 0.6∗0.4 + 0.4∗0.6

0.22 = 94.1

eli tarvitaan 95 potilasta kumpaankin ryhmään.

Huom. Jos edellisessä esimerkissä käytettäisiin jatkuvuuskorjausta, niin

tarvittava otoskoko kasvaisi likimain määrällä 2

| PC − PE | = 10.

(nQuery antaa tuloksen n = 107 ja MedStat n = 106.)

Huom. Jos halutaan erisuuri määrä henkilöitä vertailtaviin ryhmiin,esim. n vertailuryhmään C ja k*n ryhmään E (k > 0), voidaan käyttääkaavaa

n = ƒ (α, β) ∗ kPC (1− PC) + PE (1− PE)

k ∆2 (3)

Biostatistiikan peruskurssi 1998 27 Aineistokoko ja tutkimuksen voima

Page 32: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Esim. Jos edellä olevassa esimerkissä valittaisiin k = 2, niin n = 70.6, elitarvittaisiin 71 henkilöä ryhmään C ja 142 ryhmään E.(nQuery: nE = 80, nC = 160)

Arviointi ristitulosuhteen avulla

Joissakin tilanteissa tutkijan on helpompi formuloida otoskoko-ongelma suhdeluvun PC ja ris-titulosuhteen (’riskitekijäsuhde’, ’altistesuhde’, ’odds ratio’)

OR = PE (1− PC)PC (1− PE)

avulla ∆:n asemesta. Tällöin PE voidaan laskea yhtälöstä:

PE = OR ∗ PC

OR ∗ PC + (1− PC)

ja sijoittaa kaavaan (2).

Polviartroosiesimerkissä saadaan OR = 0.65 ∗ 0.750.25 ∗ 0.35

= 5.57 ja voitaisiin siten kysyä otosko-

koa, joka antaisi vertailtavien ryhmien välille 5.57-kertaisen ristitulosuhteen hoitoeron 0.40 si-jasta.

Aineistokoon (n), vertailuryhmän suhdeluvun (PC) ja ristitulosuhteen (OR) perusteella voi-daan arvioda OR:n luotettavuutta sen luottamusvälin perusteella (luottamusvälien laskentakaa-vat esitetään myöhemmin).

Esim. Ennenaikaisten synnytysten vaara (nQuery manuaali, s.15-13.) Hypoteettinen esimerkki suunnitellusta tutkimuksesta raskaana olevilla äideillä. Tavoitteena oli ehkäistä ennenaikaisia synnytysten määrää tietyn koulutusohjelman avulla. Tutkittavia ryhmiä oli kaksi: ryhmä E sai koulutusta ja ryhmä C ei. Tutkijat olivat valmiit ottamaan kumpaan-kin ryhmään 500 äitiä ja halusivat pudottaa koulutuksen avulla ennen-aikaisten synnytysten ORE/C:n 0.5:een (50%:n suojaava vaikutus). Aikai-sempien tutkimusten perusteella he arvioivat, että C-ryhmässä ennen-aikaisia synnytyksiä voisi olla 8%. Tutkijat kysyivät: kuinka suuri on OR:n 95%:n luottamusväli? Ohjelmalla nQuery saadaan väliksi (0.290 , 0.862). Todetaan, että 1 ei sisälly väliin, mutta väli on melko lavea.

Parittaiset aineistot

Kaavaa (2) voidaan soveltaa myös parittaisten (kaltaistettujen) aineistojen tapauksessa seuraa-vasti. Oletetaan, että tutkimusaineisto muodostuu havaintopareista: tapaus - verrokki tai samahenkilö kahtena eri hoitojaksona (ristikkäistutkimus) ja lopputulos on kaksiarvoinen (kyllä –ei). Oletetaan, että m:stä havaintoparista on saatu lopputulokseksi seuraava frekvenssitauluk-ko:

Aineistokoko ja tutkimuksen voima 28 Seppo Sarna

Page 33: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Tapaus-verrokki -asetelma

Verrokki (C)

Altistus Kyllä Ei

Tapaus (E)Kyllä t r

Ei s u

Ristikkäistutkimus

Hoitojakso1 (C)

Positiivinenvaste

Kyllä Ei

Hoitojakso2(E)

Kyllä t r

Ei s u

Lopputuloksen ’kyllä’ suhdeluvut ryhmissä C ja E ovat siten:

PC = t + sm

PE = t + rm

Parittainen testaus perustuu diskordantteihin (lopputulos erilainen) havaintopareihin, eli frek-vensseihin r ja s. Testisuure (McNemarin testi) on :

χ2 = | r − s | 2

r + s

Nollahypoteesin mukaisesti diskordantteja pareja on yhtä paljon (r = s), eli niiden suhdeluku

Ω0 = r

r + s =

sr + s

= 0.5

Vaihtoehtoisen hypoteesin mukaista suhdelukua Ω1 on käytännössä vaikea ennalta määritellä.Jos voidaan karkeasti olettaa, että kaltaistustekijät eivät vaikuta ’kyllä’-vastauksen todennä-köisyyteen (esim. myönteinen hoitovaste), niin Ω1 saadaan seuraavasta kaavasta:

Ω1 = PC (1− PE)

PC (1− PE) + PE (1− PC)(4)

Sijoittamalla kaavaan (2) PC:n ja PE:n paikalle Ω0 ja Ω1, ja jakamalla näin saatu luku n kahdel-la saadaan diskordanttien parien odotettu määrä k. Yllä esitetyin oletuksin tarvittava aineisto-koko m (= parien määrä) saadaan kaavasta:

m = k

PC (1− PE) + PE (1− PC)(5)

Biostatistiikan peruskurssi 1998 29 Aineistokoko ja tutkimuksen voima

Page 34: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Esim. Estrogeenialtistus ja kohtusyöpä (Brown 1976). Tutkimuksessa olimukana 63 ’tapaus-verrokki’ -paria ja lopputulokseksi saatiin neli-kenttä:

Verrokki (C)

Altistunut Kyllä Ei Yhteensä

Tapaus(E)

Kyllä 27 29 56

Ei 3 4 7

Yhteensä 30 33 63

Jos oletetaan, että vasta suunniteltaisiin tätä tutkimusta ja kysyttäisiin: Kuinka paljon pareja

tarvitaan, jos α = 0.01, 1− β = 0.90, PC = 3063

= 0.48 ja PE = 5663

= 0.86?

Ratkaisu: Kaavasta (4) saadaan ensin Ω1 = 0.10. Sijoittamalla kaavaan (2) arvot

ƒ (α, β) = 14.9, PC = Ω0 = 0.50, PE = Ω1 = 0.10 ja ∆ = 0.40 saadaan n = 31.7.

Diskordanttien parien odotettu määrä on siten puolet tästä määrästä,eli k = 16.

Sijoittamalla kaavaan (5) saadaan tutkimukseen tarvittavien parien

määräksi m = 16

0.48 ∗ 0.11 + 0.89 ∗ 0.52 = 31

(nQuery: m = 35, ero johtuu jatkuvuuskorjauksesta)

Huom. Jos edellä olevasta nelikentästä lasketaan McNemarin testi, niinsaadaan χ2= 21.1 ja P <0.0001.

Kahden suhdeluvun ekvivalenttisuudentestaaminen

Sellaisten kliinisten tutkimusten määrä, joissa pyritään ns. bioekvivalenttisuuden toteennäyttä-miseen, esimerkiksi kahden eri hoitomuodon välillä, on viime vuosina lisääntynyt voimak-kaasti. Tavallisin tilanne on sellainen, että on olemassa jokin klassinen (kontrolli-) hoitomuo-to C, jonka teho PC tiedetään hyväksi, mutta jolla on paljon sivuvaikutuksia. Tutkimuksessakokeillaan uutta hoitomuotoa E, jolla on vähemmän sivuvaikutuksia, mutta tehon PE ei oletetaaivan yltävän klassisen hoidon tasolle. Hoidot katsotaan bioekvivalenteiksi, mikäli tehojenero ei ylitä tutkijan ennalta määrittelemää pientä määrää ε (> 0); PC - PE < ε. Tällaisessa tilan-teessa tarvittava aineistokoko n yhtä hoitomuotoa kohden saadaan kaavasta:

n = ƒ (α, β) ∗ PC (1− PC) + PE (1− PE)

[ε − (PC − PE)]2(6)

Aineistokoko ja tutkimuksen voima 30 Seppo Sarna

Page 35: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Käyttö:

• ’negatiiviset’ kokeet• ’bioekvivalenssi’

Hoitovaste: PC klassinen hoitoPE uusi hoito

Bioekvivalenttisuus: PC – PE < ε ; ε ≥ 0

Kaavaa (6) käytetään tavallisesti siten, että asetetaan PE = PC = P.

Huom. Makuch ja Simon (1978) suosittelevat, että kaavassa (6) käytettäisiinseuraavia arvoja:

α = 0.10 (yksipuoleinen)

β = 0.20

ε = 0.10

Esim. Vaiheen I rintasyövän hoidot (Machin & Campbell, s.36): Mastectomia (C), Kyhmyn poisto (E). Seuranta-aika 5 vuotta.

Oletetaan, että PC =0.60 ja että hoidot katsotaan bioekvivalenteiksi, josPE on vähintään 0.50, eli ε = 0.10. Jos lisäksi vaaditaan, että α= 0.10(yksipuolinen testi) ja 1− β= 0.80, niin kuinka paljon potilaitakumpaankin ryhmään tarvitaan?

Ratkaisu: Asetetaan PE = PC = 0.60. Taulukon 1 perusteella ƒ (α, β) = 4.5. Sijoit-tamalla nämä arvot kaavaan (6) saadaan n = 216, eli näin monta poti-lasta tarvitaan kumpaankin hoitoryhmään.

Huom. Jos ei ole realistista tehdä oletusta PE = PC, vaan PE < PC, niin otos-kokoa joudutaan yleensä selvästi kasvattamaan, koska kaavassa (6)nimittäjä pienenee.

Kvantitatiivinen lopputulos, kahdenkeskiarvon vertailu

Usein kliinisten tutkimusten lopputulosmuuttuja on kvantitatiivinen, ja halutaan tutkia, onkoryhmien keskiarvojen välillä eroa. Mikäli kyseessä on yksi ryhmä ja kaksi ajankohtaa, käyte-tään joko parittaista t-testiä tai sen ei-parametrista vaihtoehtoa Wilcoxonin testiä. Jos taas ky-seessä on toisistaan riippumattomat vertailtavat ryhmät, testinä käytetään kahden otoksen t-testiä tai Mann-Whitney-Wilcoxon testiä

Biostatistiikan peruskurssi 1998 31 Aineistokoko ja tutkimuksen voima

Page 36: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Yksi otos, yksi tai kaksi ajankohtaa tai periodia

Käyttötilanne: a) halutaan verrata aineistosta laskettua keskiarvoa hypoteettiseen arvoon, taib) halutaan tutkia jonkin kvantitatiivisen suureen (esimerkiksi veren- paine) muutosta kahden ajankohdan välillä

Tällaisessa tilanteessa voidaan tarvittava aineistokoko laskea kaavalla:

n = ƒ (α, β)

d 2 + zα2

2(8)

jossa ƒ on kuten edellä, d on standardoitu erotus nollahypoteesin ja vaihtoehtoisen hypoteesin

määrittelemien keskiarvojen µ0 ja µ1 erotuksesta d = | µ0 − µ1 |

σ, ja σ on tarkasteltavan suureen

perusjoukon standardipoikkeama. Normaalijakauman prosenttipisteen zα tavallisimmin käyte-

tyt arvot ovat: z0.01 = 2.58, z0.05 = 1.96, z0.10 = 1.64. Tavallisimmin käytettävät ƒ (α, β) arvotlöytyvät edellä olevasta taulukosta 1.

Esim. Oletetaan, että ’terve-lapsi’ -tutkimuksessa on todettu lapsen keskimää-räiseksi kävelemäänoppimisiäksi µ0 = 12 kk.

Halutaan tutkia oppivatko synnynnäistä sydänvikaa potevat lapsetkävelemään myöhemmin kuin terveet lapset ja halutaan todeta 0.5 stan-dardipoikkeaman ero yksisuuntaisella testillä siten, että α = 0.025 ja1 − β = 0.95. Paljonko tutkittavia lapsia tarvitaan?

Taulukon 1 perusteella saadaan ƒ (α, β) = 13.0, zα = 1.96. Sijoittamalla kaavaan (8) saadaan

n = 13

0.52 + 1.962

2 = 53.92, eli tarvitaan 54 lasta.

Huom. Parittaisen t-testin tapauksessa µ0 asetetaan tavallisesti nollaksi.

Huom. Mikäli standardipoikkeamaa ei kyetä arvioimaan, niin d:lle voidaan käyttää arvoja väliltä 0.1 - 1.0 (Cohen 1988). Efektiä voidaan arvioidad:n suhteen seuraavasti:

Efekti (d) Arvio

noin 0.2 Pieni kliininen efekti

noin 0.5 Kohtalainen kliininen efekti

noin 0.8 Suuri kliininen efekti

Jos sitä vastoin tunnetaan tarkasteltavan suureen vaihteluväli, niinstandardipoikkeama voidaan karkeasti arvioida jakamalla vaihteluväli neljällä. Myös ristikkäistutkimuksissa voidaan soveltaa kaavaa (8).

Aineistokoko ja tutkimuksen voima 32 Seppo Sarna

Page 37: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Esim. Suunitellaan tutkimusta, jonka tavoitteena on vertailla tietyn lääkkeen verenpainetta alentavaa vaikutusta. Oletetaan, että efekti halutaan todeta yhden tunnin kuluessa, jos se on olemassa. Kliinisesti merkittäväksi efektin suuruudeksi arvioidaan 10 mmHg. Tämän eron tutkija haluaa todeta 90% varmuudella (1 − β) ja yksisuuntaisella merkitsevyystasolla α = 0.05. Oletetaan aikaisempien vastaavanlaisten tutkimusten perus-teella voitavan arvioida, että σ = 10 mmHg (vaihtelu yksilökohtaisesti tunnin sisällä). Tällöin

d = 1.01.0

= 1, z0.10 = 1.64, ƒ (α, β) = 8.6, n = 8.61

+ 1.642

2 = 9.94,

eli tarvitaan 10 potilasta.

Kahden otoksen t-testi

Käyttötilanne: Halutaan verrata kahden toisistaan riippumattoman ryhmän (esimerkiksi kahden hoitoryhmän) keskiarvoja toisiinsa t-testillä.

Valitaan µ0:ksi esim. lumeryhmän keskiarvo ja µ1:ksi hoitoryhmän keskiarvo. Kaava (8) mo-difioituu tällöin muotoon:

n = 2 ∗ ƒ (α, β)

d2 + zα 2

4(9)

Huom. Useimmissa käytännön tilanteissa ƒ (α, β):n zα:n arvot löytyvät edellä olevasta taulukosta 1.

Huom. Jos 2α = β = 0.05, saadaan taulukon 1 perusteella ƒ (α, β) = 13 ja

zα = 1.96. Tällöin pätee likimain yhtälö n = 26d2, eli jos standardoitu

hoitoero on 1 (kliinisesti suuri ero) tarvitaan 26 potilasta kumpaankin ryhmään, ja jos d = 0.1 (kliinisesti hyvin pieni ero) tarvitaan potilaita 2600 kumpaankin ryhmään.

Esim. Suunnitellaan tutkimusta, jonka tavoitteena on vertailla lääkehoidon (ryhmä 1) ja lumehoidon (ryhmä 0) eroa verenpaineen laskun suhteen. Oletetaan, että µ1 = 0, µ1 = 10 ja σ = 10 mmHg, eli halutaan todeta standardoitu erotus 1.0 jos se on olemassa. Oletetaan, että käytetään riippumattomien otosten t-testiä ja kaksisuuntaista merkitsevyystasoa α = 0.05, ja halutaan voimaksi 1 − β = 0.9. Tällöin

a) α = 0.05 (kaksisuuntainen)

n = 2 ∗ 10.5

1 + 1.962

1 = 21.8 eli tarvitaan 22 potilasta

(taulukko A2: n = 22)

Biostatistiikan peruskurssi 1998 33 Aineistokoko ja tutkimuksen voima

Page 38: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

b) α = 0.05 (yksisuuntainen)

n = 2 ∗ 8.61

+ 1.642

4 = 17.87 eli tarvitaan 18 potilasta.

Esim. D-vitamiinihoito raskaana olevilla naisillaneonataalisen hypokalsemian ehkäisemiseksi (Cockburn et al. 1980)

Naiset satunnaistettiin kahteen ryhmään: D-vitamiinihoito ja lumehoito.

Kalsiumin määritys seerumista suoritettiin viikko lapsen syntymän jäl-keen. Oletetaan, että µ0 = 9.0 mg/100 ml, σ = 1.8 mg/100 ml ja kliini-sesti merkitsevä muutos olisi 0.5 mg/100 mlPäätetään, että käytetään arvoja: α = 0.05, 1− β = 0.95

d = 0.51.8

= 0.28 mg/100 ml (=standardoitu hoitovasteiden erotus).

Tällöin ƒ(α,β) = 13.0 ja zα = 1.96, joten

n = 2∗ 13.00.282 +

1.962

4 = 338

Huom. Jos 2α = β = 0.05, saadaan taulukon 1 perusteella ƒ (α, β) = 13 ja

zα = 1.96. Tällöin pätee likimain yhtälö n = 26d 2 , eli standardoitu

hoitoero on 1 (kliinisesti suuri ero), tarvitaan 26 potilasta kumpaankin ryhmään, ja jos d = 0.1 (kliinisesti hyvin pieni ero) tarvitaan potilaita 2600 kumpaankin ryhmään.

Huom. µ0:n, σ:n ja d:n valinta on käytännössä yleensä vaikeaa. Esimerkissävoitaisiin menetellä seuraavasti:

Asetetaan lapsen hypokalsemian rajaksi seerumin kalsium ylittää 7.4 mg/100 ml ja oletetaan, että PC = 20% (lumeryhmä) ja PE = 10% (D-vitamiinihoitoryhmä), ∆ = 10%, α = 0.05, 1− β = 0.95

Kaavan (2) ja taulukon 1 perusteella saadaan n = 325.(Taulukko A1: n=329. nQuery: n=329.)

Esim. Kahden periodin ristikkäistutkimusasetelma (nQueryn manuaali s. 13.8). Suunnitellaan syöpätutkimusta, jonka tavoitteena on verrata uutta neut-ropenian vähentämiseen tähtäävää hoitoa lumehoitoon. Lopputulos-muuttujana on niiden päivien lukumäärä, jolloin potilaalla kemoterapian seurauksena on neutropeniaa (neutrofiilen määrä alle tietyn rajan). Suun-nitellaan, että käytetään kaksisuuntaista t-testiä merkitsevyystasolla 5%. Oletetaan, että eri hoitosyklien (lume-hoito/hoito-lume) välillä ei ole ’carry-over’-efektiä. Tutkija kysyy riittääkö 30 potilasta tuottamaan riit-tävän voiman todeta neutropenian kestossa reduktio 3 vrk, kun aiem-

Aineistokoko ja tutkimuksen voima 34 Seppo Sarna

Page 39: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

massa pilottitutkimuksessa neutropenian on todettu kestävän keski-määrin 6 vrk ja että keskihajonta kahden syklin välillä on 5.2.

Ratkaisu: nQuery antaa voimaksi 86%, jota voidaan ylläolevassa tilanteessa riittävänä.

Ei-parametriset testit

Mikäli t-testin asemesta käytetään joko Wilcoxonin parittaista testiä (’Wilcoxon matched pairtest’, ’Wilcoxon pairwise test’) tai Wilcoxonin järjestyslukujen summatestiä (’WilcoxonRank-Sum test’) joka on sama kuin Mann-Whitneyn U-testi, voidaan voimalaskelmat tehdäedellä olevilla kaavoilla käyttäen yksinkertaista korjaustekijää. Korjaustekijä riippuu jakaumi-en todellisesta muodosta seuraavasti:

tasainen jakauma 1

kaksinkertainen eksponentiaalijakauma23

≈ 0.67

logistinen jakauma9

π2 ≈ 0.91

normaalijakaumaπ3

≈ 1.05

Todetaan, että normaalijakauman tapauksessa Mann-Whitneyn U-testiä käytettäessä tarvitaannoin 5% suurempi aineisto kuin käytettäessä t-testiä. Yleensä Mann-Whitneyn testiä käyte-tään kun jakaumat ovat vinoja, jolloin Mann-Whitneyn testi vaatii pienemmän aineistokoonkuin t-testi; esimerkiksi logistisen jakauman tapauksessa vain 91% t-testin vaatimasta aineisto-koosta.

Esimerkiksi Pass 6.0 suorittaa yllä mainitut korjaukset, ohjelmassa nQuery on mahdollista ar-vioida aineistokokoa myös silloin kun käytetään ei-parametrisiä testejä.

Esim. Oletetaan, että edellä tarkastellussa verenpainetutkimusesimerkissä halutaan käyttää t-testin asemesta Mann-Whitneyn U-testiä.

Aluksi arvioida efektin suuruus. Oletetaan että vertailtavien ryhmien havaintoarvot ovat x1i, i=1,...n1 ja x2i, i=1,...n2. Oletetaan, että n1 < n2. U-testisuureelle on seuraavanlainen käytännön tulkinta: Se ilmoittaa niiden havaintoparien lukumäärän (k), joille pätee x1i < x2i. Jos merki-tään n:llä kaikkien mahdollisten havaintoparien määrää n:llä, niin efektin suuruus voidaan arvioida p1 = P(x1i < x2i) = k / n. Standardoitua keskiarvojen erotusta 1.0 vastaavaksi arvioksi saadaan (nQuery) 0.760 ja tarvittavaksi potilasmääräksi tulee n=26 (nQuery). Tässä arviossa ei ole huomioitu jakauman muotoa, siksi n on suurempi kuin mitä t-testin yhteydessä saatiin.

Huom. Mikäli ryhmien välillä ei olisi eroa, niin p1 = 0.500. Standardoituja ero-tuksia 0.2 (’pieni efekti’),0.5 (’kohtalainen efekti’) ja 0.8 (’suuri efekti’) vastaavat arvot ovat: 0.556,0.638, ja 0.714.

Biostatistiikan peruskurssi 1998 35 Aineistokoko ja tutkimuksen voima

Page 40: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Muita otoskoon laskentatilanteitaTutkimusasetelman ja -problematiikan johdosta joudutaan usein käyttämään myös muita kuinedellä esitettyjä kaavoja. Tällaisia tilanteita syntyy mm. silloin, kun halutaan

• vertailla samanaikaisesti useampia ryhmäkeskiarvoja (F-testi, Anova) keskenään(Ohjelmat nQuery ja Pass 6.0. Teoria: Day & Graham, 1989)

• toistomittausten Anova (Ohjelmat nQuery ja Pass 6.0)• satunnaistettujen lohkojen Anova (Ohjelmat nQuery ja Pass 6.0)• seurata jonkin markkinoille tulleen uuden lääkkeen sivuvaikutuksia (Machin &

Campbell, 1987)• vertailla aikaa, joka kuluu jonkin tapahtuman ilmaantumiseen logrank-testillä

(Ohjelmat nQuery ja Pass 6.0)• käyttää ositettua satunnaistamista• ottaa huomioon seurannasta kadotettujen vaikutus otoskokoon• arvioida aika, joka kuluu maksimaalisen hyödyn saavuttamiseen eri hoitomuodoil-

la• verrata korrelaatiokertoimia keskenään. (Ohjelmat nQuery ja Pass 6.0)• verrata ristikkäistutkimusasetelmassa preferenssejä (MedStat: SUPPSIZE).

KommenttejaKun tilastollinen ohjelmapaketti tai taulukoiden käyttö on tuottanut tutkijalle tarvittavaksiotoskooksi esimerkiksi luvun 989, on seurauksena yleensä tutkijan turhautuminen — enhänminä noin suurta aineistoa voi saada kokoon. Tällöin on syytä muistaa, että huolimatta otos-koon arvioinnin näennäisestä matemaattisesta tarkkuudesta, on taustalla kuitenkin monia rat-kaisemattomia tieteellisiä ongelmia, kuten esimerkiksi seuraavat:

Yhden lopputulosmuuttujan käyttö laskentakaavoissa• Käytännössä jokaisessa kliinisessä tutkimuksessa on useita sekä ’kovia’ (esim.

kuolema) että ’pehmeitä’ (esim. arviointiskaalat) lopputulosmuuttujia. Aineisto-koon arviointi pitäisi itse asiassa suorittaa käyttämällä monimuuttujamenetelmiä.Sellaisia menetelmiä, jotka toimisivat tyydyttävästi kliinisten tutkimusten yh-teydessä, ei ole kuitenkaan ainakaan kirjoittajan tiedossa. Yleensä otoskokolaskel-mat suoritetaan tärkeimmän kovan lopputulosmuuttujan suhteen. Tällämenettelyllä on kuitenkin taipumus tuottaa tarpeettoman suuri aineistokoko peh-meiden muuttujien tarpeisiin, sillä saavutettavissa olevat kliinisesti merkitykselli-set erot ovat yleensä kovissa muuttujissa suhteellisesti pienempiä kuin pehmeissä.Suositeltavaa onkin kokeilla otoskokolaskelmissa tärkeimpiä molemmantyyppisiämuuttujia ennen lopullista päätöksentekoa.

Perusjoukon tuntemattomien suureiden arvojen valinta• Tällaisia perusjoukon tuntemattomia suureita ovat esimerkiksi kliinisesti merki-

tyksellinen ero (∆), kontrolliryhmän suhdeluku (PC), vaarasuhde (R), perusjoukonstandardipoikkeama jne. Näiden suureiden valinta perustuu yleensä aikaisempiin

Aineistokoko ja tutkimuksen voima 36 Seppo Sarna

Page 41: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

vastaaviin tutkimuksiin tai on enemmän tai vähemmän hatusta otettua. Valinnallasaattaa olla kuitenkin huomattava merkitys otoskoon kannalta. Vaikeimmin arvi-oitavissa ovat tavallisesti standardipoikkeamat, sillä tarkasteltavan suureen ja-kaumaa ei yleensä kovin hyvin tunneta, ja arvio joudutaan muodostamaanyhdistelemällä useiden erillistutkimusten tuloksia. Kannattaa kuitenkin mieluum-min yrittää arviointia kuin tyytyä tekemään tarkasteltava suure kaksiarvoiseksi,jolloin menetetään paljon informaatiota.

Tilastollisen merkitsevyystason ja testin voimakkuuden valinta• Nämä valinnat ovat täysin tutkijan määriteltävissä. Ei ole olemassa mitään mate-

maattista sääntöä, joka määräisi esimerkiksi, että merkitsevyystason pitää olla 5%,jota tunnetulla biometrian oppi-isällä R. A. Fisherillä oli tapana käyttää ja jostamyöhemmin muodostui koko tilastomaailman noudattama käytäntö. Lisäksi pitääottaa huomioon tullaanko tutkimuksessa käyttämään yksi- vai kaksisuuntaistatestiä. Yleisohje tähän tilanteeseen on seuraava:

käytetään kaksisuuntaista testiä, ellei aikaisempiin tutkimuksiin perustuvanäyttö yksisuuntaisen testin puolesta ole erittäin vakuuttavakäytetään merkitsevyystasoa 5% tai 1%käytetään testin voimakkuutta 80% – 95%.

ViitteetBrown SE. Estrogen and endometrial cancer in a retirement community. NEJM 294: 1262-67,

1976.

Cockburn F, Belton NR, Purvis RJ et al. Maternal vitamin D intake and mineral metabolismin mothers and their newborn infants. BMJ 281: 11-14, 1980.

Day SJ, Graham DF. Sample size and power for comparing two or more treatment groups inclinical trials. Br Med J 1989; 299: 663-5.

Familiari L, Postorino S, Turiano S, Luzza G. Comparison of pirenzepine and trihiozine withplacebo in treatment of peptic ulcer. Clinical Trial J. 18: 363-8, 1981.

Freiman KA, Chalmers TC, Smith H Jr, Kuebler RR. The importance of beta, the type II errorand sample size in the design and interpretation of the randomized control trial. Survey of71 "negative" trials. N Engl J Med 299: 690-694, 1978.

Makuch R, Simon R. Sample size requirements for evaluating a conservative therapy. CancerTreat. Rep. 621: 1037-40, 1980.

Pocock SJ. Clinical trials. A practical approach. ss. 123-138. John Wiley and Sons, Chiches-ter, 1983.

Smith CR, Lewith GT, Machin D. A preliminary study to establish a controlled method of as-sessing transcutaneous nerve stimulation (TNS) as a treatment for the pain caused by os-teoarthritis (OA) of the knee. Physiotherapy 69: 266-8, 1983.

Biostatistiikan peruskurssi 1998 37 Aineistokoko ja tutkimuksen voima

Page 42: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

KirjallisuuttaCohen J. Statistical power analysis for the behavioral sciences, revised ed. Academic Press,

Lawrence Erlbaum Associates, Hillsdale, New Jersey, 1988.• Paljon esimerkkejä, muttei kliinisistä kokeiluista. Hyvä kirja.

Dupont W and Plummer WD. Power and sample size calculations -- a review and a computerprogram. Controlled Clinical Trials 1990;11:116-28.

• Hyvä dokumentti julkisohjelmasta.

Kraemer HC and Thiemann S. (1987) How many subjects? Sage publications, 2111 WestHillcrest Drive, Newbury Park, CA. 91320

• Erittäin hyvä johdattelu voima-analyysiin.

Lipsey MW. (1990) Design Sensitivity Statistical Power for Experimental Research. Sagepublications, 2111 West Hillcrest Drive, Newbury Park, CA. 91320

• Erittäin hyvä johdattely voima-analyysiin.

Machin D & Campbell MJ. Statistical tables for the design of clinical trials. Blackwell Scienti-fic Publ. Oxford, 1987.

• Hyvä taulukkokokoelma ja paljon esimerkkejä kliinisistä tutkimuksista. Aikakallis kirja (noin US$150).

OhjelmianQuery AdviserTM Sample Size Determinations. Statistical Solutions, LTD. Fax: +353-21-

319 630.

Pass 6.0 Power Analysis and Sample Size for Windows. NCSS, Jerry L. Hintze, Kaysville,Utah, 1996.

Egret Siz. Sample size and power for nonlinear regression. Statistics and Research Corporati-on. Fax: +1-206-547 4140.

Aineistokoko ja tutkimuksen voima 38 Seppo Sarna

Page 43: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Satunnaistaminenja sokkouttaminen

YleistäHuomattava osa, etenkin faasi III:n, kliinisistä tutkimuksista on vertailevia (’comparativetrials’), joissa yhtä tai useampia hoitoja verrataan johonkin yleisesti hyväksyttyyn/käytettyynstandardihoitoon, kontrolliin. Uutta hoitoa saaneiden vertaaminen aikaisemmin hoidettuihinpotilaisiin (’historical controls’) voi antaa erittäin harhaisen tuloksen, koska olosuhteet ja hoi-tokäytännöt saattavat olla olennaisesti muuttuneet. Nykyisin historiallisten kontrollien käyttötutkimuksissa on melko harvinaista. Joskus eettiset syyt saattavat pakottaa historiallisten kont-rollien käyttöön.

Tieteellisesti ideaalista vertailevaa kliinistä koetta voidaan luonnehtia seuraavasti:• Vertailtavat ryhmät tutkitaan samanaikaisesti.• Vertailtavat ryhmät ovat tutkimuksen aloitushetkellä mahdollisimman samankal-

taisia kaikkien muiden tekijöiden kuin tutkittavan uuden hoitomuodon tai lääkkeensuhteen.

• Vertailukelpoisuus tulisi säilyä tutkimuksen kuluessa.

Satunnaistamisen tavoiteet ovat:1) Tehdä vertailtavat ryhmät tausta- tai ennustetekijöiltään mahdollisimman samankal-

taisiksi tutkimuksen alkaessa2) Estää subjektiivisten tekijöiden vaikutus tutkimuksen lopputulokseen.

Esim. Satunnaistamisen tarpeelisuus. Monivitamiinihoidot ja hermostoputkensulkeutumishäiriöt. (Smithells et al. 1980, Smithells et al. 1981)

Monivitamiinihoitoa raskauden aikana saaneita äitejä verrattiin ryhmäänäitejä, jotka eivät olleet saaneet vitamiinisupplementaatiota. Kahdestatutkimuksesta saatiin yhdistettynä seuraavat tulokset kun lopputulos-muuttujana (’outcome measure’) oli syntyneen lapsen hermostoputkensulkeutumishäiriön suhteellinen määrä.

Yhdistetty lopputulos oli:

Monivitamiinihoito Kontrolli

Synnytysten lukumäärä 397 493

Häiriöiden lukumäärä 3 (0.8 %) 23 (4.7%)

Tutkijat ilmoittivat johtopäätöksenään, että monivitamiinihoidosta onmerkittävä hyöty (p = 0.003, yksisuuntainen testi) ja suosittelivat moni-vitamiinihoidon käyttöönottoa raskaana oleville naisille.

Biostatistiikan peruskurssi 1998 39 Satunnaistaminen ja sokkouttaminen

Page 44: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Ongelmana tässä tutkimuksessa on se, että kontrolliryhmä ei ollut satun-naistettu. Kontrolliryhmän lähempi tarkastelu osoitti mm.,että kontrolli-ryhmään oli valikoitunut huomattavasti enemmän äitejä korkean riskinalueelta, Pohjois-Irlannista. Ei-satunnaistettujen tutkimusten perusteellaei yleesä voida saada riittävää tieteellistä näyttöä todellisista hoitoeroistaja siten hoitokäytäntöjä ei niiden perusteella tulisi muuttaa.

Todellinen ongelma ei-satunnaistettujen tutkimusten suhteen on kuitenkin se, että ne saattavatestää tai olennaisesti haitata satunnaistettujen tieteelliset kriteerit täyttävien tutkimusten suorit-tamista, koska niitä saatetaan pitää epäeettisinä. Yllä mainitutkin tutkimukset herättivät huo-mattavaa keskustelua Brittein saarilla 1980-luvulla ja useita satunnaistettuja tutkimuksia ai-heesta on jälkeenpäin suoritettu. Edelleen kuitenkin hermostoputken sukeutumishäiriön syyon tuntematon, mutta mm. foolihapolla on todettu olevan tärkeä osuus hermostoputken sul-keutumisessa.

Satunnaistettuja tutkimuksia on kolmea eri tyyppiä: • avoimet (’open’)• yksöissokko (’single-blind’)• kaksoissokko (’double blind’)

Avoimissa tutkimuksissa satunnaistaminen suoritetaan esimerkiksi leikkausjärjestyksessä (eiyleensä sairaalaantulojärjestyksessä). Tällöin on erittäin tärkeää että, satunnaistamiskoodi eiole kenelläkään hoitohenkilökunnasta tiedossa ennen kuin leikkaus on suoritettu. Sen jälkeen,yleensä jonkun tietyn protokollassa määritellyn ajan kuluttua päätetään, tayttääkö potilas jat-kohoidon edellytykset ja pidetäänkö hänet tutkimuksessa, jonka jälkeen sekä potilas, että hoi-tohenkilökunta on tietoinen mitä jatkohoitoa kukin potilas saa. Tutkimusta valvovien henkilöi-den vastuulla on seurata hoidon toteutumista ja asianmukaista kirjaamista. Potilaiden hoidos-sa tulee noudattaa tarkoin protokollaa, jotta subjektiiviset tekijät eivät pääsisi vaikuttamaanlopputulokseen. Kaikkia potilaita tulee tutkia yhtä usein, eikä esimerkiksi siten, että uutta hoi-toa saavia tutkittaisiin useammin ja tarkemmin. Etenkin avoimissa tutkimuksissa randomisaa-tiokoodi kannattaa sulkea potilaskohtaisiin kirjekuoriin, jotka kulkevat potilaspapereiden mu-kana.

Yksöissokkotutkimuksissa ainoastaan potilas ei tiedä mitä hoitoa hän saa, mutta hoitohenkilö-kunta tietää. Valtaenemmistö vertailevista tutkimuksista toteutetaan kuitenkin kaksoissokko-periaatteella, jolloin myöskään hoitohenkilökunta ei ole tietoinen potilaan saamasta hoidosta.Satunnaistamiskoodi avataan vasta, kun tutkimustiedosto on esitarkastettu, korjattu ja suljettu.Tutkimustuloksia käsittelevien henkilöidenkään ei tulisi tietää hoitokoodeista ennenkuin tär-keimmät tulokset on analysoitu. Hoidoista kannattaa käytää esim. koodeja A, B, C, jne. ana-lysoinnin alkuvaiheessa.

Satunnaistetut ryhmät voivat olla kooltaan erisuuria. Tavallisinta on kuitenkin käyttää 1:1 sa-tunnaistamissuhdetta, eli yhtä paljon potilaita uuteen ja kontrollihoitoon tai jos vertailtaviahoitoja on useita, niin käytetään samaa potilasmäärää kaikissa ryhmissä. Joskus eettisiin syi-hin vedoten vertailuryhmä saatetaan jättää pienemmäksi. Ainakin 1/3 potilaista tulisi kuiten-kin tällöinkin olla satunnaistettuja kontrolleita.

Satunnaistaminen ja sokkouttaminen 40 Seppo Sarna

Page 45: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Niitä menetelmiä, jotka turvaavat sen, että kaikissa ryhmissä on haluttu määrä tutkimuksen lo-pussa kutsutaan rajoitetuiksi. Vastakohtana on rajoittamattomat menetelmät, joita käytettäessäsaatetaan päätyä hyvinkin erisuuruisiin potilasmääriin.

Yksinkertainen (rajoittamaton)satunnaistaminen

Yksinkertaisessa satunnaistamisessa ei aseteta ehtoja ryhmien koolle. Menetelmää harvem-min käytetään sellaisenaan hoitokokeessa.

Esim.

Sijoitusryhmä Luvut

Kaksi ryhmääA 0 – 4

B 5 – 9

Kolme ryhmää

A 1 – 3

B 4 – 6

C 7 – 9

— 0

Luku 0 5 2 7

Järjestys — B A C

Huom! Aloitus satunnaisesta kohdasta satunnaislukujen taulukosta.

Ongelma: Yleensä erisuuret ryhmäkoot tuloksena.

Taulukko: Suurin mahdollinen epätasapaino satunnaistettaessa kahteen ryhmään

Potilaidenlukumäärä

Ryhmien suuruudet

P ≥ 0.05 P ≥ 0.01

10 2 : 8 1 : 9

20 6 : 14 4 : 16

50 18 : 32 16 : 34

100 40 : 60 37 : 63

1000 469 : 531 459 : 541

Lähde: Pocock 1983.

Biostatistiikan peruskurssi 1998 41 Satunnaistaminen ja sokkouttaminen

Page 46: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

KorvaamismenettelyMikäli suoritettu yksinkertainen satunnaistaminen on tuottanut listan, missä ryhmäkoot ovatepätasapainossa, valitaan uusi lista, jolla vanha korvataan, kunnes riittävä tasapaino on saavu-tettu.

“Korttipakan sekoittamis” -menettelyEsim. Kaksi hoitoa ja halutaan yhteensä 40 potilasta. Ajatellaan korttipakka,

jossa on kahta lajia kortteja 40 kpl satunnaisesti sekoitetuksi.

Satunnaiset permutoidut lohkotEsim. Kaksi ryhmää A, B. Lohkon (’block’) suuruus on 2.

JärjestysArvottu

luku

AB 0 – 4

BA 5 – 9

Luku 0 5 2 ...

Järjestys AB BA AB ...

Huom! Soveltuu 2:n periodin ristikkäistutkimuksiin.

Lohkokokoa 2 pitäisi välttää (paitsi ositetussa satunnaistamisessa)ennustettavuuden vuoksi.

Esim. Kaksi ryhmää, A ja B. Lohkon suuruus 4.

Luku

AABB 1

ABBA 2

BBAA 3

BABA 4

ABAB 5

BAAB 6

Lukuja 7 – 9 ja 0 ei käytetä.

Ongelma: Ennustettavuus kunkin lohkon lopussa; etenkin lohkokoon ollessa pieni.Huom! Ositetussa satunnaistamisessa voidaan käyttää pieniä lohkokokoja siten,

että peräkkäiset lohkot sijoitetaan eri ositteeseen.

Satunnaistaminen ja sokkouttaminen 42 Seppo Sarna

Page 47: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Harhaisen kolikon menetelmä

Kahden ryhmän tapaus

• Aloitetaan yksinkertaisella satunnaistamisella.

• Sijoitetaan seuraava potilas todennäköisyydellä P > 0.5 (esim. P = 3⁄4) pienempäänryhmään ja todennäköisyydellä P < 0.5 (esim. P = 1⁄4) suurempaan ryhmään.

• Jos ryhmäkoot ovat yhtäsuuret, käytetään yksinkertaista satunnaistamismenetel-mää.

Esim. P = 3⁄5, kaksi ryhmää A, B

Jos ryhmät ovat erisuuret: 0 – 5 pienempään ryhmään6 – 9 suurempaan ryhmään

Jos ryhmät ovat yhtäsuuret: 0 – 4 ryhmään A5 – 9 ryhmään B

Satunnaisluku: 0 5 2 7 8 4 3 7 4 1 6 . . .

Ryhmä: A* B A* A A B B A B B B* . . .

* Ryhmät ovat yhtäsuuret, joten käytetään yksinkertaista satunnaistamista

P Ero korkeintaan3⁄4 42⁄3 63⁄5 105⁄9 16

todennäköisyydellä P ≤ 0.05

Ositettu satunnaistaminen(’stratified randomization’)

Tavoite: Taata vertailtavien ryhmien samankaltaisuus (homogeenisuus) tausta-tekijöiden suhteen.

Tärkeää mm. tilastollisen tehokkuuden kannalta.

Ositettu satunnaistaminen ei ole suositeltavaa, mikäli• tutkimus on suuri ja lähtöarvoilla ja aikaisilla tuloksilla ei ole relevanssia• pienet organisatoriset resurssit• on epävarmuutta relevanteista taustatekijöistä, jotka vaikuttavat lopputulokseen.

Biostatistiikan peruskurssi 1998 43 Satunnaistaminen ja sokkouttaminen

Page 48: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Menettelytapa:• Muodostetaan ositteet tausta- tai ennustetekijöiden perusteella.• Sovelletaan satunnaistettujen lohkojen menetelmää erikseen kuhunkin ositteeseen

käyttäen melko pientä lohkokokoa (esim. 4).

Esim. Taustatekijät: x1 ja x2 saavat arvoja yhdestä kahteen.

Osite 1 2 3 4

x1: 1 1 2 2

x2: 1 2 1 2

B B A B

A B A A

B A B A

A A B B

A A B A

B A A B

A B B B

B B A A

. . . .

. . . .

. . . .

Ongelma: Ositteiden määrän lisääntyessä tulee ositteita, joihin ei tule riittävästitapauksia.

Ongelman ratkaisu: Minimointimenettely.

MinimointimenettelyMinimointimenettelyn (Taves 1974) tavoitteena on taata vertailtavien ryhmien samankaltai-suus, kun lopputulokseen vaikuttavia (korreloivia) taustatekijöitä on paljon.

Minimointimenettelyn toimintaperiaatetta voidaan kuvata seuraavalla yksinkertaistetulla esi-merkillä.

Esim. Hoidot A ja B

Taustatekijät (prognostiset tekijät)• x1 (keskus) arvot 1 – 5• x2 (tauti) arvot 1 – 2• x3 (vaikeusaste) arvot 1 – 3

Satunnaistaminen ja sokkouttaminen 44 Seppo Sarna

Page 49: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

keskus tauti vaikeusaste∑1 2 3 4 5 1 2 1 2 3

A 2 3 1 6 3 10 5 2 8 5

B 3 1 3 4 4 9 6 3 6 6

Potilas 31 0 0 1 0 0 1 0 0 0 1

A + potilas 31 2 11 6

B 3 9 6

|A + potilas 31 – B | 1 2 0 3

B + potilas 31 4 10 7

A 1 10 5

|B + potilas 31 – A| 3 0 2 5

Taulukon kaksi ensimmäistä riviä ilmaisevat frekvenssijakaumat tausta-tekijöiden suhteen ryhmissä A ja B, kun 30 potilasta on satunnaistettu. Rivi 3 ilmaisee potilaan 31 arvot taustatekijöiden suhteen. Taulukon kolme seuraavaa riviä ilmaisevat kuinka paljon frekvenssijakaumat muuttuvat jos potilas 31 sijoitetaan ryhmään A, ja kolme seraavaa vas-taavasti jos potilas 31 sijoitetaan ryhmään B. Summasarakkeista voi-daan todeta, että ryhmien A ja B jakaumat lähestyvät enemmän toisiaan, jos potilas 31 sijoitetaan hoitoryhmään A.

Huom. Kun potilaat sijoitetaan hoitoryhmiin käyttäen minimointimenettelyä,pitää lopputulos analysoida käyttäen kovarianssianalyysiä siten, ettäkovariaateiksi otetaan minimoinnissa käytetyt taustatekijät.

Jos käytettäisiin varianssianalyysiä, testauksen tuloksena saatavap-arvo olisi liian pieni; ylioptimistinen todelliseen α-tasoon verrattuna.

Monen taustatekijän tapauksessa minimointimenettely yhdistettynäkovarianssianalyysiin kasvattaa testauksen voimaa verrattuna tavalliseen satunnaistamiseen. Edellytyksenä on luonnollisesti se, ettäkovarianssianalyysin käyttöedellytykset ovat voimassa.

Esim. Minimointimenettelyn käyttö vertailevassa hoitotutkimuksessa (Meade ym, 1995.)

Kyseessä on monikeskustutkimus, johon otettiin yhteensä 741 alaselkä-oireyhtymää potevaa henkilöä, joiden ikä vaihteli välillä 18-64 vuotta ja joilla manipulaatiohoito ei ollut kontraindisoitu. Tutkimuksen tavoittee-na oli verrata sairaalan organisoimaa jatkohoitoa ja kiropraktikon suorit-tamaa hoitoa keskenään. Keskeisin lopputulosmuuttuja oli Oswestryn 10-osioinen selkäkipua mittaava kyselylomakeasteikko. Tulokset esitet-tiin skaalalla 0 -100. Tutkimuksen seuranta-aika oli kolme vuotta ja tut-kimustulokset analysoitiin aikomus-hoitaa-periaatteella ’intention to treat’.

Biostatistiikan peruskurssi 1998 45 Satunnaistaminen ja sokkouttaminen

Page 50: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Satunnaistaminen suoritettiin soveltaen yllä kuvattua minimointiperiaa-tetta. Ennustavina tekijöinä käytettiin seuraavia luokkamuuttujia: lähet-tävä klinikka, episodin kesto (kaksiarvoisena; 1 kk tai alle tai yli 1 kk),kaisemmat selkäkivut (kaksiarvoisena, kyllä-ei), Oswestry lähtötilan-teessa (kaksiarvoisena; yli 40, 40 tai alle)

Tutkimus antoi tulokseksi, että kiropraktikon hoidossa olleet saivat enemmän hyötyä hoidosta. Todennäköisin selitus tulokselle on se, että kiropraktikon hoidot jakaantuivat pidemmälle aikavälille. Kovin vakuut-tavaa näyttöä hoitoerojen suuruudesta ei tutkimuksen perusteella voi kuitenkaan luotettavasti arvioida, mm. analyysimenetelmissä tulisi käyt-tää toistomittausasetelmaa. Tutkijat tyytyivat kuitenkin melko yksinker-taisiin perusmenetelmiin.

Epäsymmetrisesti tasapainotetut menetelmät

Erisuuret ryhmät → tilastollinen voimakkuus laskee.

Ylivoimaisesti tavallisinta kahden vertailtavan ryhmän kliinisissä kokeissa on, että satunnais-tetaan sama määrä potilaita kumpaankin vertailtavaan ryhmään. Riippumatta lopputulos- taivastemuuttujan luonteesta, näin aina onkin tehokkainta. Mikäli kuitenkin tavoitteena on saadaesimerkiksi enemmän käytännön kokemusta uudesta hoidesta kuin standardihoidosta, saate-taan päätyä käyttämään epäsymmetrisesti tasapainotettuja satunnaistamismenetelmiä siten,että uutta hoitoa saavia potilaita otetaan tutkimukseen enemmän. Tällöin kuitenkin tutkimuk-sen voima laskee nopeasti, kun uutta hoitoa saavien osuus kasvaa yli 70 %:n (ks. Pocock, s. 88).

Lähtötason vertailut ja puutteetsatunnaistamisessa

Satunnaistaminen takaa kliinisissä kokeissa hoitojen allokoitumisen harhattomasti eri ryhmi-en välillä, mutta ei takaa lähtötason muuttujien jakaumien samankaltaisuutta, etenkään pienis-sä aineistoissa.

Altman ja Dore (1990) tutkivat 80 artikkelia satunnaistetuista kliinisistä kokeista, jotka oli jul-kaistu jossakin seuraavista neljästä lehdestä: Annals of International Medicine, British Medi-cal Journal, The Lancet tai New England Journal of Medicine. Paitsi lähtötason muuttujaver-tailujen puutteisiin, arvointiraati kiinnitti huomioita virheisiin ja puutteisiin satunnaistamisenosalta.

Satunnaistaminen ja sokkouttaminen 46 Seppo Sarna

Page 51: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Valikoituja tuloksia todetuista puutteista lähtötasonmuuttujienkäsittelyssä:

• 19:ssa raportissa käytettiin jatkuvien muuttujien hajonnan kuvaamisessa keskivir-hettä (SE), yhdessä luottamusvälejä ja 13:sta artikkelissa ei ilmoitettu hajontaaollenkaan, joten puutteita oli 49%:ssa tapauksista

Lähtötason muuttujien kuvaamisessa hajonnan ilmoittaminen on oleellista.Suunnilleen symmetrisillä jakaumilla ilmoitetaan keskihajonta (SD) jamuuten esim. vaihteluväli (’range’), valikoituja prosenttipisteitä(’percentiles’) tai joskus jopa koko aineisto, hyvin pienissä tutkimuksissa.Keskivirhe (SE) ei ole hajonnan mitta lähtötason muuttujille vaan erilais-ten estimaattien, esim keskiarvon, luotettavuuden mitta. Myöskään luot-tamusvälien käyttö ei ole mielekästä kun kuvataan lähtötason eroja. Luot-tamusvälejä käytetään hoitoefektien tai niiden erojen arviointiin.

• Hypoteesien testaamista lähtötason muuttujien suhteen käytettiin 58%:ssa tutki-muksista, mutta vain joka kolmannessa artikkelissa ilmoitettiin käytetty menetelmä

Testausmenetelmän ilmoittaminen on aivan oleellista ilmoitetun p-arvonkannalta.

• 46:ssa artikkelissa ilmoitettiin yhteensä noin kuusisataa hypoteesien testaustalähtötason muuttujien suhteen ja niistä 4% antoi tilastollisesti merkitsevän tuloksen(p < 0.05)

Yleensä tutkimuksissa testataan lukuisia lähtötason muuttujia ja ennus-teen kannalta relevanteimmat ilmoitetaan. Suoritettujen testien määräpaisuu kuitenkin tavallisesti suureksi ja törmätään nk. monivertailu-ongelmaan (’multiple testing’). Esim. jos testataan 20 lähtötason muut-tujaa, niin voidaan olettaa, että ainakin yhdessä niistä saadaan tilastol-lisesti merkitsevä ero (p < 0.05), vaikka eroa ei todellisuudessa olisiolemassakaan. Tässä arviossa oletetaan lähtötason vertailut toisistaan riippumattomiksi, mitä ne eivät käytännössä tietenkään ole. Hypoteesientestaaminen ei ole paras mahdollinen ryhmien vertailukelpoisuuden arviointikeino. Paljon täkeämpää olisi tietää prognostisten tekijöiden voimakkuus ja mahdollinen epätasapaino ryhmien välillä.

• Noin puolessa tutkimuksista lähtötason eroja ei korjattu tai huomioitu mitenkääntuloksia analysoitaessa. Joka neljännessä korjaamiseen (’adjustment’) käytettiintilastollista mallintamista

Lähtötason muuttujien vaikutuksen korjaaminen mallittamalla oli vielä1980-luvun alussa jonkinverran kiistelty kysymys. Nykyisin adjustointiinsuhtaudutaan kuitenkin melko yksimielisen hyväksyvästi. Logistinenmalli ja Coxin malli ovat tavallisimpia keinoja adjustoinnin suorittamiseksi.

Biostatistiikan peruskurssi 1998 47 Satunnaistaminen ja sokkouttaminen

Page 52: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

• Lähes kaikissa (91%) artikkeleista kommmentoitiin jollakin tavoin lähtötasojensamanlaisuutta. Vertailu oli kuitenkin asiallista vain 59%:ssa tapauksista. Suurim-pina puutteina olivat informoinnin riittämättömyys ja virheet adjustoinnessa

Valikoituja tuloksia puutteista satunnaistamisessa:

• 60%:ssa artikkeleista metodiosasta puuttui maininta mitä satunnaistamismenetel-mää oli käytetty.

• Satunnaislukujen generoititapa oli mainittu vain puolessa artikkeleista• Lohkosatunnaistamista käytettiin 30%:ssa tutkimuksista.• Vain 52%:ssa tutkimuksista, joissa oli käytetty osittamista (’stratification’) käytet-

tin lohkosatunnaistamista

Osittaminen ei palvele tarkoitustaan, ellei satunnaistamisessa käytetälohkomenettelyä

• Lohkokokoa ei mainittu 35%:ssa tapauksista• Yhdessä 30:n potilaan aineistossa käytettiin lohkokokoa 20!

Tämä lohkokoko on liian suuri. Lohkokoko tulee valita siten, että aineis-tokoko on jaollinen lohkokoolla. tavallisimmin käytetyt lohkokoot ovatvälillä 4-20. Liian pieniä lohkokokoja kannattaa välttää ennustettavuus-syistä. 30:n potilaan ja kahden hoitoryhmän tapauksessa sopiva lohko-koko olisi 6.

• Hoidon allokointimenetelmä oli puutteellisesti ilmoitettu 45%:ssa tapauksista, jalopuista 44:stä tutkimuksesta 16:ssa oli ilmoitettu, että on käytetty kirjekuoria,mutta ainoastaan 2:ssa tutkimuksessa oli ilmoitettu, että ne olivat numeroituja,sinetöityjä ja läpinäkymättömiä, niinkuin pitäisi.

ViitteetAltman DG. Comparability of randomised groups. Statistician 1985; 34: 125-36.

Altman DG, Dore CJ. Randomisation and baseline comparisons in clinical trials. Lancet1990; 335: 149-53.

Meade TW, Dyer S, Browne W,Frank AO. Randomized comparison of chiropractic and hos-pital outpatient management for low back pain: results from extended follow-up. BMJ1995; 311: 349-351.

Smithells RW, Shepprd S, Schorah JC et al. Possible prevention of neural tube defects by peri-conceptional vitamin supplementation. Lancet 1980, i 339-340.

Smithells RW, Shepprd S, Schorah JC et al. Vitamin supplementation and neural tube defects.Lancet 1981, ii 1425.

Satunnaistaminen ja sokkouttaminen 48 Seppo Sarna

Page 53: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Pocock SJ. Clinical trials; a practical approach. John Wiley & Sons, Chichester 1983: 66-99.

Taves DR. Minimization: A new method of arranging patients to treatment and controlgroups. Clin Pharmacol Ther 1974; 15: 443-53.

Biostatistiikan peruskurssi 1998 49 Satunnaistaminen ja sokkouttaminen

Page 54: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Satunnaistaminen ja sokkouttaminen 50 Seppo Sarna

Page 55: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Aineiston kerääminen ja senalustava käsittely

OtantamenetelmiäHuomattava osa lääketieteellisistä tutkimuksista perustuu otantaan (’sampling’). Sen suoritta-mistapoja on useita. Seuraavassa esitellään lyhyesti kliinisissä tutkimuksissa tavallisimminkäytetyt menetelmät.

Yksinkertainen satunnaisotanta (’Simple random sampling’)

Käyttö: Kun perusjoukko äärellinen ja henkilöt ovat identifioituja, kuuluvatesim. johonkin rekisteriin.

Oletetaan, että perusjoukkoon kuuluu N henkilöä (tai muuta havaintoyksikköä), joille on an-nettu tunnukset 1, 2, ..., N ja että tästä perusjoukosta halutaan kerätä n henkilöä käsittävä tutki-musaineisto (otos).

Menettelytapa: Muodostetaan tasaisesti jakautuneita satunnaislukuja väliltä (1, N)käyttäen satunnaislukujen taulukoita tai tietokoneidensatunnaislukujen generointi- (muodostamis-) ohjelmia.

Jokaisella mahdollisella n:n henkilön suuruisella otoksella, joka on valittavissa tästä N henki-löä käsittävästä perusjoukosta on siten sama todennäköisyys tulla tutkijan aineistoksi. Tässäsuhteessa on selvä ero kliinisissä kokeiluissa käytettyyn menettelyyn, missä tutkimukseen kel-puutetut (’eligible’) henkilöt satunnaistetaan vertailtaviin ryhmiin, jolloin kullakin potilaallaon yhtä suuri todennäköisyys joutua mihinkä tahansa vertailtavista ryhmistä. Tällöin vertailta-vat ryhmät eivät ole satunnaisotoksia mistään perusjoukosta. Usein myöskään tutkimukseenkelpuutettujen N:n henkilön ryhmä, ei ole satunnaisotos mistään perusjoukosta, vaan se on va-littu muilla kriteereillä.

Systemaattinen otanta (’Systematic sampling’)

Käyttö: Kun perusjoukko on ääretön tai siihen kuuluvia henkilöitä ei etukäteentiedetä. Esim. poliklinikkatutkimuksissa on usein tämä tilanne.

Menettelytapa: Otetaan mukaan joka k:s henkilö satunnaisesti valitusta ajanhetkestäalkaen.

Tässä otantamenettelyssä perusjoukko voi olla myös ääretön. Otanta aloitetaan satunnaisestivalitusta kohdasta (esim. ajanhetkestä) ja sen jälkeen otokseen valitaan joka k:s (esim. jokakolmas tai joka neljäs) henkilö.

Verrattuna yksinkertaiseen satunnaisotantaan systemaattinen otanta on helpompi suorittaa; eiedellytä olemassa olevaa rekisteriä perusjoukosta. Tätä menetelmää voidaan käyttää esim.,

Biostatistiikan peruskurssi 1998 51 Aineiston kerääminen ja sen alustava käsittely

Page 56: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

kun halutaan tutkia tapaturma-asemalle tuotavia potilaita ja, kun oletetaan lisäksi, että tutki-mus edellyttää mm. tavanomaisesta rutiinista poikkeavia näytteenottoja ja lisämäärityksiä, joi-ta ei tehdä kaikille potilaille. Tällöin systemaattinen otanta on ainoa keino, koska potilaita eiole ennakkoon rekisteröity ja koska tutkimukseen halutut tiedot eivät ole sellaisia, joita olisisystemaattisesti tallennettu potilaskertomuksiin.

Toinen selvä etu on, että systemaattinen otos jakaantuu yleensä tasaisemmin yli perusjoukon,mistä johtuen systemaattinen otanta on usein huomattavastikin tarkempi kuin yksinkertainensatunnaisotanta.

Systemaattisuus voi kuitenkin joissakin tapauksissa aiheuttaa virheellisyyttä. Esim. tapaturma-asematutkimuksessa on aiheellista valita k siten, että otos ei valikoidu esim. kellonajan, vii-konpäivän, vuodenajan tai muiden sellaisten tekijöiden suhteen, jotka ovat haitallisia tutki-mustulosten yleistettävyyden kannalta. Tämän asian varmistamiseksi onkin aiheellista mene-tellä siten, että kerätään useita systemaattisia osaotoksia valitsemalla useitasatunnaisaloituskohtia, joista alkaen otantaa suoritetaan, esim. keräämällä eri vuodenaikoinaomat systemaattiset otokset.

Ositettu otanta (’Stratified sampling’)

Käyttö: Perusjoukko on äärellinen ja halutaan turvata edustavuus jonkin tekijänsuhteen.

Menettelytapa: Perusjoukko jaetaan äärelliseen määrään ositteita (’strata’, perusjoukonosajoukkoja), joista kustakin erikseen suoritetaan satunnaisotanta. Osittei-siinjakoperusteina voi olla esim. ikäryhmitys tai keskussairaalapiirijako.

Ositettua otantaa käytetään mm. seuraavista syistä johtuen:• halutaan parantaa koko otoksesta laskettavien suureiden tarkkuutta verrattuna

yksinkertaisella satunnaisotannalla saataviin arvioihin• halutaan turvata edustavuus niiden tekijöiden suhteen, jotka ovat ositteisiinjaon

perustana• halutaan laskea arvioita tutkittaville suureille kussakin ositteessa.

Ensimmäisessä tapauksessa on optimaalista valita ositteiden otoskoot siten, että ne ovat niinhyvin kuin mahdollista verrannollisia tutkittavan muuttujan hajontaan perusjoukon vastaavas-sa ositteessa. Mikäli ei ole mitään tietoa perusjoukon hajonnoista eri ositteissa tai ollaan en-nen kaikkea kiinnostuneita jälkimmäisestä vaihtoehdosta, niin otantasuhde on yleensä tällöinsyytä valita vakioksi kaikissa ositteissa, mikä merkitsee, että kustakin ositteesta valittava otok-sen koko on suhteessa ositteen kokoon perusjoukossa.

Esim. Halutaan arvioida jonkin/joidenkin sairauksien yleisyyttä Suomen väes-tössä otantatutkimuksen avulla ja oletetaan, että on näyttöä siitä, ettäkyseiset sairaudet ovat epätasaisesti jakautuneita maan eri osien suh-teen. Tällöin voidaan käyttää ositettua otantaa. Ositteisiinjaon perus-teeksi valitaan esim. lääni tai keskussairaalapiiri. Kustakin näin saata-vasta ositteesta suoritetaan satunnaisotanta siten, että otoskoko on suh-teessa vastaavaan väestömäärään. Tämä menettely parantaa ennen kaik-

Aineiston kerääminen ja sen alustava käsittely 52 Seppo Sarna

Page 57: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

kea sairauksien esiintyvyyttä mittaavien suureiden tarkkuutta (hajontaa)verrattuna yksinkertaisella satunnaisotannalla saataviin arvoihin.

Kolmannessa tapauksessa voi käydä niin, että joudutaan poikkeamaan optimaalisesta otan-tasuunnitelmasta, koska se tuottaisi joihinkin ositteisiin liian vähän havaintoja. Tällöin käyte-tään nk. rikastusmenettelyä, mikä tarkoittaa, että otoskokoa kasvatetaan pienissä ositteissa.Esim., jos ositteisiinjaon perusteena on sosiaaliluokka, niin ylimmän sosiaaliluokan osuuttavoidaan joutua kasvattamaan otosta valittaessa, koska sen osuus perusjoukosta on yleensämuita sosiaaliluokkia pienempi.

Monivaiheinen otanta (’Multiphase sampling’)

Käyttö: Kustannuksien säästämiseksi joissakin melko harvinaisissa tutkimus-tilanteissa.

Menettelytapa: Perusjoukko jaetaan ensiksi ensimmäisen vaiheen otosyksiköiksi.Tämän jälkeen käytetään jotain edellä kuvatuista otantamenettelyistä javalitaan otos näistä ensimmäisen vaiheen otosyksiköistä. Kukin otok-seen valituista yksiköistä jaetaan edelleen toisen vaiheen otosyksiköiksi,joista seuraavaksi valitaan otos. Näin voidaan jatkaa niin kauan kuin ontarpeellista.

Monivaiheisen otantamenettelyn etuna kustannusten säästön ohella olla joissakin tilanteissaolla otantaprosessin helpottuminen. Se ei myöskään edellytä yhteistä rekisteriä koko perusjou-kosta.

Haittana voidaan pitää sitä, että yleensä arvioitavien suureiden tarkkuudessa menetetään.Esim. jos halutaan suorittaa jonkin tietyn alueen (esim. pääkaupunkiseudun) koululaisiin koh-distuvaa tutkimusta, niin ensimmäisessä vaiheessa otantayksiköiksi valitaan koulut ja toisenvaiheen otantayksiköiksi luokat ja sitten kolmannen vaiheen otantayksiköiksi oppilaat. Tä-mäntyyppiseen järjestelyyn otannan osalta joudutaan turvautumaan ennen kaikkea käytännönjärjestelyiden helpottamiseksi.

Aineiston käsittelyTavallisesti tutkimuksissa joudutaan keräämään suuri määrä tietoa, useista tutkittavista ja mo-nista tutkimuksen kannalta relevanteista suureista (muuttujista, ’variables’). Jotta tämä tutki-mustieto olisi mielekkäästi tulkittavissa, se joudutaan tiivistämään yhdistelmätiedoksi (’aggre-gate data’), tunnusluvuiksi (’characteristic’), taulukoiksi (’tables’) tai graafisiksi kuvaajiksi(’graphical displays’). Ennen analyysivaihetta kannattaa suorittaa tutkimusaineiston perusteel-linen tarkastelu (’data screening’), joka tulisi suunnitella yhtä huolellisesti kuin varsinainen ti-lastokäsittelykin. Aineiston esikäsittelyssä pyritään paikallistamaan aineistossa mahdollisestiesiintyvät virheellisyydet ja poikkeavat havaintoarvot (’outliers’), ja puuttuvien tietojen määräja laatu. Lisäksi jakaumien muotoon ja perusriippuvuussuhteisiin kannattaa perehtyä huolella.

Biostatistiikan peruskurssi 1998 53 Aineiston kerääminen ja sen alustava käsittely

Page 58: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Muuttujien tyypit

Tilastokäsittelyn kannalta on oleellista minkälaisilla suureilla ja muuttujilla havaintoja teh-dään ja mitataan. Muuttujat voidaan kahteen päätyyppiin:

• epäjatkuvat (’discrete’) ja• jatkuvat (’continuous’)

Epäjatkuvat muuttujat voivat saada vain tiettyjä, määrättyjä arvoja, ja jatkuvat muuttujat voi-vat saada arvoalueensa sisältä mitä tahansa arvoja (mittaustarkkuuden puitteissa), esimerkiksihenkilön pituus.

Epäjatkuvat muuttujat voidaan edelleen jakaa • luokkamuuttujiin (’categorial’) ja• numeerisiin muuttujiin (’numerical’)

joista edellisistä esimerkkinä ABO-veriryhmäjärjestelmä, ja jälkimmäisestä lukumäärät(’counts’).

Asteikot (’scales’)

Muuttujan mitta-asteikko ratkaisee, minkälaisia deskriptiivisiä keinoja (tilastollisia tunnuslu-kuja, graafisia kuvaajia ja taulukoita), tilastollisia analyysimenetelmiä ja testejä on tarkoituk-senmukaista käyttää.

• Välimatka-asteikko (’Interval scale’)Asteikko, missä minkä tahansa kahden numeerisen arvon erotuksella onkvantitatiivisesti sama merkitys missä tahansa kohdassa skaalaa, esim.lämpötila.

• Suhdeasteikko (’Ratio scale’)Välimatka-asteikko, missä 0-arvo merkitsee ominaisuuden puuttumista,esim. alkoholin kulutus, vaarasuhde.

• Järjestysasteikko (’Ordinal scale’)Kolmi- tai useampiluokkainen asteikko, missä luokkien suhteellinen sijaintitoisiinsa nähden muodostaa luonnollisen järjestyksen, esim. oireen voimak-kuus: ei oiretta, lievä, kohtalainen, vaikea.

• Laatueroasteikko (’Nominal scale’, ’Multichotomy’)Kolmi- tai useampiluokkainen asteikko, missä luokkien välillä ei oletetaolevan mitään luonnollista järjestystä tutkittavassa asiayhteydessä, esim.siviilisääty, tautiluokitus.

• Kaksiluokkainen asteikko (’Dichotomy’)On erikoistapaus järjestysasteikosta. Siinä on kaksi luokkaa, joiden järjestyskeskenään on sopimuskysymys, esim. sukupuoli, taudin olemassaolo.

Monissa tilastollisissa malleissa välimatka- tai suhdeasteikollinen muuttuja joudutaan luokitte-lemaan järjestysasteikolliseksi, jotta mallin parametrien arviointi olisi mahdollista ja tuloksettulkittavissa.

Aineiston kerääminen ja sen alustava käsittely 54 Seppo Sarna

Page 59: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Laatueroasteikollista muuttujaa voidaan testausmielessä tarkastella tilastollisissa malleissa jär-jestysasteikollisena, kun halutaan tutkia, muodostavatko sen luokat luonnollisen järjestyksen(trenditestit).

Laatueroasteikollisesta muuttujasta voidaan ja usein joudutaan muodostamaan tilastollisiinmalleihin useita kaksiarvoisia ilmaisin-, vale- tai mallintamismuuttujia, (’indicator’-, ’dum-my’- tai ’design’-muuttujat), joilla yhdessä on sama tietosisältö kuin alkuperäisellä muuttujal-la.

Välimatka- tai suhdeasteikollista muuttujaa (esim. ikä) voidaan tilastollisissa malleissa käsitel-lä kuten laatueroasteikollista muuttujaa, kun halutaan esim. testata muuttujan mahdollisia ei-monotonisia yhteyksiä mallin muihin muuttujiin. Tällöin on kuitenkin syytä huomata, että kat-kaisukohdilla (’cut-off points’) on suuri merkitys tulosten kannalta. Huono katkaisukohtienvalinta voi peittää alleen tilastollisen yhteyden.

Tiedot kannattaa alkuperäiseen tiedostoon kerätä mahdollisimman tarkasti, jotta tilastokäsitte-lyssä niitä voidaan sopivasti yhdistellä tutkimushypoteesin edellyttämällä tavalla, esimerkiksilaboratoriomittausarvot kannattaa ottaa tarkkoina eikä pelkästään kaksiarvoisina (normaali,epänormaali), samoin ikä kannattaa ottaa ainakin vuoden tarkkuudella. Aikaviiveiden laske-mista varten tietokantaan kannattaa sisällyttää tarkat päivämäärät (’date’ muodossa).

Muuttujaluettelo

Tilastokäsittelyä varten kannattaa tutkimustiedostosta/tietokannasta laatia kuvaus muuttujiensisällöstä, mitta-asteikosta ja tiedon esittämistavasta. Tämä myös estää tiedon muuttumisenkäyttökelvottomaksi pitkään kestävän tutkimuksen aikana unohduksen seurauksena. Kuvauk-seen kannattaa sisällyttää muuttujista ainakin seuraavat asiat:

Muuttujan numero • Esim. juokseva numerointi

Muuttujan nimilyhenne• Useimmat tilasto-ohjelmat sallivat korkeintaan 8 merkkisiä nimiä. Skandinaavisia

kirjaimia ja erikoismerkkejä sisältäviä muuttujanimiä kannattaa välttää.

Muuttujan varaama tila• Kentän koko tietokannassa• Desimaalipisteen sijanti pitää ilmoittaa (x.xx) samoin mahdollinen etumerkki.

Niille pitää varata oma tila kentästä.

Muuttujan kuvaus • Muutaman sanan mittainen selvitys muuttujan sisällöstä

Muuttujan asteikko • Tilastokäsittelyssä käytettävä asteikkotyyppi

Biostatistiikan peruskurssi 1998 55 Aineiston kerääminen ja sen alustava käsittely

Page 60: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Muuuttajan koodiarvot

• Tutkijan valitsemat koodiarvot laatuero- ja järjestusasteikollisille muuttujille• Jonkin ominaisuuden, oireen tai altisteen puuttuminen kannattaa koodata 0:ksi ja

sen olemassaolo 1:ksi.

Puuttuvien tietojen merkintä• Esim. ohjelmissa dBase ja BMDP * (tai ** jne...) merkitsee puuttuvaa tietoa. Tyhjä

tulkitaan kiinteässä tallennnusmuodossa (’fixed format’) puuttuvaksi tiedoksi,mutta ei vapaassa tallennusmuodossa (’free format’). Vapaassa muodossa puuttu-vaa tietoa voidaan merkitä , , tai *. Myös muut merkit, kuten esim. vaihtelualueenulkopuolle menevät arvot (9,99,999 jne..) voidaan määritellä muuttujakohtaisestipuuttuviksi tiedoiksi. Joissakin tietokantaohjelmissa (esim. dBase) tyhjä muuntuuhelposti eri käsittelyvaiheissa nollaksi ja voi siten aiheuttaa ongelmia.

Erityishuomautukset • Mittaustarkkuus, pyöristys, typistys, jne.

Lisätietoja käsittelyä varten

Muuttujien luokitukset• Jatkuvat muuttujat joudutaan usein aineistoa kuvattaessa ja joissakin malleissa

estimointisyistä luokittelemaan. Tästä tosin saattaa aiheutua jonkin verran infor-maation menetystä. Jatkuvien muuttujien tiedot kannattaa kuitenkin tallentaa luo-kittelemattomina, sillä luokitukset voidaan suorittaa tilasto-ohjelmalla. Yleensäjoudutaan kokeilemaan monia eri luokituksia.

Muuttujien muunnokset• Erotus- ja summamuuttujat, indeksit ym. johdetut muuttujat

Ehdot loogisuustarkistuksia varten• Jo tietojen tallennusvaiheessa kannattaa tietokantaohjelmaan rakentaa makro

(joukko ohjelmointikielen käskyjä), jonka avulla voidaan tarkistaa loogisten vir-heiden olemassaoloa. Ennen tilastokäsittelyä kannattaa tarkistaa minimit ja mak-simit ja loogiset mahdottomuudet.

Yksityiskohtaisemmin on edellä mainittuja asioita tarkastellut mm. Salmelin (1991).

Puuttuvat tiedot

Puuttuvat tiedot muodostavat monissa kliinisissä tutkimuksissa ison ongelman. Niitä syntyyolosuhteiden pakosta ja yleensä niille pitäisi jotain tehdä ennen tilastokäsittelyä. Puuttuvientietojen seurauksena tutkimuksen voima saattaa heiketä estimaattien tarkkuus huonontua.Näin käy erityisesti silloin, jos tilastokäsittelyyn otetaan vain ns. ’täydelliset tapaukset’, eli po-tilaat, joilta on saatu kaikki tiedot (’complete-case analysis’, ’available-case analysis’). Mikälipuuttuvat tiedot eivät tällaisessa tilanteessa jakaannu satunnaisesti aineiston sisällä, saattaa tu-loksiin lisäksi syntyä harhaa.

Aineiston kerääminen ja sen alustava käsittely 56 Seppo Sarna

Page 61: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Monet tutkijat pitävät karkeana nyrkkisääntönä, että enempää kuin 5% muuttujan arvoista eisaisi puuttua. Monissa kliinisissä tutkimuksissa suoritetaan potilaasta toistomittauksia ja Täl-löin puuttuvat tiedot ovat erityisen ongelmallisia. Monissa tilastollisissa algoritmeissa on si-säänrakennettuna mahdollisuus ottaa huomioon puuttuvat tiedot (esim. SAS Mixed ja BMDP5V). Tutkimusaineiston esikäsittelyyn puuttuvien tietojen osalta on käytettävissä myös eri-tyisohjelmistoja, esim. SOLAS.

• Tavallisimpia puuttuvien tietojen korvaamismenettelyjä ovat:• Ryhmäkeskiarvolla tai satunnaisesti valitulla muuttujan arvolla korvaaminen

(’group mean imputation’).• Viimeisen havaintoarvon siirtäminen eteenpäin (LVCF-menetelmä ’last value

carried forward’). Käytetään etenkin toistomittausasetelmissa. Tämän menetelmänkanssa tulisi kuitenkin olla erityisen varovainen, se voi johtaa pahasti harhaiseenlopputulokseen.

• Lähimmällä kaltaistetulla havaintoarvolla korvaaminen (’hot-deck imputation’).Käytetään esim. kyselytutkimuksissa siten, että jos jokin kysymyssarja käsittää 10osiota ja henkilöltä A puuttuu vastaus osioon 4, niin etsitään sellaisen henkilön Bvastaus, joka on vastannut mahdollisimman samanlaisesti kuin henkilö A muihin10:stä osiosta ja siirretään B:n vastaus A:n tietueeseen puuttuvaan osioon 4.

Poikkeavat havaintoarvot

Biologisessa materiaalissa esiintyy aina poikkeuksellisen pieniä tai suuria muuttujan arvoja.Tärkeä vaihe aineiston esitarkastelussa on pyrkiä paikallistamaan tällaiset arvot, kenellä henki-löllä niitä esiintyy ja missä muuttujissa. Poikkeavia havaintoarvoja esiintyy seuraavista syistäjohtuen:

• Virheet näytteidenotossa, mittaamisessa tai tietojen rekisteröinnissä. Nämä poik-keavat havaintoarvot pyritään yleensä korvaamaan oikealla arvolla, mikäli sesuinkin on mahdollista. Muussa tapauksessa havaintoarvo tai koko havaintoyksik-kö saatetaan joutua sulkemaan pois analyysistä.

• Äärimmäiset biologisen, psykologisen tai ympäristövariaation aiheuttamat arvot.Yleensä analyysit ja arvioinnit joudutaan tällaisissa tapauksissa suorittamaan sekänäiden poikkeavien arvojen kanssa että ilman niitä. Lisäksi on olemassa menetel-miä arvioida poikkeavien arvojen vaikutusta tuloksiin.

• Otantaongelmat tai virheet tutkimusten sisäänotto- tai poissuljentakriteereissäsaattavat tuoda mukaan aineistoon henkilöitä, jotka poikkeavat muista tutkittavistaselvästi. Koska nämä henkilöt eivät kuulu tutkimuksen perusjoukkoon, lieneetavallisinta, että tapaukset vain raportoidaan ja suljetaan tilastokäsittelyn ulkopuo-lelle.

Biostatistiikan peruskurssi 1998 57 Aineiston kerääminen ja sen alustava käsittely

Page 62: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

KeskiluvutJakauman sijainnin kuvaamisessa käytetään tavallisimmin seuraavia keskilukuja:

• Aritmeettinen kerkiarvo• Painotettu aritmeettinen keskiarvo• Mediaani• Geometrinen keskiarvo• Harmoninen keskiarvo• Viritetyt (’trimmed’) keskiarvot• Moodi

Näiden keskilukujen käyttökelpoisuutta eri asteikkotyyppien yhteydessa kuvaa seuraava tau-lukko:

Asteikko

TunnuslukuVälimatka

/suhdeJärjestys Laatuero Dikotomia

Keskiarvo + (+) – –

Mediaani + + – –

Moodi + + + +

Selitykset: + : käyttökelpoinen (+): varauksellisesti käyttökelpoinen – : ei sopiva

Varauksellisesti käyttökelpoinen tarkoittaa, että tunnusluku on mielekäs deskriptiivisesti vain,mikäli muuttujien arvot ovat yhtä etäällä toisistaan biologisessa mielessä.

Useimmissa analyyseissa dikotominen ja järjestysasteikollinen muuttuja toimivat laskennalli-sesti kuten välimatka-/suhdeasteikollinen muuttuja, mutta viimeksi mainituille kehitetyt testittoimivat vain likimääräisesti. Dikotomisten muuttujien keskiarvot eivät kuitenkaan ole de-skriptiivisesti mielekkäitä, koska keskiarvo on riippuvainen valituista koodiarvoista. Prosent-tiosuuksien ilmaiseminen on mielekkäämpää.

Mikäli aineistossa muuttujan arvoina esiintyy poikkeuksellisen pieniä tai suuria arvoja (’out-liers’), voidaan käyttää viritettyjä (’trimmed’) keskiarvon estimaatteja. Ne jättävät jakaumanääripäistä tietyn määrän havaintoarvoja pois.

Toinen tapa hallita poikkeavia havaintoarvojen yliokorostuvaa vaikutusta on käyttää havainto-arvojen painottamista siten, että estimaatin lähellä olevat arvot saavat suuremman painon kuinääripäissä olevat arvot. Esim. BMDP-paketissa tällaisia keskiarvon estimaatteja on kahta tyyp-piä: ’Hampel’ ja ’Biweight’, jotka erovat toisistaan havaintojen painotusmekanismin suhteen.Tilastollisten testien kannalta nämä viritetyt tai painotetut keskiarvot eivät ole kovin käyttökel-poisia.

Mikäli jakauma on voimakkaasti vino oikealle, niin keskiluvuksi kannattaa usein valita loga-ritmimuunnokseen perustuva geometrinen keskiarvo (= antilogaritmi logaritmisten arvojen

Aineiston kerääminen ja sen alustava käsittely 58 Seppo Sarna

Page 63: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

aritmeettisesta keskiarvosta). Huom. nolla-arvot pitää korvata mittaustarkkuuden alarajalla.Geometrista keskiarvoa käytetään yleisesti mm. sero-bakteriologisissa tutkimuksissa. Senkäyttö on varsin luonnollista esim. titterien yhteydessä.

Mikäli jakauma on vino vasemmalle, voidaan käyttää muunnosta exp(x) ennen keskiarvon las-kemista. Jos jakaumassa on hännät molempiin suuntiin, voidaan käyttää muunnosta 1⁄x. Täl-löin keskeisyyttä mittaa harmoninen keskiarvo (= käänteisarvojen aritmeettinen keskiarvo).

Eräs yleisimmin käytettyjä jakauman sijainnin mittoja lääketieteellisissä tutkimuksissa on me-diaani, eli se arvo, joka jakaa järjestetyn havaintoaineiston niin, että sekä sen ala- että yläpuo-lella on 50% havaintoarvoista. Mediaani ei luonnollisestikaan ole herkkä poikkeaville havain-toarvoille.

Kun julkaistaan keskiarvoja, kannattaa pitää mielessä mikä on alkuperäisen datan numeerinentarkkuus. Keskiarvoihin kannattaa ottaa vain yksi ylimääräinen desimaali.

Hajonnan mitatNimeerinen tapa kvantifioida tutkittavissa suureissa esiintyvää vaihtelua (’variability’) eli ha-jontaa (’dispersion’) on käyttää seuraavia mittalukuja:

• Vaihteluväli (’Range’)• Prosenttipisteet (’Percentiles’)• Standardipoikkeama (’Standard deviation’, SD)• Variaatiokerroin (’Coefficient of variation’, CV)

Standardipoikkeama soveltuu hajonnan mitaksi deskriptiivisessä mielessä vain, mikäli ja-kauma on suunnilleen symmmetrinen. Muuten hajontaa kannattaa kuvata 90%, 95% tai100%:n vaihteluväleillä, prosenttipisteillä (esimerkiksi desiilit, kvinttiilit, kvarttiilit) tai graafi-sesti, esimerkiksi esittämällä kaikki havaintopisteet. Mikäli aineistossa esiintyy poikkeavia ha-vaintoarvoja, tulisi 100% vaihteluvälin sijasta käyttää esimerkiksi 95% vaihteluväliä.

Laskennallisesti standardipoikkeama on hyvä ja tavallisimmin käytetty hajonnan mittaluku.Merkintätapaa keskiarvo ± SD tulisi välttää. Mikäli jakauma on normaali, tämä merkintä tar-koittaa noin 68% vaihteluväliä. Väliä keskiarvo ± 2*SD tai 95% vaihteluväliä käytetään useinkuvaamaan niinsanottua normaalia vaihtelua, viitearvoväliä (’reference interval’).

Riittävä numeerinen tarkkuus hajonnan ilmoittamisessa on yleensä kaksi ylimääräistä desi-maalia verrattuna alkuperäisen datan tarkkuuteen.

Kun SD suhteutetaan, s.o. jaetaan keskiarvolla, saadaan variaatiokerroin (CV). CV on yksi-köistä riippumaton ja sitä käytetään kun halutaan vertailla vaihtelua eri aineistoissa. CV ilmoi-tetaan prosenttilukuna.

Biostatistiikan peruskurssi 1998 59 Aineiston kerääminen ja sen alustava käsittely

Page 64: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Jakauman vinous ja huipukkuusJakauman vinous (’skewness’) paljastuu parhaiten graafisessa tarkastelussa. Tietokoneohjel-missa on olemassa useita jakauman vinouden eri piirteitä korostavia mittalukuja, joista mi-kään ei ole ihanteellinen. Tavallisimmin käytetty lienee niinsanottuun kolmanteen momenttiinja sen keskivirheeseen perustuva parametrinen huipukkuuskerroin ja sen testi, joka sisältyyuseimpiin tilastopaketteihin. Myös ei-parametrinen vinouskerroin on laskettavissa prosentti-pisteiden perusteella, mutta sitä näkee harvemmin käytettävän.

Parametrinen huipukkuuskerroin (’kurtosis’) ja sen testi perustuu neljänteen momenttiin jasen keskivirheeseen.

Jakauman normaalisuusJakauman normaalisuutta voidaan testata monin tavoin. Graafisesti sitä voidaan tutkia esim.’probit-plot’-menetelmällä (MedStat: PROBIT, BMDP5D). Y-akselilla on tällöin kumulatiivi-sen normaalijakauman mukaiset odotusarvot ja x-akselilla havaitun kumulatiivisen jakaumanarvot. Normaalisuus on sitä parempi mitä paremmin pisteet sijoittuvat 45° kulmassa (x, y)-koordinaatistoon piirretylle suoralle viivalle. Tilastollisena testinä voidaan käyttää esim. Wilk-Shapiron W-testiä tai yhteensopivuustestejä.

Graafiset kuvaajatTavallisimpiin graafisiin esitystapoihin kuuluuvat erilaiset histogrammit (frekvenssijakaumi-en kuvaajat), pylväsdiagrammit (’bar diagram’, ’column diagram’), viivadiagrammit (’linediagrams’), hajontadiagrammit (’scatter plots’) ja ympyrädiagrammit (’piirakat’, ’pies’) (Tuf-te 1983, Stenman 1995).

Kun kuvataan kahden muuttujan välisiä yhteyksiä hajontadiagrammeilla, niin kaikki havainto-aineiston pisteet tulisi esittää. Joissakin tilanteissa kuvantamissymboli voidaan korvata lukuar-volla, joka ilmaisee yhtenevien pisteiden määrän. Etenkin pienissä aineistoissa yksittäisten ha-vaintopisteiden esittäminen hajontadiagrammeissa on suositeltavaa.

Kuvattaessa frekvenssijakaumaa on histogrammille vaihtoehtona frekvenssimurtoviiva (’freq-uency polygon’), jonka etuna histogrammiin verrattuna on se, että samaan kuvaan voidaan si-joittaa esimerkiksi useampien ryhmien frekvenssijakaumat vertailujen helpottamiseksi, jamyös jakauman muoto hahmottuu paremmin. Frekvenssijakaumissa kannattaa aina käyttää ta-savälisiä luokituksia.

Aineiston kerääminen ja sen alustava käsittely 60 Seppo Sarna

Page 65: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Yleisohjeita kuvien rakentamiseen:

• Kuvien ja kuvatekstien tulee olla itsensäselittäviä; kuvat pitää olla ymmärrettävissäartikkelin sisällöstä riippumatta

• Vaaka- ja pystyakselit tulee nimetä selkeästi ja myös yksiköt pitää olla näkyvissä• Ei liian paljon tietoa yhteen kuvaan• Kuvien tarkoitus on antaa nopeasti selkeä käsitys esitettävästä asiasta eikä esitellä

detaljitietoutta• Ei liian paljon numerotietoutta kuviin• Luottamusvälit suositeltavampia kuin keskivirheistä muodostuvat virhejanat

(’error bars’)

ViitteetSalmelin R. Lomakesuunnittelu tietokonetallennuksen ja tilastollisen käsittelyn kannalta. Duo-

decim 1991; 107: 305-12.• Sisältää käytännön kokemukseen perustuvia ohjeita tietojen tallentamisesta ja

koodaamisesta.

Stenman S. Tieteellisen artikkelin kuvitus I. Piirrostyypit ja niiden käyttö. Suomen lääkäri-lehti 1995; 50: 4: 379-385.

Stenman S. Tieteellisen artikkelin kuvitus II. Mitä kuuluu kuvioon ja mitä tekstiin. Suomenlääkärilehti 1995; 50: 5: 499-501.

Stenman S. Tieteellisen artikkelin kuvitus III. Tietokonegrafiikan sudenkuoppia. Suomen lää-kärilehti 1995; 50: 6: 629-634.

• Stenmanin artikkelisarja on suositeltavaa luettavaa.

Ohjelmia ja kirjallisuuttaSolas For Missing Data Analysis 1.0. Statistical Solutions. Fax: +358-21-319 630.

http://www.statsol.ie

Tufte ER. The visual display of quantitative information. Cheshire Conn.: Graphics Press,1983.

• Hyvä kirja graafisista esitystavoista.

Biostatistiikan peruskurssi 1998 61 Aineiston kerääminen ja sen alustava käsittely

Page 66: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Aineiston kerääminen ja sen alustava käsittely 62 Seppo Sarna

Page 67: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Luottamusväliestimointi

YleistäEstimoinnilla (’estimation’) tarkoitetaan tutkittavan ilmiön kuvaamiseen käytetyn mallin taijakauman sisältämien tuntemattomien suureiden, parametrien, arviointia tutkimusaineiston(otoksen/otosten) perusteella. Estimointitapoja on kahta päätyyppiä

• piste-estimointia (’point estimation’) ja• luottamusväliestimointia (’confidence interval estimation’).

Otossuuretta (’sample statistic’), jolla tuntematonta parametria arvioidaan sanotaan estimaatto-riksi. Samaa parametria voidaan estimoida monella eri estimaattorilla tilanteesta riippuen. Esi-merkiksi jakauman keskeisyyttä voidaan arvioida erilaisilla keskiluvuilla (tavallinen aritmeet-tinen keskiarvo, viritetyt keskiarvot jne.). Estimaatti on otoksen perusteella laskettu estimaat-torin arvo. Se on aina otoskohtainen.

Luottamusvälejä on kahta päätyyppiä, frekventistisiä ja Bayesilaisia välejä.

Olkoon θ (’theta’) tarkasteltavan perusjoukon suure (parametri), jonka luottamusväli halutaanmäärätä. Bayesilaiset välit perustuvat niinkutsuttuihin a priori ja a posteriori todennäköisyys-tiheyksien yhdistelmään. A priori todennäköisyystiheys kuvastaa tutkijan subjektiivista ennak-kokäsitystä parametrin θ arvojen todennäköisyyksistä ennen tutkimusaineiston analysointia,ja a posteriori todennäköisyydet lasketaan tutkimusaineiston perusteella.

Frekventistisen luottamusvälin määritelmä:

Olkoon θ arvioitava tuntematon suure, parametri. Määrätään otoksenperusteella väli [θ1, θ2]n , missä n on otoksen koko siten, että θkuuluu tähän väliin tietyllä todennäköisyydellä 1 − α.Tällaista väliä kutsutaan luottamusväliksi (’confidence interval’,’confidence limits’, CL100 ∗ (1− α)%).

Huom. Luottamusvälin kaikki arvot eivät ole yhtä todennäköisiä! Luottamus-välin keskellä olevat arvot ovat todennäköisempiä kuin sen laidallaolevat. Todennäköisyydet määräytyvät tarkasteltavan suureenotosjakauman perusteella.

Todennäköisyyttä 1− α kutsutaan luottamustasoksi (’confidence level’). Tavallisimmin luotta-mustasoksi valitaan jokin arvoista: 0.90 tai 0.95 tai 0.99. Valinta ei perustu kuitenkaan mihin-kään matemaattiseen tosiseikkaan. Kysymys on siitä, kuinka suuren riskin tutkija johtopäätök-silleen katsoo voivansa ottaa.

Luottamusväli on aina otoskohtainen, otoksen havaintoarvojen funktio. Se pienenee, kun otos-koko n kasvaa, ts. varmuus lisääntyy. Vastaavasti, kun n pidetään vakiona ja luottamustasoa(1− α) kasvatetaan, niin väli pitenee. Esim. 95%:n väli on pidempi kuin 90% väli, kun n pide-tään kiinteänä.

Biostatistiikan peruskurssi 1998 63 Luottamusväliestimointi

Page 68: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Todennäköisyyden frekvenssitulkinnan mukaisesti n:n havainnon toisto-otoksista lasketuistaväleistä [θ1,θ2]n , joiden pituus vaihtelee otoksesta toiseen, 100 ∗ (1− α)% on sellaisia, että ar-vioitava parametri kuuluu kyseiseen väliin. Toisto-otoksia pitää kuitenkin olla paljon, jottatämä tulkinta pitäisi paikkansa. Tähän frekventistiseen todennäköisyystulkintaan perustuvienluottamusvälien lisäksi on olemassa myös toisen tyyppisiä, nk. Bayesiläisiä välejä.

Luottamusvälit voidaan lisäksi jakaa• tarkkoihin ja• likimääräisiin väleihin

riippuen siitä käytetäänkö välien laskennassa tarkasteltavan suureen tarkkaa vai likimääräistätodennäköisyysjakaumaa.

Luottamusväli antaa enemmän tietoa kliinisissä tutkimuksissa hoitoerosta kuin pelkkä P-arvo.

Esim. Luottamusvälit vastaan merkitsevyystestit. Sepelvaltimotaudin seuran-tatutkimus, Lipid Research Program, 1984. Aineistona 3806 miestä joilla oli korkeat lipidiarvot. Seuranta-aika oli keskimäärin 7.4 vuotta.

Kyseessä oli lumehoitokontrolloitu kaksoissokkotutkimus.

Ryhmät: A. Lumehoito.B. Kolestyramiinilla hoidetut.

Tulos:

A B

Miesten määrä 1900 1906

CHD tapaukset 187 (9.8%) 155 (8.1%)

Ilmoitettu tulos:

1. P < 0.05 (yksipuoleinen testi)2. CHD-vaaran reduktio: 100∗(9.8 − 8.1) ⁄ 9.8 = 17%3. 90% luottamusväli: [3%, 32%]

Vaihtoehtoinen tapa raportoida tulos:

2. CHD vaaran reduktio: 9.8% − 8.1% = 1.7%3. 95% luottamusväli: [-0.1%, 3.5%]

(1. P > 0.05, N.S.)

Esim. Lievän hypertension hoitokoe (MRC-tutkimus, 1985).

Tutkimusaineisto: 17 354 potilasta, 85 572 seurantavuotta

Lopputulosmuuttuja: aivoinfarktien määrä

Terapia Lume Reduktio

60 109 45%

Luottamusväliestimointi 64 Seppo Sarna

Page 69: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Tulos: CL 95% = [25%, 60%]

Huom. Luottamusväli melko lavea mikä merkitsee, että päättelyyn sisältyyepävarmuutta kun tulos tulkitaan reduktioprosenttina.

Yllä olevien lukujen perusteella saadaan aivoinfarkti-ilmaantuvuudeksi terapiaryhmässä 1.4ja lumeryhmässä 2.6 tuhatta henkilövuotta kohden. Jos näille luvuille lasketaan Poisson-ja-kaumaan perustuvat luottamusvälit, todetaan että 99% luottamustasolla ne eivät mene päällek-käin. Tämä tulos on sopusoinnussa tutkijoiden ilmoittaman P-arvon P < 0.01 kanssa.

Esim. Oraalinen magnesiumhoito hypertensioon. (Cappuccio et al. 1985).

Tutkimusaineisto: 17 potilastaAsetelma: Ristikkäistutkimus, hoitojaksot 1 kk:n mittaisiaAnnos: 15 mmol magnesiumia päivässä

Tutkimuksella pyrittiin näyttämään, ettei hoidolla ole vaikutusta.

Tulos: Ei eroa lumehoitoon verrattuna.

Luottamusväli olisi paljastanut tutkimuksen alhaisen voiman. Luottamusväliä ei ilmoitettu!

Esimerkkejä luottamusvälien laskentatilanteista

• Keskiarvot ja niiden erotuksetyksi otoskaksi otosta (riippumattomat, parittaiset)

• Suhdeluvut ja niiden erotuksetyksi otos (eri jakaumat: binomi, poisson, jne.)kaksi otosta (riippumattomat, parittaiset)

• Regressio ja korrelaatioyksi otoskaksi otosta

• Eloonjäämisanalyysityksi suhdelukusuhdelukujen erotukset

• Ei-parametriset analyysityksi otos (mediaani, muut kvarttiilit)kaksi otosta mediaaninen ero (riippumattomat, parittaiset)

Normaalijakaumaan perustuvatluottamusvälit

Kaava:

θ ± zα∗ SE(θ) (5.1)

Biostatistiikan peruskurssi 1998 65 Luottamusväliestimointi

Page 70: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

missä θ on piste-estimaatti, SE(θ) sen keskivirhe ja zα normaalijakau-man prosenttipiste. (esim. 95%:n luottamusvälissä z0.05 = 1.96).

Esim. θ = µ, θ = x_ (keskiarvo)

Keskiarvon keskivirhe (=keskiarvon standardipoikkeama):

SE (x_) =

σ√n

, missä n on otoskoko

Esim. θ = Mediaani. Mediaanin keskivirhe:

SE(MED) = X(i) − X(j)

2√3 , missä X(i) ja X(j) ovat i. ja j. arvo järjestetyssä

otoksessa (X(1), X(2), ..., X(n)), kun i ja j määritellään:

i = INT ( n + √3n2

+ 1), j = INT ( n + √3n2

− 1)

Huom. Funktio INT( ) toimii siten, että se ottaa suluissa olevasta lausekkeestakokonaisosan; esim. INT(6.8) = 6.

Keskiarvon luottamusväliKaava:

x_ ± tα⁄2(n− 1) ∗ SE( x

_) (5.2)

missä tα⁄2 (n − 1) on studentin t-jakauman prosenttipiste vapausastein

n − 1, x_ on aineistosta (x1, x2, ..., xn) laskettu keskiarvo ja SE ( x

_) =

SD√n

keskiarvon keskivirheen estimaatti (arvio).

Esim. (Gardner & Altman 1989, s. 21)x = systolinen verenpaine

Aineisto: 100 miespuolista diabeetikkoa, ikä 40 - 49.

x_ = 146.4, SD = 18.5 (mmHg), t0.025(99) = 1.984

Luottamusväli: CL95% = (142.7, 150.1)

Huom. Keskiarvon luottamusväli voidaan laskea MedStatin ohjelmalla EBtietokantaan tallennetuista muuttujista. Ohjelma CIA on sen sijaan tulos-ten jälkikäsittelyohjelma ja sen avulla yllä oleva luottamusväli voidaanlaskea edellyttäen, että n, x

_, ja SD ovat annettuja (etukäteen laskettuja).

Luottamusväliestimointi 66 Seppo Sarna

Page 71: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Keskiarvojen erotuksen luottamusväli

Riippumattomat otokset

Aineistokoot: n1, n2Keskiarvot: x

_1, x

_2

Keskihajonnat: SD1, SD2

Yhdistetty keskihajonta:

SD= [(n1 − 1) SD1

2 + (n2 − 1) SD2 2

n1 + n2 − 2]1⁄2

Keskiarvojen erotuksen keskivirhe:

SE (x_

1 – x_

2) = SD ∗ √1n1

+ 1n2

Keskiarvojen erotuksen luottamusväli:

(x_

1 − x_

2) ± tα⁄2(n1 + n2 − 2) ∗ SE (x_

1 − x_

2) (5.3)

missä t α⁄2 (n1 + n2 − 2) on Studentin t-jakauman prosenttipiste ja

α on luottamustaso.

Esim. (Gardner & Altman 1989, s. 22)

Aineisto: 100 diabeetikkoa ja 100 verrokkia (kontrollia), 40 - 49 vuoti-aita miehiä

Mitattu suure: Systolinen verenpaine

Keskiarvot ja (keskihajonnat): 146.4 (18.5) ja 140.4 (16.8) mmHg

Tehtävä: Halutaan laskea keskiarvojen erotuksen 95%:n ja 99%:n luot-tamusvälit.

Ratkaisu: Monet yleiskäyttöiset tilastopaketit eivät laske keskiarvojen erotuksen luottamusväliä läheskään aina vaikka se olisi aiheellista. Myöskään aina ei ole käytettävissä alkuperäistä aineistoa vaan ainoas-taan ns. ’kondendsoitu data’ eli yllä esitetyt tunnusluvut. Tällöin joudu-taan turvautumaan erikoisohjelmiin, esim. CIA, jolla laskenta on hel-posti suoritettavissa. CIA:n laskenta-algoritmi perustuu yllä oleviin kaa-voihin. Taulukkolaskimiin voidaan kohtalaisen helposti tehdä makro, joka suorittaa vaaditun tehtävän.

Mikäli laskenta suoritetaan yllä olevien kaavojen perusteella, niin saadaan seuraavat välitulok-set:

• yhdistetty keskihajonta 17.7 mmHg• keskiarvojen erotus 6.0 mmHg

Biostatistiikan peruskurssi 1998 67 Luottamusväliestimointi

Page 72: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

• keskiarvojen erotuksen keskivirheeksi 2.50 mmHg• vapausasteet (100-1)+(100-1)=198• luottamustasot 95%:n väli: 1-0.05/2=0.025• 99%:n väli: 1-0.01/2=0.005

Studentin t-jakauman prosenttipisteet vapausastein 198 ja luottamustasoin 0.025 ja 0,005 ovat1.972 ja 2.601 (StaTable, tai liitteen taulukot)

Luottamusväleiksi saadaan: 95% väli ( 1.07 - 10.9)99% väli (-0.50 - 12.5)

Parittaiset otokset

• kaksi ajankohtaa• kaltaistetut parit (xi1, xi2)• käytetään yhden otoksen kaavaa havaintoparien erotuksille di = xi1 - xi2

Esim. (Gardner & Altman 1989, s. 23)

Aineisto: 16 keski-ikäistä miestäMitattiin: systolinen verenpaine (x) ennen ja jälkeen liikuntasuorituksen

Erotus: di = x1i – x2i

d = 6.6 mmHg, SDd = 6.0 mmHgdf = 15, t0.025 = 2.13 Luottamusväli CL95%: (3.40, 9.80)

Ohjelma: CIA (Gardner & Altman, 1989)

Mediaanien ja muiden prosenttipisteidenluottamusvälit

Lajitellaan aineisto (x1, ..., xn) nousevaan järjestykseen (x(1), ..., x(n)).Lasketaan luvut r ja s siten, että:

r = n2

− zα⁄2√n2

ja s = 1+ n2

+ zα⁄2√n2

Luottamusväli: CL95%: [x(r), x(s)]

Huom. Kun n < 25 kannattaa käyttää tarkkaa binomijakaumaan perustuvaa väliä.

Esim. n = 100 ⇒ CL95%: (x(40), x(61))

eli luottamusvälin alaraja on 40. havaintoarvo ja yläraja 61. havainto-arvo järjestetyssä otoksessa.

Binomijakauman mukaan tämä on 96.5% luottamusväli.

Luottamusväliestimointi 68 Seppo Sarna

Page 73: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Muille prosenttipisteille (q) r ja s korvataan arvoilla:

r’ = nq − zα⁄2√nq (1− q ) ja s’ = 1 + nq + zα⁄2√nq (1− q )

Esim. 75%-pisteelle (q = 0.75), kun n = 100Luottamusväli: CL95%: (x(67), x(84))

Ohjelmat: CIA (vaihtoehto 8), MedStat (EB)

Mediaanien erotuksen luottamusväli

Riippumattomat otokset

• oletetaan, että aineisto on peräisin kahdesta jakaumasta, joiden muoto on sama,mutta ne eroavat sijainnin suhteen

• kahden perusjoukon mediaanien erotus estimoidaan kaikkien mahdollisten erotus-ten di = xi1 – xj2, i = 1, ..., n1, j = 1, ..., n2 mediaanina.

Näitä erotuksia on n1 * n2, kun n1 ja n2 ovat otosten koot.

• luottamusväli (otoskoko ≥ 25)• [d(k), d(n1 n2 − k)], missä d(k) on k. pienin ja d(n1 n2 − k) on k. suurin erotus

• luku k saadaan kaavasta: k = Wα⁄2 – n1 (n1 + 1)

2 , missä Wα⁄2 on Mann-Whitney:n

testisuureen jakauman %-piste

Ohjelmat: CIA: 8, Medstat: CA

Huom. Parittaisessa tapauksessa voidaan käyttää mediaanin luottamusvälejäerotuksille

Esim. a) Riippumattomat otokset, n1 = n2 = 30, α = 0.05Mediaanipareja on 30 * 30 = 900, k = 318.95% luottamusväliksi saadaan CL95% = [d(318), d(583)]

b) Parittaiset otokset, n = 30, α = 0.05

Mediaanipareja on n (n + 1)

2, eli 465, k* = 138.

95% luottamusväliksi saadaan CL95% = [d(138), d(328)](Wilcoxonin testiin perustuva menetelmä)

Biostatistiikan peruskurssi 1998 69 Luottamusväliestimointi

Page 74: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Suhdeluvun luottamusväli (tarkka väli)Luottamusvälin laskenta perustuu matemaattiseen yhteyteen binomi- ja F-jakauman välillä.

Tarkastellaan suhdelukua π ja oletetaan, että sille on tutkimusaineiston perusteella laskettu ar-

vio: π = kn

missä k ilmaiseen esim. kuinka monella n:stä henkilöstä on jokin tutkimuksen

kohteena oleva ominaisuus.

Luottamusväli: CL(1− α)% = (πL, πU):

πL = k

k + (n − k + 1) Fα⁄2 (2n − 2k + 2 , 2k )(5.4)

πU = k + 1

k + 1 + (n − k) 1Fα⁄2 (2k + 2 , 2n − 2k )

Esim. Bakteriurian esiintyvyys synnyttäjilläTutkimusaineisto: n = 196 synnyttäjää, k = 11 bakteeriuriatapaustaPiste-estimaatti: π = 11/196 = 0.056Luottamusväli: CL90% = (πL, πU)

Alaraja: dƒ1 = 2196 – 211 + 2 = 372, dƒ2 = 2k = 22, F0.10/2(, 22) = 1.80⇒ πL = 11/(11 + (196 – 11 + 1) 1.80) = 0.032

Yläraja: dƒ1 = 211 + 2 = 24, dƒ2 = 2196 – 211 = 370, F0.10/2(24, ) = 1.52⇒ πU = (11 + 1)/((11 + 1) + (196 - 11)(1/1.52)) = 0.090

Esim. Kliininen koe, Analgeetit x ja y, 100 potilastaLopputulosmuuttuja: preferenssi lääkkeen suhteenTulos: 65 potilasta preferoi x:ää. Tällöin k = 65 joten π = 0.65 ja

CL95%: πL = 65 / (65 + 36 F0.025(68, 130)) = 0.55 πU = 0.74

Suhdelukujen erotuksen luottamusväli

Riippumattomat otokset

Suhdeluvut: p1 = k1

n1 , p2 =

k2

n2

Luottamusväliestimointi 70 Seppo Sarna

Page 75: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Hoitovaste ∑+ –

Ryhmä 1 k1 n1 – k1 n1

Ryhmä 2 k2 n2 – k2 n2

Luottamusväli:

(p1 − p2) ± zα √p1 (1 − p1)n1

+ p2 (1 − p2)

n2

Esim. Kaksi hoitoa: 1 ja 2

Hoito Parantui Ei parantunut ∑1 21 8 29

2 12 19 31

Suhdeluvut: p1 = 21/29 = 0.724, p2 = 12/31 = 0.387 , p1 – p2 = 0.337 jaSE(p1 – p2) = 0.121, joten

CL95%: 0.337 – 1.96 * 0.121 = 0.101, 0.337 + 1.96 * 0.121 = 0.573eli (10.1%, 57.3%)

Parittaiset otokset

Käyttö:• kaksi ajankohtaa, samat henkilöt• kaltaistetut parit

Tarkastellaan ominaisuutta, joka on tyyppiä: kyllä, ei

1 2Henkilöidenlukumäärä

Suhdeluvut

Kyllä Kyllä rp1 =

r + snKyllä Ei s

Ei Kyllä tp2 =

r + tnEi Ei u

n

Suhdeluvut ja niiden erotus: p1 = r + s

n , p2 =

r + tn

, p1 − p2 = s − t

n

Erotuksen keskivirhe: SE(p1 − p2) = √s + t − (s − t)2⁄n

n

Biostatistiikan peruskurssi 1998 71 Luottamusväliestimointi

Page 76: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Luottamusväli erotukselle p1 – p2:

πL = (2∗AL − 1) (s + t)

n

πU = (2∗AU − 1) (s + t)

n

missä AL, AU ovat suhdeluvulle s

s + t binomijakauman perusteella lasketun luottamusvälin ala-

ja ylärajat.

Huom. Binomijakauman luottamusvälin kaavassa sijoitetaan k = s ja n = s + t .

Esim. (Gardner & Altman 1989, s. 32)

Aineisto: 35 sairaalassa kuollutta astmapotilasta ja heille valitut ikä-sukupuoli-kaltaistetut elävät parit. Kaikki ovat olleet tehohoidossa.

Tutkimuksen kohde: Monitoroinnin riittämättömyys (kyllä – ei)

Tulos: Raadin suorittama arvio monitoroinnin riittämättömyydestä riippumattakuolintiedosta.

Kuolleet Elävät n

Kyllä Kyllä 10

Kyllä Ei 13

Ei Kyllä 3

Ei Ei 9

∑ = 35

Suhdeluvut: p1 = (10 + 13)

35 = 0.66 , p2 =

(10 + 3)35

= 0.37

π = p1 − p2 = 0.29 , SE(p1 − p2) = √13 + 3 − (13 − 3)2

35 = 0.104

Luottamusväli:s

s + t = 13

13 + 3 = 0.81

CL95% tälle suhdeluvulle on AL = 0.5435, AU = 0.9595 ja näin ollen

πL = (2∗0.5435 − 1) (13 + 13)

35 = 0.0398

πU = (2∗0.9595 − 1) (13 + 3)

35 = 0.420

Luottamusväliestimointi 72 Seppo Sarna

Page 77: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Lukumäärän luottamusvälitPoisson-jakaumaan perustuva luottamusväli:

Parametri: λ = tapahtumien keskimääräinen lukumäärä / t, missä t on aika- / pinta-ala- / tilavuusyksikkö

Piste-estimaatti: λ = kt ,

missä k on havaittujen tapausten lukumäärä.

λ:n luottamusväli: 100(1 – α)% luottamusväli saadaan χ2 -jakauman prosenttipisteidenperusteella seuraavasti:

Alaraja: λ__ = χ 1 − α⁄2

2 (2k)2

ja yläraja: λ__ =

χ α⁄22 (2k + 2)

2

Suluissa oleva lauseke on vapausasteluku.

Poisson-jakauman luottamusvälit voidaan laskea ohjelmalla CIA:6:5 siten, kohtaan ’Observednumber:’ sijoitetaan lukumäärä k ja kohtaan ’Expected number:’ luku 1.

Esim. Asbestialtistus ja keuhkosyöpä (Armitage ja Berry 1987, s. 133).• Aineistona suuri joukko työntekijöitä, jotka olivat altistuneet asbestipölylle• Todettiin 33 keuhkosyöpäkuolemaa seuranta-aikana(k, O)• odotusarvo 20 (vastaavassa perusjoukossa)(E)

Odotusarvo voi olla laskettu esimerkiksi kaavalla E = Σ ni Ri, missä Ri on keuhkosyöpävaaraperusjoukon (referenssipopulaation) ikäluokassa i, ja ni on kyseiseen luokkaan kuuluvien hen-kilöiden määrä tutkimusryhmässä.

Onko keuhkosyöpäriski lisääntynyt?Nollahypoteesi H0: k = k0

Ratk. k = 33, mistä seuraa, että vapausasteet ovat 2k = 66, 2k+2 = 68CL95%: λ__= 45.43 = 22.7 , λ

__= 92.69 = 46.3

(laskettu ohjelmalla MedStat POISSON)

Testi: z = |k − k0| − 1⁄2

√k0

= |33 − 20| − 1⁄2

√20 = 2.80, P = 0.0026

Standardoitu suhde SMR (’Standardized Morbidity Ratio’):SMR = O/E = 33/20 = 1.65

99% luottamusväli: (1.00, 2.54) (laskettu ohjelmalla CIA:6:5)

Biostatistiikan peruskurssi 1998 73 Luottamusväliestimointi

Page 78: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Lukumäärien suhteen luottamusväliPoisson-jakauman tapauksessa

Käyttötilanne: Vakioitujen ilmaantuvuuslukujen vertailu

Oletetaan, että kA ja kB ovat havaittuja lukumääriä Poisson-jakaumista,joiden odotusarvot ovat λA ja λB

Suhteen R = λA

λB

luottamusväli lasketaan kaavalla:

( RL, RU) = (θL

1 − θL ,

θU

1 − θU)

missä θ = λA

λA + λB

ja (θL, θU) sen binomiaalinen luottamusväli.

Esim. MenA rokotuskoe suomalaisilla 3 kk - 5 v ikäisillä lapsilla vuonna1975 (Heikki Peltola et al., 1977.)

Ryhmä A: nA = 49295, sai MenA-rokotetta (Meningogoccus group A polysaccharide)Ryhmä B: nB = 48977, sai Hib-rokotetta (Haemophilus influenzae type b polysaccharide)Ryhmä C: nC = 31906, ei rokotettu

Tulos: Ensimmäisen seurantavuoden aikana ryhmässä A ei tullut yhtään tapausta, ryhmässä B tuli kuusi, ja ryhmässä C tuli 13 tapausta.

95% luottamusvälit (MedStat POISSON tai CIA:6:5)

A B C

k: 0 6 13

CL95%: (0, 3.7) (2.2, 13.1) (6.9, 22.2)

Ilmaantuvuudet (I) 100000 henkilövuotta kohden, ja niiden 95% luottamusvälit:

A B C

k: 0 12.3 40.7

CL95%: (0,7.5) (4.5, 26.8) (21.6, 69.6)

k:t ja niiden luottamusvälien päätepisteet on kerrottu suhteilla 100000/nA,100000/nB ja 100000/nC

Vertailu ryhmien B ja C välillä:

kB = 6 ja kC = 13, R = λB

λC

ja θ = kB

kB + kC

= 619

= 0.316

CL95%: (θL, θU) = (0.126, 0.565)

Luottamusväliestimointi 74 Seppo Sarna

Page 79: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

CL99%: (θL, θU) = (0.0895, 0.633) (CIA:4)

R = 613

= 0.46 ja sen luottamusväli

CL95%: (RL, RU) = ( 0.1261 − 0.126

, 0.565

1 − 0.565) = (0.14, 1.30)

CL99%: (RL, RU) = (0.10, 1.72)Koska ryhmäkoot eroavat, on sekä R että sen luottamusväli kerrottava

suhteella nC

nB =

3190648977

= 0.65 ja siten saadaan korjatuksi arvoksi R∗ = 0.30

CL95%: (RL∗, RU∗) = (0.09, 0.85)

CL99%: (RL∗, RU∗) = (0.06, 1.12)

Todetaan että myös ryhmässä B on MenA:n aiheuttamia aivokalvon-tulehduksia tilastollisesti merkitsevästi vähemmän kuin rokottamatto-mien ryhmässä (0.01 < P < 0.05)

Huom! Luku 1 ei sisälly 95% luottamusväliin, mutta sisältyy 99% luottamus-väliin, mistä johtuu ylläoleva johtopäätös.

Luottamusvälit preferensseilleRistikkäistutkimusasetelma:

• hoidot A ja B• potilaiden määrä n

Hoito Lukumäärä

A parempi aB parempi b

Yhtä hyviä n – (a + b)

∑ = n

Erotus: |a − b|

n

95% -luottamusväli CL95%: |a − b|

n ± 1.96 √a + b

n

Testi: z = |a − b|√a + b

Esim. a = 3, b = 13, n = 40a − b

n = 25%

z = 2.50, P = 0.0248 (kaksipuoleinen)

CL95%: (5.4%, 44.6%)

Biostatistiikan peruskurssi 1998 75 Luottamusväliestimointi

Page 80: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Multinomijakaumaan perustuvaluottamusväli

• Lopputulosmuuttuja on s-luokkainen ja saa arvot x1, x2, ..., xs , joita vastaavatkoodit l1, l2, ..., ls

Esim. s = 3, x1 = ’parempi’, x2 = ’ennallaan’, x3 = ’huonompija näitä x:n arvoja vastaavat koodiarvot l1 = + 1, l2 = 0, l3 = – 1

• Aineisto: n potilasta• Lopputulosten suhteelliset osuudet: (p1, p2, ..., ps) = (n1⁄n, n2⁄n, ..., ns⁄n)

• Lopputulos on summapistemäärä: L = n ∑ i = 1

s

pi li = ∑ i = 1

s

ni li

• L:n luottamusväli: L ± √χs−12 ( α) √∑ pi li

2 − [∑ pi li]2 √n

• α on riskitaso ja s – 1 on vapausaste

Esim. Reumakipujen analgeettihoito (Isomäki et al. 1984).• Koeasetelma: Kaikki kaikkia vastaan satunnaistetussa järjestyksessä ja kääntäen.• 90 potilasta ja 90 vertailua.• Lopputulos parhaan lääkkeen osalta: (n1, n2, n3) = (11, 4, 3)• L = 11*(+1) + 4*(0) + 3*(-1) = 8• Luottamusväli CL95%: (0.070, 15.93)

Negatiiviseen eksponenttijakaumaanperustuva luottamusväli

Käyttötilanne: Esimerkiksi syöpätutkimuksissa lasketaan usein potilaan viiden vuoden elossaolotodennäköisyyksiä. Oletetaan, että elossaolon jakauma noudat-taisi negatiivista eksponenttijakaumaa, jonka muotoa säätelee parametri θ = kuolemantapausten keskimääräinen tapahtumisintensiteetti. Olete-taan, että θ:lle on käytettävissä arvio (piste-estimaatti):

θ = 1 t_ =

n

∑ ti , missä ti on seuranta-aika

θ:n luottamusväli voidaan tällöin laskea kaavalla θ__ = χ1 − α⁄2

2 (2n)

2 ∑ ti , θ

__ =

χα⁄22 (2n)

2 ∑ ti

Eliniän odotusarvo on E(t) = 1θ

ja sen arvio E^ (t) = 1θ

Esim. Laske eliniän odotusarvon ja viiden vuoden elossaolotodennäköisyydenpiste-estimaatit ja niiden 90%:n luottamusvälit.

Luottamusväliestimointi 76 Seppo Sarna

Page 81: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Ratk. n = 10, t_ = 3.5 , mistä seuraa θ = 0.2857

α⁄2 = 0.05, dƒ = 2n = 20, mistä seuraa

χ0.952 = 10.851, χ0.05

2 = 31.410, ∑ ti = 10 * 3.5 = 35

Sijoittamalla nämä arvot edellä olevaan kaavaan saadaan:

θ__ = 10.851

70 = 0.155 , θ

__ =

31.41070

= 0.449

CL90%: alaraja: 1 θ__ =

10.4487

= 2.23 yläraja: 1 θ__

= 1

0.1550 = 6.45

Viiden vuoden elossaolotodennäköisyys P (t ≥ 5) = exp (θ ∗ 5)

Piste-estimaatti: P(t ≥ 5) = exp (–0.2857 * 5) = 0.2397

CL90%: alaraja: exp(–0.4487 * 5) = 0.1061 yläraja: exp(–0.1550 * 5) = 0.4607

Altistus- ja vaarasuhteen luottamusvälitTapaus-verrokkiasetelmassa käytetään taudin ja altisteen välisen riippuvuuden mittana altis-tussuhdetta (’odds ratio’, OR), josta käytetään myös nimitystä ristitulosuhde sen laskentata-vasta johtuen. Oletetaan, että tulokset on esitetty seuraavasti:

Tauti

Tapaukset Verrokit

Altistekyllä a b a + b

ei c d c + d

Tällöin OR määritellään suhteena: OR = a ∗ db ∗ c

OR:n 95% luottamusväli lasketaan ln(OR):n luottamusvälin avulla seuraavasti:

CI95% = eln (OR) ± 1.96 ∗ SE (ln (OR)) missä SE (ln (OR)) = √1⁄a + 1⁄b + 1⁄c + 1⁄d

Luotettavimmin vaarasuhde (RR) voidaan arvioida seurantatutkimuksista. Vaarasuhteen arvi-on luotettavuutta mittaava luottamusväli voidaan laskea seuraavasti:

a) Ilmaantuvuustiedot

Altistuneet Altistumattomat ∑Tapaukset a b m1

Henkilövuodet n1 n0 t

Biostatistiikan peruskurssi 1998 77 Luottamusväliestimointi

Page 82: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

b) Kumulatiivinen ilmaantuvuus tai vallitsevuus

Tapaukset a b m1Muut c d m0

∑ n1 n0 t

Vaarasuhteen arvio: RR = a⁄n1

b⁄n0

Testi a): χ = a − m1n1⁄t√m1n1n1⁄t2

(binomijakauma)

Testi b): χ = a − m1n1⁄t

[m1m0n1n0

t2 (t − 1)]

1⁄2 (hypergeometrinen jakauma)

Luottamusväli: RR___ = RR(1 − zα ⁄χ) , RR

___ = RR(1 + z

α ⁄χ)

ViitteetArmitage P & Berry G. Statistical methods in medical research, second edition, Blackwell

Scientific Publications, 1987.

Cappuccio FP et al. Lack of the effect of oral magnesium on high blood pressure. A doubleblind study. BMJ 291: 235-8, 1985

Gardner MJ & Altman DG. Statistics with confidence - Confidence intervals and statisticalguidelines. BMJ, Lontoo 1989. Hinta £19.

Isomäki H, Martio J, Kamela K et al. Comparison of analgesic effect of ten nonsteroidal anti-inflammatory drugs. Br J Rheumatol 23: 61-65, 1984.

Lipid Research Clinics Program. The lipid research clinics coronary prevention trial results.JAMA; 251: 351-74, 1984.

Medical Research Council Working Party. MRC trial of treatment of mild hypertension. BMJ291: 97-104, 1985.

Peltola H, Mäkelä PH, Käyhty H et al. Clinical Efficacy of Meningococcus Group A CapsularPolysaccharide Vaccine in Children Three Months to Five Years of Age. N Eng J Med297: 686-691, 1977.

OhjelmiaCIA (Confidence Interval Analysis). Gardner MJ, Gardner SB, Winter PD. CIA (Versio 0.5).

BMJ, Tavistock Square, London WC1H 9JR. Hinta £50.

Luottamusväliestimointi 78 Seppo Sarna

Page 83: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Tilastollisten testien valinta jatoteuttaminen

Hypoteesien testaaminenHypoteesien testaamisessa voidaan erottaa kaksi perustyyppiä:

• yksi testattava suure• simultaaniset testaukset; monta samanaikaisesti testattavaa suuretta

Hypoteesien testauksessa on kyse valinnasta kahden toisensa poissulkevan hypoteesin välillä:• nollahypoteesi (H0 , ’null hypothesis’)• vaihtoehtoinen hypoteesi (HA , ’alternative hypothesis’)

Esim. Onko uuden hoidon A ja perinteisen hoidon B välillä eroa tehon suhteen?

Nollahypoteesi: Ei ole eroa,Vaihtoehtoinen hypoteesi: On eroa.

Tämä päättelyprosessi päätyy ratkaisuun, joka on kaksiarvoinen: a) joko siten, että katsotaantutkimuksen antavan näyttöä hoitoeroista, jolloin päätetään hyväksyä vaitoehtoinen hypoteesitai b) siten, että tutkimuksen perusteella ei saada riittävää näyttöä hoitoeroista, eli nollahypo-teesi jää voimaan. H0:a ei voida koskaan tilastollisin keinoin todistaa oikeaksi. Oikea johto-päätös päädyttäessä siihen, että H0 jää voimaan, on esimerkiksi "tutkimuksessa ei voitu osoit-taa hoitojen A ja B välille tilastollisesti merkitsevää eroa."

HA voi olla joko kaksi- tai yksisuuntainen; ’on eroa’ tai ’on ero johonkin tiettyyn suuntaan’.Valtaosassa kliinisiä vertailevia tutkimuksia vaihtoehtoinen HA on kaksisuuntainen, koska etu-käteen ei voida olla täysin varmoja, etteikö jokin tietty hoito voisi olla esim. lumehoitoa hai-tallisempikin, ainakin jossakin tutkimuksen kohteeksi valitussa potilasjoukossa. Yksisuuntais-ta testausta käytetään mm. bioekvivalenssitutkimusten yhteydessä testattaessa siirrettyä nolla-hypoteesia (’shifted null hypothesis’). Siirron määrää tällöin tutkijan määrittelemäbioekvivalenttisuuden raja-arvo. Yksisuuntaista testausta voidaan käyttää myös silloin, hypo-teesin toinen suunta ei ole mielekäs tai testauksen kannalta relevantti. Esim. aiheuttaako run-sas kännykän käyttö aivotoiminnan häiriöitä? Joskus yksisuuntaista testausta näkee selvästikäytettävän siitä syystä, että kaksisuuntainen testi ei ole antanut tilastollisesti merkitsevää tu-losta (p < 0.05). Tämä menettely on luonnollisesti vastoin tieteen sääntöjä. Yksinkertaista jayleispätevää ohjetta yksi- tai kaksisuuntaisen testin käytöstä ei kuitenkaan voi antaa. Taloudel-liset syyt saattavat puoltaa yksisuuntaisen testin käyttöä, koska silloin selvitään paljon pienem-mällä potilasmäärällä.

Käytännössä tilastollinen testaus ei anna koskaan täysin varmaa päätöstä kumpaankaan suun-taan, vaan päätökesiin sisältyy virhemahdollisuus. Virheitä on kahta tyyppiä:

• α-virhe, hylkäämisvirhe, eli I-lajin virhe: H0 hylätään, vaikka se todellisuudessapitää paikkansa. Syynä voi olla esimerkiksi sattuma tai väärä testi.

Biostatistiikan peruskurssi 1998 79 Tilastollisten testien valinta ja toteuttaminen

Page 84: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

• β-virhe, hyväksymisvirhe, eli II-lajin virhe: H0 jää voimaan, vaikka se onkin vääräja pitäisi siten hylätä. Syynä voi olla riittämätön aineistokoko tai väärä testi.

α-virhe on sama kuin tilastollinen merkitsevyystaso (’statistical significance level’). α-virhevoi olla yksi- tai kaksisuuntainen. Aineistokoolla ei ole vaikutusta α-virheen esiintymismah-dollisuuteen. Testin voimakkuus on β-virheen funktio 1 − β. Se arvioidaan ensisijaisesti tutki-muksen suunnitteluvaiheessa tai toissijaisesti tutkimustulosten luotettavuutta tarkasteltaessa.β-virhe on aina yksisuuntainen.

Edellä esitetyssä hoitokokeiluesimerkissä päätöksentekoon liittyvät virheet voidaan esittääseuraavanlaisena nelikenttänä:

Todellinen tilanne:Hoitoero

Kyllä Ei

Päätöstutkimuksenperusteella

H0 hylätään ja hyväksytään HA

’hoitoeroa on’

Voima1 − β

I-lajin virheα

H0:a ei voi hylätä,’ei hoitoeroa’

II-lajin virheβ 1 − α

Kun testattavassa suureessa, esimerkiksi kliinisten vertailtavien tutkimusten lopputulosmuut-tujassa, todetaan ero, se voi johtua

• satunnaisvaihtelusta,• satunnaisvaihtelusta ja hoitoerosta, tai• satunnaisvaihtelusta ja harhasta

Tilastollisessa tutkimuksessa pyritään tutkimaan voiko todettu ero selittyä satunnaisvaihtelul-la. Harhan mahdollisuuksia pyritään välttämään mm. valitsemalla vertailuryhmä oikein.

MonivertailutTavallisesti monivertailutilanteessa ollaan, jos on monta hoitoa, monta lopputulosmuuttujaa,toistomittauksia, osaryhmäanalyysejä, tai välianalyysejä. Merkitään K:lla vertailujen lukumää-rää, α:lla sitä merkitsevyystasoa, jolla tutkimus aiotaan toteuttaa ja α*:llä todennäköisyyttävirheellisesti hylätä ainakin yksi kaikista mahdollisista nollahypoteeseista.

Jos vertailut ovat toisistaan riippumattomia vallitsee α:n ja α*:n välillä yhteys seuraavasti:

α* = P(’monivertailussa ainakin yksi merkitsevä tulos vaikka H0 on tosi’)= 1 − P (hyväksytään kaikki H0:t | kaikki H0:t ovat tosia)= 1 − (1 − α)K

Esim. K lopputulosmuuttujaa, merkitsevyystaso α = 0.05.Sijoittamalla yllä olevaan kaavaan K = 1, 2, ..., 10 saadaan

Tilastollisten testien valinta ja toteuttaminen 80 Seppo Sarna

Page 85: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

K α* K α*

1 0.05 6 0.26

2 0.10 7 0.30

3 0.14 8 0.34

4 0.19 9 0.37

5 0.23 10 0.40

Taulukosta voitaan todeta, että α-virheen mahdollisuus kasvaa nopeasti lopputulosmuuttujienlukumäärän lisääntyessä. Kun α on pieni, niin (1 − α)K ≈ 1 − Kα. Sijoittamalla tämä edelläolevaan kaavaan todetaan, että α* = Kα. Jos halutaan säilyttää monivertailutilanteessa alku-peräinen merkitsevyystaso, pitäisi P-arvoja verrata tasoon, joka on jaettu vertailujen lukumää-rällä. Tämä niinsanottu Bonferroni-korjaus korjaa liikaa eli on konservatiivinen, koska lop-putulosmuuttujat yleensä käytännössä korreloivat keskenään, jolloin edellä oleva α:n ja α*:nvälinen yhteys pidä paikkansa.

Ainoa oikea tapa käsitellä monivertailuongelmaa on käyttää sellaisia tilastollisia menetelmiäja testejä, jotka on suunniteltu tähän tarkoitukseen: toistomittausten ANOVA, Friedmanin tes-ti, Cochranin Q-testi, erilaiset monivertailutestit.

Kliinisten tutkimusten suunnitelmissa tulisi ilmoittaa mahdollisimman tarkasti, mitä hypo-teeseja on tarkoitus testata ja kuinka testit tai erilaiset vertailut tullaan suorittamaan (suunnitel-lut vertailut, ’ad hoc comparisons’). Usein varsinaisten hypoteesien lisäksi tutkimusprosessinanalyysivaiheessa kehitellään lisähypoteeseja, valitaan niihin soveltuvat testit ja vertailutavat(jälkikäteisvertailut, ’post hoc comparisons’). Nämä testaukset tulkitaan kuitenkin suoritetuntutkimuksen kannalta toisarvoisiksi. Lähinnä niillä on merkitystä jatkotutkimusten kehittelynkannalta.

Parametrinen ja ei-parametrinen testiParametrinen testi (’parametric test’) perustuu johonkin teoreettiseen malliin ja sen sisältämi-en tuntemattomien parametrien arvioimiseen tutkimusaineiston perusteella. Esimerkiksi t-testion parametrinen testausmenetelmä, joka perustuu Studentin t-jakaumaan.

Ei-parametrinen testi (’non-parametric test’) ei perustu mihinkään jakaumaoletuksiin, vaan sii-nä tarvittavat suureet lasketaan suoraan havaintoaineistosta esim. muodostamalla suhdeluku-ja, niiden tuloja jne. (esim Kaplan-Meier -menetelmä) tai muodostamalla järjestyslukuja sekäniiden perusteella johdettuja suureita (esim. Wilcoxon-Mann-Whitney’n testisuure). Ei-para-metrisia menetelmiä käytetään etenkin pienissä ja/tai hankalissa havaintoaineistoissa, esim.kun aineisto sisältää poikkeavia havaintoarvoja.

Ei-parametristen testausmenetelmien voima on lähes sama (noin 95%) kuin parametristen me-netelmien silloin, kun parametristen menetelmien käyttöedellytykset ovat voimassa.

Biostatistiikan peruskurssi 1998 81 Tilastollisten testien valinta ja toteuttaminen

Page 86: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Ei-parametristen menetelmien käyttöindikaatioita ovat

• mittaukset järjestysasteikolla• aineisto pieni (alle 20)• jakaumat monihuippuisia ja/tai epäsymmetrisiä.

P-arvon käyttöön liittyviä rajoitteita jaongelmia

P-arvon määrittely edellyttää käsitteiden testisuure ja sen otosjakauma määrittelyä. Testisuu-reella tarkoitetaan mitä tahansa nollahypoteesin testaamiseen käytettyä otossuuretta, otoksenhavaintoarvojen funktiota. Testisuureen otosjakauma on kaikkien mahdollisten testisuureensaamien arvojen muodostama jakauma.

P-arvo määritellään seuraavasti: Se on testisuureen otosjakauman perusteella laskettu todennä-köisyys saada lopputulos, joka on vähintään yhtä harvinainen (epätodennäköinen) kuin tutki-muksessa saatu lopputulos edellyttäen, että H0 pitää paikkansa (on tosi).

P-arvoja on lääketieteellisissä julkaisuissa käytetty ylikorostuneesti ja niiden käyttöön on liit-tynyt paljon mystiikkaa ja harhakäsityksiä. Näihin asioihin on viime vuosina kiinnitetty tie-teellisten lehtien toimituksissa ja tutkijoille suunnatuissa kirjoitusohjeissa erityistä huomiota.

P-arvo ei suoranaisesti liity aineistokokoon; pieni p-arvo voidaan saavuttaa niin pienessä kuinsuuressakin tutkimuksessa. Kliinisissä tutkimuksissa mm. hoitoero on ratkaisevassa asemas-sa. Pienen eron löytäminen edellyttää yleensä isoa aineistoa. Suuri ero voidaan sen sijaan to-deta pienemmälläkin aineistolla (ks. luku aineistokoon arviointi). Millään tilastollisella testilläei kuitenkaan yleensä saavuteta maagisena pidettyä tasoa p < 0.05, jos ryhmäkoko jää allekuuden. Oikein pienillä aineistoilla kannattaa yleensä käyttää satunnaistamis- eli permutaa-tiotestejä (esim. StatXact3).

Jonkin todetun eron biologinen tai lääketieteellinen merkitsevyys on eri asia kuin tilastollinenmerkitsevyys. Tästä syystä artikkeleissa kannattaa käyttää jälkimmäisestä termiä ’statisticallysignificant’. Kliinisen merkitsevyyden arviointia helpottaa, kun ei tyydytä pelkkään p-arvoon,vaan keskeisimmille lopputulosmuuttujille lasketaan myös luottamusvälit. Vaikka p-arvo eiantaisikaan esim. ryhmien välille tilastollisesti merkitsevää hoitoeroa, niin luottamusväli voipaljastaa, että käytännön kannalta eroa saattaisi olla, mikä näkyy esim. välin kapeutena ja sel-vänä epäsymmetrisyytenä nollan suhteen. Isoilla aineistoilla kliinisesti merkityksettömätkinerot saattavat tulla tilastollisesti erittäin merkitseviksi, esim. p < 0.0001.

Vakiintunut käytäntö vetää tilastollisesti merkitsevän ja ei-merkitsevän (’non-significant’) tu-loksen raja tasolle 0.05 ei perustu mihinkään matemaattiseen tosiseikkaan. Se on täysin keino-tekoinen valinta ja aiheuttaa paljon harhakäsityksiä. Esim. tutkija saattaa raportoida p-arvoon0.051 päätyneen tuloksen tilastollisesti ei-merkitsevänä, kun taas joku toinen tutkija samankal-taisesta tutkimuksesta saamansa tuloksen p = 0.049 tilasollisesti merkitseväksi. Jos tutkijateivät ilmoita p-arvoa, niin lukijalla ei ole mahdollista arvioida tulosten merkitystä. Koko tilas-tollisen testauksen periaatteet on täysin väärin ymmärretty, mikäli näillä kahdella tuloksellakatsottaisiin olevan jotain eroa käytännön kannalta. On syytä muistaa, että eri ohjelmienkin

Tilastollisten testien valinta ja toteuttaminen 82 Seppo Sarna

Page 87: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

tuottamat p-arvot samasta testistä voivat vaihdella jonkin verran, ja joskus jopa paljonkin, riip-puen siitä, minkälaista laskenta-algoritmia mikäkin ohjelma käyttää.

Käsitteitä melkein merkitsevä (’almost significant’), merkitsevä (’significant’) ja erittäin mer-kitsevä (’highly significant’) ei nykysuositusten mukaan tulisi käyttää. Ne ovat peräisin taulu-koiden laadinnasta ja antavat p-arvon luonteesta väärän kuvan. Useimmissä tilanteissa p-arvokannattaa antaa ns. tarkkana, siten että siinä on korkeintaan neljä desimaalia ja kaksi merkitse-vää numeroa, esim. p = 0.0032, p = 0.0002 tai p < 0.0001. Tätä pienemmät p-arvot eivätole mielekkäitä, koska p-arvo liittyy vain α-virheeseen. Jonkin geneettisen ominaisuudenesiintymistodennäköisyys voisi olla 3.2*10-6 (eli 3.2/1 000 000). P-arvon kohdalla näin pieniarvo ei anna enempää varmuutta H0:n oikeellisuudesta kuin mitä arvo 0.0001 antaisi.

P-arvo on laskettu ehdolla, että H0 on tosi, eli kyseessä on ehdollinen todennäköisyysp (T | H0), missä T on tutkimuksen lopputulos. Samaan lopputulokseen T voidaan kuitenkinpäätyä monien muidenkin hypoteesien kuin H0:n vallitessa. Mikäli olisikin niin H0:n asemestajokin vaihtoehtoisista hypoteeseista H1 olisikin tosi, niin saataisiin aivan eri p-arvoja. P-arvovastaa itse asiassa aivan eri kysymykseen, mihin tutkija toivoisi ja usein luulee sen vastaavan.Tutkija tavoittelee yleensä todennäköisyyttä p (H0 | T), eli että onko H0 tosi sen tiedon perus-teella, mitä tutkimuksen lopputulos (T) tuotti. Tähän p-arvo ei vastaa. Todennäköisyydetp (T | H0) ja p (H0 | T) voivat olla hyvinkin erilaisia. Andersen (1984) esittää kirjassaan esi-

merkin: T=kuume, H0=umpisuolen tulehdus, p (H0 | T) voisi olla 0.01 ja p (T | H0) luokkaa0.50, joten melkoinen ero.

Eholliset todennäköisyydet p (H0 | T) ja p (T | H0) voidaan liittää toisiinsa kaavalla:

p (H0 | T) = p (H0) ∗ p (T | H0)

p (T)

Tämä on ns. Bayesin kaava. H0:n paikkaansapitävyyttä ilmaiseva todennäköisyys ehdolla, ettätutkimuksessa on saatu lopputulos T on siten suoraan verrannollinen nollahypoteesin a prioritodennäköisyyteen p(H0) ja p-arvoon. A priori todennäköisyys p(H0) perustuu tutkimuksen ul-kopuoliseen ennäkkotietoon. Yllä olevaan kaavaan perustuvat Bayesiläiset menetelmät eivätainakaan toistaiseksi ole saavuttaneet suurta suosiota kliinisissä tutkimuksissa. P(H0):n arvi-ointia on pidetty liian subjektiivisena. Toisaalta esim. aikaisemmista vastaavista tutkimuksistasaatavan a priori tiedon hyödyntämättä jättäminenkin, kuten p-arvon laskemisessa tapahtuu,ei ole korrektia.

Tilastollisten testien valintaperusteetTilastollisten testien valintapäätös on yleensä melko monitahoinen asia. Testi tulisi valita si-ten, että se on riittävän herkkä toteamaan eroja jos niitä on olemassa, mutta toisaalta se ei saisiolla myöskään liian optimistinen. Ainakin alla esitettyihin asioihin pitää ottaa kantaa sopivaatestiä mietittäessä:

Biostatistiikan peruskurssi 1998 83 Tilastollisten testien valinta ja toteuttaminen

Page 88: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

• Aineiston rakenne/testausasetelmaRiippumattomat (’independent’) otokset/ryhmät’Unpaired/unmatched design’Riippuvat (’related’, ’dependent’) otokset/ryhmätRiippumattomat kaltaistetut (’matched’) otokset

• Mitta-asteikkoVälimatka/suhdeasteikkoJärjestysasteikkoLaatueroasteikkoBinomiaalinen asteikko

• Otosten/ryhmien lukumääräYksiKaksiYli kaksi

• Testauksen tarkoitusHeterogeenisuusTrendiAssosiaatio

• Aineiston koko’Kohtalainen’ (yli 30 ryhmää kohden)’Pienehkö’ (10-30 ryhmää kohden)’Pieni’ (alle 10 ryhmää kohden)

• JakaumaNormaali/log-normaaliBinomiPoisson

Monissa tilastopaketeissa on sisäänrakennettuna ohjelmamoduuleja (’statistical adviser’, ’sta-tistical navigator’, ’tutor’, ’guide’, ’wizard’), jotka avustavat tutkijaa testi- tai menetelmävalin-noissa. Nämä ohjelmien valikot tai niiden esittämät kysymykset perustuvat mm. yllä esitettyi-hin valintaperusteisiin. Lisäksi usein niissä kerrotaan testien ja menetelmien käyttöedellytyk-sistä.

Seuraavissa taulukoissa on esitetty kliinisten tutkijoiden tavallisimmin käyttämiä perustestejäasteikkotyypeittäin eri testausasetelmissa.

Tilastollisten testien valinta ja toteuttaminen 84 Seppo Sarna

Page 89: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

1 muuttuja, 1 otos, 1 tai 2 ajankohtaa

Asteikko Testausasetelma Testi

Välimatka tai suhde

Otoksen tunnusluvun tai malliinliittyvän parametrin testaaminen

z-testi (Waldin testi)

t-testi

Muutos, iso otos, 2 ajankohtaa parittainen t-testi

Muutos, pieni otos, 2 ajankohtaa satunnaistamistesti

Muutos, pieni otos, kaltaistetut paritFisherin

satunnaistamistesti

YhteensopivuusKolmogorov-

Smirnovin testi

Normaalisuus Shapiro-Wilkin W-testi

Järjestys

SatunnaisuusBinomitesti

’Runs’-testi

MuutosWilcoxonin

parittainen testi*

Yhteensopivuus

Kolmogorov-Smirnovin testi

Hodges-Lehmanninmediaanien

luottamusvälit

Laatuero

Otoksen tunnusluvun testaus

binomitesti

Poissontesti

χ2 -testi

Muutosten heterogeenisuus,2×2 taulukko

McNemarin testi

Muutosten heterogeenisuus,k×k taulukko (k ≥ 2)

Lehmacherin testi= Yleistetty McNemar

Heterogeenisuus, kaltaistetut parit Bowkerin testi

*Testi tunnetaan myos nimillä ’parittainen rank-sum’, ’Wilcoxon-Pratt’ sekä ’Wilcoxon signed rank’ -testi

Biostatistiikan peruskurssi 1998 85 Tilastollisten testien valinta ja toteuttaminen

Page 90: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

1 muuttuja, 2 toisistaan riippumatonta otosta

Asteikko Testausasetelma Testi

Välimatka tai suhdeHeterogeenisuus, pienet otokset

Fisher-Pitmaninpermutaatiotesti

(satunnaistamistesti)

Heterogeenisuus, keskiarvojen ero,suuret otokset

t-testi

Järjestys

Heterogeenisuus,mediaanien ero

Wilcoxonin testiriippumattomille

otoksille eli Mann-Whitneyn U-testi

Heterogeenisuus,järjestetyt kategoriat

kontingenssi-taulukkotesti

Ositetut 2×c taulukot

’Wilcoxonin rank-sum’-testi

’Normal scores’ -testi

Savage-testi

Cochran-Armitagentrenditesti

Permutaatiotesti

Heterogeenisuus, rajatut havainnotWilcoxon-Gehanin testi

logrank-testi

Laatuero

Heterogeenisuus,2×2 taulukko, pienet otokset

Fisherin eksakti testi

Heterogeenisuus,2×2 taulukko, isot otokset

Pearsonin χ2-testi

Heterogeenisuus,r×c taulukko, pienet otokset

Fisher-Freeman-Haltonin testi

(yleistetty Fisherineksakti testi)

Heterogeenisuus,r×c taulukko, suuret otokset

LR-testi(uskottavuussuhdetesti)

Pearsonin χ2-testi

Heterogeenisuus,ositetut 2×2 taulukot,

sekoittava tekijä mukanaMantel-Haenszelin testi

Tilastollisten testien valinta ja toteuttaminen 86 Seppo Sarna

Page 91: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

1 muuttuja, yli 2 otosta, yksi luokitteleva tekijä,riippumattomat otokset

Asteikko Testausasetelma Testi

Välimatka- tai suhde

Heterogeenisuus,keskiarvojen erot,normaalijakauma

Yksisuuntainenvarianssianalyysi

(Anova)

F-testi

Heterogeenisuus, pienet otokset satunnaistamistesti

Järjestys

Heterogeenisuus,mediaanien erot

Kruskal-Wallisinei-parametrinen

varianssianalyysi

Trandit mediaaneissaJonckheere-Terpstran

-trenditesti

Heterogeenisuus, rajattuja havaintoja Schemperin testi

Laatuero

Suhdelukujen homogeenisuus G-testi

Jakaumien yhteensopivuus G-testi

Kolmiulotteiset kontingenssi-taulukot (N×N×N)

χ2-testi

1 muuttuja, yli 2 otosta, kaksi luokittelevaa tekijää,riippumattomat otokset

Asteikko Testausasetelma Testi

Välimatka- tai suhdeHeterogeenisuus, keskiarvojen erot,

normaalijakauma

kaksisuuntainenvarianssianalyysi’two-way Anova’

sisäkkäiset luokitukset,’nested Anova’

Järjestys Heterogeenisuus, mediaanien erotkaksisuuntainenei-parametrinen

varianssianalyysi

LaatueroHeterogeenisuus,spesifit hypoteesit

log-lineaariset mallit

Biostatistiikan peruskurssi 1998 87 Tilastollisten testien valinta ja toteuttaminen

Page 92: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

1 muuttuja, yli 2 otosta, riippuvat otokset

Asteikko Testausasetelma Testi

Välimatka- tai suhde

Heterogeenisuus, toistotesim. eri ajankohtina

toistomittauksienvarianssianalyysi

Heterogeenisuus, pienet otokset satunnaistamistesti

Heterogeenisuus,pienet otokset, kaltaistus

Pitman-Welchin testi

Järjestys

Heterogeenisuus, toistot,kaltaistetut henkilöt

Friedmaninkaksisuuntainenvarianssianalyysi

Heterogeenisuus, toistot,esim. samat henkilöt ja eri arvioijat

rank sum -testi

Monotonisuus Pagen trenditesti

Laatuero Suhdelukujen heterogeenisuus Cochranin Q-testi

Assosiaation (riippuvuuden) mitat

Asteikko Mitattava suure Mitta

Välimatka- tai suhdeRiippuvuus

(kaksiulotteinen normaalijakauma)Pearsonin

korrelaatiokerroin

Järjestys

Riippuvuus

Spearmanin järjestys-korrelaatiokerroin

Kendallin tau τSomersin D

Riippuvuus, r×s taulukot Gamma-kerroin Γ

Yhtäpitävyys*Kendallin konkordans-

sikerroin, χ2 -testi

Laatuero

Yhtäpitävyys*Cohenin kappa κ

Painotettu kappa κ

Riippuvuus, r×c taulukot

Cramerin kerroin

Phi-kerroin rϕlambda-kerroin λ

Goodman-Kruskalintau τ

Epävarmuuskerroin(’uncertaintycoefficient’)

*joko samat koehenkilöt ja kaksi testiä / havainnoijaa tai parittaisen aineiston konkordanssin mittaaminen

Tilastollisten testien valinta ja toteuttaminen 88 Seppo Sarna

Page 93: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Normaalisuuden testaaminenMonissa lääketieteellisissä aineistoissa muuttujien jakauman normaalisuuden tarkistaminenon aiheellista, koska hyvin usein normaalisuusoletus ei ole voimassa. Tällöin on syytä välttääsellaisia menetelmiä ja testejä, jotka voimakkaasti perustuvat normaalisuuteen. Esimerkiksipaljon käytettyä t-testiä luonnehditaan yleensä melko robustiksi testiksi, mikä tarkoittaa etteise ole kovin herkkä poikkeamille niistä oletuksista, joihin testi perustuu. Poikkeavat havainto-arvot aiheuttavat kuitenkin herkästi t-testin nimittäjässä olevan keskivirheen kasvamisen, jol-loin testistä tulee konservatiivinen, l. ylivarovainen.

Normaalisuuden testaamiseen voidaan käyttää seuraavia testejä

• χ2 -yhteensopivuustesti χ2 = ∑ i = 1

k(Oi − Ei)

2

Ei = χ2 (k − 1 − m)

• Kolmogorov-Smirnovin testi

K-S-testi yleensä voimakkaampi kuin χ2-testi• Vinouskerroin g1, ja sen keskivirhe: SE (g1)

Testi: z = g1

SE (g1)• Huipukkuuskerroin g2, ja sen keskivirhe: SE (g2)

Testi: z = g2 − 3

SE (g2)• Shapiro-Wilkin W-testi

Suositeltava testi, ja löytyy useimmista tilastopaketeista.• ’Probit-plot’ -menetelmä

Varianssien homogeenisuustestitJoissakin testeissä edellytetään vertailtavien ryhmien varianssien homogeenisuutta. Tämän tut-kimiseksi on olemassa seuraavat testit:

• Hartleyn F-max-testiPerustuu kahden varianssin suhteeseen

• Bartlettin testiSekä Hartleyn että Bartlettin testit ovat herkkiä poikkeamille normaalisuu-desta. Hartleyn testi on lisäksi herkkä ryhmien erisuuruudelle.

• Box’n testiTesti soveltuu erityisesti isoille aineistoille

• Levenen testiBox ja Levene ovat melko robusteja testejäNormaalijakaumillekin Levenen testi on lähes yhtä hyvä kuin Hartleyn taiBartlettin testi.

Biostatistiikan peruskurssi 1998 89 Tilastollisten testien valinta ja toteuttaminen

Page 94: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Permutaatiotesti riippuville otoksillePermutaatio- eli satunnaistamistestit ovat ns. eksakteja testejä, joiden otosjakauma nollahypo-teesin vallitessa ja siten myös laskettavat p-arvot saadaan tutkijan keräämästä havaintoaineis-tosta sopivasti permutoimalla. Normaalijakaumaoletusta ei tarvita. Niitä voidaan käyttää jatku-ville, järjestys- ja nominaaliasteikollisille muuttujille. Tavallisimmin niitä käytetään pienilläaineistoilla. Suuriin aineistoihin sovellettaessa käytetään Monte Carlo simulaatiota jolloin saa-tava p-arvo ei ole yksikäsitteinen vaan tietty väli.

Käyttötilanne:• Kaksi otosta, esimerkiksi samoista henkilöistä kahtena eri ajankohtana• Aineistokoko on alle 10 (voidaan laskea suuremmillekin aineistoille)• Mittaukset välimatka-asteikolla (normaalisuusoletusta ei tarvita)

Esim. FEV1 (l⁄sek) ennen ja jälkeen bronkodilataattorin käytön astmaatikoilla

(Campbell MJ & Machin D, 1990, s. 134)

Aineisto: x y y - x

n = 5

1 1.5 1.7 0.2

2 1.7 1.9 0.2

3 2.1 2.2 0.1

4 1.6 1.9 0.3

5 2.4 2.4 0.0

Tuloksia eri testeillä ja ohjelmilla:

KaksipuoleinenP-arvo

MedStat CD

Wilcoxon/Pratt 0.1250

Parittainen t-testi

Nolla mukana 0.0349

Nolla poistettu 0.0163

StatXact

Permutaatiotesti

Asymptoottinen 0.0593

Eksakti 0.1250

Monte Carlo(2000 simulaatiota) 0.1190 ± 0.0273 (99%)

Wilcoxon 0.0656

Näin pienellä aineistokoolla niinsanotut asymptoottiset testit (esim. t-testi) antavat yleensä yli-optimistisia tuloksia, liian pieniä P-arvoja. Aineistokokoa pitäisi tässä tapauksessa kasvattaanoin 10 koehenkilöön, mikäli standardoitu muutos on todellisuudessa kuten yllä 1.08 (muu-toksen keskiarvo / muutoksen SD), voimaksi vaaditaan 90%, ja kaksipuoleiseksi merkitse-vyystasoksi 0.05.

Tilastollisten testien valinta ja toteuttaminen 90 Seppo Sarna

Page 95: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Wilcoxonin parittainen testiTestistä käytetään myös nimitystä etumerkillinen järjestyslukutesti (’Wilcoxon signed ranktest’).

Käyttötilanne:• Samat henkilöt kahtena eri ajankohtana• Kaltaistetut parit

Testi perustuu "+" ja "-" merkkisten järjestyslukujen summiin T+ ja T-. Jos aineiston lukupa-reissa on erotuksia, joiden tulos on nolla, laskevat monet tilasto-ohjelmat Wilcoxonin testistäPrattin (1959) esittämän modifikaation. Ohjelmassa StatXact vastaava tulos saadaan käyttä-mällä yhden otoksen eksaktia permutaatiotestiä.

Testin lisäksi kannattaa yleensä laskea mediaanien erotus (esim. hoitoero) ja sen 95% luotta-musvälit.

Järjestyslukujen muodostaminen

Havaintoaineiston lukupareista (x1, y1),... , (xn, yn) lasketaan erotukset di = xi - yi , jotka laji-tellaan suuruusjärjestykseen di:n mukaan.

Silloin kun aineistossa esiintyy erotuksia, joiden arvo di = 0, on järjestyslukujen muodostami-seksi kaksi tapaa:

• Tavanomaisessa Wilcoxonin testissä tapaukset di = 0 jätetään pois järjestyslukujamuodostettaessa. Näin menetellään esimerkiksi StatXact ohjelmassa käytettäessäoptiota WI.

• Toinen menettelytapa on antaa niille kaikille järjestysluku 0 ja seuraavat järjestys-luvut alkavat arvosta (nollien määrä) + 1. Esimerkiksi ohjelma MedStat menetteleenäin (Prattin modifikaatio), samoin StatXactin permutaatiotesti (optio PE EX).

Mikäli aineistossa esiintyy samoja erotuksia (’ties’), niin järjestysluku lasketaan seuraavasti:

Jos |d(j)| = |d(j + 1)| = … = |d(j + k)| , niin järjestysluku on (j) + (j + k)

2.

Jos merkitään nollasta poikkeavien erotusten määrää n’:lla, niin tällöin T+ + T− = 12 n’ (n’ + 1)

Testissä voidaan käyttää joko summaa T+ tai T-. Pienillä n’-arvoilla (n’ ≤ 25) P-arvo katso-taan taulukoista (esim. Altman 1991, s.531). Suurilla n’-arvoilla (n’ > 25) T+ (tai T-) noudatta-vat likimain normaalijakaumaa siten, että

E ( T+) = 14 n’ (n’ + 1) , Var ( T+) =

2 ∗ n’ (n’ + 1) (2n’ + 1) − ∑ j

(tj3 − tj)

48

missä ∑ j

(tj3 − tj) on samoista erotuksista (’ties’) johtuva korjaustekijä.

Biostatistiikan peruskurssi 1998 91 Tilastollisten testien valinta ja toteuttaminen

Page 96: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Asymptoottinen testisuure on

z = |T+ − E (T+) | − 1⁄2

√Var (T+)

Esim. Muutoksen testaaminen. Riippuvat otokset. (Makuch RD & Parks WP.Response of serum antigen level to AZT treatment of AIDS.AIDS Research and Human Retroviruses. 1988; 4: 315-16.)

ID Pre_AZT Post_AZT DIFF

01 149 0 -149

02 0 51 51

03 0 0 0

04 259 385 126

05 106 0 -106

06 255 235 -20

07 0 0 0

08 52 0 -52

09 340 48 -292

10 0 0 0

Ratkaisu perinteisellä Wilcoxonin testillä:

20 potilasta, 4 nollaa, joten n’ = 16

Järjestysluku 1 2 3 4 5 6 7 8 9

di 14 20 51 52 84 89 103 106126 149 ...

T+ = 12 , 12

n’ (n’ + 1) = 136 (T- = 136 - 12 = 124)

E(T+) = 14

n’ (n’ + 1) = 68

Var(T+) = n’ (n’ + 1) (2n’ + 1)

24 = 374 (Ei samoja erotuksia)

SE(T+) = 19.34

z-testi: |T+ − E (T+) | − 1⁄2

SE (T+) =

|12 − 68| − 1⁄219.34

= 2.87 (P = 0.0041)

Esim. Kliininen kokeilu rauhoittavan lääkkeen käytöstä neuroottisilla potilailla.Kontrollina lumelääke. 10 potilasta. (Armitage, s. 105, 411)

Asetelma: ristikkäistutkimus

ID Pre_AZT Post_AZT DIFF

11 180 77 -103

12 0 0 0

13 84 0 -84

14 89 0 -89

15 212 53 -159

16 554 150 -404

17 500 0 -500

18 424 165 -295

19 112 98 -14

20 2600 0 -2600

Tilastollisten testien valinta ja toteuttaminen 92 Seppo Sarna

Page 97: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Hoitokaika kummassakin periodissa yksi viikko.

Lopputulosmuuttuja: ahdistuneisuuspistemäärä (0-30)

Ahdistuneisuus Erotus d i(lääke-lume)Potilas Lääke Lume

1 19 22 -3

2 11 18 -7

3 14 17 -2

4 17 19 -2

5 23 22 1

6 11 12 -1

7 15 14 1

8 19 11 8

9 11 19 -8

10 8 7 1

-13

di 1 1 1 1 2 3 3 7 8 8

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

Järjestysluku 2.5 5 6.5 7 9.5

T+ = 2.5 + 2.5 + 2.5 + 9.5 = 17 , 12

n’ (n’ + 1) = 55

E(T+) = 14

∗10∗11 = 27.5

Var(T+) = 2 ∗ 10 ∗ 11 ∗ 21 − (43 − 4) − (23 − 2) − (23 − 2)

48

= 96.25 - 1.5 = 94.75 (1.5 on samoista erotuksista _ aiheutuva korjaus)

SE(T+) = √94.75 = 9.37

z = 10.5 − 0.5

9.37 = 1.03 , P = 0.303

(Parittainen t-testi: t = d_

SE (d_) =

−1.31.438

= -0.90 , P = 0.392 , dƒ = 9)

Lääke

Lume

Biostatistiikan peruskurssi 1998 93 Tilastollisten testien valinta ja toteuttaminen

Page 98: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

McNemarin testiKäyttötilanne:

• Lopputulos kaksiarvoinen• Jokin seuraavista asetelmista:

Samat henkilöt mitattu kahtena eri ajankohtana ja tarkastellaan muutostalopputulosmuuttujassaRistikkäistutkimusasetelmaKaltaistettu tapaus-verrokki -asetelma

Ristikkäistutkimuksen testausasetelma:

Vaste hoitoon A

Kyllä Ei Yhteensä

Vaste hoitoon B

Kyllä e f e + f

Ei g h g + h

Yhteensä e + g f + h n

Testausasetelma kaltaistetulle tapaus-verrokki -tutkimukselle:

Verrokit: altistus

Kyllä Ei Yhteensä

Tapaukset:altitus

Kyllä e f e + f

Ei g h g + h

Yhteensä e + g f + h n

Testi ilman jatkuvuuskorjausta: χ2 = (f − g)2

f + g

Yatesin jatkuvuuskorjauksella: χ2 = (f − g − 1)2

f + gTestisuure noudattaa kummassakin tapauksessa likimain χ2-jakaumaa vapausastein 1.

Esim. Kaltaistettu tapaus-verrokki -tutkimus kivessyövästä. Lähde: Brown LM, Pottern LM, Hoover RN. Testicular cancer in youngmen: the search for causes of the epidemic increase in United States.J Epidemiology and Community Health. 1987; 41: 349-354.)

Altiste: Kivesten laskeutuminen syntyessä (kyllä-ei)

Tilastollisten testien valinta ja toteuttaminen 94 Seppo Sarna

Page 99: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Tulos

Kontrollit (eisyöpää)

ei kyllä Σ

Tapaukset ei 4 11 15

kyllä 3 241 244

Σ 7 252 261

Testit: χ2 = (11 − 3)2

11 + 3 = 4.57 , P = 0.033

χc2 =

(11 − 3 − 1)2

11 + 3 = 3.50 (Yates-korjattu) P = 0.061

Yllä olevat testit ovat approksimatiivisia. Tarkka testaus voidaansuorittaa binomijakauman perusteella:

Kaava: P = (f + g)!f! g!

(12

)f + g

Sovelletaan ylläolevaa ja lasketaan lopputuloksen (yllä oleva taulukko)ja nollahypoteesin vallitessa sitä harvinaisempien lopputulosten toden-näköisyydet taulukoista:

Näin saadaan:P(i) =

14!11! 3!

(12

)14 = 0.02222

P(ii ) = 14!

12! 2! (1

2)14 = 0.00555

P(iii ) = 14!

13! 1! (1

2)14 = 0.00085

P(iv) = 14!

14! 0! (1

2)14 = 0.00006

Laskemalla nämä yhteen saadaan P = 0.02868.

Kaksisuuntaisessa testissä tämä arvo kerrotaan kahdella ja siten ns.tarkaksi P-arvoksi saadaan 0.057 (yleensä 2 merkitsevää numeroa riittää!).Vertaamalla approksimatiivisiin arvoihin todetaan, että tämä on melkolähellä jatkuvuuskorjattua arvoa.

Huom. Yllä suoritettu testi on nimeltään binomitesti.

(i)

4 11

3 241

(ii)

4 12

2 241

(iii)

4 13

1 241

(iv)

4 14

0 241

Biostatistiikan peruskurssi 1998 95 Tilastollisten testien valinta ja toteuttaminen

Page 100: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Huom. McNemarin testin yleistys (k×k) -taulukoille, k > 2, sisältyy moniintilastopaketteihin.

Bowkerin testiKäyttöttilanne:

• Parikaltaistetut aineistot• Mittaukset laatueroasteikolla• Lopputulosmuuttujassa yli kaksi luokkaa (arvoa)

Esim. Jonkin taudin ja ABO-veriryhmän välinen yhteys.Tapaus-verrokki -asetelma. Luvut taulukossa ovat parien lukumääriä.

Verrokit

A B AB O

Tapaukset

A 74 14 6 66

B 2 4 2 4

AB 10 12 2 12

O 18 8 3 64

Ohjelmalla DISFREE saatiin tulos P < 0.0001 , joten taudin ja ABO-veriryhmän välillä on tilastollinen yhteys. O-veriryhmää on verrokeilla selvästi enemmän.

LR-testi siirtymätodennäköisyysmatriiseille

Ajanhetki → (t+1)

↓ X x1 x2 x3

(t)

x1 n11(1) n12

(1) n13(1)

x2 n21(1) n22

(1) n23(1)

x3 n31(1) n32

(1) n33(1)

Homogeenisuus: χ2 -testi.

Kahden ryhmän vertailu. Vertaillaan hoitoja A ja B.

Tilastollisten testien valinta ja toteuttaminen 96 Seppo Sarna

Page 101: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Hoito A.

(t+1)

X x1 x2 x3 Σ

(t)

x1 n11(1) n12

(1) n13(1) n1

(1)

x2 n21(1) n22

(1) n23(1) n2

(1)

x3 n31(1) n32

(1) n33(1) n3

(1)

Testisuure: Wilksin lambda λ

−2 ∗ log λ = −2 ∗ ∑ k = 1

2

∑ i = 1

3

∑ j = 1

3

nij(k) [ qij − log q

^ij (k)]

missä qij(k) =

nij(k)

ni(k) ja qij =

nij(1) + nij

(2)

ni(1) + ni

(2)

−2 ∗ log λ noudattaa likimain χ2 -jakaumaa vapausastein r(s-1), missä r on rivien lukumäärä ja s on sarakkeiden lukumäärä kummas-sakin matriisissa.

Testi on myös välittömästi yleistettävissä useammallekin ryhmälle. Josryhmien lukumäärä on g, saadaan vapausasteiden määräksi r (s-1) (g-1)

Esim. x = kivun määrä: x1 = ei, x2 = lievä, x3 = kohtalainen, x4 = vaikeaLääkkeet: A ja B. t = ennen hoitoa, t + 1 = hoidon jälkeen

Hoito A.

(t+1)

X x1 x2 x3 x4 Σ

(t)

x1 0 1 0 0 1

x2 3 9 0 0 12

x3 1 2 10 2 15

x4 0 0 0 2 2

Σ 4 12 10 4

−2 ∗ log λ = 23.243, dƒ = 4 ∗ 3 ∗ 1 = 12, p = 0.026

Hoito B.

(t+1)

X x1 x2 x3 x4 Σ

(t)

x1 0 0 0 0 0

x2 5 4 1 0 10

x3 8 5 4 0 17

x4 3 0 0 0 3

Σ 16 9 5 0

Hoito B.

(t+1)

X x1 x2 x3 Σ

(t)

x1 n11(2) n12

(2) n13(2) n1

(2)

x2 n21(2) n22

(2) n23(2) n2

(2)

x3 n31(2) n32

(2) n33(2) n3

(2)

Biostatistiikan peruskurssi 1998 97 Tilastollisten testien valinta ja toteuttaminen

Page 102: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Mann-Whitneyn U-testiMann-Whitneyn U-testi on riippumattomien otosten t-testin ei-parametrinen vastine. Sen voi-ma on likimain 95,5% verrattuna t-testiin silloin kun t-testin edellyttämä normaalisuusoletuson voimassa.

Käyttötilanne: Halutaan testata ovatko kaksi toisistaan riippumatta valittua satunnais-otosta x1i, i = 1, ..., n1 ja x2i, i = 1, ..., n2 peräisin perusjoukoista, joidenjakaumat ovat identtiset tarkastelun kohteena olevan muuttujan suhteen?

Testillä on seuraavia ominaisuuksia:• Ei oletusta normaalisuudesta.• Alkuperäisiä arvoja käytetään vain järjestyslukujen muodostamiseen, joiden avulla

testisuureen arvo lasketaan.• Testin voimakkuus on vain hieman heikompi kuin t-testin, kun sille asetetut

olettamukset ovat voimassa.

Merkitään: U12 on niiden parien lukumäärä, joissa x1i < x2iU21 on niiden parien lukumäärä, joissa x1i > x2i

Niistä pareista, joissa x1i = x2i lasketaan puolet kumpaankin summaan, U12 ja U21. Kumpaatahansa summista U12 ja U21 voidaan käyttää testisuureena U. Testisuurelle U pätee seuraavan-lainen tulkinta: U / (n1 * n2) on niiden parien suhteellinen osuus, joille n1i < n2i.

Luvuille U12 ja U21 pätee seuraava:

0 ≤ U12 , U21 ≤ n1 * n2

E(U12) = 12

n1n2

Esim. Verenpainetutkimus. Hypoteettinen aineisto (StatXact 3 manuaali s. 220)

Ryhmä Diastolinen verenpaine

Hoitoryhmä(n = 4)

94 108 110 90

Lumeryhmä(n = 11)

80 94 85 90 90 90 108 94 78 105 88

Tulokset: Mann-Whitneyn testisuure U = 35Yksisuuntainen tarkka p = 0,0542Kaksisuuntainen p = 0,0989

Mikäli n1 tai n2 ovat alle 20, kannattaa p-arvo laskea niinsanotuilla eksakteilla algoritmeilla(esim. StatXact 3) tai katsoa taulukoista. Kun aineistokoot ylittävät 20, voidaan käyttääasymptoottista testisuuretta:

z = U − m

s, missä m =

n1 ∗ n2

2 ja s = √ (n1 + n2 + 1) ∗ m

6

Tilastollisten testien valinta ja toteuttaminen 98 Seppo Sarna

Page 103: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Wilcoxonin järjestyslukujen summatestiTesti on algebrallisesti sama kuin Mann-Whitneyn U-testi.

Merkitään: T1 on arvojen x1i järjestyslukujen summa yhdistetyssä järjestetyssä aineistossa T2 on arvojen x2i järjestyslukujen summa yhdistetyssä järjestetyssä aineistossa

Samoille lukuarvoille järjestysluvuksi tulee järjestyslukujen keskiarvo (kuten Wilcoxonin pa-rittaisessa testissä).

T1:lle pätee seuraava epäyhtälö:12 n1 (n1 + 1) ≤ T1 ≤ n1n2 +

12 n1 (n1 + 1)

T1:n odotusarvo voidaan laskea kaavalla

E (T1) = 12

n1 (n1 + n2 + 1)

Voidaan näyttää, että: U12 + U21 = n1 n2

T1 + T2 = 12

(n1 + n2) (n1 + n2 + 1)

Tästä seuraa, että U-testi ja Wilcoxonin testi ovat algebrallisesti yhtäpitäviä, ja tuottavat täy-sin saman testituloksen (P-arvon).

U21 = n1 n2 + 12

n2 (n2 + 1) - T2

U12 = n1 n2 + 12

n1 (n1 + 1) - T1

Kun lukupareissa ei ole samoja lukuarvoja, niin

Var(U12) = Var(T1) = n1n2 (n + 1)

12 , n = n1 + n2

Kun lukupareissa on samoja lukuarvoja, niin

Var(U12) = Var (T1) = n1n2

12 ∗ n (n − 1) ∗ [n3 − n − ∑

t

(t3 − t)]

U- tai T-suureen keskivirheeksi saadaan siten SE(U) = √Var (U) = SE(T)

Huom. ROC-käyrän (’Receiver Operating Characteristic’) pinta-ala (A) ja sen keskivirhe voidaan laskea U-testisuureen avulla seuraavasti:

A = 100 ∗ (1 − U

n1n2) (prosenttia)

SE(A) = √Var(U)n1n2

Biostatistiikan peruskurssi 1998 99 Tilastollisten testien valinta ja toteuttaminen

Page 104: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Esim. 109:n CT-kuvan arviointi.

Ehdottomannormaali ← ARVIOINTISKAALA → Ehdottoman

epänormaali

1 2 3 4 5

Todellinen status

Normaali 33 6 6 11 2 58

Epä-normaali

3 2 2 11 33 51

36 8 8 22 35 109

Järjestys-luvut

18.5 40.5 48.5 63.5 92.0

StatXact-ohjelmalla saatiin seuraavat tulokset:

T1 = 2027 E(T1) = 3190 SE(T1) = 158.1T2 = 3968z = -7.356U = 316.0

A = 1 − 316

58 ∗ 51 = 0.893 = 89.3%

SE(A) = √158.12

58 ∗ 51 = 2.91%

χ2-trenditesti N×2 taulukoille

Käyttötilanne: a) suhdelukujen trendin testaaminen yhdessä otoksessab) järjestysasteikollisen lopputuloksen vertaaminen kahden ryhmän välillä

Esim. a) Lannerangan degeneratiiviset muutokset rautatieläisillä (’toppamiehet’)Ikätrendin testaaminen.

Muutos

Score + −

Ikä

alle 35 1 5 32 37

35 - 44 2 17 34 51

45 tai yli 3 24 22 46

46 88 134

χ2HET = 13.631, df = 2, P = 0.0011

χ2-trendi = 13.628, df = 1, P = 0.0002χ2

R (poikkeama lineaarisesta trendistä) = 0.003

Tilastollisten testien valinta ja toteuttaminen 100 Seppo Sarna

Page 105: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Johtopäätös: Lanneselän degeneratiiviset muutokset lisääntyvät lähes lineaarisesti tässä aineistossa.

Esim. b) Alaselän kiputilan hoitokokeilu

Hoito A: lepo, 15 potilastaHoito B: ohjattu liikunta, 15 potilasta

Lopputulos: sunjektiivinen arvio 5-luokkaisella asteikolla.

A B

Selvästi parempi 2 4

Parempi 4 8

Ennallaan 5 2

Huonompi 3 1

Selvästi huonompi 1 0

Testitulos: P = 0.0579 (StatXact)

Ylläolevat P-arvot ovat kaksipuoleisia.

χ2-nelikenttätestiKäyttötilanne:

• Kaksiarvoinen lopputulosmuuttuja• Kaksi hoitoryhmää• Kahden binomiaalisen suhdeluvun vertailu

Lopputulos

Kyllä Ei

Ryhmä 1 a b a+b

Ryhmä 2 c d c+d

a+c b+d n

Ilman jatkuvuuskorjausta: χ2 = (ad − bc)2 ∗ n

(a + c) (b + d) (a + b) (c + d)

Yatesin jatkuvuuskorjauksella: χC2 =

(ad − bc − 12

n)2 ∗ n

(a + c) (b + d) (a + b) (c + d)

Kummassakin tapauksessa vapausasteita (dƒ) on 1.

Biostatistiikan peruskurssi 1998 101 Tilastollisten testien valinta ja toteuttaminen

Page 106: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Vertailtavat suhdeluvut ovat p1 = a

a + b ja p2 =

cc + d

Esim. hoitoero on siten p1 - p2, ja sen normaalijakaumaan perustuva luottamusväli:

(p1 − p2) ± zα √p1 (1 − p1)(a + b)

+ p2 (1 − p2)

(c + d)

Huom! Nelikentän lukujen a, b, c ja d tulee olla lukumääriä eikä esimerkiksiprosenttilukuja.

Esim. Lasolin myrkyllisyyskokeilu rotilla (Oy Alko Ab)Rotat satunnaistettiin kahteen ryhmään.

Ensimmäinen ryhmä sai 6-10g⁄kg puhdasta etanolia 25% liuoksenaToinen ryhmä sai yhtä paljon etanolia sisältävää LasoliaLopputulosmuuttuja: kuolema seuranta-aikana

Tulos:

Kuoli Ei

Etanoli 14 6 20 70%

Lasol 7 13 20 35%

21 19 40

Prosenttilukujen ero on 35%, ja sen luottamusväli CL95%: (6.0%, 64.0%)

Testitulos: χ2 = 4.912 , P = 0.027χC

2 = 3.609 , P = 0.057

Fisher: P = 0.0562

Ristitulosuhde (’odds ratio’): OR = a ∗ db ∗ c

= 4.3.

Ohjelma CIA antaa OR:n luottamusväliksi CL95%: (1.15, 16.3)

Kun nelikentässä jokin odotusarvoista E(a), E(b), E(c) tai E(d) on yli viisi, χ2-testin asemestasuositellaan käytettäväksi Fisherin tarkkaa testiä. Nelikentän lukujen odotusarvot E(⋅) laske-taan seuraavasti:

(rivisumma) ∗ (sarakesumma)

(kononaissumma)

Esimerkiksi E (a) = (a + b) ∗ (a + c)

n

Tilastollisten testien valinta ja toteuttaminen 102 Seppo Sarna

Page 107: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Fisherin tarkka nelikenttätestiKäyttötilanne:

Lopputulos

Kyllä Ei

Ryhmä 1 a b a + b

Ryhmä 2 c d c + d

a + c b + d n

• perustuu hypergeometriseen jakaumaan• reunasummat oletetaan kiinteiksi (olettamus on epärealistinen joissakin tutki-

musasetelmissa)• Ylläolevaan nelikenttään liittyvä todennäköisyys saadaan hypergeometriseen ja-

kaumaan perustuvalla kaavalla

p = (a + b)! (c + d)! (a + c)! (b + d)!

a! b! c! d! n!

• P-arvo saadaan siten, että lasketaan todetun lopputuloksen todennäköisyys p0 jasitäkin harvinaisempien lopputulosten (1-tai 2-suuntainen) todennäköisyydet pi

edellyttäen, että H0 olisi tosi ja summataan. P = Σ pi.

Esim:

Lopputulos P-arvo

8 2 10p0 = 0.02361

1 5 6

9 7 16

Muut mahdolliset lopputulokset reunasummien ollessa 10, 6, 9 ja 7:

a) "Ylempi häntä", pU

9 1pU = 0.00087

0 6

b) "Alempi häntä", pL

7 3pL = 0.15734

2 4

c)

6 4pL = 0.36713

3 3

Biostatistiikan peruskurssi 1998 103 Tilastollisten testien valinta ja toteuttaminen

Page 108: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

d)

5 5pL = 0.33042

4 2

e)

4 6pL = 0.11014

5 1

f)

3 7pL = 0.01049

6 0

Yksisuuntainen P-arvo lasketaan siten, että saadun lopputulosnelikentän todennäköisyyteenp0=0.02361 lisätään H0:n ollessa voimassa harvinaisemman tuloksen a) todennäköisyys janäin saadaan P=0.02448.

Kaksisuuntaisessa testauksessa tähän P-arvoon pitää vielä lisätä toisesta ’hännästä’ lopputu-lokseen f) liittyvä todennäköisyys 0.01049, joka siis on H0:n ollessa voimassa harvinaisempi(p < p0) kuin todettu lopputulos. Näin saadaan kaksisuuntaiseksi P-arvoksi 0.03497, joka onselvästi pienempi kuin 2*(yksisuuntainen P-arvo) eli 0.04896.

Huom! Monet tilastopaketit antavat Fisherin testin P-arvon joko vain a) yksi-suuntaisena (eivät tosin välttämättä ilmoita sitä, esim. EPISTAT, CSS)tai b) laskevat sen kaksisuuntaisen P-arvon kertomalla yksisuuntaisenP-arvon kahdella (esim. MedStat). Tämä laskutapa antaa konservatiivi-semman tuloksen, elleivät jommat kummat reunasummista ole samat,eli (a + b) = (c + d) tai (a + c) = (b + d).

Fisherin kontingenssitaulutesti 2×ktaulukoille

Käyttötilanne:• heterogeenisuuden testaaminen• tarkasteltava muuttuja laatueroasteikollinen• kaksi vertailtavaa ryhmää

Esim. Mahahaava ja ABO-veryryhmä (Varis K, Salmi H, ym., julkaisematon)

O A B AB ∑APU 18 26 1 1 46

NUD 8 24 13 6 51

APU: Active Peptic UlcerNUD: ylävatsaoireita, mutta ei elimellistä sairautta

Tilastollisten testien valinta ja toteuttaminen 104 Seppo Sarna

Page 109: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Ohjelmalla StatXact saatiin testitulokseksi P = 0.0003 (kaksipuoleinen).Tavallinen χ2-testi antaa tuloksen χ2 = 17.57 , P = 0.0005

Mantel-Haenszelin nelikenttätestiKäyttötilanne:

• nelikenttien yhdistäminen jokosamaa ongelmaa tarkastelevista eri tutkimuksista taisaman tutkimuksen eri ositteista

• sekoittavien tekijöiden (’confounders’) hallinta

Oletetaan, että sekoittava tekijä z on laatuero-, järjestys- tai luokiteltu välimatka-asteikollinen,ja saa arvot: 1, ..., k

Tutkitaan x:n ja y:n välistä riippuvuussuhdetta, missä esim.x = hoitoryhmää ilmaiseva muuttuja y = lopputulosta ilmaiseva muuttuja (kyllä, ei)

Halutaan kontrolloida z:n vaikutus analysoitaessa x:n ja y:n välistä riippuvuussuhdetta

Oletetaan, että aineisto on jaettu sekoittavan tekijän mukaisesti k:hon ositteeseen ja että kussa-kin ositteessa on laskettu seuraava nelikenttä:

j. osite: Lopputulos

+ –

RyhmäA a j b j M1j

B c j d j M0j

N1j N0j Tj

Lasketaan seuraavat ositekohtaiset suureet: OR^j =

aj dj

bj cj , E (aj) =

Mij Nij

Tj

Oletetaan M1j , M0j , N1j ja N0j kiinteiksi. Hypergeometrisesta jakaumasta seuraa, että

Var (aj) = M1j M0j N1j N0j

Tj 2 (Tj − 1)

ja siten ositekohtaiseksi testisuureeksi saadaan χ1, j2 =

(aj − E (aj) − 1⁄2)2

Var (aj)

Biostatistiikan peruskurssi 1998 105 Tilastollisten testien valinta ja toteuttaminen

Page 110: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Yli kaikkien ositteiden lasketuksi yhdistetyksi arvioksi ristitulosuhteelle, odotusarvolle ja va-rianssille saadaan:

ORk =

∑ j

aj dj

Tj

∑ j

bj cj

Tj

, E (ak) = ∑ j

E (aj) , Var (ak) = ∑ j

Var (aj)

Näiden arvioiden perusteella saadaan Mantel-Haenszelin nelikenttätestiksi:

M-H-testi: χ1, M−H2 =

( | ∑ aj − ∑ E (aj)| − 1⁄2)2

∑ Var (aj)

Huom. χ1, M−H = z , eli normaalijakauman prosenttipiste.

Huom. Testin kumulatiivisuudesta johtuen odotetut frekvenssit yksittäisissänelikentissä voivat olla pieniä (< 5).

Esim. Kaksi hoitoa A ja B, sekoittavana tekijänä ikä, lopputulos parantuminen

a) tulos ilman sekoittavan tekijän kontrollointia:

Kyllä Ei

A 33 28 61

B 20 40 60

Testitulos (StatXact): χ12 = 5.298 P = 0.0213

χ1, C2 = 4.488 P = 0.0341

Fisher: P = 0.0280

Todetaan, että hoidolla ja parantumisella on tilastollinen yhteys P < 0.05,kun ikää ei huomioida.

Tilastollisten testien valinta ja toteuttaminen 106 Seppo Sarna

Page 111: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

b) sekoittavan tekijän kontrollointi osittamalla:

Kyllä Ei ∑

NuoretA 14 6 20

OR = 2.00B 7 6 13

Keski-ikäiset

A 12 7 19OR = 2.40

B 5 7 12

VanhatA 7 15 22

OR = 1.58B 8 27 35

Ositekohtaisten nelikenttien yläkulmassa olevien lukujen (aj) 14, 12 ja 7odotusarvoiksi (E (aj)) saadaan 12.73, 10.42 ja 5.79, ja variansseiksi(Var (aj)) 1.880, 1.882 ja 2.666 (MedStat DD).

Ositekohtaisiksi, jatkuvuuskorjatuiksi testisuureen χ1, j2 arvoiksi saadaan

siten 0.33, 0.64 ja 0.19. Mikään näistä ei ole likikään tilastollisestimerkitsevä.

Johtopäätös: Taulukon summasarakkeesta voidaan todeta, että hoidot A ja B ovat epätasapainossa eri ikäryhmissä, siis ikä assosioituu myös hoitojailmaisevaan muuttujaan. Lisäksi ositekohtaisista OR^ :sta todetaan, ettäikä assosioituu myös hoidon lopputulokseen. Näin ollen ikä täyttääsekoittavan tekijän vaatimukset. Iän kontrolloinnin jälkeen testitulosei ole enää tilastollisesti merkitsevä, sillä

χ1, M−H2 = 1.98, dƒ = 1 , P = 0.159

Hoidon A parempi lopputulos selittyy siten suurelta osin iällä.

Yhdistetyksi ristitulosuhteeksi saadaan OR^k = 1.90

Yhdistäminen ei ole perusteltua elleivät ositekohtaiset ristitulosuhteet ole keskenään homogeenisia; tässä tapauksessa homogeenisuusvaatimus täyttyy. StatXact antaa p-arvoksi 0.9068 (Breslown ja Dayn testi). Yhdis-tetyn vaarasuhteen 95% luottamusväliksi saadaan StatXactilla (0.8717, 4.149).

Mikäli lopputulos on k-luokkainen, voidaan testaukseen käyttää edellä kuvatun nelikenttätes-tin yleistystä, Mantel-Haenszelin testiä 2×k -taulukoille.

Huolimatta tämän testin yleisyydestä ja käyttökelpoisuudesta se yllättäen kuitenkin puuttuumonista tavallisimmista tilastopaketeista (esim. BMDP).

Mantel-Haenszelin testiä voidaan käyttää monissa muissakin kuin edellä mainituissa tutki-musasetelmissa, esimerkiksi tapaus-verrokki -tutkimuksissa.

Biostatistiikan peruskurssi 1998 107 Tilastollisten testien valinta ja toteuttaminen

Page 112: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Kruskal-Wallisin yksisuuntainenvarianssianalyysi

Käyttötilanne:

• Onko k riippumatonta otosta peräisin samasta perusjoukosta (tai identtisistäperusjoukoista), joilla on sama mediaani.

• perustuu järjestyslukuihin• testi edellyttää vähintään järjestysasteikkoa• ryhmä (otos-) koot ni voivat olla erisuuria

Testisuure:

H = 12

N (N + 1) ∗ ∑

i = 1

k

ni R__

i2 − 3 ∗ (N + 1)

missä N = ∑ni ja R__

i = ∑ j = 1

ni

Rj

ni on järjestyslukujen Rj keskiarvo ryhmässä i.

Mikäli kyseessä on pieni aineisto (ryhmäkoot 5 tai alle) p-arvo katsotaan testisuureelle H laa-dituista taulukoista. Muissa tapauksissa H:n merkitsevyyden arvioimiseen voidaan käyttää χ2-jakaumaa vapausastein (k - 1).

Kun järjestetyssä aineistossa ryhmästä riippumatta esiintyy samoja lukuarvoja (’ties’), pitäätestisuuretta H korjata ottamalla nämä tasatulokset huomioon. Testisuure H pitää jakaa tekijäl-lä

1 − ∑ i = 1

gti3 − ti

N3 − N, missä g on niiden lukuarvoryhmien määrä, joissa tasatuloksia esiintyy

ja ti on tällaisissa ryhmissä olevien lukujen määrä.

Monivertailut - Dunnin testiMikäli ryhmiä halutaan verrata joko a) pareittain keskenään, tai b) ryhmiä tiettyyn kontrolli-ryhmään, syntyy niinsanottu monivertailutilanne. Tällöin α-taso pitää korjata vertailujen luku-määrällä. Kohdassa a) vertailujen määrä on k(k - 1) / 2 ja kohdassa b) k - 1. Tätä korjaus-menettelyä kutsutaan Bonferroni-menetelmäksi. Kruskal-Wallisin varianssianalyysin testeihinvoidaan käyttää Dunnin testiä (MedStat MULT.) Testissä asetetaan erotuksille R

__i − R

__j

niinsanottu kriittinen arvo kaavalla

Tilastollisten testien valinta ja toteuttaminen 108 Seppo Sarna

Page 113: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

zα∗ ∗ √N (N + 1)12

∗ ( 1ni

∗ 1nj

) missä α∗ = α

k (k − 1) ⁄ 2, N = ∑ ni ja

zα∗ on normaalijakauman prosenttipiste.

Esimerkkiaineisto (MedStat manuaali, sivut 18.1-18.2)

Fiktiivinen aineisto. Kahden tekijän yhdistelykokeilu. Tutkijat halusivat testata ’Gastryl’-nimi-sen lääkkeen imeytymistä. Tabletteja oli päällystemateriaaliltaan kolmea tyyppiä: A, B ja C.Tablettien antotapoja oli kolme: E = tyhjään mahaan, A = antasidin kanssa ja M = aterian jäl-keen.

Halutaan testata: 1) Riippuuko seerumin konsentraatio tablettityypistä?

2) Riippuuko seerumin konsentraatio antotavasta?

3) Onko tablettityypin ja antotavan välillä yhdysvaikutusta (interaktio)?

Kohdan 1) testaaminen edellyttää taulukon rivien välisen vaihtelun analysointia ja voidaansuorittaa Kruskal-Wallisin testillä.

Kohdassa 2) on kyse sarakkeiden välisestä vaihtelusta ja testinä käytetään Friedmanin testiä.

Interaktion testaamiseen tarvitaan kaksisuuntaista ei-parametrista varianssianalyysiä.

Tablettityyppien testaaminen: Ei välitetä antotavasta, vaan tarkastellaan rivisummia(E+A+M).

Tabletti-tyyppi

HenkilöSumma

(E+A+M)Järjestys-luku Ri

Σ Ri R__

i

A

1 70 8

2 63 6

3 42 2

4 83 9.5

5 20 1

6 97 15.5

7 46 3.5

8 97 15.5 61 7.8

Biostatistiikan peruskurssi 1998 109 Tilastollisten testien valinta ja toteuttaminen

Page 114: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Tabletti-tyyppi

HenkilöSumma

(E+A+M)Järjestys-luku Ri

Σ Ri R__

i

B

1 49 5

2 89 13

3 67 7

4 133 23

5 118 20

6 46 3.5

7 140 24

8 85 12 107.5 13.4

C

1 83 9.5

2 132 22

3 99 17.5

4 109 19

5 99 17.5

6 84 11

7 90 14

8 122 12 131.5 16.4

Testisuure: H = 12

24 ∗ 25 * (8 * 7.62 + 8 * 13.42 + 8 * 16.42) - 3 * 25 = 6.42

Korjattu testisuure: Gastryl-esimerkkiaineistossa g = 4 (tasatulokset 46, 83, 97 ja 99) jakaikissa on kaksi lukua, joten kaikki ti = 2. Koska N = 24, on korjaussiten 1 - 4 * (23 - 2) / (243 - 24) = 0.998, joten H = 6.43.

Koska vapausasteet ovat k - 1 = 2, saadaan χ2-jakauman perusteella(MedStat: EF) p=0.040 (kaksipuoleinen)

Monivertailut:

Tabletti-tyyppi ∑ Ri

Tabletti-tyyppi ∑ Rj

Erotus

R__

i − R__

jKriittinen

arvo

A 61.0 B 107.5 5.8 8.47

A 61.0 C 131.5 8.8 8.47*

B 107.5 C 131.5 3.0 8.47

Johtopäätös: Tablettityyppien A ja C välillä on tilastollisesti merkittävä ero tasolla p < 0.05.

Tilastollisten testien valinta ja toteuttaminen 110 Seppo Sarna

Page 115: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Friedmanin kaksisuuntainenvarianssianalyysi

Käyttötilanne: Esim. joukko henkilöitä on tutkittu eri olosuhteissa tai eri arvioijientoimesta. Halutaan tutkia, onko näiden toistojen välillä eroa.

1 2 ... k

1 y11 y12 ... y1k

2 y21 y22 ... y2k

. . . . .

. . . . .

. . . . .

n yn1 yn2 ... ynk

Muodostetaan järjestysluvut 1 ... k riveittäin esim. nousevan suuruus-järjestyksen mukaisesti.

1 2 ... k

1 r11 r12 ... r1k

2 r21 r22 ... r2k

. . . . .

. . . . .

. . . . .

n rn1 rn2 ... rnk

∑ r•1 r•2 ... r•k

rij on jokin luvuista 1, 2, ..., k jokaisella i:n arvolla

Friedmanin testi testaa, eroavatko sarakesummat r•j toisistaan.

Testisuure:

S = 12

nk (k + 1) ∑

j = 1

k

r•j2 − 3n (k + 1)

Testisuure S noudattaa likimain χ2-jakaumaa vapausastein dƒ = k - 1,edellyttäen että k ja/tai n eivät ole kovin pieniä.

Esim. Gastryl-esimerkkiaineisto. Testataan hypoteesia lääkkeen antotapojenvälisistä eroista välittämättä tabletin päällysteestä (eli tarkastellaansarakevaihtelua MedStat manuaalin taulukossa 18.2)

Biostatistiikan peruskurssi 1998 111 Tilastollisten testien valinta ja toteuttaminen

Page 116: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Analyysi suoritetaan rivisummien perusteella (esim. 65 = 33+18+14)

Henkilö Antotapa

E Ri A Ri M Ri

1 65 2 63 1 74 3

2 75 1 110 3 99 2

3 65 1 73 3 70 2

4 104 2 103 1 118 3

5 62 1 88 3 87 2

6 68 1 81 3 78 2

7 83 1 94 2 99 3

8 93 1 113 3 98 2

∑ Ri 10 19 19

Testisuure: S = 12

8 ∗ 3 ∗ 4 (102 + 192 + 192) − 3 ∗ 8 ∗ 4 = 6.75,

P = 0.034 (MedStat: EF)

Monivertailut: (Dunnin testi)

Antotapa ∑ Ri Antotapa ∑ Rj ErotusKriittinen

arvo

E 10.0 A 19.0 9.0 9.58

E 10.0 M 19.0 9.0 9.58

A 19.0 M 19.0 0.0 9.58

Johtopäätös: Monivertailukorjattuna antotapojen välillä ei ole tilastollisestimerkitsevää eroa.

Kaksisuuntainen ei-parametrinenvarianssianalyysi

Käyttötilanne: Kahden tekijän yhdistelykokeilu, kun mittaukset ovat joko a) järjestysasteikolla tai b) välimatka/suhdeasteikolla ja aineisto on pieni.

Tilastollisten testien valinta ja toteuttaminen 112 Seppo Sarna

Page 117: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Testattavat hypoteesit:

1) Onko tekijöiden (esim. tablettityyppi ja antotapa) välillä interaktioita,siis onko toisen tekijän vaikutus erilainen toisen tekijän eri ryhmissä(esim. onko tablettityypillä eri vaikutus lopputulokseen riippuen antotavasta)

2) Mikäli interaktioita ei esiinny on mielekästä testata kummankin teki-jän vaikutuksia erikseen Kruskal-Wallisin ja Friedmanin testeillä,muuten ei.

Esim. Gastryl-esimerkkiaineisto (MedStat manuaali, sivu 18.2)

Interaktiotesti: χ2 = 13.44, dƒ = (3-1)*(3-1) = 4, p = 0.0009

Tulkinta: Lääkkeen päällysteen ja antotavan välillä on voimakas interaktio.Päällyste A yhdessä antotavan E kanssa antaa suuria arvoja, kun taaspäällyste C yhdessä antotavan E kanssa antaa pieniä arvoja. Tällaisessatilanteessa ei ole mielekästä tulkita päällysteen ja antotavan erillis-vaikutuksia lopputulokseen.

Eloonjäämiskäyrien vertailu• Log-rank -testi (= Mantel-Haenszelin testi)• kaksi ryhmää A ja B• lasketaan odotusarvot kuolleitten lukumäärille

EA = e∗ar

, missä e = 0 jos elossa, ja e = 1 jos kuollut, a on seurannassa

mukana olevien määrä ryhmässä A, ja r on seurannassa mukana olevienmäärä molemmissa ryhmissä

• havaitut kuolemantapausmäärät OA ja OB

EB = OA + OB – EA

• vaarasuhde: ORA⁄B = OA ⁄EA

OB ⁄EB

• testi: χ2 = (OA − EA)2

EA +

(OB − EB)2

EB , dƒ = 1

ToistomittausanalyysitToistomittausanalyysien (’Analysis of repeated measures’) perusideana on vähentää yksilöi-den välisen vaihtelun vaikutusta itse tutkittavaan asiaan, esimerkiksi hoitojen vaikutukseen.

Toistomittausasetelmat ovat yleisesti ottaen voimakkaampia kuin tavanomaiset asetelmat, kos-ka niissä yksilöiden välinen vaihtelu voidaan poistaa (eristää) analyysista ja siten redusoidavirhevaihtelua.

Biostatistiikan peruskurssi 1998 113 Tilastollisten testien valinta ja toteuttaminen

Page 118: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Toistoasetelmissa tullaan yleensä toimeen pienemmällä koehenkilö (tai -eläin) määrällä kuinasetelmissa, joissa ei ole toistoja. Tämä on tärkeää etenkin harvinaisten sairauksien tutkimises-sa tai muuten tilanteissa, joissa koehenkilöitä on vaikea saada.

Ennen toistomittausten varianssianalyysiä tulisi suorittaa havaintoaineiston rakenteen tarkaste-lu ennen analyysiä seuraavista syistä johtuen:

• Hoitojen vaikutusten ymmärtäminen globaalisesti• Selvittää keskiarvojen erojen testausedellytykset

jakaumien muoto, normaalisuushajonnaterot ryhmien välillä

• Minkälaiset ovat eri yksilöiden vastekäyrätovatko samanlaisia keskenään?minkälaisia riippuvuussuhteita on eri mittauskertojen välillä?poikkeavat havainnotonko varianssien vaihtelussa systematiikkaa?

Yhtäpitävyyden mitta kappa κAsetelma: Samat koehenkilöt ja kaksi testiä tai havainnoijaa.

Asteikko: laatuero- tai järjestysasteikko.

Kapan tilastollinen merkitsevyys voidaan testata z-testillä:

z = κ

SE (κ)

Kapalle voidaan myös laskea luottamusväli: CI95% = κ ± 1.96 ∗ SE (κ)

Kappaa voidaan käyttää myös parittaisissa aineistoissa konkordanssinmittana. Nyrkkisääntönä voidaan käyttää κ ≥ 0.75 = ’hyvä’ 0.75 > κ ≥ 0.40 = ’keskinkertainen’ κ < 0.40 = ’huono’

KirjallisuuttaAndersen B. Problems with p. Significance testing in medical research. Rockie A/S, Denmark1984.

Tilastollisten testien valinta ja toteuttaminen 114 Seppo Sarna

Page 119: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Biostatistisia näkökohtiaartikkelin kirjoittamisessa

Aineisto- ja menetelmäosa

Yleistä:• mitä tutkimusasetelmaa on käytetty -- tarkka kuvaus!• kuinka koehenkilöt ja verrokit on valittu• sisäänotto- ja poissuljentakriteerit• mistä perusjoukosta valinta on suoritettu• koehenkilöiden ja verrokkien määrä

vaikuttaa tutkimuksen voimaanmillä perusteella tähän määrään on päädytty

• havaintojen keräämis- ja mittaustekniikat• vastausprosentit ("surveys")• poispudonneet ("drop-outs")

poisjääneiden kuvaus

Tilastolliset menetelmät

• kaikki käytetyt menetelmät mainittavamissämitenperustelu miksi

• erikoismenetelmistä viitetilastollinen ohjelmapaketti (esim. SPSS, StatXact 3).

Hoitokokeet

• koejärjestelyt• sokkouttamismenettelyt• hoitojen tarkka kuvaus• hoitomyöntyvyyden tutkiminen ja huomioonotto analyyseissä• satunnaistamismenetelmä

lohkokoko, osittaminen• lopputulosmuuttujan/-jien kuvaus

muunnokset• hoitokokeiluissa mieluiten vain yksi päälopputulosmuuttuja

toissijaiset eksploratiivisia• usean hoidon samanaikaisissa kokeiluissa kontrastit ilmoitettava etukäteen

Biostatistiikan peruskurssi 1997 115 Biostatistisia näkökohtia artikkelin kirjoittamisessa

Page 120: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Aineiston kuvailu

• riittävä aineiston esittely tulisi edeltää ja täydentää tilastollista analyysiä• muuttujat, jotka ovat oleellisia tilastoanalyysin pätevyyden ja tulosten tulkinnan

kannalta tulisi kuvata tarkasti käyttäen graafisia esityksiä ja yhdistelmätietoa;prosenttiosuuksia, keskilukuja, hajontaa kuvaavia suureita, jne

• lähtötason tietojen vertailu ryhmien välillä hoitokokeissa; ovatko ryhmät vertailu-kelpoisia?

Olettamusten tarkistaminen

• Monet menetelmät (t-testit, korrelaatio, regressio, varianssianalyysi, jnpp) edellyt-tävät, että analysoitavien muuttujien jakaumat täyttävät tietyt olettamukset: nor-maalisuus, vakiovarianssius, jne

• tilastopaketeissa on monia graafisia keinoja, kvantitatiivisia menetelmiä ja testejätarkistaa perusolettamusten voimassaolo ennen tilastoanalyysin suorittamista

• poikkeavat havaintoarvot ja puuttuvat tiedot kannattaa paikallistaa ja tarkistaaennen tilastoanalyysiä

Tulosten esittäminen

• prosenttiluvuissa nimittäjä käytävä ilmi; vähennys 25% → 20% saatetaan ilmaista5%:na tai 20%:na.

• merkintää x_ ± SD tulisi välttää, parempi tapa x

_ (SD = ...). SD mittaa hajontaa

mielekkäästi vain symmetrisissa jakaumissa. x_ ± S.E.M. esim. piirroksissa ovat

OK (n. 70% luottamusväli)• merkitsevyystestien antamien tulosten esittäminen: P = ..., testi• kannattaa harkita, onko testaaminen mielekästä, luottamusvälit usein mielekkääm-

piä

• merkitsevyysrajan α = 0.05 käyttö johtaa helposti merkitsevien tulosten yliedus-tukseen

• suoritettuja testejä on usein enemmän kuin raportoidaan: α−virhe kasvaa• kannattaa ilmoittaa tarkka P-arvo, esim. 0.061 tai 0.042• kaksi merkitsevää numeroa riittää• merkitsevyydet alle 0.0001 eivät ole mielekkäitä, esim. P = 2.6 * 10-8

• hyvä grafiikka usein parempi kuin raskaat taulukot

Virheitä tulosten analysoinnissa

• parittaisen asetelman käyttämättä jättäminen• testien soveltuvuuden tarkistaminen

olettamukset• toistomittausten tulkitseminen riippumattomiksi havainnoiksi• poikkeava havaintoarvojen merkityksen huomioimatta jättäminen

Biostatistisia näkökohtia artikkelin kirjoittamisessa 116 Seppo Sarna

Page 121: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

paljonko tulos muuttuu, jos ne jätetään pois• puuttuvien tietojen käsittelyssä paljon virheitä

eri korvausmenettelyt (esim. ohjelma SOLAS)

Biostatistiikan peruskurssi 1997 117 Biostatistisia näkökohtia artikkelin kirjoittamisessa

Page 122: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Biostatistisia näkökohtia artikkelin kirjoittamisessa 118 Seppo Sarna

Page 123: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Sanastoa

Tässä sanastossa olevat käsitteet ja määritelmät on pyritty soveltamaan kliiniseen tutkimus-käyttöön sopiviksi. Määritelmät eivät ole yleispäteviä eivätkä matemaattisesti tarkkoja.

’aikomus-hoitaa’- analyysi ’intention to treat analysis’Kaikki satunnaistetut potilaat otetaan mukaan analyysiin, mikäli mahdollista.

aineiston tarkastelu ’data screening’Tutkimusaineiston esitarkastelu ennen varsinaisia analyysejä; poikkeavien havaintoarvojenetsintä, jakaumien muotojen ja perusriippuvuuksien selvittely.

alfa-virhe, α-virhe, ’alpha error’, ’type I error’Todennäköisyys tehdä johtopäätös, että (esim. hoitojen välillä) on merkitsevää eroa, kuntodellisuudessa ei kuitenkaan ole.

algoritmi ’algorithm’Ratkaisumenetelmä. Esim. aineistokoonarviointikaavan kirjoittaminen makroksi (käskyjou-koksi) taulukkolaskimelle tai päätöspuu jonkin sairauden hoitosuosituksesta.

altistuneiden ryhmä ’exposed group’Niiden henkilöiden ryhmä, jotka ovat tai joiden oletetaan olevan altistunut jollekin agens-sille, jonka tuottaa sellaisen kemiallisen, fyysisen tai biologisen vaikutuksen, jolla on jokokausaalinen tai muu yhteys tautivaaraan. Esimerkiksi ravinnon runsaan suolapitoisuudenvaikutus verenpainetaudin kehittymiseen. Vastakohta on ei-altistuneiden ryhmä ’non-ex-posed group’.

aritmeettinen keskiarvo ’arithmetic mean’Tavallisin välimatka- ja suhdeasteikollisen muuttujan jakauman keskeisyyden mitoista.Herkkä poikkeaville havaintoarvoille.

arviointi ’estimation’Osa tilastollista päättelyä, missä tutkimusaineiston perusteella arvioidaan tutkittavan ilmi-ön kuvaamiseen rakennetun mallin tuntemattomia suureita (parametreja).

Bayesilainen lähestymistapa ’Bayesian approach’Menettely, missä a priori todennäköisyysjakaumien muodossa esitettyä ennakkotietoa tai -uskomusta tarkennetaan tutkimuksessa kerätyn tiedon avulla. Tieto, jolla ennakkotietoakorjataan esitetään uskottavuus(’likelihood’)funktion muodossa. Näin saadaan nk. a poste-riorinen todennäköisyysjakauma, jonka avulla voidaan arvioida tutkittavaa asiaa, esim. hoi-toeron suuruutta vertailevissa tutkimuksissa.

beeta-virhe, β-virhe, ’beta error’, ’type II error’Todennäköisyys tehdä johtopäätös, että (esim eri hoitojen välillä) ei ole eroa, kun sitä to-dellisuudessa on.

binomijakauma ’binomial distribution’Kuvaa toistettujen satunnaisten kaksiarvoisten tapahtumien eri lopputulosten esiintymisto-dennäköisyyksiä. Se on siten epäjatkuva jakauma.

Biostatistiikan peruskurssi 1998 119 Sanastoa

Page 124: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

dikotominen asteikko ’dichotomical scale’Kaksiarvoinen asteikko (’0,1’,’ei-kyllä’) on erikoistapaus joko laatuero- tai järjestysas-teikosta. Käytetään usein malleissa ja analyyseissa mm. ilmaisin- (’indicator’) tai vale-(’dummy’) muuttujissa.

ehdollinen todennäköisyys ’conditional probability’Ehdollinen todennäköisyys P(A|B) ilmaisee tapahtuman A esiintymismahdollisuuden, mi-käli ehto B on voimassa (tapahtuma B on tapahtunut). Esim. jonkin sairaudenikäluokkakohtaiset esiintyvyydet. Tällöin tapahtuma A on sairauden esiityminen ja tiettyynikäluokkaan kuuluminen on ehto B.

ei-parametrinen menetelmä ’non-parametric method’Menetelmä, joka ei perustu mihinkään jakaumaoletuksiin, vaan siinä tarvittavat suureet las-ketaan suoraan havaintoaineistosta esim. muodostamalla suhdelukuja, niiden tuloja jne.(esim Kaplan-Meier -menetelmä) tai muodostamalla järjestyslukuja sekä niiden perusteellajohdettuja suureita (esim. Wilcoxon-Mann-Whitney’n testisuure). Ei-parametrisia menetel-miä käytetään etenkin pienissä ja/tai hankalissa havaintoaineistoissa, esim. kun aineisto si-sältää poikkeavia havaintoarvoja.

ennakkotodennäköisyys ’a priori probability’Todennäköisyys, joka perustuu aikaisempaan tietoon. Esim. diagnostisissa testeissä toden-näköisyys, joka kertoo kuinka paljon diagnosoitavaa tautia esiintyy tutkimuksen kohteenaolevassa perusjoukossa (väestössä). Tätä ennakkokäsitystä korjataan kunkin diagnosoita-van potilaan kohdalla tekemällä diagnostisia testejä ja laskemalla niiden perusteella tutkit-tavan taudin jälkikäteis- (a posteriori) todennäköisyys, esim Bayesin kaavaa käyttäen.

ennustetekijä ’prognostic factor’Muuttuja, jonka tiedot on kerätty potilaiden sisäänottohetkellä (esim. syöpätutkimuksissamuuttuja, joka ilmaisee onko potilaalla etäpesäkkeitä vai ei) ja joilla mahdollisesti on vai-kutusta hoitotulokseen.

epäjatkuva muuttuja ’discrete variable’Saa yleensä vain kokonaislukuarvoja. Esim. kasvaimen malignisuusaste, tapaturmien luku-määrä jollakin aikavälillä.

Fisherin tarkka testi ’Fisher’s exact test’Eräs tavallisimmin käytetyistä pienten aineistojen (n < 30) ristiintaulukkotesteistä. Käyte-tään etenkin nelikenttien yhteydessä, kun jonkin lokerofrekvenssin odotusarvo on alle 5.Testistä on olemassa myös yleistetty versio useampi luokkaisiin taulukoihin. Testi kuuluuns. ehdollisiin testeihin. Ehtona on, että reunasummat ovat kiinteät. Testi perustuu hyperge-ometriseen jakaumaan.

frekvenssimurtoviiva ’frequency polygon’Graafisen kuvaamisen keino, jonka avulla kuvataan frekvenssijakaumia. Vaihtoehtoinenesitysmuoto tähän tarkoitukseen on histogrammi.

geometrinen keskiarvo ’geometric mean’Vinoissa jakaumissa käytetty keskiluku; logaritmimuunnettujen havaintoarvojen aritmeetti-sen keskiarvon antilogaritmi.

Sanastoa 120 Seppo Sarna

Page 125: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

hajontakuvio ’scatter plot’Graafisen kuvaamisen keino, jonka avulla havainnollistetaan esim. kahden muuttujan välis-tä riippuvuussuhdetta.

hajonnan mitta ’measure of dispersion’Kuvaa sitä, kuinka lähelle keskilukua havaintoarvot kasaantuvat.

harha ’bias’Tilastollinen tutkimuksen harha on sellainen tulkinta tai toimenpide missä tahansa tutki-musprosessin vaiheessa, joka johtaa systemaattiseen poikkeamaan todellisuudesta.

havainnoiva tutkimusasetelma ’survey’Epäkokeellinen asetelma, joka perustuu otantaan ja systemaattiseen tiedonkeruuseen taval-lisimmin haastattelun tai postikyselyn muodossa.

histogrammi ’histogram’Graafisen kuvaamisen keino, jonka avulla kuvataan frekvenssijakaumia.

huipukkuus ’kurtosis’Mitta, joka ilmaisee onko jakauma huipukkaampi (’leptokurtic’) tai litteämpi (’platykur-tic’) kuin normaalijakauma (’bell shaped’, ’mesokurtic’).

hylkäämisalue (kriittinen alue) ’region of rejection’Alue testisuureen jakaumassa, joka johtaa päätelmään: ’nollahypoteesi hylätään ja hyväksy-tään vaihtoehtoinen hypoteesi’.

hypoteesi ’hypothesis’Tilastolliseen päättelyyn liittyvä väittämä (olettamus) ks. nollahypoteesi ja vaihtoehtoinenhypoteesi.

hyväksymisalue ’region of acceptance’Alue testisuureen jakaumassa, joka johtaa päätelmään: ’nollahypoteesi jää voimaan’.

ilmaantuvuusluku ’incidence rate’Uusien tautitapausten määrä tietyllä aikavälillä sairastumiselle alttiina olevassa väes-tönosassa.

ilmaisin ’indicator’(0,1)-tyyppinen muuttuja, jota käytetään mm. tilastollisissa malleissa ilmasemaan esim.jonkin ominaisuuden puuttumista tai olemassaoloa.

interventiotutkimusasetelma ’intervention study design’Tutkimusasetelma, missä tutkija itse aiheuttaa muutoksen koeolosuhteissa (kokeellinen tut-kimus) tai altistuksissa (epidemiologinen tutkimus). Satunnaistamista ei yleensä voidasuorittaa.

jakauma ’distribution’Jakauma ilmaisee kuinka moni tai mikä osuus kaikista mahdollisista mittaus- tai havainto-arvoista saa tietyn arvon tai tietyllä välillä olevan arvon. Välin asemesta voidaantarkastella myös pinta-alaa, tilavuutta jne. ks. lisäksi käsitteet empiirinen jakauma ja toden-näköisyysjakauma.

Biostatistiikan peruskurssi 1998 121 Sanastoa

Page 126: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

jatkuva muuttuja ’continuous variable’Voi saada mitä tahansa havaintoarvoja määritellyn vaihtelualueen sisältä (esim. pituus, pai-no).

jälkikäteisvertailut ’post hoc comparisons’Vertailut, jotka ryhmien välillä suoritetaan sen jälkeen, kun yleisvaikutus lopputuloksestaon todettu. Esim. todetaan, että hoitoryhmien A, B ja C keskiarvojen välillä on eroa ja ver-taillaan sen jälkeen ryhmia pareittain keskenään.

järjestysluku ’rank’Luku, joka saadaan, kun havaintoaineisto asetetaan järjestykseen jonkin asian tai ominai-suuden suhteen.

järjestysasteikko ’ranking scale’Asteikko, missä koodiarvoilla on luonnollinen järjestys (esim. kasvaimen pahanlaa-tuisuusaste), mutta eri koodiarvojen välit eivät välttämättä ole yhtä pitkiä.

kaksisuuntainen testi ’two tailed/sided test’Testi mihin suuntaan tahansa olevista eroista vertailtavien ryhmien välillä. Tavallisimminkäytetty testaustapa julkaisuissa.

kaltaistus ’matching’Sekoittavien tekijöiden hallintakeino tutkimuksen suunnitteluvaiheessa. Etenkin tapaus-verrokki -asetelmissa käytetty menetelmä.

kaltaistettu tutkimus ’matched study’Tutkimus, missä tutkittavat on kaltaistettu pareiksi tai joukoiksi (’set’), esim. yksi tapaus jak verrokkia, missä kaltaistus on suoritettu tiettyjen taustatekijöiden kuten sukupuoli, ikäjne. suhteen.

kappa ’kappa’Mittaa yhtäpitävyyttä (’agreement’) esim. kahden arvioitsijan tai kahden mittausmenetel-män välillä. Kapasta on olemassa myös monia yleistyksiä, esim. useiden arvioitsijoidentapaukseen. Lisäksi on olemassa erilaisia painotettuja kappa-mittoja.

katkaisukohta ’cut-off point’Arvo, jota käytetään muuntamaan jatkuva muuttuja epäjatkuvaksi tietyissä analyysitilan-teissa.

keskeinen raja-arvoväittämä ’central limit theorem’Jos otetaan yhtä suuria otoksia ei-normaalista jakaumasta ja lasketaan kustakin otoksestakeskiarvo, niin niiden jakauma on likimain normaalinen otoskoon ollessa riittävä. Myösuseiden muuttujien summat noudattavat yleensä normaalijakaumaa keskeisestä raja-arvo-väittämästä joutuen.

keskiluku ’measure of central tendency’Mikä tahansa mittaluku, jonka avulla kuvataan jakaumien sijaintia, aineiston ’tyypillisin’arvo.

Sanastoa 122 Seppo Sarna

Page 127: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

keskivirhe ’standard error’Mittaa minkä tahansa tutkimusaineiston perusteella lasketun otossuureen hajontaa (luotetta-vuutta), eli kuinka paljon suure voisi vaihdella, jos tutkimus toteutettaisiin toistuvastisamalla aineistokoolla ja tutkimusasetelmalla.

keskihajonta, standardipoikkeama ’standard deviation’Mitta, joka kuvaa tutkittavan muuttujan havaintoarvojen jakautumista tietyssä tutkimusai-neistossa. Soveltuu parhaiten hajonnan mitaksi symmetrisille jakaumille. Herkkäpoikkeaville havaintoarvoille.

Khii 2-testi, χ2-testi, ’Chi-square-test’Eräs yleisimmin käytetyistä ristiintaulukkotesteistä. Sen tavallisimmat käyttöindikaatiotovat frekvenssilukujen heterogeenisuuden tai suhdelukujen trendin (monotonisuuden) tes-taaminen. Sitä käytetään myös yhteensopivuustestinä, kun verrataan jotain havaittua jakau-maa johonkin teoreettiseen jakaumaan.

kiinteiden vaikutusten malli ’fixed-effects model’Etenkin varianssianalyysissä käytetty matemaattinen malli, missä vaikutusta ilmaistaan kii-teällä tekijällä, jonka saamat arvot ovat kiinteitä lukuja. Vastakohtana on satunnaistenvaikutusten malli ’random effects model’, missä vaikutusta ilmaisevan tekijän arvoihin si-sältyy satunnaisvaihtelua.

kliininen koe ’clinical trial’Ihmisillä suoritettu systemaattinen kokeellinen tutkimus, jonka avulla pyritään joko löytä-mään tai toteamaan lääkkeiden tai hoitojen vaikutuksia ja/tai sivuvaikutuksia (farmako-dynamiikka) tai tutkimus, jonka avulla tutkitaan lääkeaineiden imeytymistä, jakautumistakehon eri osiin, metaboloitumista tai erittymistä (farmakokinetiikka).

kohdeperusjoukko ’target population’Perusjoukko, johon päätelmät (johtopäätökset) tutkimuksesta halutaan yleistää.

kohortti ’cohort’Seurantatutkimusasetelmissa käytetty nimitys sellaisesta tutkittavien joukosta, jolla on jo-kin yhteinen ominaisuus, esim. sama syntymävuosi.

kohorttitutkimusasetelma ’cohort study design’Alttiuslähtöinen asetelma, missä aluksi valitaan tutkimuksen kohteena oleva henkilöjouk-ko (kohortti) ja määritetään heidän altistusstatuksensa tutkittavan (tutkittavien) altisteen(altisteiden) suhteen seurannan alussa. Altistumien määrää ’luonto’ eikä tutkija, kuten ko-keellisissa asetelmissa. Tutkittavista kerätään tavallisesti etenevästi (prospektiivisesti) tutki-muksen kohteena olevan (olevien) sairauden (sairauksien) ilmaantumistiedot altisteen jasairauden välisen yhteyden selvittämiseksi. Kohorttitutkimuksessa osa tiedoista saatetaankerätä myös takenevasti (retrospektiivisesti), jolloin kyseessä on titojen keruun suhteenkaksisuuntainen (ambispektiivinen) tutkimus.

kokeellinen tutkimusasetelma ’experimental study design’Ihmisillä, koe-eläimillä, koemaljoilla tai muilla koeyksiköillä suoritettu tarkkaan tutkijansuunnittelemaan koejärjestelyyn perustuva asetelma. Kokeellisessa asetelmassa tutkijamäärää koeasetelmillaan kuka altistuu ja kuka ei tutkittavallle tekijälle (esim. tietylle hoi-dolle).

Biostatistiikan peruskurssi 1998 123 Sanastoa

Page 128: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

kokonaistutkimusasetelma ’population study’Asetelma, missä tutkitaan kaikki tutkimuksen kohteena olevaan perusjoukkoon kuuluvathenkilöt. Asetelmaan on harvoin tarvetta kliinisissä tutkimuksissa, yleensä otantatutkimusriittää.

korjaaminen ’adjustment’Sekoittavien tekijöiden vaikutuksen puhdistamiskeino, esim. monimuuttujamallien avullatoteutettuna.

korrelaatiokerroin ’coefficient of correlation’Tietyntyyppinen riippuvuuden mitta. Mittoja on useita. Pearsonin korrelaatiokerroin mittaalineaarista riippuvuutta, Spearmanin korrelaatiokerroin kahden muuttujan järjestyslukujenriippuvuutta toisistaan jne.

kovariaatti ’covariate’Muuttuja, joka liittyy tai vaihtelee yhdessä jonkin toisen muuttujan kanssa. Esim. ikää tar-kastellaan usein kovariaattina tarkasteltaessa muiden muuttujien välisiä yhteyksiä.

kovarianssi ’covariance’Kahden satunnaismuuttujan yhteisvaihtelua mittaava suure.

kriittinen arvo ’critical value’Tietty prosenttipiste testisuureen otosjakaumassa. Se määrittelee ns. kriittisen alueen, jollesijoittuvat testisuureen arvot johtavat nollahypoteesin hylkäämi-seen prosenttipisteen il-maisemalla todennäköisyydellä. Esim. χ2-jakaumassa vapausasteiden ollessa 1 arvoa3.841 (5%-piste) suuremmat testisuureen arvot johtavat nollahypoteesin hylkäämiseen to-dennäköisyydellä p.

kuvaileva tilastotiede ’descriptive statistics’Tiedon järjestämistä, esittämistä ja tiivistämistä tilastollisiksi tunnusluvuiksi.

käsittelemätön tieto ’raw data’Tarkoittaa alkuperäisiä muokkaamattomia ja mahdollisesti koodaamattomia havainto-arvo-ja, laboratoriohuomautuksia, muistioita, erilaisia potilasasiakirjoja, automaattistenmittauslaitteiden tulosteita jne. ,joita kliinisissä tutkimuksissa kerääntyy.

käyränsovitus ’curve fitting’Menetelmä, jonka avulla pyritään sovittamaan esim. xy-koordinaatistossa kuvattuun ha-vaintoaineistoon (esim. annos-vaste riippuvuus) jokin matemaattisesti määritelty käyrä,joka mahdollisimman hyvin sopii havaittuu pisteistöön. Yleisesti käyränsovitukseen käyte-tään ns. pienimmän neliösumman menetelmää ’least squares method’.

’laatikko-ja-viikset’-kuvio ’box-and-whiskers plot’Frekvenssijakauman kuvaamisessa käytetty graafinen esitysmuoto, missä ’laatikon’ alareu-na tavallisesti ilmaisee 25%:n, keskiviiva 50%:n, yläreuna 75%:n pisteen (alempi kvarttiili,mediaani, ylempi kvarttiili) ja ’viikset’ 2.5%:n ja 97.5%:n pisteen sijaintia.

laatueroasteikko ’nominal scale’Asteikko, missä on nimetyt kategoriat, joiden järjestys ja koodaustapa ovat tutkijan valitse-mia, esim. tautiluokitus, ammatti.

Sanastoa 124 Seppo Sarna

Page 129: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

laaduntarkkailu ’quality control’Kaikki ne toimenpiteet, joita suoritetaan mitattavan tiedon laadun varmistamiseksi. Esim.laboratoriomääritysten laadunvalvonta.

lohkosatunnaistaminen ’block randomization’Satunnaistamismenetelmä, missä yhtä suurien ryhmäkokojen turvaamiseksi, tutkittavat sa-tunnaistetaan useamman koehenkilön muodostamissa ryhmissä, lohkoissa (’block’).Lohkokoko riippuu vertailtavien ryhmien määrästä, esim. jos hoitoja on 2, voidaan käyttäälohkokokoja 2 tai 4, jne. ja kolmen hoidon tapauksessa lohkokokoja 3 tai 6, jne. Tutkittavi-en määrä on tasapainossa aina lohkon päätyttyä.

lopputulosmuuttuja ’outcome measure’Tutkimuksen keskeisimpien tulosten, esim. hoitojen vaikutusten, mittaamiseen käytettysuure.

luokkien sisäinen korrelaatiokerroin ’intraclass correlation coefficient’Suure, joka kuvaa luokkien/ryhmien samankaltaisuutta jonkin välimatka-asteikollisenmuuttujan suhteen. Se on välimatka- ja laatueroasteikollisen muuttujan välisen riippuvuu-den mitta. Kyseessä ei ole varsinaisesti korrelaatio, vaan samankaltaisuuden mitta, joka saaarvoja väliltä [0,1]. Se ilmoittaa kuinka suuri osuus kokonaisvaihtelusta johtuu luokkien vä-lisestä vaihtelusta. Käyttö: esim. toistomittausten samankaltaisuuden arvioinnissa. Suurevoidaan laskea varianssianalyysin avulla. Se on erikoistapaus monen arvioitsijan reliabi-teettikertoimesta.

luottamustaso ’confidence level’, CLLuottamusvälin laskentaan liittyvä todennäköisyys, joka kertoo kuinka suuri varmuus vä-lin antamaan arvioon sisältyy. Varmuustaso olisi kuvaavampi termi.

luottamusväli ’confidence interval’, CIKahden otossuureen määrittelemä väli, johon arvioitavana oleva tuntematon perusjoukonsuure (esim. todellinen hoitoero) sijoittuu luottamustason (tavallisesti 95%) ilmoittamallavarmuudella. Varmuusväli olisi kuvaavampi suomenkielinen termi.

mallintaminen, mallitus ’modelling’Tutkittavan ilmiön kuvaamista teoreettisella rakennelmalla, mallilla.

mallintamismuuttuja ’design variable’Tyyppiä (-1,+1) oleva muuttuja, jonka avulla mm. varianssianalyysissä voidaan koodataerilaisia efektejä.

McNemarin testi ’McNemar’s test’Parittaisten aineistojen luokiteltujen muuttujien riippuvuustesti. Esim. Yksi potilasjoukko,jolle on suoritettu jokin interventio ja halutaan tutkia tapahtuuko intervention johdostamuutosta mittarissa, joka on joko laatueroasteikollinen tai luokiteltu jatkuva muuttuja.

mediaani ’median’Arvo, jonka alapuolella on puolet ja yläpuolella on puolet havaintoarvoista, 50%-piste.

merkitsevyystaso ’significance level’Katso tilastollinen merkitsevyys.

Biostatistiikan peruskurssi 1998 125 Sanastoa

Page 130: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

meta-analyysi ’meta-analysis’Analyysi, joka suoritetaan kahden tai useamman samaa ongelmaa tarkastelevan tutkimuk-sen tulosten pohjalta. Tavoitteena on tehdä johtopäätöksiä, jotka olisivat luotettavampiakuin mihin yksittäisissä tutkimuksissa on päädytty ja analysoida lisäksi yksittäisten tutki-mustulosten välistä vaihtelua.

mittausharha ’measurement bias’Harha, joka aiheutuu mittausten suorittamiseen liittyvästä menettelytavasta. Esim., josmansettimenetelmällä suoritetuissa verenpainemittauksissa preferoidaan parillisia arvoja.

mittausvirhe ’measurement error’Mittalaitteeseen tai mittauksia tuottavaan itse prosessiin liittyvä virhe. Esim. kalibrointivir-he.

monivertailutesti ’multiple comparison test’Monivertailutestaustilanne syntyy silloin, kun päälopputulosmuuttujan ohella vertaillaanuseita muita lopputulosmuuttujia (jotka on valittu joko ad hoc tai post hoc), joiden testaa-miseen ei voimalaskelmissa ole varauduttu. Toinen tavallinen monivertailutilanne syntyy,kun vertaillaan pareittain tuloksia useina ajankohtina tai samana ajankohtana useiden ryh-mien välillä. Monivertailutestaustilanne kasvattaa α-virheen mahdollisuutta. Monivertailu-testeissä α-virhe korjataan.

moodi ’mode’Kategoria, joka esiintyy useimmin.

muuttuja ’variable’Suure, jota käytetään havaintojen tekemiseen tai mittaamiseen.

nollahypoteesi ’null hypothesis’ [merkintänä H0]Ennalta määritelty perusväittämä, jonka hyväksymiseen tai kumoamiseen tutkimuksessapyritään. Esim., että vertailtavien lääkehoitojen A ja B tehojen välillä ei ole eroa.

Normaalijakauma ’Normal distribution’, ’Gaussian distribution’, ’bell curve’Eräs yleisimmistä tilastollisissa testeissä ja menetelmissä käytetyistä jatkuvista jakaumista.Monet parametrisista testeistä ja menetelmistä perustuvat normaalisuusoletukseen.

odotusarvo ’expected value’Esim. (aineistokoko)*(jonkin tapahtuman todennäköisyys)

oppimisvaikutus ’learning effect’Harha, joka syntyy tutkimustuloksiin tutkittavien oppiessa suoriutumaan testeistä myöhem-millä kerroilla paremmin kuin ensimmäisellä kerralla.

ortogonaalinen ’orthogonal’Kaksi asiaa, kontrastia, tekijää tai muuttujaa ovat keskenään ortogonaalisia jos niillä ei oleyhteisvaihtelua, eli niiden kovarianssi on nolla.

ositettu satunnaistaminen ’stratified randomization’Eräs yleisimmistä satunnaistamistavoista, jonka tavoitteena on saada vertailtavat ryhmättutkimuksen aloitushetkellä mahdollisimman hyvin tasapainoon ennusteeseen vaikuttavientekijöiden suhteen.

Sanastoa 126 Seppo Sarna

Page 131: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

osittaminen ’stratification’Sekoittavien tekijöiden hallintakeino, missä tutkimusaineisto jaetaan sekoittavien tekijöi-den perusteella ositteisiin ’strata’, siten että ositteiden sisällä vertailtavat ryhmät ovatmahdollisimman samankaltaisia.

otantatutkimus ’sample study’Otantaan perustuva epäkokeellinen tutkimusasetelma, jonka tavoitteena on tehdä luotetta-via perusjoukkoa koskevia johtopäätöksiä tutkimalla huolella valittu ja sopivan kokoinenosa perusjoukkoa. Otantatutkimuksen tulokset eivät koskaan ole tarkkoja vaan niihin sisäl-tyy aina otannasta aiheutuvaa vaihtelua.

otos ’sample’Perusjoukon (populaation) osa, joka on kerätty jotain otantatekniikkaa käyttäen perusjou-kon ominaisuuksien tutkimiseksi.

otosjakauma ’sample distribution’Kaikkien mahdollisten otossuureen saamien arvojen muodostama jakauma.

otosperusjoukko ’population sampled’,’study population’Perusjoukko, josta tutkimusaineisto (otos) on kerätty

otossuure ’sample statistic’Otoksen havaintoarvojen perusteella laskettu suure, havaintoarvojen funktio.

parametri ’parameter’Tuntematon suure, joka säätelee tutkittavan ilmiön kuvaamisessa käytettyä mallia, esim. jo-tain teoreettista jakaumaa. Arvioidaan tutkimusaineiston perusteella.

parametrinen menetelmä ’parametric method’Menetelmä, joka perustuu johonkin teoreettiseen malliin ja sen sisältämien tuntemattomienparametrien arvioimiseen tutkimusaineiston perusteella. Esim. t-testi on parametrinen tes-tausmenetelmä, joka perustuu Studentin t-jakaumaan. Vrt. ei-parametrinen menetelmä.

p-arvo ’p-value’Havaintoaineiston ja käytetyn testisuureen otosjakauman perusteella laskettu todennäköi-syys saada lopputulos, joka on vähintään yhtä epätodennäköinen (harvinainen) kuintutkimuksessa todettu lopputulos edellyttäen, että todellisuudessa nollahypoteesi olisi tosi.

permutaatiotestit ’permutation tests’Permutaatio- eli satunnaistamistestit ovat ns. eksakteja testejä, joiden otosjakauma nollahy-poteesin vallitessa ja siten myös laskettavat p-arvot saadaan tutkijan keräämästä havaintoai-neistosta sopivasti permutoimalla. Normaalijakaumaoletusta ei tarvita. Niitä voidaankäyttää jatkuville, järjestys- ja nominaaliasteikollisille muuttujille. Tavallisimmin niitä käy-tetään pienillä aineistoilla. Suuriin aineistoihin sovellettaessa käytetään Monte Carlo simu-laatiota jolloin saatava p-arvo ei ole yksikäsitteinen vaan tietty väli.

perusjoukko ’population’Termi, jota käytetään kuvaamaan joko äärellistä tai ääretöntä joukkoa yksilöitä (koehenki-löitä).

Biostatistiikan peruskurssi 1998 127 Sanastoa

Page 132: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

piste-estimointi ’point estimation’Tuntemattoman suureen (parametrin, esim. jonkin taudin yleisyyden) arviointi yhdellä lu-kuarvolla (estimaatilla), joka on laskettu havaintoaineistosta.

poikkeava havaintoarvo ’outlier’Muista havaintoarvoista selvästi poikkeava arvo, joita biologisessa aineistossa esiintyy.Paitsi biologinen vaihtelu syynä voi myös olla mittaus- tai tallennusvirhe.

poikkileikkaustutkimusasetelma ’cross-sectional study design’Asetelmassa ei ole aikasuuntausta, kaikki mittaukset suoritetaan tutkimushetkellä. Sitä käy-tetään pääasiassa silloin, kun halutaan tutkia eri asioiden ja ominai-suuksien yleisyyttä janiiden välisiä riippuvuus-suhteita. Asetelmaa käytetään myös seurantatutkimuksen osana.

Poisson-jakauma ’Poisson distribution’Harvinaisten kaksiarvoisten (’kyllä-ei’) tapahtumien tutkimisessa ja testaamisessa käytettyjakauma.

potilaslomake ’case record form, CRF’Kliinisissä tutkimuksissa käytetty asiakirja, jonka avulla kustakin tutkittavasta kerätään tut-kimuksen kuluessa tietoa protokollan määrittelemällä tavalla.

prosenttipiste ’percentile’Jakaumien kuvaamisessa käytetty suure, joka jakaa aineiston tietyn suuruisiin prosent-tiosuuksiin, esim. 95%-piste merkitsee että 5% jakauman arvoista on yhtä suuria tai sitäsuurempia. Tavallisimmin käytettyjä prosenttipisteitä ovat: terttiilit, kvarttiilit ja desiilit.50%:n piste on sama kuin mediaani.

protokolla (tutkimussuunnitelma) ’protocol’Asiakirja, missä kuvataan mm. tutkimuksen tausta, perusteet, tavoitteet, tutkimusasetelma,tutkimusorganisaatio ja tutkimuksen hallinnointi.

protokollan mukainen analyysi ’per protocol analysis’Analyysiin otetaan mukaan kaikki vain protokollan mukaisesti hoidetut potilaat.

puhdistumisjakso ’wash-out period’Tutkimusjakso, jonka tarkoitus on poistaa ristikkäis-asetelmassa vaikutuksen siirtyminenseuraavalle tutkimusjaksolle.

pylväskuvio ’bar chart’Muuten kuten histogrammi, mutta pylväiden välissä on tyhjää tilaa. Käytetään laatueroas-teikollisten muuttujien yhteydessä.

rajattu havaintoarvo ’censored observation’Sellainen havaintoarvo, jonka arvoa ei tiedetä, mutta sen olemassaolo tiedetään. Esim. seu-rantatutkimuksissa tiedetään tutkimuksen päättyessä elossa olevien potilaidenseuranta-aika, mutta ei tiedetä kuinka kauan potilas eläisi, jos tutkimuksen seuranta-aikaajatkettaisiin. Näin syntyy oikealle rajattu havaintoarvo. Laboratoriotutkimuksissa mittaus-laitteen tarkkuuden alittava arvo on esimerkki vasemmalle rajatusta havaintoarvosta.

Sanastoa 128 Seppo Sarna

Page 133: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

regressiosuora ’regression line’Suora, joka sovitetaan (x,y)-koordinaatistossa havaintopisteistöön tavallisimmin siten, ettäpisteistä suoralle y-akselin suuntaisesti laskettujen poikkeamien (residuaalien) neliöidensumma minimoituu.

regressiokerroin ’regression coefficient’Yksinkertaisen regressiosuoran y=a+b*x tapauksessa kerroin b, joka ilmaisee kuinka pal-jon y keskimäärin muuttuu, kun x muuttuu yhden yksikön verran. Kerroin a ilmaiseesuoran ja y-akselin leikkauspisteen ja sitä kutsutaan vakiotermiksi. Epälineaarisessa regres-siossa ja monimuuttujaregressiossa kerrointen tulkinta on monimutkaisempaa.

regressioanalyysi ’regression analysis’Menetelmä, missä pyritään selittämään muuttujassa (y) esiintyvää vaihtelua joukolla muitamuuttujia (x1, ..., xp). Käytännössä tämä tapahtuu siten, että havaintoaineistoon sovitetaanmalli, joka kuvaa mahdollisimman hyvin näiden muuttujien välisiä riippuvuussuhteita. Lää-ketieteellisissä sovelluksissa lineaaristen mallien ohella käytetään runsaasti myös epäline-aarisia malleja esim. logistinen malli ja erilaiset annos-vaste-mallit.

regressio kohti keskiarvoa ’regression towards the mean’Yleinen ilmiö seurantatutkimuksissa; Esim. jos verenpainetutkimuksissa tarkastellaan nii-den henkilöiden osaryhmää, joilla on lähtötutkimuksessa korkea verenpaine, niin toistomit-tauskerroilla tämän ryhmän keskiarvo lähestyy perusjoukon keskiarvoa ilman mitäänhoitovaikutustakin. Likimain pätee relaatio (erotus 2. mittauskerralla) = r * (erotus 1. mittauskerralla) missä r on ensimmäisen ja toisen mittauskerran välisten mittausten korrelaatiokerroin.Yllä kuvattu ilmiö johtuu siitä, että r < 1 mittausvirheestä ja biologisesta vaihtelusta joh-tuen.

riippuvuus ’association’Mikäli muuttujan (y) arvojen suuruus riippuu muuttujan (x) arvoista, niin muuttujien x ja yvälillä vallitsee tilastollinen riippuvuus. Jos tapahtuman (A) ilmaantuminen riippuu tapah-tumasta B, niin tapahtumat A ja B ovat riippuvaisia toisistaan.

riippumaton muuttuja (’independent variable’)Muuttuja (esim. jokin interventiotoimenpide tai ennustetekijä), jonka avulla pyritään selit-tämään riippuvassa muuttujassa ilmenevää vaihtelua.

riippuva muuttuja ’dependent variable’Tutkimusmielenkiinnon kohteena oleva lopputulos- tai vastemuuttuja, jonka vaihtelua pyri-tään selvittämään.

ristiintaulukko ’contingency table’Termi ’contingency’ tarkoittaa sattumaa. Ristiintaulukko tarkoittaa laatueroasteikollistentai luokiteltujen muuttujien välisten yhteyksien tutkimiseksi muodostettua kaksi tai useam-pi ulotteista talukkoa.

ristikkäistutkimusasetelma ’cross-over design’Tutkimusasetelma, jossa on vähintään kaksi tutkimusperiodia ja kaikki tutkittavat saavat jo-kaista tutkimuksen kohteena olevaa hoitoa satunnaisessa järjestyksessä. Asetelman käytönperusideana on vähentää tutkittavien määrää.

Biostatistiikan peruskurssi 1998 129 Sanastoa

Page 134: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

ristitulosuhde ’odds ratio’ [merkintänä OR]Kahden kaksiarvoisen muuttujan välinen riippuvuuden mitta. OR=1 merkitsee, ettei oleriippuvuutta. Mittaa käytetään etenkin tapaus-verrokki-tutkimusasetelmassa taudin ja altis-teen välistä yhteyttä arvioitaessa.

ROC-käyrä ’ROC-curve; Receiver Operating Characteristic Curve’xy-koordinaatistoon piirretty käyrä, missä x-akselina on väärän negatiivisen tuloksen to-dennäköisyys (1-spesifisyys) ja y-akselina on oikean positiivisen tuloksen todennäköisyys(sensitiivisyys).

’runko-ja-lehdet’- diagrammi ’stem and leaf diagram’Frekvenssijakauman graafinen esitysmuoto, mistä on todettavissa samanaikaisesti ja-kauman muoto ja kunkin havainnon numeerinen arvo. Käytetään pääasiassa aineistonesitarkastelussa.

satunnaistaminen ’randomization’Kokeellisissa tutkimuksissa käytetty menetelmä, jonka tarkoituksena on turvata vertailtavi-en ryhmien samankaltaisuus tutkimuksen aloitushetkellä.

satunnaisten vaikutusten malli ’random effects model’Etenkin varianssianalyysissä käytetty malli. Vastakohta kiinteiden vaikutusten mallille.

satunnaisvirhe ’random error’Virhe, joka aiheutuu satunnaisesta prosessista tai sattumman vaikutuksesta. Virhe, jota eikyetä selittämään. Se liittyy satunnaismuuttujan vaihteluun.

sekoittava tekijä ’confounding factor’Tekijä, joka häiritsee tutkittavan suureen (x) ja lopputulos- tai vaikutusmuuttujan (y) väli-sen yhteyden tutkimista. Jotta jokin suure olisi sekoittava tekijä (z), niin z:n täytyyitsenäisesti assosioitua sekä x:ään että y:hyn. Sekoittavien tekijöiden hallinta on eräs tilas-tollisen tutkimuksen keskeisimmistä asioista.

selitysaste R2 ’coefficient of determination’Ilmaisee regressioanalyysissä sen osuuden selitettävän eli riippuvan muuttujan (’dependentvariable’) vaihtelusta, joka selittyy riippumattomilla muuttujilla (’independent variables’)

sensitiivisyys ’sensitivity’Seulonta- tai diagnostisen testin herkkyys taudin toteamiseksi. Se on ehdollinen todennä-köisyys sille, että testi antaa oikean positiivisen tuloksen silloin, kun testattavallahenkilöllä todella on testauksen kohteena oleva tauti; ilmaisee testin kyvyn löytää sairaat.

seurantatutkimusaselma ’follow-up study design’Epäkokeellinen tutkimusasetelma, missä henkilöt valitaan heidän altistusstatuksensa perus-teella. Henkilöitä seurataan tietty ajanjakso, jonka riittävä pituus arvioidaan tutkimuksenvoimalaskelmien yhteydessä. Seurannan kuluessa rekisteröidään tutkittaville ilmaantuvattautitapahtumat.

siirtyvä vaikutus ’carry-over effect’Hoitovaikutuksen siirtyminen ristikkäisasetelmassa periodilta toiselle.

sokkouttaminen ’blinding, masking’Menettely, jolla pyritään hoitokokeiluissa estämään, se etteivät hoitohenkilökunta ja tutki-

Sanastoa 130 Seppo Sarna

Page 135: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

jat tietäisi ennen hoidon aloittamista, mitä hoitoa kukin potilas tulee saamaan (yksöissokko-menetelmä, ’single blinded’ tai mitä hoitoa potilaat tutkimuksen aikana saavat (kaksoissok-komenetelmä ’double blind’). Kolmoissokkomenetelmä (’triple blind’) tarkoittaa, ettätilastoanalyysitkin suoritetaan siten, että hoitoryhmistä käyteään peitekoodeja.

spesifisyys ’specificity’Seulonta- tai diagnostisen testin tarkkuus taudin toteamiseksi. Se on ehdollinen todennäköi-syys sille, että testi antaa oikean negatiivisen tuloksen silloin, kun testattavalla henkilöllätodellisuudessa ei ole testauksen kohteena olevaa tautia; ilmaisee testin kyvyn tunnistaa ter-veet.

standardipoikkeama ’standard deviation’Ks. keskivirhe.

standardointi ’standardization’Muunnos, missä muuttujan arvosta vähennetään keskiarvo ja erotus jaetaan stand-ardipoikkeamalla.

standardoitu pistemäärä ’standard score’Katso standardointi. Standardipoikkeaman (SD) yksiköissä esitetty havaintoarvo.

suhdeasteikko ’ratio scale’Asteikko, missä nollakohta merkityksellinen ja siten skaalan lukuarvojen välimatkat (taisuhteet) ovat samat, esim. esineen paino.

suhteellinen vaara ’relative risk’ [merkintänä RR]Seurantatutkimusasetelmissa käytetty altisteen ja taudin välisen yhteyden mitta; altistunei-den ja altistumattomien sairastumisvaaran suhde.

suunnitellut vertailut ’planned/ad hoc comparisons’Tutkimushypoteesissa (protokollassa) etukäteen (ennen analyysejä) määritellyt vertailut.

systemaattinen virhe ’systematic error’Virhe, joka johtuu jostain systemaattisesta prosessista tai harhasta, toisin kuin satunnaisvir-he.

t-jakauma ’t-distribution’Yksi yleisimmin käytetyistä todennäköisyysjakaumista Normaalijakauman ohella. Ja-kauman muotoa säätelee parametri nimeltä vapausaste, jonka laskentakaava riippuututkimusaineiston koosta ja jakauman käyttötarkoituksesta. Esim. jos t-jakaumaa käytetäänPearsonin korrelaatiokertoimen testaamiseen, niin vapausasteita on n-2, koska testisuureenlaskemisessa joudutaan arvioimaan kaksi keskiarvoa. Jakaumasta käytetään myös nimitys-tä Studentin t-jakauma. Se on Normaalijakaumaa litteämpi ja pitkähäntäisempi.

t-testi ’t-test’Moniin eri testaustilanteisiin soveltuva parametrinen testi, joka perustuu t-jakaumaan. Tes-tistä on olemassa monia eri versioita. Testin perusmuoto on: t = [(otossuure)-(hypoteettinen arvo)] / (otossuureen keskivirhe)Testistä on olemassa monia eri versioita riippuen siitä, kuinka nimittäjässä olevan keskivir-he arviointi- ja vapausasteiden laskentatavasta.

Biostatistiikan peruskurssi 1998 131 Sanastoa

Page 136: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

tapaus-verrokki -tutkimusasetelma ’case-control’ tai ’case referent -study design’Sairauslähtöinen tutkimus asetelma, joka suoritetaan siten, että valitaan joukko tutkimuk-sen kohteena olevaa tautia sairastavia henkilöitä ja niille mahdollisimman samankaltainenvertailuryhmä; samankaltainen muiden paitsi tutkittavan taudin suhteen. Tämän jälkeen tut-kittavista kerätään altistetiedot takenevasti (retrospektiivisesti).

testisuure ’test statistic’Nollahypoteesin testaamiseen käytetty otossuure.

tietojen editointi ’data editing’Tutkimusaineiston esikäsittelyyn kuuluva virheiden etsintä- ja korjaamisvaihe. Suoritetaankliinisissä kokeiluissa ennenkuin tiedosto virallisesti suljetaan ja tutkimuskoodi avataan.

tilastollinen merkitsevyystaso ’statistical significance level’Tilastolliseen päättelyyn liittyvä todennäköisyys (α-virhe, I-lajin virhe), joka ilmoittaakuinka suuri erehtymisriski nollahypoteesin virheelliseen hylkäämiseen halutaan sallia. Ti-lastollinen merkitsevyys on välttämätön edellytys kliiniselle merkittävyydelle (’importan-ce’), mutta ei kerro mitään todellisesta vaikutuksen suuruudesta.

tilastollinen päättely ’statistical inference’Tilastotieteen keskeisimpiä käyttötapoja. Päättely-mekanismi, jolla kerätyn otoksen (tutki-musaineiston) perusteella pyritään tutkittavasta asiasta tekemään johtopäätöksiä laajempaajoukkoa koskevaksi. Tilastollisen päättelyn osa-alueet ovat arviointi (estimointi) ja hypo-teesien testaaminen.

todennäköisyys ’probability’Suhteellisen uskottavuuden mitta sille, että tapahtuuko jonkin tapahtuma tai ei. Normitettuvälille [0,1].

toisensa poissulkeva tapahtuma ’mutually exclusive event’Toisen tapahtuman toteutuessa toinen ei voi toteutua, esim. jonkin taudin pysyvä im-muniteetti estää sairastumisen siihen uudelleen.

toistomittausanalyysi ’analysis of repeated measures’toistomittausasetelmaa käyttävä analyysimenetelmä.

toistomittausasetelma ’repeated measures design’Tutkimusasetelma, jossa pyritään vähentämään yksilöiden välisen vaihtelun vaikutusta tut-kittavaan asiaan, esim. hoitojen vaikutukseen suorittamalla tutkittavista useita mittauksiaesim. eri aikoina ja eri olosuhteissa.

tutkimussunnitelma ’study design’,’study protocol’Yleissuunnitelma, jonka mukaan tutkimus suoritettiin tai suunnitellaan suoritettavaksi. Sesisältää yksityiskohtaisia tietoja tutkittavien joukosta, tietojenkeruusta, käytettävistä mene-telmistä, tutkimusasetelmasta, hoitotoimenpiteistä, tutkimuksen toteutusaikatauluista jne.

tutkittavien joukko ’study population’Käytetään kahdessa eri merkityksessä: 1. kaikki ne henkilöt tai havaintoyksiköt, jotka onotettu tai tullaan ottamaan mukaan tutkimukseen. 2. kaikki ne henkilöt tai havaitoyksiköt,jotka harkittu otettavaksi tutkimukseen riippumatta siitä otetaanko ne vai ei (vrt. perusjouk-ko).

Sanastoa 132 Seppo Sarna

Page 137: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

uskottavuussuhde ’likelihood ratio’Uskottavuussuhde (LR) määrittelee kuinka todennäköinen jokin tapahtuma A on tietyn eh-don B ollessa voimassa verrattuna siihen, että ehto B ei ole voimassa. Kaavana:LR = P(A|B) / P(A|ei B). Esim. Millä todennäköisyydellä vatsahaavapotilaalla on helico-bakteeri+ verrattuna muihin ylävatsaoireita poteviin potilaisiin.

vaihteluväli ’range’Muuttujan suurimman ja pienimmän arvon erotus. Poikkeavien havaintojen tapauksessa tä-män 100%-vaihteluvälin sijasta käytetään usein esim. 95%-vaihteluväliä.

vaihtoehtoinen hypoteesi ’alternative hypothesis’ [merkintänä H1]Ennalta määritelty vaihtoehtoinen väittämä nollahypoteesille. Esim., että lääkehoitojen te-holla on eroa, mutta ei määritellä suuntaa (kaksisuuntainen hypoteesi) tai että hoito A on te-hokkaampi kuin hoito B (yksisuuntainen hypoteesi). Tavallisimmin tutkimuksissakäytetään kaksisuuntaista hypoteesia, koska etukäteen ei yleensä voida olla täysin varmojatuloksen suunnasta.

vaikutuksen mukainen koodaus ’effects coding’Etenkin varianssianalyysissä käytetty koodaustapa, missä läätueroasteikollinen muuttujamuunnetaan arvoja 1,0 ja -1 hyväksikäyttäen kaksiarvoisiksi ilmaisinmuuttujiksi. Poikkeaavertailuryhmänmukaisesta koodaustavasta siinä, että tässä koodauksessa vertailu suorite-taan yleiskeskiarvoon.

vaikutuksen suuruus ’effect size’Ero tutkimuksen lopputulos- tai vastemuuttujassa, jonka toteennäyttämistä tutkimuksessatavoitellaan, mikäli ero on olemassa.

vakiointi ’standardization’Sekoittavien tekijöiden (tavallisimmin ikä) vaikutuksen korjaamismenettely. Menetelmiäon kahta tyyppiä; suora (’direct’) ja epäsuora (’indirect’) vakiointi.

valemuuttuja ’dummy variable’Muuttuja, jota käytetään apuna tilastollisissa analyyseissa ja mallittamisissa, kun esim. ha-lutaan muodostaa laatueroasteikollisesta muuttujasta useita sen eri luokkia ilmaiseviamuuttujia.

vallitsevuus ’prevalence rate’Tutkittavaa tautia sairastavien osuus tietyllä ajanhetkellä tietyssä väestössä.

vapausaste ’degrees of freedom’Vapausaste on parametri, joka säätelee todennäköisyysjakauman muotoa. Näitä parametre-ja voi olla yksi tai useampia. Vapausaste kuvaa sitä, kuinka monta ’vapaata’ havaintoarvoaaineistossa on. Esim. nelikentässä tutkimustuloksena riittää tarkastella vasemmassa yläkul-massa olevaa arvoa (a), sillä jos reunasummat oletetaan kiinteiksi, niin muiden lokeroidenarvot määräytyvät a:n ja reunasummien perusteeella. Vapaasti vaihtelevia havaintoarvojaon siten vain yksi, eli vapausasteita on yksi.

variaatiokerroin ’coefficient of variation’Skaalasta riippumaton vaihtelun mitta; standardipoikkeama jaettuna keskiarvolla.

Biostatistiikan peruskurssi 1998 133 Sanastoa

Page 138: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

varianssi ’variance’Satunnaismuuttujien vaihtelua kuvaava suure. Tilastollisen tutkimuksen keskeisin kohde.Esim. varianssianalyysissä vaihtelu jaetaan eri tekijöista johtuvaksi vaihteluksi ja virhe-vaihteluksi, joita verrataan keskenään.

verrokki ’referent’, ’control’Vertailuhenkilöstä käytetty nimitys epidemiologisissa tutkimuksissa. Kliinisissä tutkimuk-sissa yleensä käytetään nimitystä kontrollihenkilö.

viitearvoväli ’reference interval’Väli, joka ilmaisee ns. normaalivaihtelua esim. laboratoriotesteissä tai lasten kasvukäyrissä.

vinouskerroin ’coefficient of skewness’Mittaa jakauman vinoutta suhteessa normaalijakaumaan. Symmetriselle jakaumalle kerroinon nolla, oikealle vinossa jakaumassa positiivinen ja vasemmalle vinossa jakaumassa nega-tiivinen.

viritetty keskiarvo ’trimmed mean’Lähinnä deskriptiivisiin tarkoituksiin soveltuva tapa laskea keskiarvo siten, että jakaumas-sa mahdollisesti esiintyvien poikkeavien (’outlier’) havaintoarvojen vaikutus ei liikaa ko-rostuisi. Laskentamenetelminä käytetään joko jakauman äääripäiden poisjättöä tai erilaisiapainottamiskeinoja, jakauman ääripäissä olevat havaintoarvot saavat pienemmän painonkuin jakauman keskellä olevat arvot.

voima (1-β) ’power’Tutkimuksen (testin) voima ilmoittaa millä todennäköisyydellä käytetyllä aineistokoolla jatilastollisella merkitsevyystasolla voidaan todeta tietyn suuruinen vaikutus (efekti) käyte-tyssä lopputulosmuuttujassa, mikäli vaikutus on olemassa, ts. testin voima ilmoittaa toden-näköisyyden hylätä nollahypoteesi silloin kun vaihtoehtoinen hypoteesi on tosi.

välianalyysi ’interim analysis’Mikä tahansa etukäteen suunniteltu kliinisen tutkimuksen kuluessa suoritettu analyysi.Syyt suorittamiseen ovat joko eettisiä tai taloudellisia. Välianalyysien suorittaminen vaikut-taa tilastolliseen merkitsevyystasoon (α-virhe kasvaa).

välimatka-asteikko ’interval scale’Asteikko, missä arvojen väliset etäisyydet ovat samat, mutta nollakohta on mielivaltainen,esim. lämpötila.

yhdistelmätieto ’aggregate data’Tieto, joka on muodostettu yhdistämällä tietoa useista eri tietueista. Esim. muodostamallajonkin henkilön kaikista sairaalakäynneistä yhteenlasketut hoitopäivät.

yhdistetty varianssi ’pooled variance’Mikäli kahden tai useamman ryhmän variassit eivät poikkea tilastollisesti toisistaan esim.Levenen testillä testattuna, niin niistä voidaan muodostaa yhdistetty varianssi tilastollisiintesteihin ja analyyseihin. Yhdistetty varianssi muodostetaan tavallisesti painottamalla ryh-mäkohtaisia variansseja vapausasteilla dƒi = ni − 1

Sanastoa 134 Seppo Sarna

Page 139: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

yhdysvaikutus ’interaction’Kun tutkittavan tekijän (A, esim. hoito) vaikutus lopputulokseen on erilainen riippuen jos-tain toisesta tekijästä (B, esim lääkkeenantotapa), niin A:n ja B:n välillä on yhdysvaikutus.Tällöin tekijöiden A ja B vaikutusta lopputulokseen ei voi välittömästi arvioida.

yhteensopivuus ’goodness of fit’Käytetään kahdessa yhteydessä: 1. Ilmaisemaan sitä, kuinka hyvin havaitut ja odotetut frek-venssit sopivat yhteen. Tätä testataan yhteensopivuustestillä. 2. tarkoittaa myös sitä, kuin-ka hyvin havaintoavot sopivat yhteen jokin matemaattisesti määritellyn käyrän kanssa (ks.käyränsovitus)

yhteiskorrelaatiokerroin ’multiple correlation coefficient’Lineaarisen monimuuttujaregressioanalyysin yhteydessä käytetty suure, joka mittaa y-muuttujan ja kaikkien x-muuttujien välistä yhteyttä (merk. R). Tilasto-ohjelmat tulostavatyleensä myös korjatun (’adjusted’) yhteiskorrelaatiokertoimen (Radj), joka huomioi mallis-sa olevien x-muuttujien määrän, toisin kuin R. Yhteiskorrelaatiokertoimen neliötä (R2) kut-sutaan mallin selitysasteeksi. Se kuvastaa kuinka paljon y-muuttujan vaihtelusta(varianssista) selittyy käytettyjen x-muuttujien perusteella.

yksisuuntainen testi ’one tailed/sided test’Testi, missä testauksen (vaihtoehtoisen hypoteesin) suunta on etukäteen määritelty.

Englannista suomeena posteriori comparisons (unplanned/multiple comparisons): ’jälkikäteisvertailut, suun-

nittelemattomat vertailut, monivertailut’a posteriori probability: ’jälkikäteistodennäkoisyys’a priori comparisons (planned/ad hoc hoc comparisons): ’suunnitellut vertailut’a priori probability: ’etukäteistodennäköisyys’ad hoc comparisons/tests (ks. a priori comparisons)adjustment: ’korjaaminen’aggregate data: ’yhdistelmätieto’algorithm: ’algoritmi’

alpha error, type I error: ’alfa-virhe’, α-virhealternative hypothesis, merkitään H1: ’vaihtoehtoinen hypoteesi’ambispective: ’kaksisuuntainen’ (ks. kohorttitutkimusasetelma)analysis of repeated measures: ’toistomittausanalyysi’arithmetic mean: ’aritmeettinen keskiarvo’association: ’riippuvuus’bar chart: ’pylväskuvio’Bayesian approach: ’Bayesilainen lähestymistapa’bell-shaped, mesocurtic: ’kellonmuotoinen’

beta error, type II error: ’beeta-virhe’, β-virhebias: ’harha’

Biostatistiikan peruskurssi 1998 135 Sanastoa

Page 140: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

binomial distribution: ’binomijakauma’blinding, masking: ’sokkouttaminen’block randomization: ’lohkosatunnaistaminen’’box-and-whiskers’ plot: ’laatikko-ja-viikset’-kuviocarry-over effect: ’siirtyvä vaikutus’case-control study design, case-referent study design:’tapaus-verrokki-tutkimusasetelma ’case record form, CRF: ’potilaslomake’central tendency (ks. measure of central tendency)categorical data: ’luokiteltu tieto’ (ks. laatueroasteikko)categorical variable: ’luokkamuuttuja’ (ks. epäjatkuva muuttuja)censored observation: ’rajattu havaintoarvo’central limit theorem: ’keskeinen raja-arvoväittämä’

chi-square test: ’Khii2-testi’, χ2-testiclinical trial: ’kliininen kokeilu’coefficient of correlation: ’korrelaatiokerroin’coefficient of determination: ’selitysaste’coefficient of skewness: ’vinouskerroin’coefficient of variation: ’variaatiokerroin’cohort: ’kohortti’cohort study design: ’kohorttitutkimusasetelma’conditional probability: ’ehdollinen todennäköisyys’confidence interval: ’luottamusväli’, CIconfidence level: ’luottamustaso’, CLconfounding factor: ’sekoittava tekijä’contingency table: ’ristiintaulukko’continuous variable: ’jatkuva muuttuja’covariance: ’kovarianssi’covariate: ’kovariaatti’critical value: ’kriittinen arvo’cross-over design: ’ristikkäistutkimusasetelma’cross-sectional study design: ’poikkileikkaustutkimusasetelma’curve fitting: ’käyränsovitus’cut-off point: ’katkaisukohta’data screening: ’aineiston tarkastelu’data editing: ’tietojen editointi’degrees of freedom: ’vapausaste’dependent variable: ’riippuva muuttuja’descriptive statistics: ’kuvaileva tilastotiede’design variable: ’mallintamismuuttuja’dichotomical scale: ’dikotominen asteikko’discrete variable: ’epäjatkuva muuttuja’

Sanastoa 136 Seppo Sarna

Page 141: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

distribution: ’jakauma’dummy variable: ’valemuuttuja’effect size: ’vaikutuksen suuruus’effects coding: ’vaikutuksen mukainen koodaus’estimation: ’arviointi’expected value: ’odotusarvo’experimental study design: ’kokeellinen tutkimusasetelma’exposed group: ’altistuneiden ryhmä’Fisher’s exact test: ’Fisherin tarkka testi’fixed-effects model: ’kiinteiden vaikutusten malli’follow-up study design: ’seurantatutkimusaselma’frequency polygon: ’frekvenssimurtoviiva’geometric mean: ’geometrinen keskiarvo’goodness of fit: ’yhteensopivuus’histogram: ’histogrammi’hypothesis: ’hypoteesi’incidence rate: ’ilmaantuvuusluku’indicator: ’ilmaisin’independent variable: ’riippumaton muuttuja’inference: ’päättely’ (ks. statistical inference)intention to treat analysis: ’aikomus-hoitaa -analyysi’interaction: ’yhdysvaikutus’interim analysis: ’välianalyysi’interval scale: ’välimatka-asteikko’intervention study design: ’interventiotutkimusasetelma’intraclass correlation coefficient: ’luokkien sisäinen korrelaatiokerroin’

kappa: ’kappa’, κkurtosis: ’huipukkuus’learning effect: ’oppimisvaikutus’leptokurtic: ’huipukas’, ks. huipukkuus.likelihood ratio: ’uskottavuussuhde’matching: ’kaltaistus’matched study: ’kaltaistettu tutkimus’McNemar’s test: ’McNemarin testi’measure of central tendency: ’keskiluku’measure of dispersion: ’hajonnan mitta’measurement bias: ’mittausharha’measurement error: ’mittausvirhemedian: ’mediaani’mesocurtic, bell-shaped: ’kellonmuotoinen’meta-analysis: ’meta-analyysi’mode: ’moodi’

Biostatistiikan peruskurssi 1998 137 Sanastoa

Page 142: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

modelling: ’mallintaminen, mallitus’multiple comparison test: ’monivertailutesti’multiple correlation coefficient: ’yhteiskorrelaatiokerroin’mutually exclusive event: ’toisensa poissulkeva tapahtuma’nominal scale: ’laatueroasteikko’non-parametric method: ’ei-parametrinen menetelmä’Normal distribution’,’Gaussian distribution’, ’bell curve’: ’Normaalijakauma’null hypothesis, merkitään H0: ’nollahypoteesi’observational stydy: ’havainnoiva tutkimus’ (ks. cohort study design)odds ratio, merkitään OR: ’ristitulosuhde’one tailed/sided test: ’yksisuuntainen testi’ordered categorical data: ’järjestetty luokiteltu tieto’ ks. järjestysasteikkoorthogonal: ’ortogonaalinen’outcome measure: ’lopputulosmuuttuja’outlier: ’poikkeava havaintoarvo’p-value: ’p-arvo’parameter: ’parametri’parametric method: ’parametrinen menetelmä’per protocol analysis: ’protokollan mukainen analyysi’percentile: ’prosenttipiste’permutation tests: ’permutaatiotestit’planned/ad hoc comparisons: ’suunnitellut vertailut’platycurtic: ’litteä’, ks. huipukkuuspoint estimation: ’piste-estimointi’Poisson distribution: ’Poisson-jakauma’pooled variance: ’yhdistetty varianssi’population: ’perusjoukko’population sampled, study population: ’otosperusjoukko ’population study: ’kokonaistutkimusasetelma’post hoc comparisons: ’jälkikäteisvertailut’

power: ’voima’ (1 − β)prevalence rate: ’vallitsevuus’probability: ’todennäköisyys’prognostic factor: ’ennustetekijä’prospective: ’etenevä’ (ks. kohorttitutkimusasetelma)protocol: ’protokolla’ (tutkimussuunnitelma)quality control: ’laaduntarkkailu’R2: ’selitysaste’random effects model: ’satunnaisten vaikutusten malli’random error: ’satunnaisvirhe’randomization: ’satunnaistaminen’randomization test: ks. ’permutaatiotestit’

Sanastoa 138 Seppo Sarna

Page 143: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

rank: ’järjestysluku’ranking scale: ’järjestysasteikko’range: ’vaihteluväli’ratio scale: ’suhdeasteikko’raw data: ’käsittelemätön tieto’reference interval: ’viitearvoväli’referent, control: ’verrokki’region of acceptance: ’hyväksymisalue’region of rejection: ’hylkäämisalue’ (kriittinen alue)regression analysis: ’regressioanalyysi’regression coefficient: ’regressiokerroin’regression line: ’regressiosuora’regression towards the mean: ’regressio kohti keskiarvoa’relative risk (merkitään RR): ’suhteellinen vaara ’repeated measures design: ’toistomittausasetelma’retrospective: ’takeneva’ (ks. tapaus-verrokki -tutkimusasetelma)ROC-curve; Receiver Operating Characteristic Curve: ’ROC-käyrä’sample: ’otos’sample distribution: ’otosjakauma’sample statistic: ’otossuure’sample study: ’otantatutkimus’scatter plot: ’hajontakuvio’sensitivity: ’sensitiivisyys’significance level: ’merkitsevyystaso’skewness: ’vinous’, ks. vinouskerroinspecificity: ’spesifisyys’standard deviation: ’keskihajonta, standardipoikkeama’standard error: ’keskivirhe’standard score: ’standardoitu pistemäärä’standardization: ’standardointi’, ’vakiointi’statistical significance level: ’tilastollinen merkitsevyystaso’statistical inference: ’tilastollinen päättely’stem-and-leaf diagram: ’runko-ja-lehdet-diagrammi’stratification: ’osittaminen’stratified randomization: ’ositettu satunnaistaminen’study design, study protocol: ’tutkimussuunnitelma’study population: ’tutkittavien joukko’survey: ’havainnoiva tutkimusasetelma’systematic error: ’systemaattinen virhe’target population: ’kohdeperusjoukko’t-distribution: ’t-jakauma’t-test: ’t-testi’test statistic: ’testisuure’

Biostatistiikan peruskurssi 1998 139 Sanastoa

Page 144: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

trimmed mean: ’viritetty keskiarvo’two tailed/sided test: ’kaksisuuntainen testi’type I error: (ks. alpha error)type II error: (ks. beta error)variable: ’muuttuja’variance: ’varianssi’washout period: ’puhdistumisjakso’

Sanastoa 140 Seppo Sarna

Page 145: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Taulukko A1:

Tarvittava aineistoko, kun verrataan kahta binomiaalista suhdelukua p1 ja p2 toisiinsa. Esim. ∆ = p2 − p1 on hoitoero (tai efektin suuruus) tärkeimmässä lopputulosmuuttujassa. Taulukon arviot on laskettu olettaen, että testaus suoritetaan

χ2-testillä ilman jatkuvuuskorjausta kaksisuuntaista merkitsevyystasoa α = 0.05 käyttäen.

Voima (1 − β)p1 p2 0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.95

0.05 0.10 214 305 342 385 435 497 582 719

0.05 0.15 70 99 111 125 141 161 188 231

0.05 0.20 38 54 60 67 76 86 101 124

0.05 0.25 25 35 39 44 49 56 65 80

0.05 0.30 18 25 28 32 36 40 47 58

0.05 0.35 14 20 22 24 27 31 36 44

0.05 0.40 11 16 17 19 22 24 28 34

0.05 0.45 10 13 14 16 18 20 23 28

0.05 0.50 8 11 12 13 15 17 19 23

0.05 0.55 7 9 10 11 12 14 16 19

0.05 0.60 6 8 9 10 11 12 14 16

0.05 0.65 5 7 8 8 9 10 12 14

0.10 0.15 337 481 540 607 686 785 918 1135

0.10 0.20 98 140 157 177 199 228 266 329

0.10 0.25 50 71 79 89 100 114 133 164

0.10 0.30 31 44 49 55 62 71 82 101

0.10 0.35 22 31 34 38 43 49 57 70

0.10 0.40 17 23 26 29 32 36 42 52

0.10 0.45 13 18 20 22 25 28 33 40

0.10 0.50 11 14 16 18 20 22 26 32

0.10 0.55 9 12 13 15 16 18 21 26

0.10 0.60 7 10 11 12 14 15 17 21

0.10 0.65 6 9 9 10 11 13 15 18

0.10 0.70 6 7 8 9 10 11 12 15

Voima (1 − β)p1 p2 0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.95

0.15 0.20 444 635 713 801 906 1036 1212 1498

0.15 0.25 123 176 197 222 250 286 335 413

0.15 0.30 60 85 96 107 121 138 161 199

0.15 0.35 37 52 58 65 73 83 97 119

0.15 0.40 25 35 39 44 49 56 65 80

0.15 0.45 18 26 29 32 36 41 47 58

0.15 0.50 14 20 22 24 27 31 36 44

0.15 0.55 11 16 17 19 22 24 28 34

0.15 0.60 9 13 14 16 17 20 23 28

0.15 0.65 8 11 12 13 14 16 19 22

0.15 0.70 7 9 10 11 12 13 15 18

0.15 0.75 6 8 8 9 10 11 13 15

0.20 0.25 536 767 861 968 1094 1251 1464 1810

0.20 0.30 145 206 231 260 294 336 392 485

0.20 0.35 69 98 109 123 138 158 185 228

0.20 0.40 41 58 65 72 82 93 109 134

0.20 0.45 27 39 43 48 54 62 72 89

0.20 0.50 20 28 31 35 39 44 52 63

0.20 0.55 15 21 23 26 29 33 39 47

0.20 0.60 12 17 18 20 23 26 30 36

0.20 0.65 10 13 15 16 18 21 24 29

0.20 0.70 8 11 12 13 15 17 19 23

0.20 0.75 7 9 10 11 12 14 16 19

0.20 0.80 6 8 8 9 10 11 13 15

Voima (1 − β)p1 p2 0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.95

0.25 0.30 613 877 984 1107 1251 1431 1674 2070

0.25 0.35 162 231 259 291 329 376 440 543

0.25 0.40 75 107 120 135 152 174 203 251

0.25 0.45 44 63 70 79 89 101 118 145

0.25 0.50 29 41 46 52 58 66 77 95

0.25 0.55 21 29 33 37 41 47 54 67

0.25 0.60 16 22 24 27 31 35 40 49

0.25 0.65 12 17 19 21 24 27 31 38

0.25 0.70 10 14 15 17 19 21 24 29

0.25 0.75 8 11 12 13 15 17 19 23

0.25 0.80 7 9 10 11 12 14 16 19

0.25 0.85 6 8 8 9 10 11 13 15

0.30 0.35 675 965 1083 1218 1377 1575 1842 2278

0.30 0.40 175 250 281 315 356 407 477 589

0.30 0.45 81 115 128 144 163 186 217 268

0.30 0.50 47 66 74 83 93 107 124 153

0.30 0.55 31 43 48 54 61 69 81 99

0.30 0.60 22 30 34 38 42 48 56 69

0.30 0.65 16 22 25 28 31 35 41 50

0.30 0.70 13 17 19 21 24 27 31 38

0.30 0.75 10 14 15 17 19 21 24 29

0.30 0.80 8 11 12 13 15 17 19 23

0.30 0.85 7 9 10 11 12 13 15 18

0.30 0.90 6 7 8 9 10 11 12 15

Page 146: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Voima (1 − β)p1 p2 0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.95

0.35 0.40 721 1031 1157 1301 1471 1682 1969 2434

0.35 0.45 185 264 296 333 376 430 503 621

0.35 0.50 84 120 134 150 170 194 227 280

0.35 0.55 48 68 76 85 96 110 128 158

0.35 0.60 31 44 49 55 62 71 82 101

0.35 0.65 22 31 34 38 43 49 57 70

0.35 0.70 16 22 25 28 31 35 41 50

0.35 0.75 12 17 19 21 24 27 31 38

0.35 0.80 10 13 15 16 18 21 24 29

0.35 0.85 8 11 12 13 14 16 19 22

0.35 0.90 6 9 9 10 11 13 15 18

0.35 0.95 5 7 8 8 9 10 12 14

0.40 0.45 752 1075 1206 1356 1534 1754 2053 2538

0.40 0.50 191 272 305 343 388 443 519 641

0.40 0.55 86 122 137 153 173 198 231 286

0.40 0.60 49 69 77 86 97 111 130 160

Voima (1 − β)p1 p2 0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.95

0.40 0.65 31 44 49 55 62 71 82 101

0.40 0.70 22 30 34 38 42 48 56 69

0.40 0.75 16 22 24 27 31 35 40 49

0.40 0.80 12 17 18 20 23 26 30 36

0.40 0.85 9 13 14 16 17 20 23 28

0.40 0.90 7 10 11 12 14 15 17 21

0.40 0.95 6 8 9 10 11 12 14 16

0.45 0.50 767 1097 1231 1384 1565 1790 2095 2590

0.45 0.55 193 275 308 347 392 448 524 647

0.45 0.60 86 122 137 153 173 198 231 286

0.45 0.65 48 68 76 85 96 110 128 158

0.45 0.70 31 43 48 54 61 69 81 99

0.45 0.75 21 29 33 37 41 47 54 67

0.45 0.85 15 21 23 26 29 33 39 47

0.45 0.85 11 16 17 19 22 24 28 34

0.45 0.90 9 12 13 15 16 18 21 26

Voima (1 − β)p1 p2 0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.95

0.45 0.95 7 9 10 11 12 14 16 19

0.50 0.55 767 1097 1231 1384 1565 1790 2095 2590

0.50 0.60 191 272 305 343 388 443 519 641

0.50 0.65 84 120 134 150 170 194 227 280

0.50 0.70 47 66 74 83 93 107 124 153

0.50 0.75 29 41 46 52 58 66 77 95

0.50 0.80 20 28 31 35 39 44 52 63

0.50 0.85 14 20 22 24 27 31 36 44

0.50 0.90 11 14 16 18 20 22 26 32

0.50 0.95 8 11 12 13 15 17 19 23

Lähde: Machin D & Campbell MJ. StatisticalTables for the Design of Clinical Trials. Black-well Scientific Publ. 1987: Table 3.1 (modifioi-tu).

Taulukko A1 (jatkoa)

Taulukko A2:

Tarvittava aineistoko, kun vertaillaan kahden toisis-taan riippumattoman ryhmän keskiarvoja µ0 ja µ1 toi-

siinsa. Esim. µ1 − µ0 on hoitoero (tai efektin suuruus)tärkeimmässä lopputulosmuuttujassa. Taulukon arvi-ot on laskettu olettaen, että testaus suoritetaan riippu-mattomien otosten t-testillä kaksisuuntaista merkitse-vyystasoa α = 0.05 käyttäen. Taulukointi on suoritet-

tu standardoidun erotuksen dt = µ1 − µ0

σ mukaisesti.

dt

Voima (1 − β)

0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.950.05 3074 4401 4939 5553 6280 7184 8407 10397

0.10 769 1101 1235 1389 1571 1797 2102 2600

0.15 342 490 550 618 699 799 935 1156

0.20 193 276 310 348 393 450 526 651

0.25 124 177 198 223 252 288 337 417

0.30 86 123 138 155 175 201 234 290

0.35 64 91 102 114 129 148 173 213

0.40 49 70 78 88 99 113 132 163

0.45 39 55 62 70 79 80 105 129

dt

Voima (1 − β)

0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.950.50 32 45 50 57 64 73 85 105

0.55 26 37 42 47 53 60 70 87

0.60 22 32 35 40 45 51 59 73

0.65 19 27 30 34 38 43 51 63

0.70 17 23 26 29 33 38 44 54

0.75 15 21 23 26 29 33 38 47

0.80 13 18 20 23 26 29 34 42

0.85 12 16 18 20 23 26 30 37

0.90 10 15 16 18 20 23 27 33

Page 147: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Taulukko A2 (jatkoa)

dt

Voima (1 − β)

0.50 0.65 0.70 0.75 0.80 0.85 0.90 0.950.95 10 13 15 16 18 21 24 30

1.00 9 12 13 15 17 19 22 27

1.05 8 11 12 14 15 17 20 25

1.10 7 10 11 12 14 16 18 22

1.15 7 9 10 11 13 15 17 21

1.20 6 9 10 11 12 13 16 19

1.25 6 8 9 10 11 12 14 18

1.30 6 7 8 9 10 12 13 16

1.35 5 7 8 9 10 11 13 15

1.40 5 7 7 8 9 19 12 14

1.45 5 6 7 8 8 10 11 13

1.50 4 6 6 7 8 9 10 13

Lähde: Machin D & Campbell MJ. StatisticalTables for the Design of Clinical Trials. Black-well Scientific Publ. 1987: Table 7.2 (modifioi-tu).

Taulukko A3:

Satunnaislukuja(numeroita)

1 9 2 7 5 2 6 7 4 7 9 7 2 6 9 6 2 0 6 4 5 7 8 4 3 9 1 1 2 2 4

2 7 4 0 5 2 7 8 8 4 1 5 5 7 3 1 2 4 9 0 1 3 2 2 9 2 9 6 3 1 0

3 3 9 4 4 7 6 9 1 6 3 0 0 6 3 9 8 5 0 7 1 1 3 4 5 2 9 5 7 6 2

4 2 1 5 5 3 9 7 2 3 9 1 1 1 1 3 1 6 1 8 5 2 0 8 7 0 2 7 3 2 4

5 1 6 0 4 9 6 0 4 6 7 2 8 6 0 2 9 2 2 4 8 3 1 0 6 4 0 3 5 0 9

6 2 9 2 3 2 5 7 2 2 5 8 5 7 5 7 7 3 2 8 8 6 5 6 0 6 2 6 2 3 7

7 0 9 9 4 6 1 6 4 6 8 0 3 8 0 8 0 0 8 1 9 0 2 8 7 0 0 8 7 8 5

8 9 0 3 6 8 4 8 3 7 6 2 0 3 8 1 0 1 2 3 2 5 7 5 4 4 5 4 1 9 4

9 6 3 6 4 2 0 6 4 8 5 6 8 4 8 9 6 7 7 6 2 7 8 6 9 2 0 5 9 1 8

10 1 2 4 1 6 2 3 4 9 1 8 7 7 2 0 3 5 5 5 1 8 1 7 1 1 7 4 2 9 7

11 3 9 0 2 8 8 5 1 4 1 6 9 8 1 1 2 5 5 9 0 4 8 5 9 3 9 6 3 5 4

12 9 4 2 5 2 2 0 9 1 4 2 4 9 4 7 5 0 7 0 7 5 0 9 7 6 6 3 1 8 3

13 1 6 1 6 7 4 1 7 5 0 1 6 0 1 4 0 4 7 8 3 3 1 7 6 9 0 8 6 8 1

14 9 5 1 8 7 1 4 2 8 8 6 9 5 5 6 0 6 6 2 1 1 0 8 2 3 0 2 1 3 1

15 9 5 0 3 7 8 4 0 3 3 6 7 4 8 1 8 7 7 9 2 4 9 0 3 5 4 8 8 5 8

16 8 9 2 8 5 8 4 4 0 4 1 8 1 5 8 4 7 0 1 3 3 4 8 6 4 2 7 7 4 3

17 8 3 8 5 0 3 6 2 0 8 5 3 1 8 3 3 8 8 6 5 4 8 9 5 4 5 3 5 6 0

18 2 5 6 9 1 2 8 5 8 1 7 4 3 4 8 4 2 6 5 8 3 5 1 8 9 1 6 6 5 2

19 4 7 8 2 3 9 3 5 8 6 1 1 9 5 7 9 0 0 6 0 4 9 7 9 1 6 3 5 8 0

20 6 2 8 1 2 5 4 6 9 0 2 4 5 4 2 0 6 5 8 0 8 8 6 9 2 9 2 9 3 0

21 1 9 6 3 6 2 4 2 1 8 6 7 8 8 5 4 2 6 0 6 1 2 8 7 6 9 8 9 3 5

22 6 4 4 6 1 1 6 0 8 0 4 7 6 0 8 5 5 3 2 5 2 1 6 4 3 9 3 9 7 6

23 0 5 6 8 5 8 3 8 2 0 1 5 6 1 7 8 8 6 1 0 2 8 4 9 3 1 0 3 3 7

24 6 8 7 5 0 8 2 6 0 9 1 4 9 4 3 5 6 8 4 8 0 3 8 7 4 4 8 2 7 7

25 1 0 2 7 1 6 8 5 0 0 4 0 7 9 0 2 3 9 4 4 9 0 5 8 6 0 5 0 9 9

26 6 5 7 1 8 1 8 7 9 5 0 3 8 7 7 7 3 1 6 1 8 8 7 4 0 0 7 6 3 9

27 9 4 5 7 7 0 8 5 8 7 9 6 7 4 9 5 6 1 8 7 0 6 7 7 5 9 6 3 2 2

28 1 9 8 5 9 5 1 6 6 5 4 9 0 4 6 1 6 9 5 0 6 3 4 2 3 6 5 3 3 5

29 1 3 8 0 7 9 6 6 3 8 3 3 7 2 5 3 1 7 1 7 0 4 7 0 4 1 3 6 6 9

30 9 1 6 9 7 0 0 1 0 7 3 3 6 6 7 2 4 7 7 0 6 0 4 4 4 9 1 0 7 4

31 0 9 1 0 7 5 6 3 1 5 6 6 5 3 4 2 8 5 8 8 5 7 6 8 2 1 2 5 4 0

32 2 9 5 2 1 5 0 7 3 3 6 8 7 0 2 4 0 4 6 7 9 4 7 2 7 6 2 2 1 4

33 0 6 6 1 4 9 4 3 1 9 6 9 6 9 3 9 3 3 5 2 4 3 2 9 0 4 6 9 1 4

34 8 5 6 3 0 5 8 0 3 4 3 3 0 6 0 5 9 9 8 5 8 2 8 1 9 1 5 2 6 8

35 4 9 9 2 7 9 7 7 3 5 6 1 1 9 6 2 4 0 6 2 7 4 7 8 9 5 2 9 4 3

36 7 7 0 8 1 5 3 7 5 9 5 2 7 9 5 6 7 4 7 6 6 9 2 8 6 4 2 0 6 9

27 9 3 0 1 0 0 2 0 7 2 8 8 1 1 2 5 3 2 5 6 9 0 8 7 7 1 9 2 5 0

38 6 2 3 4 1 2 1 5 1 4 3 1 1 4 2 8 3 4 8 0 6 5 1 9 3 7 5 0 5 9

39 9 5 7 3 1 2 1 1 3 2 7 8 7 0 7 1 8 9 8 0 5 3 9 7 5 9 2 7 7 5

40 4 7 5 6 7 3 9 6 5 1 1 7 9 6 7 2 1 4 0 4 8 9 4 4 7 4 1 5 6 5

41 2 5 4 4 1 7 8 3 9 2 1 1 7 3 3 5 7 7 0 3 2 9 1 3 3 7 1 1 6 4

42 5 5 3 6 7 4 3 1 0 0 6 2 5 5 2 6 5 5 7 9 0 1 6 6 5 8 6 8 1 8

43 4 2 0 1 0 7 6 9 9 4 1 4 3 1 5 8 4 0 9 6 8 7 1 5 2 2 0 7 1 9

44 2 5 2 1 5 0 4 3 4 9 5 4 4 3 4 7 2 3 4 4 9 3 0 0 8 8 3 2 8 2

45 3 1 6 7 0 6 3 9 6 4 5 5 9 3 7 2 1 4 1 7 6 1 6 4 0 2 1 0 4 6

Taulukon luvut on generoitu satunnaislukuohjel-malla siten, että ne noudattavat likimain tasaistajakaumaa, eli numeroiden 0-9 esiintymistoden-näköisyys on sama. Taulukkoja käytettäessäaloituskohta tulisi valita satunnaisesti.

Page 148: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Taulukko A4:

Lukumäärien vertailu Poisson-jakauman tapauksessaa) Testiongelma: Sisältyykö todettu lukumäärä k Poisson-jakauman luotta-musväliin vai ei ?

k95%

luottamusväli99%

luottamusväli0 0.000 3.69 0.000 5.30

1 0.0253 5.57 0.005 7.43

2 0.242 7.22 0.103 9.27

3 0.619 8.77 9.338 10.98

4 1.09 10.24 0.672 12.59

5 1.62 11.67 1.08 14.15

6 2.20 13.06 1.54 15.66

7 2.81 14.42 2.04 17.13

8 3.45 15.76 2.57 18.58

9 4.12 17.08 3.13 20.00

10 4.80 18.39 3.72 21.40

11 5.49 19.68 4.32 22.78

12 6.20 20.96 4.94 24.14

13 6.92 22.23 5.58 25.50

14 7.65 23.49 6.23 26.84

15 8.40 24.74 6.89 28.16

16 9.15 25.98 7.57 29.48

17 9.90 27.22 8.25 30.79

18 10.67 28.45 8.94 32.09

19 11.44 29.67 9.64 33.38

20 12.22 30.89 10.35 34.67

k95%

luottamusväli99%

luottamusväli21 13.00 32.10 11.07 35.95

22 13.79 33.31 11.79 37.22

23 14.58 34.51 12.52 38.48

24 15.38 35.71 13.25 39.74

25 16.18 36.90 14.00 41.00

26 16.98 38.10 14.74 42.25

27 17.79 39.28 15.49 43.50

28 18.61 40.47 16.24 44.74

29 19.42 41.63 17.00 45.98

30 20.24 42.83 17.77 47.21

35 24.38 48.68 21.64 53.32

40 28.58 54.47 25.59 59.36

45 32.82 60.21 29.60 65.34

50 57.11 65.92 33.66 71.37

Taulukko A5:

Lukumäärien vertailu kahden Poisson-jakauman tapauksessab) Testiongelma: Poikkeavatko kahdesta eri otoksesta lasketut lukumäärätk1 ja k2 toisistaan? Taulukoissa on pienin lukumäärä, jolla tilastollisestimerkitsevä ero saadaan.

k1 + k2α =0.05

α =0.01

6 0 0

7 0 0

8 1 0

9 1 0

10 1 0

11 2 1

12 2 1

13 3 1

14 3 2

15 3 2

16 4 2

17 4 3

18 5 3

19 5 4

20 5 4

21 6 4

22 6 5

23 7 5

24 7 5

k1 + k2α =0.05

α =0.01

25 7 6

26 8 6

27 8 7

28 9 7

29 9 7

30 10 8

31 10 8

32 10 8

33 11 9

34 11 9

35 12 10

36 12 10

37 13 10

38 13 11

39 13 11

40 14 12

41 14 12

42 15 13

43 15 13

k1 + k2α =0.05

α =0.01

44 16 13

45 16 14

46 16 14

47 17 15

48 17 15

49 18 15

50 18 16

51 19 16

52 19 17

53 20 17

54 20 18

55 20 18

56 21 18

57 21 19

58 22 19

59 22 20

60 23 20

61 23 20

62 24 21

k1 + k2α =0.05

α =0.01

63 24 21

64 24 22

65 25 22

66 25 23

67 26 23

68 26 23

69 27 24

70 27 24

71 28 25

72 28 25

73 28 26

74 29 26

75 29 26

76 30 27

77 30 27

78 31 28

79 31 28

80 32 29

Esim. k1 = 4, k2 = 11. Rivi 15 sarake 1: luku = 3 < k1 ⇒ p > 0.05, joten lukumäärät eivät poikkea tilastollisesti merkitsevästi toisistaan

Esim. k1 = 1, k2 = 11. Rivi 12 sarake 2: luku =1 = k1 ⇒ p = 0.01, joten lukumäärät eroavat toisistaan riskitasolla 0.01

Page 149: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Taulukko A6:

Wilcoxonin parittainen testi

Taulukossa on annettu Wilcoxonin testisuureen T+ kriittiset arvot kak-sisuuntaisessa testissä. Oletetaan, että T+:ksi on valittu pienempi summistaT+ ja T-. Yleensä tilastopaketit tulostavat molemmat näistä summista, mut-ta jos ohjelma antaisikin vain suuremman summan, niin pienempi on hel-posti laskettavissa suuremman summan ja tehokkaan aineistokoon n’ funk-tiona; n’ = n - (nollaerotusten määrä). Olkoon T+ = min(T+, T-). Tällöin T- = (n’ * (n’ + 1) / 2) - T+.

n’Kaksisuuntainen

merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.0014 0 - - - - -

5 2 0 - - - -

6 3 - - - - -

7 5 3 2 0 - -

8 8 5 3 1 0 -

9 10 8 5 3 1 -

10 14 10 8 5 3 -

11 17 13 10 7 5 0

12 21 17 13 9 7 1

13 26 21 17 12 9 2

14 31 25 21 15 12 4

n’Kaksisuuntainen

merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.00115 36 30 25 19 15 6

16 42 35 29 23 19 9

17 48 41 34 28 23 11

18 55 47 40 32 27 14

19 62 53 46 37 32 18

20 69 60 52 43 37 21

21 77 67 58 49 42 26

22 86 75 66 55 48 30

23 95 83 73 62 54 35

24 104 91 81 69 61 40

25 114 100 89 76 68 45

Kun n’ > 25 voidaan käyttää normaalijakauman taulukoita laskemalla tes-tisuure:

z = |T+ − n’ ∗ (n’ + 1)⁄2| − 0.5

√n’ ∗ (n’ + 1) ∗ (2n’ + 1)⁄24

Esimerkki: n’= 16 ja T+ = 12. Riviltä 16 todetaan, että arvo 12 sijoittuu sa-rakkeiden 0.01 ja 0.001 väliin, eli testisuuretta vastaava P:n arvo on tällävälillä. Yllä olevalla kaavalla ja StaTable ohjelmalla saadaan P=0.0041.

Lähde: Altman DG. Practical Statistics for Medical Research. Chapmann& Hall. Table B9 (modifioitu)

Taulukko A7:

Mann-Whitneyn U-testin kriittiset arvotKaksisuuntainen merkitsevyystaso (α)

n1 n2Kaksisuuntainen merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.0024 4 13 15 16 - - -3 5 13 14 15 - - -4 5 16 18 19 20 - -5 5 20 21 23 24 25 -3 6 15 16 17 - - -4 6 19 21 22 23 24 -5 6 23 25 27 28 29 -6 6 27 29 31 33 34 -3 7 17 19 20 21 - -4 7 22 24 25 27 28 -5 7 27 29 30 32 34 -6 7 31 34 36 38 39 427 7 36 38 41 43 45 483 8 19 21 22 24 - -4 8 25 27 28 30 31 -5 8 30 32 34 36 38 406 8 35 38 40 42 44 477 8 40 43 46 49 50 548 8 45 49 51 55 57 602 9 16 17 18 - - -3 9 22 23 25 26 27 -4 9 27 30 32 33 35 -5 9 33 36 38 40 42 446 9 39 42 44 47 49 52

Page 150: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Taulukko A7 (jatkoa)

n1 n2Kaksisuuntainen merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.0027 9 45 48 51 54 56 608 9 50 54 57 61 63 679 9 56 60 64 67 70 742 10 17 19 20 - - -3 10 24 26 27 29 30 -4 10 30 33 35 37 38 405 10 37 39 42 44 46 496 10 43 46 49 52 54 577 10 49 53 56 59 61 658 10 56 60 63 67 69 749 10 62 66 70 74 77 82

10 10 68 73 77 81 84 902 11 19 21 223 11 26 28 30 32 33 -4 11 33 36 38 40 42 445 11 40 43 46 48 50 536 11 47 50 53 57 59 627 11 54 58 61 65 67 718 11 61 65 69 73 75 809 11 68 72 76 81 83 89

10 11 74 79 84 88 92 9811 11 81 87 91 96 100 1062 12 20 22 23 - - -3 12 28 31 32 34 35 -4 12 36 39 41 42 45 485 12 43 47 49 52 54 586 12 51 55 58 61 63 687 12 58 63 66 70 72 778 12 66 70 74 79 81 879 12 73 78 82 87 90 96

10 12 81 86 91 96 99 10611 12 88 94 99 104 108 11512 12 95 102 107 113 117 1242 13 22 24 25 26 - -3 13 30 33 35 37 38 -

n1 n2Kaksisuuntainen merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.0024 13 39 42 44 47 49 515 13 47 50 53 56 58 626 13 55 59 62 66 68 737 13 63 67 71 75 78 838 13 71 76 80 84 87 939 13 79 84 89 94 97 10310 13 87 93 97 103 106 11311 13 95 101 106 112 116 12312 13 103 109 115 121 125 13313 13 111 118 124 130 135 1432 14 24 25 27 28 - -3 14 32 35 37 40 41 -4 14 41 45 47 50 52 555 14 50 54 57 60 63 676 14 59 63 67 71 73 787 14 67 72 76 81 83 898 14 76 81 86 90 94 1009 14 85 90 95 100 104 11110 14 93 99 104 110 114 12111 14 102 108 114 120 124 13212 14 110 117 123 130 134 14313 14 119 126 132 139 144 15314 14 127 135 141 149 154 1642 15 25 27 29 30 - -3 15 35 38 40 42 43 -4 15 44 48 50 53 55 595 15 53 57 61 64 67 716 15 63 67 71 75 78 837 15 72 77 81 86 89 958 15 81 87 91 96 100 1069 15 90 96 101 107 111 11810 15 99 106 111 117 121 12911 15 108 115 121 28 132 14112 15 117 125 131 138 143 15213 15 127 134 141 148 153 16314 15 136 144 151 159 164 174

n1 n2Kaksisuuntainen merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.00215 15 145 153 161 169 174 1852 16 27 29 31 32 - -,3 16 37 40 42 45 46 -4 16 47 50 53 57 59 625 16 57 61 65 68 71 756 16 67 71 75 80 83 887 16 76 82 86 91 94 1018 16 86 92 97 102 106 1139 16 96 102 107 113 117 125

10 16 106 112 118 124 129 13711 16 115 122 129 135 140 14912 16 125 132 139 146 151 16113 16 134 143 149 157 163 17314 16 144 153 160 168 174 18515 16 154 163 170 179 185 19716 16 163 173 181 190 196 2082 17 28 31 32 34 - -3 17 39 42 45 47 49 514 17 50 53 57 60 62 665 17 60 65 68 72 75 806 17 71 76 80 84 87 937 17 81 86 91 96 100 1068 17 91 97 102 108 112 1199 17 101 108 114 120 124 132

10 17 112 119 125 132 136 14511 17 122 130 136 143 148 15812 17 132 140 147 155 160 17013 17 142 151 158 166 172 18314 17 153 161 169 178 184 19515 17 163 172 180 189 195 20816 17 173 183 191 201 207 22017 17 183 193 202 212 219 2322 18 30 32 34 36 - -3 18 41 45 47 50 52 544 18 52 56 60 63 66 695 18 63 69 72 76 79 84

Page 151: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Taulukko A7 (jatkoa)

n1 n2Kaksisuuntainen merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.0026 18 74 80 84 89 92 987 18 85 91 96 102 105 1128 18 96 103 108 114 118 1269 18 107 114 120 126 131 139

10 18 118 125 132 139 143 15311 18 129 137 143 151 156 16612 18 139 148 155 163 169 17913 18 150 159 167 175 181 19214 18 161 170 178 187 194 20615 18 172 182 190 200 206 21916 18 182 193 202 212 218 23217 18 193 204 213 224 231 24518 18 204 215 225 236 243 2582 19 31 34 36 37 38 -3 19 43 47 50 53 54 574 19 55 59 63 67 69 735 19 67 72 76 80 83 886 19 78 84 89 94 97 1037 19 90 96 101 107 111 1188 19 101 108 114 120 124 1329 19 113 120 126 133 138 146

10 19 124 132 138 146 151 16111 19 136 144 151 159 164 17512 19 147 156 163 172 177 18813 19 158 167 175 184 190 20214 19 169 179 188 197 203 21615 19 181 191 200 210 216 23016 19 192 203 212 222 230 24417 19 203 214 224 235 242 25718 19 214 226 236 248 255 27119 19 226 238 248 260 268 2842 20 33 36 38 39 40 -3 20 45 49 52 55 57 604 20 58 62 66 70 72 77

n1 n2Kaksisuuntainen merkitsevyystaso (α)

0.2 0.1 0.05 0.02 0.01 0.0025 20 70 75 80 84 87 936 20 82 88 93 98 102 1087 20 94 101 106 112 116 1248 20 106 113 119 126 130 1399 20 118 126 132 140 144 15410 20 130 138 145 153 158 16811 20 142 151 158 167 172 18312 20 154 163 171 180 186 19813 20 166 176 184 193 200 21214 20 178 188 197 207 213 22615 20 190 200 210 220 227 24116 20 201 213 222 233 241 25517 20 213 225 235 247 254 27018 20 225 237 248 260 268 28419 20 237 250 261 273 281 29820 20 249 262 273 286 295 312

Esim. jos n1 = 4, n2 = 11 ja U = 35. Tämä ylittääp = 0.20:a vastaavan arvon 33, muttei p = 0.10:avastaavaa arvoa 36, joten 0.10 < p < 0.20. Inter-poloimalla saataisiin likimain p=0.125. StatXact3 antaa tarkaksi yksisuuntaiseksi arvoksi 0.0542.Kertomalla tämä kahdella saataisiin 0.1084.

Kun n1 tai n2 ovat suurempia kuin 20, voidaankäyttää kaavaa: z = (U - m)/s, missä m = n1*n2/2ja s=(n1+n2+1)*m/6)0.5 ja katsoa z:aa vastaava p-arvo Normaalijakauman taulukoista.

Lähde: Rohlf FJ and Sokal RR. Statistical Tab-les. W.H.Freeman Company, New York, 1981Table 29 (modifioitu).

Taulukko A8:

Standardoidun Normaalijakauman prosenttipistei-tä (z) vastaavia kaksisuuntaisia p-arvoja

z p1.60 0.1096

1.61 0.1074

1.62 0.1052

1.63 0.1031

1.64 0.1010

1.645 0.1000

1.65 0.0989

1.66 0.0969

1.67 0.0949

1.68 0.0930

1.69 0.0910

1.70 0.0891

1.71 0.0873

1.72 0.0854

1.73 0.0836

1.74 0.0819

1.75 0.0801

1.76 0.0784

1.77 0.0767

1.78 0.0751

1.79 0.0735

1.80 0.0719

1.81 0.0703

1.82 0.0688

1.83 0.0672

1.84 0.0658

1.85 0.0643

z p1.86 0.0629

1.87 0.0615

1.88 0.0601

1.89 0.0588

1.90 0.0574

1.91 0.0561

1.92 0.0549

1.93 0.0536

1.94 0.0524

1.95 0.0512

1.96 0.0500

1.97 0.0488

1.98 0.0477

1.99 0.0466

2.00 0.0455

2.01 0.0444

2.02 0.0434

2.03 0.0424

2.04 0.0414

2.05 0.0404

2.06 0.0394

2.07 0.0385

2.08 0.0375

2.09 0.0366

2.10 0.0357

2.11 0.0349

2.12 0.0340

z p2.13 0.0332

2.14 0.0324

2.15 0.0316

2.16 0.0308

2.17 0.0300

2.18 0.0293

2.19 0.0285

2.20 0.0278

2.21 0.0271

2.22 0.0264

2.23 0.0257

2.24 0.0251

2.25 0.0244

2.26 0.0238

2.27 0.0232

2.28 0.0226

2.29 0.0220

2.30 0.0214

2.31 0.0209

2.32 0.0203

2.33 0.0198

2.34 0.0193

2.35 0.0188

2.36 0.0183

2.37 0.0178

2.38 0.0173

2.39 0.0168

Page 152: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

z p2.40 0.0164

2.41 0.0160

2.42 0.0155

2.43 0.0151

2.44 0.0147

2.45 0.0143

2.46 0.0139

2.47 0.0135

2.48 0.0131

2.49 0.0128

2.50 0.0124

2.51 0.0121

2.52 0.0117

2.53 0.0114

2.54 0.0111

2.55 0.0108

2.56 0.0105

2.57 0.0102

2.58 0.0099

2.59 0.0096

2.60 0.0093

2.61 0.0091

2.62 0.0088

2.63 0.0085

2.64 0.0083

2.65 0.0080

2.66 0.0078

2.67 0.0076

2.68 0.0074

z p2.69 0.0071

2.70 0.0068

2.71 0.0067

2.72 0.0065

2.73 0.0063

2.74 0.0061

2.75 0.0060

2.76 0.0058

2.77 0.0056

2.78 0.0054

2.79 0.0053

2.80 0.0051

2.81 0.0050

2.82 0.0048

2.83 0.0047

2.84 0.0045

2.85 0.0044

2.86 0.0042

2.87 0.0041

2.88 0.0040

2.89 0.0039

2.90 0.0037

2.91 0.0036

2.92 0.0035

2.93 0.0034

2.94 0.0033

2.95 0.0032

2.96 0.0031

2.97 0.0030

Taulukko A8 (jatkoa)z p

2.98 0.0029

2.99 0.0028

3.00 0.0027

3.01 0.0026

3.02 0.0025

3.03 0.0025

3.04 0.0024

3.05 0.0023

3.06 0.0022

3.07 0.0021

3.09 0.0020

3.11 0.0019

3.12 0.0018

3.14 0.0016

3.16 0.0016

3.18 0.0015

3.20 0.0014

3.22 0.0013

3.24 0.0012

3.26 0.0011

3.29 0.0010

3.32 0.0009

3.35 0.0008

3.39 0.0007

3.43 0.0006

3.48 0.0005

3.54 0.0004

3.61 0.0003

3.72 0.0002

3.90 0.0001

Taulukko A9:

Pearsonin korrelaatiokertoimen (rxy)merkitsevyysrajat (kriittiset arvot) erivapausastemäärillä (df) testattaessa hypoteesia: perusjoukon korrelaatio-kerroin = 0. Negatiivisilla korrelaatio-kertoimilla etumerkki jätetään huomi-oimatta.

df = n-2, missä n on havaintoparien (x, y) lukumäärä. Taulukoita voidaankäyttää myös osittaiskorrelaatioiden(rxy.z) testaamiseen, tällöin df = n - 3, n - 4, ja niin edelleen.

vapaus-asteet(df)

kaksisuuntainen merkitsevyystaso (α)

0.010 0.05 0.02 0.01 0.001

1 0.9877 0.9969 0.9995 0.9999 1.0000

2 0.9000 0.9500 0.9800 0.9900 0.9990

3 0.8054 0.8734 0.9343 0.9587 0.9911

4 0.7293 0.8114 0.8822 0.9172 0.9741

5 0.6694 0.7545 0.8329 0.8745 0.9509

6 0.6215 0.7067 0.7887 0.8343 0.9249

7 0.5822 0.6664 0.7498 0.7977 0.8983

8 0.5494 0.6319 0.7155 0.7646 0.8721

9 0.5214 0.6012 0.6851 0.7348 0.8471

10 0.4973 0.5760 0.6581 0.7079 0.8233

11 0.4762 0.5529 0.6339 0.6835 0.8010

12 0.4575 0.5324 0.6120 0.6614 0.7800

13 0.4409 0.5140 0.5923 0.6411 0.7604

14 0.4259 0.4973 0.5742 0.6226 0.7419

15 0.4124 0.4822 0.5577 0.6055 0.7247

16 0.4000 0.4683 0.5426 0.5897 0.7084

17 0.3887 0.4555 0.5285 0.5751 0.6932

18 0.3783 0.4438 0.5155 0.5614 0.6788

19 0.3687 0.4329 0.5034 0.5487 0.6652

20 0.3598 0.4227 0.4921 0.5368 0.6524

21 0.3515 0.4132 0.4815 0.5256 0.6402

22 0.3438 0.4044 0.4716 0.5151 0.6287

23 0.3365 0.3961 0.4622 0.5052 0.6178

24 0.3297 0.3882 0.4534 0.4958 0.6074

25 0.3233 0.3809 0.4451 0.4869 0.5974

26 0.3172 0.3739 0.4372 0.4785 0.5880

27 0.3115 0.3673 0.4297 0.4705 0.5790

28 0.3061 0.3610 0.4226 0.4629 0.5703

Page 153: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

vapaus-asteet(df)

kaksisuuntainen merkitsevyystaso (α)

0.010 0.05 0.02 0.01 0.001

29 0.3009 0.3550 0.4158 0.4556 0.5620

30 0.2920 0.3494 0.4093 0.4487 0.5541

31 0.2913 0.3440 0.4032 0.4421 0.5465

32 0.2869 0.3388 0.3973 0.4357 0.5392

33 0.2826 0.3328 0.3916 0.4296 0.5322

34 0.2785 0.3291 0.3862 0.4238 0.5255

35 0.2746 0.3246 0.3810 0.4182 0.5189

36 0.2709 0.3202 0.3759 0.4128 0.5126

37 0.2673 0.3160 0.3712 0.4076 0.5066

38 0.2638 0.3120 0.3665 0.4026 0.5007

39 0.2605 0.3081 0.3621 0.3978 0.4950

40 0.2573 0.3044 0.3578 0.3932 0.4896

41 0.2542 0.3008 0.3536 0.3887 0.4843

42 0.2512 0.2973 0.3496 0.3843 0.4792

43 0.2483 0.2940 0.3457 0.3801 0.4742

44 0.2455 0.2907 0.3420 0.3761 0.4694

45 0.2429 0.2876 0.3384 0.3721 0.4647

46 0.2405 0.2845 0.3348 0.3683 0.4602

47 0.2377 0.2816 0.3314 0.3646 0.4557

48 0.2353 0.2787 0.3281 0.3610 0.4515

50 0.2306 0.2732 0.3218 0.3542 0.4432

52 0.2262 0.2681 0.3158 0.3477 0.4354

54 0.2221 0.2632 0.3102 0.3415 0.4280

56 0.2181 0.2586 0.3048 0.3357 0.4210

vapaus-asteet(df)

kaksisuuntainen merkitsevyystaso (α)

0.010 0.05 0.02 0.01 0.001

58 0.2144 0.2542 0.2997 0.3301 0.4143

60 0.2108 0.2500 0.2948 0.3248 0.4079

65 0.2027 0.2405 0.2837 0.3127 0.3931

68 0.1982 0.2352 0.2776 0.3060 0.3850

70 0.1954 0.2319 0.2737 0.3017 0.3798

75 0.1889 0.2242 0.2647 0.2919 0.3678

78 0.1852 0.2199 0.2597 0.2864 0.3611

80 0.1829 0.2172 0.2565 0.2830 0.3568

85 0.1775 0.2108 0.2491 0.2748 0.3468

88 0.1745 0.2072 0.2449 0.2702 0.3412

90 0.1726 0.2050 0.2422 0.2673 0.3375

95 0.1680 0.1996 0.2359 0.2604 0.3291

98 0.1654 0.1966 0.2324 0.2565 0.3242

100 0.1638 0.1946 0.2301 0.2540 0.3211

105 0.1599 0.1900 0.2247 0.2480 0.3130

108 0.1576 0.1874 0.2216 0.2446 0.3095

110 0.1562 0.1857 0.2196 0.2425 0.3069

115 0.1528 0.1816 0.2149 0.2372 0.3004

118 0.1509 0.1793 0.2122 0.2343 0.2967

120 0.1496 0.1779 0.2104 0.2324 0.2943

128 0.1449 0.1723 0.2039 0.2252 0.2853

130 0.1438 0.1710 0.2023 0.2235 0.2833

138 0.1396 0.1660 0.1965 0.2170 0.2752

140 0.1386 0.1648 0.1951 0.2155 0.2733

vapaus-asteet(df)

kaksisuuntainen merkitsevyystaso (α)

0.010 0.05 0.02 0.01 0.001

150 0.1339 0.1593 0.1886 0.2083 0.2643

160 0.1297 0.1543 0.1821 0.2019 0.2562

170 0.1240 0.1476 0.1748 0.1932 0.2454

180 0.1223 0.1455 0.1705 0.1905 0.2420

190 0.1191 0.1417 0.1660 0.1855 0.2357

200 0.1161 0.1381 0.1636 0.1809 0.2299

225 0.1095 0.1296 0.1543 0.1707 0.2170

250 0.1039 0.1236 0.1465 0.1620 0.2061

300 0.0948 0.1129 0.1338 0.1480 0.1884

350 0.0878 0.1046 0.1240 0.1371 0.1747

400 0.0822 0.0978 0.1160 0.1283 0.1635

450 0.0775 0.0922 0.1094 0.1210 0.1543

500 0.0735 0.0875 0.1038 0.1149 0.1464

1000 0.0520 0.0619 0.0735 0.0813 0.1038

2000 0.0368 0.0458 0.0520 0.0576 0.0735

5000 0.0233 0.0277 0.0329 0.0364 0.0465

Esim. Oletetaan, että n = 50 ja rxy = 0.3550. Taulukosta riviltä df = 48 todetaan, että arvo sijoittuu merkitsevyystasojen 0.02 ja 0.01 arvojen väliin, joten 0.01 < p < 0.02

Taulukko A9 (jatkoa)

Page 154: Ventura - peruskur · Normanin ja Steinerin ’Biostatistics, The Bare Essentials’ on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan

Taulukko A10:

Spearmanin järjestysiokertoimen (rs) merkitsevyysrajat kaksisuuntaisessatestissä. Negatiivisten korrelaatiokerrointen etumerkkiä ei huomioida. Kunn > 30 voidaan käyttää Pearsonin korrelaatiokertoimien taulukoita.

aineistokoko kaksisuuntainen merkitsevyystaso (α)

n 0.1 0.05 0.02 0.01 0.002

5 0.8000 0.9000 - - -

6 0.7714 0.8286 0.8857 0.9429 -

7 0.6786 0.7450 0.8571 0.8929 0.9643

8 0.6190 0.7143 0.8095 0.8571 0.9286

9 0.5833 0.6833 0.7667 0.8167 0.9000

10 0.5515 0.6364 0.7333 0.7818 0.8667

11 0.5273 0.6091 0.7000 0.7455 0.8364

12 0.4965 0.5804 0.6713 0.7273 0.8182

13 0.4780 0.5549 0.6429 0.6978 0.7912

14 0.4503 0.5341 0.6220 0.6747 0.7670

15 0.4429 0.5179 0.6000 0.6536 0.7464

16 0.4265 0.5000 0.5824 0.6324 0.7265

17 0.4118 0.4853 0.5637 0.6152 0.7083

18 0.3994 0.4716 0.5480 0.5975 0.6904

19 0.3895 0.4579 0.5333 0.5825 0.6737

20 0.3789 0.4451 0.5203 0.5684 0.6586

21 0.3688 0.4351 0.5078 0.5545 0.6455

22 0.3597 0.4241 0.4963 0.5426 0.6318

23 0.3518 0.4150 0.4852 0.5306 0.6186

24 0.3435 0.4061 0.4786 0.5200 0.6070

25 0.3362 0.3977 0.4654 0.5100 0.5962

26 0.3299 0.3894 0.4564 0.5002 0.5856

27 0.3236 0.3822 0.4481 0.4915 0.5757

28 0.3175 0.3749 0.4401 0.4828 0.5660

29 0.3113 0.3685 0.4320 0.4744 0.5567

30 0.3059 0.3620 0.4251 0.4665 0.5479

Lähde: Glasser, GJ andWinter RF. Critical Va-lues of the Coefficientof Rank Correlation forTesting the Hypothesisof Indepence. Biometri-ka 48:444-448, 1961.

Huom. Taulukon lukui-hin sisältyy korjausteki-jä (Conover WJ. Practi-cal Nonparametric Sta-tistics. John Wiley andSons, 1971), mikä selit-tää poikkeaman Siege-lin kirjassa esitettyihinkriittisiin arvoihin.