grundläggande biostatistik

34
Grundläggande Biostatistik Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Upload: trinh

Post on 12-Jan-2016

76 views

Category:

Documents


0 download

DESCRIPTION

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet. Modellbaserad analys Regression Logistisk regression Överlevnadsanalys. Konfidensintervall P-värden (enkla tester). Formell analys. Hitta misstag Hantera extremvärden Bortfall. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Grundläggande Biostatistik

Grundläggande Biostatistik

Joacim Rocklöv, LektorEpidemiologi och global hälsaUmeå Universitet

Page 2: Grundläggande Biostatistik

Formellanalys

Informell data analys

Design och mätningHur samlas data in?

Mätskalorreliabilitetvaliditet

Lär känna data, tabeller, mått, grafer

Hitta misstag Hantera extremvärden Bortfall

KonfidensintervallP-värden (enkla tester)

Modellbaserad analysRegressionLogistisk regressionÖverlevnadsanalys

Page 3: Grundläggande Biostatistik

Syften..

•Skatta prevalens och risker för insjuknande av sjukdom

•Jämföra utfall av behandling tex läkemedel/rehabiliteringsmetoder

•Kartlägga riskfaktorer, dvs faktorer som ökar risken för sjukdom

•Följa förlopp – tillväxtkurvor, etc…

Page 4: Grundläggande Biostatistik

Strategi vid kliniska prövningar

- Sample size beräkningar

-Datainsamling

-Beskrivande statistik

-Statistisk analys

-Inferens

- Presentation/publikation

Page 5: Grundläggande Biostatistik

Mätning

Variabel

Kvantitativ Kategorisk

Diskret Kontinuerlig Ordnad Ej ordnad

Page 6: Grundläggande Biostatistik

• Utfallsvariabler – primära/sekundära

• Behandlingsvariabler/riskfaktorer – variabler som påverkar utfallet

• Bakgrundsvariabler – demografiska variabler

• Förväxlingsvariabler – confounders/inflytelserika men ej intressanta variabler för frågeställningen

Grupper av variabler

Page 7: Grundläggande Biostatistik

Datanivåer(typer av variabler)

Kvalitativa variabler = kategorivariabler

Kvantitativa variabler = numeriska variabler

Nominala variabler

Utfallen är kategorier som inte kan rangordnas

Ordinala variabler

Utfallen är ordnade kategorier

Intervall- variabler

Kan beräkna differenser men inte kvoter

Kvot- variabler

Kan beräkna differenser och kvoter

Blodtyp KönYrkeRökning (ja/nej)

VAS-skalanBetyg Självskattad hälsa, smärta Rökning (nej, lite, mycket)

Temperatur Mätt i C° F°

K°LängdVikt, ålderRökning (antal cigaretter per dag)

 

Page 8: Grundläggande Biostatistik

Variabel Kategorier Typ av variabel

Datanivå

ID

Kön Man/Kvinna Kat Nominal Binär

Blodgrupp O, A, B, AB Kat Nominal

VIKT Mätt i kg Kvant Kontinuerlig

Rökare Nej, Ja Kat Nominal Binär

Smärta Obetydlig, Måttlig,Svår, Outhärdlig

Kat Ordinal

Vårddagar Antal vårdagar Kvant Diskret

Page 9: Grundläggande Biostatistik

Orsak verkan samband?

x y

x y

x påverkar y

x är associerad med y

Page 10: Grundläggande Biostatistik

Studiedesign

Experiment

Klinisk prövning

Observationsstudie

Tvärsnitts-undersökning

Longitudinellundersökning

Kohortstudie Fall-kontrollstudie

Page 11: Grundläggande Biostatistik

Randomiserad kontrollerad studie

Patienter

Behandling

Kontroll/Placebo

Randomisering

Utfall

Utfall

Fler armar kan förekomma

Page 12: Grundläggande Biostatistik

Kohort studie

Population

Exponerade

Ej exponerade

Utfall

Utfall

Page 13: Grundläggande Biostatistik

Fall kontroll studie

Fall

Kontroller

Exponerade

Ej exponerade

Page 14: Grundläggande Biostatistik

Tvärsnitts-studie

Population Urval

Mätningar

Page 15: Grundläggande Biostatistik

Analys och inferens

Sant medelvärde

Population Urval

Urvalsmetod

Inferens

Skattning avsant medelvärde

Page 16: Grundläggande Biostatistik

Inferens 2: Hypotesprövning

Skiljer sig män och kvinnor åt vad avser kroppstemperatur?

P-värde = 0.024 Slutsats: ?

Report

temp_c

sex Mean N Std. DeviationMan 36,7248 65 ,38820

Kvinna 36,8855 65 ,41305

Total 36,8051 130 ,40732

Page 17: Grundläggande Biostatistik

Statistisk inferens

de metoder som används för att utifrån ett stickprov dra slutsatser om en hel

population.

Page 18: Grundläggande Biostatistik

Hypotesprövning

Vid prövning av behandlingsmetod på två grupper:H0: ingen skillnad mellan grupperHA: skillnad mellan grupper När väljer vi nollhypotesen och när förkastar vi den till fördel för den alternativa hypotesen?

Page 19: Grundläggande Biostatistik

Konfidensintervall

•Skattningar är osäkra på grund av att vi studerar en del av populationen.•Skattningar kan ges med FELMARGINAL.•Det kallas KONFIDENSINTERVALL.•Konfidensintervallet anges med grad av osäkerhet som kallas konfidensnivå (95%, 99%, etc)

Page 20: Grundläggande Biostatistik

Konfidensintervall

intervall som inkluderar det sanna medelvärdet nästan säkert (95%).

Kroppstemperatur

Konfidensintervallet blir 36.73 – 36.88

Detta intervall inkluderar populationens medelvärde nästan säkert (med 95% konfidens)

Page 21: Grundläggande Biostatistik

P-värde

p-värde = sannolikheten för det erhållna utfallet eller extremare under förutsättning att nollhypotesen är sann.

• Om denna sannolikhet är liten tror vi att nollhypotesen är falsk. Vi förkastar nollhypotesen.

• Om denna sannolikhet är stor kan vi inte förkasta nollhypotesen.

Page 22: Grundläggande Biostatistik

Praxis för bedömning av p-värden

p > 0.05 ingen skillnad (ej signifikant)

0.05>p>0.01 skillnad (signifikant *)

0.01>p>0.001 skillnad (signifikant **)

0.001>p skillnad (signifikant ***)

Page 23: Grundläggande Biostatistik

Typ I och II fel

Null Hypothesis is true (H0)

Alternative Hypothesis is true (HA)

Reject Null Hypothesis-Negative

Right decision Type 2 error (β)

Reject Null Hypothesis-Positive

Type 1 error (α) Right decision

H0: grupp1=grupp2

HA: grupp1≠grupp2

Type 1 error is referred to as false positiveType 2 error is referred to as false negative

Page 24: Grundläggande Biostatistik

Begreppet power – studiens styrka• Sannolikheten att kunna påvisa en skillnad mellangrupper (tex behandlingsgrupper) om den finns där

• Utgör en komponent vid bestämning av studiens storlek

• Andra komponenter är:• Den minsta skillnad vi vill kunna påvisa• Risk för ett falskt positivt fynd (alfa-fel)• Storleken av spridningen i utfallet• Val av metod

Page 25: Grundläggande Biostatistik

Presentation av data

Bild

Mått

Tabell

Val styrs av variabeltyp

Page 26: Grundläggande Biostatistik

Lägesmått

Medelvärde

Median ”Mittersta värdet”

n

xx

n

ii

1 36.8 gr C

36.8 gr C

Page 27: Grundläggande Biostatistik

Variationsmått

Standardavvikelse

Kvartilavstånd (IQR)

Variationsvidd (Range)

1

)(1

2

n

xxs

n

ii s = 4.13 år

q1 = 36.56, q3 = 37.06 IQR= 0.5 grC

max =38.22, min = 35.72 VV = 2.5

Page 28: Grundläggande Biostatistik

Grafisk beskrivning: Histogram

-3 -2 -1 -0 1 2 3 4

X

0.0

0.1

0.2

0.3

0.4

Y

Referens

Page 29: Grundläggande Biostatistik

Weight of child at birth (g)

4900.0

4700.0

4500.0

4300.0

4100.0

3900.0

3700.0

3500.0

3300.0

3100.0

2900.0

2700.0

40

30

20

10

0

Std. Dev = 458.39

Mean = 3793.7

N = 284.00

Page 30: Grundläggande Biostatistik

År styrka i höger och vänster hand associerade?

Grafisk bild av samband (scatter plot)

Page 31: Grundläggande Biostatistik

Grafisk beskrivning: Boxplot

Page 32: Grundläggande Biostatistik

Tabellpresentation

Page 33: Grundläggande Biostatistik

Jämförelse mellan grupper

Page 34: Grundläggande Biostatistik