ku 05 08 2009

63
Open problems in association mapping Thomas Mailund !" !!"#$% $’()*"%(+, Bioinformatics Research Centre

Upload: mailund

Post on 30-Jun-2015

437 views

Category:

Travel


1 download

TRANSCRIPT

Page 1: Ku 05 08 2009

Open problems in association mapping

Thomas Mailund

!"!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&&

&

Bioinformatics Research Centre

Page 2: Ku 05 08 2009

Open problems in association mapping

Thomas Mailund

!"!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&&

&

Bioinformatics Research Centre

Stuff about

Page 3: Ku 05 08 2009

Overview

• Tutorial

• Multi-marker methods - rare(er) variants

• Multi-loci methods - epistasis

Page 4: Ku 05 08 2009

Tutorial

Page 5: Ku 05 08 2009

“Genetic” diseases

Gunshot w

oundsC

ar accidents

Smoking induced

lung cancer

Cardiovascular

diseaseO

besityD

iabetes 2

Alzheim

erSchizophrenia

BRC

A1

breast cancer

Cystic fibrosis

Haem

ophilia

Page 6: Ku 05 08 2009

Disease mapping...

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Locate disease-affecting polymorphisms

Cases (affected)

Controls (unaffected)

Page 7: Ku 05 08 2009

Disease mapping...

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Locate phenotype-affecting polymorphisms

Page 8: Ku 05 08 2009

Disease mapping...

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Markers are locally correlated

Page 9: Ku 05 08 2009

Marker RelatednessLinkage disequilibrium (LD)

Recombination rate

LD (

r2 )

Empirical Results Theoretical Results

Clark et al. 2003, AJHG 73:285-300. Hein et al. 2005

Page 10: Ku 05 08 2009

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Search for indirect signals

Disease mapping...

Page 11: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

“Tag” markers Unobserved marker

Page 12: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 13: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 14: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 15: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 16: Ku 05 08 2009

GWA

Type 500k - 1m and get 3b

Page 17: Ku 05 08 2009

GWA

Type 500k - 1m and get 3bThe common

variants

Page 18: Ku 05 08 2009

Multiple test issues

5% significance threshold means 5% false positives...

Page 19: Ku 05 08 2009
Page 20: Ku 05 08 2009

Null distributionAlternative distribution

Page 21: Ku 05 08 2009

Null distributionAlternative distribution

Page 22: Ku 05 08 2009

Null distributionAlternative distribution

Page 23: Ku 05 08 2009

Null distribution"Real" null distributionAlternative distribution

Page 24: Ku 05 08 2009

WTCCC results

Page 25: Ku 05 08 2009

GWA a successful approach

~500 validated findings for ~100 different traits

Page 26: Ku 05 08 2009

GWA a successful approach

~500 validated findings for ~100 different traits...but much genetic risk remains unexplained!

Page 27: Ku 05 08 2009

Why?

Page 28: Ku 05 08 2009

Why?

• Rare variants?

• We only tag common variants...

• Gene-gene interaction?

• Marginal effects vs interactions...

Page 29: Ku 05 08 2009

Multi-marker methods

Page 30: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 31: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 32: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 33: Ku 05 08 2009

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 34: Ku 05 08 2009

IndirectMulti-Marker

Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Page 35: Ku 05 08 2009

Local trees along the genome

Page 36: Ku 05 08 2009

Local trees along the genome

Page 37: Ku 05 08 2009

Local trees along the genome

Page 38: Ku 05 08 2009

Local trees along the genome

Page 39: Ku 05 08 2009

Trees and LD

Recombination rate

Tree

sim

ilari

ty

Recombination rate

LD r

2

Page 40: Ku 05 08 2009

Clustering on a tree

Disease affecting mutation

Page 41: Ku 05 08 2009

Clustering on a tree

Complete penetrance

Incomplete penetrance

Spurious disease

Page 42: Ku 05 08 2009

Clustering on a tree

60%

40%

25%

75%

Case/control clusteringis not random on the tree...

Page 43: Ku 05 08 2009

Scoring the clustering

Red=casesGreen=controls

Are the case chromosomes significantly over-represented in some clusters?

Page 44: Ku 05 08 2009
Page 45: Ku 05 08 2009
Page 46: Ku 05 08 2009
Page 47: Ku 05 08 2009

Besenbacher et al. 2009

Page 48: Ku 05 08 2009

Multi-loci methods

Page 49: Ku 05 08 2009

AAAGG

AAAGG

A 3 2

G 3 2

0

1.5

3

A G

Page 50: Ku 05 08 2009

T 2 3

A 2 3

0

1.5

3

T A

TTAAA

AAATT

Page 51: Ku 05 08 2009

AAAGG

AAAGG

TTAAA

AAATT

AT 2 0

AA 1 1

GA 2 0

GT 0 2

0

1

2

AT AA GA GT

Page 52: Ku 05 08 2009

Explosion in complexity

500k markers gives us ~125 billion pairs!

Page 53: Ku 05 08 2009

Explosion in complexity

500k markers gives us ~2·1016 triplets

Page 54: Ku 05 08 2009
Page 55: Ku 05 08 2009
Page 56: Ku 05 08 2009
Page 57: Ku 05 08 2009
Page 58: Ku 05 08 2009
Page 59: Ku 05 08 2009

• Using protein interaction networks we

• Reduced ~125 billion tests to ~3-4 million

• Reduced corrected significance threshold from ~4·10-13 to ~9·10-8

Page 60: Ku 05 08 2009
Page 61: Ku 05 08 2009
Page 62: Ku 05 08 2009

Perspectives...

• Complete genome sequencing

• No need for tagging

• Rare variants

• Structural variation

• Pathway analysis

• Analysis of pathways as a whole

• Constructing tests from known pathways

Page 63: Ku 05 08 2009