simulating sequence evolution under domain constraints · zf-ubp lacbi sgf11 sus1 fact fact fact...
TRANSCRIPT
-
40 60 80 100 120
40
60
80
mm
Simulating sequence evolution under domainconstraints
Tina Koestler
CIBIV
February 3, 2011
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 1 / 12
-
40 60 80 100 120
40
60
80
mm
Protein domain - an evolutionary conserved region
UCH
ZnF_UBP
zf-UBPYEAST
FUNGI
METAZOA
PLANTS
PROTISTS
UCH
ZnF_UBPzf-UBP
HOMSA
UCHZnF_UBP
zf-UBP
ARATH
UCH
DICDI
UCH
ZnF_UBP
zf-UBP
DICDI
best BLAST hit
best FACT hit
UCH
BATDE
D. discoideum
UCHZnF_UBP
zf-UBP
LACBI
Sgf11 Sus1
FACT
FACT FACT
FACT
? FACT
FACT FACT
? FACT
Sgf73 Sac3 Thp1 Sus1 Cdc31
FACT
FACT FACT
FACT
FACT FACT FACT
FACT FACT FACT
FACT FACT
Sem1
Ubp8SAGA TREX2
UCH
TRYBR
UCH
ZnF_UBP
zf-UBP
TRYBR
best BLAST hit
best FACT hit
*BM Basidiomycota**CM Chytridiomycota
BM*
CM**
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 2 / 12
-
40 60 80 100 120
40
60
80
mm
Simulating protein sequence evolution without constraints
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 3 / 12
-
40 60 80 100 120
40
60
80
mm
Simulating protein sequence evolution without constraints
0.3
G
E
A
F
B
D
C
2
0.1
0.5
0.1
1
0.1
0.1
0.5
0.2
0.1
0.2
0.1
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 3 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
-
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
M4 M5 M6
S G D
qii = −�
j �=irijπj
qi = −qii
qS qG qDACDE..
ACDE..
ACDE..
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 5 / 12
-
40 60 80 100 120
40
60
80
mm
Simulation workflow
phylogenetic tree
S1 S2S3
S4
root sequence
HMMscan
Pfam
simulation program
S1
S2
S3
S4
>S1CCGCCIAC-MACPVVAIDFSRLANSLLGL---AIV>S2CCSCCVACVMACPVVGLLFSRLANSLLGL---LIV>S3AC-TCVAC---C-VVFSRFSRLA-SLLGLNIILII>S4ACDTCVAC--AC-VVILVFSRLA-SLLGLNIILIV
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 6 / 12
-
40 60 80 100 120
40
60
80
mm
ABC tran
ABC_tran
insertion position
Fre
quen
cy
0 20 40 60 80 100 120
020
0040
0060
0080
0010
000
84
64
36
2252
47
●●●●●
●
●●●●
●●●
●
●●
●●
●
●
●
●●
●●
●
●●
●
●●
●●●●●
●
●
●●●●●
●●
●●
●
●●●
●
●●●
●
●●
●
●●●●●●
●●●●
●
●●
●
●●
●●●
●
●●●●●●●●
●
●●
●●●●●●
●●●
●●●●
●●
●
●●
●
●●●
0 20 40 60 80 100 120
05
1015
2025
3035
mean insertion length per position at different branch lengths
position
leng
th
●
●●●●●●
●●●●
●
●
●●
●●●●
●
●●
●
●●●
●●●●
●●●●●●●
●●●
●●
●
●
●●●●●●
●
●
●●●
●●●●
●
●●●
●
●●●●
●
●●●●●●●●
●●●●●
●
●
●●●●●●●●●●
●●●●●●
●●●
●
●●
●
●
●
●●
●
●
●●●●●●
●●
●●●
●●●●
●
●
●
●●
●
●
●●
●●
●
●●
●
●●
●●●●●●
●●●
●
●
●●●
●●●●●
●●●
●
●
●
●●●
●●●●●●●
●
●
●●●●●
●●●
●
●
●●
●
●●●●●
●
●
●●●●●●●
●●●
●●●
●●
●
●●●●●●●
●
●
●●●
●●●●●●●
●●●●●
●●●●●●
●●
●
●●●●
●●●
●
●●●●●
●●
●
●
●●●●
●●●
●
●
●●●●
●●●
●●●●
●
●●●
●●●
●
●●●●
●
●●●
●●●●
●●●●
●●●●●
●●
●
●
●●●●
●
●●
●●
●●●
●●●●
●●●●●
●●●●
●●●●●●●
●
●●●●●
●●●●●
●
●●●
●
●
●●
●●●●
●
●
●●●●
●●●●●●●●●●
●
●●●●●●●●●●●
●
●●
●
●●
●●
●●●●●●●
●
●●●●●●
●●●●
●
●●●
●●●●●
●
●●●●●●●●●●
●●●●●●●
●●●
●●●●
●
●●●●●
●
●●●
●
●
●
●
●
●
0.10.51.01.52.05.0
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 7 / 12
-
40 60 80 100 120
40
60
80
mm
Evolving 22,000 human proteins
●
●
●
●
●
0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
branch length
reco
vere
d do
mai
ns [%
]● ●
●
●●
●
●
no InDelsno InDels + FInDel rate=0.05InDel rate=0.05 + FInDel rate=0.1InDel rate=0.1 + F
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 8 / 12
-
40 60 80 100 120
40
60
80
mm
Generate your own protein family
( ( ( (C : 0 . 2 ,B : 0 . 1 ) : 0 . 1 ,A : 0 . 1 ) : 0 . 1 ,G : 2 . 0 ) : 0 . 1 , ( ( F : 1 , E : 0 . 5 ) : 0 . 1 ,D : 0 . 5 ) : 0 . 2 ) ;
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 9 / 12
-
40 60 80 100 120
40
60
80
mm
Generate your own protein family
0.3
G
E
A
F
B
D
C
2
0.1
0.5
0.1
1
0.1
0.1
0.5
0.2
0.1
0.2
0.1
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
1111111
34343433283930
DK L L G- I A - - - - - - - A F D- - - V R I A V Y DP GQ C L A K K C TQ A EM E I QDN L L G- L A - - - - - - - T Y D- - - V R I A V Y NP SQ C L P K K C T E A EM E I QDN L L G- L A - - - - - - - T Y D- - - V R I A V Y DP GQ C L P K A C T E A EMK I QDT L L G- W I - - - - - - - A Y - - - - V R I A V I DP GR C L P K K C T A S E L K I LDK - - G- L - - - - - - - - - - - - - - I R V F V V NAGQ C L P K K C S V A K L K I H- E L NK Y V D FQ S GP R V GT - - - - V K V Y V V S E GQ C L A K R C T V - K L I F TDR L - - - V K - - - - - - - DC S S P - L K L A V L R A GR C L A K K C TQ - - - - I Q
35353534294031
66625760566665
C P V E L GT L - - - - - - - - - V K I K ND- C E E I V N EMV D- C - - V L C P D S DC P V - - D- - - - - - - - - - - V R I GND- C E E N S D EMV D- C - - V A C P DP DC P V - - DA L - - - - - - - - - V K I K ND- C E - - - - - M I E - C - - I L - - NP DC P V - - - - - - - - A E - - A V - - V P DD- C I E I A N LMA E - C - - L A - - D S EC P L R L - - - - - - E D- - - - V K V GD E - CM EM- Q SMQD- A - - I A - - D E EC P V - - - - - - - - A T S E - - MK I P A D- C - E V - N S V V D- C - - T A - - DNDC P AD L A H F E S N- - - - - - I R T GR N- C K V P A DR NP D- C V C I S - - D E E
67635861576766
938282888710780
R C V V C - - - GA CQ A R C P A NAM- - - K - L Y T G- AMNV - - - - - - - F - - -R C V V C - - - E A CQ A R C P A E A I - - - K - L Y - - - - - - - - - - - - - - - - - -R C I V C - - - E A CQ A R C P A NA I - - - K - L L T G- - - NA - - - - - - - F - - -K C V F C - - - GA CQ A Y C P Q DV V - - - Q - V Y T Y S K L NG- - - - - - - F - - -K C I F C DAG S E C V E A C P L GA V - - - T - E Y K G F A L DA - - - - - - - F - - -Q C V F C - - - C A C I R R CDQ NA I K GNT - V Y GGV A L D E A A L K K P R Y T NR- - - - - - - - - - - - - - C P GNAW- - - T - F Y - - DK S T Y - - - - - - - F - - -
948383898810881
1139810210099130106
- - - - - - - - - - T - - - N S G S TQ - - - - - - A L K D- - K - F E I HT A GD- - -- - - - - - - - - - - - - - - - - E TQ - - - - - - L L R E - - K - Y D I HT E GD- - -- - - - - - - - - - T - - - N S G E TQ - - - - - - A L R E - - K - Y S VQ I E GD- - -- - - - - - - - - - A - - - E K N- AQ - - - - - - A L P D- - - - - - - - - - GK - - -- - - - - - - - - - S - - - NA A - SQ - - - - - - A L E D- - - - - - - - - - DA - - -GA T S NA Y I P E T - - - R F A - A K - - - - - - A - K DAD- - - - - - - - T L - - -- - - - - - - - - - ND L R E A P - S - - E L E T G E L I D- - R S A I MY - - A DV - -
11499103101100131107
145127130125123161131
G- - - - S T LMA A L E G I LQ P T - - R G S I T I H- - - - - - SMYMV - T R P TWA - - - - A T LMA A L E G I LQ - - - - R G S I T V H- - - - - - SMY T V - T R P S -A - - - - S T LMA A I T G I MQ - - - - R G S I S T H- - - - - - - MY T V - S R P S -A - - - - S S L L E A V E R I L K - - - - R G E I T I H- - - - - A - - - - - S - - P T HA - - - - S T LM E A I T T I QQ P K - - R G E V A L H- - P G- - - - - - - - - - - - -A - - - - SM L I E V L I R V I - - T HP A E I NA V HP - - - - E E L Y S A - DQ - - -NT GK - T T LMR A L T S LMDP E - - V L A L E L H- - - - - - - - - - - - - - - - -
146128131126124162132
179156158154148195145
L G- - V - G I I TQ N F L DV - - - - - - - HN S V - L A D L D I GK R H L E I R S S GL R - - I - G I I KQ N F L S V - - - - - - - HK S V - L A D L D I GK R H L E - - - - -- R - - I - GA I TQ N F L S V - - - - - - - HNT I - L S D L E I GR R H L E - - - - -F G- - V - P A I S E E F P E V - - - - - E - - S A V - L E N I NV GK R D L N- - - - -- - - - - - GA I P Q N F L E V - - - - - - A E K T I - L DA L DMGR R D- - - - - - -WR - - V - GV N SQ K F F E F GCQWK - DA KMV S L E E V DY GK K A - - - - - - -- - P C - - - MV E NT F K R V - - - - - - - - - - - - - - - - - - - - - - - - KQ - P -
180157159
146
207163164
164
K K R G E D E P E GV RQM S K L DP T A NW- - - - - - - - - - - - - G L - - - - Y R K- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I A I S F R K - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I A V G F E - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -S R G- - - - - - - - - - - - - - - - E GG- T S K E NK F LMG E E I - - - - - - - - -
165 208
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -NT T T - K A P L R Y GDV P I R S A S GA SQ G I A L F K S I NV A NK R E GNT K A L
209 243
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -Y S T - - - E L T A ANP N S C E K S L DV - - - - - - - E G F GM L K K S DM L A S AQ
208164165155149196244
228184185174167211278
- - - - - - - - - - - - - - - - - - - - - - - Q N SQ I E K T T I LMT V A I - S AMK S- - - - - - - - - - - - - - - - - - - - - - - Q R S E I E K AQ I LMT V P K - S VMK S- - - - - - - - - - - - - - - - - - - - - - - Q T SQ I E K AQ I L L T I P M- S SMK S- - - - - - - - - - - - - - - - - - - - - - - R A E R I E A A R I LMA L P I - S VM E -- - - - - - - - - - - - - - - - - - - - - - - T - A R I R K S L I LMK I K I - S V S R -- - - - - - - - - - - - - - - - - - - - - - - - - - R I E DDR I L L A - A I - DVMR -NDG E L L V Y ND FQ G E - - - - - - - - - A A S R I S GA TM I V T I P V N I T V D-
229185186175168212279
266222223213207253311
T V A T V S GGQ K V L L E I MV T L A E V K K L L I L D E P A S - MKQ T A - - - - - -T V A T V S GGQ K V L L E FM E C L V E V K K L I I L D E P A S - MKQ S D- - - - - -T V A A V S G SQ K V L L A VMV C L V E V K K L L I L D E P A S - MTQ S D- - - - - -- I G S L S E GQ KM L L P L A E C L V E V R K L L I L D E S T S - MK P V T I G - - - -- V DT L S GGQWMR L E I A E C FMK V R K L L L L D E P T S - L K V T C E GT - - -R L T T L A DGQ R V R LM I F E CMK A E K TM L L V D E P T A - DK I Q A E G- V K -- - - K L S V GKQ V K V T L A T EM F T K T K Y L I L D E T V T - - - A P P - - - - - -
267223224214208254312
291239241231227265323
- - F - - - - - N F G- H- - T - - DP Q T V S DD SQ V - - - - I NG L I - - - - T T L- - L - - - - - N- - - - - - - - - - - - - V S DD- - - - - - - R Y NMNG I I - S T L- - Q - - - - - N F G- H- - T - - DP AQ L S DD- - - - - - - R - - - - - - - - S T L- - F - - - - - GW S - G- - S L S DA R V S S D- - - - - - - - - - - - - - - - - S T LHA F - - - - - Q F G- D- - S I NG E R A S NV - - - - - - - - - - - - - - - - - T T L- - - - - - - - D F E LQ - - R GAG- - - - - - - - - - - - - - - - - - - - - - - S A L- - V - - - - - D I G - H L A - - - D- - - - - - - - - - E - - - - - - - - - - - - V T L
292240242232228266324
325272272256263287340
I G L P T S L L DK T E NNV HP R T - - - - - - - - A - - - K NK L S S S S L K R A H EI G L P I S L L E K T E NNV HP R T - - - - - - - - E - - - K NK L S D S S L K R A H-I G L P I S L L E K T E N S I HP R K - - - - - - - - E - - - K - - L T S S NP QQ AH-I A L P Y S L L DK G S I N I S P EQ P I G S - - - Y - - - - K - - - - - - - - - - - - -V N L P Y S L L NK GK I E I HP QQ P V GR E K - - D- - - R - - - S NR S V R R A H-L S A P Y A L L E V GK GK I R P RQ V - - - - - I - - - - - N- - - - - - - - - - - - -F L Y P T G S LQ - F AMR L E GR - - - - - - - - - - - - - - - - - - - - - - - - - - -
326273273257264288341
350286288275293305351
L V I S NY HDK - - - - - - I P I L P Q P W L D F - - - NHGNV - - - - - - - - - - -- - - - - - - - - - - - - - - L G I L P Q P W L D F - - - - - L DV - - - - - - - - - - -- - - - - - - - - - - - - - - I G I L P Q P W L D F - - - NH L DV - - - - - - - - - - -- - - - - - - - - - - - - - - L S I V P Q P WR D F L DA K HGDV - - - - - - - - - - -- - - - - - - - - S V E - - - L P I V P E P W L D F - - - T HGK A E R I A Y T S VWP P- - - - - - - - - S V - T P F - - I V EQ P W LQ F - - - - HGDV - - - - - - - - - - -- - - - - - - - - - - - - - - L YWV NQ HK F L F - - - - - - - - - - - - - - - - - - -
351287289276294306352
361298308282325312355
- - - - - - - - - - - - - - - - - - - - - - - - - E L K L NT S HDT A - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - E L K L K P S H E T A A - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - E L K LQ P S HD I A A K T L A A S L A- - - - - - - - - - - - - - - - - - - - - - - - - E L T L S P A - - - - - - - - - - - - -K L DK FQ S SQ P S K SMT GY A GR R NHKQQ L R L I P S - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - Q F R V Y P A - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - L N I K - - - - - - - - - - - - - - -
362299309283326313356
382319351298345332374
- - - - - - - - - - - - - - - - - - - - - - A T T P A D I GV EMV D L I NQ V DH- Q -- - - - - - - - - - - - - - - - - - - - - - A T T K A E I GA EMV N L I Y GADH- A -R K K RQ S S T DN S A N F S E K DV K GDA K T P A E I A A EMV G F I YQ V DH- A -- - - - - - - - - - - - - - - - - - - - - - S I T P V A I GT EMV N I I N- - - - - - -- - - - - - - - - - - - - - - - - - - - - - A I T P EQ I G L DMT T I I NDADH- - -- - - - - - - - - - - - - - - - - - - - - - E I A P E E A A T TM L R L V S E I DR - - -- - - - - - - - - - - - - - - - - - - - - - - - - E S A GD LQ L L K L T NY S NNG- D
375 398
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -T E S - - E D- - - A Y - G- - - - - - - V L D S E L V I P Q L DHR SM- - - - - - - -
399 421
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- DD- Q S - - - - - - DN S - - GK G E V E - Y S - - N L F I N- - - - - - - - G SW-
383320352299346333422
421358390337381362456
- - - S V S HY S G F - Q E V K V K A I R A T V A - E KM I V LQ D EMT V - V A T GK G- - - S V S HY S G F - Q E V R V NA I HA T I A - N L K VM LQ D EMT V - V A T GK A- - - S V S HY S G F - Q E V K V NA I R A T V A - NKMV V I Q D EMT V - A A T GK G- - - P V TQ Y S G F - E KMK V K S I R L A A K - D EM L L LQ D E I T I - V A T GK G- - - R S T HY S G F D E KQ K I H SMHMAAAD E KMV V I Q D E I T S - I - - - - -- - - - - - - - - - F - E K E R V K S A R A V A A - E AMV A V I D E P T T - V C L G- -- - - DT DHY SQ G- E P V R L S AMR A L I C - S L T V A I E DD L V - - Q T I - - -
422359391338382363457
445382414360408371465
R P A E K - - - - E K C E DMQ R - - L A C A G L V - T - A I - SR P A EQ - - - - E T C S D L E R - - V T C A GP V - M- T I - RK S A E K - - - - E NC S D L K R - - V V C AGP M-M- V I - SR P - - - - - - EQ T C F D L V R R L V A C P G- - VM- A T - D- - A DAQ GGNN L C V D L DQ - -MV CDGP L VM- A V - K- - - DA - - - - - - - - - - - - - - - - - - - P T V - - SQ P KL P G- - - - - - - - - - - - - - - - - - - - - - L - N S P L - K
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 10 / 12
-
40 60 80 100 120
40
60
80
mm
Outlook
What proteins are appropriate to reconstruct a specific phylogeny
Gene 1
Gene 2
Gene 3
Gene 4
spec
ies
A
spec
ies
B
spec
ies
C
spec
ies
D
spec
ies
E
A B C D E
A BCD E
A B C D E
A B C D E
How far back in time can we trace a protein
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 11 / 12
-
40 60 80 100 120
40
60
80
mm
Acknowledgements
Ingo EbersbergerArndt von Haeseler
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 12 / 12
Introduction