simulating sequence evolution under domain constraints · zf-ubp lacbi sgf11 sus1 fact fact fact...

20
Simulating sequence evolution under domain constraints Tina Koestler CIBIV February 3, 2011 Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 1 / 12

Upload: others

Post on 03-Feb-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

  • 40 60 80 100 120

    40

    60

    80

    mm

    Simulating sequence evolution under domainconstraints

    Tina Koestler

    CIBIV

    February 3, 2011

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 1 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Protein domain - an evolutionary conserved region

    UCH

    ZnF_UBP

    zf-UBPYEAST

    FUNGI

    METAZOA

    PLANTS

    PROTISTS

    UCH

    ZnF_UBPzf-UBP

    HOMSA

    UCHZnF_UBP

    zf-UBP

    ARATH

    UCH

    DICDI

    UCH

    ZnF_UBP

    zf-UBP

    DICDI

    best BLAST hit

    best FACT hit

    UCH

    BATDE

    D. discoideum

    UCHZnF_UBP

    zf-UBP

    LACBI

    Sgf11 Sus1

    FACT

    FACT FACT

    FACT

    ? FACT

    FACT FACT

    ? FACT

    Sgf73 Sac3 Thp1 Sus1 Cdc31

    FACT

    FACT FACT

    FACT

    FACT FACT FACT

    FACT FACT FACT

    FACT FACT

    Sem1

    Ubp8SAGA TREX2

    UCH

    TRYBR

    UCH

    ZnF_UBP

    zf-UBP

    TRYBR

    best BLAST hit

    best FACT hit

    *BM Basidiomycota**CM Chytridiomycota

    BM*

    CM**

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 2 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Simulating protein sequence evolution without constraints

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 3 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Simulating protein sequence evolution without constraints

    0.3

    G

    E

    A

    F

    B

    D

    C

    2

    0.1

    0.5

    0.1

    1

    0.1

    0.1

    0.5

    0.2

    0.1

    0.2

    0.1

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 3 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    Begin M1 M2 M3 Mx

    D1 D2 D3 Dx

    I0 I1 I2 Ix-1

    End

    Ix

    M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Profile Hidden Markov Model - pHMM

    M4 M5 M6

    S G D

    qii = −�

    j �=irijπj

    qi = −qii

    qS qG qDACDE..

    ACDE..

    ACDE..

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 5 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Simulation workflow

    phylogenetic tree

    S1 S2S3

    S4

    root sequence

    HMMscan

    Pfam

    simulation program

    S1

    S2

    S3

    S4

    >S1CCGCCIAC-MACPVVAIDFSRLANSLLGL---AIV>S2CCSCCVACVMACPVVGLLFSRLANSLLGL---LIV>S3AC-TCVAC---C-VVFSRFSRLA-SLLGLNIILII>S4ACDTCVAC--AC-VVILVFSRLA-SLLGLNIILIV

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 6 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    ABC tran

    ABC_tran

    insertion position

    Fre

    quen

    cy

    0 20 40 60 80 100 120

    020

    0040

    0060

    0080

    0010

    000

    84

    64

    36

    2252

    47

    ●●●●●

    ●●●●

    ●●●

    ●●

    ●●

    ●●

    ●●

    ●●

    ●●

    ●●●●●

    ●●●●●

    ●●

    ●●

    ●●●

    ●●●

    ●●

    ●●●●●●

    ●●●●

    ●●

    ●●

    ●●●

    ●●●●●●●●

    ●●

    ●●●●●●

    ●●●

    ●●●●

    ●●

    ●●

    ●●●

    0 20 40 60 80 100 120

    05

    1015

    2025

    3035

    mean insertion length per position at different branch lengths

    position

    leng

    th

    ●●●●●●

    ●●●●

    ●●

    ●●●●

    ●●

    ●●●

    ●●●●

    ●●●●●●●

    ●●●

    ●●

    ●●●●●●

    ●●●

    ●●●●

    ●●●

    ●●●●

    ●●●●●●●●

    ●●●●●

    ●●●●●●●●●●

    ●●●●●●

    ●●●

    ●●

    ●●

    ●●●●●●

    ●●

    ●●●

    ●●●●

    ●●

    ●●

    ●●

    ●●

    ●●

    ●●●●●●

    ●●●

    ●●●

    ●●●●●

    ●●●

    ●●●

    ●●●●●●●

    ●●●●●

    ●●●

    ●●

    ●●●●●

    ●●●●●●●

    ●●●

    ●●●

    ●●

    ●●●●●●●

    ●●●

    ●●●●●●●

    ●●●●●

    ●●●●●●

    ●●

    ●●●●

    ●●●

    ●●●●●

    ●●

    ●●●●

    ●●●

    ●●●●

    ●●●

    ●●●●

    ●●●

    ●●●

    ●●●●

    ●●●

    ●●●●

    ●●●●

    ●●●●●

    ●●

    ●●●●

    ●●

    ●●

    ●●●

    ●●●●

    ●●●●●

    ●●●●

    ●●●●●●●

    ●●●●●

    ●●●●●

    ●●●

    ●●

    ●●●●

    ●●●●

    ●●●●●●●●●●

    ●●●●●●●●●●●

    ●●

    ●●

    ●●

    ●●●●●●●

    ●●●●●●

    ●●●●

    ●●●

    ●●●●●

    ●●●●●●●●●●

    ●●●●●●●

    ●●●

    ●●●●

    ●●●●●

    ●●●

    0.10.51.01.52.05.0

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 7 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Evolving 22,000 human proteins

    0.0 0.5 1.0 1.5

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    branch length

    reco

    vere

    d do

    mai

    ns [%

    ]● ●

    ●●

    no InDelsno InDels + FInDel rate=0.05InDel rate=0.05 + FInDel rate=0.1InDel rate=0.1 + F

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 8 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Generate your own protein family

    ( ( ( (C : 0 . 2 ,B : 0 . 1 ) : 0 . 1 ,A : 0 . 1 ) : 0 . 1 ,G : 2 . 0 ) : 0 . 1 , ( ( F : 1 , E : 0 . 5 ) : 0 . 1 ,D : 0 . 5 ) : 0 . 2 ) ;

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 9 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Generate your own protein family

    0.3

    G

    E

    A

    F

    B

    D

    C

    2

    0.1

    0.5

    0.1

    1

    0.1

    0.1

    0.5

    0.2

    0.1

    0.2

    0.1

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465

    1111111

    34343433283930

    DK L L G- I A - - - - - - - A F D- - - V R I A V Y DP GQ C L A K K C TQ A EM E I QDN L L G- L A - - - - - - - T Y D- - - V R I A V Y NP SQ C L P K K C T E A EM E I QDN L L G- L A - - - - - - - T Y D- - - V R I A V Y DP GQ C L P K A C T E A EMK I QDT L L G- W I - - - - - - - A Y - - - - V R I A V I DP GR C L P K K C T A S E L K I LDK - - G- L - - - - - - - - - - - - - - I R V F V V NAGQ C L P K K C S V A K L K I H- E L NK Y V D FQ S GP R V GT - - - - V K V Y V V S E GQ C L A K R C T V - K L I F TDR L - - - V K - - - - - - - DC S S P - L K L A V L R A GR C L A K K C TQ - - - - I Q

    35353534294031

    66625760566665

    C P V E L GT L - - - - - - - - - V K I K ND- C E E I V N EMV D- C - - V L C P D S DC P V - - D- - - - - - - - - - - V R I GND- C E E N S D EMV D- C - - V A C P DP DC P V - - DA L - - - - - - - - - V K I K ND- C E - - - - - M I E - C - - I L - - NP DC P V - - - - - - - - A E - - A V - - V P DD- C I E I A N LMA E - C - - L A - - D S EC P L R L - - - - - - E D- - - - V K V GD E - CM EM- Q SMQD- A - - I A - - D E EC P V - - - - - - - - A T S E - - MK I P A D- C - E V - N S V V D- C - - T A - - DNDC P AD L A H F E S N- - - - - - I R T GR N- C K V P A DR NP D- C V C I S - - D E E

    67635861576766

    938282888710780

    R C V V C - - - GA CQ A R C P A NAM- - - K - L Y T G- AMNV - - - - - - - F - - -R C V V C - - - E A CQ A R C P A E A I - - - K - L Y - - - - - - - - - - - - - - - - - -R C I V C - - - E A CQ A R C P A NA I - - - K - L L T G- - - NA - - - - - - - F - - -K C V F C - - - GA CQ A Y C P Q DV V - - - Q - V Y T Y S K L NG- - - - - - - F - - -K C I F C DAG S E C V E A C P L GA V - - - T - E Y K G F A L DA - - - - - - - F - - -Q C V F C - - - C A C I R R CDQ NA I K GNT - V Y GGV A L D E A A L K K P R Y T NR- - - - - - - - - - - - - - C P GNAW- - - T - F Y - - DK S T Y - - - - - - - F - - -

    948383898810881

    1139810210099130106

    - - - - - - - - - - T - - - N S G S TQ - - - - - - A L K D- - K - F E I HT A GD- - -- - - - - - - - - - - - - - - - - E TQ - - - - - - L L R E - - K - Y D I HT E GD- - -- - - - - - - - - - T - - - N S G E TQ - - - - - - A L R E - - K - Y S VQ I E GD- - -- - - - - - - - - - A - - - E K N- AQ - - - - - - A L P D- - - - - - - - - - GK - - -- - - - - - - - - - S - - - NA A - SQ - - - - - - A L E D- - - - - - - - - - DA - - -GA T S NA Y I P E T - - - R F A - A K - - - - - - A - K DAD- - - - - - - - T L - - -- - - - - - - - - - ND L R E A P - S - - E L E T G E L I D- - R S A I MY - - A DV - -

    11499103101100131107

    145127130125123161131

    G- - - - S T LMA A L E G I LQ P T - - R G S I T I H- - - - - - SMYMV - T R P TWA - - - - A T LMA A L E G I LQ - - - - R G S I T V H- - - - - - SMY T V - T R P S -A - - - - S T LMA A I T G I MQ - - - - R G S I S T H- - - - - - - MY T V - S R P S -A - - - - S S L L E A V E R I L K - - - - R G E I T I H- - - - - A - - - - - S - - P T HA - - - - S T LM E A I T T I QQ P K - - R G E V A L H- - P G- - - - - - - - - - - - -A - - - - SM L I E V L I R V I - - T HP A E I NA V HP - - - - E E L Y S A - DQ - - -NT GK - T T LMR A L T S LMDP E - - V L A L E L H- - - - - - - - - - - - - - - - -

    146128131126124162132

    179156158154148195145

    L G- - V - G I I TQ N F L DV - - - - - - - HN S V - L A D L D I GK R H L E I R S S GL R - - I - G I I KQ N F L S V - - - - - - - HK S V - L A D L D I GK R H L E - - - - -- R - - I - GA I TQ N F L S V - - - - - - - HNT I - L S D L E I GR R H L E - - - - -F G- - V - P A I S E E F P E V - - - - - E - - S A V - L E N I NV GK R D L N- - - - -- - - - - - GA I P Q N F L E V - - - - - - A E K T I - L DA L DMGR R D- - - - - - -WR - - V - GV N SQ K F F E F GCQWK - DA KMV S L E E V DY GK K A - - - - - - -- - P C - - - MV E NT F K R V - - - - - - - - - - - - - - - - - - - - - - - - KQ - P -

    180157159

    146

    207163164

    164

    K K R G E D E P E GV RQM S K L DP T A NW- - - - - - - - - - - - - G L - - - - Y R K- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I A I S F R K - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I A V G F E - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -S R G- - - - - - - - - - - - - - - - E GG- T S K E NK F LMG E E I - - - - - - - - -

    165 208

    - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -NT T T - K A P L R Y GDV P I R S A S GA SQ G I A L F K S I NV A NK R E GNT K A L

    209 243

    - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -Y S T - - - E L T A ANP N S C E K S L DV - - - - - - - E G F GM L K K S DM L A S AQ

    208164165155149196244

    228184185174167211278

    - - - - - - - - - - - - - - - - - - - - - - - Q N SQ I E K T T I LMT V A I - S AMK S- - - - - - - - - - - - - - - - - - - - - - - Q R S E I E K AQ I LMT V P K - S VMK S- - - - - - - - - - - - - - - - - - - - - - - Q T SQ I E K AQ I L L T I P M- S SMK S- - - - - - - - - - - - - - - - - - - - - - - R A E R I E A A R I LMA L P I - S VM E -- - - - - - - - - - - - - - - - - - - - - - - T - A R I R K S L I LMK I K I - S V S R -- - - - - - - - - - - - - - - - - - - - - - - - - - R I E DDR I L L A - A I - DVMR -NDG E L L V Y ND FQ G E - - - - - - - - - A A S R I S GA TM I V T I P V N I T V D-

    229185186175168212279

    266222223213207253311

    T V A T V S GGQ K V L L E I MV T L A E V K K L L I L D E P A S - MKQ T A - - - - - -T V A T V S GGQ K V L L E FM E C L V E V K K L I I L D E P A S - MKQ S D- - - - - -T V A A V S G SQ K V L L A VMV C L V E V K K L L I L D E P A S - MTQ S D- - - - - -- I G S L S E GQ KM L L P L A E C L V E V R K L L I L D E S T S - MK P V T I G - - - -- V DT L S GGQWMR L E I A E C FMK V R K L L L L D E P T S - L K V T C E GT - - -R L T T L A DGQ R V R LM I F E CMK A E K TM L L V D E P T A - DK I Q A E G- V K -- - - K L S V GKQ V K V T L A T EM F T K T K Y L I L D E T V T - - - A P P - - - - - -

    267223224214208254312

    291239241231227265323

    - - F - - - - - N F G- H- - T - - DP Q T V S DD SQ V - - - - I NG L I - - - - T T L- - L - - - - - N- - - - - - - - - - - - - V S DD- - - - - - - R Y NMNG I I - S T L- - Q - - - - - N F G- H- - T - - DP AQ L S DD- - - - - - - R - - - - - - - - S T L- - F - - - - - GW S - G- - S L S DA R V S S D- - - - - - - - - - - - - - - - - S T LHA F - - - - - Q F G- D- - S I NG E R A S NV - - - - - - - - - - - - - - - - - T T L- - - - - - - - D F E LQ - - R GAG- - - - - - - - - - - - - - - - - - - - - - - S A L- - V - - - - - D I G - H L A - - - D- - - - - - - - - - E - - - - - - - - - - - - V T L

    292240242232228266324

    325272272256263287340

    I G L P T S L L DK T E NNV HP R T - - - - - - - - A - - - K NK L S S S S L K R A H EI G L P I S L L E K T E NNV HP R T - - - - - - - - E - - - K NK L S D S S L K R A H-I G L P I S L L E K T E N S I HP R K - - - - - - - - E - - - K - - L T S S NP QQ AH-I A L P Y S L L DK G S I N I S P EQ P I G S - - - Y - - - - K - - - - - - - - - - - - -V N L P Y S L L NK GK I E I HP QQ P V GR E K - - D- - - R - - - S NR S V R R A H-L S A P Y A L L E V GK GK I R P RQ V - - - - - I - - - - - N- - - - - - - - - - - - -F L Y P T G S LQ - F AMR L E GR - - - - - - - - - - - - - - - - - - - - - - - - - - -

    326273273257264288341

    350286288275293305351

    L V I S NY HDK - - - - - - I P I L P Q P W L D F - - - NHGNV - - - - - - - - - - -- - - - - - - - - - - - - - - L G I L P Q P W L D F - - - - - L DV - - - - - - - - - - -- - - - - - - - - - - - - - - I G I L P Q P W L D F - - - NH L DV - - - - - - - - - - -- - - - - - - - - - - - - - - L S I V P Q P WR D F L DA K HGDV - - - - - - - - - - -- - - - - - - - - S V E - - - L P I V P E P W L D F - - - T HGK A E R I A Y T S VWP P- - - - - - - - - S V - T P F - - I V EQ P W LQ F - - - - HGDV - - - - - - - - - - -- - - - - - - - - - - - - - - L YWV NQ HK F L F - - - - - - - - - - - - - - - - - - -

    351287289276294306352

    361298308282325312355

    - - - - - - - - - - - - - - - - - - - - - - - - - E L K L NT S HDT A - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - E L K L K P S H E T A A - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - E L K LQ P S HD I A A K T L A A S L A- - - - - - - - - - - - - - - - - - - - - - - - - E L T L S P A - - - - - - - - - - - - -K L DK FQ S SQ P S K SMT GY A GR R NHKQQ L R L I P S - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - Q F R V Y P A - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - L N I K - - - - - - - - - - - - - - -

    362299309283326313356

    382319351298345332374

    - - - - - - - - - - - - - - - - - - - - - - A T T P A D I GV EMV D L I NQ V DH- Q -- - - - - - - - - - - - - - - - - - - - - - A T T K A E I GA EMV N L I Y GADH- A -R K K RQ S S T DN S A N F S E K DV K GDA K T P A E I A A EMV G F I YQ V DH- A -- - - - - - - - - - - - - - - - - - - - - - S I T P V A I GT EMV N I I N- - - - - - -- - - - - - - - - - - - - - - - - - - - - - A I T P EQ I G L DMT T I I NDADH- - -- - - - - - - - - - - - - - - - - - - - - - E I A P E E A A T TM L R L V S E I DR - - -- - - - - - - - - - - - - - - - - - - - - - - - - E S A GD LQ L L K L T NY S NNG- D

    375 398

    - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -T E S - - E D- - - A Y - G- - - - - - - V L D S E L V I P Q L DHR SM- - - - - - - -

    399 421

    - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- DD- Q S - - - - - - DN S - - GK G E V E - Y S - - N L F I N- - - - - - - - G SW-

    383320352299346333422

    421358390337381362456

    - - - S V S HY S G F - Q E V K V K A I R A T V A - E KM I V LQ D EMT V - V A T GK G- - - S V S HY S G F - Q E V R V NA I HA T I A - N L K VM LQ D EMT V - V A T GK A- - - S V S HY S G F - Q E V K V NA I R A T V A - NKMV V I Q D EMT V - A A T GK G- - - P V TQ Y S G F - E KMK V K S I R L A A K - D EM L L LQ D E I T I - V A T GK G- - - R S T HY S G F D E KQ K I H SMHMAAAD E KMV V I Q D E I T S - I - - - - -- - - - - - - - - - F - E K E R V K S A R A V A A - E AMV A V I D E P T T - V C L G- -- - - DT DHY SQ G- E P V R L S AMR A L I C - S L T V A I E DD L V - - Q T I - - -

    422359391338382363457

    445382414360408371465

    R P A E K - - - - E K C E DMQ R - - L A C A G L V - T - A I - SR P A EQ - - - - E T C S D L E R - - V T C A GP V - M- T I - RK S A E K - - - - E NC S D L K R - - V V C AGP M-M- V I - SR P - - - - - - EQ T C F D L V R R L V A C P G- - VM- A T - D- - A DAQ GGNN L C V D L DQ - -MV CDGP L VM- A V - K- - - DA - - - - - - - - - - - - - - - - - - - P T V - - SQ P KL P G- - - - - - - - - - - - - - - - - - - - - - L - N S P L - K

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 10 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Outlook

    What proteins are appropriate to reconstruct a specific phylogeny

    Gene 1

    Gene 2

    Gene 3

    Gene 4

    spec

    ies

    A

    spec

    ies

    B

    spec

    ies

    C

    spec

    ies

    D

    spec

    ies

    E

    A B C D E

    A BCD E

    A B C D E

    A B C D E

    How far back in time can we trace a protein

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 11 / 12

  • 40 60 80 100 120

    40

    60

    80

    mm

    Acknowledgements

    Ingo EbersbergerArndt von Haeseler

    Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 12 / 12

    Introduction