total evidence phylogenies: the missing data issue
TRANSCRIPT
Total evidence phylogenies
The missing data issue
Thomas Guillerme
? @TGuillerme
Trinity College Dublin
Acknowledgements
Natalie Cooper (Natural History Museum - UK)
Gavin Thomas (Univ. Sheffield - UK)
Emmanuel Douzery (Univ. Montpellier II - FR)
Frédéric Delsuc (Univ. Montpellier II - FR)
Trevor Hodkinson (Trinity College Dublin - IE)
@TGuillerme
Time
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1
? ? ? ? ? ? ? ?
What is the effect of missing data on tree
topology?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
No missing data
Missing data
25%
50%
75%
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
? ? ? ?
0 1 1 0
? ? ? ?
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
? ? ? ?
? ? ? ?
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 ? 0 ? 0 0 1 ? 0 ? ? 1 ? 0 ? 1 1
Fossil taxa
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
? ? ? ? 0 1 1 1 ? ? ? ? ? ? ? ? 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1
Living taxa
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
No missing data
Missing data
25%
50%
75%
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
? ? ? ?
0 1 1 0
? ? ? ?
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
? ? ? ?
? ? ? ?
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
A B C D
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
No missing data
Missing data
25%
50%
75%
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
? ? ? ?
0 1 1 0
? ? ? ?
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
? ? ? ?
? ? ? ?
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
A B C D
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
150 CPU years later…
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
6 PhD months later…
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
No missing data
Missing data
25%
50%
75%
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
0 1 1 1
0 1 1 0
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
? ? ? ?
0 1 1 0
? ? ? ?
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
? ? ? ?
? ? ? ?
0 1 1 0
1 0 0 0
0 1 1 0
0 0 1 1
0 1 1 1
Sim
ula
ted
Da
ta
A B C D
A B C D
A B C D
A B C D
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
A B C D
A B C D
A B C D
A B C D
No missing data
Missing data
25%
50%
75%
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Tre
e s
imila
rity
Data
1
0
100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Tre
e s
imila
rity
1
0
Trees are identical
Trees are no more different than expected by chance
Data 100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Results
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Tre
e s
imila
rity
1
0
Missing data in the fossil record
Data 100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Tre
e s
imila
rity
1
0
Missing data in the fossil record
Missing data for living taxa
Data 100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 ? 1 0 0 0 1 1 0 1 1 1
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C A T C G A A C A T C G G A C A T C G G A A
0 0 1 0 0 1 1 1 ? ? ? ? 0 1 1 0 1 0 0 0 0 ? 1 0 0 0 1 1 0 1 1 1
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
We need morphological data
from living taxa!
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
How much data are out there?
Guillerme & Cooper, 2015, bioRxiv
Guillerme & Cooper, 2015, bioRxiv
Available data
?
Guillerme & Cooper, 2015, bioRxiv
Available data
?
Guillerme & Cooper, 2015, bioRxiv
Available data
Guillerme & Cooper, 2015, bioRxiv
Available data
Guillerme & Cooper, 2015, bioRxiv
Available data
16% 56/351
Tre
e s
imila
rity
1
0
Missing data in the fossil record
Missing data for living taxa
Data 100% 25%
Tre
e s
imila
rity
1
0
Missing data in the fossil record
Missing data for living taxa
Data 100% 25%
Tre
e s
imila
rity
1
0
Missing data in the fossil record
Missing data for living taxa
Data 100% 25%
@TGuillerme
Guillerme & Cooper, 2015 biorxiv.org
Guillerme & Cooper, accepted Mol. Phyl. Evol.
Tre
e s
imila
rity
1
0
Missing data in the fossil record
Missing data for living taxa
Data 100% 25%
@TGuillerme
Thank you Guillerme & Cooper, 2015
biorxiv.org
Guillerme & Cooper, accepted Mol. Phyl. Evol.