molekulare evolution -...
TRANSCRIPT
Molekulare Evolution
Dr. Vera Warmuth SoSe2019
Nachbesprechung Phylo Übungen
Zeichne den Baum
(((A,B),(C,D)),(E,F))
((A,(B,C)),(D,E))
Wer ist näher verwandt...
a) A green alga is more closely related to a red alga than to a mossb) A green alga is more closely related to a moss than to a red algac) A green alga is equally related to a red alga and a mossd) A green alga is related to a red alga, but is not related to a moss
Wer ist näher verwandt...
a) A green alga is more closely related to a red alga than to a mossb) A green alga is more closely related to a moss than to a red algac) A green alga is equally related to a red alga and a mossd) A green alga is related to a red alga, but is not related to a moss
• Identifiziere dazu den letzten gemeinsamen Vorfahren!
x
y
Wer ist näher verwandt...
a) A seal is more closely related to a horse than to a whaleb) A seal is more closely related to a whale than to a horsec) A seal is equally related to a horse and a whaled) A seal is related to a whale, but is not related to a horse
Wer ist näher verwandt...• Identifiziere dazu den letzten gemeinsamen Vorfahren!
a) A seal is more closely related to a horse than to a whaleb) A seal is more closely related to a whale than to a horsec) A seal is equally related to a horse and a whaled) A seal is related to a whale, but is not related to a horse
x
Welcher ist falsch...
Welcher ist falsch...
Parsimonisch informative Positionen?
Ziel: finde den Baum, der mit den wenigsten Merkmalsänderungen die Datenmatrix erklärt
0 0 0
Ziel: finde den Baum, der mit den wenigsten Merkmalsänderungen die Datenmatrix erklärt
1 1 1
Ziel: finde den Baum, der mit den wenigsten Merkmalsänderungen die Datenmatrix erklärt
1 2 1
Ziel: finde den Baum, der mit den wenigsten Merkmalsänderungen die Datenmatrix erklärt
0+1+1+1+1+1+1+1+1+1+1+0+1+0+1+1+1+1 = 6 Parsimoniescore
Parsimoniescore und Baumlänge
• Parsimoniescore: Summe der Merkmalsänderungen an parsimonie-
informativen Positionen, die einen bestimmten Baum erklären
• Baumlänge: Summe aller Merkmalsänderungen im Baum (JEDE
Änderung wird gezählt)
Evolution
Veränderung von Allelefrequenzen über Zeit
Molekulare Evolution
Veränderung der Struktur und Sequenz von Makromolekülen
Molekulare Evolution der Genom Sequenz des Zika Virus zwischen 2013 und 2017
Molekulare Evolution
molekulare Evolution als Fachrichtung..
...ist die vergleichende Studien von Makromolekülen
...fragt danach, wie und warum sich Sequenzen im Laufe der Evolution ändern
...liefert die Basis zur Konstruktion von Sequenzstammbäumen – analog zu den
Stammbäumen auf der Basis phänotypischer Merkmale
Vorlesung
1.) Mechanismen: (Punkt-)mutation, Genduplikation
2.) Alignments als Grundlage der phylogenetischen Analyse molekularer Sequenzdaten
3.) Neutrale Theorie der neutralen Evolution und molekulare Uhr
Molekulare Evolution
• Permanente Änderungen des Erbmaterials (der DNA)
• Mutationen sind stochastisch und zufällig
• Ursachen: Fehler in der Replikation während der Zellteilung; radioaktive
Strahlung; Chemikalien; Vireninfektion; Transposon Aktivität
• Punktmutationen am Häufigsten
• Generell in der Grössenordnung von 10−9 to 10−8 /Position/Generation
(Viren ca 10−6 /Position/Generation)
Mutationen
Punktmutationen
Nicht alle Mutationen haben Fitness Konsequenzen
Aminosäuren bestehen aus Nukleotid Triplets (‚codon‘)
Substitutionen können
a) synonym sein: keine Änderung in der Aminosäure
b) Nicht-synonym sein: Änderung in der Aminosäure
GCA -> AlaninGCG -> Alanin vierfach-degenerierte StelleGCC -> Alanin (synonyme Stelle)GCT -> Alanin
AGA -> ArgininAGG -> Arginin zweifach-degenerierte StelleAGC -> SerinAGT -> Serin
AGT -> SerinGGT -> Glycin nicht-degenerierte StelleCGT -> Arginin (nicht-synonyme Stelle)TGT -> Cystein
Nicht alle Mutationen haben negative Fitness Konsequenzen
Nicht alle Mutationen haben Fitness Konsequenzen
-> Die Substitutionsrate von Nukleotiden kommt auf ihre Position im Kodon an
-> synonyme Substitutionsrate >> nicht-synonyme Substitutionsrate
Position
Nicht alle Mutationen haben negative Fitness Konsequenzen
Beispiel:Leucin: 6 mögliche codon Varianten
Tyrosin: nur 2 mögliche codon Varianten
TTA CTA CTT CTC CTG TTG
TAT TAC
Mechanismen molekularer Veränderung: Punktmutation
Nicht-synonyme Mutationen verändern Proteine: a) missense: Aminosäure ändert sich
Nicht-synonyme Mutationen verändern Proteine: a) non-sense: Aminosäure -> Stop Kodon
Mechanismen molekularer Veränderung: Punktmutation
Mechanismen molekularer Veränderung: Genduplikation
• Neue Gene können durch Genduplikation und Divergenz entstehen
• Genduplikationen lassen Rückschlüsse auf die Evolution von Genen zu
Duplikation erfolgt vor/bei ArtenbildungFunktion bleibt erhalten
Mechanismen molekularer Veränderung: Genduplikation
• Neue Gene können durch Genduplikation und Divergenz entstehen
• Genduplikationen lassen Rückschlüsse auf die Evolution von Genen zu
PseudogeneDuplizierte Gene, die ihre Funktion verloren haben
Duplikation erfolgt vor/bei ArtenbildungFunktion bleibt erhalten
Duplikation im Genom innerhalb einer Artneue Funktion
Genduplikation: Beispiel
Paralogie ist ein Problem für die Phylogenetik
Inferierte, falsche Phylogenie
Paralogie ist ein Problem für die Phylogenetik
Inferierte, falsche Phylogenie
Diskrepanz zwischen Genbäumen und dem Artenbaum
• Genduplikation: einer der Mechanismen in der molekularen Evolution die zu einer Diskrepanz zwischen Genbäumen und dem Artbaum führen kann!
Alignments
• Ein Alignment ist eine Datenmatrix in der alleNukleotide/Aminosäuren einer Spalte homolog zueinander sind.
• Problem: Indels (Insertion und Deletion events) erschweren die Identifizierung von homologen Nukleotiden. Substitution /
Missmatch
Alignment Algorithmen
• Jedes Alignment erhält eine Wertung (score)
• Werte für Übereinstimmung (match), Nicht-Übereinstimmung (mismatch), und Lücken
(gap)
• Einfaches Beispiel:
– Match = 1, Mismatch = -1, Gap = -2
Sequenz_1 ATCC-
Sequenz_2 AGCCG
Score: 1 - 1 + 1 + 1 - 2 = 0
Alignment Algorithmen
• Komplexere Methoden:
- Unterschiedliche Scores für Mismatches/Substitution
- Anfang einer Lücke (Gap opening) hat höhere Kosten als eine das Erweitern einer
Lücke (Gap extension)
Sequenz_1 ATCC-
Sequenz_2 AGCCG
Score: 1 - 1 + 1 + 1 - 2 = 0
Point accepted mutation (PAM) Matrix für Substitution-
Kosten
BLAST(Basic Local Alignment Search Tool)
• BLAST sucht Sequenzen mit hoher Übereinstimmung.
• Verglichen werden kleine Teile der Sequenzen
• Scores werden ähnlich wie bei paarweisen Sequenzvergleichen berechnet.
• Dient zum
• Identifizieren einer Sequenz.
• Suchen Sequenzen ander Arten.
Basic Local Alignment Search Tool
homolog oder paralog!
Basic Local Alignment Search Tool
homolog oder paralog!
Molekulare Evolution und Phylogenetik
• 1962: Zuckerkandl & Pauling. Unterschiede in Aminosäuren im Hämoglobin verschiedener Vertebraten akkumulieren linear (Molekulare Uhr)
• 1963: Margoliash: ‘genetic equidistance hypothesis’: AnzahlNukleotid Unterschieden in der Cytochrome C Sequenz zweierArten ist proportional zur Zeit seit dem letzen gemeinsamenVorfahren
• 1968: Motoo Kimura: Neutrale Theorie der molekularen Evolution
Neutrale Theorie der molekularen Evolution
Neutrale Mutationen und genetische Drift als zentrale Mechanismen derVeränderung von Proteinen
- Mutationen mit negativem Fitness Effekt werden schnell entfernt
- Mutationen mit positivem Fitness Effekt sind extrem selten
Wichtige Folgerungen
Rate der molekularen Evolution entspricht Rate neutraler Mutationen
Rate neutraler Mutationen ist konstant (Molekulare Uhr)
Achtung: gilt nur auf molekularer Ebene! Selektion dominiert Evolution auf phänotypischer Ebene
Evolutionary Rate at the Molecular Level Nature (1968)
“Calculating the rate of evolution in terms of nucleotide substitutions seems to give a value so high that many of the mutations involved must be neutral ones.”
Cytochrome C Genbaum(Margoliash, Fitch & Margoliash, 1960s)
die Veränderungsrate ist ungefähr konstant:17+10+2=31 from gemeinsamen Vorfahren zu Hefe
32 from gemeinsamen Vorfahren zu Primaten
=> Molekulare Uhr!
Traditionell werden datierte Fossilien benutzt, um Mutations Raten in
Zeiteinheiten umzurechnen und damit Knoten in phylogenetischen
Bäumen zu datieren (phylogenetische Mutationsrate)
Margoliash (1963)
Kalibrierung mit Hilfe von datierten Fossilien,z.B. bekannter Divergenz Mensch-Pferd
Traditionell werden datierte Fossilien benutzt, um Mutations Raten in
Zeiteinheiten umzurechnen und damit Knoten in phylogenetischen
Bäumen zu datieren (phylogenetische Mutationsrate)
Margoliash (1963)Kalibrierung mit Hilfe von datierten Fossilien,z.B. bekannter Divergenz Mensch-Pferd
Kalibrierung war falsch, heute auf 1 Billion Jahre geschätzt
Probleme mit der Molekularen Uhr
• Nicht alle Proteine haben die gleiche Substitutions Rate
• Nicht alle Taxa haben unterschiedliche Substitutionsraten
• Generationszeit ist oft nicht bekannt
• Das Alter der Fossilien relative zu den untersuchten evolutionären Zeiträumen beeinflusst das Ergebnis
• Fossilien aus dem ‚richtigen‘ Zeitalter sind oft nicht vorhanden
• Unterschiedliche Methoden/Algorithmen
• Und, und und...