das szenario ein neues tödliches...
TRANSCRIPT
![Page 1: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/1.jpg)
![Page 2: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/2.jpg)
Das Szenario ...ein neues tödliches Virus!
• Labor: Isolierung der Erbsubstanz und Sequenzierung • Computer: Erkennen der Virusgene (de novo Genvorhersage)
Ähnlichkeit zu bekannten Genen? (Datenbanksuchen)
Verwandtschaft? Ausbreitung? Herkunft? (Phylogenetische Rekonstruktion)
Struktur der Proteine? (Struktur-Vorhersage, Modellierung)
Wirkstoff-Design
• Labor: Wirkstoff-Test
![Page 3: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/3.jpg)
Molekulare Phylogenie
• Verwandtschaft von Organismen (molekulare Systematik, Forensik) • Verwandschaft zwischen Genen/Proteinen (Genomevolution, Gen/Proteinfunktion) • Ausbreitung von Lebewesen (Anthropologie, Ökologie, Epidemiologie)
![Page 4: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/4.jpg)
4 © Dan Graur 4
(1.500 MYA)
(100 MYA)
(5 MYA)
© Dan Graur
Das Leben ist nur einmal enstanden. => alle Organismen sind miteinander verwandt, d.h. haben einen Vorfahren, der in der Vergangenheit gelebt hat.
Grundlage!
![Page 5: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/5.jpg)
5
Grundbegriffe
A B C D E A B C D E Dichotomie Polytomie
Ast (branch)
Knotenpunkt (node)
Wurzel (root)
Innengruppe (ingroup)
![Page 6: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/6.jpg)
6
Stammbaum-Typen Ohne Außengruppe: Mit Außengruppe:
Evolutionsrichtung
Neunauge
Hai
Goldfisch
Flösselhecht
Zebrafisch
Forelle
Lungenfisch
Molch
Ochsenfrosch
Krallenfrosch
Mensch
Maus
Strahlen- flosser
Land- wirbeltiere
Flösselhecht
Goldfisch
Neunauge
Hai
Zebrafisch
Lungenfisch
Maus
Mensch
Forelle Molch
Ochsen-‐ frosch
Krallenfrosch
Evolutionsrichtung?
![Page 7: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/7.jpg)
Molekulare vs. klassische Phylogenie
• Sequenzen sind direkt vererbt; keine Umwelteinflüsse
• Sequenzdaten sind in großer Menge relativ kostengünstig und schnell zu erhalten (Dank sei der PCR!!!)
• weitgehend frei von Interpretationseinflüssen („reduziert“, „etwas abgeflacht“ etc.)
• Sequenzen erlauben Vergleiche über große Distanzen (Tiere, Pilze, Pflanzen)
Dennoch: auch molekulare Daten können zu falschen
Stammbäumen führen !
![Page 8: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/8.jpg)
Welche Vergleiche mache Sinn?
![Page 9: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/9.jpg)
Welche Vergleiche mache Sinn?
http://evolution.berkeley.edu/evolibrary/article/similarity_hs_01
HOMOLOGIE heißt das Zauberwort für sinnvolle Vergleiche!
![Page 10: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/10.jpg)
Welche Vergleiche mache Sinn? PlePPO YWREDFGINSHHWHWHLVYPIEM-----NVNRDRKGELFYYMHQQMVARYDWERLSVNLNRVEKLE 61PmoPPO YWREDYGINVHHWHWHLIYPPAM-----GFDRDRKGELFYYMHQQVIARYDIERLCLGLPKVEKLD 61BmoPPO1 YFREDIGINLHHWHWHLVYPFDAADRA-IVNKDRRGELFYYMHQQIIARYNVERMCNNLSRVRRYN 65DmePPOA1 YFREDIGVNSHHWHWHLVYPTTGPTE--VVNKDRRGELFYYMHHQILARYNVERFCNNLKKVQPLN 64DmePPO2 YFREDLGINLHHWHWHLVYPFEASDRS-IVAKDRRGELFYYMHQQVIARYNAERFSNNLARVLPFN 65DmePPO3 YFREDLGVNLHHWHWHLVYPIEAPDRS-IVDKDRRGELFYYMHQQIIARYNAERLSNHMARVQPFN 65EcaHcA YFREDIGVNAHHWHWHVVYPSTYDPAFFGKVKDRKGELFYYMHQQMCARYDCERLSNGLNRMIPFH 66EcaHcD YFREDIGINSHHWHWHLVYPAFYDADIFGKIKDRKGELFYYMHQQMCARYDCERLSVGLQRMIPFQ 66EcaHcF YFREDIGANAHHWHWHIVYPPTWDASVMSKVKDRKGELFYYMHQQMCARYDCDRLSTGLRRMIPFH 66LpoHc2 YYREDVGINAHHWHWHLVYPSTWNPKYFGKKKDRKGELFYYMHQQMCARYDCERLSNGMHRMLPFN 66PvaHc YFGEDIGLNTHHVTWHMEFPFWWNDAYG-HHLDRKGENFFWIHHQLTVRFDAERLSNYLDPVGELQ 65PirHcC YFGEDVGMNTHHVLWHMEFPFWWEDSSG-RHLDRKGESFFWVHHQLTVRYDAERLSNHLDPVEELS 65PirHcA YFGEDIGMNIHHVTWHMDFPFWWEDSYG-YHLDRKGELFFWVHHQLTARFDFERLSNWLDPVDELH 65
PlePPO YWREDFGINSHHWHWHLVYPIEM-----NVNRDRKGELFYYMHQQMVARYDWERLSVNLNRVEKLE 61PmoPPO YWREDYGINVHHWHWHLIYPPAM-----GFDRDRKGELFYYMHQQVIARYDIERLCLGLPKVEKLD 61BmoPPO1 YFREDIGINLHHWHWHLVYPFDAADRA-IVNKDRRGELFYYMHQQIIARYNVERMCNNLSRVRRYN 65DmePPOA1 YFREDIGVNSHHWHWHLVYPTTGPTE--VVNKDRRGELFYYMHHQILARYNVERFCNNLKKVQPLN 64DmePPO2 YFREDLGINLHHWHWHLVYPFEASDRS-IVAKDRRGELFYYMHQQVIARYNAERFSNNLARVLPFN 65DmePPO3 YFREDLGVNLHHWHWHLVYPIEAPDRS-IVDKDRRGELFYYMHQQIIARYNAERLSNHMARVQPFN 65EcaHcA YFREDIGVNAHHWHWHVVYPSTYDPAFFGKVKDRKGELFYYMHQQMCARYDCERLSNGLNRMIPFH 66EcaHcD YFREDIGINSHHWHWHLVYPAFYDADIFGKIKDRKGELFYYMHQQMCARYDCERLSVGLQRMIPFQ 66EcaHcF YFREDIGANAHHWHWHIVYPPTWDASVMSKVKDRKGELFYYMHQQMCARYDCDRLSTGLRRMIPFH 66LpoHc2 YYREDVGINAHHWHWHLVYPSTWNPKYFGKKKDRKGELFYYMHQQMCARYDCERLSNGMHRMLPFN 66PvaHc YFGEDIGLNTHHVTWHMEFPFWWNDAYG-HHLDRKGENFFWIHHQLTVRFDAERLSNYLDPVGELQ 65PirHcC YFGEDVGMNTHHVLWHMEFPFWWEDSSG-RHLDRKGESFFWVHHQLTVRYDAERLSNHLDPVEELS 65PirHcA YFGEDIGMNIHHVTWHMDFPFWWEDSYG-YHLDRKGELFFWVHHQLTARFDFERLSNWLDPVDELH 65
PlePPO YWREDFGINSHHWHWHLVYPIEM-----NVNRDRKGELFYYMHQQMVARYDWERLSVNLNRVEKLE 61PmoPPO YWREDYGINVHHWHWHLIYPPAM-----GFDRDRKGELFYYMHQQVIARYDIERLCLGLPKVEKLD 61BmoPPO1 YFREDIGINLHHWHWHLVYPFDAADRA-IVNKDRRGELFYYMHQQIIARYNVERMCNNLSRVRRYN 65DmePPOA1 YFREDIGVNSHHWHWHLVYPTTGPTE--VVNKDRRGELFYYMHHQILARYNVERFCNNLKKVQPLN 64DmePPO2 YFREDLGINLHHWHWHLVYPFEASDRS-IVAKDRRGELFYYMHQQVIARYNAERFSNNLARVLPFN 65DmePPO3 YFREDLGVNLHHWHWHLVYPIEAPDRS-IVDKDRRGELFYYMHQQIIARYNAERLSNHMARVQPFN 65EcaHcA YFREDIGVNAHHWHWHVVYPSTYDPAFFGKVKDRKGELFYYMHQQMCARYDCERLSNGLNRMIPFH 66EcaHcD YFREDIGINSHHWHWHLVYPAFYDADIFGKIKDRKGELFYYMHQQMCARYDCERLSVGLQRMIPFQ 66EcaHcF YFREDIGANAHHWHWHIVYPPTWDASVMSKVKDRKGELFYYMHQQMCARYDCDRLSTGLRRMIPFH 66LpoHc2 YYREDVGINAHHWHWHLVYPSTWNPKYFGKKKDRKGELFYYMHQQMCARYDCERLSNGMHRMLPFN 66PvaHc YFGEDIGLNTHHVTWHMEFPFWWNDAYG-HHLDRKGENFFWIHHQLTVRFDAERLSNYLDPVGELQ 65PirHcC YFGEDVGMNTHHVLWHMEFPFWWEDSSG-RHLDRKGESFFWVHHQLTVRYDAERLSNHLDPVEELS 65PirHcA YFGEDIGMNIHHVTWHMDFPFWWEDSYG-YHLDRKGELFFWVHHQLTARFDFERLSNWLDPVDELH 65
PlePPO YWREDFGINSHHWHWHLVYPIEM-----NVNRDRKGELFYYMHQQMVARYDWERLSVNLNRVEKLE 61PmoPPO YWREDYGINVHHWHWHLIYPPAM-----GFDRDRKGELFYYMHQQVIARYDIERLCLGLPKVEKLD 61BmoPPO1 YFREDIGINLHHWHWHLVYPFDAADRA-IVNKDRRGELFYYMHQQIIARYNVERMCNNLSRVRRYN 65DmePPOA1 YFREDIGVNSHHWHWHLVYPTTGPTE--VVNKDRRGELFYYMHHQILARYNVERFCNNLKKVQPLN 64DmePPO2 YFREDLGINLHHWHWHLVYPFEASDRS-IVAKDRRGELFYYMHQQVIARYNAERFSNNLARVLPFN 65DmePPO3 YFREDLGVNLHHWHWHLVYPIEAPDRS-IVDKDRRGELFYYMHQQIIARYNAERLSNHMARVQPFN 65EcaHcA YFREDIGVNAHHWHWHVVYPSTYDPAFFGKVKDRKGELFYYMHQQMCARYDCERLSNGLNRMIPFH 66EcaHcD YFREDIGINSHHWHWHLVYPAFYDADIFGKIKDRKGELFYYMHQQMCARYDCERLSVGLQRMIPFQ 66EcaHcF YFREDIGANAHHWHWHIVYPPTWDASVMSKVKDRKGELFYYMHQQMCARYDCDRLSTGLRRMIPFH 66LpoHc2 YYREDVGINAHHWHWHLVYPSTWNPKYFGKKKDRKGELFYYMHQQMCARYDCERLSNGMHRMLPFN 66PvaHc YFGEDIGLNTHHVTWHMEFPFWWNDAYG-HHLDRKGENFFWIHHQLTVRFDAERLSNYLDPVGELQ 65PirHcC YFGEDVGMNTHHVLWHMEFPFWWEDSSG-RHLDRKGESFFWVHHQLTVRYDAERLSNHLDPVEELS 65PirHcA YFGEDIGMNIHHVTWHMDFPFWWEDSYG-YHLDRKGELFFWVHHQLTARFDFERLSNWLDPVDELH 65
?
![Page 11: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/11.jpg)
Allgemeine Vorgehensweise…
Sequenz 1: KIADKNFTYRHHNQLV Sequenz 2: KVAEKNMTFRRFNDII Sequenz 3: KIADKDFTYRHW-QLV Sequenz 4: KVADKNFSYRHHNNVV Sequenz 5: KLADKQFTFRHH-QLV Sequenz 5
Sequenz 3Sequenz 2Sequenz 4
Sequenz 1
Multiples Sequenzalignment erstellen (DNA oder Protein) Sequenzen vergleichen > Ähnlichkeit bestimmen Aus Ähnlichkeitsmaß die Verwandtschaft rekonstruieren (Baum)
![Page 12: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/12.jpg)
Phylogenie-Rekonstruktion ist kein triviales Problem
• es ist viel leichter und sicherer, einen „unrooted“ Baum zu erstellen: d. h. nur dann „rooten“, wenn die „Outgroup“ klar definiert ist
• mit 3 Taxa kann man 1 unverwurzelten Baum erstellen, aber 3 alternative Bäume mit Wurzel
![Page 13: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/13.jpg)
Phylogenie-Rekonstruktion ist kein triviales Problem
![Page 14: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/14.jpg)
Nochmal die Frage...
Wann DNA? Wann Protein?
Eng verwandte SARS-Varianten in der menschlichen Population
Corona-Virus-Gruppen aus verschiedenen Spezies
![Page 15: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/15.jpg)
Ein Alignment ist immer eine Hypothese zur Sequenzevolution!
SeqA N A – F L S SeqB N A – F - S SeqC N A K Y L S SeqD N A – Y L S
NAYLS NAKYLS NAFS NAFLS
+K -L
Y -> F
Wir waren ja leider nicht direkt dabei....!
![Page 16: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/16.jpg)
Warum ist es nicht einfach, das „beste“ Alignment zu konstruieren?
• 2 Sequenzen à 300 Bp = 1088 mögliche Alignments!!! • Computer-Algorithmen erforderlich, die ohne Ausprobieren aller Möglichkeiten auskommen. • „Regelwerk“ notwendig, um bestmögliches Alignment zu erkennen
![Page 17: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/17.jpg)
seqA TCAGACGATTG (11)seqB TCGGAGCTG (9)
I. TCAG-ACG-ATTGTC-GGA-GC-T-G
II. TCAGACGATTGTCGGAGCTG--
III. TCAG-ACGATTG TC-GGA--GCTG
Aber was ist richtig?
I. Keine mismatches
II. Keine internen Lücken
III. „Von beidem Etwas“
Warum ist es nicht einfach, das „beste“ Alignment zu konstruieren?
Annahmen über den Ablauf der Sequenz-Evolution:
![Page 18: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/18.jpg)
Jede Sequenz lässt sich mit einer jeden anderen Sequenz alignen! Aber macht das Alignment auch Sinn? Also: Haben wir die richtigen An- nahmen über den Verlauf der Evolution getroffen??
Wir brauchen „evolutionäre Modelle“, um ein möglichst richtiges Alignment zu erstellen!
Überlegungen...
![Page 19: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/19.jpg)
Was bedeutet es, ein „Evolutionsmodell“ zu haben?
Ein ‚Evolutionsmodell‘ basiert auf empirischen Daten! Zum Beispiel: Ich weiß, die Aminosäure Cystein ist für die Proteinstruktur äußerst wichtig! " Cysteine sind also konserviert während der Evolution von Proteinen! " Cysteine können daher beim Alignment zweier Proteinsequenzen als Ankerpunkte dienen " ein Alignment mit übereinanderstehenden Cysteinen würde danach mit Pluspunkten ‚belohnt‘
Bov Co-V SARS Mur HepV
![Page 20: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/20.jpg)
SARS: konservierte Cysteine im Alignment des spike-Proteins
Resultat: Verwandtschaft von SARS zu Gruppe 2-Coronaviren?
Eickmann et al. 2003
![Page 21: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/21.jpg)
Ein einfacher Score-Wert zur Bewertung eines Alignments
S = Y - ∑ Wk x Zk
S = Similarity-Score (‚Belohnungspunkte‘)Y = Anzahl an Matches
Zk = Anzahl der gaps mit Länge kWk = gap penalty für gaps der Länge k
Mit Setzen der gap penalty trifft man Annahmen über dierelative Häufigkeit von indel-Mutationen während der Evolution!
![Page 22: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/22.jpg)
Eine einfache Substitutions-matrix für Nukleotidsequenzen
A C G TA C G T
1
1
1
1
0
0
0
0
0 0
• alle Richtungen von Nt-Austauschen sind gleich wahrscheinlich • bei jedem „match“ beider Sequenzen gibt es 1 Belohnungspunkt für den Übereinstimmungs-Score
![Page 23: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/23.jpg)
Substitutions-Matrizen für Proteine
• bei Proteinen gibt es 20 As! • chemisch-funktionelle Ähnlichkeit bestimmt Wahrscheinlichkeit eines Austauschs während der Evolution. Daher... • ...sind die „Kosten“ für bestimmte Austausche (bzw. die Beloh- nung für gleiche As) unterschiedlich hoch! • Definition der „Kosten/Belohnungen“ erfolgt über Matrizen:
z. B. PAM-Matrizen (Dayhoff 1978)
Lys Arg
![Page 24: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/24.jpg)
PAM-Matrizen...
...definieren ‚Belohnungswerte‘ für zwei Aminosäuren, die sich in einem Alignment gegenüber- stehen:
• positiver Wert = Aminosäuren, die sich häufig in Alignments gegenüberstehen und somit ‚funktionell konserviert‘ sind
z.B. W-W 17 C -C 12
aber W-V - 6
Margaret Dayhoff
![Page 25: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/25.jpg)
Wir haben also Kriterien (Substitutionsmatrizen, gap penalties), um Alignments zu bewerten. Aber wie werden Alignments überhaupt erstellt?
![Page 26: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/26.jpg)
Needleman-Wunsch (N-W) 1970
• Bei Erstellung des Alignments werden zunächst kleine Problem-Schritte gelöst. Dann wird aus den Teillösungen das Gesamtalignment rekonstruiert... • Algorithmus: „dynamic programming“
![Page 27: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/27.jpg)
Needleman-Wunsch
![Page 28: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/28.jpg)
• es wird zunächst eine zweidimensionale Matrix mit den beiden zu vergleichenden Sequenzen erstellt
• in die Zellen der Matrix wird der Alignment-Score für die jeweils verglichenen Sequenzpositionen hineingeschrieben. Die Berechnung des Score-Werts erfolgt natürlich anhand einer Substitutionsmatrize.
• das Alignment ergibt sich als Pfad durch die Matrix. Der Pfad mit der höchsten Endsumme gewinnt...
Needleman-Wunsch
![Page 29: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/29.jpg)
N-W ist eine exakte Vorgehensweise und viel zu aufwändig für multiple Sequenzvergleiche! Wir brauchen....
Heuristik (altgr. εὑρίσκω heurísko „ich finde“; von εὑρίσκειν heurískein ‚auffinden‘, ‚entdecken‘) bezeichnet die Kunst, mit begrenztem Wissen (unvollständigen Informationen) und wenig Zeit dennoch zu wahrscheinlichen Aussagen oder praktikablen Lösungen zu kommen.[1] Es bezeichnet ein analytisches Vorgehen, bei dem mit begrenztem Wissen über ein System mit Hilfe mutmaßender Schlussfolgerungen Aussagen über das System getroffen werden. Die damit gefolgerten Aussagen können von der optimalen Lösung abweichen.
www.wikipedia.de
![Page 30: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/30.jpg)
30
A B C D
1) Sequenzvergleich
Alle Sequenzen werden miteinander verglichen (Option A: schnelles "quick and dirty" Alignment Option B: exaktes, langsames Needleman-Wunsch) => Berechnen der Distanzen
Progressives Alignment
![Page 31: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/31.jpg)
31
"guide tree"
A D B C
2) Ähnliche Sequenzen werden gruppiert
=> Cluster-Analyse = Erstellung eines hierarchischen Stammbaums ("guide tree").
-‐ D
0.77 -‐ C
0.82 0.45 -‐ B
0.27 0.89 0.75 -‐ A
D C B A
Progressives Alignment
![Page 32: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/32.jpg)
32
A D B C
3) Alignment von nahe verwandten Sequenzen; die ähnlichsten zuerst.
B C
A D
Progressives Alignment
![Page 33: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/33.jpg)
33
B C
A D
A D
B C
A D B C
4) Sukzessives globales Alignment
„alte“ gaps erhalten, neue hinzugefügt
Progressives Alignment
![Page 34: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/34.jpg)
34
Progressives Alignment
1. paarweiser Vergleich aller Sequenzen miteinander => Berechnung der Distanzen zweier Sequenzen 2. gruppiert Sequenzen nach Ähnlichkeit (Cluster-‐Bildung) 3. Erstellung paarweiser Alignments 4. sukzessives Alignment nach Ähnlichkeit, dabei die ähnlichsten Sequenzpaare zuerst
Feng & Doolittle (1987): PileUp (GCG package)
Higgins and Sharp (1988), Thompson et al. (1994): CLUSTAL
Notredame et al. (2000): T-COFFEE
![Page 35: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/35.jpg)
Allgemeine Vorgehensweise…
Sequenz 1: KIADKNFTYRHHNQLV Sequenz 2: KVAEKNMTFRRFNDII Sequenz 3: KIADKDFTYRHW-QLV Sequenz 4: KVADKNFSYRHHNNVV Sequenz 5: KLADKQFTFRHH-QLV Sequenz 5
Sequenz 3Sequenz 2Sequenz 4
Sequenz 1
Multiples Sequenzalignment erstellen (DNA oder Protein) Sequenzen vergleichen > Ähnlichkeit bestimmen Aus Ähnlichkeitsmaß die Verwandtschaft rekonstruieren (Baum)
Zur Erinnerung:
![Page 36: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/36.jpg)
Vom Alignment zu einem einfachen Baum-Rekonstruktionsverfahren…
Aus dem Alignment ergibt sich zunächst, wie ähnlich oder unähnlich die Sequenzen zueinander sind. Meist wird eine Distanzmatrix erstellt:
A B C D OTU A 0 6 10 18 OTU B 0 12 20 OTU C 0 19 OTU D 0
* OTU = operational taxonomic unit: z. B. Spezies, Gen, Protein
*
![Page 37: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/37.jpg)
Vom Alignment zu einem einfachen Baum-Rekonstruktionsverfahren…
UPGMA =
Unweighted Pair-Group Method using Arithmetric Means
Sokal and Michener 1967!
…eine Methode, die auf der Berechnung von Unähnlichkeiten (Distanzen) der alignierten Sequenzen beruht („Distanz-Methode“)
![Page 38: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/38.jpg)
UPGMA
A B C D OTU A 0 6 10 18 OTU B 0 12 20 OTU C 0 19 OTU D 0
3 A
3 B
2.5
5.5 C
3 A
3 B
61.
2.
Ausgangs-Distanz-Matrix
A/B C D OTU A/B 0 11 19 OTU C 0 19 OTU D 0
Neu berechnete Distanz-Matrix
(AC + BC) / 2
![Page 39: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/39.jpg)
UPGMA
A/B/C D Sequenz A/B/C 0 19 Sequenz D 0
A
3 B
2.5
5.5 C
D
4
9.5
3 3. Neu berechnete Distanz-Matrix
![Page 40: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/40.jpg)
UPGMA
![Page 41: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/41.jpg)
UPGMA-Problem
A B C D OTU A 0 6 10 18 OTU B 0 12 20 OTU C 0 19 OTU D 0
A B C D OTU A 0 6 11 19 OTU B 0 11 19 OTU C 0 19 OTU D 0
A
3 B
2.5
5.5 C
D
4
9.5
3
Ausgangsmatrix
rekonstruierte Matrix
Astlängen des UPGMA-Baums passen nicht exakt zur Realität...
![Page 42: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/42.jpg)
Practical Exercises 4
• Build a phylogenetic tree manually using UPGMA • Produce “multiple” nucleotide and amino acid sequence alignment of SARS genes and proteins • Where did SARS originate and how did it spread in the population? > Prepare a nt-based tree from different SARS genomes • Which are the distant relatives of SARS coronavirus? > Prepare an aa-based tree for the spike protein
![Page 43: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/43.jpg)
SARS-Verwandschaft RNA Polymerase (As) Spike Protein (As)
Unterschiedliche Datensätze und Rekonstruktionsmethoden können leicht unterschiedliche Baum-Topologien ergeben!! Aber: SARS Co-V ist alter Verwandter der Gruppe 2 Coronaviren
![Page 44: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/44.jpg)
SARS- Phylogenie: Ausbreitung
![Page 45: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/45.jpg)
SARS-Phylogenie: Herkunft? DNA (Komplettgenom)
• Varianten sind >99% identisch. Dennoch ist eine geographische Zuordnung möglich.
Sequenz zeigt Besonderheit: Sein Spike-Gen hat Insertion von 29 Bp, die sonst nur in tierischen SARS-Verwandten gefunden worden ist!
![Page 46: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/46.jpg)
SARS-Phylogenie: Herkunft?
![Page 47: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/47.jpg)
SARS: zoonotischer Ursprung
Larvenroller - palm civet (Paguma larvata)
Marderhund - Raccoon dog (Nyctereutes procyonoides)
![Page 48: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/48.jpg)
![Page 49: Das Szenario ein neues tödliches Virus!molgen.biologie.uni-mainz.de/.../PDFs/Genomforsch/Modul42-Hankeln-B.pdf · Molekulare Phylogenie • Verwandtschaft von Organismen (molekulare](https://reader030.vdocuments.mx/reader030/viewer/2022040701/5d5c826488c9934a238b6d87/html5/thumbnails/49.jpg)
Das Szenario ...ein neues tödliches Virus!
• Labor: Isolierung der Erbsubstanz und Sequenzierung • Computer: Erkennen der Virusgene (de novo Genvorhersage)
Ähnlichkeit zu bekannten Genen? (Datenbanksuchen)
Verwandtschaft? Ausbreitung? Herkunft? (Phylogenetische Rekonstruktion)
Struktur der Proteine? (Struktur-Vorhersage, -Modellierung) Wirkstoff-Design
• Labor: Wirkstoff-Test