genetikkurs für die studiengänge biochemie und molekulare...

22
1 Genetikkurs für die Studiengänge Biochemie und Molekulare Biotechnologie (1. Semester) Lilla Römisch-Margl, Christian Lindermayr, Erich Glawischnig 9.-12.3., Mo-Do 09:15 – 16:00 Uhr Prüfung Fr. 13.3.2015, voraussichtlich 13:00h Bitte schließen Sie sich selbständig zu Gruppen von 2-3 Personen zusammen. Tragen Sie sich in die entsprechende Liste ein. Alle Fragen / Übungen sollen in diesen Gruppen bearbeitet werden. Bitte Gruppennummer merken! Die Übungen in diesem Skript beziehen sich z.T. direkt auf die Vorlesung im Kurs. Die entsprechenden Folien finden Sie im Downloadbereich der Genetik- Homepage. Inhalte des Kurses sind: A. Klassische Genetik, Genotyp – Phänotyp B. Kopplung - Molekulare Marker C. Restriktionsanalyse D. Genetischer Fingerabdruck / PCR E. Promotoren und Reportergene F. Gene, cDNAs und Homologie-Datenbanksuche G. Kopplung - Quantitative Trait Loci (QTL) A. Klassische Genetik Übungen: 1. Kreuzungsanalyse Eine Käferart besitzt 3 mögliche Flügelfarben, blau, grün und türkis. Zufällig gefangene Individuen einer polymorphen Population wurden miteinander gekreuzt. Kreuzung Eltern (Phänotyp) Nachkommen(Phänotyp) 1 blau x grün alle blau 2 blau x blau 3/4 blau, 1/4 türkis 3 grün x grün 3/4 grün, 1/4 türkis 4 blau x türkis 1/2 blau, 1/2 türkis 5 blau x blau 3/4 blau, 1/4 grün 6 blau x grün 1/2 blau, 1/2 grün 7 blau x grün 1/2 blau, 1/4 grün, 1/4 türkis 8 türkis x türkis alle türkis Was ist die genetische Grundlage der Flügelfarben? Geben Sie so vollständig, wie möglich die Genotypen von Eltern und Nachkommen an.

Upload: lamlien

Post on 18-Aug-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

1

Genetikkurs für die Studiengänge Biochemie und Molekulare Biotechnologie (1. Semester) Lilla Römisch-Margl, Christian Lindermayr, Erich Glawischnig 9.-12.3., Mo-Do 09:15 – 16:00 Uhr Prüfung Fr. 13.3.2015, voraussichtlich 13:00h Bitte schließen Sie sich selbständig zu Gruppen von 2-3 Personen zusammen. Tragen Sie sich in die entsprechende Liste ein. Alle Fragen / Übungen sollen in diesen Gruppen bearbeitet werden. Bitte Gruppennummer merken! Die Übungen in diesem Skript beziehen sich z.T. direkt auf die Vorlesung im Kurs. Die entsprechenden Folien finden Sie im Downloadbereich der Genetik-Homepage. Inhalte des Kurses sind:

A. Klassische Genetik, Genotyp – Phänotyp B. Kopplung - Molekulare Marker C. Restriktionsanalyse D. Genetischer Fingerabdruck / PCR E. Promotoren und Reportergene F. Gene, cDNAs und Homologie-Datenbanksuche G. Kopplung - Quantitative Trait Loci (QTL)

A. Klassische Genetik Übungen: 1. Kreuzungsanalyse Eine Käferart besitzt 3 mögliche Flügelfarben, blau, grün und türkis. Zufällig gefangene Individuen einer polymorphen Population wurden miteinander gekreuzt. Kreuzung Eltern (Phänotyp) Nachkommen(Phänotyp) 1 blau x grün alle blau 2 blau x blau 3/4 blau, 1/4 türkis 3 grün x grün 3/4 grün, 1/4 türkis 4 blau x türkis 1/2 blau, 1/2 türkis 5 blau x blau 3/4 blau, 1/4 grün 6 blau x grün 1/2 blau, 1/2 grün 7 blau x grün 1/2 blau, 1/4 grün, 1/4 türkis 8 türkis x türkis alle türkis Was ist die genetische Grundlage der Flügelfarben? Geben Sie so vollständig, wie möglich die Genotypen von Eltern und Nachkommen an.

Page 2: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

2

2. Kreuzungsanalyse Meerschweinchen kommen mit den Fellfarben Dunkelbraun (B), Sepia (S), Creme (C) und Albino (A) vor. Verschiedene Meerschweinchen (nicht notwendigerweise reinerbig) wurden miteinander gekreuzt und erhielten folgende Nachkommen (die jeweilige Anzahl ist angegeben): Kreuzung Eltern (Phänotyp) Nachkommen(Phänotyp) B S C A 1 B x B 22 0 0 7 2 B x A 10 9 0 0 3 C x C 0 0 34 11 4 S x C 0 24 11 12 5 B x A 13 0 12 0 6 B x C 19 20 0 0 7 B x S 18 20 0 0 8 B x S 14 8 6 0 9 S x S 0 26 9 0 10 C x A 0 0 15 17 Was ist die genetische Grundlage der Fellfarben? Geben Sie so vollständig, wie möglich die Genotypen von Eltern und Nachkommen an. Das dunkelbraun gefärbte Elterntier aus Kreuzung 7 wird mit dem dunkelbraun gefärbten Elterntier aus Kreuzung 8 gekreuzt. Welche Verteilung der Nachkommen erwarten Sie? 3. Kreuzungsanalyse Zwei reinerbige Kürbispflanzen wurden gekreuzt, ein lang gestreckter und ein diskusartiger. Die Früchte der F1-Generation werden alle diskusartig. In der F2 ergab sich folgende Verteilung (Anzahl der Nachkommen): diskusartig: 270 kugelförmig: 178 lang gestreckt: 32 Was ist wahrscheinlich die genetische Grundlage der Kürbisform? Geben Sie so vollständig, wie möglich die Genotypen von Eltern, F1 und F2 an. 4. Kreuzungsanalyse Ananas-Blätter kommen in 3 Typen vor: Stachlig (S), angespitzte Blätter (A), röhrenförmig (nichtstachlig) (R). Reinerbige Pflanzen wurden gekreuzt: Kreuzung Eltern (Phän.) F1 (Phänotyp) F2(Phänotyp) 1 A x S A 99 A : 34 S 2 R x A R 120 R : 39 A 3 R x S R 95 R : 25 A : 8 S Wie lassen sich diese Ergebnisse erklären? Geben Sie mit selbst gewählten Symbolen die Genotypen dieser Pflanzen an.

Page 3: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

3

5. Blutgruppe Auf einer Säuglingsstation sind 4 Säuglinge durcheinander gebracht worden. Sie besitzen die Blutgruppen 0, A, B und AB. Auch bei den jeweiligen Elternpaaren sind die Blutgruppen bekannt:

a) AB x 0 b) A x 0 c) A x AB d) 0 x 0

Ordnen Sie die Kinder ihren Eltern zu. 6. Blutgruppe 2 In einem Gerichtsstreit zwischen 2 Männern soll die Vaterschaft von 3 Kindern einer Frau geklärt werden. Dazu werden Blutgruppen verwendet. Neben dem AB0-System auch das MN-System (hier bestimmen 2 co-dominante Allele eines Gens die Blutgruppen M, N und MN) und der Rhesusfaktor (Rh+ dominant, Rh- rezessiv). Blutgruppe Mann 1 0 M Rh+

Mann 2 AB MN Rh-

Mutter A N Rh+

Kind 1 0 MN Rh+

Kind 2 A N Rh+

Kind 3 A MN Rh-

In wieweit lässt sich so die Vaterschaft für die einzelnen Kinder entscheiden? Chi-Quadrat (χ2) Test, Übungen I 1. Welche Hypothese würden sie im vorgestellten Beispiel (Folien) auswählen, wenn die F2-Maiskörner folgende Verteilungen zeigen: A. Von 1.000 Körnern sind 790 schwarz und 210 bronze. B. Von 100 Körnern sind 31 schwarz und 69 bronze. C. Von 1.000 Körnern sind 310 schwarz und 690 bronze

Page 4: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

4

B. Kopplung – Molekulare Marker Genkopplung und Genkartierung –Kartierung mit sichtbaren Markern SSLP und CAPS Marker – Kartierung mit molekularen Markern Kartieren Sie mit Hilfe eines gegebenen molekularen Markers zwei weitere molekulare Marker im Genom von Arabidopsis thaliana, d.h. bestimmen Sie die Lage der unbekannten Marker relativ zur Lage des bekannten Markers. Die Arabidopsis thaliana Ökotypen Columbia und Landsberg erecta weisen über das gesamte Genom verteilte Polymorphismen (Sequenzunterschiede) auf. Solche Polymorphismen können mit Hilfe von molekularen Markern sichtbar gemacht und für die Kartierung von unbekannten Loci verwendet werden. Nach folgendem Schema sind aus einer Kreuzung der Ökotypen Landsberg erecta und Columbia F2-Pflanzen erstellt worden, die für eine Kartierung verwendet werden können. loc steht für einen beliebigen Locus im Genom von Arabidopsis thaliana. P locLer / locLer x locCol / locCol F1 locLer / locCol (100) Selbstung F2 locLer / locLer + locLer / locCol + locCol / locCol (25:50:25) Ler = Ökotyp Landsberg erecta Col = Ökotyp Columbia Nachweis von DNA-Polymorphismen mit SSLP (Simple Sequence Length Polymorphism) und CAPS (Cleaved Amplified Polymorphic Sequences) Markern Der Nachweis von DNA-Polymorphismen an definierten Positionen im Genom erfolgt bei SSLP Markern in einem, bei CAPS Markern in zwei Schritten: Bei beiden Markertypen wird die polymorphe Sequenz mittels PCR amplifiziert. Bei SSLP Markern wird ein Längenpolymorphismus direkt durch die Größe der spezifischen PCR Produkte sichtbar gemacht. Mit CAPS Markern wird ein Restriktionspolymorphismus detektiert, also eine Sequenz, die durch ein bestimmtes Restriktionsenzym geschnitten werden kann oder nicht. Bei CAPS Markern muss das PCR-Produkt also noch mit einem Restriktionsenzym verdaut werden. Durch gelelektrophoretische Trennung der Produkte des Restriktionsverdaus wird der Polymorphismus sichtbar gemacht.

Hier werden zwei SSLP Marker (SSLP1 und SSLP2) und ein CAPS Marker (CAPS1) auf Chromosom V verwendet. Die zu erwartenden Bandenmuster für die homozygoten Ökotypen Landsberg erecta und Columbia sind (in kb):

Page 5: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

5

SSLP1 SSLP2 CAPS1 (XbaI) Ler/Ler 0,6 0,13 0,5 + 0,7 Col/Col 0,7 0,17 1,2 Anhand der PCR-Ergebnisse kann man jeder Pflanze in einer Population einen Genotyp für jeden der drei verwendeten Marker zuweisen. Beispiel: Die Pflanzen A und B ergeben folgendes Bandenmuster (in kb): Marker: SSLP1 Marker: SSLP2 Marker: CAPS1 Pflanze A 0,7 0,13 + 0,17 0,5 + 0,7 Pflanze B 0,6 + 0,7 0,13 0,5 + 0,7 + 1,2 Die möglichen Genotypen sind jeweils Ler/Ler oder Ler/Col (bzw. Col/Ler) oder Col/Col. (NB: Die Genotypen Ler/Col und Col/Ler können mit diesen Markern nicht unterschieden werden.) Das erhaltene Bandenmuster für die Pflanzen A und B lässt sich also wie folgt zusammenfassen: F2-Pflanze Nr.

SSLP1 Ler/ Ler

SSLP1 Ler/ Col

SSLP1 Col/ Col

SSLP2 Ler/ Ler

SSLP2 Ler/ Col

SSLP2 Col/ Col

CAPS1 Ler/ Ler

CAPS1 Ler/ Col

CAPS1 Col/ Col

Pflanze A - - - - - -

Pflanze B - - - - - -

Arabidopsis thaliana Chromosom V: 26,99 Mbp (physikalische Karte)

132,6 cM (genetische Karte)

Bestimmung von Rekombinationsfrequenzen und genetischen Abständen Der genetische Abstand zwischen zwei Loci oder Markern wird anhand der Rekombinationshäufigkeit zwischen diesen Loci bestimmt. Genetische Abstände

CAPS1 = EG7F2 (24,34 Mbp, ca. 115 cM) Wo auf Chromosom V liegen die

Marker SSLP1 und SSLP2?

Page 6: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

6

liefern Informationen über die relative Lage von Loci zueinander. Eine Rekombinationsfrequenz von 1% entspricht dabei 1 cM (centiMorgan) oder 1 m.u. (map unit). Der physikalische Abstand zwischen zwei Loci wird in Basenpaaren (bp) gemessen. Genetischer und physikalischer Abstand sind nicht proportional, d.h. die Beziehung Basenpaare pro centiMorgan ist nicht konstant. Die Rekombinationsfrequenz zwischen zwei Loci wird hier aus der Nachkommenschaft einer Ausgangskreuzung ermittelt indem die Häufigkeit von erkennbar rekombinanten Individuen in der vorliegenden Population bestimmt wird. Für zwei beliebige Loci loc1 und loc2 gilt für die Kreuzung aus Columbia und Landsberg erecta (s. oben) folgendes Kreuzungsschema. Kreuzungsschema F1 loc1Ler loc2Ler loc1Col loc2Col Bezüglich loc1 und loc2 bringt diese doppelt heterozygote F1-Pflanze vier verschiedenen Gametentypen hervor, zwei parentale und zwei rekombinante Gameten. Aus der Kombination dieser Gameten ergeben sich 16 F2-Klassen mit verschiedenen Allelkombinationen. F2

männliche Gameten weibliche Gameten

parentale

rekombinante

loc1Ler loc2Ler

loc1Col loc2Col

loc1Col loc2Ler

loc1Ler loc2Col

parentale

loc1Ler loc2Ler loc1Col loc2Col

1 loc1Ler loc2Ler loc1Ler loc2Ler

2 loc1Col loc2Col loc1Ler loc2Ler

3 loc1Col loc2Ler loc1Ler loc2Ler

4 loc1Ler loc2Col loc1Ler loc2Ler

5 loc1Ler loc2Ler loc1Col loc2Col

6 loc1Col loc2Col loc1Col loc2Col

7 loc1Col loc2Ler loc1Col loc2Col

8 loc1Ler loc2Col loc1Col loc2Col

rekombinante

loc1Col loc2Ler loc1Ler loc2Col

9 loc1Ler loc2Ler loc1Col loc2Ler

10 loc1Col loc2Col loc1Col loc2Ler

11 loc1Col loc2Ler loc1Col loc2Ler

12 loc1Ler loc2Col loc1Col loc2Ler

13 loc1Ler loc2Ler loc1Ler loc2Col

14 loc1Col loc2Col loc1Ler loc2Col

15 loc1Col loc2Ler loc1Ler loc2Col

16 loc1Ler loc2Col loc1Ler loc2Col

parentale Klassen: 1, 2, 5, 6 rekombinante Klassen: 3, 4, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 parentale und doppelt rekombinante Klassen, die nicht unterscheidbar sind: 2, 5, 12, 15 erkennbare = auswertbare, rekombinante Klassen: 3, 4, 7, 8, 9, 10, 11, 13, 14, 16 Jedes F2-Individuum lässt sich experimentell einer bestimmten Allelkombination zuordnen. Bestimmte Allelkombinationen sind im Kreuzungsschema einmalig,

Page 7: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

7

andere kommen mehrfach vor. Deshalb lässt sich jedes F2-Individuum entweder zu einer bestimmten F2-Klasse oder zu einer Gruppe von F2-Klassen zuordnen. Das Kreuzungsschema zeigt, dass jedes F2-Individuum zu einer von insgesamt 16 Klassen gehört. Diese Klassen gehen auf vier verschiedene Gameten zurück, zwei parentale und zwei rekombinante Gametentypen. Die beiden parentalen Typen und die beiden rekombinanten Typen werden jeweils im Verhältnis 1:1 gebildet, d.h. dass jedes Mal wenn der parentale Typ loc1Ler loc2Ler gebildet wird, zwingend auch der zweite parentale Typ loc1Col loc2Col entsteht. Entsprechend liegen auch die rekombinanten Typen loc1Col loc2Ler und loc1Ler loc2Col im Verhältnis 1:1 vor. Der Anteil der rekombinanten Gameten ist durch die Rekombinationsfrequenz (p) gegeben. Bei einer gegebenen Rekombinationsfrequenz (p) lässt sich die Frequenz von rekombinanten Gameten mit p angeben, die Frequenz der parentalen Gameten als 1-p. Die Frequenz jeder einzelnen F2-Klasse ergibt sich durch Multiplikation der Frequenzen der Gameten, aus denen sie hervorgeht. Frequenzen der Gameten und resultierende Frequenzen der F2-Klassen in Abhängigkeit der Rekombinationsfrequenz p

männliche Gameten weibliche Gameten

1 - p parentale

p rekombinante

(1-p)/2 loc1Ler loc2Ler

(1-p)/2 loc1Col loc2Col

p/2 loc1Col loc2Ler

p/2 loc1Ler loc2Col

1 - p parentale

(1-p)/2 loc1Ler loc2Ler (1-p)/2 loc1Col loc2Col

1 (1-p)2/4 loc1Ler loc2Ler loc1Ler loc2Ler

2 (1-p)2/4 loc1Col loc2Col loc1Ler loc2Ler

3 (p-p2)/4 loc1Col loc2Ler loc1Ler loc2Ler

4 (p-p2)/4 loc1Ler loc2Col loc1Ler loc2Ler

5 (1-p)2/4 loc1Ler loc2Ler loc1Col loc2Col

6 (1-p)2/4 loc1Col loc2Col loc1Col loc2Col

7 (p-p2)/4 loc1Col loc2Ler loc1Col loc2Col

8 (p-p2)/4 loc1Ler loc2Col loc1Col loc2Col

p rekombinante

p/2 loc1Col loc2Ler p/2 loc1Ler loc2Col

9 (p-p2)/4 loc1Ler loc2Ler loc1Col loc2Ler

10 (p-p2)/4 loc1Col loc2Col loc1Col loc2Ler

11 (p/2)2 loc1Col loc2Ler loc1Col loc2Ler

12 (p/2)2 loc1Ler loc2Col loc1Col loc2Ler

13 (p-p2)/4 loc1Ler loc2Ler loc1Ler loc2Col

14 (p-p2)/4 loc1Col loc2Col loc1Ler loc2Col

15 (p/2)2 loc1Col loc2Ler loc1Ler loc2Col

16 (p/2)2 loc1Ler loc2Col loc1Ler loc2Col

Gibt es keine Rekombination zwischen den Loci, so folgt p = 0 und 1-p = 1, d.h. es kommen nur parentale Gameten vor. Die Loci sind in diesem Fall eng gekoppelt und das Kreuzungsschema reduziert sich auf das obere linke Viertel. Die Loci befinden sich auf demselben Chromosom in unmittelbarer Nachbarschaft.

Page 8: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

8

Der maximale Wert für p ist p = 0,5, d.h. jeder der vier Gametentypen kommt mit der gleichen Frequenz von 0,25 vor. Die Loci sind in diesem Fall ungekoppelt und segregieren unabhängig voneinander. Die Loci sind auf unterschiedlichen Chromosomen lokalisiert oder sie liegen auf demselben Chromosom in einem sehr großen Abstand voneinander. Zwischen den beiden Extremen kann p jeden Wert annehmen: 0 ≤ p ≤ 0,5. Das entspricht dem genetischen Abstand, der Werte zwischen 0 cM (gekoppelte Loci) und 50 cM (ungekoppelte Loci) einnehmen kann. Die Auswertung der doppelt rekombinanten Klasse 16 (loc1Ler loc2Col / loc1Ler loc2Col) stellt die einfachste Möglichkeit dar, die Rekombinationsfrequenz p zu bestimmen. Die Anzahl der Klasse 16-Individuen kann experimentell bestimmt werden und wird hier mit N16 bezeichnet. Die Frequenz x der Klasse 16-Individuen beträgt dann also N16/S = x, wobei S die Individuenzahl der untersuchten Population darstellt. Die Frequenz der Klasse 16 in Abhängigkeit von der Rekombinationsfrequenz p beträgt (p/2)2. Wir erhalten N16 / S = x = (p/2)2. Auflösung nach p ergibt: Gleichung 1 (Auswertung nach Klasse 16)

!

p = 2 x Bezieht man zusätzlich zu Klasse 16 die Klasse 11 ein, setzt also N11,16 gleich der Summe der Individuen in den Klassen 11 und 16, erhält man N11,16 / S = x = 2 (p/2)2, da beide Klassen jeweils mit der Frequenz (p/2)2 vorkommen. Auflösung nach p ergibt: Gleichung 2 (Auswertung nach Klassen 11, 16)

!

p = 2x Diese Art der Auswertung ist theoretisch korrekt, aber relativ ungenau, weil die Rekombinationsfrequenz p aus den Frequenzen von nur einer bzw. zwei F2-Klassen extrapoliert wird. Die bestmögliche Auswertung ergibt sich, wenn alle rekombinanten Klassen, die sich eindeutig zuordnen lassen, einbezogen werden. Im vorliegenden Fall sind das 10 Klassen (3, 4, 7, 8, 9, 10, 11, 13, 14, 16 im Kreuzungsschema). Na sei jetzt die Summe aller Individuen dieser 10 Klassen. Diese 10 Klassen setzen sich zusammen aus zwei Klassen mit der Frequenz (p/2)2 und acht Klassen mit der Frequenz (p – p2)/4. Damit erhalten wir: Na / S = x = 2 (p/2)2 + 8 (p – p2)/4 Umformung ergibt: x = 2 p – 3/2 p2

– 2/3 x = p2 – 4/3 p – 2/3 x = (–p + 2/3)2 – 4/9

Auflösung nach p ergibt dann:

Gleichung 3 (Auswertung nach Klassen 3, 4, 7, 8, 9, 10, 11, 13, 14, 16)

!

p =23"

49"23x

Molekulare Marker – Übung Benutzen Sie die Beispieldaten von 50 Pflanzen der F2-Generation auf der nächsten Seite und berechnen Sie den genetischen Abstand in cM zwischen SSLP1/SSLP2, SSLP1/CAPS1 und SSLP2/CAPS1. Berechnen Sie die Abstände (1.) auf der Basis der doppelt rekombinanten Klassen 11 und 16, (2.) auf der Basis aller auswertbaren rekombinanten Klassen und (3.) wie unter (2.), aber zusätzlich mit Haldane Korrektur. Wo liegen SSLP1 und SSLP2? Zeichnen Sie die Markerpositionen in der Abbildung auf Seite 5 ein.

Page 9: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

9

F2-P

flanz

e N

r.

SSLP

1 Le

r/Ler

SSLP

1 Le

r/Col

SSLP

1 C

ol/C

ol

SSPL

2 Le

r/Ler

SSPL

2 Le

r/Col

SSPL

2 C

ol/C

ol

CA

PS1

Ler/L

er

CA

PS1

Ler/C

ol

CA

PS1

Col

/Col

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

Page 10: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

10

Übungen (Kopplung) Zwei-Faktorkreuzung (Maiskörner) Gen Coulorless 1: C1 Chr 9 Position 26 cM

Anthocyanbiosynthese C1 Farbe ist dominant über c1 farblos Gen Shrunken 1: Sh1, Chr. 9 Position 29 cM

Stärkebiosynthese Sh1: glatt ist dominant über sh1 shrunken

Gen Shrunken 2: Sh2, Chr. 2 Position 149 cM

Stärkebiosynthese Sh2: glatt ist dominant über sh2 shrunken

Bestimmen Sie die Genotypen und Phänotypen der folgenden Kreuzungen. Geben Sie die Frequenzen der einzelnen Phänotypen in Prozent an (ohne Haldane-Korrektur). Kreuzung 1 C1 Sh2 C1 sh2 c1 sh2 c1 sh2 Kreuzung 2 C1Sh1 C1sh1 c1sh1 c1sh1 Kreuzung 3 C1sh1 C1sh1 c1Sh1 c1sh1 Zwei-Faktorkreuzung II, Epistasie (Maiskörner) Gen Coulorless 1: C1 Chr 9 Position 26 cM Flavonoidbiosynthese C1 Farbe ist dominant über c1 farblos Gen Anthocyaninless 1: A1 Chr.4, Position 149 cM Anthocyanbiosynthese A1 Farbe ist dominant über a1 farblos Gen Bronze 1: Bz1 Chr. 9 Position 31 cM Anthocyanbiosynthese Bz1 schwarz ist dominant über bz1 bronze Gen Bronze 2: Bz2 Chr. 1 Position 106 cM Anthocyanbiosynthese Bz2 schwarz ist dominant über bz2 bronze Epistatische Beziehung: C1 - A1 > Bz1 - Bz2

x

x

x

Page 11: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

11

Bestimmen Sie die Genotypen und Phänotypen der folgenden Kreuzungen. Geben Sie die Frequenzen der einzelnen Phänotypen in Prozent an (ohne Haldane-Korrektur). Kreuzung 4 C1 a1 c1 A1 c1 A1 c1 a1 Kreuzung 5 C1 bz2 c1 Bz2 c1 Bz2 c1 bz2 Kreuzung 6 C1bz1 c1Bz1 c1Bz1 c1bz1 Kreuzung 7 C1Bz1 c1Bz1 c1bz1 c1bz1 Molekulare Kartierung 1 Mit dem Primerpaar Hum1/Hum2 kann ein Polymorphismus auf Chromosom 1 bestimmt werden. Es wird ein Fragment von 200 bp oder von 500 bp amplifiziert. Mit dem Primerpaar Dro1/Dro2 kann ein Polymorphismus auf Chromosom 3 bestimmt werden. Es wird ein Fragment von 300 bp oder von 800 bp amplifiziert. Machen Sie eine Skizze für das Gel auf dem die PCR-amplifizierte DNA der zwei Individuen A (Mutter) und B (Vater) aufgetragen ist. Dabei trägt die Mutter homozygot das 200 bp Allel Hum1/2 und homozygot das 800 bp Allel von Dro1/2, der Vater homozygot das 500 bp Allel von Hum1/2 und homozygot das 300 bp Allel von Dro1/2. Wie sieht das Ergebnis der PCR-Analyse mit Hum1/2 und Dro1/2 für die Kinder des Paares aus (Skizze)? Eine Tochter des Paares hat Kinder mit einem Mann, der folgende Allele trägt: Hum1/2 500 bp Allel homozygot, Dro1/2 800 bp-Allel homozygot. Wie sieht die Verteilung der Hum1/2 und Dro1/2 Allele in deren Nachkommenschaft aus. Machen Sie eine Skizze und geben sie die Wahrscheinlichkeit des Auftretens der verschiedenen Genotypen an.

x

x

x

x

Page 12: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

12

Molekulare Kartierung 2 Mit dem Primerpaar Hum1/Hum2 kann ein Polymorphismus auf Chromosom 1 bestimmt werden. Es wird ein Fragment von 200 bp oder von 500 bp amplifiziert. Mit dem Primerpaar Ara1/Ara2 kann ein weiterer Polymorphismus auf Chromosom 1 bestimmt werden, es wird ein Fragment von 400 bp oder von 1000 bp amplifiziert. Ara und Hum sind vollständig gekoppelt. Machen Sie eine Skizze für das Gel auf dem die PCR-amplifizierte DNA der zwei Individuen A (Mutter) und B (Vater) aufgetragen ist. Dabei trägt die Mutter homozygot das 200 bp Allel Hum1/2 und homozygot das 400 bp Allel von Ara1/2, der Vater homozygot das 500 bp Allel von Hum1/2 und homozygot das 1000 bp Allel von Ara1/2. Wie sieht das Ergebnis der PCR-Analyse mit Hum1/2 und Ara1/2 für die Kinder des Paares aus (Skizze)? Eine Tochter des Paares hat Kinder mit einem Mann, der folgende Allele trägt: Hum1/2 200 bp Allel homozygot, Ara1/2 400 bp-Allel homozygot. Wie sieht die Verteilung der Hum1/2 und Ara1/2 Allele in deren Nachkommenschaft aus. Machen Sie eine Skizze und geben sie die Wahrscheinlichkeit des Auftretens der verschiedenen Genotypen an. Chi-Quadrat (χ2) Test, Übungen II Sie isolieren eine Mutante, deren Nachkommen zu 100% weiße Blütenblätter zeigen. Diese Mutante wird mit dem Wildtyp gekreuzt, der ausschließlich rote Blütenblätter zeigt. Die resultierenden F1 Pflanzen werden geselbstet. Eine größere Anzahl von F2 Individuen wird angezogen. Hypothese 1: Mutanten-Phänotyp wird verursacht durch eine rezessive Mutation im nuklearen Genom. Hypothese 2: Mutanten-Phänotyp wird verursacht durch zwei dominante Mutationen an zwei Loci im nuklearen Genom. Hypothese 3: Mutanten-Phänotyp wird verursacht durch eine dominante Mutation und eine rezessive Mutation an zwei Loci im nuklearen Genom im Abstand von 10 cM. - Wie hoch ist jeweils der vorhergesagte Anteil an Mutanten in der F2 Generation basierend auf den verschiedenen Hypothesen? Nehmen Sie an, dass in der F2 Generation folgende Verteilungen beobachtet werden. A. Von 100 Individuen der F2 Generation haben 60 weiße Blütenblätter und 40 rote Blütenblätter

Page 13: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

13

B. Von 1.000 Individuen der F2 Generation haben 246 weiße Blütenblätter und 754 rote Blütenblätter - Welche Hypothese kann die Verteilung von Mutanten und Wildtypen im Fall A. und B. jeweils am besten erklären? Berechnen sie die zugehörigen χ2-Werte für die Hypothesen 1 - 3. - Wie viele Individuen müssten im Fall B ungefähr getestet werden, um zwischen den Hypothesen 1 und 3 diskriminieren zu können? C. Restriktionsanalyse Restriktionskartierung 1 Der Nachweis eines rekombinanten Plasmids durch Isolierung einer Transformante mit dem gewünschten Phänotyp ist kein eindeutiger Beweis für eine erfolgreiche Klonierung. Um rekombinante Fremd-DNA eindeutig zu identifizieren und zu charakterisieren, ist es notwendig, die Plasmid-DNA der rekombinanten Transformante genauer zu untersuchen. Eine von verschiedenen Möglichkeiten ist die Restriktionsanalyse isolierter Plasmid-DNA. Bereits kleine Mengen aufgereinigter Plasmid-DNA erlauben die Konstruktion einer Restriktionskarte des Plasmids. Dies geschieht durch einen Verdau der DNA mit verschiedenen Restriktionsenzymen und Analyse der entstandenen DNA-Fragmente auf einem Agarose-Gel. Die Größe der Fragmente kann durch Vergleich mit DNA-Fragmenten bekannter Größe bestimmt werden. Um eine Karte des rekombinanten Plasmids zu konstruieren, ist es notwendig, die Position von Restriktionsschnittstellen im klonierten Fragment in Beziehung zu setzen mit bekannten Schnittstellen des Ausgangsplasmids. Dies kann einfach durch einen "Doppelverdau" der gleichzeitigen oder aufeinander folgenden Spaltung der DNA mit zwei Enzymen bewerkstelligt werden. Durch Vergleich und Größenbestimmung der von Einzel- und Doppelverdaus erzeugten DNA-Fragmente lässt sich dann die exakte Lage sowie die Orientierung der einklonierten DNA bestimmen. Restriktionskarten der Plasmide pBR322 und pBlueskriptSK+

pBR322

PstI 3609

2066 PvuII

0

? SalI

EcoRI

657 KpnI 719 BamHI PvuI 2416

pBSK+ T7-Promoter

Page 14: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

14

DNA-Fragmentlängen-Standard ist 1kB+ Die Fragmentlängen in kb: 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1.6 (stärker), 1, 0.85, 0.65, 0.5, 0.4, 0.3, 0.2, 0.1 Restriktionsenzyme: EcoRl G + AATTC Sall G + TCGAC Pstl CTGCA + G XhoI C + TCGAG Aufgaben 1. Erstellen Sie mit Hilfe der Standard-DNA eine Eichkurve. Tragen Sie auf halblogarithmischem Papier Wanderstrecke gegen log DNA-Länge (in kb) auf. 2. Bestimmen Sie die Größe von pBR322. Ergänzen Sie in nachstehender Karte die fehlenden Werte bei den Positionsangaben der Restriktionsschnittstellen. 3. Bestimmen Sie die Größe des Plasmids pBR322-LEU2. Wie groß ist das einklonierte LEU2-Fragment? Weshalb kann es nach der Klonierung nicht mehr mit dem Enzym Sall aus dem Plasmid herausgeschnitten werden, mit dem pBR322 geöffnet wurde? 4. Zeichnen Sie eine grobe Karte von pBR322-LEU unter Angabe der experimentell bestimmten Fragmentlängen.

1 2 3 4 5 6 7 8 1 2 3 4

1. pBR322 geschnitten mit EcoRl (= pBR322 x EcoRl)2. pBR322 x EcoRl+Sall3. pBR322 x Sall4. pBR322 x Pstl+Sall5. pBR322-LEU2 x Sall6. pBR322-LEU2 x Pstl+EcoR17. pBR322-LEU2 x EcoRl8. pBR322-LEU2 x EcoRl+Sall

Page 15: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

15

Restriktionskartierung 2 Der Plasmid-Vektor pBluskriptSK+ ist 3,0 kb groß. An Position 657 bp findet sich die einzige KpnI-Erkennungsstelle, an Position 719 die einzige BamHI-Erkennungsstelle, an Position 2416 bp die einzige PvuI-Erkennungsstelle. Sie wollen in pBluskriptSK+ ein 3 kb großes KpnI Fragment klonieren, das Fragment hat keine BamHI-Erkennungsstelle aber einen internen PvuI-Schnitt, der das Fragment in 1 kb und 2kb unterteilt. Mit welchen Restriktionsverdauen können Sie die Klonierung des Fragments in den Vektor beweisen, welche Größe haben die entstehenden Restriktionsfragmente. Ihr 3 kb KpnI-Fragment soll in RNA überschrieben werden. Dies kann nach Klonierung in den pBluskriptSK+-Vektor mit der T7-RNA-Polymerase erfolgen. Der Promotor für die T7-RNA-Polymerase liegt upstream (5’-wärts) der BamHI-Schnittstelle. Das 5’-Ende ihres Gens liegt an dem Ende ihres KpnI-Fragments, das downstream nach 1 kb eine PvuI-Schnitt aufweist. Welches Restriktionsmuster haben die Plasmide, die Sie für die Transkription einsetzen können? DNA-Konzentration Bestimmung der DNA-Konzentration Für die Analyse isolierter DNA ist es wichtig, die Konzentration von DNA-Präparation zu kennen. Diese wird photometrisch bestimmt. Die Beziehung von DNA-Absorption und DNA-Konzentration ist linear: Doppelsträngige DNA OD260=1 => Konzentration der DNA: 50 µg/ml Das Verhältnis OD260/OD280 gibt die Güte der DNA-Präparation an: Reine DNA OD260/OD280 = 1,8-2,0 Ein niedrigerer Wert bedeutet, dass die Präparation auch Proteine enthält. Konzentration der DNA-Präparation = Konzentration der Verdünnung x Verdünnungsfaktor, also c (µg/ml) = A260 x 50 µg/ml x Verdünnungsfaktor Ausbeute = Konzentration der DNA-Präparation x Volumen, also m (µg) = c (µg/ml) x V (ml) Aufgabe: Sie haben Plasmid-DNA isoliert. Das Volumen der DNA-Lösung beträgt 100 µl. Von dieser Lösung werden 20 µl entnommen und 980 µl Wasser gegeben. Diese Verdünnung wird im Photometer gemessen. Es ergibt sich eine OD260 von 0,1. Welche Konzentration hat die Ausgangslösung? Wie viel µg Plasmid haben sie isoliert? Wie viel µl der Ausgangslösung müssen Sie einsetzen, wenn sie 0.5 µg verdauen wollen.

Page 16: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

16

D. Genetischer Fingerabdruck / PCR Die Polymerase Ketten Reaktion (Polymerase Chain Reaction, PCR) ermöglicht es, definierte Bereiche einer DNA in vitro zu amplifizieren. Der zu amplifizierende Bereich wird durch zwei Primer, kurze gegenläufige Oligonukleotide mit Homologie zum linken und rechten Ende der Ziel-DNA, bestimmt. In einem ersten Schritt wird eine komplexe DNA, die die Zielsequenz enthält, bei 94°C denaturiert. In einem zweiten Schritt wird die Temperatur so weit abgesenkt, dass die Primer an die homologen Bereiche der Zielsequenz hybridisieren (Annealing). Im dritten Schritt wird von einer thermostabilen DNA-Polymerease (Taq-Polymerase) die Zielsequenz synthetisiert, und zwar jeweils ausgehend vom linken und rechten Primer. Die Zielsequenz wird daher verdoppelt. Der Zyklus aus diesen drei Schritten wird nun vielfach (meist 30mal) wiederholt. Unter idealen Reaktionsbedingungen verdoppelt sich bei jedem neuen Zyklus die Anzahl der DNA-Moleküle mit der Zielsequenz, da natürlich auch die neu synthetisierten DNA-Moleküle als Matrize für die Neusynthese verwendet werden können. In 30 Zyklen können so theoretisch aus einem DNA-Molekül 230 Moleküle entstehen, eine DNA Menge, die auf Agarosegelen sichtbar gemacht bzw. kloniert oder sequenziert werden kann. Die PCR-Technik wird unter anderem in der Medizin und der Forensik (Verbrechensaufklärung) eingesetzt. Eine Anwendung ist die Amplifizierung von Genbereichen aus menschlicher DNA, die einen Polymorphismus aufweisen. Durch die Verwendung mehrerer verschiedener Primerpaare kann so ein "genetischer Fingerabdruck" erstellt werden, der es z.B. ermöglicht, Gewebeproben einem bestimmten Menschen zuzuordnen. Aufgabe Sie sollen das angegebene DNA-Fragment (von dem nur der Einzelstrang angegeben ist) mit Hilfe der PCR-Methode vollständig vervielfältigen. Wählen Sie die dafür nötigen einzelsträngigen DNA-Primer aus, die jeweils eine Länge von 10 Nukleotiden haben sollen. Geben Sie die Sequenzen in 5' 3' Orientierung an. 5'-GGTGTCCTGTGGATCCGNNAAANNGNGGTCTATGCCTGTTATA-3'

Page 17: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

17

E. Promotoren und Reportergene Datenbankrecherche mit Promotorsequenzen Sie untersuchen die Expressionsmuster des uidA-Reportergens unter der Kontrolle von 4 verschiedenen Promotoren A, B, C, D. Die Promotorsequenzen A, B, C, D können Sie als Text-File unter http://genetik.wzw.tum.de/index.php?id=10 im Downloadbereich für Vorlesungsmaterialien „Promotor-Sequenzen“ herunter laden. Login und Passwort werden bekannt gegeben. 1. Um welche Promotoren handelt es sich? Welche Gene werden normalerweise von diesen Promotoren kontrolliert? Für die Gene im Arabidopsisgenom gibt es eine einheitliche Nomenklatur in der Form AtXgYYYYY (AGI Identifier). At steht für Arabidopsis thaliana, X ist eine Zahl zwischen 1 und 5 und bezeichnet das Chromosom oder C (Plastidengenom) bzw. M (Miochondriengenom), g steht für Gen, und mit der 5-stelligen Zahl (YYYYY) werden die Gene entlang des Chromosoms durchnummeriert (z.B At3g26830). Finden Sie für B, C, und D den entsprechendee AGI-Identifier des durch den jeweiligen Promotor kontrollierten Gens! Dazu müssen Sie eine Datenbanksuche durchführen. blastn ist das gängigste Programm, mit dem Datenbanken nach ähnlichen DNA-Sequenzen durchsucht werden können. Das blastn Programm ist online u.a. zugänglich unter:

- http://www.ncbi.nlm.nih.gov/BLAST/ - Wählen Sie dort die Option „nucleotide blast [blastn]“ und Sie erhalten das

entsprechende Eingabefenster. - Unter „Search“ können Sie Ihre DNA-Sequenz über die Tastatur oder per

cut&paste eingeben. - Wählen Sie unter „Database“ die Option „Others“ aus. - Starten Sie die Suche durch Klicken auf BLAST! Das Ergebnis erhalten

Sie dann durch Klicken auf Format! - Als Ergebnis erhalten Sie eine Liste von Blast Hits, beginnend mit dem

Datenbankeintrag mit der größten Ähnlichkeit zu Ihrer Sequenz. Wenn sie als Blast Hits genomische Sequenzen erhalten, so liegt die codierende Sequenz des kontrollierte Gens downstream der entsprechenden Promotorsequenz. Beachten Sie dabei, dass ein Gen auch auf dem complementären Strang liegen kann (complement). Falls Sie zusätzlich weitere Informationen zu dem entsprechenden Gen benötigen können Sie in einer Literaturdatenbank eine Stichwortsuche durchführen, beispielsweise mit dem Gennamen: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?

Page 18: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

18

2. Gezielte Suche nach Expressionsdaten: Datenbanken mit Arraydaten. Für Arabidopsis thaliana gibt es, ähnlich anderen Modellorganismen, Oligoarrays (Chips) mit denen die Expression eines Großteils der Gene in einem bestimmten Gewebe, einem bestimmten Entwicklungsstadium, oder einer bestimmten Stressbehandlung untersucht werden kann. Viele dieser „Array-Daten“ sind in Datenbanken abgelegt und können so miteinander verglichen werden. Mit Hilfe des AGI-Identifiers kann für ein bestimmtes Gen die entwicklungs- und Stress-spezifische Expression abgefragt werden. Finden Sie so heraus, wie, im Rahmen der Genauigkeit von Array-Experimenten, die von den Promotoren B, C und D kontrollierten Gene exprimiert sind. Empfohlene Website: „Electronic Fluorescent Protein“ http://bbc.botany.utoronto.ca/efp/cgi-bin/efpWeb.cgi

- Anschauliche (bildliche) Darstellung der Stärke der Genexpression. - „Primary AGI ID“: Hier AGI-Identifier eingeben! - „Data Source“: Hier wählen Sie der Reihe nach die verschiedenen

Kategorien aus. Machen Sie, anhand dieser Ergebnisse (+ ev. Ergebnisse einer Literaturrecherche) Vorhersagen über die Expression des uidA-Reportergens unter der Kontrolle dieser Promotoren (GUS-Experiment)! F. Gene, cDNAs und Homologie-Datenbanksuche Jede Gruppe soll eine Arabidopsis oder Mais cDNA-Sequenz bearbeiten. Es handelt sich dabei um „Rohdaten“, die durch Sequenzierung von cDNA-Klonen erzeugt wurden. Die entsprechenden Sequenz-Chromatogramme und zugehörigen Nucleotid-Sequenzen finden Sie als pdf- bzw. Text-Files unter http://genetik.wzw.tum.de/index.php?id=10 im Downloadbereich (cDNA -Sequenzen). Login und Passwort werden bekannt gegeben. Bitte bearbeiten Sie eine Sequenz entsprechend Ihrer Gruppennummer: Gruppe Sequenz 1, 21,... seq1 2, 22,... seq2 3, 23,... seq3 4, 24,... seq5 5, ... seq6 6, ... seq8 7, ... seq9 8, ... seq10 9, ... seq87 10, ... seq88 11, ... seq90

Page 19: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

19

12, ... seq91 13, ... seq92 14, ... seq94 15, ... seq95 16, ... seq96 17, ... seq97 18, ... seq99 19, ... seq91 20, ..... seq2 Sequenzauswertung Zur Sequenzierung Ihrer im pBluescript enthaltenen cDNA wird der T3-Primer oder SK-Primer eingesetzt. Dementsprechend stammt der Anfang der erhaltenen DNA-Sequenz vom Vektor (vgl. Vektorkarte pBluescript). Die Vektorsequenz stört bei der Auswertung und wird deshalb entfernt. Suchen Sie dazu innerhalb der ersten 100 Basen die EcoRI-Erkennungssequenz (5’-GAATTC-3’). Die EcoRI-Sequenz ist Teil des bei der cDNA Synthese verwendeten EcoRI-Adapters (5’-GAATTCGGCACGAGG-3’). Die eigentliche cDNA-Sequenz schließt in 3’ Richtung unmittelbar an den Adapter an. Entfernen Sie auch vor der Datanbanksuche Sequenzen die qualitativ schlecht sind (viele Basen hintereinander, die nicht eindeutig zuzuordnen sind – im pdf-File zu erkennen) Zur Auswertung soll mit der erhaltenen cDNA-Sequenz eine Datenbanksuche mit den Programmen „nucleotide blast“ und „blastx“ (http://www.ncbi.nlm.nih.gov/BLAST/) durchgeführt werden.

- Für „nucleotide blast“ (vergleicht eine DNA-Sequenz mit DNA-Datenbanksequenzen) wählen Sie unter „Database“ die Option „Others“ und geben Sie unter „Organism“ den Begriff Viridiplantae ein (grüne Pflanzen). Damit wird die Suche auf DNA Sequenzen pflanzlicher Herkunft beschränkt.

- Für „blastx“ (übersetzt die DNA Sequenz, mit der gesucht wird, in die sechs möglichen Proteinsequenzen und vergleicht diese mit Protein-Datenbanksequenzen). Unter „Organism“ auch hier „Viridiplantae“ eingeben; ansonsten Default-Einstellungen verwenden.

Notieren Sie jeweils die Namen (Definitions) der drei besten Hits in der Ergebnisliste. Klicken Sie dazu nacheinander auf die entsprechenden Accessions in der Liste. Sie erhalten dann den vollständigen, zum betreffenden Blast Hit gehörenden Datenbankeintrag. Die Definition finden Sie in der zweiten Zeile der Einträge. Unter Umständen befinden sich unter diesen Hits keine Definitionen mit bekannter Funktion, wie z.B. ein Enzymname. In diesem Fall betrachten Sie die ersten 10 – 20 Hits und suchen nach Sequenzen mit bekannter Funktion. Möglicherweise kodiert Ihre cDNA für ein Protein mit ähnlicher Funktion. Ein solches Ergebnis ist jedoch lediglich ein Hinweis und muss mit großer Vorsicht behandelt werden.

Page 20: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

20

- Welche Bereiche sind Vektorsequenz, welche EST-Sequenz - Ergebnisse des BLAST-search (siehe oben) - Sollte die BLAST-Suche ergeben, dass es sich bei dem EST um ein

bekanntes Gen oder um ein Homolog zu einem bekannten Gen handelt, beschreiben Sie kurz die Funktion dieses Gens. Hierzu kann eine Stichwortsuche unter http://www.ncbi.nlm.nih.gov/entrez/query.fcgi? hilfreich sein.

Übung Homologie-Datenbanksuche Die folgenden GenBank-Identifier repräsentieren 3 Enzyme mit bekannter Funktion in verschiedenen Biosynthesewegen in Arabidopsis thaliana. 1. GI:15235430 (TRPA) 2. GI:15228293 (GLDH) 3. GI:15238899 (ARGSL) http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?CMD=search&DB=protein - Unter der obigen URL erhalten Sie bei Angabe des 8-stelligen Identifiers (nur Ziffern) den Datenbankeintrag dieser Enzyme, der die Aminosäuresequenz enthält. Notieren Sie die Namen der drei Enzyme. Die zugehörigen Loci im Arabidopsis Genom (im Format AT1G28240) finden Sie unter „locus_tag“. - In der Datenbank KEGG kann man die Position von Genen bzw. Enzymen im Metabolismus verschiedener Organismen finden. http://www.genome.ad.jp/kegg/kegg2.html Um nach den oben genannten Enzymen zu suchen, klicken Sie unter „DBGET Search“ auf „ENZYME“. Enzyme haben sehr häufig uneinheitliche Namen in verschiedenen Datenbanken. Wenn Sie unter dem vollen Namen aus dem GenBank-Eintrag keinen Hit bekommen, suchen sie mit einem Teil des Namens. Die Hits aus dieser Suche sind (via E.C. Nummer) mit der KEGG-Hauptseite für das entsprechende Enzym verlinkt. Auf dieser Seite gibt es den Eintrag „Pathway“, unter dem ein oder mehrere Biosynthesewege gelistet sind, in denen das Enzym eine Funktion hat. In den verlinkten metabolischen Karten ist das gesuchte Enzym rot markiert. Stellen Sie fest, welchen Schritt in welchem Biosyntheseweg jedes der drei Enzyme katalysiert. Alternativ können Sie diese Informationen auch mit dem Tool „AraCyc“ (http://www.arabidopsis.org/biocyc/index.jsp) bekommen, das auf den Metabolismus von Arabidopsis spezialisiert ist. Suchen Sie dort unter „Query“ mit den Enzymnamen oder den A.t.-Loci.

Page 21: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

21

- Gehen Sie zu http://www.ncbi.nlm.nih.gov/BLAST/, und dann zu „protein blast“ (blastp). Unter Angabe der 8-stelligen Identifier im Feld „Search“ führen Sie nacheinander Datenbanksuchen mit den Aminosäuresequenzen von allen drei Enzymen durch. Unter „ Algorithm parameters“ wählen Sie als maximale Zahl von Zielsequenzen (Max target sequences) „1000“ aus und geben Sie unter „ Expect threshold“ den Wert „0.001“ ein; ansonsten Default Einstellungen verwenden. Wie gewohnt erhalten Sie eine nach Signifikanz geordnete Liste von Treffern. Die Spezies-Verteilung aller Treffer aus der blastp-Suche finden Sie unter „Taxonomy reports“. Suchen Sie nach Treffern für die Modellorganismen E. coli, S. cerevisiae, O. sativa, C. elegans, D. melangoster, M. musculus, H. sapiens. Welche der drei Enzyme aus Arabidopsis haben homologe Enzyme in diesen Modellorganismen? Interpretieren Sie Ihr Ergebnis bezüglich der Anwesenheit oder Abwesenheit der entsprechenden Biosynthesewege in den Modellorganismen. G. Kopplung – Quantitative Trait Loci (QTL) 1. Kartierung von Markerpositionen Berechnen Sie die genetische Distanz (cM) für alle unten aufgeführten Markerpaarungen (T175 – C35, C35 – T93, etc.). Bezüglich jeder der zehn Markerpaarungen ist der Genotyp der Eltern 1 und 2 (P1 und P2) jeweils durch aabb bzw. AABB symbolisiert, der F1-Genotyp war AaBb. Für jede Markerpaarung finden Sie in der Tabelle die Anzahl von F2-Individuen in bestimmten Genotypklassen. Klären Sie zunächst folgende Fragen:

- Welche der 9 Genotypklassen in der Tabelle sind parentale Typen, welche sind rekombinant?

- Welche der drei Gleichungen aus Abschnitt B. können Sie hier prinzipiell zur Berechnung der genetischen Distanz einsetzen? Welche dieser Gleichungen muss hier verwendet werden, um ein sinnvolles Ergebnis zu erhalten?

Benutzen Sie anschliessend die Haldane Funktion (s. Folien), um korrigierte Distanzen zu erhalten. Zeichnen Sie jeweils eine Karte für die Kopplungsgruppen auf Chromosom 1 und Chromosom 2 auf Basis der korrigierten Distanzen.

Page 22: Genetikkurs für die Studiengänge Biochemie und Molekulare ...plantdev.bio.wzw.tum.de/fileadmin/media/pptLecturesSNZ/Genetik_Uebung... · A. Klassische Genetik Übungen: 1. Kreuzungsanalyse

22

FREQUENCY of marker pairs within linkage group P1 P2 abs. aa aa aa Aa Aa Aa AA AA AA Freq. bb Bb BB bb Bb BB bb Bb BB chrom1 T175 *C35 276 133 11 0 10 118 1 0 0 3 C35 *T93 276 103 29 5 15 105 14 0 1 4 T93 *C66 281 88 26 4 9 121 9 0 5 19 C66 *T50B 284 92 13 1 24 120 6 1 11 16 chrom2 T24 *C15 271 57 9 2 17 113 12 0 23 38 C15 *T125 304 64 20 0 3 147 10 0 2 58 T125 *T71 305 52 12 3 22 125 21 1 23 46 T71 *T83 316 57 19 2 24 113 29 4 25 43 T83 *T209 274 36 40 0 14 115 8 0 13 48 T209 *T17 258 36 11 0 68 87 4 5 5 42