genomy - brown rozdział 2 - ocr
TRANSCRIPT
R O Z D Z I A Ł
Mapowanie genomów technikami genetycznymi
Spis treści
2.1 Mapy genetyczne i fizyczne 15 2.2 Markery dla map genetycznych 15
2.2.1 Geny były pierwszymi stosowanymi markerami 15 2.2.2 Markery DNA do mapowania genetycznego 18
2.3 Sposoby podejścia do mapowania genetycznego 22 2.3.1 Analiza sprzężeń jest podstawą mapowania
genetycznego 22 2.3.2 Przeprowadzanie analizy sprzężeń u różnych
typów organizmów 28
14 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Fakty i założenia Mapowanie genetyczne do tworzenia map genomów wykorzystuje takie techniki genetyczne jak krzyżowanie organizmów i analiza rodowodów. Pierwotnie jako markerów używano genów, lecz obecnie uzupełniono je o markery DNA takie jak RFLP, SSLP i SNP.
Podstawą mapowania genetycznego jest obliczenie częstości rekombinacji poprzez analizę sprzężeń.
Jeśli możliwe są eksperymenty hodowlane, to przeprowadza się dwu- lub wielopunktowe krzyżówki testowe. Trudności w mapowaniu genów u człowieka wynikają z ograniczeń analizy rodowodów. Analiza genetyczna bakterii wymaga przeniesienia genów z jednej komórki do drugiej.
Następne trzy rozdziały opisują techniki i strategie stosowane do otrzymania sekwencji genomu. Techniki te obejmują znacznie więcej niż tylko same metody sekwencjonowania DNA, które oczywiście mają fundamentalne znaczenie. Mają także jedno podstawowe ograniczenie: nawet stosując najbardziej rozwinięte technologie, rzadko można w jednym eksperymencie otrzymać sekwencję dłuższą niż 750 bp, co oznacza, że sekwencję długiej cząsteczki DNA trzeba składać z serii krótszych sekwencji. Jednym z podejść jest podzielenie cząsteczki na fragmenty, ustalenie sekwencji każdego z nich i użycie komputera do znalezienia zachodzących na siebie fragmentów, a następnie złożenie oryginalnej sekwencji (rys. 2.1). Opisana strategia typu „shotgun" stanowi standardowe podejście do sekwencjonowania małych genomów prokariotycznych, ale ze wzrostem liczbv fragmentów, niezbędna analiza danych staje się niewspółmiernie bardziej złożona (dla n fragmentów liczbę możliwych zakładek opisuje 2n2-2n). Drugim problemem w metodzie „shotgun" jest możliwość powstawania błędów podczas analizy repetycyjnych regionów genomu. Jeśli sekwencję zawierającą powtórzenia podzieli się na fragmenty, w wielu otrzymanych kawałkach będą takie same lub bardzo podobne motywy sekwencyjne. Łatwo można złożyć te sekwencje tak, że część regionów powtarzających się zostanie usunięta, a nawet tak, że dwa fragmenty tego samego lub różnych chromosomów zostaną ze sobą błędnie połączone (rys. 2.2).
Samo podejście „shotgun" jest więc nieodpowiednie dla większych, bardziej złożonych genomów. Zamiast tego, wpierw należy stworzyć mapę genomu. Mapa genomu stanowi przewodnik do prac nad sekwen-cjonowaniem, pokazując pozycje genów i innych charakterystycznych rodzajów sekwencji.
Gdy dostępna jest mapa, fazę sekwencjonowania można przeprowadzić na jeden z dwóch sposobów (rys. 2.3):
DNA
fragmenty
sekwencje
Rysunek 2.1 Podejście „shotgun" do składania sekwencji
Cząsteczkę D N A dzieli się na mate fragmenty, z których każdy jest sekwencjonowany. Oryginalną sekwencję składa się przez poszukiwanie zachodzących na siebie kawałków sekwencji pochodzących z poszczególnych fragmentów. W praktyce, by ustalić, że dwie sekwencje należy ze sobą połączyć, potrzeba zakładki o długości kilkudziesięciu par zasad
2.2 MARKERY DLA MAP GENETYCZNYCH 15
powtarzający się DNA
500 bp
DNA
fragmenty
sekwencje
nieprawidłowa zakładka
Rysunek 2.2 Problemy spotykane przy podejściu „shotgun"
W przedstawionym przykładzie cząsteczka D N A zawiera dwa segmenty powtarzającego się D N A , z których każdy składa się z wielu kopii motywu GATTA. Podczas badania sekwencji okazuje się, że dwa fragmenty z różnych części D N A zachodzą na siebie. Może to prowadzić do błędnej interpretacji, w której centralny segment cząsteczki D N A zostanie pominięty, a jeśli dwa powtarzalne segmenty D N A pochodziły z różnych chromosomów, sekwencje tych chromosomów mogą zostać błędnie złożone
• Przez zastosowanie kontigów klonów (sekcja 4.2.2). Genom dzieli się na nadające się do obróbki segmenty, każdy o długości kilkuset kb lub kilku Mb, sekwencjonowane następnie indywidualnie, przeważnie metodą „shotgun". Po ukończeniu sekwen-cjonowania segmentu można go umieścić w prawidłowym miejscu na mapie.
• Poprzez ukierunkowaną strategię „shotgun" (sekcja 4.2.3). Strategia ta wykorzystuje określone punkty na mapie genomu jako znaczniki do pomocy w składaniu głównej sekwencji z wielkiej liczby krótkich sekwencji otrzymanych przez podejście „shotgun". Mapy używa się także do sprawdzenia, czy nie popełniono błędów w składaniu sekwencji regionów powtarzalnych. Teoretycznie w ten sposób można zsekwencjonować cały genom człowieka (Venter i wsp., 1998).
W obu podejściach mapa stanowi szkic do kolejnej fazy projektu, czyli sekwencjonowania. Pewne typy map wskazują także pozycje genów, umożliwiając skierowanie początkowej fazy projektu sekwencjonowania na interesujące regiony genomu tak, aby sekwencje istotnych genów otrzymać tak szybko, jak to jest możliwe. Z tych powodów pierwsze 6 lat Projektu Poznania Genomu Człowieka poświęcono prawie całkowicie na mapowanie genomu człowieka, a nie na jego sekwencjonowanie.
2.1 MAPY GENETYCZNE I FIZYCZNE
Tradycyjnie metody mapowania genomu dzieli się na dwie kategorie
Mapowanie genetyczne opiera się na stosowaniu technik genetycznych do konstruowania map pokazujących pozycje genów i innych charakterystycznych rodzajów sekwencji w genomie. Techniki genetyczne obejmują krzyżowanie organizmów lub, w przypadku ludzi, badanie historii rodzin (rodowodów). Mapowanie genetyczne opisano w tym rozdziale. Mapowanie fizyczne wykorzystuje techniki biologii molekularnej do badania cząsteczek DNA bezpo średnio w celu skonstruowania map pokazujących pozycje różnych typów sekwencji z genami włącz nie. Mapowanie fizyczne opisano w następnym rozdziale.
2.2 MARKERY DLA MAP GENETYCZNYCH
Jak każdy rodzaj mapy, mapa genetyczna musi pokazywać pozycje poszczególnych genów w stosunku do określonych wyznaczników, czyli markerów. Na mapach geograficznych takimi markerami są rozpoznawalne składniki krajobrazu, jak rzeki, drogi i budynki. A jakich markerów możemy użyć w krajobrazie genetycznym?
2.2.1 Geny byty pierwszymi stosowanymi markerami
W pierwszych mapach genetycznych, konstruowanych na początku XX wieku dla organizmów takich jak muszka owocowa, jako markerów używano genów. Było to wiele lat przed tym, nim zrozumiano, że geny są segmentami cząsteczek DNA. Geny traktowano wówczas jako abstrakcyjne jednostki odpowiedzialne za przekazywanie cech dziedzicznych z rodziców na potomstwo. By być użyteczną w analizie genetycznej, cecha dziedziczna musi występować w dwóch alternatywnych formach lub fenotypach, czego przykładem jest występowanie długich i krótkich łodyg u roślin groszku badanego przez Mendla. Każdy fenotyp jest określany przez inny allel odpowiadającego mu genu. Na początku jedynymi genami nadającymi się do badania były takie, które odpowiadały fenotypom rozróżnialnym wzrokowo. Tak więc na przykład pierwsze mapy genomu muszki owocowej pokazywały pozycje genów odpowiedzialnych za barwę ciała, kolor oczu, kształt skrzydeł i podobnych. Wszystkie wymienione fenotypy można obserwować po prostu patrząc na muchy przez lupę o niewielkim powiększeniu lub okiem nieuzbrojonym. We wczesnych latach genetyki takie podejście było odpowiednie, ale genetycy szybko zdali sobie sprawę, że w ten sposób można badać dziedziczenie zaledwie ograniczonej liczby fenotypów nadających się do obserwacji wzrokowej, a w wielu przypadkach analiza jest trudniejsza, ponieważ na pojedynczą cechę fizyczną wpływa więcej niż jeden
16 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Analiza kontigów klonów
Analiza typu „shotgun"
mapa genomowa mapowany segment DNA
sekwencjonowanie „shotgun" zmapowanego segmentu
złożona sekwencja
złożone sekwencje
pozycja sekwencji jest już znana
markery używane do zakotwiczenia złożonych sekwencji na mapie
Rysunek 2.3 Alternatywne podejścia do sekwencjonowania genomu
Zmapowano genom, składający się z liniowej cząsteczki D N A długości 2,5 Mb i poznano pozycje ośmiu markerów (A-H). Z lewej - analiza kontigów klonów rozpoczyna się od segmentu DNA, którego pozycję na mapie genomu zidentyfikowano, ponieważ zawiera) markery A i B. Segment sekwencjonuje się metodą „shotgun" i otrzymaną sekwencję umieszcza się w znanej pozycji na mapie. Z prawej - ukierunkowana strategia „shotgun" obejmuje losowe sekwencjonowanie całego genomu. Uzyskuje się kawałki nieprzerwanych sekwencji, prawdopodobnie o długości setek kb. Jeśli nieprzerwana sekwencja zawiera marker, to można ją umieścić w odpowiednim miejscu na mapie. Zauważ, że w obu metodach im więcej markerów znajduje się na mapie genomu, tym lepiej. Więcej szczegółów dotyczących tych strategii sekwencjonowania - patrz podrozdział 4.2.
gen. Na przykład do roku 1922 zmapowano ponad 50 genów na czterech chromosomach muszki owocowej, lecz dziewięć z nich stanowiły geny koloru oczu i każdy nowicjusz, mający nadzieję na wniesienie czegoś nowego do tej dziedziny, wpierw musiał nauczyć się rozróżniać kolory oczu muchy: czerwony, jasnoczerwony i inne odcienie czerwieni, takie jak: cynober (cinnabar, vermilion), kolor granatu (garnet), cielisty (carnation), sepia, szkarłat (scarlet), różowy (pink), purpura (cardinal) lub bordo (claret). Aby stworzyć bardziej ogólne mapy genów, konieczne stało się znalezienie cech bardziej policzalnych, dających się lepiej rozróżniać i mniej złożonych niż nadające się do obserwacji wzrokowej.
Odpowiedzią było wykorzystanie biochemii do rozróżniania fenotypów, szczególnie ważne u dwóch typów organizmów - mikroorganizmów i ludzi. Mikro
organizmy, jak na przykład bakterie i drożdże, mają niewiele cech, które można obserwować wzrokowo, więc mapowanie genów tych organizmów musi opierać się na fenotypach biochemicznych, takich jak wymienione w tabeli 2.1. Ludzie także mają cechy obserwowal-ne wzrokowo, ale już od lat dwudziestych badano fenotypy biochemiczne uzyskiwane przez typowanie krwi, i były to nie tylko standardowe grupy krwi jak ABO (Yamamoto i wsp., 1990), lecz także warianty alleliczne białek osocza krwi i białka immunologiczne, jak antygeny leukocytów człowieka (system HLA - ang. human leukocyte antigens). Dużą przewagą takich markerów nad fenotypami widzialnymi jest występowanie alleli wielokrotnych w wielu istotnych genach (Mori i wsp., 1997). Na przykład gen nazywany HLA--DRB1 posiada przynajmniej 59 alleli, a HLA-B przynajmniej 60. Ma to znaczenie ze względu na sposób, w jaki
markery 500 kb
sekwencjonowanie metodą „shotgun" catego genomu
2.2 MARKERY DLA MAP GENETYCZNYCH 17
Ramka 2 . 1 : Krótki przewodnik po genetyce mendlowskiej
Mapowanie genetyczne opiera się na zasadach dziedziczenia po raz pierwszy opisanych przez Grzegorza Mendla w roku 1865 (Orel, 1995). Z wyników krzyżowania roślin grochu Mendel wyciągnął wniosek, że każda roślina grochu ma dwa allele każdego genu, ale tylko jeden fenotyp. Łatwo to zrozumieć, gdy roślina należy do czystej linii lub jest homo-zygotą pod względem konkretnej cechy, gdyż wtedy ma dwa identyczne allele i odpowiedni fenotyp. Jednakże Mendel wykazał, że jeśli skrzyżuje się dwie czyste linie o różnych fenotypach, całe potomstwo (pokolenie F1) ma ten sam fenotyp. Członkowie pokolenia F1 muszą być heterozygota-mi pod względem badanego fenotypu, gdyż dziedziczą po jednym allelu od każdego z rodziców. Fenotyp rośliny F1 jest więc dominujący nad drugim, recesywnym fenotypem.
Mendel przeprowadził dodatkowe krzyżówki, które umożliwiły mu sformułowanie dwóch praw genetyki. Pierwsze prawo mówi, że allele segregują przypadkowo. Innymi słowy, jeśli rodzic ma allele A i a, to osobnik z pokolenia F1 ma taką samą szansę odziedziczenia A jak a. Drugie prawo mówi, że pory alleli segregują niezależnie, czyli dziedziczenie alleli genu A jest niezależne od dziedziczenia alleli genu B. Dzięki tym prawom wyniki krzyżówek genetycznych są przewidywalne, jak to pokazują przykłady u góry następnej kolumny.
Wielkim wkładem Mendla do współczesnej genetyki było, że niemal bezbłędnie określił sposób dziedziczenia genów. Teraz wiemy, że dwa allele genu są niesione przez dwa chromosomy homologiczne (patrz s. 25) w komórce diploi-
krzyżówka jednopunktowa
krzyżówka dwupunktowa
dalnej i że sposób, w jaki allele są przenoszone z rodziców na potomstwo, zgodnie z tym co wydedukował Mendel, odpowiada wydarzeniom zachodzącym podczas wytwarzania haploidalnych gamet podczas mejozy (patrz rys. 2.10). Zauważamy również, że prosta reguła dominacji-recesywności zaproponowana przez Mendla może się skomplikować w sytuacjach, których nie spotkał u swoich roślin grochu. Jedną z nich jest niepełna dominacja, gdy fenotyp heterozygoty jest pośredni między dwiema formami homozygotycznymi. Na przykład jeśli czerwone goździki krzyżuje się z białymi, to w F1 heterozygoty są różowe. Inną komplikacją jest kodo-minacja, gdy oba allele można wykryć u heterozygoty. Kodominacja jest sytuacją typową dla markerów DNA, których allele można wykryć bezpośrednio metodami badania DNA (sekcja 2.2.2). Mendel popełnił tylko jeden poważny błąd: jego drugie prawo nie zakłada istnienia sprzężeń, czyli możliwości, żeby allele dwóch genów dziedziczyły się wspólnie, ponieważ znajdują się na jednym chromosomie. Jak zobaczymy w sekcji 2.3.1, odkrycie sprzężeń przez następców Mendla doprowadziło do metod stosowanych w mapowaniu genetycznym.
Tabela 2.1 Typowe markery biochemiczne używane w analizie genetycznej Saccharomyces cerevisiae
Marker Fenotyp Metoda identyfikacji komórek niosących marker
ADE2 CANI CUPI CYHI LEU2 SUC2 URA3
wymaga adeniny oporny na kanawaninę oporny na miedź oporny na cykloheksimid wymaga leucyny zdolny do fermentacji sacharozy wymaga uracylu
rośnie tylko wtedy, gdy w pożywce jest obecna adenina rośnie w obecności kanawaniny rośnie w obecności miedzi rośnie w obecności cykloheksimidu rośnie tylko wtedy, gdy w pożywce jest obecna leucyna rośnie, gdy sacharoza jest jedynym węglowodanem w pożywce rośnie tylko wtedy, gdy w pożywce jest obecny uracyl
rodzice
genotypy F1
fenotypy F1
rodzice wysoki okrągłe TtRr x TtRr wysoki okrągłe
genotypy F1 TR Tr tR tr
TR TTRR TTRr TtRR TtRr Tr TTRr TTrr TtRr Ttrr tR TtRR TtRr ttRR ttRr tr TtRr Ttrr ttRr ttrr
fenotypy F1 9 wysokich, okrągłe : 3 wysokie, pomarszczone : 3 niskie, okrągłe: 1 niski, pomarszczone
Gen Allele
wysokość wysoki T niski t
nasiona grochu okrągłe R pomarszczone t
rodzice wysoki TTxtt niski okrągłe RR x rr pomarszczone
rośiiny F1 dziedziczą po jednym allelu od każdego z rodziców
genotypy F1 wszystkie Tt wszystkie Rr Fenotypy F1 wszystkie wysokie wszystkie okrągłe
wniosek wysoki jest dominujący okrągłe jest dominujące
18 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
przeprowadza się mapowanie genów człowieka (sekcja 2.3.2). Zamiast przeprowadzić wiele eksperymentów krzyżówkowych, co jest procedurą stosowaną do organizmów eksperymentalnych, takich jak muszki owocowe czy myszy, dane o dziedziczeniu genów ludzkich trzeba zbierać przez badanie fenotypów członków jednej rodziny. Jeśli członkowie rodziny są homo-zygotami pod względem badanego genu, nie uzyskuje się żadnej użytecznej informacji. Może się to często zdarzać, jeśli gen ma zaledwie dwa allele, ponieważ przypadkowo małżeństwo zawarły osoby homozygo-tyczne względem tego samego allelu. Jest to mniej prawdopodobne, jeśli badany gen ma 60 alleli, a nie dwa.
2.2.2 Markery DNA do mapowania genetycznego
Geny są bardzo użytecznymi, jednak nie idealnymi, markerami. Jeden problem, szczególnie w badaniu większych genomów - kręgowców i roślin kwiatowych, stanowi to, że mapa oparta całkowicie na genach nie jest zbyt szczegółowa. Byłoby to prawdą, nawet jeśli można by zmapować każdy gen, ponieważ jak zobaczyliśmy w rozdziale 1, w genomach tych organizmów geny są poprzedzielane dużymi przerwami (patrz rys. 1.7, s. 10). Problem jest tym trudniejszy, że zaledwie część pełnej liczby genów występuje w formach allelicznych łatwych do odróżnienia. Mapy genów nie są więc zbyt dokładne. Potrzebujemy innych typów markerów.
Mapowane cechy nie będące genami nazywa się markerami DNA. Tak jak markery genowe, aby były użyteczne, markery DNA muszą występować w przynajmniej dwóch formach allelicznych. Trzy typy cech sekwencji DNA odpowiadają temu wymogowi.
Polimorfizm długości fragmentów restrykcyjnych (RFLP) RFLP (ang. restriction fragment length polymorphism) były pierwszymi badanymi typami markerów DNA. Fragmenty restrykcyjne powstają, gdy na cząsteczkę DNA działa się endonukleazą restrykcyjną, będącą typem enzymu tnącego cząsteczki DNA w określonych sekwencjach (patrz Metody badań 3.1, s. 40). Na przykład endonukleazą restrykcyjna EcoRI tnie dwuniciowy DNA jedynie w obrębie sekwencji:
5' - GAATTC - 3' 3' - CTTAAG - 5'
Taka specyficzność sekwencyjna oznacza, że trawienie określonej cząsteczki DNA danym enzymem restrykcyjnym powinno zawsze dawać ten sam zestaw fragmentów. Nie zawsze jest to prawdą w przypadku cząsteczek genomowego DNA, ponieważ niektóre miejsca restrykcyjne są polimorficzne, występują jako dwa allele: jeden allel mający prawidłową sekwencję dla miejsca restrykcyjnego, i w związku z tym cięty podczas trawienia DNA enzymem, oraz drugi allel
Rysunek 2.4 Polimorfizm długości fragmentów restrykcyjnych (RFLP)
Cząsteczka D N A z lewej strony ma polimorficzne miejsce restrykcyjne (oznaczone gwiazdką) nieobecne w cząsteczce po stronie prawej. RFLP ujawnia się po działaniu enzymem restrykcyjnym, ponieważ jedna cząsteczka jest cięta na cztery fragmenty, podczas gdy druga jest cięta na trzy fragmenty
- z taką zmianą, że miejsce restrykcyjne nie jest rozpoznawane. W drugim przypadku dwa graniczące fragmenty restrykcyjne po traktowaniu enzymem pozostają ze sobą złączone, co prowadzi do polimorfizmu długości (rys. 2.4). To jest RFLP, a jego pozycję na mapie można odnaleźć przez prześledzenie dziedziczenia jego form allelicznych, tak jak wtedy, gdy stosowanymi markerami są geny. Uważa się, że w genomie człowieka jest około 105 RFLP, ale oczywiście dla każdego RFLP występować mogą tylko dwa allele (z miejscem restrykcyjnym i bez). Wartość RFLP w mapowaniu genów człowieka jest więc ograniczana przez duże prawdopodobieństwo, że rodzina będzie całkowicie homozygotyczna pod względem danego RFLP.
W celu oznaczenia RFLP niezbędne jest określenie wielkości tylko jednego lub dwóch pojedynczych fragmentów restrykcyjnych na tle wielu nieistotnych fragmentów. Nie jest to łatwy problem: enzym EcoRI, rozpoznający sekwencję o długości 6 bp, może ciąć DNA raz na 46 (czyli raz na 4096 bp), (sekcja 3.1.2). Jeśli przecinamy ludzki DNA, to otrzymamy prawie 750000 fragmentów. Na szczęście istnieją techniki umożliwiające wykrycie pojedynczych fragmentów:
• Hybrydyzacja metodą Southerna (patrz Metody badań 2.1) była pierwszą techniką stosowaną do oznaczania RFLP. Fragmenty DNA otrzymane po trawieniu rozdziela się przez elektroforezę w żelu agarozowym, a poszukiwane wykrywa się dzięki hybrydyzacji z sondą.
• Reakcja łańcuchowa polimerazy (PCR - ang. polymerase chain reaction), (patrz Metody badań 2.2) jest obecnie stosowana powszechniej, ponieważ jest szybsza niż analiza Southerna. W reakcji PCR region DNA zawierający RFLP namnaża się do wielu kopii przed pocięciem DNA enzymem restrykcyjnym. Wówczas RFLP można uwidocznić przez barwienie fragmentów restrykcyjnych bromkiem etydyny w żelu agarozowym, co jest metodą
dodanie nukleazy restrykcyjnej
4 fragmenty 3 fragmenty
polimorfczne miejsce restrykcyjne
2.2 MARKERY DLA MAP GENETYCZNYCH 19
Hybrydyzacja metodą Southerna
Wykrywanie określonych fragmentów restrykcyjnych na tle wielu innych fragmentów restrykcyjnych
W hybrydyzacji metodą Southerna zestaw fragmentów restrykcyjnych przenosi się z żelu agarozowego na błonę nylonową i specyficzny, badany fragment wykrywa się przez hybrydyzację z sondą. Technika ta, oprócz zastosowania do mapowania RFLP (sekcja 2.2.2), jest także używana w innych procedurach wymagających identyfikacji szczególnych fragmentów restrykcyjnych, na przykład do sprawdzenia klonowanego fragmentu (Metody badań 3.4, s. 52)
Elektroforeza w żelu agarozowym (Metody badań 3.2, s. 43) służy do rozdzielania liniowych cząsteczek DNA, takich jak fragmenty restrykcyjne, zależnie od ich wielkości. Jeśli trawienie dało tylko kilka fragmentów, to każdy tworzy oddzielny prążek, który można zobaczyć po wybarwieniu żelu bromkiem etydyny. Jeżeli jest więcej niż około 50 fragmentów, prążki łączą się ze sobą tworząc smugę i nie można zobaczyć pojedynczych fragmentów. Wówczas fragmenty przenosi się na błonę nylonową po prostu kładąc ją na żelu. Bufor przesiąkając przenosi DNA z żelu na błonę, do której DNA się przyłącza (rysunek u góry). Do przenoszenia można kupić drogą maszynę, lecz prościej użyć pliku papierowych ręczników.
Sondą do hybrydyzacji jest wyznakowana cząsteczka DNA o sekwencji komplementarnej do docelowego DNA, który
chcemy wykryć. Ponieważ sonda i docelowy DNA są komplementarne, mogą tworzyć pary czyli hybrydyzować. Pozycję docelowego fragmentu restrykcyjnego na filtrze identyfikuje się przez wykrycie sygnału znacznika dołączonego do sondy. Sondą może być syntetyczny nukleotyd (patrz rys. 2.7) lub sklonowany fragment DNA (Metody badań 3.4, s. 52). W wykrywaniu RFLP sondą jest przeważnie sklonowany fragment obejmujący polimorficzne miejsce restrykcyjne.
Aby przeprowadzić hybrydyzację, błonę umieszcza się w szklanej butelce z wyznakowaną sondą oraz buforem i delikatnie obraca przez kilka godzin, aby sonda miała możliwość hybrydyzowania z docelowym DNA. Następnie błonę płucze się w celu usunięcia sondy, która nie zhyb-rydyzowała, i wykrywa się sygnał znacznika. Szczegóły znakowania i detekcji prezentują Metody badań 3.3, s. 46; w poniższym przykładzie sondę wyznakowano radioaktywnie, a sygnał wykrywa się stosując autoradiografię. Na auto-radiogramie widoczne są prążki komplementarne z sondą. Widzimy, że w ścieżce 2 jest tylko jeden hybrydyzujący prążek, a w ścieżce 3 dwa prążki. DNA w ścieżce 3 został przecięty w polimorficznym miejscu restrykcyjnym, natomiast w ścieżce 2 - nie.
20 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Reakcja łańcuchowa polimerazy
Wykładnicze namnażanie wybranego regionu cząsteczki D N A
Reakcja łańcuchowa polimerazy (PCR - ang. polymerase chain reaction) prowadzi do powielenia wybranego fragmentu cząsteczki DNA. Bez trudu można namnażać odcinki długości nawet ponad 5 kb, a po zmodyfikowaniu standardowej techniki możliwe są dłuższe amplifikacje - aż do 40 kb. Technika PCR ma wiele zastosowań w biologii molekularnej, na przykład w mapowaniu DNA (patrz sekcja 2.2.2), sekwen-cjonowaniu DNA (patrz sekcje 4.1.1 i 4.2.1) i filogenetyce molekularnej (rozdział 15). Zmodyfikowaną wersję reakcji PCR można stosować do namnażania cząsteczek RNA w postaci DNA (Metody badań 5.1, s. 91). Technika PCR jest także szeroko używana w wyspecjalizowanych dziedzinach, takich jak medycyna sądowa i diagnostyka kliniczna, gdzie szczególnie użyteczna jest możliwość pracy z niewielką wyjściową liczbą cząsteczek.
Reakcję przeprowadza się przez zmieszanie ze sobą cząsteczki DNA stanowiącej matrycę, która może być obecna w bardzo niewielkich ilościach, oraz nukleotydów, dwóch syntetycznych oligonukleotydowych starterów i termostabil-nej polimerazy DNA (patrz Metody badań 4.2, s. 64), odpornej na denaturację pod wpływem wysokiej temperatury. Zwykle używa się polimerazy Taq z bakterii Thermus aquaticus żyjącej w gorących źródłach. Dwa startery muszą się przyłączyć do matrycy na obu końcach namnażanego regionu, co oznacza, że aby przygotować odpowiednie oligonukleotydy, musimy znać skrajne sekwencje. Oligonukleotydy zapoczątkowują syntezę nowego, komplementarnego polinukleotydu tworzonego - jak we wszystkich enzymatycznych syntezach DNA - w kierunku od 5' do 3' przez kopiowanie matrycowego DNA w kierunku od 3' do 5' (patrz rys. /./, s. 3 i sekcja 12.3.2).
Ponieważ polimeraza Taq jest termostabilna, mieszaninę reakcyjną można podgrzać do 90°C bez niszczenia aktywności enzymu. W tej temperaturze nowe nici oddzielają się od matrycowego DNA. Po ochłodzeniu mieszaniny do matrycowego DNA, a także do nowych nici, przyłącza się więcej starterów. Wtedy polimeraza Taq przeprowadza drugi cykl syntezy DNA.
PCR można kontynuować przez 30-40 cykli, nim enzym ulegnie ostatecznej inaktywacji albo startery lub nukleotydy zostaną zużyte. Pojedynczą cząsteczkę wyjściową można namnożyć do dziesiątek milionów identycznych fragmentów, co stanowi kilka mikrogramów DNA. Obecność polimorficz-nego miejsca restrykcyjnego w namnożonym regionie można sprawdzić przez trawienie produktu reakcji PCR enzymem restrykcyjnym i sprawdzenie próbki w żelu agarozowym.
2.2 MARKERY DLA MAP GENETYCZNYCH 21
mniej czułą niż hybrydyzacja z sondą. Tło niena-mnożonego DNA nie pokazuje się, jedynymi widocznymi fragmentami są te, które pochodzą z namnożonego DNA.
Zauważmy, że techniki te bezpośrednio wykrywają oba allele RFLP: oznacza to, że (jak przy innych markerach DNA) allele są kodominujące.
Polimorfizm długości prostych sekwencji (SSLP)
SSLP (ang. - simple sequence length polymorphism) są szeregami powtórzeń sekwencji, przejawiającymi różnice długości, a wiec różnymi allelami zawierającymi różną liczbę jednostek powtarzalnych (rys. 1.5A). W odróżnieniu od RFLP, SSLP może być wieloallelowe, bo każdy SSLP może mieć wiele różnych wariantów długości. Istnieją dwa typy SSLP:
• Minisatelity, znane także jako zmienna liczba powtórzeń tandemowych (VNTR - ang. variable number of tandem repeats), w których jednostka powtarzalna ma kilkadziesiąt nukleotydów długości.
(A) Dwa warianty SSLP
allel I
allel 2
(B) Typowanie SSLP za pomocą reakcji PCR
elektroforeza w żelu agarozowym
ŚCIEŻKA A: test ŚCIEŻKA B: markery alleli WNIOSEK: badany DNA zawiera allel 2
Rysunek 2.5 SSLP i ich oznaczanie
(A) Dwa allele mikrosatelitarnego SSLP. W allelu I m o t y w „GA" jest powtórzony trzy razy, a w allelu 2 - pięć razy. (B) Sposób oznaczania SSLP w reakcji PCR. Region otaczający SSLP amplifikuje się, a badany produkt identyfikuje się przez elektroforezę w żelu agarozowym. Produkty PCR dają prążek odpowiadający dłuższej z sekwencji dwóch alleli wykazując, że testowany D N A zawierał allel 2. Opis elektroforezy w żelu znajduje się w Metodach badań 3.2, s. 43
allel 1
allel 2
Rysunek 2.6 Polimorfizm punktowy
• Mikrosatelity lub proste powtórzenia tandemowe (STR - ang. simple tandem repeats), w których powtórzeniami są znacznie krótsze jednostki, przeważnie dwu-, trzy- lub czteronukleotydowe. Dwa mikrosatelity spotkaliśmy w rozdziale 1, gdy patrzyliśmy na typowy 50-kb fragment genomu człowieka (patrz rys. 1.5, s. 6).
Jako markery DNA mikrosatelity są bardziej popularne niż minisatelity z dwóch powodów. Po pierwsze, minisatelity nie są równo rozprzestrzenione w genomie, lecz częściej znajduje się je bliżej końców chromosomów. Stosując porównanie geograficzne, równoważne jest to z próbą użycia mapy latarni morskich, by znaleźć drogę wokół wyspy. Mikrosatelity są dogodniej rozmieszczone w genomie. Po drugie, najszybszym sposobem oznaczania polimorfizmów długości jest reakcja PCR (rys. 2.5B), a za jej pomocą znacznie szybciej i dokładniej oznacza się sekwencje krótsze niż 300 bp. Większość alleli minisatelitarnych jest dłuższa, ponieważ jednostki powtarzalne są stosunkowo długie i często jest ich wiele w jednym ciągu. Typowy mikrosatelita zawiera 10-30 kopii powtarzalnej sekwencji nie dłuższej niż cztery bp, i dlatego lepiej nadaje się do oznaczenia w reakcji PCR. Dotychczas w genomie człowieka znaleziono około 104 mikro-satelitów, ale prawdopodobnie jest ich znacznie więcej (sekcja 6.3.1).
Polimorfizmy punktowe (SNP) SNP (ang. single nucleotide polymorphism) stanowią bardzo licznie występujące w genomie pojedyncze mutacje punktowe (rys. 2.6). Niektóre równocześnie prowadzą do RFLP, choć nie większość, ponieważ sekwencji, w obrębie których leżą SNP, nie rozpoznaje żaden enzym restrykcyjny. Uważa się, że w genomie człowieka jest ponad 200 000 SNP położonych w genach i prawdopodobnie dziesięć razy tyle, a może i więcej w DNA pozagenowym (Collins i wsp., 1997).
Każdy SNP ma tylko dwa allele *, więc z punktu widzenia mapowania genów człowieka ma te same wady co RFLP; istnieje duże prawdopodobieństwo, że wszyscy członkowie rodziny będą homozygotyczni pod względem pojedynczego SNP. Zaletą SNP jest ich
* Polimorfizm punktowy może mieć cztery allele odpowiadające wystąpieniu jednego z czterech możliwych nukleotydów: A, C, T, G (przyp. tłum.).
22 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Rysunek 2.7 Hybrydyzacja z oligonukleotydami jest bardzo specyficzna
W bardzo dokładnie określonych warunkach hybrydyzacji stabilna cząsteczka hybrydowa powstaje tylko wtedy, gdy oligonukleotyd może utworzyć z docelowym D N A strukturę, w której wszystkie nukleotydy tworzą pary. Pojedyncze miejsce, w którym zasady nie tworzą pary, uniemożliwia tworzenie hybrydy. Aby osiągnąć taki poziom precyzji warunków, temperatura inkubacji musi być tuż poniżej t e m p e r a t u r y topnienia (T ) oligonukleotydu. W temperaturze powyżej 7 nawet cząsteczka, w której wszystkie zasady tworzą pary, jest niestabilna. Jeśli temperatura jest niższa od T o więcej niż 5°C, to hybrydy, w których nie wszystkie zasady tworzą pary, mogą być stabilne. T oligonukleotydu pokazanego na rysunku wynosi około 58°C. Obliczono to ze wzoru T m = (4 x liczba nukleotydów G i C) + (2 x liczba nukleotydów A i T) °C
olbrzymia liczba i możliwość oznaczania metodami nie wymagającymi elektroforezy w żelu. Jest to istotne dlatego, że elektroforeza w żelu jest trudna do zautomatyzowania, więc każda metoda detekcji na niej oparta będzie stosunkowo powolna i pracochłonna. Wykrywanie SNP jest szybkie, ponieważ opiera się na analizie hybrydyzacji z oligonukleotydami. Oligonukleotyd to krótka, syntetyzowana chemicznie, jed-noniciowa cząsteczka DNA, zwykle krótsza niż 50 nukleotydów. Jeśli warunki są odpowiednie, oligonukleotyd będzie hybrydyzował z inną cząsteczką DNA tylko wtedy, gdy na całej swojej długości utworzy z nią pary nukleotydów. Jeśli pojawi się jednonukleotydowa różnica, jedna pozycja oligonukleotydu nie tworzy pary i hybrydyzacja nie zachodzi (rys. 2.7). Hybrydyzacja z oligonukleotydami pozwala rozróżnić dwa allele SNP. Strategia przeszukiwania obejmuje:
• Technologię „chip" DNA (patrz Metody badań 2.3). „Chip" DNA jest silikonową płytką, o powierzchni 2 cm2 lub mniejszej, niosącą wiele różnych gęsto poukładanych oligonukleotydów. Testowany DNA znakuje się znacznikiem fluorescencyjnym i pipe-tuje na powierzchnię płytki. Hybrydyzację wykrywa się oglądając „chip" pod mikroskopem fluorescencyjnym. Pozycje emitujące sygnał fluorescencyjny pokazują, który oligonukleotyd zhybry-
dyzował z badanym DNA. W ten sposób w jednym eksperymencie można oznaczyć wiele SNP (Wang i wsp., 1998).
• Dynamiczna hybrydyzacja specyficzna dla allelu (DASH - ang. dynamic allele-specific hybridization; Pennisi, 1998). W tej technice hybrydyzacja zachodzi w roztworze, na przykład w jednej ze studzienek 96-studzienkowej płytki mikrotitracyjnej i wykrywana jest dzięki znacznikowi fluorescencyjnemu wiążącemu się jedynie z dwuniciowym DNA. Sygnał emitowany jest wyłącznie wtedy, gdy zachodzi hybrydyzacja. Początkowo hybrydyzacja zachodzi w warunkach umożliwiających istnienie pojedynczych miejsc, gdzie zasady nie tworzą par. Na tym etapie eksperymentu oligonukleotydy i badany DNA hybrydyzują niezależnie od tego, jaki allel SNP występuje w DNA. Rozróżnienie między al-lelami osiąga się podnosząc temperaturę, ponieważ hybrydy, w których nie wszystkie zasady tworzą pary, są mniej stabilne niż pełne hybrydy i rozpadają się w niższej temperaturze. Obserwując, w jakiej temperaturze zanika sygnał fluorescencyjny zależny od hybrydyzacji, można określić, który allel znajduje się w badanym DNA.
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO
2.3.1 Analiza sprzężeń jest podstawą mapowania genetycznego
Teraz, kiedy zebraliśmy zestaw markerów, dzięki którym możemy skonstruować mapę, przyjrzyjmy się samym technikom mapowania. Wszystkie opierają się na sprzężeniu genetycznym, odkrytym przez Bate-sona, Saundersa i Punnetta w 1905 r., lecz zrozumianym dopiero gdy Tomasz H u n t Morgan rozpoczął swoje przełomowe badania na muszkach owocowych w latach 1910-1911. Pierwsi genetycy XX wieku rozpoznali, że geny leżą na chromosomach, a każdy chromosom dziedziczy się jako niepodzielna jednostka. Innymi słowy, jeśli dwa geny leżą na tym samym chromosomie, to są ze sobą fizycznie sprzężone i w związku z tym powinny dziedziczyć się wspólnie. Wyglądało to na bezpieczną hipotezę, jednak gdy pierwsi genetycy przeprowadzili krzyżówki genetyczne podobne do opublikowanych przez Mendla 40 lat wcześniej, stwierdzili, że niewiele genów wykazuje pełne sprzężenie. Pary genów dziedziczyły się albo niezależnie, jak geny z różnych chromosomów, albo jeśli wykazywały sprzężenie, było to jedynie sprzężenie częściowe: czasem dziedziczyły się razem, a czasem nie (rys. 2.8). Rozwiązanie tej sprzeczności między teorią a doświadczeniem było milowym krokiem w rozwoju technik mapowania genetycznego.
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 23
„ C h i p " D N A
G ę s t o u ł o ż o n e cząsteczk i D N A d o r ó w n o l e g ł y c h anal iz h y b r y d y z a c y j n y c h
„Chip" D N A zaprojektowano, by umożliwić przeprowadzanie
jednocześnie wielu eksperymentów hybrydyzacyjnych. Jego
głównym zastosowaniem jest poszukiwanie pol imorf izmów,
takich jak SNP (sekcja 2.2.2), i porównywanie populacji RNA
z różnych komórek (sekcja 5.4.1). Może być także stosowany
w nowych metodach sekwencjonowania D N A (sekcja 4.1.2).
„ C h i p " D N A niesie dużą liczbę sond D N A , każdą o innej
sekwencji i umieszczoną w określonym miejscu na powierz
chni płytki. Sondy mogą być syntetycznymi oligonukleotydami
lub innymi krótk imi cząsteczkami D N A , takimi jak k o m
p l e m e n t a r n y D N A ( c D N A - ang. complementary D N A ;
patrz rys. 3.11, s. 50). W najwcześniejszych metodach oligo
nukleotydy lub c D N A nanoszono na szkiełka mikroskopowe
lub błonę nylonową, by utworzyć m i k r o p a n e l e . W ten
sposób można było osiągnąć stosunkowo małą gęstość,
przeważnie 6400 kropek na powierzchni 18 mm na 18 mm
ustawionych 80 x 80. Aby stworzyć panele o dużym zagęsz
czeniu, potrzebna była bardziej rozwinięta technologia. Roz
wiązaniem okazała się synteza ol igonukleotydów in situ na
powierzchni płytki, co wymagało rozszerzenia metodologii
stosowanej w syntezie oligonukleotydów, jak pokazano na
rysunku obok. Zwykła metoda obejmuje dodawanie nukleo-
t y d ó w jeden po drugim do rosnącego końca; sekwencja
zależała od tego, k t ó r y z substratów d N T P dodano do
mieszaniny reakcyjnej. Taka metoda zastosowana do paneli
D N A zaowocowałaby wszystkimi oligonukleotydami o takiej
samej sekwencji. Zamiast tego używa się substratów d N T P
zmodyfikowanych tak, że przed przyłączeniem do końca
rosnącego oligonukleotydu wymagają aktywacji świetlnej.
d N T P dodaje się jeden po drugim do powierzchni płytki, a do
skierowania pulsów światła na konkretne pozycje, czyli okreś
lenia, który z rosnących oligonukleotydów zostanie wydłużony
o dany d N T P , używa się fotolitografii.
W ten sposób można osiągnąć gęstość do jednego miliona
ol igonukleotydów na c m 2 (Ramsay, 1998), co przy poszuki
waniu SNP pozwala typować pół miliona pol imorf izmów
w jednym eksperymencie, zakładając, że są oligonukleotydy
dla obu alleli SNP. „ C h i p " D N A nie jest trudny w użyciu
(patrz rysunek poniżej). Aby umożliwić zajście hybrydyzacji,
zwykta synteza
dodawanie tylko do zaktywowanych oligonukleotydów
„chip" inkubuje się z wyznakowanym docelowym D N A .
Przez skanowanie powierzchni płytki i zapisanie pozycji,
w których w y k r y t o emisję sygnału wysyłanego przez znacznik,
określa się, k t ó r e oligonukleotydy zhybrydyzowały z D N A .
Do mikropaneli o małej gęstości można stosować znaczniki
izotopowe, wykrywane elektronicznie za pomocą urządzenia
o nazwie p h o s p h o r i m a g e r . Metoda ta nie zapewnia jednak
rozdzielczości odpowiedniej dla paneli o dużej gęstości, do
nich niezbędne jest więc użycie znacznika fluorescencyjnego
(Metody badań 3.3, s. 46). Sygnał fluorescencyjny w y k r y w a się
przez skanowanie laserem czy bardziej r u t y n o w o - fluores
cencyjnym mikroskopem konfokalnym.
dodawanie do wszystkich oligonukleotydów
synteza aktywowana światłem
DNA wyznakowany fluorescencyjnie
mikroskopia konfokalna „chip" DNA
hybrydyzacja
sygnały hybrydyzacji
24 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Rysunek 2.8 Częściowe sprzężenie
Częściowe sprzężenie odkryto na początku XX wieku. Pokazaną tutaj krzyżówkę przeprowadzili Bateson, Saunders i Punnett w roku 190S na grochu cukrowym. Krzyżówka rodzicielska daje wynik typowy dla krzyżówek dwupunktowych (patrz ramka 2. /, s. I 7), gdzie
wszystkie rośliny F1 mają taki sam fenotyp, wskazując, że za f ioletowe kwiaty i podłużne ziarna pyłku odpowiadają allele dominujące. Nieoczekiwanie potomstwo krzyżówki F ( nie wykazywało stosunku fenotypów 9:3:3:1 (oczekiwanego dla genów na różnych chromosomach) ani 3:1 (oczekiwanego przy całkowitym sprzężeniu). Ten niezwykły stosunek jest typowy dla częściowego sprzężenia
Zachowanie się chromosomów w czasie mejozy wyjaśnia, dlaczego geny wykazują sprzężenie częściowe, a nie całkowite Przełomowego odkrycia dokonał Tomasz H u n t Morgan wyjaśniając zależność między sprzężeniem częściowym a zachowaniem chromosomów w czasie podziału jądra komórkowego. Cytolodzy w końcu XIX wieku rozróżniali dwa typy podziału jądra: mitozę i mejozę. Powszechniejszy z nich - mitoza to proces, w którym diploidalne jądro komórki somatycznej dzieli się na dwa potomne, wciąż diploidalne jądra (rys. 2.9). Aby stworzyć wszystkie komórki niezbędne w ciągu całego ludzkiego życia, potrzeba około 101 7 mitoz. Zanim rozpocznie się mitoza, każdy chromosom w jądrze replikuje się, ale kopie nie od razu oddzielają się od siebie. Na początku pozostają połączone w swoich centrome-rach i nie rozłączają się do momentu, gdy chro
mosomy są rozdzielane między dwa nowe jądra w czasie mitozy. Szczególnie istotne jest, że każde potomne jądro otrzymuje pełen zestaw chromosomów, a większość zdarzeń, które składają się na proces mitozy, służy osiągnięciu tego celu.
Proces mitozy nie ma bezpośredniego związku z mapowaniem genetycznym. Z mapowaniem związany jest inny proces podziałowy - mejoza. Mejoza zachodzi tylko w komórkach rozrodczych. W jej wyniku z komórki diploidalnej powstają cztery hap-loidalne gamety, z których każda może połączyć się z gametą płci przeciwnej w czasie rozmnażania płciowego. Łatwo wyjaśnić to, że po mejozie powstają cztery komórki haploidalne. Mitoza prowadzi do powstania dwóch komórek diploidalnych: w mejozie zachodzą, jeden po drugim, dwa podziały jądra. Podstawowa różnica między mitozą i mejoza jest subtelniejsza. Przypomnijmy, że w komórce diploidal-
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 25
Rysunek 2.9 Mitoza
W interfazie, czyli okresie między podziałami jąder, chromosomy znajdują się w formie rozciągniętej (sekcja 6.1.1). Na początku mitozy chromosomy kondensują i do późnej profazy formują struktury widoczne w mikroskopie świetlnym. Każdy chromosom właśnie przeszedł replikację D N A , ale dwa potomne chromosomy są połączone centromerami. W czasie metafazy pęka błona jądrowa (u większości eukariotów) i chromosomy ustawiają się w jednej płaszczyźnie na środku komórki . Teraz mikrotubule odciągają siostrzane chromosomy w stronę przeciwnych końców komórk i . W telofazie w o k ó ł każdego zbioru potomnych chromosomów odtwarzają się błony jądrowe. Wynikiem jest powstanie z jednego jądra rodzicielskiego dwóch identycznych jąder potomnych. Dla ułatwienia pokazano tylko jedną parę chromosomów homologicznych; jeden w parze jest czerwony, a drugi - niebieski
nej są dwie oddzielne kopie każdego chromosomu (sekcja 1.1.1), nazywane chromosomami homologicznymi. W czasie mitozy chromosomy homologiczne pozostają oddzielone od siebie. Każdy z pary replikuje się i jest przenoszony do jądra potomnego niezależnie od swojego homologa. Natomiast w czasie mejozy chromosomy homologiczne nie zachowują się niezależnie. W pierwszym podziale mejotycznym każdy chromosom łączy się z homologiem tworząc biwalent (rys. 2.10). Zachodzi to po replikacji każdego chromosomu, ale przed rozdzieleniem zreplikowanych struktur. Biwalent w rzeczywistości zawiera cztery kopie chromosomów, a przeznaczeniem każdej z nich jest odnalezienie drogi do jednej z czterech gamet wytworzonych na końcu mejozy. Wewnątrz biwalentu ramiona chromosomów (chromatydy) przechodzą fizyczne przerwanie i wymianę segmentów DNA. Proces ten nazywa się crossing-over lub rekombinacją i został odkryty przez belgijskiego cytologa Jans-sensa w 1909 r., zaledwie na dwa lata przed tym, nim Morgan zaczął zastanawiać się nad częściowym sprzężeniem.
W jaki sposób odkrycie crossing-over pomogło Morganowi wyjaśnić częściowe sprzężenie? Aby to zrozumieć, musimy pomyśleć o wpływie jaki crossing-
-over może mieć na dziedziczenie genów. Rozważmy dwa geny, oba o dwóch allelach. Gen pierwszy nazwijmy A, a jego allele A i a, zaś drugi gen B o allelach B i b. Wyobraźmy sobie teraz, że te dwa geny leżą na chromosomie 2 Drosophila melanogaster, gatunku muszki owocowej badanego przez Morgana. Prześledzimy teraz przebieg mejozy diploidalnego jądra, w którym jedna kopia chromosomu 2 ma allele A i B, zaś druga ma a i b. Sytuację tę ilustruje rysunek 2.11. Rozważmy dwa alternatywne scenariusze:
1) Crossing-over nie zachodzi między genami A i B. W tym przypadku dwie powstające gamety będą zawierały kopie chromosomów z allelami A i B, a pozostałe dwie będą zawierać a i b. Innymi słowy, dwie gamety mają genotyp AB, a dwie genotyp ab.
2) Crossing-over zachodzi między genami A i B. Doprowadzi to do wymiany segmentów DNA zawierających gen B między chromosomami homologicznymi. W końcu otrzymuje się cztery gamety o różnych genotypach: AB, aB, Ab, ab.
Pomyślmy teraz, co się zdarzy jeśli spojrzymy na wyniki mejozy w 100 identycznych komórkach. Jeśli nigdy nie zachodzi rekombinacja, uzyskamy gamety
centromer
późna profaza
metafaza
mikrotubule
anafaza
telofaza
interfaza
btona jądrowa
26 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Pokazano zdarzenia obejmujące jedną parę chromosomów homologicznych; jeden z chromosomów tworzących parę jest czerwony, drugi niebieski. Na początku mejozy chromosomy kondensują i każda para chromosomów homologicznych ustawia się, by utworzyć biwalent. W biwalencie może zajść crossing-over, obejmujący przerwanie ramion chromosomów i wymianę D N A . Później w mejozie następują dwa podziały jądra; wynikiem pierwszego są dwa jądra, oba z dwiema kopiami każdego chromosomu. W końcu powstają cztery jądra, każde zawierające pojedynczą kopię każdego chromosomu. Końcowe produkty mejozy - gamety są więc haploidalne. Molekularne podstawy rekombinacji opisano w podrozdziale I 3.2
o następujących genotypach:
200 AB 200 ab
Oznacza to całkowite sprzężenie: geny A i B w czasie mejozy zachowują się jak pojedyncza jednostka. Ale jeśli (a jest to bardziej prawdopodobne) w niektórych jądrach zajdzie rekombinacja między A i B, pary alleli nie będą dziedziczone jak pojedyncze jednostki. Załóżmy, że rekombinacja zachodzi w czasie 40 ze 100 mejoz. Wśród powstałych gamet będzie:
160 AB 160 ab 40 Ab 40 oB
To sprzężenie nie jest całkowite, jest tylko częściowe. Oprócz dwóch genotypów rodzicielskich (AB, ab) widzimy gamety o genotypach zrekombinowanych (Ab, aB).
Od częściowego sprzężenia do mapowania genetycznego Kiedy Morgan zrozumiał, jak można wytłumaczyć częściowe sprzężenie przez crossing-over zachodzący w czasie mejozy, wymyślił sposób mapowania względnych pozycji genów na chromosomie. W rzeczywistości kluczowego odkrycia nie dokonał sam Morgan, ale student pracujący w jego laboratorium, Artur Stur-tevant (Sturtevant, 1913). Stwierdził on, że crossing--over jest zjawiskiem losowym, z czego wynika, że prawdopodobieństwo jego zajścia w każdej pozycji wzdłuż pary równolegle ułożonych chromatyd jest jednakowe. Jeśli to założenie jest prawdziwe, to dwa blisko siebie położone geny będą rozdzielane przez rekombinację rzadziej niż dwa geny bardziej od siebie oddalone. Idąc dalej - częstość, z którą geny będą rozprzęgane przez crossing-over, będzie wprost proporcjonalna do ich odległości na chromosomie. Częstość rekombinacji jest więc miarą odległości między dwoma genami. Jeśli uda się określić częstość rekom-
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 27
Rysunek 2.1 I W p ł y w crossing-over na sprzężone geny
Rysunek pokazuje parę chromosomów homologicznych jeden czerwony, a drugi niebieski. A i B są sprzężonymi genami o allelach A, a, 8 i fa. Z lewej strony pokazano mejozę, w której między A i B nie zaszedł crossing-over. Dwie otrzymane gamety mają genotyp AB, a pozostałe dwie ab. Z prawej strony między A i B zaszedł crossing-over: cztery gamety wykazują wszystkie możl iwe genotypy: AB, aB, Ab i ab
binacji dla różnych par genów, można skonstruować mapę ich względnych pozycji na chromosomie (rys. 211):
Okazało się, że założenie Sturtevanta o losowości crossing-over nie było do końca uzasadnione. Porównania między mapami genetycznymi a rzeczywistymi pozycjami genów w cząsteczkach DNA określonymi przez mapowanie fizyczne i sekwencjonowanie DNA wykazały, że w niektórych obszarach chromosomów,
nazywanych gorącymi punktami rekombinacji, crossing-over zachodzi częściej niż w innych. Oznacza to, że odległość na mapie genetycznej niekoniecznie odzwierciedla fizyczną odległość między dwoma markerami. Teraz zdajemy sobie także sprawę z tego, że pojedyncza chromatyda może brać udział w więcej niż jednym akcie rekombinacji jednocześnie, ale też że odległość, w której te dwie rekombinacje mogą zajść, jest ograniczona. Prowadzi to do dalszych niedokład-
28 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Rysunek 2.12 Tworzenie mapy genetycznej na podstawie częstości rekombinacji
Przykład zaczerpnięto z oryginalnych eksperymentów z muszką owocową przeprowadzonych przez Artura Sturtevanta. Wszystkie cztery geny są potożone na chromosomie X muszki owocowej. Pokazano częstości rekombinacji między genami wraz z wydedukowanymi na ich podstawie pozycjami genów na mapie
ności w procedurze mapowania. Niezależnie od tych zastrzeżeń analiza sprzężeń zwykle prowadzi do prawidłowych wniosków o porządku genów, a oszacowania odległości są wystarczająco dokładne do stworzenia m a p genetycznych nadających się do zastosowania jako szkic w projektach sekwencjonowania genomów.
2.3.2 Przeprowadzanie analizy sprzężeń u różnych typów organizmów
Aby zobaczyć, jak rzeczywiście przeprowadza się analizę sprzężeń, powinniśmy rozważyć trzy różne sytuacje:
• Analiza sprzężeń u organizmów takich jak muszka owocowa i mysz, które można poddawać planowanym eksperymentom hodowlanym.
• Analiza sprzężeń u ludzi, na których nie można przeprowadzać planowanych eksperymentów, można jednak wykorzystać rodowody rodzin.
• Analiza sprzężeń u bakterii, które nie przechodzą mejozy.
Analiza sprzężeń, gdy możliwe sq planowane eksperymenty hodowlane Pierwszym typem analizy sprzężeń jest nowoczesne uzupełnienie metody wynalezionej przez Morgana i jego współpracowników. Metoda opiera się na analizie potomstwa z eksperymentalnych krzyżówek między rodzicami o znanych genotypach i można ją stosować, przynajmniej w teorii, u wszystkich euka-riotów. Względy etyczne wykluczają jej zastosowanie u ludzi, a problemy praktyczne, takie jak długość
ciąży czy czas potrzebny potomstwu do osiągnięcia dojrzałości (a więc uczestniczenia w następnych krzyżówkach) ograniczają efektywność metody w stosunku do niektórych zwierząt i roślin.
Jeśli wrócimy do rysunku 2.11, zobaczymy, że kluczem do mapowania genetycznego jest możliwość ustalenia genotypów gamet powstałych po mejozie. W kilku przypadkach jest to możliwe przez bezpośrednie badanie gamet. Na przykład gamety wytwarzane przez niektóre mikroorganizmy eukariotyczne, z Saccharomy-ces cerevisiae włącznie, można hodować jako kolonie komórek haploidalnych i określać ich genotyp stosując testy biochemiczne. Bezpośrednie genotypowanie gamet jest także możliwe u wyższych Eukaryota z użyciem markerów DNA. DNA z pojedynczego plemnika może służyć do przeprowadzenia reakcji PCR, umożliwiając oznaczenie RFLP, SSLP i SNP. Niestety analizy DNA z plemników są dość pracochłonne. Rutynowej analizy sprzężeń u wyższych Eukaryota nie przeprowadza się więc bezpośrednio badając gamety, lecz ustalając genotypy diploidalnego potomstwa powstałego z fuzji dwóch gamet, po jednej od każdego z rodziców. Innymi słowy przeprowadza się krzyżówkę genetyczną.
Komplikacją krzyżówki genetycznej jest to, że uzyskane potomstwo nie jest wynikiem jednej, lecz dwóch mejoz (jednej u każdego z rodziców), a u większości organizmów przypadki rekombinacji są równie prawdopodobne w czasie tworzenia gamet zarówno męskich, jak i żeńskich. Musimy w jakiś sposób móc wyłonić z genotypów diploidalnego potomstwa przypadki rekombinacji, które zaszły w obu tych mejozach. Oznacza to, że krzyżówkę należy przeprowadzać bardzo starannie. Standardowo wykorzystuje się krzy-
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 29
żówkę testową. Ilustruje ją rysunek 2.13, scenariusz 1, gdzie przeprowadziliśmy krzyżówkę testową, by zma-pować dwa spotkane wcześniej geny A (allele A i a) i B (allele B i b), oba z chromosomu 2 muszki owocowej. Istotną cechą testu jest genotyp każdego z rodziców:
• Jeden z rodziców jest podwójną heterozygotą. Oznacza to, że u tego rodzica obecne są wszystkie cztery allele: jego genotyp to AB/ab. Podwójne heterozygoty otrzymuje się przez skrzyżowanie dwóch linii czystych, na przykład AB/ABxab/ab (patrz ramka 2.1, s. 17).
• Drugi z rodziców jest pochodzącą z linii czystej podwójną homozygotą. Obie kopie homologicznych chromosomów 2 u tego rodzica są takie same: w przykładzie przedstawionym w scenariuszu 1 obie mają allele a i b, więc genotyp ab/ab.
Podwójne heterozygoty mają genotyp taki sam jak komórka, której mejozę prześledziliśmy na rysunku 2.11. Naszym celem jest wywnioskowanie, jakie były genotypy gamet wytworzonych przez tego rodzica i obliczenie frakcji rekombinantów. Zauważ, że gamety
produkowane przez drugiego z rodziców, będącego podwójną homozygotą, będą mieć genotyp ab niezależnie, czy będą gametami rodzicielskimi, czy po rekombinacji. W rezultacie mejoza u tego rodzica w czasie badania genotypów potomstwa jest „niewidoczna" co oznacza, że jak pokazuje scenariusz 1 na rys. 2.13, genotypy diploidalnego potomstwa można jednoznacznie przyporządkować genotypom gamet od rodzica będącego podwójną heterozygotą. Krzyżówka testowa umożliwia bezpośrednie przebadanie pojedynczej me-jozy, a zatem obliczenie częstości rekombinacji i zma-powanie odległości dwóch genów.
Należy rozważyć jeszcze jeden punkt. Jeśli, jak na rysunku 2.13 w scenariuszu 1, stosuje się markery genowe wyrażające dominację lub recesywność, rodzic będący podwójną homozygotą musi mieć oba allele warunkujące fenotyp recesywny. Jeżeli jednak stosuje się kodominujące markery DNA, rodzic będący podwójną homozygotą może mieć jakąkolwiek kombinację alieli homozygotycznych (tzn. AB/AB, Ab/Ab, aB/aB, ab/ab). Powody ku temu pokazuje scenariusz 2 na rysunku 2.13.
Scenariusz I A i B są markerami genetycznymi A i 6 są dominujące względem o i b
Scenariusz 2 A i B są markerami genetycznymi A i 8 są kodominujące względem o i b
RODZICE
1 x 2 AB/ab ab/ab
krzyżówka testowa
RODZICE
1 x 2 AB/ab Ab/Ab
AB Ab aB ab
ab ab ab ab
gamety
AB Ab aB ab
Ab Ab Ab Ab
Każdy fenotyp jest taki sam jak gemeta rodzica I
Genotyp gamet rodzica I identyfikuje się na podstawie wykrytych alieli: Jeśli wykryto tylko A, gameta rodzica I byłaA. Jeśli wykryto A+a, to gameta rodzica I była a itd.
Rysunek 2.13 Dwa przykłady krzyżówki testowej
W scenariuszu I - A i B są markerami genetycznymi o allelach A, o, B i b. Uzyskane potomstwo liczy się badając jego fenotypy. Ponieważ rodzic będący podwójną homozygotą (rodzic 2) ma dwa allele recesywne, o i b, nic nie wnosi do fenotypów potomstwa. Fenotyp każdego osobnika z pokolenia F1 jest więc taki sam jak gamety od rodzica I, z której powstał dany osobnik. W scenariuszu 2 - A i B są markerami D N A , których pary alieli są kodominujące. W tym konkretnym przypadku rodzic będący podwójną homozygotą ma genotyp Ab/Ab. Allele obecne u każdego osobnika z pokolenia F1 wykrywa się bezpośrednio, na przykład techniką PCR. Kombinacje alieli pozwalają wydedukować genotypy gamet rodzica I, z których powstał każdy osobnik
GENOTYPY F1 FENOTYPY GENOTYPY F1 WYKRYTE ALLELE
ABab AB ABAb A+B+b Abab Ab AbAb A+b aBab aB aBAb A+a+B+b abab ab abAb A+a + b
30 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
Ramka 2.2: Krzyżówki wielopunktowe
Dokładność analizy sprzężeń jest większa, jeśli w jednej krzyżówce śledzi się więcej niż dwa markery. Nie tylko pozwala to szybciej uzyskać częstość rekombinacji, ale także, przez prostą analizę danych, umożliwia ustalenie względnego porządku markerów na chromosomie. Dzieje się tak dlatego, że aby w zestawie trzech markerów środkowy oddzielić od dwóch markerów zewnętrznych, potrzeba dwóch zdarzeń rekombinacyjnych. A dwa zewnętrzne markery można rozdzielić przez tylko jedną rekombinację.
pojedynczy crossing-over
D £ F d E F
Ponieważ podwójna rekombinacja jest mniej prawdopodobna
niż pojedyncza, oddzielenie środkowego markera od pozo
stałych będzie zachodzić stosunkowo rzadko. Przykład danych
otrzymanych z krzyżówki t rzypunktowej pokazano w tabelce. Krzyżówkę przeprowadzono między potrójną heterozygotą
(ABC/abc) i potrójną homozygotą (abcłabc). Najliczniejszą
klasę stanowi p o t o m s t w o mające jeden z dwóch genotypów
rodzicielskich pochodzące ż przypadków braku rekombinacji
w obszarze zawierającym markery A, B i C. Dwie następne
klasy potomstwa są stosunkowo częste (51 i 63 osobniki
w niniejszym przykładzie). Każda z nich powstała z pojedyn
czej rekombinacji. Analiza ich genotypów wskazuje, że w pier
wszej z tych dwóch klas marker A został rozprzęgnięty od
markerów B i C, a w klasie drugiej marker B został rozprzęg
nięty od A i C. Wnioskiem jest, że A i B są markerami
zewnętrznymi. Potwierdza to liczba potomstwa, u którego
marker C został rozprzęgnięty od A i B. Jest ich tylko dwoje,
co wskazuje, że do powstania tego genotypu potrzebna jest
podwójna rekombinacja. Marker C znajduje się więc między
A i B .
Genotypy potomstwa
ABC/abc abc/abc
aBC/abc Abc/abc
AbC/abc abc/abc
ABc/obc abC/abc
Liczba potomstwa
987
51
63
2
Wywnioskowane przypadki rekombinacji
brak (genotypy rodzicielskie)
jeden, między A i B, C
jeden, między B i A,C
dwa: jeden między C i A oraz jeden między C i B.
Mapowanie genów przez analizę rodowodów u człowieka
Oczywiście u ludzi niemożliwy jest dobór genotypów rodziców i przeprowadzenie krzyżówki zaprojektowanej specjalnie tak, aby była użyteczna w mapowaniu. Zamiast tego, dane do obliczenia częstości rekombinacji trzeba uzyskać przez badanie genotypów kolejnych pokoleń istniejących rodzin. Wynika z tego, że dostępne dane są ograniczone, a ich interpretacja trudna. Ludzkie małżeństwa rzadko stanowią odpowiednią krzyżówkę testową, a genotypów jednego lub większej liczby członków rodziny często nie można zbadać z powodu ich śmierci lub niechęci do współpracy.
Problem obrazuje rysunek 2.74. W tym przykładzie badamy chorobę dziedziczną obecną w rodzinie złożonej z dwojga rodziców i sześciorga dzieci. Choroby genetyczne są często stosowanymi markerami genetycznymi u ludzi. Stan choroby jest jednym allelem, a zdrowia drugim. Rodowód na rysunku 2.14A pokazuje, że matka jest chora tak jak i czworo jej dzieci. Wiemy z wywiadu rodzinnego, że babka ze strony matki również cierpiała na tę chorobę, ale zarówno ona, jak i jej mąż - dziadek ze strony matki nie żyją. Możemy włączyć ich do rodowodu zaznaczając, że nie
żyją, przez przekreślenie symbolu, jednak nie uzyskamy żadnych dalszych wiadomości o ich genotypach. Naszym celem jest zmapowanie pozycji genu odpowiedzialnego za chorobę genetyczną i w tym celu prześledzimy jej sprzężenie z mikrosatelitarnym markerem M, którego cztery allele - M1 M2, M3 i M4 są obecne u żyjących członków rodziny. Pytanie brzmi: jak wiele dzieci jest rekombinantami?
Jeśli spojrzymy na genotypy sześciorga dzieci, zobaczymy, że 1, 3 i 4 mają allele odpowiedzialne za chorobę i mikrosatelitarne allele M1. Natomiast 2 i 5 mają allel odpowiadający zdrowiu i M?. Możemy więc postawić dwie alternatywne hipotezy. Pierwsza: dwie kopie chromosomów homologicznych matki mają genotyp choroba-M 1 i zdrowie-M 2, w wyniku czego dzieci 1, 2, 3, 4 i 5 mają genotypy rodzicielskie, a szóste dziecko jest jedynym rekombinantem (rys. 2.14B). Sugerowałoby to, że gen warunkujący chorobę i mik-rosatelita są względnie blisko sprzężone i rekombinacja między nimi zachodzi rzadko. W hipotezie alternatywnej zakłada się, że chromosomy matczyne mają genotypy zdrowie-M, i choroba-M 2, dzieci 1-5 są rekombinantami, a numer sześć typem rodzicielskim, co by oznaczało, że geny są położone na chromosomie
podwójny crossing-over
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 3 I
(A) Rodowód
(B) Możliwe interpretacje rodowodu
CHROMOSOMY MATKI
DZIECKO I
DZIECKO 2
DZIECKO 3
DZIECKO 4
DZIECKO 5
DZIECKO 6
choroba M1
zdrowie M2
choroba M1
choroba M1
zdrowie M2
choroba M2
hipoteza I
choroba M1
zdrowie M2
rodzicielski
rodzicielski
rodzicielski
rodzicielski
rodzicielski
zrekombinowany
hipoteza 2
zdrowie M1
choroba M2
zrekombinowany
zrekombinowany
zrekombinowany
zrekombinowany
zrekombinowany
rodzicielski
częstość rekombinacji 1/6 = 6,7% 5/6 = 83,3%
(C) „Wskrzeszenie" babki ze strony matki
allel choroby musi być sprzężony z M1
HIPOTEZA I JEST PRAWDZIWA
Rysunek 2.14 Przykład analizy r o d o w o d ó w u człowieka
(A) Rodowód przedstawia dziedziczenie choroby genetycznej w rodzinie: dwojga żyjących rodziców i sześciorga dzieci oraz według informacji o babce ze strony matki - z wywiadu rodzinnego. Allel warunkujący chorobę (pełne symbole) dominuje nad allelem prawidłowym (puste symbole). Naszym zadaniem jest ustalenie stopnia sprzężenia między genem warunkującym chorobę a mikrosatelitą M przez typowanie alleli tego mikrosatelity ( M ( , M2, itd.) u żyjących członków rodziny. (B) Rodowód można zinterpretować na dwa różne sposoby. Hipoteza I zakłada małą częstość rekombinacji i wskazuje, że gen odpowiedzialny za chorobę jest blisko sprzężony z mikrosatelitą M. Hipoteza 2 sugeruje, że gen i mikrosatelita są znacznie słabiej sprzężone. W (C) problem zostaje rozwiązany przez ponowne pojawienie się babki ze strony matki; genotyp mikrosatelity babki jest zgodny wyłącznie z hipotezą I. Więcej szczegółów w tekście
LEGENDA
zdrowa kobieta chora kobieta zdrowy mężczyzna chory mężczyzna zmarły
32 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
względnie daleko od siebie. Nie możemy ustalić, która z hipotez jest prawidłowa: dane są frustrująco niejednoznaczne.
Najbardziej satysfakcjonującym rozwiązaniem problemu postawionego przez rodowód na rysunku 2.14 byłaby znajomość genotypu babki. Załóżmy na chwilę, że jesteśmy w serialu telewizyjnym w rodzaju „Dynastii" i babka w rzeczywistości nie umarła, natomiast ku
(A) Koniugacja
nukleoid
plazmidy
dawca biorca
(B) Transdukcja
DNA bakterii bakteriofag
(C) Transformacja
ogólnemu zaskoczeniu pojawia się ponownie w chwili odpowiedniej, by uratować wciąż malejącą oglądalność. Okazuje się, że jej genotyp pod względem mikrosatelity M to M1M5 (rys. 2.14C). To oznacza, że allel odpowiedzialny za chorobę i M1 znajdują się blisko siebie, na tym samym chromosomie. Teraz z pewnością możemy stwierdzić, że prawidłowa jest hipoteza 1 i tylko dziecko 6 jest rekombinantem.
Zmartwychwstanie kluczowych osobników zwykle nie jest opcją dostępną dla prawdziwego genetyka, chociaż DNA można uzyskać nawet ze zwłok lub kości ludzi nieżyjących. Niepełne rodowody analizuje się statystycznie stosując miarę zwaną lod score (Morton, 1995). Nazwa pochodzi od logarytmu prawdopodobieństwa (ang. logarithm of the odds), że geny są sprzężone. Miary tej używa się na początku do ustalenia, czy badane markery leżą na jednym chromosomie, innymi słowy - czy geny są sprzężone, czy nie. Jeśli analiza lod score ustali sprzężenie, można następnie określić miarę najbardziej prawdopodobnej częstości rekombinacji. W sytuacji idealnej dane będą pochodzić z więcej niż jednego rodowodu, podnosząc wiarygodność wyniku. Analiza jest mniej niejednoznaczna dla rodzin z większą liczbą dzieci i, jak widzieliśmy na rysunku 2.14, istotna jest możliwość genotypowania przynajmniej trzech pokoleń. Z tego powodu stworzono kolekcje rodzin, takie jak zebrana przez Centre d'Etudes du Polymorphi-sme Humaine (CEPH) w Paryżu (Dausset i wsp., 1990). Kolekcja CEPH zawiera hodowlane linie komórkowe z rodzin, w których można przebadać wszystkich czworo dziadków, jak też co najmniej ośmioro dzieci z drugiego pokolenia. Kolekcja jest dostępna do mapowania markerów DNA dla każdego badacza, który zgadza się dostarczyć uzyskane dane do centralnej bazy danych CEPH (patrz Badania i odkrycia 2.1).
Mapowanie genetyczne u bakterii Ostatnim typem mapowania genetycznego, którym się zajmiemy, jest podejście stosowane u bakterii. Główną trudnością, z którą spotykają się genetycy próbujący rozwinąć techniki mapowania dla bakterii, jest brak mejozy u tych haploidalnych organizmów. Trzeba było wymyślić inny sposób wprowadzenia rekombinacji między homologiczne segmenty bakteryjnego DNA. Rozwiązaniem stało się wykorzystanie
Rysunek 2.1 5 Trzy sposoby uzyskania transferu D N A między bakteriami
(A) Koniugacja może spowodować transfer chromosomowego lub plazmidowego D N A z bakterii będącej dawcą do biorcy. Koniugacja obejmuje fizyczny kontakt między dwiema bakteriami i przeniesienie zachodzące przez wąską rurkę zwaną pila. (B) Transdukcja to przeniesienie małego segmentu D N A z komórki dawcy za pośrednictwem bakteriofaga. (C) Transformacja jest podobna do transdukcji, ale przenoszony D N A jest „nagi". Zdarzenia przedstawione w (B) i (C) często wiążą się ze śmiercią komórki dawcy. W (B) śmierć następuje, gdy bakteriofag opuszcza komórkę dawcy; w (C) usunięcie D N A z komórki dawcy jest przeważnie konsekwencją naturalnej śmierci komórki
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 33
Mapa genetyczna człowieka
Jednym z pierwszych celów Projektu Poznania Genomu Człowieka była mapa genetyczna o gęstości przynajmniej jednego markera na każde I Mb genomu. Cel ten osiągnięto w 1994 r. Opisana tu publikacja, wydana dwa lata później, prezentuje mapę genetyczną o gęstości markerów wynoszącej średnio jeden na 0,6 Mb.
Mapę oparto na 5264 mikrosatelitach (sekcja 2.2.2) typu AC/TG:
5' - ACACACACACAC - 3' 3' - TGTGTGTGTGTG - 5'
Były dwie przyczyny, dla których wybrano mikrosatelity o tej konkretnej sekwencji. Po pierwsze są one częste w genomie, po kilka na każdy Mb DNA, co zapewnia stopień pokrycia odpowiedni do mapowania o dużej gęstości. Po drugie, ten typ mikrosatelity jest bardzo zmienny, występuje po kilka alleli każdego z nich w całej populacji. W praktyce oznacza to, że wykazują dużą heterozygo-tyczność, czyli wysokie prawdopodobieństwo, że przypadkowo wybrana z populacji osoba będzie heterozygotą pod względem tego konkretnego mikrosatelity. Średnia hete-rozygotyczność wszystkich markerów użytych do badania wynosiła 0,7 (prawdopodobieństwo 7 na 10, że osobnik będzie heterozygotą), a tylko 7% markerów miało hete-rozygotyczność mniejszą niż 0,5.
Do wykonania większości mapowania użyto materiału pochodzącego od ośmiu rodzin z kolekcji CEPH. Rodziny te obejmowały 134 osoby i pozwalały na prześledzenie 186 mejoz. Uzyskane dane wykorzystano do stworzenia map chromosomów od I do 22. Aby zmapować chromosom X, włączono jeszcze 12 rodzin (170 osób, o 105 mejoz więcej). Dodatkowe dane były potrzebne, ponieważ przypadki rekombinacji pomiędzy markerami sprzężonymi z X są w rodowodach rzadsze, gdyż mężczyźni mają tylko jeden chromosom X.
Mapa Analiza sprzężeń pozwoliła przypisać 5264 markery do 2335 pozycji chromosomowych. Liczba pozycji jest mniejsza niż liczba markerów, ponieważ niektóre mikrosatelity leżą zbyt blisko siebie, by je rozdzielić; dlatego zostały zmapowane w tej samej pozycji. Średnia gęstość dla całej mapy wyniosła jeden marker na 599 kb, sięgając od jednego na 495 kb dla chromosomu 17 do jednego markera na 767 kb dla chromosomu 9. Tylko w trzech miejscach w genomie najbliższe siebie markery wydawały się odległe o więcej niż 4 Mb DNA. Podejrzewa się, że te przerwy w rzeczywistości nie są tak wielkie, jak się wydają, prawdopodobnie w związku z gorącymi punktami rekombinacji (patrz s. 27). Dwa markery po przeciwnych stronach takiego miejsca będą wydawać się bardziej oddalone, niż są w rzeczywistości, z powodu dużej częstości rekombinacji zachodzącej między nimi.
Krótko po publikacji mapy genetycznej ukończono mapę fizyczną o gęstości markerów sięgającej jeden na 100 kb. (Patrz Badania i odkrycia 3.1, s. 56). Ta i inne mapy fizyczne
obejmują pozycje 7000 mikrosatelitów obecnych na mapie genetycznej, umożliwiając integrację obu typów map w jedną obszerną mapę genomu człowieka.
Mapa mikrosatelitów w genomie człowieka
Każda czerwona kreska oznacza jedną z 2335 pozycji, w których zostaty zmapowane markery mikrosatelitarne. Przedrukowano za zgodą z: Dib C et al., Nature, 380, 152-154. Copyright 1996 Macmillan Magazines Limited
Literatura cytowana Dib C, Fuare S, Fizames C, et al. (1996) A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature 380, 152-154.
34 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI
dawca biorca
(A) Transfer kolejnych markerów w czasie koniugacji
(B) Jednoczesny transfer blisko sprzężonych markerów w czasie transdukcji lub transformacji
Rysunek 2.16 Podstawy mapowania genów u bakterii
Powyższy rysunek pokazuje transfer funkcjonalnego genu odpowiedzialnego za syntezę tryptofanu z dzikiej bakterii (o genotypie opisywanym jako trp+) do biorcy, któremu brakuje działającej kopii tego genu (trp~). Biorcę nazywa się auksotrofem t ryptofanowym (słowo używane do opisania zmutowanej bakterii, która może przeżyć tylko wówczas, gdy dostarczy się jej odpowiedniego składnika odżywczego - w t y m przypadku tryptofanu, który nie jest konieczny dla typu dzikiego, patrz sekcja 13.1.2). Po transferze potrzebna jest podwójna rekombinacja, by przeniesiony gen włączył się do chromosomu komórki biorcy, zmieniając fenotyp biorcy z trp- na trp+. (A) W czasie koniugacji D N A przenoszony jest z dawcy do biorcy w taki sposób, jak przeciąga się strunę przez rurkę. Względne pozycje markerów w cząsteczce D N A można zmapować ustalając czas, po którym markery pojawiają się w komórce biorcy. W pokazanym przykładzie markery A, B i C są przenoszone odpowiednio po 8, 20 i 30 minutach od rozpoczęcia koniugacji. Przeniesienie całego genomu £. coli zajmuje około 100 minut. (B) Aby zostać wspólnie przeniesione w czasie transdukcji lub transformacji, dwa markery (lub więcej) muszą być ściśle sprzężone, ponieważ zwykle procesy te umożliwiają przeniesienie z dawcy do biorcy mniej niż 50 kb DNA. Mapowanie z użyciem transdukcji i transformacji stosuje się do ustalenia względnych pozycji markerów położonych zbyt blisko siebie, aby zmapować je precyzyjnie stosując koniugację. Dalsze szczegóły - patrz Freifelder (1987)
2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 35
jednej z trzech istniejących metod przenoszenia fragmentów DNA z jednej bakterii do drugiej (rys. 2.15):
1) Koniugacja, w czasie której dwie bakterie zbliżają się fizycznie i jedna z nich (dawca) przekazuje DNA drugiej bakterii (biorcy). Przeniesiony DNA może być kopią części lub, jeśli to możliwe, całości chromosomu komórki dawcy, albo też segmentem chromosomowego DNA długości do 1 Mb, włączonym do plazmidu (sekcja 1.2.2). Ten drugi przypadek nazywa się transferem episomu.
2) Transdukcja, która obejmuje przeniesienie małych (do ok. 50 kb) segmentów DNA z dawcy do biorcy za pośrednictwem bakteriofaga.
3) Transformacja, gdy komórka biorcy pobiera ze środowiska fragmenty DNA pochodzące z komórki dawcy, rzadko dłuższe niż 50 kb.
Po przeniesieniu musi zajść podwójna rekombinacja, tak aby DNA z bakterii dawcy włączył się do chromosomu komórki biorcy (rys. 2.16A). Jeśli to się nie zdarzy, przeniesiony DNA jest gubiony w czasie podziału komórki biorcy. Jedynym wyjątkiem jest transfer episomu, gdyż plazmidy mogą się namnażać niezależnie od chromosomu gospodarza.
Tutaj też używa się markerów biochemicznych, fenotypem dominującym lub typu dzikiego jest pewna cecha biochemiczna (np. zdolność syntezy tryptofanu; wrażliwość na antybiotyk *), a fenotypem recesywnym - cecha przeciwna (np. brak zdolności syntezy tryptofanu, oporność na antybiotyk). Transfer genu przeważnie przeprowadza się między dawcą mającym allele dzikie a biorcą o allelach recesywnych. Przeniesienie do szczepu biorcy śledzi się poszukując pojawienia się u biorcy funkcji biochemicznych określanych przez badane geny (rys. 2.16B). Szczegóły procedury mapowania zależą od używanego typu transferu genów. W mapowaniu koniugacyjnym DNA dawcy jest przenoszony do biorcy jako ciągła nitka, a pozycje genów mapuje się przez oznaczenie czasu wejścia alleli dzikich do biorcy. Mapowanie z zastosowaniem transdukcji i transformacji umożliwia zmapowanie genów położonych stosunkowo blisko siebie, ponieważ przenoszony segment DNA jest krótki (50 kb), a prawdopodobieństwo, że dwa geny zostaną przeniesione wspólnie, zależy od ich bliskości na chromosomie bakteryjnym.
* Wrażliwość na antybiotyki jest cechą dziką, na ogól recesywną (przyj), tłum.)
LITERATURA CYTOWANA
Collins FS, Guyer MS and Chakravart i A (1997) Variations on a theme: cataloging human D N A sequence variation. Science, 278, 1580-1581.
Dausset J, Cann H, Cohen D, et al. (1990) Program description: Centre d'Etude du Polymorphisme Humain - collaborative genetic mapping of the human genome. Genomics, 6, 575-577.
Freifelder D (1987) Microbiol Genetics. Jones & Bartlett, Boston. Mori M, Beatty PG, Graves M, Boucher KM and Milford EL (1997) HLA gene and haplotype frequencies in the N o r t h American
population. Transplantation, 65, U I. M o r t o n NE (1955) Sequential tests for the detection of linkage. Am. J. Hum. Genet., 7, 277-3 18. Orel V (1995) Gregor Mendel: The First Geneticist. Oxford University Press, Oxford. Pennisi E (1998) Sifting through and making sense of genome sequences. Science, 280, 1692-1693. Ramsay G (1998) D N A chips: state of the art. Nature Biotechnol, 16, 40-44. Sturtevant AH (1913) The linear arrangement of six sex-linked factors in Drosophila as shown by mode of association. J. Exp. Zoo/.,
14, 39-45. V e n t e r JC, Adams M D , Sutton G G , Kerlavage AR, Smith HO and Hunkapil ler M (1998) Shotgun sequencing of the human
genome. Science, 280, 1540-1542. W a n g D G , Fan J-B, Siao C-J, et al. (1998) Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in
the human genome. Science, 280, 1077-1082. Y a m a m o t o F, Clausen H, W h i t e T, M a r k e n J and H a k a m o r i S (1990) Molecular genetic basis of the histo-blood group ABO system.
Nature, 345, 229-233.
LITERATURA UZUPEŁNIAJĄCA
Alberts B, Bray D, Lewis J, Raff M, Roberts K and Watson JD (1994) Molecular Biology of the Cell. 3rd edition. Garland Publishing, NewYork. - Zawiera wszystkie szczegóły mitozy i mejozy.
Fincham JRS, Day PR and Radford A ( 1979) Fungal Genetics, 4th edition. Blackwell, London. - „Biblia" mapowania genów mikroorganizmów eukariotycznych.
Griffiths AJF, Miller JH, Suzuki D T , Lewontin RC and Gelbart WM (1996) An Introduction to Genetic Analysis, 6th edition. W. H. Freeman, NewYork. - Rozdziały 5 i 6 szczególnie dobrze opisują mapowanie genów za pomocą krzyżówek eksperymentalnych. Rozdział 10 dotyczy mapowania u bakterii.
Strachan T and Read AP (1996) Human Molecular Genetics. BIOS Scientific Publishers, Oxford. - Rozdział 12 obejmuje mapowanie genetyczne człowieka.
Sturtevant AH (1965) A History of Genetics. Harper and Row, N e w York. - Opisuje wczesne prace nad mapowaniem genów przeprowadzone przez Morgana i jego współpracowników.