genomy - brown rozdział 2 - ocr

R O Z D Z I A Ł

Mapowanie genomów technikami genetycznymi

Spis treści

2.1 Mapy genetyczne i fizyczne 15 2.2 Markery dla map genetycznych 15

2.2.1 Geny były pierwszymi stosowanymi markerami 15 2.2.2 Markery DNA do mapowania genetycznego 18

2.3 Sposoby podejścia do mapowania genetycznego 22 2.3.1 Analiza sprzężeń jest podstawą mapowania

genetycznego 22 2.3.2 Przeprowadzanie analizy sprzężeń u różnych

typów organizmów 28

14 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Fakty i założenia Mapowanie genetyczne do tworzenia map genomów wykorzystuje takie techniki genetyczne jak krzyżowanie organizmów i analiza rodowodów. Pierwotnie jako markerów używano genów, lecz obecnie uzupełniono je o markery DNA takie jak RFLP, SSLP i SNP.

Podstawą mapowania genetycznego jest obliczenie częstości rekombinacji poprzez analizę sprzężeń.

Jeśli możliwe są eksperymenty hodowlane, to przeprowadza się dwu- lub wielopunktowe krzyżówki testowe. Trudności w mapowaniu genów u człowieka wynikają z ograniczeń analizy rodowodów. Analiza genetyczna bakterii wymaga przeniesienia genów z jednej komórki do drugiej.

Następne trzy rozdziały opisują techniki i strategie stosowane do otrzymania sekwencji genomu. Techniki te obejmują znacznie więcej niż tylko same metody sekwencjonowania DNA, które oczywiście mają fundamentalne znaczenie. Mają także jedno podstawowe ograniczenie: nawet stosując najbardziej rozwinięte technologie, rzadko można w jednym eksperymencie otrzymać sekwencję dłuższą niż 750 bp, co oznacza, że sekwencję długiej cząsteczki DNA trzeba składać z serii krótszych sekwencji. Jednym z podejść jest podzielenie cząsteczki na fragmenty, ustalenie sekwencji każdego z nich i użycie komputera do znalezienia zachodzących na siebie fragmentów, a następnie złożenie oryginalnej sekwencji (rys. 2.1). Opisana strategia typu „shotgun" stanowi standardowe podejście do sekwencjonowania małych genomów prokariotycznych, ale ze wzrostem liczbv fragmentów, niezbędna analiza danych staje się niewspółmiernie bardziej złożona (dla n fragmentów liczbę możliwych zakładek opisuje 2n2-2n). Drugim problemem w metodzie „shotgun" jest możliwość powstawania błędów podczas analizy repetycyjnych regionów genomu. Jeśli sekwencję zawierającą powtórzenia podzieli się na fragmenty, w wielu otrzymanych kawałkach będą takie same lub bardzo podobne motywy sekwencyjne. Łatwo można złożyć te sekwencje tak, że część regionów powtarzających się zostanie usunięta, a nawet tak, że dwa fragmenty tego samego lub różnych chromosomów zostaną ze sobą błędnie połączone (rys. 2.2).

Samo podejście „shotgun" jest więc nieodpowiednie dla większych, bardziej złożonych genomów. Zamiast tego, wpierw należy stworzyć mapę genomu. Mapa genomu stanowi przewodnik do prac nad sekwen-cjonowaniem, pokazując pozycje genów i innych charakterystycznych rodzajów sekwencji.

Gdy dostępna jest mapa, fazę sekwencjonowania można przeprowadzić na jeden z dwóch sposobów (rys. 2.3):

DNA

fragmenty

sekwencje

Rysunek 2.1 Podejście „shotgun" do składania sekwencji

Cząsteczkę D N A dzieli się na mate fragmenty, z których każdy jest sekwencjonowany. Oryginalną sekwencję składa się przez poszukiwanie zachodzących na siebie kawałków sekwencji pochodzących z poszczególnych fragmentów. W praktyce, by ustalić, że dwie sekwencje należy ze sobą połączyć, potrzeba zakładki o długości kilkudziesięciu par zasad

2.2 MARKERY DLA MAP GENETYCZNYCH 15

powtarzający się DNA

500 bp

DNA

fragmenty

sekwencje

nieprawidłowa zakładka

Rysunek 2.2 Problemy spotykane przy podejściu „shotgun"

W przedstawionym przykładzie cząsteczka D N A zawiera dwa segmenty powtarzającego się D N A , z których każdy składa się z wielu kopii motywu GATTA. Podczas badania sekwencji okazuje się, że dwa fragmenty z różnych części D N A zachodzą na siebie. Może to prowadzić do błędnej interpretacji, w której centralny segment cząsteczki D N A zostanie pominięty, a jeśli dwa powtarzalne segmenty D N A pochodziły z różnych chromosomów, sekwencje tych chromosomów mogą zostać błędnie złożone

• Przez zastosowanie kontigów klonów (sekcja 4.2.2). Genom dzieli się na nadające się do obróbki segmenty, każdy o długości kilkuset kb lub kilku Mb, sekwencjonowane następnie indywidualnie, przeważnie metodą „shotgun". Po ukończeniu sekwen-cjonowania segmentu można go umieścić w prawidłowym miejscu na mapie.

• Poprzez ukierunkowaną strategię „shotgun" (sekcja 4.2.3). Strategia ta wykorzystuje określone punkty na mapie genomu jako znaczniki do pomocy w składaniu głównej sekwencji z wielkiej liczby krótkich sekwencji otrzymanych przez podejście „shotgun". Mapy używa się także do sprawdzenia, czy nie popełniono błędów w składaniu sekwencji regionów powtarzalnych. Teoretycznie w ten sposób można zsekwencjonować cały genom człowieka (Venter i wsp., 1998).

W obu podejściach mapa stanowi szkic do kolejnej fazy projektu, czyli sekwencjonowania. Pewne typy map wskazują także pozycje genów, umożliwiając skierowanie początkowej fazy projektu sekwencjonowania na interesujące regiony genomu tak, aby sekwencje istotnych genów otrzymać tak szybko, jak to jest możliwe. Z tych powodów pierwsze 6 lat Projektu Poznania Genomu Człowieka poświęcono prawie całkowicie na mapowanie genomu człowieka, a nie na jego sekwencjonowanie.

2.1 MAPY GENETYCZNE I FIZYCZNE

Tradycyjnie metody mapowania genomu dzieli się na dwie kategorie

Mapowanie genetyczne opiera się na stosowaniu technik genetycznych do konstruowania map pokazujących pozycje genów i innych charakterystycznych rodzajów sekwencji w genomie. Techniki genetyczne obejmują krzyżowanie organizmów lub, w przypadku ludzi, badanie historii rodzin (rodowodów). Mapowanie genetyczne opisano w tym rozdziale. Mapowanie fizyczne wykorzystuje techniki biologii molekularnej do badania cząsteczek DNA bezpo średnio w celu skonstruowania map pokazujących pozycje różnych typów sekwencji z genami włącz nie. Mapowanie fizyczne opisano w następnym rozdziale.

2.2 MARKERY DLA MAP GENETYCZNYCH

Jak każdy rodzaj mapy, mapa genetyczna musi pokazywać pozycje poszczególnych genów w stosunku do określonych wyznaczników, czyli markerów. Na mapach geograficznych takimi markerami są rozpoznawalne składniki krajobrazu, jak rzeki, drogi i budynki. A jakich markerów możemy użyć w krajobrazie genetycznym?

2.2.1 Geny byty pierwszymi stosowanymi markerami

W pierwszych mapach genetycznych, konstruowanych na początku XX wieku dla organizmów takich jak muszka owocowa, jako markerów używano genów. Było to wiele lat przed tym, nim zrozumiano, że geny są segmentami cząsteczek DNA. Geny traktowano wówczas jako abstrakcyjne jednostki odpowiedzialne za przekazywanie cech dziedzicznych z rodziców na potomstwo. By być użyteczną w analizie genetycznej, cecha dziedziczna musi występować w dwóch alternatywnych formach lub fenotypach, czego przykładem jest występowanie długich i krótkich łodyg u roślin groszku badanego przez Mendla. Każdy fenotyp jest określany przez inny allel odpowiadającego mu genu. Na początku jedynymi genami nadającymi się do badania były takie, które odpowiadały fenotypom rozróżnialnym wzrokowo. Tak więc na przykład pierwsze mapy genomu muszki owocowej pokazywały pozycje genów odpowiedzialnych za barwę ciała, kolor oczu, kształt skrzydeł i podobnych. Wszystkie wymienione fenotypy można obserwować po prostu patrząc na muchy przez lupę o niewielkim powiększeniu lub okiem nieuzbrojonym. We wczesnych latach genetyki takie podejście było odpowiednie, ale genetycy szybko zdali sobie sprawę, że w ten sposób można badać dziedziczenie zaledwie ograniczonej liczby fenotypów nadających się do obserwacji wzrokowej, a w wielu przypadkach analiza jest trudniejsza, ponieważ na pojedynczą cechę fizyczną wpływa więcej niż jeden


Analiza kontigów klonów

Analiza typu „shotgun"

mapa genomowa mapowany segment DNA

sekwencjonowanie „shotgun" zmapowanego segmentu

złożona sekwencja

złożone sekwencje

pozycja sekwencji jest już znana

markery używane do zakotwiczenia złożonych sekwencji na mapie

Rysunek 2.3 Alternatywne podejścia do sekwencjonowania genomu

Zmapowano genom, składający się z liniowej cząsteczki D N A długości 2,5 Mb i poznano pozycje ośmiu markerów (A-H). Z lewej - analiza kontigów klonów rozpoczyna się od segmentu DNA, którego pozycję na mapie genomu zidentyfikowano, ponieważ zawiera) markery A i B. Segment sekwencjonuje się metodą „shotgun" i otrzymaną sekwencję umieszcza się w znanej pozycji na mapie. Z prawej - ukierunkowana strategia „shotgun" obejmuje losowe sekwencjonowanie całego genomu. Uzyskuje się kawałki nieprzerwanych sekwencji, prawdopodobnie o długości setek kb. Jeśli nieprzerwana sekwencja zawiera marker, to można ją umieścić w odpowiednim miejscu na mapie. Zauważ, że w obu metodach im więcej markerów znajduje się na mapie genomu, tym lepiej. Więcej szczegółów dotyczących tych strategii sekwencjonowania - patrz podrozdział 4.2.

gen. Na przykład do roku 1922 zmapowano ponad 50 genów na czterech chromosomach muszki owocowej, lecz dziewięć z nich stanowiły geny koloru oczu i każdy nowicjusz, mający nadzieję na wniesienie czegoś nowego do tej dziedziny, wpierw musiał nauczyć się rozróżniać kolory oczu muchy: czerwony, jasnoczerwony i inne odcienie czerwieni, takie jak: cynober (cinnabar, vermilion), kolor granatu (garnet), cielisty (carnation), sepia, szkarłat (scarlet), różowy (pink), purpura (cardinal) lub bordo (claret). Aby stworzyć bardziej ogólne mapy genów, konieczne stało się znalezienie cech bardziej policzalnych, dających się lepiej rozróżniać i mniej złożonych niż nadające się do obserwacji wzrokowej.

Odpowiedzią było wykorzystanie biochemii do rozróżniania fenotypów, szczególnie ważne u dwóch typów organizmów - mikroorganizmów i ludzi. Mikro

organizmy, jak na przykład bakterie i drożdże, mają niewiele cech, które można obserwować wzrokowo, więc mapowanie genów tych organizmów musi opierać się na fenotypach biochemicznych, takich jak wymienione w tabeli 2.1. Ludzie także mają cechy obserwowal-ne wzrokowo, ale już od lat dwudziestych badano fenotypy biochemiczne uzyskiwane przez typowanie krwi, i były to nie tylko standardowe grupy krwi jak ABO (Yamamoto i wsp., 1990), lecz także warianty alleliczne białek osocza krwi i białka immunologiczne, jak antygeny leukocytów człowieka (system HLA - ang. human leukocyte antigens). Dużą przewagą takich markerów nad fenotypami widzialnymi jest występowanie alleli wielokrotnych w wielu istotnych genach (Mori i wsp., 1997). Na przykład gen nazywany HLA--DRB1 posiada przynajmniej 59 alleli, a HLA-B przynajmniej 60. Ma to znaczenie ze względu na sposób, w jaki

markery 500 kb

sekwencjonowanie metodą „shotgun" catego genomu


Ramka 2 . 1 : Krótki przewodnik po genetyce mendlowskiej

Mapowanie genetyczne opiera się na zasadach dziedziczenia po raz pierwszy opisanych przez Grzegorza Mendla w roku 1865 (Orel, 1995). Z wyników krzyżowania roślin grochu Mendel wyciągnął wniosek, że każda roślina grochu ma dwa allele każdego genu, ale tylko jeden fenotyp. Łatwo to zrozumieć, gdy roślina należy do czystej linii lub jest homo-zygotą pod względem konkretnej cechy, gdyż wtedy ma dwa identyczne allele i odpowiedni fenotyp. Jednakże Mendel wykazał, że jeśli skrzyżuje się dwie czyste linie o różnych fenotypach, całe potomstwo (pokolenie F1) ma ten sam fenotyp. Członkowie pokolenia F1 muszą być heterozygota-mi pod względem badanego fenotypu, gdyż dziedziczą po jednym allelu od każdego z rodziców. Fenotyp rośliny F1 jest więc dominujący nad drugim, recesywnym fenotypem.

Mendel przeprowadził dodatkowe krzyżówki, które umożliwiły mu sformułowanie dwóch praw genetyki. Pierwsze prawo mówi, że allele segregują przypadkowo. Innymi słowy, jeśli rodzic ma allele A i a, to osobnik z pokolenia F1 ma taką samą szansę odziedziczenia A jak a. Drugie prawo mówi, że pory alleli segregują niezależnie, czyli dziedziczenie alleli genu A jest niezależne od dziedziczenia alleli genu B. Dzięki tym prawom wyniki krzyżówek genetycznych są przewidywalne, jak to pokazują przykłady u góry następnej kolumny.

Wielkim wkładem Mendla do współczesnej genetyki było, że niemal bezbłędnie określił sposób dziedziczenia genów. Teraz wiemy, że dwa allele genu są niesione przez dwa chromosomy homologiczne (patrz s. 25) w komórce diploi-

krzyżówka jednopunktowa

krzyżówka dwupunktowa

dalnej i że sposób, w jaki allele są przenoszone z rodziców na potomstwo, zgodnie z tym co wydedukował Mendel, odpowiada wydarzeniom zachodzącym podczas wytwarzania haploidalnych gamet podczas mejozy (patrz rys. 2.10). Zauważamy również, że prosta reguła dominacji-recesywności zaproponowana przez Mendla może się skomplikować w sytuacjach, których nie spotkał u swoich roślin grochu. Jedną z nich jest niepełna dominacja, gdy fenotyp heterozygoty jest pośredni między dwiema formami homozygotycznymi. Na przykład jeśli czerwone goździki krzyżuje się z białymi, to w F1 heterozygoty są różowe. Inną komplikacją jest kodo-minacja, gdy oba allele można wykryć u heterozygoty. Kodominacja jest sytuacją typową dla markerów DNA, których allele można wykryć bezpośrednio metodami badania DNA (sekcja 2.2.2). Mendel popełnił tylko jeden poważny błąd: jego drugie prawo nie zakłada istnienia sprzężeń, czyli możliwości, żeby allele dwóch genów dziedziczyły się wspólnie, ponieważ znajdują się na jednym chromosomie. Jak zobaczymy w sekcji 2.3.1, odkrycie sprzężeń przez następców Mendla doprowadziło do metod stosowanych w mapowaniu genetycznym.

Tabela 2.1 Typowe markery biochemiczne używane w analizie genetycznej Saccharomyces cerevisiae

Marker Fenotyp Metoda identyfikacji komórek niosących marker

ADE2 CANI CUPI CYHI LEU2 SUC2 URA3

wymaga adeniny oporny na kanawaninę oporny na miedź oporny na cykloheksimid wymaga leucyny zdolny do fermentacji sacharozy wymaga uracylu

rośnie tylko wtedy, gdy w pożywce jest obecna adenina rośnie w obecności kanawaniny rośnie w obecności miedzi rośnie w obecności cykloheksimidu rośnie tylko wtedy, gdy w pożywce jest obecna leucyna rośnie, gdy sacharoza jest jedynym węglowodanem w pożywce rośnie tylko wtedy, gdy w pożywce jest obecny uracyl

rodzice

genotypy F1

fenotypy F1

rodzice wysoki okrągłe TtRr x TtRr wysoki okrągłe

genotypy F1 TR Tr tR tr

TR TTRR TTRr TtRR TtRr Tr TTRr TTrr TtRr Ttrr tR TtRR TtRr ttRR ttRr tr TtRr Ttrr ttRr ttrr

fenotypy F1 9 wysokich, okrągłe : 3 wysokie, pomarszczone : 3 niskie, okrągłe: 1 niski, pomarszczone

Gen Allele

wysokość wysoki T niski t

nasiona grochu okrągłe R pomarszczone t

rodzice wysoki TTxtt niski okrągłe RR x rr pomarszczone

rośiiny F1 dziedziczą po jednym allelu od każdego z rodziców

genotypy F1 wszystkie Tt wszystkie Rr Fenotypy F1 wszystkie wysokie wszystkie okrągłe

wniosek wysoki jest dominujący okrągłe jest dominujące


przeprowadza się mapowanie genów człowieka (sekcja 2.3.2). Zamiast przeprowadzić wiele eksperymentów krzyżówkowych, co jest procedurą stosowaną do organizmów eksperymentalnych, takich jak muszki owocowe czy myszy, dane o dziedziczeniu genów ludzkich trzeba zbierać przez badanie fenotypów członków jednej rodziny. Jeśli członkowie rodziny są homo-zygotami pod względem badanego genu, nie uzyskuje się żadnej użytecznej informacji. Może się to często zdarzać, jeśli gen ma zaledwie dwa allele, ponieważ przypadkowo małżeństwo zawarły osoby homozygo-tyczne względem tego samego allelu. Jest to mniej prawdopodobne, jeśli badany gen ma 60 alleli, a nie dwa.

2.2.2 Markery DNA do mapowania genetycznego

Geny są bardzo użytecznymi, jednak nie idealnymi, markerami. Jeden problem, szczególnie w badaniu większych genomów - kręgowców i roślin kwiatowych, stanowi to, że mapa oparta całkowicie na genach nie jest zbyt szczegółowa. Byłoby to prawdą, nawet jeśli można by zmapować każdy gen, ponieważ jak zobaczyliśmy w rozdziale 1, w genomach tych organizmów geny są poprzedzielane dużymi przerwami (patrz rys. 1.7, s. 10). Problem jest tym trudniejszy, że zaledwie część pełnej liczby genów występuje w formach allelicznych łatwych do odróżnienia. Mapy genów nie są więc zbyt dokładne. Potrzebujemy innych typów markerów.

Mapowane cechy nie będące genami nazywa się markerami DNA. Tak jak markery genowe, aby były użyteczne, markery DNA muszą występować w przynajmniej dwóch formach allelicznych. Trzy typy cech sekwencji DNA odpowiadają temu wymogowi.

Polimorfizm długości fragmentów restrykcyjnych (RFLP) RFLP (ang. restriction fragment length polymorphism) były pierwszymi badanymi typami markerów DNA. Fragmenty restrykcyjne powstają, gdy na cząsteczkę DNA działa się endonukleazą restrykcyjną, będącą typem enzymu tnącego cząsteczki DNA w określonych sekwencjach (patrz Metody badań 3.1, s. 40). Na przykład endonukleazą restrykcyjna EcoRI tnie dwuniciowy DNA jedynie w obrębie sekwencji:

5' - GAATTC - 3' 3' - CTTAAG - 5'

Taka specyficzność sekwencyjna oznacza, że trawienie określonej cząsteczki DNA danym enzymem restrykcyjnym powinno zawsze dawać ten sam zestaw fragmentów. Nie zawsze jest to prawdą w przypadku cząsteczek genomowego DNA, ponieważ niektóre miejsca restrykcyjne są polimorficzne, występują jako dwa allele: jeden allel mający prawidłową sekwencję dla miejsca restrykcyjnego, i w związku z tym cięty podczas trawienia DNA enzymem, oraz drugi allel

Rysunek 2.4 Polimorfizm długości fragmentów restrykcyjnych (RFLP)

Cząsteczka D N A z lewej strony ma polimorficzne miejsce restrykcyjne (oznaczone gwiazdką) nieobecne w cząsteczce po stronie prawej. RFLP ujawnia się po działaniu enzymem restrykcyjnym, ponieważ jedna cząsteczka jest cięta na cztery fragmenty, podczas gdy druga jest cięta na trzy fragmenty

- z taką zmianą, że miejsce restrykcyjne nie jest rozpoznawane. W drugim przypadku dwa graniczące fragmenty restrykcyjne po traktowaniu enzymem pozostają ze sobą złączone, co prowadzi do polimorfizmu długości (rys. 2.4). To jest RFLP, a jego pozycję na mapie można odnaleźć przez prześledzenie dziedziczenia jego form allelicznych, tak jak wtedy, gdy stosowanymi markerami są geny. Uważa się, że w genomie człowieka jest około 105 RFLP, ale oczywiście dla każdego RFLP występować mogą tylko dwa allele (z miejscem restrykcyjnym i bez). Wartość RFLP w mapowaniu genów człowieka jest więc ograniczana przez duże prawdopodobieństwo, że rodzina będzie całkowicie homozygotyczna pod względem danego RFLP.

W celu oznaczenia RFLP niezbędne jest określenie wielkości tylko jednego lub dwóch pojedynczych fragmentów restrykcyjnych na tle wielu nieistotnych fragmentów. Nie jest to łatwy problem: enzym EcoRI, rozpoznający sekwencję o długości 6 bp, może ciąć DNA raz na 46 (czyli raz na 4096 bp), (sekcja 3.1.2). Jeśli przecinamy ludzki DNA, to otrzymamy prawie 750000 fragmentów. Na szczęście istnieją techniki umożliwiające wykrycie pojedynczych fragmentów:

• Hybrydyzacja metodą Southerna (patrz Metody badań 2.1) była pierwszą techniką stosowaną do oznaczania RFLP. Fragmenty DNA otrzymane po trawieniu rozdziela się przez elektroforezę w żelu agarozowym, a poszukiwane wykrywa się dzięki hybrydyzacji z sondą.

• Reakcja łańcuchowa polimerazy (PCR - ang. polymerase chain reaction), (patrz Metody badań 2.2) jest obecnie stosowana powszechniej, ponieważ jest szybsza niż analiza Southerna. W reakcji PCR region DNA zawierający RFLP namnaża się do wielu kopii przed pocięciem DNA enzymem restrykcyjnym. Wówczas RFLP można uwidocznić przez barwienie fragmentów restrykcyjnych bromkiem etydyny w żelu agarozowym, co jest metodą

dodanie nukleazy restrykcyjnej

4 fragmenty 3 fragmenty

polimorfczne miejsce restrykcyjne


Hybrydyzacja metodą Southerna

Wykrywanie określonych fragmentów restrykcyjnych na tle wielu innych fragmentów restrykcyjnych

W hybrydyzacji metodą Southerna zestaw fragmentów restrykcyjnych przenosi się z żelu agarozowego na błonę nylonową i specyficzny, badany fragment wykrywa się przez hybrydyzację z sondą. Technika ta, oprócz zastosowania do mapowania RFLP (sekcja 2.2.2), jest także używana w innych procedurach wymagających identyfikacji szczególnych fragmentów restrykcyjnych, na przykład do sprawdzenia klonowanego fragmentu (Metody badań 3.4, s. 52)

Elektroforeza w żelu agarozowym (Metody badań 3.2, s. 43) służy do rozdzielania liniowych cząsteczek DNA, takich jak fragmenty restrykcyjne, zależnie od ich wielkości. Jeśli trawienie dało tylko kilka fragmentów, to każdy tworzy oddzielny prążek, który można zobaczyć po wybarwieniu żelu bromkiem etydyny. Jeżeli jest więcej niż około 50 fragmentów, prążki łączą się ze sobą tworząc smugę i nie można zobaczyć pojedynczych fragmentów. Wówczas fragmenty przenosi się na błonę nylonową po prostu kładąc ją na żelu. Bufor przesiąkając przenosi DNA z żelu na błonę, do której DNA się przyłącza (rysunek u góry). Do przenoszenia można kupić drogą maszynę, lecz prościej użyć pliku papierowych ręczników.

Sondą do hybrydyzacji jest wyznakowana cząsteczka DNA o sekwencji komplementarnej do docelowego DNA, który

chcemy wykryć. Ponieważ sonda i docelowy DNA są komplementarne, mogą tworzyć pary czyli hybrydyzować. Pozycję docelowego fragmentu restrykcyjnego na filtrze identyfikuje się przez wykrycie sygnału znacznika dołączonego do sondy. Sondą może być syntetyczny nukleotyd (patrz rys. 2.7) lub sklonowany fragment DNA (Metody badań 3.4, s. 52). W wykrywaniu RFLP sondą jest przeważnie sklonowany fragment obejmujący polimorficzne miejsce restrykcyjne.

Aby przeprowadzić hybrydyzację, błonę umieszcza się w szklanej butelce z wyznakowaną sondą oraz buforem i delikatnie obraca przez kilka godzin, aby sonda miała możliwość hybrydyzowania z docelowym DNA. Następnie błonę płucze się w celu usunięcia sondy, która nie zhyb-rydyzowała, i wykrywa się sygnał znacznika. Szczegóły znakowania i detekcji prezentują Metody badań 3.3, s. 46; w poniższym przykładzie sondę wyznakowano radioaktywnie, a sygnał wykrywa się stosując autoradiografię. Na auto-radiogramie widoczne są prążki komplementarne z sondą. Widzimy, że w ścieżce 2 jest tylko jeden hybrydyzujący prążek, a w ścieżce 3 dwa prążki. DNA w ścieżce 3 został przecięty w polimorficznym miejscu restrykcyjnym, natomiast w ścieżce 2 - nie.


Reakcja łańcuchowa polimerazy

Wykładnicze namnażanie wybranego regionu cząsteczki D N A

Reakcja łańcuchowa polimerazy (PCR - ang. polymerase chain reaction) prowadzi do powielenia wybranego fragmentu cząsteczki DNA. Bez trudu można namnażać odcinki długości nawet ponad 5 kb, a po zmodyfikowaniu standardowej techniki możliwe są dłuższe amplifikacje - aż do 40 kb. Technika PCR ma wiele zastosowań w biologii molekularnej, na przykład w mapowaniu DNA (patrz sekcja 2.2.2), sekwen-cjonowaniu DNA (patrz sekcje 4.1.1 i 4.2.1) i filogenetyce molekularnej (rozdział 15). Zmodyfikowaną wersję reakcji PCR można stosować do namnażania cząsteczek RNA w postaci DNA (Metody badań 5.1, s. 91). Technika PCR jest także szeroko używana w wyspecjalizowanych dziedzinach, takich jak medycyna sądowa i diagnostyka kliniczna, gdzie szczególnie użyteczna jest możliwość pracy z niewielką wyjściową liczbą cząsteczek.

Reakcję przeprowadza się przez zmieszanie ze sobą cząsteczki DNA stanowiącej matrycę, która może być obecna w bardzo niewielkich ilościach, oraz nukleotydów, dwóch syntetycznych oligonukleotydowych starterów i termostabil-nej polimerazy DNA (patrz Metody badań 4.2, s. 64), odpornej na denaturację pod wpływem wysokiej temperatury. Zwykle używa się polimerazy Taq z bakterii Thermus aquaticus żyjącej w gorących źródłach. Dwa startery muszą się przyłączyć do matrycy na obu końcach namnażanego regionu, co oznacza, że aby przygotować odpowiednie oligonukleotydy, musimy znać skrajne sekwencje. Oligonukleotydy zapoczątkowują syntezę nowego, komplementarnego polinukleotydu tworzonego - jak we wszystkich enzymatycznych syntezach DNA - w kierunku od 5' do 3' przez kopiowanie matrycowego DNA w kierunku od 3' do 5' (patrz rys. /./, s. 3 i sekcja 12.3.2).

Ponieważ polimeraza Taq jest termostabilna, mieszaninę reakcyjną można podgrzać do 90°C bez niszczenia aktywności enzymu. W tej temperaturze nowe nici oddzielają się od matrycowego DNA. Po ochłodzeniu mieszaniny do matrycowego DNA, a także do nowych nici, przyłącza się więcej starterów. Wtedy polimeraza Taq przeprowadza drugi cykl syntezy DNA.

PCR można kontynuować przez 30-40 cykli, nim enzym ulegnie ostatecznej inaktywacji albo startery lub nukleotydy zostaną zużyte. Pojedynczą cząsteczkę wyjściową można namnożyć do dziesiątek milionów identycznych fragmentów, co stanowi kilka mikrogramów DNA. Obecność polimorficz-nego miejsca restrykcyjnego w namnożonym regionie można sprawdzić przez trawienie produktu reakcji PCR enzymem restrykcyjnym i sprawdzenie próbki w żelu agarozowym.


mniej czułą niż hybrydyzacja z sondą. Tło niena-mnożonego DNA nie pokazuje się, jedynymi widocznymi fragmentami są te, które pochodzą z namnożonego DNA.

Zauważmy, że techniki te bezpośrednio wykrywają oba allele RFLP: oznacza to, że (jak przy innych markerach DNA) allele są kodominujące.

Polimorfizm długości prostych sekwencji (SSLP)

SSLP (ang. - simple sequence length polymorphism) są szeregami powtórzeń sekwencji, przejawiającymi różnice długości, a wiec różnymi allelami zawierającymi różną liczbę jednostek powtarzalnych (rys. 1.5A). W odróżnieniu od RFLP, SSLP może być wieloallelowe, bo każdy SSLP może mieć wiele różnych wariantów długości. Istnieją dwa typy SSLP:

• Minisatelity, znane także jako zmienna liczba powtórzeń tandemowych (VNTR - ang. variable number of tandem repeats), w których jednostka powtarzalna ma kilkadziesiąt nukleotydów długości.

(A) Dwa warianty SSLP

allel I

allel 2

(B) Typowanie SSLP za pomocą reakcji PCR

elektroforeza w żelu agarozowym

ŚCIEŻKA A: test ŚCIEŻKA B: markery alleli WNIOSEK: badany DNA zawiera allel 2

Rysunek 2.5 SSLP i ich oznaczanie

(A) Dwa allele mikrosatelitarnego SSLP. W allelu I m o t y w „GA" jest powtórzony trzy razy, a w allelu 2 - pięć razy. (B) Sposób oznaczania SSLP w reakcji PCR. Region otaczający SSLP amplifikuje się, a badany produkt identyfikuje się przez elektroforezę w żelu agarozowym. Produkty PCR dają prążek odpowiadający dłuższej z sekwencji dwóch alleli wykazując, że testowany D N A zawierał allel 2. Opis elektroforezy w żelu znajduje się w Metodach badań 3.2, s. 43

allel 1

allel 2

Rysunek 2.6 Polimorfizm punktowy

• Mikrosatelity lub proste powtórzenia tandemowe (STR - ang. simple tandem repeats), w których powtórzeniami są znacznie krótsze jednostki, przeważnie dwu-, trzy- lub czteronukleotydowe. Dwa mikrosatelity spotkaliśmy w rozdziale 1, gdy patrzyliśmy na typowy 50-kb fragment genomu człowieka (patrz rys. 1.5, s. 6).

Jako markery DNA mikrosatelity są bardziej popularne niż minisatelity z dwóch powodów. Po pierwsze, minisatelity nie są równo rozprzestrzenione w genomie, lecz częściej znajduje się je bliżej końców chromosomów. Stosując porównanie geograficzne, równoważne jest to z próbą użycia mapy latarni morskich, by znaleźć drogę wokół wyspy. Mikrosatelity są dogodniej rozmieszczone w genomie. Po drugie, najszybszym sposobem oznaczania polimorfizmów długości jest reakcja PCR (rys. 2.5B), a za jej pomocą znacznie szybciej i dokładniej oznacza się sekwencje krótsze niż 300 bp. Większość alleli minisatelitarnych jest dłuższa, ponieważ jednostki powtarzalne są stosunkowo długie i często jest ich wiele w jednym ciągu. Typowy mikrosatelita zawiera 10-30 kopii powtarzalnej sekwencji nie dłuższej niż cztery bp, i dlatego lepiej nadaje się do oznaczenia w reakcji PCR. Dotychczas w genomie człowieka znaleziono około 104 mikro-satelitów, ale prawdopodobnie jest ich znacznie więcej (sekcja 6.3.1).

Polimorfizmy punktowe (SNP) SNP (ang. single nucleotide polymorphism) stanowią bardzo licznie występujące w genomie pojedyncze mutacje punktowe (rys. 2.6). Niektóre równocześnie prowadzą do RFLP, choć nie większość, ponieważ sekwencji, w obrębie których leżą SNP, nie rozpoznaje żaden enzym restrykcyjny. Uważa się, że w genomie człowieka jest ponad 200 000 SNP położonych w genach i prawdopodobnie dziesięć razy tyle, a może i więcej w DNA pozagenowym (Collins i wsp., 1997).

Każdy SNP ma tylko dwa allele *, więc z punktu widzenia mapowania genów człowieka ma te same wady co RFLP; istnieje duże prawdopodobieństwo, że wszyscy członkowie rodziny będą homozygotyczni pod względem pojedynczego SNP. Zaletą SNP jest ich

* Polimorfizm punktowy może mieć cztery allele odpowiadające wystąpieniu jednego z czterech możliwych nukleotydów: A, C, T, G (przyp. tłum.).


Rysunek 2.7 Hybrydyzacja z oligonukleotydami jest bardzo specyficzna

W bardzo dokładnie określonych warunkach hybrydyzacji stabilna cząsteczka hybrydowa powstaje tylko wtedy, gdy oligonukleotyd może utworzyć z docelowym D N A strukturę, w której wszystkie nukleotydy tworzą pary. Pojedyncze miejsce, w którym zasady nie tworzą pary, uniemożliwia tworzenie hybrydy. Aby osiągnąć taki poziom precyzji warunków, temperatura inkubacji musi być tuż poniżej t e m p e r a t u r y topnienia (T ) oligonukleotydu. W temperaturze powyżej 7 nawet cząsteczka, w której wszystkie zasady tworzą pary, jest niestabilna. Jeśli temperatura jest niższa od T o więcej niż 5°C, to hybrydy, w których nie wszystkie zasady tworzą pary, mogą być stabilne. T oligonukleotydu pokazanego na rysunku wynosi około 58°C. Obliczono to ze wzoru T m = (4 x liczba nukleotydów G i C) + (2 x liczba nukleotydów A i T) °C

olbrzymia liczba i możliwość oznaczania metodami nie wymagającymi elektroforezy w żelu. Jest to istotne dlatego, że elektroforeza w żelu jest trudna do zautomatyzowania, więc każda metoda detekcji na niej oparta będzie stosunkowo powolna i pracochłonna. Wykrywanie SNP jest szybkie, ponieważ opiera się na analizie hybrydyzacji z oligonukleotydami. Oligonukleotyd to krótka, syntetyzowana chemicznie, jed-noniciowa cząsteczka DNA, zwykle krótsza niż 50 nukleotydów. Jeśli warunki są odpowiednie, oligonukleotyd będzie hybrydyzował z inną cząsteczką DNA tylko wtedy, gdy na całej swojej długości utworzy z nią pary nukleotydów. Jeśli pojawi się jednonukleotydowa różnica, jedna pozycja oligonukleotydu nie tworzy pary i hybrydyzacja nie zachodzi (rys. 2.7). Hybrydyzacja z oligonukleotydami pozwala rozróżnić dwa allele SNP. Strategia przeszukiwania obejmuje:

• Technologię „chip" DNA (patrz Metody badań 2.3). „Chip" DNA jest silikonową płytką, o powierzchni 2 cm2 lub mniejszej, niosącą wiele różnych gęsto poukładanych oligonukleotydów. Testowany DNA znakuje się znacznikiem fluorescencyjnym i pipe-tuje na powierzchnię płytki. Hybrydyzację wykrywa się oglądając „chip" pod mikroskopem fluorescencyjnym. Pozycje emitujące sygnał fluorescencyjny pokazują, który oligonukleotyd zhybry-

dyzował z badanym DNA. W ten sposób w jednym eksperymencie można oznaczyć wiele SNP (Wang i wsp., 1998).

• Dynamiczna hybrydyzacja specyficzna dla allelu (DASH - ang. dynamic allele-specific hybridization; Pennisi, 1998). W tej technice hybrydyzacja zachodzi w roztworze, na przykład w jednej ze studzienek 96-studzienkowej płytki mikrotitracyjnej i wykrywana jest dzięki znacznikowi fluorescencyjnemu wiążącemu się jedynie z dwuniciowym DNA. Sygnał emitowany jest wyłącznie wtedy, gdy zachodzi hybrydyzacja. Początkowo hybrydyzacja zachodzi w warunkach umożliwiających istnienie pojedynczych miejsc, gdzie zasady nie tworzą par. Na tym etapie eksperymentu oligonukleotydy i badany DNA hybrydyzują niezależnie od tego, jaki allel SNP występuje w DNA. Rozróżnienie między al-lelami osiąga się podnosząc temperaturę, ponieważ hybrydy, w których nie wszystkie zasady tworzą pary, są mniej stabilne niż pełne hybrydy i rozpadają się w niższej temperaturze. Obserwując, w jakiej temperaturze zanika sygnał fluorescencyjny zależny od hybrydyzacji, można określić, który allel znajduje się w badanym DNA.

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO

2.3.1 Analiza sprzężeń jest podstawą mapowania genetycznego

Teraz, kiedy zebraliśmy zestaw markerów, dzięki którym możemy skonstruować mapę, przyjrzyjmy się samym technikom mapowania. Wszystkie opierają się na sprzężeniu genetycznym, odkrytym przez Bate-sona, Saundersa i Punnetta w 1905 r., lecz zrozumianym dopiero gdy Tomasz H u n t Morgan rozpoczął swoje przełomowe badania na muszkach owocowych w latach 1910-1911. Pierwsi genetycy XX wieku rozpoznali, że geny leżą na chromosomach, a każdy chromosom dziedziczy się jako niepodzielna jednostka. Innymi słowy, jeśli dwa geny leżą na tym samym chromosomie, to są ze sobą fizycznie sprzężone i w związku z tym powinny dziedziczyć się wspólnie. Wyglądało to na bezpieczną hipotezę, jednak gdy pierwsi genetycy przeprowadzili krzyżówki genetyczne podobne do opublikowanych przez Mendla 40 lat wcześniej, stwierdzili, że niewiele genów wykazuje pełne sprzężenie. Pary genów dziedziczyły się albo niezależnie, jak geny z różnych chromosomów, albo jeśli wykazywały sprzężenie, było to jedynie sprzężenie częściowe: czasem dziedziczyły się razem, a czasem nie (rys. 2.8). Rozwiązanie tej sprzeczności między teorią a doświadczeniem było milowym krokiem w rozwoju technik mapowania genetycznego.

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 23

„ C h i p " D N A

G ę s t o u ł o ż o n e cząsteczk i D N A d o r ó w n o l e g ł y c h anal iz h y b r y d y z a c y j n y c h

„Chip" D N A zaprojektowano, by umożliwić przeprowadzanie

jednocześnie wielu eksperymentów hybrydyzacyjnych. Jego

głównym zastosowaniem jest poszukiwanie pol imorf izmów,

takich jak SNP (sekcja 2.2.2), i porównywanie populacji RNA

z różnych komórek (sekcja 5.4.1). Może być także stosowany

w nowych metodach sekwencjonowania D N A (sekcja 4.1.2).

„ C h i p " D N A niesie dużą liczbę sond D N A , każdą o innej

sekwencji i umieszczoną w określonym miejscu na powierz

chni płytki. Sondy mogą być syntetycznymi oligonukleotydami

lub innymi krótk imi cząsteczkami D N A , takimi jak k o m

p l e m e n t a r n y D N A ( c D N A - ang. complementary D N A ;

patrz rys. 3.11, s. 50). W najwcześniejszych metodach oligo

nukleotydy lub c D N A nanoszono na szkiełka mikroskopowe

lub błonę nylonową, by utworzyć m i k r o p a n e l e . W ten

sposób można było osiągnąć stosunkowo małą gęstość,

przeważnie 6400 kropek na powierzchni 18 mm na 18 mm

ustawionych 80 x 80. Aby stworzyć panele o dużym zagęsz

czeniu, potrzebna była bardziej rozwinięta technologia. Roz

wiązaniem okazała się synteza ol igonukleotydów in situ na

powierzchni płytki, co wymagało rozszerzenia metodologii

stosowanej w syntezie oligonukleotydów, jak pokazano na

rysunku obok. Zwykła metoda obejmuje dodawanie nukleo-

t y d ó w jeden po drugim do rosnącego końca; sekwencja

zależała od tego, k t ó r y z substratów d N T P dodano do

mieszaniny reakcyjnej. Taka metoda zastosowana do paneli

D N A zaowocowałaby wszystkimi oligonukleotydami o takiej

samej sekwencji. Zamiast tego używa się substratów d N T P

zmodyfikowanych tak, że przed przyłączeniem do końca

rosnącego oligonukleotydu wymagają aktywacji świetlnej.

d N T P dodaje się jeden po drugim do powierzchni płytki, a do

skierowania pulsów światła na konkretne pozycje, czyli okreś

lenia, który z rosnących oligonukleotydów zostanie wydłużony

o dany d N T P , używa się fotolitografii.

W ten sposób można osiągnąć gęstość do jednego miliona

ol igonukleotydów na c m 2 (Ramsay, 1998), co przy poszuki

waniu SNP pozwala typować pół miliona pol imorf izmów

w jednym eksperymencie, zakładając, że są oligonukleotydy

dla obu alleli SNP. „ C h i p " D N A nie jest trudny w użyciu

(patrz rysunek poniżej). Aby umożliwić zajście hybrydyzacji,

zwykta synteza

dodawanie tylko do zaktywowanych oligonukleotydów

„chip" inkubuje się z wyznakowanym docelowym D N A .

Przez skanowanie powierzchni płytki i zapisanie pozycji,

w których w y k r y t o emisję sygnału wysyłanego przez znacznik,

określa się, k t ó r e oligonukleotydy zhybrydyzowały z D N A .

Do mikropaneli o małej gęstości można stosować znaczniki

izotopowe, wykrywane elektronicznie za pomocą urządzenia

o nazwie p h o s p h o r i m a g e r . Metoda ta nie zapewnia jednak

rozdzielczości odpowiedniej dla paneli o dużej gęstości, do

nich niezbędne jest więc użycie znacznika fluorescencyjnego

(Metody badań 3.3, s. 46). Sygnał fluorescencyjny w y k r y w a się

przez skanowanie laserem czy bardziej r u t y n o w o - fluores

cencyjnym mikroskopem konfokalnym.

dodawanie do wszystkich oligonukleotydów

synteza aktywowana światłem

DNA wyznakowany fluorescencyjnie

mikroskopia konfokalna „chip" DNA

hybrydyzacja

sygnały hybrydyzacji


Rysunek 2.8 Częściowe sprzężenie

Częściowe sprzężenie odkryto na początku XX wieku. Pokazaną tutaj krzyżówkę przeprowadzili Bateson, Saunders i Punnett w roku 190S na grochu cukrowym. Krzyżówka rodzicielska daje wynik typowy dla krzyżówek dwupunktowych (patrz ramka 2. /, s. I 7), gdzie

wszystkie rośliny F1 mają taki sam fenotyp, wskazując, że za f ioletowe kwiaty i podłużne ziarna pyłku odpowiadają allele dominujące. Nieoczekiwanie potomstwo krzyżówki F ( nie wykazywało stosunku fenotypów 9:3:3:1 (oczekiwanego dla genów na różnych chromosomach) ani 3:1 (oczekiwanego przy całkowitym sprzężeniu). Ten niezwykły stosunek jest typowy dla częściowego sprzężenia

Zachowanie się chromosomów w czasie mejozy wyjaśnia, dlaczego geny wykazują sprzężenie częściowe, a nie całkowite Przełomowego odkrycia dokonał Tomasz H u n t Morgan wyjaśniając zależność między sprzężeniem częściowym a zachowaniem chromosomów w czasie podziału jądra komórkowego. Cytolodzy w końcu XIX wieku rozróżniali dwa typy podziału jądra: mitozę i mejozę. Powszechniejszy z nich - mitoza to proces, w którym diploidalne jądro komórki somatycznej dzieli się na dwa potomne, wciąż diploidalne jądra (rys. 2.9). Aby stworzyć wszystkie komórki niezbędne w ciągu całego ludzkiego życia, potrzeba około 101 7 mitoz. Zanim rozpocznie się mitoza, każdy chromosom w jądrze replikuje się, ale kopie nie od razu oddzielają się od siebie. Na początku pozostają połączone w swoich centrome-rach i nie rozłączają się do momentu, gdy chro

mosomy są rozdzielane między dwa nowe jądra w czasie mitozy. Szczególnie istotne jest, że każde potomne jądro otrzymuje pełen zestaw chromosomów, a większość zdarzeń, które składają się na proces mitozy, służy osiągnięciu tego celu.

Proces mitozy nie ma bezpośredniego związku z mapowaniem genetycznym. Z mapowaniem związany jest inny proces podziałowy - mejoza. Mejoza zachodzi tylko w komórkach rozrodczych. W jej wyniku z komórki diploidalnej powstają cztery hap-loidalne gamety, z których każda może połączyć się z gametą płci przeciwnej w czasie rozmnażania płciowego. Łatwo wyjaśnić to, że po mejozie powstają cztery komórki haploidalne. Mitoza prowadzi do powstania dwóch komórek diploidalnych: w mejozie zachodzą, jeden po drugim, dwa podziały jądra. Podstawowa różnica między mitozą i mejoza jest subtelniejsza. Przypomnijmy, że w komórce diploidal-


Rysunek 2.9 Mitoza

W interfazie, czyli okresie między podziałami jąder, chromosomy znajdują się w formie rozciągniętej (sekcja 6.1.1). Na początku mitozy chromosomy kondensują i do późnej profazy formują struktury widoczne w mikroskopie świetlnym. Każdy chromosom właśnie przeszedł replikację D N A , ale dwa potomne chromosomy są połączone centromerami. W czasie metafazy pęka błona jądrowa (u większości eukariotów) i chromosomy ustawiają się w jednej płaszczyźnie na środku komórki . Teraz mikrotubule odciągają siostrzane chromosomy w stronę przeciwnych końców komórk i . W telofazie w o k ó ł każdego zbioru potomnych chromosomów odtwarzają się błony jądrowe. Wynikiem jest powstanie z jednego jądra rodzicielskiego dwóch identycznych jąder potomnych. Dla ułatwienia pokazano tylko jedną parę chromosomów homologicznych; jeden w parze jest czerwony, a drugi - niebieski

nej są dwie oddzielne kopie każdego chromosomu (sekcja 1.1.1), nazywane chromosomami homologicznymi. W czasie mitozy chromosomy homologiczne pozostają oddzielone od siebie. Każdy z pary replikuje się i jest przenoszony do jądra potomnego niezależnie od swojego homologa. Natomiast w czasie mejozy chromosomy homologiczne nie zachowują się niezależnie. W pierwszym podziale mejotycznym każdy chromosom łączy się z homologiem tworząc biwalent (rys. 2.10). Zachodzi to po replikacji każdego chromosomu, ale przed rozdzieleniem zreplikowanych struktur. Biwalent w rzeczywistości zawiera cztery kopie chromosomów, a przeznaczeniem każdej z nich jest odnalezienie drogi do jednej z czterech gamet wytworzonych na końcu mejozy. Wewnątrz biwalentu ramiona chromosomów (chromatydy) przechodzą fizyczne przerwanie i wymianę segmentów DNA. Proces ten nazywa się crossing-over lub rekombinacją i został odkryty przez belgijskiego cytologa Jans-sensa w 1909 r., zaledwie na dwa lata przed tym, nim Morgan zaczął zastanawiać się nad częściowym sprzężeniem.

W jaki sposób odkrycie crossing-over pomogło Morganowi wyjaśnić częściowe sprzężenie? Aby to zrozumieć, musimy pomyśleć o wpływie jaki crossing-

-over może mieć na dziedziczenie genów. Rozważmy dwa geny, oba o dwóch allelach. Gen pierwszy nazwijmy A, a jego allele A i a, zaś drugi gen B o allelach B i b. Wyobraźmy sobie teraz, że te dwa geny leżą na chromosomie 2 Drosophila melanogaster, gatunku muszki owocowej badanego przez Morgana. Prześledzimy teraz przebieg mejozy diploidalnego jądra, w którym jedna kopia chromosomu 2 ma allele A i B, zaś druga ma a i b. Sytuację tę ilustruje rysunek 2.11. Rozważmy dwa alternatywne scenariusze:

1) Crossing-over nie zachodzi między genami A i B. W tym przypadku dwie powstające gamety będą zawierały kopie chromosomów z allelami A i B, a pozostałe dwie będą zawierać a i b. Innymi słowy, dwie gamety mają genotyp AB, a dwie genotyp ab.

2) Crossing-over zachodzi między genami A i B. Doprowadzi to do wymiany segmentów DNA zawierających gen B między chromosomami homologicznymi. W końcu otrzymuje się cztery gamety o różnych genotypach: AB, aB, Ab, ab.

Pomyślmy teraz, co się zdarzy jeśli spojrzymy na wyniki mejozy w 100 identycznych komórkach. Jeśli nigdy nie zachodzi rekombinacja, uzyskamy gamety

centromer

późna profaza

metafaza

mikrotubule

anafaza

telofaza

interfaza

btona jądrowa


Pokazano zdarzenia obejmujące jedną parę chromosomów homologicznych; jeden z chromosomów tworzących parę jest czerwony, drugi niebieski. Na początku mejozy chromosomy kondensują i każda para chromosomów homologicznych ustawia się, by utworzyć biwalent. W biwalencie może zajść crossing-over, obejmujący przerwanie ramion chromosomów i wymianę D N A . Później w mejozie następują dwa podziały jądra; wynikiem pierwszego są dwa jądra, oba z dwiema kopiami każdego chromosomu. W końcu powstają cztery jądra, każde zawierające pojedynczą kopię każdego chromosomu. Końcowe produkty mejozy - gamety są więc haploidalne. Molekularne podstawy rekombinacji opisano w podrozdziale I 3.2

o następujących genotypach:

200 AB 200 ab

Oznacza to całkowite sprzężenie: geny A i B w czasie mejozy zachowują się jak pojedyncza jednostka. Ale jeśli (a jest to bardziej prawdopodobne) w niektórych jądrach zajdzie rekombinacja między A i B, pary alleli nie będą dziedziczone jak pojedyncze jednostki. Załóżmy, że rekombinacja zachodzi w czasie 40 ze 100 mejoz. Wśród powstałych gamet będzie:

160 AB 160 ab 40 Ab 40 oB

To sprzężenie nie jest całkowite, jest tylko częściowe. Oprócz dwóch genotypów rodzicielskich (AB, ab) widzimy gamety o genotypach zrekombinowanych (Ab, aB).

Od częściowego sprzężenia do mapowania genetycznego Kiedy Morgan zrozumiał, jak można wytłumaczyć częściowe sprzężenie przez crossing-over zachodzący w czasie mejozy, wymyślił sposób mapowania względnych pozycji genów na chromosomie. W rzeczywistości kluczowego odkrycia nie dokonał sam Morgan, ale student pracujący w jego laboratorium, Artur Stur-tevant (Sturtevant, 1913). Stwierdził on, że crossing--over jest zjawiskiem losowym, z czego wynika, że prawdopodobieństwo jego zajścia w każdej pozycji wzdłuż pary równolegle ułożonych chromatyd jest jednakowe. Jeśli to założenie jest prawdziwe, to dwa blisko siebie położone geny będą rozdzielane przez rekombinację rzadziej niż dwa geny bardziej od siebie oddalone. Idąc dalej - częstość, z którą geny będą rozprzęgane przez crossing-over, będzie wprost proporcjonalna do ich odległości na chromosomie. Częstość rekombinacji jest więc miarą odległości między dwoma genami. Jeśli uda się określić częstość rekom-


Rysunek 2.1 I W p ł y w crossing-over na sprzężone geny

Rysunek pokazuje parę chromosomów homologicznych jeden czerwony, a drugi niebieski. A i B są sprzężonymi genami o allelach A, a, 8 i fa. Z lewej strony pokazano mejozę, w której między A i B nie zaszedł crossing-over. Dwie otrzymane gamety mają genotyp AB, a pozostałe dwie ab. Z prawej strony między A i B zaszedł crossing-over: cztery gamety wykazują wszystkie możl iwe genotypy: AB, aB, Ab i ab

binacji dla różnych par genów, można skonstruować mapę ich względnych pozycji na chromosomie (rys. 211):

Okazało się, że założenie Sturtevanta o losowości crossing-over nie było do końca uzasadnione. Porównania między mapami genetycznymi a rzeczywistymi pozycjami genów w cząsteczkach DNA określonymi przez mapowanie fizyczne i sekwencjonowanie DNA wykazały, że w niektórych obszarach chromosomów,

nazywanych gorącymi punktami rekombinacji, crossing-over zachodzi częściej niż w innych. Oznacza to, że odległość na mapie genetycznej niekoniecznie odzwierciedla fizyczną odległość między dwoma markerami. Teraz zdajemy sobie także sprawę z tego, że pojedyncza chromatyda może brać udział w więcej niż jednym akcie rekombinacji jednocześnie, ale też że odległość, w której te dwie rekombinacje mogą zajść, jest ograniczona. Prowadzi to do dalszych niedokład-


Rysunek 2.12 Tworzenie mapy genetycznej na podstawie częstości rekombinacji

Przykład zaczerpnięto z oryginalnych eksperymentów z muszką owocową przeprowadzonych przez Artura Sturtevanta. Wszystkie cztery geny są potożone na chromosomie X muszki owocowej. Pokazano częstości rekombinacji między genami wraz z wydedukowanymi na ich podstawie pozycjami genów na mapie

ności w procedurze mapowania. Niezależnie od tych zastrzeżeń analiza sprzężeń zwykle prowadzi do prawidłowych wniosków o porządku genów, a oszacowania odległości są wystarczająco dokładne do stworzenia m a p genetycznych nadających się do zastosowania jako szkic w projektach sekwencjonowania genomów.

2.3.2 Przeprowadzanie analizy sprzężeń u różnych typów organizmów

Aby zobaczyć, jak rzeczywiście przeprowadza się analizę sprzężeń, powinniśmy rozważyć trzy różne sytuacje:

• Analiza sprzężeń u organizmów takich jak muszka owocowa i mysz, które można poddawać planowanym eksperymentom hodowlanym.

• Analiza sprzężeń u ludzi, na których nie można przeprowadzać planowanych eksperymentów, można jednak wykorzystać rodowody rodzin.

• Analiza sprzężeń u bakterii, które nie przechodzą mejozy.

Analiza sprzężeń, gdy możliwe sq planowane eksperymenty hodowlane Pierwszym typem analizy sprzężeń jest nowoczesne uzupełnienie metody wynalezionej przez Morgana i jego współpracowników. Metoda opiera się na analizie potomstwa z eksperymentalnych krzyżówek między rodzicami o znanych genotypach i można ją stosować, przynajmniej w teorii, u wszystkich euka-riotów. Względy etyczne wykluczają jej zastosowanie u ludzi, a problemy praktyczne, takie jak długość

ciąży czy czas potrzebny potomstwu do osiągnięcia dojrzałości (a więc uczestniczenia w następnych krzyżówkach) ograniczają efektywność metody w stosunku do niektórych zwierząt i roślin.

Jeśli wrócimy do rysunku 2.11, zobaczymy, że kluczem do mapowania genetycznego jest możliwość ustalenia genotypów gamet powstałych po mejozie. W kilku przypadkach jest to możliwe przez bezpośrednie badanie gamet. Na przykład gamety wytwarzane przez niektóre mikroorganizmy eukariotyczne, z Saccharomy-ces cerevisiae włącznie, można hodować jako kolonie komórek haploidalnych i określać ich genotyp stosując testy biochemiczne. Bezpośrednie genotypowanie gamet jest także możliwe u wyższych Eukaryota z użyciem markerów DNA. DNA z pojedynczego plemnika może służyć do przeprowadzenia reakcji PCR, umożliwiając oznaczenie RFLP, SSLP i SNP. Niestety analizy DNA z plemników są dość pracochłonne. Rutynowej analizy sprzężeń u wyższych Eukaryota nie przeprowadza się więc bezpośrednio badając gamety, lecz ustalając genotypy diploidalnego potomstwa powstałego z fuzji dwóch gamet, po jednej od każdego z rodziców. Innymi słowy przeprowadza się krzyżówkę genetyczną.

Komplikacją krzyżówki genetycznej jest to, że uzyskane potomstwo nie jest wynikiem jednej, lecz dwóch mejoz (jednej u każdego z rodziców), a u większości organizmów przypadki rekombinacji są równie prawdopodobne w czasie tworzenia gamet zarówno męskich, jak i żeńskich. Musimy w jakiś sposób móc wyłonić z genotypów diploidalnego potomstwa przypadki rekombinacji, które zaszły w obu tych mejozach. Oznacza to, że krzyżówkę należy przeprowadzać bardzo starannie. Standardowo wykorzystuje się krzy-


żówkę testową. Ilustruje ją rysunek 2.13, scenariusz 1, gdzie przeprowadziliśmy krzyżówkę testową, by zma-pować dwa spotkane wcześniej geny A (allele A i a) i B (allele B i b), oba z chromosomu 2 muszki owocowej. Istotną cechą testu jest genotyp każdego z rodziców:

• Jeden z rodziców jest podwójną heterozygotą. Oznacza to, że u tego rodzica obecne są wszystkie cztery allele: jego genotyp to AB/ab. Podwójne heterozygoty otrzymuje się przez skrzyżowanie dwóch linii czystych, na przykład AB/ABxab/ab (patrz ramka 2.1, s. 17).

• Drugi z rodziców jest pochodzącą z linii czystej podwójną homozygotą. Obie kopie homologicznych chromosomów 2 u tego rodzica są takie same: w przykładzie przedstawionym w scenariuszu 1 obie mają allele a i b, więc genotyp ab/ab.

Podwójne heterozygoty mają genotyp taki sam jak komórka, której mejozę prześledziliśmy na rysunku 2.11. Naszym celem jest wywnioskowanie, jakie były genotypy gamet wytworzonych przez tego rodzica i obliczenie frakcji rekombinantów. Zauważ, że gamety

produkowane przez drugiego z rodziców, będącego podwójną homozygotą, będą mieć genotyp ab niezależnie, czy będą gametami rodzicielskimi, czy po rekombinacji. W rezultacie mejoza u tego rodzica w czasie badania genotypów potomstwa jest „niewidoczna" co oznacza, że jak pokazuje scenariusz 1 na rys. 2.13, genotypy diploidalnego potomstwa można jednoznacznie przyporządkować genotypom gamet od rodzica będącego podwójną heterozygotą. Krzyżówka testowa umożliwia bezpośrednie przebadanie pojedynczej me-jozy, a zatem obliczenie częstości rekombinacji i zma-powanie odległości dwóch genów.

Należy rozważyć jeszcze jeden punkt. Jeśli, jak na rysunku 2.13 w scenariuszu 1, stosuje się markery genowe wyrażające dominację lub recesywność, rodzic będący podwójną homozygotą musi mieć oba allele warunkujące fenotyp recesywny. Jeżeli jednak stosuje się kodominujące markery DNA, rodzic będący podwójną homozygotą może mieć jakąkolwiek kombinację alieli homozygotycznych (tzn. AB/AB, Ab/Ab, aB/aB, ab/ab). Powody ku temu pokazuje scenariusz 2 na rysunku 2.13.

Scenariusz I A i B są markerami genetycznymi A i 6 są dominujące względem o i b

Scenariusz 2 A i B są markerami genetycznymi A i 8 są kodominujące względem o i b

RODZICE

1 x 2 AB/ab ab/ab

krzyżówka testowa

RODZICE

1 x 2 AB/ab Ab/Ab

AB Ab aB ab

ab ab ab ab

gamety

AB Ab aB ab

Ab Ab Ab Ab

Każdy fenotyp jest taki sam jak gemeta rodzica I

Genotyp gamet rodzica I identyfikuje się na podstawie wykrytych alieli: Jeśli wykryto tylko A, gameta rodzica I byłaA. Jeśli wykryto A+a, to gameta rodzica I była a itd.

Rysunek 2.13 Dwa przykłady krzyżówki testowej

W scenariuszu I - A i B są markerami genetycznymi o allelach A, o, B i b. Uzyskane potomstwo liczy się badając jego fenotypy. Ponieważ rodzic będący podwójną homozygotą (rodzic 2) ma dwa allele recesywne, o i b, nic nie wnosi do fenotypów potomstwa. Fenotyp każdego osobnika z pokolenia F1 jest więc taki sam jak gamety od rodzica I, z której powstał dany osobnik. W scenariuszu 2 - A i B są markerami D N A , których pary alieli są kodominujące. W tym konkretnym przypadku rodzic będący podwójną homozygotą ma genotyp Ab/Ab. Allele obecne u każdego osobnika z pokolenia F1 wykrywa się bezpośrednio, na przykład techniką PCR. Kombinacje alieli pozwalają wydedukować genotypy gamet rodzica I, z których powstał każdy osobnik

GENOTYPY F1 FENOTYPY GENOTYPY F1 WYKRYTE ALLELE

ABab AB ABAb A+B+b Abab Ab AbAb A+b aBab aB aBAb A+a+B+b abab ab abAb A+a + b


Ramka 2.2: Krzyżówki wielopunktowe

Dokładność analizy sprzężeń jest większa, jeśli w jednej krzyżówce śledzi się więcej niż dwa markery. Nie tylko pozwala to szybciej uzyskać częstość rekombinacji, ale także, przez prostą analizę danych, umożliwia ustalenie względnego porządku markerów na chromosomie. Dzieje się tak dlatego, że aby w zestawie trzech markerów środkowy oddzielić od dwóch markerów zewnętrznych, potrzeba dwóch zdarzeń rekombinacyjnych. A dwa zewnętrzne markery można rozdzielić przez tylko jedną rekombinację.

pojedynczy crossing-over

D £ F d E F

Ponieważ podwójna rekombinacja jest mniej prawdopodobna

niż pojedyncza, oddzielenie środkowego markera od pozo

stałych będzie zachodzić stosunkowo rzadko. Przykład danych

otrzymanych z krzyżówki t rzypunktowej pokazano w tabelce. Krzyżówkę przeprowadzono między potrójną heterozygotą

(ABC/abc) i potrójną homozygotą (abcłabc). Najliczniejszą

klasę stanowi p o t o m s t w o mające jeden z dwóch genotypów

rodzicielskich pochodzące ż przypadków braku rekombinacji

w obszarze zawierającym markery A, B i C. Dwie następne

klasy potomstwa są stosunkowo częste (51 i 63 osobniki

w niniejszym przykładzie). Każda z nich powstała z pojedyn

czej rekombinacji. Analiza ich genotypów wskazuje, że w pier

wszej z tych dwóch klas marker A został rozprzęgnięty od

markerów B i C, a w klasie drugiej marker B został rozprzęg

nięty od A i C. Wnioskiem jest, że A i B są markerami

zewnętrznymi. Potwierdza to liczba potomstwa, u którego

marker C został rozprzęgnięty od A i B. Jest ich tylko dwoje,

co wskazuje, że do powstania tego genotypu potrzebna jest

podwójna rekombinacja. Marker C znajduje się więc między

A i B .

Genotypy potomstwa

ABC/abc abc/abc

aBC/abc Abc/abc

AbC/abc abc/abc

ABc/obc abC/abc

Liczba potomstwa

987

51

63

2

Wywnioskowane przypadki rekombinacji

brak (genotypy rodzicielskie)

jeden, między A i B, C

jeden, między B i A,C

dwa: jeden między C i A oraz jeden między C i B.

Mapowanie genów przez analizę rodowodów u człowieka

Oczywiście u ludzi niemożliwy jest dobór genotypów rodziców i przeprowadzenie krzyżówki zaprojektowanej specjalnie tak, aby była użyteczna w mapowaniu. Zamiast tego, dane do obliczenia częstości rekombinacji trzeba uzyskać przez badanie genotypów kolejnych pokoleń istniejących rodzin. Wynika z tego, że dostępne dane są ograniczone, a ich interpretacja trudna. Ludzkie małżeństwa rzadko stanowią odpowiednią krzyżówkę testową, a genotypów jednego lub większej liczby członków rodziny często nie można zbadać z powodu ich śmierci lub niechęci do współpracy.

Problem obrazuje rysunek 2.74. W tym przykładzie badamy chorobę dziedziczną obecną w rodzinie złożonej z dwojga rodziców i sześciorga dzieci. Choroby genetyczne są często stosowanymi markerami genetycznymi u ludzi. Stan choroby jest jednym allelem, a zdrowia drugim. Rodowód na rysunku 2.14A pokazuje, że matka jest chora tak jak i czworo jej dzieci. Wiemy z wywiadu rodzinnego, że babka ze strony matki również cierpiała na tę chorobę, ale zarówno ona, jak i jej mąż - dziadek ze strony matki nie żyją. Możemy włączyć ich do rodowodu zaznaczając, że nie

żyją, przez przekreślenie symbolu, jednak nie uzyskamy żadnych dalszych wiadomości o ich genotypach. Naszym celem jest zmapowanie pozycji genu odpowiedzialnego za chorobę genetyczną i w tym celu prześledzimy jej sprzężenie z mikrosatelitarnym markerem M, którego cztery allele - M1 M2, M3 i M4 są obecne u żyjących członków rodziny. Pytanie brzmi: jak wiele dzieci jest rekombinantami?

Jeśli spojrzymy na genotypy sześciorga dzieci, zobaczymy, że 1, 3 i 4 mają allele odpowiedzialne za chorobę i mikrosatelitarne allele M1. Natomiast 2 i 5 mają allel odpowiadający zdrowiu i M?. Możemy więc postawić dwie alternatywne hipotezy. Pierwsza: dwie kopie chromosomów homologicznych matki mają genotyp choroba-M 1 i zdrowie-M 2, w wyniku czego dzieci 1, 2, 3, 4 i 5 mają genotypy rodzicielskie, a szóste dziecko jest jedynym rekombinantem (rys. 2.14B). Sugerowałoby to, że gen warunkujący chorobę i mik-rosatelita są względnie blisko sprzężone i rekombinacja między nimi zachodzi rzadko. W hipotezie alternatywnej zakłada się, że chromosomy matczyne mają genotypy zdrowie-M, i choroba-M 2, dzieci 1-5 są rekombinantami, a numer sześć typem rodzicielskim, co by oznaczało, że geny są położone na chromosomie

podwójny crossing-over

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 3 I

(A) Rodowód

(B) Możliwe interpretacje rodowodu

CHROMOSOMY MATKI

DZIECKO I

DZIECKO 2

DZIECKO 3

DZIECKO 4

DZIECKO 5

DZIECKO 6

choroba M1

zdrowie M2

choroba M1

choroba M1

zdrowie M2

choroba M2

hipoteza I

choroba M1

zdrowie M2

rodzicielski

rodzicielski

rodzicielski

rodzicielski

rodzicielski

zrekombinowany

hipoteza 2

zdrowie M1

choroba M2

zrekombinowany

zrekombinowany

zrekombinowany

zrekombinowany

zrekombinowany

rodzicielski

częstość rekombinacji 1/6 = 6,7% 5/6 = 83,3%

(C) „Wskrzeszenie" babki ze strony matki

allel choroby musi być sprzężony z M1

HIPOTEZA I JEST PRAWDZIWA

Rysunek 2.14 Przykład analizy r o d o w o d ó w u człowieka

(A) Rodowód przedstawia dziedziczenie choroby genetycznej w rodzinie: dwojga żyjących rodziców i sześciorga dzieci oraz według informacji o babce ze strony matki - z wywiadu rodzinnego. Allel warunkujący chorobę (pełne symbole) dominuje nad allelem prawidłowym (puste symbole). Naszym zadaniem jest ustalenie stopnia sprzężenia między genem warunkującym chorobę a mikrosatelitą M przez typowanie alleli tego mikrosatelity ( M ( , M2, itd.) u żyjących członków rodziny. (B) Rodowód można zinterpretować na dwa różne sposoby. Hipoteza I zakłada małą częstość rekombinacji i wskazuje, że gen odpowiedzialny za chorobę jest blisko sprzężony z mikrosatelitą M. Hipoteza 2 sugeruje, że gen i mikrosatelita są znacznie słabiej sprzężone. W (C) problem zostaje rozwiązany przez ponowne pojawienie się babki ze strony matki; genotyp mikrosatelity babki jest zgodny wyłącznie z hipotezą I. Więcej szczegółów w tekście

LEGENDA

zdrowa kobieta chora kobieta zdrowy mężczyzna chory mężczyzna zmarły


względnie daleko od siebie. Nie możemy ustalić, która z hipotez jest prawidłowa: dane są frustrująco niejednoznaczne.

Najbardziej satysfakcjonującym rozwiązaniem problemu postawionego przez rodowód na rysunku 2.14 byłaby znajomość genotypu babki. Załóżmy na chwilę, że jesteśmy w serialu telewizyjnym w rodzaju „Dynastii" i babka w rzeczywistości nie umarła, natomiast ku

(A) Koniugacja

nukleoid

plazmidy

dawca biorca

(B) Transdukcja

DNA bakterii bakteriofag

(C) Transformacja

ogólnemu zaskoczeniu pojawia się ponownie w chwili odpowiedniej, by uratować wciąż malejącą oglądalność. Okazuje się, że jej genotyp pod względem mikrosatelity M to M1M5 (rys. 2.14C). To oznacza, że allel odpowiedzialny za chorobę i M1 znajdują się blisko siebie, na tym samym chromosomie. Teraz z pewnością możemy stwierdzić, że prawidłowa jest hipoteza 1 i tylko dziecko 6 jest rekombinantem.

Zmartwychwstanie kluczowych osobników zwykle nie jest opcją dostępną dla prawdziwego genetyka, chociaż DNA można uzyskać nawet ze zwłok lub kości ludzi nieżyjących. Niepełne rodowody analizuje się statystycznie stosując miarę zwaną lod score (Morton, 1995). Nazwa pochodzi od logarytmu prawdopodobieństwa (ang. logarithm of the odds), że geny są sprzężone. Miary tej używa się na początku do ustalenia, czy badane markery leżą na jednym chromosomie, innymi słowy - czy geny są sprzężone, czy nie. Jeśli analiza lod score ustali sprzężenie, można następnie określić miarę najbardziej prawdopodobnej częstości rekombinacji. W sytuacji idealnej dane będą pochodzić z więcej niż jednego rodowodu, podnosząc wiarygodność wyniku. Analiza jest mniej niejednoznaczna dla rodzin z większą liczbą dzieci i, jak widzieliśmy na rysunku 2.14, istotna jest możliwość genotypowania przynajmniej trzech pokoleń. Z tego powodu stworzono kolekcje rodzin, takie jak zebrana przez Centre d'Etudes du Polymorphi-sme Humaine (CEPH) w Paryżu (Dausset i wsp., 1990). Kolekcja CEPH zawiera hodowlane linie komórkowe z rodzin, w których można przebadać wszystkich czworo dziadków, jak też co najmniej ośmioro dzieci z drugiego pokolenia. Kolekcja jest dostępna do mapowania markerów DNA dla każdego badacza, który zgadza się dostarczyć uzyskane dane do centralnej bazy danych CEPH (patrz Badania i odkrycia 2.1).

Mapowanie genetyczne u bakterii Ostatnim typem mapowania genetycznego, którym się zajmiemy, jest podejście stosowane u bakterii. Główną trudnością, z którą spotykają się genetycy próbujący rozwinąć techniki mapowania dla bakterii, jest brak mejozy u tych haploidalnych organizmów. Trzeba było wymyślić inny sposób wprowadzenia rekombinacji między homologiczne segmenty bakteryjnego DNA. Rozwiązaniem stało się wykorzystanie

Rysunek 2.1 5 Trzy sposoby uzyskania transferu D N A między bakteriami

(A) Koniugacja może spowodować transfer chromosomowego lub plazmidowego D N A z bakterii będącej dawcą do biorcy. Koniugacja obejmuje fizyczny kontakt między dwiema bakteriami i przeniesienie zachodzące przez wąską rurkę zwaną pila. (B) Transdukcja to przeniesienie małego segmentu D N A z komórki dawcy za pośrednictwem bakteriofaga. (C) Transformacja jest podobna do transdukcji, ale przenoszony D N A jest „nagi". Zdarzenia przedstawione w (B) i (C) często wiążą się ze śmiercią komórki dawcy. W (B) śmierć następuje, gdy bakteriofag opuszcza komórkę dawcy; w (C) usunięcie D N A z komórki dawcy jest przeważnie konsekwencją naturalnej śmierci komórki


Mapa genetyczna człowieka

Jednym z pierwszych celów Projektu Poznania Genomu Człowieka była mapa genetyczna o gęstości przynajmniej jednego markera na każde I Mb genomu. Cel ten osiągnięto w 1994 r. Opisana tu publikacja, wydana dwa lata później, prezentuje mapę genetyczną o gęstości markerów wynoszącej średnio jeden na 0,6 Mb.

Mapę oparto na 5264 mikrosatelitach (sekcja 2.2.2) typu AC/TG:

5' - ACACACACACAC - 3' 3' - TGTGTGTGTGTG - 5'

Były dwie przyczyny, dla których wybrano mikrosatelity o tej konkretnej sekwencji. Po pierwsze są one częste w genomie, po kilka na każdy Mb DNA, co zapewnia stopień pokrycia odpowiedni do mapowania o dużej gęstości. Po drugie, ten typ mikrosatelity jest bardzo zmienny, występuje po kilka alleli każdego z nich w całej populacji. W praktyce oznacza to, że wykazują dużą heterozygo-tyczność, czyli wysokie prawdopodobieństwo, że przypadkowo wybrana z populacji osoba będzie heterozygotą pod względem tego konkretnego mikrosatelity. Średnia hete-rozygotyczność wszystkich markerów użytych do badania wynosiła 0,7 (prawdopodobieństwo 7 na 10, że osobnik będzie heterozygotą), a tylko 7% markerów miało hete-rozygotyczność mniejszą niż 0,5.

Do wykonania większości mapowania użyto materiału pochodzącego od ośmiu rodzin z kolekcji CEPH. Rodziny te obejmowały 134 osoby i pozwalały na prześledzenie 186 mejoz. Uzyskane dane wykorzystano do stworzenia map chromosomów od I do 22. Aby zmapować chromosom X, włączono jeszcze 12 rodzin (170 osób, o 105 mejoz więcej). Dodatkowe dane były potrzebne, ponieważ przypadki rekombinacji pomiędzy markerami sprzężonymi z X są w rodowodach rzadsze, gdyż mężczyźni mają tylko jeden chromosom X.

Mapa Analiza sprzężeń pozwoliła przypisać 5264 markery do 2335 pozycji chromosomowych. Liczba pozycji jest mniejsza niż liczba markerów, ponieważ niektóre mikrosatelity leżą zbyt blisko siebie, by je rozdzielić; dlatego zostały zmapowane w tej samej pozycji. Średnia gęstość dla całej mapy wyniosła jeden marker na 599 kb, sięgając od jednego na 495 kb dla chromosomu 17 do jednego markera na 767 kb dla chromosomu 9. Tylko w trzech miejscach w genomie najbliższe siebie markery wydawały się odległe o więcej niż 4 Mb DNA. Podejrzewa się, że te przerwy w rzeczywistości nie są tak wielkie, jak się wydają, prawdopodobnie w związku z gorącymi punktami rekombinacji (patrz s. 27). Dwa markery po przeciwnych stronach takiego miejsca będą wydawać się bardziej oddalone, niż są w rzeczywistości, z powodu dużej częstości rekombinacji zachodzącej między nimi.

Krótko po publikacji mapy genetycznej ukończono mapę fizyczną o gęstości markerów sięgającej jeden na 100 kb. (Patrz Badania i odkrycia 3.1, s. 56). Ta i inne mapy fizyczne

obejmują pozycje 7000 mikrosatelitów obecnych na mapie genetycznej, umożliwiając integrację obu typów map w jedną obszerną mapę genomu człowieka.

Mapa mikrosatelitów w genomie człowieka

Każda czerwona kreska oznacza jedną z 2335 pozycji, w których zostaty zmapowane markery mikrosatelitarne. Przedrukowano za zgodą z: Dib C et al., Nature, 380, 152-154. Copyright 1996 Macmillan Magazines Limited

Literatura cytowana Dib C, Fuare S, Fizames C, et al. (1996) A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature 380, 152-154.


dawca biorca

(A) Transfer kolejnych markerów w czasie koniugacji

(B) Jednoczesny transfer blisko sprzężonych markerów w czasie transdukcji lub transformacji

Rysunek 2.16 Podstawy mapowania genów u bakterii

Powyższy rysunek pokazuje transfer funkcjonalnego genu odpowiedzialnego za syntezę tryptofanu z dzikiej bakterii (o genotypie opisywanym jako trp+) do biorcy, któremu brakuje działającej kopii tego genu (trp~). Biorcę nazywa się auksotrofem t ryptofanowym (słowo używane do opisania zmutowanej bakterii, która może przeżyć tylko wówczas, gdy dostarczy się jej odpowiedniego składnika odżywczego - w t y m przypadku tryptofanu, który nie jest konieczny dla typu dzikiego, patrz sekcja 13.1.2). Po transferze potrzebna jest podwójna rekombinacja, by przeniesiony gen włączył się do chromosomu komórki biorcy, zmieniając fenotyp biorcy z trp- na trp+. (A) W czasie koniugacji D N A przenoszony jest z dawcy do biorcy w taki sposób, jak przeciąga się strunę przez rurkę. Względne pozycje markerów w cząsteczce D N A można zmapować ustalając czas, po którym markery pojawiają się w komórce biorcy. W pokazanym przykładzie markery A, B i C są przenoszone odpowiednio po 8, 20 i 30 minutach od rozpoczęcia koniugacji. Przeniesienie całego genomu £. coli zajmuje około 100 minut. (B) Aby zostać wspólnie przeniesione w czasie transdukcji lub transformacji, dwa markery (lub więcej) muszą być ściśle sprzężone, ponieważ zwykle procesy te umożliwiają przeniesienie z dawcy do biorcy mniej niż 50 kb DNA. Mapowanie z użyciem transdukcji i transformacji stosuje się do ustalenia względnych pozycji markerów położonych zbyt blisko siebie, aby zmapować je precyzyjnie stosując koniugację. Dalsze szczegóły - patrz Freifelder (1987)


jednej z trzech istniejących metod przenoszenia fragmentów DNA z jednej bakterii do drugiej (rys. 2.15):

1) Koniugacja, w czasie której dwie bakterie zbliżają się fizycznie i jedna z nich (dawca) przekazuje DNA drugiej bakterii (biorcy). Przeniesiony DNA może być kopią części lub, jeśli to możliwe, całości chromosomu komórki dawcy, albo też segmentem chromosomowego DNA długości do 1 Mb, włączonym do plazmidu (sekcja 1.2.2). Ten drugi przypadek nazywa się transferem episomu.

2) Transdukcja, która obejmuje przeniesienie małych (do ok. 50 kb) segmentów DNA z dawcy do biorcy za pośrednictwem bakteriofaga.

3) Transformacja, gdy komórka biorcy pobiera ze środowiska fragmenty DNA pochodzące z komórki dawcy, rzadko dłuższe niż 50 kb.

Po przeniesieniu musi zajść podwójna rekombinacja, tak aby DNA z bakterii dawcy włączył się do chromosomu komórki biorcy (rys. 2.16A). Jeśli to się nie zdarzy, przeniesiony DNA jest gubiony w czasie podziału komórki biorcy. Jedynym wyjątkiem jest transfer episomu, gdyż plazmidy mogą się namnażać niezależnie od chromosomu gospodarza.

Tutaj też używa się markerów biochemicznych, fenotypem dominującym lub typu dzikiego jest pewna cecha biochemiczna (np. zdolność syntezy tryptofanu; wrażliwość na antybiotyk *), a fenotypem recesywnym - cecha przeciwna (np. brak zdolności syntezy tryptofanu, oporność na antybiotyk). Transfer genu przeważnie przeprowadza się między dawcą mającym allele dzikie a biorcą o allelach recesywnych. Przeniesienie do szczepu biorcy śledzi się poszukując pojawienia się u biorcy funkcji biochemicznych określanych przez badane geny (rys. 2.16B). Szczegóły procedury mapowania zależą od używanego typu transferu genów. W mapowaniu koniugacyjnym DNA dawcy jest przenoszony do biorcy jako ciągła nitka, a pozycje genów mapuje się przez oznaczenie czasu wejścia alleli dzikich do biorcy. Mapowanie z zastosowaniem transdukcji i transformacji umożliwia zmapowanie genów położonych stosunkowo blisko siebie, ponieważ przenoszony segment DNA jest krótki (50 kb), a prawdopodobieństwo, że dwa geny zostaną przeniesione wspólnie, zależy od ich bliskości na chromosomie bakteryjnym.

* Wrażliwość na antybiotyki jest cechą dziką, na ogól recesywną (przyj), tłum.)

LITERATURA CYTOWANA

Collins FS, Guyer MS and Chakravart i A (1997) Variations on a theme: cataloging human D N A sequence variation. Science, 278, 1580-1581.

Dausset J, Cann H, Cohen D, et al. (1990) Program description: Centre d'Etude du Polymorphisme Humain - collaborative genetic mapping of the human genome. Genomics, 6, 575-577.

Freifelder D (1987) Microbiol Genetics. Jones & Bartlett, Boston. Mori M, Beatty PG, Graves M, Boucher KM and Milford EL (1997) HLA gene and haplotype frequencies in the N o r t h American

population. Transplantation, 65, U I. M o r t o n NE (1955) Sequential tests for the detection of linkage. Am. J. Hum. Genet., 7, 277-3 18. Orel V (1995) Gregor Mendel: The First Geneticist. Oxford University Press, Oxford. Pennisi E (1998) Sifting through and making sense of genome sequences. Science, 280, 1692-1693. Ramsay G (1998) D N A chips: state of the art. Nature Biotechnol, 16, 40-44. Sturtevant AH (1913) The linear arrangement of six sex-linked factors in Drosophila as shown by mode of association. J. Exp. Zoo/.,

14, 39-45. V e n t e r JC, Adams M D , Sutton G G , Kerlavage AR, Smith HO and Hunkapil ler M (1998) Shotgun sequencing of the human

genome. Science, 280, 1540-1542. W a n g D G , Fan J-B, Siao C-J, et al. (1998) Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in

the human genome. Science, 280, 1077-1082. Y a m a m o t o F, Clausen H, W h i t e T, M a r k e n J and H a k a m o r i S (1990) Molecular genetic basis of the histo-blood group ABO system.

Nature, 345, 229-233.

LITERATURA UZUPEŁNIAJĄCA

Alberts B, Bray D, Lewis J, Raff M, Roberts K and Watson JD (1994) Molecular Biology of the Cell. 3rd edition. Garland Publishing, NewYork. - Zawiera wszystkie szczegóły mitozy i mejozy.

Fincham JRS, Day PR and Radford A ( 1979) Fungal Genetics, 4th edition. Blackwell, London. - „Biblia" mapowania genów mikroorganizmów eukariotycznych.

Griffiths AJF, Miller JH, Suzuki D T , Lewontin RC and Gelbart WM (1996) An Introduction to Genetic Analysis, 6th edition. W. H. Freeman, NewYork. - Rozdziały 5 i 6 szczególnie dobrze opisują mapowanie genów za pomocą krzyżówek eksperymentalnych. Rozdział 10 dotyczy mapowania u bakterii.

Strachan T and Read AP (1996) Human Molecular Genetics. BIOS Scientific Publishers, Oxford. - Rozdział 12 obejmuje mapowanie genetyczne człowieka.

Sturtevant AH (1965) A History of Genetics. Harper and Row, N e w York. - Opisuje wczesne prace nad mapowaniem genów przeprowadzone przez Morgana i jego współpracowników.

genomy - brown rozdział 2 - ocr

Documents