10 - mappe fisiche e analisi del genoma umanodbce.uniroma1.it/sites/default/files/10 - mappe fisiche...

39
Mappe fisiche Mappe fisiche Si basano sulla localizzazione fisica delle molecole di DNA

Upload: dangcong

Post on 14-Feb-2019

218 views

Category:

Documents


1 download

TRANSCRIPT

Mappe fisicheMappe fisiche

Si basano sulla localizzazione fisica delle molecole di DNA

Costruzione di una mappa fisicaCostruzione di una mappa fisica� diversi metodi

- Mappe a bassa risoluzioneMappe a bassa risoluzione

- Mappe ad alta risoluzioneMappe ad alta risoluzione

Risoluzione= distanza a cui due punti devono trovarsi per poter essere identificati come distinti

Mappe fisiche a bassa risoluzione (5Mappe fisiche a bassa risoluzione (5--0.5Mb)0.5Mb)

Mappatura citogenetica mediante:bandeggio cromosomicoFISH (Fluorescence In Situ Hybridization)

Mappatura per delezione

Mappatura mediante ibridi

Mappe citogenetiche mediante bandeggioMappe citogenetiche mediante bandeggio

FluorescentFluorescent In Situ In Situ HybridizationHybridization (FISH)(FISH)

Ibridazione in situ con sonde marcate con diversi composti fluorescenti (ognuno emette ad una specifica lunghezza d’onda). Il vetrino è esposto alle varie lunghezze d’onda in maniera sequenziale generando al computer una “pittura cromosomica”

Incrocio tra un individuo omozigote per la mutazione recessiva ed un individuo eterozigote per la delezione

Mappatura per Mappatura per delezionedelezioneSu quale cromosoma risiedeun gene di interesse?

I geni sono assegnati ad un particolare cromosoma mediante l’associazione di un fenotipo con una delezione cromosomica

Mappe fisiche ad alta risoluzione (100kbMappe fisiche ad alta risoluzione (100kb--1bp)1bp)

Mappe di restrizione

Mappatura mediante STS (Sequence Tagged Sites)

Sequenziamento del DNA

Mappa di restrizioneMappa di restrizione

Uso di enzimi con siti di taglio rari

es. Not1 riconosce sequenza di 8 basi ricca in GC (meno frequenti sul genoma umano)

Elettroforesi su gel dei frammenti ottenuti per stimarne le dimensioni � RFLP

Mappe di restrizione (combinando risultati ottenuti con tagli di più enzimi contemporaneamente)

Sequenze utilizzabili come STS:Sequenze utilizzabili come STS:

-- una regione sequenziata casualmente e poi posizionata sul cromosoma- una regione mappata geneticamente- una sequenza trascritta

Le STSSTS, sono brevi segmenti unici di DNA di cui è nota sequenza e posizione sul genoma � landmark (pietra miliare)

Sono lunghe circa 100-500 bp e sono identificabili mediante PCR

STS nel gene per la proteina ribosomale S3.Le regioni sottolineate corrispondono ai primers usati per amplificarli

Mappatura mediante siti a sequenza etichettataMappatura mediante siti a sequenza etichettata

((SequenceSequence TaggedTagged SitesSites oo STS)STS)

STS

Mappa di cloni contigui (Mappa di cloni contigui (contig*contig* mapmap))

STEP 1STEP 1 - collezione di frammenti clonati di DNA provenienti da un interocromosoma o parti di esso (genoteche totali o parziali).

STEP 2STEP 2 – identificazione di cloni che hanno inserti di DNA che si sovrappongono. Si cerca di ottenere un contiguo, ossia una serie di cloni overlapping che coprano una intera regione cromosomica.

STEP 3STEP 3 – I cloni ottenuti rappresentano la base di partenza per analisi piu'dettagliate fino a livello di sequenza.

*Contig*Contig = serie ricostruita di pi= serie ricostruita di piùù frammenti sovrapposti di DNA a formare un segmento continuoframmenti sovrapposti di DNA a formare un segmento continuo

B N N SB N N S

N S XN S X

X S SX S S

B N N S XB N N S X

Clone 1Clone 1

Clone 2Clone 2

Clone 3Clone 3

Clone 4Clone 4

B = B = BamHIBamHI

N = N = NotINotI

S = S = SalISalI

X = X = XhoIXhoI

B N N S XB N N S X S SS SContigContig

Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione mediante sovrapposizione

delle mappe di restrizione dei singoli clonidelle mappe di restrizione dei singoli cloni

Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione delle mediante sovrapposizione delle

mappe di restrizione dei singoli clonimappe di restrizione dei singoli cloni

Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione di STSmediante sovrapposizione di STS

ChromosomeChromosome

walkingwalking

ShotgunShotgun

approachapproach

Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione mediante sovrapposizione

di sequenze dei singoli clonidi sequenze dei singoli cloni

ChromosomeChromosome walkingwalking

The The shotgunshotgun DNA DNA sequencingsequencing

Il DNA è frammentato e sequenziato. La sequenza è ricostruita confontandosequenze overlapping.

� Costruzione di una mappa genetica e fisica per il genoma di uomo

� cDNA sequencing (creazione di una banca di EST ovvero Expression Sequence Tags)

� Genomic shotgun sequencing

� Utilizzo di sequenziatori automatici

Progetto genoma umanoProgetto genoma umano

Iniziato nel 1985

Febbraio 2001

SequenziamentoSequenziamento del genoma umanodel genoma umano

SequenziamentoSequenziamento del genoma umano:del genoma umano:

approccio gerarchico approccio gerarchico ““clone clone byby clone" clone"

� Libreria con larghi inserti cromosomici.Cloni BAC ~100-200 kb

� Costruzione di una mappa fisicadel genoma, selezione del numero minimo di cloni per coprire il genoma

� Frammentazione casuale e sequenziamento shotgun dei cloni.

� Assemblaggio delle sequenze

� Libreria con larghi inserti cromosomici.Cloni BAC ~100-200 kb

� Costruzione di una mappa fisicadel genoma, selezione del numero minimo di cloni per coprire il genoma

� Frammentazione casuale e sequenziamento shotgun dei cloni.

� Assemblaggio delle sequenze

SequenziamentoSequenziamento del genoma umano:del genoma umano:

Approccio Approccio ““globaleglobale”” ((WholeWhole GenomeGenome ShotgunShotgun, WGS), WGS)

� Libreria shotgun: corti inserti 1.5-3 kb

� Sequenziamento shotgun dei cloni.

� Assemblaggio delle sequenze

� Libreria shotgun: corti inserti 1.5-3 kb

� Sequenziamento shotgun dei cloni.

� Assemblaggio delle sequenze

““clone clone byby cloneclone”” vs vs WGSWGS

Human Genome Consortium

Fisical map,45.000 BAC

individual BACsequencing

27.000.000clones

Assembly

wholesequencing

Assembly

1 year10 years

Celera

Organizzazione del genoma umanoOrganizzazione del genoma umanoOrganizzazione del genoma umano

Distribuzione della funzione genica dellDistribuzione della funzione genica dell’’ 1,5% del 1,5% del

genoma umano (26.000 geni presunti)genoma umano (26.000 geni presunti)

Per quale ragione quasi la metà dei geni codificati dal

genoma umano attende ancora una funzione?

Come si assegna ad una sequenza la categoria di Come si assegna ad una sequenza la categoria di ““genegene””??

Complicazioni nellComplicazioni nell’’identificazione dei geni codificanti identificazione dei geni codificanti in genomi in genomi eucarioticieucariotici

Come si assegna ad una sequenza la categoria di Come si assegna ad una sequenza la categoria di ““genegene””::

� Un criterio, molto usato, è l’identificazione nella sequenza di una

OOpen RReading FFrame (ORF)

� se la sequenza viene trascritta

� se è possibile “tradurre in vitro” la sequenza

� se la sequenza del polipeptide è omologo ad un altro o se la

“presunta” funzione è in accordo con le caratteristiche del carattere

ExpressedExpressed SequenceSequence TagsTags

Come si studia la funzione di un prodotto genico?Come si studia la funzione di un prodotto genico?

�� genomica funzionale (lezione 19)genomica funzionale (lezione 19)

Il DNA ripetitivo può essere distinto in due categorie:

� Ripetizioni intersperse: le cui unità sono distribuite nel genoma in modo casuale e occupano il 44% del genoma (LINE, SINE, etc)

� Sequenze ripetute in tandem: le cui unità sono disposte in serie l’una vicina all’altra (DNA satellite, minisatellite, microsatellite)

DNA minisatellite: VNTR, DNA minisatellite: VNTR, VariableVariable NumberNumber Tandem Tandem RepeatsRepeats

Lunghezza della sequenza ripetuta: 15-100 bp

Numero di ripetizioni: da decine a migliaia di copie

Frequenza nel genoma: circa 100 loci in tutto il genoma umano

Localizzazione: sparse nel genoma

DNA DNA microsatellitemicrosatellite: STR, Short Tandem : STR, Short Tandem RepeatsRepeats

Lunghezza della sequenza ripetuta : 2-6 bp

Numero di ripetizioni : 10-20

Frequenza nel genoma : circa 100mila loci, uno ogni 30000 bp

Localizzazione: sparse nel genoma

Derivano da errori nel processo di copiatura del genoma durante Derivano da errori nel processo di copiatura del genoma durante la divisione la divisione cellulare e potrebbero essere prodotti inevitabili della replicacellulare e potrebbero essere prodotti inevitabili della replicazione del genomazione del genoma

Sequenze ripetute in tandemSequenze ripetute in tandem

LINE*LINE*: Long : Long InterspersedInterspersed ElementsElements, sequenze disperse , sequenze disperse

lunghelungheNel genoma umano sono presenti da 20000 a 40000 elementiOgni elemento può essere lungo da 1000 a 5000 bp

SINE*SINE*: Short : Short InterspersedInterspersed ElementsElements, sequenze disperse , sequenze disperse

cortecorteNel genoma umano sono presenti circa 500 mila elementiOgni elemento può essere lungo alcune centinaia di basiEsempio: sequenze Alu (1,1 milioni di copie nel genoma)

Sono tutte derivate da Sono tutte derivate da elementi elementi trasponibilitrasponibili

* LINE e SINE sono retrotrasposoni non-LTR

Elementi LTR : Long Terminal Elementi LTR : Long Terminal RepeatRepeatRetrotrasposoni con sequenze ripetute alle estremità

TransposoniTransposoni a DNAa DNA

Ripetizioni intersperseRipetizioni intersperse

� Gli elementi elementi trasponibilitrasponibili sono elementi autonomi di DNA parassita, capaci di esistere solo all’interno di una cellula

� Sono componenti normali ed ubiquitari dei procarioti ed eucarioti

� Sono sequenze di DNA capaci di muoversi all’interno dei genomi

� La trasposizione consiste in una ricombinazione nonricombinazione non--omologaomologa.

� I trasposoni possono causare mutazioni geniche e cromosomiche mutazioni geniche e cromosomiche

Elementi Elementi trasponibilitrasponibili

Trasposizione con intermedi a DNAa) replicativab) non replicativa

Trasposizione con intermedi a RNA

Eucarioti e procarioti Solo eucarioti

Sequenze codificanti:

- 2 segmenti genici codificanti parte del TcR

- 1 gene per il tripsinogeno

- 1 pseudogene correlato al tripsinogeno

Esoni: 1414bp =2,8% del totale

52 sequenze ripetute (39%) di 4 tipi:

LINE

SINE

Trasposoni

LTR

2 microsatelliti con ripetizioni GAGAGA… e TATTTATTTATT…, rispettivamente

Circa il 50% di sequenze non geniche, di funzione ignota

Sequenze codificantiSequenze codificanti::

- 2 segmenti genici codificanti parte del TcR

- 1 gene per il tripsinogeno

- 1 pseudogene correlato al tripsinogeno

Esoni: 1414bp =2,8% del totale

52 52 sequenze ripetutesequenze ripetute (39%) di 4 tipi:(39%) di 4 tipi:

LINE

SINE

Trasposoni

LTR

2 2 microsatellitimicrosatelliti con ripetizioni con ripetizioni GAGAGAGAGAGA…… e e TATTTATTTATTTATTTATTTATT……, , rispettivamenterispettivamente

Circa il 50% di Circa il 50% di sequenze non sequenze non genichegeniche, di funzione ignota, di funzione ignota

Organizzazione del genoma nucleare umanoOrganizzazione del genoma nucleare umanoEs. locus del recettore beta delle cellule T (Es. locus del recettore beta delle cellule T (chrchr 7) 7) –– 50Kb50Kb