10 - mappe fisiche e analisi del genoma umanodbce.uniroma1.it/sites/default/files/10 - mappe fisiche...
TRANSCRIPT
Costruzione di una mappa fisicaCostruzione di una mappa fisica� diversi metodi
- Mappe a bassa risoluzioneMappe a bassa risoluzione
- Mappe ad alta risoluzioneMappe ad alta risoluzione
Risoluzione= distanza a cui due punti devono trovarsi per poter essere identificati come distinti
Mappe fisiche a bassa risoluzione (5Mappe fisiche a bassa risoluzione (5--0.5Mb)0.5Mb)
Mappatura citogenetica mediante:bandeggio cromosomicoFISH (Fluorescence In Situ Hybridization)
Mappatura per delezione
Mappatura mediante ibridi
Ibridazione in situ con sonde marcate con diversi composti fluorescenti (ognuno emette ad una specifica lunghezza d’onda). Il vetrino è esposto alle varie lunghezze d’onda in maniera sequenziale generando al computer una “pittura cromosomica”
Incrocio tra un individuo omozigote per la mutazione recessiva ed un individuo eterozigote per la delezione
Mappatura per Mappatura per delezionedelezioneSu quale cromosoma risiedeun gene di interesse?
I geni sono assegnati ad un particolare cromosoma mediante l’associazione di un fenotipo con una delezione cromosomica
Mappe fisiche ad alta risoluzione (100kbMappe fisiche ad alta risoluzione (100kb--1bp)1bp)
Mappe di restrizione
Mappatura mediante STS (Sequence Tagged Sites)
Sequenziamento del DNA
Mappa di restrizioneMappa di restrizione
Uso di enzimi con siti di taglio rari
es. Not1 riconosce sequenza di 8 basi ricca in GC (meno frequenti sul genoma umano)
Elettroforesi su gel dei frammenti ottenuti per stimarne le dimensioni � RFLP
Mappe di restrizione (combinando risultati ottenuti con tagli di più enzimi contemporaneamente)
Sequenze utilizzabili come STS:Sequenze utilizzabili come STS:
-- una regione sequenziata casualmente e poi posizionata sul cromosoma- una regione mappata geneticamente- una sequenza trascritta
Le STSSTS, sono brevi segmenti unici di DNA di cui è nota sequenza e posizione sul genoma � landmark (pietra miliare)
Sono lunghe circa 100-500 bp e sono identificabili mediante PCR
STS nel gene per la proteina ribosomale S3.Le regioni sottolineate corrispondono ai primers usati per amplificarli
Mappatura mediante siti a sequenza etichettataMappatura mediante siti a sequenza etichettata
((SequenceSequence TaggedTagged SitesSites oo STS)STS)
STS
Mappa di cloni contigui (Mappa di cloni contigui (contig*contig* mapmap))
STEP 1STEP 1 - collezione di frammenti clonati di DNA provenienti da un interocromosoma o parti di esso (genoteche totali o parziali).
STEP 2STEP 2 – identificazione di cloni che hanno inserti di DNA che si sovrappongono. Si cerca di ottenere un contiguo, ossia una serie di cloni overlapping che coprano una intera regione cromosomica.
STEP 3STEP 3 – I cloni ottenuti rappresentano la base di partenza per analisi piu'dettagliate fino a livello di sequenza.
*Contig*Contig = serie ricostruita di pi= serie ricostruita di piùù frammenti sovrapposti di DNA a formare un segmento continuoframmenti sovrapposti di DNA a formare un segmento continuo
B N N SB N N S
N S XN S X
X S SX S S
B N N S XB N N S X
Clone 1Clone 1
Clone 2Clone 2
Clone 3Clone 3
Clone 4Clone 4
B = B = BamHIBamHI
N = N = NotINotI
S = S = SalISalI
X = X = XhoIXhoI
B N N S XB N N S X S SS SContigContig
Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione mediante sovrapposizione
delle mappe di restrizione dei singoli clonidelle mappe di restrizione dei singoli cloni
Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione delle mediante sovrapposizione delle
mappe di restrizione dei singoli clonimappe di restrizione dei singoli cloni
Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione di STSmediante sovrapposizione di STS
ChromosomeChromosome
walkingwalking
ShotgunShotgun
approachapproach
Assemblaggio di un Assemblaggio di un contigcontig mediante sovrapposizione mediante sovrapposizione
di sequenze dei singoli clonidi sequenze dei singoli cloni
The The shotgunshotgun DNA DNA sequencingsequencing
Il DNA è frammentato e sequenziato. La sequenza è ricostruita confontandosequenze overlapping.
� Costruzione di una mappa genetica e fisica per il genoma di uomo
� cDNA sequencing (creazione di una banca di EST ovvero Expression Sequence Tags)
� Genomic shotgun sequencing
� Utilizzo di sequenziatori automatici
Progetto genoma umanoProgetto genoma umano
Iniziato nel 1985
Febbraio 2001
SequenziamentoSequenziamento del genoma umano:del genoma umano:
approccio gerarchico approccio gerarchico ““clone clone byby clone" clone"
� Libreria con larghi inserti cromosomici.Cloni BAC ~100-200 kb
� Costruzione di una mappa fisicadel genoma, selezione del numero minimo di cloni per coprire il genoma
� Frammentazione casuale e sequenziamento shotgun dei cloni.
� Assemblaggio delle sequenze
� Libreria con larghi inserti cromosomici.Cloni BAC ~100-200 kb
� Costruzione di una mappa fisicadel genoma, selezione del numero minimo di cloni per coprire il genoma
� Frammentazione casuale e sequenziamento shotgun dei cloni.
� Assemblaggio delle sequenze
SequenziamentoSequenziamento del genoma umano:del genoma umano:
Approccio Approccio ““globaleglobale”” ((WholeWhole GenomeGenome ShotgunShotgun, WGS), WGS)
� Libreria shotgun: corti inserti 1.5-3 kb
� Sequenziamento shotgun dei cloni.
� Assemblaggio delle sequenze
� Libreria shotgun: corti inserti 1.5-3 kb
� Sequenziamento shotgun dei cloni.
� Assemblaggio delle sequenze
““clone clone byby cloneclone”” vs vs WGSWGS
Human Genome Consortium
Fisical map,45.000 BAC
individual BACsequencing
27.000.000clones
Assembly
wholesequencing
Assembly
1 year10 years
Celera
Distribuzione della funzione genica dellDistribuzione della funzione genica dell’’ 1,5% del 1,5% del
genoma umano (26.000 geni presunti)genoma umano (26.000 geni presunti)
Per quale ragione quasi la metà dei geni codificati dal
genoma umano attende ancora una funzione?
Come si assegna ad una sequenza la categoria di Come si assegna ad una sequenza la categoria di ““genegene””??
Complicazioni nellComplicazioni nell’’identificazione dei geni codificanti identificazione dei geni codificanti in genomi in genomi eucarioticieucariotici
Come si assegna ad una sequenza la categoria di Come si assegna ad una sequenza la categoria di ““genegene””::
� Un criterio, molto usato, è l’identificazione nella sequenza di una
OOpen RReading FFrame (ORF)
� se la sequenza viene trascritta
� se è possibile “tradurre in vitro” la sequenza
� se la sequenza del polipeptide è omologo ad un altro o se la
“presunta” funzione è in accordo con le caratteristiche del carattere
Come si studia la funzione di un prodotto genico?Come si studia la funzione di un prodotto genico?
�� genomica funzionale (lezione 19)genomica funzionale (lezione 19)
Il DNA ripetitivo può essere distinto in due categorie:
� Ripetizioni intersperse: le cui unità sono distribuite nel genoma in modo casuale e occupano il 44% del genoma (LINE, SINE, etc)
� Sequenze ripetute in tandem: le cui unità sono disposte in serie l’una vicina all’altra (DNA satellite, minisatellite, microsatellite)
DNA minisatellite: VNTR, DNA minisatellite: VNTR, VariableVariable NumberNumber Tandem Tandem RepeatsRepeats
Lunghezza della sequenza ripetuta: 15-100 bp
Numero di ripetizioni: da decine a migliaia di copie
Frequenza nel genoma: circa 100 loci in tutto il genoma umano
Localizzazione: sparse nel genoma
DNA DNA microsatellitemicrosatellite: STR, Short Tandem : STR, Short Tandem RepeatsRepeats
Lunghezza della sequenza ripetuta : 2-6 bp
Numero di ripetizioni : 10-20
Frequenza nel genoma : circa 100mila loci, uno ogni 30000 bp
Localizzazione: sparse nel genoma
Derivano da errori nel processo di copiatura del genoma durante Derivano da errori nel processo di copiatura del genoma durante la divisione la divisione cellulare e potrebbero essere prodotti inevitabili della replicacellulare e potrebbero essere prodotti inevitabili della replicazione del genomazione del genoma
Sequenze ripetute in tandemSequenze ripetute in tandem
LINE*LINE*: Long : Long InterspersedInterspersed ElementsElements, sequenze disperse , sequenze disperse
lunghelungheNel genoma umano sono presenti da 20000 a 40000 elementiOgni elemento può essere lungo da 1000 a 5000 bp
SINE*SINE*: Short : Short InterspersedInterspersed ElementsElements, sequenze disperse , sequenze disperse
cortecorteNel genoma umano sono presenti circa 500 mila elementiOgni elemento può essere lungo alcune centinaia di basiEsempio: sequenze Alu (1,1 milioni di copie nel genoma)
Sono tutte derivate da Sono tutte derivate da elementi elementi trasponibilitrasponibili
* LINE e SINE sono retrotrasposoni non-LTR
Elementi LTR : Long Terminal Elementi LTR : Long Terminal RepeatRepeatRetrotrasposoni con sequenze ripetute alle estremità
TransposoniTransposoni a DNAa DNA
Ripetizioni intersperseRipetizioni intersperse
� Gli elementi elementi trasponibilitrasponibili sono elementi autonomi di DNA parassita, capaci di esistere solo all’interno di una cellula
� Sono componenti normali ed ubiquitari dei procarioti ed eucarioti
� Sono sequenze di DNA capaci di muoversi all’interno dei genomi
� La trasposizione consiste in una ricombinazione nonricombinazione non--omologaomologa.
� I trasposoni possono causare mutazioni geniche e cromosomiche mutazioni geniche e cromosomiche
Elementi Elementi trasponibilitrasponibili
Trasposizione con intermedi a DNAa) replicativab) non replicativa
Trasposizione con intermedi a RNA
Eucarioti e procarioti Solo eucarioti
Sequenze codificanti:
- 2 segmenti genici codificanti parte del TcR
- 1 gene per il tripsinogeno
- 1 pseudogene correlato al tripsinogeno
Esoni: 1414bp =2,8% del totale
52 sequenze ripetute (39%) di 4 tipi:
LINE
SINE
Trasposoni
LTR
2 microsatelliti con ripetizioni GAGAGA… e TATTTATTTATT…, rispettivamente
Circa il 50% di sequenze non geniche, di funzione ignota
Sequenze codificantiSequenze codificanti::
- 2 segmenti genici codificanti parte del TcR
- 1 gene per il tripsinogeno
- 1 pseudogene correlato al tripsinogeno
Esoni: 1414bp =2,8% del totale
52 52 sequenze ripetutesequenze ripetute (39%) di 4 tipi:(39%) di 4 tipi:
LINE
SINE
Trasposoni
LTR
2 2 microsatellitimicrosatelliti con ripetizioni con ripetizioni GAGAGAGAGAGA…… e e TATTTATTTATTTATTTATTTATT……, , rispettivamenterispettivamente
Circa il 50% di Circa il 50% di sequenze non sequenze non genichegeniche, di funzione ignota, di funzione ignota
Organizzazione del genoma nucleare umanoOrganizzazione del genoma nucleare umanoEs. locus del recettore beta delle cellule T (Es. locus del recettore beta delle cellule T (chrchr 7) 7) –– 50Kb50Kb