ricerca di similarità di sequenza (fasta e blast) allineamento di due sequenze allineamento...

14
Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

Upload: gervasio-luciani

Post on 02-May-2015

236 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

Ricerca di similarità di sequenza (FASTA e BLAST)

Allineamento di due sequenze

Allineamento multiplo di sequenze

Page 2: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

RICERCA DI SIMILARITA’ E ALLINEAMENTO DI SEQUENZE

BLAST e PSI-BLASThttp://www.ncbi.nlm.nih.gov/blast/

FASTAhttp://fasta.bioch.virginia.edu/ oppure http://www.ebi.ac.uk/fasta33/

Page 3: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

Alcune caratteristiche dei tools più usati:

BLAST (Basic Local Alignment Search Tool), sviluppato dal National Center forBiotechnology Information, NCBI):

- allineamento locale- estremamente veloce- parte cercando brevi frammenti della sequenza, che poi prova ad estendere- usa una matrice di sostituzione in entrambe le fasi del processo di allineamento (scansione del database e estensione della subsequenza): più preciso ha quattro opzioni fondamentali:

BLASTP: confronta sequenze proteiche contro un database proteicoBLASTN: confronta sequenze nuclotidiche contro un database nucleotidicoTBLASTN: confronta una sequenza proteica contro un database nucleotidico, traducendo ciascuna sequenza del database nucleotidico nei suoi 6 frames di letturaBLASTX: confronta una sequenza nucleotidica contro un database proteico, dopo averla tradotta nei suoi 6 frames di lettura.

Page 4: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

BLAST:

Page 5: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

BLASTP

Page 6: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

Penalità assegnata ai gap

Dimensione delle parole

Scelta della matrice di sostituzione

Numero atteso di HSP (High-scoring Segment Pair) valutato su base statistica

Seconda parte della pagina di BLAST:

I valori di default usati da BLAST sono W=3, T=13, Matrice=BLOSUM 62

Page 7: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

Terza parte della pagina di BLAST:

Page 8: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

FASTA: http://www.ebi.ac.uk/fasta33/

Vari database

Sequenza in formato FASTA

Ktup: lunghezza delle parole

Align: numero di allineamenti finali

Open e residue: Penalità per i gap

Page 9: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

Allineamento di due sequenze:

BLAST: bl2seq

LALIGN: http://www.ch.embnet.org/software/LALIGN_form.html

EMBOSS: http://www.ebi.ac.uk/emboss/align/

Page 10: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

LALIGN:

Page 11: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

ALLINEAMENTO MULTIPLO DI SEQUENZE

Informazione biologica maggiore rispetto a quella riportata l’allineamento di due sole sequenze: i residui più importanti dal punto di vista strutturale o funzionale saranno estremamente conservati tra tutte le sequenze dell’allineamento.

“Una sequenza amminoacidica fa la timida; un paio di sequenze omologhe sussurrano; molte sequenze allineate gridano”.

Per essere informativo un allineamento multiplo dovrebbe contenere unadistribuzione di sequenze sia strettamente sia lontanamente correlate:Svantaggi:•tutte strettamente correlate => ridondanza•tutte lontanamente correlate => allineamento inaccurato => inutilità

Page 12: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

ALLINEAMENTO MULTIPLO DI SEQUENZE

Page 13: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

Programmi per l’allineamento multiplo globale:

CLUSTALW: http://www.ebi.ac.uk/clustalw/ o scaricare il programma eseguibile

KALIGN http://msa.cgb.ki.se/cgi-bin/msa.cgi

Multalin http://bioinfo.genopole-toulouse.prd.fr/multalin/multalin.html

TCOFFEE http://www.ch.embnet.org/software/TCoffee.html

Page 14: Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

CLUSTAL W: -il tool più comune utilizzato per l’allineamento multiplo di sequenza:- potenziato per allineamenti di sequenze proteiche divergenti favorisce l’apertura di gaps in regioni in cui è potenzialmente presente un loop piuttosto che una struttura secondaria ordinata (in base a una penalità residuo-specifica e a una penalità ridotta in regioni idrofiliche) favorisce l’apertura di gaps nelle stesse posizioni.