gene prediction and annotation -...
Post on 27-Jun-2019
222 Views
Preview:
TRANSCRIPT
GENE PREDICTION AND ANNOTATION
...AGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGATTTAGATCGATGATAGGGAGGGCTGTAGTGGTGTGATGCTAGTGGATGATAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGAGTATTTGAGGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGTTGATCGTGATGTCTAGCTGATGTCAGTAAGTTTAGTCGATTTAGATCGATGATAGGGAGGGCTGTAGTGGTGTGATGCTAGTGAGGGCTGTAGTGGTGTGATGCTAGTGGATGATAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGG...
GENE PREDICTION
GENE PREDICTION
Identification of genetic elementsin a genomic sequence
GENE PREDICTION
Identification of genetic elements in a genomic sequence
Approaches
1) de-novo predictions (← training set)
2) Evidence Based (← EST e Proteine)
3) Comparatve genomics (← other genomes)
4) RNA-seq (← NGS reads)
5) Combiner (← training set)
A gene prediction platform
GeneID SNAP TigrscanGlimmer
HMMEST Proteins
GenomicaComparata
RNA seq
TrainingSet
TrainingSet 2
Vitis
Vigna
Dicot
SwissProt
Trembl
A.thaliana
O.sativa
Populus t.
SOLiD
SOLEXA
JIGSAW GFF PARSER
GBROWSE
Annotazione
GBROWSE
The Gbrowse helps in the understanding of the predictions
Il gbrowse (http://gmod.org/wiki/GBrowse) is a tool for the visualization of genetic annotations.
It is based on a relational database (MySQL or Postgres) where all the traces are stored.
GBROWSE
DeNovo Prediction
many false positives
GBROWSE
Alignment of EST and proteins: very good but not all genes are covered.
GBROWSE
RNA Seq
GBROWSE
The objects in the Gbrowser can be linked to the annotation platform
GBROWSECan also be linked to other servces
Functional AnnotationAutomatic and manual annotation
Metodi di annotazione
Assegnamento di una funzione, di un ruolo metabolico, regolativo o stutturale al set di geni predetti
Esistono numerose risorse bioinformatiche e database per l'identificazione e l'annotazione di domini proteici, famiglie geniche, domini transmembrana, localizzazione cellulare, …
Metodi di annotazione
Annotazione automatica
Relativamente veloce Grande numero di annotazioni Solitamente le annotazioni derivano da similarità di sequenza e file di “mapping” Utili nella fase preliminare dell'annotazione genomica → forniscono la “bozza” del “libro genomico”
Annotazione manuale
Annotazioni di alta qualità Richiede biologi esperti Processo molto lungo
Sistema automatizzato
processo di revisione mediante annotazione manuale
Alcune delle informazioni utilizzate
UniProtKB: risorsa universale di sequenze proteiche
Pfam, SMART, Prosite: famiglie proteiche, domini funzionali e strutturali
KEGG: enzimi e pathway metabolici
Gene families: clusterizzazione, allineamento multiplo e creazione di alberi filogenetici
InterPro: risorsa integrata classificare e annotare geni e proteine
WoLFPSORT, TargetP: predizione di localizzazione cellulare
HMMTop, TMHMM: identificazione di eliche transmembrana
Gene Ontology: dizionario universale e gerarchico di funzioni proteiche, processi biologici e compartimenti cellulari
Riassumendo...
ANNOTAZIONE STRUTTURALE di GENI
L’annotazione strutturale dei geni comprende una serie di operazioni:
1) Inserimento di nuovi geni in regioni dove non ci sono predizioni
2) Rimozione di geni predetti
3) Modifica di predizioni geniche- Splitting di predizioni- Fusione di predizioni- Inserimento/rimozione Esoni- Modifica siti di Start e Stop
4) Inserimento di trascritti alternativi
ANNOTAZIONE STRUTTURALE di GENI
ANNOTAZIONE STRUTTURALE di GENI
Evidenze:- Osservazioni Gbrowse- Esperimenti- Letteratura... ... ... ...
Strumento di annotazione strutturale
Chado DBgene pred
specialist
GBROWSE
ANNOTAZIONE STRUTTURALE di GENI
Perchè usare APOLLO1) Interfaccia grafica semplice2) Integrato al database chado su cui puo’ leggere e scrivere (progetto GMOD)3) Permette controlli di traduzione e dei siti di splicing4) Lavora in locale per cui non sovraccarica i server che gestiscono le annotazioni5) Multipiattaforma (Windows, Linux, Mac)6) Sviluppato per lavorare in gruppi
APOLLO (1)
LOGIN
solo gli utenti abilitati possono accedere al database con Apollo. Ogni modifica inoltre viene registrata con lo user di chi la esegue
APOLLO (2)
Dopo il LOGIN viene aperta una finestra sulla regione specificata.
Questa schermata individua delle aree ben specifiche.
APOLLO (2.1)
BLACK AREARegione delle evidenze (non modificabile)
APOLLO (2.2)
BLUE AREARegione delle predizioni (modificabile)
APOLLO (2.3)
Frame PLUS
Frame MINUS
CoordinateGenomiche
APOLLO (3)
Creare un nuovo Gene:
1) Da Evidenze- trascritti alternativi- nuovi geni
2) Senza nessuna Evidenza
APOLLO (3.1)
Creare un nuovo Gene: Da EVIDENZE
DRAG and DROPDalle Evidenze alle Predizioni
APOLLO (3.1)
Creare un nuovo Gene: Da EVIDENZE
Il nuovo gene ha CDS in comune con 2 predizioni
1) Creare un nuovo gene ?
2) Unire i geni overlappanti ?
3) Rendere il nuove gene come trascritto alternativo di uno dei due geni ?
Apollo chiede
APOLLO (3.1)
Creare un nuovo Gene: Da EVIDENZE
CREARE UN NUOVO GENE
APOLLO (3.1)
Creare un nuovo Gene: Da EVIDENZE
CREARE UN NUOVO GENE
Esistono comunque molti metodi alternativi per raggiungere lo stesso risultato
APOLLO (3.2)
Creare un nuovo Gene: Senza Evidenze
Tast DX mouse su una regione della BLUE ZONE.Vieni chiesto se creare una nuova Annotazione
APOLLO (4)
Modificare Geni
1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”
APOLLO (4)
Modificare Geni
1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”
2) Aggiungere Esoni ad un trascritto → Trascinare l'esone da una evidenza
APOLLO (4)
Modificare Geni
1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”
2) Aggiungere Esoni ad un trascritto → Trascinare l'esone da una evidenza
Siti di splicing anomali!!!
APOLLO (4)
Modificare Geni
1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”
2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza
3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”
APOLLO (4)
Modificare Geni
1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”
2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza
3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”
4) Split Exon → Selezionare l'esone → tasto dx → “split”
APOLLO (4)
Modificare Geni
1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”
2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza
3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”
4) Split Exon → Selezionare l'esone → tasto dx → “split”
5) Modifiche Ulteriori a Esoni con “Exon Detail Editor”
Integrazione Apollo - GbrowseGBROWSE
Apollo e Gbrowse sono entrambi progetti di GMOD. Questo implica una completa integrazione dei due strumenti. Alla base vi è un database CHADO che sia il GBROWSE che Apollo possono utilizzare
Integrazione Apollo - GbrowseGBROWSE
Apollo e Gbrowse sono entrambi progetti di GMOD. Questo implica una completa integrazione dei due strumenti. Alla base vi è un database CHADO che sia il GBROWSE che Apollo possono utilizzare
chado
GBROWSESolo lettura
Lettura + scrittura
I cambiamenti introdotti da Apollo sono subito visibili nel Gbrowse
top related