gene prediction and annotation -...

Post on 27-Jun-2019

222 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

GENE PREDICTION AND ANNOTATION

...AGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGATTTAGATCGATGATAGGGAGGGCTGTAGTGGTGTGATGCTAGTGGATGATAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGAGTATTTGAGGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGTTGATCGTGATGTCTAGCTGATGTCAGTAAGTTTAGTCGATTTAGATCGATGATAGGGAGGGCTGTAGTGGTGTGATGCTAGTGAGGGCTGTAGTGGTGTGATGCTAGTGGATGATAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGG...

GENE PREDICTION

GENE PREDICTION

Identification of genetic elementsin a genomic sequence

GENE PREDICTION

Identification of genetic elements in a genomic sequence

Approaches

1) de-novo predictions (← training set)

2) Evidence Based (← EST e Proteine)

3) Comparatve genomics (← other genomes)

4) RNA-seq (← NGS reads)

5) Combiner (← training set)

A gene prediction platform

GeneID SNAP TigrscanGlimmer

HMMEST Proteins

GenomicaComparata

RNA seq

TrainingSet

TrainingSet 2

Vitis

Vigna

Dicot

SwissProt

Trembl

A.thaliana

O.sativa

Populus t.

SOLiD

SOLEXA

JIGSAW GFF PARSER

GBROWSE

Annotazione

GBROWSE

The Gbrowse helps in the understanding of the predictions

Il gbrowse (http://gmod.org/wiki/GBrowse) is a tool for the visualization of genetic annotations.

It is based on a relational database (MySQL or Postgres) where all the traces are stored.

GBROWSE

DeNovo Prediction

many false positives

GBROWSE

Alignment of EST and proteins: very good but not all genes are covered.

GBROWSE

RNA Seq

GBROWSE

The objects in the Gbrowser can be linked to the annotation platform

GBROWSECan also be linked to other servces

Functional AnnotationAutomatic and manual annotation

Metodi di annotazione

Assegnamento di una funzione, di un ruolo metabolico, regolativo o stutturale al set di geni predetti

Esistono numerose risorse bioinformatiche e database per l'identificazione e l'annotazione di domini proteici, famiglie geniche, domini transmembrana, localizzazione cellulare, …

Metodi di annotazione

Annotazione automatica

Relativamente veloce Grande numero di annotazioni Solitamente le annotazioni derivano da similarità di sequenza e file di “mapping” Utili nella fase preliminare dell'annotazione genomica → forniscono la “bozza” del “libro genomico”

Annotazione manuale

Annotazioni di alta qualità Richiede biologi esperti Processo molto lungo

Sistema automatizzato

processo di revisione mediante annotazione manuale

Alcune delle informazioni utilizzate

UniProtKB: risorsa universale di sequenze proteiche

Pfam, SMART, Prosite: famiglie proteiche, domini funzionali e strutturali

KEGG: enzimi e pathway metabolici

Gene families: clusterizzazione, allineamento multiplo e creazione di alberi filogenetici

InterPro: risorsa integrata classificare e annotare geni e proteine

WoLFPSORT, TargetP: predizione di localizzazione cellulare

HMMTop, TMHMM: identificazione di eliche transmembrana

Gene Ontology: dizionario universale e gerarchico di funzioni proteiche, processi biologici e compartimenti cellulari

Riassumendo...

ANNOTAZIONE STRUTTURALE di GENI

L’annotazione strutturale dei geni comprende una serie di operazioni:

1) Inserimento di nuovi geni in regioni dove non ci sono predizioni

2) Rimozione di geni predetti

3) Modifica di predizioni geniche- Splitting di predizioni- Fusione di predizioni- Inserimento/rimozione Esoni- Modifica siti di Start e Stop

4) Inserimento di trascritti alternativi

ANNOTAZIONE STRUTTURALE di GENI

ANNOTAZIONE STRUTTURALE di GENI

Evidenze:- Osservazioni Gbrowse- Esperimenti- Letteratura... ... ... ...

Strumento di annotazione strutturale

Chado DBgene pred

specialist

GBROWSE

ANNOTAZIONE STRUTTURALE di GENI

Perchè usare APOLLO1) Interfaccia grafica semplice2) Integrato al database chado su cui puo’ leggere e scrivere (progetto GMOD)3) Permette controlli di traduzione e dei siti di splicing4) Lavora in locale per cui non sovraccarica i server che gestiscono le annotazioni5) Multipiattaforma (Windows, Linux, Mac)6) Sviluppato per lavorare in gruppi

APOLLO (1)

LOGIN

solo gli utenti abilitati possono accedere al database con Apollo. Ogni modifica inoltre viene registrata con lo user di chi la esegue

APOLLO (2)

Dopo il LOGIN viene aperta una finestra sulla regione specificata.

Questa schermata individua delle aree ben specifiche.

APOLLO (2.1)

BLACK AREARegione delle evidenze (non modificabile)

APOLLO (2.2)

BLUE AREARegione delle predizioni (modificabile)

APOLLO (2.3)

Frame PLUS

Frame MINUS

CoordinateGenomiche

APOLLO (3)

Creare un nuovo Gene:

1) Da Evidenze- trascritti alternativi- nuovi geni

2) Senza nessuna Evidenza

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

DRAG and DROPDalle Evidenze alle Predizioni

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

Il nuovo gene ha CDS in comune con 2 predizioni

1) Creare un nuovo gene ?

2) Unire i geni overlappanti ?

3) Rendere il nuove gene come trascritto alternativo di uno dei due geni ?

Apollo chiede

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

CREARE UN NUOVO GENE

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

CREARE UN NUOVO GENE

Esistono comunque molti metodi alternativi per raggiungere lo stesso risultato

APOLLO (3.2)

Creare un nuovo Gene: Senza Evidenze

Tast DX mouse su una regione della BLUE ZONE.Vieni chiesto se creare una nuova Annotazione

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto → Trascinare l'esone da una evidenza

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto → Trascinare l'esone da una evidenza

Siti di splicing anomali!!!

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza

3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza

3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”

4) Split Exon → Selezionare l'esone → tasto dx → “split”

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza

3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”

4) Split Exon → Selezionare l'esone → tasto dx → “split”

5) Modifiche Ulteriori a Esoni con “Exon Detail Editor”

Integrazione Apollo - GbrowseGBROWSE

Apollo e Gbrowse sono entrambi progetti di GMOD. Questo implica una completa integrazione dei due strumenti. Alla base vi è un database CHADO che sia il GBROWSE che Apollo possono utilizzare

Integrazione Apollo - GbrowseGBROWSE

Apollo e Gbrowse sono entrambi progetti di GMOD. Questo implica una completa integrazione dei due strumenti. Alla base vi è un database CHADO che sia il GBROWSE che Apollo possono utilizzare

chado

GBROWSESolo lettura

Lettura + scrittura

I cambiamenti introdotti da Apollo sono subito visibili nel Gbrowse

top related