gene prediction and annotation -...

43
GENE PREDICTION AND ANNOTATION

Upload: vungoc

Post on 27-Jun-2019

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GENE PREDICTION AND ANNOTATION

Page 2: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

...AGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGATTTAGATCGATGATAGGGAGGGCTGTAGTGGTGTGATGCTAGTGGATGATAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGAGTATTTGAGGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGTCAGTAAGGATGACGATGGAGTACGTTGATCGTGATGTCTAGCTGATGTCAGTAAGTTTAGTCGATTTAGATCGATGATAGGGAGGGCTGTAGTGGTGTGATGCTAGTGAGGGCTGTAGTGGTGTGATGCTAGTGGATGATAGGATGACGATGGAGTACGATCGTGATGTCTAGCTGATGG...

Page 3: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GENE PREDICTION

Page 4: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GENE PREDICTION

Identification of genetic elementsin a genomic sequence

Page 5: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GENE PREDICTION

Identification of genetic elements in a genomic sequence

Approaches

1) de-novo predictions (← training set)

2) Evidence Based (← EST e Proteine)

3) Comparatve genomics (← other genomes)

4) RNA-seq (← NGS reads)

5) Combiner (← training set)

Page 6: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

A gene prediction platform

GeneID SNAP TigrscanGlimmer

HMMEST Proteins

GenomicaComparata

RNA seq

TrainingSet

TrainingSet 2

Vitis

Vigna

Dicot

SwissProt

Trembl

A.thaliana

O.sativa

Populus t.

SOLiD

SOLEXA

JIGSAW GFF PARSER

GBROWSE

Annotazione

Page 7: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GBROWSE

The Gbrowse helps in the understanding of the predictions

Il gbrowse (http://gmod.org/wiki/GBrowse) is a tool for the visualization of genetic annotations.

It is based on a relational database (MySQL or Postgres) where all the traces are stored.

Page 8: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GBROWSE

DeNovo Prediction

many false positives

Page 9: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GBROWSE

Alignment of EST and proteins: very good but not all genes are covered.

Page 10: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GBROWSE

RNA Seq

Page 11: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GBROWSE

The objects in the Gbrowser can be linked to the annotation platform

Page 12: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

GBROWSECan also be linked to other servces

Page 13: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

Functional AnnotationAutomatic and manual annotation

Page 14: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

Metodi di annotazione

Assegnamento di una funzione, di un ruolo metabolico, regolativo o stutturale al set di geni predetti

Esistono numerose risorse bioinformatiche e database per l'identificazione e l'annotazione di domini proteici, famiglie geniche, domini transmembrana, localizzazione cellulare, …

Page 15: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

Metodi di annotazione

Annotazione automatica

Relativamente veloce Grande numero di annotazioni Solitamente le annotazioni derivano da similarità di sequenza e file di “mapping” Utili nella fase preliminare dell'annotazione genomica → forniscono la “bozza” del “libro genomico”

Annotazione manuale

Annotazioni di alta qualità Richiede biologi esperti Processo molto lungo

Sistema automatizzato

processo di revisione mediante annotazione manuale

Page 16: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

Alcune delle informazioni utilizzate

UniProtKB: risorsa universale di sequenze proteiche

Pfam, SMART, Prosite: famiglie proteiche, domini funzionali e strutturali

KEGG: enzimi e pathway metabolici

Gene families: clusterizzazione, allineamento multiplo e creazione di alberi filogenetici

InterPro: risorsa integrata classificare e annotare geni e proteine

WoLFPSORT, TargetP: predizione di localizzazione cellulare

HMMTop, TMHMM: identificazione di eliche transmembrana

Gene Ontology: dizionario universale e gerarchico di funzioni proteiche, processi biologici e compartimenti cellulari

Page 17: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

Riassumendo...

Page 18: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene
Page 19: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene
Page 20: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene
Page 21: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

ANNOTAZIONE STRUTTURALE di GENI

Page 22: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

L’annotazione strutturale dei geni comprende una serie di operazioni:

1) Inserimento di nuovi geni in regioni dove non ci sono predizioni

2) Rimozione di geni predetti

3) Modifica di predizioni geniche- Splitting di predizioni- Fusione di predizioni- Inserimento/rimozione Esoni- Modifica siti di Start e Stop

4) Inserimento di trascritti alternativi

ANNOTAZIONE STRUTTURALE di GENI

Page 23: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

ANNOTAZIONE STRUTTURALE di GENI

Evidenze:- Osservazioni Gbrowse- Esperimenti- Letteratura... ... ... ...

Strumento di annotazione strutturale

Chado DBgene pred

specialist

GBROWSE

Page 24: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

ANNOTAZIONE STRUTTURALE di GENI

Perchè usare APOLLO1) Interfaccia grafica semplice2) Integrato al database chado su cui puo’ leggere e scrivere (progetto GMOD)3) Permette controlli di traduzione e dei siti di splicing4) Lavora in locale per cui non sovraccarica i server che gestiscono le annotazioni5) Multipiattaforma (Windows, Linux, Mac)6) Sviluppato per lavorare in gruppi

Page 25: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (1)

LOGIN

solo gli utenti abilitati possono accedere al database con Apollo. Ogni modifica inoltre viene registrata con lo user di chi la esegue

Page 26: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (2)

Dopo il LOGIN viene aperta una finestra sulla regione specificata.

Questa schermata individua delle aree ben specifiche.

Page 27: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (2.1)

BLACK AREARegione delle evidenze (non modificabile)

Page 28: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (2.2)

BLUE AREARegione delle predizioni (modificabile)

Page 29: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (2.3)

Frame PLUS

Frame MINUS

CoordinateGenomiche

Page 30: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (3)

Creare un nuovo Gene:

1) Da Evidenze- trascritti alternativi- nuovi geni

2) Senza nessuna Evidenza

Page 31: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

DRAG and DROPDalle Evidenze alle Predizioni

Page 32: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

Il nuovo gene ha CDS in comune con 2 predizioni

1) Creare un nuovo gene ?

2) Unire i geni overlappanti ?

3) Rendere il nuove gene come trascritto alternativo di uno dei due geni ?

Apollo chiede

Page 33: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

CREARE UN NUOVO GENE

Page 34: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (3.1)

Creare un nuovo Gene: Da EVIDENZE

CREARE UN NUOVO GENE

Esistono comunque molti metodi alternativi per raggiungere lo stesso risultato

Page 35: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (3.2)

Creare un nuovo Gene: Senza Evidenze

Tast DX mouse su una regione della BLUE ZONE.Vieni chiesto se creare una nuova Annotazione

Page 36: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

Page 37: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto → Trascinare l'esone da una evidenza

Page 38: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto → Trascinare l'esone da una evidenza

Siti di splicing anomali!!!

Page 39: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza

3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”

Page 40: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza

3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”

4) Split Exon → Selezionare l'esone → tasto dx → “split”

Page 41: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

APOLLO (4)

Modificare Geni

1) Eliminare Esoni → Selezionare l'esone → tasto dx → “delete feature”

2) Aggiungere Esoni ad un trascritto→ Trascinare l'esone da una evidenza

3) Merge Exon → Selezionare gli esoni (con shift) → tasto dx → “merge”

4) Split Exon → Selezionare l'esone → tasto dx → “split”

5) Modifiche Ulteriori a Esoni con “Exon Detail Editor”

Page 42: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

Integrazione Apollo - GbrowseGBROWSE

Apollo e Gbrowse sono entrambi progetti di GMOD. Questo implica una completa integrazione dei due strumenti. Alla base vi è un database CHADO che sia il GBROWSE che Apollo possono utilizzare

Page 43: GENE PREDICTION AND ANNOTATION - didattica.cribi.unipd.itdidattica.cribi.unipd.it/genomica/Genomics_2012/gene_prediction_annotation/Gene... · KEGG: enzimi e pathway metabolici Gene

Integrazione Apollo - GbrowseGBROWSE

Apollo e Gbrowse sono entrambi progetti di GMOD. Questo implica una completa integrazione dei due strumenti. Alla base vi è un database CHADO che sia il GBROWSE che Apollo possono utilizzare

chado

GBROWSESolo lettura

Lettura + scrittura

I cambiamenti introdotti da Apollo sono subito visibili nel Gbrowse