anotaci ón automática

28
Anotación Automática Dante Travisany

Upload: brock

Post on 24-Feb-2016

64 views

Category:

Documents


0 download

DESCRIPTION

Anotaci ón Automática. Dante Travisany. Temas. Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl. Identificaci ón del Problema. Virus : 15 – 20 Bacteria 3000 - 5000 Eucariontes : sobre los 10000. Pipeline. Pipeline. Unix S ímbolo : | Segmentaci ón. Tools. BLAST - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Anotaci ón Automática

Anotación Automática

Dante Travisany

Page 2: Anotaci ón Automática

Temas• Pipeline

• Tools

• Bases de Datos

• Conceptos

• Ejemplos

• Ensembl

Page 3: Anotaci ón Automática

Identificación del Problema

• Virus : 15 – 20

• Bacteria 3000 - 5000

• Eucariontes: sobre los 10000

Page 4: Anotaci ón Automática

Pipeline

Pipeline• Unix

• Símbolo: |

• Segmentación

Page 5: Anotaci ón Automática

Tools• BLAST • InterProScan• AmiGO• Pathway Tools• Infernal• Glimmer• Critica• GeneMark• GeneWise• BedTools• Samtools• GenomicTools• KEGG-API

Page 6: Anotaci ón Automática

Base de Datos

BLAST DB Protein-KEGG-PRIAM-SWISSPROT-UNIPROT-NR

BLAST DB Nucleotide- NT- REFSEQ- RDP

InterProScan - Databases

- Pfam- SSF- Gene3D- TIGRfam

Page 7: Anotaci ón Automática

Nuevo Problema

• Gran cantidad de bases de datos.

• Errores en Anotación, doble anotación.

• Necesidad de Crear un vocabulario Controlado

• Gene Ontology, UniPROT, SwissPROT, InterProScan.

• Capacidad de realizar referencias cruzadas en las bases de datos.

Page 8: Anotaci ón Automática

Algunos Conceptos Importantes

• Gene Name

• Vocabulario Controlado

• IFAA

Page 9: Anotaci ón Automática

GeneName:

Para cada Organismo existen gene names particulares, según la base de datos de Referencia.

HUGO:www.genenames.org

Page 10: Anotaci ón Automática

Gene Ontology ConsortiumGene Ontology:

Proyecto colaborativo entre variadas instituciones.

Vocabulario:EstructuradoPrecisoComún Controlado

Permite describir los roles de los genes y los productos génicos en cualquier organismo.

Page 11: Anotaci ón Automática

División Gene Ontology

• Proceso Biológico

• Función Molecular

• Componente Celular

Page 12: Anotaci ón Automática

COG - KOG

Page 13: Anotaci ón Automática

Idea

• Filtrar por bases de datos

• Generar una rutina automática capaz de iterar el proceso, para cada set de genes.

Page 14: Anotaci ón Automática

Tools & Databases

Page 15: Anotaci ón Automática
Page 16: Anotaci ón Automática
Page 17: Anotaci ón Automática

Resumen

• Hasta ahora, se han visto:

NGS sequencing.Assembly.Gene Prediction.Annotation (Databases).Automatic Annotation

Page 18: Anotaci ón Automática

Caso Transcriptómica

Page 19: Anotaci ón Automática

Nannochloropsis salina transcriptomics

Page 20: Anotaci ón Automática
Page 21: Anotaci ón Automática
Page 22: Anotaci ón Automática

RNA processing and modification

Chromatin structure and dynamics

Energy production and conversion

Cell cycle control, cell division, chromosome partitioning

Amino acid transport and metabolism

Nucleotide transport and metabolism

Carbohydrate transport and metabolism

Coenzyme transport and metabolism

Lipid transport and metabolism

Translation, ribosomal structure and biogenesis

Transcription

Replication, recombination and repair

Cell wall/membrane/envelope biogenesis

Cell motility

Posttranslational modification, protein turnover, chaperones

Inorganic ion transport and metabolism

Secondary metabolites biosynthesis, transport and catabolism

General function prediction only

Function unknown

Signal transduction mechanisms

Intracellular trafficking, secretion, and vesicular transport

Defense mechanisms

Extracellular structures

Nuclear structure

Cytoskeleton

AB

CD

EF

GH

IJ

KL

MN

OP

QR

ST

UV

WY

Z

0 5 10 15 20 25

KOG Category N.salina v/s C.reindhardtii

N.salinaC.reindhartii

Category Percentage

KOG

Cate

gory

Page 23: Anotaci ón Automática

23

GenDB

– Automatic Annotation System for Prokaryotic genomes

• Development for the University of Bielefeld since 2002.

• Modular system developed using an OOP and a relational database (O2DBI).

• Provide an Application program Interface (API).

Page 24: Anotaci ón Automática

24

GenDB

• Folker Meyer et all. GenDB an open source genome annotation system for prokaryote genomes. Nucleic Acids Research,2003

Page 25: Anotaci ón Automática

25

GenDBPipeline

25

Page 26: Anotaci ón Automática

26

GenDB

Page 27: Anotaci ón Automática

Ensembl

• Inicio:1999

• Objetivo: generar herramientas de anotación automática.

Ensembl Pipeline.

• Website:http://www.ensembl.org/

Page 28: Anotaci ón Automática

Galaxy

• Workflows, para NGS sequence, web based.

http://galaxy.psu.edu/