[interculte2012] introdução a banco de dados biológicos
TRANSCRIPT
INTRODUÇÃO A BANCOS DE DADOS BIOLÓGICOS
FELIPE GUIMARÃES TORRES COORDENADO PELO PROF. MÁRCIO SOUSSA NÚCLEO DE SERVIÇOS TECNOLÓGICOS - NST
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONTATO
FELIPE GUIMARÃES TORRES
http://www.facebook.com/felipe.g.torres.5
http://www.twitter.com/felipegtorres
http://www.slideshare.net/fgtorres
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – AGENDA
1. Biologia Básica 2. Seres vivos 3. Células 4. DNA
5. História do con- ceito de BDB.
6. Evolução de Re- curso.
7. Bancos de Dados Biológicos
8. Arquitetura com- putacional de um BDB.
9. Conceitos mate- máticos.
10. Prática. 11. TecJorge. 12. Referências.
BIOLOGIA BÁSICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Seres formados por células… Seres vivos…
Exceção dos vírus…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Células
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Procarióticas…
NOME DO CURSO – NOME DO BLOCO INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Eucarióticas…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Ácido desoxirribonucléico. Armazena informações genéticas em genes. São formados por monômeros conhecidos como nucleotídeos.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Estrutura nucleotídica …
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Relações entre nucleotídeos…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Estrutura do DNA
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Ligações entre nucleotídeos
Fosfodiéster…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Ligações entre nucleotídeos
Pontes de Hidrogênio…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
Dogma central…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA
HISTÓRIA DO CONCEITO BDB’S
1965 1970
1982
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
Década de 60…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
Tempo 13 anos (1990 - 2003)
Custo U$3.8 bilhões
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
INTRODUÇÃO ESTRUT. COMP. BANCO DE D. B. DADOS BIO. BANCO DE DADOS ATUAIS FERRAMENTAS
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
SANGER ILLUMINA HISEQ2000
TOTAL DE BASES: 30~ 350 kb TEMPO DA CORRIDA: 15 HORAS CUSTO: U$1000/Mb
TOTAL DE BASES: 35 ~ 200 Gb TEMPO DA CORRIDA: 1.5 a 8 dias CUSTO: MENOS DE U$1/Mb
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GENBANK ENTRE 1995 A 2011.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GOLD ENTRE 1997 A 2011.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S
BANCOS DE DADOS BIOLÓGICOS
Banco de dados biológicos são locais computacionais para o armazenamento de dados biológicos.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS
Sequências de DNA…
Sequências de Proteínas… Anotações…
Dados Biológicos
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS
Secundários… Especializados…
Tipos de BDB
Primários…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS
Primários… Armazenam informações biológicas
originais.
Armazenam normalmente em arquivos de texto. Ex.: Fasta.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS
Secundários…
Armazenam resultados de análises feitas a partir de dados primários.
Utilizam SGBD`s e estruturas computacionais mais complexas.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS
ARQUITETURA COMPUTACIONAL DE UM BDB
Modelos de BD
Relacional…
Orientado a objeto….
Arquivo de texto….
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB
Relacional
Utilizando o conceito de keys…
Largamente utilizado e estável…
Planilhas que se relacionam…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB
Relacional
Exemplo de modelo relacional…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB
OO
Conceito melhorado de keys…
Maior facilidade na abstração…
Conceito abstrato de objeto…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB
Orientado a objeto
Exemplo de modelo OO …
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB
CONCEITOS MATEMÁTICOS PARA ACESSO A DADOS
BIOLÓGICOS
Métodos de acesso… Estruturas de dados que podem ser
armazenadas em memória.
Utilizam SGBD`s e estruturas computacionais mais complexas.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS
Hash Mapping
Armazena chave, valor e um ponteiro…
Alta performace em pesquisas id…
Conhecida como estrutura key-value…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS
Hash Mapping
Exemplo de hash…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS
Árvore de Sufixos
Resolve alguns problemas de similaridade…
Alta performace em textos…
Utilizado por aplicações para pesquisa…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS
Matematicamente é…
Fórmula do prefixo e sufixo…
F = {α1, α2, ..., αn} F* = todas as sequências possíveis com o alfabeto F. T E F*. T = “TATA” c = |T| Logo: T[i:j] (1≤ i≤ j≤ c) T[1:j] = prefixo T[i:c] = sufixo
Prefixos Sufixos R[1:1] = “A” R[6:6] = “T” R[1:2] = “AG” R[5:6] = “AT” R[1:3] = “AGA” R[4:6] = “GAT” R[1:4] = “AGAG” R[3:6] = “AGAT” R[1:5] = “AGAGA” R[2:6] = “GAGAT” R[1:6] = “AGAGAT” R[1:6] = “AGAGAT”
R = “AGAGAT” |R| = 6
Sufixo e Prefixo…
Exemplo de prefixos e sufixos…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS
Árvore de Sufixo…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS
R = “AGAGAT”
PRÁTICA
Visual Suffix Tree…
Software para criação de suffix trees…
Linguagem Java utilizando o jGraph
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS
Visual Suffix Tree…
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS
• No HIV Databases estam armazenados dados de sequências de HIV, epitopos e testes para vacinas. • Este projeto foi fundado pela Division of AIDS of the National Institute of Allergy and Infectious Diseases (NIAID) • Acesso disponível pelo link:
http://www.hiv.lanl.gov/content/index
HIV Databases INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA
UNIPROT • Banco de dados de proteínas e informações funcionais. • O UNIPROT é um consórcio entre:
• European Bioinformatics Institute (EBI). • Swiss Institute of Bioinformatics (SIB). • Protein Information Resource (PIR).
• Esse banco de dados integrou quatro bancos de dados em 2002. Swiss-Prot e TrEMBL (EBI e SIB) e PIR-PSD e iProClass (PIR). • Acesso disponível pelo link:
http://www.uniprot.org/
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA
PROTEIN DATA BANK • É um repositório de estruturas tri-dimensionais de proteínas e ácidos nucléicos. • A maioria das estruturas foram obtidas por cristalograma ou por espectroscopia por ressonância magnética. • A estrutura pode ser visualizada em 3D. • Acesso disponível pelo link: http://www.rcsb.org/pdb
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA
ENTREZ • O NCBI alberga dados provenientes da sequenciação de genomas no seu GenBank e mantém um índice de artigos de investigação biomédica que disponibiliza nas bases de dados PubMed Central e PubMed. • Todas as bases de dados estão disponíveis na Internet através do motor de busca Entrez. É um grande integrador de dados no NCBI. • Acesso disponível pelo link: http://www.ncbi.nlm.nih.gov/sites/gquery
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA
1. Xiong, J. (2006). Essential Bioinformatics. Cambridge University Press.
2. Andrzej Polanski and Marek Kimmel (1998). Bioinformatics. Springer.
3. Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, T. N. Bhat, Helge Weissig, Ilya N. Shindyalov and Philip E. Bourne (2000). The Protein Data Bank. Oxford University Press, Nucleic Acids Research, 2000, Vol. 28, No. 1
4. Robert Schleif, (1993). Genetics and Molecular Biology. Department of Biology The Johns Hopkins University Baltimore, Maryland. All rights reserved. Printed in the United States of America on acid-free paper.
5. Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts and Peter Walter, (2008). Molecular biology of the cell. Published by Garland science, Taylor & Francis Group, LLC, an informa business, 270 Madison Avenue, NewYork NY f 0016,USA,and 2 park Square,Milton park, Abingdon,OXl4 4RN,UK.
INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – REFERÊNCIAS
Perguntas !?
Obrigado !