Download - Análise de Estruturas de Proteínas
Análise de Estruturas de Proteínas
Jeane Melo
Jeane Melo
Roteiro Introdução
Predição de Estrutura Secundária (Parte 1) Apresentação do problema Exemplos de abordagens Preditor NNPSS
Comparação e Detecção de Padrões Estruturais (Parte 2) Apresentação do problema Exemplos de abordagens Modelo desenvolvido
Jeane Melo
Introdução Projeto genoma humano
Jeane Melo
Introdução Proteínas
Metabolismo, suporte de filamentos, catálise bioquímica, regulação do volume celular e imunização
Jeane Melo
Introdução
Proteômica
Identificação de todas as proteínas expressas por um genoma
Determinação das funções patológicas e fisiológicas das proteínas
Jeane Melo
Introdução
PDB
48235
Swiss-Prot
290484
Seqüências
X
Estruturas
Jeane Melo
Introdução
Jeane Melo
Introdução
Análise seqüencial Comparação de seqüências Busca por ocorrências de padrões
Análise estrutural Obtenção da estrutura a partir da seqüência Comparação de estruturas conhecidas Busca por motivos ou domínios estruturais
Jeane Melo
Introdução
Problema do dobramento de proteínas Predição de Estrutura Secundária
Análise de estruturas conhecidas Busca por motivos Busca por subestrutura comum
Predição de Estrutura Secundária de
Proteínas
Jeane Melo
Predição de Estrutura Secundária
Patrick J. Fleming, Haipeng Gong and George D. Rose (2006) Secondary structure determines protein topology. Protein Science 15:1828-1834.
Jeane Melo
Predição de Estrutura Secundária Dada uma seqüência de aminoácidos, classificar
cada resíduo em classes de elementos de estrutura secundária, por exemplo: Hélices Fitas Coils
Abordagens estatísticas (50%-60%) Abordagens envolvendo redes neurais têm se
revelado mais eficazes (~80%).
Jeane Melo
Exemplos de abordagens
Qian, N. and Sejnowski, T. J. (1988). Predicting the secondary structure of globular proteins using neural network models. Journal Molecular Biology, 202:865-884.
Q3 = 64,3% Janela de tamanho 13 40 nós na camada escondida
Jeane Melo
Exemplos de abordagens
Georgios J. Pappas Jr. and Shankar Subramaniam. Analysis of the Effects of Multiple Sequence Alignments in Protein Secondary Structure Prediction. LNCS, 3594:128-140, 2005
Jeane Melo
Exemplos de Abordagens
PSIPRED Perfis PSI-Blast Predição em dois níveis Desempenho Q3
Entre 76,5% e 78,3%
Jones, D. T. (1999). Protein secondary structure prediction based on position-specific scoring matrices. Journal of Molecular Biology, 292:195-202.
Jeane Melo
Exemplos de Abordagens Melhor Desempenho
1032 proteínas dissimilares Predição em dois níveis
Combinação de 800 predições Desempenho alcançado
77,2% Utilizando o conjunto RS126 para teste
80,6%
Petersen, T. N., Lundegaard, C., Nielsen, M., Bohr, H., Bohr, J., Brunak, S., Gippert, G. P., and Lund, O. (2000). Prediction of protein secondary structure at 80% accuracy. Proteins, 41:17-20.
Jeane Melo
Pontos Abordados
Resultados próximos porém não comparáveis
Esforço computacional
Algoritmo de treinamento
Regras de combinação
Dados de entrada
Jeane Melo
O Preditor NNPSS
NNPSS Neural Network based Protein Secondary Structure
Predictor
Arquitetura simplificada
Eficiência
Resultados comparáveis
Jeane Melo
Abordagem de Referência
Bancos de Dados CB396, RS126
Preditores avaliados PHD [Rost and Sander, 1994] DSC [King and Sternberg, 1996] NNSSP [Salamov and Solovyev, 1995] PREDATOR [Frishman and Argos, 1997] CONSENSUS [Cuff and Barton, 1999]
Cuff, A. J. and Barton, J. G. (1999). Evaluation and improvement of multiple sequence methods for protein secondary structure prediction. Proteins: Structure, Function and Genetics, 34:508-519.
Jeane Melo
O Preditor NNPSS Dados
Bancos CB396, RS126
Perfis PSI_Blast, Freqüência, PSI_Blast com filtro Banco de dados NR
Método de avaliação Validação cruzada Q3
RPROP Regras de combinação
Votação, Produto, Média, Máximo, Mínimo
Jeane Melo
O Preditor NNPSS
Jeane Melo
Resultados
Método RS126 (%) CB396 (%)
PHD 73,5 71,9DSC 71,1 68,4PREDATOR 70,3 68,6NNSSP 72,7 71,4CONSENSUS 74,8 72,9NNPSS 74,1 75,9
Guimarães, K. S., Melo, J. C. B., and Cavalcanti, G. D. C. (2003). Combining few neural nets for effective secondary structure prediction. In Proc. of the Third IEEE Symposium on Bioinformatics and Bioengineering, pages 415-420,Maryland, USA.
Jeane Melo
Resultados
Jeane Melo
Extração de Características Simplificar arquitetura Seleção de resíduos significativos
Proteínas SSSD Métodos
Análise de Componentes Principais (PCA) Análise de Componentes Independentes (ICA)
Friedberg, I., Kaplan, T., and Margalit, H. Glimmers in the midnight zone: Characterization of aligned identical residues in sequence-dissimilar proteins sharing a common fold. In Proc. of the Eighth International Conference on Intelligent Systems for Molecular Biology, pages 162-170, 2000.
Jeane Melo
Extração de Características
Jeane Melo
Análise ComparativaComparaçãodas Melhores Performances Q3 Médias
180 Componentes (PCA) versus 180 Componetes (ICA)
70.00
71.00
72.00
73.00
74.00
75.00
76.00
Rede1 Rede2 Rede3 Produto Média Votação Mínimo Máximo
Prec
isão
Méd
ia (%
)
PCAICA
Melo, J. C. B., Cavalcanti, G. D. C., and Guimarães, K. S. (2004). Protein secondary structure prediction: efficient neural network and feature extraction approaches. IEE Electronics Letters, 40(21):1358-1359.