model agem, avaliação, modificação e seleção de estruturas de proteínas
DESCRIPTION
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO. Model agem, Avaliação, Modificação e Seleção de Estruturas de Proteínas. Projeto de Pós-Graduação. Aluno Erico Souza Teixeira | Orientadora Katia Silva Guimarães. PROTEÍNAS. Conceitos. - PowerPoint PPT PresentationTRANSCRIPT
Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas
Projeto de Pós-Graduação
UNIVERSIDADE FEDERAL DE PERNAMBUCOCENTRO DE INFORMÁTICA
MESTRADO EM CIÊNCIA DA COMPUTAÇÃO
Aluno Erico Souza Teixeira | Orientadora Katia Silva Guimarães
PROTEÍNAS
Conceitos
Citosina | Guanina Adenina | Timina
PROJETO
Área de Desenvolvimento
• BioInformática– Química Computacional
• Modelagem Molecular
• Descoberta das estruturas 3D
O Problema
• Construção de um modelo 3D de uma proteína a partir da seqüência primária
O Problema
>gi|532319|pir|TVFV2E|TVFV2E envelope proteinELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRTQIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQAWCHFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFYCKMDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETISKKTYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPIGFAPTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQKNLLAAVEAQQQMLKLTIWGVK
ATOM 145 N VAL A 25 32.433 16.336 57.540 1.00 11.92 A1 N
ATOM 146 CA VAL A 25 31.132 16.439 58.160 1.00 11.85 A1 C
ATOM 147 C VAL A 25 30.447 15.105 58.363 1.00 12.34 A1 C
ATOM 148 O VAL A 25 29.520 15.059 59.174 1.00 15.65 A1 O
ATOM 149 CB AVAL A 25 30.385 17.437 57.230 0.28 13.88 A1 C
ATOM 150 CB BVAL A 25 30.166 17.399 57.373 0.72 15.41 A1 C
ATOM 151 CG1AVAL A 25 28.870 17.401 57.336 0.28 12.64 A1 C
ATOM 152 CG1BVAL A 25 30.805 18.788 57.449 0.72 15.11 A1 C
ATOM 153 CG2AVAL A 25 30.835 18.826 57.661 0.28 13.58 A1 C
ATOM 154 CG2BVAL A 25 29.909 16.996 55.922 0.72 13.25 A1 C
O Problema
• Importância– Funcionalidade de uma proteína está
relacionada com sua estrutura 3D– Desenvolvimento de novos medicamentos– Descobrir estruturas de outras proteínas
• Situação atual– 1/6 das seqüências tem estrutura conhecida– Swiss-Prot (155576) X PDB (26403 )
Atacando o problema
• Métodos experimentais– Estático
• cristalografia de raios-X
– Dinâmico• técnicas de ressonância nuclear magnética
Atacando o problema
• Aplicações teóricas– métodos físicos
• ab initio
– métodos empíricos• threading
• homologia
Homologia
busca e seleção dos templates
alinhamento alvo-template
construção do modelo
avaliação do modelo
fim
Atacando o problema
• Precisões
Experimentais (o.3 - o.5Å )
Físicos (3.5Å )
Empíricos (1.oÅ )
Atacando o problema
• Dificuldades– Experimentais
• Tempo
• Equipamentos e laboratórios especializados
– Teóricos• Manuseio com diversos programas (entrada/saída,
interfaces)
• Precisão
Melhorando a Precisão
• Avaliadores– Indicam possíveis regiões problemáticas– Metodologia baseada em conhecimento prévio
• Interações não covalentes entre os átomos de C-O-NFreqüências de interações: janela e uma distância
• Propriedades estereoquímicas (ângulos e distância de ligação, Ramanchandran Plot, ângulos diedros das cadeias laterais, ...)Morris et al. (1992) e Engh & Huber (1991)
• Interações entre os átomosCálculo de Energia potencial
Melhorando a Precisão
• Criando Novas Conformações– Modelos de uma seqüência polipeptídica próximos
da estrutura nativa– Coordenadas Cartesianas dos Cα
• estágios iniciais da difração de raios-X• seqüências do PDB• Analítica• Baseado em conhecimento• Minimização de energia
– Ângulos de torção Φ (phi), ψ (psi)• Construir a geometria ideal da proteínas
Seleção dos Modelos
• Métodos– Campos de força
• Equações de potenciais de energia• Termos não-ligados (interações de Lennard-Jones e
Coulomb )• Ligados (distância das ligações, ângulos de ligação,
ângulos diedros)• Restrições de posição e de distância
– Baseados em conhecimento • Ou potenciais estatísticos• Função de pontuação
O Projeto
• Definição– eliminação defeitos presentes nas estruturas de
proteínas originadas da modelagem por homologia
– Construir, avaliar, modificar e selecionas as melhores conformações
O Projeto
Modelagem
Avaliação da estrutura
Construção das conformações
Seleção das regiões
defeituosas
Estrutura primária da proteína
Estrutura terciária da proteína
Novos modelos
Modelo final
OUTROS PROJETOS
Modelagem
• MODELLER– Interface da Accelrys– Nenhum estudo de automatização do processo
Avaliadores
• 3 tipos de avaliadores– Estereoquímicas– Energia potencial– Propriedades não presentes no processo de
modelagem
• Não há um projeto de relacionamento
Criando novas conformações
• Analítico– 2-3 resíduos
• RAPPER e PETRA– Ab initio
• FREAD– Baseado em conhecimento prévio– 3-8 resíduos
• CODA– Combinação entre o FREAD e PETRA
• Não há aplicação em “mundo real”
Seleção de estruturas
• Comparação entre– Campos de Força (CHARMM)– Potenciais estatísticos– RMSD Cα– Choque de energia das cadeias laterais
• Problemas– Seleção empírica– Sob modelos originados de processos
experimentais
Como Resolver o Problema
Ferramentas Aplicadas
• Modelagem– MODELLER
• Projeto na graduação
• Mais conhecida
• Bom material teórico
Ferramentas Aplicadas
• Avaliadores– PROCHECK– ANoLEA– ProSa– PROVE
Ferramentas Aplicadas
• Criação das conformações– Ab initio– Ângulos de torção Φ (phi), ψ (psi)
• Seleção das Conformações– TINKER– Campo OPLSAA
Linguagens de Programação
• Perl– Saídas das ferramentas apresentavam um
formato ASCII– Projetos em iniciação científica
• Java– Orientada o objeto– Não dominava a linguagem C++
Entrada/Saída
O Projeto
CODIGO=<"CODIGO">
MODELLER=<on/off>
SEQUENCIA=<"SEQUENCIA">
TEMPLATES=
INICIO=
FIM=
NOME=
ORIGEM=
SEARCH=<no/yes/only>
AVALIADOR3D=<on/off>
PDB=default
ANOLEA=1
PROCHECK=1
PROSA=1
PROVE=1
WINDOW=5
CONFORMACOES=<on/off>
PDB=default
ANOLEA=0
PROCHECK=0
PROSA=0
PROVE=0
WINDOW=5
AUTOMATIC=yes/no
Exemplo
Modelagem
• Search
• Tabela de seqüências similares
Modelagem
• Download dos arquivos PDB
• Alinhamento entre as estruturas e a seqüência alvo
• Construção da Árvore de Distância
Modelagem
• Construção de 5 modelos
• Seleção pela menor energia
Avaliadores
• Escolha dos pesos para cada uma das ferramenta
• Execução
• Cálculo da região de maior pontuação
Construção das estruturas
Há 1000 conformações no conjunto final?
sim
Sai do algoritmo
não Retira uma conformação da fila
Insere o próximo resíduo
Após 25 tentativas
Conformação recusada
Tem o tamanho da região – 1?
Insere a nova e a antiga conformação
na fila
não
sim
Aproximação entre o dummy e a
penúltima âncora
Insere a última âncora
Não houve choques
Insere a nova conformação no conjunto final e a antiga
na fila
Houve choques
Construção das Estruturas
Seleção da melhor conformação
• Construção das cadeias laterais
• Validação dos choques
• Cálculo da energia sem minimização
• Escolha das 50 com menor energia
• Cálculo do campo de força com minimização
• Seleção daquela que apresenta a menor energia
Alternativas
Modelagem
• Construção de interface que permita– Alterar os alinhamentos– Visualizar agrupamentos das seqüências
similares
• Função de pontuação para a seleção automática ou classificação dos templates
Avaliadores
• Clustering da informação– Associar os tipos usados como modelos de cada
ferramenta com os templates da homologia– Determinar uma função de pontuação de acordo
com as famílias de proteínas
Construção de conformações
• Inserir parcelas de campos de força como filtro de construção
• Aplicação de análises originados de estruturas representativas do PDB– Ab initio + conhecimento prévio
Seleção das conformações
• Aplicação de outros campos de força de acordo com a famílias dos templates
Docking
• Aplicação dos campos de força
• Busca dos sítios ativos
Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas
Projeto de Pós-Graduação
UNIVERSIDADE FEDERAL DE PERNAMBUCOCENTRO DE INFORMÁTICA
MESTRADO EM CIÊNCIA DA COMPUTAÇÃO
Obrigado !!!
Análise de um Modelador de Estrutura de Proteínas e seus Componentes
Trabalho de Graduação em Teoria da Computação
UNIVERSIDADE FEDERAL DE PERNAMBUCOCENTRO DE INFORMÁTICA
GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
Obrigado !!!