1
Linhas de Experimentos: Reutilização e Gerência de
Configuração em Workflows científicos
Eduardo Ogasawara Leonardo Murta Cláudia Werner Marta Mattoso
2
Sumário
l Introdução l Análise de SGWfC pela perspectiva de
Engenharia de Software l Proposta: Linhas de experimentos l Desenvolvimento para e com reutilização l Protótipo l Conclusões
3
Reutilização em workflows científicos
l reexecutar um workflow previamente montado
l buscar workflows já criados
4
MyExperiment: Um repositório de workflows
5
Workflows similares
mafft kalign
6
Reutilização no nível de atividades
l Entender atividades como componentes l [Gary et al., 1999] [Bowers et al., 2006]
l Trazer semântica entre workflows similares para que o pesquisador possa:
l Saber que existem variações l Explorar variações em suas pesquisas l Facilitar a manutenção dos workflows l Saber medir quais variações são mais
usadas
7
Estado da arte em reutilização de atividades
l Adição de novas atividades (plug-ins) l Kepler, Vistrails, Taverna
l Apoio a subworkflows l Kepler e Taverna
8
Linhas de produtos em Engenharia de Software
l Conjunto de sistemas que compartilham estruturas comuns em termos de aplicabilidade. [Northrop, 2002][Frakes et al., 2005]
l Sucesso requer planejamento e estruturação dos elementos a sofrer técnicas de reutilização.
9
Características de linhas de produtos
l Conceito de componentes l Ativos de reutilização l Pontos de variabilidade l Pontos de opcionalidade l Regras de composição l Estabelecimento de recortes
10
Proposta: Linhas de experimentos
l Representação do encadeamento de atividades para experimentação num nível mais abstrato.
l Separação do processo básico da escolha de um determinado algoritmo ou técnica.
11
Workflow padrão
Encadeamento de atividades gerais com pontos de variabilidade e opcionalidade.
Alinhamento
kalign mafft musclee
tcoffee
Árvore Filogenética
Legenda Opcionalidade Variabilidade Obrigatoriedade
12
Tabela de equivalência entre linhas de produtos e linhas de experimentos
Linhas de produtos
Linha de produto Workflow padrão
Linhas de experimentos
pontos de variabilidade Atividades e relacionamentos variantes
pontos de opcionalidade Atividades e relacionamentos opcionais
Regras de composição Regras de encadeamento
Recorte Geração de workflow a partir da linha
Features Recorte guiado
13
Desenvolvimento para reutilização
Repositório
Concepção
l Há um trabalho inicial maior de planejamento para se compor uma linha de experimentos
l Mudanças na linha podem ser refletidas nos workflows montados
Requisitos
14
Desenvolvimento com reutilização
Repositório
Concepção
Exploração de variações
Requisitos
l Exploração de variações l Recortes de linhas
15
Construção da linha a partir de um workflow
fasta
mafft display
16
Indicação manual de ponto de variabilidade
fasta
align*
display
Definição de ponto de variabilidade
kalign mafft
17
Dif/Merge de workflows
A = A B = B C ponto de variabilidade E incluir atividade opcional F
A
C B
A
E
B
F
Busca de subgrafos semelhantes
Tabela de dif/merge Para construção da linha
18
Protótipo
l Objetivo de avaliar os conceitos apresentados.
l Desenvolvido um protótipo em Java l SGBD Postgres l XPDL-Specifications do WfMC.
19
Características do protótipo
l Workflow padrão (nível mais abstrato) l Criação de linhas de experimentos a
partir de um workflow inicial l Cartuchos para exportação/importação
de workflows para Kepler, Taverna e Vistrails.
l Variabil idade e opcionalidade de atividades e relacionamentos
20
Retomando ...
mafft kalign
21
Protótipo: gerenciador de linhas
variabilidade
22
Edição de atividade de alinhamento
Itens de variabilidade
Nível de abstração
23
Edição de relacionamento
Converte em item variável
24
Conclusões
l Aplicação de conceitos de reutilização para composição de workflows.
l Maior formalização via workflow padrão, que permite: l Explorar variações; l Facilitar a manutenção; l Medir uso a partir dos recortes;
25
Trabalhos em andamento
l Este trabalho faz parte do projeto de Gerência de Experimentos Científicos em Larga Escala (GEXP)
l Alinhado ao tema de doutorado. l Aplicação do conceito de linha de
experimentos para cadeia de petróleo e bioinformática.
l Exploração mais aprofundada de gerência de configuração.
26
Eduardo Ogasawara [email protected]
Visite nosso sítio http://gexp.nacad.ufrj.br
Linhas de Experimentos: Reutilização e Gerência de Configuração em
Workflows científicos
Obrigado!