repositório de dados na u.porto: um fluxo de curadoria suportado numa extensão ao dspace

21
Repositório de dados na U.Porto Um fluxo de curadoria suportado numa extensão ao DSpace Cris:na Ribeiro DEI FEUP/ INESC TEC João Rocha da Silva FEUP Eugénia Matos Fernandes Reitoria da Universidade do Porto João Correia Lopes DEI FEUP/ INESC TEC

Upload: conferencia-luso-brasileira-sobre-acesso-livre

Post on 25-Jan-2015

259 views

Category:

Technology


0 download

DESCRIPTION

Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace. - Cristina Ribeiro, João Rocha da Silva, Maria Eugénia Matos Fernandes, João Correia Lopes

TRANSCRIPT

Page 1: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Repositório  de  dados  na  U.Porto    

Um  fluxo  de  curadoria  suportado  numa  extensão  ao  DSpace    

Cris:na  Ribeiro   DEI-­‐  FEUP/  INESC  TEC  

João  Rocha  da  Silva   FEUP  

Eugénia  Matos  Fernandes   Reitoria  da  Universidade  do  Porto  

João  Correia  Lopes   DEI-­‐  FEUP/  INESC  TEC  

Page 2: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Conteúdo  

•  Obje:vos  •  Auditoria  de  dados  na  U.Porto  •  Desenho  de  um  workflow  de  gestão  de  dados  •  Construção  de  um  protó:po  de  repositório  •  Conclusões  e  trabalhos  futuros  

Page 3: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Obje:vos  

•  Determinar  as  necessidades  de  gestão  de  dados  dos  inves:gadores  da  U.Porto  

•  Desenhar  e  implementar  um  repositório  de  dados  para  sa:sfazer  estas  necessidades  

•  Procurar  uma  solução  que  não  esteja  limitada  às  necessidades  de  um  só  grupo  

Page 4: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Objetivo

Status Quo

Sa:sfazer  obje:vos  

 •  Representar  dados  tabulares  em  formatos  próprios  para  preservação  –  XML  

•  Interrogação  online  •  Reu:lização  de  descritores  nos  metadados  

Page 5: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Fase  1  :  Entrevistas  

Recolha  de  dados  e  de  casos  de  uso  

Especificação  do  workflow  

Construção  da  plataforma  

Depósito  de  dados  

Page 6: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Auditoria  de  dados  

•  Entrevistas  com  inves:gadores  – Engenharia,  ciências  sociais,  educação,  ciências  da  terra,  biologia,  economia,  …    

•  Recolha  de  amostras  de  dados  •  Recolha  de  casos  de  uso  •  Relatório  e  resultados  subme:dos  a  aprovação  dos  inves:gadores  

Page 7: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Os  inves:gadores  dizem  

•  …  a  gestão  de  dados  é  complexa  •  …  a  gestão  de  dados  não  deveria  distraí-­‐los  do  seu  trabalho  

•  …  precisam  de  apoio  profissional  na  gestão  de  dados  

•  …  “o  que  ganho  em  guardar  os  meus  dados  num  repositório?  Os  discos  externos  são  tão  baratos!”  

Page 8: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Os  inves:gadores  dizem  

•  …  já  perderam  dados  devido  a  formatos  que  foram  abandonados  

•  …  precisam  de  sí:o  para  par:lhar  dados  com  parceiros,  em  vez  de  usarem  o  email  

•  …  precisam  de  ferramentas  para  manipulação  de  dados  online  

Page 9: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Preocupações  e  necessidade  dos  inves:gadores  

•  “Os  repositórios  não  podem  ser  cemitérios    de  dados”  

•  “O  principal  obje:vo  na  preservação  de  dados  é  a  par:lha/  reu:lização/  citação”  

•  “Os  dados  têm  de  ser  bem  anotados  ou  não  podem  ser  usados  para  validar  resultados  

 

Page 10: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Fase  2  :  Modificar  o  workflow  

Recolha  de  dados  e  de  casos  de  uso  

Especificação  do  workflow  

Construção  da  plataforma  

Depósito  de  dados  

Page 11: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

O  Papel  do  “Curador  de  Dados”  

Dados

CuradorInvestigador

Page 12: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Reunião  de  curadoria  

Reunião

Dados Curados

Page 13: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Anotação  de  dados  

Silva, João Rocha

Azores GPS Run

01-01-2011

License: CC ShareAlike

dc:contributor.author

dc:lastModified

dc:title

dc:rights

38.760267493 -27.084113746 488500.999190

38.760267489 -27.084113743488499.999191

-27.084113739 488498.999192 38.760267506

488497.999193 38.760267485 -27.084113744

-27.084113730 488496.999194 38.760267507

time.gps_sow latitude longitude

Terceira

Flores

Table-level metadata

Data

Dimensions

END_METADATA

-107.391006-93.994527-80.584969-67.168032-53.750371

gravity.specific

Elementos    do  XML  Schema    do  domínio  como  descritores  e  colunas  

Page 14: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Depois  da  reunião  

Dados+Metadados  em  formato  Excel  

Repositório

Page 15: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Dados  disponíveis  

•  Explorar,  filtrar  e  descarregar  só  o  necessário  

Investigador

Repositório de dados de investigação

Page 16: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Fase  3  :  Construir  ferramentas  de  suporte  ao  workflow  

Recolha  de  dados  e  de  casos  de  uso  

Especificação  do  workflow  

Construção  da  plataforma  

Depósito  de  dados  

Page 17: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Módulo de dados de investigação UPData

TransformaçãoXSLT

CoreDSpace

TabelaDinâmica

Tabela Formatada

Tradutorde

Interrogações

Interrogação XQuery FLWOR

Ficheiro Original

Folha Excel correctamente

preenchida

5

4

3

Documento Traduzido

(XML)

Página dedepósito

Interrogação(JSON)

XML Manager

Resultados (Dados + Metadados)

1

Acesso a

dados

Leitor XLSX

2

Investigador Curador

Pedido de filtragem de dados

Page 18: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace
Page 19: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Fase  4  :  Testar  ferramenta  com  dados  reais  

Recolha  de  dados  e  de  casos  de  uso  

Especificação  do  workflow  

Construção  da  plataforma  

Depósito  de  dados  

Page 20: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Conclusões  e  Trabalho  Futuro  •  Recolhemos  requisitos  e  casos  de  uso  dos  inves:gadores  da  U.Porto  

•  Casos  de  uso  mais  importantes  foram  implementados  em  repositório  DSpace  

•  U:lizadores  podem  navegar  sobre  dados  online  no  repositório  e  descarregar  subconjuntos  selecionados  

•  Futuro:    –  Validação  de  ferramentas  com  u:lizadores  – Métodos  mais  simples  de  interação  entre  inves:gadores  e  repositório  

Page 21: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Contactos  e  ligações  

Cris:na  Ribeiro   [email protected]  

João  Rocha  da  Silva   [email protected]    

Eugénia  Matos  Fernandes   [email protected]    

João  Correia  Lopes     [email protected]    

Repositório:  hjp://sciencedata.up.pt/  

Documentos:  hjp://sciencedata.up.pt/doc