richtlijnen voor betrouwbare data bewaarplaatsen; rollen en verantwoordelijkheden - laurents sesink...
DESCRIPTION
Richtlijnen voor betrouwbare data bewaarplaatsen Rollen en verantwoordelijkheden Laurents Sesink (DANS) ‘Seminar De uitdaging van het delen van medische onderzoeksdata (3)’ Utrecht, 15 mei 2013TRANSCRIPT
Richtlijnen voor betrouwbare data bewaarplaatsen
Rollen en verantwoordelijkheden
Laurents Sesink
‘Seminar De uitdaging van het delen van medische onderzoeksdata (3)’
Utrecht, 15 mei 2013
Waarom wetenschappelijke data delen } Validatie van onderzoek
} Gedragscode. Data tot 5 jaar na onderzoek beschikbaar houden.
Niederlande Renommierter Psychologe gesteht Fälschungen
Hergebruik van data
} De laatste 10 jaar is er een verandering met betrekking tot het principe van het delen van onderzoeksdata.
} Overheid: OECD Principles and Guidelines for Access to Research Data from Public Funding.
} Wetenschappelijke organisaties: Berlin Declaration on Open Access.
} DANS wordt gefinancierd om dit beleid te implementeren in het wetenschappelijke domein.
Wat is DANS? } Een instituut van de Koninklijke Nederlandse
Academie van Wetenschappen (KNAW) en de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO).
} Voorgangers DANS: Steinmetz archief (1964), Nederlands Historisch Data Archief (1989).
} Missie: de permanente toegang van wetenschappelijke data in Nederland voor de toekomst garanderen. (beginnend met data van de humaniora and sociale wetenschappen).
DANS Beleid
} Het is niet belangrijk waar data gearchiveerd wordt als de repository voldoet aan internationale standaarden en richtlijnen met betrekking tot trustworthiness
} Onderzoek financiers moeten onderzoekers verplichten om hun data in een TDR te deponeren.
} Onderzoekers moeten hun data deponeren/delen: Open als het kan, beschermd als het moet.
Rollen en verantwoordelijkheden } Onderzoek financiers: Stimuleer en verplicht ◦ Audit en certificering van digitale repositories ◦ Data management paragraaf in projectvoorstellen ◦ Data contract ◦ Deponeren of delen van onderzoek data in een TDR
} Data repositories: ◦ Conformeer aan de richtlijnen van een TDR ◦ Geef permanente toegang tot onderzoek data
} Data producenten: ◦ Produceer excellente data ◦ Deponeer data in een TDR
} Data consumenten: ◦ Gebruik data op een betrouwbare wijze
◦ Geef wetenschappelijke waardering aan de producent van de data (refereer!)
Data is hot! } Neelie Kroes (Vice-
President of the European Commission responsible for the Digital Agenda): “Data is the new gold”
} Rome, April 2012: Open science culture – open sharing of data, software, publications, educational materials
} DMP in Horizon 2020
} ARVODI } KADASTER } CBS
Nederlandse overheid en wetenschappelijke data
Data repositories: Conformeer aan internationale standaarden en richtlijnen. • BASIC CERTIFICATION is granted to repositories
which obtain DSA certification • EXTENDED CERTIFICATION is granted to Basic
Certification repositories which in addition perform a structured, externally reviewed and publicly available self-audit based on ISO 16363 or DIN 31644
• FORMAL CERTIFICATION is granted to repositories which in addition to Basic Certification obtain full external audit and certification based on ISO 16363 or equivalent DIN 31644.
See: www.trusteddigitalrepository.eu
5 Kriteria 16 Richtlijnen
Onderzoek data: } Kunnen gevonden
worden op het Internet } Zijn toegankelijk
(duidelijke rechten en licenties)
} Zijn in in bruikbaar formaat
} Zijn betrouwbaar } Zijn refereerbaar
(persistent identifier) 22-05-13
Data Seal of Approval
www.datasealofapproval.org
} (1) The data producer deposits the research data in a data repository with sufficient information for others to assess the scientific and scholarly quality of the research data and compliance with disciplinary and ethical norms.
} (2) The data producer provides the research data in formats recommended by the data repository
} (3) The data producer provides the research data together with the metadata requested by the data repository
Data producent: 3 richtlijnen
} (4) The data repository has an explicit mission in the area of digital archiving and promulgates it
} (5) The data repository uses due diligence to ensure compliance with legal regulations and contracts including, when applicable, regulations governing the protection of human subjects.
} (6) The data repository applies documented processes and procedures for managing data storage
} (7) The data repository has a plan for long-term preservation of its digital assets
} (8) Archiving takes place according to explicit workflows across the data life cycle
Data repository: 10 richtlijnen
} (9) The data repository assumes responsibility from the data producers for access and availability of the digital objects
} (10) The data repository enables the users to utilize the research data and refer to them
} (11) The data repository ensures the integrity of the digital objects and the metadata
} (12) The data repository ensures the authenticity of the digital objects and the metadata
} (13) The technical infrastructure explicitly supports the tasks and functions described in internationally accepted archival standards like OAIS
Data repository: 10 richtlijnen
} (14) The data consumer complies with access regulations set by the data repository
} (15) The data consumer conforms to and agrees with any codes of conduct that are generally accepted in higher education and research for the exchange and proper use of knowledge and information
} (16) The data consumer respects the applicable licenses of the data repository regarding the use of the research data
Data consument: 3 richtlijnen
} Data archief is als organisatie verantwoordelijk voor het implementeren van de guidelines.
} Een assesment kan online aangevraagd worden. } De assesment aanvraag wordt aanvaard of afgewezen. } De organisatie beschrijft hoe voldaan wordt aan de
richtlijnen. } De DSA board reviewed de assesment. } Er worden categorieën toegekend in welke mate een
richtlijn afdoende geïmplementeerd is. } Bij voldoende score krijgt men het DSA Seal. } Het Seal moet periodiek vernieuwd worden.
Assesment proces
} Repository is verantwoordelijk voor de implementatie van alle richtlijnen behalve 4,6,7,8 and 13;
} Bewaar een kopie van de data in een Trusted Digital Repository (TDR) met een DSA Seal die alle 16 richtlijnen geimplementeerd heeft (inclusief 4, 6, 7, 8 en13).
} 16 repositories hebben op dit moment een SEAL } DANS assesment.
Gedelegeerde verantwoordelijkheid
} Bij DANS in het Elektronische Archivering Systeem (EASY)
} Elders in een TDR (3TU.datacentre, The Language Archive)
Hiervoor zijn nodig: } Data archiverings richtlijnen } Onderzoeksdata management training en
advies
Data producent: Onderzoekers moeten hun data delen/deponeren in een TDR
} Digitale data zijn in grote aantallen aanwezig
} Nieuwe onderzoeksvragen } Nieuwe methoden en technieken } Nieuwe zoek, browse, analyse en
visualisatie tools
Data intensieve wetenschap
} Meer informatie } Publicaties } Datasets } Onderzoek informatie
} Onderzoeker } Organizatie } Projecten
} Contextuele informatie is nodig om het vinden en waarderen van informatie
Informatie in context
Projects
Koppelen van data, publicaties, onderzoek informatie
Data
Publications
Researchers
Research information in context
!
Benodigde infrastructuur
Research Infrastructures
Research Information
Research Data
Research Publications
Educational Resources
Software
Interoperabiliteit: standaarden & systemen
Persistent Identifiers
Metadata
} Domein specifieke diensten ◦ CLARIN, DARIAH, CESSDA etc.
} Gemeenschappelijke diensten ◦ DASISH, EUdat
} Digitale duurzaamheid ◦ APARSEN, Planets
Rollen en verantwoordelijkheden
Scholarly communication semantic data landscape
Trusted Data Repositories Ingest
Research information in
context
Interoperability Integrity E-Architecture Agreements
Policy, standards
Implementation
Metadata PI’s (object, author)
Narcis OpenAire Europeana
Data Publications Research Informations
Service Providers
Data Providers
Required infrastructure
Research infrastructure
Research information
Research data
Research publications
Educational material
Software
} Domein specifieke diensten ◦ CLARIN, DARIAH, CESSDA etc.
Rollen en verantwoordelijkheden
} CLARIN centers } CESSDA leden } DARIAH partners } Minimale eisen
} DSA
BIG SCIENCES
TECHNICAL SCIENCES
SOCIAL SCIENCES& HUMANITIES(designated community)
Basic Infrastructure
Federated Dataservice Network
SURFSara Datacenter
3TU Datacenter
FEDERATED DATASERVICE INFRASTRUCTURE
StorageComputing Networking
Virtualization GRIDCloud Computing Lightpaths
Producer
VRE-X
SharePointDataVerse
Consumer
DANS
Ingest Access
Administration
Management
Storage
ERIC-YCLARIN
DARIAH
VRE-X
SharePointDataVerse
ERIC-YCLARIN
DARIAH
Disk
Services
Internet
Preservation
Research Curation + Preservation Reuse
Discovery
AAIVisualization
Open Archival Information System (OAIS): A n A r c h i v e t h a t h a s a c c e p t e d t h e responsibility to preserve information and make i t avai lable for a Designated Community.
Administration
Preservation Planning
Data Management
Ingest AccessArchival StorageSIP AIP AIP DIP
Descriptive Info
Descriptive Info
queriesresult setsorders
MANAGEMENT
PRODUCER
CONSUMER
OAIS Cooperating: Archives with potential common producers, common submission standards, and common dissemination standards, but no common finding aids.
OAIS Shared resources: Archives that have entered into agreements with other Archives to share resources, perhaps to reduce cost.
The aim of a Virtual Research Environment is to provide an integrated environment that supports the work of a community of collaborating researchers.
OAIS Shared Resources
OAIS
Cooperating
Research DataCESSDA, GBIFCLARIAH, Life-Watch
Scholarly communicationOpenaire, NARCIS
Cultural HeritageEuropeana
OAIS Federated: Archives with both a Local Community and a Global Community which has interests in the holdings of several OAIS Archives and has influenced those Archives to provide access to their holdings via one or more common finding aids.
OAIS Federated
Maa
rten
Hoo
gerw
erf, La
uren
ts S
esin
k23 A
pril
2013,
Dat
a Arc
hivi
ng a
nd N
etw
orke
d Ser
vice
s (D
AN
S)
Evolution of the internet
time
Driver of innovation - Technology - Social use
1.0: web of information
2.0: web of people
3.0: semantic web
4.0: ?
2000 1990
0.0: desktop
2010 2020
expectations
Machine executable information
A set of standards and best practices for sharing data and the semantics of data over the web for use by applications. - Publication of vocabularies. - Dissemination for humans and machines. - ………..
Semantic data landscape
Interoperability
Service Providers
Data providers
Digital Humanities semantic data landscape
Trusted Data Repository (DSA)
Ingest
Machine executable information
Re-use of data (authority files, vocabularies, data etc.)
Interoperability Integrity E-Architecture Agreements
Policy, standards
Implementation
Metadata Data PI’s (object, author)
Silo’s
No borders
Machine executable information
Semantic data landscape
e-Science & Cloud services High performance computing Large scale-high speed storage
en.wikipedia.org 300 × 429 - Girl with a Pearl Earring
ReadFile.aspx mauritshuis.nl 375 × 441 - Girl with a pearl earring. period ca. c.1665.
girl‑with‑a‑pearl‑earring‑gretchen‑matta.jpg fineartamerica.com 521 × 700 - Girl with a Pearl Earring Painting - Girl with a
Machine executable information
Digital Humanities semantic data landscape
Integriteit