informe datos cientificos en esp

Upload: claudia-silvera

Post on 10-Feb-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/22/2019 Informe Datos Cientificos en Esp

    1/59

    Diciembre 2012

  • 7/22/2019 Informe Datos Cientificos en Esp

    2/59

    Edicin, Diseo y MaquetacinFundacin Espaola para la Ciencia y la Tecnologa, FECYT, 2012

    ConclusionesFundacin Espaola para la Ciencia y la Tecnologa, FECYT.

    AutoresGrupo de Trabajo de Depsito y Gestin de datos en Acceso Abierto del proyectoRECOLECTA.

    CoordinacinCristina Gonzlez Copeiro (FECYT)Jordi Serrano-Muoz (UPC)

    ParticipantesAlicia Garca-Garca (UCV)Antonia Ferrer-Sapena (UPV)

    Fernanda Peset (UPV)Isabel Bernal (CSIC)Izaskun Lacunza (FECYT)Javier Gmez (UA)Lus Martnez-Uribe (Fundacin Juan March)Manuela Palafox (UCM)Mercedes de Miguel Estvez (FECYT)Paz Fernndez (Fundacin Juan March)Pilar Rico Castro (FECYT)Ricard de la Vega (CESCA)Victoria Rasero (UC3M)

    ColaboradoresAgnes Ponsati (CSIC)Florencia Dieci (UPV)

    Fecha de edicinDiciembre 2012

    Cmo citar este documentoGrupo de Trabajo de Depsito y Gestin de datos en Acceso Abierto del proyectoRECOLECTA. La conservacin y reutilizacin de los datos cientficos en Espaa. Informe del

    grupo de trabajo de buenas prcticas[en lnea] Madrid: Fundacin Espaola para la Ciencia y

    la Tecnologa, FECYT (2012) [Consulta 14/01/2013]. Disponible enWWW.FECYT.ES

    Este informe est bajo unaLicencia Creative CommonsAtribucin-NoComercial-SinDerivadas 3.0 Unported

    http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://www.fecyt.es/
  • 7/22/2019 Informe Datos Cientificos en Esp

    3/59

    3/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    SUMARIO

    Introduccin .............................................................................................................................................................................. 4

    1. Los datos de investigacin ........................................................................................................................................... 5

    2. Actores implicados en la gestin de los datos cientficos ............................................................................... 8

    3. Qu son los datos de la investigacin? ............................................................................................................... 10

    3.1 Definicin ........................................................................................................................................................................ 10

    3.2 Tipos de datos ............................................................................................................................................................... 10

    3.3 La gestin de los datos .............................................................................................................................................. 11

    4. Infraestructura y Sostenibilidad ............................................................................................................................. 13

    5. Buenas prcticas para la gestin de datos de investigacin ...................................................................... 155.1 Desarrollo de un plan de gestin de datos ....................................................................................................... 15

    5.2 Formatos ......................................................................................................................................................................... 17

    5.3 Metadatos ....................................................................................................................................................................... 17

    5.4 Identificador digital de datos ................................................................................................................................. 19

    5.5 Marco legal relacionado con la gestin y divulgacin de datos de investigacin ........................... 20

    5.6 Preservacin .................................................................................................................................................................. 23

    6. Ejemplos de buenas prcticas por disciplinas y actores .............................................................................. 24

    6.1 Guas para la gestin de los datos: ....................................................................................................................... 24

    6.2 Datos por disciplinas: ................................................................................................................................................ 247. Casos de estudio en Espaa ...................................................................................................................................... 26

    7.1 Evolucin de las contribuciones espaolas. Gestin de datos cientficos .......................................... 27

    7.1.1 Revisin bibliogrfica de literatura acadmica y profesional............................................. 27

    7.1.2 Jornadas y conferencias relacionadas con la gestin de datos de investigacin............... 30

    7.1.3 Proyectos relacionados con la gestin de datos y contacto con profesionales del sector 33

    8. Caso de estudio: ODiSEA ............................................................................................................................................ 37

    8.1 Antecedentes ................................................................................................................................................................. 37

    8.2 Objetivo ............................................................................................................................................................................ 37

    8.3 Equipo .............................................................................................................................................................................. 38

    8.4 Metodologa ................................................................................................................................................................... 38

    8.5 El producto: ODiSEA: International Registry on Research Data......................................................... 39

    8.6 Lecciones aprendidas ................................................................................................................................................ 39

    9. Buenas prcticas ............................................................................................................................................................ 41

    10. Sobre los casos de estudio en Espaa .................................................................................................................. 42

    11. Conclusiones .................................................................................................................................................................... 44

    12. Bibliografa ....................................................................................................................................................................... 49

    Sobre las instituciones participantes ......................................................................................................................... 56

    http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209
  • 7/22/2019 Informe Datos Cientificos en Esp

    4/59

    4/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Introduccin

    Este informe surge para dar respuesta al reto que se abre dentro del movimiento de acceso abierto

    sobre cmo incluir los datos de investigacin junto a las publicaciones cientficas dentro de los

    repositorios. Contribuye de esta forma a la mejor aplicacin de la Ley 14/2011, de 1 de junio, de la

    Ciencia, la Tecnologa y la Innovacin, en lo que se refiere al artculo 37 de difusin en abierto. Tiene por

    objetivo ayudar a la normalizacin de la gestin de los datos en los repositorios con el fin de facilitar su

    preservacin, acceso y distribucin. En su contenido se reflejan todos los aspectos importantes que

    intervienen en la gestin de los datos, desde su definicin, tipos de datos, actores implicados, buenas

    prcticas para la gestin y un panorama general de la situacin en Espaa.

    La Fundacin Espaola para la Ciencia y la Tecnologa (FECYT), en colaboracin con Red de Bibliotecas

    Universitarias (REBIUN) de la Conferencia de Rectores de las Universidades Espaolas (CRUE), gestiona

    y coordina RECOLECTA, un proyecto para la creacin de una red de repositorios institucionales

    interoperables y que puede ser considerado como la primera iniciativa nacional en la creacin de una

    infraestructura que facilita la open scienceo ciencia en abierto. El objetivo es adems dotar de mayor

    visibilidad y servicios a los resultados de la investigacin y de la produccin cientfica espaola.

    En el marco de este proyecto en 2012 se puso en marcha un grupo de trabajo cuyo objetivo fue el estudio

    del panorama general de la gestin de los datos cientficos de investigacin y su uso en el mbito de los

    repositorios.

    Nuestro agradecimiento a todas las instituciones participantes en el grupo de trabajo: la Universitat

    Politcnica de Catalunya (UPC), la Universidad Carlos III de Madrid (UC3M), la Universidad Complutense

    de Madrid (UCM), el Consejo Superior de Investigaciones Cientficas (CSIC), la Universidad de Alicante

    (UA), el Centro de Servicios Cientficos y Acadmicos de Catalua (CESCA), el Instituto Juan March y la

    Universidad Politcnica de Valencia (UPV).

    Confiamos en que este estudio resulte de ayuda e inters para la gestin de los datos de investigacin.

  • 7/22/2019 Informe Datos Cientificos en Esp

    5/59

    5/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    1.LOS DATOS DE INVESTIGACINEn los ltimos aos, el movimiento de Acceso Abierto a la informacin cientfica ha iniciado un debate sobre

    nuevas tendencias en el acceso, uso y modelos de negocio de la informacin producida con fondos pblicos.

    Este movimiento tiene una presencia importante en el acceso abierto a publicaciones cientficas publicadas

    en revistas. En este sentido, mltiples agencias de financiacin e instituciones que realizan investigacin ya

    disponen de polticas para garantizar el acceso abierto a publicaciones cientficas financiadas con fondos

    pblicos.

    El movimiento de acceso abierto y de creacin de e-infraestructuras que den apoyo al uso de informacin

    cientfica por la comunidad cientfica ha comenzado a debatir tambin sobre la importancia de los datos de

    investigacin. Estos datos de investigacin estn empezando a reconocerse como una fuente deconocimiento propia e independiente de las publicaciones que pueden emplearse en la validacin de los

    resultados de investigacin publicados en artculos, para generar nuevo conocimiento y ser explotados por

    humanos y mquinas de manera interdisciplinar.

    Para asegurar esta explotacin de los datos, es necesario que estn disponibles y accesibles en la red, de la

    misma manera que lo estn las publicaciones. Sin embargo, la naturaleza de los datos de investigacin es

    muchsimo ms variable y dependiente de la disciplina y de su particular ciclo de vida. Adems, los

    requisitos tcnicos y legales para garantizar el acceso son ms complejos que los de las publicaciones.

    Existen ya disciplinas de la ciencia con tradicin de depsito y re-uso de datos disponibles en repositorios

    temticos, pero muchas otras que no han incluido esta prctica en sus rutinas de investigacin. La gestin

    adecuada de los datos requiere, adems, de inversin, personal especializado en la generacin de datos,

    explotacin de los mismos y su posterior preservacin, coordinacin para garantizar la interoperabilidad de

    los nodos de la infraestructura, cambio de cultura entre el personal investigador, etc.1.

    Actualmente, existe ya un acuerdo internacional para considerar la creacin de una infraestructura

    transnacional y multidisciplinar que garantice el acceso a los datos de investigacin, que contribuir a

    mejorar la calidad de la ciencia, multiplicar sus resultados y evitar duplicidades2

    3

    . En este mbito, se handado mltiples pasos, particularmente desde agencias de financiacin, para estimular la cultura open

    science que incluya a los datos de investigacin como parte de una e-infraestructura que d soporte a la

    ciencia del siglo XXI.

    1A surfboard for riding the wave: Towards a four country action programme on research data; Knowledge Exchange, 2011;http://www.knowledge-exchange.info/Default.aspx?ID=469 [Consulta 6/12/2012]

    2High level expert group on scientific data: Riding the Wave: How Europe can gain from the rising tide of scientific data; European

    Union, 2010; http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdf [Consulta 6/12/2012]3 OECD Principles and Guidelines for Access to Research Data from Public Funding, OECD, 2007;http://www.oecd.org/dataoecd/9/61/38500813.pdf [Consulta 6/12/2012]

    http://www.knowledge-exchange.info/Default.aspx?ID=469http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469
  • 7/22/2019 Informe Datos Cientificos en Esp

    6/59

    6/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Sin tratar de ser exhaustivos, y a modo de muestra de las tendencias internacionales al respecto, se destacan

    en esta introduccin algunos documentos y comunicaciones europeas que estn marcando las tendencias en

    la redefinicin del acceso a la informacin cientfica, concebida como una e-infraestructura a disposicin de

    la comunidad investigadora y el pblico en general y disponible en acceso abierto cuando el conocimiento

    proceda de proyectos financiados con fondos pblicos.

    En 2007, la Comisin Europea public una comunicacin sobre informacin cientfica en la era digital,

    destacando las primeras acciones previstas por la Comisin para coordinar el paso de la era de la

    informacin cientfica en papel al entorno digital4. Estas recomendaciones se centraban en facilitar el acceso

    a las publicaciones cientficas, cofinanciar infraestructuras de investigacin (repositorios), y estimular el

    debate para futuras polticas al respecto y el debate entre los diferentes actores.

    A esta Comunicacin, le siguieron las conclusiones del Consejo sobre informacin cientfica 5que otorgan al

    acceso rpido a las publicaciones y datos de investigacin el carcter de crucial para el desarrollo del

    Espacio Europeo de Investigacin.

    Fruto de estas conclusiones, la Comisin Europea lanz un proyecto piloto en el mbito del Sptimo

    Programa Marco, que estimulaba a los beneficiarios de siete reas del programa a depositar sus artculos de

    investigacin cientfica en repositorios temticos o institucionales, respetando un periodo de embargo de

    entre 6 y 12 meses6

    . Como apoyo a este piloto, se financi tambin el proyecto OpenAire, que dotaba deinfraestructura tecnolgica y apoyo tcnico para el cumplimiento del piloto7.

    Tambin en 2007, la Organizacin para la Cooperacin y el Desarrollo Econmicos (OCDE) public una gua

    para el acceso a los datos de informacin cientfica procedentes de financiacin pblica, que tena por

    objetivo proveer de recomendaciones generales a los responsables de poltica cientfica y agencias de

    financiacin de los estados miembros para estimular el acceso a los datos de investigacin8.

    En 2010, la Comisin Europea encarg al Grupo de alto nivel en datos de investigacin un informe con su

    visin sobre el acceso, uso, re-uso y calidad de los datos de investigacin cientfica en 20309. Este informe

    4Communication on scientific information in the digital age: access, dissemination and preservation (Com 2007 56 Final);http://ec.europa.eu/research/science-society/document_library/pdf_06/communication-022007_en.pdf [Consulta 6/12/2012]

    5Council Conclusions on scientific information in the digital age: access, dissemintation and preservation, European Union, 2007;

    http://www.consilium.europa.eu/ueDocs/cms_Data/docs/pressData/en/intm/97236.pdf [Consulta 6/12/2012]6Commission Decision on the adoption and a modification of special clauses applicable to the model grant agreement of FP7

    C(2008) 4408 finalhttp://ec.europa.eu/research/press/2008/pdf/decision_grant_agreement.pdf[Consulta 6/12/2012]

    7OpenAire FP7 projecthttp://www.openaire.eu/ [Consulta 6/12/2012]

    8 OECD Principles and Guidelines for Access to Research Data from Public Funding, OECD, 2007;

    http://www.oecd.org/dataoecd/9/61/38500813.pdf [Consulta 6/12/2012]9High level expert group on scientific data: Riding the Wave: How Europe can gain from the rising tide of scientific data; EuropeanUnion, 2010; http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdf [Consulta 6/12/2012]

    http://ec.europa.eu/research/science-society/document_library/pdf_06/communication-022007_en.pdfhttp://www.consilium.europa.eu/ueDocs/cms_Data/docs/pressData/en/intm/97236.pdfhttp://ec.europa.eu/research/press/2008/pdf/decision_grant_agreement.pdfhttp://www.openaire.eu/http://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.openaire.eu/http://ec.europa.eu/research/press/2008/pdf/decision_grant_agreement.pdfhttp://www.consilium.europa.eu/ueDocs/cms_Data/docs/pressData/en/intm/97236.pdfhttp://ec.europa.eu/research/science-society/document_library/pdf_06/communication-022007_en.pdf
  • 7/22/2019 Informe Datos Cientificos en Esp

    7/59

    7/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    est sirviendo como hoja de ruta europea en la consecucin de una e-infraestructura que maximice los

    beneficios del acceso a la informacin cientfica.

    En respuesta a este informe, Knowledge Exchange, una asociacin con miembros de instituciones

    dedicadas a la creacin de e-infraestructuras para la investigacin y la enseanza superior de cuatro pases

    europeos, ha elaborado una propuesta para la creacin de un plan de accin de Gran Bretaa, Dinamarca,

    Holanda y Alemania sobre datos de investigacin10.

    La Comisin Europea prepara para finales del ao 2012 unas nuevas recomendaciones sobre acceso abierto

    y preservacin de la informacin cientfica, que previsiblemente ahondarn en el estmulo del contenido

    cientfico en abierto (de publicaciones y datos), las infraestructuras abiertas e interoperables y la open

    culture (para investigadores y pblico en general).

    A nivel nacional, la recin aprobada Ley de la ciencia, la tecnologa y la innovacin11se suma al estmulo

    de creacin de infraestructuras de apoyo a la informacin cientfica, con un artculo especialmente dedicado

    al depsito en repositorios institucionales o temticos de artculos cientficos financiados con Presupuestos

    Generales del Estado.

    El presente informe surge del mbito del proyecto Recolecta y pone de manifiesto algunas consideraciones

    importantes que han de tenerse en cuenta en el diseo e implementacin de una poltica de gestin de datosde investigacin, con especial nfasis en la situacin de Espaa con respecto a otros pases. A lo largo de

    este informe, se define la variedad de tipos de datos de investigacin, los actores implicados en su gestin

    (los repositorios institucionales y temticos, las agencias de financiacin, los centros de datos existentes,

    investigadores, bibliotecarios y expertos en la gestin de datos, etc.). Asimismo, se reflexiona sobre los

    aspectos econmicos derivados de la creacin de una infraestructura interoperable de gestin de datos. Por

    ltimo, el informe pretende contribuir a futuras iniciativas que van a ser necesarias adoptar para la gestin

    de los datos resultado de la investigacin, en el mbito de la nueva Ley de la Ciencia, Tecnologa e

    Innovacin.

    10A surfboard for riding the wave: Towards a four country action programme on research data; Knowledge Exchange, 2011;

    http://www.knowledge-exchange.info/Default.aspx?ID=469 [Consulta 6/12/2012]11Ley 14/2011 de la Ciencia, la Tecnologa y la Innovacinhttp://www.boe.es/boe/dias/2011/06/02/pdfs/BOE-A-2011-9617.pdf [Consulta 6/12/2012]

    http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.boe.es/boe/dias/2011/06/02/pdfs/BOE-A-2011-9617.pdfhttp://www.boe.es/boe/dias/2011/06/02/pdfs/BOE-A-2011-9617.pdfhttp://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469
  • 7/22/2019 Informe Datos Cientificos en Esp

    8/59

    8/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    2.ACTORES IMPLICADOS EN LA GESTIN DE LOS DATOS CIENTFICOSLa e-ciencia ha cambiado las prcticas de la investigacin en todas las reas cientficas. El aumento de la

    capacidad computacional permite a los investigadores procesar y compartir grandes cantidades de

    informacin. Para facilitar la reutilizacin de los datos cientficos hay que adoptar los estndares utilizados

    por la comunidad de datos de investigacin, desarrollar y promocionar guas de buenas prcticas que

    ayuden a los investigadores a gestionar adecuadamente sus datos de investigacin, impulsar programas de

    formacin que doten a la comunidad cientfica de las competencias necesarias, proteger la propiedad

    intelectual de los productores de datos y establecer los mecanismos necesarios para asegurar la calidad.

    Para ello, es fundamental alcanzar un alto grado de coordinacin entre los agentes implicados en la gestin

    de los datos.

    En este apartado se describe el papel que desempean los actores que intervienen en la gestin de los datos

    cientficos y las responsabilidades asociadas12.

    Investigadores/productores de datos

    Proporcionan la evidencia y validacin cientfica de las investigaciones. Si bien esta categora se compone

    fundamentalmente de investigadores, en algunos casos hay conjuntos de datos que ya existen y los

    cientficos los utilizan para validar sus tesis. La comunidad investigadora puede ser considerada como

    productores, autores, y usuarios de los datos de investigacin.

    Universidades y Centros de Investigacin

    Su principal responsabilidad es establecer la poltica interna de gestin de los datos cientficos. Establecen

    los estndares para los distintos tipos de datos y la gua de buenas prcticas. Las instituciones deben asumir

    la responsabilidad de promocin para que los resultados de la investigacin de sus investigadores se

    depositen en los repositorios institucionales para su custodia y preservacin a corto plazo, proporcionando

    la formacin adecuada.

    Dentro de las Universidades y centros de Investigacin, cabe destacar aquellos servicios ms relevantes en

    la gestin de datos como los servicios de Informtica, Bibliotecas y Servicios de Investigacin. Cada uno de

    ellos tiene papeles complementarios (el de Informtica en almacenamiento; el de Biblioteca en metadatos,

    apoyo a la publicacin y derechos; y los Servicios de Investigacin en polticas institucionales, planes de

    gestin y temas de tica) y es necesario que se coordinen para poder dar un servicio institucional completo.

    Repositorios institucionales

    Desempean un papel bsico en el almacenamiento de los datos a corto plazo, frente al papel que tienen los

    centros de datos de preservacin a largo plazo. Es bsico el uso de estndares que facilite la

    interoperabilidad entre los repositorios y los centros de datos. Es muy importante la fiabilidad y robustez

    de los enlaces y el establecimiento de mecanismos para la migracin de datos entre los repositorios, as

    12Lyon, Liz (2007) Dealing with Data: Roles, Rights, Responsabilities and Relationships. Consultancy Report. UKOLNhttp://www.ukoln.ac.uk/ukoln/staff/e.j.lyon/reports/dealing_with_data_report-final.doc [Consulta 6/12/2012]

    http://www.ukoln.ac.uk/ukoln/staff/e.j.lyon/reports/dealing_with_data_report-final.dochttp://www.ukoln.ac.uk/ukoln/staff/e.j.lyon/reports/dealing_with_data_report-final.doc
  • 7/22/2019 Informe Datos Cientificos en Esp

    9/59

    9/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    como el mantenimiento de las versiones de los datos si se encuentran en distintos espacios de

    almacenamiento. La sostenibilidad del archivo de los datos de investigacin constituye uno de los desafos y

    problemas clave.

    Centros de datos

    Establecen guas de buenas prcticas y la seleccin de los datos que deben preservarse a largo plazo,

    facilitando su difusin. Protegen los derechos de propiedad de los productores de los datos y proporcionan

    herramientas para su reutilizacin. Desarrollan planes de recuperacin de datos en caso de desastres.

    Gestores de datos

    El perfil profesional del gestor de datos requiere competencias informticas, conocimiento de la disciplina,

    de las prcticas de investigacin y flujos de trabajo, comprensin de las normas tcnicas especficas,

    esquemas de metadatos y vocabularios de uso habitual.

    Tambin deben conocer cules son los centros de datos nacionales e internacionales de la investigacin en

    la disciplina y disponer de un buen conocimiento de los requisitos de publicacin de datos de las revistas

    acadmicas ms importantes13. La responsabilidad de los gestores de datos es gestionar y promocionar el

    uso de datos desde su creacin para asegurar su uso y su disponibilidad para ser localizados y

    reutilizados14.

    Usuarios que reutilizan los datos

    Deben cumplir las condiciones de la licencia y los permisos de utilizacin, reconociendo los derechos de

    propiedad intelectual de los investigadores productores de los datos.

    Agencias de financiacin

    Las agencias de financiacin implementan las polticas de datos con los actores implicados, determinan las

    fechas de preservacin, resuelven problemas de confidencialidad, proteccin de datos y uso de licencias.

    Desde comienzos de 2000, las agencias de financiacin de algunos pases ( National Institutes of Health,

    Welcome Trust, etc.) han comenzado a pedir la liberacin de datos en diversos grados y con diferentes

    niveles de cumplimiento, con el fin de maximizar el retorno de la financiacin a la investigacin. Desde

    2010, la National Science Foundationexige que las propuestas de financiacin vayan acompaadas de un

    Plan de Gestin de Datos15.

    Publicaciones cientficas

    Del mismo modo que las agencias de financiacin, los editores de publicaciones cientficas estn enlazando

    los artculos de las revistas con los datos de investigacin utilizados, con el fin de compartir esos datos con

    lectores e investigadores.

    13Lyon, Liz (2012) The Informatics Transform: Re-Engineering Libraries for the Data Decade. The International Journal of Digital

    Curation. Volume 7, Issue 1, 2012http://www.ijdc.net/index.php/ijdc/article/view/210/279 [Consulta 6/12/2012]14

    Martnez-Uribe, Luis, Macdonald, Stuart (2008). Un nuevo cometido para los bibliotecarios acadmicos: data curation. Elprofesional de la informacin, v.17, n. 3, mayo-junio 200815

    Borgman, C.L. (2011). The conundrum of sharing research data. Journal of the American Society for Information Science and

    Technologyhttp://papers.ssrn.com/sol3/papers.cfm?abstract_id=186915 [Consulta 6/12/2012]

    http://www.ijdc.net/index.php/ijdc/article/view/210/279http://papers.ssrn.com/sol3/papers.cfm?abstract_id=186915http://papers.ssrn.com/sol3/papers.cfm?abstract_id=186915http://www.ijdc.net/index.php/ijdc/article/view/210/279
  • 7/22/2019 Informe Datos Cientificos en Esp

    10/59

    10/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    3.QU SON LOS DATOS DE LA INVESTIGACIN?3.1 Definicin

    Definir los datos de la investigacin no es tarea sencilla, los datos producidos por los investigadores forman

    un grupo de materiales extremadamente heterogneo y complejo, creado para distintos propsitos y

    mediante procesos tambin diferentes. Los datos son el alma de la investigacin, rara vez son objetos

    sencillos que pueden ser fcilmente compartidos, sino que encarnan las perspectivas epistemolgicas de sus

    creadores16.

    La Universidad Australiana de Melbourne aporta la siguiente definicin en su poltica institucional de datos:

    Los datos de la investigacin son hechos, observaciones o experiencias en que se basa el argumento, la teora o

    la prueba. Los datos pueden ser numricos, descriptivos o visuales. Los datos pueden ser en estado bruto o

    analizado, pueden ser experimentales u observacionales. Los datos incluyen: cuadernos de laboratorio,

    cuadernos de campo, datos de investigacin primaria (incluidos los datos en papel o en soporte informtico),

    cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografas, pelculas, y las comprobaciones y las

    respuestas de la prueba. Las colecciones datos para la investigacin pueden incluir diapositivas; diseos y

    muestras. En la informacin sobre la procedencia de los datos tambin se podra incluir: el cmo, cundo,

    donde se recogi y con que (por ejemplo, instrumentos). El cdigo de software utilizado para generar,

    comentar o analizar los datos tambin pueden ser considerados datos.

    3.2 Tipos de datos

    La National Science Foundation (2007) propone la siguiente categorizacin de datos de investigacin

    basada en su origen que ayuda a comprender mejor la variedad de tipos y sus distintas necesidades a la

    hora de gestionarse:

    Datos observacionales.Son registros histricos, se pueden obtener nicamente en un lugar y en un

    momento en el tiempo. Esta caracterstica los hace especialmente importantes a la hora de

    preservarlos ya que en caso de que se perdiesen no podran volver a reproducirse. Ejemplos: los

    barmetros del Centro de Investigaciones Sociolgicas (CIS), son encuestas de opinin sobre diversos

    temas que preocupan a los espaoles. El Banco Nacional de Datos Climatolgicos sera otro caso de

    este tipo ya que posee informacin sobre precipitaciones registradas en Espaa desde hace 150 aos.

    Datos experimentales. Son los datos que acompaan a los experimentos desde su planificacin y

    preparacin hasta la obtencin de resultados. Los experimentos en muchos casos pueden repetirse

    16Borgman, CL (2012) On Local or Global? Making Sense of the Data Sharing Imperative. Talk at University of Southern Carolinaon 9th April 2012

  • 7/22/2019 Informe Datos Cientificos en Esp

    11/59

    11/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    para obtener los mismos datos sin embargo en ocasiones el coste de repetir el experimento hace que

    no sea rentable repetirlo. Ejemplos: el acelerador de partculas del CERN en Ginebra produce una

    cantidad desorbitada de datos experimentales capaz de llenar 100,000 DVDs al ao. En los laboratorios

    de investigacin ya sean qumicos, biolgicos o en otras disciplinas tambin se producen gran cantidad

    de datos con instrumentos especializados.

    Datos computacionales.Estos son los datos que acompaan a las simulaciones que suelen incluir

    datos de entrada, ciertos programas y resultados. Para este tipo de datos en la mayora de los casos no

    se necesitan los resultados ya que con los datos de entrada, los programas y el ordenador que los

    genera debiera de ser posible reproducirlos. Ejemplos: pueden ser datos producidos en centros de

    computacin avanzada que simulan el funcionamiento de rganos del cuerpo humano, el movimiento

    de los astros o predicen el tiempo.

    De esta manera cada disciplina cientfica basar su investigacin en estas tipologas y en aquellas en las que

    se puedan subdividir. Ya sean cualitativos, cuantitativos, geogrficos, espaciales, u otros, pertenecern a uno

    o a varios de los ejes mencionados.

    3.3 La gestin de los datos

    La correcta gestin de los datos de investigacin es una parte fundamental de proceso de investigacin. Esta

    gestin consiste en la toma de decisiones y acciones desde antes de la creacin de los datos, durante sucreacin y uso y a lo largo de su ciclo de vida. Algunas de las etapas que debe de incluir una correcta gestin

    de datos son:

    Un plan de gestin de datos como parte de la propuesta de financiacin que anticipe los retos de la

    gestin y proponga soluciones a los mismos.

    Tratar las cuestiones ticas y legales oportunas referentes a datos personales sensibles, copyright y

    licencias de acceso y uso de los datos.

    La organizacin y documentacin de los datos de acuerdo a estndares disciplinares e

    internacionales que permitan conocer qu son los datos y como se crearon los datos para poder ser

    reutilizados.

    Mecanismos apropiados de almacenamiento, back-up y seguridad de la informacin que aseguren

    la confidencialidad, integridad y disponibilidad de la informacin.

    Compartir los datos de manera que se citen de forma estndar y as dar crdito a los creadores de

    los mismos.

    Archivo de una copia final de los datos en centros de datos especializados que tomen las medidas

    necesarias para la preservacin y difusin de los datos.

  • 7/22/2019 Informe Datos Cientificos en Esp

    12/59

    12/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Para que sea posible gestionar los datos de este modo es necesario que existan polticas, a nivel de agencias

    de financiacin e institucional, que definan y aclaren los papeles y responsabilidades de los distintos

    actores. La responsabilidad de esta gestin a lo largo del ciclo de vida debe recaer en una variedad de

    instituciones tales como las agencias de financiacin, las Universidades, las Bibliotecas, los Centros

    Informticos y los propios investigadores. Pero ante todo han de ser los investigadores y sus necesidades el

    punto de partida.

    La Ligue des Bibliothques Europennes de Recherche - Association of European Research Libraries

    (LIBER) cre en 2010 un grupo de trabajo sobre e-Ciencia (Working Group on e-Science), el resultado ha

    sido un informe final17que incluye diez recomendaciones para las bibliotecas que se inicien en la gestin de

    datos de investigacin, en las conclusiones se destaca que las bibliotecas pueden y deben desempear

    tareas en el apoyo a los investigadores en la gestin y planificacin de los datos.

    17Christensen-Dalsgaard, Birte et al (2012) Ten recommendations for libraries to get started with research data management:

    Final report of the LIBER working group on E-Science / Research Data Management.http://www.libereurope.eu/sites/default/files/WGSC_20120801.pdf [Consulta 9/12/2012]

    http://www.libereurope.eu/sites/default/files/WGSC_20120801.pdfhttp://www.libereurope.eu/sites/default/files/WGSC_20120801.pdf
  • 7/22/2019 Informe Datos Cientificos en Esp

    13/59

    13/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    4.INFRAESTRUCTURA Y SOSTENIBILIDADLos datos han de ser gestionados por una infraestructura fiable y estable que asegure la confiabilidad y su

    integridad. El white paper Strategy for a European Data Infrastructure18recoge los principales requisitos

    de infraestructura de diversas iniciativas de datos de algunas disciplinas y comunidades de investigacin a

    nivel europeo. En resumen son:

    Preservacin de datos a largo plazo incluyendo mecanismos de autenticidad y de control de calidad

    de los datos.

    Acceso a los datos (ciclo de vida de los datos), servicios de data curation y capacidad de

    computacin en la infraestructura (data mining, data processing...).

    Distribucin de los datos y federaciones, no solo por motivos de preservacin sino tambin para laoptimizacin y aumento del rendimiento del acceso.

    A estos requisitos se les suma que los datos deben estar duplicados para conseguir la alta disponibilidad,

    requisito comn de este tipo de sistemas.

    Tres aspectos se han de tener en cuenta para dar solucin a estos requisitos:

    Sistemas software capaces de gestionar el ciclo de vida de los datos.

    Sistemas de almacenamiento masivo de datos. Existen diversas tecnologas para este propsito,

    como la arquitectura NAS (Network Attached Storage) de crecimiento horizontal, que permite

    escalar rpidamente mediante nodos de tipo comodity en funcin de la demanda. En relacin al

    ciclo de vida de los datos, pueden existir muchos factores dependientes de su naturaleza o

    disciplina, sin embargo, a nivel de flujos de bits que se almacenan en un soporte fsico, pueden ser

    tratados de manera homognea.

    Redes de alta capacidad para la transmisin de datos entre diferentes nodos. En Espaa la red

    acadmica y de investigacin espaola (RedIRIS) proporciona estos servicios avanzados de

    comunicaciones a la comunidad cientfica y universitaria nacional.

    Estas infraestructuras han de ser tenidas en cuenta de cara a analizar la viabilidad de las iniciativas para la

    gestin de datos, pues sus costes, tanto de adquisicin como de mantenimiento, son elevados. Se estima que

    los costes de mantenimiento de repositorios de datos cientficos son de un orden de magnitud mayor que

    los tradicionales repositorios de publicaciones19.

    18Strategy for a European Data Infrastructure

    http://www.csc.fi/english/pages/parade [Consulta 6/12/2012]19 Beagrie N, Chruszcz J and Lavoie B (2008). Keeping Research Data Safe 1. JISChttp://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf [Consulta 12/12/12]

    http://www.csc.fi/english/pages/paradehttp://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdfhttp://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdfhttp://www.csc.fi/english/pages/parade
  • 7/22/2019 Informe Datos Cientificos en Esp

    14/59

    14/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Existen dos principios bsicos para rentabilizar mejor estos costes:

    Procesos de seleccin de los datos. No todos los datos han/pueden ser enriquecidos (data

    curation) o preservados. Una buena seleccin integrada dentro del ciclo de vida de los datos y

    realizada desde el punto de vista del conocimiento especfico de los datos y pensando no slo en su

    uso principal, sino tambin en cmo podrn estos datos ser re-usados a posteriori es esencial.

    Uso de las economas de escala con respecto a las infraestructuras. Se trata de conseguir una capa

    de datos que agrupe infraestructuras de manera transversal, tal y como se realiza por Geant,

    RedIRIS o la Anella Cientfica en la capa de conectividad, o como los proyectos Driver hacen

    interoperables distintos repositorios de investigacin. No slo se conseguira la comparticin de

    costes, sino que adems se aumentaran las sinergias entre distintos grupos de investigacin o

    incluso entre diferentes disciplinas.

    En apartados anteriores se menciona que los datos pueden ser muy heterogneos, y dependiendo de ellos

    los costes asociados a la infraestructura pueden variar sustancialmente. En un extremo de altos costes en

    infraestructura se situaran proyectos con masivos datasets como los de los datos producidos por el Large

    Hadron Collider o el European Bioinformatics Institute, mientras que en el otro extremo, por ejemplo, se

    situara el Worldwide Protein Data Bank Archive, repositorio con ms de 80.000 estructuras en 3D de

    molculas, pero que apenas ocupan 150GB de almacenamiento. En este ltimo caso, los costes de

    infraestructura no son significativos comparados con las 69 FTE de personal que trabaja en el proyecto20

    .

    An slo gestionando aquellos datos que sean tiles o imprescindibles, hacindolo en infraestructuras

    que aprovechen las economas de escala y sea cual sea el tamao de la infraestructura necesaria, para la

    gestin de datos cientficos son necesarias polticas de financiacin de las infraestructuras a largo plazo,

    pues los datos son acumulativos y se preservan tpicamente ms all de los ciclos tecnolgicos.

    Como se ha mencionado antes, en las propuestas de financiacin de proyectos, se debera detallar un plan

    de gestin de datos, incluyendo su viabilidad econmica.

    20The Royal Society (2012). Science as an open enterprise http://royalsociety.org/policy/projects/science-public-enterprise/report[Consulta 12/12/12]

    http://royalsociety.org/policy/projects/science-public-enterprise/reporthttp://royalsociety.org/policy/projects/science-public-enterprise/report
  • 7/22/2019 Informe Datos Cientificos en Esp

    15/59

    15/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    5.BUENAS PRCTICAS PARA LA GESTIN DE DATOS DE INVESTIGACINLos datos de investigacin constituyen uno de los principales activos en el proceso de investigacin

    cientfica. Una ptima gestin de dichos datos favorece la innovacin y el desarrollo de la misma, puesto que

    permitira la explotacin de datos de alta calidad (compartir reutilizar).

    En el marco global de la E-Ciencia, el objeto especfico del control, organizacin, descripcin y preservacin

    de datos cientficos es el dataset, que se define como una coleccin de datos reunidos durante la ejecucin

    de un proyecto de investigacin. Los datasets son objetos digitales compuestos y heterogneos. Es decir,

    pueden comprender diferentes elementos o tipos de datos: documentos de texto, hojas de clculo, ficheros

    de operaciones matemticas, grficos, imgenes, etc. El dataset constituye la base de una investigacin y va

    asociado a una publicacin cientfica como resultado de dicha investigacin. El dataset adquiere valoraadido si se integra con la publicacin relacionada (linking data: cita y enlace), independientemente de su

    ubicacin.

    Los datasets se almacenan y gestionan en repositorios interoperables en red integrados en una

    infraestructura global de investigacin, desarrollados conforme a estndares internacionales.

    Instituciones de educacin superior y agencias de financiacin de la investigacin de varios pases estn

    llevando a cabo iniciativas para crear infraestructuras de gestin de datos que posibiliten la reutilizacin de

    los datasets, mediante la adopcin de polticas que promueven el acceso abierto y la comparticin de los

    datos, y garantizando la sostenibilidad y accesibilidad de los datos a largo plazo.

    El movimiento Open Data, en el marco del Open Access, define los datos abiertos como aqullos que se

    pueden usar, reutilizar y redistribuir sin otra restriccin que el requisito de atribucin o compartir igual21.

    5.1 Desarrollo de un plan de gestin de datos

    La responsabilidad de la gestin de los datos corresponde en primer lugar a los investigadores, pero las

    instituciones deben proporcionar el soporte tcnico y organizativo a su comunidad. Organizativamente, enun servicio de gestin de datos de investigacin, es imprescindible la colaboracin entre los investigadores

    y productores de los datos y los bibliotecarios de datos dentro de una institucin.

    Los investigadores son los expertos que deben proporcionar la informacin contextual necesaria para

    determinar el origen y el ciclo de vida de los datos. Los bibliotecarios son expertos en la gestin de

    informacin y han de proporcionar apoyo especializado y personalizado a los investigadores, as como

    21http://opendefinition.org/okd/ [Consulta 6/12/2012]

    http://opendefinition.org/okd/http://opendefinition.org/okd/
  • 7/22/2019 Informe Datos Cientificos en Esp

    16/59

    16/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    utilizar los medios tcnicos necesarios para que los datos sean comprendidos e interpretados por otros

    investigadores.

    Dada la diversidad de datos cientficos, por su naturaleza heterognea y por la cultura especfica de cada

    comunidad cientfica, la institucin debe proporcionar a los investigadores un modelo de plan de gestin de

    los datos para ahorrar tiempo y esfuerzo en el proceso de la investigacin 22. La planificacin conlleva una

    serie de ventajas:

    Se pueden encontrar y comprender los datos cuando se necesite utilizarlos.

    Se garantiza la continuidad del proyecto independientemente de la participacin de los

    investigadores.

    Se evitan duplicaciones y tareas innecesarias.

    El mantenimiento del conjunto de datos generados permite la validacin de los resultados.

    Los datos se pueden compartir permitiendo un alto nivel de colaboracin y de avance en la

    investigacin.

    Si los datos se ofrecen en abierto tendrn una gran visibilidad.

    Otros investigadores que utilicen los datos pueden citarlos y la investigacin obtendr ms

    prestigio.

    La descripcin mnima de los datos debe tratar los siguientes aspectos:

    Contexto, descripcin del proyecto y propsito de la investigacin, metodologa utilizada;

    Naturaleza de los datos, historia de los datos, contenido y estructura, terminologa, software, fecha

    de creacin y fechas de modificacin, versiones, responsables y participantes;

    Formatos de ficheros, estructura y nomenclatura de los ficheros, sistema de almacenamiento,

    procedimiento para copias de seguridad;

    Aspectos legales, polticas de acceso y seguridad;

    El paradigma tecnolgico de un sistema de gestin de datos cientficos incluye los siguientes

    requerimientos:

    El modelo lgico de datos (relacional) y su sistema de gestin (base de datos) han de permitir su

    descripcin, su representacin y su recuperacin;

    El sistema de gestin deber permitir una ptima organizacin de los datos, documentarlos,

    preservarlos y hacerlos accesibles;

    22Existen herramientas para la elaboracin de planes de este tipo, como por ejemplo DMPTool (https://dmp.cdlib.org/ [Consulta

    6/12/2012])

    https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/
  • 7/22/2019 Informe Datos Cientificos en Esp

    17/59

    17/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Un software que sea capaz de analizar gran cantidad de datos, procesarlos, tratarlos y obtener

    diferentes productos secundarios (Data Mining).

    5.2 Formatos

    El formato en el que se archivan los datos es un factor primordial para asegurar su preservacin y su

    accesibilidad. La evolucin de las tecnologas son la causa de que tanto el hardware como el software se

    vuelvan obsoletos. Los investigadores utilizaran el formato y software adecuado a sus necesidades, pero

    para garantizar el acceso y la preservacin a largo plazo, habra que tener en cuenta las siguientes

    consideraciones:

    Deben utilizarse, en la medida de lo posible, formatos abiertos, no propietarios.

    El formato utilizado ha de permitir la indizacin del contenido para su potencial recuperacin.Un formato de compresin de datos utiliza menos espacio de almacenamiento.

    El formato elegido deber ser estndar (IANA mime types), o estndar de facto para la comunidad

    investigadora.

    Los ficheros y las carpetas deben estar bien organizados con una estructura ordenada. El sistema de

    nomenclatura es importante para identificar los contenidos.

    Es necesario llevar un control de versiones de los ficheros para que puedan localizarse las sucesivas

    versiones y pueda conocerse los cambios de una con respecto a otra.

    5.3 Metadatos

    Los metadatos son un conjunto de informacin estructurada que ha de recoger el origen, propsito,

    referencia temporal, localizacin geogrfica, creador, condiciones de acceso y trminos de uso de un

    dataset. Los metadatos cumplen diferentes funciones relacionadas entre s: la gestin y administracin, la

    preservacin, la descripcin, la diseminacin de los datos y la recuperacin de los datos. La documentacin

    y descripcin de los datos facilita su localizacin, su comprensin y su utilizacin.

    La documentacin del dataset facilitada por el investigador se incluir en el registro de metadatos. Los

    metadatos deben incluir al menos la siguiente informacin:

    Ttulo: Nombre del proyecto del conjunto de datos o de investigacin que lo produjo

    Nombres de los creadoresy las direccionesde la organizacin o personas que han creado los datos.

    Cdigo de identificacin de los datos, incluso si es una referencia de uso interno.

    Palabras o frases que describen el tema o el contenido de los datos.

    Patrocinadores: Las organizaciones o agencias que financiaron la investigacin.

    Derechos: Cualquier tipo de derechos de propiedad intelectual de los datos.

    Acceso a la informacin: Dnde y cmo sus datos pueden ser accesibles por otros investigadores?

  • 7/22/2019 Informe Datos Cientificos en Esp

    18/59

    18/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Idioma del contenido.

    Fechas clave asociadas a los datos , incluyendo: inicio del proyecto y la fecha de finalizacin, fecha de

    lanzamiento, perodo de tiempo cubierto por los datos, y otras fechas relacionadas con la vida til

    de datos, por ejemplo, el ciclo de mantenimiento, actualizacin del programa.

    Lugar al que hacen referencia los datos(p.e, una ubicacin fsica, cobertura espacial etc).

    Metodologa: Cmo se generaron los datos, incluidos los equipos o el software utilizado, el

    protocolo experimental, etc?

    Procesamiento de datos: toda la informacin acerca de cmo los datos se han alterado o procesado.

    Fuentes: Citas a los materiales para los datos procedentes de otras fuentes, incluidos los detalles de

    los datos de origen.

    Lista de nombres de archivo de la lista de todos los archivos de datos asociados con el proyecto, con

    sus nombres y extensiones de archivo (por ejemplo, 'stone.mov').

    Formatos de archivo de los datos , por ejemplo, FITS, SPSS, HTML, JPEG, RIF-CS y el software

    necesario para leer los datos.

    Organizacin de archivos: estructura del archivo de datos (s) y la disposicin de las variables,

    cuando sea aplicable.

    Lista de variablesen los archivos de datos.

    Explicacin de los cdigos o abreviaturas utilizadas en cualquiera de los nombres de los archivos o

    las variables en los archivos de datos.

    Versionesde fecha / fecha y hora para cada archivo, y usar un ID diferente para cada versin (ver laorganizacin de sus archivos).

    Operaciones de comprobacin para verificar si los archivos han cambiado a lo largo del tiempo.

    (Algoritmo Checksum para proteger la integridad de los datos).

    Los metadatos se estructuran en registros conforme a esquemas normalizados. Los criterios de adopcin de

    un esquema u otro dependern de los objetivos que se plantee la organizacin para la gestin de los datos.

    Para lograr la interoperabilidad con otros sistemas de gestin de datos es prioritaria la normalizacin. Con

    objeto de cumplir todas las funciones antes mencionadas, se suelen combinar diferentes esquemas demetadatos mediante la declaracin del espacio de nombres correspondiente a cada esquema.

    Existen varios estndares de metadatos, aunque aqu citaremos aqullos cuyo uso est ms extendido:

    Dublin Core Metadata Terms23. Es un esquema muy simple de carcter universal, que puede ser

    aplicado a recursos de todo tipo y procedencia.

    23http://dublincore.org/documents/dcmi-terms/ [Consulta 6/12/2012]

    http://dublincore.org/documents/dcmi-terms/http://dublincore.org/documents/dcmi-terms/
  • 7/22/2019 Informe Datos Cientificos en Esp

    19/59

    19/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Data Documentation Initiative (DDI)24. Es un esquema diseado especficamente para la

    descripcin de conjuntos de datos de ndole social y econmico. Permite documentar el ciclo de

    vida completo de los datos.

    General International Standard Archival Description(ISAD(G))25. Es un conjunto de elementos

    para describir archivos con varios niveles de agregacin. Los procesos descriptivos pueden ser

    simultneos a la produccin de los documentos y continuar a lo largo de todo su ciclo vital.

    Metadata Encoding and Transmission Standard (METS)26. Se trata de una norma para la

    codificacin y agrupacin de metadatos administrativos, tcnicos, de preservacin y descriptivos,

    que permite la representacin de objetos digitales complejos con gran exhaustividad. Tambin

    permite expresar las relaciones entre las partes de un objeto digital, as como las relaciones entre

    distintos objetos.

    ISO 19115 for geographic information27. Esquema utilizado para la descripcin de informacin y

    servicios geogrficos. Es aplicable a los datasets geogrficos.

    Los registros de metadatos se agrupan en sistemas de bsqueda y recuperacin de informacin, y podrn

    ser recolectados a travs del protocolo OAI-PMH.

    5.4 Identificador digital de datos

    El dataset almacenado debe asociarse a un identificador digital nico y persistente que facilite la

    verificacin de los datos, la reutilizacin, la diseminacin y el impacto, y el acceso a largo plazo. Losidentificadores conforme a los preceptos de la web semntica deben tener forma de URI. La URI es una

    cadena de caracteres que condensa la direccin URL (Uniform Resource Location) y el nombre URN

    (Uniform Resource Name) del recurso28.

    Hay muchos sistemas diferentes, como por ejemplo:

    PURL Uniform Resource Locator. Funcionalmente, un PURL es una URL. Sin embargo, en lugar de

    apuntar directamente a la ubicacin de un recurso de Internet, algunos puntos PURL apuntan a unservicio de resolucin intermedia. El servicio de resolucin de PURL asocia el PURL con la direccin

    URL real y devuelve la URL para el cliente.

    DOI Digital Object Identifier. Es un nombre para una entidad en las redes digitales. Proporciona un

    sistema de identificacin permanente y viable y el intercambio interoperable de la informacin

    manejada en las redes digitales.

    24http://www.ddialliance.org/what [Consulta 6/12/2012]

    25http://www.icacds.org.uk/eng/ISAD(G)es.pdf [Consulta 6/12/2012]

    26http://www.loc.gov/standards/mets [Consulta 6/12/2012]

    27 http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020[Consulta 6/12/2012]28

    http://www.w3.org/TR/uri-clarification/ [Consulta 6/12/2012]

    http://www.ddialliance.org/whathttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.loc.gov/standards/metshttp://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.w3.org/TR/uri-clarification/http://www.w3.org/TR/uri-clarification/http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.ddialliance.org/what
  • 7/22/2019 Informe Datos Cientificos en Esp

    20/59

    20/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    ACCESSION29Nmeros usados por el National Center for Biotechnology Information (NCBI) son

    nicos y citables.

    InChI30La IUPAC International Chemical Identifier (InChITM) es un identificador no propietario de

    las sustancias qumicas que pueden ser utilizados en las fuentes de datos impresos y electrnicos,

    permitiendo as una vinculacin ms fcil de las compilaciones de datos diversos.

    5.5 Marco legal relacionado con la gestin y divulgacin de datos de investigacin

    La produccin, gestin y diseminacin de datos debe ajustarse a un marco legal en el que existen derechos y

    acuerdos que deben ser respetados. Las cuestiones clave al respecto seran:

    Qu derechos legales existen sobre los datos y datasets?

    A quin pertenecen estos derechos?Qu restricciones legales se han de aplicar para la diseminacin de los datos y datasets?

    Qu contratos, permisos y licencias hay que utilizar para cumplir con la legalidad vigente?

    Hay que tener en consideracin los siguientes derechos:

    Los derechos de propiedad intelectual

    La confidencialidad, privacidad y proteccin de datos

    Acceso y datos: Teniendo en cuenta las restricciones legales, es necesario identificar qu datos sernaccesibles, identificar quin puede acceder a los datos y con qu propsito. Segn la naturaleza de los datos

    debemos atender a las siguientes categoras:

    Datos pblicos: pueden ponerse sin restricciones a disposicin de cualquier usuario en acceso

    abierto.

    Datos restringidos: slo pueden ser consultados por determinados usuarios.

    Datos privados: no se pueden hacer pblicos. Son confidenciales.

    Privacidad y confidencialidad: Cualquier investigacin que contenga datos de carcter personal tiene quecumplir los preceptos de la legislacin de proteccin de datos. En Espaa la norma que regula estos

    aspectos es la Ley Orgnica 15/1999, de 13 de diciembre, de Proteccin de Datos de Carcter Personal, cuyo

    objeto es garantizar y proteger en lo que concierne al tratamiento de los datos personales, las libertades

    pblicas y los derechos fundamentales de las personas fsicas, y especialmente de su honor e intimidad

    personal y familiar. La ley es de aplicacin a los datos de carcter personal registrados en cualquier soporte

    fsico. El tratamiento de los datos cubre las actividades de recoleccin, registro, almacenamiento,

    29http://www.ncbi.nlm.nih.gov/ [Consulta 6/12/2012]30

    http://www.iupac.org/home/publications/e-resources/inchi.html [Consulta 6/12/2012]

    http://www.iupac.org/inchihttp://www.iupac.org/inchihttp://www.ncbi.nlm.nih.gov/http://www.iupac.org/home/publications/e-resources/inchi.htmlhttp://www.iupac.org/home/publications/e-resources/inchi.htmlhttp://www.ncbi.nlm.nih.gov/http://www.iupac.org/inchi
  • 7/22/2019 Informe Datos Cientificos en Esp

    21/59

    21/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    recuperacin, consulta, uso y diseminacin. Para garantizar el derecho a la proteccin de datos, es necesario

    informar a las personas implicadas y solicitar su consentimiento para el tratamiento de sus datos.

    Propiedad intelectual y datos: En Espaa la norma principal que regula los derechos de propiedad

    intelectual es la Ley de Propiedad Intelectual (Real Decreto Legislativo 1/1996 de 12 de abril por el que se

    aprueba el Texto Refundido de la LPI) que ha sufrido varias modificaciones, entre ellas la operada por la Ley

    23/2006 de 7 de julio con el objeto de adaptar la normativa espaola a las nuevas circunstancias creadas

    por la sociedad de la informacin.

    Las colecciones de datos y las bases de datos estn protegidas por propiedad intelectual, segn el art. 12 del

    mencionado TRLPI mediante el denominado derecho sui generis, en cuanto que constituyen creaciones

    intelectuales. La proteccin se refiere nicamente a su estructura en cuanto forma de expresin de la

    seleccin o disposicin de contenidos, no a los datos mismos. Los derechos de autor pertenecen a sus

    creadores, siempre que se trate de trabajos originales.

    Los derechos morales son derechos de carcter personal que pertenecen exclusivamente a los autores y son

    irrenunciables. En virtud de estos derechos corresponde a los autores fundamentalmente, el decidir si su

    obra ha de ser divulgada y en qu forma, y exigir el reconocimiento de la autora.

    Los derechos de explotacin o copyright son transferibles. El titular de estos derechos posee su ejercicioexclusivo y no pueden ser realizados sin su autorizacin, salvo en los lmites que establece la ley. Los

    derechos de explotacin constituyen una serie de actos como el de reproduccin, distribucin,

    comunicacin pblica y transformacin.

    Existen excepciones al ejercicio de los actos de explotacin, como en el caso de reproduccin para uso

    exclusivamente privado, usos en beneficio de personas con discapacidad, uso a ttulo de cita o ilustracin

    con fines educativos.

    Las obras en situacin de dominio pblico, cuando el plazo de proteccin de los derechos ha expirado,

    pueden ser utilizadas de forma libre y gratuita31.

    Depsito de los datos: El depsito de los datasets en un repositorio implica el ejercicio de los derechos de

    explotacin, por lo que se requiere el permiso explcito del titular de dichos derechos mediante un acuerdo

    de cesin no exclusiva de los derechos necesarios.

    31El TRLPI establece un plazo de duracin de los derechos de una obra en setenta aos desde su divulgacin, y en setenta aos

    desde su creacin si no han sido divulgadas.

  • 7/22/2019 Informe Datos Cientificos en Esp

    22/59

    22/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    Conforme al movimiento Open access, los datos resultantes de proyectos financiados con fondos pblicos

    constituyen un bien de inters pblico, por lo que deben estar disponibles en un repositorio en acceso

    abierto sin perjuicio de preceptos legales o ticos.

    Licencias alternativas al copyright: Como hemos mencionado anteriormente, el titular de los derechos de

    explotacin tiene la potestad de determinar quin puede acceder a los datos y bajo qu condiciones. Existen

    licencias estndares y libres que el autor puede aplicar a sus datos de investigacin para proporcionar los

    trminos en los que compartir y reutilizar dichos datos en el mbito de Internet. Un ejemplo de dichas

    licencias son las Creative Commons, que en conjunto constituyen seis licencias que permiten la copia,

    distribucin, descarga y transformacin de los documentos digitales:

    RECONOCIMIENTO (Attribution):

    En cualquier explotacin de la obra autorizada por la licencia har falta reconocer la autora.

    NO COMERCIAL (Non Commercial):

    La explotacin de la obra queda limitada a usos no comerciales.

    SIN OBRAS DERIVADAS (No Derivate Works):

    La autorizacin para explotar la obra no incluye la transformacin para crear una obra derivada.

    COMPARTIR IGUAL (Share alike):

    La explotacin autorizada incluye la creacin de obras derivadas siempre que mantengan la

    misma licencia al ser divulgadas.

    Mediante la combinacin de estos cuatro preceptos se obtienen seis tipos de licencias:

    Reconocimiento de autora (CC BY)

    Reconocimiento de autora compartir en idnticas condiciones (CC BY-SA)

    Reconocimiento de autora Sin obra derivada (CC BY-ND)

    Reconocimiento de autora Sin uso comercial (CC BY-NC)

    Reconocimiento de autora Sin uso comercial compartir en idnticas condiciones (CC BY-NC-SA)

    Reconocimiento de autora Sin uso comercial Sin obra derivada (CC BY-NC-ND)

    Las licencias de la versin CC 4.0 abordan las caractersticas especficas de los datos.

    Science Commons es una iniciativa dentro de Creative Commons que, entre otras cosas, pretender derribar

    barreras y desarrollar herramientas para facilitar la reutilizacin de datos resultados de proyectos de

  • 7/22/2019 Informe Datos Cientificos en Esp

    23/59

    23/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    investigacin. En esta lnea, Science Commons Open Access Data Protocol32 recoge una metodologa y unas

    buenas prcticas para la creacin de herramientas que permitan la integracin de bases de datos cientficos

    entre s y su puesta en el dominio pblico.

    Siguiendo el modelo de Creative Commons, la Open Knowledge Foundation ha creado unas licencias

    especficas para colecciones de datos: The Open Data Commons Licence33. Es importante distinguir entre la

    licencia de los datos incluidos en la base de datos y el rgimen de licencia de la base de datos en s. Entre las

    licencias de Open Data Commons destacan las Database Contents License, referida a los contenidos de la

    base de datos, y la ms radical de todas, la Public Domain Database License, en que los titulares de los

    derechos se despojan de ellos para beneficio de todos.

    5.6 PreservacinLos datos debern ser preservados y permanecer accesibles y utilizables para la investigacin futura. La

    gestin de los datos deber incluir un plan de preservacin conforme a estndares internacionales.

    Las cuestiones a plantearse son: Qu datos hay que guardar? Cmo guardarlos?

    Hacer copias de seguridad de forma regular que puedan ser utilizadas para restaurar los ficheros originales.

    Es necesario constatar la integridad de los ficheros mediante la comprobacin del cdigo MD5 checksum

    value, el tamao del fichero y la fecha.

    La estrategia de almacenamiento de datos debe contemplar la obsolescencia del hardware y del software.

    Conviene copiar los datos en diferentes tipos de soporte fsico, por ejemplo en uno digital y en un disco

    duro. Hay que tener en cuenta factores de conservacin de los soportes, como los cambios de temperatura,

    la humedad relativa, la luz, etc.

    32http://sciencecommons.org/projects/publishing/open-access-data-protocol/[Consulta 12/12/2012]

    33

    http://opendatacommons.org/licenses/ [Consulta 12/12/2012]

    http://sciencecommons.org/projects/publishing/open-access-data-protocol/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://sciencecommons.org/projects/publishing/open-access-data-protocol/
  • 7/22/2019 Informe Datos Cientificos en Esp

    24/59

    24/59

    LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS

    CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE

    TRABAJO DE BUENAS PRCTICAS.

    6.EJEMPLOS DE BUENAS PRCTICAS POR DISCIPLINAS Y ACTORES6.1 Guas para la gestin de los datos:

    Australian National Data Service: HTTP://ANDS.ORG.AU/RESEARCHERS/MANAGE-DATA.HTML [Consulta

    8/12/2012]

    Australian National University. Data Management: Information from courses and a manual on data

    management:HTTP://ILP.ANU.EDU.AU/DM/ [Consulta 8/12/2012]

    CIESIN: Geospatial Electronic Records- Resources on managing and preserving geospatial data and

    related electronic records:HTTP://WWW.CIESIN.COLUMBIA.EDU/GER [Consulta 8/12/2012]

    Data Management for Researchers: HTTP://ANDS.ORG.AU/RESEARCHERS/MANAGE-DATA.HTML [Consulta

    8/12/2012]

    Gestin de datos en Humanidades:HTTP://ERCIM-NEWS.ERCIM.EU/EN89/SPECIAL/DATA-MANAGEMENT-IN-

    THE-HUMANITIES [Consulta 8/12/2012]

    ICPSR Guide to Social Science Data Preparation and Archiving: Outlines best practices throughout

    the research process, including applying for a research grant, collecting data, and preparing data for

    deposit in a public archive. HTTP://WWW.ICPSR.UMICH.EDU/FILES/ICPSR/ACCESS/DATAPREP.PDF

    [Consulta 8/12/2012]

    Oak Ridge National Laboratory. Best Practices for Preparing Environmental Data Sets to Share and

    Archive. Describes the practices to make data sets ready to share with others:

    HTTP://DAAC.ORNL.GOV/PI/BESTPRACTICES-2010.PDF [Consulta 8/12/2012]UK Data Archive: Create & Manage Data: Provides best practice strategies and methods for creating,

    preparing and storing shareable datasets. HTTP://WWW.DATA-ARCHIVE.AC.UK/CREATE-MANAGE

    [Consulta 8/12/2012]

    UK Data Archive: Managing and Sharing Data: a Best Practice Guide for Researchers 3rd. ed.

    HTTP://WWW.DATA-ARCHIVE.AC.UK/MEDIA/2894/MANAGINGSHARING.PDF [Consulta 8/12/2012

    6.2 Datos por disciplinas:Anotacin y Descripcin de las bases de Datos Biomdicas (Harvard University):

    HTTP://ESCHOLARSHIP.UMASSMED.EDU/CGI/VIEWCONTENT.CGI?ARTICLE=1000&CONTEXT=JESLIB [Consulta

    8/12/2012]

    Arqueologa:HTTP://ARCHAEOLOGYDATASERVICE.AC.UK/ [Consulta 8/12/2012]

    Astronoma:HTTP://ADSWWW.HARVARD.EDU/ [Consulta 8/12/2012]

    Bioinformtica: HTTP://WWW.EBI.AC.UK/INFORMATION/DATABASES_SITEMAP.HTML [Consulta

    8/12/2012]

    Ciencias Marinas:HTTP://WWW.MARINE-GEO.ORG/CONTRIBUTE.PHP [Consulta 8/12/2012]Ciencias Qumicas:HTTP://WWW.CHEMSPIDER.COM/ [Consulta 8/12/2012]

    http://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/h