gbif provisión de datos a gbif taller "provisión de datos colombianos al gbif en el marco del...

14
GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia“ Pontifica Universidad Javeriana, Bogotá, Colombia. Mayo 27-29 de 2008 Silvia Lusa GBIF.ES, Unidad de Coordinación [email protected] www.gbif.es

Upload: sara-ruedas

Post on 14-Apr-2015

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Provisión de datos a GBIF

Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia“

Pontifica Universidad Javeriana, Bogotá, Colombia. Mayo 27-29 de 2008

Silvia Lusa GBIF.ES, Unidad de Coordinación

[email protected]

Page 2: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

1. Glosario técnico para esta charla2. Protocolos y estándares en GBIF.

• De dónde vienen• Dónde se integran (arquitectura)• Cuáles son

3. Integración tecnológica en los nodos.4. Implementación en GBIF-España

Provisión de datos a GBIF

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 3: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Glosario técnico para esta charla

• Metadatos– Conjunto de datos que definen cada uno de los recursos publicados en la red de

GBIF– Normalmente un recurso corresponde a una colección

• Estándar de datos– Perfil común de datos– Utilizado para intercambio – Darwin Core, ABCD, NCD, TCS

• Protocolo– Conjunto de reglas que van a permitir la comunicación y el transporte de datos

en la red– Utilizan estándares de datos (son capaces de reconocerlos y manejarlos)– Implementados en software – DiGIR (DiGIR provider, DiGIR portal), Biocase (Pywraper), TAPIR (TapirLink,

etc)

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 4: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Protocolos y estándares en GBIFDe dónde vienen

• GBIF adopta Estándares y Protocolos desarrollados por el Biodiversity Information Standards-TDWG

• TDWG (Taxonomic Databases Working Group) http://www.tdwg.org-Desarrolla y promueve el uso de estándares y protocolos

- Objetivo: Interoperabilidad en el intercambio de datos + evitar duplicidad de esfuerzos-Evolución de estándares y protocolos:

- adaptándose a las necesidades y nuevos retos que se plantean en el mundo de la biodiversidad

-adaptándose y haciendo uso de las nuevas soluciones tecnológicas

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 5: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Protocolos y estándares en GBIFDónde se integran.Arquitectura GBIF

Page 6: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Estándares de datos en GBIF

Perfiles de datos utilizados en GBIF:

Darwin Core Darwin Core 1.2

Darwin Core 1.4

MaNIS (original)

MaNIS 1.21

Darwin Core 1.2 plus OBIS extension

ABCD ABCD 1.20

ABCD 1.48

ABCD 2.05

ABCD 2.06

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 7: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

•Diseñado para facilitar el intercambio de información de datos primarios de biodiversidad a través de internet

•2001-2003 The Species Analyst (Universidad de Kansas). Desde el 2004, TDWG

•Características:

•Para datos de colecciones y datos observacionales

•Mínimo común denominador. Recopila conceptos ampliamente utilizados por diferentes disciplinas que trabajan en biodiversidad

•Información en espacio y tiempo: El qué, el cuando y el dónde

•Simplicidad (minimizando las barreras entre los proveedores de datos+maximizando la disponibilidad para los usuarios)

•Para intercambio, no para modelado de datos

•Versiones: http://wiki.tdwg.org/twiki/bin/view/DarwinCore/DarwinCoreVersions

Darwin Core

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 8: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

•48 elementos no jerarquizados

•XML Schema: http://digir.net/schema/conceptual/darwin/2003/1.0/darwin2.xsd

•Estructurados en:

Identificación

Preparación y Conservación

Recolección y Notas

El cuándo

El dónde

Darwin Core 1.2

DateLastModified * InstitutionCode * CollectionCode * CatalogNumber *

ScientificName * BasisOfRecord Kingdom Phylum

Class Order Family Genus

Species Subspecies ScientificNameAuthor IdentifiedBy

YearIdentified MonthIdentified DayIdentified TypeStatus

CollectorNumber FieldNumber Collector YearCollected

MonthCollected DayCollected JulianDay TimeOfDay

ContinentOcean Country StateProvince County

Locality Longitude Latitude CoordinatePrecision

BoundingBox MinimumElevation MaximumElevation MinimumDepth

MaximumDepth Sex PreparationType IndividualCount

PreviousCatalogNumber RelationshipType RelatedCatalogItem Notes

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 9: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

•Formado por un núcleo central de elementos y una serie de extensiones con información adicional (de una disciplina concreto, info extra)•Core: (46 elementos) http://rs.tdwg.org/dwc/tdwg_dw_core.xsd

Elementos a nivel de registro Elementos taxonómicos Elementos de Identificación Elementos referentes a la localidad y localización Elementos referentes al evento de recolección Elementos biológicos Elementos de referencia: ImageURL, RelatedInformation

•Extension Curacional: http://rs.tdwg.org/dwc/tdwg_dw_curatorial.xsd

•Extensión Geoespacial:http://rs.tdwg.org/dwc/tdwg_dw_geospatial.xsd

•Extensión Paleontológica

•Extensión para interacciones entre organismos•Extensión microbiológica•Extensión Observacional /Monitorazación

Darwin Core 1.4

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 10: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Protocolos de intercambio en GBIF

Protocolos de intercambio utilizados+ Estándar de datos

Biocase (Biocase Pywrapper) ABCD

DiGIR (DiGIR provider package, DiGIR prov-sourceforge)

Darwin Core

TAPIR (TapirLink, TapirDoNet, Pywrapper)

ABCD

Darwin Core 1.4

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 11: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

TAPIR (TDWG Access Protocol for Information Retrieval )

• TAPIR es un protocolo para acceso a datos estructurados provenientes de bases de datos distribuidas de estructura lógica y física diferentes

• TAPIR combina las características de los protocolos BioCASe y DiGIR y amplía las posibilidades de comunicación entre aplicaciones cliente y proveedores de datos a través de Internet

• Su potencialidad permite la interoperabilidad no solo entre especimenes u observaciones si no que se puede utilizar en otros dominios (geológico, ecológico, clima, secuenciación genética, geoespacial, etc.)

• Implementaciones:– wrapper applications :

• PyWrapper (phyton)• TapirLink (0.6) (php)• TAPIRdoNet (.net)

– La primera red en implementar TAPIR: Plant Genetic Resources Community – CGIAR (Grupo Consultivo para la Investigación Agrícola Internacional ) – Generation Challenge Programme

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 12: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Integración tecnológica en los nodos

Distribuído Centralizado

ParticipantA

ParticipantC

Data Warehouse

ParticipantB

Data Warehouse

GBIFPortal

GBIFRegistry

GBIFIndex

ParticipantB

Page 13: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Implementación en GBIF-España

Soporte para instalación/mantenimiento del software requerido para el proveedor de datos

DiGIR/TAPIR provider

Servicio de Alojamiento para bases de datos (futuro: + imágenes digitales)

1. Conexión del software (DiGIR/TAPIR provider) instalado en los servidores de GBIF.es a la/s base/s de datos del proveedor (MySQL, Oracle, Postgree)

2. Espacio fisico para alojamiento de archivos de bases de datos + Conexión

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.

Page 14: GBIF Provisión de datos a GBIF Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia Pontifica Universidad Javeriana, Bogotá, Colombia

GBIF

Problemas técnicos Todo Correcto Sugerencias calidad de datos

Transferencia Subida por SFTP de la Base de datos. Área de pre-producción

Validacióntécnica y calidad de datos

PublicaciónBase de datos pasa al área de producción

http://data.gbif.org[http://es.mirror.gbif.org]

http://www.gbif.es/datos

[(re)Indexación]

Servicio de Alojamiento. Procesos

Reporte[Corrección demorada]

Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia

Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.