datos y metadatos, de francisca hernández carrascal

Post on 07-Dec-2014

2.234 Views

Category:

Technology

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

 

TRANSCRIPT

1

Datos y metadatos

Francisca Hernández

francisca.hernandez@digibis.com

2

Datos y metadatos

• Representación fidedigna del objeto original• Representación fidedigna de la copia digital

– Garantizar la vida del objeto digital– Descripción de los procesos realizados

• Derechos de propiedad, acceso y uso• Garantizar las funcionalidades de un sistema de

información • Transmisión de datos y metadatos• Integración de datos y metadatos en un repositorio

3

Representación del objeto original

• Descripciones bibliográficas– Marc 21 (ISO 2709) – MARC XML – MarcXchange (ISO

25577:2008)– Dublin Core sin cualificar– Dublin Core extendido– Metadata Object Description Schema (MODS)

• Funcionalidades– Presentación del objeto– Gestión y mantenimiento de colecciones digitales– Búsqueda y recuperación (SRU)– Recolección de metadatos (OAI-PMH)

4

Conversiones

MARC 21ISO 2709

MarcXchange

MODS

Dublin CoreRDF

Estructuras de metadatos

OAI_DC

MODS Schema

Variantes de expresión XML

oai_marc

MARC XML

5

6

<metadata>

<oai_marc:oai_marc xmlns:oai_marc="http://www.openarchives.org/OAI/1.1/oai_marc" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/1.1/oai_marc http://www.openarchives.org/OAI/1.1/oai_marc.xsd" status="0" type="n" level="t" ctlType="m" encLvl="0" catForm="2" lrRqrd="b">

<oai_marc:fixfield id="1">"BVPB20070010280"</oai_marc:fixfield>

<oai_marc:fixfield id="3">"BVPB"</oai_marc:fixfield>

<oai_marc:fixfield id="5">"20081021115525.0"</oai_marc:fixfield>

<oai_marc:fixfield id="8">"061031q17011800esp |||||||lat d"</oai_marc:fixfield>

<oai_marc:varfield id="35" i1="" i2="">

<oai_marc:subfield label="a">CCPB000789586-0</oai_marc:subfield>

</oai_marc:varfield>

<oai_marc:varfield id="40" i1="" i2="">

<oai_marc:subfield label="a">CCPB</oai_marc:subfield>

<oai_marc:subfield label="b">spa</oai_marc:subfield>

<oai_marc:subfield label="c">CCPB</oai_marc:subfield>

</oai_marc:varfield>

<oai_marc:varfield id="100" i1="0" i2="">

<oai_marc:subfield label="0">BVPB20070030684</oai_marc:subfield>

<oai_marc:subfield label="a">Ramon Llull</oai_marc:subfield>

7

<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim">

<record>

<leader>00000ntm a22000002b 4500</leader>

<controlfield tag="001">BVPB20070010280</controlfield>

<controlfield tag="003">BVPB</controlfield>

<controlfield tag="005">20081021115525.0</controlfield>

<controlfield tag="008">061031q17011800esp |||||||lat d</controlfield>

<datafield tag="035" ind1=" " ind2=" ">

<subfield code="a">CCPB000789586-0</subfield>

</datafield>

<datafield tag="040" ind1=" " ind2=" ">

<subfield code="a">CCPB</subfield>

<subfield code="b">spa</subfield>

<subfield code="c">CCPB</subfield>

</datafield>

<datafield tag="100" ind1="0" ind2=" ">

<subfield code="a">Ramon Llull</subfield>

<subfield code="c">Beato</subfield>

<subfield code="d">ca. 1232-1315</subfield>

</datafield>•

8

<metadata>

<oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">

<dc:type xmlns:dc="http://purl.org/dc/elements/1.1/">Book</dc:type>

<dc:language xmlns:dc="http://purl.org/dc/elements/1.1/">lat</dc:language>

<dc:title xmlns:dc="http://purl.org/dc/elements/1.1/">Dialecta seu logica nova [Manuscrito] ; De venatione medii inter subjectum et praedicatum ; De conversione subjecti et praedicati per medium</dc:title>

<dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Ramon Llull, Beato (ca. 1232-1315)</dc:creator>

<dc:date xmlns:dc="http://purl.org/dc/elements/1.1/">[S. XVIII]</dc:date>

<dc:date xmlns:dc="http://purl.org/dc/elements/1.1/">1701</dc:date>

<dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Ramon Llull</dc:creator>

<dc:identifier xmlns:dc="http://purl.org/dc/elements/1.1/">http://bvpb.mcu.es/es/consulta/registro.cmd?id=397871</dc:identifier>

<dc:identifier xmlns:dc="http://purl.org/dc/elements/1.1/">http://bvpb.mcu.es/es/catalogo_imagenes/grupo.cmd?path=11000987</dc:identifier>

<dc:format xmlns:dc="http://purl.org/dc/elements/1.1/">image/jpeg</dc:format>

</oai_dc:dc>

</metadata>

9

<?xml version="1.0" encoding="UTF-8"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">

<rdf:Description>

<dc:title>Boletín Oficial de la provincia de Orense Recurso electrónico</dc:title>

<dc:type>text</dc:type>

<dc:publisher>[S.l. s.n.]</dc:publisher>

<dc:date>1834-</dc:date>

<dc:language>spa</dc:language>

<dc:description>Título tomado de la cabecera</dc:description>

<dc:description>Errores de numeración</dc:description>

<dc:description>Con el inicio de cada año comienza la numeración</dc:description>

<dc:description>Algunos n. con suplementos</dc:description>

<dc:description>Copia digital</dc:description>

<dc:description>Índice anual, n. 1 (1838) de las leyes, decretos, reales órdenes y demás superiores determinaciones insertas en el Boletín Oficial de Orense desde 1 de Enero hasta fín de Noviembre del año de 1838</dc:description>

<dc:description>Índice anual general de los decretos, órdenes y demás disposiciones superiores publicadas en los Boletines en los n. 1 de los meses de Enero, Febrero, Marzo y Abril de los años 1841, 1842, 1843, 1844, 1845</dc:description>

<dc:description>Índice anual, n. 1 (1879)</dc:description>

</rdf:RDF>

10

Representación fidedigna de la copia

• Características técnicas de la copia– Garantizar la vida del objeto digital– Descripción de los procesos realizados– Derechos de propiedad, acceso y uso– Transmisión de datos y metadatos

• MIX (Metadata for Still Images in XML) • textMD Technical Metadata for Text

11

Metadata for Still Images in XML

• MIX expresa– Tamaño del fichero– Formato y versión del mismo (TIFF 6.0, JPEG 2000)– Orden de bytes– Compresión (CCITT, LZW, JPEG 2000 lossless)– Ratio de compresión– Fijeza (Algoritmo, Algoritmo original)– Características de la imagen (altura, anchura, color, perfil de

color, etc.) – http://www.loc.gov/standards/mix/

12

textMD: Metadatos técnicos para textos

• textMD expresa– Aspectos técnicos de la generación de un texto, p.e.,

software y hardware utilizado en la obtención de OCR, procesador de texto

– Juego de caracteres– Idioma– Tipos y tamaños– Lenguaje de marcado– Software para impresión y/o visualización– http://www.loc.gov/standards/textMD/

13

METSRights: Derechos de propiedad, acceso y uso

• METSRights expresa– Derechos asociados a una copia digital o a sus

componentes– Identificación del propietario de los derechos– Circunstancias asociadas a permisos y restricciones (p.e.,

acceso a grupos determinados)– Categorías de derechos (dominio público, copyright,

licencia, contrato, etc.)– Permisos (localizar, mostrar, copiar, duplicar, modificar,

imprimir)

14

El ciclo de vida de un objeto digital

• Registro de cambios producidos en un objeto digital a lo largo de su ciclo de vida– Digitalización – Retoque y mejora de imágenes – Reconocimiento óptico de caracteres– Validación

• JHOVE - JSTOR/Harvard Object Validation Environment

• http://hul.harvard.edu/jhove/ – Conversión (migración) de un formato a otro– Agente que realiza el proceso– Fecha en la que se realiza el proceso– Software y hardware utilizado

15

<premis:event>

<premis:eventIdentifier>

<premis:eventIdentifierType>NULREPOS</premis:eventIdentifierType>

<premis:eventIdentifierValue>inu-event-00006</premis:eventIdentifierValue>

</premis:eventIdentifier>

<premis:eventType>conversion-to-jpeg2000</premis:eventType>

<premis:eventDateTime>2006-04-04</premis:eventDateTime>

<premis:eventDetail>Migrate TIFF to JPEG2000</premis:eventDetail>

<premis:linkingAgentIdentifier>

<premis:linkingAgentIdentifierType>lcnaf</premis:linkingAgentIdentifierType>

<premis:linkingAgentIdentifierValue>Northwestern University, University Library, Digital Library Systems Development</premis:linkingAgentIdentifierValue>

</premis:linkingAgentIdentifier>

<premis:linkingObjectIdentifier>

<premis:linkingObjectIdentifierType>NULREPOS</premis:linkingObjectIdentifierType>

<premis:linkingObjectIdentifierValue>inu-afmp-g8850_1729_a5_FG7</premis:linkingObjectIdentifierValue>

</premis:linkingObjectIdentifier>

</premis:event>

16

Transmisión de datos y metadatos

– Metadatos descriptivos– Metadatos administrativos

• Metadatos técnicos (MIX, textMD)• Metadatos de propiedad intelectual (METSRights)• Metadatos de procedencia de un objeto digital

– Relación de ficheros (una copia, varias versiones…)– Estructura de los ficheros– Comportamientos

• Metadata Encoding & Transmission Standard (METS)• Preservation Metadata Implementation Strategies

(PREMIS)

17

Metadatos descriptivos

Metadatos Administrativos

Relación de ficheros

Comportamiento

MARC 21

DC MODS

MIX, textMD

METSRights

METS Extensiones METS

PREMIS

DIGIPROV

Objetos

Eventos

Agentes

Derechos

PREMIS

18

Distintas formas de expresar los mismos datos

– PREMIS <event>– METS <digiprov>

– PREMIS

– METS– PREMIS encapsulados en METS – Metadatos técnicos encapsulados en PREMIS

– Perfiles de METS– http://www.loc.gov/standards/mets/mets-profiles.html

19

20

METS

21

Datos y metadatos

• Representación fidedigna del objeto original• Representación fidedigna de la copia• Garantizar la vida del objeto digital• Descripción de los procesos realizados• Derechos de propiedad, acceso y uso• Transmisión de datos y metadatos• Integración de datos y metadatos en un repositorio• Garantizar las funcionalidades de un sistema de

información

top related