第二讲 信息资源组织方法 第六章 元数据方法

99
第第第 第第第第第第第第 第第第 第第第第第第第第 第第第 第第第第第 第第第 第第第第第 第第 第第 [email protected] [email protected] 北北北北北北北北北北北北 2005 北北

Upload: bisa

Post on 14-Jan-2016

76 views

Category:

Documents


0 download

DESCRIPTION

北京大学研究生课程进修班 2005 上海. 第二讲 信息资源组织方法 第六章 元数据方法. 刘炜 [email protected]. 目录. 元数据一般概念 国外元数据研究与应用的历史与现状 国内元数据研究与应用的历史与现状 趋势与问题 DC 元数据方法. 元数据一般概念. 定义 来源 作用 分类 模型. 思考: 元数据概念早已有之,为什么现在会非常热门? 固然 MARC 是一种元数据格式,但是它与“现代”元数据究竟又什么大的区别?. 元数据定义. “ meta” 来自古希腊语,意思是更高层次或更基本的概念 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第二讲  信息资源组织方法 第六章  元数据方法

第二讲 信息资源组织方法第二讲 信息资源组织方法第六章 元数据方法第六章 元数据方法

第二讲 信息资源组织方法第二讲 信息资源组织方法第六章 元数据方法第六章 元数据方法

刘炜刘炜[email protected]@libnet.sh.cn

刘炜刘炜[email protected]@libnet.sh.cn

北京大学研究生课程进修班 2005 上海

Page 2: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

目录目录目录目录

• 元数据一般概念元数据一般概念• 国外元数据研究与应用的历史与现国外元数据研究与应用的历史与现

状状• 国内元数据研究与应用的历史与现国内元数据研究与应用的历史与现

状状• 趋势与问题趋势与问题• DCDC 元数据方法元数据方法

Page 3: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据一般概念元数据一般概念元数据一般概念元数据一般概念

• 定义定义• 来源来源• 作用作用• 分类分类• 模型模型

思考:思考:1.1. 元数据概念早已有之,为什么现在会非常热门?元数据概念早已有之,为什么现在会非常热门?2.2. 固然固然 MARCMARC 是一种元数据格式,但是它与“现代”元是一种元数据格式,但是它与“现代”元

数据究竟又什么大的区别?数据究竟又什么大的区别?

Page 4: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据定义元数据定义元数据定义元数据定义• ““ meta”meta” 来自古希腊语,意思是更高层次或更基本的概念来自古希腊语,意思是更高层次或更基本的概念• 关于数据的数据(关于数据的数据( data about datadata about data ))• 关于数据的结构化数据(关于数据的结构化数据( structured data about datastructured data about data ))• 用于描述数据的内容(用于描述数据的内容( whatwhat )、覆盖范围()、覆盖范围( where, whenwhere, when )、质量、管理方式、)、质量、管理方式、

数据的所有者(数据的所有者( whowho )、数据的提供方式()、数据的提供方式( howhow )等信息的数据,是数据与数)等信息的数据,是数据与数据用户之间的桥梁据用户之间的桥梁

• 资源的信息 资源的信息 (Information about a resource)(Information about a resource)• 编目信息 编目信息 (Cataloguing information)(Cataloguing information)• 管理、控制信息(管理、控制信息( Administrative information)Administrative information)• 是一组独立的关于资源的说明(是一组独立的关于资源的说明( metadata is a set of independent metadata is a set of independent

assertions about a resource assertions about a resource ))• 定义和描述其它数据的数据(定义和描述其它数据的数据( data that defines and describes other data data that defines and describes other data (( ISO/IEC 11179-3:2003(E)ISO/IEC 11179-3:2003(E) ))

• MetadataMetadata 在台湾被译作“元资料”、“诠释资料”、“后设资料”、“文后资在台湾被译作“元资料”、“诠释资料”、“后设资料”、“文后资料”、“超资料”等多种名称。 料”、“超资料”等多种名称。

Page 5: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

来源来源来源来源

• 计算机计算机 // 数据库领域数据库领域• 网络信息标注网络信息标注 // 检索检索• 进一步发展:机器对于语义的理解和进一步发展:机器对于语义的理解和

处理(语义万维网)处理(语义万维网)

Page 6: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据的作用元数据的作用元数据的作用元数据的作用

元数据的主要功能是定位(元数据的主要功能是定位( locationlocation )、寻找或发掘)、寻找或发掘(( discoverydiscovery )、存档()、存档( documentationdocumentation )、评价)、评价(( evaluationevaluation )与选择()与选择( selectionselection )等五大功能)等五大功能 ** ;;

其他作用:链接与交互关系的体现(其他作用:链接与交互关系的体现( linkage and linkage and interactive relationship managementinteractive relationship management )、整合)、整合XMLXML、、 RDFRDF与与 Z39.50Z39.50 不同协议的应用等;不同协议的应用等;

描述、检索、选择、定位、管理、评估与交互等功能描述、检索、选择、定位、管理、评估与交互等功能 **** 。。

* 来自于欧洲 DESIRE( Development of a European Service for Information on Research and Education )计划的元数据分析报告** 北大数字图书馆研究所的研究报告

Page 7: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Metadata supports operations on resources ….

… and relieves the user of having to have advance knowledge of the characteristics or existence of the resource.

–Know what resources are available

–Know how to play a resource

–Know provenance of a resource

–Know what use policy governs a resource

–Know how to ingest a resource

–Know how to interact with a resource

–Know how to compose/decompose resources

– …

Page 8: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

A ‘portal’ turned inside out …A ‘portal’ turned inside out …A ‘portal’ turned inside out …A ‘portal’ turned inside out …

Common services

Content services

Application services

Presentation services

I need a few

references

From slides by Lorcan Dempsey

Page 9: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

authenticationauthentication

From slides by Lorcan Dempsey

Page 10: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Directory: user profileDirectory: user profile

From slides by Lorcan Dempsey

Page 11: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Query brokerQuery broker

From slides by Lorcan Dempsey

Page 12: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Directory: service/collection description

Directory: service/collection description

From slides by Lorcan Dempsey

Page 13: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Content: results listContent: results list

From slides by Lorcan Dempsey

Page 14: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

I’d like to get this book.

Common services

Content services

Application services

Presentation services

Request brokerRequest broker

From slides by Lorcan Dempsey

Page 15: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Directory: ILL policyDirectory: ILL policy

From slides by Lorcan Dempsey

Page 16: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Directory: service/collection description

Directory: service/collection description

From slides by Lorcan Dempsey

Page 17: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Content: circ/ILL systemContent: circ/ILL system

From slides by Lorcan Dempsey

Page 18: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

I need this article too.

Common services

Content services

Application services

Presentation services

Request brokerRequest broker

From slides by Lorcan Dempsey

Page 19: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

openURL resolveropenURL resolver

From slides by Lorcan Dempsey

Page 20: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Directory: local knowledge baseDirectory: local knowledge base

From slides by Lorcan Dempsey

Page 21: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Nearly there …Nearly there …Nearly there …Nearly there …

Common services

Content services

Application services

Presentation services

Directory: service/collection descriptionDirectory: service/collection description

From slides by Lorcan Dempsey

Page 22: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Common services

Content services

Application services

Presentation services

Content: articleContent: article

From slides by Lorcan Dempsey

Page 23: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Directory: ILL policy

Directory: ILL policy

Common services

Content services

Application services

Presentation services

AuthenticationAuthentication

Directory: user profile

Directory: user profile

Query brokerQuery broker

Directory: service/collection description

Directory: service/collection description

Reference dbReference db

Request brokerRequest broker

Circ/ILL systemCirc/ILL systemOpenURL resolverOpenURL resolver

Directory: local knowledge base

Directory: local knowledge base

Article dbArticle db• Metadata for multiple

entities required to support operations.

• This picture could be extended in multiple ways.

• Metadata for multiple entities required to support operations.

• This picture could be extended in multiple ways.

From slides by Lorcan Dempsey

Page 24: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据大家庭元数据大家庭Cultural heritage Media

industry

Web/Internet

LibraryInstructionaltechnology

E-gov

Researchcommunities

Book industry

EAD, MARC AMC, ..

MARC, MODS, DC, RSLP, ..

Onix, …

XML, RDF, OWL, …

CSDGM, DDI, NBII, IVOA, …

EGMS, AGLS, GILS, …

GEM, DC-ED, IEEE-LOM, SCORM, …

MPEG, JPEG, TIAA-CREF…

*

*

*

*From slides by Lorcan Dempsey

Page 25: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据的分类元数据的分类元数据的分类元数据的分类

Asset metadata – Who, Where & When:

Title, Creator, Publisher, Contributor, Date, Type,

Format, Identifier, Source, Language

Subject metadata –What & Why:

Subject, Description, Coverage

Relational metadata – Links between and to:

Relation

Use metadata – How can it be used:

Rights & Permissions

Enabled Functionality

Co

mp

lex

ity

http://dublincore.org/documents/dces/

More efficient editorial process

Better navigation &

discovery

Page 26: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据的分类元数据的分类元数据的分类元数据的分类

元数据类型元数据类型 定义定义

描述型描述型元数据元数据

内容描述内容描述 描述资源对象内容或外观信息。描述资源对象内容或外观信息。

结构描述结构描述 描述资源对象各组件的结构信息。描述资源对象各组件的结构信息。

管理型管理型元数据元数据

技术技术 描述资源对象的技术要求的元数据信息。描述资源对象的技术要求的元数据信息。

权限权限 描述资源对象的权限管理与合法取用的元数据描述资源对象的权限管理与合法取用的元数据信息。信息。

来源来源 描述资源对象的产生、发展与环境等方面的元描述资源对象的产生、发展与环境等方面的元数据信息。数据信息。

一般管理一般管理 用来管理信息资源的元数据信息。用来管理信息资源的元数据信息。

根据元数据中的元素所描述、揭示的语义来划分的:

Page 27: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据分类元数据分类元数据分类元数据分类类型 定义 使用实例管理 用于管理与控制信息资源的元数据 • 采购信息

• 版权及复制记录• 获取权利控制(密级)• 馆藏信息• 数字化的选择标准• 版本控制

描述 用于描述与标识信息资源的元数据 • 目录记录一般为手工制作的元数据 • 专门索引

• 资源之间的超链接• 用户所做的注解

保存 与信息资源的保存管理相关的元数据 • 资源的物理状态描述文档• 有关保存资源物理或数字化版本的文档,例如数据的更新与迁移

技术 与系统功能相关的元数据或元数据行为模式• 硬件及软件文档• 数字化信息,例如格式、压缩比及缩放比• 系统响应时间的记录• 许可及安全数据,例如密码及加密密钥

使用 与用户级别与类型相关的有关信息资源的元数据• 展出记录• 用户及利用记录• 内容重用及多版本信息

Page 28: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

描述性元数据的分类描述性元数据的分类描述性元数据的分类描述性元数据的分类

第一级 第二级 第三级

记录特性简单格式非标准化的全文索引

结构化的格式逐渐成为标准字段结构

复杂格式国际标准详细的标记

元数据格式举例LycosAltavistaYahoo etc

Dublin CoreIAFA templatesRFC 1807SOIF

FGDCEADTEIGILSMARC

描述能力低 高

Page 29: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

国外情况国外情况国外情况国外情况

• 概况概况• 项目情况项目情况• 标准化情况标准化情况• 研究与应用特点研究与应用特点• 值得借鉴之处值得借鉴之处

Page 30: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据标准举例元数据标准举例元数据标准举例元数据标准举例

按元数据应用的学科领域,则可以进行如下划分 :按元数据应用的学科领域,则可以进行如下划分 :• 传统图书期刊,如:传统图书期刊,如: MARCMARC 等。 等。 • 网络资源,如网络资源,如 Dublin CoreDublin Core、、 IAFA/WHOIS++ TemplatesIAFA/WHOIS++ Templates、、 LDIFLDIF(( LDAP Data LDAP Data

Interchange FormatInterchange Format )、)、 SOIFSOIF(( Summary Object Interchange Summary Object Interchange FormatFormat )、)、 URCsURCs(( Uniform Resource Characteristics/CitationsUniform Resource Characteristics/Citations )等。 )等。

• 政府信息,如:政府信息,如: GILSGILS(( Government Information Locator ServiceGovernment Information Locator Service ,政府信息定,政府信息定位服务)、位服务)、 DC-GovDC-Gov(( DC-Government Application ProfileDC-Government Application Profile,, DCDC 政府应用纲政府应用纲要)等。 要)等。

• 科技文献,如:科技文献,如: ibTEXibTEX、、 EELSEELS(( The Engineering Electronic LibraryThe Engineering Electronic Library ,工程电,工程电子图书馆元数据)、子图书馆元数据)、 EEVLEEVL(( The Edinburgh Engineering Virtual LibraryThe Edinburgh Engineering Virtual Library ,爱丁,爱丁堡虚拟电子图书馆元数据)、堡虚拟电子图书馆元数据)、 RFC1807RFC1807等等 [28][28] 。 。

• 人文及社会科学资源,如:人文及社会科学资源,如: TEI HeaderTEI Header、、 ICPSR SGML Codebook InitiativeICPSR SGML Codebook Initiative等等[29][29] 。 。

• 教育资源:教育资源: IEEE LOMIEEE LOM(( Learn Object MedleLearn Object Medle ,学习对象模型)、,学习对象模型)、 GEMGEM(( GEM GEM Element ListElement List,, GEMGEM 元数据)、元数据)、 DC-EdDC-Ed(( DC-EducationDC-Education 元数据)等。元数据)等。

• 博物馆藏品或特藏,如:博物馆藏品或特藏,如: CDWACDWA(( Categories for the Description of Works of Categories for the Description of Works of ArtArt ,艺术作品描述目录)、,艺术作品描述目录)、 CIMICIMI(( Computer Interchange of Museum Computer Interchange of Museum InformationInformation)) CIMICIMI 、 、 VRA CoreVRA Core(( Visual Resources Association Core,Visual Resources Association Core, 可视可视资源核心类目)、资源核心类目)、 REACHREACH 元素集等。 元素集等。

• 保存型元数据方案:保存型元数据方案: CEDARSCEDARS、、 NLANLA、、 NEDLIBNEDLIB• 地理空间资源,如:地理空间资源,如: FGDC/CSDGMFGDC/CSDGM 等 等 • 手稿档案保存类,如:手稿档案保存类,如: EADEAD 等等• 网络多媒体及版权管理:网络多媒体及版权管理: INDECSINDECS

Page 31: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

简介简介简介简介• 1.CDWA(1.CDWA( 艺术作品描述目录艺术作品描述目录 ))• 2.CDF(2.CDF( 频道定义格式频道定义格式 ))• 3.BibTex(3.BibTex( 科技文献书目资源格科技文献书目资源格式式 ))

• 4.CIMI(4.CIMI( 博物馆信息计算机交换标博物馆信息计算机交换标准框架准框架 ))

• 5.DC(5.DC(都柏林核心元数据都柏林核心元数据 ))• 6.EAD(6.EAD( 编码文档描述编码文档描述 ))• 7.EELS(7.EELS(工程电子化图书馆工程电子化图书馆 ))• 8.EEVL(8.EEVL(爱丁堡工程虚拟图书馆爱丁堡工程虚拟图书馆 ))• 9.FGDC(9.FGDC( 联邦地理数据委员会联邦地理数据委员会 ))• 10.GILS(10.GILS( 政府信息定位服务政府信息定位服务 ))• 11.IAFA/WHIOS++Templates11.IAFA/WHIOS++Templates(( 因特网匿名因特网匿名 FTPFTP 文件库版式文件库版式 ))

• 12.ICPSR SGML Codebook(12.ICPSR SGML Codebook( 政政治和社会研究方面的校际联盟治和社会研究方面的校际联盟 ))

• 13.LDAP DIF(13.LDAP DIF( 轻便型目录获取协轻便型目录获取协议议 ))

• 14.MARC(14.MARC( 机读目录格式机读目录格式 ))• 15.MCF(15.MCF( 元内容框架元内容框架 ))• 16.PICA+(16.PICA+( 荷兰图书馆自动化中荷兰图书馆自动化中心心 ))

• 17.PICS(17.PICS( 网络内容选择平台网络内容选择平台 ))• 18.RDF(18.RDF( 资源描述框架资源描述框架 ))• 19.RFC(19.RFC( 书目记录格式书目记录格式 ))• 20.SGML(20.SGML( 通用标准标记语言通用标准标记语言 ))• 21.SOIF(21.SOIF( 概略对象交换格式概略对象交换格式 ))• 22.TEL Header(22.TEL Header( 文本编码计划文本编码计划 ))• 23.URCs(23.URCs( 统一资源特征统一资源特征 ))• 24.Warwick 24.Warwick

Framework(WarwickFramework(Warwick 框架框架 ))• 25.Web Collections(25.Web Collections( 网站集合网站集合 ))

Page 32: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

IFLAIFLA推荐方案推荐方案IFLAIFLA推荐方案推荐方案

应包含的核心元素应包含的核心元素• 主题 Subject• 日期 Date• 使用条件 Conditions of use• 出版者 Publisher• 资源名 Name assigned to the resource• 语种 /表达方式 Language/mode of expression• 资源标识符 Resource identifier• 资源类型 Resource type (i.e., what the resource is,

rather than what it is about)• 作者 /创建者 Author/creator• 版本 Version

见: Guidance on the Structure, Content, and Application of Metadata Records for Digital Resources and Collections: Report of the IFLA Cataloguing Section Working Group on the Use of Metadata Schemas (2003 Oct 27)

Page 33: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

国内情况国内情况国内情况国内情况

• 概况概况• 历史历史• 项目与研究应用情况项目与研究应用情况• 趋势与展望趋势与展望• 值得关注的课题值得关注的课题• 图书馆员的角色图书馆员的角色

Page 34: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

国内元数据研究与应用概况国内元数据研究与应用概况国内元数据研究与应用概况国内元数据研究与应用概况

国内的研究与应用:国内的研究与应用:• 数字化项目的需要,例如国家图书馆、中山图书馆等;数字化项目的需要,例如国家图书馆、中山图书馆等;• 数字图书馆开发与建设的需要,如有关数字图书馆项目、国家数字图书馆开发与建设的需要,如有关数字图书馆项目、国家

863863 项目等;项目等;• 国外元数据跟踪研究和应用的成果国外元数据跟踪研究和应用的成果近来新呈现的特点近来新呈现的特点• 注重体系化的研究,通过对系统架构的研究,建立信息系统模注重体系化的研究,通过对系统架构的研究,建立信息系统模

型(生命周期模型、数据流模型、应用相关模型等)。型(生命周期模型、数据流模型、应用相关模型等)。• 注重具体应用环境和实现的研究。注重具体应用环境和实现的研究。• 注重标准体系的建立(一整套标准规范和可操作的文档)。注重标准体系的建立(一整套标准规范和可操作的文档)。

Page 35: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

历史历史历史历史

• 19971997 年“试验型数字图书馆”项目年“试验型数字图书馆”项目• OCLCOCLC 的引介、推动的引介、推动• 国图及中山图书馆元数据方案国图及中山图书馆元数据方案• 北大元数据方法论北大元数据方法论• 上海图书馆“第一届国际元数据研讨上海图书馆“第一届国际元数据研讨

会”会”• 上图的元数据跟踪及应用上图的元数据跟踪及应用

Page 36: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

国内元数据项目与应用研究情况国内元数据项目与应用研究情况国内元数据项目与应用研究情况国内元数据项目与应用研究情况

• 国家图书馆国家图书馆《《中文元数据方案中文元数据方案》》• 北京大学图书馆(拓片和敦煌古卷)北京大学图书馆(拓片和敦煌古卷)• 清华大学(建筑)清华大学(建筑)• 中科院文献情报中心中科院文献情报中心• 《《我国数字图书馆标准与规范建设我国数字图书馆标准与规范建设》》项目项目 (CDLS)(CDLS)• 中山图书馆“数字式中文全文文献通用格式”中山图书馆“数字式中文全文文献通用格式”• 中国可持续发展信息共享示范系统中国可持续发展信息共享示范系统 **• 教育信息源数据标准教育信息源数据标准 ****• 上海图书馆应用研究情况上海图书馆应用研究情况

*参见: http://nfgis.nsdi.gov.cn/sdinfo/download.asp**参见: http://www.celtsc.edu.cn/ 全国信息技术标准化技术委员会教育技术分技术委员会发布的有关全国信息技术标准化技术委员会教育技术分技术委员会发布的有关教育信息元数据标准教育信息元数据标准

Page 37: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

国家图书馆国家图书馆国家图书馆国家图书馆

• 国家图书馆国家图书馆 (NLCN)(NLCN)于于 19911991年年 33 月成立了文献数字化中心,主要从月成立了文献数字化中心,主要从事国家图书馆内部文献的加工生产,事国家图书馆内部文献的加工生产, 20002000年年 1010月划入中国数字图月划入中国数字图书馆有限责任公司范围,承担中国数字图书馆工程中的资源建设任务,书馆有限责任公司范围,承担中国数字图书馆工程中的资源建设任务,现已经为中国数字图书馆提供中文图书现已经为中国数字图书馆提供中文图书 2020 万册,万册, 70007000 万页、缩微万页、缩微胶片胶片 200200 万拍、金石拓片万拍、金石拓片 60006000张等数字资源 。张等数字资源 。

• 另有:甲骨影像及拓片资源库;西夏文献数字资源库;中文拓片资源另有:甲骨影像及拓片资源库;西夏文献数字资源库;中文拓片资源库;国际敦煌项目库;国际敦煌项目 (( 敦煌及其他遗址出的十万余件写卷,可以在互联网上免费获得高清晰度的数敦煌及其他遗址出的十万余件写卷,可以在互联网上免费获得高清晰度的数码图像,与之相联的有书目,地图,照片,遗址图等其他有关历史,现状等信息,使学者,学生,平常老码图像,与之相联的有书目,地图,照片,遗址图等其他有关历史,现状等信息,使学者,学生,平常老百姓能由此深入了解公元一千年丝绸之路上的社会生活状况 百姓能由此深入了解公元一千年丝绸之路上的社会生活状况 )) 。。

• 20022002年年 1212月,月,““国家图书馆二期工程暨国家数字图书馆工程国家图书馆二期工程暨国家数字图书馆工程””项目项目立项申请书通过国务院批准,程总投资立项申请书通过国务院批准,程总投资 123,500123,500 万元;万元;

• 基于基于 OAISOAIS参考模型的保存性元数据方案“中文元数据方案 ”参考模型的保存性元数据方案“中文元数据方案 ”

Page 38: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

中文元数据方案中文元数据方案中文元数据方案中文元数据方案1 名称 Title

2 主题 Subject

3 版本 Edition

4 内容摘要 Abstract

5 内容类型 Content Type

6 语种 Language

7 内容覆盖范围 Coverage

8 内容创建者 Creator

9 其它责任者 Contributor

10 内容创建日期 Date of Creation

11 出版 Publisher

12 版权所有者 Copyright Holder

13 资源标识符 Identifier

14 关联资源 Related Objects

15 数字资源制作者 Digital Publisher Name

16 数字资源制日期 Digital Publisher Date

17 数字资源制作地 Digital Publisher Place

18 权限声明 Rights Warning

19 公开对象 Actors

20 操作许可 Actions

21 原始技术环境 Original Technical Environments

22 加工处理历史 Ingest Process History

23 维护历史 Administration History

24 认证指示符 Authentication Indicator

25 基本抽象格式描述 UAF-Description

Page 39: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

中国高校系统:以北京大学为代表中国高校系统:以北京大学为代表中国高校系统:以北京大学为代表中国高校系统:以北京大学为代表• 基于专门数字对象的元数据标准基于专门数字对象的元数据标准

– 古籍元数据标准(第古籍元数据标准(第 44 版)版)– 拓片元数据标准(第拓片元数据标准(第 66 版)版)– 舆图元数据标准(第舆图元数据标准(第 11 版)版)– 学位论文元数据标准(第学位论文元数据标准(第 22 版)版)– 人物元数据标准(第人物元数据标准(第 11 版)版)– 电子图书元数据标准(教学参考书)(第电子图书元数据标准(教学参考书)(第 11 版)版)– 网络资源元数据标准(第网络资源元数据标准(第 11 版)版)– 其它其它

参见示例

Page 40: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Page 41: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

中国科学院文献情报中心中国科学院文献情报中心中国科学院文献情报中心中国科学院文献情报中心

• 国家科学数字图书馆预研项目国家科学数字图书馆预研项目• 后续项目:“后续项目:“科技基础性工作专项资科技基础性工作专项资金重点项目金重点项目《《我国数字图书馆标准规我国数字图书馆标准规范建设范建设》》””

Page 42: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

完整的框架体系完整的框架体系完整的框架体系完整的框架体系

Works/Objects

Collections of Works/Objects

Databases of discriptions

Digital Objects

Collections ofDigital Objects

Identification/Naming

Metadata Descriptions

Retrieval Mechanisms

Location Resolution

Storage and Archiving

Formatting

Organizing Mechanisms

格式化

识别与命名

元数据描述

组织机制

检索机制

地址解析

长期保存

注:本页内容来自张晓林教授有关元数据的演示稿

Page 43: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

基于生命周期的元数据开发应用框架基于生命周期的元数据开发应用框架基于生命周期的元数据开发应用框架基于生命周期的元数据开发应用框架

互操作机制

检索机制长期保存

应用领域

应用目标

内容结构

句法结构

语义结构

编码语言

制作机制组织与存储

Page 44: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海回目录

中国可持续发展信息共享示范系统中国可持续发展信息共享示范系统中国可持续发展信息共享示范系统中国可持续发展信息共享示范系统

Page 45: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

基础教育教学资源元数据规范基础教育教学资源元数据规范基础教育教学资源元数据规范基础教育教学资源元数据规范• 编入编入《《教育信息化技术标准教育信息化技术标准》》 CELTS-42 CELTS-42 ;;• 与与 IEEE LOMIEEE LOM和和 IMSIMS 相一致;相一致;• 与与 DCDC联系密切(以联系密切(以 DCDC 为核心)为核心)• 体系完整,元数据方面已包括三个规范:体系完整,元数据方面已包括三个规范:

– CELTS-3.1CELTS-3.1(( CD1.6)CD1.6) 学习对象元数据学习对象元数据 2002-09-052002-09-05– CELTS-3.3CELTS-3.3(( CD1.6)CD1.6) 学习对象元数据实践指南学习对象元数据实践指南 2003-2003-

01-0701-07– CELTS-3.4CELTS-3.4((WD1.0)WD1.0) 学习对象元数据测试规范学习对象元数据测试规范 2003-2003-

01-0701-07

• 建立了运作机制和认证体系建立了运作机制和认证体系

参见示例

Page 46: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

上海图书馆上海图书馆上海图书馆上海图书馆

• 上海图书馆于上海图书馆于 19971997年启动了古籍数字化项目年启动了古籍数字化项目 (( 数字化数量共计数字化数量共计32233223 种一、二级藏品种一、二级藏品 130130 万页万页 )) 。 ,。 , 19981998年开始进行历史文献和年开始进行历史文献和特色馆藏的抢救性整理和数字化工作。特色馆藏的抢救性整理和数字化工作。 19991999年是上海图书馆进行大年是上海图书馆进行大规模数字化的一年,这一年一共进行了规模数字化的一年,这一年一共进行了 77 个数字化项目。个数字化项目。

• 上海数字图书馆是一个综合了七个资源库的网上图书馆,拥有数据近上海数字图书馆是一个综合了七个资源库的网上图书馆,拥有数据近200GB200GB ,主要是扫描的影像数据。系统采用,主要是扫描的影像数据。系统采用 IBM Digital Library IBM Digital Library version 2.4version 2.4 作为主要开发工具应用平台。作为主要开发工具应用平台。

• 元数据方案采用以元数据方案采用以 DCMESDCMES 作为核心集、多种元数据方案并存的“元作为核心集、多种元数据方案并存的“元数据应用纲要”形式,以基于数据应用纲要”形式,以基于 XMLXML的的 RDFRDF 为基础的编码方式封装在为基础的编码方式封装在一起,保证了原始素材内容管理中元数据的完整性与互操作能力。 一起,保证了原始素材内容管理中元数据的完整性与互操作能力。

• 目前正在修改完善一整套元数据规范、方案和方法。目前正在修改完善一整套元数据规范、方案和方法。• 上图德元数据规范和方法正在应用于上海图书馆正在建设的古籍数字上图德元数据规范和方法正在应用于上海图书馆正在建设的古籍数字

图书馆、拓片资源的数字化、家谱数字图书馆、名人手稿数字图书馆图书馆、拓片资源的数字化、家谱数字图书馆、名人手稿数字图书馆等。等。

Page 47: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据实践元数据实践元数据实践元数据实践

Page 48: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

值得关注的课题值得关注的课题值得关注的课题值得关注的课题

• 流程与方法流程与方法• 模型模型• 几个重点和趋势:几个重点和趋势:

– 元数据注册体系元数据注册体系– 应用方案(应用方案( APAP )的概念和形式化)的概念和形式化– 保存性元数据保存性元数据– 权限管理元数据权限管理元数据

Page 49: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

上图元数据方案设计流程上图元数据方案设计流程上图元数据方案设计流程上图元数据方案设计流程

建立模型详细列出相关实体,标明其相互

之间的关系。

资源分析分析应用领域资源特点和文献利

用方式

属性提取内容专家从资源利用的角度提出

属性要求

文献调研

元数据专家从现有标准和相关项

目中获得参考

元素精炼分析应用领域资源特点和文献利

用方式

限定规则规定属性限定原则(子字段,修饰词和编码)

规范控制考察需要进行规范控制的属性,

制定办法

著录规则制定详细的著录规则,指导数据

加工

置标方案通常选择

XML/RDF 或单纯 XML 置标

检索要求提出元素对应属性字段的具体检

索要求

系统需求元数据需求作为应用系统需求的

一个部分

验收要求元数据部分在系统中所要达到的

功能

未来扩展预留未来发展的可能性,即可扩

展性

元数据方案设计流程图示

Page 50: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

图书馆员的角色图书馆员的角色图书馆员的角色图书馆员的角色

• 领域内容专家领域内容专家 // 信息组织专家信息组织专家 // 计算机计算机专家三位一体;专家三位一体;

• 技术与应用的桥梁;技术与应用的桥梁;• 完善知识体系结构完善知识体系结构————构建元数据方构建元数据方案和知识本体案和知识本体

Page 51: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据模型元数据模型元数据模型元数据模型

• RDFRDF 数据模型(及数据模型(及WarwickWarwick 框架)框架)• OAISOAIS 参考模型参考模型• FRBRFRBR 功能功能 // 生命周期模型生命周期模型• DCMIDCMI 抽象模型(抽象模型( DCMIDCMI 元数据方案元数据方案抽象模型)抽象模型)

• 数字图书馆体系结构模型数字图书馆体系结构模型

Page 52: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据模型:三位一体元数据模型:三位一体元数据模型:三位一体元数据模型:三位一体

在语义、结构和句法三方面分别达成一致在语义、结构和句法三方面分别达成一致• 语义语义

– 通过属性元素(部分通过编码通过属性元素(部分通过编码 // 置标方式)表达置标方式)表达• 结构结构

– 语义的抽象载体,通过框架语义的抽象载体,通过框架 // 容器来表达,要求做容器来表达,要求做到人类与机器均可读到人类与机器均可读

• 句法句法 //语法语法– 具体的置标具体的置标 // 编码方案(如编码方案(如 XML/METS/ XML/METS/

MODS/RDF/XMLS/RDFS/OWLMODS/RDF/XMLS/RDFS/OWL 等),传达语义等),传达语义和结构和结构

Page 53: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

FRBRFRBR 模型模型FRBRFRBR 模型模型Functional Requirements for Bibliographic Records

Page 54: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据生命周期元数据生命周期元数据生命周期元数据生命周期

Page 55: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

数字图书馆体系结构模型数字图书馆体系结构模型数字图书馆体系结构模型数字图书馆体系结构模型

资源库服务

索引服务

馆藏服务

句柄

名字服务

数字资源

用户访问网关服务

资源库服务

索引服务

馆藏服务

句柄句柄

名字服务

数字资源

用户访问网关服务

资源创建者

数字对象

数据

句柄

仓储

RAP(仓储存取协议 ) 句柄服务器

创建包含

由句柄系统创建包含在

被存取 句柄注册于

Page 56: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据与数字图书馆元数据与数字图书馆元数据与数字图书馆元数据与数字图书馆• 元数据决定了数字图书馆的体系结构,主要解决元数据决定了数字图书馆的体系结构,主要解决两个问题:两个问题:– 定义数字图书馆中数字对象的信息结构定义数字图书馆中数字对象的信息结构– 定义由数字对象构成的资源库的组织结构定义由数字对象构成的资源库的组织结构

• 数字对象是数字图书馆中存储信息的基本逻辑单数字对象是数字图书馆中存储信息的基本逻辑单位,它进一步决定着的信息组织处理和利用方式、位,它进一步决定着的信息组织处理和利用方式、资源库的组织结构,提供了统一的互操作。资源库的组织结构,提供了统一的互操作。

• 元数据方案是数字图书馆建设的重要组成部分,元数据方案是数字图书馆建设的重要组成部分,体现在数字图书馆开发的各个环节中体现在数字图书馆开发的各个环节中– 存储存储– 检索检索– 发布发布– 管理管理

Page 57: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DCDC 元数据元数据DCDC 元数据元数据

Page 58: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DCMIDCMI(Dublin Core Metadata Initiative(Dublin Core Metadata Initiative

DCMIDCMI(Dublin Core Metadata Initiative(Dublin Core Metadata Initiative

• Dublin Core Metadata Initiative (DCMI) Dublin Core Metadata Initiative (DCMI) – An organization dedicated to fostering the widespread An organization dedicated to fostering the widespread

adoption of interoperable metadata standards and adoption of interoperable metadata standards and promoting the development of specialized metadata promoting the development of specialized metadata vocabularies for describing resources to enable more vocabularies for describing resources to enable more intelligent resource discovery systemsintelligent resource discovery systems

• MissionMission– Make it easier to find resources using the Internet Make it easier to find resources using the Internet

through the following activities:through the following activities:• Developing metadata standards for discovery across Developing metadata standards for discovery across

domains domains • Defining frameworks for the interoperation of metadata Defining frameworks for the interoperation of metadata

setssets• Facilitating the development of community- or disciplinary-Facilitating the development of community- or disciplinary-

specific metadata sets that are consistent with items 1 and specific metadata sets that are consistent with items 1 and 2 2

Page 59: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Dublin Core Metadata Element SetDublin Core Metadata Element SetDublin Core Metadata Element SetDublin Core Metadata Element Set

• Dublin Core Metadata Element Set (DCMES)Dublin Core Metadata Element Set (DCMES)– A set of 15 descriptive semantic definitionsA set of 15 descriptive semantic definitions– A core set of elements that could be shared across A core set of elements that could be shared across

disciplines or within any type of organization needing to disciplines or within any type of organization needing to organize and classify informationorganize and classify information

• Three formally endorsed versions the Dublin Core Three formally endorsed versions the Dublin Core Metadata Element Set, version 1.1:Metadata Element Set, version 1.1:– ISO Standard 15836-2003 (February 2003)ISO Standard 15836-2003 (February 2003)– NISO Standard Z39.85-2001 (September 2001)NISO Standard Z39.85-2001 (September 2001)– CEN Workshop Agreement CWA 13874 (March 2000)CEN Workshop Agreement CWA 13874 (March 2000)– Internet RFC 2413 (September 1998): first published Internet RFC 2413 (September 1998): first published

version of the Dublin Core; superseded by the above version of the Dublin Core; superseded by the above three standardsthree standards

Page 60: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Design goals for DCMESDesign goals for DCMESDesign goals for DCMESDesign goals for DCMES

• Simplicity of creation and maintenanceSimplicity of creation and maintenance– Define a small and simple metadata element set to Define a small and simple metadata element set to

allow a non-specialist to create simple descriptive allow a non-specialist to create simple descriptive records for information resources easily and records for information resources easily and inexpensively while providing for effective retrieval of inexpensively while providing for effective retrieval of those resources in the networked environment.those resources in the networked environment.

• Commonly understood semanticsCommonly understood semantics– Provide a common set of elements, the semantics of Provide a common set of elements, the semantics of

which are universally understood and supported. which are universally understood and supported. • International scopeInternational scope

– Involve representatives from virtually every continent Involve representatives from virtually every continent to ensure the development of the standard considers to ensure the development of the standard considers the multilingual and multicultural nature of the the multilingual and multicultural nature of the electronic information universe.electronic information universe.

• ExtensibilityExtensibility– Provide mechanisms for extending the DC element set Provide mechanisms for extending the DC element set

for additional resource discovery needs.for additional resource discovery needs.

Page 61: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

The 15 elementsThe 15 elementsThe 15 elementsThe 15 elements

• Type (Resource Type)Type (Resource Type)• Format (Format)Format (Format) • Identifier (Resource Identifier (Resource

Identifier)Identifier) • Source (Source)Source (Source)• Language (Language)Language (Language) • Relation (Relation)Relation (Relation) • Coverage (Coverage)Coverage (Coverage) • Rights (Rights Rights (Rights

Management)Management)

• Title (Title)Title (Title): : • Creator (Creator)Creator (Creator)• Subject (Subject and Subject (Subject and

Keywords)Keywords) • Description Description

(Description): (Description): • Publisher (Publisher)Publisher (Publisher) • Contributor Contributor

(Contributor)(Contributor) • Date (Date)Date (Date)

• All elements are optional and repeatableAll elements are optional and repeatable

Page 62: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Three components for metadataThree components for metadataThree components for metadataThree components for metadata

• Elements & SemanticsElements & Semantics– Definitions for the content of the elements, e.g., what is Definitions for the content of the elements, e.g., what is

a title, creator, etc.a title, creator, etc.– Focus of DCMESFocus of DCMES

• Content Rules – Content Rules – – Guidelines and direction for inputting the content, e.g., Guidelines and direction for inputting the content, e.g.,

what to capitalize, order of elements, etc.what to capitalize, order of elements, etc.– DCMES guidelines availableDCMES guidelines available

• SyntaxSyntax– Rules for structuring and expressing the elements for Rules for structuring and expressing the elements for

machine processingmachine processing– DCMES is syntax independentDCMES is syntax independent

Page 63: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Element name and semanticsElement name and semanticsElement name and semanticsElement name and semantics

Element Name: TitleElement Name: Title– Label: TitleLabel: Title– Semantics: A name given to the resource.Semantics: A name given to the resource.– Comment: Typically, Title will be a name by which the Comment: Typically, Title will be a name by which the

resource is formally known.resource is formally known.

• Element Name: CreatorElement Name: Creator– Label: CreatorLabel: Creator– Semantics: An entity primarily responsible for making Semantics: An entity primarily responsible for making

the content of the resource.the content of the resource.– Comment: Examples of Creator include a person, an Comment: Examples of Creator include a person, an

organization, or a service. Typically, the name of a organization, or a service. Typically, the name of a Creator should be used to indicate the entity.Creator should be used to indicate the entity.

Page 64: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DC qualifiersDC qualifiersDC qualifiersDC qualifiers

• To extend and refine the 15 elementsTo extend and refine the 15 elements• Two categories of qualifiers:Two categories of qualifiers:

– Element RefinementElement Refinement – These qualifiers make the – These qualifiers make the meaning of an element narrower or more specific. meaning of an element narrower or more specific. A refined element shares the meaning of the A refined element shares the meaning of the unqualified element, but with a more restricted unqualified element, but with a more restricted scope. scope.

– Encoding SchemeEncoding Scheme – These qualifiers identify – These qualifiers identify schemes that aid in the interpretation of an schemes that aid in the interpretation of an element value. These schemes include controlled element value. These schemes include controlled vocabularies and formal notations or parsing vocabularies and formal notations or parsing rules.rules.

Page 65: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DCMI TermsDCMI TermsDCMI TermsDCMI Terms• Authoritative specification of all metadata terms Authoritative specification of all metadata terms

related to DC, including elements, element related to DC, including elements, element refinements, encoding schemes, vocabulary termsrefinements, encoding schemes, vocabulary terms

• Maintained by the DC Usage BoardMaintained by the DC Usage Board• Contained in the DCMI Metadata RegistryContained in the DCMI Metadata Registry

DC ElementDC Element Element RefinementsElement Refinements Element Encoding Element Encoding SchemesSchemes

DateDate DateCreatedDateCreatedValidValidAvailableAvailableIssuedIssuedModifiedModifiedDate CopyrightedDate CopyrightedDate SubmittedDate Submitted

DCMI PeriodDCMI PeriodW3C-DTFW3C-DTF

Page 66: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

SyntaxSyntaxSyntaxSyntax

• DCMI avoided the syntax warsDCMI avoided the syntax wars• But interoperability?But interoperability?• Now provides specifications for Now provides specifications for

encoding DC simple and DC qualified encoding DC simple and DC qualified in:in:– HTML <meta> elementsHTML <meta> elements– XML according to DCMES XML schemasXML according to DCMES XML schemas– RDF according to DCMES RDF schemasRDF according to DCMES RDF schemas

Page 67: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Application profilesApplication profilesApplication profilesApplication profiles

• Consist of data elements drawn from one or more Consist of data elements drawn from one or more namespace schemas combined together by implementors namespace schemas combined together by implementors and optimised for a particular local application. and optimised for a particular local application.

• Application profiles are useful as they allow the Application profiles are useful as they allow the implementor to declare how they are using standard implementor to declare how they are using standard schemasschemas

• Characteristics:Characteristics:– May draw on one or more existing namespaces May draw on one or more existing namespaces – Introduce no new data elements Introduce no new data elements – May specify permitted schemes and values May specify permitted schemes and values – Can refine standard definitions Can refine standard definitions

• Application profiles enable implementors “to share Application profiles enable implementors “to share information about their schemas in order to inter-work with information about their schemas in order to inter-work with wider groupings…. Communities can start to align practice wider groupings…. Communities can start to align practice and develop common approaches by sharing their and develop common approaches by sharing their application profiles.” application profiles.”

From Heery and Patel, 2000

Page 68: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Implementations and applicationsImplementations and applicationsImplementations and applicationsImplementations and applications

• Gateway to Educational MaterialsGateway to Educational Materials– http://gem.syr.eduhttp://gem.syr.edu– improve the organization and accessibility of collections improve the organization and accessibility of collections

of educational materialsof educational materials• Monticello Electronic LibraryMonticello Electronic Library

– http://www.solinet.net/preservation/http://www.solinet.net/preservation/preservation_templ.cfm?doc_id=1062preservation_templ.cfm?doc_id=1062

– DC used to provide semantic interoperability between DC used to provide semantic interoperability between several databases of electronic media and record typesseveral databases of electronic media and record types

• open.gov.ukopen.gov.uk– http://www.open.gov.ukhttp://www.open.gov.uk– First entry point to UK public sector information on the First entry point to UK public sector information on the

internet, uses the Dublin Core RDF vocabulary to describe internet, uses the Dublin Core RDF vocabulary to describe each of the resources available on the siteeach of the resources available on the site

• Environment AustraliaEnvironment Australia– http://www.ea.gov.au/http://www.ea.gov.au/– Utilizes DC for its Web metadata and internal searchesUtilizes DC for its Web metadata and internal searches

Page 69: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Implementations and applicationsImplementations and applicationsImplementations and applicationsImplementations and applications

• Library Application ProfileLibrary Application Profile– http://www.dublincore.org/documents/2002/09/24/http://www.dublincore.org/documents/2002/09/24/

library-application-profile/library-application-profile/– Clarifies the use of DC in libraries and library-related Clarifies the use of DC in libraries and library-related

applications and projects applications and projects

• Open Archives Initiative Protocol for Metadata Open Archives Initiative Protocol for Metadata HarvestingHarvesting– http://www.openarchives.org/http://www.openarchives.org/– Uses DC simple for exposing metadata for harvestingUses DC simple for exposing metadata for harvesting

• Search and Retrieve Web ServiceSearch and Retrieve Web Service – http://www.loc.gov/srwhttp://www.loc.gov/srw– An XML-based protocol that uses DC as one of the XML An XML-based protocol that uses DC as one of the XML

schemas to transfer information from database to clientschemas to transfer information from database to client

Page 70: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Metadata packages and METSMetadata packages and METSMetadata packages and METSMetadata packages and METS

• Metadata Encoding and Transmission Metadata Encoding and Transmission Standard (METS)Standard (METS)

• A digital library standard for encoding A digital library standard for encoding descriptive, administrative, and structural descriptive, administrative, and structural metadatametadata

• Expressed using the XML schema languageExpressed using the XML schema language

Dublin Core is not intended to displace any other metadata standard. Rather it is intended to co-exist — often in the same resource description — with metadata standards that offer other semantics. It is fully expected that descriptive records will contain a mix of elements drawn from various metadata standards, both simple and complex.

from ANSI/NISO Z39.85

Page 71: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

METS structureMETS structureMETS structureMETS structure• METS Header:METS Header: Contains metadata describing the METS Contains metadata describing the METS

document itselfdocument itself• Descriptive Metadata:Descriptive Metadata: May point to descriptive metadata May point to descriptive metadata

external to the METS document or contain internally external to the METS document or contain internally embedded descriptive metadata, or both. embedded descriptive metadata, or both.

• Administrative Metadata:Administrative Metadata: Provides information regarding Provides information regarding how the files were created and stored, intellectual how the files were created and stored, intellectual property rights, etc. property rights, etc.

• File Section:File Section: Lists all files containing content which Lists all files containing content which comprise the electronic versions of the digital object. comprise the electronic versions of the digital object. 

• Structural Map:Structural Map: Outlines a hierarchical structure for the Outlines a hierarchical structure for the digital library object, and links the elements of that digital library object, and links the elements of that structure to content files and metadata that pertain to structure to content files and metadata that pertain to each element.each element.

• Structural Links:Structural Links: Records the existence of hyperlinks Records the existence of hyperlinks between nodes in the hierarchy outlined in the between nodes in the hierarchy outlined in the Structural Map. Structural Map.

• Behavior:Behavior: A behavior section can be used to associate A behavior section can be used to associate executable behaviors with content in the METS objectexecutable behaviors with content in the METS object

Page 72: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DC & Admin MD in METS documentDC & Admin MD in METS documentDC & Admin MD in METS documentDC & Admin MD in METS document

<dmdSec ID="dmd002"> <mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin Core Metadata"> <xmlData> <dc:title>Alice's Adventures in Wonderland</dc:title> <dc:creator>Lewis Carroll</dc:creator> <dc:date>between 1872 and 1890</dc:date> <dc:publisher>McCloughlin Brothers</dc:publisher> <dc:type>text</dc:type> </xmlData> </mdWrap> </dmdSec> <techMD ID="AMD001"> <mdWrap MIMETYPE="text/xml" MDTYPE="NISOIMG" LABEL="NISO Img. Data"> <xmlData> <niso:MIMEtype>image/tiff</niso:MIMEtype> <niso:Compression>LZW</niso:Compression> <niso:ScanningAgency>NYU Press</niso:ScanningAgency> </xmlData> </mdWrap> </techMD>

Page 73: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

SummarySummarySummarySummary

• Metadata is critical for:Metadata is critical for:– Resource descriptionResource description– Resource discoveryResource discovery– Management of information resourcesManagement of information resources

• DCMI provides international forum for DCMI provides international forum for identifying problems, developing identifying problems, developing understanding, and proposing solutions.understanding, and proposing solutions.

• DCMES provides metadata solutionsDCMES provides metadata solutions– For simple resource description that can be For simple resource description that can be

extended for richer resource representationsextended for richer resource representations– For interoperability of metadata through a system For interoperability of metadata through a system

of common semantics and prescribed syntaxesof common semantics and prescribed syntaxes– For expressing queries using common search For expressing queries using common search

concepts across domainsconcepts across domains

Page 74: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

ReferencesReferencesReferencesReferences• Dublin Core Metadata InitiativeDublin Core Metadata Initiative

http://www.dublincore.orghttp://www.dublincore.org• ANSI/NISO Z39.85-2001: The Dublin Core Metadata Element ANSI/NISO Z39.85-2001: The Dublin Core Metadata Element

SetSet http://www.niso.org/standards/resources/Z39-85.pdfhttp://www.niso.org/standards/resources/Z39-85.pdf

• DCMI Frequently Asked QuestionsDCMI Frequently Asked Questions http://www.dublincore.org/resources/faq/http://www.dublincore.org/resources/faq/

• Using Dublin Core (D. Hillmann)Using Dublin Core (D. Hillmann) http://dublincore.org/documents/usageguide/ http://dublincore.org/documents/usageguide/

• DCMI Schemas (XML and RDF)DCMI Schemas (XML and RDF) http://dublincore.org/schemas/http://dublincore.org/schemas/

• Application Profiles: Mixing and Matching Metadata Schemas Application Profiles: Mixing and Matching Metadata Schemas

(R. Heery and M. Patel)(R. Heery and M. Patel) http://www.ariadne.ac.uk/issue25/app-profiles/http://www.ariadne.ac.uk/issue25/app-profiles/

• Dublin Core ProjectsDublin Core Projects http://dublincore.org/projects/http://dublincore.org/projects/

Page 75: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DC Metadata Abstract ModelDC Metadata Abstract ModelDCDC 元数据抽象模型元数据抽象模型

DC Metadata Abstract ModelDC Metadata Abstract ModelDCDC 元数据抽象模型元数据抽象模型

• 元数据方案设计原则元数据方案设计原则• 完整的元数据方案组成完整的元数据方案组成• 什么是什么是 DCDC 元数据抽象模型?元数据抽象模型?• 为什么要有这个抽象模型?为什么要有这个抽象模型?• DCDC 元数据抽象模型包含哪些内容?元数据抽象模型包含哪些内容?• 如何应用该抽象模型?如何应用该抽象模型?

Page 76: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

名人手稿元数据方案的设计名人手稿元数据方案的设计 -- 通用原则通用原则名人手稿元数据方案的设计名人手稿元数据方案的设计 -- 通用原则通用原则

• 简单性与适用性原则简单性与适用性原则• 专指度与通用性原则专指度与通用性原则• 互操作性与易转换性原则互操作性与易转换性原则• 灵活性与可扩展性原则灵活性与可扩展性原则• 用户需求原则用户需求原则• 遵循现有标准原则遵循现有标准原则

Page 77: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

名人手稿元数据方案的设计名人手稿元数据方案的设计 -- 具体原则具体原则名人手稿元数据方案的设计名人手稿元数据方案的设计 -- 具体原则具体原则

• 资源分析原则资源分析原则• 扩展原则扩展原则包括元素扩展原则和修饰限定原则包括元素扩展原则和修饰限定原则

• 元素定义原则元素定义原则• 置标原则置标原则• 系统实现和其他应用原则系统实现和其他应用原则

Page 78: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据完整体系设计元数据完整体系设计 (( 数字化项目数字化项目 ))元数据完整体系设计元数据完整体系设计 (( 数字化项目数字化项目 ))

• 资源对象的描述方案;资源对象的描述方案;• 管理元数据方案;管理元数据方案;• 元数据置标方案;元数据置标方案;• 资源集合元数据方案;资源集合元数据方案;• 元数据体系映射方案;元数据体系映射方案;• 资源的著录方案;资源的著录方案;• 技术实现方案。技术实现方案。 上海图书馆名人手稿元数据方案的设计可详见上海图书馆名人手稿元数据方案的设计可详见 20042004年年第第 44 期的期的《《图书馆杂志图书馆杂志》》或上海图书馆“数字图书馆研或上海图书馆“数字图书馆研究资源网站”究资源网站” 20042004年的研究报告年的研究报告

Page 79: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DCDC 元数据的描述对象:资源 的抽象模型元数据的描述对象:资源 的抽象模型DCDC 元数据的描述对象:资源 的抽象模型元数据的描述对象:资源 的抽象模型• 每个资源每个资源 ((resourceresource)) 具有零个或多个属性具有零个或多个属性 ((propertiesproperties)) ;;• 每个属性每个属性 ((propertyproperty)) 具有一个或多个值具有一个或多个值 ((valuesvalues)) ;;• 每个值每个值 ((valuevalue) ) 本身是一个资源本身是一个资源 ((resourceresource)()( 即:用来描述资源,与属性相关即:用来描述资源,与属性相关

的物理或概念实体。的物理或概念实体。 )) ;;• 每个资源每个资源 ((resourceresource)) 可以是一个或多个类可以是一个或多个类 ((classesclasses)) 中的成员;(注:作为属中的成员;(注:作为属

性值的资源所在的类性值的资源所在的类 ((classclass)) 常被称为编码体系词表常被称为编码体系词表 ((vocabulary encoding vocabulary encoding schemescheme)) ););

• 每个属性每个属性 ((propertyproperty)) 和类和类 ((classclass)) 均均具有其被声明的语义; 具有其被声明的语义;

• 每个类每个类 ((classclass)) 通过限定(子类)关通过限定(子类)关系与一个或多个其它类相关系与一个或多个其它类相关 (( 当两个当两个类共享部分语义类共享部分语义 ((semanticssemantics)) 时,所时,所有属于子类有属于子类 ((sub-classsub-class)) 的资源的资源((resourceresource)) 同时也是另一个相关类同时也是另一个相关类((classclass)) 的成员;的成员;

• 每个属性只能与一个其它属性通过限每个属性只能与一个其它属性通过限定关系(子属性)相关(当两种属性定关系(子属性)相关(当两种属性共享部分语义时,子属性的的有效值共享部分语义时,子属性的的有效值也就是相关属性的有效值)。也就是相关属性的有效值)。

Page 80: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DCDC 元数据描述的抽象模型元数据描述的抽象模型DCDC 元数据描述的抽象模型元数据描述的抽象模型• 一个条描述一个条描述 (description)(description) 是由一个或多个陈述是由一个或多个陈述 (statements)(statements) (该陈述仅与(该陈述仅与

一个且唯一一个资源有关),以及零个或一个资源的一个且唯一一个资源有关),以及零个或一个资源的 URIURI 组成(组成( URIURI 用来标识用来标识所描述的资源);所描述的资源);

• 每个陈述由一个属性每个陈述由一个属性 URIURI (这里的(这里的 URIURI 用于标识一个属性),零个或一个值用于标识一个属性),零个或一个值URIURI (这里的(这里的 URIURI 用于标识属性的值),零个或一个编码体系用于标识属性的值),零个或一个编码体系 URIURI (这里的(这里的URIURI 标识值的类),零个或多个值的表述标识值的类),零个或多个值的表述 (representations)(representations) 组成;组成;

• 每个属性都是被描述资源的一项特性;每个属性都是被描述资源的一项特性;• 每个属性每个属性 URIURI 可以在多个陈述中重复;可以在多个陈述中重复;• 值的表述值的表述 (value representation)(value representation) 可以是字串值可以是字串值 (value string)(value string) 、复合值、复合值

(rich value)(rich value) 或相关描述或相关描述 (related description)(related description) 等形式;等形式;• 每个字串值都是一个简单的、人类可读的字符串,用以表示属性的值;每个字串值都是一个简单的、人类可读的字符串,用以表示属性的值;• 每个字串值可以有相应的编码体系每个字串值可以有相应的编码体系 URI( encoding scheme URI)URI( encoding scheme URI) ,用来标识,用来标识

一个语法编码体系;一个语法编码体系;• 每个字串值可以有相应的字串语种每个字串值可以有相应的字串语种 (value string language)(value string language) ,它是一个,它是一个 ISOISO

语种标记(例如,语种标记(例如, en-GBen-GB ););• 每个复合值每个复合值 (rich value)(rich value) 是一些标记文本、图像、视频、音频等,或者它们的是一些标记文本、图像、视频、音频等,或者它们的

组合,表示作为属性值的资源;组合,表示作为属性值的资源;• 每条相关资源描述都是一个用来描述属性值的资源。 每条相关资源描述都是一个用来描述属性值的资源。

Page 81: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

补充说明:补充说明: DCDC 元数据描述的抽象模型元数据描述的抽象模型补充说明:补充说明: DCDC 元数据描述的抽象模型元数据描述的抽象模型

• 一条“相关描述”描述一个相关的资源,因一条“相关描述”描述一个相关的资源,因此并非是“描述”的一部分,例如,当一个此并非是“描述”的一部分,例如,当一个人是所描述资源的创建者时,一条相关描述人是所描述资源的创建者时,一条相关描述可以提供关于这个“人”的元数据。可以提供关于这个“人”的元数据。

• 在某些语境在某些语境 (Context)(Context)中,语法编码体系也中,语法编码体系也可以认为是某种“数据类型”可以认为是某种“数据类型”

• 在在 DCMIDCMI 元数据描述中,所描述资源的类通元数据描述中,所描述资源的类通常由常由 DCDC 类型属性的值来描述。类型属性的值来描述。

Page 82: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

DCDC抽象模型抽象模型 UMLUML 图示图示DCDC抽象模型抽象模型 UMLUML 图示图示

Page 83: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

““记录”与“值”记录”与“值”““记录”与“值”记录”与“值”

一条一条 DCMIDCMI 元数据记录是一条或多条元数据记录是一条或多条描述的集合,这些描述是关于一个或描述的集合,这些描述是关于一个或多个相关资源的,这些资源根据某个多个相关资源的,这些资源根据某个DCMIDCMI 置标指南实例化(这些置标指南置标指南实例化(这些置标指南有 :有 : XHTML meta tags, XML, XHTML meta tags, XML, RDF/XML, RDF/XML, 等等等等 ))

一个一个 DCMIDCMI 元数据值是物理的或者概元数据值是物理的或者概念的实体,当描述一个资源时,这个念的实体,当描述一个资源时,这个实体就成为该资源的属性。 实体就成为该资源的属性。

Page 84: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

简单简单 DCDC 和限定和限定 DCDC简单简单 DCDC 和限定和限定 DCDC

• 简单简单 DCDC记录:记录:– 遵从抽象模型遵从抽象模型– 仅由一条描述组成仅由一条描述组成– 仅使用仅使用 DCDC 元数据元素集元数据元素集 [DCMES][DCMES]中的中的 1515个个

属性 属性 – 不使用不使用 URIURI 值,编码体系,复合值或相关描述值,编码体系,复合值或相关描述

• 限定限定 DCDC记录:记录:– 遵从遵从 DCMIDCMI抽象模型抽象模型– 至少包含一个来自于至少包含一个来自于 DCMIDCMI 元数据术语推荐表元数据术语推荐表

[DCTERMS][DCTERMS]中的属性 中的属性

Page 85: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

向上兼容(向上兼容( Dump DownDump Down )原则)原则向上兼容(向上兼容( Dump DownDump Down )原则)原则元素(属性)向上兼

容值向上兼容

非预设( Uninformed)

忽略任何不属于 DC元数据元素集的属性。

使用 URI值(如果存在)或字串值作为新字串值。

预设( Informed) 递归地解决子属性关系,直到 DC元数据元素集 15个属性中的一个。否则就忽略。

用相关描述或字串值的知识来构造新的字串值。

• 并且在任何情况下,向上兼容算法都应该:并且在任何情况下,向上兼容算法都应该:– 忽略任何相关描述和复合值 忽略任何相关描述和复合值 – 忽略任何编码体系忽略任何编码体系 URIURI

Page 86: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

WhyWhyWhyWhy

• 明确概念,例如明确概念,例如 DCDC 的描述对象、描述单元、限定的描述对象、描述单元、限定方式等等;方式等等;

• (在一套概念术语的基础之上)提供一个抽象的数(在一套概念术语的基础之上)提供一个抽象的数据模型(概念的坐标参照系),以便在不同的元数据模型(概念的坐标参照系),以便在不同的元数据方案(如果都采用或宣称采用基于据方案(如果都采用或宣称采用基于 DCDC 的方案或的方案或者者 APAP )之间获得共同的理解;)之间获得共同的理解;

• 独立于特定的编码语法,约束和补充置标方案的不独立于特定的编码语法,约束和补充置标方案的不足;足;

• 深入理解编码对象的属性,实现元素的映射、翻译深入理解编码对象的属性,实现元素的映射、翻译和转换,从而实现元数据方案的共享和重用;和转换,从而实现元数据方案的共享和重用;

• 在语义层实现元数据应用系统(数字图书馆)的互在语义层实现元数据应用系统(数字图书馆)的互操作操作

Page 87: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

Metadata Application ProfileMetadata Application Profile元数据应用纲要元数据应用纲要

Metadata Application ProfileMetadata Application Profile元数据应用纲要元数据应用纲要

• 什么是元数据应用纲要?什么是元数据应用纲要?• 为什么要提出元数据应用纲要?为什么要提出元数据应用纲要?• 元数据应用纲要的具体内容是什么?元数据应用纲要的具体内容是什么?• 除了除了 DCMIDCMI ,还有哪些元数据标准维,还有哪些元数据标准维护机构支持元数据应用纲要?护机构支持元数据应用纲要?

• 如何应用元数据应用纲要?如何应用元数据应用纲要?

Page 88: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

来源来源来源来源

• 作为一种元数据方案(作为一种元数据方案( metadata metadata schemaschema )的形式被引入;)的形式被引入;

• 对于应用不同元数据标准的内容和方对于应用不同元数据标准的内容和方法进行一定程度的规范;法进行一定程度的规范;

• 思想来自于思想来自于 Warwick Framework:Warwick Framework:不同元素可以集成在一个包中描述一不同元素可以集成在一个包中描述一个资源;个资源;

Page 89: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

为什么要用为什么要用 APAP为什么要用为什么要用 APAP

• 元数据方案重用元数据方案重用• 标准化标准化• 互操作互操作• 简便易行简便易行

Page 90: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

内容内容内容内容• 欧洲标准见:欧洲标准见: CEN CWA14855CEN CWA14855• 定义所要描述的资源属性,并采用定义所要描述的资源属性,并采用 ERER 分析方法明确所要描述的资源对象;分析方法明确所要描述的资源对象;• 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不

同的元数据标准规范(不同命名域);同的元数据标准规范(不同命名域);• 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某

种程度的限定,但是不能扩大或交叉;种程度的限定,但是不能扩大或交叉;– 可以规定元素的编码规则;可以规定元素的编码规则;– 可以规定元素的值的约束;可以规定元素的值的约束;– 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等可以规定其他约束:是否必选、可重复、取值范围、数据类型等等

• 如果需要增加“新”的元素,必须自己建立命名域并维护这些新的元素组成如果需要增加“新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;的元数据方案;

• 编码规则(制定置标方案)(机读);编码规则(制定置标方案)(机读);• 编写有关应用文档(人读)编写有关应用文档(人读)

参见: http://www.ariadne.ac.uk/issue25/app-profiles/ http://www.cultivate-int.org/issue3/schemas/

Page 91: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

为什么要用命名域为什么要用命名域为什么要用命名域为什么要用命名域

• 推荐采用具有命名域的元数据规范有如下考推荐采用具有命名域的元数据规范有如下考虑,命名域提供了一种机制,能够:虑,命名域提供了一种机制,能够:– 标识元数据元素的管理机构,具有一定的权威性;标识元数据元素的管理机构,具有一定的权威性;– 支持元素的原有语义定义支持元素的原有语义定义 ; ; – 保证元素概念的“唯一性” 以及与相关概念的保证元素概念的“唯一性” 以及与相关概念的

关系。关系。

Page 92: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

制订制订 APAP 的过程的过程制订制订 APAP 的过程的过程

各有不同,但共性如下:各有不同,但共性如下:• 根据资源类型和系统开发需要,定义元数据及数根据资源类型和系统开发需要,定义元数据及数

据元素需求据元素需求• 选择现有的最合适的元数据标准规范(元数据元选择现有的最合适的元数据标准规范(元数据元

素集)素集)• 复用标准的元素,根据目标系统的需要赋予特定复用标准的元素,根据目标系统的需要赋予特定

的语义(仅缩小语义,不扩大、改变),制订著的语义(仅缩小语义,不扩大、改变),制订著录规则并考虑应用规范词表 录规则并考虑应用规范词表

• 扩展元素扩展元素 //限定并进行定义,赋予本地的命名域限定并进行定义,赋予本地的命名域进行管理进行管理

Page 93: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

支持抽象模型的元数据机构支持抽象模型的元数据机构支持抽象模型的元数据机构支持抽象模型的元数据机构

• DCMIDCMI– DC-LibDC-Lib– DC-EdDC-Ed

• MARCMARC• DOIDOI• IEEE/LOM IEEE/LOM

Page 94: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

APAP 的问题的问题APAP 的问题的问题

• 不同元数据元素的一致性问题;不同元数据元素的一致性问题;• 元数据标准更新的同步问题;元数据标准更新的同步问题;• 编码体系等修饰词的维护、更新问题;编码体系等修饰词的维护、更新问题;• 应用纲要的标准化问题应用纲要的标准化问题• 完全的形式化是否有可能?完全的形式化是否有可能?

Page 95: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

元数据注册体系元数据注册体系元数据注册体系元数据注册体系

• 什么是元数据注册系统?什么是元数据注册系统?• 为什么要注册?为什么要注册?• 目前有哪些注册系统?目前有哪些注册系统?• DCDC 注册系统的现状和功能注册系统的现状和功能• 相关标准:相关标准: ISO11179ISO11179

Page 96: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

什么是元数据注册系统什么是元数据注册系统什么是元数据注册系统什么是元数据注册系统

• 元数据注册系统(又叫登记系统, Metadata Registry MR )是对元数据的定义信息、置标方案、转换规则、著录规则、应用指南等规范进行发布登记管理和检索的系统;

• 支持 Internet环境中元数据规范的发现、识别、调用以及在此基础上的元数据转换挖掘和复用。

Page 97: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

需要注册系统的原因需要注册系统的原因需要注册系统的原因需要注册系统的原因

• 提供开放的管理机制提供开放的管理机制• 元数据方案重用元数据方案重用• 标准化标准化• 支持支持 Semantic Web ServiceSemantic Web Service 架构架构

Page 98: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

目前的注册系统目前的注册系统目前的注册系统目前的注册系统

• DCMI Open Metadata RegistryDCMI Open Metadata Registry• ROADS Metadata RegistryROADS Metadata Registry• DESIRE Metadata RegistryDESIRE Metadata Registry• GERMAN METADATA REGISTRYGERMAN METADATA REGISTRY• CSDL CSDL 元数据登记政策与登记系统元数据登记政策与登记系统(( 建设中建设中 ))

• UDDIUDDI

Page 99: 第二讲  信息资源组织方法 第六章  元数据方法

北京大学研究生课程进修班 2005 上海

注册系统当前发展简评注册系统当前发展简评注册系统当前发展简评注册系统当前发展简评

• 人工系统为主人工系统为主– 人工登录人工登录– ““ 以人为本”的功能设定(查询以人为本”的功能设定(查询 // 浏览);浏览);

• 静态服务为主,通常涉及元素和方案两个层静态服务为主,通常涉及元素和方案两个层次,对命名域中的元素进行一定的分类,具次,对命名域中的元素进行一定的分类,具有对元素、置标方案和各类其它文档的浏览、有对元素、置标方案和各类其它文档的浏览、查询和链接功能;查询和链接功能;

• 元素与各类元数据应用相关文档登记,供一元素与各类元数据应用相关文档登记,供一定范围内(例如课题组或一个系统)的重用定范围内(例如课题组或一个系统)的重用和参考和参考