都柏林核心元数据集(Dublin Core Metadata)
都柏林元数据采集标准,即都柏林核心(Dublin Core),是一套广泛采用的元数据元素集,用于描述和发现网络资源。
相关链接:中国图书馆图书分类法22个大类
定义与起源
都柏林核心(Dublin Core)是一套元数据元素集,由国际图书馆电脑中心(OCLC)在1995年美国俄亥俄州都柏林提出,旨在描述网上的信息,实际上可以描述一切信息。
都柏林核心元数据集(Dublin Core Metadata)是由OCLC与美国国家超级计算机应用中心于1995年3月联合发起的网络资源描述框架。
该数据集包含15个核心元素,分为内容描述、资源形态和知识产权三大类,通过可扩展标记语言(XML)等技术实现数字资源的标准化描述。
作为国际标准化组织(ISO)发布的元数据管理标准,其广泛应用于图书馆情报检索、数字资源组织及跨领域信息共享,并成为我国数字图书馆建设项目的重要技术基础
都柏林核心元数据集的元素构成
都柏林核心在简化形式中包含15个元素,这些元素包括:
题名(Title)、创建者(Creator)、主题(Subject)、描述(Description)、出版者(Publisher)、类型(Type)、格式(Format)、来源(Source)、语言(Language)、关联(Relation)、覆盖范围(Coverage)、标识符(Identifier)、权限(Rights)和贡献者(Contributor)。
再进一步细分,可以分为三个类别:
- 内容描述类:题名(Title)、创建者(Creator)、主题及关键词(Subject and Keywords)、描述(Description)等
- 资源形态类:日期(Date)、类型(Type)、格式(Format)等
- 知识产权类:出版者(Publisher)、其他责任者(Contributor)等
如下表所示:
属性 | 定义 |
---|---|
Contributor | 一个负责为资源内容作出贡献的实体(如作者)。 |
Coverage | 资源内容的氛围或作用域 |
Creator | 一个主要负责创建资源内容的实体。 |
Format | 物理或数字的资源表现形式。 |
Date | 在资源生命周期中某事件的日期。 |
Description | 对资源内容的说明。 |
Identifier | 一个对在给定上下文中的资源的明确引用 |
Language | 资源智力内容所用的语言。 |
Publisher | 一个负责使得资源内容可用的实体 |
Relation | 一个对某个相关资源的引用 |
Rights | 有关保留在资源之内和之上的权利的信息 |
Source | 一个对作为目前资源的来源的资源引用。 |
Subject | 一个资源内容的主题 |
Title | 一个给资源起的名称 |
Type | 资源内容的种类或类型。 |
都柏林核心(Dublin Core, DC)元数据元素集特点
• 简易:都柏林核心只有15个元素,通俗易懂。
• 通用:不针对某个特定的学科或领域,支持对任何内容的资源进行描述。
• 可选择性:著录项目可以简化,只要确保最低限度的7个元素(题名、出版者、形式、类型、标识符、日期和主题)就可以了。
技术实现与应用场景
都柏林核心元数据集采用可扩展标记语言(XML)实现技术层面的结构化描述,利用资源描述框架(RDF)增强元数据互操作性。
其技术特点体现为定义明确的最小元素集,允许通过扩展修饰词适应不同应用场景。
在数字图书馆领域,该元数据集被用于电子图书编目,相较于传统MARC格式更具简洁性和跨平台兼容性。
截止2022年,我国国家图书馆、CALIS等项目已实现DC元数据的本地化应用,解决中文语义映射问题 。
相关链接
企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程