元数据标准MODS的发展及应用
- 格式:doc
- 大小:28.00 KB
- 文档页数:4
元数据的标准一、引言元数据是描述数据的数据,它提供了关于数据的信息,包括数据的属性、结构、来源、格式等。
元数据的标准化是确保数据质量、数据集成和数据共享的重要手段。
本文将介绍元数据的标准格式,包括元数据的定义、分类、要素和规范等内容。
二、元数据的定义元数据是对数据进行描述和解释的信息,它包括数据的属性、结构、来源、格式、关系等。
元数据可以匡助用户了解数据的含义和特征,提高数据的可理解性和可管理性。
三、元数据的分类根据元数据的用途和对象,可以将元数据分为三类:技术元数据、业务元数据和管理元数据。
1. 技术元数据:用于描述数据的技术特性,包括数据的结构、格式、存储方式、访问权限等。
技术元数据主要面向数据管理和数据处理人员。
2. 业务元数据:用于描述数据的业务含义和用途,包括数据的定义、业务规则、数据质量要求等。
业务元数据主要面向业务用户和决策者。
3. 管理元数据:用于管理和组织元数据的信息,包括元数据的命名规则、版本控制、权限管理等。
管理元数据主要面向元数据管理员和数据管理平台。
四、元数据的要素元数据包括多个要素,每一个要素用于描述数据的一个方面。
常见的元数据要素包括:1. 标识符:用于惟一标识数据或者数据集,通常使用统一资源标识符(URI)或者全局惟一标识符(GUID)。
2. 名称:用于描述数据的名称,通常是一个短语或者词汇。
3. 定义:用于解释数据的含义和特征,提供对数据的理解和解释。
4. 类型:用于描述数据的类型,例如文本、数字、日期等。
5. 结构:用于描述数据的结构和组织方式,例如表格、树形结构、关系模型等。
6. 格式:用于描述数据的存储格式和编码方式,例如CSV、XML、JSON等。
7. 来源:用于描述数据的来源和采集方式,例如数据库、传感器、人工输入等。
8. 更新频率:用于描述数据的更新频率,例如每日更新、实时更新等。
9. 所有者:用于描述数据的所有者和责任人,通常是一个组织或者个人。
10. 访问权限:用于描述数据的访问权限和安全要求,例如公开访问、仅限内部访问等。
元数据基础知识:Microsoft® SQL Server™ 2000 Meta Data Services 是一系列使您得以管理元数据的服务。
要使用Microsoft Meta Data Services,需要先了解元数据的特点。
如果不了解元数据的概念,本概述会帮助您了解Meta Data Services 所管理的数据类型。
元数据描述数据的结构和意义,就象描述应用程序和进程的结构和意义一样。
切记:元数据是抽象概念,具有上下文,在开发环境中有多种用途。
元数据是抽象概念当人们描述现实世界的现象时,就会产生抽象信息,这些抽象信息便可以看作是元数据。
例如,在描述风、雨和阳光这些自然现象时,就需要使用"天气"这类抽象概念。
还可以通过定义温度、降水量和湿度等概念对天气作进一步的抽象概括。
在数据设计过程中,也使用抽象术语描述现实世界的各种现象。
人们把人物、地点、事物和数字组织或指定为职员、顾客或产品数据。
在软件设计过程中,代表数据或存储数据的应用程序和数据库结构可以概括为开发和设计人员能够理解的元数据分类方案。
表或表单由对象派生出来,而对象又由类派生。
在元数据中有多个抽象概念级别。
可以描述一个数据实例,然后对该描述本身进行描述,接着再对后一个描述进行描述,这样不断重复,直到达到某个实际限度而无法继续描述为止。
通常情况下,软件开发中使用的元数据描述可扩展为二至三级的抽象概念。
比如"loan table" 数据实例可以描述为数据库表名。
数据库表又可以描述为数据库表对象。
最后,数据库表对象可以用一个抽象类描述,该抽象类确定所有派生对象都必须符合的固定特征集合。
元数据具有上下文人们通常把数据和元数据的区别称为类型/实例区别。
模型设计人员表述的是类型(如各种类或关系),而软件开发人员表述的是实例(如Table 类或Table Has Columns 关系)。
元数据的标准元数据的标准格式一、引言元数据是描述数据的数据,它提供了数据的定义、结构、属性以及与其他数据之间的关系。
标准化的元数据格式对于数据的管理、共享和交换至关重要。
本文将介绍元数据的标准格式,包括元数据的定义、元数据标准的目的和重要性,以及常见的元数据标准格式。
二、元数据的定义元数据是指描述数据的属性、特征、结构和关系的数据。
它提供了数据的语义信息,帮助用户理解数据的含义和用途。
元数据可以包括数据的名称、类型、格式、单位、范围、来源、创建时间、更新时间等信息。
三、元数据标准的目的和重要性1. 目的元数据标准的目的是为了规范元数据的格式和内容,提高数据的可管理性、可共享性和可交换性。
通过统一的元数据标准,可以减少数据管理的复杂性,提高数据的质量和可信度。
2. 重要性元数据标准的重要性体现在以下几个方面:- 数据管理:元数据标准可以帮助组织对数据进行有效管理,包括数据的采集、存储、清洗、分析等过程。
- 数据共享:元数据标准可以提供数据的共享和交换的基础,不同组织和系统之间可以通过遵循相同的元数据标准来实现数据的互操作性。
- 数据分析:元数据标准可以帮助用户理解数据的结构和含义,从而更好地进行数据分析和挖掘。
- 数据质量:元数据标准可以提供数据质量的评估和管理的依据,帮助组织提高数据的准确性、完整性和一致性。
四、常见的元数据标准格式1. Dublin Core(DC)Dublin Core是一种广泛应用的元数据标准,它定义了15个基本元数据元素,包括标题、作者、主题、描述、日期、类型、格式等。
Dublin Core适用于各种类型的文档和资源。
2. Metadata Object Description Schema(MODS)MODS是一种用于描述文档和资源的元数据标准,它基于XML语言,包括标题、作者、主题、摘要、日期、格式等元数据元素。
MODS可以适用于各种类型的文档和资源。
3. Metadata Encoding and Transmission Standard(METS)METS是一种用于描述复杂数字对象的元数据标准,它基于XML语言,包括结构、内容、行为等元数据元素。
图书馆理论与实践图书馆数字化技术平台2009(11)●李丹,,向菁2(1.国家图书馆数字资源部,北京l()008l;2.中国科学院国家科学图书馆,北京100190))协作与实践:数字资源长期保存工具及方法——2008年数字资源长期保存国际会议(iPRES2008)综述[关键词】数字资源;长期保存;协作;保存工具;iPRES2008[摘要】系统而全面地回顾iPRES2008数字资源长期保存国际会议。
从数字资源长期保存规划与政策、相关技术问题、成本与危机管理、服务提供商信任建立、数字保存服务体系五个方面介绍目前研究和实践进展情况,分析并总结已有的经验和教训,并就面临的问题和下一步发展进行探讨。
[中图分类号]G250.76;G253[文献标志码]B[文章编号】1005--8214(2009)Il—0070—03继2004、2007年北京,2005年德国,2006年北美成功举办之后,2008年9月2卜30日,数字资源长期保存领域的主流国际性系列会议iPRES(Intema—tionalConfevence011PresexvationofDigitalObjects)第五届会议在大英图书馆举行.会议吸引了来自33个国家的250余名参会人员,为相关专家和研究人员提供了一个盛大的交流和学习平台。
近年来,数字资源长期保存领域经历了从基础理论研究到个体实验、最佳实践及联合行动的发展过程,iPRES的研讨内容不断拓展和深入,吸引了越来越多的机构和学者的关注。
2004年的首次国际对话,主要商讨了数字资源长期保存的基本问题,在对长期保存的内涵和外延达成一定共识的基础上开始了长期保存的实验和国际合作。
此后。
各个实验项目在不同的处理过程中遇到了相应的阶段性问题,这些问题在2005、2006年会议中受到了关注,如工作流、元数据、知识技术、认证、知识库、保存服务和项目管理等。
2007年则围绕具体项目和实践经验,探讨数字资源长期保存的战略计划与基础设施、相关管理问题、技术研究与实践、认证与评估、教育与培训等。
元数据标准MODS的发展及应用
【摘要】本文论述了元数据标准MODS的内涵、特点及其使用的基本原则,介绍了国外MODS近期应用的一些项目。
【关键词】元数据;MODS;数字图书馆
【Abstract】This paper expounds the concept and characteristics of MODS metadata and introduces the recent application situation of MODS abroad.
【Key words】Metadata;MODS;Digital library
The Development and Application of MODS Metadata
0 前言
到目前为止,描述图书馆资源的元数据标准主要由设计于20世纪60年代的MARC(Machine Readable Cataloge)担当。
人们普遍使用的MARC格式虽然产生比较早,著录格式也修改得越来越完善,但MARC格式过于复杂、繁琐。
随着现代信息技术的发展和普及,为了方便人们通过网络来直接存取图书馆资源,数字图书馆的建设被提上日程,而其中的元数据方案多采用DC(Dublin Core)。
尽管DC较为简单,著录方式也较为容易,但在应用过程中遇到了不少问题,难以满足图书馆文献著录的需要。
同时,用DC描述Web资源中多种多样的资源类型还存在许多有待解决的问题。
MODS就是针对DC和MARC描述图书馆资源存在的不足而开发出来的。
1 MODS的概念
MODS(Metadata Object Description Schema,元数据对象描述模式)是美国国会图书馆于2002年6月开发出的,是继MARC之后的第二种以MARC为基础的文献编目元数据。
MODS的元素来自MARC21的字段,是MARC21的一个子集。
它采用XML作为编码语言,是MARC21的XML简略版。
MODS的第一版MODS1.0颁布之后的版本有MODS2.0、MODS3.0和MODS3.1,目前最新的版本是2006年6月1日公布的MODS3.2版。
MODS以MARC21的元素和语义学为基础,不是简单地将MARC数据XML化,而是有所创新,但它的设计主要是针对图书馆资源,也可为各种目的使用,适于网络环境下多种信息资源的描述,是在立足现实的基础上扬弃传统、面向未来而开发的一种新的文献编目元数据。
2 传统图书馆资源组织方式的弊端
2.1 MARC存在的主要缺陷
MARC产生于20世纪60年代,是图书馆文献资源组织的重要工具,也是世界上流行最广的书目数据标准。
随着信息技术的迅猛发展,特别是电子资源的出现,MARC缺陷日益显露出来,主要表现在:(1)受制于卡片目录的思维。
(2)繁杂的规定阻碍了著录的规范化。
(3)拘泥于传统编码格式。
(4)FRBR对MARC 产生了巨大的冲击。
国际图联于1998年正式推出FRBR报告,是国际编目原则和编目思维模式上的重大突破,FRBR认为编目对象不能停留在传统的平面层次上,应根据用户的需求将编目对象分成若干层次,它揭示了隐匿在编目对象中的深层次关系,形成一个立体的元数据模型,已经成为人们设计、考察和评估元数据的一个研究框架。
2.2 DC存在的主要缺陷
DC作为一种通用的元数据标准,目前在很多数字图书馆项目中被用来描述文本信息,但正是其通用性和简单性使它在描述文本信息,特别是图书馆馆藏时存在诸多缺点。
首先是它的不完整性。
DC元素没有被有效地限定,对许多应用不适合。
其次,没有一套广泛接受的使用说明。
带来的后果是每一个应用DC的组织或机构都要对它进行自己的说明,不但重复劳动,而且造成说明的不一致。
对于一个元数据标准来说这是一个致命的缺点,影响其应用。
第三个缺点实际上是它前两个缺点的结果:一个组织或机构应用DC的速度非常慢,特别对于图书馆来说,用起来不但困难,而且代价比较高,因此它不是图书馆描述馆藏方便且好用的标准。
3 国外有关MODS的应用项目
3.1 澳大利亚国家书目数据库元数据项目(Australian National Biblio- graphic Database Metadata Project)
澳大利亚国家图书馆主办,将原DC数据格式转换为MODS,再转换为MARC,最终全部转入澳大利亚国家书目资料库,该项目也支持OAI-PMH,已于2004年完成。
3.2 音、视频原型项目(A V Prototype Project)
由美国国会图书馆发起,其目的是探索视频和音频资源的数字化保存方案。
该项目和美国国会图书馆的其它项目一起来设计一个文献信息库系统,该系统用来支持视频和音频资源的存储、维护和传递。
该项目的核心是元数据的产生,其中大部分元数据是在它生成时直接抓取过来,随后再转换为XML文档。
这个项目用METS标准来封装数字对象和它的元数据。
当前,METS的描述性元数据采用MODS方案。
对于图书馆资源库中已经有MARC书目数据的对象,直接转换为MODS,其中的数据丢失将会很小;对于没有原始元数据的资源对象则直接用MODS模版。
3.3 经典幻灯片收集项目(Classics Slide Collection)
凯斯西储大学的凯尔文史密斯图书馆主办,该项目主要搜集关于希腊、罗马艺术的3000张数字幻灯片,并利用MODS作为每一张TIF和JPEG200图形格式的元数据。
该项目是凯斯西储大学“Digital Case”数字典藏计划的一部分,已于2006年上半年完成。
3.4 MINERV A(Mapping the Internet:Electronic Resources Virtual Archive)项目这是一个网络资源保存计划,其目的是支持人们开放式地定位、选择和保存网络资源。
该项目的运作由美国国会图书馆连同the Internet Archive (Alexa)、SUNY、the University of Washington一起向社会各组织机构及个人扩展。
网络资源的元数据生成将依据MODS标准,MODS记录不但用于该项目的检索系统,还要将其转换为MARC记录,加入到图书馆的在线书目数据库中。
图书馆准备实验性地用METS来提供更多的元数据,比如保存和管理元数据等。
美国国会图书馆的网络发展部和MARC标准办公室正在开发直接生成MODS记录的工具。
3.5 Copac学术目录(Copac Academic Catalogue)
英国曼彻斯特大学发起,COPAC是一个联合目录,主要提供英国和爱尔兰24家大学研究图书馆的联合在线目录,还包括英格兰图书馆与苏格兰国家图书馆的目录。
COPAC的书目格式为CURLMARC21,该项目计划将其全部转换为MODS格式,从2005年项目实施开始,目前已取得了相当进展。
3.6 印地安那州片音乐项目(In Harmony:Sheet Music from Indiana)
由美国印地安那州的多所大学、博物馆和历史研究所参加的印地安那州数字图书馆计划。
该计划将收集超过10000种音乐数字对象,这些音乐或其主题与印地安那州有关,或其作者来自该州。
为了使参与合作的院校、博物馆和研究所能够充分共享这些数字资源,该计划将使用MODS作为数字对象的元数据标准,预计于2007年完成。
从以上应用中可以看出,目前世界各国图书馆界都在探索如何能更好地揭示和组织网络化数字化信息资源的目录元数据。
总之,MODS标准是符合数字图书馆和有关机构的愿望和要求而产生的适合在Web上运行的元数据,是图书馆学界描述数字化资源的又一次创新,它的出现必将有利于促进我国信息资源编目元数据规则的科学化、规范化和标准化。
【参考文献】
[1]The Library of Congress. Metadata Object Description Schema[EB/OL].[2009-05-16]. http://www. loc. gov/standards/mods/mods -overview.Html.
[2]The Library of Congress. Outline of elements and attributes in MODS version
3.3[EB/OL].[2009-05-16].http:///standards/mods/mods-outline.html.
[3]吴万晔.论MARC元数据的缺陷及发展趋势[J].图书馆工作与研究,2006(2):28-29.
[4]王妙娅,李小梅.新的元数据标准MODS及其应用[J].情报杂志,2004(11):82-83.
[5]李世玲,李素喜.MODS与MARC、DC之比较研究[J].现代情报,2006(6):138.
[6]王小平.浅析MODS元数据[J].图书馆论坛,2008(5):65-67,70.
[7]高嵩.MODS与MARC的互操作分析[J].现代图书情报技术,2006(2):72-75.。