数字图书馆与元数据及多媒体.pptx
- 格式:pptx
- 大小:2.90 MB
- 文档页数:93
图书管理员如何进行图书馆的数字化馆藏整理与展示近年来,随着科技的飞速发展和数字化浪潮的涌现,图书馆的数字化馆藏整理与展示变得越来越重要。
作为图书馆中的重要角色,图书管理员在数字化时代中起着举足轻重的作用。
本文将以图书管理员的视角,探讨如何进行图书馆的数字化馆藏整理与展示。
一、数字化馆藏整理数字化馆藏整理是将传统的纸质文献转化为数字形式,并将其整理存放在图书馆的数据库中。
下面将介绍数字化馆藏整理的步骤。
1. 数字化采集:图书管理员首先需要进行数字化采集工作。
这包括利用扫描设备将纸质文献转化为电子格式,并利用光学字符识别(OCR)技术将纸质文献中的文字转化为可编辑的电子文本。
2. 数据库建设:将采集到的电子文献整理存放在图书馆的数据库中。
图书管理员需要对文献进行分类、标注等工作,以便读者可以通过关键词、作者、主题等方式快速定位所需的文献。
3. 元数据管理:图书管理员需要对数字化馆藏进行元数据管理。
元数据是描述数字资源特征的数据,包括标题、作者、出版日期、摘要等信息。
通过良好的元数据管理,读者可以更好地了解和利用图书馆的数字化馆藏。
二、数字化馆藏展示数字化馆藏的展示是图书管理员向读者展示图书馆馆藏的过程。
下面将介绍数字化馆藏展示的策略和方法。
1. 网络平台建设:图书管理员可以借助互联网来展示数字化馆藏。
建立一个美观、易用的图书馆网站或者图书检索平台,为读者提供方便快捷的检索和浏览服务。
2. 用户体验优化:图书管理员需要不断优化用户体验,提升读者使用数字化馆藏的满意度。
这可以通过改进网站界面的设计、添加用户反馈功能、提供个性化推荐等手段来实现。
3. 多媒体展示:除了文字和图片,图书管理员可以利用多媒体技术来展示数字化馆藏。
例如,可以制作视频介绍图书馆的特色馆藏、举办在线讲座等形式来吸引读者的注意。
4. 社交媒体推广:图书管理员可以利用社交媒体平台来推广图书馆的数字化馆藏。
通过发布推文、博客、微信公众号等方式,将图书馆的数字资源推送给更多的读者。
图书馆数字资源的标准与规范随着信息技术的不断发展和进步,数字资源在图书馆中的应用变得越来越重要。
图书馆数字资源的标准与规范对于保证资源的质量、可访问性和可持续性至关重要。
本文将从数字资源的定义、标准的必要性、相关标准组织以及数字资源标准的实施方法等方面进行探讨。
一、数字资源的定义数字资源是指以数字形式存储的文献、资料或其他信息资源。
它们可以是数字化的书籍、期刊、报纸,也可以是电子文献数据库、音视频资源等。
二、标准的必要性1. 统一资源描述和分类:标准化的数字资源可以使用统一的元数据来描述其内容和特征,方便用户进行搜索和筛选。
2. 提高信息检索效率:标准化的数字资源可以使信息检索工具更高效,减少用户的搜索时间。
3. 保证资源质量:标准化要求可以确保数字资源的准确性、可信度和权威性,提供高质量的信息服务。
4. 促进资源共享:标准化的数字资源可以促进图书馆之间的资源共享和合作,提高资源的利用率。
三、相关标准组织1. 国际图书馆联盟(简称:IFLA):IFLA制定了许多数字资源相关的标准,如国际标准书号(ISBN)、国际标准期刊号(ISSN)、图书馆国际标准编号(ISIL)等。
2. 国际标准化组织(简称:ISO):ISO制定了一系列数字资源的标准,如数字图书馆应用与管理的信息模型、数字图书馆元数据的交换格式等。
3. 美国图书馆协会(简称:ALA):ALA发布了许多数字资源管理和访问的指南和标准,如数字资源管理指南、数字资源访问指南等。
四、数字资源标准的实施方法1. 元数据标准化:制定统一的元数据标准,包括元数据元素的定义、属性、格式等,方便资源的管理和检索。
2. 信息安全标准化:确保数字资源的安全性和保密性,采取措施保护用户的个人信息和知识产权。
3. 使用权管理标准化:制定资源使用的规则和准则,明确使用者的权限和责任,保证资源的合法使用。
4. 网络服务标准化:制定数字资源的网络服务标准,包括资源的访问、存储、传输等方面,确保用户可以方便地获取和使用资源。
图书馆的数字资源采集和处理流程图书馆是社会中重要的知识传播和文化储备场所。
随着信息技术的发展,数字资源在图书馆中的地位日益重要。
本文将介绍图书馆数字资源的采集和处理流程,以展示如何高效地利用数字资源满足读者的需求。
一、数字资源采集数字资源的采集是图书馆获取各类电子书籍、期刊、报纸和音视频资源等的关键步骤。
以下是数字资源采集的流程:1. 确定需求:图书馆需根据读者的需求确定采集的数字资源类型和范围,比如学术期刊、电子图书等。
2. 寻找资源:图书馆可以通过订购商、出版社、数据库等渠道寻找适合的数字资源,也可以考虑与其他图书馆合作共享资源。
3. 评估资源质量:在采集数字资源之前,图书馆需要评估资源的质量和可靠性,包括内容的准确性、版权问题等。
4. 选择供应商:图书馆需评估不同供应商提供的数字资源及其服务,选择合适的供应商进行采集。
5. 签订许可协议:在采集数字资源时,图书馆需要与供应商签订许可协议,明确资源的使用范围、期限和使用方式等。
二、数字资源处理数字资源的处理包括目录编制、整理和保存等环节,以确保资源的有序存储和方便使用。
以下是数字资源处理的流程:1. 目录编制:采集到的数字资源需要进行目录编制,以方便读者查询和检索。
图书馆可以根据资源的主题、类型和作者等信息建立目录。
2. 元数据标注:图书馆需要对数字资源进行元数据标注,包括资源的标题、作者、出版信息、关键词等,以提供给读者更准确的检索结果。
3. 数字化加工:图书馆将采集到的资源进行数字化处理,将纸质文献转化为电子版,并进行格式转换和加密操作。
4. 资源整理和分类:图书馆需将采集到的资源进行整理和分类,建立清晰的资源分类体系,方便读者查找所需资源。
5. 存储及备份:数字资源需要进行安全的存储和备份,以防数据丢失或损坏。
图书馆可采用云存储和硬盘备份等方式进行数据保护。
三、数字资源利用数字资源的利用是图书馆实现资源共享和传播的重要环节。
以下是数字资源利用的流程:1. 检索资源:读者可以通过图书馆提供的检索系统,根据关键词、作者或题名等信息检索所需的数字资源。
MDLIB多媒体数字图书馆管理系统方案书北京佳星慧盟科技股份有限公司目录一、MDLIB多媒体数字图书馆系统简介 (3)二、MDLIB多媒体数字图书馆系统特点 (4)三、MDLIB多媒体数字图书馆系统功能介绍 (8)四、MDLIB多媒体数字图书馆系统运行配置 (11)附录:部分书籍简介 (12)MDLIB多媒体数字图书馆系统一、MDLIB多媒体数字图书馆系统简介MDLIB多媒体数字图书馆系统(也称“MDLIB多媒体电子图书馆系统”)适用于中小学、大中专院校组建数字图书馆或电子阅览室,实现电子图书的浏览与管理,也是学校多媒体信息发布和信息资源共享平台和门户,帮助学校搭建数字化教育资源中心,方便教师工作、学生自主学习。
MDLIB多媒体数字图书馆是一个基于Web的B/S系统,所有的操作都可以通过浏览器来完成,而不需要在客户端的计算机上安装其它任何驱动产品。
在安装数字图书馆产品后,可以通过往服务器上安装相应的电子图书,实现对图书馆书籍的扩充;另一方面,也可以让管理员从任何一台可以登录系统的计算机上,利用管理员帐号登录,然后对服务器上的图书进行管理。
系统结构模式MDLIB多媒体数字图书馆系统新版主界面二、MDLIB多媒体数字图书馆系统特点数字图书馆在使用上具备如下特点:安装方法简便大多数的管理和信息发布系统在安装时都非常烦琐复杂,不仅要求安装者有一定的软件操作知识,而且要求他们有相当的系统集成观念。
例如,对于传统的管理信息发布系统的安装来说,安装人员首先要懂得数据库产品的基本知识,还要了解Web服务器软件的构建和配置,第三还要掌握如何构建Web站点,最后还要进行无数的配置实践,这才能完成整个安装工作。
整个安装过程对于不太熟悉计算机技术的用户来说,简直是一场恶梦。
这些问题在数字图书馆系统中都得以解决。
借助安装向导的强大威力,整个数字图书馆的安装一气呵成,可以完成整个系统的全部配置工作。
安装程序首先将系统文件复制到硬盘上,然后自动建立图书馆数据库,再自动构建图书馆站点,最终完成整个操作。
数字图书馆元数据方案设计说明书元数据方案确实是数字图书馆中所利用的信息描述方式。
数字图书馆的运作,不管是存取进程仍是检索进程,都是以元数据方案为基础实现的。
以下是数字图书馆元数据方案设计说明书,欢迎阅读。
元数据方案为数字图书馆散布式信息资源的发觉和检索奠定了基础。
因此,元数据方案决定了数字图书馆的功能特点、运行模式和系统运行的整体性能。
为了实现这一整体性能,达到共建共享信息资源的目的,数字图书馆元数据方案应遵循以下原那么。
元数据方案的标准化原那么在数字图书馆建设中,标准问题最重要的是元数据的制作,而与元数据的制作紧密相关的问题是元数据方案的设计。
但是,目前在元数据方案的标准化方面存在很多问题。
第一,就DC系列元数据而言,在同一元素的著录内容上存在较大的不同。
如,北京大学拓片元数据要求在权限(Rights)元素中著录馆藏地址、许诺利用的用户范围,而在《数字式中文全文文献通用格式》规定著录有关权限治理的声明,包括知识产权等。
第二,关于同类型信息资源的组织,有的图书馆已经采纳DC元数据,有的那么仍然采纳MARC元数据。
这种著录内容和同类信息资源所用元数据的不一致都会给数据互换的带来困难。
最后,各个元数据所采纳的编码语言也是各不相同,有的采纳HTML,有的采纳SGML或XML。
由于各个编码语言的标签设置、内容、可扩展性的不同,那么会阻碍元数据的通用性。
元数据方案的标准化原那么具有普遍的内涵。
它包括元素著录内容的标准化、同类型数字化信息资源的著录所采纳元数据的一致性、元数据方案所采纳编码语言的统一性这几个方面。
元数据方案的准确性原那么所谓准确性原那么一方面指元数据方案中元素的概念、利用的术语等不能模棱两可,容易产生歧义,致使不同的明白得;另一方面指元数据方案能够准确地描述信息资源。
也确实是说,元数据方案不仅要规定元素的设置、著录规那么、标记语言的利用,而且要规定著录所依据的标准、传输互换语言等。
当前困扰各个搜索引擎的问题是如何提高其查准率。
数字图书馆解决方案引言随着数字化时代的到来,图书馆也不得不跟随潮流进行数字化转型。
数字图书馆是指将传统图书馆中的图书、期刊、报纸等纸质文献资源,以数字化的形式储存、管理和检索的一种图书馆。
数字图书馆解决方案是指为图书馆提供数字化转型的技术解决方案,以便实现更高效、更便利的图书馆服务。
1. 储存与管理1.1 数字化文献存储数字图书馆解决方案的首要任务是将传统图书馆中的纸质文献资源进行数字化存储。
这些数字化的文献资源可以采用各种常见的文件格式,如PDF、EPUB等,以便于后续的检索和使用。
1.2 数据库管理系统为了实现对数字化文献的高效管理,数字图书馆需要借助数据库管理系统。
数据库管理系统可以提供方便的数据组织和存取接口,使得图书馆管理人员能够轻松地对数字化文献进行管理,包括增加、删除、修改、查询等操作。
1.3 元数据管理在数字图书馆中,元数据的管理也至关重要。
元数据是指描述数字化文献中各种属性信息的数据,比如书名、作者、关键词等。
通过合理的元数据管理,图书馆用户可以更加方便地对数字资源进行检索和利用。
2. 检索与阅读2.1 检索引擎数字图书馆解决方案需要提供一个强大的检索引擎,以便用户能够快速地搜索到所需的数字资源。
检索引擎应具备高效的搜索速度和准确的检索结果,可以根据关键词、作者、分类等多种方式进行检索。
2.2 用户界面为了方便用户的使用,数字图书馆解决方案应该提供一个友好的用户界面。
用户界面应具备良好的可视化效果和简洁明了的操作方式,以便于用户快速找到所需的数字资源并进行查阅。
2.3 阅读器数字图书馆解决方案应该提供一个内置的阅读器,以便用户能够在线阅读数字资源。
阅读器应具备良好的阅读体验,支持翻页、目录跳转、字体调整等功能,并能够兼容各种常见的文件格式。
3. 版权保护与安全性3.1 数字版权管理数字图书馆中的文献资源大多来自于版权方授权,因此数字图书馆解决方案需要提供数字版权管理功能。
通过数字版权管理技术,可以实现对数字资源的合法使用和控制,保护版权方的权益。
图书馆的数字化资源管理与利用随着信息技术的不断发展,数字化资源在图书馆中的管理与利用变得日益重要。
本文将从数字化资源的定义与分类、数字化资源的管理以及数字化资源的利用三个方面进行探讨。
一、数字化资源的定义与分类数字化资源是指将实体文献、实物文物等通过数字技术转化为数字形态的资源。
它包括电子图书、电子期刊、数字文献、数字图片、数字地图等多种形式。
依据其内容特点和形态特点,数字化资源可以分为文本型、图像型、声音型和视频型等不同分类。
文本型数字化资源主要包括电子图书、电子期刊等,图像型数字化资源则包括数字照片、数字地图等。
二、数字化资源的管理数字化资源的管理是确保资源能够被有效保存、组织和检索的关键。
首先,需要建立起完善的数字化资源管理系统,包括数字化资源的选题、采编、加工、质控、发布等环节的规范,确保数字化资源能够按照一定的流程和标准进行管理。
同时,数字化资源的元数据也是管理的重要组成部分,它可以为用户提供丰富的信息,帮助用户更好地理解和利用资源。
此外,数字化资源的版权管理也是数字化资源管理的重要内容。
图书馆需要与版权方进行沟通和合作,确保数字化资源的合法性和合规性。
在数字化资源管理过程中,图书馆还需要注重资源的安全保护,包括合理的权限设置、定期的备份和数据恢复等,以防止资源丢失或遭到不当使用。
三、数字化资源的利用数字化资源的利用是图书馆将资源提供给用户进行信息检索、学习和研究的过程。
数字化资源的利用可以通过在线数据库、数字图书馆等形式进行。
用户可以通过检索关键词、浏览目录、下载全文等方式获取所需的信息。
同时,图书馆还可以将数字化资源与纸质资源相结合,为用户提供多样化的服务。
数字化资源的利用还可以促进图书馆与其他机构、学校之间的合作与交流。
通过数字化资源的共享与互通,用户可以跨地域、跨机构地获取各类优质资源,提升学术研究的效率和质量。
总结起来,数字化资源的管理与利用是图书馆数字化发展的重要方向。
图书馆需要借助信息技术手段,建立起完善的数字化资源管理系统,确保资源的有效存储和组织,并通过提供便捷的利用方式,满足用户的学习和研究需求。
图书馆数字资源的标准与规范在当今数字化时代,图书馆已不再仅仅是收藏和借阅纸质书籍的场所,而是承担着更广泛的功能,其中包括数字资源的收集、管理和提供。
为了确保图书馆数字资源的高质量和便捷使用,制定标准与规范是至关重要的。
本文将以此为基础,以图书馆数字资源的标准与规范为题,探讨其重要性并介绍一些常见的标准与规范。
一、数字资源的标准与规范的重要性图书馆作为信息传播和知识共享的重要场所,其数字资源的标准与规范对于保证资源的有效利用和信息共享至关重要。
以下是几个重要方面:1. 提高资源的质量:通过标准与规范,图书馆能够确保数字资源的准确性、权威性和完整性。
例如,标准的数字化处理流程可以避免信息丢失和错误,从而提高资源的质量。
2. 促进资源的互操作性:标准与规范可以确保数字资源在不同平台和系统之间的互操作性。
这使得用户能够更方便地获取和使用资源,提高了资源的可访问性。
3. 便于资源的管理和维护:通过制定标准与规范,图书馆能够更好地管理和维护数字资源。
例如,统一的命名规则和文件格式可以减少资源命名和格式转换的工作量,提高工作效率。
4. 保护用户隐私和知识产权:标准与规范可以确保数字资源的安全性和合法性,防止用户隐私和知识产权的被侵犯。
二、常见的数字资源标准与规范为了满足数字资源管理和利用的需求,图书馆采用了许多标准与规范。
以下是几个常见的例子:1. Dublin Core元数据标准:这是一种用于描述数字资源的元数据标准,包括资源的标题、作者、关键词等基本信息。
它提供了一种通用的元数据格式,使得不同系统和平台可以交换和共享资源信息。
2. MARC标准:这是一种用于描述图书馆馆藏物品的机器可读编目格式。
MARC标准规定了每个书目记录的字段和子字段的含义和格式,保证了图书馆馆藏物品的一致性和可检索性。
3. ISO标准:ISO(国际标准化组织)制定了许多与数字资源管理相关的标准。
例如,ISO 27001定义了信息安全管理体系的要求,ISO 14721定义了数字档案存储的规范。
数字图书馆元数据方案设计说明书元数据方案就是数字图书馆中所使用的信息描述方法数字图书馆的运作无论是存取过程还是检索过程都是以元数据方案为基础实现的以下是数字图书馆元数据方案设计说明书欢迎阅读1数字图书馆元数据方案设计原则元数据方案为数字图书馆分布式信息资源的发现和检索奠定了基础因此元数据方案决定了数字图书馆的功能特征、运行模式和系统运行的总体性能为了实现这一总体性能达到共建共享信息资源的目的数字图书馆元数据方案应遵循下列原则1.1元数据方案的标准化原则在数字图书馆建设中标准问题最重要的是元数据的制作而与元数据的制作紧密相关的问题是元数据方案的设计然而目前在元数据方案的标准化方面存在很多问题首先就DC 系列元数据而言在同一元素的著录内容上存在较大的差异如北京大学拓片元数据要求在权限(Rights)元素中著录馆藏地址、允许使用的用户范围而在《数字式中文全文文献通用格式》规定著录有关权限管理的声明包括知识产权等其次对于同类型信息资源的组织有的图书馆已经采用DC元数据有的则仍然采用MARC元数据这种著录内容和同类信息资源所用元数据的不一致都会给数据交换的带来困难最后各个元数据所采用的编码语言也是各不相同有的采用HTML有的采用SGML或XML由于各个编码语言的标签设置、内容、可扩展性的不同则会影响元数据的通用性元数据方案的标准化原则具有广泛的内涵它包括元素著录内容的标准化、同类型数字化信息资源的著录所采用元数据的一致性、元数据方案所采用编码语言的统一性这几个方面1.2元数据方案的准确性原则所谓准确性原则一方面指元数据方案中元素的定义、使用的术语等不能模棱两可容易产生歧义导致不同的理解;另一方面指元数据方案能够准确地描述信息资源也就是说元数据方案不仅要规定元素的设置、著录规则、标记语言的使用而且要规定著录所依据的标准、传输交换语言等当前困扰各个搜索引擎的问题是如何提高其查准率搜索引擎的低查准率究其原因是其对信息资源特征的揭示不够准确、深入数字图书馆的信息资源类型多样既有文字信息也有音频、视频信息只有准确地揭示它们的特征提供高质量的元数据才能保证较高的查准率1.3元数据方案的通用性与专用性原则元数据方案的通用性与专用性都是相对而言的所谓通用性是指元数据方案可用于数字图书馆多种信息资源的元数据制作所谓专用性是指元数据方案只适用于数字图书馆某一特定类型信息资源的元数据制作具有通用性的元数据适用于组织多种类型的信息资源通用性元数据有两种:一种通用性元数据的结构非常庞大、复杂但是具有很好的描述深度因为所有的情况都已经定义了比如MARC元数据另一种通用性元数据其结构非常简单好学易用仅仅只有几个非常普遍的属性但对特定类型的信息资源的描述能力不够而具有很好专用性的元数据其对于某一特定类型的信息资源描述能力很强但无法覆盖其它类型的信息资源数字图书馆信息资源类型多样过分强调专用性会导致多种元数据各自为政因此在设计元数据方案时设计人员需要在通用性和专用性之间加以协调、平衡才能产生更好的效果1.4元素设置的可扩展性原则所谓元素设置的可扩展性原则是指在元数据方案设计时为元素、元素的限定词以及属性值的扩充留有一定的余地数字图书馆要处理的数字化信息资源非常广泛而且各类数字化信息资源的应用背景更为复杂如果元数据方案只提供最广泛意义上的描述一些针对特定应用背景的内容并不纳入那么应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下扩充一些元素或属性值此外元数据是一个发展活跃的领域新的元数据元素会不断出现老的元数据元素会不断修改完善数字图书馆的生存环境是一个不断变化的环境新的信息源也会层出不穷这就要求元数据方案允许将新的元数据元素容纳于其中或者要求修改更新已经注册的元数据方案1.5元数据方案的互操作性原则所谓元数据方案的互操作性是指在由不同的组织制定与管理且技术规范不尽相同的元数据环境下要向用户提供一个统一的数据检索界面确保系统对用户的一致性服务在具体应用上互操作性表现为易转换性即在所携信息损失最小的前提下可方便地转换为其它系统常用的元数据2数字图书馆元数据方案设计应注意的问题2.1非MARC元数据与数字图书馆信息资源组织的质量问题在此根据我国当前引进、研制元数据的状况将现存的元数据分为两类即MARC元数据和非MARC元数据MARC元数据包括USMARC、UNIMARC、CNMARC等非MARC元数据包括DC系列元数据和非DC系列元数据DC系列元数据是指我国在数字图书馆建设的过程中对DC元数据加以引进并改造而生成的针对特殊类型信息资源的元数据也就是说这些新出现的元数据是在DC元数据的基础上进行了扩充、改进例如DC元数据、北京大学拓片元数据、《数字式中文全文文献通用格式》以及清华大学的建筑元数据非DC系列元数据包括TEI头标、EAD、GILS等目前将非DC系列元数据用于数字图书馆信息资源组织的呼声很高美国图书馆协会(theAmericanLibraryAssociation简称ALA)编目:著录与检索委员会(CommitteeonCataloging:DescriptionandAccess简称CC:DA)在《元数据与编目规则研究报告》(CC:DATaskForceonmetadataandCatalogingRules:FinalReport)中以TEI头标、EAD等元数据为例就非DC系列元数据作为编目源的情况做出评估得出三点重要结论第一非MARC元数据在专门针对其用途而设计的系统中效率最高但在图书馆目录系统中的效率就不是最高的第二不符合AACR的普通元数据进入图书馆目录的时候总是需要图书馆编目人员对其进行严格审查第三绝大多数非MARC元数据方案没有提供足够的信息以区别相似的信息资源或者内容基本相同而不同版本信息资源也就是说只有充分地利用各种编目规则和其它一些质量保证手段非MARC元数据才能具有较高的质量才能用于图书馆信息资源组织众所周知非MARC元数据大多数是一些资源描述机构针对自己的需要而开发的在这些元数据方案中元数据的制作可以由专业的编目人员完成也可以由根本没有任何经验信息资源的提供者自己完成非专业人员制作的元数据具有费用低、元数据的专指性较好的优点但是这样做会导致对数字化信息资源的属性和特征的揭示程度差别很大进而影响元数据的总体质量到目前为止绝大多数元数据仍然由专业人员提供例如TEI头标是一种复杂的元数据绝大多数TEI文本都是由人文科学领域非图书馆专业人员创建而TEI头标通常是由图书馆员创建或维护如果让非专业人员参与元数据的制作那么数字图书馆元数据方案设计就应解决元数据制作质量的检测与管理问题2.2DC系列元数据与MARC元数据的关系目前有些数字图书馆纷纷采用DC元数据作为描述数字化信息资源的格式例如清华大学图书馆的建筑数字图书馆项目以DC元数据作为基本框架结合建筑资料的实际情况对DC元数据进行改造扩充为THDL——清华大学建筑数字图书馆元数据格式北京大学依据DC元数据开发了拓片元数据格式上海图书馆也使用了DC元数据自从DC元数据产生以来图书馆界争论不休的问题是图书馆是继续使用MARC元数据还是舍弃MARC元数据改用DC元数据?具体到我国在任何一个数字图书馆元数据方案的设计过程中必然要涉及到MARC元数据与DC系列元数据关系的处理DC元数据最初的定位是处于全文索引和复杂格式的元数据之间提供简单明了的元数据格式DC元数据与MARC元数据的最主要的区别在于DC元数据结构简单而MARC元数据复杂DC元数据经过数次研讨会后对其进行扩展使用修饰限定词使得DC元数据不可避免地复杂起来其扩展的原因有两个一是应用领域比较复杂DC元数据没有足够的元素来描述信息资源的各种重要特征;二是人们希望DC元数据应用于多个领域实际上无论如何扩展DC元数据不可能解决所有数字化信息资源的描述问题笔者建议:由国家标准化权威机构——全国信息与文献标准化技术委员会来制定适应于各类数字化信息资源的元数据方案这样做可以在全国范围内就某一类数字化信息资源采用何种元数据著录达成共识目前在MARC元数据与DC系列元数据并存的情况下信息资源的存储与检索必然涉及MARC元数据与DC系列元数据两者之间的转换是将全部MARC元数据转换为DC元数据还是将DC元数据转换为MARC元数据?笔者认为MARC元数据与DC元数据之间转换的目的是实现一条记录可以以MARC元数据和DC元数据两种格式来显示以及数据的交换与共享但是如果用户没有这种需求或者两者之间不转换并不影响数据交换则没有必要进行转换也就是说根据实际需要来决定是否需要MARC元数据与DC元数据之间相互转换MARC元数据与DC元数据之间的转换会产生很多问题由于MARC元数据的描述能力大大丰富于DC元数据如何尽量解决两者之间转换所产生的歧义与不确定性以及信息丢失等难题2.3元数据的编码语言问题元数据的编码语言是指针对元数据元素和结构进行定义和描述的具体语法和语义规则目前各种元数据使用的编码语言是不同的包括标准通用标记语言(StandardGeneralMarkupLanguage简称SGML)、超文本标记语言(HypertextMarkupLanguage简称HTML)、可扩展标记语言(ExtensibleMarkupLanguage简称XML)三种形式有些元数据明确规定使用何种标记语言如TEI头标、EAD和美国联邦地理数据委员会《数字地理空间元数据内容标准》使用SGML也有些元数据没有规定使用何种编码语言如DC元数据有使用HTML也有使用XML的从数据交换和共享的需要出发元数据的作用是传递计算机系统可以理解的描述信息和存储数据计算机首先要理解元数据的各个元素或字段序列化的方式即按怎样的顺序和结构来组织各个元素及其内容所使用的编码语言不同元数据编码规则以及记录格式也存在差异这样则不利于数据的交换和信息资源的共享因此从长远利益来看有必要对元数据的编码语言进行统一3对我国数字图书馆元数据方案设计的若干建议3.1推进元数据标准化进程提高元数据的互操作能力目前国内出现了许多种元数据例如拓片元数据、建筑元数据、古籍元数据、中文数字化全文文献元数据等由于每种元数据都是由不同图书馆研制而成的并且针对不同类型的数字化信息资源因此就会出现DC系列元数据与MARC元数据并存的局面这种局面有利于DC系列元数据与MARC元数据形成优势互补也可以使某些适合用DC系列元数据描述的特定类型信息资源被充分地揭示和利用同时这种局面也会带来一些问题目前我国DC系列元数据至少有4种以上那么对DC系列元数据是否一体化;那些特定类型信息资源以前的机读记录该如何处理等笔者主张DC系列元数据一体化反对各自为政DC系列元数据都是在DC元数据的基础上根据用户的需求与信息资源特点进行了修正所以这些元数据的核心或实质仍然是DC元数据这一点可以作为DC系列元数据一体化的基础但是这种一体化工作完成就需要各个研制单位之间的协调与合作需要以国家标准的形式出现加以强制执行从而结束元数据结构各自为政的局面对于那些原由MARC元数据著录的信息资源来说MARC记录已为受编信息资源提供了著录内容详尽查全率高的机读格式在受编信息资源数字化的过程中没有必要舍弃原有的元数据而采用其它元数据方案3.2选择适用的编码语言在数字图书馆元数据方案设计中编码语言的选择也是关键步骤之一目前在DC系列元数据中通常使用HTML、SGML或XML有比较才有鉴别和选择我们不妨对这三种编码语言的优劣进行分析比较XML是SGML语言的一个子集同HTML一起成为SGML家族的主要成员SGML是一种元语言可以用来定义其它更专门的标记语言HTML是由SGML定义出来的专门使用在上的标记语言SGML是很好的资料存储格式适用于任何复杂的文件但不便于网络传输SGML非常复杂不易学习掌握XML与HTML不同XML是SGML的一个简化版本实际上XML也是一种元语言与HTML不同的是XML并没有语义上的元素定义也没有预先定义好的一套标记系统在实际应用中可以根据需要定义自己的标记XML是可扩展的具有较强的灵活性和适用能力同时它很有可能在今后成为应用最为广泛的标记语言但是目前XML在网络上的应用不如HTML广泛由于HTML文档本身的结构性不强扩展能力差描述内容的能力也较弱因此不太可能成为今后数字图书馆元数据方案的主要编码语言笔者建议数字图书馆元数据方案的编码语言采用XML3.3数字图书馆元数据方案的设计应面向专业编目人员信息资源编目实际上是信息资源进行分析、判断和组织的过程组织过程包括分类、描述、归并及格式化等过程;分析过程则包括区分、验证、评估、比较、解释及综合过程总之信息资源编目是一个复杂的、信息增值的过程目前困扰信息资源编目的主要问题是费用一是时间的花费二是金钱的花费费用问题使得许多元数据方案的设计者希望所研制的元数据可以由非专业人员制作毫无疑问非专业人员制作元数据的费用低然而这种低费用是以牺牲元数据的质量为代价的笔者认为对于数字图书馆的建设而言元数据的总体质量是不容忽视的如果没有高质量的元数据数字化信息资源的利用也就成为一句空话甚至会像搜索引擎一样查准率很低所以建议数字图书馆元数据方案的设计应面向专业编目人员只有专业编目人员利用编目规则及书目控制等手段才能够提供具有较高质量的元数据3.4数字图书馆元数据方案的设计中应考虑到其它技术运用在数字图书馆建设的过程中必然要涉及到许多技术其中包括数据库技术、全文检索技术、开放式网络词表/分类技术、地理信息系统(GIS)等在数字图书馆元数据方案的设计中我们需要与这些技术进行衔接并加以应用以联合在线资源目录(CooperativeOnlineResourceCatalog简称CORC)为例加以说明CORC 是建立在网络环境下的为本地或网络电子资源创建书目元数据的系统是一种为电子资源编目的数据库和工具包CORC利用了网上杜威分类法数据库实现了编目过程中DDC号码和主题标目自动分配同时CORC数据库的软件平台采用Mantis这是一种适用于任何元数据定义与界面的网络资源编目系统工具箱Mantis用XML存储记录使得记录的输出非常容易且有MARC、DCHTML和DCRDF、XML多种格式可供选择CORC的成功在于其能够充分利用各种技术因此我国在数字图书馆元数据方案的设计过程中也需要考虑其它技术的运用。