为什么要进行信息资源整合

  • 格式:docx
  • 大小:25.40 KB
  • 文档页数:6

下载文档原格式

  / 11
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

为什么要进行信息资源整合

信息资源整合是指将某一范围内的,原本离散的、多元的、异构的、分布的信息资源通过逻辑的或物理的方式组织为一个整体,使之有利于管理、利用和服务。我们也可以这样来理解信息资源整合,就是把分散的资源集中起来,把无序的资源变为有序,使之方便用户查找信息、方便信息服务于用户。这也是广义的信息资源整合概念,它包含了信息采集、组织、加工以及服务等过程。

为什么要进行信息资源的整合? 整合究竟要解决什么问题? 这主要源于网络信息资源的激增,资源的种类越来越丰富,数据库和信息资源检索系统越来越多,检索方式、检索手段各式各样。造成了数据冗余、相互关联程度低,大量的信息孤岛出现,同时用户的检索负担也日益加重。因此,需要有一种手段把这些信息集中、整序、关联起来,把检索系统集成起来,使用户知道到哪里可以找到所需要的信息,怎样去查找这些信息,如何筛选检索结果,这就是信息资源整合的最终目的。

信息资源的整合方法、途径和手段多种多样,但一般来说包括三个层面:其一是数据层(又称资源层) ,即把有关信息资源集中为一体;第二是操作层(又称服务层或中间层) ,即通过软件或平台对有关信息资源进行统一利用;第三是系统层(又称应用层) ,即包含数据内容、软件系统以及基础设置的全面整合。信息服务部门需要根据自己的信息资源、应用系统状况以及硬件基础设施来确定整合层次和实施方案。

信息资源整合原则

信息资源整合是一个系统工程,如何在理论的指导和经验的驱使下,使信息资源的整合工程做到最优。还需要我们在数据整合工程的实施过程中遵循如下原则。

整体性原则

整体性又称完整性,就是在信息资源整合工程中要保持信息资源对象完整与全面。完整性主要体现在这样几个方面。

(1)根据服务的主要对象或服务目标,保证整合资源内容的和学科的完整性;

(2)确保信息资源是一个整体,并不一定要求在物理上是一个整体,但需要将分布资源有机关联,揭示数据对象间的内在关系,在逻辑上形成一个整体;

(3)用户界面的统一,即实现一站式检索;

(4)系统功能的全面性,即要求整合后的资源系统能够涵盖原子系统的所有功能。

科学性原则

科学性原则主要是指对整合工程进行全面规划,科学论证,切忌匆忙上马,不宜随意凑合,要保证整合的合理性、科学性和规范化。具体在实施过程中要注意。

(1)资源选择的科学性,根据自己的服务对象和财力合理的规划、购买和自建资源,不能盲目求多,浪费人力财力;

(2)整合资源组织的科学性,建立各类资源间的多重关联,科学地组织它们,将有限的资源产生出最大的知识和信息量;

(3)整合后的系统在交互接口上的科学性,这个交互包括数据处理过程的后台交互,也包括用户和检索系统的交互,交互的科学性主要体现在处理接口的无缝连接,处理过程简洁快速,检索界面的方便有效。

层次性原则

层次性原则是指在建立信息资源整合系统和为用户服务的过程中,以满足用户服务为最终目标,在以下几个方面考察其层次性:一是整合数据的层次性,因为我们的用户可能具有不同的知识背景,不同层次的信息需求,所以我们要注意整合不同知识层次的信息;二是指信息资源整合的结构性,由于用户的查询需求可能是多方面的,目的可能很复杂,因此,为满足不同的用户需求,简单的一维、二维整合可能难以达到目的,需要能够实现数据的多维整合;三是检索操作的层次性,即提供简单检索、复合检索和专家检索这样多层次的检索界面来满足不同层

次用户的检索要求。

最优化原则

最优化原则的目标是使整合后的信息资源达到最佳的使用效果。也就是说如何将组合在一起的信息资源达到最优,即将原本并不是紧密关联的数据有机的联系在一起,并能够发现隐藏在其中的信息和知识;如何使检索系统达到最佳的运行效果,即是否拥有多种检索手段(例如简单检索、布尔逻辑检索、二次检索、同义词检索、排除词检索以及扩检和缩检手段) ,使其能够获得理想的查全率和查准率。

动态性原则

动态性原则是指整个整合系统能够适应数据动态变化和用户需求随机改变的状况。满足动态性的系统应该是个开放性的系统,应能够把各种类型的数据、不同格式的数据整合到系统中,能够及时增加动态变化的数据。在检索方面,应能够适应用户不断变化的检索要求,具有一定的学习功能,能够实现动态性的推荐服务。总之,整合系统满足动态性就是指其能够随着数据和外部各种环境的变化而不断变化。

针对性原则

针对性原则是指根据整合的目标,有针对性地选择信息资源、挑选恰当的整合工具和整合方法,切不可盲目实施。除此之外,针对性原则还表现在根据用户的特定需求来整合与组织信息资源,使整合后的资源既符合总目标,又满足用户的个性化服务需求。当然,这种个性化服务的实现还要求系统功能的扩充,如提供个性化的信息推送服务。另外,在针对性原则指导下的常见信息资源整合方式,还包括建设专题数据库或者特色数据库,如CAL IS项目、JAL IS项目等。

适度性原则

所谓适度性就是不要盲目的追求广、大、多,要根据现有的技术力量、资金能力对信息资源进行适度的整合。因此,要求我们在进行整合的过程中,资源选择时要根据自己的服务对象,依据自身对信息资源的整合能力选择待整合资源。例如,艺术类的院校应集中在与艺术有关资源的整合,文科类院校对理工类的信息资源就应当谨慎收录。当然,这样整合可能会使得用户获得的资源受到限制,因此,就要求多个资源整合机构能够建立联盟,就像图书馆间的馆际互借。

经济性原则

经济性原则主要从两个方面反映出来:一是通过遵循针对性和适度性原则,在自己经济力量有限的情况下,通过最优化理论与方法,进行较少的经济投入而实现功能倍增;二是指经过整合后的信息资源系统,要扩大服务范围,提升服务能力,以多样化的服务手段,产生最大的经济效益,做到服务、生存、发展。

信息资源整合前沿研究

下一代互联网发展趋势主要表现为: GGG ( GreatGlobal Grid)中的网格计算、语义网( Semantic Web)中的基于语义的信息表示等新的服务模式的出现。在GGG或语义网环境下的信息资源整合研究是当前比较热门的一个前沿研究。

针对日益增长的多媒体数据检索需求,研究TB级以上容量的海量多媒体的信息检索的有效机制,从多种类型的多媒体中建立起跨媒体的语义网络,实现跨媒体的数据整合、识别与综合检索,研究复杂媒体数据以及检索机制,建立智能高效的海量数据检索,对复杂媒体数据(如视频、3D模型、动画等)的智能处理技术及检索机制的研究,跨媒体信息整合、识别与检索技术,跨媒体知识的表达与推理的研究,跨媒体海量信息的综合检索系统实现。

信息资源整合前沿研究还包括知识整合(集成)研究,如何将隐性知识显性化、如何对各种知识进行有效集成,如何更有效为决策服务,这些都有待今后深入研究。

以上给出了信息资源整合研究的几个主要方面,实际上其研究还涉及其许多方面。如,对信息资源整合实施中涉及到的知识产权问题;整合的规范与标准问题;信息资源整合环境下的人才培养等,都是信息资源整合研究的内容。

信息资源整合关键技术

信息资源整合不仅仅是把信息资源聚集在一起,而是涉及到对信息描述、组织、处理、整序、检索、服务等方方面面,这些方面都需要有一定的技术来支撑。具体技术主要包括如下几个方面。

数据的组织、转换相关技术

数据的组织技术主要解决不同类型、不同结构的数据如何组织在一起;如信息资源涉及到的分类控制方法:行业分类表、地区分类表、中图法范畴分类体系、用户自定义分类体系等资源多分类组织技术。数据转换技术主要解决将不同格式、不同平台下的数据转换问题,MARC、DOC、PDF、TXT等不同格式的文件的格式分析,数据交换或转换技术,数据的查重去重技术等。此外还包括数据封装技术,如XML技术。

索引技术

索引技术的研究,主要解决整合后的索引如何构造的问题,这些索引要满足不同检索算法和检索需求,如,全文检索、同义词检索、排除检索、扩检和缩检、集成(整合、跨库、一站式)检索技术(涉及到关键词、主题词、分类导航、元搜索、TOP - K集成检索等整合检索) 、跨语言的信息检索技术、概念检索技术(利用同义词词典、概念词典)等进行基于概念(或基于语义、基于本体)的检索。

数据描述技术

信息源的语义内容描述、语义的识别能力及信息重复率,覆盖度等研究,也包括如何用元数据来表达整合后的数字信息,信息标引中所使用的元数据标准(如DC) ,元数据之间(如DC与MARC)的兼容互换、不同分类体系之间(如DDC号与中图分类号)的自动映射技术等。

信息自动化处理技术

信息的自动标引(包括智能分词、信息抽取、信息过滤、话题跟踪、关键词标引、主题标引、概念标引及其它元数据的自动标引) 、自动分类(分类也是一种整合) 、自动文摘、自动篇章分析、机器翻译(多语种