当前位置:文档之家› 售后服务信息整流与知识增值服务

售后服务信息整流与知识增值服务

售后服务信息整流与知识增值服务
售后服务信息整流与知识增值服务

(售后服务)信息整流与知

识增值服务

信息整流和知识增值服务

【内容提要】本文提出数字图书馆的主要功能目标是信息整流和知识增值服务;信息和知识转换是数字图书馆的关键理论和技术问题。图书馆受到Internet的巨大冲击、不再是文献信息服务的唯壹提供者,数字图书馆如何才能挽回失去的老用户,吸引新用户?知识管理工程将使数字图书馆成为21世纪学习的大平台、文化知识的大平台和知识资源中心。

【摘要题】信息服务

1数字图书馆的信息整流

数字图书馆把传统图书馆的功能由信息的查询和图书资料的借阅扩展到知识服务的新阶段。实现这壹宏伟目标需要解决许多技术和社会问题,其中有俩个最关键的技术是信息的整流和知识的创新。前者涉及数字图书馆的知识链建立问题,后者涉及数字图书馆的信息变换成知识的知识增值服务问题。

1.1数字图书馆的知识链

数字图书馆是壹个庞大的数字资料库,包括所有资料的数字化存储,于线网上资料、多媒体资料、电子出版物等。数字图书馆根据用户对信息的不同需求,将文本、图片等原件制作成不同数字形式。壹般有纯图像形式,目录文本形式,正文图像形式,全文本形式和全文索引形式。但关键仍是知识链的建立。

为实现知识链信息,数字图书馆将资源分成为元数据和对象数据。对象数据指数字化的文本、图像、声言、影像等,元数据则指那些描述和管理对象的数据。对象数据分布式地存放于各地的资源站点内,元数据则集中存放于数字图书馆中心

的超大规模服务器上。用户查询时,中心调度系统通过元数据来调度各对象数据库以提供服务。

知识的控制单位长期停留于文献这壹级上,而人对知识的需求壹般不是以文献为单位的。早于20世纪70年代后期就有专家指出,知识的控制单位将从文献深化到文献中的数据、公式、事实、结论等最小的独立的“知识元”。壹旦实现知识的控制单位由文献深化到“知识元”,大量文献中所包含的“知识元”及关联信息间的链接将产生极大的知识增值,从而大大推进人类对知识的利用,促进新知识的创造,从而也将推动知识资源业的重大发展[1]。

壹篇文献反映作者的科学研究成果,包含着作者的知识创新的过程。于是文本结构本身就隐含着对某学科问题的知识链。

假如我们把每篇文献的知识见成是人类知识结构中的壹个知识单元,知识单元和知识结构就组成了个性知识和共性知识的知识系统。个性知识体当下知识的创新上,共性知识结构则表当下知识的完整性上。于是我们就建立了个性知识和共性知识的知识链。事实上,专利文献就明显地表现了个性知识单元和人类知识结构的知识创新链关系[2]。

数字图书馆对文本的知识标引,既体现了标引者应用学科知识结构的背景知识的能力,同时又体现了标引者识别和提炼作者的知识创新点的判断和知识组织能力。因此,是壹个知识链建立的知识增值过程。

1.2数字图书馆的知识发现

知识链的建立过程是知识发现和知识再组织的过程。知识发现的主要目标是采用有效的算法,从大量现有或历史数据集合中发现且找出最初未知、但最终可理解的有用知识,且用简明的方式显示出来。知识发现壹般包含如下几个步骤:(1)

理解相应的问题领域;(2)准备关联数据子集;(3)发现模式(数据挖掘);(4)所发现模式的后处理;(5)应用发现结果。

(1)文本知识结构分析技术

尽管和多媒体信息相比,文本信息显得比较普通,但文本仍然是记载和传播信息的最主要媒体,因此对文本信息知识发现技术的研究具有十分重要的意义和广泛的应用前景。

文本结构分析的目的于于发现文本表达主题概念的物理组织结构,由物理结构自动重组主题概念的逻辑结构,实现对文本知识的抽象化和具体化推理检索。

文献[3]把文本结构分成物理结构和逻辑结构。物理结构={标题,段落,句子,词汇},它表示了文本的组成情况。可采用向量空间模型表示文本及文本各个部分,进行文本结构分析,其中主要是文本的层次分析,从而得到文本的逻辑结构。逻辑结构={主题,层次,段落,句子,主题词},它更着重于表示文本所包含的思想内容和表达的逻辑方式。

(2)知识链结构

文本的物理结构是文本的外表形式,逻辑结构体现了作者表达目的的逻辑顺序,而文本的知识链结构则是作者的目的和灵魂,知识链结构={问题,已有解的优缺点,新解的方案,性能评价,今后方向}。研究文本的目的是为了获得文本的知识链,以创建新的知识链。链,表现了引用文献和被引用文献之间的多种关系。但它且不完全直接表现知识链关系。文献链是壹种庞大的文献引用系统。知识链则是壹种巨大的知识引用系统。若能完成这壹巨大的系统,人类将可能进行更有效的知识学习。

1.3信息整流的实现

知识链是文本知识结构的普遍特性,是人类学习、创新的纽带。信息整流和信息滤波不同。信息滤波的目的主要有俩点,即过滤掉不关联的文档以及将关联文档列表分为新的文档和已经查阅过的文档,且按相似度大小排序,对已检索的关联文档,通知信息Agent不必返回全文文档,以减少通信费用。信息整流的目的于于建立数字图书馆的知识链库,提供知识链服务。

信息整流是建立知识链的过程。从全文提取出知识单元,形成独立的知识基础,构成知识单元库,把各种知识单元库进行链接,构成数字图书馆广泛的知识网络库。

知识网络库形成了学科横向交叉和学科纵向延伸的科学知识体系。描述了人类知识学习和知识创新的知识网络结点。把人类知识学习和创新活动之间的距离大大的缩短。于知识网络库中,用户能够跨知识单元库学习所感兴趣的知识,更能够通过知识单元库直接学习到解决问题的知识和办法。

知识单元库的实现是知识网络库建立的基础和关键。已有的信息置标语言HTML (HyperTextMarkupLanguage)的超级链接功能使Web技术从计算机世界走向社会、走向千家万户,实现Web和数据库的超级链接。HTML表现出Web 显示数据的通用方法,而XML提供了壹个直接处理Web数据的通用方法。HTML 着重描述Web页面的显示格式,而XML着重描述Web页面的内容。XML是文档的各种数字表示方式,用XML表示的数字文档能够由计算机处理,也能够供人阅读。XML文档是壹种纯文本文档,能够包含图片、视频或其他多媒体信息,能够是百科全书,也能够是壹封电子邮件,或壹则天气预报、壹张电子商务交易单等。如对〈商品〉的描述中,若于应用中的名称、质量、价格仍不足以描述壹个商品的特征时,仍可通过其他模式增加新特征,只要加入的元素于它们各自名

域的前后关系中是有效的。这就为知识单元的描述提供了工具,通过XML标记将文本标记成知识单元,继而将知识单元链接成知识结构,实现知识链。

和引文索引不同,于用XML实现知识单元的描述中,能够将被引文献中的知识单元采用指针的方式加以直接标记,于是实现了知识链接的作用。

链接(Linking)是Web实现关键。HTML的链接是单向的有俩个端点——源端和目标端,源端通常是Web页的壹个片段,如壹个词语、壹段文本或壹幅图像,目标端是壹个“资源”。由统壹资源标记(URI)地址指定。XML是描述结构化数据的底层文法,用这种简单文法能够支持种类繁多的应用。预计XML将成为数字图书馆信息整流的基础性语言。

2数字图书馆的知识增值服务

数字图书馆不仅是传统图书馆的数字化,而且是来源极其丰富的网上资源库。通过对信息资源的深加工和合理、有效的组织,使之成为永久、有序的知识源泉。数字图书馆不仅要进行信息整流,而且仍要进行知识增值服务。数字图书馆将构筑起信息和知识转换的社会大平台,为实现全民终身学习、自主学习、随时随地学习创造条件。

2.1图书馆受到Internet巨大冲击

Internet正于成为世界上最大的“图书馆”。网络信息资源的迅猛扩大,越来越加深了人们对网络的依赖程度,影响和改变着人们选择信息、使用信息的行为和方式。目前,Internet上已拥有各种日报、杂志及时事快报、新书报道,世界上大多数主要的检索系统、数据库均已上网,且且向用户提供信息服务。Internet 信息服务商以其雄厚的资金投入和先进的技术设备优势,面向企业、面向市场开发信息产品,图书馆不再是信息服务的唯壹提供者,图书馆传统的信息产品受到

巨大冲击。

2.2数字图书馆的知识增值服务

数字图书馆如何才能挽回以前的老用户,且吸引更多的新用户?这是图书馆转型的根本所于,是数字图书馆建设的核心。为此,数字图书馆的服务内容和质量要比目前网上的信息服务更加独具壹格,数字图书馆要向信息实体虚拟化、信息资源数字化、信息传递网络化、信息利用共享化、信息提供的知识化方向转型发展。数字图书馆发展的优势将于什么地方?

知识增值服务是数字图书馆占领知识服务市场的优势所于。数字图书馆应用系统应是可扩展的知识服务网络系统。

数字图书馆对于有高价值的图像、文本、语言、音响、影像、影视、软件和科学数据等多媒体信息进行高质量的加工,实现知识增值,且提供于广域网上高速横向跨库的便捷的数字知识存取服务。

由此,我们能够说,数字图书馆的兴起是Internet网络技术的巨大冲击;数字图书馆的发展的强大推动力是人类知识需求速度的猛增。人类不仅需求更多的信息,而且需要更高质量的知识。数字图书馆将面向知识增值服务系统的转型发展。

2.3数字图书馆的知识创新

国家创新体系的主要功能,是知识创新、知识传播、知识交换和知识利用。大力促进和提高知识的生产、传播、交换和利用的水平、规模和效率,是国家创新体系的基本任务。

(1)知识创新过程

知识创新是数字图书馆发展的最主要的动力源泉。信息经过加工和改造形成知识。知识是人脑创新的成果,是人类智慧的结晶。智慧是人类文明的源泉,是推

动历史发展的永恒动力,是生产力诸要素中的核心。

知识壹般可分为陈述性知识、过程性知识和控制性知识。陈述性知识提供概念和事实,描述系统状态、环境和条件,使人们知道是什么。过程性知识提供有关状态的变化、问题求解过程的操作、演算和动作的知识。

个性知识单元由最小的知识元素“知识元”组成,知识元的不同排列构成了不同知识单元之间的差异,知识元也是知识结构的最小元素,于知识结构中能够由知识元直接组成新的知识单元,这就是知识学习和知识创新的过程。

(2)知识创新的度量方法

于考虑知识创新度量问题时,我们应尽可能从知识单元和知识结构之间所表现的特征寻找描述度量的方法。就某壹篇文献而言,它的知识包含有俩个层次。壹个是局部的,即是围绕该文本主题有关方面的判断、推理、结论等。另壹个是全局的、总体的,即是相对该学科主题现状的知识增量。比如,壹篇综述性文献,由于采用知识的提炼和合成技术,它本身的(局部的)知识容量增加了,建立了新的知识链关系,就有知识创新产生。

从知识度量角度讲,我们所研究的知识是事实性的、静态的知识,是关于事物的分类、属性、事物间关系等的科学事实或客观事实。具体到某壹篇文献而言,知识是指关于其所研究对象(主题)的结构、关系、属性和取值等方面所做的概念、判断、推理,即有关该主题对象新有的结论。相对学科主题而言,它的知识则指的是新增加的那壹部分,即知识创新的增量。知识是可学习的、可复制的,而智慧是不可复制的。目前对知识创新度量最简单的方法是对产生新的知识增量及其效应的判别和估价。这种估价的结果表现为壹种数量现象,实质上估价知识的增量隐含着对智慧的测度,因为实现知识创新的根源是智慧,但对智慧的度量目前

则是太困难了。

(3)信息和知识的变换

科技发展史上的壹条规律说明:当把俩门表面见来毫不相干的学科结合起来的时候,就可能形成壹门新的学科;当把俩种似乎没有任何联系的现象联系起来,就可能于科学技术上取得某些进展或突破。不同学科的文献常有内于的联系,包含隐含的知识或信息,能够从中重组出全新的知识或信息,得出全新的推理或结论。·隐含信息的关联

隐含信息的重组是知识的外化和外延。壹些信息本身没有什么价值,但于它身后却隐藏着另外壹种很有价值的信息,这种延伸或潜于的信息单元、知识单元,有壹定的隐蔽性,往往不易被人发现,壹旦被开发出来,且运用到实践当中去,却可产生不可估量的效益。

美国芝加哥大学图书馆研究生院、信息中心的SwansanD.R.等壹直于从事认知科学和文献内容相互关系的研究,对信息重组和知识创新过程进行了不少研究。由于他们壹直对文献的隐含信息进行研究,且于研究过程中,利用现代的计算机技术,设计了壹种新颖的计算机辅助信息检索软件(ARROWSMITH算法),能辨别出生物医学文献中俩个词语间的联系,从而进壹步发现隐含信息的关联,促进新知识的产生。

·知识的消息通信

知识元、知识单元、知识结构均以信息的方式于文献中表现,把隐含于文献中的大量复杂知识元以消息通信的方式连接起来,提高隐含知识的明晰化程度,将是未来数字图书馆向知识创新努力的关键[4]。

知识检索是于知识结构中获取知识的过程,用户能够通过知识单元间接地获取知

识,更能够通过知识元直接获取知识;信息检索只能通过间接的知识单元信息获取文献。

知识链接是数字图书馆的核心,是实现数字图书馆从信息服务向知识服务转型的关键技术。因此,采用知识链研究知识标引和检索是合理的,研究知识元、知识单元、知识结构之间的信息和知识的变换是可实现的。

从人工智能观点见,知识是对事实的合理推理的结果。知识的表达和处理能够有多种方法,且已有许多优秀成果,但最关键的是如何实现知识元和知识单元和知识结构之间的继承性,以及如何有效地实现它们之间的消息通信。

·信息转换成知识

从标引“知识元”层面研究,揭示单篇文献的个体“知识元”信息和某领域共性“知识结构”的链接关系,从而找出信息和知识的转换的普遍规律[5],是提高用户通过检索系统直接获取有效知识而不是壹大堆文献的有效方法。

传统的信息服务只提供文献的信息或提供作为知识素材的文献,且没有揭示文献中的知识链。人们获取的只是文献数据信息本身,且不是知识。比如人们见到了题录摘要,从中未必能够见到知识。即使读完了壹次文献,也许仍不能准确了解其中的知识所于。

数字图书馆中存于大量的文献信息库,文献信息库中的知识是非结构化的,知识元之间的关系是隐含的,需要壹种能把文献中的知识元及其信息背景壹起封装的技术,实现知识和访问该知识的信息成为独立的知识元,又要使得于检索需要的时候,独立知识元之间的关系能通过它们所带的信息实现连接,这就是我们要实现的知识链概念。具体方法我们将另文介绍。其基本框架有:

(1)将标引的每壹个工序合理安排;

(2)借助历史数据尽快完成知识增值标引;

(3)于系统中捆绑专家工具,以便快速抽取知识元,建立知识链关系;(4)自动整理现有工序操作流程,且于知识库中总结工作吸取教训;

(5)自动形成标引的标准;

(6)校验后决定是否修改;

(7)将结论整理存入知识网格库;

(8)用户查询的经验及要求的加入等。

人们期望数字图书馆能提供知识服务,数字图书馆正于由文献信息服务向知识增值服务转型。数字图书馆将造就壹门新的学科——知识管理工程。它将是以计算机技术、通信技术、管理科学、人工智能技术为骨干的新型学科。信息过滤,信息和知识转换,将对知识管理工程产生深远的影响。新壹代数字图书馆的工作者将是信息整流和知识创新的人才。

相关主题
文本预览
相关文档 最新文档