当前位置:文档之家› 本体学习研究综述

本体学习研究综述

本体学习研究综述
本体学习研究综述

ISSN 1000-9825, CODEN RUXUEW E-mail: jos@https://www.doczj.com/doc/fb3342628.html,

Journal of Software, Vol.17, No.9, September 2006, pp.1837?1847 https://www.doczj.com/doc/fb3342628.html, DOI: 10.1360/jos171837 Tel/Fax: +86-10-62562563

? 2006 by Journal of Softwar e. All rights reserved.

本体学习研究综述?

杜小勇1,2+, 李曼1, 王珊1,2

1(中国人民大学信息学院,北京 100872)

2(教育部数据工程与知识工程重点实验室,北京 100872)

A Survey on Ontology Learning Research

DU Xiao-Yong1,2+, LI Man1, WANG Shan1,2

1(School of Information, Renmin University of China, Beijing 100872, China)

2(Key Laboratory of Data Engineering and Knowledge Engineering, Ministry of Education, Beijing 100872, China)

+ Corresponding author: E-mail: duyong@https://www.doczj.com/doc/fb3342628.html,

Du XY, Li M, Wang S. A survey on ontology learning research. Journal of Software, 2006,17(9):1837?1847.

https://www.doczj.com/doc/fb3342628.html,/1000-9825/17/1837.htm

Abstract: Recently, ontology learning is emerging as a new hotspot of research in computer science. In this paper

the issue of ontology learning is divided into nine sub-issues according to the structured degree (structured,

semi-structured, non-structured) of source data and learning objects (concept, relation, axiom) of ontology. The

characteristics, major approaches and the latest research progress of the nine sub-issues are summarized. Based on

the analysis framework proposed in the paper, existing ontology learning tools are introduced and compared. The

problems of current research are discussed, and finally the future directions are pointed out.

Key words:ontology; ontology learning; concept; relation; axiom

摘要: 近年来,本体学习技术逐渐成为计算机科学领域的一个研究热点.根据数据源的结构化程度(结构化

半结构化非结构化)以及本体学习对象的层次(概念关系公理),将本体学习问题划分为9类子问题.分别阐

述了这9类问题的基本特征常用的方法和最新的研究进展,并在此分析框架下进一步介绍和比较了现有的本

体学习工具.最后,讨论了存在的问题,指出了未来的研究方向.

关键词: 本体;本体学习;概念;关系;公理

中图法分类号: TP182文献标识码: A

近年来,在计算机科学中关于本体的研究越来越多.所谓本体,最著名并被广泛引用的定义是由Gruber提出

的“本体是概念模型的明确的规范说明”[1].通俗地讲,本体是用来描述某个领域甚至更广范围内的概念以及概

念之间的关系,使得这些概念和关系在共享的范围内具有大家共同认可的明确的唯一的定义,这样,人机之

间以及机器之间就可以进行交流.目前,本体已经被广泛应用于语义Web智能信息检索信息集成数字图

书馆等领域[2].

在过去的10年里,已经出现了许多本体构建工具,从最早的Ontolingua[3],OntoSaurus[4],WebOnto[5],到

? Supported by the National Natural Science Foundation of China under Grant Nos.60496325, 60573092 (国家自然科学基金)

Received 2005-11-22; Accepted 2006-02-23

1838 Journal of Software 软件学报 V ol.17, No.9, September 2006 Protégé-2000[6],WebODE [7],OilEd [8],OntoEdit [9],以及KAON [10]等,本体构建工具也日趋成熟.这些工具提供了友好的图形化界面和一致性检查机制.借助这些工具,用户可以把精力集中在本体内容的组织上,而不必了解本体描述语言的细节,而且避免了很多错误的发生,方便了本体的构建.但是,这些工具提供的仅仅是本体编辑功能,支持的仍然是手工构建本体的方式.即使使用这些本体编辑工具,用户依然需要逐个地输入和编辑每个概念的

名字

约束属性等内容.现有的大部分系统,例如Cyc [11]和Mikrokosmos [12]等,都是靠手工输入大量的知识,然

后才能基于这些知识进行推理或获取新的知识.

由于手工方法费时

费力,使得本体的构建成为一项艰巨的任务.因此,如何利用知识获取技术来降低本体构建的开销是一个很有意义的研究方向.目前,国外在该方向的研究很活跃,把相关的技术称为本体学习(ontology learning)技术,其目标是利用机器学习和统计等技术自动或半自动地从已有的数据资源中获取期望的本体.由于实现完全自动的知识获取技术还不现实,所以,整个本体学习过程是在用户指导下进行的一个半自动的过程.

本体的结构(ontology structure)是一个五元组[13]O :={C ,R ,H c ,Rel ,A o }.这里的C 和R 是两个不相交的集合,其中:C 中的元素称为概念(concept);R 中的元素称为关系(relation);H c 表示概念层次,即概念间的分类关系(taxonomy relation);Rel 表示概念间的非分类关系(non-taxonomy relation);A o 表示本体公理(axiom).从本体的结构可以看出,本体学习的任务包括概念的获取概念间关系(包括分类关系和非分类关系)的获取和公理的获取.这3种本体学习对象构成了从简单到复杂的层次.

现实世界中的数据种类很多,例如纯文本以及XML,HTML,DTD 等,大部分都可以作为本体学习的数据源.针对不同类型的数据源需要采用不同的本体学习技术,所以本文根据数据源的结构化程度,将本体学习技术分为3大类:基于结构化数据的本体学习技术基于非结构化数据的本体学习技术和基于半结构化数据的本体学习技术.

本文第1节~第3节分别介绍这3大类本体学习技术在本体学习对象的3个层次上常用的方法和研究进展.第4节介绍并分析比较几个具有代表性的本体学习工具.第5节讨论目前本体学习技术中存在的问题以及未来的研究方向.

1 基于结构化数据的本体学习

结构化数据主要包括关系数据库或面向对象数据库中的数据.随着数据库在信息管理领域的广泛应用,大量的数据通常存储在数据库中.Lawrence 和Giles 在1998年时估计互联网上有80%的内容存储在Hidden Web 中[14].所谓的Hidden Web 中的数据就是存储在数据库中,而且这些数据一般都是面向主题(领域)的.因此,如何利用数据库中丰富的数据构建本体是一个很有意义的研究课题.

首先看一下关系数据库.众所周知,关系数据库采用的是关系模型,它是对领域信息建模的一种经典模型.这种模型结构简单,二维关系表格形式容易被理解,关系代数理论强有力地支持了关系模型,使得关系数据库得以广泛应用[15].现有的应用大多采用关系数据库来组织和存储数据.在关系模型中,关系(relation)是元组的集合;而关系模式(relation schema)是用来描述关系的结构的,即它由哪些属性构成这些属性来自哪些域以及属性和域之间的映像关系.所以说,在关系数据库中,关系模式是型,元组集(即关系)是值.与关系模型相比,本体是一种

具有更多语义结构更为复杂的模型.所以,这类本体学习的主要任务就是分析关系模型中蕴涵的语义信息,将其映射到本体中的相应部分.

在关系模型中,实体以及实体间的联系都是用表来表示的.所以,无论是概念的获取还是概念间关系的获取,首先必须区分出哪些表是用来描述实体的,哪些表是用来描述实体间的联系的,然后才能将实体信息映射为本体中的概念,将联系信息映射为本体中的关系.实际上,早在20世纪90年代,研究者们就已经开始关注如何自动分析关系模型的语义了.当时的研究动机是他们认为关系模型所能描述的语义信息太少,即它不能用一张表模型表示出复杂对象的语义,从而不适合于对数据类型繁多而语义复杂的领域信息系统的建模.所以,他们提出了将关系模型重新设计成更复杂的结构(例如面向对象模型).在此期间,他们给出一系列技术来获取关系模型的语义结构,并对其重新设计,这些技术被称为关系数据库的逆向工程(relational database reverse

杜小勇 等:本体学习研究综述 1839 engineering)[16].这些研究成果中很多都可以用于从关系数据库中获取本体.例如,1994年,Johannesson [17]提出将关系模型转换为一个概念模型,该概念模型实际上是一个扩展的实体-关系模型的形式化表示,然后由用户对该概念模型进行修订生成最终的本体.由于已有的关系数据库的逆向工程技术都没有考虑到如何将关系模型直接转换成本体,所以2002年,Stojanovic 等人[18]

通过考察数据库中的表

属性主外键和包含依赖关系,给出了一组从关系模型到本体的映射规则.基于这些规则能够直接得到一个候选本体,然后可以进一步对该候选本体

进行评价和精炼,生成最终的本体.

对于公理的获取,目前还没有查到相关的研究成果.本文认为可以利用数据库中定义良好的结构来获取一些简单的公理.例如,如果数据库中的某个属性具有Not Null 约束,则可以得到在本体中相应的关系在其对应的类中的Mincardinality 为1.除此之外,还可以通过发现属性间的依赖关系来获取公理.例如,假设数据库模式满足3NF,如果存在两个表R i 和R j 都具有属性A ,且A 不是R i 的主码,满足R i 表中的属性A 包含依赖于R j 表中的属性A ,则可以将A 映射成一个对象属性P ,且其domain 和range 分别是表R i 和R j 对应的类.该规则表明:如果关系中的某个属性只是用来描述两个关系之间的参照关系,那么可以将其映射成本体中的一个对象属性.

可以看出,现有的研究主要集中在对关系模式进行语义分析,从而获取构建本体所需的概念和关系.由于关系模式中蕴涵的语义十分有限,所以这些方法只能用来构建轻量级的本体(即结构较简单的本体).为此,1999年Kashyap [19]提出首先根据关系模式得到一个初步的本体,然后基于用户查询进一步丰富该本体中的概念和关系.由于用户查询具有很大的随机性,所以很难保证结果的质量.实际上,一种更为可行的方法是分析数据库中的元组,得到更多隐含的语义信息.2004年,Astrova [20]已经通过对元组的分析,得到了概念间的“继承”关系.另外,本文认为还可应用一些基于关系数据库的数据挖掘技术[21],例如概念层次的发现等,来改进这类本体学习技术.

值得强调的是,上述方法的前提都是已知数据库的模式信息,然而在很多情况下,这些信息无法直接获得.此时,如何发现数据库的语义是很有意义的研究课题.2004年,Astrova 等人[22]提出由于HTML 表格是Web 上用户和数据库交互最常用的界面,所以在无法获得数据库模式信息的情况下,可以通过分析这些HTML 表格的结构和数据来获取关系数据库的语义,从而构建本体.在这方面,最近关于Hidden Web 的一些研究成果[23]可以借鉴.总之,从关系数据库中学习本体仍然有很多工作可以做.

除了可以从关系模型中获取本体,也可以从面向对象模型中获取本体.面向对象模型与本体有许多相似之处,所以,从面向对象模型中获取本体的方法比较简单.另外,由于目前面向对象数据库应用范围有限,所以这方面不是研究的重点. 2 基于非结构化数据的本体学习

非结构化数据是指没有固定结构的数据.其中,纯文本是Web 中大量存在的一类非结构化数据,也是最重要的一类,可以用来获取本体的数据源.目前,基于非结构化数据的本体学习技术的研究主要集中在从纯文本中获取本体.纯文本依据一定的造句法表达特殊的语义,使得读者可以基于一些背景知识来理解其中的含义.然而,由于缺乏一定的结构,要使机器能够自动地理解纯文本并从中抽取出所需要的知识,则必须利用自然语言处理(NLP)技术对其预处理,

然后利用统计机器学习等手段从中获取知识.

对于概念的获取,现有的方法可以分为3类:基于语言学的方法基于统计的方法和混合方法.(1) 基于语言学的方法[38]主要根据领域概念的特殊词法结构或模板,寻找和抽取结构符合这些特定模板的字符串.由于这些模板在大多数情况下是与具体语言相关的,因此,这类方法要求针对具体的语言作相应的处理;(2) 基于统计的方法[24?27]主要根据领域概念与普通词汇拥有不同的统计特征(例如,领域相关性和领域通用性),以鉴别出领域概念.大多数基于统计的方法关注于多字词汇(multi word unit,简称MWU)的抽取,主要方式是计算各组成部分之间的联系程度;(3) 混合方法[28,29]往往是结合语言学和统计学的技术,有的是在统计处理之后采用语法过滤器,

以便抽取出经过统计计算有意义的与给定词法模板匹配的词汇组合;有的则是首先采用语言技术选出候选项,然后再用统计方法对这些候选项进行计算.

与国外相比,国内在领域概念(也称为专业术语)的自动抽取方面,特别是中文领域概念的自动抽取的研究

1840 Journal of Software 软件学报 V ol.17, No.9, September 2006 工作相对较少.在2003年的第7届全国计算语言学联合学术会议上,东北大学的陈文亮等人[39]提出利用Bootstrapping 的机器学习技术,从大规模无标注真实语料中自动获取领域词汇.2005年,山西大学郑家恒等人[40]提出采用非线性函数与“成对比较法”相结合的方法,综合考虑位置和词频两个因素,给出候选词的权重,实现了关键词的自动抽取.2005年,上海交通大学的杜波等人[41]提出了一种将统计方法与规则方法相结合的专业领域术语抽取算法.

值得强调的是,无论国内还是国外,统计方法都是主流.我们也曾经尝试着将已有的这些方法应用到经济学领域中,希望能够自动的抽取出中文经济学概念,但结果却不理想.其中的主要困难在于如何识别概念的领域相关性.从理论上讲,可以通过计算概念在领域相关的文本集中出现的频率与其在普通文本集中出现的频率的比值来判断概念的领域相关性,即如果该比值大于指定的阈值,则说明该概念在某个领域中经常出现,而在其他领域中不常用.但是,该方法的结果受普通文本集质量(主要指内容和规模)的影响很大,从而影响了该方法的实际可行性.

对于概念间关系的获取,常用的方法有:

基于模板的方法

基于概念聚类的方法

基于关联规则的方法基于词典的方法,或者这些方法的混和.(1) 基于模板的方法[28,30]是指通过分析领域相关文本,总结出一些频繁出现的语言模式作为规则,然后判断文本中词的序列是否匹配某个模式如果匹配,则可以识别出相应的关系.例如:可以将一个非常简单的字符串匹配(* is *)作为一个模式,那么,满足该模式的一对概念就可以认为具有“isa”关系.这些模式可以是手工定义的,也可以是从某些样本句子中学习得到的.这类方法的主要缺点是准确度低,因为大量无用的概念对往往也会匹配这些模式,而且模式的获取是否完备对于获取效果影响较大;(2) 基于概念聚类的方法是利用概念之间的语义距离,对概念进行聚类.这样,同一类簇中的概念具有语义近似的关系.同时,也可以进行层次聚类,聚类的结果就是概念间的分类关系.关于概念层次聚类的研究有很多,例如,Fisher [31]提出了一种基于矢量的聚类方法,Bisson [32]和Emde 等人[33]提出了基于FOL 的聚类方法.这些方法共同的局限性是只能得到概念间严格的层次关系(即树状的层析结构),然而在本体中一个概念却可以有多个父概念.为此, Faure 等人[34]采用宽度优先的方法对概念进行逐层聚类,较为特殊的是,它在进行每层聚类的时候都要考虑所有的簇而不管这些簇所在的层次.显然,该方法还有一个附加的约束,即一个簇不能和它的父簇进行聚类.这样得到的结果是一个无环图,图中两个结点间的连线表示概念间的层次关系;(3) 关联规则挖掘的方法常用于获取概念间的非分类关系,其基本思想是:如果两个概念经常出现在同一文档(或段落,或句子)中,则这两个概念之间必定存在关系.2000年,Maedche 等人[35]最先描述并评价了将关联规则应用于本体学习的方法.2001年,Maedche 等人[36]又提出使用已有的概念层次作为背景知识,然后利用关联规则来发现概念间的非分类关系的方法;(4)

基于词典的方法往往根据一些现有的词汇词典中定义的同义词近义词和反义词等知识来获取本体中概念间的关系.例如,Nakaya 等人[37]使用WordNet 来获取概念间的分类关系;(5) 混和方法往往是同时使用上述若干种方法,以期得到更好的结果.其中比较特殊的方法是由Missikoff 等人[26]和Navigli 等人[27]提出的,他们提出利用机器学习技术基于已有的通用本体对抽取出来的术语进行语义解释,即为这些术语关联上明确的概念标识符;然后,基于这些语义解释来确定概念之间的分类和相似关系,生成一个领域概念森林.与其他方法相比,该方法的主要特点是对术语进行语义解释,然后使用这些语义解释来获取除分类关系以外的其他概念间的关系,而其他方法都是将术语等同于领域概念.这种做法的好处是可以确定复杂术语的正确含义及其语义关系.对于一个复杂术语,该方法首先确定与该术语的各个组成成分相对应的概念,然后根据这些概念间的语义关系来构造相应的复杂概念.该步骤的结果是得到一个领域概念森林,它表示了这些复杂概念间的分类关系和其他关系.

到目前为止,国际上对概念间关系获取的研究很多,但是,对概念间非分类关系的获取,大部分方法都停留在判断两个概念之间是否存在关系的层次上,无法进一步为获取的关系赋予相应的语义标签,即得到的都是“匿名”关系.为此,2005年,Kavalec 等人[42]提出使用扩展的关联规则挖掘方法为本体中概念间的非分类关系赋予语义标签.其基本思想是:如果两个概念间存在非分类关系,那么该关系能够用经常出现在这两个词附近的某个动词来表示.所以,可以通过计算某个动词和某两个概念一起出现的条件概率决定这两个概念之间的关系是否可

杜小勇 等:本体学习研究综述 1841 以用该动词来表示.Kavalec 等人的方法是对解决该问题的一个初步尝试,但它仅考虑了词频,没有考虑句子结构等其他因素,所以结果并不十分理想.

对于公理的获取,研究成果很少,目前查到的只有Shamsfard 等人[38]提出的基于模板的抽取方法,即在对句子结构分析的基础上,应用预先定义的模板如果与模板匹配,则得到相应的本体公理.该方法的局限性很明显,它不仅需要人工预先制定模板,而且无法获取隐含的公理.

3 基于半结构化数据的本体学习

半结构化数据是指具有隐含结构,但缺乏固定或严格结构的数据[13].Web 中的半结构化数据很多,例如大量的XML 格式和HTML 格式的网页,以及它们遵循的文档类型定义(XML schema 或DTD),还有越来越多的用RDF 标注的网页,都可以作为本体学习的数据源.

由于这类数据是介于结构化和非结构化数据之间的一类数据,所以基于上述两种数据类型的本体学习技术也可以应用到这类数据源.对于XML,HTML 和RDF 等格式的网页,可以直接使用那些从纯文本中获取本体的方法.例如,Papatheodorou 等人[47]给出的从XML 或RDF 格式的文档中获取概念间分类关系的方法,就是首先抽取出表示每篇文档内容的关键词,然后基于这些关键词使用聚类技术,将文档集分成不同的组,保证同组内的文档内容是相似的;接着,使用统计的方法选出最能表达每组文档内容的关键词;将这些关键词作为本体中的概念,并根据先前聚类的结果给出概念间的分类关系.实际上,由于半结构化数据具有隐含的结构,所以在获取本体的过程中,可以利用这些隐含的结构信息来改善本体学习的结果.例如在进行领域概念抽取时,可以根据文档中的标签区分概念出现的位置,然后通过在传统的统计公式上增加关于位置信息的权重来提高概念抽取的准确度.

对于模式语言(例如XML schema 或DTD),因为它们描述了XML 数据的层次结构,通常认为它们是XML 的逻辑模型.所以类似于从结构化数据中学习本体,对于这些数据通常采用映射技术,即利用一些映射规则将其中的一些元素映射到本体.其中的研究重点是映射规则的发现,现有的方法可以分为两类:一类是基于学习的方法,即利用一些自学习的手段自动获取,例如Kavalec 等人[42]重点研究了利用机器学习方法自动地得到映射规则;另外一类是基于预定义规则,即用户预先给出了一些规则,例如,Doan 等人[43]和Mello 等人[44]使用预定义的规则,从DTD 中提取语义信息生成相应的概念模式,然后对这些概念模式进行语义集成得到本体.但是,由于各种模式语言在语法上的差异,需要使用不同的映射规则.为此,Volz 等人[53]提出将这些半结构化数据映射成一棵语法树,该语法树是一个四元组:非终结符集,终结符集,开始符集和规则集;然后使用一些规则将这些非终结符集和终结符集中的元素映射为本体中的概念和关系.通过使用语法树,该方法克服了现有模式语言(XML schema 和DTD)在语法上的差别,但当把XML Schema 映射成语法树时,该方法没有考虑XML Schema 的完整性约束,例如key,unique,keyref(key reference)等.

实际上,机器可读的词典(MRD)也是一种特殊的半结构化数据.作为一种通过手工方式认真组织的可靠的领域知识资源,它们也是一种非常好的本体学习数据源.这类数据源的内部结构虽然在很大程度上也是一种纯文本,但对于领域概念及其关系的抽取来说,仍有很多规律可循.所以,对于它们通常使用基于语言学的方法和基于模板的方法.例如:Litkowski [45]通过对词典中每个定义的分析,获取概念之间的分类关系;Rigau 等人[46]使用一组预定义的词典语法模板自动地从词典中发现词与词之间的上下位关系.

另外,随着语义Web 的发展,Web 中会出现越来越多的用OWL,RDF(S)等语言描述的本体,它们也是一种半结构化的数据.如何从已有的本体中学习新的本体也是当前国际上比较重视的一个课题,这其中更多地涉及到

本体的合并本体的映射等问题.由于篇幅有限,本文不作讨论.

4 本体学习工具

以上章节分别介绍了基于结构化数据非结构化数据和半结构化数据的本体学习技术中常用的方法和最新的研究进展.其中一些方法已经应用到本体学习工具之中.由于完全自动的本体学习技术还不现实,所以,现

1842

Journal of Software 软件学报 V ol.17, No.9, September 2006

有的本体学习工具都是半自动的.本体学习工具的

基本框架如图1所示.

图1表明,本体学习工具的输入可以是各种类

型的数据源.在此框架中,预处理模块首先对数据源

进行预处理;接着,学习模块通过使用算法库中的各

种本体学习算法从上一步预处理的结果中获取本

体;然后,将结果作为候选本体呈现给用户;最后,用

户在评价/编辑模块的帮助下对该候选结果进行评

价和确认,并将最终的结果添加到本体库中.可以看出,整个过程是在用户参与下的半自动的过程.需要注意的是,学习模块在获取本体的过程中需要参照

已有的本体.目前,一些算法已经提出可以利用已有

的本体作为背景知识来提高本体学习的精度[13].另

外,如果在本体学习之前已经存在了一个初步的本

体,那么在将本体学习结果添加到其中时,还要考虑

到新添加的知识和已有的知识是否存在不一致性等

问题.这就涉及到本体的进化问题,本文不作讨论.

到目前为止,国外已经开发了许多本体学习工具.虽然这些工具的系统框架在细节上各不相同,但都遵循如图1所示的基本框架和处理流程.本文重点介绍几个具有代表性的工具:Hasti,OntoLearn,Text-To-Onto,Onto Builder 和OntoLiFT.

4.1 工具简介

Hasti [38]是Amir Kabir University of Technology 开发的一个本体学习工具.其主要特点是:使用一个初始的核心本体,

然后基于该核心本体自动地从纯文本中获取新的概念关系和公理,从而不断地扩充这个初始的核心本体.它是为数不多的一个能够获取本体公理的工具.需要注意的是,它使用的这个核心本体是领域独立的,其中包括很少量的手工定义的概念分类关系非分类关系和公理.使用该核心本体的主要目的是便于对一些

新获取的概念关系和公理在本体中进行预定位.根据输入的纯文本的领域,Hasti 学习的结果可以是通用本体也可以是领域本体.该工具使用了多种本体学习方法:在获取概念时,它使用了基于语言学的方法;在获取概念间关系时,它使用了基于概念聚类(包括层次聚类和非层次聚类)的方法和基于模板的方法;在获取公理时,它使用基于模板的方法.除此之外,它还使用了启发式的学习方法,即在本体学习过程中,当同时出现多个可能的候选结果时,它利用一些启发式的规则来减少假设空间,消除不确定性.所以说,Hasti 使用的是一种启发式的混和的本体学习方法.目前,它已经可以做到从波斯文本中获取本体.

OntoLearn [26,27]是University of Rome 开发的一个基于文本的本体学习工具,它能够获取概念及其关系.其主要特点是:将语义解释的方法应用到本体获取中,即首先使用基于语言学和统计的方法从一组文本集中抽取出领域相关的术语,然后使用通用本体中的概念对这些术语进行语义解释,从而确定术语之间的分类和其他语义关系.OntoLearn 选择WordNet 作为通用本体,使用WordNet 中的概念对获取的术语进行语义解释,从而使所构建的领域本体与WordNet 具有明确的关系,这样的好处是有利于不同领域本体之间的互操作和一致化.

Text-To-Onto [13,48]是University of Karlsruhe 开发的一个整合的本体学习工具.其主要特点是可以支持从多种数据源中获取本体.目前,它已经可以做到从非结构化数据(纯文本)和半结构化数据(HTML,词典)中获取概念及其关系.对于从非结构化数据中学习本体,它使用加权的词频统计方法来获取概念,使用基于概念层次聚类法来获取分类关系,使用基于关联规则的方法来获取非分类关系;对于HTML 数据,它将其预处理成纯文本,然后利用基于非结构化数据的本体学习方法从中获取本体;对于词典,它使用基于模板的学习方法.该系统能够处理德文和英文的数据源.

Fig.1 The basic framework of ontology learning tools 图1 本体学习工具的基本框架

HTML XML

杜小勇 等:本体学习研究综述

1843

OntoBuilder [49,50]是Mississippi State University 开发的一个从XML 和HTML 中获取本体(包括概念及其关系)的工具.它看起来像一个Web 浏览器.当使用它来获取本体之前,需要手工构建一个初始的领域本体;然后,在用户浏览包含相关领域信息的网站的过程中,该工具会为每个网站生成一个候选本体[51];最后,在用户的参与下将这些候选本体与初始本体合并.其中,使用的本体学习方法主要是词频统计和模式匹配(

包括子串匹配内容

匹配

词典匹配).OntoBuilder 可以支持英文的网页,但在实际中,它并不能适用于所有的网站,因为有些网站包含了它不支持的技术,例如带有脚本(scripting)的网页.

OntoLiFT [52]是University of Karlsruhe 开发的一个从半结构化数据(XML schema,DTD)和结构化数据(关系数据库)中获取本体(包括概念及其关系)的工具.对于这两种类型的数据源,它都采用基于映射规则的方法来获取本体.在系统实现中,从XML Schema 和DTD 中获取本体的部分是基于一个已有的工具(hMarfra).HMarfra 能够实现从XML Schema 到本体的映射.然后,OntoLift 开发了一个从DTD 到XML Schema 映射的中间工具.这样,将这两个工具合并起来,就实现了从XML Schema 和DTD 中获取本体.从关系数据库中获取本体的部分是基于Java JDBC 标准提供的接口,然后按照一定的命名规范将数据库中的表名和属性名等信息,按照映射规则转换为本体中的元素.

4.2 工具的比较分析

除了本文提到的这5个具有代表性的工具外,还有许多各具特色的本体学习工具.由于目前还没有统一的评价标准,很难对它们进行定量的评价.一般来说,本体学习工具之间的主要区别在于:

(1) 数据源:即本体学习工具的输入数据的种类,

例如纯文本

Web

页面机器可读的词典等; (2) 学习方法:即本体学习工具为了从数据源中获取本体所采用的主要方法,例如:统计方法机器学习方法和模式匹配等方法;

(3) 本体学习对象:即本体学习工具从数据源中学习到的本体对象,

主要包括概念概念间关系和公理. 根据上述3个方面,现将本文介绍的5种本体学习工具进行总结(见表1).表1给出了在本文的分析框架下,现有工具对各类本体学习子问题的支持情况及采用的本体学习方法.表中给出的工具名称表示该工具可以支持从相应类型的数据源中获取相应的本体学习对象,工具名称后的括号内给出的是该工具针对该类本体学习子问题所采用的主要方法.

Table 1 Summary of ontology learning tools

表1 本体学习工具总结 Data resource Ontology

learning objects

Structured data Unstructured data Semi-Structured data Concept OntoLiFT

{mapping rules} Hasti{linguistic analysis / heuristic rules} OntoLearn{linguistic analysis / statistical frequencies } Text-To-Onto{statistical frequencies} OntoBuilder{statistical frequencies / matching} OntoLiFT{mapping rules}

Text-To-Onto{statistical frequencies}

Relation OntoLiFT {mapping rules} Hasti{cluster / template / heuristic rules} OntoLearn{semantic interpretation} Text-To-Onto{hierarchical concept clustering / association rules} OntoBuilder{statistical frequencies /

matching}

OntoLiFT{mapping rules}

Text-To-Onto{hierarchical concept

clustering / association rules / template}

Axiom

Hasti{template / heuristic rules} 表1表明:

(1) 支持从非结构化和半结构化数据中获取概念和概念间关系的工具比较多;支持从结构化数据中获取

概念和关系的工具只有OntoLiFT.说明虽然在数据库领域中关于从关系模型中抽取语义或将关系数

据模型转换为更复杂模型的研究由来已久,但将这些成果应用于本体学习中的研究还较少;

(2) 支持从结构化数据和半结构化数据中获取公理的工具还没有;支持从非结构化数据中获取公理的工

具只有Hasti.它是2004年开发出的一个本体工具,这表明关于本体公理的获取已经逐渐引起人们的

注意.虽然Hasti 中的公理获取方法还有很多不足,但它为今后的相关研究提供了一条思路;

1844

Journal of Software 软件学报 V ol.17, No.9, September 2006

(3) 这些工具都仅能支持基于某些类型的数据源的本体学习.例如:Hasti 和OntoLearn 支持的数据源只有

纯文本;Text-To-Onto 支持的数据源只有纯文本和某些半结构化数据;OntoBuilder 支持的数据源只有

XML 和HTML;OntoLiFT 支持的数据源只有XML Schema,DTD 和关系数据库,说明目前还没有一个

整合的本体学习系统;

(4) 大部分工具使用的本体学习方法都比较单一.说明这些工具都只能在某些情况下取得较好的结果.

因为任何一种本体学习方法都无法适用于所有的情况,为了提高工具的适用范围,必须利用多种本

体学习方法.将获得的结果有效地综合起来,从而保证在大部分情况下都能获得比较理想的结果.资

料表明,Text-To-Onto 和Hasti 都在朝这个方向努力.

另外,本体学习中的很多技术都依赖于对自然语言的处理.所以,本体学习工具具有很强的语言特征.其中: Hasti 支持波斯语;Text-To-Onto 支持英语和德语;OntoLearn,OntoBuilder 和OntoLiFT 都仅支持英语.目前还没有一个能够支持中文的本体学习工具.

5 存在的问题与未来的研究方向

本文根据数据源的结构化程度(

结构化

半结构化非结构化)以及本体学习对象的层次(

概念

关系公理),将本体学习问题划分为9类子问题,分别阐述了这9类问题的基本特征常用的方法和研究进展,并分析比较了现有的本体学习工具.从中可以看出:本体学习虽然是一个新兴的研究领域,但是许多相关领域的研究成果都可以供其借鉴.其中,自然语言处理技术是本体学习的基础.除此之外,领域概念的识别

Web 数据的抽取数

据库的逆向工程

机器学习等技术都极大地促进了本体学习领域的发展.然而,由于本体学习任务自身的特殊性,该领域仍然存在许多有待解决的问题.总结起来有以下几个方面:

? 对本体学习方法的改进

虽然目前已经提出了很多本体学习方法,但大部分方法都不理想.就基于结构化数据的本体学习来说,现有方法一般只考虑关系模式的语义,而没有进一步去挖掘大量元组中包含的语义信息,所以获取的概念数量和关系种类都非常有限.就基于非结构化数据的本体学习来说,它是目前研究较多的一大类问题,但是仍然没有一个成熟的领域概念获取方法,并且无法自动地为非分类关系赋予语义;就基于半结构化数据的本体学习来说,现有的方法往往是将其按照纯文本对待,没有充分地利用其隐含的结构信息;从本体学习对象的层次来看,现有研究主要集中在概念和关系的获取,公理的获取研究很少,然而,公理的定义和维护也是本体构建中一项重要的工作.总之,现有的方法仍然存在许多值得改进的地方(详见第1节~第3节的讨论).另外,针对同一个学习目标,本体学习技术中的任意一种方法都有自己的适用范围,无法保证在所有情况下都得到好的学习结果.因此,如何将各种方法进行综合从而获得更好的学习结果,是未来的一个研究方向.而且,现有的本体学习方法都需要人的参与,虽然完全自动的方法在短期内是不现实的,但由于Web 资源的大量性,还需要进一步提高本体学习的自动化程度,尽量减少用户的参与.

? 对本体学习工具的完善

目前的本体学习工具的功能都非常有限,它们都仅能处理某些类型的数据源,获取某些本体学习对象.而且,由于现有的本体学习方法的局限性,这些工具仍然很不成熟,一些最新的研究成果还没有应用其中(详见第4节的讨论).虽然由于缺乏客观的评价标准无法准确地对这些现有的本体学习工具进行定量的评价,但由于它们很多都是开放源码或可以免费下载的,所以通过使用可以感觉到它们无论在功能,

还是在稳定性

易用性等方面与实际应用还有一段距离.

未来需要一个完善的

整合的能够完成多种学习任务的本体学习工具. ? 对本体学习结果的评价

限于篇幅,本文没有详细讨论对本体学习结果的评价.总的来说,现有方法可以分为3类:

基于应用的方法基于“Golden Standard”的方法和基于专家评价的方法.其中:基于应用的方法是通过选择一些相关的应用,根据这些具体应用的结果来评价本体学习的结果;基于“Golden Standard”的方法是使用一些现有的手工构建的本体作为“Golden Standard”,将本体学习的结果与其相比;基于专家评价的方法是邀请一组领域专家对本体学习的

杜小勇等:本体学习研究综述1845

结果进行人工评价.在这些方法中,相关应用的选择“Golden Standard”的选择领域专家的选择都会极大地影响评价的结果,所以说很难使用它们对本体学习结果进行客观的评价.可见,本体学习技术作为一种无监督的学习技术,对其进行评价比对有监督的技术(例如分类技术)的评价更为困难,尤其是标准测试数据集(即标准数据源)的建立和标准结果(即标准本体或标准应用)的制定.目前还没有统一的评价本体学习结果的标准,不利于本体学习方法和工具的进一步发展.所以,如何对本体学习结果进行定量的评价是一个重要的研究方向,也是一个迫切需要解决的问题.

总之,国际上在本体学习方面的研究很活跃,并开发了一些相关的工具.国内在本体方面的研究刚刚起步,并且研究重点主要集中在如何利用本体来解决语义问题,而专门针对本体的快速构建(本体学习)方面的研究成果比较少,还没有一个能够支持中文的本体学习工具.由于中文语法的复杂性,中文本体学习技术确实存在很多困难,单纯依靠统计的手段或现有的与语言无关的算法很难获得令人满意的学习结果,必须结合中文自然语言处理领域的研究成果,使用一些基于规则的方法来改善本体学习的质量.随着本体在计算机科学领域的应用日益广泛,针对中文语言的特点展开相关研究并开发相应的工具是很有必要的.

References:

[1] Gruber TR. A translation approach to portable ontology specifications. Technical Report, KSL 92-71, Knowledge System

Laboratory, 1993.

[2] D eng ZH, Tang SW, Zhang M, Yang DQ, Chen J. Overview of ontology. Acta Scientiarum Naturalium Universitatis Pekinensis,

2002,38(5):730?738 (in Chinese with English abstract).

[3] Farquhar A, Fikes R, Rice J. The Ontolingua server: A tool for collaborative ontology construction. Int’l Journal of

Human-Computer Studies, 1997,46(6):707?727.

[4] Swartout B, Ramesh P, Knight K, Russ T. Toward distributed use of large-scale ontologies. In: Proc. of the AAAI Symp. on

Ontological Engineering. 1996. http://ksi.cpsc.ucalgary.ca/KAW/KAW96/swartout/Banff_96_final_2.html

[5] Duineveld AJ, Stoter R, Weiden MR, Kenepa B, Benjamins VR. Wonder tools? A comparative study of ontological engineering

tools. Int’l Journal of Human-Computer Studies, 2000,52(6):1111?1133.

[6] Noy NF, Fergerson RW, Musen MA. The knowledge model of protégé-2000: Combining interoperability and flexibility. In: Dieng

R, Corby O, eds. Proc. of the EKAW 2000. Heidelberg: Springer-Verlag, 2000. 17?32.

[7] Arpirez JC, Corcho O, Fernandez-Lopez M, Gomez-Perez A. WebODE: A scalable ontological engineering workbench. In: Gil Y,

Musen M, Shavlik J, eds. Proc. of the K-CAP 2001. New York: ACM Press, 2001. 6?13.

[8] Bechhofer S, Horrocks I, Goble C, Stevens R. OilEd: A reason-able ontology editor for the semantic Web. In: Baader F, Brewka G,

Eiter T, eds. Proc. of the KI 2001, Joint German/Austrian Conf. on AI. Heidelberg: Springer-Verlag, 2001. 396?408.

[9] Sure Y, Angele J, Erdmann M, Staab S, Studer R, Wenke D. OntoEdit: Collaborative ontology engineering for the semantic Web.

In: Horrocks I, Hendler JA, eds. Proc. of the ISWC 2002. Heidelberg: Springer-Verlag, 2002. 221?235.

[10] Bozsak E, Ehrig M, Handschuh S, Hotho A, Maedche A, Motik B, Oberle D, Schmitz C, Staab S, Stojanovic L, Stojanovic N,

Studer R, Stumme G, Sure Y, Tane J, Volz R, Zacharias V. KAON Towards a large scale semantic web. In: Bauknecht K, Mintjoa A, Quirchmayr G, eds. Proc. of the 3rd Int’l Conf. on E-Commerce and Web Technologies. Heidelberg: Springer-Verlag, 2002. 304?313.

[11] Lenat DB. CYC: A large-scale investment in knowledge infrastructure. Communications of the ACM, 1995,38(11):33?38.

[12] Nierenburg S, Beale S, Mahesh K, Onyshkevych B, Raskin V, Viegas E, Wilks Y, Zajac R. Lexicons in the mikrokosmos project.

In: Busa F, Johnston M, eds. Proc. of the AISB Workshop on Multilinguality in the Lexicon. Brighton: Ulrich Heid, 1996. 26?33.

[13] Maedche A. Ontology Learning for the Semantic Web. Boston: Kluwer Academic Publishers, 2002.

[14] Lawrence S, Giles CL. Searching the World Wide Web. Science, 1998,280(5360):98?100.

[15] Sa SX, Wang S. Introduction to Database System. 3rd ed. Beijing: Higher Education Press, 2002 (in Chinese).

[16] Ramanathan S, Hodges J. Reverse engineering relational schemas to object-oriented schemas. Technical Report, MSU-960701,

Mississippi State University, 1996.

[17] Johannesson P. A method for transforming relational schemas into conceptual schemas. In: Rusinkiewicz M, ed. Proc. of the

ICDE’94. Boston: IEEE Computer Society, 1994. 190?201.

[18] Stojanovic L, Stojanovic N, Volz R. Migrating data-intensive web sites into the semantic Web. In: Proc. of the 17th ACM Symp. on

Applied Computing. New York: ACM Press, 2002. 1100?1107. http://www.fzi.de/ipe/publikationen.php?id=820

1846 Journal of Software软件学报 V ol.17, No.9, September 2006

[19] Kashyap V. Design and creation of ontologies for environmental information retrieval. In: Proc. of the Workshop on Knowledge

Acquisition, Modeling and Management.1999. http://sern.ucalgary.ca/KSI/KAW/KAW99/papers/Kashyap1/kashyap.pdf

[20] Astrova I. Reverse engineering of relational database to ontologies. In: Davies J, et al, eds. Proc. of the ESWC 2004. Heidelberg:

Springer-Verlag, 2004. 327?341.

[21] Han J, Kamber M, write. Fan M, Meng XF, et al, translate. Data Mining: Concepts and Techniques. Beijing: China Machine Press,

2001 (in Chinese).

[22] Astrova I, Stantic B. Reverse engineering of relational database to ontologies: an approach based on an analysis of HTML forms. In:

Proc. of the Workshop on Knowledge Discovery and Ontologies at ECML/PKDD. 2004. http://olp.dfki.de/pkdd04/astrova-final.pdf [23] Wang J, Wen J, Lochovsky F, Ma W.Instance-Based schema matching for web databases by domain-specific query probing. In:

Mario AN, et al, eds. Proc. of the VLDB 2004. San Francisco: Morgan Kaufmann Publishers, 2004. 408?419.

[24] Agirre E, Ansa O, Hovy E, Martinez D. Enriching very large ontologies using the WWW. In: Staab S, Maedche A, eds. Proc. of the

ECAI 2004 Workshop on Ontology Learning. 2000. http://ol2000.aifb.uni-karlsruhe.de/

[25] Xu F, Kurz D, Piskorski J, Schmeier S. A domain adaptive approach to automatic acquisition of domain relevant terms and their

relations with bootstrapping. In: Proc. of the LREC 2002. http://www.dfki.uni-sb.de/~feiyu/LREC_TermExtraction_final.pdf. [26] Missikoff M, Navigli R, Velardi P.Integrated approach for web ontology learning and engineering. IEEE Computer, 2002,35(11):

60?63.

[27] Navigli R, Velardi P, Gangemi A. Ontology learning and its application to automated terminology translation. IEEE Intelligent

Systems, 2003,18(1):22?31.

[28] Daille B. Study and implementation of combined techniques for automatic extraction of terminology. In: Proc. of the ACL’94

Workshop “The Balancing Act: Combining Symbolic and Statistical Approaches to Language”. 1994. https://www.doczj.com/doc/fb3342628.html,/W/ W94/W94-0104.pdf

[29] Velardi P, Fabriani P, Missikoff M. Using text processing techniques to automatically enrich a domain ontology. In: Proc. of the

FOIS. New York: ACM Press, 2001. 270?284.

[30] Hearst MA. Automatic acquisition of hyponyms from large text corpora. In: Bourigault D, ed. Proc. of the COLING.1999.

539?545. http://www.cs.mu.oz.au/acl/C/C92/C92-2082.pdf

[31] Fisher DH. Knowledge acquisition via incremental conceptual clustering. Machine Learning, 1987,2(2):139?172.

[32] Bisson G.Learning in FOL with a similarity measure. In: Pinkas G, Dechter R, eds. Proc. of the AAAI. San Francisco: Morgan

Kaufmann Publishers, 1992. 82?87.

[33] Emde W, Wettschereck D. Relational instance-based learning. In: Saitta L, ed. Proc. of the ICML’96. San Francisco: Morgan

Kaufmann Publishers, 1996. 122?130.

[34] Faure D, Nedellec C. A corpus-based conceptual clustering method for verb frames and ontology acquisition. In: Velardi P, ed.

Proc. of the LREC Workshop on Adapting Lexical and Corpus Resources to Sublanguages and Applications. Granada: LREC, 1998.

5?12.

[35] Maedche A, Staab S. Discovering conceptual relations from text. In: Horn W, ed. Proc. of the ECAI 2000. Amsterdam: IOS Press,

2000. 321?325.

[36] Maedche A, Staab S. Ontology learning for the semantic Web. IEEE Intelligent System, Special Issue on the Semantic Web, 2001,

16(2):72?79.

[37] Nakaya N, Kurematsu M, Yamaguchi T. A domain ontology development environment using a MRD and text corpus. In: Proc. of

the Joint Conf. on Knowledge Based Software Engineering. 2002. http://panda.cs.inf.shizuoka.ac.jp/mmm/doddle/publication/ jckbse2002.pdf

[38] Shamsfard M, Barforoush AA. Learning ontologies from natural language texts. Int’l Journal Human-Computer Studies, 2004,60(1):

17?63.

[39] C hen WL, Zhu JB, Yao TS. Automatic learning field words by bootstrapping. In: Proc. of the JSCL. Beijing: Tsinghua University

Press, 2003. 67?72 (in Chinese with English abstract).

[40] Z heng JH, Lu JL. Study of an improved keywords distillation method. Computer Engineering, 2005,31(18):194?196 (in Chinese

with English abstract).

[41] D u B, Tian HF, Wang L, Lu RZ. Design of domain-specific term extractor based on multi-strategy. Computer Engineering,

2005,31(14):159?160 (in Chinese with English abstract).

杜小勇等:本体学习研究综述1847

[42] Kavalec M, Svátek V. A study on automated relation labelling in ontology learning. In: Buitelaar P, Cimiano P, Magnini B, eds.

Ontology Learning from Text: Methods, Evaluation and Applications. Amsterdam: IOS Press, 2005. http://nb.vse.cz/~svatek/ olp05.pdf

[43] Doan A, Domingos P, Levy A. Learning source descriptions for data integration. In: Suciu D, Vossen G, eds. Proc. of the

Workshop on the Web and Database. Heidelberg: Springer-Verlag, 2000. 81?86.

[44] Mello RdS, Heuser CA. A bottom-up approach for integration of XML sources. In: Simon E, Tanaka AK, eds. Proc. of the WIIW.

Brazil, 2001. 118?124.

[45] Litkowski K. Models of the semantic structure of dictionaries. Journal of Computational Liguistics, 1978,15(81):25?74.

[46] Rigau G, Rodrigues H, Agirre E. Building accurate semantic taxonomies from monolingual MRDs. In: Proc. of the COLING-ACL.

San Francisco: Morgan Kaufmann Publishers, 1998. 1103?1109. https://www.doczj.com/doc/fb3342628.html,/P/P98/P98-2181.pdf

[47] Papatheodorou C, Vassiliou A, Simon B. Discovery of ontologies for learning resources using word-based clustering. In: Kommers

P, Richards G, eds. Proc. of the World Conf. on Educational Multimedia, Hypermedia and Telecommunications. Chesapeake: AACE, 2002. 1523?1528.

[48] Maedche A, Staab S. The ontology extraction & maintenance environment Text-to-Onto. In: Proc. of the ICDM 2001 Workshop on

the Integration of Data Mining and Knowledge Management. 2001. http://cui.unige.ch/~hilario/icdm-01/DM-KM-Final/Volz.pdf [49] Modica G, Gal A, Jamil HM. The use of machine-generated ontologies in dynamic information seeking. In: Batini C, Giunchiglia F,

Giorgini P, Mecella M, eds. Proc. of the 9th Int’l Conf. on Cooperative Information Systems. Heidelberg: Springer-Verlag, 2001.

433?448. 

[50] Avigdor G, Giovanni M, Hasan J. OntoBuilder: Fully automatic extraction and consolidation of ontologies from Web sources. In:

Proc. of the ICDE 2004. Boston: IEEE Computer Society, 2004. 853?853. https://www.doczj.com/doc/fb3342628.html,/comp/proceedings/icde/2004/ 2065/00/20650853.pdf

[51] Gal A, Anaby-Tavor A, Trombetta A, Montesi D. A framework for modeling and evaluating automatic semantic reconciliation.

VLDB Journal, 2005,14(1):50?67.

[52] Volz R, Oberle D, Staab S, Studer R. OntoLiFT prototype. IST Project 2001-33052 WonderWeb Deliverable 11. 2003.

附中文参考文献:

[2] 邓志鸿,唐世渭,张铭,杨冬青,陈捷.Ontology研究综述.北京大学学报(自然科学版),2002,38(5):730?738.

[15] 萨师煊,王珊.数据库系统概论.第3版.北京:高等教育出版社,2002.

[21] Han J,Kamber M,著.范明,孟小峰,等,译.数据挖掘概念与技术.北京:机械工业出版社,2001.

[39] 陈文亮,朱靖波,姚天顺.基于Bootstrapping的领域词汇自动获取.见:第7届全国计算语言学联合学术会议论文集(JSCL 2003).

北京:清华大学出版社,2003.67?72.

[40] 郑家恒,卢娇丽.关键词抽取方法的研究.计算机工程,2005,31(18):194?196.

[41] 杜波,田怀凤,王立,陆汝占.基于多策略的专业领域术语抽取器的设计.计算机工程,2005,31(14):159?160.

杜小勇(1963),男,浙江开化人,博士,教授,博士生导师,CCF高级会员,主要研究领域为智能信息检索,高性能数据库,知识工程.

王珊(1944),女,教授,博士生导师,CCF 高级会员,主要研究领域为高性能数据库,数据仓库,知识工程

.

李曼(1977),女,博士生,主要研究领域为

本体,语义Web,智能信息检索.

本体学习研究综述

作者:杜小勇, 李曼, 王珊, DU Xiao-Yong, LI Man, WANG Shan

作者单位:杜小勇,王珊,DU Xiao-Yong,WANG Shan(中国人民大学,信息学院,北京,100872;教育部数据工程与知识工程重点实验室,北京,100872), 李曼,LI Man(中国人民大学,信息学院,北京

,100872)

刊名:

软件学报

英文刊名:JOURNAL OF SOFTWARE

年,卷(期):2006,17(9)

被引用次数:50次

参考文献(58条)

1.Gruber TR A translation approach to portable ontology specifications 1993

2.Deng ZH.Tang SW.Zhang M.Yang DQ Chen J Overview of ontology (in Chinese with English abstract)[期刊论文]-Acta Scientiarum Naturalium Universitatis Pekinensis 2002(05)

3.Farquhar A.Fikes R.Rice J The Ontolingua server:A tool for collaborative ontology construction

1997(06)

4.Swartout B.Ramesh P.Knight K.Russ T Toward distributed use of large-scale ontologies 1996

5.Duineveld AJ.Stoter R.Weiden MR.Kenepa B Benjamins VR Wonder tools? A comparative study of

ontological engineering tools 2000(06)

6.Noy NF.Fergerson RW.Musen MA The knowledge model of protégé-2000:Combining interoperability and flexibility 2000

7.Arpirez JC.Corcho O.Fernandez-Lopez M.Gomez-Perez A WebODE:A scalable ontological engineering workbench 2001

8.Bechhofer S.Horrocks I.Goble C.Stevens R OilEd:A reason-able ontology editor for the semantic Web 2001

9.Sure Y.Angele J.Erdmann M.Staab S,Studer R,Wenke D OntoEdit:Collaborative ontology engineering for the semantic Web 2002

10.Bozsak E.Ehrig M.Handschuh S.Hotho A,Maedche A,Motik B,Oberle D,Schmitz C,Staab S,Stojanovic

L,Stojanovic N,Studer R,Stumme G,Sure Y,Tane J,Volz R,Zacharias V KAON-Towards a large scale semantic web 2002

11.Lenat DB CYC:A large-scale investment in knowledge infrastructure 1995(11)

12.Nierenburg S.Beale S.Mahesh K.Onyshkevych B,Raskin V,Viegas E,Wilks Y,Zajac R Lexicons in the mikrokosmos project 1996

13.Maedche A Ontology Learning for the Semantic Web 2002

https://www.doczj.com/doc/fb3342628.html,wrence S.Giles CL Searching the World Wide Web 1998(5360)

15.Sa SX.Wang S Introduction to Database System 2002

16.Ramanathan S.Hodges J Reverse engineering relational schemas to object-oriented schemas 1996

17.Johannesson P A method for transforming relational schemas into conceptual schemas 1994

18.Stojanovic L.Stojanovic N.Volz R Migrating data-intensive web sites into the semantic Web 2002

19.Kashyap V Design and creation of ontologies for environmental information retrieval 1999

21.Han J.Kamber M.write Fan M.Meng XF translate.Data Mining:Concepts and Techniques 2001

22.Astrova I.Stantic B Reverse engineering of relational database to ontologies:an approach based on an analysis of HTML forms 2004

23.Wang J.Wen J.Lochovsky F.Ma W Instance-Based schema matching for web databases by domain-specific query probing 2004

24.Agirre E.Ansa O.Hovy E.Martinez D Enriching very large ontologies using the WWW 2000

25.Xu F.Kurz D.Piskorski J.Schmeier S A domain adaptive approach to automatic acquisition of domain relevant terms and their relations with bootstrapping

26.Missikoff M.Navigli R.Velardi P Integrated approach for web ontology learning and engineering

2002(11)

27.Navigli R.Velardi P.Gangemi A Ontology learning and its application to automated terminology translation 2003(01)

28.Daille B Study and implementation of combined techniques for automatic extraction of terminology 1994

29.Velardi P.Fabriani P.Missikoff M Using text processing techniques to automatically enrich a domain ontology 2001

30.Hearst MA Automatic acquisition of hyponyms from large text corpora 1999

31.Fisher DH Knowledge acquisition via incremental conceptual clustering 1987(02)

32.Bisson G Learning in FOL with a similarity measure 1992

33.Emde W.Wettschereck D Relational instance-based learning 1996

34.Faure D.Nedellec C A corpus-based conceptual clustering method for verb frames and ontology acquisition 1998

35.Maedche A.Staab S Discovering conceptual relations from text 2000

36.Maedche A.Staab S Ontology learning for the semantic Web 2001(02)

37.Nakaya N.Kurematsu M.Yamaguchi T A domain ontology development environment using a MRD and text corpus 2002

38.Shamsfard M.Barforoush AA Learning ontologies from natural language texts 2004(01)

39.Chen WL.Zhu JB.Yao TS Automatic learning field words by bootstrapping 2003

40.Zheng JH.Lu JL Study of an improved keywords distillation method (in Chinese with English abstract) [期刊论文]-Computer Engineering 2005(18)

41.Du B.Tian HF.Wang L.Lu RZ Design of domain-specific term extractor based on multi-strategy (in Chinese with English abstract)[期刊论文]-Computer Engineering 2005(14)

42.Kavalec M.Svátek V A study on automated relation labelling in ontology learning 2005

43.Doan A.Domingos P.Levy A Learning source descriptions for data integration 2000

44.Mello RdS.Heuser CA A bottom-up approach for integration of XML sources 2001

45.Litkowski K Models of the semantic structure of dictionaries 1978(81)

46.Rigau G.Rodrigues H.Agirre E Building accurate semantic taxonomies from monolingual MRDs 1998

clustering 2002

48.Maedche A.Staab S The ontology extraction & maintenance environment Text-to-Onto 2001

49.Modica G.Gal A.Jamil HM The use of machine-generated ontologies in dynamic information seeking 2001

50.Avigdor G.Giovanni M.Hasan J OntoBuilder:Fully automatic extraction and consolidation of ontologies from Web sources 2004

51.Gal A.Anaby-Tavor A.Trombetta A.Montesi D A framework for modeling and evaluating automatic semantic reconciliation 2005(01)

52.Volz R.Oberle D.Staab S.Studer R OntoLiFT prototype.IST Project 2001-33052 WonderWeb Deliverable 11 2003

53.邓志鸿.唐世渭.张铭Ontology研究综述[期刊论文]-北京大学学报(自然科学版) 2002(05)

54.萨师煊.王珊数据库系统概论 2002

55.Jawei Han.Micheline kamber.范明.孟小锋数据挖掘-概念与技术 2001

56.陈文亮.朱靖波.姚天顺基于Bootstrapping的领域词汇自动获取[会议论文] 2003

57.郑家恒.卢娇丽关键词抽取方法的研究[期刊论文]-计算机工程 2005(18)

58.杜波.田怀凤.王立.陆汝占基于多策略的专业领域术语抽取器的设计[期刊论文]-计算机工程 2005(14)

相似文献(10条)

1.期刊论文王昊.刘建华.苏新宁.杨建林.Wang Hao.Liu Jianhua.Su Xinning.Yang Jianlin面向语义网的本体学习

技术和系统研究-现代图书情报技术2009,""(1)

针对网络中存在的不同结构化程度的数据,探讨目前用于实现语义网的各种常见本体学习技术、方法及其可获得的本体元素、存在的问题,比较当前融合多种本体学习技术的本体学习系统,分析所采用的关键技术、适用的处理对象以及生成的结果描述.

2.学位论文刘柏嵩基于Web的通用本体学习研究2007

语义Web提出以来,本体(Ontology)正在成为人工智能和知识工程中一种重要的工具,在知识的获取、表示、分析和应用等方面具有重要的意义。从本体开发的角度来说,由于借助本体编辑器(如Protdgd)手工开发本体是一个繁重和棘手的任务,极易导致知识获取的瓶颈。因此,Web本体的可获取性已被学术界公认为是制约语义Web成功的巨大挑战之一。从现有信息源,包括文本、词典、遗留知识库、WWW文档等,获取领域知识、以自动方式构建或扩充本体,即所谓的本体学习(OntologyLearning),是开发本体的有效途径。

目前国际上在本体学习方面的研究非常活跃,虽然已经提出了很多本体学习方法,但大部分方法都不理想。由于缺乏统一的本体学习体系结构概念和方法,虽然开发了一些本体学习方法,但这些方法难以被其他系统重用。当前本体学习系统工具多是原型系统,不能大规模实时处理网上海量信息源,也缺乏中文语料处理能力。同时,目前还缺乏有效的评价本体学习结果的标准和方法,不利于本体学习方法和工具的进一步发展。

本文就是在开放的网络环境下,综合运用机器学习和自然语言处理方法,按照分层技术原理,提出了一种新的分层本体学习方法体系,并实现了一种基于Web的多策略本体学习工具GOLF,然后讨论了本体演化和评价方法,并对本体学习框架GOLF进行了实验和评价。本文的主要研究内容如下:

(1)提出了一种分层本体学习方法体系,其中包括术语自动抽取、概念学习、实例学习和分类关系学习和非分类关系学习多种关键技术。在对现有学习方法做大量改进的基础上,完全实现了本体学习全过程的无缝集成,并且在本体学习系统中集成了本体评价模块。

(2)开发了基于Web的多语种通用本体学习工具GOLF,并采用Web文档作为本体学习源,进行了跨领域、多语种实验。同时,实现本体学习过程中的本体演化管理,并对学习结果进行评价和反馈。

(3)在本体学习中引入多策略学习方法,以提高学习质量。各学习算法的组合框架采用概率组合分布,可根据不同的语料特征为每个算法设定权值,从而增强了对不同领域语料的适应性。通过实验对比分析,在学习结果的准确率和召回率方面,GOLF系统都比著名的Text20nto系统更好。

(4)实现了中文语料的本体学习。本文所提出的方法和工具能够很好地处理多语种语料,与同类系统(大多只能处理西文文本)相比,对中文的处理能力明显加强;特别针对中文的语言学特征,引入HowNet语义词典,添加了对应于中文文本的语言学模式和停用词表,性能有明显改善。

(5)提出了一种新的基于贝叶斯决策理论的本体评价方法RiMOE,并采用RiMOE方法对GOLF的学习过程和结果进行评价。

(6)本体学习系统GOF运用模块化设计思想,可以灵活地组合不同的功能模块,大大提高了系统的可扩展性。用户可以根据不同的领域特征和语种配置模块,可以集成不同的语言学模式和语义词典。

本体学习的研究将从根本上改变网络环境下知识系统的构建方式,对计算网格和语义Web的发展并最终普及应用起很大的推动作用。实验表明,本文提出的本体学习方法和工具基本实现了跨领域、跨语种的自动无监督本体学习功能,且性能良好。本文以“973”重大项目为依托,对Web环境下本体学习和评价进行了积极、有效的探索,尤其是按照分层思路、采用集成学习方法,在多语种、跨领域本体自动构建方面取得了良好的效果。

3.期刊论文徐济成.李绍稳.张友华.XU Ji-cheng.LI Shao-wen.ZHANG You-hua农业本体及本体学习研究-计算机技

术与发展2009,19(8)

目前国际上关于本体学习的研究非常活跃.利用本体学习技术来实现本体的半自动或自动构建就成为克服手工构建本体的困难和大规模开发本体的有效途经.介绍了本体理论和本体学习,综述了国内外农业本体的研究现状,特别介绍了农业本体学习的过程,给出了农业本体学习的关键理论和技术,采用基于统计、隐含语义检索和关联规则的算法提取概念;采用模式匹配和聚类算法提取概念问关系,列举了目前常用的本体学习工具,分析了本体学习结果的评价方法.

4.学位论文桑爱菊基于Text2Onto的中文本体学习技术研究2009

随着新一代互联网——语义Web——研究的不断深入,本体(ontology)正在成为人工智能和知识工程中一种重要的工具,在知识的获取、表示、分析和应用等方面具有重要的意义。本体的手工构建是一项繁琐而辛苦的任务,极易导致知识获取的瓶颈。因此,Web本体的可获取性已被学术界公认为是制约语义

相应的,对于语义Web在中国的推广和应用而言,中文本体的获取是非常重要的。如何从现有的各领域的大量中文文献中获取本体,同时提高所得本体的质量使其能被有效利用,成为语义Web在中文环境下推广的一个重要课题。

本文在Text20nto框架下,针对中文的特点及中西文之间的差别围绕中文本体的获取技术展开了讨论和研究,其中利用了ICTCLAS分词工具。首先我们介绍了Text20nto的优点、系统架构,工作原理及关键的算法。然后针对中文本体学习这一领域存在的问题提出了基于Text20nto的中文本体学习技术框架,并对这个框架下的几个关键的技术问题,包括中文语料预处理、术语概念抽取、语义关系抽取,分别作了更为详细的介绍,给出了中文术语概念抽取及过滤的具体算法。最后,分析了现有本体学习系统的体系结构,在Text20nto的基础上整合了中文分词,加入中文概念抽取及过滤算法,实现了中文本体学习系统框架。

通过实验,我们认为基于Text20nto的中文本体学习技术研究是对中文本体获取的一次非常有意义的尝试,初步解决了中文术语概念的抽取及过滤问题,并为后续的中文本体学习技术研究打下了良好的基础。

5.会议论文程波波.张友华.李绍稳.朱利君基于文本的本体学习研究综述2008

近年来,本体学习的研究在计算机领域变得越来越深入,而基于文本的本体学习研究正成为本体学习研究的重点.文章主要探讨了面向文本的本体学习技术,描述了当前国内外本体学习领域的研究现状,对本体学习任务、学习方法、学习工具进行了说明,特别是对本体学习领域关于概念和关系的自动抽取做了详细介绍,文章最后提出了本体学习研究出现的问题以及下一步研究方向.

6.学位论文贾秀玲面向文本的本体学习中概念提取及关系提取的研究2007

对本体的研究在计算机领域变的越来越广泛,但手工构造本体是一项繁琐而辛苦的任务还会导致知识获取瓶颈。本体学习(ontologylearning)技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的半自动构建。本体学习涉及到从输入数据中提取本体学习内容(概念知识)并用这些内容构建本体。现实世界中的数据种类很多,例如纯文本以及XML,HTML,DTD等,大部分都可以作为本体学习的数据源。针对不同类型的数据源需要采用不同的本体学习技术。根据数据源的结构化程度将本体学习技术分为三大类:基于结构化数据的本体学习技术、基于非结构化数据的本体学习技术和基于半结构化数据的本体学习技术。

本文主要是对面向文本的本体学习中的概念提取和关系提取进行了理论研究并做了实验测试,提出了新的见解和创新:

对本体学习的理论基础进行了研究,其中包括本体的定义、特征、类型、描述语言以及本体建立方法。

分析了本体学习的一般周期,并对本体学习中的学习内容、目前出现的本体学习系统及其所采用的体系结构和评价标准做了详细介绍。本文首次对目前四个有代表性的本体学习系统做了特征比较。

提出了面向文本的本体学习系统(OLSFT),该系统由管理组件、资源处理组件、算法库组件和协调组件构成。在算法库组件中主要包括概念提取算法和概念间关系提取算法。在概念提取中本文主要采用统计的方法,对一般的基于假设的概念提取方法做了改进,提出了领域相关度和领域一致度相结合的方法使提取出的概念更具代表性。概念间关系提取算法则主要采用词汇句法模式法和关联规则方法,并对以后的算法改进方向做了说明。

此外,本文对本体学习系统的主要构成模块进行了研究,根据各个模块功能的不同提出了具体的性能衡量指标,并通过实验做了测试。这些为构建完善的本体学习系统提供了参考,实验证明本研究是可行的。

7.期刊论文张海营.Zhang Haiying本体学习和基于句型规则的自举本体学习方法模型设计-图书情报工作

2007,51(9)

介绍本体学习的概念和发展,分析现有的本体学习的体系结构,研究中文本体学习这一领域存在的主要问题,包括中文语料特有的分词、词性和行文灵活问题等,基于中文本体获取中存在的困难,针对中文语料中丰富的句型要素,提出基于句型规则的自举本体学习方法,构建整个方法的框架模型,详细分析该模型以及其运行流程中的两个关键环节:规则学习环节和本体学习环节.最后分析该方法的特点和意义.

8.学位论文邱桃荣面向本体学习的粒计算方法研究2009

随着Web发展,面向主题的领域数据源(本文称为领域信息系统)不仅越来越多,而且其包含的信息非常丰富。这类数据源可以归属于半结构化数据源,具有内部结构不完整、内容不完备或不精确或不确定、数据量大、动态和分布式存储等特点。如今,从这类数据源中用于实现知识抽取和知识表示的方法正变得日益重要。

然而,现有的本体学习方法基本上是基于非结构化和结构化数据源下提出的,对半结构化数据源进行本体学习时一般按基于非结构化方法进行相应处理,而没有充分考虑半结构化数据源本身具有的隐含结构特征。从现有的文献资料看很少专门介绍基于半结构化数据源的本体学习方法与技术的阐述。因此

,从领域信息系统中实现知识抽取以构建近似本体必然给本体学习算法带来很大的挑战。

另一方面,虽然在粒计算数据挖掘方面有不少学者进行了广泛深入的研究,但从领域信息系统这类数据源中进行基于粒计算的数据挖掘方法研究还不多见。由于粒计算在不完备、不确定信息处理和对复杂问题近似求解方面具有特殊的优势,所以针对领域信息系统,通过研究基于粒计算的数据挖掘方法不仅扩展数据挖掘、知识发现的理论与方法,而且将为在复杂数据源下的本体学习提供一条有效的途径。

本文以粒计算理论为指导,针对领域信息系统就面向本体学习的粒计算方法进行了一些探索性的研究工作。

本文的主要贡献表现在以下几个方面:

(1)通过对领域信息系统中信息函数的扩展,给出了领域信息系统的形式化描述和相应的粗糙集,提出了面向本体学习的领域概念粒度空间模型

首先,由于领域信息系统可以归属于一种半结构化数据,具有数据不完备又有数据值是多值等特点,需要对信息函数进行扩展。通过扩展的信息函数可以定义领域信息系统中对象之间的各种关系,包括等价关系,由此给出了相应的粗糙集模型,从而拓展了粗糙集应用环境。

其次,从面向本体概念学习和分类学习的需要出发,针对领域信息系统提出了一种逐层粒化方法生成具有不同抽象程度的信息粒(本文称为对象粒

),并从粒计算的近似概念观点出发定义了对象粒的特征描述和相应的特征支持集,构建了领域对象粒度空间。将对象粒及其特征描述结合为一个整体定义为概念粒,以此来体现领域(近似)概念。并通过层次粒化所生成的领域对象粒度空间诱导出相应的领域概念粒度空间。讨论了概念粒度空间中概念粒之间的关系、概念粒之间的运算、有关性质和领域不确定信息的粒近似表示,分析了概念粒度空间模型的特点。并将基于领域信息系统的本体概念学习和分类关系归结为概念粒度空间生成的过程。

(2)针对领域本体概念和概念之间关系获取的需要,提出领域多层次概念获取的粒计算方法

基于所提出的领域概念粒度空间模型,针对领域信息系统中特征值具有不确定或不精确的情形定义了具体的粒化准则,提出领域多层次概念获取算法(CGS),从而为领域信息系统的本体概念学习和分类关系学习提供了一种有效的解决方法和实现技术。并在该算法的基础上针对领域信息系统具有动态特征和分布性特征提出了领域多层次概念获取的增量方法(CGS2),从而能有效地适应动态数据源的需要。通过算法测试比较、原型演示测试,以及本体学习原型演示系统的初步应用表明所提出的方法是有效的。

(3)针对领域本体关系概念获取的需要,提出领域多维多层次之间关联关系挖掘的粒计算方法

通过关联关系的挖掘来实现领域本体关系概念及非分类关系的学习是一种经常使用的方法。先前的方法是针对非结构化数据源在已经具有概念集的基础上发现概念之间的关联关系。本文应用特征值域概念层次结构和关联关系挖掘的优化策略,提出了基于粒计算的领域多维多层次关联关系挖掘算法(G-Approach)。对所提出的算法进行详细的实例说明,并选择不同类型数据集和其他典型挖掘方法进行不同角度的测试与比较。测试结果表明了所提出的方法是有效的。另外,本文所提出的领域多维多层次之间关联关系挖掘的粒计算方法是直接运行于领域信息系统上,用于发现具有不同概念层次之间的关系概念。因此,所提出的方法不仅扩展了对复杂数据源数据挖掘方法,而且为领域本体关系概念学习提供了一种有效的解决方法与实现技术。

同时基于G-Approach方法提出领域多维多层次间关联关系的粒计算增量挖掘方法(G-Approach2),从而能适应动态的或分布式的领域信息系统的需要。实验测试与比较结果表明对非稠密型数据源G-Approach2方法比G-Approach方法具有更好的性能,但对完全属于稠密型数据集的测试结果却不如直接采用CGS方法好。因此,这需要我们进一步深入分析研究,以图改进增量方法使之能对稠密型数据集有更好的性能。

(4)针对本体非分类关系学习的需要,提出基于不同概念粒度空间的概念粒间交叉关系获取方法

针对同一领域信息系统从不同的角度或侧面构建不同领域概念粒度空间,通过分析粒间上下文,提出了基于不同领域概念粒度空间的概念粒间交叉关系获取方法。由此为从领域信息系统进行领域本体的非分类学习提供了一种有效的解决方法与实现技术。

(5)提出基于粒计算的本体学习框架

间关系的获取,三是将所获取的概念和关系映射为本体类和关系,包括类映射、关系映射和实例映射等;基于该框架和面向本体学习的粒计算方法设计了相应的原型演示系统,通过具体的数据集的测试运行验证了所提出的框架和算法是有效的。

9.期刊论文孔敬.Kong Jing本体学习:原理、方法与相关进展-情报学报2006,25(6)

本体学习是自动或半自动构建本体的一系列方法和技术.本文概述了本体学习的研究状况,描述了本体学习的框架结构,总结了本体学习的技术、方法与算法,提出了当前本体学习研究的问题与难题以及进一步研究方向.

10.学位论文傅魁基于Web的本体学习研究2007

本体能够支持人机之间、机器之间的信息交换、知识共享与重用,而得到越来越广泛的重视、研究和应用。然而,领域本体的匮乏却是困扰本体理论研究与现实应用的最主要瓶颈之一,本体学习应运而生,它能够以自动或半自动化的机器学习方式从多种不同的数据源中获取本体。相比国外较多本体学习研究而言,中文环境下本体学习刚刚拉开序幕。本文通过对基于Web的本体学习的研究,为具有实用价值的中文本体学习系统的研发提供理论方法基础。

论文在借鉴国外现有的本体学习理论、方法和技术的基础上,结合中文自然语言处理的研究成果,对中文环境下领域本体的概念获取、继承关系学习、嘱性关系学习和本体实例获取的理论方法展开研究。论文主要研究内容如下:

(1)通用本体学习系统的体系结构。设计了一种通用本体学习系统体系结构,由建立在资源层基础上的五大功能模块构成,分别为:资源管理模块、通用资源读写模块、数据预处理模块、本体抽取模块和本体评价与编辑模块。本文所提出的基于Web的本体学习的方法可组件式地无缝集成到该体系结构中。

(2)多策略领域概念获取。提出了一种融合信息抽取、中文自然语言处理、语言学和统计等多种策略的领域概念获取算法。能根据页面块特征判定结果自适应选择信息抽取或基于隐马模型和候选名词短语约简的术语获取方法,研究了基于搜索引擎的术语间同义词关系识别方法以及领域概念的过滤算法。

(3)继承关系学习。提出了基于Web分类目录判定的继承关系学习方法和基于语境自学习的继承关系学习方法。前者主要包括网页中Web分类目录判定算法、分类目录标注规则、隐式分类目录模式发现机制、标注文档合并中的歧义消解算法以及继承关系映像规则。后者主要包括继承关系语境的自学习机制和基于语境的继承关系获取算法。两种方法各有优缺点,具有互补性。

(4)基于知网的属性关系学习。属性关系具有重要作用,但研究很少。首先采用基于语境自学的方法获取候选属性集合;分析认为候选属性集合由非属性词汇、无效属性和有效属性构成,提出了利用知网中属性义原所描述的上下位关系实现非属性词汇过滤和利用属性——宿主关系实现无效属性过滤的算法

;研究基于领域概念树的实现属性关系映射与修剪的基本规则,设计了相应的算法。

(5)本体实例的获取。分析了Web网页中个体知识表示的主要形式,提出了基于本体的网页主题概念和个体知识表示特征的判定算法,重点设计了Web表格中本体实例获取的规则,包括本体实例表格识别规则、属性单元识别规则、属性值单元识别的基本规则和扩展规则、实例名称识别规则,给出了算法总体描述。

引证文献(48条)

1.靳伟.张月清.王芳基于本体的分类检索系统的设计与实现[期刊论文]-河北农业大学学报 2010(2)

2.胡哲.郑诚改进的概念语义相似度计算[期刊论文]-计算机工程与设计 2010(5)

3.温春.石昭祥.杨国正一种利用度属性获取本体概念层次的方法[期刊论文]-小型微型计算机系统 2010(2)

4.刘超.李绍稳.张友华.徐济成农业领域本体自适应学习建模研究[期刊论文]-农业网络信息 2010(1)

5.张玉芳.杨芬.熊忠阳.陈小莉基于上下文的领域本体概念和关系的提取[期刊论文]-计算机应用研究 2010(1)

6.王岁花.赵爱玲.马巍巍从Web中提取中文本体非分类关系的方法[期刊论文]-计算机工程与设计 2010(2)

7.毕鲁雁.焦宗夏.范圣韬.康荣杰基于本体映射的设计知识库搜索方法[期刊论文]-计算机集成制造系统 2009(10)

8.刘嘉琳.陈俊杰.李海芳Mpeg-7和FCA结合构建图像情感语义本体框架[期刊论文]-计算机工程与设计 2009(17)

9.温春.石昭祥.张亮中文领域本体概念层次获取方法对比研究[期刊论文]-计算机应用研究 2009(8)

10.张晓明.胡长军.李华昱.赵冲冲从关系数据库到本体映射研究综述[期刊论文]-小型微型计算机系统 2009(7)

11.张晓明.胡长军.李华昱.赵冲冲从关系数据库到本体映射研究综述[期刊论文]-小型微型计算机系统 2009(7)

12.温春.王晓斌.石昭祥中文领域本体学习中术语的自动抽取[期刊论文]-计算机应用研究 2009(7)

13.刘振中.刘勇基于UML类图的OWL本体映射方法[期刊论文]-计算机工程 2009(13)

14.沈学利.周纪超基于多本体的煤炭调度集成系统的研究[期刊论文]-世界科技研究与发展 2009(2)

15.李庭波.陈平留.郑德祥基于森林资源数据结构的本体学习探索[期刊论文]-西南林学院学报 2009(2)

16.赵涓涓.陈俊杰.刘嘉琳.许伟忠以本体为核心的图像情感语义检索模型[期刊论文]-计算机应用 2009(5)

17.邢军.韩敏基于两层向量空间模型和模糊FCA本体学习方法[期刊论文]-计算机研究与发展 2009(3)

18.邹军华课程本体的创建及描述[期刊论文]-中国教育技术装备 2009(6)

19.Chen Jia.Wu Yue Rules-based object-relational databases ontology construction[期刊论文]-系统工程与电子技术(英文版) 2009(1)

20.王昊.刘建华.苏新宁.杨建林面向语义网的本体学习技术和系统研究[期刊论文]-现代图书情报技术 2009(1)

21.朱碧岑.夏清国.朱郑州一种支持QoS约束的语义Web服务发现框架[期刊论文]-计算机工程 2009(2)

22.张宝燕.毛海飞汉语框架网络学习策略研究[期刊论文]-山西电子技术 2008(6)

23.蒋天民本体学习综述[期刊论文]-科技情报开发与经济 2008(33)

24.王芳.滕桂法.张玉新.任力生.马建斌.赵洋基于本体的农业问答语义管理系统设计与实现[期刊论文]-河北农业大学学报 2008(5)

25.王红滨.刘大昕.王念滨.张万松基于非结构化数据的本体学习研究[期刊论文]-计算机工程与应用 2008(26)

26.徐萍.邵波基于本体信息抽取的竞争情报预处理分析[期刊论文]-情报杂志 2008(9)

27.于娟.党延忠本体集成研究综述[期刊论文]-计算机科学 2008(7)

28.杨圣洪.贾焰非成熟领域的本体构建方法[期刊论文]-计算机工程与应用 2008(24)

29.陈佳.吴跃规则驱动的企业互操作本体构造[期刊论文]-计算机集成制造系统 2008(7)

30.马建红.张旭.赵轶.张浩基于本体的服务构件描述研究与实现[期刊论文]-微计算机信息 2008(18)

31.刘柏嵩.贺赛龙一种基于Web的分类体系学习算法[期刊论文]-宁波大学学报(理工版) 2008(1)

32.张囡囡.李冠宇.曲丽宁主要本体学习工具的比较分析[期刊论文]-微计算机信息 2008(12)

33.贾小林基于元数据的教学资源本体学习研究[期刊论文]-科学技术与工程 2008(9)

34.王俊丽.丁志军.蒋昌俊.孙萍本体概念分类的遗传算法[期刊论文]-高技术通讯 2008(3)

35.叶海军.熊筱芳.姚力文.刘萍基于本体的多Agent交互模型[期刊论文]-计算机与现代化 2008(4)

36.瞿裕忠.胡伟.郑东栋.仲新宇关系数据库模式和本体间映射的研究综述[期刊论文]-计算机研究与发展 2008(2)

37.张联超.黄志球.沈国华.周航基于逆向工程的本体构建方法研究[期刊论文]-计算机工程与设计 2007(24)

38.朱礼军.赵新力.孙钦山Apriori算法在政务本体构造中的应用[期刊论文]-计算机工程与设计 2007(24)

39.王珊.张俊.彭朝晖.战疆.杜小勇基于本体的关系数据库语义检索[期刊论文]-计算机科学与探索 2007(1)

40.王珊.张俊.彭朝晖.战疆.杜小勇基于本体的关系数据库语义检索[期刊论文]-计算机科学与探索 2007(1)

41.强彦.谢红薇基于Web数据的本体概念抽取[期刊论文]-电脑开发与应用 2007(11)

42.贾秀玲.文敦伟一种本体学习中分类关系提取方法的研究[期刊论文]-计算机技术与发展 2007(10)

43.谢轶群.舒江波基于本体的构件库智能检索方法研究[期刊论文]-湖南文理学院学报(自然科学版) 2007(3)

44.饶袆.刘鹏基于本体的GridGIS服务发现框架研究[期刊论文]-地理信息世界 2007(4)

45.修佳鹏.熊燕.张雷.吴建林基于OWL的战场本体构建方法[期刊论文]-郑州大学学报(理学版) 2007(2)

46.杜小勇.马文峰.武文娟学科领域本体的构建与进化——以经济学领域本体为例[期刊论文]-现代图书情报技术2007(3)

47.熊广.徐盈本体资源自动化构建问题研究[期刊论文]-科技情报开发与经济 2007(10)

48.张勇领域本体构建的方法研究[期刊论文]-渤海大学学报(自然科学版) 2006(4)

本文链接:https://www.doczj.com/doc/fb3342628.html,/Periodical_rjxb200609001.aspx

授权使用:河北大学(hebeidx),授权号:c194afc3-cf60-475b-84e1-9e00010c70d8

下载时间:2010年9月29日

马克思哲学物质本体论研究的切入方式

长期以来,本体论作为哲学的根基性问题一直是思考和研习马克思哲学的学者无法回避和拒斥的问题。马克思实现哲学变革后,作为哲学基础的本体论有没有发生改变,学界一直争议不断。要彻底究清马克思哲学本体论问题,就要直面三个问题:什么是本体论,马克思哲学有没有本体论,马克思哲学本体论是什么样的本体论。正确找到这三个问题的答案,马克思哲学本体论问题就能够得到解决。这样也就要求我们在探讨这一问题时候,要从四点做起:直面历史、直面逻辑、直面分歧、直面文本。 一、直面历史:“本体论”一词的语言考古学 所谓直面历史即直面哲学的历史,是指在研究马克思哲学本体论问题的时候要分析清楚本体论一词在哲学史上所指为何物,也就是对“什么是本体论”的回答。我们都知道,本体论这一概念是由西方哲学的ontology 一词译介过来的,其实ontology 一词从词根上看并不蕴有本体的意思,但当我们把这一词语翻译成本体论的时候,人们很容易将其理解为关于本体的学问。诚然,在当前的学术研究中,对本体论的研讨范围有不同的意见,但是大家都承认本体论有一个较为明确的研究对象。所以,从本体论的内涵着手是弄清马克思的新世界观有没有本体论以及是什么样的本体论的前提条件。从语词的发展来看,不管是英文中的ontology、法文中的 马克思哲学物质本体论研究的切入方式 徐 钊 (苏州大学 政治与公共管理学院,江苏 苏州 215123) 摘 要:长期以来,关于马克思哲学与本体论的关系问题一直是学术研究交锋与争鸣的重要问题,争论的焦点围绕三个问题:什么是本体论,马克思哲学有没有本体论,马克思哲学的本体论是什么样的本体论。解决这三个问题就要做到四个直面:直面历史、直面逻辑、直面分歧和直面文本。这样我们可以得出,马克思哲学是有本体论的,不能把马克思哲学本体论理解为“实践本体论”或“关系本体论”,马克思哲学本体论是物质本体论。 关键词:马克思哲学;本体论;物质本体论;实践本体论;关系本体论 中图分类号:B016 文献标识码:A 文章编号:1001-4403(2010)04-0022-05 ontologie,还是德文中的ontologie,都是由拉丁文中ontologia 一词发展而来的,而ontologia 又源自希腊文中表达“是”或“存在”的logos 和onta。我们发现,在希腊文中,on 和onta 在语义上等同于英文里的being 和beings、拉丁文的ens、德文的sein。在当前的中国学术界中,on 主要被翻译成“存在”、“有”和“是”。但是汉语的这些译名都只译出了on (being)的部分意思。王太庆认为:“他们的to be (Being)之类的词里头同时包含着我们的‘是’、‘有’、‘在’三个意思,他们认为这三个意思是一个意思,这三 合一的意义就体现在being 这个范畴里。” [1] 这样,我们可以在理解“是论”概念的同时,一并看出“是论”与具体的“是”的区别。从柏拉图的逻辑来看,“是”论是共同的“是”,具体的“是”是分有的“是”。所以,“是”有比“存在”更广泛的意义。用亚里士多德的话说:“‘是论’是专门研究‘有’(‘是’)本身,以及‘有’(‘是’) 凭本性具有的各 种属性。” [2]122 当然这不表明其他学科不研究“有”(“是”),它是说其他学科研究的只是“有”(“是”)的某一部分。也就是说“是”(“有”)指称的“什么”或“这个”是他们的研究问题。 沃尔夫对本体论的内涵作出了较为明确的回答,他说:“本体论论述各种关于有的抽象完全普遍的哲学范畴,认为‘有’是唯一的,善的;其中出现了唯一者、偶性、实体、因果、现象等范畴,这是 抽象的形而上学。” [3]179 此外,有些学者从本体论与收稿日期:2010-03-05 作者简介:徐钊(1966— ),男,苏州大学政治与公共管理学院博士生。 苏州大学学报(哲学社会科学版) Journal of Suzhou University (Philosophy & Social Science)2010年7月第4期Jul.2010No.4

车辆系统动力学发展1

汽车系统动力学的发展和现状 摘要:近年来,随着汽车工业的飞速发展,人们对汽车的舒适性、可靠性以及安全性也提出越来越高的要求,这些要求的实现都与汽车系统动力学相关。汽车系统动力学是研究所有与汽车系统运动有关的学科,它涉及的范围较广,除了影响车辆纵向运动及其子系统的动力学响应,还有车辆在垂向和横向两个方面的动力学内容。本文通过对汽车系统动力学的的介绍,对这一新兴学科的发展和现状做一阐述。 关键字:汽车系统动力学动力学响应发展历史 Summary:In recent years, with the rapid development of automobile industry, people on the vehicle comfort, reliability and safety are also put forward higher requirements, to achieve these requirements are related to vehicle system dynamics.Vehicle system dynamics is the study of all related to the movement of the car system discipline, it involves the scope is broad, in addition to the effects of dynamic response of vehicle longitudinal motion and its subsystems, and vehicles to and dynamic content crosswise two aspects in the vertical.Based on the vehicle system dynamics is introduced, the development and status of this emerging discipline to do elaborate. Keywords:Dynamics of vehicle system dynamics Dynamic response Development history 0 引言 车辆动力学是近代发展起来的一门新兴学科。有关车辆行驶振动分析的理论研究,最早可以追溯到100年前。事实上,知道20世纪20年代,人们对车辆行驶中的振动问题才开始有初步的了解;到20世纪30年代,英国的Lanchester、美国的Olley、法国的Broulhiet开始了车辆独立悬架的研究,并对转向运动学和悬架运动学对车辆性能的影响进行了分析。开始出现有关转向、稳定性、悬架方面的文章。同时,人们对轮胎侧向动力学的重要性也开始有所认识。 在随后的20年中,车辆动力学的进展甚微。进入20世纪50年代,可谓进入了一个车辆操纵动力学发展的“黄金时期”。这期间建立了较为完整的车辆操纵动力学线性域(即侧向加速度约小于0.3g)理论体系。随后有关行驶动力学的进一步发展,是在完善的测量和计算手段出现后才得以实现。人们对车辆动力学理解的进程中,理论和试验两方面因素均发挥了作用。随后的几十年,汽车制造商意识到行驶平顺性和操纵稳定性在汽车产品竞争中的重要作用,因而车辆动力学得以迅速发展。计算机及应用软件的开发,使建模的复杂程度不断提高。在过去的70多年中,车辆动力学在理论和实际应用方面也都取得了很多成就。在新车型的设计开发中,汽车制造商不仅依靠功能强大的计算机软件,更重要的是具有丰富测试经验和高超主观评价技能的工程师队伍。 传统的车辆动力学研究都是针对被动元件的设计而言,而采用主动控制来改变车辆动态性能的理念,则为车辆动力学开辟了一个崭新的研究领域。在车辆系统动力学研究中,采用“人—车—路”大闭环的概念应该是未来的发展趋势。作为驾驶者,人既起着控

国内农民发展研究综述

国内农民发展研究综述 摘要:自科学发展观提出以来,人的发展被置于发展的核心立场。中国的改革开放从农村起步,从促进农业和农村发展,到关注农民发展,构成了农民改革和发展的一条主线。近年来,学术界对农民发展问题的讨论持续升温,研究涉及农民发展的概念、农民发展的主体、农民发展的现状以及农民发展权问题。通过梳理研究文献,总结农民发展研究取得了成果,分析其存在的问题,是为了更好的促进农民发展研究。 关键词:农民发展;发展现状;农民发展权 自改革开放以来,农业、农村、农民问题发(即三农问题)一直是学术界研究的重点,并形成了一个新的学术研究领域。农民进城和学者下乡成为中国社会的一大社会景观。农民问题一直是三农问题的核心。近年来,农民问题研究引入了一个新的学术术语,即农民发展,引起了广泛的讨论。发展的本质是人的发展,人既是发展的主体、动力,也是发展的目标。中国的改革开放事业就是实现全体中国人民的发展。农民是中国最大的社会群体,中国的发展离不开农民的发展,农民发展既是中国发展的面临的艰巨任务和有待于破解的最大难题。没有农民发展,就不可能实现中国国家富强、

民族复兴、人民幸福的“中国梦”。农民发展概念的提出,把农民作为发展主体进行研究,提供了一个新的学术增长点,从而产生了一批较高质量的学术成果。学者们围绕农民发展的概念定义与内涵、农民发展的主体分类、农民发展的现状、农民发展权等问题进行了广泛的探讨,既有共识,也存在分歧。梳理近十年来有关农民发展的研究成果,总结农民发展研究的成果,分析其存在的不足,可以进一步拓展农民发展研究的创新空间。 一、农民发展的概念 农民发展,作为一个新近的学术概念,学术界从不同的角度加以界定。叶敬忠(2000)将农民发展定义为农民开展各种各样的活动来实现农户及农村社区的变迁的过程。这种变迁表现在很多方面,如社会、经济、文化、政治、机制与立法、人力与性别、知识与技术及环境等方面。[1]李克强(2007)认为农民发展的内涵就是农民本质力量和本质关系的发展,即农民意识的发展,根本就是提高自身的能力与素质。[2]赵宇霞等(2012)将农民发展概括为农民生存发展、本质发展和个性发展三个方面。[3]周明海(2008)综合现有发展学的有关理论,认为农民发展至少应有以下四层含义:农民发展的前提是获取平等的发展机会,农民发展的条件是政府均等化的资源投资,农民发展的态势在于可持续发展,农民发展的终极目标是消除贫困、实现实质自由。[4]

本体理论研究背景现状和应用

本体理论研究背景现状和应用 本体理论研究背景现状和应用 1 背景和现状 1.1 下一代互联网---语义网 1.2本体论的概念 1.3 语义网中的本体 .2 研究现状 1 背景和现状 1.1 下一代互联网---语义网 Internet上几乎有我们所需要的任何信息,但我们往往很难从这些海量的信息中得到我们所需要的.目前网上的信息搜索技术主要是采用关键字匹配的方式进行的,考虑的只是字面上的匹配,还不能对语义进行处理,这样返回给用户的查询结果要么是大量的无关内容,要么是什么也查不到.例如,假设一个用户希望搜索引擎为他找出所有海边的大学,因此他输入查询条件”university near the beach”搜索引擎首先通过相应的关键词处理技术得到关键词.例如“university,near, beach”,然后用这三个关键词与建立了索引的各个网页进行匹配,如果某个网页含有这些关键词,那么就认为符合用户的查询要求:最后利用rank技术对满足条件的所有网页根据匹配的权重进行排序,提供给用户.通过这种关键词匹配的方法,计算机既不理解用户的意图,也不理解网页的语义,只是简单的搜索加匹配,没有任何智能.最后用户得到的是大量的包含”university”,”near'’,”beach”这些词的网页.要得到“海滩边的大学”,用户得自己判断,甚至需要访问相应的网页,而其中真正符合条件的可能非常之少.假设有一所大学:UCLA大学的主页上提到了它邻近太平洋(near the Pacific Ocean),但是并没有提到它在海边.那么,搜索引擎无法找出UCLA这样实际上满足查询条件的大学,因为它无法理解”near the Pacific Ocean'’的语义,造成这种情况的原因是计算机无法理解信息的真正意义.一方面计算机直接处理自然语言在处理质量和速度上都还有很长的一段路要走:另一方面,目前的网页是设

综述 齿轮系统动力学的理论体系_王建军

齿轮系统动力学的理论体系 * 王建军 副教授 王建军 李润方 摘要 根据对国内外齿轮系统动力学研究成果的系统总结,阐述齿轮 系统动力学理论的基本结构体系。说明齿轮动力学的发展过程;围绕动态激 励、模型类型、建模和求解方法以及齿轮系统的固有特性、动态响应和动力稳定性等介绍齿轮系统动力学所涉及的基本问题,讨论该理论的主要工程应用的基础上,提出应进一步研究的方向与重点。 关键词 齿轮系统 动力学性能 理论体系 正问题 反问题 中国图书资料分类法分类号 T G132.41 1 齿轮系统动力学基本理论体系 齿轮系统动力学[1]是研究齿轮系统在传递运动和动力过程中的动力学行为的一门科学。它以齿轮系统为对象,以齿轮副啮合过程的动力学特性为核心,以提高和改善齿轮系统的动力学行为为目的,在充分考虑系统各零部件动态特性的基础上,利用振动力学理论和方法,研究齿轮系统在传递动力和运动中振动、冲击、噪声的基本规律, 为设计制造小振动、低噪声、高可靠性、高传动性能的齿轮系统提供理论依据。 齿轮系统是机器最主要的动力和运动传递装置,其力学行为和工作性能对整个机器有重要影响。因此,齿轮系统动力学近百年来一直受到人们的广泛关注,尤其是近20年来,由于相关力学的理论与实验技术的发展,促进了齿轮系统动力学的深入研究。迄今,已经形成了较为完整的齿轮系统动力学的基本理论体系(见图1),系统总结齿 图1齿轮系统动力学的基本理论体系 ?动载系统的计算方法?振动噪声的评价与防治?状态监测与故障诊断 ?系统参数与动态性能的关系?载荷识别与动态设计 齿轮动力学理论的应用 动态响应 (系统的输出)系统模型 (系统的力学、数学描述)动态激励(系统的输入)?稳定性指标?稳定性区域?稳定性性能?系统参数对稳定性的影响 动力稳定性?动载荷系统振动?系统参数的影响 动态响应?固有频率?固有振型?参数对固有特性的影响 固有特性?时变刚度?传递误差?齿侧间隙?支承弹性与间隙?系统阻尼 考虑因素?齿轮副纯扭模型?齿轮传动系统模型 模型类型?集中参数法 ?传递矩阵法 ?有限元法?动态子结构综合法 建模方法?时变啮合刚度?轮齿传递误差?啮入啮出冲击 内部激励?原动机的扭矩 ?负载的反作用力矩 外部激励求解方法 ?时域法 ?频域法?解析法?数值法?实验法 *国家自然科学基金资助项目(59575006),机械传动国家重点实验室开放基金资助项目 收稿日期:1997—01—03 修回日期:1998—11—20 轮系统动力学理论与方法的时机已经成熟。 2 齿轮系统动力学的发展 2.1 分析理论 (1)在本世纪50年代以前,以啮合冲击作为描述和解释齿轮动态激励、动态响应的基础,将齿轮系统简化为单自由度系统,以冲击作用下的单自由度系统的动态响应来表达齿轮系统的动力学行为。 50年代以后,将齿轮系统作为弹性的机械振动系 统,以振动理论为基础,分析在啮合刚度、传递误差和啮合冲击作用下,系统的动力学行为。这一发展奠定了现代齿轮系统动力学的基础。 (2)在振动理论的框架内,齿轮系统动力学经历了由线性振动理论向非线性振动理论的发展。在线性振动理论范畴内,人们以平均啮合刚度替代时变啮合刚度,并由此计算齿轮副的固有频率和振型,利用数值积分法计算系统的动态响应,不考虑因时变啮合刚度引起的动态稳定问题,且避免研究由齿侧间隙引起的非线性以及多对齿轮副、齿轮副 ? 55?齿轮系统动力学的理论体系——王建军 李润方

综述:本体的概念、方法和应用

综述:本体的概念、方法和应用 王昕 摘要:近十年来,本体(ontologies)和本体工程(ontological engineering)在知识工程及其相关的应用领域获得广泛的关注。本文作者在研究产品设计知识重用的过程中,阅读了大量有关本体的文献资料。作者认为,本体工程在信息共享、系统集成、基于知识的软件开发等方面具有重要的作用和广阔的应用前景,而在国内,这方面的研究刚刚起步。本文扼要介绍了这一新兴学科分支的概念、方法及研究和应用现状。 关键词:本体,本体工程,知识共享和重用 本体论(Ontology:o大写)原是哲学的分支,研究客观事物存在的本质。它与认识论(Epistemology)相对,认识论研究人类知识的本质和来源。也就是说,本体论研究客观存在,认识论研究主观认知。而本体(ontology:o小写)的含义是形成现象的根本实体(常与“现象”相对)。 在人工智能领域,知识建模必须在知识库和两个子系统之间建立联系:agent行为(问题求解技能)和环境(问题存在的领域)。而长期以来,AI的研究者较为注重前一个子系统,而领域知识的表达依赖于特定的任务,这样做的好处是只需要考虑相关的领域知识。但是,大规模的模型共享、系统集成、知识获取和重用依赖于领域的知识结构分析。因此,进入九十年代以来,任务独立(task-independent)的知识库(本体)的价值被发现,并受到广泛关注。本文作者在研究产品设计知识重用的过程中,阅读了大量有关本体的文献资料。作者认为,本体工程在信息共享、系统集成、基于知识的软件开发等方面具有重要的作用和广阔的应用前景,而在国内,这方面的研究刚刚起步。本文将扼要介绍这一新兴学科分支的概念、方法及研究和应用现状。 1 本体的基本概念 1.1 本体的定义 近十年来,本体的研究日趋成熟。在各种文献中,尽管与本体相关的概念和术语的用法并不完全一致,但是事实的使用约定已经出现。在参考文献[2]、[3]中,作者根据已有文献中相关概念和术语的使用情况,提出了推荐的使用约定。我们首先列出本体的几种比较有代表性的定义,然后对相关的概念做简要的描述。 本体(ontology)的几个代表性定义: (1) 本体是对于“概念化”的某一部分的明确的总结或表达。 (2) 本体在不同的场合分别指“概念化”或“本体理论”。 (3) 本体是对于“概念化”的明确表达。 (4) 本体是用于描述或表达某一领域知识的一组概念或术语。它可以用来组织知识库较高层次的知识抽象,也可以用来描述特定领域的知识。

马克思主义哲学本体论问题研究综述

马克思主义哲学本体论问题研究综述 丁钊,李栋梁 从20世纪80年代以来,马克思主义哲学的本体论研究,一直是中国哲学界关于马克思主义哲学创新讨论的焦点性问题之一、。此问题的讨论,首先源于对马克思主义哲学传统教科书体系的批判和反省。从“人道主义和异化问题”讨论到“主体性原则”的讨论,再到国内80年代中后期的“实践唯物主义”讨论,学术界在对马克思主义哲学研究进行整体反思的过程中形成了物质本体论和实践本体论的激烈论争。现将这一问题的研究综述如下。 一、马克思主义哲学本体论问题研究的由来分析 “本体论”是我国最为流行的对ontology一词的译名,但中国哲学乃至中国语文中都没有与之完全对应的概念。马克思在叙述自己的哲学时,也从未正面使用过这一概念。中国哲学界在20世纪80年代之前,是不使用“本体论”这个概念的。80年代初在讨论哲学基本问题时,有的学者提出,哲学基本问题的第一方面主要讲的是本体论问题,第二方面主要讲的是认识论问题,而认识论是以本体论为前提的。这样,“本体论”这个术语才在马克思主义哲学的研究中从正面去使用。 有的学者认为,马克思本人在自己的哲学思考中,并没有对物质的本体论地位进行论证,这一论证首先是由恩格斯在《反杜林论》中提出来的。列宁则在《唯物主义与经验批判主义》中对恩格斯的思想从认识论的角度作了进一步的发挥。正是通过恩格斯与列宁的分析,认识论的唯物主义原则与物质本体论获得了逻辑的统一性,并且在马克思哲学研究中,以自然为本体的物质本体论构成了马克思哲学体系的基础。而在斯大林的《论辩证唯物主义和历史唯物主义》一文中,对物质本体论的地位进行了最为系统的表述:第一,它将辩证唯物主义理解为是对自然对象的唯物的、辩证的理解;第二,“世界按其本质说来是物质的”,“自然界、存在、物质世界是第一性的”,思维、意识等都是从物质中派生出来的;第三,历史唯物主义是辩证唯物主义在历史领域的应用与推广。 由此,有的学者认为教科书作为哲学的体系化,并非马克思所制订,而是苏联学者以斯大林1938年9月发表的《论辩证唯物主义和历史唯物主义》一文为蓝本编写的,是“苏联模式”的马克思主义哲学。他们认为马克思主义哲学是实

多体系统动力学综述

1. 绝对节点坐标法 传统有限元方法建立的单元为非等参数单元,其使用节点处的位移梯度来描述物体的无限小的转动,但在物体发生大变形时,节点处的位移梯度已不能准确描述物体的转动变形,从而极大影响到计算的精度。 Shabana [1]提出了绝对节点坐标法(Absolute nodal coordinate formulation, ANCF ),其理论基础主要是有限元和连续介质力学理论。该方法将物体的单元节点坐标定义在全局坐标系下,使用节点处的斜率(slope)矢量作为节点坐标而不是节点处的无限小转动[2],不需要另外计算刚体位移与柔性变形之间的耦合,能较精确地计算大变形的多体系统动力学问题。其最终推导出的多体系统的微分代数方程组(DAEs )中,质量矩阵是一个常数矩阵,但刚度矩阵将是一个非线性的时间函数。 1.1梁单元的绝对节点坐标法 Shabana 首先推导出一维梁单元的绝对节点坐标法模型[1][3]。在这种模型中,梁单元用中性轴来简化,如图1所示,其上面任意一点P 在全局坐标系下的坐标表达为: 23101232320123r =Se r a a x a x a x r b b x b x b x ??+++??==????+++???? 图1 其中,x 为沿轴线的单元局部坐标,[]0,x l ∈,l 为梁单元初始长度;S 为单元形函数;e 为含有8个单元节点坐标的广义坐标矢量。 123456781102205162e []|,|,|,|, T x x x l x l e e e e e e e e e r e r e r e r ========= 1 2 1 2 304078,,,x x x l x l r r r r e e e e x x x x ====????====????

国内外研究现状评述

国内外研究现状评述 基于国外博物馆免费开放的现状,国内博物馆在几年近也开始陆续免费开放。但是,由于管理机制的缺失,博物馆免费开放的制度并没有达到十分完善,并且免费开放的标准没有达到整齐划一。具体表现在:同一层次的博物馆的硬件和软件在免费开放的情况下并没有做到同步的提升。不同层次的博物馆在免费开放的情况下硬件和软件并没有达到一个递增递减的标准。因此我们需要对国外的免费开放博物馆进行深入的研究,并且对他们的管理机制进行有效的学习,来针对国内博物馆免费开放这一举动作出一套完整的指南手册。 以下是对浙江博物馆以及湖北博物馆免费开放前后硬件和软件的变化的调查。 1.针对观众量的剧增,及时采取应对措施 1)实施日总人数控制测算。湖北省博物馆原设计的正常接待能力为日均3000人。针对免费开放后的变化,管理者对博物馆的现有接待能力进行了慎重的评估,认为每天5000人为可承受接待能力,因此决定将每天的观众量控制在5000人以内,以保证正常的参观环境和文物、观众的安全。 2)采取发放免费参观券的措施。为适当控制客流,采取了分时段发放免费参观券的办法。博物馆广播定时播放参观须知,讲解咨询人员加强组织疏导,引导文明参观。在馆门口发票处增设了观众排队领票围栏,每天9?誜00开馆发票,上午发放3500张,下午发放1500张,全天基本控制在5000张,下午停止发票前派保安排在领票队伍末尾,及时劝阻后来观众改日再来,有效缓解了观众拥堵现象。 3)对团队、外宾团体参观采取提前预约的方式。为调节观众流量,博物馆对团队、外宾团体参观实行提前预约,适当错开高峰时期,这样既保证了团队的参观质量,又保证了正常的参观秩序。 4)对观众集中的个别展室实施必要的人数控制。对曾侯乙墓、梁庄王墓等观众集中的展厅,加强引导,实施必要的人数控制。当人数太多时,及时通知安保人员组织观众在展厅门口排队进入,或劝导观众先看其他展厅,以控制和减少展厅的人流量。同时利用技术防范设施对金银玉器展厅和一级文物柜等重点部位进行严密监控,还派出保安在展柜周围人盯死守,并及时劝阻个别人不利于展柜和文物安全的行为。

基于本体的知识集成研究综述

基于本体的知识集成研究综述1 李跃龙,李勇 大连海事大学计算机科学学院大连(116026) E-mail:liyao1120@https://www.doczj.com/doc/fb3342628.html, 摘要:本文对知识管理中研究的重点和热点—知识集成的概念、基于本体的知识集成现状进行了综述。由于对知识集成本身的研究时间不长,因此无论是在理论和实践中都缺乏系统性的研究,形成了研究的丛林。本文通过详实的文献,阐述了知识集成的概念、本体概念及研究现状和基于本体的知识集成研究现状等多个问题和主要进展。 关键词:知识集成,本体,综述 中图分类号:TP311 1.引言 不论对知识经济持何态度,在管理领域,知识已经成为企业竞争力的源泉。Davenport 和Prusak指出科技不是能够维系的竞争优势来源,而知识的优势是可以长久维系的,因为它能源源不断地创造效益和优势。哈佛大学的学者们认为,当前的企业管理已经进入全球化和知识化的阶段,在这个阶段持续成长成为管理的目标,知识管理成为管理的主题。在知识管理中,集成(Integrate)和应用(Apply)组织知识(Organizational Knowledge)的能力是企业创造和维持竞争优势的关键[1-2]。这主要是因为如果知识不能够被集成和共享,那么它对于实现组织目标来说价值就极其有限。因此,知识的集成和应用就成为知识管理所面临的挑战[3]。知识的有效集成和共享将对企业的长远发展起到关键性作用并能够提升企业竞争力[4]。知识集成是组织获取知识所带来的收益并创造竞争优势的根本过程[5]。这表明了知识集成具有非常重要的战略意义和实践价值。 迄今为止,关于知识集成的概念还没有统一的认识。知识集成最早是由Demsetz在1991年提出的,而正式提出来的是Grant,他认为企业的重要作用就是进行知识集成,知识集成为企业创造了优势[6]。 2.知识集成的定义 许多学者提出了自己的知识集成的定义,本文将介绍国外具有代表性的定义,并分析他们的共同点。然后,根据我们对知识集成的理解,尝试给出一个具有知识集成主要特征的综合定义。在基于资源理论、创新管理、组织学习等理论的基础上, Wernerfelt, Barney和Penrose提出了企业知识集成的观点,他们强调知识在企业中的应用。Garud和Nayyar认为知识集成促进组织不同层面知识的传授、组合和整合。通过集成和整合,专业的知识才能产生价值[7]。Conner和Prahalad, Grant, Kogut和Zander认为组织的首要作用就是为知识提供集成的意境和手段,以生产产品和服务[8]。Tiwana提出知识集成是一个项目团队通过实践将他们的组件知识(Component Knowledge)集成为在项目执行中的高层次的体系知识(Architectural Knowledge)。知识集成也经常被认为是企业吸收能力(Absorptive Capacity)的一部分[9]。Huang则认为知识集成是通过组织成员的社会交往持续进行共享信念的构建、积累和提炼的集体过程[6]。知识集成意味着知识可以在需要的地方被交换、共享、发展、精炼等[10]。因此,知识集成的概念可以从组织、团队和个人不同层面来理解。 从组织层面看,知识集成是组织为配合企业战略发展目标,选择来自市场多个供给主体1本课题得到国家自然科学基金(项目编号:60672031)的资助。

中西方哲学 本体论

第二讲本体论马克思主义世界观 2008年10月 ◎第二讲,本体论(3周:10月7、23日;10月28、30日、11月4日、6日) 一、西方形而上学(本体论)及其发展史简介(马克思主义哲学之前) 二、马克思主义的唯物主义世界观 三、马哲诞生之后西方本体论哲学的进展 四、中国哲学(老子、易学)对本体论问题的解决 五、人类新哲学本体论建设任务 从幻灯片“渺小”中,我们能体会到我们人在宇宙中是如何的渺小。《苏菲的世界》:“哲学家从来不会过分习惯这个世界。对于他们而言,这个世界一直都有一些不合理,甚至有些复杂难解、神秘莫测。这是哲学家与小孩子共同具有的一种重要能力。你可以说,哲学家终其一生都像个孩子一样敏感。而大多数成人都把这世界当成一种理所当然的存在。” 一、西方形而上学(本体论)发展史简介 (一)概念。“形而上学”与“本体论”等概念及其关系 ◎“形而上学”这个词有三种不同的含义和用法。第一指对终极实在(ultimate reality)本性、本源、和存在状态的理性思考,形而上学即本体论,与价值论、认识论并列相对而言(狭义)。这里我们是在狭义上使用“形而上学”这个词的。 对于本体论的误解。1,从本体论是关于超验或先验的原理的系统,导出“这种哲学当然应归入客观唯心主义”的推论。(上海俞宣孟《本体论研究》);2,将研究经验存在具体内容的学问,冠之以“本体论”之名。这与20世纪语言哲学的强势崛起有关。 “形而上学”的第二种用法是广义的用法,与亚里士多德在其《形而上学》一书中开创

的哲学传统一致,是指用高度抽象的概念去把握超验的,比经验知识更为深刻、更为普遍的本质性、规律性的内容。在此意义上,形而上学就是大哲学,被理解为包括本体论、价值论和认识论。第三种用法是从黑格尔之后,由马克思主义哲学用出来的,即相对于辩证思维方式的一种机械主义的思维方式,即在方法论意义上使用这个词。 ◎形而上学metaphysics一词起源于公元前70年的罗马,希腊漫游哲学家安德罗尼柯Andronicus在亚里士多德逝世300年后编纂他的著作时,把他归为“第一哲学”的论著放在了物理学论著之后,叫“meta (ta) physica”, or “following (the) Physics”,后来简化成Metaphysics,“meta”既有“后”的意思,又有“超”的意思,更由于亚里士多德关于“第一哲学”的内容使这个词渐渐地明确地有了“超越可感觉经验实在的内容”这样一种内涵。 ◎本体论ONTOLOGY(《中国大百科全书·哲学卷》):在西方哲学中,指关于存在及其本质和规律的学说,来自拉丁文ON(存在、有、是)和ONTOS(存在物)。德国经院学者郭克兰纽(1547-1628)在其著作中第一次使用了“本体论”一词,将其解释为形而上学的同义语。 ◎(二)历史。1)古代。西方哲学起始于问:世界从哪里来(世界的本原),世界是什么(世界的本质)。开始形成的回答:水、气、火等等某种具体的物质是万物的本原,后来德谟克利特提出世界是由原子构成的。是实在论的、同时也是还原论的、分析的思路。◎“分析”一词有狭义与广义、或逻辑与生活两种。狭义地或逻辑地,分析与综合相对而言,广义或生活的用法等同于研究探讨,包括了辩证地研究、探讨。 ◎还原论是将物质的高级运动形式(如生命运动)归结为低级运动形式(如机械运动),用低级运动形式的规律代替高级运动形式的规律的方法。还原论认为,各种现象都可被还原成一组基本的要素,各基本要素彼此独立,不因外在因素而改变其本质。通过对这些基本要素的研究,可推知整体现象的性质。 ◎公理化是指通过运用公理方法的研究,建立起由公理表述的理论系统。其方法主要是:1)从它的诸多的概念中挑选出一组初始概念,即不加定义的概念,该理论中的其余概念,都由初始概念通过定义引入,即都用初始概念定义,其余为导出概念。2)从它的一系列命题中挑选出一组公理,即不加证明的命题,而其余的命题,都应用逻辑规则从公理推演出来,称为定理。应用逻辑规则从公理推演定理的过程称为一个证明,每一个定理都是经由证明而予以肯定的。由初始概念、导出概念、公理以及定理构成的演绎体系,称为公理系统。中学几何。 ◎古希腊哲学发展到巴门尼德(盛年约在公元前504-501年),将“存在”或“是”确立为哲学的对象,他区分了“非存在”和“存在”。非存在只是变动不居的感觉对象,存在是由思想才能把握的事物不变的共相或本质。认为理性把握的本质逻辑在先。确定时间在先回答的是起源问题,而确定逻辑在先则是要回答本质或本原问题。 ◎中国哲学对世界本体的把握思路完全不同,我们可在《易传》中看到。《易经·系辞下传》第二章:“古者包羲氏之王天下也,仰则观象於天,俯则观法於地,观鸟兽之文,与地

关于本体论的研究综述

?综 述? 关于本体论的研究综述 顾金睿,王 芳 (南开大学商学院,天津300017) 摘 要:本文是一篇关于本体论的综述性文章,介绍了本体的概念、本体的理论研究,包括本体 的建模元语、分类、表示语言、构造规则以及目前研究本体的权威机构,对与本体相关的概念进行了介绍,分别探讨了本体与语义网络,本体与语义网,本体与叙词表的关系,最后介绍了本体在信息检索以及其他一些领域的应用。 关键词:本体;语义网络;语义网;叙词表;信息检索中图分类号:G 25217 文献标识码:A 文章编号:1007-7634(2007)06-0949-08 Overvie w of the Subject of Ontology G U Jin -rui ,WANG Fang (Business School o f Nankai Univer sity ,Tianjin 300071,China ) Abstract :This is a com prehensive paper on the subject of ontology.It introduces the concept ,the theory re 2search of ontology ,including m odeling primitive ,classification ,dem onstration languages ,construction rules ,and the authoritative agencies that engage in the ontology research recently.The ontology -related con 2cepts are als o presented in this paper.It separately probes into the relationships between ontology and seman 2tic netw ork ,ontology and semantic web ,and ontology and thesaurus as well.Finally what unfolds is the ap 2plication of ontology on the information research and other fields. K ey w ords :ontology ;semantic netw ork ;semantic web ;thesaurus ;information retrieval 收稿日期:2006-09-18 作者简介:顾金睿(1983-),女,天津人,本科生;王 芳(1970-),女,宁夏中宁人,博士,副教授,硕士生导 师,从事电子政务与信息经济学研究. 本体的概念起源于哲学领域。17世纪,德意志哲学家郭克兰纽(R 1G oclenius )首次提出“On 2tology ”一词。哲学领域的“Ontology ”在苏格拉底提出“始基”问题中萌芽,由柏拉图和亚里士多德奠定了它的雏形,中世纪经院哲学使之最终成熟起来【1】。《牛津现代高级英汉双解词典》(简化汉字本)对于“Ontology ”的英文解释是:“the depart 2ment of metaphysics concerned with nature of existence ; specific theory of this ”【2】 。从词源来看,英文的“On 2tology ”最早来自拉丁文“Ontologia ”一词,而拉丁 文又源自希腊文。就希腊文的字面意思来说,On 2tologia 是指“on ”的“log os ”。“log os ”译为中文是 指“理念、理性、哲学”,音译为“逻各斯”【3】 。“Ontology ”在汉语中也有不同的译名,如“万有论”、“存有论”、“本体论”、“存在论”等,其中以 “本体论”流传最广【4-5】 。 1 本体的概念 古希腊哲学家亚里士多德将本体定义为研究 第25卷第6期2007年6月 情 报 科 学 V ol.25,N o.6 June ,2007

隐喻研究综述(正文)

隐喻研究综述 Reviews on Metaphor Study 摘要:近年来隐喻研究受到广大学者的关注。本文在参阅文献的基础上,综合考察国内外隐喻研究,对不同时期的隐喻研究进行整理概述。并在此基础上提出隐喻研究的不足,以及未来的发展趋势。 关键词:隐喻研究;发展趋势 Abstract: Recent years, metaphor research is concerned by numerous scholars. On the basis of references, this thesis summarizes metaphor theories among different periods by investigating metaphor theories at home and abroad. And on this basis, it points up the shortages and development tendency of metaphor. Key Words:metaphor research; development tendency 隐喻是一种普遍现象,人们每时每刻都在使用大量的隐喻。英国修辞学家理查兹曾经说过,“我们日常会话中几乎没三句话中就可能出现一个隐喻”。随着认知语言学的发展,语言学界对隐喻研究产生浓厚的兴趣,国内语言学家对隐喻也作了系统的评述。对隐喻研究的概述可以有不同的写法。林书武撰写的概述,以是否存在比喻性和非比喻性语言为主线,从隐喻的历史发展、本体与喻体、隐喻的成因及其认知功能全面地描述了国外的隐喻研究的发展。束定芳则对隐喻的本质及语义特征进行了概述。他认为隐喻不仅是认知语言学的一个分支,其自身也可以成为一门独立的学科——隐喻学。为了对隐喻有一个更加全面的了解,我们有必要对其历史发展进行系统的梳理。 1.传统隐喻 隐喻研究可以追溯到公元前300年,至今已有2000多年的历史。然而,历史上首位对隐喻产生兴趣的是亚里士多德。他在其作品中多次提到了隐喻。亚里士多德对隐喻的定义是:隐喻通过把属于别的事物的词给予另一个事物而构成,或从“属”到“种”,或从“种”到“属”,或从“种”到“种”,或通过类比(束定芳2000)。亚里士多德对隐喻的解释就是将隐喻看作了一种修辞手段。他的定义阐明了隐喻非常重要的特点。西方祖多的研究,例如G. Lakoff的研究就是根据“隐喻是借一事物谈另一事物”的观点展开的(林书武1996)。他还指出隐喻是根据类比的原则所作得隐形比较,也就是说隐喻就是一种明喻,他们之间的差别甚少,其不同之处只存在于他们的表达方式的差异。根据以上观点,亚氏对隐喻的理解被成为“对比论”。 公元前1世纪,罗马修辞学家昆提良就隐喻提出了另一个理论,即“替代论”。他认为,隐喻实际上就是育用一个词去替代另一个词的修辞现象(束定芳2000)。如: (1)He is a pig. 例(1)中,“pig”是用来替代“a lazy man”这一直接说法的。 传统隐喻研究认为隐喻是一种非常规性语言表达,它是一种修辞方式。就亚

动力系统综述

Xxxxxx U N I V E R S I T Y 《微分方程定性理论》实践报告 所属学院:理学院 专业班级:应用数学 姓名: 学号:xxxxxxxxxxx 实践课题:动力系统综述 实践成绩: 任课教师:

动力系统综述 随着数学知识的不断扩充及科学技术的不断发展,动力系统被广泛应用于工程、力学、生态等各大领域,推动着社会的发展。动力系统是随时间而演变的系统。 随着数学知识的不断扩充及科学技术的不断发展,动力系统被广泛应用于工程、力学、生态等各大领域,推动着社会的发展。动力系统是随时间而演变的系统。对于含参数的系统,当参数变化并经过某些临界值时,系统的定性性态,如平衡点或周期运动的数目和稳定性等会发生突然变化,这种变化称为分叉[2]。 分叉理论主要研究当参数在分叉值附近变化时,系统轨线的拓扑结构或定性性态将如何变化。近几十年来,动力系统的分叉理论被系统而深入的研究,并得到了迅猛的发展,且广泛应用于物理、化学、生物、工程等研究领域中,分叉问题的研究己成为非线性动力系统研究的重点和难点之一。 1动力系统简介 动力系统的研究起源于牛顿的经典力学理论.假设空间R n 的一个质点M 在时刻t 的坐标为),,,(21n x x x x =并且己知质点M 此时的运动速度为))(,),(),(()(21x v x v x v x v n =,并且只与坐标x 有关.那么质点M 的运动方程为: )(x v dt dx = (1) 这个方程是一个自治的微分方程.更进一步如果方程(1)满足微分方程解的存在和唯一性定理的条件,那么对任何的初值条件00)(x t x =,则方程存在唯一解),,()(00x t t t =?。 我们称x 取值的空间n ?为相空间,而称((t , x )的取值空间“n ???”为增广相空间.按照微分方程的几何意义,方程(1)定义了增广相空间中的一个向量场.解的几何意义为增广相空间中经过点),(00x t 的唯一的积分曲线[1]. 2 动力系统在力学中的应用 稳定性是系统的一个重要特性。对系统运动稳定性分析是系统与控制论的一个重要组成部分,一个实际的系统必须是稳定的,不稳定的系统是不能付诸于工程实施的。 设系统的向量状态方程为: 0,)(),,(00≥==t x t x t x f x (2.1) 式中:x 为n 维状态向量;),(??f 为n 维向量函数。

本体论的研究和应用现状

本体论的研究和应用现状 刘红阁 郑丽萍 张少方 摘要 “本体论”原是哲学研究中发展出来的一个概念。近年来,本体论的研究和应用受到了知识工程及相关应用领域的广泛关注。本文对目前本体论的研究和应用现状进行了综述,主要内容包括:本体的定义、发展本体的原因、本体的设计原则和方法论、本体的描述语言和国内本体的研究现状。最后本文指出了当前本体论研究中存在的一些问题和未来本体论研究的主要方向。 关键字 本体论、知识工程、语义Web 1引言 “本体论” (Ontology,大写O)原是哲学研究中发展出来的一个概念,研究客观事物存在的本质和组成。本体论在哲学定义上的主要特点在于本体论是关于世界某个方面的一个特定的分类体系,这个体系不依赖任何特定的语言。近年来,随着信息科学的飞速发展,本体论逐渐用于知识工程和信息科学等领域之中。 本文就目前本体论的研究和应用现状进行了系统介绍和综合评述。首先就本体的定义和内涵进行了深入的讨论(第2节),其次给出了发展本体的原因以及本体的具体应用领域(第三节),介绍了本体的设计原则和方法论(第4节)、当前主流的本体描述语言(第5节),讨论了国内本体论研究和应用状况(第6节),最后本文指出了当前本体论研究中存在的一些问题和未来本体论研究的主要方向(第7节)。 2本体是什么? 本体论(Ontology)和本体(ontology)在英文表示是不一样的,即一个用大写的“O”开头,另一个则用小写的“o”开头。本体论这个术语诞生于17世纪,派生于希腊语的onto 和logia,是一个哲学的分支。从哲学上来说,本体论是研究客观事物存在的本质,所以本体论在哲学上的真正内涵是对世界上任何领域内的真实存在所做出的客观描述。对本体论的理解,人们不存在什么疑问。但是对本体(ontology)的理解,哲学界和计算机科学界存在着不同的观点。 在哲学界,本体作为表述哲学理论的术语,是指形成现象的根本实体。 近十多年来,本体论的研究日益成熟,也已经远远超过了哲学的范畴,和信息技术(例如:面向对象系统)、知识工程及人工智能都有着密切的关系。尤其本体论最近在Web上的应用直接导致了语义Web的诞生,企图解决Web信息共享中的语义问题,给Web带来了勃勃生机和无限遐想。 知识工程界认为本体是一种engineering artifact(工程人造物)。尽管本体论的研究日益成熟,但“本体究竟是什么”仍是一个争论中的话题。本文根据时间顺序就部分研究者对本体做出的定义列出如下,以供参考: 首先, Neches et al.(1991)指出:“一个本体定义了组成主题领域的词汇的基本术语和关系,以及用于组合术语和关系以定义词汇的外延的规则。” 该定义只是给出了建立一

相关主题
文本预览
相关文档 最新文档