语义网基础教程
- 格式:doc
- 大小:67.50 KB
- 文档页数:9
1. 引言“告诉我我应该买什么酒提供给下列菜单的每道菜,随便说一下,我不喜欢苏特恩白葡萄酒”。
目前构造一个能够查找满足这个查询的酒的Web代理会是困难的。
类似地,考虑派给软件代理一个做出合理的旅行安排的任务(更多的用例,参考OWL需求文档)。
为了支持这种计算,不仅仅用关键词而是说明Web上描述的资源的含义是必要的。
这个额外的解释层表述了数据的“语义”。
Web本体语言OWL是一种定义和实例化“Web本体”的语言。
“本体”这个术语来自于哲学,它是研究世界上的各种实体以及他们是怎么关联的科学。
一个“Web本体”可能包含了类,属性和他们的实例的描述。
给出这样的一个本体,OWL形式语义说明怎么获得它的逻辑结论,也就是说,不是逐字写在本体中的事实,而是语义蕴涵的事实。
这些蕴涵可以是基于单个的文档也或利用OWL机制合并在一起的多个分布的文档。
本文档是W3CWeb本体工作组(WebOnt)制定的Web本体语言的描述的一部分。
OWL综述([Overview], 1.1)的文档指南部分描述了不同部分的文档以及他们怎样结合的。
当描述另外一个XML/Web标准时,有一个问题会冒出来:这个标准给了我什么XML和XML Schema不能给的。
这个问题有两个答案。
本体和XML Schema的区别是它是一种知识表示,而不是一种消息格式。
大多数来自工业界的Web标准包含了一个消息格式和协议规范的组合。
这些格式已经被给予一个操作语义,例如,"一旦收到订单(PurchaseOrder)的消息,从AccountFrom账号转移Amount数量的美元到AccountTo账号,并且发货(Product)",但是这些规范并没有设计为支持此事务上下文之外的推理。
例如,一般来说,没有机制让我们推出:因为这个产品的类型是夏敦埃酒(Chardonnay,一种无甜味白葡萄酒),它必定也是一种白色酒。
OWL本体的一个优点是会有能够对其做推理的工具。
“物联网技术”课程教学大纲课程名称:物联网技术英文名称:The Internet of Things Technology课程编码:课程学时:48 学分:3适用对象:计算机专业和网络工程专业本科学生先修课程:计算机网络使用教材:李联宁主编,《物联网技术基础教程》,清华大学出版社,2012.6主要参考书:[1]刘云浩,《物联网导论》科学出版社出版[2]一、课程介绍从网络结构上看,物联网就是通过Internet将众多信息传感设备与应用系统连接起来并在广域网范围内对物品身份进行识别的分布式系统。
物联网的定义是:通过射频识别(RFID)装置、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网相连接,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。
当每个而不是每种物品能够被唯一标识后,利用识别、通信和计算等技术,在互联网基础上,构建的连接各种物品的网络,就是人们常说的物联网。
二、教学基本要求1.本课程主要讲述物联网技术的基本概念和基本原理,使学生了解物联网工程技术基础的主要内容2.培养学生物联网工程的逻辑思维能力以及分析问题和解决问题的能力。
三、课程内容第1章“物联网概述”讲述物联网技术的基本知识第2章“物联网架构技术”讲述物联网的系统结构;第3章“标识技术”所讲述的各个特定领域的标识与自动识别技术、不同的标识体系、“物品”的统一标识体系、电子产品EPC编码;第4章“通信技术”主要讲述无线低速网络、移动通信网络、设备对设备(M2M)及工业领域的无线网络等方面通信技术基础;第5章“网络技术”主要讲述RFID非接触射频识别系统、无线传感器网络、宽带网络技术、无线网格网、云计算网络等技术;第6章网络定位和发现技术涉及GPS全球定位系统、蜂窝基站定位、新兴定位系统(AGPS)、无线室内环境定位、传感器网络节点定位及时间同步技术;第7章“软件、服务和算法技术”讲述环境感知型中间件、嵌入式软件、微型操作系统、面向服务架构、物联网海量数据存储与查询、物联网数据融合及路由等技术;第8章“硬件技术”讲述微电子机械系统(MEMS)、移动设备内置传感器硬件平台、数字化传感器及网络接口技术等。
Software 软件2011年第32卷 第4期国际IT 传媒品牌专业教学资源库本体模型构建*孙玉娣 裴 勇(江苏经贸职业技术学院,江苏 南京 211168)摘 要:针对当前专业教学资源库的可重用性低、难以提供智能服务等问题,本文提出构建本体专业教学资源库。
该方法将语义web 思想与本体技术引入专业资源库构建中,并以构建《计算机网络专业教学资源库》为例,阐述了构建基于本体的专业教学资源库模型的整个流程,并选用Jena 推理机,对资源语义的一致性进行检查。
研究表明,对教学资源库的框架描述上升到知识级,有利于对教学资源库的共享与语义查询。
关键词:本体;教学资源库;语义网;owl中图分类号:TP311 文献标识码:A DOI: 10.3969/j.issn.1003-6970.2011.04.034Professional Teaching Resources Libraries Ontology Model ConstructionSUN Yu-di, PEI Yong(Jiangsu Institute of Economic & Trade Technology , Nanjing 211168, China )【Abstract 】According to the requirements of being used repeatedly and supplying intelligence services on the teaching resources, this paper presented constructing professional teaching resources libraries based on ontology, the semantic web ideas and ontology technologies were introduced. With computer network professional teaching resources libraries, this paper illustrated the whole process of constructing ontology teaching resources libraries, and using Jena reasoning engine to ensure consistency of resources semantic. Since the description of teaching resources libraries corresponding to its knowledge level, so it contributes to the sharing of teaching resources and semantic inquiry.【Key words 】ontology; teaching resources libraries; semantic web; owl *校级课题项目(课题号JSJM2010091)作者简介:孙玉娣(1981-),女(汉),江苏高淳人,硕士研究生,讲师,主要研究方向:本体,知识工程;裴勇(1980-),男(汉),江苏盐城人,硕士研究生,讲师,主要研究方向:计算机网络,信息安全。
2012年第28期(总第43期)科技视界Science &Technology VisionSCIENCE &TECHNOLOGY VISION科技视界0引言知识表示是对知识的一种描述,或者说是一种约定,探索新的知识表示方法一直是人工智能研究的重要课题之一。
目前已有许多种知识表示方法。
例如,谓词逻辑、语义网络、产生式规则、框架、概念从属等。
这些方法对于描述特定领域的问题求解已经足够,且已得到广泛应用。
但是,从来没有人认为这些知识表示方法已经达到了最终的目的,因此知识表示仍是很久以来人工智能研究的中心课题。
对它的研究还需要相当深入的研究。
概念结构理论的出现为知识表示研究带来了一种新的思路。
本文正是从这个角度出发,在研究人工智能中知识基本概念、分类及传统知识表示方法基础上,主要研究概念图知识表示方法的基本理论及方法,通过实例阐述概念图知识表示方法的优点及其在实际工程中的应用。
1知识表示知识表示是人工智能研究的一个重要课题,无论应用人工智能技术解决什么问题,首先遇到的问题就是所涉及的各类知识如何加以表示。
研究知识表示的主要目的是为用户提供一种有利于进行逻辑推理,能够充分表示领域内知识和便于高效率进行程序设计的知识表示。
合理的知识表示,可以使问题的求解变得容易,并且有较高的求解效率。
一个好的知识表示方法应该具备以下的性质:1.1表达充分性能够将问题求解所需的知识正确有效的表达出来。
1.2推理有效性能够与高效的推理机制密切结合,支持系统的控制策略。
1.3操作维护性便于实现模块化,便于知识更新和知识库的维护。
1.4理解透明性知识表示便于人类理解,易读、易懂,便于知识的获取。
1.5良好访问性能够很好的接受访问并有效的利用所访问的知识对其进行有效的利用。
2传统知识表示方法基于前面所描述的知识表示方法所应具备的性质,目前普遍应用的传统知识表示方法主要有逻辑表示模式、基于规则的产生式系统、语义网、框架表示法、剧本表示法、脚本表示法等。
认知视角下的大学英语词汇-语义网络构建江雪【摘要】认知语言学研究发现,知识以网络的形式存在于大脑中,而词汇是网络中新旧知识的联结点。
本文从认知的角度出发,分析了前人构建的词汇-语义网络模型,在此基础上提出基于课文内容的词汇-语义网络构建,以及基于单元主题的词汇-语义网络构建。
【期刊名称】《开封教育学院学报》【年(卷),期】2016(036)007【总页数】2页(P92-93)【关键词】认知语言学;词汇-语义网;大学英语【作者】江雪【作者单位】广东财经大学华商学院外语系,广东广州 511300【正文语种】中文【中图分类】H319认知心理学家认为,知识是以网络的形式存在于大脑里。
美国语言学家Stevick也认为,词汇是以联想网络的方式来存储和记忆的。
1968年,美国心理学家Quillian与认知心理学家Collins的研究发现语义网络和大脑中存在着不同层次的知识网络,在此基础上提出了分层网络模型。
而后,Collins&loftus提出了扩散激活模型;K.Bock&W.Levelt提出了改进版的扩散激活模型。
这些模型都证实了词汇具有网络性,而词义决定了词汇存在于一个极其复杂的语义系统中,在这个系统中,词义之间也存在着各种内在联系,并形成了一个多元关系的语义网络。
后来,越来越多专家开始意识到单独的词汇网或语义网并不能代表心理词汇组织,因此,他们认为词汇-语义网是一种更好地呈现心理词汇组织的方式。
也就是说,在教学中,教师应抓住学生的心理发展特征,根据学生的心理发展规律,结合心理词汇的组织方式,在分析前人构建的词汇-语义网络模型基础上,构建基于课文内容的词汇-语义网络和基于单元主题的词汇-语义网络。
这不仅有助于培养学生创新的思维方式,还可以大大提高词汇教学的效果。
在1968年,学者Collins首次提出语义网络的概念。
此后,有些学者也提出了几种不同的语义网络模型。
这里,笔者主要分析三种模型:Collins& Quillian提出的分层网络模型[1];Collins&loftus提出的扩散激活模型[2];K.Bock&W.Levelt提出的改进版的扩散激活模型[3](P945-984)。
计算机好写的论文题目(精选200个)计算机科学与技术专业的学科代码为0812,下属四个二级学科:计算机系统结构(081201)、计算机软件与理论(081202)、计算机应用技术(081203)以及信息安全(081220)。
本专业培养具有良好的科学素养,系统地、较好地掌握计算机科学与技术,包括计算机硬件、软件与应用的基本理论、基本知识和基本技能与方法,能在科研部门、教育单位、企业、事业、技术和行政管理部门等单位从事计算机教学、科学研究和应用的计算机科学与技术学科的高级科学技术人才。
本专业学生主要学习计算机科学与技术方面的基本理论和基本知识,接受从事研究与应用计算机的基本训练,具有研究和开发计算机系统的基本能力。
本专业学生可以在以下计算机学科的二级学科下选择论文的具体方向:计算机系统结构、计算机软件与理论、计算机应用技术、信息安全、教育技术。
选题方向一、计算机软件与理论计算机软件与理论是指由计算机科学理论和研究、开发计算机软件所涉及的理论、方法、技术所构成的学科,是信息科学的核心研究领域之一,是计算机学科用来为国民经济、国防建设、人民生活服务的工具和基础。
计算机软件与理论的研究范围十分广泛,包括系统软件、软件自动化、程序设计语言、数据库系统、软件工程与软件复用技术、并行处理与高性能计算、智能软件、理论计算机科学、人工智能、计算机科学基础理论等。
该学科的研究方向主要有:软件方法学、信息系统工程、并行处理与高性能计算、计算机网络与普适计算和数据库技术与应用等。
以培养高素质的创新型科学研究与工程技术人才为目的。
教学科研工作中,兼顾理论研究与工程技术实践,着力建设重基础、宽口径的特色专业,以校企联合为手段,为科学研究和信息技术产业输送高层次的计算机专门人才。
在科学研究和应用技术方面跟踪国内外前沿方向,形成基础研究与应用技术研究结合、产学研结合的特色。
通过委托、横向合作等方式将科研成果转化为计算机应用产品,为政府、企事业等单位的公共信息平台建设进行研发,涉及信息系统集成、Web技术、信息安全、智能控制、图形图像处理、新农村及制造业信息化、远程教育、软件项目管理等众多应用领域。
语义网学习报告Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT语义网学习报告学院:计算机科学与工程专业:计算机科学与技术班级:学号:姓名:刘啸宇指导教师:吴陈一、语义网的概念与发展语义网的定义及概述万维网之父——伯纳斯·李(Berners-Lee)在2002年描绘了下一代互联网的前景,并将下一代互联网称为“语义网”(Semantic Web)。
他描述道:“语义网是当前网络的延伸,信息在其中被赋予明确含义,从而实现人与计算机的更好协作。
”蒂姆·伯纳斯-李在2006年普林斯顿大学演讲和后期接受媒体采访时公开表示,他最初将这种智能网络命名为语义网或许不够贴切,也许更准确的名称应该是数据网(外语:Data Web)。
语义网就是能够根据语义进行判断的智能网络,实现人与电脑之间的无障碍沟通。
它好比一个巨型的大脑,智能化程度极高,协调能力非常强大。
在语义网上连接的每一部电脑不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以干人所从事的工作。
它将使人类从搜索相关网页的繁重劳动中解放出来,把用户变成全能的上帝。
语义网中的计算机能利用自己的智能软件,在万维网上的海量资源中找到你所需要的信息,从而将一个个现存的信息孤岛发展成一个巨大的数据库。
语义网的建立极大地涉及了人工智能领域的部分,与web 智能网络的理念不谋而合,因此语义网的初步实现也作为web 的重要特征之一,但是想要实现成为网络上的超级大脑,需要长期的研究,这意味着语义网的相关实现会占据网络发展进程的重要部分,并且延续于数个网络时代,逐渐转化成"智能网"。
二、语义网的体系结构erners-Lee于2000年提出了语义网的体系结构,并对此做了简单的介绍。
该体系结构共有七层,自下而上其各层功能逐渐增强。
第一层第一层:""层。
Unicode和URI。
Jena 简介一般来说,我们在Protege这样的编辑器里构建了本体,就会想在应用程序里使用它,这就需要一些开发接口。
用程序操作本体是很必要的,因为在很多情况下,我们要自动生成本体,靠人手通过Protege创建所有本体是不现实的。
Jena 是HP公司开发的这样一套API,似乎HP公司在本体这方面走得很靠前,其他大公司还在观望吗?可以这样说,Jena对应用程序就像Protege对我们,我们使用Protege操作本体,应用程序则是使用Jena来做同样的工作,当然这些应用程序还是得由我们来编写。
其实Protege本身也是在Jena的基础上开发的,你看如果Protege 的console里报异常的话,多半会和Jena有关。
最近出了一个Protege OWL API,相当于对Jena的包装,据说使用起来更方便,这个API就是Protege的OWL Plugin所使用的,相信作者经过OWL Plugin的开发以后,说这些话是有一定依据的。
题目是说用Jena处理OWL,其实Jena当然不只能处理OWL,就像Protege 除了能处理OWL外还能处理RDF(S)一样。
Jena最基本的使用是处理RDF(S),但毕竟OWL已经成为W3C的推荐标准,所以对它的支持也是大势所趋。
好了,现在来点实际的,怎样用Jena读我们用Protege创建的OWL本体呢,假设你有一个OWL本体文件(.owl),里面定义了动物类(/ont/Animal,注意这并不是一个实际存在的URL,不要试图去访问它),并且它有一些实例,现在看如下代码:OntModel m = ModelFactory.createOntologyModel();File myFile = ...;m.read(new FileInputStream(myFile), "");ResIterator iter = m.listSubjectsWithProperty(RDF.type, m.getResource("http:// /ont/Animal"));while (iter.hasNext()) {Resource animal = (Resource) iter.next();System.out.println(animal.getLocalName());}和操作RDF(S)不同,com.hp.hpl.jena.ontology.OntModel是专门处理本体(Ontology)的,它是com.hp.hpl.jena.rdf.model.Model的子接口,具有Model的全部功能,同时还有一些Model没有的功能,例如listClasses()、listObjectProperties(),因为只有在本体里才有“类”和“属性”的概念。
OWL Web本体语言指南目前这种结构的万维网,很像一本地图做得很差的地理书,我们对于Web中可以使用的文档和服务的了解,都是基于关键字搜索的,同时还需要灵活地使用文档的链接和使用模式。
如果没有强有力的工具的支持,这么大规模的数据是很难管理的,为了能够给Web绘制出更为详实的地图,计算代理需要对于网络上可用资源的内容和能力做一个机器能够读得懂的描述。
这些描述是人类能够读得懂的信息的扩展。
OWL,这种本体描述语言,可以用来描述Web文档和应用中内在的类和关系。
这篇文章解释了OWL语言的使用:通过定义类以及类的属性来形式化某个领域;定义个体并说明它们之间的属性;在OWL语言的形式化语义允许的层次上,对类和个体进行推理。
本文的各章节间是按照类、属性、个体的集合的定义给出来的,从最简单的概念开始,逐渐过渡到更为复杂的概念。
本文档的状态本文档已被W3C成员及其他相关方面审阅,并已被W3C总监(W3C Director)批准为W3C 推荐标准(W3C Recommendation)。
W3C制定推荐标准的任务是使之受到关注,并促使其被广泛应用。
这将增强Web的功能性与互操作性。
本文档是W3C关于Web本体语言OWL的推荐标准的六个部分之一。
它已经被Web 本体工作小组(小组章程) 作为W3C语义Web行动(行动声明) 的一部分于2004年2月10日发布。
本文档的早期版本中所描述的关于OWL的设计已被广泛评阅,并已满足工作小组的技术需求。
工作小组充分考虑所有收到的意见,并做了必要的修改。
本文档自从候选推荐标准版本以来的所有修改都在文后的变更日志中。
欢迎通过public-webont-comments@ (历史存档)提出您的意见,也可以通过www-rdf-logic@ (mailto:www-rdf-logic@)(历史存档) 参与相关技术的讨论。
可以访问到有关实现的一个列表。
W3C维护着一个与这些工作相关的专利声明的目录。
第一章概述 1.1万维网现状
万维网改变了人类彼此交流的方式和商业创作的方式。发达社会正在向知识经济和知识社会转型,而万维网处于这场革命的核心位置。 这种发展使得人们对计算机的看法也发生了变化。起初,计算机仅仅用作数值计算,而现在则主要用于信息处理,典型的应用包括数据库,文档处理和游戏等等。眼下,人们对计算机关注的焦点正在经历新的转变,将其视作信息高速公路的入口。 绝大部分现有的网络内容适合于人工处理。即使是从数据库自动生成的网络内容,通常也会丢弃原有的结构信息。目前万维网的典型应用方式是,人们在网上查找和使用信息、搜索和联系其他人、浏览网上商店的目录并且填表格订购商品等等。 现有软件工具没有很好的支持这些应用。除了建立文件间联系的链接之处,最优价值和必不可少的工具是搜索引擎。 基础关键词的搜索引擎,比如Alta Vista、Yahoo,Google等,是使用现有万维网的主要工具。毫无疑问,加入没有这些搜索引擎,万维网不会取得现在这么大的成功。然而,搜索引擎的使用也存在一些严重过的问题: 高匹配、低精度。即使搜到了主要相关页面,但它们与同时搜到的28758个低相关或不相关页面混在一起,检索的效果就很差。太多和太少一样令人不满意。 低匹配或无匹配。有时用户得不到任何搜索结果,或者漏掉了一些重要的相关页面。虽然对于现在的搜索引擎来说,这种情况发生的频率不高,但确实会出现。 检索结果对词汇高度敏感。使用最初填写的关键词往往不能得到想要的结果,因为祥光的文档里使用了与检索关键词不一样的术语。这当然令人不满意,因为语义相似的查询理应返回相似的结果。 检索结果是单一的网页。如果所需要的信息分布在不同的文档中,则用户必须给出多个查询来收集相关的页面,然后自己提取这些页面中的相关信息并组织成一个整体 有趣的是,尽管搜索引擎技术在发展,但主要的困难还是上述几条,技术的发展速度似乎落后于网上内容量的增长速度。 此外,即使搜索是成功的,用户仍必须自己浏览搜索到的文档,从中提取所需的信息,也就是说,对极其耗时的信息检索本身,搜索引擎并没有提供更多支持。因此,用信息检索来描述搜索引擎为用户提供的功能,是不确切的;用信息定位可能更加合适。另外,由于现有网络搜索的结果不易直接被其他软件进一步处理,因此搜索引擎的应用往往是孤立的。 目前,为网络用户提供更大支持的主要障碍在于,网上内容的含义不是机器可解读的。当然,有一些工具能够检索文档、把它们分割成更小的部分、检查拼写并统计词频等等。可是,一旦牵涉到解释句子含义和提取对用户有用的信息,现有的软件能力就有限了。举一个简单的例子。对现有技术而言,一下俩个句子的含义是难以区分的: 我是一个计算机科学的教授。 你不妨认为,我是一个计算机科学的教授。 使用文本处理技术,咋样才能改善现在的状况呢?一种解决方案是沿用现有表达方式来表示网上的内容,并发展基于人工智能和计算语言学的一些日趋复杂的技术以解决现有难题。这条途径迄今已探索多时,尽管取得了一些进展,但其任务仍然显得过于困难。 另一种途径是用一种更容易被机器处理掉表示方法来描述网上的内容,并此阿勇之恩那个技术来利用这种表示方法所提供的便利。我们把这个革命性的方案称为语义网运动。值的注意的是,语义网并不是一种和首先由万维网平行的新的全球信息高速公路,相反,它将在现有万维网的基础上逐渐成长。 语义运动由——万维网联盟(W3C)发起,其倡导者正是在20世纪80年代后期发明万维网的Tim Berners-Lee。他期望通过这场运动来实现他的万维网的初始蓝图,在这个蓝图中,信息含义所起的比现今万维网中重要很多。 语义网的发展得到了产业界的大力支持和各国的大力支持和各国政府的大量资助。美国政府设立了DAMl(DAPRA Agent Markup Language)项目,欧盟第六研究框架计划也将语义网作为关键内容之一。
1.2 从当前万维网到语义网:实例分析 1.2.1知识管理 知识管理所关注的是在一个组织中获取、处理和维护知识。由于大型商业机构把内部知识视为一种能够提高生产力、创造新的价值和增强竞争力的智力资源,知识管理已成为他们的一项关键性工作,对于地理分布广泛的国际组织来说尤其如此。 目前大多数可用信息只具有弱结构组织形式,如文本、音频和视频等。从知识管理的角度来说,现有技术从在以下诸方面的局限: 信息搜索。公司通常依靠基于关键词的搜索引擎,这方面的局限性上文已经做了简要描述。 信息抽取。需要人工浏览文档,以便从中找出相关的信息。现有的智能代理(intelligent agent)还不能令人满意地完成这项任务。 信息维护。现在这方面仍然存在一些问题,比如术语的不相容性和无法移除过时信息等等。 信息挖掘。虽然可以数据挖掘(data mining)等手段提取隐藏在公司数据库中新知识,但对于分布式的、弱结构化的文档集合,这个任务仍然是困难的。 信息视图。经常需要限制某些雇员对某些信息的浏览权限。“视图”意味着隐藏某些信息,这个概念在数据库领域里为人们所熟知,但对企业内部网(或者万维网)尚难实现。 语义网的目的是允许更高级的知识管理系统,使得: 可以根据含义用概念空间组织知识; 具备相容性检查和新知识提取功能的自动工具支持知识维护; 问答系统取代关键词搜索——用人性化的方式检索、提取和表示所需知识; 支持跨文档的问答功能; 能够规定用户查看信息的指定部分(甚至文档的某些部分)的权限。 1.2.2 企业对个人电子商务 企业对个人(B2C)电子商务是万维网用户最主要的商业活动。典型场景是用户访问一个或者多个网上商店,浏览他们的报价,选择并订购产品。 理想化的情况是,用户收集所有网上商店的信息,包括价格、条款、说明(比如有效期)等信息,从而选择最好的产品。但是如此规模的手工浏览太浪费时间,通常用户咋i做决定之前只会访问一个或者少数几个网上商店。 为了改善这种情形,以购物机器人的形式出现了一些网上购物工具,这种软件代理能够访问多家商店、提取产品和价格信息,汇总市场情况。这些功能是借助于从网上商店提取信息的打包程序来实现的。对于不同的网上商店,必须开发不同的打包程序。这种方法是有缺陷的。 有关信息是通过关键词搜索和其他手段从网上商店获取的。这个过程利用了特定信息段之间临近关系的假设以进行信息打包(比如,价格是通过单词price后面接着的$符号和一个正数来表示的,则根据三者之间的临近关系把价格信息“打包)。这种假设不一定正确,因而这种启发式方法未必 总能凑效。所以,能够如此获取的信息是有限的。想运输费用、交货时间、关于目的地国家的限制、安全等级和隐私保护措施等信息一般不恩呢提取出来,而所有这些因素可能对用户的决策起重要作用。另外,编制打包程序是费时的,而且网上商店的设置一旦发生变动,则需要重新编制打包程序。 语义网技术支持软件代理对产品信息和服务条款的解读,使得: 能够正确地提取价格和产品信息,并根据用户需求解释配送和隐私保护措施; 能够从其他来源,比如独立的排名机构或客户群体,补充提供网上商店的信誉信息; 不再需要低层次的打包程序; 更加高级的购物代理能够代表购买者的利益与商店代理进行自动协商。 1.2.3 企业对企业电子商务 大多数用户在晚上的商业活动只与B2C电子商务有关,但是,网络技术的最大经济价值体现在企业对企业电子商务中。 企业间数据交换的传统方式是通过电子数据交换(EDI)途径。然而,这个技术太复杂了,只能为专家所理解,编程和维护都很困难,且容易出错。每一对企业间的数据交换都需要专门编程,开发费用很大。另外,EDI是一种孤立的技术手段,所交换的数据无法方便的与其他商业应用集成使用。 因特网视乎是企业间交流的理想的基础设施。企业越来越关注基于因特网的解决方案,已经出现了诸如企业间门户(B2B portol)这样的商业模型。然而, 由于没有统一的标准,企业对企业电子商务模式的发展遇到了障碍。HTML不包含信息的结构和信息的语义,所以它无法对上述食物提供有效的支持。XML这种新标准是一个很大的进展。但它只适用于事先对词汇表及其含义达成共识的情况。 语义网的实现将使企业间的合作不需要太大的开销。借助于标准的抽象领域模型可以消除术语差异,实现用不同术语书写的文档之间的翻译转换,从而实现数据交换。拍卖、协商和草拟合同将由软件代理自动(或半自动)地完成。 1.2.4个人代理:未来的展望 迈克尔出了一场轻微车祸,他觉得颈部有点疼。他的私人医生建议他去做一组理疗。迈克尔要他的语义网代理(Semantic Web agent)设计出一些可能的就医方案。 语义网代理从医生的自动代理那里查到了医生推荐的治疗信息,并查看了迈克尔的医疗保险公司提供的理疗师名单,从中找出距离迈克尔的办公室或住处不超过10公里的治疗师和权威排名机构对他们的评价,然后,寻找和迈克尔的日程表不冲突的预约时间。几分钟后,它给出了两个建议方案。但迈克尔都不满意。其中一个方案的预约时间在两星期后,而在另一个方案里,迈克尔则必须在交通高峰时刻驱车前往。所以,迈克尔把时间限制的更严格一些,让他的语义代理重新设计方案。 几分钟后,语义代理给出了一个新方案,可以在两天之内预约一个声誉很高的理疗师,但有一些小问题需要解决。首先,迈克尔的一些不太重要的工作安排需要调整,语义网代理承诺它将调整迈克尔的工作时刻表,如果迈克尔采纳这个方案的话。另外,该理疗师不在保险公司网站公布名单里,以为他的收费超过了保险公司规定的最高金额。不过,语义网代理从另一张名单上找到了这个理疗师的名字,并且得知,根据保险公司的有关规定,迈克尔可以接受超过最高限额的治疗。此外,迈克尔的语义网代理还和理疗师的自动代理谈成了优惠价格。该理疗师最近才决定收取高额治疗费,所以急于招徕新的病人。 既然增加的费用有限,迈克尔对这个新方案很感兴趣。不过,这个语义网代理是几天前才安装的,所以迈克尔要求它回答几个问题:对理疗师声誉的评价是怎样做出的?为什么迈克尔需要调整他的工作日程表?议价过程是怎样进行的?语义网代理一一给出了适当的解释。 迈克尔觉得很满意,他的语义代理网将使他繁忙的生活变得更轻松。他要求他的语义网代理采取所有必要的步骤,落实这个治疗方案。
1.3 语义网技术 1.2节所描绘的场景不是科幻小说,它的实现也不需要科学上的革命性突破。我们有理由断定,这是一个工程技术挑战而不是科学挑战,其中所有重要方面已经得到了部分的解决。目前,最需要的是集成、标准化、工具的开发和用户的采用。当然。未来的技术进步会产生更加先进的语义网。 在下面各小节里,我们将简要描述实现上述功能所需的几个必备技术。 1.3.1 显示元数据 目前的网络内容更适合让人而不是程序来阅读。HTML是直接或借助工具书写万个的主导语言。一个理疗师的我哪也片段看上去是这样的: 这些信息以适合人类阅读的方式显示,但对机器来说就有问题了。基于关键词的搜索能够识别理疗(physiotherapy)和咨询时间(consultation hours)这些单词。一个只能代理甚至能够识别该理疗中心的职员。但是,它分不清谁是医生、谁是秘书,识别具体的咨询时间就更加苦难了(这需要链接到the State Of Origin游戏的页面里去浏览)。 通过语义网途径解决这个问题的办法不是开发更高级的只能代理,而是从网页表示的角度入手。如果用更合适的语言取代HTML,用它们编写的网页就可以更好地表达其内容,这汇总网页不仅可以包含格式信息以生成便于人类阅读的文档,还可以包含描述内容的其他信息。比如在我们的例子中,可以包含下面这些信息: 与HTML相比,这种表达方式更容易让机器处理。元数据(metadata)指的是