基于语义Web页面多媒体资源库设计与实现
- 格式:doc
- 大小:25.00 KB
- 文档页数:6
技术交流丨/ 2019.5数据通信Technology Discussion \/基于IFML和UML生成语义Web用户界面李丹丹刘晓燕曹荣凯(昆明理工大学信息工程与自动化学院云南昆明650500)摘要:随着语义Web应用程序的广泛应用,市场上对语义W eb用户界面的需求也越来越大,带注释的用户界面的设计和实现的工作变得越来越复杂。
针对该问题提出了一种基于交互流建模语言(IFML)的语义Web用户界面模型驱动开发方法。
首先利用对象管理组织(OMG)最近采用的新的用户界面建模标准IFML,完成应用程序需求分析的建模设计;然后,分别设计了转换规则,将IFML模型转换到HTM L5平台,UML模型转换到ODM模型,并通过转换工具ATL实现规则转换。
最后,结合HTML5模型和ODM模型,作为Acceleo工具的输入,生成带注释的语义Web应用。
关键词:交互流建模语言;语义Web应用程序;用户界面开发;HTMU模型;0DM模型;模型转换中图分类号:TP311 文献标识码:A1引言近年来,随着语义Web应用程序的广泛使用,人 们对语义Web应用程序的用户界面需求越来越高。
因此,语义Web用户界面的开发工作变得复杂且耗时[1]。
软件应用市场对用户界面的需求逐渐变得丰富 且复杂。
在开发用户界面工作之前,设计师需要了解 计算机平台、用户特点、环境交互等,这是一项复杂耗 时、一致性低的工作。
建模的方法能够降低设计工作 的复杂性,提高设计效率,并且保证应用程序的需求被 完整准确地设计。
因此,本文采用模型驱动方法开发 语义Web用户界面,降低开发工作的重复性,同时提高 开发质量。
事实上,已经有一些结合模型驱动方法,针 对用户界面开发的研究,比如,〇〇H- Method,WebML,HERA,TERESA,MARIA等。
这些技术由于它们在实 际工作中体现出的各种局限性,对于复杂的语义Web 用户界面开发远远不够。
交互流建模语言(Interaction Flow Modeling Language,IFML)[21的出现解决了语义 Web用户界面建模设计工作的复杂性问题。
毕业设计题目基于WEB的多媒体文档的设计与实现学院电子信息工程学院专业软件技术班级软件技术01班学号122060520121学生姓名胡磊指导教师王红刚完成日期2015年12月西安思源学院教务处制二零一四年十二月制【摘要】随着高校办学规模的扩大和学生数量的增多,每年高校毕业设计课题的数量和研究领域也随之增加,使得毕业设计的管理工作和信息收集工作变得复杂和困难。
鉴于此,采用信息化的管理方式管理毕业设计期间产生的大量文档成为高校信息化管理的趋势。
一个较完善的毕业设计文档管理系统能使学生方便的选题、开题、提交论文、及时查看有关毕业设计的相关信息、上传和下载相关资料和文档;也使教师方便的查看和审批学生毕业设计和相关文档,因此会大大提高毕业设计期间的管理水平和教学水平。
本文主要进行了系统需求的分析,同时也对系统数据库的整体架构和各部分表之间的关系进行了分析和概述,最后对整个系统的具体设计和实现进行详细介绍,包括对各个模块的设计与分析、流程的实现以及具体功能的展示。
【关键词】文档管理信息管理系统 C# SQL Server目录前言 (4)1 系统需求分析 (5)1.1系统目标 (5)1.2 开发工具和环境 (6)2 数据库设计 (8)2.1数据库设计的原则 (8)2.2 逻辑结构设计 (8)3 系统设计与实现 (11)3.1 系统总体设计流程 (11)3.2 系统功能模块设计 (11)3.3 系统功能结构设计 (13)4.系统模块设计与实现 (15)4.1 用户登录模块 (15)4.2 选题模块...................... 错误!未定义书签。
4.3 文件上传模块.................. 错误!未定义书签。
4.4 模板模块...................... 错误!未定义书签。
4.5 成绩模块...................... 错误!未定义书签。
4.6 公告模块...................... 错误!未定义书签。
基于WEB的多媒体素材管理库的开发及应用分析作者:林永怡陈自琛来源:《硅谷》2011年第09期摘要:目前,国内的教育网站涵盖比较丰富的建设资源。
这些资源在实践中扮演着越来越重要的角色,是广大师生学习、各社会人士研究的重要渠道。
对开发和应用WEB的多媒体素材库进行初步的分析,探究完善多媒体素材管理库的方法。
关键词: WEB建设;多媒体素材管理库;分析中图分类号:G434文献标识码:A文章编号:1671-7597(2011)0510134-01教育资源系统、常态远程教育平台、高校教育数据库、和远程学习教育试点是多媒体素材的主要内容。
另外衍生出一系列二级教育建设内容,如多媒体材料库、教案数据库、在线教学频道、案例课件库等,它们的产生和发展为众多的学员提供了丰富的学习资源。
1 重点开发技巧高等教育的多媒体素材库突破了传统教学中意纯文字学习的单调形式,以文本、声音、图像、视频影像等相互交叉结合构建出时代感强烈的新颖教育资源库。
多元化的学习资源和海量的选择空间更容易激发广大学员的学习兴趣,发挥其主观能动性,拓展知识的视野。
因此,重点研究以上的要素能进一步优化多媒体网络体系中的信息和数据,实现效用最大化。
1.1 合理运用检索技术。
在文本、图像、音频、视频影像的共同作用下,才能构建出高質量的多媒体素材库。
在繁多的资源中必须合理使用资源检索才能使学习者搜索出合适自己的资源。
检索系统应符合简明、高效、易操作等特性,以方便搜索者。
另外,管理库中的资源要符合原来的教学知识结构,以各学科中的知识结构为基础,向关联的多媒体素材进行辐射,通过高效检索使WEB多媒体素材库更完善:通过输入题目、关键字等的信息便可对对应的多媒体资源进行检索。
1.2 完善B/S结构的多媒体素材管理库。
正确维护和管理多媒体素材管理库是完善之的重要途径,这不仅为广大的使用者提供便利,还有利整个多媒体管理技术的优化升级。
库中需要广泛收集以图像为重点内容包括音频素材、动画素材、视频素材的规范化存档和应用。
软件应用多媒体素材管理库的内容主要包括教育资源系统、远程教育平台、教育数据库以及远程学习教育试点等,除此之外,还有一些衍生出的新兴教学内容,比如多媒体的电子数据库、教案数据库、在线学习的资源库等,多种类别的素材已经成为教学的重要资源。
1 基于WEB的多媒体素材管理库的发展现状我们的生活已经离不开网络,信息技术已经极大的得到普及,软件及硬件设施也在逐步完善,这些都为我们进行WEB多媒体素材管理库的开发与应用提供可能。
首先,日益丰富的网络资源为多媒体素材库的建设提供了大量现成的资源;其次,计算机软件技术不断发展,诸如ASP、Acess、SQL Sever等技术都为多媒体素材库提供了技术支持,最后就是便于网上资源共享,取之于网络,用之于网络,从网络中去获取资源,制作出来多媒体素材在发到网上,共享给同样需要的人使用。
2 基于WEB的多媒体素材管理库的设计2.1 设计原则在进行基于WEB的多媒体素材管理库的设计时,一般要有针对性的进行相应的设计,主要遵循的原则有:采用B/S即浏览器/服务器的结构,并且要满足多用户使用的需求,具备高效管理素材文件的特征,要具有强大的兼容性和保密性,可以有一定的容错性以及相应速度。
2.2 功能介绍基于WEB的多媒体素材管理库的主要功能是可以使用户能够方便的找寻自己所需的教学资源,然后进行分类,这样可以极大的缩短搜索的时间,提高效率,用户可以更好的获取资源,同时,也可以将有效的资源进行上传,使素材库的资源不断的丰富,使多媒体素材管理库能够实现对素材的删除与增加,修改与下载上传等功能。
2.3 整体结构基于WEB的多媒体素材管理库的系统主要是在服务器端进行应用操作的,主要由后台管理以及用户的操作两部分组成,客户端的用户可以通过浏览进行查看,而后台管理则主要对资源库的资源进行修改和删除等操作,还可以按照素材的不同类别,进行相应的分类,这样给用户的检索功能大大提高了自己所需素材的查找效率,还可以及时的对素材进行补充。
浅谈语义 Web 本体及本体库设计技术陈王乐;余秋明【摘要】当前 Web页面的信息描述采用是格式化表示语言,用此方式描述的信息计算机无法自动理解,因此出现了语义网这一研究领域,目的在于实现Web 的计算机理解。
本文介绍了语义Web 的七层结构,讨论了本体的概念,分析了本体库所应具备的功能。
【期刊名称】《科技风》【年(卷),期】2012(000)014【总页数】1页(P100-100)【关键词】语义网;本体;本体库【作者】陈王乐;余秋明【作者单位】江西理工大学软件学院,江西南昌330013;江西理工大学软件学院,江西南昌330013【正文语种】中文近些年来,互联网技术的迅猛发展,面对信息的海洋,如何组织、管理和维护海量信息并为用户提供有效的服务也就成为一项重要而迫切的研究课题。
在2000年世界XML大会上,万维网创始人Tim Berners-Lee对语义网这一概念进行了解释,并提出了它的体系结构。
本体是使Web具有语义性的关键技术。
从本质上说,本体是概念化的形式化、显式规范,概念化是通过识别世界中现象的相关概念而建立的关于现象的抽象模型;显式指概念的类型和应用的约束条件是显式定义的;形式化指机器可以理解、处理;共享指所要表达的概念化是某个领域所固有的,别广泛接受的。
在构建一个知识库系统的时候,不同本体扮演着不同角色,通常可以区分为:领域本体、通用本体、应用型的本体、表示本体。
目前现有如下几种典型的本体形式,包括词典、主题映射、体系分类法、WordNet等。
词典(Thesauri)描述了概念(如词性等)以及概念之间的关系。
通常本体定义主要包括以下几个组成部分:1)类:领域和任务中的概念,通常使用分类法组织在一起;2)关系:领域概念之间的一种联系类型。
基本关系有四种:part-of,kind-of,instance-of和 attribute-of。
3)函数:一种特殊的关系,在关系的N个元素中前N-1个元素决定了第N个元素。
2007年4月April 2007—282— 计 算 机 工 程Computer Engineering 第33卷 第8期Vol.33 No.8 ·开发研究与设计技术·文章编号:1000—3428(2007)08—0282—04文献标识码:A中图分类号:TP302基于语义Web 的网络学习资源库本体实现钟 珞,王 辉,李锐弢,宋华珠(武汉理工大学计算机科学与技术学院,武汉430070)摘 要:将语义Web 技术引入网络学习系统,构造了一个基于语义Web 架构的网络学习资源库本体,实现对网络学习系统中学习资源的管理。
在分析本体建模方式以及网络学习资源库基本功能的基础上,定义了由学习资源本体和用户本体组成的学习资源库顶层本体,并给出系统类图,在Prot ég é3.1中实现了本体建模,给出了基于OWL 的本体描述,对定义的本体进行了评估,并用基于本体的推理实例验证了本体的有效性。
关键词:语义Web ;本体;网络学习资源库Implementation of Ontology in E-learning Resource RepositoryBased on Semantic WebZHONG Luo, WANG Hui, LI Ruitao, SONG Huazhu(Institute of Computer Science & Technology, Wuhan University of Technology, Wuhan 430070)【Abstract 】The semantic Web technology is introduced in the E-learning to construct a learning resource ontology based on semantic Web architecture and realizes further management of the learning resources in E-learning system. After analyzing the functions and scope of Web-based education resource library and the methods of ontology modeling, upper ontology is illustrated which includes the resource library ontology and the users' ontology. And the class diagram is shown. Corresponding OWL description of ontology is implemented with Protégé3.1. The evaluation of ontology is given, and an inference instance proves its validity.【Key words 】Semantic Web; Ontology; E-learning resource repository语义Web 是国际互联网组织制定的关于未来Web 的一个长远蓝图,有着良好的应用前景。
基于Web的多媒体CAI课件开发过程中若干问题的研究和实践【摘要】在分析了Web多媒体课件开发的流程,并提出了多媒体元素的设计与整合、用户体验与评估、交互设计与互动性增强、技术实践与应用探索等关键问题。
结合实践经验,总结了一些有效的解决方案,并展望了未来的发展前景。
【关键词】Web多媒体,计算机辅助教学,课件开发,用户体验,交互设计,技术实践,应用探索,评估,互动性增强,发展前景,实践经验分享1. 引言1.1 背景介绍Web多媒体课件是一种结合了文字、图片、音频、视频等多种媒体形式的教学工具,以提升教学效果和学习体验。
随着互联网和移动设备的普及,Web多媒体课件逐渐成为教育领域的重要组成部分。
在传统教学模式下,学生通过纸质教材和黑板书写获取知识,而Web多媒体课件的出现为学生提供了更加生动、直观且互动性强的学习方式。
1.2 研究意义多媒体元素的设计与整合是Web多媒体课件开发的核心环节,直接关系到课件的吸引力和实用性。
探讨多媒体元素的设计原则、整合技巧,对于提高课件的质量和用户体验至关重要。
用户体验和评估是评价课件质量的关键指标,通过研究用户体验在多媒体课件中的应用和评估方法,可以有效提升课件的实用性和吸引力。
1.3 研究方法我们开展了实地调研和案例分析,深入了解实际开发中的问题和挑战,通过与开发者和用户进行沟通交流,获取他们的真实反馈和建议,进一步完善我们的研究内容和方法。
2. 正文2.1 Web多媒体课件开发流程分析Web多媒体课件的开发过程主要包括需求分析、设计、制作、测试和发布等几个关键阶段。
首先是需求分析阶段,开发团队需要与教育专家和客户充分沟通,明确课件的学习目标、内容和形式。
在设计阶段,团队要设计课件的结构和布局,确定使用的多媒体元素和交互方式。
制作阶段是将设计稿转化为实际的课件内容,包括文字、图片、视频等多媒体元素的编制和整合。
测试阶段需要对课件进行全面测试,确保其在各种设备和平台上都能正常运行。
基于Web技术的中职学校多媒体教学资源库设计与实现摘要:多媒体技术和网络技术的发展,为现代教育方式的更新注入了新的活力。
多媒体教学在教育行业中也得到了越来越广泛的应用。
对中职学校的多媒体教学资源库进行了设计,对系统进行了详细的分析。
分析证明该系统是可行的,值得推广和借鉴。
关键词:Web技术;多媒体;教学资源库;设计0 引言随着多媒体和网络技术的普及,以学生为中心的教学模式得到了发展。
多媒体网络教学体现了现代信息技术在教育行业中的应用。
它作为一种先进的教学模式,以构建主义学习理论为基础,最大限度地运用现代信息技术,为学生和教师创造一种全新的教学和学习环境,在教师的组织和帮助之下,学生通过和教师之间的交流与协作,主动进行知识构建获得新知识,进而形成自己的知识结构体系,这有利于创造性人才的培养。
多媒体计算机辅助教学在教育领域中具有明显的优势,受到了广大教师的青睐。
当前在教学中所使用的多媒体课件要么是购买现成的,要不就是自行开发。
通常购买的课件都是固定封闭式的软件,而不同教师都有着不同的教学习惯和思路,同时学生的状况也是参差不齐的,如果在课堂中使用购买的课件很可能出现水土不服现象,也就是说购买的课件无法适应不断变化的课堂教学。
显而易见,教师自行开发的课件和自己的教学思路是相一致的,最适宜自己教学。
但存在的问题是在开发过程中会有很多的困难。
课件开发对教师的计算机综合水平要求很高,同时也需要很多的专业设备。
网络技术的快速发展为计算机网络的高速传输提供了可能性,同时为多媒体技术的网络化应用奠定了坚实的基础。
由此可见,开发基于Web技术的多媒体教学资源库是完全可行的。
运用这项技术,可以存放制作难度相对较高的教学资源,这样给教师查询和下载自己所需要的素材提供了方便,使得素材的重复利用率得到有效提高,同时也使得多媒体课件制作的难度降低。
除此之外,还为学生课后自学提供了方便,可以有效提高学生的自学能力。
1 中职学校多媒体教学资源库设计在进行中职学校多媒体教学资源库的设计中,主要包括以下3个方面的内容,下面将对这3方面关键内容进行分析。
基于语义的Web再工程研究的开题报告1. 研究背景和意义随着互联网技术的不断发展,Web应用逐渐从简单的静态页面逐步演化为动态、交互性更强的应用。
然而,基于HTML标记语言开发的Web应用存在一些缺陷,如受限于文本、静态结构和信息孤岛等,导致Web应用在处理数据和信息时存在不足,难以满足人们日益增长的需求。
同时,随着数据量、结构和关系的增多,用户对Web应用的期望也发生了变化,更加注重信息的有效性、应用的互操作性和应用的可扩展性,这项需求的满足需要Web语义化的支持。
基于语义的Web再工程是一种利用已经存在的Web资源,重组它们以增加内容的语义值和机器可读性的技术。
它通过将Web内容转换为结构化数据,并利用语义技术实现数据之间的链接,建立起丰富信息之间的联系和通信。
因此,基于语义的Web再工程为Web应用的进一步发展和提高用户满意度提供了新的思路和方法,具有重要的研究和应用价值。
2. 研究目标和内容本研究旨在通过对基于语义的Web再工程的研究,探讨如何利用语义技术,对Web应用进行重构,提高Web应用的语义价值和机器可读性,使其更加适用于各种不同场景的应用需求。
具体研究内容包括:(1)对基于语义的Web再工程的概念和应用进行深入研究,了解国内外研究的现状和进展。
(2)分析Web应用语义化设计的要点和方法,针对现有Web应用的数据和内容进行结构化重塑和语义标注。
(3)利用语义技术和数据挖掘技术,对Web应用的数据进行自动化分析和处理,提高数据的可利用性和应用场景的多样性。
(4)通过实验验证,评估基于语义的Web再工程方法的有效性和可行性,并探讨其在各种应用场景下的实际应用情况。
3. 研究方法和技术路线本研究采用文献综述、实践研究、理论探讨等方法,结合实验验证和案例分析,探究基于语义的Web再工程的研究问题和解决方案。
具体技术路线如下:(1)研究Web应用的发展趋势、研究现状和应用需求,明确语义化设计对Web应用的价值和作用。
基于Web的多媒体CAI课件开发过程中若干问题的研究和实践摘要随着信息技术的发展,教学改革迫切需要引入多媒体教学手段。
基于Web的多媒体CAI课件是近年来应用较为广泛的一种教学工具。
本文通过对多媒体CAI课件开发过程中的相关问题进行研究和实践,探讨了多媒体CAI课件的开发过程、设计原则以及实现技术,希望能够为相关工作者提供一定的参考和借鉴。
引言随着计算机技术和互联网的快速发展,多媒体技术的应用在不断扩展和深化。
多媒体教学是集音、视频、文本、图形等多种形式的教学手段,它已经成为现代教育的主要形式之一。
多媒体教学的特点是将信息传输和知识传授以视听形式展现出来,有助于提高学习的兴趣和效果。
CAI课件是计算机辅助教学的一种形式,它将多媒体教学与计算机技术有机结合起来,可以极大地提高教学效果和效率。
基于Web的多媒体CAI课件充分利用了互联网的优势,可以方便地传播、交流和使用,因此应用越来越广泛。
但是,在多媒体CAI课件的开发过程中,也面临着许多问题和挑战。
本文将从多媒体CAI课件的开发过程、设计原则以及实现技术等方面,探讨基于Web的多媒体CAI课件开发过程中若干问题的研究和实践。
多媒体CAI课件的开发过程多媒体CAI课件的开发过程主要包括学科分析、教学设计、课件制作、试用评价等几个步骤。
学科分析学科分析是指通过对所要教授的学科的内容和特点进行分析,确定课件的目的、适用对象和内容。
在学科分析的基础上,可以制定全面而合理的教学计划,为后续的教学设计提供依据。
教学设计教学设计是指根据学科分析的结论,制定多媒体CAI课件的教学目标、内容、方法和形式等方面的计划。
教学设计不仅要考虑课程的内部结构、教学框架、教学目标、课件内容等方面的规范和合理性,还要考虑学生的认知特点、教学环境的变化、课程的评价机制等因素。
课件制作是指根据教学设计的方案,采用多种媒体技术和开发工具,具体实现教育目的的制作过程。
在制作过程中,需要根据学生的年龄、认知特点、文化背景等因素,选择合适的内容、形式和风格,以便实现目标的达成。
基于Web的多媒体教学系统的设计与实现随着信息技术的不断发展,网络技术的广泛应用,教育模式也正在发生着变革。
以前的传统教育模式越来越不能满足现代化教育的需求。
因此,将多媒体技术应用到教育教学中,是一种必要的改变。
基于Web的多媒体教学系统是一种新型的教学形式,不仅能够让学生更好的理解知识,也更加符合学生的学习方式和兴趣。
本文将探讨如何设计和实现基于Web的多媒体教学系统。
一、需求分析为了使教学系统更加符合现代化教育的要求,我们需要从学生的实际需求出发,分析教学系统的需求。
1.学生的需求现在的学生越来越倾向于多媒体的形式来学习知识,他们更愿意通过视频、音频等多媒体形式来学习课程。
因此,我们需要开发一种基于多媒体的教学系统,不仅要支持视频、音频等多媒体功能,还要具备交互性。
2.教师的需求在教学系统中,教师是系统中不可或缺的一部分。
教师需要能够灵活地设置课程,随时对学生的学习情况进行监控和管理。
同时,为了提高教学效果,教师需要对学生的学习过程实时反馈。
因此,本系统需要支持教师对学生的教学管理和监控。
3.系统的要求为了保证系统的稳定性和可靠性,本文中的基于Web的多媒体教学系统需要实现以下要求:1)支持多种文件格式的上传和下载功能。
2)支持数据备份和恢复功能。
3)支持多层权限的控制管理。
4)支持安全登录和会话管理。
5)支持实时消息推送和在线教学反馈。
二、系统设计在我们了解需求之后,我们需要对系统进行设计。
本章将介绍系统的整体设计和各个模块的设计。
1.总体架构本系统采用了B/S结构,使用J2EE技术实现,主要分为四个模块:用户管理模块、课程管理模块、学生管理模块和考试管理模块。
主要功能包括注册、登录、课程设置、发布、管理和考试。
2.用户管理模块用户管理模块是系统的核心模块之一,系统采用了分层架构,包括用户层、业务层和数据层。
用户层主要处理用户的登录和注册功能,业务层主要处理各种业务逻辑,数据层主要处理系统的数据库操作。
收稿日期:2012-11-05;修回日期:2012-01-12基金项目:湖南省教育厅科研项目(10C1237)作者简介:李发英(1972-),女,湖南郴州人,讲师,硕士,研究方向:分布式计算.基于语义的web 服务匹配算法研究与实现李发英,陆武魁(湘南学院计算机科学系,湖南郴州 423000)摘 要:随着Internet 信息的迅速增长,快速而有效地查找网络信息成为获取网络信息的基础.为了实现高效查找web 服务,提出一种基于语义的三阶段匹配算法,首先对web 服务进行基于关键字的分类筛选,然后实现web 服务基于语义的功能匹配,最后实现web 服务的非功能匹配.实践证明,该算法能够提高web 服务匹配效率.关键词:web 服务;匹配算法;分类;功能web 服务匹配中图分类号:TP393.027 文献标识码:A DOI:10.3969P j.jssn.1672-8173.2012.02.0121 引言当今Internet 迅猛发展,个人和企业对Internet 上的资源需求也在大幅度增长,如何有效利用网络上的海量资源和信息成为一个关键问题.Web 服务是对Internet 环境下资源的统称,指具有自治性的软件实体,在实现上,web 服务由服务提供者提供并发布到网络上,网络上的服务注册中心统一管理各类web 服务,需要web 服务的对象包括团体或个人或是其他web 服务称为服务请求者,服务请求者通过注册中心寻找web 服务.要实现web 服务的发布与调用,涉及到三个基本对象和三种基本操作,其中的关键技术分别是SOAP,W SDL 和UD -DI,三个基本对象是服务提供者Provider,服务请求者Requester 以及服务注册中心Register.三种基本操作是发布(publishing),绑定(binding)和请求(request).SOAP 的中文意思是是简单对象访问协议,对应的四个英文单词分别是Simple Object Access Protoc ol,SOAP 是web 服务实现服务调用的基础,当网络上的web 服务要调用其他服务时,SOAP 提供相应的通信机制.SOAP 将web 消息体封装使web 服务之间的调用与具体平台和操作系统无关.WSDL 是Web Service Description Language 的缩写,WSDS 是一种web 服务描述语言,它通过XML 文件格式来描述服务基本信息以及服务调用的相关信息,其中最基本的信息是某一个web 服务可以实现那些方面的功能,调用该web 服务的具体方法等,本质上,web 服务匹配的精确度跟WSDL 文件中描述信息的丰富程度紧密相关,文件中关于web 服务的描述信息越详尽,在服务匹配时精确度越高,因此,要提高服务匹配的精度,实现快速和有效匹配,一种方法是在该文件中添加更多的关于该web 服务的功能和非功能语义信息.然后基于语义实现服务匹配.由于篇幅的限制,如何添加更多的语义信息在本文中不给出具体介绍.UDDI 的中文意思是统一描述、发现集成,UDDI 是Universal Description Discovery Integrated 的缩写,UDDI 的功能是实现对web 服务的注册,因此也可以将UDDI 看作一个用于查找和注册WEB 服务的注册器,通过UDDI 可以为服务提供者提供发布服务的方式,同时UDDI 也负责管理由服务提供者已经发布的Web 服务.UDDI 是服务请求者和服务提供者之间联系的桥梁,UDDI 将服务提供者和服务请求者绑定在一起,从而便于服务请求者调用所需要的web 服务.Web 服务赖以实现的这三大核心技术以XML(eXtensible Markup Language)可扩展标记语言为基础,相互作用,共同完成web 服务的描述、发布、管理和调用,在整个SOA 体系架构中起到关键性的作用.2012年4月第33卷第2期 湘南学院学报Journal of Xiangnan University Apr.,2012Vol.33No.2Web 服务的实质是/共享资源、交互通信、协作研究0.通过分布在全球各地web 上的各种资源,在SOAP 协议下达到共享的目的.服务的内涵十分广泛,从计算服务、查询与检索、信息处理到自动完成服务服务查找和合成的语义web 服务时代.因此,要实现语义环境下的WEB 服务查询与处理,服务的自动合成,服务匹配算法至关重要,特别是算法本身的效率高低,直接影响到服务查找与合成的速度,决定了用户利用网络资源和访问网络资源的快速性和高效率.2 Web 服务的体系结构要实现SOA 体系结构中的WEB 服务匹配,首先了解体系结构中的基本组成部分,从体系结构实现的功能来看,Web 服务体系结构包含必须的三个对象以及三种基本操作.三个对象分别是:服务请求者Requester:在SOA 体系中,服务请求者可以是最终用户也可以是实现某个特定功能的应用程序.服务提供者Provider:能够提供服务的软件实体.服务注册中心Registry:保存服务并对服务进行管理的机构.三种基本操作是:发布(Publish):发布操作将服务提供者对象与注册中心联系起来.发现(Find):发现操作将服务提供者与服务请求者联系起来.绑定(Bind):绑定操作将注册中心与服务请求者联系起来,为实现服务发现提供了支撑作用.在SOA 体系结构中,三个对象和三种基本操作互相连接,密不可分,三个对象对三个基本操作有重要作用,由图1可知,服务提供者将WEB 服务发布到服务注册中心,服务请求者通过查找服务注册中心来查找并发现所需要的W EB 服务,服务提供者通过棒定操作与服务请求者联系在一起.图1 SOA 架构下的WEB 服务体系结构图如图1所示,SOA 体系结构中的三个对象分别实现以下功能,这三个对象与三个核心操作紧密结合,共同实现WEB 服务的发布、发现和绑定,以及在动态环境下为企业和个人实现动态服务选择和服务组合.(1)服务提供者(Service Provider):该对象在SOA 体系结构中是一个关键部分,它通过因特网向企业或个人提供应用服务.通过使用一种服务描述语言来描述和定义应用程序的功能,服务描述语言的描述能力直接关系到WEB 服务的查找和调用,当前比较流行的服务描述语言是W SDL,在SOA 结构中,任何一个服务提供者可以在网上发布一个或者多个应用服务,应用服务的基本信息通过UDDI 服务注册中心发布,这样其他应用程序或用户可以通过网络接收和调用满足需要的Web 服务.(2)服务请求者(Service Requester):服务请求者对象也称服务用户(Service User).服务请求者可以是最终用户,也可以是一个由其他任何一个服务提供者提供的WEB 服务.从服务调用和服务使用的角度看,服务请求者可以是任何一个发现并调用其他应用程序,或启动与服务交互的应用程序.(3)服务注册器(Service Registry):服务注册对象的主要作用是实现WEB 服务的注册.并发布服务基本信息的对象,主要负责将服务提供者对象和服务请求者对象联系起来.在SOA 体系结构中,实现WEB 服务的发现、查找和调用,必须发生的基本操作有:(1)发布服务(Publishing):在W EB 服务,服务提供者为了将自身提供的WEB 服务描述信息及时发布到网络上,可以通过发布服务的操作将服务基本信息,如何调用该服务的相关信息通过服务注册器对象进行发布.发布后,WEB 服务保存在服务注册器中,供服务提供者在需要的时候调用.(2)发现服务(Finding):在服务匹配系统中,服务请求者通过服务注册中心查找需要的WEB 服务,在服务注册中心查找并获取要调用WEB 服务的相关描述信息,为调用该WEB 服务奠定基础.通过发现操作,服务提供者和服务注册中心可以很方便地联系起来,最后将需要的W EB 服务通过服务注册中心查找并实现成功调用.李发英,陆武魁:基于语义的web 服务匹配算法研究与实现湘南学院学报(自然科学版)2011年4月(第33卷)第2期(3)绑定服务(Binding):服务提供者将自身所提供的WEB服务发布到服务注册器后,服务请求者可以直接使用服务描述信息中的服务绑定信息来定位、联系以及调用所需要的WEB服务,从而完成与某个特定的需要Web服务的交互.3基于语义实现三阶段WEB服务匹配算法当前对WEB服务研究中,WEB服务匹配算法的研究在学术界已经有多种不同的实现方法.大概有语法级和语义级服务匹配.语法级服务匹配基于UDDI技术和WSDL技术,并运用本体论思想,根据领域本体对已发布服务实现逻辑划分.语义层次上的服务匹配算法则通过在WSDL描述文件中添加了更多语义信息,或者通过人工标注的方法添加了丰富语义信息,最终可以实现服务的自动查找和自动合成.一种方法是通过使用OWL-S基于本体的服务描述语言,该本体描述服务可以有更强的信息表达能力,并且支持语义推理功能[3].另一种方法是将UDDI技术与OW L-S本体结合来实现语义服务匹配功能[4],但没有提及非功能匹配特性.我们给出的三级服务匹配算法很好地将语法级关键字匹配与语义层次上的服务匹配结合,同时也很好地实现了服务的功能特性和非功能特性,既全面又可以提高服务匹配效率.3.1基于关键字的服务筛选如前所叙,要高效利用Internet网上的资源,个人或企业以及其他软件实体能够有效地访问网络上的web 服务,需要使用一种有效的用于语义环境下高效发现和查找web服务的服务匹配算法,在面向语义的WEB服务环境下,我们提出一种三阶段服务匹配算法,该算法的第一步是实现语法级的基于关键字的服务匹配,第二阶段是基于语义的功能WEB服务匹配,第三阶段是基于语义的非功能WEB服务匹配.由于服务请求者需要的web服务是在整个全球性的Internet中查找,Internet是一个拥有海量信息的资源库,我们考虑到首先从大量的web服务中筛选出一部分,以便缩小web服务查找范围.在这个阶段,我们采用了基于关键字的服务筛选,即根据服务请求者的服务需求,直接根据服务请求web服务关键字来匹配网络中的web服务,将匹配web服务保存在一个缓冲池中,然后再从该缓冲池取出筛选出来的服务,这部分服务将作为第二阶段基于语义的功能性服务匹配和第三阶段基于语义的非功能性服务匹配的很多可选WEB服务.基于关键字的服务匹配如图2 .所示Array图2服务匹配系统的第一阶段关键字匹配在上述的图2中,第一步将服务请求者预期需要的web服务转化为与服务提供者相同的服务描述,本文中,假设给定的服务描述语言为OWL(Ontology Web Language),代理B1获取服务请求者的描述信息,代理B2负责将描述信息包含的主要关键字提取出来,然后将此关键字与服务提供者提供的服务进行匹配,将关键字能够匹配成功的服务作为下一阶段进行功能性匹配的侯选服务,如果匹配不成功,则舍弃该web服务,依次选择下一个web服务进行匹配.通过模块2匹配成功的服务将作为匹配结果保存在匹配结果存储器中.3.2三阶段服务匹配在执行了第一步给出的基于关键字服务匹配算法后,取出通过语法层次的服务匹配算法选出的语法上与服务请求者需求一致的WEB服务,而这样的服务在语义上是否满足服务需求者,需要作进一步的服务匹配.也就是对那些满足语法级服务匹配的WEB服务再一次执行语义级别的服务匹配.语义级别的服务匹配算法的实现对于智能化服务组合及动态服务组合至关重要.在整个服务匹配算法中,语义级服务匹配是核心,也是关键.为了能够更好地实现服务匹配高效精确的效果,我们将这一阶段的匹配细分为两个方面,一是根据服务能够最终为用户提供的实际功能,根据是否满足需求者的预期功能为目标的匹配,功能级服务匹配.二是根据服务是否满足除核心功能外的其他指标如服务费用,服务所需时间,服务所能达到的质量指标等,者类服务匹李发英,陆武魁:基于语义的web服务匹配算法研究与实现配我们称为服务的非功能匹配.3.2.1功能级服务匹配过程在整个服务匹配过程中,功能级WEB服务匹配的目标是针对服务提供者所提供的WEB服务,使得服务请求者能够找到满足自身需要的服务,最基本的需要就是所查找到的服务能够满足最基本的功能需求,这种功能就是在服务描述文件中所描述的服务能够实现的基本功能.另一方面,我们所提到的服务匹配是在语义级别上的服务匹配,因此,针对服务描述文件中大量的语义信息,我们要设法利用描述文件中的语义信息来实现功能级服务匹配.在海量的服务中查找和定位一个预期的WEB服务需要一个高效的服务匹配算法,从服务描述到算法的实现需要很多工作要做.再有,功能级服务匹配在服务的动态组合中是一个关键因素,因为服务匹配算法决定了能否在查找到动态组合中所需要的WEB服务,一个不合适的服务对于服务组合来说是不利的,使用这样的服务影响组合服务的功能,组合服务根本不能实现其功能,如果一个WEB服务不能在基本的功能上满足服务请求者的需求,那么这项服务不再参与第三阶段的非功能级服务匹配,实际上,判断功能级服务匹配是否匹配成功的最简单的方法是,给定一个特定的输入in,能否获得预期的输出out,如果有预期的输出则说明该WEB服务满足基本的功能.然而在语义环境下,需要结合本体中的概念来实现功能级语义匹配. 3.2.2功能级服务匹配的描述在基于语义的服务匹配系统中,需要引入本体这一概念,在SOA体系结构中,本体描述了特定领域中的概念及概念之间的关系,这种关系涉及到其中的类与子类关系,属性关系,包含关系和被包含关系,继承关系以及二元关系等.在本体中,这些概念及其关系表现为具有明显层次的树状结构,通过树状结构的概念集,本体至少在概念层次上表明了特定领域中任意两个概念之间有多少相似点,如果两个概念不同,可以通过本体表明这两个概念的差异程度.从软件设计的角度看,本体中的概念(concept)与面向对象程序设计中的类(class)相似,假设我们用in表示要执行服务的输入,用out表示进行执行服务后的输出.在基于本体的服务匹配系统中,由于本体给出了特定领域中相关的类及其关系,把输入、输出参数与本体中的类相关联,服务的输入信息可以表示成本体中的一个类,服务执行后的输出结果表示成本体中的另一个类,通过本体实现服务功能的语义描述,再通过描述逻辑将本体中的概念及其关系形式化,这样服务匹配的功能级匹配在服务调用和服务动态组合中可以由软件代理来实现,这种基于本体的服务匹配算法是实现自动服务组合和语义匹配的基础.在功能级语义服务匹配中,根据匹配结果与请求者预期服务之间的关系,综合有关文献大致有以下几类:A.匹配结果包含需求服务.即可以通过匹配算法找到满足服务需求者需要的服务.对以上的匹配结果进一步细分,又可以将匹配成功的结果划分为两种.(1)完全满足需要的匹配.指匹配算法所返回的WEB服务完全满足服务需求者的预期结果;换句话说,返回的W EB服务都能够满足服务请求者,实现请求者需要的预期功能.(2)不能完全满足需要的匹配.指在经过匹配算法得到的所有返回的W EB服务中,有少部分WEB服务不能满足服务需求者预期的功能,要么返回的服务包含太多的不能起任何作用的无用信息.这些无用信息对服务请求者来说既不能实现预期功能又不具备非功能特性如服务质量、可靠性和价格等的需求;二是不能返回需求者完全的预期的WEB服务,也就是需求者需要的服务不能完全通过这种不完全匹配得到满足,只能满足请求者的部分功能需求.B.匹配结果不包含需求服务:指服务匹配结果不满足服务需求者预期的服务请求,意味着通过功能级匹配后不可以为服务请求者找到预期的WEB服务.如果出现这种情况,也就是在第二阶段被过滤掉的WEB服务,不能参与第三阶段即非功能服务匹配.3.2.3功能级服务匹配算法在当前服务匹配算法研究中,对服务匹配算法的描述有多种方法,文献1通过本体实现功能级服务匹配算法,这种方法能够将概念及其关系详尽体现在树形结构上,并通过树的层次关系表明概念之间的包含与被包含关系,继承关系等,在基于推理的服务匹配算法中,基于本体的描述方法特别有效.但本体的创建是繁琐的,并且对于一个特定的领域,由于概念数目多,关系复杂,要构建符合本领域的通用本体比较困难,这不是一个人能够完成的工作,通常要涉及到领域专家的参与.文献2给出了面向对象的服务匹配描述方法,在面向对象中,通过类的构建及其与子类的继承关系来描述整个算法,但这种方法没有包括类与子类除继承关系外的其他关系,如二元关系,并且这种方法比较抽象,不是很只管.集合论是比较直观也是比较简单的描述方法,基于集合论的方法来描述服务匹配算法的基本思想是:给定两个集合,判断集合中概念之间的相似程度,由于功能级服务匹配是基于语义的,因此概念之间的相似程度是指概念的语义相似度.为了很好地描述基于集合论的服务匹配算法,可以给出以下定义:对于服务提供者提供的服务可能的输出用用集合X表示,服务请求者预期的输出服务用集合Y表示.从集合Y中取出任意一个元素y,使用深度规则,在集合X进行深度遍历,查找到与元素y的语义相似度最大的元素x(x指X中与y最匹配的元素),可以得到y的最大语义相似度,这个值是集合X与元素y的语义相似度.X与Y的相似匹配结果可以通过集合X与集合Y中的每个元素的语义相似度执行几何平均计算求得.用sim(x,y)表示集合X中的任何一个实例x与y之间的相似度,ma x表示X集合中的x与y的最大语义相似度,该算法用伪代码描述如下:For I=1to N P P取集合X中的某个元素For J=1to N P P取集合Y中的某个元素If sim(xi,yj)>max将X中的元素x与Y中的元素y的语义相似度跟max比较ma x=sim(xi,yj) elseoutput xi通过上述服务匹配算法可知,对于任何一个返回服务,如果该服务的语义相似度大于其他任何一个相似度,则返回给服务请求者的服务就是取服务相似度值最大的一个.因为服务相似度值越大,说明该服务越接近服务请求者的需求,服务匹配精度和准确度越高.3.2.4非功能级服务匹配算法的实现要在理论上判断服务匹配算法返回的WEB服务是否完全满足服务请求者的预期目标,在执行了概念级服务匹配和功能级服务匹配后,还有一个比较重要的因素,即服务的非功能因素,如执行服务或调用服务所需的时间、获取该服务所需的成本即服务费用、服务质量等.如何实现服务非功能匹配、如何衡量非功能匹配算法的有效性、高效性和完备性是值得关注的问题.一个通用的方法是,在服务的功能匹配模式中,通过添加外部高级约束条件的方式来实现服务的非功能匹配,也就是说,我们可以将服务费用、服务质量等非功能因素作为一些附加条件来判断服务匹配是否成功.这种综合了功能匹配和非功能匹配的服务匹配算法对于一个实际应用型的系统很重要,单独考虑服务的非功能因素远远不够,原因是服务的非功能因素总是在动态变化的,这些因素随着服务执行过程中的外部条件变化而发生很大的变化.由于综合匹配模式包括功能匹配和非功能匹配,在具体的服务匹配可以将服务非功能性匹配的实现作为服务关键匹配模式的一个组成部分,在这里,使用SHI Q描述逻辑,将服务的功能级匹配和非功能级匹配的交集作为关键匹配模式的主要组成部分,这样一来,整个关键匹配模式可以用下面的表达式来表示: KE YMT1=(服务类型类.task(服务约束类.(执行时间类.time(服务对象.object))))KE YMT2=(服务类型类.task(服务约束类.(服务价格类.time(服务对象.object))))KE YMT3=(服务类型类.task(服务约束类.(服务质量类.time(服务对象.object))))、KE YMT=KEYMT1H KEYMT2H KE YMT3其中,服务类型有:企业类服务,个人服务;服务约束类包括执行时间,服务费用和服务质量通过以上的关键匹配表达式,可以很好地综合功能匹配和非功能匹配,实现满足服务请求者的高精确度匹配,实践证明,这种匹配模式是可行的而且是高效率的.4算法性能分析本文提出的三阶段服务匹配算法与单独的基于关键字的匹配算法及功能级匹配算法相比,在以下两个方面有了极大的改进.一是提高了服务的查准率.查准率是指匹配的返回给服务请求者的WEB服务在多大程度上满足服务请湘南学院学报(自然科学版)2011年4月(第33卷)第2期李发英,陆武魁:基于语义的web服务匹配算法研究与实现求者需要的W EB服务.查准率是服务匹配返回的满足服务需求的WEB服务数量与返回的WEB服务总数量的比值.如果返回的服务完全满足请求者的需求,则查准率为100%.二是提高了服务的查全率.查全率是指所返回的WEB服务包含了需求者期望的W EB服务的数量.查全率是服务匹配返回并且满足服务需求的WEB服务数量与服务请求者预期需要的WEB服务数量的比值.为了更好地说明本文提出的服务匹配算法在算法性能和查找效率方面的优越性,通过实验数据进行说明.实验环境为:CPU1.5HZ,内存1G,操作系统WI NXP,推理机Jena,本体构建平台Protege3.2,数据库Mysql6.0.测试用W EB服务;生物信息领域的100个本体.通过读取部署在服务器上的服务描述信息进行实验,实验过程中对原有WEB服务不作任何修改.实验数据表明,该算法与单独使用本体推理和单独使用几何距离相似度计算两种算法相比,在一定程度上可以提高服务匹配系统的查全率和查准率.单独概念级的服务匹配算法在三种算法中查全率和查准率最低,三阶段服务匹配算法查全率最高,但该算法所需要的匹配时间相对长,因为要进行三次匹配,下一步研究的重点是讨论如何缩短三阶段服务匹配算法的匹配时间,以便使该算法具有更好的实用性和灵活性.5结束语基于关键字、功能和非功能服务匹配的三级服务匹配算法是一种语义web服务匹配.将此匹配系统应用于各种查询系统中可以提高服务查全率和查准率,既可以避免有用信息的遗漏,又可以防止大量无用信息呈现在用户面前,导致无用信息的泛滥.这是有效整合系统、实现服务自动组合的必要措施.后续研究的重点是研究相似度匹配精确算法,此外,结合一个典型实例说明服务匹配方法在查询系统中的实际应用.参考文献:[1]Paolucci M,Kawamura T,Payne TR,et al.Importing the Semantic Web in UDDI[C].Web Services,E-Business and Semantic WebWorkshop,2002.[2]高振国,杨孝宗.服务发现技术中的服务描述和服务匹配技术[J].计算机工程与设计,2005,4(12):3313-3316.[3]任波.基于功能的Web服务语义相似匹配[J].计算机工程,2006,6(2):206-208.[4]侯冕.基于语义Web本体语言的推理机引擎的实现[J].学术论文,2005,4(7):41-43.[5]尹晓璐.基于语义的Web服务查询[J].实验科学与技术,2005,5(1):31-34.Research and Realization of Web ServiceMatching Based on SemanticsLi Faying,Lu Wukuei(Department of Computer Science of Xiangnan University,Chenzhou423000,C hina)Abstract:With the development of the internet,it is of primary importance for us to find network information quickly and efficiently.So in this essay,a three stage web matching algorithm based on semantic is provided.Firstly,category and choice based on key words are performed,secondly,function web service matching is rea-l ized,lastly,non-function web service matching is realized.This algorithm has been proved to improve web ser-vice efficiency.Key w ords:web service;matching algorithm;category;function web service matching。
基于语义Web页面多媒体资源库的设计与实现
摘要:互联网的推出和发展带动了网络经济的快速增长,用户通过网络平台即可获得丰富的信息资源,实现不同地理位置和用户平台的网络互通,伴随着网络信息量的暴增,用户从资源库中寻找所需信息的准确率越来越低,开发出一种快速、有效提取相关度信息的资源库迫在眉睫。
本文提出了一类基于语义web页面的多媒体资源库设计方案,充分利用数据库、面向对象、人工智能等高新技术来构建数据库的软件体系,通过搜索和分析多媒体资源网页来获得相应的多媒体区域,提取多媒体资源相关文本信息,将最终确认的文本信息存储在数据库,当用户使用检索服务时资源库会呈现出准确度最高的信息,实现庞大资源和有效信息的快速对接。
关键词:多媒体资源库;web页面;信息提取
中图分类号:tp311.52
搜索引擎工具为互联网用户提供了获得有效信息的良好途径,负责从庞大的数据资源中检索出最符合用户要求的信息。
在未来的互联网发展趋势中,不断壮大的信息资源库虽然值得欣喜,可却为用户准确检索信息工作设置了许多困难,极具代表性的baidu、google 等搜索工具将承担更多的分布式数据源和异构数据,在很大程度上会降低用户检索的质量。
本文针对大型数据库表的搜索问题提出了一类多媒体数据库设计方案,利用web本身的优势来凸显信息相关度,实现信息分析和提取的高准确度。
1多媒休资源库相关技术
1.1数据库技术
数据库技术的推出是为了建立起计算机和应用程序之间的桥梁,主要负责分类、存储和检索数据的任务,同时还会组织和维护好应用数据,从应用上来说它很符合标准式接口的要求,且面对所有用户开放。
1.2面向对象技术
面对对象技术侧重整和所有信息处理模块,能有效的调节复杂知识单元的结构,且在接触构件化集成问题时能快速的获取多媒体资源库的信息。
1.3网络技术
网络技术是为了解决不同地理位置用户网络需求应运而生的,它首先需要一定功能的通信设备,借助线路的联通来实现网络共享,网络软件的嵌入帮助实现用户最佳网络体验。
1.4人工智能技术
人工智能技术是多媒体资源库相关技术的必然发展趋势之一,它承担着分析学习者特征和要求的责任,当有效筛选出学习者信息后就会和知识库形成匹配,将最大价值的学习资料回馈给用户操作界面,解决了人工查询带来的困难和误差。
2基于web页面多媒体资源库的设计
我们提出一类基于web页面多媒体资源库的设计方案,首要任务是挑选出本身web里面实际存在的多媒体资源页面,然后操作预处理行为,通过对结构的分析来获得关于多媒体资源的所有文本,对
文本进行组织后采取拼音转换、中英文翻译、提取关键词等操作,使其符合信息库要求。
2.1搜集多媒体资源网页
选择极具代表性的网络资源搜索器google或baidu,通过搜索来获得和多媒体有关联性的所有web页面,点击标签后计算机会按照内容相似度对web页面进行排序。
html代码会统一保存在一个区域内,形成可用的资源库,同时发挥布尔模型的作用,确定资源库爬向方向和主题,从技术层面来说这也是提高搜索引擎准确率的途径之一。
2.2分析多媒体资源网页和定位多媒体区域
charset的属性值会直接影响到多媒体资源网页的编码语言和类型,极具代表性的代码,可从里面提取出gb2312的编码代码,另一代码中编码型号应为utf-8。
各式各样的编码类型都可以转换成统一的gb2312编码。
常用的vc函数multibytetowidechar()或widechartomultibyte()都具有编码转换的功能,能快速将utf-8变成gb2312编码。
解决了编码问题就可以通过网页结构图来划分多媒体资源所处的区域,定位一切和资源相关的文本,提高导航准确性,同时运行相关算法,在保持有效文本的基础上剔除干扰性文本。
2.3提取多媒体资源相关文本信息
提取多媒体资源的相关文本信息,首先要对网页重要标签进行汇总和分析,比如说“……之间的内容”,description和keywords
都是网页头部的两大关键词,网页的关键词则表示为,而网页的描述则用表示,通过高度和集中的概括来得出不同网页的特征词,对用户而言很容易区分出网页内容。
通常来说借助关键字来辨析网页结构和内容也是将其他干扰性信息排除在外的方式之一,改变以往文本鱼龙混杂的局面。
现阶段多数网站都设置了多媒体资源导航的模块,以英语学习网站为代表,第一模块是英语之声,然后细分到听力训练,下面还有动画听力内容,到达最终的字母训练模块,而导航文本已经明确的指出了“字母听力训练”是关键字。
2.4入库文本信息
入库文本信息最重要的一步就是将上个步骤中提取的文本信息存储到数据库,包括不同文本的关键字,这一步完成了对web页面多媒体资源库的初步构建,从理论上来说已经满足了结构要求。
3基于web页面多媒体资源库的测试
我们通过多媒体资源搜集器来测试web页面多媒体资源库的实际功能,首先选取网站排行榜里面知名度位于前20位的主流网站,搜索出数量高达300个的页面,对页面关键字进行统计,计算web 页面多媒体资源库的提取率和准确率,并以此来作为判断测试结果的硬性指标,如表1所示:
表1测试结果
页面数目包含关键词的数目提取正确的网页数提取率
准确率
300 292 288 97.3% 96.0%
基于语义web页面设计出来的多媒体资源库提取率高达97.3%,准确率也达到了96.0%,最终获得相关文本信息量大、准确度高。
该系统在应用范围上还存在一定缺陷,因为是特别针对表格定位标签所设计的,所以最终分析和存取的结果误差很大,而一旦存在未使用表格定位的网页,就会出现多媒体资源信息尚未提取的现象。
4结语
解决多媒体资源搜索和文本提取问题对提高网络信息的利用度
有重要作用,为用户提供最高效、准确的资源服务。
我们在利用传统语义web的基础上提出了一类围绕关键词相关度的搜索模型,它能快速、有效的将媒体资源中具有相关度的关键词分析和提取出来,提升用户使用检索服务的舒适度。
我们在设置媒体信息文档模块时嵌入了传统稳定的语言模块,以“词语—关键词”为评判标准,充分融合内容分析和文本提取两种方法的优势,发挥多媒体丰富资源的特点,保证高提取率和查准率,和不同网站的页面形成良好的契合。
参考文献:
[1]徐丽玲,王琴.基于web多媒体资源库设计与研究[j].中国现代教育装备,2008(5):74-76.
[2]韩旭,曹永存,王辉,林旺.构建基于web的非物质文化遗产多媒体资源库[j].情报杂志,2009,28(6).
[3]李沛.多媒体资源库图像数据压缩和存储技术研究[j].煤炭
技术,2012,31(6):178-179.
[4]王成槃.浅谈城乡一体化背景下的多媒体资源库建设[j].兰台世界,2012(14):64-65.。