基于刻面分类的ERP构件检索
- 格式:pdf
- 大小:248.08 KB
- 文档页数:2
基于刻面分类的构件检索袁冬娟,周晓峰河海大学计算机及信息工程学院,江苏南京(210098)摘要:构件库是软件复用技术的核心,而如何有效检索到可复用的构件是关键。
在众多的构件检索方法中,刻面检索是一种得到广泛应用和高效的检索方法。
这方面的研究和实践也一直是构件检索的重点,并且结合新技术而不断发展着。
本文介绍了构件刻面检索的现状,并对其未来的发展进行了展望。
关键词:软件复用,构件检索,刻面1引言软件构件技术是影响整个软件产业的关键技术之一[1]。
它被认为是有效提高软件生产率、缩短软件产品交付时间和提高软件质量的新途径。
近年来,构件技术的发展和基于构件的软件工程(Component - Based Software Engineering,CBSE)[2]的提出,使得构件库的建立成为发展的必然趋势, 因为基于构件的软件开发需要具有大量可供选择的可复用构件,提供验证合格的构件就必须通过构件库来实现,但如何有效地从构件库中准确地检索到所需要的构件是构建构件库的关键技术问题。
有效的构件检索机制能够降低构件查找和理解的成本,软件构件的分类和检索方法决定了构件库的组织、管理,以及构件库的查询和用户对软件构件的理解,是软件复用的基础性问题,也是近来软件复用研究的一个热点。
基于刻面分类的构件检索方法以其能够较大地提高检索效率,而且有助于复用者理解构件和目标领域的优点得到广泛的应用。
2构件检索的现状随着软件复用实践的深入和构件库规模的扩大以及新技术的不断发展,出现了很多构件检索方法。
目前的构件分类和检索方法有两种:一是W. Frakes从构件表示出发分为的人工智能方法、超文本方法和信息科学方法三类。
信息科学方法是目前实际复用项目中应用较为成功的一类, 又分为基于受控词汇表(枚举、刻面)分类和基于不受控词汇表(如关键词)分类两种形式,其中以枚举、刻面、属性值、关键词和正文检索几种方法较为常见;另外就是H. Mili按照复杂度和检索效果的递增将其分为基于文本的、基于词法描述子的和基于规约的编码和检索方法[3]。
基于xml刻面构件描述与检索算法研究近年来,随着互联网的发展,用户的数据量在迅速增长,因此,如何有效地组织和检索这些数据变得越来越重要。
在传统的信息检索方法中,用户被要求使用英文关键词描述相关内容,但是用户本身具有不同的文化背景,所以没有一种语言可以准确地表达他们的想法,而且,关键词由于不同的使用者的不同理解,往往会导致检索结果的不准确。
因此,基于XML的构件查询(XQ)技术成为当今最有效的数据检索技术,它被广泛应用于数据库、XML文档以及其它结构数据的检索中。
XML刻面构件(XFC)是基于XML的构件检索技术的基础,XFC把XML文档看做一系列构件,这些构件有着特定的描述和相互间的关系,XQ语言则用来描述这些构件的检索模式以及它们的检索结果。
XFC把XML文档看作一系列构件,构件的描述可以使用XML元素标签,属性标签以及文本标签表示,XQ语言则使用模式(pattern)描述构件的关系,模式可以描述两个构件相互包含,也可以描述某个构件的子构件,通过这种形式,XQ语言就可以获得文档中完整的构件信息。
XFC检索可以提供更准确,更有效的结果,但是由于XQ语言的复杂性,XFC检索的性能非常低,所以,研究基于XFC的高性能检索算法显得非常重要。
本文主要研究基于XML刻面构件(XFC)的检索算法,探讨了XFC检索的基本原理及其检索的关键技术,并介绍了几种基于XFC 的性能提升算法,以及它们在实际应用中的优势和不足。
首先,介绍了XFC基本原理及其概念。
与传统文本检索不同,XFC检索基于XML文档的构件关系描述,可以提供更准确,更有效的结果。
其次,介绍了XFC检索实现的关键技术,包括构件选择,构件抽取,模式匹配,构件过滤,构件聚合以及结果输出。
最后,结合实际应用,介绍了几种基于XFC的性能提升算法,以及它们的优势和不足。
综上所述,XML刻面构件检索技术是当今极具发展潜力的一种有效的数据检索技术。
随着它在实际应用中的普及,这一技术正在为用户提供精准的结果。
构件检索需求分析1.概述构件检索就是用户从目标构件库中检索出满足需求或接近需求的构件。
构件检索一直被认为是构件库系统管理的核心技术问题,构件的检索方法依赖于构件的分类描述方法。
构件检索需求列表●为检索构件建立分类模式;●能较准确的检索所需构件;●提供可视化的检索工具;功能列表●能通过关键词或刻面属性检索构件;●查看构件的基本信息;●可以选择需要用到的构件;2.构件分类模式合理有效的构件分类方式是构件的检索的基础,同时也方便了构件库管理人员管理构件,对用户更好的理解构件奠定了基础。
典型的分类模式基于以下三种表示方法:基于信息检索的方法、基于人工智能的方法和基于形式化规约的方法。
目前使用的大多数资产分类模式都是基于信息检索的方法。
信息检索分类方法分为两类:1)基于受控的词汇表分类:分类术语的数目是有限的,并且术语的组合也是按照一定语法进行的;2)基于不受控的词汇表分类:分类术语的数目是不受限制的;大部分复用分类模式都是基于不受控词汇表的方法,如自由文本;或者基于受控词汇的方法,例如枚举、刻面、“属性-值”方法;其中基于受控的词汇表方法是目前研究的重点。
常用的分类模式有四种:●关键词分类模式●枚举分类模式●刻面分类模式●“属性--值”分类模式检索工具结合关键词分类模式和刻面分类模式对资产进行检索,关键词分类模式是用关键词索引的术语和描述是从资产的文档中自动提取出来的,或者由对资产进行分类的人员填写。
在刻面分类模式中,类别是根据一组有序的刻面来定义的。
多个分类刻面描述了资产的不同属性。
每个刻面有一组有限的、有效的术语或取值。
例如:“使用环境”为一个刻面,而“uCOS”、“Linux”为其中的属性;同样可以包括“语言”、“领域”等刻面以及其各自的相关属性。
检索原型界面如图1所示:图1 构件检索原型图3.构件检索工具构件检索工具必须包含通过关键词或刻面属性检索构件、查看构件基本信息等基本功能。
构件检索对话框如图2所示图2 构件检索对话框检索结果将显示在构件检索对话框中,以表格的形式列出构件相关属性以便用户查看。