基于容差计算的非完备信息系统属性约简算法
- 格式:pdf
- 大小:994.87 KB
- 文档页数:6
基于包含度的不完备序信息系统属性约简的一种算法郭永平【期刊名称】《佳木斯大学学报(自然科学版)》【年(卷),期】2012(030)002【摘要】In this paper,by introducing the concept of inclusion degree to incomplete ordered information system,the significance of attribute was defined.Then,an inclusion degree-based algorithm for attribute reduction under incomplete ordered information system was proposed.The experimental results show that this algorithm can find the reduction of an incomplete ordered information system.%在不完备序信息系统中,通过引入包含度的概念,对属性重要度进行了定义;在此基础上,提出了一种基于包含度的属性约简算法;最后,通过实例分析表明,该算法能得到不完备序信息系统的一个约简.【总页数】4页(P270-272,277)【作者】郭永平【作者单位】中国人民银行嘉峪关市中心支行,甘肃嘉峪关735100【正文语种】中文【中图分类】O159【相关文献】1.一种不完备模糊目标信息系统的精度属性约简算法 [J], 于晓辉;张强2.一种基于知识粒度的不完备信息系统的属性约简算法 [J], 李秀红;史开泉3.基于全序优势关系的不完备模糊信息系统及其属性约简 [J], 曾雪兰;孙兴星;于莹莹4.不完备信息系统下基于分辨度的属性约简算法 [J], 李长清;张燕兰5.一种基于变精度区分矩阵的不完备信息系统属性约简 [J], 蔡正琦;林和;孔令旺;李永礼因版权原因,仅展示原文概要,查看原文内容请购买。
基于容差计算的非完备信息系统属性约简算法梁宝华【摘要】对于有缺损值的非完备信息系统约简,多数算法利用容差关系求信息量,但此类算法需消耗大量时间计算容差,导致属性约简质量、消耗的时间及空间复杂度均不理想.为了有效提高求容差类计算效率,引入一个与相容类信息量等价的计算公式.以此为基础,提出一种属性约简算法,使时间复杂度降为O(|C|2|U|),空间降为O(|C||U|).最后,通过实例和实验分析并验证了算法的有效性和可行性.%For incomplete information system reduction with defective values, most algorithms use the tolerance relation to compute the amount of information, but this kind of algorithm consumes a large amount of time computing tolerance, which leads to the quality of attribute reduction and the time and space complexity are not ideal.In order to improve the computation efficiency of the tolerance class effectively, a formula for calculating the equivalent information of the compatible class is introduced.Based on it, an attribute reduction algorithm is proposed, which reduces the time complexity to O(|C|2|U|) and reduces the space to O(|C||U|).Finally, the examples and experimental analysis show that the proposed algorithm is efficient and feasible.【期刊名称】《计算机应用与软件》【年(卷),期】2017(034)004【总页数】6页(P299-304)【关键词】粗糙集;属性约简;非完备信息系统;相容类【作者】梁宝华【作者单位】巢湖学院信息工程学院安徽合肥 238000【正文语种】中文【中图分类】TP181粗糙集理论[1-2]是由波兰数学家Pawlak教授于1982年提出的,是一种处理不完全、不精确和模糊性数据的数学工具。
不完备信息系统属性约简算法研究作者:***来源:《计算机时代》2020年第07期摘要:基于经典粗糙集,从不完备信息系统和相容类的相关概念出发,给出了不完备信息系统中相容类的算法和属性约简算法。
此算法将继续被研究以期降低其时间复杂度。
关键词:不完备信息系统;粗糙集;属性约简;相容类中图分类号:TP18 文献标识码:A 文章编号:1006-8228(2020)07-83-030引言自学者Pawlak于1982年提出粗糙集以来,粗糙集理论在机器学习、规则提取、决策支持等领域得到了广泛应用。
经典的粗糙集理论以完备的信息系统为研究对象,在处理数据时基于严格的等价关系来进行划分。
然而,在实际生产、生活和科学实践中,由于数据获取、数据保存技术等方面的限制,很多信息系统都会存在属性的缺省值,即遇到的绝大多数信息系统都是不完备的。
在文献(7)中作者为了能利用粗糙集来处理不完备的信息系统,提出以相容关系来分类,但遇到数据量比较大时,人为计算相容类耗时耗力,求属性约简更是耗时。
所以设计计算机算法来处理是十分关键的。
本文的安排如下:第一部分简要阐述不完备信息系统、完备信息系统及其约简集的相关概念;第二部分设计了计算不完备信息系统中相容类的算法;第三部分设计了计算不完备信息系统中属性约简集的算法;最后,给出了全文总结。
4结束语本文在相关定义和相容类的分类方法下,设計了处理不完备信息系统中分类和属性约简的计算机算法,极大地简化了计算量,在一定程度上能够有效地节省计算时间和研究者的精力。
本文只是在相容类情况下进行分类和属性约简算法的一个初步探索。
基于本文的结果,还可以深入研究分类和属性约简的算法,以进一步降低算法的时间复杂度。
信息量的不完备信息系统属性约简方法信息量的不完备信息系统属性约简方法不完备信息系统是指存在一些未知或不可知的属性的系统。
约简是在保留系统重要特征的前提下,去除一些冗余的特征以降低系统的复杂性。
在不完备信息系统中,属性约简是一种重要的方法。
下面介绍一种基于信息量的不完备信息系统属性约简方法。
信息量是指某一事件的不确定性程度,用信息熵来表示。
对于一个不完备信息系统来说,我们可以通过已知的属性信息和属性取值进行估算和推测,然后计算出每个未知属性的信息熵。
如果一个属性在已知属性的条件下其信息熵较小,那这个属性就有更大的概率是有用的属性。
用这种方法求解属性约简,可以使得约简结果更具有实际意义和解释性。
具体步骤如下:1. 将不完备信息系统分为两类:已知属性集和未知属性集。
其中已知属性集包含在一些实例中已知的属性,未知属性集包含在这些实例中未知或不可知的属性。
2. 对于每个未知属性,计算在已知属性的条件下的信息熵。
假设一个未知属性 Ai,对于系统中任意的实例 X,已知属性集为 K,未知属性集为 U,该未知属性的取值为 Vi,那么该未知属性在已知属性集 K 的条件下的信息熵为:H(Ai|K) = -∑ (P(X|K) * log2 P(X|K))其中,P(X|K) 是在已知属性集 K 的条件下,未知属性 Ai 的取值为 Vi 的概率,根据贝叶斯定理可得P(X|K) = P(V1|K) * P(V2|K) * … * P(Vn|K)V1, V2, …, Vn 分别为未知属性集 U 中的属性取值。
3. 对于每个未知属性,计算其信息增益。
信息增益表示该属性对系统的分类能力,加入该属性后能够使得不完备信息系统的熵减少的程度。
信息增益的计算公式为:Gain(Ai|K) = H(U|K) - H(Ai|K)其中,H(U|K) 是在已知属性集 K 的条件下未知属性集 U 的信息熵。
4. 对于所有未知属性,按照信息增益从大到小排序,选择信息增益最大的属性加入已知属性集 K。
不完备信息系统中基于限制容差关系的属性约简方法王超;罗可【摘要】决策表核属性的确定往往是信息约简的基础,然而以往的核属性约简方法大多是针对完备信息系统的.将完备信息系统中的属性核与属性序约简算法延伸至不完备系统,提出一种不完备信息系统中基于限制容差关系的属性约简方法.该方法通过构造限制容差关系下决策表的改进分辨矩阵来求得核属性,并将非核属性按直观影响分类质量的能力排序,能够保证得到的约简结果是相对最小约简.通过实验比较证明该方法可行、有效.%The confirmation of core attribute of a decision table is always the basis of information reduction. However, most of the previous reduction methods in core attribute are for complete information system. Extending the reduction algorithm in core attribute and attribute order to incomplete information system, which was used in complete information system, this paper presented an attribute reduction algorithm based on limited tolerance relation in incomplete information system. This method obtained core attribute by constructing an improved discemable matrix of decision table in incomplete information system, and sorted the attributes which did not belong to core attribute by ability of affecting classification quality intuitively. Thus, the reduction result was ensured to be a relatively minimized reduction. This method is proved to be feasible and more effective through comparison.【期刊名称】《计算机应用》【年(卷),期】2011(031)012【总页数】4页(P3236-3239)【关键词】不完备信息系统;属性约简;限制容差关系;核属性【作者】王超;罗可【作者单位】长沙理工大学计算机与通信工程学院,长沙 410114;长沙理工大学计算机与通信工程学院,长沙 410114【正文语种】中文【中图分类】TP18;TP311.130 引言属性约简一直是Rough集理论研究的核心内容之一[1-2]。
基于可调节多粒度粗糙集的不完备信息系统属性约简
在数据处理过程中,数据集有时是带噪声的或者是缺省的,因此需要能处理不精确,不确定型数据的理论和方法.粗糙集理论正是满足这种要求的数学工具.目前粗糙集理论被广泛地应用在粒计算,机器学习,人工智能和数据挖掘等领域.属性约简问题是粗糙集理论中最核心的内容之一,现有的信息系统的约简算法主要有基于属性重要度的属性约简算法;基于差别矩阵的属性约简算法;基于信息熵的属性约简算法.然而,随着计算机和数据采集技术的进步,数据的积累无论是在数据对象个数上还是在数据维度上都在迅速增长.由此而导致算法的复杂度会随着数据规模的增大而越来越高,因此研究更有效的属性约简方法具有一定的现实意义.本文的主要工作如下:基于全局的可调节多粒度粗糙集模型在属性约简中因计算复杂度过高而导致其应用性不强.本文以不完备信息系统的多粒度粗糙集模型为基础,给出了基于信息水平的局部可调节多粒度粗糙集模型,并进一步给出了下近似质量,属性内、外重要度的定义.最后,本文研究了基于不完备信息系统的多粒度粗糙集的局部属性约简和全局约简的区别和联系,并给出了相关的启发式算法.。
不完备信息系统的属性约简算法的开题报告一、选题背景信息系统是指事物进行解释和研究的任何对象或内容,它是现代计算机技术所应用的重点之一,通过对信息系统进行分析和规划,可以帮助人们更好的实现信息的有效管理和利用。
在信息系统的分析过程中,属性约简一般涉及到的是属性约简问题。
在信息系统中,属性数量可能是非常庞大的,而这些属性中很多都是冗余或者不必要的。
属性约简算法的作用就是通过选择最重要的属性,将系统中不必要和冗余的属性进行消除,从而降低算法的时间和空间复杂度,提高算法的准确性和可用性。
在很多实际问题中,由于缺乏足够的信息或者现有的信息不能完全描述系统本身的特点,因此导致信息系统不完备的情况,这时候需要使用不完备信息系统的属性约简算法来对系统进行优化。
二、选题意义随着现代社会的不断发展,信息化已经成为当今社会的主要发展趋势。
信息系统的优化和管理对于保持信息的可靠性和安全性起到了至关重要的作用,因此信息系统的属性约简算法有着广泛的应用领域,比如在分类和预测、数据挖掘和聚类等方面都有着重要的应用。
而对于不完备信息系统的属性约简算法的研究,在解决实际问题中有着很大的作用。
为了更好的实现信息的分析和规划,需要选择合适的属性约简算法,对信息系统进行优化和管理,从而提高信息系统的效率和准确性。
因此,对于不完备信息系统的属性约简算法的研究和开发,有着非常重要的意义。
三、研究方法本篇论文主要通过文献综述和实例分析两种方法来研究不完备信息系统的属性约简算法。
文献综述方法通过对相关文献的检索和归纳,来获取关于属性约简算法的知识和研究成果,从而对不完备信息系统的属性约简算法进行深入的研究和分析。
实例分析方法通过选择实际的数据集来进行分析和研究,通过自主编程实现不完备信息系统的属性约简算法,并对算法进行实验验证和对比分析,从而对算法的性能和效果进行评估和改进。
四、预期结果通过本次研究,可以预期达到以下的结果:1. 对不完备信息系统的属性约简算法进行深入研究,掌握其原理和特点,为信息系统的优化和管理提供理论支持。