粗糙集理论论文
- 格式:docx
- 大小:24.84 KB
- 文档页数:4
论文作者冲突域
1.冲突域和广播域是计算机网络中两个非常重要而又容易混淆的概念,正确掌握和应用这两个概念对计算机网络技术的理解和掌握非常关键.主要论述了计算机网络中冲突域和广播域的概念、两者的比较。
2.属性约简是粗糙集理论的核心内容之一。
目前,从不同的观点已经提出了一些不完备决策表中粗糙集属性约简算法。
但是,这些算法相对于完备决策表还是有待进一步考虑。
3.本文针对适用于DS-UWB通信系统的CT-MAC协议,结合具体的调制、多址方式,研究其最佳冲突域范围,并根据分析结果进行了Matlab仿真。
4.由于集中式交换结构面临当今网络端口速度不断提高和需要QoS保证的挑战,提出了基于冲突域的分布式并行流水交换结(DPPS),并给出了一种基于缓存队列的DPPS实现方案。
5.为了满足网络循环时间的要求(固定为512bit),不同配置的以太网的直径被限制在一定的范围内,使网络系统的覆盖范围受到很大的限制,要扩大网络系统的覆盖范围,必须使用网络互连设,求核是粗糙集理论中的重要研究之一。
近年来在不完备决策表中的求核算法相对较少。
通过对葛浩引入冲突域的概念进行研究,设计一种在不完备决策表中的新的求核算法。
6.近几年,随着医院发展规模的不断扩大,医院医护工作人员的上网需求与日俱增,新出现的网络问题也是层出不穷。
小的如个人主
机染上病毒,硬件故障;大的如局部网络瘫痪,或整个医院都不能上网。
7.针对决策系统存在冲突对象的情况,提出一个基于冲突域的权
重约简的启发式算法来降低属性约简的测试成本。
8.以不完备决策表为研究对象,通过对冲突域的概念进行研究,
给出在不完备决策表下的基于冲突域的属性约简的定义。
商务智能计算二进制差异矩阵
粗糙集理论是一种能有效地分析和处理不精确、不一致、不完整等各种不完备信息的数据分析工具。
知识约简是粗糙集理论的核心内容之一,是粗糙集应用的关键技术,也是知识发现的重要研究课题。
通过约简删除信息系统中的冗余信息,达到简化知识的目的。
本文围绕知识约简中的两个重要问题:属性约简和值约简,在一致和不一致决策表上分别提出了新的算法,并通过实验证明算法的有效性。
主要研究工作及创新点如下: (1)论文主要对粗糙集理论中的基于二进制区分矩阵约简算法进行研究,提出了一种新的二进制区分矩阵的构造方法,有效地减少了存储空间,加快了扫描速度。
在二进制区分矩阵上,总结归纳出一些相关的性质和定理,并对其进行了相应的证明。
算法只需对二进制区分矩阵进行简单的算术运算即可完成对决策表的约简操作; (2)给出了一种基于二进制区分矩阵的启发式属性约简算法,以属性重要度作为启发信息。
对于不一致决策表的属性约简,给出了一种快速、简便的计算负域的方法; (3)分析了值约简的过程及本质,提出了基于对象的二进制区分矩阵概念,并在此矩阵上进行值约简。
在值约简过程中定义了新的启发信息,以属性归纳性作为规则约简的度量标准;给出了一种新的规则准确度的简便计算方法和对重复或冗余规则的判定、处理办法。
根据规则的准确度和属性归纳性求得决策表的最简规则,有效地提高了约简的速度。
数学工作效率公式摘要:在敏捷制造的动态盟员选择中,如何选择高效率的企业组成动态联盟是一个基本而又关键的问题。
对企业效率进行评估可以应用计量经济学里的生产函数模型,一般的生产函数是以劳动力和资金两大项作为主要投入因素。
然而,实际上不同行业在特定条件下,企业效率评估的主要投入属性是各不相同的。
论文首先通过粗糙集的方法对企业的各投入因素进行属性约简,归约出对企业生产起主要影响作用的投入因素,再通过前沿生产函数来计算企业的效率值,从而挑选出相对效率最高的企业组成动态联盟。
论文对中国13家上市钢铁企业进行了实证分析,进一步说明该方法具有较强的实用性。
关键词:动态盟员;粗糙集;前沿生产函数;效率评估;钢铁企业以敏捷制造、虚拟企业、动态联盟等为代表的新一代制造业信息化建设已经成为当今制造企业研究和学习的热点[1]。
同时,用现代信息技术对传统制造业进行改造,也是现代制造企业发展的必然趋势。
在虚拟企业的组织结构中,运用科学的方法在众多候选企业中选择出高效率的优势企业组成动态联盟是起关键性作用的第一步[2]。
因此,如何通过有效方法对企业进行效率评估,是动态盟员选择中一个基本而又重要的问题。
生产效率反映了企业中各类经济因素对生产经营活动的影响程度,也综合体现了企业生产能力的大小和竞争实力的强弱[3]。
在动态盟员选择的过程中,盟主企业可以通过对候选企业的效率评估来进行动态联盟的组合。
企业的效率评估往往和两个因素有关,即企业的投入与产出,可是在一般情况下,企业的投入因素往往有多个,而产出则主要以产量值为主。
如果能正确选择出对企业效率产生影响的主要投入因素,并通过一个定量化方法正确分析投入与产出之间的关系,则可以对企业的效率进行更恰当的评估。
生产函数模型是二十世纪初由柯布-道格拉斯首先提出的,利用生产函数模型进行效率评估是传统的常用工具。
在此基础上,Farrell在1957年又进一步提出的前沿生产函数是反映在一定技术和生产要素组合的条件下,企业各投入因素与最优产出之间的函数关系。
收稿日期:!""#$"#$"%基金项目:教育部博士启动基金资助项目(!""""&#%!")・作者简介:王庆(&’(")),男,辽宁沈阳人,东北大学博士研究生,讲师;巴德纯(&’%#)),男,辽宁沈阳人,东北大学教授,博士生导师・第!*卷第&期!""%年&月东北大学学报(自然科学版)+,-./01,23,.4560746./8/9:6.794;(304-.01<=96/=6)>,1?!*,3,@&!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!+0/@!""%文章编号:&""%$A "!*(!""%)"&$""B "$"#智能故障诊断的粗糙决策模型王庆,巴德纯,王晓冬(东北大学机械工程与自动化学院,辽宁沈阳&&"""#)摘要:为了提高故障诊断的精度和降低误报率,提出了粗糙决策智能故障诊断模型・该模型可以对决策表进行无教师的规则提取;通过自学习,用较少的样本即可对故障进行分类・将复杂系统的原始样本集转化成了决策表,利用粗糙集具有较强的处理不确定和不完备信息的能力,对原始样本集的条件属性进行了约简处理;同时,利用决策树具有快速学习及分类的优势对约简后的决策表进行规则提取,提高了故障诊断的鲁棒性・给出了基于该模型的故障诊断步骤・以实例介绍了利用该模型进行故障诊断的全过程・关键词:粗糙集;约简;决策树;规则;故障诊断中图分类号:C D&B !;C D&B A文献标识码:E如何从不完备及冗余数据中准确提取征兆,以提高故障诊断的鲁棒性,是近年来故障诊断的研究热点[&]・同时建立高效的故障诊断器,以提高诊断的精度和速度也受到学者的广泛关注[!]・粗糙集理论[A ]作为一种处理不确定和不精确问题的工具广泛应用于数据挖掘和模式识别领域[#!B ],近年来也被用于智能故障诊断・在故障模式的识别中,粗糙集能在保证信息不丢失的前提下,对决策系统进行有效约简,去除多余信息,减轻故障分类器的压力;同时也能进行规则提取与规则约简・但其对规则的处理多基于知识库逻辑理论,效率不高;特别是它没有给出规则间的关系,得到的规则对故障状态的推理为产生式的推理,诊断速度不高・郝丽娜等[’]提出了基于粗糙集和神经元网络的故障诊断模型,利用粗糙集对决策表进行约简,同时发挥神经元网络并行计算的优点,对故障快速分类・但神经元网络学习速度慢是实时快速故障诊断的瓶颈,并且用神经元网络的故障分类结果不便于解释,往往要加入解释器・本文研究粗糙集与决策树融合的故障诊断方法・决策树[&",&&]具有对无次序的实例进行快速分类并记忆的能力,其产生的规则是树状结构,规则间关系清晰,使得推理的结果便于解释;利用粗糙集对决策表进行离散化及约简,并用决策树提取规则产生故障分类器,达到了对故障进行快速诊断的目的,并以实例验证了该模型的有效性・&理论基础定义!!F 〈",#,$,%〉为信息系统,其中"F {&&,&!,…,&’}为全体样本集(论域)・#F (")为全部属性集,(为条件属性集,)为决策属性集,(#)F !・$为全部属性的值域,设*是任一属性,&+是任一个对象,则%(&+,*)表示&+在*属性的取值・定义"设任一属性子集,$#,-(,)F {(&+,&.)%"!&’*%,,%(&+,*)F %(&.,*)},二元关系-(,)称为不可分辨关系・属性子集,将全部样本"划分成若干等价类,称为,基本元素・,基本元素中的任意两个对象&,/关于,是不可区分的,称&,/在属性集合,上不可分辨・决策表可以看作是"的一族等价关系,即知识库・定义#,$#,0$";,0F "{1%"/23)(,):1$0};,0F ";{1%"/23)(,):1#0(!}分别称为下近似和上近似・定义$"((,))为近似质量・如果(4是(去掉某些条件属性后的条件属性集合,并能保持近似质量不变,即:"((4,))F "((,))则(4为(的一个)约简,其中"((,))5)0%"/)6(066"6・万方数据定义!令!"#($)为$所有约简的集合,%&!"($)!!!"#($)为$的属性约简的核・!!(%’())")为信息系统*的分明矩阵,%’(!{+"%#+(,’)$+(,()},’,(!#,$,…,);-(%)!!{%.’(:#&(&’&);.’($%}为分明函数・定义"设/!(0#,0$,…,0’,…,01)为信源发出的信息;2!(3#,3$,…,3’,…,34)为信宿收到的信息・5(0’)为0’发生的概率;5(3(/0’)为收到3(后判定为0’的概率・6(/)78’5(0’)&’($5(0’)为信息/所能提供的信息量(熵)・6/()27’(5(3()’’50’3()(&’($50’3()(为信宿收到全部信息2后对信源发出的信息/的不确信性・定义#收到2后获得关于/的信息量为9!6(:))6(:/;),为平均互信息量或熵降量,它表示2能提供的关于/的信息量的大小・$基于粗糙决策模型故障诊断步骤故障诊断中的条件属性多为连续值,为了对其进行约简和规则提取要对其进行离散化处理・即在连续的属性域上寻找若干个断点,用断点将连续的属性值划分为离散的区间・最后用离散的决策表代替了原来的连续的决策表・然后根据定义求取决策表分明矩阵,根据分明矩阵求取其分明函数,并将分明函数化简成若干合取的析取式形式,则析取式中每个合取对应一个条件属性约简的结果・所谓规则的提取就是从约简决策表中得到推理规则集,该规则集是用来对一个新对象(新设备状态)进行分类的故障诊断器・本文采用决策树*+,算法对约简表进行规则提取・*+,算法是利用信息论中的信息熵降作为评判函数・它在决策表(属性集)上寻找一个最佳的分类条件属性,该属性作为决策树的一个分支节点(该节点上条件属性的熵降最大)・然后再根据该节点上条件属性的值进行分支,选取其中一个分支再根据最大熵降从其他条件属性中搜索最佳属性作为下一级的新节点,直到形成一个完整的决策树・该决策树即为故障诊断的规则集・该规则集作为故障分类器对故障进行诊断・最后给定一个测试集,用上述粗糙决策故障诊断模型对测试集中的各个对象进行分类,得到每一个对象对应的设备状态・,基于粗糙决策模型故障诊断算例以上海宝钢-./012设备为对象,对其进行了状态量的获取,分别提取了各种过程量(如水蒸气、冷凝水及各种压力)的原始数据信息・并建立如下信息系统,*!(/,$%#),/为对象集,即-./012设备状态集;$!{+#,+$,…,+#3}代表条件属性,即代表-./012各个参量域集・其中,+’,’!#,$,…,#4分别代表系统真空度<%,一级泵入口压力<#,二级泵入口压力<$,三级泵入口压力<,,四级泵入口压力<4,水池压力<3,系统入口温度=%,冷凝器#回水温度=#,冷凝器$回水温度=$,水蒸气流量4(,冷凝水流量45,水蒸气温度=(,冷凝水温度=5,水蒸气压力<(,冷凝水压力<5・#!{>}为决策属性,>!’,’!#,$,…,#$分别代表设备的状态(水蒸气压力、流量太低;四级泵故障;冷凝器$回水温度太高;冷凝水温度太高;冷凝水压力、流量太低;水蒸气温度过高;水蒸气压力、流量太低;三级泵抽气故障;冷凝器#回水温度过高;冷凝器#故障;一级泵故障;系统状态正常)・对决策表进行离散化处理,并用符号代表离散决策表中各个条件属性的分段值(自然数#,%,$分别代表偏大,中间,偏低的分段),得离散化的决策表并用矩阵"表示,阵中’!#,$,…,#4代表对象集;(!#表示为对象域,(!$,,,…,#6表示条件属性;(!#7表示决策属性・根据离散化的决策表首先求取决策表的分明矩阵并根据分明函数-的定义对分明矩阵进行约简计算,即计算分明函数-的最小析取范式・其中,每一个析取分量对应一个约简・从中任选一个约简,该约简对应的决策表用矩阵"(表示・"7#%%%%#%%%%$%%%$%#$%%%%#%%%%%%%%%%$,%%%#%%%%#%%%%%%,4%%%#%%%%%%%%#%%43%%%#%%%%%%$%%%$36%%%#%%%%%%%$%%%67%%%#%%%%%$%%%$%78%%%#%%%%%%%%%%%89%%#%%%%#%%%%%%%9#%%%#%%%%%%%%%%%%#%####%%%%%%%%%$%%%6#$##%%%%%%%%%%%%%###,##%%%%%%%$%%%$%#)*+,#4%%%%%%%%%%%%%%%#$#8第#期王庆等:智能故障诊断的粗糙决策模型万方数据!!!!"""!""""""!#"""!""#"""#$""!""!""""$%""!""""""!%&""!""""#""&’""!"""""#"’(""!"""#"""()""!""""""")*"!""!"""""*!""!""""""""!"!!!"""""""#"’!#!"""""""""!!!$!"""""#"""!"#$%!%""""""""""!#由矩阵!和!!可见经过了属性的约简,去除了信息系统的多余属性,使决策表得到了简化・用属性"","#,"$,"%,#!,##,$+,$,,#+,#,所包含的信息可完全代表原来决策表中的信息,达到了约简的目的・约简!!对应的决策表中有!#种不同的决策属性,即有!#种故障类型,其中有!%个样本・根据决策树-.$算法,首先计算决策表的初始熵:%(&)!’#!%/0+##!%’#!%/0+##!%’!"!%/0+#!"!%!$(&#・计算属性""的条件熵:%(&/"")!$!%’$$/0+#()!$)!!!%’!!!!/0+#!()!!!$("&((・同理计算其他属性的条件熵・经计算得知"$的条件熵最小说明其熵降最大,所以选择"$为第一级结点・"$有两个分支,"$1"和"$1!・分别以这两个分支为起点计算・以"$1"分支计算其对应的初始熵和条件熵・经计算得知"#和$+的条件熵最小说明其熵降最大,所以任选"$为第二级结点・"#有两个分支,"#1"和"#1!・分别再以这两个分支为起点计算・"#1!分支计算得#!为其下级结点,同理计算#!的两个分支的初始熵为"说明它不能再分,都为最终接点(叶接点),分别对应于故障*和故障!"・以次类推・逐步计算各级结点和叶结点,最后得到决策树如图!所示・从图!可见利用决策树-.$算法形成了以下!$条规则:"$1!&##1"’*1$;"$1!&##1!&#+1#’*1’;"$1!&##1!&#+1"&$,1#’*1&;"$1!&##1!&#+1"&$,1"&#,1!’*1%;"$1!&##1!&#+1"&$,1"&#,1"&$+1"’*1’;"$1!&##1!&#+1"&$,1"&#,1"&$+1"’*1(;"$1"&"#1!&#!1"’*1!";"$1"&"#1!&#!1!’*1*;"$1"&"#1"&$+1#’*1!;"$1"&"#1"&$+1"&""1!&#+1"’*1!!;"$1"&"#1"&$+1"&""1!&#+1#’*1’;"$1"&"#1"&$+1"&""1"&"%1"’*1!#;"$1"&"#1"&$+1"&""1"&"%1!’*1#・图!"#$%&’决策树图()*+!,-.)/)0123--04"#$%&’234567粗糙决策故障诊断的故障分类器(诊断器)就由上述!$条规则组成・由!!可见,*1)对应的条件属性集包含于*1$,*1%,*1&,*1’,*1(的条件属性集,所以上述规则中没有对故障类型*1)进行推理,即由决策树-.$算法自动形成的决策树中不包含故障类型*1)的叶结点・看来决策树-.$算法也能够对一些特例进行排除,说明具有规则的过滤能力・给定包含!$对象的测试集",应用该模型对其诊断,结果见表!・"!!""""!""""#"""#"#""!""""""""""""$!!"""""""""#"""%"""!""""""""!""&!!"""""""""""""’"""!""""""#"""#("""!"""""""#""")"""""""""#"""#"*"""""""""""""""!"""""!""""""""""!!"""!""""!""""""!#!!"""""""#"""#""#$%!$""!""""!"""""""・#)东北大学学报(自然科学版)第#’卷万方数据表!故障诊断结果"#$%&!’&()%*+,,#)%*-.#/0+(.(样本对象诊断结果!!"!#$%&&’!!%’(%样本对象诊断结果)(*!"!#"!!$!"!!$*与训练集比较表明,上述分类结果完全正确,这说明该粗糙决策故障诊断模型能够对+,-./0的故障进行正确的诊断・&结论复杂系统故障诊断中,数据样本集中有大量重复样本和冗余属性,甚至干扰信息;粗糙集能够对包含干扰和冗余信息的决策表进行约简处理并提取征兆,表现出较强的鲁棒性・决策树可以对决策表进行快速无教师的规则提取,得到树状规则集,诊断时它用较少的属性即可对故障进行分类,适用于快速故障分类・因此基于粗糙集和决策树理论相融合的故障诊断技术对复杂系统的快速鲁棒故障诊断具有现实意义・参考文献:[!]1234,/5678,,9:14;75:<=>25?@A B 2B :B 2@?C A :?D BE =B =D E A C 6[F ];!"#$%&’()*+,+-%)&(.,"###,&$($):%!G (";["]陶志,许宝栋,汪定伟・基于决策属性支持度的知识约简方法[F ]・东北大学学报(自然科学版),"##","$(!!):!#"’G !#")・(/5A H ,3:0I ,J 5@?I J;.@A K <E >?EC E >:L =2A @5M M C A 5L DN 5B E >A @>E L 2B 2A @5==C 2N :=EB :M M A C =>E ?C E E [F ];/"%(+01"23"(&4’0)&’(+5+*6’()*&.(30&%(0178*’+8’),"##","$(!!):!#"’G !#");)[$]O 5K <5P H ;+A :?D B E =B [F ];,+&’(+0&*"+01/"%(+01"2!"#$%&’(0+-,+2"(#0&*"+78*’+8’),!*)",!!(’):$&!G $’%;[&]F E <A @E PF ;+A :?DB E =BC E >:L =2A @A Q5==C 2N :=E B5@>=D E 2C >A R 52@B Q A C @E :C 5<@E =K A C P B [F ];!"#$%&*"+01,+&’11*9’+8’,!**’,!!("):$$*G $&(;[’]黎明,张化光・基于粗糙集的神经网络建模方法研究[F ]・自动化学报,"##",")(!):"(G $$・(12S ,H D 5@?,T ;+E B E 5C L DA @=D E R E =D A >A Q@E :C 5<@E =K A C PR A >E <2@?N 5B E >A @C A :?DB E =B=D E A C 6[F ];:8&0:%&"#0&*807*+*80,"##",")(!):"(G $$;)[%]O 5K <5PH ;+A :?D B E =5M M C A 5L D =AP @A K <E >?E -N 5B E >>E L 2B 2A @B :M M A C =[F ];;%("$’0+/"%(+01"2<$’(0&*"+01=’)’0(84,!**(,**(%):&)G ’(;[(]U D 2E @UU ;V C A :?D B E =5M M C A 5L D =A 5==C 2N :=E ?E @E C 5<2W 5=2A @2@>5=5R 2@2@?[F ];/"%(+01"2,+2"(#0&*"+78*’+8’),!**),!#((&):!%*G !(%;[)].C 6B W P 2E K 2L W S;+A :?D B E =5M M C A 5L D =A 2@L A R M<E =E 2@Q A C R 5=2A @B 6B =E R B [F ];,+2"(#0&*"+78*’+8’),!**),!!"("):$*G &*;[*]郝丽娜,王伟,吴光宇,等・粗糙集-神经网络故障诊断方法研究[F ]・东北大学学报(自然科学版),"##$,"&($):"’"G "’’・(,5A 1X ,J 5@?J ,J :TY ,’&01;+E B E 5C L D A @C A :?D BE =-@E :C 5<@E =K A C P Q 5:<=>25?@A B 2B R E =D A >[F ];/"%(+01"23"(&4’0)&’(+5+*6’()*&.(30&%(0178*’+8’),"##$,"&($):"’"G "’’;)[!#]9:2@<5@F +;Z @>:L =2A @A Q>E L 2B 2A @=C E E B [F ];>084*+’?’0(+*+9,!*)%,!(!):)!G !#%;[!!]9:2@<5@F+;42R M <2Q 62@?>E L 2B 2A @=C E E B [F ];,+&’(+0&*"+01/"%(+01"2>0+@>084*+’7&%-*’),!*)(,"((!):""!G "$&;Z @=E <<2?E @=75:<=I 25?@A B 2B S A >E <05B E >A @+A :?D4E =B5@>I E L 2B 2A @/C E E/D E A C 6A :3BC *+9,D :E ’@84%+,A :3BF *0"@-"+9(4L D A A <A Q S E L D 5@2L 5<8@?2@E E C 2@?[V :=A R 5=2A @,X A C =D E 5B =EC @\@2]E C B 2=6,4DE @65@?!!###&,U D 2@5;U A C C E B MA @>E @=:J V X T92@?,8-R 52<:K 5@?^2@?@E :!B A D :;L A R )!"#$%&’$:+A :?D B E =B 5@>>E L 2B 2A @=C E E =DE A C 65C E 2@=C A >:L E >2@L A R M <2L 5=E >2@=E <<2?E @=Q 5:<=>25?@A B 2B B 6B =E R (U Z 7I 4);VC A :?D ->E L 2B 2A @Q 5:<=>25?@A B 2BR A >E <2B =D :B >E ]E <A M E >=A E @B :C E >25?@A B 2B M C E L 2B 2A @5@>B M E E >:M =D E 2R M <E R E @=5=2A @A Q U Z 7I 4;/D ER A >E <L 5@E _=C 5L =C :<E B >2C E L =<6Q C A RC E >:L E >>E L 2B 2A @=5N <E ;+A :?D B E =B =D E A C 65B 5@E KR 5=D E R 5=2L 5<=A A <2B :B E >=A >E 5<K 2=D 2@E _5L =5@>:@L E C =52@P @A K <E >?E Q A C M 5==E C @C E L A ?@2=2A @;/D E =5C ?E =2BR 52@<6=A C E R A ]E C E >:@>5@=2@Q A C R 5=2A @5@>B E E P Q A C C E >:L E >>E L 2B 2A @=5N <E B ;V B 5^:2L P <6<E 5C @2@?=D E A C 65@>L <5B B 2Q 2L 5=2A @=A A <,>E L 2B 2A @=C E E 2B :B E >=A E _=C 5L =C :<E B >2C E L =<6Q C A R C E >:L E >>E L 2B 2A @=5N <E B A5B =A5L ^:2C E B 5=2B Q 5L =A C 6C E B :<=;V @E _5R M <E 2B ?2]E @=AB D A K D A K=A5M M <6=D E 2@=E <<2?E @=Q 5:<=>25?@A B 2B =A +,-./0]5L ::R R E =5<<:C ?2L 5<B 6B =E R ;/D EE Q Q E L =2]E @E B BA Q=D E5<?A C 2=D R2B=D E C E Q A C E M C A ]E >=D C A :?D=D E E _E R M<2Q 2L 5=2A @;()*+,%-#:C A :?D B E =B ;C E >:L =2A @;>E L 2B 2A @=C E E ;C :<E ;Q 5:<=>25?@A B 2B (=’8’*6’-:$(*1’,"##&)$)第!期王庆等:智能故障诊断的粗糙决策模型万方数据。
The boss is like a tiger, the tiger's butt cannot be touched, and the tiger's butt is not suitable for shooting.勤学乐施积极进取(页眉可删)C语言论文开题报告一、选题目的和意义选题的目的:粗糙集理论自从提出后20多年来,逐渐成为数据挖掘领域的研究热点之一,基于粗糙集理论的属性约简算法具有重要的研究意义。
目前,属性约简已有多种算法,各种算法也有其不同的优、缺点。
求属性约简集,通常是从求核属性开始的。
目前提出的各种算法当中,使用具体程序实现比较少,而__实现了粗糙集理论中的求核和属性约简算法。
另外,人们可能认为粗糙集仅仅是理论方面的研究,但实际上,粗糙集理论在现实生活中的应用是非常广泛的,不论是医疗、气象学方面,还是电信业、金融业等方面都有所应用。
选题的意义:__使用C语言程序实现求属性核算法和基于分明矩阵的属性约简算法,通过程序可以清楚地表达算法的各个步骤和算法的具体实现过程。
而__中又结合了实际生活中的两个实例,分别是在房地产信息决策系统医疗诊断系统方面,说明粗糙集理论并不只是空洞的理论,而在实际当中有着广泛的应用,和人们日常的生产、生活和学习是息息相关的。
二、本选题在国内外的研究现状和发展趋势国内外的研究现状:粗糙集理论是1982年由波兰数学家Z.Pawlak提出的,当时没有引起国际计算机学界和数学界的重视,研究仅限于东欧的一些国家,直到20世纪80年代末才逐渐引起各国学者的注意。
1991年,Z.Pawlak发表了专著《Rough Set: Theoretical Aspects of Reasoning about Data》,奠定了粗糙集理论的基础,从而掀起了粗糙集的研究热潮。
后来,1996年在日本举行的国际粗糙集研讨会以及年在重庆举行中国粗糙集研讨会推动了亚洲地区和我国对粗糙集理论与应用的研究。
数学系07级信息与计算科学专业毕业论文题目汇编序号选题内容备注1 问题:泰勒公式在高等数学中的应用研究供题教师:甘小艇问题的背景介绍及研究的主要方法:泰勒定理开创了有限差分理论,使任何单变量函数都可展成幂级数。
而在高等数学中,泰勒公式是一个非常重要的内容,它将很多复杂的函数近似的表达为简单的多项式函数,这种化繁为简的功能,使它成为了研究和分析众多数学问题的桥梁纽带。
对此问题你感兴趣的话,不妨试一试,许多重要发现会在其中。
2 问题:高阶矩阵的特征值及其应用研究供题教师:甘小艇问题的背景介绍及研究的主要方法:物理、力学和工程技术中的很多问题在数学上都归结为求矩阵的特征值和特征向量问题。
通常情况下,对于阶数较大的矩阵来说,常规求解矩阵特征值是十分困难,甚至是不切实际的。
我们知道,如果矩阵A与B相似,则A与B有相同的特征值。
因此,人们就希望在相似变换下,把A化为最简单的形式.一般矩阵的最简单的形式是约当标准形.由于在一般情况下,用相似变换把矩阵A化为约当标准形是很困难的,于是人们就设法对矩阵A依次进行相似变换,使其逐步趋向于一个约当标准形,从而求出A的特征值。
其中方法有:矩阵特征值和特征向量的幂法,反幂法;求实对称矩阵全部特征值和特征向量的雅可比方法;求特征值的多项式方法;求任意矩阵全部特征值的QR 方法。
3 问题:矩阵的广义逆的求法及应用研究供题教师:甘小艇问题的背景介绍及研究的主要方法:广义逆的思想可追溯到1903年(E.)I。
弗雷德霍姆的工作,他讨论了关于积分算子的一种广义逆(他称之为伪逆)。
1904年,D。
希尔伯特在广义格林函数的讨论中,含蓄地提出了微分算子的广义逆。
而任意矩阵的广义逆定义最早是由E。
H。
穆尔在1920年提出的,他以抽象的形式发表在美国数学会会刊上。
当时人们对此似乎很少注意.这一概念在以后30年中没有多大发展.曾远荣在1933年,F。
J。
默里和J。
冯·诺伊曼在1936年对希尔伯特空间中线性算子的广义逆作过讨论。
答辩中提出的主要问题及回答的简要情况1、粗糙集为何具有较高容错性一般配电网有哪些情况出现信息畸变?答:粗糙集是一种有效的处理不精确、不一致、不完整等各种不完备数据的方法。
粗糙集可以通过属性约简的方法把信息当中产生畸变和误判的信息给处理掉。
所以保证了诊断结果的准确性。
具有较高的容错性。
配电网出现信息畸变主要是在信息的传输过程中。
也就是通过实时监控系统(SCADA)在向电网控制中心这一过程中出现的。
2、数据挖掘技术别人用过没有?答:从目前可供参考的文献来看。
数据挖掘技术应用于配电网故障诊断的比较少。
该方法在其他故障诊断中用的比较多。
如高压输电线路的故障诊断、蒸汽机故障诊断和变压器故障诊断等。
3、论文中的三种方法是相互验证吗?答:在论文中。
采用了�1�7�1�7据挖掘技术中三种常用的方法:粗糙集、神经网络、决策树。
论文中的三种方法不是相互验证。
主要是在三种方法采用的配电网的实例是不相同的。
所以无法比较和相互验证。
只是尝试把这三种方法应用于配电网中。
看能否得出比较理想的诊断结果。
4、图5-3结构图中给出的故障特征。
能否准确的给出区域故障比如图5-3中的区域S ec2出现故障。
若CB8不跳时。
是不是还能判断出Sec2故障?答:是可以的。
因为当某处线路故障时。
在条件允许情况下。
断路器会动作。
如果短路器拒动。
故障处附近的过流保护和后备保护就会动作。
从而保证故障区域不往外延伸。
有效控制故障范围。
例如在图5-3中。
当母线Bus2发生故障时。
母线保护BR2就会动作。
如果BR2拒动。
母线Bus2附近的断路器就会动作。
如果上述都不动作。
过流保护和后备距离保护动作。
从而保证故障�1�7�1�7域不延伸。
有效地控制了故障范围。
分类号:____________ 密 级:______________ UDC:____________ 单位代码: 10142硕士学位论文 论文题目:04步战车综合传动装置故障诊断专家系统的研究学 号:_________________________ 作 者:_________________________ 学 科 名 称:_________________________ 2014年 02月 17日姜双双 公开 控制理论与控制工程 TP182 04步战车综合传动装置故障诊断专家系统的研究姜双双沈阳工业大学2011416沈阳工业大学硕士学位论文论文题目:作者:_________________________指 导 教 师: 单位:协助指导教师: 单位:论文提交日期:2014年 02月 17日学位授予单位:沈 阳 工 业 大 学李英顺 教授 沈阳工业大学 沈阳工业大学 04步战车综合传动装置故障诊断专家系统的研究 姜双双 王艳红 教授A Master’s Thesis in Control Theory and Control Engineering STUDY ON FAULT DIAGNOSIS EXPERT SYSTEM FOR SYNTHETIC TRANSMISSION DEVICE OF CATERPILLAR INFANTRY CHARIOTSBy Jiang ShuangshuangSupervisor:Professor Li YingshunSchool of Information Science and EngineeringShenyang University of TechnologyFebruary 17, 2014摘要CH400综合传动装置功能全面、整体技术水平先进,能够明显提高装甲车的机动性能,它与现有装备的机械传动相比综合技术先进、结构复杂,故障机理更加复杂、维修难度大,现有检测手段对其维修要求已不再适用。
基于粗糙集和灰色理论的决策树算法研究的开题报告一、选题背景近年来,信息时代随着互联网的高速发展,数据量呈爆炸式增长,数据挖掘技术成为了热点话题之一。
数据挖掘技术是从大量数据中自动发现非显而易见的模式、知识和信息的一种方法,它主要包括聚类、分类和预测等功能。
其中,分类算法是数据挖掘中最为重要的一种技术,其核心算法之一就是决策树。
决策树算法是一种有效的分类算法,其基本思想是通过选择最优的属性对数据进行划分,从而构建一个树形结构的决策模型。
目前,关于决策树的研究主要包括三个方面:一是改进算法本身,如采用剪枝技术、改进属性选择度量方法等;二是融入其他算法来改进决策树,在常用的决策树算法的基础上,融入数据挖掘领域其他算法,如粗糙集、灰色理论等;三是将决策树应用于实际问题,如医学、金融、环保等领域,从而实现对这些领域的深度挖掘。
二、选题意义当前,随着数据量的不断增长和应用领域的不断拓展,决策树算法在数据挖掘、机器学习等领域的应用越来越广泛。
在实际应用中,决策树算法具有解决复杂分类问题、推理能力强、易于理解和解释等优点。
同时,粗糙集和灰色理论也是目前数据挖掘领域中常用的方法,其与决策树的结合可以更好地发挥数据挖掘的优势,提高决策树算法的效率和精度。
通过研究基于粗糙集和灰色理论的决策树算法,可以更深入地探究决策树算法的内在规律和实现机制,从而在实际应用中更有效地运用决策树算法解决各种分类问题。
三、研究内容本文将基于粗糙集和灰色理论的决策树算法作为研究对象,重点研究以下内容:1. 粗糙集理论和灰色理论的原理及应用;2. 常见决策树算法的原理、优缺点及改进;3. 基于粗糙集和灰色理论的决策树算法的设计和实现;4. 算法性能的实验验证及分析。
四、研究方法本文将主要采用以下研究方法:1. 文献综述法:对现有的相关文献和研究成果进行系统的搜集和综述,了解决策树算法和粗糙集/灰色理论的相关背景知识和最新研究进展;2. 算法设计法:在对现有算法进行了解和分析的基础上,对基于粗糙集和灰色理论的决策树算法进行设计和完善,包括算法的整体结构设计、关键步骤的实现、参数选取等;3. 实验验证法:进行算法性能分析和实验验证,通过对数据集的分析和比较来验证算法的可行性和优越性。
粗糙集理论浅析 粗糙集理论,是继概率论、模糊集、证据理论之后的又一个处理不确定性的数学工具。作为一种较新的软计算方法,粗糙集近年来越来越受到重视,其有效性已在许多科学与工程领域的成功应用中得到证实,是当前国际上人工智能理论及其应用领域中的研究热点之一。在很多实际系统中均不同程度地存在着不确定性因素,采集到的数据常常包含着噪声,不精确甚至不完整 。
一、 引言 粗糙集作为一种处理不精确、不确定与不完全数据的新的数学理论, 最初是由波兰数学家Z. Paw lak于1982年提出的。由于最初关于粗糙集理论的研究大部分是用波兰语发表的, 因此当时没有引起国际计算机学界和数学界的重视, 研究地域也仅局限在东欧一些国家, 直到20世纪80年代末才逐渐引起各国学者的注意。近几年来, 由于它在机器学习与知识发现、数据挖掘、决策支持与分析等方面的广泛应用, 研究逐渐趋热。1992年, 第一届关于粗糙集理论国际学术会议在波兰召开。1995年,A CM Com 2m unication 将其列为新浮现的计算机科学的研究课题。1998年, 国际信息科学杂志( Infor2m ation Sciences) 还为粗糙集理论的研究出了一期专辑。 粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分, 每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画。该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确 定或不精确问题的理论有很强的互补性。
二、 基本概念 粗糙集是一种较有前途的处理不确定性的方法,相信今后将会在更多的领域中得到应用. 但是,粗糙集理论还处在继续发展之中,正如粗糙集理论的创立人Z. Paw lak 所指出的那样,尚有一些理论上的问题需要解决,诸如用于不精确推理的粗糙逻辑(Rough logic) 方法,粗糙集理论与非标准分析(Nonstandard analysis) 和非参数化统计(Nonparametric statistics)等之间的关系等等. 将粗糙集与其它软计算方法(如模糊集,人工神经网络,遗传算法等) 相综合,发挥出各自的优点,可望设计出具有较高的机器智商(M IQ) 的混合智能系统(Hybrid Intelligent System),这是一个值得努力的方向。
三、 粗糙集理论中的知识表示 “知识”这个概念在不同的范畴内有多种不同的含义。在粗糙集理论中,“知识”被认为是一种分类能力。人们的行为是基于分辨现实的或抽象的对象的能力,如在远古时代,人们为了生存必须能分辨出什么可以食用,什么不可以食用;医生给病人诊断,必须辨别出患者得的是哪一种病。这些根据事物的特征差别将其分门别类的能力均可以看作是某种“知识”。
四、 不可分辨关系与基本集 分类过程中,相差不大的个体被归于同一类,它们的关系就是不可分辨关系(indiscernibility relation). 假定只用两种黑白颜色把空间中的物体分割两类,{黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的,因为描述它们特征属性的信息相同,都是黑色. 如果再引入方,圆的属性,又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时,如果两个同为黑色方物体,则它们还是不可分辨的. 不可分辨关系是一种等效关系(equivalence relationship),两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系. 基本集(elementary set) 定义为由论域中相互间不可分辨的对象组成的集合,是组成论域知识的颗粒. 不可分辨关系这一概念在粗糙集理论中十分重要,它深刻地揭示出知识的颗粒状结构,是定义其它概念的基础. 知识可认为是一族 等效关系,它将论域分割成一系列的等效类.
五、 粗糙集的计算方法 软计算(sof t compu t ing) 的概念是由模糊集创始人Zadeh[ 9 ]提出的. 软计算中的主要工具包括粗糙集,模糊逻辑(FL),神经网络(NN),概率推理(PR),信度网络(Belief Networks),遗 传算法(GA) 与其它进化优化算法,混沌(Chaos) 理论等. 传统的计算方法即所谓的硬计算(hard computing),使用精确,固定和不变的算法来表达和解决问题. 而软计算的指导原则是利用所允许的不精确性,不确定性和部分真实性以得到易于处理,鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.。
六、 粗糙集理论的特点 粗糙集方法的简单实用性是令人惊奇的,它能在创立后的不长时间内得到迅速应用是因为具有以下特点: (1) 它能处理各种数据,包括不完整(incomplete) 的数据以及拥有众多变量的数据; (2) 它能处理数据的不精确性和模棱两可(ambiguity),包括确定性和非确定性的情况; (3) 它能求得知识的最小表达(reduct) 和知识的各种不同颗(granularity) 层次; (4) 它能从数据中揭示出概念简单,易于操作的模式(pattern) ; (5) 它能产生精确而又易于检查和证实的规则,特别适于智能控制中规则的自动生成. 七、 粗糙集理论的应用 RS理论的生命力在于它具有较强的实用性,从诞生到现在虽然只有十几年的时 间,但已经在许多领域取得了令人鼓舞的成果. 1)股票数据分析.应用RS方法分析了十年间股票的历史数据,研究了股票 价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证券交易专家的认可. 2)模式识别.应用RS方法研究了手写字符识别问题,提取出了特征属性. 3)地震预报.研究了地震前的地质和气象数据与里氏地震级别的依赖关系. 4)冲突分析.应用RS方法建立了反映以色列、巴勒斯坦、约旦、埃及、叙 利亚和沙特阿拉伯等六国关于中东和平问题各自立场的谈判模型. 5)医疗诊断.RS方法根据以往的病例归纳出诊断规则,用来指导新的病例.现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%. 6)专家系统(ES).RS抽取规则的特点,为构造ES知识库提供了一条崭新的途径 7)人工神经元网络(ANN).训练时间过于漫长的固有缺点是制约ANN实用化的因素 之一.应用RS化简神经网络训练样本数据集,在保留重要信息的前提下消除了 多余的数据,使训练速度提高了4.77倍,获得了较好的效果.将RS与ANN结 合起来,充分利用RS处理不确定性的特长以增强ANN的信息处理能力. 8)决策分析. RS的决策规则是在分析以往经验数据的基础上得到的.RS允许 决策对象中存在一些不太明确、不太完整的属性,弥补了常规决策方法的不足.希腊工业发展银行ETEVA应用RS理论协助制订信贷政策,是RS多准测决策方法的一个成功范例. 9)从数据库中挖掘信息 现代社会中,随着信息产业的迅速发展,大量来自金融,医疗,科研等不同领域的信息被存储在数据库中. 这些浩如烟海的数据间隐含着许多有价值的但鲜为人知的相关性,例如股票的价格和一些经济指数有什么关系; 手术前病人的病理指标可能与手术是否成功存在某种联系; 满足何种条件的夜空会出现彗星等天文现象等等. 由于数据库的庞大,人工处理这些数据几乎是不可能的,于是出现了一个新的研究方向—数据库中的知识发现(Knowledge Discovery in Databases,KDD),也叫做数据库(信息) 发掘(Mining),它是目前国际上人工智能领域中研究较为活跃的分支. 粗糙集是其中的一种重要的研究方法,它采用的信息表与关系数据库中的关系数据模型很相似,这样就便于将基于粗糙集的算法嵌入数据库管理系统中. 粗糙集引入核(core),化简(reduct) 等有力的概念与方法,从数据中导出用IF THEN 规则形式描述的知识,这些精练的知识更便于存储和使用.美国医学工作者应用粗糙集理论对大量的病历进行分析,发现黑人妇女患乳腺癌后的死亡率比白人妇女高. 到目前为止,早产的预测在医学上还是比较困难的. 现有的人工预测方法准确率只有17à - 58à,而应用粗糙集理论则可将准确率提高到68à - 90à. 八、参考文献 张琦,韩祯祥,文福拴.一种基于粗糙集方法的电力系统故障诊断/警报处理的新 方法.中国电力,1998,31(4):32-38 王珏,苗夺谦,周育键.关于Rough Set理论与应用的综述.模式识别与人工智能,1996,9(4):337-344 曾黄麟.粗集理论及其应用.重庆:重庆大学出版社,1998 Ewa Orlowska(ed.).Incomplete information-rough set analysis.New York:PhysicaVerlag,1998 苗夺谦, 王珏. 粗糙集理论中知识粗糙性与信息熵关系的讨论[J ]. 模式识别与人工智能, 1998,11: 34- 40. 苗夺谦, 王珏. 粗糙集理论中概念与运算的信息表示[J ]. 软件学报, 1999, 10: 113- 116. 李莉. 基于可变精度粗集模型的增量式归纳学习[J ]. 计算机科学, 1999, 26: 55- 58. 张文修, 梁怡. 不确定推理原理[M ]. 西安交通大学出版社, 1996. 施恩伟. 粗糙集中不可分辨关系的某些性质[J ]. 科学通报(英文辑), 1990, 35: 338- 341. 张文修, 吴志伟. 基于随机集的粗糙集模型(É )[J ]1西安交通大学学报, 2000, 34(12): 15—191