【文献综述】决策粗糙集均值模型
- 格式:pdf
- 大小:459.69 KB
- 文档页数:6
Ξ 收稿日期:2006-03-10作者简介:姚红霞(1979-),女,硕士研究生,主要从事粗糙集理论和模糊集理论研究.【数理科学】模糊粗糙集理论介绍和研究综述Ξ姚红霞(西北师范大学数学与信息科学学院,兰州 730070)摘要:回顾了粗糙集理论,引出了模糊粗糙集的产生背景,介绍了模糊粗糙集模型的一些主要概念和性质,并给出了模糊粗糙集属性重要性的定义,探讨了模糊粗糙集合的应用和发展现状.关 键 词:粗糙集;模糊集;模糊粗糙集中图分类号:TH164 文献标识码:A 文章编号:1671-0924(2006)08-0132-04I ntroduction to and Survey for the Studies of Fuzzy R ough Sets TheoryY AO H ong-xia(Department of Mathematics and In formation Sciences ,N orthwest N ormal University ,Lanzhou 730070,China )Abstract :This paper firstly reviews the theory of rough set and brings out the generation background aboutfuzzy rough sets ,secondly ,introduces the main concept and property of fuzzy rough sets and proposes its significance ,and finally ,discusses the application and recent studies for this theory.K ey w ords :rough sets ;fuzzy sets ;fuzzy rough sets0 引言 粗糙集(R ough Sets )理论最初是由波兰数学家Z.Pawlak 于1982年[1]提出的,是一种处理不完整和不确定性知识的数学工具[1-2].经过多年的发展,该理论已被成功的用于决策支持系统、人工智能、模式识别与分类、故障检测、金融、医学、知识发现、数据挖掘和专家系统等领域.但由于其严格的等价关系,限制了粗糙模型的发展和应用.针对这个问题,Dub ois 和Prade [3-4]提出模糊粗糙集的概念,作为粗糙集的一个模糊推广.模糊集理论首先是由美国控制论专家L ・A ・扎德(L.A.Z adeh )教授于1965年[5]提出的.也是一种处理模糊和不确定性知识的数学工具,它已成功的应用于模糊控制、模糊识别、模糊聚类分析、模糊决策、模糊评判、系统理论、信息检索、医学、生物学等各个方面.虽然2者都可以用来处理模糊和不确定问题,但2者的着眼点不同.粗糙集理论在处理模糊和不确定性问题方面着眼于知识的粗糙性,强调的是集合对象间的不可分辨性;而模糊集在处理不确定性问题时,主要着眼于知识的模糊性,强调的是集合边界的不分明性.由于这2种理论在处理不确定和模糊问题时具有一定的相似性,因此把它们结合起来的研究前景或许更有实际价值,Dubois 和Prade 是最早研究粗糙模糊集和模糊粗糙集问题的代表人物之一.当知识库中的知识模块是清晰概念,而被近似的概念是一个模糊概念时,就得到粗糙模糊集;当知识库中的知识模块是模糊概念,而被近似的概念是模糊概念时,则可得到模糊粗糙集.粗糙模糊集是模糊粗糙集的特殊情况,因此一般只讨论模糊粗糙集.于是根据问题的实际需要,在文献[3-4]中,用论域上的模糊关系代替分明的二元关系,提出模糊粗糙集合的概念,作为粗糙集合的模糊推广.第20卷 第8期Vol.20 No.8重 庆 工 学 院 学 报Journal of Chongqing Institute of T echnology2006年8月Aug.20061 粗糙集理论的发展 自1992年在波兰召开了RS理论的第一届国际学术会议以来,现在每年都召开以RS为主题的国际会议,大大推动了RS理论的发展.参加的成员主要来自波兰、美国、加拿大、日本、俄罗斯等国家.在Pawlak粗糙集模型中,等价关系是关键概念,等价类是构成上下近似结构的构造性知识块,用任意的二元关系取代等价关系,就得到Pawlak粗糙集模型的不同推广,即一般关系下的RS模型、变精度RS模型、概率RS模型、基于随机集的RS模型[9],而且在一个分明的,自反和传递关系下,一对上下近似算子正好是一个拓扑空间的内部封闭的算子[10-12].在RS集理论中,基本的运算符是近似的.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.在构造性方法下,论域上的二元关系、论域的划分、领域体系、布尔代数都是最原始的概念.文献[1,13-15]用这些概念构造了下近似和上近似算子,构造性方法尤其对RS的实际应用有重要的实用价值.另一方面,公理化方法,是一种研究粗糙代数结构近似的,用上下近似算子作为最初的概念,在这种方法下,用一个公理化集合刻画的近似算子和用构造性方法产生的算子是一样[15-16].比较构造性和公理化这2种方法,对分明粗糙集最典型的公理化研究是文献[15],在文献[17]中,用不同的公理化集合刻画了不同类型的粗糙集代数.2 模糊粗糙集的产生背景 粗糙集理论最初和主要的研究采用的是构造性方法.在Z.Pawlak粗糙集模型中,等价关系是关键和原始的概念.然而,等价关系是一个过于严格的条件,其限制了粗糙集模型的一些主要应用.针对这个问题,文献[12-13,18]用非等价二元关系推广了粗集近似算子,这一成果的出现,引起了学术界研究其它不同类型近似算子的热潮.另一方面,用U上的一个等价关系,在模糊关系理论下,引入上下近似,就得到了一个推广的概念,称为粗糙模糊集[4,17,19],相反的,用模糊相似关系代替等价关系,就得到模糊粗糙集合[4-8,19].因此后来有很多模糊粗糙集合的类型,如基于模糊T相似关系的一般结构[21],基于U上弱模糊划分的结构[22-23],以及基于模糊集合上的布尔子代数[7],等等.3 模糊粗糙集合的基本概念和理论3.1 等价关系下的模糊粗糙集定义定义1[9] 设(U,R)是Pawlak近似空间,R是论域U 上的一个等价关系,若A是U上的一个模糊集合,则A关于(U,R)的一对下近似A R和上近似 A R定义为U上的一对模糊集合,其隶属度函数分别定义为:A R(x)=in f{A(y)|y∈[x]R},x∈U,A R(x)=sup{A(y)|y∈[x]R},x∈U,其中[x]R为元素x在关系R下的等价类.若A R= A R,则称A是可定义的,否则称A是模糊粗糙集(Fuzzy rough set).称A R是A关于(U,R)的正域,称 A R是A关于(U,R)的负域,称 A R∩( A R)为A的边界.3.2 一般关系下的模糊粗糙集合及其属性重要性定义2[24] 称I=(U,A)是一个决策表信息系统,若有:①U是一个非空对象集合;②A={C,D}是一个有限非空属性集合,其中C是条件属性的非空集合,D是决策属性的非空集合;③对每个属性a∈A,定义了一个从U到V a的映射: a:U→V a,其中V a是属性a的值集.定义3[25] 设U是一个非空集合,称U上的模糊二元关系是相似关系,当且仅当R是:①自反的:R(x,x)=1对所有x∈U;②对称的:R(x,y)=R(y,x),对所有x,y∈U,U上的每个条件属性子集决定了一个U上的相似关系;③传递的:R(x,y)∧R(y,z)ΦR(x,z),对所有x, y,z∈U.则称R是U上的一个等价关系.在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,粗糙集合研究对象是分明的等价类,而模糊粗糙集合研究对象是模糊等价类.将论域U上的元素在相似关系下划分模糊等价类,以下记论域U上的模糊关系为S,对象x和y之间的相似度记为u s(x,y)=u s(y,x),它同样满足定义3的条件,即自反性:u s(x,x)=1;对称性u s(x,y)=u s(y,x);传递性u s (x,z)Εu s(x,y)∧u s(y,z).因此对对象x∈U的等价类[x]s定义为:u[x]s(y)=u s(x,y)定义4[26] 模糊P上近似和P下近似定义为:uP X(F i)=sup x min{u Fi(x),u X(x)}Πi. uPX(F i)=in f x max{1-u Fi(x),u X(x)}Πi.其中F i是属于U/P的模糊等价类,PΑA,XΑU,u X (x)是对象x属于U上的任意模糊集合X的程度,则称序对(u P X(F i),u PX(F i))为模糊粗糙集合.由于模糊上下近似的定义和分明的定义有一些差异,个体对象的隶属度的近似不是十分有用的,由于这个原因,模糊上下近似可以定义为:uP X(x)=sup F∈U/P min(u F(x),sup y∈U min{u F(y),u x (y)})uPX(x)=sup F∈U/P min(u F(x),in f y∈U max{1-u F(y),u x (y)})定义5[26] 条件属性C关于决策属性D的正域为:uPOSC(D)(x)=sup u CX(x) X∈U/D定义6[26] 根据模糊正域的定义,可以求出模糊粗糙集合条件下决策属性D对条件属性集合C的依赖性:331姚红霞:模糊粗糙集理论介绍和研究综述γC (D)=∑x∈U uPOSC(D)(x)|U|定义7 令C和D分别为模糊粗糙集的条件属性和决策属性集,属性子集C′ΑC关于D的重要性定义为:σCD(C′)=γC(D)-γC-C′(D)特别当C′={a}时,属性a∈C关于D的重要性为σCD(a)=γC(D)-γC-{a}(D).4 模糊粗糙集属性约简 为了对模糊粗糙集合进行属性约简,必须先对属性模糊化.在粗糙集合中,属性对应的等价类是普通集合,而在模糊粗糙集合中,属性对应的等价类是模糊集,因此,往往把属性的等价类划分过程称为属性模糊化过程.在粗糙集中,每个对象属于且仅属于一个等价类,在模糊粗糙集中,每个对象可以属于多个模糊等价类.为了进行属性约简,必须求出复合属性的模糊等价类,具体模糊化的过程见文献[26].在文献[17]中给出了模糊粗糙集基于属性依赖性的属性约简的降维算法和例子,在文献[24]中研究了一种面向连续属性空间的模糊粗糙约简算法.5 模糊粗糙集发展现状 在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,作为粗糙集合的模糊推广.在RS集理论中,基本的运算符是近似.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.因此对模糊粗糙集的研究很多也是建立在这2种方法上的.在文献[17]中研究了模糊粗糙集上的一系列公理化集合,但他们的研究局限与用模糊T相似关系定义的模糊T 粗糙集上,而当模糊关系退化为分明关系时,就是一般的等价关系.然而,到目前为止,对一般关系下模糊粗糙集公理化方法的研究还不是很多,在文献[21]中给出了公理化的模糊粗糙集模型,在文献[25]中运用构造性和公理化方法,给出了模糊粗糙集研究的一般结构.在构造性方法下,基于一个任意的模糊关系定义了一对一般关系下的模糊粗糙集上下近似算子,在公理化方法下,用不同的公理集合刻画了不同类型的模糊粗糙近似算子,这些公理保证了确定类型的模糊关系的存在产生相同的算子.在文献[28]中,应用扩展原理,定义了依靠模糊关联和模糊隐含算子的模糊粗糙集合,并考虑了3个常用的算子,即S-,R-,Q L-算子,用其定义了3种类型的模糊粗糙集,并讨论了各自的性质,使其更好的用于不完全和不确定信息系统.在文献[27]中,讨论了在有限论域上模糊粗糙集模型和模糊拓扑空间之间的关系,提出了模糊拓扑空间上的T C 公理,并证明了所有基于自反和对称模糊关系的上下近似集合包含了一个满足T C公理的模糊拓扑空间,并且相反的,一个满足T C公理的模糊拓扑空间正好是在自反和对称模糊关系下的所有的上下近似集合.即在所有自反和对称模糊关系下的集合和所有满足T C公理的模糊拓扑空间之间,存在一个一对一的关系.但这只是在有限论域情况下的结论,在无限论域上的还不确定成立,需要进一步探讨.粗糙集理论已经被广泛和成功的应用许多领域,主要是由于它能发现隐藏在数据中的事实,而不需要额外的如专家系统或者阈值之类的信息,能在无监督条件下,挖掘出数据库里的最小知识表示.但粗糙理论在应用过程中,主要的载体是信息表,信息表中的对象是处理和挖掘的对象,而信息表中的对象的属性值要么是分明的,或者是实值的,虽然连续的属性值可以通过属性离散化方法离散,但势必会丢失一些重要信息,而且在粗糙理论下,无法判断2个属性值是相似的,或者在某种扩展意义下是相同的.因此,针对这个问题,文献[29-30]用模糊粗糙集来解决这些不确定问题,并将这个理论用于网络数据分类和挖掘上,收到了很好的效果.文献[26]将其进行了推广和完善.目前,国外学者主要从不同角度考虑模糊粗糙集的性质,根据模糊集近似推理方式的不同,主要形成了从3种不同角度研究的模糊粗糙集:基于形式逻辑的模糊粗糙集,基于三角模的模糊粗糙集,基于-截集的模糊粗糙集.6 模糊粗糙集发展展望 虽然模糊粗糙集已经发展了十几年,但作为一种理论,它还有很多的不完善,尤其是目前研究属性约简的算法还是相当少,而属性约简在实际生活中具有重要的意义.今后,模糊粗糙集还有很大的发展空间,它可能更广泛的应用于数据挖掘,知识发现等重要领域.参考文献:[1] Pawlak Z.R ough[J].International Journal of C omputerand in formation Science,1982,11:341-356.[2] Pawlak Z.R ough sets:theoretical aspects of reas oning aboutdata[M].Boston:K luwer Academic Publishers,1991:66-90.[3] Dubois D,Prade H.R ough fuzzy sets and fuzzy rough sets[J].International Journal of G eneral System,1990,17:191-208.[4] Dubois D,Prade H.Putting rough sets and fuzzy sets to2gether[C]∥S lowinski R,Intelligent Decision Support.[S.l.]:K luwer Academic,D ordrecht,1992:203-232. [5] Z adeh L A.Fuzzy sets[J].In formation and C ontrol,1965(8):338-353.[6] Nakamura A.Fuzzy rough sets[J].N ote on Multiple-Val2ued Logic in Japan,1988,9(8):1-8.[7] Nanda S.fuzzy rough sets[J].Fuzzy Sets and Systems,1992(45):157-160.[8] Thiele H.on the definition of m odel operators in fuzzy logic[C]∥Proc.IS M V L-93.Sacramento,C A:[s.n.],1993:62-67.431重庆工学院学报[9] 张文修.粗糙集理论与方法[M].北京:科学出版社,2001.[10]K ortelainen J.on the relationship beween m odified sets,topological spaces and rough sets[J].Fuzzy Sets and Sys2tem,1994(61):91-95.[11]Y ao Y Y.T w o views of the theory of rough sets in finiteuni2verses[J].InternetJ.Approx.Reas ons,1996(15):291-317.[12]Y ao Y Y,Lin T Y.G eneralization of rough sets using m odallogics[J].Intell.Automat.S oft C omputer,1996(2):103-120.[13]K ryszkiewicz M.R ough set approach to incomplete in forma2tion systems[J].In formation Sciences,1998(112):39-49.[14]P omykala J A.Approximation operations in Approximationspaces[J].Bullerin of the P olish Academy of sciences:Mathmatics,1987(35):653-662.[15]Y ao Y Y.C onstrctive and algebraic methods of the theory ofrough sets[J].Journal of In formation Sciences,1998(109):21-27.[16]Lin T Y,Liu Q.R ough approximate operators:axiomaticrough sets theory[M]∥Z iarko W,R ough Sets,Fuzzy Setsand K nowledge Discovery.Berlin:S pringer,1994:256-260.[17]Pal S K.R oughness of a fuzzy set[J].In formation Sciences,1996(93):235-246.[18]Y ao Y Y.Relational interpretations of neighborhood opera2tors and rough set approximation operators[J].In formationSciences,1998(111):239-259.[19]Chakrabarty K,Biswas R,Nanda S.Fuzziness in rough sets[J].Fuzzy Sets And Systems,2000(110):247-251. [20]Y ao Y Y.C ombination of rough and fuzzy sets based on-level sets[C]∥Lin T Y,Cercone N.R ough Sets and DataMining:Analysis for Imprecise Data.Boston:K luwer Aca2demic Publishers,1997:301-321.[21]M orsi N N,Y akout M M.Axiomatics for fuzzy rough sets[J].Fuzzy sets And Systemss,1998(100):327-342. [22]Bodjanova S.Approximation of a fuzzy concepts in decisionmaking[J].Fuzzy Ses and Systems,1997(85):23-29.[23]K uncheva L I.Fuzzy rough sets:Application to feature selec2tion[J].Fuzzy Sets and System,1992(51):147-153. [24]聂作先,刘建成.一种面向连续属性空间的模糊粗糙约简[J].计算机工程,2005,31(6):88-90.[25]WeiZhi Wu,JuSheng Mi,WenX iu Zhang.G eneralized fuzzyrough sets[J].In formation Sciences,2003(151):263-282.[26]Richard Jensen,Qiang Shen.Fuzzy rough attribute reductinwith application to web categ orization[J].Fuzzy sets andSystem,2004(141):469-485.[27]K eyun Qin,Zheng Pei.On the topological properties of fuzzyrough sets[J].Fuzzy Sets and System,2005(151)601-613.[28]K erre E,E tienne A.Anna Maria Radzikowska[J].C om2parative study of fuzzy rough sets,2002(126):137-155.[29]Jensen R,Shen Q.A rough set-aided system for s ortingWWW bookmarks[M]∥Zhong N.Web Intelligence:Re2search and Development.[S.l.]:[s.n.],2001:95-105.[30]Jensen R,Shen Q.Fuzzy-rough sets for descriptive dimen2sionality reduction[C]∥Proc,11th Internat.C on f.onFuzzy Systems.[S.l.]:[s.n.],2002,29-34.(责任编辑 刘 舸)(上接第129页)systems with product recovery[J].C omputers&IndustrialEngineering,2004,46:431-441.[4] 陈秋双,刘东红.再制造系统的库存控制研究[J].南开大学学报:自然科学版,2003,36(3):67-72. [5] Inderfurth K.Optimal policies in hybrid manu facturing/re2manu facturing systems with product substitution[J].Inter2 national Journal of Production economics,2004,90:325-343.[6] 赵昱卿,王东,奚立峰.制造与再制造决策的优化[J].工业工程与管理,2003,8(2):18-21.[7] 厉以宁.西方经济学[M].北京:高等教育出版社,2000,33-37.[8] Petruzzi N,Dada M.Pricing and the new-vendor problem:A review with extension[J].Operations Research,1999,47(2):183-194.[9] Jinn-Tsair T eng,Chun-T ao Chang.Economic productionquantity m odels for deteriorating items with price and stock-dependent demand[J].C omputers&operations research, 2005(32):297-308.[10]G upate D,Arthur V H,T atiana Bouzdine-Chameeva.Apricing m odel for clearing end-of-seas on retail inventory [J].European Journal of Operational Research,2006(170):518-540.(责任编辑 刘 舸)531姚红霞:模糊粗糙集理论介绍和研究综述。
基于粗糙集理论的不确定信息系统及其决策研究随着云计算、大数据等新兴信息技术的广泛应用,各领域的数据急剧增长,这其中结构化数据仍然是数据的主要表现形式之一。
在这些数据中往往含有大量冗余的与不确定性数据,从而导致模式分类的处理能力与决策的辨识能力的降低。
区间值型数据与直觉模糊型数据作为信息的不确定与不充分的表现形式是两种重要的结构化数据。
如何从这两类不确定数据中发现有价值的信息和规律为管理者提供决策参考,仍然是管理决策科学领域中的研究热点之一。
粗糙集理论作为数据挖掘领域中的重要方法之一,其最显著的优点是在于不需要提供解决问题所需要的数据以外的先验知识,只要面向数据本身提供的信息,就可以实现对数据的分类与决策规则的获取等任务。
该理论已经被成功地应用于机器学习、数据挖掘、决策分析等诸多领域。
经典的粗糙集模型是建立在等价关系基础之上的,要求相对较为严格,处理不确定性数据存在着局限性。
因此,经典粗糙集模型的各种扩充对于不确定信息系统的知识约简与决策规则的获取具有极其重要的意义。
本文以粗糙集为工具,结合国内外的研究现状,较为系统的研究了单粒度与多粒度背景下区间值信息系统与直觉模糊信息系统的属性约简及其决策规则的获取问题,同时面向交通事故因素关联分析问题构造了一种群决策属性粗糙集模型并加以应用。
本文的主要创新性工作如下:(1)分析了现有的容差关系在区间值聚类中的不足,本文构建了一种模糊等价关系,基于此关系分别从单粒度与多粒度视角建立了区间值信息系统的粗糙集模型,给出分辨矩阵、属性约简的判定定理及其属性约简的方法,基于模糊等价关系定义了区间值决策系统上的决策规则置信度因子,给出了决策规则的支持定理及其决策规则的获取方法。
(2)分别从单粒度与多粒度角度建立了直觉模糊信息系统的粗糙集模型。
定义了直觉模糊信息系统上的偏序关系及其分辨矩阵,给出了有效的属性约简方法。
基于直觉模糊决策系统的分类质量给出了相对属性约简的计算方法,研究了相对属性重要度以及序决策规则的提取方法,建立了直觉模糊信息系统的乐观多粒度与悲观多粒度两种模型,分析了相应的性质及其与单粒度模型的联系与区别,给出了基于多粒度序关系的决策规则置信度因子及其决策规则的获取方法。
三支决策及其相关理论研究综述摘要:三支决策、粗糙集、集对分析以及模式识别理论都是处理模糊和不确定性知识的有效理论。
分析三支决策与粗糙集、集对分析、模式识别的相似和想通之处,并将它们相互渗透,为今后三支决策理论的进一步发展和完善奠定理论基础。
关键词:三支决策;粗糙集;集对分析;模式识别;不确定性三支决策理论是姚一豫等人在粗糙集[1]和决策粗糙集[2]基础上提出的新的决策理论。
2012年10月召开的中国粗糙集与软计算会议上,姚一豫教授系统地介绍了三支决策理论的背景、框架、模型及应用。
“三支决策理论与应用”[3]标志着三支决策由粗糙集的三个区间的语义解释逐步发展为在一种不确定或不完整信息条件下的决策理论。
许多学者研究和拓展了三支决策理论,并将其应用于多个学科领域。
2013年在漳州举办的中国rough集与软计算学术会议上还专门开设了三支决策讨论班,来自各地的专家学者讨论了三支决策的研究新进展及其未来的发展方向。
三支决策用接受、拒绝和不承诺表示决策的三种类型。
与此理论研究的不确定信息的处理相关的理论还有诞生于20世纪20年代、在60年代初迅速发展成一门学科的模式识别理论[4]和1989年我国学者赵克勤首次提出的集对分析理论[5]。
模式识别过程是从样本空间到类别空间的一个映射过程,也就是将观察目标与已有模式相比较、配准,判断其类属的过程。
集对分析是以集对及其联系度的基本概念,刻画和研究系统中广泛存在着的确定性与不确定性及其转化规律的一种系统分析技术。
本文针对三支决策、粗糙集、集对分析、模式识别4种理论的基本思想、对确定性和不确定性的处理、已有的研究方向、应用领域几个方面进行综述,总结和展望三支决策理论与其他理论可以相互借鉴、相互渗透的地方。
1 基本思想1.1 粗糙集三支决策最初的提出是为了对粗糙集的3个区间给出一个合理的语义解释。
因此首先介绍粗糙集的基本思想。
给定一个知识库K=(U,R),其中R为U上的一个等价关系。
3变精度粗糙集方法粗糙集方法是为了解决模糊或不确定性问题而发展的一种理论与方法。
在粗糙集方法中,对象的属性值可以是模糊的或精确的,而决策或分类规则可以通过属性之间的相对约束关系来确定。
本文将介绍三个常用的变精度粗糙集方法,并对其进行详细阐述。
1.粗糙集的数学模型:粗糙集的数学模型是基于信息系统理论和近似推理理论。
它可以将不精确或模糊的数据转化为一个或多个精确的决策或分类规则。
其数学模型定义了粗糙集的三个基本元素:信息系统、下近似集和上近似集。
这三个元素构成了粗糙集的主要特性和运算规则。
2.变精度粗糙集的基本概念:在粗糙集方法中,为了处理不确定性或模糊性问题,可以使用变精度技术来调整精确度。
变精度粗糙集是在标准粗糙集的基础上引入了多个精度级别的概念,从而可以根据不同的应用要求对精确度进行调整。
3.粗糙集方法的三个变精度技术:a.基于粗糙集的属性精度:在传统粗糙集方法中,属性的精确度是预先定义的,而在基于粗糙集的属性精度技术中,属性的精确度是由用户根据实际情况进行调整的。
通过调整属性的精确度,可以提高粗糙集方法的分类或决策效果。
b.基于粗糙集的决策精度:传统粗糙集方法中,决策的精确度是通过属性之间的相对约束关系来确定的。
而在基于粗糙集的决策精度技术中,可以通过调整决策的精确度来改善分类或决策结果。
这种技术常常会涉及到模糊推理或概率推理的方法。
c.基于粗糙集的规则精度:在传统粗糙集方法中,规则的精确度是预先定义的。
而在基于粗糙集的规则精度技术中,可以通过调整规则的精确度来提高分类或决策的准确性。
这种技术通常涉及到规则的修剪或合并。
总结起来,粗糙集方法是一种基于信息系统理论和近似推理理论的模糊或不确定性问题处理方法。
它的数学模型定义了信息系统、下近似集和上近似集等三个基本元素,并通过属性精度、决策精度和规则精度等三个变精度技术来提高分类或决策的准确性。
这些方法在实际应用中具有较好的效果,并逐渐成为数据挖掘和智能决策等领域的重要研究方向。
第39卷 第5期 电 子 科 技 大 学 学 报 V ol.39 No.5 2010年9月 Journal of University of Electronic Science and Technology of China Sep. 2010程度与精度的逻辑差粗糙集模型张贤勇1,熊 方2,莫智文1 ,程 伟3(1. 四川师范大学数学与软件科学学院 成都 610068; 2. 四川天一学院信息工程系 成都 610100;3. 电子科技大学计算机科学与工程学院 成都 611731)【摘要】基于程度与精度的逻辑差需求,提出了程度与精度的逻辑差粗糙集模型,并定义了粗糙集区域概念。
通过变精度近似与程度近似的转化公式,得到了粗糙集区域的基本结构,提出了计算粗糙集区域的常规算法和结构算法,进行了算法分析与比较,探索并得到了模型在决策表中的应用方向。
通过该模型拓展了程度粗糙集模型和经典粗糙集模型。
关 键 词 人工智能; 程度; 程度粗糙集; 逻辑差; 精度; 粗糙集理论; 结构算法; 精度; 变精度粗糙集; 程度; 程度粗糙集; 逻辑差; 结构算法中图分类号 Tp18 文献标识码 A doi:10.3969/j.issn.1001-0548.2010.05.028Rough Set Model of Logical Difference Operationof Grade and PrecisionZHANG Xian-yong 1, XIONG Fang 2, MO Zhi-wen 1, and CHENG Wei 3(1. College of Mathematics and Software Science, Sichuan Normal University Chengdu 610068;2. Department of Information Engineering, Sichuan Tianyi University Chengdu 610100;3. School of Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 611731)Abstract This paper proposes a rough set model of logical difference operation of grade and precision, and defines the concepts of rough set regions. In the new model, basic structure of rough set regions is obtained by transformation formulas between variable precision approximations and graded approximations. Regular algorithm and structural algorithm are proposed and analyzed to calculate rough set regions, and application prospect of the new model in decision table is explored and obtained. The new model has extended graded rough set model and classical rough set model.Key words artificial intelligence; grade; graded rough set; logical difference; precision; rough set theory; structural algorithm; precision; variable precision rough set; grade; graded rough set; logical difference; structural algorithm收稿日期: 2009 - 03 - 29; 修回日期:2009 - 08 - 23基金项目:国家自然科学基金(11071178);国家自然科学基金青年科学基金(60803028);四川省科技支撑计划项目(09ZC1838);四川省青年科技基金(07ZQ026114)作者简介:张贤勇(1978 - ),男,博士生,主要从事不确定性数学的理论及其应用方面的研究.经典粗糙集模型[1]的缺陷在于忽略了类与集合重叠部分的定量信息。
a decision analysis method based on roughset -回复问题:决策分析中的粗糙集方法是什么?它的步骤是什么?引言:在现代社会中,决策逐渐成为各个领域中的重要环节。
为了实现有效的决策,研究者们提出了各种不同的方法和技术。
其中,基于粗糙集的决策分析方法为决策制定者提供了一种直观且有效的工具。
本文将详细介绍基于粗糙集的决策分析方法的步骤和应用。
一、粗糙集理论概述:粗糙集理论最早由波兰学者Zdzislaw Pawlak于1982年提出,它是一种用于处理不完全和不确定信息的数学工具。
粗糙集理论的核心思想是根据信息的不确定程度,将对象的属性分为精确可确定的部分和模糊不确定的部分。
通过使用“下近似”和“上近似”的概念来描述集合的不确定性程度。
二、决策分析基本步骤:基于粗糙集的决策分析方法通常包括以下步骤:1. 确定决策问题及目标:首先,需要明确决策的具体问题,并清晰定义决策的目标。
例如,某公司要决定使用哪种广告方式提升销售量。
2. 建立决策规则集:收集并整理相关的决策规则。
决策规则是根据已有知识和经验制定的一系列规则,用于将决策目标与决策条件联系起来。
3. 构建决策表:根据收集到的决策规则,建立一个决策表。
决策表是由决策规则的条件与结果组成的表格,用于对决策情况进行归纳和分析。
4. 确定属性重要性:根据问题的具体情况和专家的建议,确定各个属性的重要性。
属性的重要性反映了属性对决策结果的影响程度。
5. 粗糙集约简:利用粗糙集理论中的约简方法,对决策表进行简化。
约简后的决策表可以更好地反映决策规则中的核心信息,减少决策问题的复杂度。
6. 决策推理:根据已经简化的决策表,进行决策推理。
根据决策条件和已知属性,推导出最佳的决策结果。
7. 决策评价:评价决策结果的有效性和准确性。
根据实际情况和决策目标的实现程度,对决策结果进行评估和分析。
8. 反馈和调整:根据评估结果,对决策方法和过程进行反馈和调整。
粗糙集理论的使用方法与建模步骤详解粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具。
它是由波兰数学家Pawlak于1982年提出的,被广泛应用于数据挖掘、模式识别、决策分析等领域。
本文将详细介绍粗糙集理论的使用方法和建模步骤。
一、粗糙集理论的基本概念粗糙集理论的核心思想是通过对数据进行粗糙划分,找出数据之间的相似性和差异性,从而进行有效的分类和决策。
在使用粗糙集理论进行建模之前,我们首先需要了解一些基本概念。
1.1 上近似集和下近似集上近似集是指在给定条件下,能够包含所有与目标属性有关的样本的集合;下近似集是指在给定条件下,能够完全确定与目标属性有关的样本的集合。
1.2 等价类和不可区分关系等价类是指在相同条件下,具有相同目标属性的样本所构成的集合;不可区分关系是指在给定条件下,无法通过已有的属性来区分不同的样本。
二、粗糙集建模的步骤在使用粗糙集理论进行建模时,我们可以按照以下步骤进行操作。
2.1 数据预处理在进行粗糙集建模之前,我们需要对原始数据进行预处理。
预处理包括数据清洗、数据转换、数据归一化等操作,以确保数据的质量和可用性。
2.2 属性约简属性约简是粗糙集建模中的关键步骤。
通过属性约简,我们可以从原始数据中选择出最具代表性的属性,减少冗余信息,提高模型的效率和准确性。
2.3 确定目标属性在进行粗糙集建模时,我们需要明确目标属性。
目标属性是我们希望通过建模来预测或分类的属性。
2.4 确定条件属性条件属性是用来描述和区分不同样本的属性。
在确定条件属性时,我们需要根据实际问题和数据特点选择合适的属性。
2.5 构建上近似集和下近似集通过已知的条件属性和目标属性,我们可以构建上近似集和下近似集。
上近似集包含了所有与目标属性有关的样本,下近似集则包含了能够完全确定与目标属性有关的样本。
2.6 确定等价类和不可区分关系根据上近似集和下近似集,我们可以确定等价类和不可区分关系。
等价类是具有相同目标属性的样本集合,不可区分关系则是无法通过已有的属性来区分不同的样本。
基于粗糙集改进的决策树手机精准营销模型摘要随着我国电子商务和移动支付的快速发展,手机已经成为人们必不可少的工具。
在考虑用户的基本行为特征和个人偏好的基础上,本文对影响手机的销售情况的指标进了统计和分析,建立了基于粗糙集改进的决策树模型,最终实现精准营销。
针对问题一,我们对附件中所给的数据进行了预处理,删除了重复值,缺失值。
然后我们对附件中每一个表格的数据都进行了描述性统计分析,将附件中所给的数据整合成我们需要的指标,对这些指标进行归一化,以便于后续建模和计算使用。
针对问题二,结合用户基本行为信息,我们选取了网络活跃指数,网络购物指数,在线视频指数,出行指数,理财指数作为用户行为的基本特征。
筛选出已购买该手机用户的这几项指标值,由于指标之间基本无共线性,而购买该手机用户的这些指标可能有趋同性,趋同性越大,则该指标的影响越显著。
我们采用方差分析法对指标进行了选取。
以用户是否购买该手机为因变量,以筛选后的指标为自变量建立了二分类的logistic回归模型,得到用户是否购买该手机与用户基本行为特征之间的函数关系。
为探究这些指标的具体影响,我们每次对其中一个指标微小变化,其他指标不变,将变化前后的回归值进行对比,得到每个指标的因子影响率。
因子影响率越大,则该指标对用户是否购买该手机的影响越大。
最终我们得到因子影响率较大的指标是网络购物指数和出行指数。
针对问题三,结合电商分类,视频行为,触媒行为,我们定义并选取了浏览视频总时长,购买欲望指数,浏览次数比,网页影响度四个指标,筛选出已购买该手机用户的这几项指标值,考虑到指标之间可能存在共线性,我们用主成分分析的方法对指标进行筛选。
以用户是否购买该手机为因变量,以筛选后的指标为自变量,同样建立二分类的logistic回归模型,得到用户是否购买该手机与用户偏好之间的函数关系,用与第二问相同的方法得到每个指标的因子影响率。
最终我们得到因子影响率较大的指标是浏览视频总时长和浏览次数比。
基于粗糙集的多目标类Bayes粗糙集模型陈志恩【摘要】介绍了两个目标类的决策信息系统中各目标类的Bayes粗糙集模型,并将这一模型推广到具有多目标类的情形.最后讨论了该模型的相关性质,计算实例表明该模型是有效的.【期刊名称】《宁夏师范学院学报》【年(卷),期】2010(031)006【总页数】4页(P14-17)【关键词】粗糙集;多目标类;Bayes因子;粗糙集模型【作者】陈志恩【作者单位】宁夏师范学院数学与计算机科学系,宁夏,固原,756000【正文语种】中文【中图分类】O159粗糙集理论[1]是波兰数学家 Pawlak于 20世纪初提出的用于数据分析的理论.由于粗糙集理论能够分析处理不精确、不协调和不完备信息,因此作为一种具有极大潜力和有效的知识获取工具已广泛应用于人工智能、模式识别与智能信息处理等领域[2,3].目前,对粗糙集的研究主要集中在粗糙集的模型推广[4-6]、问题的不确定性研究、其它处理不确定性模糊性问题的数学理论关系与互补、纯粹的数学理论方面的研究、粗糙集的算法研究和人工智能其它方向关系的研究等方面.变精度粗糙集模型[7]主要集中于具有两个目标类的信息系统中各目标类的粗糙集模型及其性质的研究,但在实际问题中往往会遇到多目标类的情况.为了克服这种局限性,本文提出了一种具有多目标类的信息系统中各目标类的 Bayes粗糙集模型,该模型保持了原有变精度粗糙集模型的相关性质,并且不受先验概率的影响,从而减小了决策失误的风险.定义 1 四元组 S=(U,A,V,f)称为一个决策信息系统,其中 U为研究对象的非空有限集合,称为论域;A为属性的非空有限集合,A=C∪D,C∩D=Ø,C为条件属性集,D为决策属性集;V表示属性值的集合,是属性 a的值域;f:U×A→V是一个信息函数,它为每个对象的每个属性赋予一个信息值,即∀a∈A,x∈U,f(x,a)∈Va.定义 2 设S=(U,C∪D)为一决策信息系统,P为定义在论域 U上可测子集所构成的σ-代数M(U)上的概率测度,U中的任何一个子集Xi,i=1,2,…,n.称为概念,它代表具有一定概率的随机事件,0≤p(Xi)≤1.P(Xi|E)表示事件在 E发生的条件下 Xi出现的概率,也可解释为随机选择的对象在概念 E描述下属于 Xi的概率,P(Xi)、P(Xi|E)、P(E|Xi)分别为事件 Xi的先验概率、后验概率和逆概率.按照 (1)式,在只有两个目标类的信息系统里,可根据显著性阈值ε10∈[0,1)来定义目标概念的正域、负域及边界区域,因为这种模型与贝叶斯因子有关,因此称这种模型为贝叶斯粗糙集模型(简称 RB模型),定义如下(B)若ε=(0,0),则 RB-区域即为经典粗糙集区域.公式(2)只定义了具有两个目标类的决策信息系统中各目标类的正域、负域及边界区域,因此根据实际问题,有必要将这一模型推广到具有多目标类的情形.并讨论它的相关性质.定义 4 令S=(U,C∪D)为一决策信息系统,VD={0,1,…,r-1},B⊆C,考虑矩阵和经典粗糙集模型相比,Bayes粗糙集模型具有很强的数据敏感性,适当调整ε-m atric中参数的值,则各目标类的 RB-区域会发生明显的变化.例如 (表 1)已知决策信息系统I=(U,C∪D),U={x1,x2,…x20},C={a1,a2,…,a5},U/D={X0,X1,X2},考虑条件属性B={a2,a3},B ⊆A,则列表比较如下本文在两个目标类的信息系统中各目标类的Bayes粗糙集模型的基础上研究了一种具有多目标类的 Bayes粗糙集模型,该模型保持了原有变精度粗糙集模型的相关性质,并且该模型不受先验概率的影响,从而减小了决策失误的风险.【相关文献】[1] Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11:314-356.[2] Pawlak Z,Skowron A.Rud iments of Rough Set[J].Information Sciences,2007,177:3-27.[3] Slowinski R,Vanderpooten D.A Generalized Definition of RoughApproximationsBased on Similarity[J].IEEE Transaction on Knowledge and Data Engineering,2000,12:331-336.[4] 邱雅竹,付蓉.两个论域上的粗糙集模型及其应用[J].四川师范大学学报,2005,28(1):15-18.[5] 巩增泰,孙秉珍,邵亚斌,等.一般关系下的变精度粗糙集模型[J].兰州大学学报 (自然科学版),2005,41(6):110-114.[6] 张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2001.[7] Ziarko W.Variable Precision Rough Set Model[J].Journal of Computer System Science,1993,46(1):39-59.。
一种基于决策粗糙集的自动聚类方法于洪;储双双【期刊名称】《计算机科学》【年(卷),期】2011(038)001【摘要】This paper proposed an autonomous knowledge-oriented clustering method based on decision-theoretic rough set model. In order to obtain the initial clustering,the initial threshold values need to set in the knowledge-oriented clustering framework. Thus,a novel method,sort difference, was proposed to produce the initial threshold values autonomously in view of physics theory. Then,a cluster validity index based on the decision-theoretic rough set model was developed by considering various loss functions, which can estimate the quality of clustering. The results of experiments show that the new approach is valuable.%提出了一种基于决策粗糙集的面向知识的自动聚类方法.在面向知识的聚类算法中,获取初始聚类结果依赖人工阈值的设置.为此,首先根据物理学知识提出了一种差值排序方法来自动得到阈值.另外,讨论了决策粗糙集模型的损失函数,提出了一种聚类评估方法;通过对聚类结果的评估来实现自动聚类.实验结果表明新方法是有效的.【总页数】4页(P221-224)【作者】于洪;储双双【作者单位】重庆邮电大学计算机科学与技术研究所,重庆,400065;重庆邮电大学计算机科学与技术研究所,重庆,400065【正文语种】中文【中图分类】TP18【相关文献】1.基于遗传算法的一种自动聚类方法 [J], 张义良2.一种基于决策粗糙集的两步分类算法 [J], 朱灿伟3.一种基于KD树子样的自动聚类方法 [J], 潘章明4.一种基于决策粗糙集的模糊C均值聚类数的确定方法 [J], 石文峰;商琳5.一种基于自动阈值发现的文本聚类方法 [J], 张猛;王大玲;于戈因版权原因,仅展示原文概要,查看原文内容请购买。
基于平均多粒度决策粗糙集和NNBC的滚动轴承故障诊断于军; 丁博; 何勇军【期刊名称】《《振动与冲击》》【年(卷),期】2019(038)015【总页数】7页(P209-215)【关键词】平均多粒度决策粗糙集; 属性约简; 非朴素贝叶斯分类器; 滚动轴承; 故障诊断【作者】于军; 丁博; 何勇军【作者单位】哈尔滨理工大学自动化学院哈尔滨150080; 哈尔滨理工大学计算机科学与技术学院哈尔滨150080【正文语种】中文【中图分类】TP18; TH165+.3滚动轴承作为旋转机械的核心部件,已广泛应用于风电机组、运输车辆和精密机床等设备的传动系统中[-2]。
然而,由于长期运行在高速重载等复杂恶劣工况,滚动轴承的内圈、外圈和滚动体等部位极易发生裂纹、点蚀或剥落等故障[3];从而降低设备精度,甚至造成人员伤亡等严重后果。
因此,滚动轴承的故障诊断研究具有十分重要的意义。
近年来,人工智能技术已广泛应用于滚动轴承的故障诊断方法中,如深度神经网络(Deep Neural Network, DNN)、支持向量机(Support Vector Machine, SVM)和模糊逻辑(Fuzzy Logic, FL)等。
作为一种新颖的机器学习工具,DNN能够自动地从原始数据中获得有价值的特征,并且其具有简单的结构和极强的表示能力。
Gan等[4]提出了一种基于分层诊断DNN的滚动轴承故障识别方法。
该方法通过一个二级DNN,实现轴承故障程度的分级诊断。
Guo等[5]将自适应改进DNN 用于判断滚动轴承的故障类型和程度。
Zhang等[6]为滚动轴承的故障诊断构建了一种卷积DNN模型。
该模型可实现变载荷和高噪音环境下轴承的故障识别。
DNN虽能准确地诊断滚动轴承的故障类型和故障程度,但其模型结构和参数的获取需要大量的训练样本。
而且,较高的计算成本和较低的适应能力仍然没有解决。
SVM是一种基于统计学原理的监督式机器学习方法,它具有突出的泛化特性和较强的容错能力。
粗糙集理论分析及其应用研究覃宝灵(佛山科学技术学院信息与教育技术中心,广东佛山528000)摘要:本文阐述粗糙集理论的基本概念,探讨粗糙集理论中知识约简和规则提取的重要性,通过分析、比较,把这些理论和技术应用于实际中,取得了显著的效果,对其在信息系统中的应用具有一定的研究价值。
关键词:粗糙集;知识约简;规则提取;遗传算法1、前言随着信息技术的飞速发展和广泛应用,面对信息系统中不完整、不精确或不确定的数据如何有效分析处理?如何发现隐藏在信息系统中的有用知识和潜在的规律?为了解决这些问题,学术界和研究者们采用了粗糙集理论。
粗糙集理论是由波兰数学家Z.Pawlak在1982年提出的[1],它是一种分析处理不完整性、不精确性、不确定性知识的数学工具。
该理论不需要任何初始或附加信息,直接利用已知的知识库,将知识库中的不确定或不精确的知识进行近似的划分,并对所划分的知识域确定其支持程度。
目前,该理论已成为信息科学和认识科学领域的研究热点之一,随着研究的深入,该理论得到了很大的发展和壮大,并已成功应用于人工智能、模式识别与分类、知识发现与决策分析、专家系统、数据挖掘、故障检测、金融、医学、生物学等领域。
2、粗糙集的基本理论定义粗糙集理论是一种研究不完整、不确定性知识的数学工具[2]。
在信息系统中,对知识的理解和表示是人们首先思考的问题,同时也是比较难解决的问题,从目前研究来看,对这些问题的解决,粗糙集理论和技术是比较理想的方法。
定义1:(信息系统)设一个信息系统[3]S=(U,A,V,f),这里,①U是对象的非空有限集合,即称为论域,记为:U={x1,x2,┅,xn};②A是属性的非空有限集合,记为:A={A1,A2,┅,Am};③V是属性的值域集,记为:V={V1,V2,┅,Vm},且Vi是属性Ai的值域;④f是信息函数,即f:U×A→V,f(x i,Aj)∈Vj。
在信息系统中,若属性集合A由条件属性集合C和决策属性集合D组成,且C∪D=A,C∩D=Ф,则称S为决策系统,又称决策表。
基于粗糙集和灰色理论的决策树算法研究的开题报告一、选题背景近年来,信息时代随着互联网的高速发展,数据量呈爆炸式增长,数据挖掘技术成为了热点话题之一。
数据挖掘技术是从大量数据中自动发现非显而易见的模式、知识和信息的一种方法,它主要包括聚类、分类和预测等功能。
其中,分类算法是数据挖掘中最为重要的一种技术,其核心算法之一就是决策树。
决策树算法是一种有效的分类算法,其基本思想是通过选择最优的属性对数据进行划分,从而构建一个树形结构的决策模型。
目前,关于决策树的研究主要包括三个方面:一是改进算法本身,如采用剪枝技术、改进属性选择度量方法等;二是融入其他算法来改进决策树,在常用的决策树算法的基础上,融入数据挖掘领域其他算法,如粗糙集、灰色理论等;三是将决策树应用于实际问题,如医学、金融、环保等领域,从而实现对这些领域的深度挖掘。
二、选题意义当前,随着数据量的不断增长和应用领域的不断拓展,决策树算法在数据挖掘、机器学习等领域的应用越来越广泛。
在实际应用中,决策树算法具有解决复杂分类问题、推理能力强、易于理解和解释等优点。
同时,粗糙集和灰色理论也是目前数据挖掘领域中常用的方法,其与决策树的结合可以更好地发挥数据挖掘的优势,提高决策树算法的效率和精度。
通过研究基于粗糙集和灰色理论的决策树算法,可以更深入地探究决策树算法的内在规律和实现机制,从而在实际应用中更有效地运用决策树算法解决各种分类问题。
三、研究内容本文将基于粗糙集和灰色理论的决策树算法作为研究对象,重点研究以下内容:1. 粗糙集理论和灰色理论的原理及应用;2. 常见决策树算法的原理、优缺点及改进;3. 基于粗糙集和灰色理论的决策树算法的设计和实现;4. 算法性能的实验验证及分析。
四、研究方法本文将主要采用以下研究方法:1. 文献综述法:对现有的相关文献和研究成果进行系统的搜集和综述,了解决策树算法和粗糙集/灰色理论的相关背景知识和最新研究进展;2. 算法设计法:在对现有算法进行了解和分析的基础上,对基于粗糙集和灰色理论的决策树算法进行设计和完善,包括算法的整体结构设计、关键步骤的实现、参数选取等;3. 实验验证法:进行算法性能分析和实验验证,通过对数据集的分析和比较来验证算法的可行性和优越性。
文献综述数学与应用数学决策粗糙集均值模型由于社会已经进入了网络信息时代,信息量不断增长(信息爆炸),并且由于人类的参与,使数据与信息系统中的不确定性更加显著(复杂系统)。
面对大量的、杂乱无章的数据,人们希望能从中挖掘出潜在的、有用的信息,这给人类的智能信息处理能力提出了前所未有的挑战。
由此产生了人工智能的新领域——知识发现(规则提取、数据挖掘和机器学习)。
波兰数学家Pawlak于1982年发表了论文“Rough Sets”[9]提出了一种能够定量分析处理不精确、不一致、不完整信息与知识的理论——粗糙集理论。
1992年,第一届关于粗糙集理论国际学术会议在波兰召开。
粗糙集的主要特点是不需要预先给定所需处理的数据集合之外的任何信息,而是直接从给定问题的分类知识出发,提供潜在知识和决策支持。
国内外学者对该理论进行了广泛而深入的研究,提出了许多粗糙集模型,并且已经成功应用于很多领域和开发了大量的实用系统[7]。
目前,对粗糙集理论的研究集中在它的数学性质、粗糙集拓展、其它不确定方法的关系和互补、有效算法和粒度计算等方面。
目前,有3个有关粗糙集的系列国际会议,即RSCTC、RSFDGrC和RSKT。
中国学者在这方面虽然起步晚,但发展较快,从2001年开始每年召开中国粗糙集与软计算学术会议;2003年中国人工智能学会粗糙集与软计算专业委员会成立;一系列学术会议也有在中国召开,特别值得一提的是2010年第二届国际粗糙集理论研讨会在我校(浙江海洋学院)召开。
中国第四届粗糙集与软计算会议也于2004年10月24日在我校召开,大大增加了我校在国内外的知名度。
在经典粗糙集理论的研究中,Pawlak的代数粗糙集模型是研究的主要对象。
粗糙集理论是建立在分类机制的基础上的。
它将研究对象组成的集合称为论域,将分类理解为在论域上的等价关系,而等价关系构成了对该论域的划分。
粗糙集理论将知识理解为对数据的划分,每一被划分的集合称为概念或范畴。
一个等价关系对应一个划分,把论域分解成子集族,作为描述论域中任意概念的基本信息粒子。
这产生了一个颗粒集合,其中一个颗粒看作一丛点(对象),因其不可区分性、相似性、接近的功能而被看做一致[24]。
对于一个等价关系(划分),某些子集不能精确地由一个等价类或者几个等价类来表示。
于是定义了两个等价类的并——上、下近似来表达,这对近似算子也是粗糙集模型的核心基础,又称上、下近似集。
下近似要求等价类是概念的一个子集,而上近似则要求概念与集合有一个非空的交集。
对重叠度的缺乏考虑不必要地限制了粗糙集的应用,同时也促使了很多研究者探讨该理论的概率推广[10-16]。
在具有参数可调性能的概率粗糙集模型研究中,比较有代表性的成果有:Yao 等人[19-22]提出了基于Bayes 分析的决策粗糙集模型(decision-theoretic rough sets, DTRS );Polkowski [12]和Skowron [13]对概率近似分类与模糊集作了比较研究;Pawlak ,Wong 和Ziarko 等人[11]提出了0.5-概率粗糙集模型;Ziarko [26]提出了可变精度粗糙集模型;Pawlak 和Skowron 等人[10]引入了粗糙隶属函数的概念;Greco 等人[6]研究了于Bayes 粗糙集模型。
上、下近似把论域划分成三个两两不相交的区域:下近似作为正域,上近似与下近似的差作为边界域,上近似的余集作为负域。
对于一个决策系统而言,上、下近似集是通过条件等价类与决策等价类的2种代数包含关系给出定义的:下近似集完全包含于决策类;上近似集与决策类交集非空即部分包含于决策类[1]。
这两种代数包含关系可以看作“集合A 包含于集合B 的条件概率大于0和集合A 包含于集合B 的条件概率等于1”这两个特殊情况,而对于条件概率在0,1之间的情形没有做出区别。
Pawlak 的代数粗糙集模型的正域要求条件等价类严格包含于决策类,这样导致正域和负域对象较少,而边界域中的对象较多,不利于对论域中的确定性概念做出描述。
对于在正域和负域中的对象,我们可以在给定的决策类中,根据它们的隶属度,做出确定性决策;对于在边界域中的决策,我们只可以做出非确定性决策。
故可以提出两种类型的规则[15]:对于正域和负域用确定性规则;对于边界域用非确定性规则。
在决策粗糙集理论中,决策粗糙集模型中区分正域、负域、边界域的阈值是通过计算各决策的最小风险(损失)得到的确定值,由于将Bayes 决策方法引入到阈值的判定中,决策粗糙集应用于实际时具有充分的理论依据。
Yao 等人[21]进一步分析决策粗糙集同模糊集、经典粗糙集的关系,指出模糊集意义下的截集、经典Pawlak 粗糙集、各种概率型-α粗糙集模型均可以在决策粗糙集模型中找到相应的解释,它们可以视为决策粗糙集的特例。
最近,Yao 和Zhao [23]研究了决策粗糙集意义下的约简理论,指出经典代数粗糙集模型的约简理论不再适用于概率性粗糙集模型,由此提出了新的决策粗糙集约简定义所需维持不变的若干特征,并系统阐述了决策粗糙集约简理论。
Bayes 决策是通过Bayes 先验概率分析思想构造的决策方法,其核心是利用事件发生的先验概率,获得使风险最小的决策。
关于Bayes 粗糙集模型[6]尝试提供一种必要参数的合理解释。
该模型是基于Bayes规则,体现了从先验概率到后验概率的变化和分类到假设检验之间的连接。
在特定的解释下,不同的概率计算可以表示为参数。
由此不难直接建立用于Bayes粗糙集模型中的概率和用于决策理论模型的连接。
目前仍然有如何解释和确定所需的参数系统的问题。
粗糙集理论在人工智能的应用上主要有两大类[2]:一类是无决策的分析,内容主要包括数据压缩、约简、聚类与机器发现等;另一类是有决策的分析,内容主要包括决策分析、规则提取等,当然也涉及对原始数据的预处理,如数据压缩与约简等。
以粗糙集理论为基础的决策分析对数据的完备性没有很高的要求,决策粗糙集理论将Bayes风险分析和概率型包含关系引入到了粗糙集理论中,因此它在涉及风险决策的数据挖掘问题中具有很好的适用性。
自它诞生以来,尤其是最近几年,决策粗糙集理论的应用价值受到越来越多的关注。
例如,An. Q等人[4]分析了粗糙关系下的数据关系;Yao J.T.和Herber等人[17,18]研究了DTRS在属性选择问题中的应用,给出了DTRS在网络支持系统中的应用方法,并提出了基于博弈论的DTRS分析方法;Zhao等人[3]研究了决策粗糙集理论在信息过滤中的应用;Zhou和Li[25]研究了基于DTRS的多层次决策规则提取方法;Ayad R.等人[5]研究了Bayes决策粗糙集在E-learning系统中的应用。
经典粗糙集模型中的不可区分关系是一种等价关系,要求很高,限制了粗糙集模型的应用。
本课题主要研究当前粗糙集研究中的一个方向——决策粗糙集(DTRS)。
在经典粗糙集的基础上,放松了对上下近似集的要求,利用概率论中的条件概率方法及其Bayes决策理论,重新计算了接受域和拒绝域,扩大了正域和负域,从而扩大了决策域。
当多用户参与决策时,每个用户根据不同的考虑,所得的最小风险决策规则是不一样的。
当然,不同决策者对一个问题的认识有深有浅,此时我们要充分考虑决策者的权威性。
本文将从现有的研究结果进行分析、评价、总结,在这基础上提出当多用户参与决策时基于均值的决策模型,同时给出应用实例,给出最优决策方案。
这种决策模型在实际问题中有其实用性。
参考文献[1] 李华雄, 刘盾, 周献中. 决策粗糙集模型研究综述. 重庆邮电大学学报自然科学版,2010: 624-630.[2] 张文修, 吴伟志. 粗糙集理论介绍和研究综述. 模糊系统与数学, 2000, 15(4): 1-15.[3] 赵文清, 朱永利, 高伟. 一个基于决策粗糙集理论的信息过滤模型. 计算机工程与应用, 2007, 43(7): 85-187.[4] An Q., Zhu Youhong. Rough relational database and its development. Journal ofChongqing University of Posts and Telecommunications (natural science edition), 2009, 21(4): 474-478.[5] Ayad R. A, Liu J. Supporting E-learning system with modified Bayesian rough set model.Proceedings of the 6th International Symposium on Neural Networks 2009, Lecture Notes in Computer Science, 5552. Berlin: Springer, 2009: 192-200.[6] Greco S., Matarazzo B., Slowinski R. Rough membership and Bayesian confirmationmeasures for parameterized rough sets. Rough sets, Fuzzy Sets, Data Mining and Granular Computing. Proceedings of RSFDGrC’ 05, LNAT 2005, 3641: 314-324.[7] Komorowski J., Pawlak Z., Polkowski L., Skowron A. Rough Sets: A Tutorial. In: S.K.Pal,Skowron A.(eds.). Rough Fuzzy Hybridization, Springer Verlag, Singapore, 1999: 3-98. [8] Pawlak Z., Skowron A. Rough sets: Some Extension Sciences. Information, 2007, 177: 28-40.[9] Pawlak Z. Rough sets. International Journal of Computer and Information Science, 1982,11: 341-356.[10] Pawlak Z., Skowron A. Rough membership functions, in: Advances in the Dempster-shaferTheory of Evidence, R.R. Yager and M. Fedrizzi and J. Kacprzyk John Wiley and Sons.New York, 1994: 251-271.[11] Pawlak Z., Wong S.K.M., Ziarko W. Rough sets: probabilistic versus deterministicapproach. International Journal of Man-Machine Studies, 1988, 29: 81-95.[12] Polkowski L., Skowron A. Rough mereology: a new paradigm for approximate reasoning.International Journal of Approximate Reasoning, 1996, 15: 333-365.[13] Skowron A. The relationship between the rough set theory and evidence theory. Bulletin ofPolish Academy of Sciences, Mathematics, 1989, 37: 87-90.[14] Wei L., Zhang, W.X. Probabilistic rough sets characterized by fuzzy sets. InternationalJournal of Uncertainty, Fuzziness and Knowledge-Based Systems 2004, 12: 47-60. [15] Wong S.K.M., Ziarko W. Algorithm for inductive learning. Bulletin of the Polish Academyof Sciences, Technical Sciences, 1986, 34: 271-276.[16] Wu W.Z., Leung Y., Zhang W.X. On generalized rough fuzzy approximation operators.LNCS Transactions on Rough Sets V, 2006, 4100: 263-284.[17] Yao J. T., Herbert J. P. Web-based Support Systems based on Rough Set Analysis.Manuscript, 2007: 1-16.[18] Yao J. T., Zhang M. Feature selection with adjustable criteria. Proceedings of the 10thInternational Conference on Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing 2005, Lecture Notes in Artificial Intelligence 3641. Berlin: Springer, 2005: 204-213.[19] Yao Y.Y., Decision-theoretic rough set models. Proceedings of the 2nd. InternationalConference on Rough Sets and Knowledge Technology 2007, Lecture Notes in Computer Science 4481. Heidelberg: Springer, 2007:1-12.[20] Yao Y.Y., Probabilistic approaches to rough sets. Expert Systems, 2003, 20: 287-297.[21] Yao Y.Y., Wong S.K.M. A decision theoretic framework for approximating concepts.International Journal of Man-machine Studies, 1992, 37: 793-809.[22] Yao Y.Y., Wong S.K.M., Lingras P. A decision-theoretic rough set model, in:Methodologies for Intelligent Systems, 5, Z.W. Ras, M. Zemankova and M.L. Emrich (Eds.). New York: North-Holland, 1990:17-24.[23] Yao Y.Y., Zhao Y. Attribute reduction in decision theoretic rough set models. InformationSciences, 2008, 178: 3365-3373.[24] Zadeh L.A. Towards a theory of fuzzy information granulation and its centrality in humanreasoning and fuzzy logic. Fuzzy Sets and Systems, 1997, 19: 111-127.[25] Zhou X. Z, Li H. X. A multi-view decision model based on decision theoretic rough set.Proceedings of the 4th International Conference on Rough Sets and Knowledge Technology 2009, Lecture Notes in Artificial Intelligence 5589. Berlin: Springer, 2009: 650-657.[26] Ziarko,W. Variable precision rough set model. Journal of Computer and System Sciences,1993, 46: 39-59.。