基于三支决策的文本形式背景分类模型的研究
- 格式:pdf
- 大小:626.58 KB
- 文档页数:11
三⽀决策理论三⽀决策(Three-way Decision)是⼀种基于符合⼈类认知的决策模式,它认为:⼈们在实际决策过程中,对于具有充分把握接受或拒绝的事物能够⽴即作出快速的判断;对于哪些不能⽴即作出决策的事物,⼈们往往会推迟对事件的判断,即:延迟决策。
造成延迟决策的原因很多,⽐如:所掌握的信息不够充分、对风险的评估不够全⾯、对事件的认知不够彻底等。
当⼈们对信息、风险、认知的掌握程度达到⼀定的⽔平,会作出接受或拒绝的最终判断,从这个⾓度说,三⽀决策是最终实现⼆⽀决策的⼀个中间步骤。
此外,三⽀决策有着⼗分⼴泛的应⽤背景。
例如:在论⽂的审稿过程中,对于⼀篇稿件,如果⼗分优秀则直接接收,如果质量太差则直接拒稿。
但是在⼤多情况下,稿件可能具有⼀定的创新性,但技术、语⾔等⽅⾯都需要进⼀步提⾼,主编往往选择修改和重审。
在医学治疗中,讲究听闻望切,对于⼀些⼩病⽽⾔,医⽣能够快速准确地作出有病或⽆病的诊断;⽽对于⼀些疑难杂症,需要通过进⾏⼀些检查才能进⼀步的确诊。
三⽀决策的思想已在医学、⼯程、管理、信息领域得到了成功的应⽤。
近⼏年来,对于三⽀决策和粒计算的研究引起了国内外学者的⼴泛关注,在2009-2012年连续四届国际粗糙集与知识技术学术会议(RSKT)以及2011-2012年连续两届中国粗糙集与软计算学术会议(CRSSC)上都举办了三⽀决策与粒计算的研讨会,李华雄等编著的《决策粗糙集理论及其研究进展》以及贾修⼀等编著的《三⽀决策理论与应⽤》推动了三⽀决策与粒计算的发展,国际著名SCI期刊《International Journal of Approximate Reasoning》和《Fundamenta Informaticae》等也先后出版专刊推动该主题的发展。
粒计算(Granular Computing)是当前计算智能研究领域中模拟⼈类思维和解决复杂问题的新⽅法。
它覆盖了所有有关粒度的理论、⽅法和技术,是研究复杂问题求解、海量数据挖掘和模糊信息处理等问题的有⼒⼯具。
引文格式:赖祎斌,刘财辉,周琪.三支决策模型应用方法研究进展[J ].赣南师范大学学报,2023,44(3):1-10.三支决策模型应用方法研究进展*赖祎斌,刘财辉†,周 琪(赣南师范大学数学与计算机科学学院,江西赣州 341000)摘 要:粗糙集理论是一种有效的数学工具,可用于处理模糊数据及问题不确定性分析.但经典粗糙集理论处理实际问题存在很大弊端,例如对等价类划分的要求过高㊁边界域处理困难等.文章对近年来的三支决策模型有关的研究进行详细的综述,主要包括三支决策模型分析方法的理论框架㊁基本概念以及主要研究思想,并对目前已有的三支决策模型研究中存在的一些问题进行探讨,为后续研究提供理论参考.关键词:粗糙集;粒计算;三支决策;序贯三支决策中图分类号:O 29 文献标志码:A 文章编号:2096-7659(2023)03-0001-100 引言在大数据时代,人们接受到的数据信息大多都是具有不确定性的信息,如何处理不确定㊁不精确㊁不完整㊁不一致的信息成为了当下研究的热点.从不确定性的信息数据中发现有用的知识,是国内外学者致力研究解决问题的方向之一[1-2].粗糙集理论作为一种处理模糊数据的有效数学工具,于1982年波兰学者P AW L A K [3]提出,在过去的三十多年中受到了国内外学者的广泛关注.粗糙集理论按照不可分辨关系来划分问题论域,通过上近似和下近似来描述目标概念,从而在处理不确定性和不精确性的信息时更加客观.Y A O 等[4]在粗糙集的基础上,通过设定容错阈值来放宽对上近似和下近似计算的严格限制,提出决策粗糙集理论,从而提高了粗糙集方法处理问题的容错能力.而后,通过描述损失风险的损失函数与贝叶斯决策理论相结合,计算出决策粗糙集中的阈值,并提出了三支决策理论,并且解释了粗糙集理论模型中正域㊁负域和边界域.在现有文献综述里,刘保相等[5]在2014年对三支决策与粗糙集㊁集对分析㊁模式识别的相似之处进行分析介绍;竺凡超等[6]在2020年系统地介绍了三支决策的概念㊁数据缺失概念与产生的原因,并且对数据缺失机制㊁缺失数据处理方法以及引入三支决策思想处理缺失数据的方法进行了综述.刘盾[7]在2021年从三支决策管理视角出发,介绍三支决策的管理与哲学思想,并对三支决策T A O 模型的3个重要问题进行深入分析,讨论效用三支决策和行为三支决策以及动态决策环境下的序贯三支决策模型与方法,最后给出三支决策未来的发展方向.于洪等[8]在2021年归纳总结工业大数据的特点,从应用实际中证实三支工业大数据分析已经初见成效,给出未来人工智能的发展方向,即将智能系统具备和人类相似的认知行为能力.本文的主要贡献有:对三支决策及其扩展模型进行综述,对现有的三支决策及其扩展模型的分析更加新颖㊁全面. 基于基分类器,关键技术和集成策略等经典机器学习理论视角,将经典的三支决策模型算法进行分析,并对算法优缺点㊁对比算法等进行描述与综合分析.深入分析了三支决策算法中现存的问题,并提出下一步的研究方向.1 粗糙集基本概念经典的粗糙集理论通过将论域分割为3个不相交的部分,即正域㊁负域和边界域,来描述目标概念,这种方法既能够近似地表达概念,也能够更准确地描述实际情况.2023年 赣南师范大学学报 ɴ.3第三期 J o u r n a l o f G a n n a n N o r m a l U n i v e r s i t y M a y .2023*收稿日期:2022-09-15 D O I :10.13698/j.c n k i .c n 36-1346/c .2023.03.001 基金项目:国家自然科学基金项目(61663002) 作者简介:赖祎斌(1990-),男,江西赣州人,赣南师范大学数学与计算机科学学院硕士研究生,研究方向:粗糙集,数据挖掘. †通讯作者:刘财辉(1979-),男,江西于都人,赣南师范大学数学与计算机科学学院教授,博士,研究方向:粗糙集,粒计算,机器学习等.Copyright ©博看网. All Rights Reserved.1.1 P a w l a k 粗糙集模型P a w l a k 粗糙集[3]在信息系统的基础上,通过目标概念的上下近似计算结果来对系统中对象的划分.给定一个论域U ,X ⊆U 的上近似和下近似分别被定义为:a pr X ={x ɪU |[x ]ɘX ʂ∅}={x ɪU |P X |[x ] >0}(1)a pr X ={x ɪU |[x ]⊆X }={x ɪU |P X |[x ] =1}(2)其中,P X |[x ] =|X ɘx |/x 表示对象x 属于X 的条件概率.粗糙集在知识获取,如数据预处理㊁属性约简㊁规则生成㊁知识的不确定性度量㊁获取数据依赖关系上都有着广泛都应用[9-15].1.2 概率粗糙集模型传统的粗糙集模型在将对象纳入近似区域时往往过于严格,可能需要额外的信息,或需要多次近似[16-17].粗糙集的概率模型可以修改宇宙中的粗糙集区域.将要深入研究的第一种方法是可变精度,它利用给定的概率作为参数来生成区域.第2个模型是决策理论模型,它使用正确或错误分类对象的成本来确定不同的区域.可变精度粗糙集(V P R S )方法可用于许多领域,以支持数据分析[4,18-19].V P R S 方法通过使用条件概率的边界改进了传统的粗糙集方法[20].2个参数,下限ℓ上限u 由用户或专家提供.P O S u A ={x ɪA |P (A |[x ])ȡu }(3)N E G l A ={x ɪA |P (A |[x ])ɤl }(4)B DN l ,u A={x ɪA |l <P (A |[x ])<u }(5)参数u 表示将描述为[x ]的对象A 包含到集合A 中的条件概率P (A |[x ])的最小程度.这被称为u 正区,即,如果给定对象x 的描述,其属于A 的概率大于或等于用户指定的上界概率,则对象x 被包括在集合A 中.集合A 的正区域由满足此条件的所有对象组成.同样,ℓ-负区域为负ℓA 是由下限控制的ℓ.如果某个对象x 的概率(给出其描述)属于A 小于或等于用户指定的下限概率,则该对象x 包含在集合A 中.集合A 的负区域由同样满足此条件的所有对象组成.由于u -正和ℓ-负区域增加正区域和负区域的大小.这个ℓ,u 边界区域对所有剩余对象进行分类.分类的质量是用户驱动的,因为ℓ和u 参数由用户提供.专家根据其知识或直觉提供这些参数的值.上限u 设置过低会降低任何对象正确分类的确定性.同样,设置得太高的下限l 也会出现同样的结果.特殊情况u =1和ℓ=0导致该方法与P a w l a k 模型完全相同.表1 代价矩阵A c t i o n XXca pλP P λP N a B λB PλB Na NλN P λNN 1.3 决策粗糙集模型Y A O 等[4,21]将贝叶斯决策理论引入概率粗糙集,为应对手动设置参数的缺点,提出决策粗糙集理论,计算最优的α㊁β.在决策粗糙集中定义了2个状态和3个动作:Ω={X ,X }c 包含属于和不属于2种状态,A ={a p ,a B ,a N }包含接受㊁延迟决定㊁拒绝3个动作[22-23].考虑到不同的决策动作会产生不同的损失,故设置代价矩阵,如表1所示.P P 和P N 分别表示采取动作a p 时x 属于X 和不属于X ;B P 和B N 分别表示采取动作a B 时x 属于X 和不属于X ,N P 和N N 分别表示采取动作a N 时x 属于X 和不属于X .λ表示以上各种情况所需要的带代价.由此,三支决策的规则如下:如果P (X |[x ])ȡα,则决定x ɪP O S X ; 如果β<P (X |[x ])<α,则决定x ɪB N D X ; 如果P (X |[x ])ɤβ,则决定x ɪN E G X ;其中:α=λP N -λB NλP N -λB N +λB P -λP P(6)β=λB N -λNNλB N-λNN +λN P -λB P (7)2 粒计算与三支决策粒度计算起源较早,现在广泛应用于各个领域.Z A D E H [24]于1979年首次在模糊集的背景下引入信息粒化的概念,1997年,L I N [25]正式提出粒度计算这一术语.粒计算的粒度组成一般包括3个部分:粒度㊁粒度2赣南师范大学学报 2023年Copyright ©博看网. All Rights Reserved.特征和粒度结构,其中粒度特征是所有粒度共享的一组公共属性,粒度结构描述了所有粒度之间的结构关系.粒计算目前已广泛应用于图像处理㊁机器学习㊁复杂问题解决㊁模式识别㊁智能控制㊁人工神经网络㊁知识获取㊁语言动态系统等领域[26-32].粒运算是一种用于模拟人类决策思维和处理复杂问题的先进理论,粒计算中结构化问题求解的思想能够有效的求解复杂问题[33].粒度结构是由多个级别组成的层次结构,每一个粒层由一组具有相似信息粒度的粒子组成.多层粒度结构会导致多层划分和多步决策过程.从粒运算的角度来看,序贯三支选择技术就是利用这一思想,完成从粗粒层到细粒层中间的有序选择,从而提高决策效率和精确度.2.1 三支决策算法模型三支决策是粗糙集理论与粒计算理论发展过程中所诞生的重要思想.相对于传统的二支决策而言,三支决策增加不确定做出正负决策行为时的延迟决策.三支决策基本思想是通过评价函数λx 对某个对象集合D 中的元素x ɪD 进行不确定性程度的度量:当λx >α时,x 被划分到集合D 的正决策阈P O S (α,β)X ;当λx <β时,x 被划分到集合D 的负决策阈N E G (α,β)X ;当β<λx <α时,x 被划分到集合D 的延迟决策阈B N D (α,β)X .其中α,β为三支决策阈值,通常设定为0ɤβɤ1.图1 三支决策思想图图2 T A O 模型图基于此,全域D 可以被划分为3个互不相交的决策域,表示为:P O S (α,β)D ={x ɪD |λx ȡα}(8)B N D (α,β)D ={x ɪD |βx ȡα}(9)N E G (α,β)D ={x ɪD |λx ɤβ}(10)2.2 粒计算视角下的三支决策理论在对粗糙集模型和决策粗糙集模型研究的基础上,Y A O [34]发现,在处理未知事物时,三支决策比传统的二支决策更具有优势,因为它可以在获取未知不完整信息的情况下,采取不承诺的政策,从而减少由错误决策带来的损失.从而提出三支决策(T h r e e -W a y De c i s i o n s ,3WD )理论,三支决策与传统的二支决策相比(三支决策思想如图1所示),三支决策关键是可以在获取未知不完整信息时采取不承诺的决策以此来降低错误决策所造成的损失.三支决策理论又称为 三分 行动 成果(T r i s e c t i n g -A c t i n g-O u t c o m e ,T A O )模型, 三分 行动 成果 模型被描述为一种有效的决策理论,它可以帮助人们更好地思考㊁解决问题㊁处理信息和进行粒计算,从而提高工作效率和生产力.图2展示了T A O 模型的基本理论框架.T A O 模型可以分为3个任务,第1项任务(三分)将一个整体分为3个部分;第2个任务(行动)通过3个策略分别处理3个部分;第3个任务(结果)衡量和评估先前结果的有效性.三支决策理论对粗糙集理论中的正域㊁负域和边界域给出了合理的语义解释.其中,正域中的对象表示接受该对象属于目标类的决策;负域中的对象表示拒绝该对象属于目标类的决策;边界域中的对象表示尚未做出该对象是否属于目标类的决策.三支决策思想在诊断医疗疾病过程中被广泛应用,它能够帮助医师根据临床患者的病症做出治愈㊁不治愈或进一步观察的初步判断.当临床患者的3第3期 赖祎斌,刘财辉,周 琪 三支决策模型应用方法研究进展Copyright ©博看网. All Rights Reserved.4赣南师范大学学报2023年病症资料越来越丰富时,医师能够更加明智地做出治愈或不治愈的决定,而当患者表现出疑难症状时,这2种选择都存在较大的危险性,因此,更适合采取进一步观察的方式来确定最佳治疗方案.2.3三支决策中的阈值分析如何选取合适的阈值α和β将论域分为3个互不相交的子论域是三支决策模型需要解决的问题,概率粗糙集模型事先定义了阈值α和β,而决策粗糙集在贝叶斯风险决策视角下,通过损失函数获得决策总体风险最小时的三支决策划分策略,因此阈值可以自动获取[22].阈值点的计算仅仅是基于专家的经验,而且还需要考虑到损失函数的主观性和不确定性,以及如何将样本区分为正域㊁边界域和负域,以便更好地计算出三种域的阈值点.因此,准确地定义损失函数和阈值是一项具有挑战性的任务[35].H E R B E R T等[36]在三支决策理论基础上使用博弈论计算得到合理阈值.J I A等[37]通过构建决策风险最优化,提出在三支决策粗糖集理论中自适应学习参数算法,快速且有效地获得恰当阈值参数.施玉杰等[38]在三支决策的基础上使用信息熵来得到阈值并且提出自适应粗糙集.陈刚等[39]通过三支决策风险损失函数建立模型,通过样本的条件概率进行决策风险最小化,并利用网络搜索的方法,计算出风险损失最小的参数阈值.L I U等[40]将逻辑回归和决策粗糙集理论相结合,使用逻辑回归估算决策粗糙集的条件概率,应用决策粗糙集理论和贝叶斯决策对阈值进行计算,使得阈值解释更加合理.汪璐等[41]提出一种基于三支决策的贝叶斯网络分类器,此分类器把条件概率求解和阈值求解有机结合.D E N G等[42]提出一种用于解释和确定阈值并且把不确定性作为目标函数的信息理论方法,利用信息熵作为不确定性度量,通过引入信息论寻找概率粗糙集中最优阈值.A Z AM等[43]应用博弈论探索概率阈值与风险水平之间的关系,以此确定概率粗糙集阈值的最佳值.Z H A N G等[44]提出基于两类不确定分类的三支决策模型,该模型把三支决策与不确定分类结合起来,给出概率粗糙集模型的两类分类错误和两类不确定分类的定义,得到一对不同的阈值.L I A N G等[45]在决策粗糙集中加入语言评价机制,并且应用多属性群决策,调整语言评价中的参数,构造一种基于贝叶斯决策过程的新型三支决策模型.庞国宏[46]根据相邻两个粒层分类的精度差,定义了序贯三支决策中两类负效益分类;并且在惩罚函数中引入代价参数,使粒层上的分类结果能够影响代价参数;在此基础上提出一种优化的序贯三支决策分类模型.Y A N G等[47]结合三向决策和阴影集的思想,研究直觉模糊集构造阴影集问题的2种可能解决方案,使用切比雪夫距离计算评估中阈值的基本问题.Z H A N G等[48]将犹豫模糊元素的隶属度转化为距离和阈值之间的比较,引入阴影集理论以计算阈值,避免阈值获取的主观性.以上研究表明,阈值问题的选取不仅仅是模型的问题求解,更能对实际建模方案提供参数的可解释性参考,同样是三支决策在寻找最优阈值问题的解决思路中显著性的特点和优点.2.4三支决策中的损失函数在三支决策中,损失函数是一个重要参数.研究人员提出一系列基于不同损失函数格式的三支决策规则.在计算TWD模型中的预期损失时,存在2个关键问题:损失函数和条件概率.损失函数的语义解释为当对象处于某一状态时,决策者采取某一决策态度的风险损失.决策者可以根据经验得到损失函数,虽然根据决策者的经验确定损失函数是一种可行的方法,但在一定程度上增加了决策的主观性.鉴于此,有学者对客观评价确定损失函数的方法进行系统研究.HU[49]系统地研究基于犹豫模糊集和区间值犹豫模糊集的三向决策空间和三向决策规则.L I U等[50]使用成本函数和收入函数来衡量损失函数,提出基于利润的三方投资决策方法.Y A N G等[51]讨论损失函数的聚合方法,提出一个多代理D T R S模型.L I U等[52]通过分析损失函数的不同组合,提出四级概率规则选择标准.A G B O D A H[53]提出群体决策环境下决策论粗糙集损失函数的集结方法.X U等[54]对于给定一个由不完全信息表和损失函数组成的混合不完全信息表,将每个对象的损失函数表示为一个区间.为得到合理的聚合区间损失函数,基于合理粒度原则,提出一种新的聚合方法,使得聚合区间损失函数的长度既不太宽也不太窄.聚合结果尽可能包含相似类中所有对象的区间损失函数,结果尽可能具体.H E R B E R T等[36]通过将博弈论与决策论粗糙集模型相结合,提出相应的目标损失函数.J I A等[55]提出的基于多准则决策矩阵的目标损失函数.L I U[56]提出直觉模糊环境下直觉模糊损失函数的概念,延申直觉模糊环境下的三支M C D M研究工作.WA N G等[57]引入前景理论来描述损失函数.下一步可以研究所提出的基于合理粒度原则的三方决策在解决不完备信息系统中的实际问题中的应Copyright©博看网. All Rights Reserved.用;通过将模糊粗糙集模型与模糊α-邻域和TWD 思想相结合,探索TWD 模型中新的目标损失函数[58].2.5 基于序贯三支决策的数据分析Y A O 提出序贯三支决策,它以信息和知识粒度为基础,将决策过程中的代价和结果综合考虑,从而避免单层粒度下的决策损失.三支决策是一项有效的解决不确定性复杂化问题的策略,它的核心是 三分而治 ,即将一组整体分割为3个独立的部分,根据每个部分的特点采取不同的处理方式.这种模型[59-60]可以用来处理动态决策问题,它可以按照层次粒结构的顺序分为3种:从上到下㊁从下到上和从中到外.从低级粒度开始,逐步向高级粒度进一步发展,是一类普遍采用的粒结构解决方案.如图3所示.图3 序贯三支决策模型图根据n 个等价关系,能够按照不同类型的条件属性集来区分论域,并且满足以下公式:x c n ⊆ ⊆x c 2x c 1(11)其中,X 表示多个样本的矩阵形式,x c i表示不同条件属性下得到的信息粒,c i ,i =1, ,n 表示条件属性,以此类推.由此可以得到一个n 层的粒结构,表示为:G S =G S 1,G S 2, ,G S n G S =U i ,E i ,C i ,[X ]c i其中,G S i 表示第i 个粒结构,U i 表示粒结构中的非空有限集,E i 为U i 中存在的等价关系,同样此处的C i 表示粒结构中的条件属性.在多层次粒结构中,动态决策任务的目标决定每一层属性的选择方式.在序贯三支决策中,对于在边界域的对象,除了最后一层要用二支决策,其余粒层均用三支决策.因此,需要根据实际情况,在每个粒层上分别设置合理的三支决策阈值.定义1[61] 假设论域U 中存在n +1层粒层空间,n ȡ1,V i ʒU i ңD e s iL i 为从U i 到全序集U i L i , i的评价函数,给定阈值对αi ,βi ɪL i 且βi i αi ,即βi ≺i αi ɡ¬αi i βi ,在特定层i 上,1ɤi ɤn ,L i 可以分为3个两两不相交的域:P O S αi ,βi V i ={x ɪU i +1|V i D e s i X i αi }(12)N E G αi ,βiV i ={x ɪU i +1|V i D e s i X i βi }(13)B N D αi ,βiV i ={x ɪU i +1|βi ≺V i D e s i X ≺i αi }(14)其中,X 表示待决策样本,V i D e s i X 表示待决策对象集,P O S αi ,βi V i 表示正域,N E G αi ,βi V i 表示负域,B N D αi ,βiV i 表示边界域.随着从底层向上层获取的信息更多,边界域随之缩小,对象逐渐从B N D 划分到P O S 和N E G ,最后转换为二支决策.定义2[61] 给定一个决策表S =U ,C t =C ɣD ,{V a |a ɪC i },{I a |a ɪC i } ,假设有n +1层粒层空间,n ȡ1,在决策表S 上的粒化定义为:G =gC i |C i ⊆C (15)其中,g C i 为某一特定相同粒度的信息粒集合对U 的划分,C 为决策表中条件属性集,D 为决策表中决策属性集,V a 为每个属性a ɪC i 的值的集合,I a 为每个属性a ɪC i 的信息函数,C i ,1ɤi ɤn 是条件属性子集,且满足条件C 1⊂C 2⊂ ⊂C n ⊂C n +1=C .结合文献[34]的粒计算思想,陈丽芳等[62]采用二元关系实现粒层动态划分;通过计算阈值并建立多层次粒结构,将各层数据归类到正域㊁边界域和负域,并组合成新的数据子集,构建基分类器,实现不平衡数据的集成分类.亓慧等[63]借助邻域决策错误率约简,分别定义局部和全局属性子空间,并在数值型数据的基础上设计基于邻域决策错误率的序贯三支分类算法.王琴等[16]为提升情感分类模型的整体效果并且提高分类效率,提出集成序贯三支分类算法的思想,将多个分类器的三支划分结果进行最大投票,最终确定分类对象的域,构建结合集成学习的序贯三支情感分类模型.鞠恒荣等[64]研究L o c a l 约简与G l o b a l 约简之间的内在序贯性,并以此构建具有约简特性的序贯信息粒.在此基础上,把L o c a l 约简作为起始序列㊁G l o b a l 约简作为终止序列,提出一种基于L o c a l 约简的动态序贯三支分类器.F E N G 等[65]在平衡数据集上采用序贯三支决策作为分类器,将不确定域为空集作为算法迭代的终止条件,通过计算样本的分类代价对样本进行分类.Z H A N G 等[66]从粒度细分化的角度出发,结合概率粗糙集模型提出一种新的带自动纠错的序贯三支决策模5第3期 赖祎斌,刘财辉,周 琪 三支决策模型应用方法研究进展Copyright ©博看网. All Rights Reserved.6赣南师范大学学报2023年型(S3WD-A E C),以降低错误分类率(E C R).S A V C H E N K O[67]为了提高卷积神经网络的推理速度,提出一种基于序贯三支决策的图像识别算法.在序贯三支决策的应用中通常设置多组阈值,实现由粗粒度到细粒度变化的决策过程;对需要延迟决策的对象,采用逐步收集有效信息的方式,使决策结果由不确定性和粗粒度特征(边界域)向确定性和细粒度特征(正域和负域)转化,重复该过程直至决策结果的风险代价达到预期,以更加有效地降低决策代价及测试代价.2.6基于三支决策的集成算法集成学习是一种有效的方法,它将多种弱分类器结合,以提高模型的整体性能.结合集成学习的优势基于粒计算和三支决策思想,能够有效的提高模型整体分类能力.与未集成的分类器相比,集成学习后的分类器具有更强的泛化能力与更高的分类精度.多粒度序贯三支情感分类模型(N S TW S C)[16]的基学习器采用S VM㊁L R㊁N B算法,不仅可以提高整体分类效果,还可以降低分类成本.但其仅采用简单投票法,数学机理与集成策略有待更深层次的思考.三支领域互信息特征选择方法(NM I-TWD)[68]的基学习器采用L o g i s t i c R e g r e s s i o n,提高分类算法的稳定性和预测精度,利用领域互信息迭代拓展生成3个具有差异性的特征子集时需要消耗更多的资源.序贯三支决策多粒度集成分类算法(MG E-S3WD)[69]的基学习器采用C A R T决策树算法,此算法对数据的不平衡比和数据分类精度有一定作用,缺点是粒化复杂度高,运算效率低.差异性度量的基础聚类成员过滤算法(C D F3WD)[70]的基学习器采用k均值方法,有效求解基础聚类成员差异性度量,明显提升聚类集成性能,需要较大的存储空间.不完备数据集的三支聚类集成算法[71]的基学习器采用K-m e a n s算法,对不完备数据集,样本量大且特征值缺失的情况下获得良好的聚类结果,其设置每个簇成员的簇数k相同,但该算法缺乏一定的扩展性.2.7基于三支决策模型的属性约简算法研究属性约简是粗糙集领域的重要课题,而在决有风险成本的决策语境中,寻求合理的属性约简方法,并且建立三支决策属性约简基础理论,已成为当前研究的热点.J I A等[72]通过定义一种启发式的最小风险约简算法,给出决策粗糙集模型下最小化决策风险的属性约简.D U O等[18]提出θ-决策粗糙集模型,此模型对最大化与最小化的可能代价概念进行定义,同时对代价标准与决策单调两种约简对象进行解释,并且给出相应的启发式约简算法.姜春茂等[73]在序贯三支决策的基础上提出一种提高属性约简效率的方法.该方法首先计算决策系统中的属性重要度;然后将属性重要度的结果分成3类,第1类为正域(重要度大于零的属性),第2类为负域(重要度等于零的属性),第3类为边界域(重要度小于零的属性);最后循环计算边界域中属性的重要度,并将结果继续三分类直至约简结果满足约束条件.邢颖等[74]利用序贯三支决策模型的多层次粒结构可以降低决策总代价,并且能够模拟人类决策过程的特点,将各个属性的测试代价与其分类能力相关联,在保证较高准确度的同时,降低决策的总代价.WA N G等[75]设计一种基于三支前向贪婪搜索算法计算序列粒度约简,可减少评估候选属性的次数,系统地研究序贯粒度属性约简(S G A R)的概念,从一系列有序粒度中找到多个约简.针对该类方法研究,可以考虑使用其它粗糙集模型,如模糊粗糙集㊁决策粗糙集等.通过动态设置阈值的方法来控制属性重要性,不仅可以提升约简的效率,而且还能降低分类精确度的代价损失.2.8三支决策在模式识别中的研究在三支决策的粒计算其他应用上,张刚强等[76]提出一种基于序贯三支决策的多粒度情感分类方法,它将序贯三支决策的思路运用于文本情感分类工作中,以更加精准地分析评论中的情感内容,并且能够更好地反映出其间的关联性.文本情感分类性能较好,但对数据的选择要求较高.L I等[77]在三支决策的基础上提出一种项集增量挖掘的技术,此技术不仅可以用于处理频繁项集,还可以用于处理高实用性项集的增量挖掘.项集在不断增量更新的同时,降低其精确度来降低优化问题的复杂度,从而提高增量算法的效率,这种方法会增加一定的计算量.张智恒[78]将三支决策的基本概念用于项集的区域划分,得到基于三支决策的项集增量挖掘算法,其能适应大数据的动态特性,还能实时地挖掘出项集信息,提供一种新的算法思路.徐媛媛等[79]利用三支决策思想设计了三支交互推荐系统,提出结合流行度区间和M-d i s t a n c e k近邻的混合推荐算法,有效地降低了推荐代价并且构造了序贯三支人机交互.张建华等[80]在三支决策的基础上提出一种基于三支决策的关联知识推送算法,此算法根据知识属性的视图相似度衡量知识间的相似度,在考虑知识关联度的重要性的同时,也考虑到传统推送决策的二分性质以及推送成本问题,但该知识推送系统中未考虑用户评Copyright©博看网. All Rights Reserved.。
犹豫直觉模糊不确定语言变量及其三支决策犹豫直觉模糊不确定语言变量及其三支决策近年来,随着人工智能领域的迅猛发展,犹豫直觉模糊不确定语言变量及其三支决策逐渐引起了学术界的关注。
犹豫直觉模糊不确定语言变量是对人类认知过程中的直觉和犹豫的一种数学模型,它能够有效地处理不确定性信息,并进行决策。
本文将从犹豫直觉模糊不确定语言变量的基本概念、特征以及应用等方面进行探讨。
首先,我们需要了解犹豫直觉模糊不确定语言变量的基本概念和特征。
犹豫直觉模糊不确定语言变量是一种将模糊理论、犹豫数学和概率论相结合的数学模型,能够处理不确定性、模糊性和犹豫性等复杂信息。
在这种模型中,变量的取值不再是确定的,而是通过模糊集合来描述。
同时,模糊集合的隶属函数也不再是常见的三角型或梯形型函数,而是采用了犹豫型隶属函数,从而能够更好地描述人类认知过程中的不确定性和犹豫性。
其次,我们可以探讨犹豫直觉模糊不确定语言变量的应用。
犹豫直觉模糊不确定语言变量能够应用于许多领域,如医学诊断、金融风险评估、工程决策等。
以医学诊断为例,犹豫直觉模糊不确定语言变量可以用于处理医学领域中的不确定性信息,从而帮助医生做出更准确的诊断和治疗决策。
而在金融风险评估领域,犹豫直觉模糊不确定语言变量可以应用于评估金融市场的不确定性和风险,提供投资建议和决策支持。
最后,我们可以探讨犹豫直觉模糊不确定语言变量的三支决策方法。
三支决策方法是基于犹豫直觉模糊不确定语言变量的一种决策方法,它能够将不确定性信息转化为数值,并通过计算和比较来进行决策。
三支决策方法的基本思想是基于模糊隶属度和模糊加权平均的计算方法,通过计算得到决策结果的置信度,并选择置信度最高的决策结果作为最终决策。
综上所述,犹豫直觉模糊不确定语言变量及其三支决策是一个应用于处理不确定性信息和辅助决策的数学模型。
这一模型的应用潜力广泛,可以在多个领域中发挥重要的作用。
随着人工智能技术的不断发展,相信犹豫直觉模糊不确定语言变量及其三支决策将继续在实践中得到广泛应用,并为人们的生活和工作带来更多的便利与帮助总结来说,犹豫直觉模糊不确定语言变量是一种应用广泛的数学模型,可以应用于医学诊断、金融风险评估、工程决策等许多领域。
CATALOGUE目录•引言•三支决策模型概述•人机协作机制概述•三支决策模型在面向人机协作机制中的应用•实验与分析•结论与展望当前,随着技术的快速发展,人工智能(AI)和机器学习(ML)在许多领域中得到了广泛应用,如自然语言处理、图像识别、智能推荐等。
然而,尽管AI和ML在许多方面取得了显著的成功,但在某些任务中,如决策分析、预测模型等,仍然存在一定的局限性。
人类专家在这些任务中具有独特的优势,但同时也存在主观性、不确定性等问题。
因此,如何将AI和ML技术与人类专家的判断相结合,形成高效的人机协作机制,已成为当前研究的热点问题。
研究内容与方法三支决策模型是一种基于人机协作机制的决策模型,它由三个基本部分组成:问题定义、方案生成和决策制定。
该模型旨在通过人机协作的方式,提高决策效率和决策质量,以解决复杂的问题和任务。
三支决策模型的定义三支决策模型的基本结构问题定义阶段方案生成阶段决策制定阶段三支决策模型的特点人机协作机制的发展历程第一阶段基于统计学习的人机协作,利用统计学和机器学习的方法对数据进行处理和分析,为决策提供支持。
第二阶段第三阶段人机协作机制的分类及特点030201人机协作机制的关键技术实现人与机器之间的自然语言交互,提高人机交互的效率和准确性。
自然语言处理机器学习分布式系统智能代理利用机器学习算法对大量数据进行处理和分析,提取有价值的信息,为决策提供支持。
实现人机之间的分布式协作,提高整体效率和性能。
实现自主、自适应、自学习的人机协作代理,提高人机交互的灵活性和智能化程度。
遗传算法粒子群优化算法基于三支决策模型的智能优化算法利用三支决策模型,根据任务的特点和需求,实现高效的任务调度和分配,提高任务完成的速度和质量。
多智能体任务分配算法结合三支决策模型,实现更稳定、更公平的多智能体任务分配,提高任务完成的效果和满意度。
任务调度算法基于三支决策模型的任务分配算法VS基于三支决策模型的决策支持系统风险决策支持系统应急决策支持系统实验设计实验目的实验方法实验环境实验结果与分析结果展示结果分析研究结论建立了面向人机协作机制的三支决策模型,实现了对复杂任务的有效决策。
序贯三支决策理论研究现状与展望作者:魏茗来源:《计算机应用文摘》2022年第24期关键词:序贯三支决策;多粒度结构;决策代价1引言三支决策是解决不确定性问题的粒计算方法,其主要思想是三分而治,即将整体分为3个部分并采取不同的决策行为处理这3个部分。
与二支决策不同,三支决策在接受决策和拒绝决策外加入延迟决策。
将研究对象划分到正域、负域和边界域中,对这三个域中的对象分别采取接受、拒绝、延迟决策。
对于无法被划分至正域或负域的对象,将其划分至边界域采取延迟决策。
延迟决策是为了进一步做出准确的决策,它需要依据更多、更有力的信息来进行下一步决策。
姚一豫教授在粒计算理论基础研究上首次提出了序贯三支决策,构建了多层次的粒度结构,粒度层由低到高,粒度由粗到细。
这种动态的决策思维方式能够很好地体现出人们在处理现实问题时所采取的循序渐进的科学的决策过程。
例如,在医学诊断中,进行初步检查后由于信息不足无法判断病人的患病情况时,我们将其划分到边界域中,待引入新的检测方法后对患者逐步检查,最终诊断出患者病情并提供相应的治疗方案。
序贯三支决策的多粒度结构适用于处理动态的、复杂的、不确定性的问题,如今广泛应用于人脸识别、情感分析、医疗诊断等领域。
2序贯三支决策模型理论基础序贯三支决策采用多层次,多阶段的思想处理问题。
对象认识的粒度由粗变细,逐渐做出准确的决策。
在多粒度结构中的某一个粒度层,在序贯三支决策中,被划分至边界域的对象,由于支撑决策的证据不足,我们采取延迟决策,并把上一层的边界域作为下一层的处理对象,继续采用三支决策进行划分,这样在多个阶段的划分中边界域的对象被逐步划分到正域或负域。
杨新等在此基础上提出了更加广义的动态三支决策框架,对每一粒度层处理对象给出了7种不同的选择情况。
具体定义如下:3序贯三支决策模型的研究现状目前,已有许多关于序贯三支决策理论方面的研究。
在原有三支决策的研究成果基础上,Yao等从多粒度的角度出发,首次构造了序贯三支决策这种动态的三支决策模型,给出了序贯三支决策的具体算法,分析得出相较于二支决策而言,序贯三支决策方法可能具有更小的决策结果代价。
决策形式背景基于OE-协调性的属性约简
常丽娜;魏玲;彭超林
【期刊名称】《西北大学学报(自然科学版)》
【年(卷),期】2024(54)2
【摘要】属性约简作为形式概念分析中非常重要的一个研究分支,在三支概念分析中也同样重要。
基于对象导出三支概念格,提出了保持决策形式背景OE-协调性的属性约简理论,丰富了三支概念分析的约简理论。
首先,定义了决策形式背景的OE-协调集和OE-约简,并将属性按其特征分为3类。
其次,指出OE-约简的本质就是极小OE-协调集,给出了OE-协调集的几个判定定理,通过研究OE-协调集的充要条件,获取OE-约简的判定定理。
最后,给出OE-差别矩阵和OE-差别函数的定义,并给出了利用OE-差别矩阵和OE-差别函数计算OE-约简的方法。
【总页数】9页(P188-196)
【作者】常丽娜;魏玲;彭超林
【作者单位】长治学院数学系;西北大学概念、认知与智能研究中心;西北大学数学学院;格拉斯哥大学亚当斯密商学院
【正文语种】中文
【中图分类】O29;TP18
【相关文献】
1.形式背景与协调决策形式背景属性约简与概念格生成
2.基于决策规则的形式背景属性约简
3.决策形式背景基于三支决策规则的属性约简
4.基于决策规则的决策形式背景的属性约简
5.基于OE-概念格的形式背景属性约简
因版权原因,仅展示原文概要,查看原文内容请购买。
1740 引言三支决策(Three-way Decisions,3WD)是姚一豫教授提出的一种分析和解决复杂决策问题的理论[1]。
其主要思想是“三分而治”和“化繁为简”,将整体分为三个独立的部分,根据收集到的信息对不同的部分采用不同的处理策略[2]。
目前,基于时间和空间两个维度,三支决策的研究可以分为静态三支决策和动态三支决策。
静态三支决策只进行一次三支决策;动态三支决策实施多阶段的三支决策,进而做出最终决策。
结合实际决策背景,如何在动态决策信息系统下建立动态三支决策模型,提高决策效率、降低决策代价是当前的热点问题。
学者们提出了序贯三支决策[3]、多粒度三支决策[4]、多分类三支决策[5]等动态三支决策模型。
在实际决策时,人们往往会随着所获信息的更替而不断改变决策方案。
尤其是在大数据时代,人们需要在尽可能短的时间内快速决策。
因此,系统地研究动态三支决策的理论、模型和应用有重要的意义。
本文对动态三支决策的基本理论、研究现状和相关应用进行综述,总结和展望其未来研究方向。
1 三支决策基本理论作为二支决策的拓展,三支决策考虑到不确定因素,引入了延迟决策。
经典三支决策模型[6]是基于贝叶斯理论进行的决策,具体描述如下:设状态空间{,}X X Θ=⌝表示对象 x 的两种不同状态,动作集合{,,}P B N A a a a =表示对 x 进行决策采取的三种不同行为,P a ,B a ,N a 分别表示对象 x 属于、不一定属于和不属于集合X 的行为。
决策时相应的损失代价函数如表1所示。
其中,PP λ,BP λ,NP λ分别表示 x 属于X 而采取行为P a ,B a ,N a 时的损失,PN λ,BN λ,NN λ分别表示 x 不属于 X 而采取行为P a ,B a ,N a 时的损失。
Pr(|[])X x 是条件概率,对于 x 来说,采取一个决策行为时的期望代价为:(|[])Pr(|[])Pr(|[])(|[])Pr(|[])Pr(|[])(|[])Pr(|[])Pr(|[])P PP PN B BP BN N NP NN R a x X x X x R a x X x X x R a x X x X x λλλλλλ=+⌝⎧⎪=+⌝⎨⎪=+⌝⎩。
三支决策与OBE结合的计算机组成原理课程教学探究随着信息技术的快速发展,计算机科学与技术的教育已经成为了当今教育领域中的重要一环。
而在计算机科学与技术教育的核心课程之一——计算机组成原理课程,如何结合三支决策和OBE(Outcome-Based Education,目标导向教育)的理念来进行教学探究,便成为了关注的焦点。
本文将着重讨论如何利用三支决策与OBE结合的方式来开展计算机组成原理课程的教学探究。
一、三支决策与OBE相结合的教学理念三支决策是指由学生、教师和课程共同构建确定教学内容和方法。
在传统的教学方式中,教师通常是以“灌输式”教学为主,而学生在被动接受知识的同时缺乏主动性。
而OBE教育理念则将学生的学习结果和学生能力培养作为教学目的和评价标准的重要依据,强调学生自主学习和能力培养,并提倡基于学生的需求和兴趣,进行个性化的教学设计。
在计算机组成原理课程的教学中,我们可以将三支决策与OBE相结合,让学生、教师和课程共同参与决策过程,以学生的发展为中心,从而形成一种更加灵活、多元的教学模式。
在这种模式下,教师可以根据学生的基础知识和兴趣,设计出更加贴近学生需求的教学内容和方法,进而促进学生的学习积极性和学习成效。
1. 教师:教师在教学中可以充分考虑学生的实际情况和需求,灵活调整教学内容和方法。
可以采用案例教学法,引导学生结合实际案例来理解课程中的概念和原理;或者利用多媒体技术,设计生动有趣的课堂教学,激发学生的学习兴趣。
教师也可以根据学生的实际能力水平,采取个性化辅导的方式,帮助学生解决学习中的问题,提高学习效果。
教师还可以及时获取学生的反馈信息,积极调整教学策略,不断改进教学方法,以更好地适应学生的需求。
2. 学生:学生在学习过程中,可以通过选取课程方向、选课和考核方式等方式,参与到教学过程中。
学生可以在选取课程方向时,根据自己的兴趣和职业规划,选择适合自己的课程方向;在选课时,根据自己的学习能力和兴趣爱好,合理选择课程,从而激发学习动力。
三支决策基于粗糙集与粒计算研究视角在决策问题中,粗糙集和粒计算是两种重要的决策方法。
粗糙集理论是由波兰学者Zdzisław Pawlak于1982年提出的一种模糊集理论,其主要思想是通过划分决策属性值之间的粗糙程度来对决策对象进行分类,从而实现决策的目的。
粒计算是一种模型或工具,用于处理信息的随机性、不确定性和不完全性,它模拟了人类在面对模糊、局部性和模式的信息时的认知过程,可以用于决策问题的分析和解决。
在研究视角中,粗糙集和粒计算可以相互结合,实现更好的决策效果。
粗糙集通过划分属性值的粗糙程度来对数据进行分类,然后根据决策的目标,进行决策对象的选择。
而粒计算则是在粗糙集的基础上,进一步考虑数据的模糊性和不确定性,对数据进行模糊处理,以提高决策的准确性和可靠性。
粗糙集与粒计算结合的决策方法可以分为三个步骤:数据处理、知识提取和决策生成。
首先,通过粗糙集的方法,对数据进行处理,划分出决策属性值之间的粗糙程度,得到决策属性的一组模糊集合。
然后,利用粒计算的方法,提取出决策属性值之间的模糊关系,并根据这些关系进行决策的生成。
最后,通过对决策结果的评估和优化,得到最终的决策结果。
在实际应用中,粗糙集和粒计算可以应用于各个领域的决策问题。
例如,在医疗领域中,可以利用粗糙集的方法,对患者的病情进行分类,然后结合粒计算的方法,进一步考虑患者的模糊性和不确定性,制定个性化的治疗方案。
在金融领域中,可以利用粗糙集的方法,对股票市场的变化进行分类,然后结合粒计算的方法,考虑股票市场的模糊性和不确定性,制定相应的投资策略。
粗糙集与粒计算的结合在决策问题中具有很大的潜力和优势。
通过对数据的处理和知识的提取,可以更好地理解决策对象的特征和属性,从而制定出更准确、可靠的决策方案。
同时,粗糙集和粒计算的方法都考虑了数据的模糊性和不确定性,可以应对现实世界中复杂、多变的决策环境,提高决策的效果和质量。
总之,粗糙集与粒计算是两种重要的决策方法,在研究视角中可以相互结合,实现更好的决策效果。