基于区间型符号数据的群组推荐算法研究
- 格式:pdf
- 大小:293.57 KB
- 文档页数:5
区间值群组决策专家权重微调整方法冯源;张晓慧;曹月静【摘要】针对多属性群决策理论中专家权重如何确定的问题,提出了基于区间值群决策专家权重微调整方法,是对“群组决策专家权重微调整方法”的扩展研究.专家对方案偏好的测评信息为区间数,利用平均值、标准差对每个区间的左、右端点逐次进行微调整,得到专家权重.其中创新之处是当方案综合评价值相同,难以区分排序时,根据标准差进一步来衡量方案的优劣,最终取得理想的方案排序.通过实例表明该方法简便有效.【期刊名称】《吕梁学院学报》【年(卷),期】2019(009)002【总页数】7页(P23-29)【关键词】群决策;区间值;标准差;微调整【作者】冯源;张晓慧;曹月静【作者单位】太原师范学院数学系,山西晋中030619;太原师范学院数学系,山西晋中030619;太原师范学院数学系,山西晋中030619【正文语种】中文【中图分类】TP390 引言对于多属性群决策理论中专家偏好信息为区间型问题的研究,学术领域已取得了不少的研究成果,提出了诸多方法.如文献[1]中采用构造目标规划模型和线性规划模型集结偏好信息;徐泽水在文献[2]中和文献[3]中采用专家的测评信息分别以区间模糊与乘性偏好关系来排序;李磊将每位专家根据偏好信息构造的判断矩阵,应用了模拟植物生长算法(PGSA)[4]将其转化为相对应的二维平面点集.综合各学者所提的基于区间值偏好信息的多属性群决策问题的计算方法可以归结为如下几种:线性规划法、基于多目标线性规划方法、利用区间数乘法法则、累积综合评价值法、转化为单点值法.本文提出一种基于区间值群组决策专家权重微调整方法,该方法在文献[5]的基础上,当专家的偏好信息从经典数据集转化为区间数集时,利用平均值、标准差对专家偏好信息的左右端点逐次进行微调整,直到对所有的专家偏好信息调整完为止.该方法没有对数据进行较多的转化,保留了数据的原始信息,同时是对文献[5]的微调整方法中离差、平均离差基础上的拓展研究,并且可以用EXCEL工具进行求解,算法操作简单.最后通过算例验证该方法计算过程简单,有利于进一步提高决策效率.1 预备知识[6]1.1 区间数的定义、相关定理及性质若a=[a1,a2]={x|a1≤x≤a2},那么a被称为一个区间数,且a1与a2分别被称为该区间数a的下界与上界,特别地,若a1=a2,a退化为一个实数.设P为每一元素都是区间数的集合,有P=K∪B,其中,K表示P中可比较区间数的集合,B表示P中不可比较区间数的集合,“不优于”用符号“≼”来表示,“劣于”用符号来表示,对任意的a,b∈P,ab⟺a≼b且a≠b.定义1 若区间数a=[a1,a2],b=[b1,b2]存在a1≤b1,a2≤b2的关系,则a,b被称为可比较区间数.定义2 若区间数a=[a1,a2],b=[b1,b2]存在a1>b1,a2<b2的关系,则a,b被称为不可比较区间数[7].定理1 设带区间数的偏序集合P,若存在a,b∈P(是P中不可比较的)且有则ab;反之,如果则a≻b.若存在且a2<b2,则ba.该定理说明通过两个不可比较区间数的区间均值的大小比较,可以很明确的给出这两个区间数的优劣关系.1.1.1 区间数的性质[8]:设区间数a=[a1,a2],b=[b1,b2],对于任意的实数β,λ则性质1①a+b=[a1+b1,a2+b2]②a-b=[a1-b1,a2-b2]③④ab=[a1b1,a2b2]⑤⑥若λ≥1,则logλa=[logλa1,logλa2];若λ<1,则logλa=[logλa2,logλa1]性质2若a=[a1,a2] ,b=[b1,b2],β>0,β1>0,β2>0则①a+b=b+a②β1a+β2a=(β1+β2)a③βa+βb=β(a+b)④ab=ba⑤(ab)β=aβbβ⑥aβ1aβ2=aβ1+β21.1.2 区间数大小的比较定义3 对于任意区间数a=[a1,a2],则为a的均值.定义4 若任意给定区间数a=[a1,a2],则a的加权平均值为E°[a]=α1a1+α2a2,其中α1,α2∈[0,1],且α1+α2=1.当时,定义退化为定义1.在区间数的均值相同情况下,考虑它左右端点的数据不同,必然会对方案的影响程度改变,通过利用给定权重值之间存在差异,比较区间数的大小转化为比较加权平均值衡量.1.2 几种专家赋权法及比较研究群决策结果很大程度依赖专家权重与属性值,二者的变动都改变着决策最终趋势.已有的关于区间值属性权重问题的研究方法中,文献[8]中针对属性值为区间粗糙数利用灰色关联分析的思想方法确定属性表达式;文献[9]中把区间数变化成效益型三元联系数形式,然后对其进行决策建模;文献[10]中的新方法是先构造了一个区间数上下界偏差函数,然后利用偏差越小越利于决策的原则,将区间权重向量变换成确定性的权重向量;文献[11]中通过构造得分函数和精确函数,在此基础上构造转换函数,由此将区间值比例二元组和区间数之间的关系相互转变,最后通过有序加权几何算子来计算属性权重.这些方法都各有优点,但计算过程相对复杂,需要的信息量大,影响决策效率.研究基于区间数形式的群决策问题,已有不少前辈对最终评分值的获得方法进行了探究,在权重与属性都为区间数的决策方法已有成果如下:为了方便起见,作以下标记:Y={y1,y2,…ym}:m(≥2)个决策方案的集合;A={a1,a2,…an}:n(≥2)个属性或(指标)的集合;表示属性权重的集合以区间数给出),其中方案Si在第j个指标下的指标值(1)根据区间数乘法法则[12];该方法的核心理论是:利用区间数的乘法法则.设a=[a1,a2],b=[b1,b2],则区间数a与b的“·”运算定义如下:[a1,a2]·[b1,b2]=[min(a1·b1,a1·b2,a2·b1,a2·b2),max(a1·b1,a1·b2,a2·b1,a2·b2)]方案S(yk)的综合评价值(2)分析:此方法不仅计算量少而且简便合乎情理.但可能会出现这种情况:不同的评分方案,最终计算的得分相同.(2)通过构造多个线性目标规划模型法来获取最终得分[13];该方法的核心理论是:设上述根据多属性加权平均法计算S(yk)的与分别是属性权重向量左右端点的综合评价值,运用下列线性规划模型:(3)(4)分析:运用(2)求解综合评价值的优点在于可以得到的涵盖每个方案的取值范围,但是要解出所有方案的综合评价值时必需计算2 m个构造的线性规划模型,增加了求解负担.而且,每求解一次方案的时,会产生两组不同的导致权重向量不相等的情况.(3)累积综合评价值法[14];该方法的核心理论是:根据如下定义的二重积分公式获得方案的综合评价值.公式如下:(5)分析:将权重值构成的区间作为一重积分区域,属性值构成的区间作为二重积分区域,根据求解二重积分的方法来获取各方案的最终评价分数.此方法是把权重和属性向量都是单值拓展到二者分别都是区间数上,综合得分的获取利用无限多个单值的相乘再对其进行再相加.上述所提的基于多个线性目标规划模型的方法、基于区间数乘法法则方法、基于二重积分的方法、转化为单点值法,应用了更为广泛的数学理念,有其自身的优点,但存在不足.例如虽然转化为单点值法除去了繁琐的区间之间计算法则,但是转化的有前提条件,即转化后的实数属性值必须与转化前区间数属性值大小一致,所以,在方案和属性的个数比较多的情况下,转化为单点值法求解会麻烦.基于上述分析,本文提出通过求平均值与标准差的方法,该方法不仅使决策过程整体趋势更为直观,而且操作简便易于着手.2 区间型专家权重赋值算法2.1 问题描述假设集合E={e1,e2,...,et}(t≥3)表示为参与决策的专家集,t为参与决策评分的专家个数,集合Y={y1,y2,…,yv}表示参与决策的备选方案集,v(v≥2)表示参与决策的备选方案个数有v个,A={a1,a2,...,as}(s≥1)是方案的有限属性集合,s表示属性的个数.集合w={w1,w2,…,wt}为专家的初始权重向量,且满足表1为所有参与决策的t位专家对第k个方案的每一种属性测评信息表,其中表示为第j个专家针对方案k的第i个属性的评分信息的区间数,记为(1≤j≤t).由测评信息表构成的测评信息矩阵用A表示.表1 方案测评信息表yke1e2…eta1[ak11,bk11][ak12,bk12]…[ak1t,bk1t]a2[ak21,bk21][ak22,bk22]…[ak2t,bk2t]……………as[aks1,bks1][aks2,bks2]…[akst,bkst]2.2 数值型群组决策专家权重微调整方法[5]假设测评信息矩阵中的元素为计算步骤如下:(1)计算评分向量的均值(2)计算向量相对于均值的离差向量(3)计算离差平均值(4)计算专家权重的调整量用公式(5)对专家权值微调整,获取新的专家权重向量[w1,w2,…wt],根据如下公式计算:(6)若仍有未输入数据,则令k=k+1与i=i+1并返回步骤1,否则结束.2.3 基于区间型专家权重的微调整方法步骤假设初始专家的权重向量为[w1,w2,…wt],用如下步骤对其微调整:步骤1:确定均值.计算所有这t位专家对方案k的第i个属性的平均评分;假设评分向量其中,(1≤j≤t).则,左、右端点的平均评分分别为:(6)其中表示评分向量区间左右端点的平均评分.步骤2:计算相对于的离差向量(7)其中体现了各变量偏离平均位置的程度.步骤3:计算向量与向量的标准其中(8)这里使用标准差是为了进一步给出方案优劣排序.在文献[5]中所提的方法会出现专家综合评价值相同的情况,但作者并未提出进一步的解决方案.比如当方案最终排序为y4=y2≻y3≻y1.因此,本文通过使用标准差来衡量方案的离散趋势,即出现y4=y2时,在方案4与方案2的测评信息矩阵中分别选取左端点中最小的e与右端点中最大的e,构造区间数与应用公式(8)并根据定理1对其进行比较,若区间标准差较大,则排序靠后;反之,排序靠前.步骤4:计算每一位专家的权重调整量:(9)鉴于考虑到比值不超过1,分母改为离差中的最大数.本文的不同之处在于由于上述公式可以改写为下式:(10)考虑到可以用个体评分到集体制评分的均值距离远近作为权重调整的依据,这里将分数项右边的整体看作调整因子.以平均数作为衡量标准,若专家给出的分数靠近均值时,称这类专家的打分精确性高,应赋予一个大的权重值,于是在原来的基础上增大权重;反之亦然.关于α的取值,根据参考文献[5],取其中s是群组决策问题的属性个数,v是方案个数,t是专家个数.步骤5:经过调整获得新的专家权重向量[ω1,ω2,…ωt],其中公式计算:(11)用公式(12)确定最终的区间值专家权重向量.(12)步骤6:输出专家权重向量[ω1,ω2,…ωt],结束.此算法仍保持如下两条性质:(1)总的权重调整量之和为0.即证明:以左端点为例因为所以特别地,当评分向量中的时,即专家所给的测评信息矩阵中存在一个区间数的左右端点相同,则该元素从区间型变为数值型,根据2.1的定义可知区间数退化成实数.例如:某次多属性决策中有5位专家进行打分,测评信息表中既有区间数又有纯数字,以表中的某一行{[6,6],[7,8],[3.5,4],[7,7],[2.5,3]}为例,则由定义2.1可知[6,6]=6,[7,7]=7,即信息表中此行区间数退化等价于{6,[7,8],[3.5,4],7,[2.5,3]},则此方法仍然适用,文献[5]所提出的方法可视特例.3 实例分析研究某院校即将毕业的学生年度学业奖学金等级测评排序案例.为此邀请五位研究生导师对四个学生的学习成绩,论文质量,综合素质,在校表现四方面考核.则将其转化为五位专家e1,e2,e3,e4,e5对四种方案方案y1,y2,y3,y4的四个属性a1,a2,a3,a4进行测评.若此次参与评分的专家打分由于多方因素综合考虑后用区间数表示,即测评表中的评分为区间值,获取其中基本信息,并根据测评信息表构成评分矩阵为Ai,如下分别是由测评信息表构造的矩阵A1,A2,A3,A4,其中这Ai为五位专家对第i个方案的评分矩阵.按照算法步骤:第一次左端点经过微调整后得到的调整量为:(-0.008235,0.004952,0.008375,0.005140,-0.010230)第一次右端点经过微调整后得到的调整量为:(-0.008874,0.005488,0.006221,0.007953,-0.010789)第二次左端点经过微调整后得到的调整量为:(0.005090,-0.006814,-0.024550,0.010838,0.015436)第二次右端点经过微调整后得到的调整量为:(0.001650,-0.006275,-0.018570,0.009922,0.013272)第三次左端点经过微调整后得到的调整量为:(-0.029595,0.009660,-0.020644,0.030467,0.019675)第三次右端点经过微调整后得到的调整量为:(-0.035172,0.008054,-0.026096,0.019015,0.034203)第四次左端点经过微调整后得到的调整量为:(0.010375,0.025673,-0.027643,0.040737,-0.049142)第四次右端点经过微调整后得到的调整量为:(-0.003629,0.144627,0.015280,0.037489,-0.033043)再利用公式(11)得到:利用公式(12)求得经过第四轮微调整后左调整量与调整量的平均值得到最终专家权重为:避免冗余简便书写,上述调整量规定只保留小数后三位,由于考虑所以在第4次调整后计算时用公式获得.通过计算,专家权重的值为:[0.166,0.223,0.141,0.281,0.189].结合先验知识给定属性权重分别为30%,10%,30%,30%,根据加权平均公式(13)和(14)获得各方案的最终得分.(13)其中S(yk)表示第k个方案的最终得分.经过计算四个方案的综合得分分别是5.31,5.83,5.34,5.91.因此方案的综合排名为y4≻y2≻y3≻y1.该方法也说明在尽量保持原始数据的基础的原则下,利用平均数、标准差的方法对具有不确定性多属性决策问题进行排序,具有更简便易于理解的优点.4 结论研究专家偏好信息是区间型的多属性决策问题,提出了区间值专家权重微调整方法,该方法是对文献[5]中群组决策专家权重微调整方法的拓展研究.同时,还具有如下特点:(1) 具有处理混合型数据的能力,即当专家所给的评分矩阵中元素既有实数,又有区间数时,都可以用此方法来解决.(2)标准差的应用,是对方案排序的第二判别,即方案综合评价值相同时,可通过比较标准差的大小来取得理想的排序.(3)尽管研究的是属性值和专家偏好值都是实数的情形,但是本文所提的方法,可以推广语言型、模糊型等领域.参考文献:【相关文献】[1]徐泽水.区间值模糊信息的集成及其在决策中的应用[J].控制与决策,2007(27).XU Z S.Multiple-attibute group decision making with different formats of preference information on attributes [J].IEEE Transactions on Systems Man & Cybernetics-PartsB,2007(6).XU Z S,CHEN J.MAGDM linear-prograrmming modles with distinct uncertain prepreference structures[J].IEEE Transactions on Systems Man & Cybernetics Parts B,2008(5).[4]李磊,王玉倩.确定多属性群决策专家权重的一种新方法[J].统计与决策,2017(3).[5]冯源,宋词.群组决策的专家权重微调整方法[J].计算机工程与应用,2016(24).[6]宋晓辉.基于区间数的多属性决策方法研究[D].四川:西南交通大学数学系数学研究所,2011.[7]侯景亮,李远富,迟红娟.不确定多属性决策中区间数排序的一种新方法[J].数学的实践与认识,2017(18).[8]赵焕焕,菅利荣,刘勇.区间粗糙数的多属性决策方法[J].运筹与管理,2016(2).[9]陆广地.基于联系数几何特性的区间数多属性决策[J].数学的实践与认识,2017(18).[10]韦美雁.一种基于最小偏差的联系数多属性决策方法[J].数学理论与应用,2016(1).[11]焦志敏,张慧,李伯权.区间值比例二元组语言集成算子及其决策方法[J].计算机工程与应用,2017(5).[12]董春游,王辉鹏,胡晓峰.区间数不确定性多属性决策方法应用研究[J].应用能源技术,2009(5).[13]张全,樊治平,潘德惠.不确定性多属性决策中区间数的一种排序方法[J].系统工程理论与实践,1999(5).[14]郭秀英.区间数多指标决策的一种新方法[J].西南石油大学学报(社会科技版),2009(1).。
基于区间的时间序列分类算法的研究
区间时间序列分类算法是一种应用于时间序列数据的数据挖掘技术。
传统的时间序列
分类算法主要是基于单个时间点上的数值来进行分类,而区间时间序列分类算法则是考虑
了时间序列中的区间信息,能够更全面地分析时间序列数据,提高分类的准确性和稳定
性。
1. 区间定义:区间时间序列是指在一段时间内的时间序列数据,而不仅仅考虑单个
时间点的数值。
区间可以是连续的,也可以是离散的。
研究中需要确定如何定义区间,以
及如何选择合适的区间宽度。
2. 区间相似性度量:区间时间序列数据之间的相似性度量是算法研究的关键。
传统
的相似性度量方法主要是基于距离度量,如欧氏距离、曼哈顿距离等。
但是这些方法对于
区间时间序列数据并不适用,因为区间时间序列数据有不同的区间宽度和长度。
需要研究
新的相似性度量方法,以适应区间时间序列的特点。
4. 实验评估:为了评估区间时间序列分类算法的效果,需要进行一系列的实验。
实
验中需要选择合适的数据集,包括真实数据和合成数据,以及合适的评估指标,如准确率、召回率等,来评估算法的分类性能。
还需要与其他传统的时间序列分类算法进行比较,验
证区间时间序列分类算法的有效性。
目前,区间时间序列分类算法还存在一些挑战和问题,例如:区间定义的问题、区间
相似性度量的问题、分类器设计的问题等。
未来的研究还需要继续深入探讨这些问题,并
提出更好的解决方案,以提高区间时间序列分类的准确性和稳定性。
基于区间的不确定性优化理论与算法摘要:本文将介绍基于区间的不确定性优化理论与算法,并对其在各个领域的应用进行讨论。
针对不确定性问题的特点,我们提出了基于区间的优化方法,并介绍几种最优解的求解算法,这些算法广泛应用于不同领域的决策问题中。
我们也介绍了一些挑战和未来的研究方向,例如使用模糊数和区间矩阵进行最优化解的求解,以及对原始问题有更加准确的估计方法和数值算法的研究。
关键字:区间分析;不确定性优化;最差和最优情况一、序言不确定性问题广泛存在于各个领域,如工程、金融、军事和社会。
例如,在工程领域中,我们可能不知道一些系统变量的值,或者无法估算某些参数的精确值。
在金融领域中,未来的市场变化不确定,而在军事领域中,与敌方的互动不可预测。
有许多决策问题需要考虑到这些不确定性,而不确定性优化是寻找在不确定情况下最优决策的方法。
不确定性问题很大程度上依赖于概率分布、随机模型和贝叶斯方法。
然而,尽管这些方法在某些情况下很有帮助,但它们在处理一些实际问题时存在一些困难,这是由于这些方法要求输入的数据必须良好定义,因此可以容易地进行模型估算。
然而,在许多情况下,我们只知道一些不确定的事实或条件,这种情况下,建立数据模型和分布的相关性就很困难了。
基于区间分析的不确定性优化帮助我们更好地解决这种情况。
区间不确定域是由下限和上限之间的范围定义的。
基于区间的不确定性优化方法是通过在区间域内寻找最优解来解决决策问题。
与概率分布不同,区间方法需要定义一个上限和下限,并在这个范围内评估问题的解决方案。
由此产生的结果是一些保证该方案解决方案是不容易超越或更优解的结果。
本文将介绍基于区间的不确定性优化方法,包括一些最优解求解算法和应用领域。
此外,我们还将研究该方法的局限性和未来的研究方向。
二、区间分析区间分析是数学中的一种方法,用于量化变量不确定性。
在区间分析中,一个变量可以用两个数(上限和下限)来定义。
对于一个实数a,靠近零的范围可以写为[a-b,a+b],其中b是正实数“误差”项。
基于符号表示的时间序列分类综述武天鸿; 翁小清; 单中南【期刊名称】《《河北省科学院学报》》【年(卷),期】2019(036)003【总页数】10页(P11-20)【关键词】时间序列; 符号表示方法; 符号序列分类【作者】武天鸿; 翁小清; 单中南【作者单位】河北经贸大学信息技术学院河北石家庄 050061【正文语种】中文【中图分类】TP391.40 引言时间序列通常是指按时间顺序排列而成的一组数据,任何有序的实值型数据都可以当作时间序列处理[1]。
时间序列分类是数据挖掘的基本任务之一,是指根据训练集中对象所构建的分类模型判别被分类对象所属的类别[2]。
时间序列分类已经被广泛应用于模式识别、医疗诊断、工业控制、异常检测等生活的各个方面,时间序列数据维度高,分类难度大。
时间序列符号表示是指在保持和反映时间序列数据基本特征的前提下,将高维多噪声的连续实值型数据表示成低维直观的符号序列数据。
时间序列符号表示方法不仅具有简单、高效和离散化的优点,还可以有效消除噪声,使时间序列具有较强的可读性,允许研究人员利用来自文本处理、信息检索和生物信息学等领域的算法。
基于符号表示的时间序列分类方法具有更高的分类性能和效率。
本文从基于趋势、基于聚类或进化计算、基于文本、基于频率域等方面,对符号时间序列分类的研究进行了比较归类,并简要介绍了其在实际中的应用。
1 基于趋势的符号表示方法Lin等 [3~4]提出的符号聚合近似表示方法SAX (Symbolic Aggregate approXimation)是一种经典的时间序列符号表示方法。
SAX首先利用PAA方法将规范化后的时间序列(均值为0,标准差为1)分段求均值,且假设PAA值服从高斯分布,根据高斯曲线下的分段点将PAA值离散映射到相应符号空间。
SAX方法虽然简单高效,能够较好地体现时间序列的整体趋势,但是仅用分段的均值并不能很好的描述时间序列的局部特征,无法区分具有相同均值不同趋势的时间序列,完全不同的时间序列可能会得到相似的符号表示,且该方法只适于服从高斯分布的时序数据。
科技与创新┃Science and Technology&Innovation ·98·2023年第24期文章编号:2095-6835(2023)24-0098-03基于RippleNet的推荐算法研究综述韩耀宇(太原理工大学,山西太原030600)摘要:研究人员提出了推荐系统来降低信息过载的副作用,使得人们快速寻找高价值的有用信息。
针对RippleNet算法的改进方法进行阐述,对它们的性能进行了对比,并对如何改进这类推荐算法进行了总结。
关键词:推荐算法;偏好;RippleNet;知识图谱中图分类号:TP391.1文献标志码:A DOI:10.15913/ki.kjycx.2023.24.028传统的协同过滤算法得到了广泛的应用,其清晰直观,又具有很强的解释性,但是存在数据稀疏和冷启动的问题,模型的泛化能力也有待提高,于是与知识图谱的结合成为解决此问题的办法。
目前,涌现出许多成功的知识图谱模型,如NELL1、DBpedia、Google Knowledge Graph等,通过应用这些模型完成了许多单词处理和文本分类的工作。
在RippleNet算法出现以前,知识图谱的应用可以分为2种类型,即基于嵌入的方法和基于路径的方法。
首先是嵌入方面,人们发现项目与项目的关系不是简单的通过内积便能表示;其次是路径方面,路径需要人们亲历亲为设计,这显然并不符合当下的机器学习思想。
为了解决上述问题,RippleNet算法被提出。
它将偏好传播类比成实际中雨滴落在水面上产生的波纹,多个“波纹”同时扩散形成的波纹便是用户的喜爱实体集合。
因此,知识图谱的应用出现了第三种类型,即基于传播的方法。
本文对于现有的基于RippleNet 算法模型的改进进行了总结,并通过阅读相关文献,讨论了改进的3个方面。
1理论分析本文主要讨论了融合知识图谱的RippleNet推荐模型优化的相关知识[1]。
1.1知识图谱知识图谱是揭示实体之间关系的网络。