基于向量夹角余弦的几何平均组合预测研究
- 格式:pdf
- 大小:213.54 KB
- 文档页数:6
组合预测模型与方法研究综述陈华友;朱家明;丁珍妮【摘要】预测精度和预测风险是预测学研究的核心问题.从信息互补的角度,组合预测提供了一条有效的途径.本文综述了组合预测的模型与方法的分类、权重计算方法、模型构建方法,并对最优子模型的选择等问题进行综述和探讨,最后展望了在不确定环境下组合预测方法和未来的研究方向.【期刊名称】《大学数学》【年(卷),期】2017(033)004【总页数】10页(P1-10)【关键词】组合预测;集成算子;子模型选择;智能预测【作者】陈华友;朱家明;丁珍妮【作者单位】安徽大学数学科学学院,合肥230601;安徽大学数学科学学院,合肥230601;安徽大学数学科学学院,合肥230601【正文语种】中文【中图分类】O212.1“凡事预则立,不预则废”,科学的预测能为各部门的科学决策提供重要的理论支撑.在实际预测中,复杂预测系统广泛存在,该系统包含诸多随机或模糊等不确定性因素.传统的单项预测模型存在一些缺陷.例如,单个预测模型考虑因素有限,因此一个模型的信息利用不够全面;另外,预测模型的表达形式有线性或者非线性形式之分,这种表达形式的错误选择会导致系统误差,预测风险由此产生.因为不同的单个预测模型考虑不同的因素变量,这些变量含有不同的信息,它们均能从各个层面体现同一个复杂预测系统的发展状态,因而这些信息是有关联的,并且在一定的程度上起到信息互补的作用.因此,组合预测[1]的概念是由Bates和Granger首先提出的.在预测实践中,它确能提高预测的精度.组合预测成为国内外预测领域研究的热点问题之一[2-8].诺奖获得者Granger [6]和国际著名的预测专家Armstrong[7]在各自主编的教科书中均用一章的篇幅来介绍组合预测模型.国际重要的预测学术刊物出版了专辑探讨了组合预测模型[9-15].此后,相关的专著和文献[2-5]介绍不同目标函数准则下的组合预测的建模方法以及相关性质的研究,有兴趣的读者可以参阅. Kapetanios等[16]研究了英格兰银行对通胀和产量等统计数据的组合预测;Andrawis等[17] 建立了短期和长期的预测模型,并利用组合预测方法预测了埃及的入境的旅游人数;Chan等[18]利用质量控制中“累积和”技术来更新组合预测的权重,对来自10个国家和地区到香港旅游的82个季度数据进行了预测;Martins等[19]对具有相关性误差和不具有相关性误差的组合预测模型进行了比较分析.组合预测还可以帮助有关部门制定相关政策和计划,这与我们日常生活息息相关.如:组合预测在商业银行信用风险评估[20],医院门诊量预测[21],电力负荷中预测[22-24],税收收入预测[25],网络舆情预测[26],选举问题中的预测[27]以及能源消费预测[28-29]等领域.因此,研究组合预测模型理论与方法不仅在理论上具有重要的学术价值,而且在实践中也具有广阔的应用价值.本文系统综述和探讨组合预测方法的几个主要研究的问题.(i) 分类问题;(ii) 组合预测最优权重的计算方法,以及非最优权重的计算方法;(iii) 利用信息集成算子来建立组合预测模型;(iv) 利用相关性指标作为精度指标来建立组合预测模型;(v) 在模糊信息环境下建立组合预测模型;(vi) 智能组合预测模型的构建;(vii) 在组合预测模型中,如何最优选择子模型达到最佳组合,并展望不确定环境下组合预测方法和未来的研究方向.分类是组合预测的一个重要问题,它有助于从不同的角度对其进行研究[4].(i) 从权重的计算方法角度,组合预测有最优权重和非最优权重之分.最优组合预测就是权重满足归一化的约束条件下,按照极小化某种误差准则或者极大化某种精度准则来构造目标函数,从而计算出组合预测的权重.最优组合预测可以表示成如下数学规划问题:(ii) 从构建的函数关系角度,组合预测有线性和非线性之分.设k1,k2,…,kn为组合预测加权系数,满足.若组合预测值f=k1f1+k2f2+…+knfn,则称f为线性的.若组合预测值f=φ(f1,f2,…,fn),其中φ为非线性函数,则称其为非线性的.例如,加权几何平均形式组合预测或加权调和平均形式当然按加权系数是否有动态变化特征,组合预测有固定权和变权之分;从组合预测与单项预测结果的优劣角度,组合预测方法有非劣性和优性之分.组合预测通过某种加权平均获得集成结果,其关键是确定各个单项预测方法的权重系数.文献[3]总结了非最优组合预测模型权系数的计算方法,包括算术平均、均方误差倒数、误差平方和倒数和二项式系数等计算方法.非最优权重的优点是计算复杂度低,但是从组合预测的误差指标的结果来看,其预测效果往往不能令人满意.文献[30]利用信息论中熵值的计算公式,给出误差序列的变异程度的度量指标,由此获得加权系数.文献[31]根据各单项预测模型在组合预测中的贡献大小,按照Shapley值算法进行组合预测权系数大小的分配.即某个单项预测模型加入到组合预测中,使得组合预测的误差指标降低越多,其对应的权系数就越大.文献[32]运用信息熵理论,根据各个预测模型的误差指标来计算信息熵,给出基于熵权理论的组合预测权系数确定方法.另外,多数学者致力于研究组合预测模型中最优权重的计算方法.文献[33]通过极小化组合预测误差平方和建立组合预测模型来确定最优加权系数.文献[34] 在分析组合预测精度序列的基础上,通过优化有效性指标建立了组合预测模型.为简化计算,文中得到组合预测方法权系数最优近似解的计算公式.文献[35]定义了新的优性组合预测,探讨其存在的条件,探讨了模型权重的近似算法.文献[36]引入时间权重来反映时间序列新旧程度重要性,建立不确定性环境下的区间型组合预测模型,该模型通过最小化模拟值与实际值之间广义残差获得组合权重系数.文献[37]提出二元最优组合的迭代寻优算法获得非负权重最优组合预测的计算方法,证明了算法的收敛性和最优性.文献[38]给出了一种变权重组合预测模型权系数估计的新算法,该算法通过广义逆矩阵的循环迭代,形成收敛的权系数,进而进行组合预测.文献[64]提出了权重系数为三角模糊数的连续区间组合预测模型,推广和改进了权重为固定实数的传统组合预测模型.此外,还有一些学者从统计学角度出发,研究了权重系数的确定方法.文献[39] 从统计角度给出了权重的LS估计及其假设检验,给出了组合预测权系数的另一种算法.文献[40] 给出了非负变权组合预测权系数的Bayes极大似然估计方法,并利用非线性规划的Kuhn-Tucher条件把二次规划化问题转化为线性规划问题来求解权重系数.文献[41] 分别建立三种不同区间上的预测有效度的组合预测模型,利用线性规划模型的求解获得组合预测权重向量.文献[42] 建立了基于组合预测精度的数学期望和标准差的多目标规划最优组合预测模型,并给出其数学规划的解法.从上面的权重确定方法综述可以看出,对于权重系数为实数的情形研究已相对完善,但是针对不确定环境下的组合预测模型,其权重系数为区间数和三角模糊数情形的研究相对较少.由于不同的单项预测方法可以在不同的领域进行应用,其预测性能是“时好时坏” 的,即预测精度具有一定的不稳定性.组合预测的权重体现了该种单项预测方法的重要性程度,既然单项预测方法的预测表现“时好时坏”,其重要性程度的度量,即单项预测方法在组合预测中的权系数用区间数和三角模糊数表示会更贴切一些.因此权重为区间数或三角模糊数的组合预测模型的构建及其计算有待研究.4.1 基于信息算子的组合预测模型从信息集成的角度,传统的组合预测模型包括算术、几何和调和等三种加权平均形式.文献[43]考虑变权的思想,引入有序加权平均(OWA)算子,建立新的组合预测模型,并给出预测方法优超等概念,探讨其线性规划的求解.传统的组合预测通常假定加权平均系数是固定的.然而单项预测方法的精度随着时点出现不规则变化,因此传统的模型存在缺陷.文献[44]对各个单项预测方法在不同时点预测精度作为诱导变量,按预测精度高低利用诱导有序加权平均(IOWA)算子进行有序加权,建立以误差平方和为准则的组合预测模型,实例表明该模型能改善预测效果.文献[45]提出了有序加权调和平均(OWHA)算子,在此基础上建立诱导有序加权调和平均(IOWHA)算子的组合预测模型,由数学规划方法求解权系数.文献[46]在文献[45]的基础上,将基于IOWHA算子的组合预测模型应用在中国入境旅游中,取得了较好的效果.文献[47]建立了诱导有序加权几何(IOWGA)算子的非线性组合预测模型.文献[58]和[59]分别建立了一类广义加权多重平均组合预测模型和广义加权几何平均组合预测模型.文献[60]提出了一类具有广泛代表性的广义加权算术平均组合预测模型.文献[61]在文献[60]的基础上,从P次幂误差的概念出发,定义了广义加权算术平均组合预测优超和冗余度,探讨了该模型的最优化理论基础及其数学性质.文献[63]提出了基于密度算子的组合预测模型,该模型的特点是引入分布的疏密程度来度量预测精度.针对预测信息为区间数的情形,文献[66]建立了基于IOWA算子的区间组合预测模型.文献[67]考虑各个预测数据之间的相互影响,结合连续有序加权(COWA)算子与Power算子的特点,构建基于不确定加权Power平均(UWPA)算子的连续区间组合预测模型,研究了非劣性和优性组合预测模型等性质.文献[68]将IOWGA算子和区间组合预测模型结合起来进行建模.文献[69]从IOWHA算子的角度探讨区间组合预测.文献[70]针对总体趋势增长且离散程度大的时间序列,计算序列的级比和不同的阈值对原始数据列进行分组,建立非等时距的灰色模型,给出了一种灰色区间预测的新方法.文献[71] 基于COWA算子定义区间预测精度和非劣性等指标,以相应的误差平方和极小化准则建立了相应的区间组合预测模型.文献[72]引入IOWGA算子,以区间数端点的对数误差平方和为准则,建立两个端点的IOWGA算子的变权系数多目标最优组合预测模型,并通过引入偏好系数将其转化为单目标最优化模型进行求解.从以上综述可以看出,目前对于预测信息为实数和区间数形式的基于信息集成算子的组合预测模型及其性质的研究已相对完善,但是如何在不确定信息环境下把若干广义信息集成算子和组合预测进行有机结合,充分发挥新的信息集成算子在组合预测中信息有效融合的作用有待于进一步探索.4.2 基于相关性指标的组合预测模型传统的组合预测模型的构建大多基于某种拟合误差指标而提出的.文献[48]利用相关性指标进行组合预测建模,在某些条件下基于相关性的组合预测方法也可以取得较好的效果.在文献[48]的基础上,文献[49]和[50]分别研究了基于相关系数和灰色关联度的优性组合预测模型及其性质.文献[51]研究了基于向量夹角余弦的组合预测模型及其性质,文献[52]研究了基于Theil不等系数的组合预测模型及其性质.文献[62]建立了基于最大—最小贴近度的组合预测模型,研究其非劣性、优性和冗余信息的判定等基本性质.将信息集成算子与相关性指标相结合,已有相关文献提出一系列组合预测模型.文献[54]建立相关系数的加权几何平均的非线性组合预测模型.文献[55]建立了对数灰关联度的IOWGA算子最优组合预测模型.文献[56]提出了基于Theil不等系数的IOWGA算子组合预测模型,税收收入的组合预测实例证明其优性特征.文献[73] 利用加权几何平均算子和对数灰关联度构建组合预测模型.针对预测信息为区间数的情形,文献[53]引入IOWA算子以及相关系数概念,建立了多目标的区间组合预测模型,并探讨了模型的求解方法;文献[57] 引入向量夹角余弦,探讨对应的加权调和平均组合预测模型的数学性质;文献[65] 引入IOWHA算子与向量夹角余弦的概念,构建了联系数型区间组合预测最优化模型,实例证明了该模型的有效性.文献[74]结合IOWA算子和相关系数的概念,建立了多目标的区间组合预测模型,并探讨了模型的求解方法.文献[75] 将区间值的左右端点分别看作时序向量,根据向量夹角余弦,构建区间组合预测多目标规划模型,并转化为单目标规划问题求解组合预测权重的有效解.文献[76]建立了最大中心误差和最大长度误差绝对值达到最小的多目标区间组合预测模型,并探讨了模型的求解.以上综述可见,基于模糊环境下的相关性指标的组合预测模型的构建在相关文献中报道较少,因此,可以考虑将相关性指标扩展到模糊信息环境下,构建若干基于相关性指标的模糊组合预测模型,并探索所提出的模糊组合预测模型的非劣性、冗余性等相关有效性研究.4.3 模糊环境下的组合预测模型系统的复杂性和不确定性导致事物具有模糊特征,因此构建基于三角模糊数的组合预测符合事物的实际发展趋势.文献[77] 针对云计算环境中资源需求所具有的动态性和周期性的特点,在季节性ARIMA模型和自适应神经模糊推理系统这两种单项预测模型的基础上,利用预测精度和相似性度量这两个指标确定单项预测方法的权系数,构建基于广义模糊软集理论的组合预测模型,并对云计算环境下的资源进行需求预测.文献[78]对实际值和预测值进行模糊化,引入置信区间和模糊数的概念,通过极大化拟合度建立组合预测模糊规划模型.文献[79]通过引入多种预测方法的预测对象的变化趋势、预测相对误差和自适应调节系数等指标,探讨模糊自适应变权组合预测方法.文献[80]和[81]建立Choquet模糊积分的组合预测模型,并对中国卫生总费用进行实证预测分析,从而体现各个预测模型之间的交互作用及其重要性.文献[82]使用预测精度作为模糊隶属度函数的标准,并提出了模糊软集的组合预测.模糊组合预测模型研究才刚刚起步,可以将一些实数以及区间数组合预测模型推广到模糊环境下.例如:气温可用三角模糊数的左端点和右端点分别表示最低和最高温度,其中点表示平均温度.研究模糊组合预测模型既具有理论意义,又具有现实意义.在模糊环境下,三角模糊数是刻画事物的一种常见的不确定信息的表达形式,它弥补了实数和区间数的不足.模糊环境下组合预测模型的构建方法和有效性研究需要探索.4.4 智能组合预测模型随着计算机技术的飞速发展,人工神经网络[83-85]、模糊逻辑[86]、支持向量机回归[87-88]、遗传算法[89-90]等较为复杂的智能算法得以实现,人们将智能算法应用于组合预测,使得预测精度大幅度提高.文献[91]提出了一种基于粒子群算法的模糊神经网络组合预测模型,该模型兼具神经网络的学习机制和模糊系统的语言推理能力的优势,将其应用到短时交通流量的预测中.文献[92]融合BP神经网络算法和时间序列ARIMA模型,构建了组合预测模型来提高其预测性能.文献[93]建立了基于SVM的自回归预测模型,在此基础上,结合SVM、多项式和鲁棒自回归等单项预测模型,构建组合预测模型.文献[94]构建了基于ARMA-GM-BP组合预测模型,并预测了中国两年的GDP.尽管目前人工智能算法是一个热门研究领域,但是真正将智能算法用到组合预测中的研究尚需进一步探索,尤其如何解决智能算法在预测中出现过度拟合现象等问题,即数据拟合效果很好,而外推效果却不令人满意.当然,可以借鉴下智能算法在其他领域的应用,利用智能算法来求解较为复杂的组合预测最优化模型,或者可以将若干智能算法相互组合.在预测实践中,单项预测方法有很多种,例如,我们对旅游需求量进行预测,实际上有几十种单项预测模型,则如何选择哪几种单项预测方法进行组合是一个值得研究的问题.如果选择方法比较多,由于某些单项预测模型有可能存在重复的信息,则会降低组合预测的效率;反之,如果选择的方法少了,则会影响预测的结果,因此,单项预测方法的选取得当非常重要,在科学地选取单项预测方法的前提下的组合预测会更有意义.文献[95]引入预测有效度的概念,将单项预测模型的预测有效度按从大到小的顺序进行排序,若某个单项预测方法加入到组合模型中,不能提高组合预测有效度,在该单项预测模型就被淘汰,否则就加入到组合预测模型中;文献[96]引入单项预测模型误差之间的方差比、相关性以及预测的偏度这三个指标,把它们作为组合预测中单项预测方法遴选的依据.在方差比、相关性指标较高时,可以选择回归模型进行短期预测.而简单平均的组合预测适用于长期预测.文献[97]选择适合某预测对象的模型集合,由模型精度大小对其预测能力进行满意度的测定,从而获得其重要性程度的赋权,由此给出了一种预测模型库的遴选组合方法;文献[98]建立t统计量的包容检验,用于组合预测的单项模型的选择.被包容的模型加入到组合预测之中,会增加算法的复杂性,因此需要剔除被包容模型.文献[99]将单项预测模型根据其预测精度进行排序,在保证每个单项预测模型不被其他预测模型所涵盖的前提下进行组合.文献[100]基于互信息理论,提出一种单项预测模型的最优子集合选择算法.旅游需求预测实例表明最优子集合中的单项模型进行组合的结果明显优于所有单项预测模型参与的组合预测.文献[101]考虑到所选子模型之间的冗余信息会减少组合预测模型的优势,当子模型与实际值之间的冗余移除互信息有较大贡献时,就将其选为子模型.因此文中提出了基于最大线性相关和最小线性冗余的选择算法.文献[102]受到分类和模式识别的启发,提出了一种单项预测模型选择的动态选择算法. 从以上发展综述可以看出,研究组合预测模型中单项预测方法的选取具有重要的理论意义.从现有的文献梳理中发现,虽然现有子模型选择算法可以提高组合的效率,但是子模型的选择算法多数是逐步遴选法,当单项预测方法比较多时,计算量仍旧比较大,是否可以改进子模型的选择算法?可以考虑将单项预测方法根据其自身的特点进行分类,从每一类中选择出一个最优子模型进行组合,这有待进一步研究.文献[8]研究了最优预测群组,可以将其与最优子模型选择算法相结合来完善单项预测模型的优选.尽管组合预测模型和方法的研究和应用已有很多成果,但是在不确定环境下的组合预测模型的构建方法、模型的求解以及组合预测模型的有效性理论等问题也是未来组合预测领域研究的主题之一.(i) 不确定环境下的广义信息集成算子与组合预测模型的构建组合预测本质上是信息的融合.文献[103]探讨了多种广义信息集成算子及其在决策领域应用.广义信息集成算子及在组合预测中的研究和应用,以及在模糊环境下,广义信息集成算子的延拓和若干数学性质的研究有待于进一步探索.同时还要构建模糊信息的组合预测模型.例如;针对不同模糊信息拓展新的算子、组合预测过程中的算子选择理论、以及不同算子模糊组合预测效果的比较分析.(ii) 不确定环境下的多目标组合预测模型的有效性理论实数信息条件下组合预测模型有效性理论在文献[4]中已有论述.但是区间数信息形式下的组合预测模型和模糊环境下的多目标预测模型的有效性理论,如:模糊的组合预测的非劣性、优性的性质以及模型冗余度的判定等问题有待研究.(iii) 不确定环境下多目标组合预测模型的求解方法现有的模糊组合预测中求解多目标优化最常用的方法就是引进态度参数,把多目标优化转化为单目标求解计算,并探讨参数的变化对预测结果影响的灵敏度分析.未来可以利用人工智能算法或者模拟的方法来求解不确定环境下的组合预测模型. (iv) 不确定环境下组合预测模型中单项预测模型的选取;已有文献研究单项预测模型的选取问题,但是对于这方面的研究相对较少,而且也存在一定的缺陷,需要尝试设计出更为合理的算法来选择不确定环境下单项预测模型进行组合,提高组合预测的效率.陈华友,男,1969年生于安徽省和县.安徽大学教授,博士生导师,安徽省学术和技术带头人,安徽省教学名师.2002年在中国科学技术大学获得运筹与控制专业博士学位,2005年博士后毕业于南京大学管理科学与工程专业,2009年在美国俄亥俄州立大学做过一年访问学者.1994年至今,在安徽大学数学科学学院工作.研究兴趣包括运筹与管理,预测与决策分析,数学建模及应用等.已在国内外学术期刊上公开发表学术论文100余篇,其中在Fuzzy sets and Systems, Information Sciences,IEEE Transactions on Fuzzy Systems,Applied Mathematical Modelling,Knowledge-Based Systems,Computers & Industrial Engineering,Group Decision and Negotiation等国际学术刊物上发表SCI、EI收录的论文50余篇,在科学出版社出版专著2部.先后主持国家自然科学基金面上项目3项,2008年获得安徽省优秀青年科技基金项目,2011年荣获宝钢优秀教师奖;荣获安徽省教学成果一等奖3项.目前担任《运筹与管理》杂志编委,中国运筹学会不确定系统分会第四届常务理事,中国运筹学会青年工作委员会第九届委员.。
基于C-OWA算子与向量夹角余弦的绿色施工项目评标模型赵金先;王苗苗;李堃;范轲【摘要】绿色施工项目迅速发展,科学合理地甄选具有优秀绿色施工能力的中标单位对绿色施工项目的实施结果至关重要.在借鉴传统施工项目评标指标体系的基础上,结合绿色施工项目的特点和要求,构建了多层次的绿色施工项目评标指标体系.运用C-OWA算子实现评价指标赋权,通过计算施工项目的绿色度进行初步筛选,最终运用向量夹角余弦方法实现评标优选以及指标敏感性分析.该评标模型削弱了专家主观偏好对指标权重产生的不利影响,引入施工绿色度指标以及绿色度等级隶属表,在评标程序中增设初步筛选环节,使评选结果更加客观合理,并将向量夹角余弦与敏感性分析相结合,为投标单位指明弱项.最终,以实例验证该评标模型的可行性和实用性.%Due to the rapid development of green construction projects,scientific and reasonable selection of successful bidder which with excellent green construction ability is essential to the implementation of green construction projects. Combined with the characteristics and requirements of green construction project,this paper established a multi-level green construction project bidding evaluation index system based on the traditional construction project bidding evaluation index system. Using C-OWA operator to achieve the evaluation index weight,through the calculation of the green degree of construction project to conduct the preliminary screening,and the final use of vector angle cosine method for bidding scheme of optimization and index sensitivity analysis. The bid evaluation model weakens the adverse effects of expert's subjective preference of the index weight,and green construction index and greendegree grade membership table are introducted. Adding initial screening in evaluation procedures makes selection results more objective and reasonable,and the combination of vector angle cosine and sensitive analysis makes bidding units specify weaknesses. Finally,an example verified the feasibility and practicability of the bidding evaluation model.【期刊名称】《土木工程与管理学报》【年(卷),期】2017(034)005【总页数】7页(P39-45)【关键词】绿色施工;评标模型;C-OWA算子;向量夹角余弦;施工绿色度;敏感性分析【作者】赵金先;王苗苗;李堃;范轲【作者单位】青岛理工大学管理学院,山东青岛 266520;青岛理工大学管理学院,山东青岛 266520;青岛理工大学管理学院,山东青岛 266520;青岛理工大学管理学院,山东青岛 266520【正文语种】中文【中图分类】TU723.2近年来,我国大力推广绿色施工项目,在绿色施工项目招投标过程中,科学、合理的评标方法是招投标活动有效进行的保证,其评标质量的高低,直接影响到绿色建筑项目的实施过程和实施结果。
基于向量夹角余弦的IGOWLA算子组合预测模型姚成;袁宏俊【摘要】将向量夹角余弦和诱导广义有序加权对数平均(IGOWLA)算子相结合,构建了基于向量夹角余弦的IGOWLA算子的组合预测模型,并给出了优性组合预测的概念;最后,根据实例验证了该组合预测模型是科学的和有效的,且此模型是优性组合预测.【期刊名称】《怀化学院学报》【年(卷),期】2016(035)005【总页数】5页(P25-29)【关键词】向量夹角余弦;诱导广义有序加权对数平均算子;组合预测;优性预测【作者】姚成;袁宏俊【作者单位】安徽财经大学统计与应用数学学院, 安徽蚌埠233000;安徽财经大学统计与应用数学学院, 安徽蚌埠233000【正文语种】中文【中图分类】O224鉴于各个预测方法的优劣,在对指标数据进行预测的过程中,仅使用一种方法,势必会影响预测精度.基于这一问题,Bates和Granger提出了组合预测的概念[1].在此之后,组合预测方法被广泛应用到各个领域,同时越来越多的学者将组合预测方法作为自己的研究重点,并获得了很多有价值的成果[2-7].Yager提出有序加权平均(OWA)算子[8],但传统的组合预测方法仍存在对不同单项预测方法取固定权系数的问题,基于此,学者们从改善某种拟合误差的角度,提出了一系列基于不同算子的组合预测方法.例如,陈华友等在文献[9-11]中在以误差平方和为准则的条件下,分别依据不同的算子建立了组合预测模型,并给出了确定权系数的数学规划模型;江立辉等[12]创新性的给出了诱导广义有序加权对数平均算子(IGOWLA)的概念,并构建了根据IGOWLA算子的点预测的组合预测模型.传统的组合预测方法大都是以不断改善拟合误差平方和为基础来建立模型,从而求出权重系数,程玲华和陈华友[13]给出了依据向量夹角余弦的加权调和平均组合预测模型.本文在此基础上,结合IGOWLA算子,从向量夹角余弦出发,建立基于向量夹角余弦的IGOWLA算子最优组合预测模型,并给出了针对该模型的优性组合预测的概念,最后,根据实例验证了该组合预测模型是科学的和有效的.1.1 IGOWLA算子定义1[8] 设OWAw∶Rm→R为m元函数,设W=(w1,w2,…,wm)T是与OWAw有关的权重向量,满足≥0,i=1,2,…m,若,将a1,a2,…am由大到小进行排序,其中第i个数即为bi,在此称OWAw是m维有序加权平均算子,记为OWA算子.定义2[14] 设〈v1,a1〉,〈v2,a2〉,…,〈vm,am〉为m个二维数组,令则在此称IOWAw为基于v1,v2,…,vm的m维诱导有序加权平均算子,记为IOWA算子,其中vi是ai的诱导值.将v1,v2,…,vm由大到小进行排序,则第i个数的下标即为v-index(i),W=(w1,w2,…,wm)T是IOWA的权重向量,满足≥0,i=1,2,…,m.定义3[15] 若函数GOWLAw∶Rm→R为m元函数,W=(w1,w2,…,wm)T是与GOWLAw有关的权重向量,满足≥0,i=1,2,…,m,若在此称GOWLAw是m维广义有序加权对数平均算子,记为GOWLA算子,将a1,a2,…am由大到小进行排序,其中第i个数即为bi,λ∈(-∞,0)∪(0,+∞).定义4[12] 设〈v1,a1〉,〈v2,a2〉,…,〈vm,am〉为m个二维数组,若函数IGOWLAw∶Rm→R为m元函数,W=(w1,w2,…wm)T是与IGOWLAw有关的权向量,满足≥0,j=1,2,…,m,若有则称函数IGOWLAw是m维广义有序加权对数平均算子,简称IGOWLA算子,其中v-index(i)是v1,v2,…,vm中第i大的元素所对应的下标,v1,v2,…,vm称为诱导变量,λ∈(-∞,0)∪(0,+∞).特殊地,若λ=1时,IGOWLA算子退化成IOGWA 算子.1.2 基于向量夹角余弦的IGOWLA算子组合预测模型假设某指标数据的实际值为xt(t=1,2,…,N),此指标数据可以通过m种单项预测方法进行预测,xit是第i种预测方法t时刻相应的预测值(i=1,2,…,m;t=1,2,…,N).定义5 称vit为在第t时刻第i种预测方法相应的预测精度,满足由(4)式知vit∈[0,1],将vit记为xit的诱导值,因此,第t时刻可以得到预测精度和其对应的预测值的m个二维数组〈v1,x1〉,〈v2,x2〉,…,〈vm,xm〉.设W=(w1,w2,…wm)T为IGOWLA算子中m种不同预测方法的加权向量,将第t 时刻m种预测精度数据列v1,v2,…,vm由大到小进行排序,记v-index(i)是第i个预测精度的下标,根据定义4,可得预测精度序列v1,v2,…,vm所产生的IGOWLA 算子组合预测值,记为:在诱导广义有序加权对数平均算子的组合预测模型中,为了方便测算,对其时间序列取对数λ次幂.对(5)式两边取对数λ次幂,得到:令X=((lnX1)λ,(lnX2)λ,…,(lnXN)λ)T为指标数据实际值的对数λ次幂向量,Xi=((lnXi1)λ,(lnXi2)λ,…,(lnXiN)λ)T为第i种预测方法所得预测值的对数λ次幂向量,表示组合预测值的对数λ次幂向量.定义6 令τi和τ分别为:令,则称m×m方阵E=(Eij)m×m为基于向量夹角余弦的IGOWLA算子组合预测信息矩阵,且有根据(9)式,(8)也可表示为:τi和τ分别是第i种预测方法预测值数据列、组合预测值数据列与实际值数据列的向量夹角余弦.显然τi,τ∈[0,1],且向量夹角余弦值越大表示组合预测精度越高. 式(9)表明基于IGOWLA算子组合预测值序列与实际观察值序列的向量夹角余弦是组合预测方法的权重系数w1,w2,…wm的函数,且向量夹角余弦越大,表示组合预测方法效果越好.因此,基于向量夹角余弦的IGOWLA算子组合预测模型表示为式(10)的最优化模型:记τi分别为m种预测值数据列与实际值数据列向量夹角余弦的最大值、最小值. 定义7 如果τ>τmax,在此将权重w1,w2,…wm决定的组合预测模型称为优性组合预测;如果τmin≤τ≤τmax,在此将此组合预测模型称为非劣性组合预测;如果τ<τmin,在此将此组合预测模型称为劣性组合预测.定义7说明当各个单项预测值数据列与实际值数据列的向量夹角余弦最大值低于组合预测值数据列与实际值数据列向量夹角余弦值时,将此组合预测模型称为优性组合预测模型.为了验证本文提出的组合预测模型的优越性,选出五种误差对模型精度进行评价:(1)平方和误差:;(2)均方误差:;(3)平均绝对误差:|xt-xit|;(4)平均绝对百分比误差:|(xt-xit)/xt|;(5)均方百分比误差:其中,i=1,2,…,m,表示第i种单项预测方法.本文利用文献[16]的数据进行基于向量夹角余弦的IGOWLA算子组合预测模型的分析,实际值和预测值数据见表1.依据(4)式测算出2种预测方法在11个时刻的预测精度,见表2.将表2的数据代入模型(11)中,分别取λ为1、2、3,得到基于向量夹角余弦的IGOWLA算子组合预测模型的最优权重系数,见表3所示.将最优权重系数代入(12)式的基于向量夹角余弦的IGOWLA算子组合预测模型:可以计算出不同参数λ对应的基于向量夹角余弦的IGOWLA算子组合预测值,数据见表4所示.利用文中给出的基于向量夹角余弦的IGOWLA算子组合预测模型的精度评价指标体系,可以分别计算出两种单项预测方法和基于不同参数λ对应的IGOWLA组合预测方法的对应的预测误差,如表5所示.由表5可以看出,在λ取1、2、3这三个值时,两种预测方法的预测误差值远大于本文给出的组合预测模型的误差值,表明了本文提出的组合预测方法好于以上两种预测方法,可以给出精度更高的预测结果.此外,通过(7)式能够测算出两种预测方法的预测值数据列与实际值数据列的向量夹角余弦,当λ取1时,得τ1=0.999981,τ2=0.999882;当λ取2时,τ1=0.999929,τ2=0.999571;当λ取3时,τ1=0.999849,τ2=0.999107.基于向量夹角余弦的IGOWLA算子组合预测模型测算出的预测值数据列与实际值数据列的向量夹角余弦,在λ取1、2、3时分别为0.999982、0.999931、0.999850,均大于max(τ1,τ2),故根据定义7的表述可知本文给出的组合预测模型是优性组合预测.综上所述,可以得出基于向量夹角余弦的IGOWLA算子组合预测模型能够很好地提高预测精度,是一种行之有效的预测方法.本文将向量夹角余弦和诱导广义有序加权对数平均(IGOWLA)算子相结合,建立了基于向量夹角余弦的IGOWLA算子的最优组合预测模型,并给出了优性组合预测的概念,最后,根据实例验证了该组合预测模型是科学的和有效的,且此模型是优性组合预测.然而本文对基于向量夹角余弦的IGOWLA算子的最优组合预测模型的一些性质,例如优性组合预测的存在性等理论问题缺乏具体的讨论,这些问题有待更深入的研究.【相关文献】[1]Bates J M,Granger C W bination of forecasts[J].Operations Research Quarterly,1969(4):45l-468.[2]Xu Z S,Da Q L.The ordered weighted geometric averaging operators[J].International Journal of Intelligent Systems,2002(17):709-716.[3]唐小我,马永开,曾勇,杨桂元.现代组合预测和组合投资决策方法及应用研究[M].北京:科学出版社,2003.[4]陈华友,盛昭瀚,刘春林.基于向量夹角余弦的组合预测模型的性质研究[J].管理科学学报,2006(2):1-8.[5]陈华友.基于相关系数的优性组合预测模型研究[J].系统工程学报,2006(4):353-360.[6]袁宏俊,杨桂元.基于最大—最小贴近度的最优组合预测模型[J].运筹与管理,2010(2):116-122.[7]杨桂元,罗阳,高俊.我国房地产价格组合预测模型探讨[J].统计与决策,2014(12):17-20.[8]Yager R R.On ordered weighted averaging aggregation operators in multicriteria decisionmaking[J].Systems,Man and Cybernetics,IEEE Transactions on,1988(1):183-190.[9]陈华友,刘春林.基于IOWA算子的组合预测方法[J].预测,2004(6):61-65.[10]Yager R R.Generalized OWA aggregation operators[J].Fuzzy Optimization and Decision Making,2004(1):93-107.[11]陈华友,盛昭瀚.一类基于IOWGA算子的组合预测新方法[J].管理工程学报,2006(4):36-39.[12]江立辉,陈华友,丁芳清,等.基于IGOWLA算子的最优组合预测模型及应用[J].统计与决策,2015(4):82-85.[13]程玲华,陈华友.基于向量夹角余弦的加权调和平均组合预测模型的有效性[J].数学的实践与认识,2008(10):102-109.[14]Yager R R.Induced aggregation operators[J].Fuzzy Sets and Systems,2003(1):59-69.[15]Zhou L G,Chen H Y.Generalized Ordered Weighted Logarithm Aggregation Operators and Their Applications to Group Decision Making[J].International Journal of Intelligent Systems,2010(7):683-707.[16]杨蕾,陈华友,王宇.基于贴近度的诱导广义OWA算子最优组合预测模型[J].统计与决策,2013(5):24-26.。
DOI:10.13546/ki.tjyjc.2020.18.005基于Lasso和SVR的向量夹角余弦变权重组合预测模型王言文,邱启荣,王宝坤(华北电力大学数理学院,北京102200)摘要:针对Lasso回归与支持向量回归(SVR)两者各自的优势,文章提出了一种新型的结合以上两种方法的基于向量夹角余弦的变权重组合预测模型。
考虑到预测值向量和实际值向量之间的夹角越小,它们越接近,因此以最大化向量夹角余弦作为标准来构造变权重组合预测模型。
假设单一预测模型的权重是随时间连续变化的,研究在预测值向量与真实值向量的夹角余弦最大的条件下单一预测模型权重随时间变化的情况。
实证分析结果表明,基于向量夹角余弦的变权组合预测模型与单一预测方法相比,具有更高的预测精度。
同时组合预测模型弥补了Lasso回归在处理非线性数据方面的不足。
关键词:Lasso;支持向量回归;向量夹角余弦;组合预测中图分类号:0212文献标识码:A文章编号:1002-6487(2020)18-0022-050引言实际建模过程中,单项预测方法只能从某一角度为预测工作提供有用信息,并且在拟合模型的过程中可能存在偏差,因此在实际预测过程中单种方法可能会存在一定的局限性。
由于不同的方法利用的信息的来源不同,每种方法可以从不同的角度为预测工作提供有用信息,因此它们之间互为联系、相互补充。
在实际预测的过程中,不能主观地认为某种预测方法的预测值与真实值相差较大因而可以舍弃该种方法,这可能会造成某些有用信息的丢失。
Bates和Grange严于1969年首次提出了组合预测的概念,将多个单项预测方法的预测结果综合起来,以预测误差平方和最小为准则建立组合预测模型。
组合预测分为固定权重组合预测和变权重组合预测,固定权重组合预测的权重值是一个固定的常数,而变权重组合预测的权重会随着时间的变化而变化,可以更好地吸收各种预测方法的优点。
目前组合预测问题是研究领域的热点问题之一日」,文献[2]将组合预测应用于旅游人口的预测,提高了预测精度。