多指标综合评价中指标正向化和无量纲化方法的选择
- 格式:doc
- 大小:84.50 KB
- 文档页数:6
多指标综合评价中赋权方法评析在多指标综合评价中,赋权方法的选择对于评价结果的准确性和可靠性具有重要影响。
本文将介绍多指标综合评价中常见的赋权方法,并对其优缺点进行分析,旨在为实际应用中合理选择赋权方法提供参考。
多指标综合评价是指通过多个相互关联的指标来评价某一对象或系统的整体性能。
赋权方法是指根据各指标对整体评价的重要性程度,给予相应的权重,以便在综合评价时体现各指标的重要性差异。
常见的赋权方法包括主观赋权法和客观赋权法。
主观赋权法是根据专家的经验、知识和判断力,对各指标赋予相应的权重;客观赋权法则根据指标之间的相关关系或变异程度等客观信息确定权重。
主观赋权法的优点在于能够充分反映专家的经验和判断力,适用于具有不确定性和复杂性的评价问题。
但是,主观赋权法也容易受到专家主观意识的影响,导致赋权结果缺乏客观性和公正性。
客观赋权法的优点在于能够根据客观信息来确定权重,避免主观赋权法的主观性和片面性。
但是,客观赋权法往往忽略了专家的经验和判断力,无法充分反映各指标对评价目标的重要程度。
在实际应用中,可以根据具体问题的特点选择合适的赋权方法。
例如,对于具有较强主观性的评价问题,可以选择主观赋权法来赋予各指标权重;对于客观性较强的评价问题,可以选择客观赋权法来确定权重。
另外,也可以将主观赋权法和客观赋权法相结合,形成一种综合赋权方法,以充分利用两者的优点,避免其缺点。
在多指标综合评价中,赋权方法的选择应根据具体问题的特点进行判断。
在实际应用中,应充分考虑各种赋权方法的优缺点,合理选择和应用,以提高评价结果的准确性和可靠性。
下一步研究方向是多指标综合评价中赋权方法的优劣比较和组合应用。
未来可以进一步探索不同赋权方法的组合方式,以更好地体现各指标对整体评价的重要性;也可以研究如何将多指标综合评价应用于实际问题的解决,例如在环境质量评估、经济发展评价等领域的应用。
这将有助于提高多指标综合评价的应用价值和实用性。
在当今复杂的社会和经济环境中,多指标综合评价方法被广泛应用于各个领域,如经济学、环境学、生物学等。
多指标综合评价方法
在现实生活中,常常会涉及到对一些事物的全面评价,以便获取更加
准确、全面、客观的信息。
针对这种需求,多指标综合评价方法被广泛应
用于各个领域,包括经济、工程、环境、教育等等。
通过综合考虑多个指标,可以避免单指标评价的片面性和主观性,提高评价的科学性和针对性。
序列法是一种基于顺序比较的多指标综合评价方法。
首先,需要明确
各指标之间的优劣关系,即判断哪个指标对于评价对象的影响最大。
然后,依次对各指标进行比较,根据优劣程度给予相应的得分。
最后,通过统计
各指标得分的权重,得到综合评价结果。
模糊综合评价方法是一种基于模糊数学理论的多指标综合评价方法。
通过模糊集合理论中概念模糊度和隶属度的定义,将评价指标的评价结果
转化为隶属度函数,然后求解隶属度函数的加权平均值,得到综合评价结果。
层次分析法是一种基于专家判断和层次分析的多指标综合评价方法。
首先,需要确定评价指标的层次结构,划分为准则层、准则子层、子准则
层等。
然后,通过专家评分和判断,确定各层次指标的权重。
最后,根据
各层次指标的权重和评价结果,利用层次分析法的计算步骤,得到综合评
价结果。
需要注意的是,不同的多指标综合评价方法适用于不同的情境和领域,选择合适的方法需要根据具体的评价对象和评价目的进行决策。
此外,多
指标综合评价方法也需要考虑指标之间的相关性和相互影响。
因此,在实
际应用中,通常需要结合专家判断和科学分析,灵活运用多种方法,以期
得到更加客观和准确的评价结果。
无量纲化方法比较无量纲化方法是指将不同量级的数据进行比较和分析时,通过一定的数学方法将原始数据转换为无单位或者统一单位的数据。
常用的无量纲化方法有标准化、区间缩放法、归一化、对数变换等。
下面我将对这几种方法进行比较分析。
首先是标准化方法。
标准化是将数据转化为均值为0,方差为1的正态分布。
标准化能够消除数据之间的单位差异,使得不同特征的数据可进行比较和分析。
标准化的公式为:\[x' = \frac{x - \mu}{\sigma}\]其中,\(x\)为原始数据,\(\mu\)为原始数据的均值,\(\sigma\)为原始数据的标准差。
标准化方法适用于特征之间差异较大或者存在离群点的情况。
但是标准化方法不能保留原始数据的分布信息,对异常值较敏感。
接着是区间缩放法。
区间缩放法是将数据线性映射到一个指定的区间内。
常用的区间是\[0, 1\]或者\[-1, 1\]。
区间缩放法的公式为:\[x'= \frac{x - \min(x)}{\max(x) - \min(x)}\]其中,\(x\)为原始数据,\(\min(x)\)为原始数据的最小值,\(\max(x)\)为原始数据的最大值。
区间缩放法能够将数据映射到一个有限的范围内,避免了不同特征数据之间的量级差异。
但是该方法对于存在极端离群点的数据不适用。
再次是归一化方法。
归一化是将数据转化为\[0, 1\]范围内的数值。
归一化的公式为:\[x' = \frac{x - \min(x)}{\max(x) - \min(x)}\]其中,\(x\)为原始数据,\(\min(x)\)为原始数据的最小值,\(\max(x)\)为原始数据的最大值。
归一化方法能够消除单位差异,保留了数据的分布信息,适用于数据分析和聚类等场景。
最后是对数变换方法。
对数变换是将数据转化为其对数值,常用的对数变换有自然对数变换和对数函数变换。
对数变换的公式为:\[x' =\log(x + 1)\]或者\[x' = \log(x)\]其中,\(x\)为原始数据,\(x'\)为转换后的数据。
・讲座・综合效益评价中数据的直线化无量纲化方法丁昌慧!蔡辉"祁新辉!!问题的提出!在综合效益评价中,各指标间存在不可公度性,它主要体现在两个方面〔!〕:(!)各指标的度量单位(量纲)不一致,即使有些指标单位相同,其实际意义也可能不同,例如出生率与死亡率,其计量单位虽然都是千分数,但其含义不同,每升高或降低!#的意义也不一致,若直接综合,往往会使评价结果无法解释。
(")各指标的属性也不一致:指标的属性可分以下三类:!正指标(高优指标):指标值越大越好的指标;"逆指标(低优指标):指标值越小越好的指标;#适度指标:指标值不应过大或过小,而是达到适度值或适度区间最好。
适度指标也可看作正负指标的组合,只要能找到适度点,也可在适度点前后分别转化为正、逆指标。
由于这种不可公度性的存在,使得各指标不能直接用于计算和比较。
因此,只有对不同属性的指标通过某种数学变换来消除指标的量纲,将指标值转化为指数值,使得各指标值可以直接相加,形成综合指数,才可用于综合效益评价。
本文就线性无量纲方法及其特点进行讨论。
"方法〔!,"〕若某指标值在客观上与评价值之间呈线性关系,即它们之间是等比例变化,可用线性无量纲化方法。
常用的方法有极差法、极值法、$%&’()*法、比重法、百分比次法和秩次法等。
"#!极差法:设有!个指标,作了"次观察,得观察值#,对#进行规范化处理:正指标:$%+#,#-./#-01,#-./#-./"#"#-01逆指标:$%+#-01,##-01,#-./#-./"#"#-01适度指标:(0)最佳值型:$%+!#+##!,$#,##$-01$#,##$#%##2#&#-01或#"#’()-./式中,##为该指标的最佳值。
(3)最佳区间型:$%+!,&!,#-01[&!,#-./,#-01,&"]#*&!!#+[&!,&"]!,#’(,&"-01[&!,#-./,#-01,&"]#,&"2#&#-01或#"#’()-./式中,[&!,&"]为第(个指标的最佳区间,#-01和#-./分别表示该指标的最大值和最小值。
多指标综合评价中指标正向化和无量纲化方法的选择叶宗裕摘要:本文用实例说明了多指标综合评价中,用“倒数逆变换法”进行指标正向化时会完全改变原指标的分布规律,影响综合评价结果的准确性;对三种常用无量纲化方法——极差变换法、标准化法和均值化法的选择使用问题,用实例进行了比较分析。
关键词:综合评价,正向化,无量纲化,标准化法,均值化法在多指标综合评价中,有些是指标值越大评价越好的指标,称为正向指标(也称效益型指标或望大型指标);有些是指标值越小评价越好的指标,称为逆向指标(也称成本型指标或望小型指标),还有些是指标值越接近某个值越好的指标,称为适度指标。
在综合评价时,首先必须将指标同趋势化,一般是将逆向指标和适度指标转化为正向指标,所以也称为指标的正向化。
不同评价指标往往具有不同的量纲和量纲单位,直接将它们进行综合是不合适的,也没有实际意义。
所以必须将指标值转化为无量纲的相对数。
这种去掉指标量纲的过程,称为指标的无量纲化(也称同度量化),它是指标综合的前提。
在多指标评价实践中,常将指标无量纲化以后的数值作为指标评价值,此时,无量纲化过程就是指标实际值转化为指标评价值(即效用函数值)的过程,无量纲化方法也就是指如何实现这种转化。
从数学角度讲就是要确定指标评价值依赖于指标实际值的一种函数关系式,即效用函数f j。
因此,指标的无量纲化是综合评价的一项重要内容,对综合评价结果有重要影响。
指标的正向化和无量纲化都有多种方法,应用时,应根据实际情况选择合适的方法,否则将会使综合评价的准确性受到影响。
本章就如何选择正向化和无量纲化方法作些讨论。
(一)关于指标正向化方法对于指标的正向化,在实际应用中许多学者常使用将指标取倒数的方法(苏为华教授称其为“倒数逆变换法” [1]),写成公式为:y ij =C/x ij (1)其中C为正常数,通常取C=1。
很明显,用(1)式作为指标的正向化公式时,当原指标值x ij 较大时,其值的变动引起变换后指标值的变动较慢;而当原指标值较小时,其值的变动会引起变换后指标值的较快变动。
数据预处理--⽆量纲化1.⽆量纲化定义⽆量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可⽐性,故⾸先需将指标进⾏⽆量纲化,消除量纲影响后再进⾏接下来的分析。
2.⽆量纲化⽅法⽆量纲化⽅法有很多,但是从⼏何⾓度来说可以分为:直线型、折线型、曲线形⽆量纲化⽅法。
(1)直线型⽆量纲化⽅法直线型⽆量纲化⽅法是指指标原始值与⽆量纲化后的指标值之间呈现线性关系,常⽤的线性量化⽅法有阈值法、标准化法与⽐重法。
①阈值法是我们最熟悉也最常⽤的⼀种⽆量纲化⽅法,阈值也称临界值,是指衡量事物发展变化的⼀些特殊指标值,如极⼤值、极⼩值等,⽽阈值法就是通过实际值与阈值对⽐得到⽆量纲化指标值的⽅法。
主要公式以及特点如下图中所⽰。
值得注意的⼀点,阈值参数的选取确定却会直接影响分析的结果,这⾥需考虑实际情况加上已有经验进⾏探索,逐步优化,直到寻找最合适的阈值(最合适就是结果可以达到让⾃⼰满意的程度)。
②标准化⽅法就是指标原始值减去该指标的均值然后⽐上其标准差。
⽆论指标实际值是多少,最终将分布在零的两侧,与阈值法相⽐,标准化⽅法利⽤样本更多的信息,且标准化后的数据取值范围将不在[0,1]之间。
③⽐重法是将指标实际值转化为他在指标值总和中所占的⽐重。
(2)折线型⽆量纲化⽅法折线型⽆量纲化适⽤于被评价事物呈现阶段性变化,即指标值在不同阶段变化对事物总体⽔平影响是不⼀样的。
虽然折线型⽆量纲化⽅法⽐直线型⽆量纲化⽅法更符合实际情况,但是要想确定指标值的转折点不是⼀件容易的事情,需要对数据有⾜够的了解和掌握。
(3)曲线形⽆量纲化⽅法有些事物发展的阶段性变化并不是很明显,⽽前、中、后期的发展情况⼜各不相同,就是说指标值的变化是循序渐进的,并不是突变的,在这种情况下,曲线形⽆量纲化⽅法也更为合适,常⽤的曲线形⽆量纲化⽅法如下图所⽰:(4)模糊⽆量纲化⽅法综合评价中的评价指标可以分为正向指标(即指标值越⼤越好)、逆指标(即指标值越⼩越好)和适度指标(即指标值落在某个区间最好,⼤了、⼩了都不好),指标彼此之间“好”与“坏”并没有⼀个标准,在很⼤程度上具有⼀定的模糊性,这时候可以选择此⽅法对指标进⾏⽆量纲化处理,有兴趣⾃⾏搜索学习。
多指标综合评价方法及权重系数的选择来源:中国论文下载中心 [ 09-02-01 10:17:00 ] 编辑:studa20作者:王晖,陈丽,陈垦,薛漫清,梁庆【摘要】由于计算机的发展及一些相关领域的不断深入研究,综合评价方法得到了不断的发展和改进。
而指标权重系数的确定方法作为综合评价中的重中之重,近几年来也取得了一些新的进展。
本文对多指标评价方法和权重系数的选择进行概括介绍。
【关键词】多指标综合评价;评价方法;权重系数;选择基金项目:广东药学院引进人才科研启动基金资助项目( 2005ZYX12)、广州市科技计划项目( 2007J1-C0281)、广东省科技计划项目(2007A060305006)综合评价是利用数学方法(包括数理统计方法)对一个复杂系统的多个指标信息进行加工和提炼,以求得其优劣等级的一种评价方法。
本文就近年来国内外有关多指标综合评价及权重系数选择的方法进行综述,以期为药理学多指标的研究提供一些方法学的资料。
1 多指标综合评价方法1.1 层次分析加权法(AHP法)[1]AHP法是将评价目标分为若干层次和若干指标,依照不同权重进行综合评价的方法。
根据分析系统中各因素之间的关系,确定层次结构,建立目标树图→ 建立两两比较的判断矩阵→ 确定相对权重→ 计算子目标权重→ 检验权重的一致性→ 计算各指标的组合权重→计算综合指数和排序。
该法通过建立目标树,可计算出合理的组合权重,最终得出综合指数,使评价直观可靠。
采用三标度(-1,0,1)矩阵的方法对常规的层次分析加权法进行改进,通过相应两两指标的比较,建立比较矩阵,计算最优传递矩阵,确定一致矩阵(即判断矩阵)。
该方法自然满足一致性要求,不需要进行一致性检验,与其它标度相比具有良好的判断传递性和标度值的合理性;其所需判断信息简单、直观,作出的判断精确,有利于决策者在两两比较判断中提高准确性[2]。
1.2 相对差距和法[3]设有m项被评价对象,有n个评价指标,则评价对象的指标数据库为Kj=(K1j,K2j,……,Knj),j=1,2,……,m。
综合评价中数据标准化方法比较研究作者:刘竞妍张可王桂华来源:《数字技术与应用》2018年第06期摘要:数据标准化方法的选择直接影响综合评价的结果。
本文从标准化方法的选择原则出发,总结归纳8种常见的标准化方法公式和特点,并结合选择原则对现有的标准化方法所具有的性质进行一一分析,可以为综合评价中标准化方法的选择提供一些借鉴。
关键词:标准化方法;选择原则;综合评价中图分类号:R195.1 文献标识码:A 文章编号:1007-9416(2018)06-0084-02综合评价是将评价对象在各指标的表现值通过加权得到综合值的一种评价方法。
但当多个指标处于不同量级时,直接进行线性组合就会导致权重的失效,所以将指标进行标准化是重要的一步。
标准化的方法有很多种,学者们在这方面的研究主要是将几种标准化的方法进行优劣分析,然后选择某一种方法运用到自己的综合评价中。
本文将从选择标准化方法的原则出发,总结归纳各种标准化方法具有的原则和适用条件,以期为读者们进行综合评价提供一些借鉴。
1 数据标准化方法的选择原则经过查阅文献,本文归纳出选择数据标准化方法通常有如下几个原则,可以根据所分析的实际需要选择满足几个或全部原则。
1.1 同一指标内部数据相对差距不变原则同一指标内部数据的相对差距是指不同的评价对象在一个指标上的表现不同,表现的差异即体现了数据的相对差距,标准化后的数值应该保持相对差距的不变性。
一般情况下,综合评价选择的标准化方法都不应改变评价对象间的相对差距。
1.2 不同指标之间的相对差距不确定原则在客观事物的发展过程中,不同指标的发展水平也不同。
有些指标发展较快,总体水平可能较高;有些指标发展较慢,总体水平可能较低。
数据标准化必须体现出这种差距。
1.3 区间稳定性原则任意一个指标经过标准化后的指标值都要在一个确定的区间内,如最小值是0,最大值是1。
1.4 总量恒定性原则任意一个指标经过标准化处理后,各评价对象的标准值之和为一恒定的常数。
多指标综合评价方法汇总一、 指标正向化(1)指标:1. 正向指标(越大越好)2. 逆向指标(越小越好)3. 适度指标(不能太小也不能太大,接近某一值最好)(2)逆向指标正向化1. 倒数法: 1i iy x = 上式作为指标的正向化公式时,当原指标值ij x 较大时,其值的变动引起变换后指标值的变动较慢;而当原指标值较小时,其值的变动会引起变换后指标值的较快变动。
特别是当原指标值接近0时,变换后指标值的变动会非常快,使得指标评价值的确定,也即指标的无量纲化变得困难。
2. 最小阈值法:min i i x y x =3. 最大阈值法(互补法)max1i i x y x =-4. 倒扣逆变换法 {}1max i ij ij i ij i n y x x y x ≤≤=-=- 或(3)适度指标的正向化1. 绝对值倒数法:反应了实际值与标准值之间的偏差,偏差越小越好,对应的转化后的值越大,达到正向化的目的;2. 距离倒数法:跟绝对值倒数法类似3. 1max k k k i ij ij i ij i ny x x y x ≤≤=---=-- 或二、 指标的无量纲化(1) 极差正规化法{}{}{}min max min ij ij l i n ij ij ij l i n l i n x x y x x ≤≤≤≤≤≤-=多指标综合评价中不可取。
(2) 标准化法—目前最普遍使用的无量纲化方法。
ij jij j x x y σ-=消除了量纲和数量级的影响,同时标准化法也消除了各指标变异程度上的差异,因此经标准化后的数据不能准确反映原始数据所包含的信息,会导致综合评价的结果不准确。
(3) 均值化法ij ij j x y x在实际问题中,情况是复杂的,有时需要保留指标的变异信息,有时需要消除指标的变异信息。
当综合评价的指标值都是客观数值时,一般来说应该用均值化方法对指标进行无量纲化; 而当综合评价的指标值是主观分数时, 则用标准化方法更好。
多指标综合评价的方法
多指标综合评价是指综合多个指标对一个对象或系统的运行状态进行评价的方法。
其基本思想是,通过对多个指标进行量化描述,再通过各指标的权重赋值,将各指标的得分加权求和,得到最终的评价结果。
以下是常用的多指标综合评价方法:
1. 层次分析法:该方法通过建立层次结构模型,对各层次因素进行量化分析,得出各因素权重和评分,并最终得出综合评价结果。
2. 灰色关联法:该方法通过建立关联矩阵,计算各因素之间的关联程度,然后对各因素进行加权求和,得出综合评价结果。
3. 熵权法:该方法通过计算各指标的信息熵,确定各指标的权重,然后对各指标进行归一化处理,最终得出综合评价结果。
4. 网络分析法:该方法通过建立评价网络模型,对各指标之间的关系进行分析,得出各指标的重要程度,然后对各指标进行加权求和,得出综合评价结果。
以上方法各有其优缺点,应根据具体情况选用。
多指标综合评价中指标正向化和无量纲化方法的选择叶宗裕摘要:本文用实例说明了多指标综合评价中,用“倒数逆变换法”进行指标正向化时会完全改变原指标的分布规律,影响综合评价结果的准确性;对三种常用无量纲化方法——极差变换法、标准化法和均值化法的选择使用问题,用实例进行了比较分析。
关键词:综合评价,正向化,无量纲化,标准化法,均值化法在多指标综合评价中,有些是指标值越大评价越好的指标,称为正向指标(也称效益型指标或望大型指标);有些是指标值越小评价越好的指标,称为逆向指标(也称成本型指标或望小型指标),还有些是指标值越接近某个值越好的指标,称为适度指标。
在综合评价时,首先必须将指标同趋势化,一般是将逆向指标和适度指标转化为正向指标,所以也称为指标的正向化。
不同评价指标往往具有不同的量纲和量纲单位,直接将它们进行综合是不合适的,也没有实际意义。
所以必须将指标值转化为无量纲的相对数。
这种去掉指标量纲的过程,称为指标的无量纲化(也称同度量化),它是指标综合的前提。
在多指标评价实践中,常将指标无量纲化以后的数值作为指标评价值,此时,无量纲化过程就是指标实际值转化为指标评价值(即效用函数值)的过程,无量纲化方法也就是指如何实现这种转化。
从数学角度讲就是要确定指标评价值依赖于指标实际值的一种函数关系式,即效用函数f j。
因此,指标的无量纲化是综合评价的一项重要容,对综合评价结果有重要影响。
指标的正向化和无量纲化都有多种方法,应用时,应根据实际情况选择合适的方法,否则将会使综合评价的准确性受到影响。
本章就如何选择正向化和无量纲化方法作些讨论。
(一)关于指标正向化方法对于指标的正向化,在实际应用中许多学者常使用将指标取倒数的方法(为华教授称其为“倒数逆变换法”[1]),写成公式为:y=C/x ij(1)ij其中C为正常数,通常取C=1。
很明显,用(1)式作为指标的正向化公式时,当原指标值x ij较大时,其值的变动引起变换后指标值的变动较慢;而当原指标值较小时,其值的变动会引起变换后指标值的较快变动。
15前面讲了很多种统计方法,这里进行总结下:1.T检验(独立样本、配对样本)T检验主要用来检验2样本间的差异性,适用条件:自变量为二分变量(即包含两个水平)——〉一个因变量(连续变量)。
1)独立样本T检验图示:2)配对样本T检验图示:2.卡方检验上面的因变量若不是连续变量,而是二分变量,则需要用卡方检验。
卡方检验适用条件:自变量为二分变量(即包含两个水平)——〉因变量为二分变量(即包含两个水平)。
图示:3.单因素方差分析单因素方差分析的适用条件自变量为间断变量(有三个水平以上)——〉一个因变量(连续变量)若自变量为连续变量,则把自变量转换成间断变量。
如学生成绩为连续变量,可以转换为高分组、中等分组、低分组(可以考虑以平均数加减一个标准差来划分)。
1)单因素方差分析图示:若单因素方差分析效果显著,若需要具体分析,还需要进行多重比较(每两个水平之间进行比较),注意,多重比较虽说是两两比较,但该比较与独立样本T检验不同。
T检验的显著性水平(假设为0.05)是每个样本为0.05/2=0.025,而多重比较每个样本的显著性水平是是0.05/m(m为水平数量)2)单因素协方差分析在实验中某些变量无法控制,但会对实验结果造成影响。
如所选样本前测具有显著差异,但前测是在实验中控制不了的,所以在分析时就需要对该变量进行固定以排除变量对实验结果的影响。
这样的变量称为协变量(图中为共变量)。
协方差分析图示:4.多因素方差分析适用:多个自变量(为间断变量,每个自变量有多个不同的水平)——〉一个因变量(连续变量)1)二因素方差分析图示:注意:进行多因素方差分析时,如果交互效应显著,则只分析交互效应,因为单独再对有交互交应的A主效应因子或B主效应因子做单因素方差分析或T检验已没实质意义。
只有在交互效应不明显时,才对每个主效应因子做单因素方差分析或T检验。
2)二因素协方差分析与单因数协方差分析描述一样,图示为:5.多元多因数方差分析适用:多个自变量(间断变量,每个自变量有多个水平)——> 多个因变量(每个因变量均为连续变量)1)多元单因数方差分析图示2)多元多因数方差分析图示:6.线形相关分析变量X <——> 变量Y1)两两线形相关图示2)典型相关典型相关的图示:使用典型相关,就不必再去做两两之间的相关。
决策分析中的数据无量纲化方法比较分析张晓明【摘要】决策分析中多属性决策问题的各属性通常具有不同的量纲,不同量纲的不可比较性给决策带来了困难.对数据进行规范化处理能够实现各属性数据的可综合性与可比性.对决策分析中常用的数据规范化方法进行比较分析,提出在不同应用中对最佳规范化方法的选择,能够使得决策方案更加合理、优化.%The dimensions of different attributes of multiple attribute decision problems in decision analysis is often different.And the incommensurability of different dimension makes decision more difficult.To standardize data for each attribute can make the date be comprehensive and comparative.The comparative analysis of different common data standardized methods in decision analysis is made in this paper,and the best choice of standardization methods in different application is proposed in order to let decision scheme more rational and optimizational.【期刊名称】《闽江学院学报》【年(卷),期】2012(033)005【总页数】5页(P21-25)【关键词】多属性决策;数据规范化;比较;应用分析【作者】张晓明【作者单位】福建江夏学院电子信息科学学院,福建福州350108【正文语种】中文【中图分类】N945.25数据无量纲化是决策分析中数据处理的基本方法.多属性决策问题中的各属性通常具有不同的量纲,为了使包含多属性的决策方案具有理想的比较效果,需要对不同的无量纲化方法进行比较分析,对比其在不同应用中的效果,选择最佳者,使得所得到的决策方案更加合理、优化.1 数据无量纲化1.1 数据无量纲化含义及分类数据无量纲化是对数据进行规范化处理,故也称为数据规范化或数据规格化、数据标准化等.无量纲化是将原始指标数据通过简单的数学变换来消除各指标量纲影响的方法[1].它把所有的指标值规范化到同一个范围内(如区间[0,1])进行比较.无量纲化方法有很多.常用的无量纲化方法包括:线性比例法、归一化处理法、向量规范法、极值处理法、标准化处理法、均值化法与初值化法等[2-3].1.2 数据无量纲化的必要性决策分析中数据无量纲化的对象主要是多属性决策问题中的各属性所对应的数据.多属性决策问题属于多准则决策问题之一.多准则决策是指在多个不能互相替代的准则存在的情况下进行的决策,它是在20世纪60年代作为规范决策方法被引入决策科学领域的.多准则决策由两个重要部分组成:多属性决策和多目标决策.通常认为决策对象是离散的有限数量的备选方案的多准则决策是多属性决策;决策对象是连续的无限数量的备选方案的多准则决策是多目标决策[4].在决策分析中,决策的目的是对某组研究对象(备选方案)进行选择、有序分类、排序或描述等,因此需要对研究对象进行综合评价与比较.在多属性决策问题中,代表研究对象性质特征的属性(指标)是多个的,为了对研究对象(备选方案)进行全面评价,需要对各个方案中的多个指标进行合成.但在实际决策问题中,各个指标之间由于计量单位不同和数量级不尽相同,使得各指标间不具有综合性和可比性,不能直接进行合成以进行综合分析与比较,因此需要对数据进行处理,即采用某种方法对各指标数值进行无量纲化处理,解决各指标数值不可综合性问题.2 数据无量纲化方法比较分析在决策分析中,不同类型的决策问题包含不同的属性值,利用不同的决策方法进行决策.其中多属性决策常用的决策方法有简单加权法、TOPSIS法、ELECTRE法、PROMETHEE法、ER方法、LINMAP法、最大最小法、AHP法、灰关联分析法等.在这些方法中,虽然不同的属性值的标准化(无量纲化)并不是必须的,但对于某些方法来说是必备的[4].对于在多数决策方法中需要进行标准化的属性值,又由于属性类型不同,标准化的方法也不同.下文从各个常用的无量纲化方法的特点及属性的不同类型等方面出发,讨论不同无量纲化方法的实用范围并进行实例分析.2.1 属性类型多属性决策中常用的属性类型有效益型、成本型、固定型、区间型、偏离型和偏离区间型.效益型属性(也称正向型指标或望大型指标),是指属性值越大越好的属性;成本型属性(也称逆向型指标或望小型指标),是指属性值越小越好的属性;固定型属性(也称适度指标),是指属性值接近某个固定值x+j越好的属性;区间型属性,是指属性值越接近或属于某个固定区间[xj1,x+j2]越好的属性;偏离型属性,是指属性值越偏离某个固定值xj越好的属性;偏离区间型属性,是指属性值越偏离某个固定区间[xj1,x+j2]越好的属性,当属性落入该区间时有最差的评价[3-4].决策分析中有的决策问题只含有单一的属性类型,有的决策问题则含有若干个属性类型.在实际决策问题中最常用的属性类型是效益型属性和成本型属性.2.2 无量纲化方法比较及实例分析多属性决策中常用的属性无量纲化方法的特点各不同,因此适用的范围也不尽相同. 为讨论方便,先给出多属性决策问题中各决策要素的一般符号表示形式.用向量X=(x1,x2,Λ,xm)表示可供选择的方案的集,用向量Yi=(yi1,yi2,Λ,yim)表示第i个方案的各属性的集,其中元素Yij=(i=1,2,Λ,m;j=1,2,Λ,n)为第i个方案的第j个属性的值,矩阵(yij)m×n称为决策矩阵.以下讨论不同的无量纲化方法及其应用.2.2.1 向量规范化(标准化)令则zij(i=1,2,Λ,m;j=1,2,Λ,n)表示元素yij(i=1,2,Λ,m;j=1,2,Λ,n)规范化后的值.这种变换把所有属性值均化为无量纲的量,且均处于(0,1)范围内.这种方法意味着决策矩阵每个列向量按自己的规则来划分,即意味着所有的列具有同样的单位向量长度,这使得属性间的比较成为可能.而这种方法的缺点在于它并不能产生同样长短的度量刻度.每个准则刻度上的最小值和最大值并不相同.即变换后各属性的最大值和最小值并不是统一的值,最小值不为0,最大值不为1.这种非线性的尺度(即所进行的是非线性变换)使得直接的属性间的比较仍很困难[4-5]. 这种方法在ELECTRE法和TOPSIS法中比较常用[4].例1、设某人拟购买住宅一栋,有4所房屋a1,a2,a3,a4可供他选择,房屋的合意程度用5个目标(属性)去衡量,即价格b1、使用面积b2、距工作地点的距离b3、设备b4、环境b5.如果设备和环境这两个属性也可以象价格、面积与距离一样进行量化,即设备、环境越好,值越高,则决策矩阵表示为Y=(yij)4×5,其中yij表示第i个房屋第 j个属性(i=1,Λ,4;j=1,Λ,5)的值.选择最优方案,即最合意的房屋,可用多属性决策方法中的TOPSIS法进行.例1中的5个属性的单位各不同,为综合比较房屋的合意程度,需要把5个属性无纲化,因此可用式(1)对数据yij进行无量纲化处理.需要说明的是:虽然在这5个属性中,价格、距工作地点距离是成本型的指标,而使用面积、设备、环境是效益型的指标,但规范化时都用式(1)进行,其效益型与指标型在确定正理想解和负理想解时用不同的取法得以体现.2.2.2 线性变换法(也称线性比例法)1)一般线性变换法其中,y*j为一取定的特殊点,一般可取ymjax、ymjin或,三者分别为 y*j(j∈N)的最大值ymjax是决策矩阵第j列中的最大元素)、最小值,是决策矩阵第j列中的最小元素,下文中出现的ymjax、ymjin表示的意思相同)和均值[2,5].在多属性决策问题中,如果指标为效益型指标,可令即某个准则结果与其最优值进行比较,式(2)中显然有0≤zij≤1,当zij越接近于1时,结果越令人满意[4-5].如果指标为成本型指标,令同样有0≤zij≤1.线性变换法的优点在于所有的结果都进行了线性转换,变换后的相对数量和变换前的相同,结果重要性的相对顺序得到了保留[4-5].当决策问题中既有效益型指标又有成本型指标时,可利用公式(2)、式(3)把属性值(指标值)规范化[5].但有时利用式(2)、式(3)所进行的变换(数据规范化)会对决策产生困难,因为它们的基点不同,即变换后最好的效益目标和最好的成本目标有不同的值,不便于比较.如果我们把成本目标的变换修改为基点就可以统一起来[5].这样,当决策问题中既有效益型指标又有成本型指标时,使用(2)、(4)把属性值规范化,使它们的最优值都统一为1,就可更方便于进行比较.总之,当效益型和成本型的准则在决策矩阵中并存时,可以将成本型准则通过转换,作为效益型准则处理,反之也可以.当效益型准则的数目比成本型准则的数目多时,建议将所有属性转换成效益型处理[4].反之亦然.2)归一化处理法数据归一化处理使所有指标数据之和等于1.它可看成是线性比例法的一种特例[2].例2 在决策方法之一的AHP法(层次分析法)中,设判断矩阵为(yij)n×n,用和积法计算判断矩阵的最大特征根及其对应的特征向量时,第一步要利用公式,将判断矩阵每一列正规化,即是对每一列做归一化处理.例3 在AHP法中若用方根法计算判断矩阵的最大特征根与特征向量,需要将方根向量ui(i=1,2,Λ,n)通过公式正规化,即做归一化处理,得到特征向量w=(w,w,Λ,w).此处w也是各因素的相对12n权重.顺便指出:上述提到的归一化方法是对决策问题中属性的规范化,而在一般的决策问题中,权重通常也要进行归一化处理,即若设wi(i=(1,2,Λ,n)分别表示n个属性对应的权值,则要求2.2.3 极值处理法对于效益型指标,令对于成本型指标,令对于固定型属性对于区间型属性对于偏离型属性对于区间偏离型属性相对前两种变换(向量规范化、线性变换法)而言,极值处理法是一种更复杂的变换.这种方法的好处是对于每类属性度量出来的属性值严格从0到1变化.0表示最差的状态,1表示最好的状态.这种刻度转换方法不会带来结果上比例差异的改变[2,4-5].2.2.4 标准化处理法(也称标准差标准化法)这种方法在原始数据呈正态分布的情况下,转化结果是较合理的[2,6].标准化处理法是灰关联分析中常用的无量纲化的方法.如:某一评价问题的评价矩阵为(yij)m×n,其中yij表示第i个评价对象的第j个指标(i=1,Λ,m;j=1,Λ,n)的值.通过公式即可把每列的每个数据无量纲化.2.2.5 均值法、初值化法均值法、初值化法也是灰关联分析中常用的无量纲化的方法.如:利用灰色关联分析对系统进行综合评价,设m个指标n个数据序列形成如下矩阵:其中 x'i=(x'i(1),x'i(2),Λ,x'i(m)),i=0,1,Λ,n.利用均值化法处理或利用初值化法处理其中x'0=(x'0(1),x'0(2),Λ,x'0(m))是参考数据列.使得指标数据无量纲化,无量纲化后的数据序列形成如下矩阵:3 结语上文给出了数据无量纲化、归一化、正规化等概念,明确了各名称的不同含义与关系,如归一化与正规化关系、归一化与无量纲化关系等,以纠正在某些文献的数据转换过程中出现混淆的、错误的一些概念。
常规多指标综合评价简介多指标综合评价中,根据合成方法分为常规多指标综合评价和统计学合成方法,前者简单,适用于简易评价,后者复杂,适用于大项目的评价。
现介绍几种常规多指标综合评价方法:加权线性和法、乘法合成法、混合法、代换法,并对它们进行比较。
一、 加权线性和法(加法合成)1. 加权线性和法的处理加权线性和法的基本公式为:∑==n i i iX W X 1式中,x 为被评价事物得到的综合评价值w 为备评价指标的权数:x 为单个指标的评价值,n 为评价指标个数。
加权线性和法可以有不同的变形处理,比如总和法: ∑==n i I i XX这里相当于wl 都取值为1,即不加权。
再比如:有约束的线性加权和法:∏∑====n i i n i i i KK X W KX 11这里Ki为判别各评价指标是否达到最低要求的逻辑值,如达到最低要求K取值为1,否则K为0。
2、加权线性和法的特性:加权线性和法具有以下特性:(1)加权线性和法适用于各评价指标间相互独立的场合,各指标对综合水平的贡献彼此是没有什么影响的,这—要求是显然的,由于综合运算采用“和”的方式,其现实关系应是“部分之和等于总体”,若各评价指标间不独立,和的结果必然是信息的重复,也就难以反映客观实际。
(2)加权线性和法各评价指标间可以线性地补偿.即某些指标评价分数的下降,可以由另一些指标评价分数的上升来补偿,任一指标评价分数的增加都会导致总评价分数的上升。
任一指标评价分数的减少都可用另一指标评价分数的相应量增加来维持总评价分数的不变。
(3)加权线性和法权数的作用比在其它方法合成中更明显些,这是由加法合成所对应现实问题的性质所决定的。
由于加法合成中各指标间可以线性地补偿,自然各指标在综合评价中所起作用有大有小,从而表现为指标权数的变化。
(4)加权线性和法突出了评价分数较大且该指标权数较大者的作用。
这是第二和第三两个特性结合在一起的必然结果。
由此,加权线性和法是较接近于主要因素突出型的评价合成方法。
多指标综合评价中指标正向化和无量纲化方法的选择叶宗裕摘要:本文用实例说明了多指标综合评价中,用“倒数逆变换法”进行指标正向化时会完全改变原指标的分布规律,影响综合评价结果的准确性;对三种常用无量纲化方法——极差变换法、标准化法和均值化法的选择使用问题,用实例进行了比较分析。
关键词:综合评价,正向化,无量纲化,标准化法,均值化法在多指标综合评价中,有些是指标值越大评价越好的指标,称为正向指标(也称效益型指标或望大型指标);有些是指标值越小评价越好的指标,称为逆向指标(也称成本型指标或望小型指标),还有些是指标值越接近某个值越好的指标,称为适度指标。
在综合评价时,首先必须将指标同趋势化,一般是将逆向指标和适度指标转化为正向指标,所以也称为指标的正向化。
不同评价指标往往具有不同的量纲和量纲单位,直接将它们进行综合是不合适的,也没有实际意义。
所以必须将指标值转化为无量纲的相对数。
这种去掉指标量纲的过程,称为指标的无量纲化(也称同度量化),它是指标综合的前提。
在多指标评价实践中,常将指标无量纲化以后的数值作为指标评价值,此时,无量纲化过程就是指标实际值转化为指标评价值(即效用函数值)的过程,无量纲化方法也就是指如何实现这种转化。
从数学角度讲就是要确定指标评价值依赖于指标实际值的一种函数关系式,即效用函数f j。
因此,指标的无量纲化是综合评价的一项重要内容,对综合评价结果有重要影响。
指标的正向化和无量纲化都有多种方法,应用时,应根据实际情况选择合适的方法,否则将会使综合评价的准确性受到影响。
本章就如何选择正向化和无量纲化方法作些讨论。
(一)关于指标正向化方法对于指标的正向化,在实际应用中许多学者常使用将指标取倒数的方法(苏为华教授称其为“倒数逆变换法”[1]),写成公式为:y ij=C/x ij(1)其中C为正常数,通常取C=1。
很明显,用(1)式作为指标的正向化公式时,当原指标值x ij较大时,其值的变动引起变换后指标值的变动较慢;而当原指标值较小时,其值的变动会引起变换后指标值的较快变动。
特别是当原指标值接近0时,变换后指标值的变动会非常快,使得指标评价值的确定,也即指标的无量纲化变得困难。
比如徐国祥等将指标资产负债率、流动比率、速动比率作为适度指标[2],对它们的正向化方法为1||ij ij y x k =-(2)适度值k 取各单位该指标值的平均值。
这种取倒数的方法使得:一些接近k 的指标值之间的差距扩大,而远离k 的指标值之间的差距缩小,因而不能真实反映原指标的分布情况。
笔者选取2001年全国各地区全部国有及规模以上非国有工业企业主要经济效益指标中的资产负债率为例(为节省篇幅选前10个省市的值),用(2)式进行正向化变换,10个省市的资产负债率及其正向化值见表1。
资产负债率的平均值k =58.59。
表1 10省市资产负债率及其正向化值资料来源:中国统计年鉴(2002).中国统计出版社,下同.由表1可见,天津与内蒙古的资产负债率原值为58.28和58.44,相差极小,而变换后的值分别为3.25和6.76,相差很大;北京和上海的原值分别为55.29和46.46,相差很大,而变换后的值为0.30和0.08,相差很小。
但另一方面,从资产负债率对经济效益的影响程度分析,当资产负债率在平均值附近时,其值的变动对经济效益的影响较小;当资产负债率远离平均值时,其值的变动对经济效益的影响较大。
可见用这种取倒数的变换方法完全改变了原指标的分布规律,所得综合评价结果肯定是不准确的,因而是不可取的。
笔者认为,应尽可能不使用这种倒数逆变换法,而使用“倒扣逆变换法”,即对逆向指标正向化公式为1max{}ij ij ijij ij i ny x x y x ≤≤=-=-或对适度指标正向化公式为1max ||||||ij ij ij ij ij i ny x k x k y x k ≤≤=---=--或这种线性变换不会改变指标值的分布规律。
但是,对周转速度类指标(包括库存商品周转速度、流动资金周转速度等等)通常有正向指标“次数”和逆向指标“天数”两种表现形式,二者存在互逆关系:周转天数(天/次)=报告期日历长度(天)/报告期周转次数(次)显然,“次数”的增加能很好地表现实际价值的增加,“次数”是较好的评价指标,所以用倒数逆变换法将逆向指标“天数”变换为正向指标“次数”是较好的正向化方法。
(二)指标无量纲化方法的选择目前人们已提出的无量纲化方法名称很多,如综合指数法、极差变换法、高中差变换法、低中差变换法、均值化法、标准化法、比重法、功效系数法、指数型功效系数法、对数型功效系数法、正态化变换法等等。
苏为华教授将它们归为四类:广义指数法、广义线性功效系数法、非线性函数法、分段函数法[1]。
则广义指数法和广义线性功效系数法包含了前8种,都是线性无量纲化方法;后三种属于非线性函数法,也即曲线型无量纲化方法。
由于指数或对数变换时,曲线的增减速度、凹凸程度很难把握,所以实践中非线性函数法较少被采用。
实践中应用较多的是属于直线型无量纲化方法的极差变换法、标准化法和均值化法。
下面对这三种方法进行比较分析。
设综合评价中共有n 个单位,m 个指标,各指标分别为x 1,x 2,…,x m ,用x ij (i =1,2,…,n ;j =1,2,…,m )表示第i 个单位的第j 个原始指标值,y ij 表示经过无量纲化处理的第i 个单位的第j 个指标值。
极差变换法即令}{min }{max }{min 111ij ni ij ni ij ni ij ij x x x x y ≤≤≤≤≤≤--=(3)式(3)中的分母仅与原始指标的最大值和最小值有关,而与指标的其它值无关。
当x j 的最大值与最小值之差很大时,y j 值就会过小,相当于降低了第j 个指标的权重;相反,当x j 的最大值与最小值之差很小时,y j 值就会过大,相当于提高了第j 个指标的权重。
即指标的两个值就对指标的权重产生了很大影响。
所以在多指标综合评价中,用极差变换法作为无量纲化的方法是不可取的。
目前最普遍使用的无量纲化方法是标准化法,标准化法即令jjij ij x x y σ-=(4)其中j x 和σj 分别是指标x j 的均值和标准差。
经标准化后,指标y j 的均值为0,方差为1,消除了量纲和数量级的影响。
同时标准化法也消除了各指标变异程度上的差异,因此经标准化后的数据不能准确反映原始数据所包含的信息,导致综合评价的结果不准确。
从下例可以看出:例1、对十个省市的全部国有及规模以上非国有工业企业的经济效益进行综合评价。
为直观起见,只选用全员劳动生产率和产品销售率两个指标,指标值见表2。
根据国家经贸委等部门颁布的《工业经济效益评价体系》两个指标的权数分别为10和13。
表2 十省市劳动生产率和产品销售率由表2易见,各地区的产品销售率非常接近,而全员劳动生产率相差较大。
它们的变异系数分别为0.0062和0.3419也说明了这一点。
所以若用这两个指标来评价经济效益,则很显然主要的影响因素应是全员劳动生产率。
但是,若用标准化法对两个指标进行无量纲化,将使两个指标的变异程度相同,因为产品销售率的权数大,因而产品销售率对经济效益的影响会比全员劳动生产率大。
评价结果见表3表3 十省市标准化法评价结果对照从表3可见评价名次与产品销售率名次相差不大,这显然是不合理的。
所以必须改进原始数据的无量纲化方法,均值化方法就是一种较好的方法。
均值化方法即令jij ij x x y =(5)均值化后各指标的均值都为1,其方差为22222)()var()(])1[()var(jjjj jj j j j x x x x x x E y E y σ==-=-= (6)即均值化后各指标的方差是各指标变异系数jjx σ的平方,它保留了各指标变异程度的信息。
对于例1,若用均值化方法对两个指标进行无量纲化,则因全员劳动生产率的变异系数比产品销售率的变异程度大得多,因而全员劳动生产率是经济效益综合评价的主要影响因素。
评价结果见表4表4 十省市均值化法评价结果对照由表4可知,评价名次与全员劳动生产率的名次完全一致,这与实际情况是相符的。
即用均值化法比用标准化法合理。
那么,是否我们就应该用均值化方法作为指标的无量纲化方法呢?这也要具体问题具体分析。
在实际问题中,情况是复杂的,有时需要保留指标的变异信息,有时需要消除指标的变异信息。
用下面的例子即可说明。
例2、某校在对教师进行考核时,其考核方法为根据教师所任教班级的学生打分和由学校领导、教师代表组成的考核小组打分各占50%的比例进行综合。
现选择其中10位教师的分数如表5:表5 10位教师的原始考核分易见学生打分的变异程度远大于考核小组打分的变异程度,若为了保留指标的变异信息,采用均值化方法作无量纲化处理,可得各教师的综合考核分及名次如表6(因两种打分的量纲一致,也可以不作无量纲化处理,所得结果相同)表6 10位教师的均值化方法考核结果除3号和10号教师外,考核名次与学生打分的名次均相同,即考核小组的打分几乎不起作用,这显然极不合理。
一般来说,类似例1这样的由主观打分的综合评价问题,不应保留指标的变异信息,而应消除指标的变异信息。
用标准化方法即能消除指标的变异信息,使两种打分起同等作用。
用此法可得各教师的综合考核分及名次如表7。
显然,表7的结果会更加合理。
表7 10位教师的标准化方法考核结果根据以上分析,当综合评价的指标值都是客观数值时,一般来说应该用均值化方法对指标进行无量纲化;而当综合评价的指标值是主观分数时,则用标准化方法更好。
参考文献[1]苏为华.多指标综合评价理论与方法研究[M].北京,中国物价出版社,2001.[2]徐国祥.上市公司经营业绩综合评价及其实证研究[J].统计研究,2000(9).。