当前位置:文档之家› Web文档中词语权重计算方法的改进

Web文档中词语权重计算方法的改进

Web文档中词语权重计算方法的改进
Web文档中词语权重计算方法的改进

ComputerEngineeringandApplications计算机工程与应用

2007,43(19)向量空间模型

降维

特征抽取

特征选择

权值调整

文本表示图1文本向量优化技术

1引言

网络的发展使网络的信息量高速膨胀。据Lesk(1997)的

报告指出,从1995到1997年,Web上的文本信息以每年10倍递增,预计到1998年已经超过美国国会图书馆,达到20TB,目前已经很难对总的信息量进行准确的估计。网络信息量虽然巨大,但是对99%的用户来说99%的信息都是无用信息,所以要想在网络中通过相关链接来找到所需的信息无异于大海捞针。因此迫切需要研究出更为先进的技术来管理和组织这些信息,而对Web文本进行分类是这些技术中最为重要的技术之一。

要进行Web文本分类,首先要做的就是对Web文本数据进行数学描述,其中最基本的模型就是向量空间模型。在这种模型中,每一个不同的单词都作为特征空间中的一维,每一个文本就是特征空间中的一个向量。但是,这种描述方法引发了一个非常严重的问题,那就是高维稀疏,加之文本数据所特有的近义词﹑多义词等等问题,使得文本分类具有相当高的时间复杂度,而且这些问题也极大地干扰了分类算法的准确性,使得文本分类的性能急剧下降。因此,迫切需要通过其它技术优化文本向量表示以帮助提高文本分类的性能。

如图1所示,这些优化技术总的来说分为两类,首先是权

重调整方法。权重调整方法是通过综合考虑一个单词相对于一个文本﹑一个数据集或者一个类的重要性来调整其在不同文本中的权重,使其值尽可能正确地反映一个单词与一个文本在语义上的关系。另一类优化技术是降维,它指的是通过降低特征空间的维度优化文本的表示。主要包括特征选择和特征抽取两种技术。

本文将把重点放在权重调整的优化技术上。在分析当前所采用的权重计算方案的基础上,结合Web文本的特点,提出了一种新的权重调整方案,经实验验证能够有效提高Web文本的分类性能。

2传统权重计算公式的分析

单词权重的衡量不仅要考虑单词的局部权重,即单词在一

Web文档中词语权重计算方法的改进

初建崇1,刘培玉2,王卫玲2

CHUJian-chong1,LIUPei-yu2,WANGWei-ling2

1.海军航空工程学院训练部,山东烟台264001

2.山东师范大学信息科学与工程学院,济南250014

1.NavalAeronauticalEngineeringInstitute,Yantai,Shandong264001,China

2.CollegeofInformationScienceandEngineering,ShandongNormalUniversity,Ji’nan250014,ChinaE-mail:wangweiling0714@163.com

CHUJian-chong,LIUPei-yu,WANGWei-ling.ImprovedapproachtoweightingtermsinWebText.ComputerEngineeringandApplications,2007,43(19):192-194.

Abstract:ThispaperusesvectorspacemodelasthedescriptionoftheWebtext,analysesandimprovesthetraditionalformulaTF*IDF.First,weexplorethefeatureoftheWebpageswhicharewritteninHTMLanddescribethesituationinformationofthetermsinWebtext.Second,weusegeneralizedinformationtheoryasthetheorybasetointroducethequadraticentropymutualin-formationintotheformula.Theexperimentshowsthefeasibilityandthevalidityofthismethod.Keywords:vectorspacemodel;Webtextclassification;weightadjustment;mutualinformation

要:以向量空间模型作为Web文本的表示方法,对传统的TF*IDF公式进行了改进。首先,结合Web文本中HTML标签的修

饰功能,体现了特征词在Web文本结构中的位置信息;其次,以广义信息论为理论基础,引入了基于二次熵的互信息作为权重计算公式的一项,体现了单词的类区分能力。实验验证了该方法的可行性和有效性。关键词:向量空间模型;Web文本分类;权重调整;互信息文章编号:1002-8331(2007)19-0192-03

文献标识码:A

中图分类号:TP391

作者简介:初建崇(1979-),男,助理工程师,主要研究方向:网络信息安全;刘培玉(1960-),男,教授,博士生导师,主要研究方向:数据库与网络信

息安全;王卫玲(1979-),女,硕士研究生,主要研究方向:Web挖掘、信息检索、信息过滤。

192

ComputerEngineeringandApplications计算机工程与应用2007,43(19)

个特定文本中的重要性,还要考虑单词的全局权重,即单词在整个文本数据集中的重要性。将这两个因素结合在一起,就得到了单词权重的通用公式:

id

=local(t,d)*global(t)(1)其中,local(t,d)代表局部权重,global(t)代表全局权重。

单词权重最为有效的实现方法就是TF*IDF,它是由Salton在1988年提出的。其中TF称为词频,用于计算该词描述文档内容的能力;IDF称为反文档频率,用于计算该词区分文档的能力。TF*IDF的指导思想建立在这样一条基本假设之上:在一个文本中出现很多次的单词,在另一个同类文本中出现次数也会很多,反之亦然。所以如果特征空间坐标系取TF词频作为测度,就可以体现同类文本的特点。另外还要考虑单词区别不同类别的能力,TF*IDF法认为一个单词出现的文本频率越小,它区别不同类别的能力就越大,所以引入了逆文本频度IDF的概念,以TF和IDF的乘积作为特征空间坐标系的取值测度。

TF-IDF初看上去似乎合理,然而如果深入研究的话,发现这种权值计算方法对Web文本的分类并不是那么有效,其主要原因包括以下两个方面:

(1)在Web文本中,处于不同位置的单词的重要性是不同的,如果忽略单词的位置信息,仅仅以单词出现的频度作为单词重要性的衡量显然是不合理的;

(2)TF*IDF是局部权重和全局权重的综合,它仅仅表达了一个单词对一个文本的区分能力,而并没有包含这个单词区分一个类和其它类的能力。但是显然,对于文本分类来说,更为重要的是一个单词的类区分能力。

针对这些问题,近来的一些研究也提出了其它一些专门针对文本分类的单词权重调整算法,比如Shankar&Karypis提出了一种快速的迭代权重调整算法[1],它通过在TF*IDF的基础上使用单词纯度来对单词的权重进行不断调整,使分类性能提高了2%~5%;陆玉昌等人提出了一种利用特征选择中的评估函数来代替IDF进行权值调整的方法[2],使越具有类区分能力的单词在权值调整后具有越高的权重,从而使分类精度有所提高。

为了很好地解决上述问题,本文提出了一种综合考虑Web网页特点及其类别信息的权重调整方案。下面将对这种权重调整方案进行详细的介绍。

3改进的权重计算方案

针对第2章中所提出的在TF*IDF权重计算公式中所存在的问题,本文主要采用了以下两种方法予以解决:

(1)分析了HTML标签的修饰功能,对于不同标签下的单词赋予不同的权重,改进了传统的方法中仅仅以单词频度作为衡量标准的片面性;

(2)为了尽量提高具有类区分能力的单词的权重,同时降低缺乏类区分力的单词的权重,将式(1)中的通用公式作了如下调整,扩展了一项单词的类区分能力:

id

=local(t,d)*global(t)*classDisc(t)(2)其中classDisc(t)表示的就是单词t的类区分能力。

3.1基于HTML标签的加权

首先假设用户在使用HTML标签创建网页时,其使用标签的目的和标签所起的修饰作用是一致的。如:当创建者使用〈EM〉标签时,确实是为了强调该标签所修饰的内容。据此,本节根据标签的修饰作用对单词加权。

根据HTML标签对Web页面物理显示所产生的影响将其分为4类:

(1)标签本身及其所修饰的内容均不在浏览器中显示。有:<!—…—>(注释)。

(2)标签修饰的内容在浏览器上显示,绝大多数标签属于这一类。又可分为4个子类:

①改变文本的物理显示,如<B>(粗体显示)﹑<I>(斜体显示)。

②改变文本的内容样式,通过改变文本的物理显示来实现,如<H1>﹑<EM>。

③物理显示没有变化(同不加标签相比),但这些标签反映其修饰内容的属性。有:<CODE>﹑<DL>﹑<DT>﹑<DD>。其中<CODE>表明其修饰的内容为一段程序代码;<DL>﹑<DT>﹑<DD>则分别指出,下面是一列术语﹑术语词内容以及对这个术语的解释。

④当鼠标放在上面时,显示提示内容。主要是标签的一些属性,如title属性。

(3)标签本身在浏览器上显示。包括:<LI>﹑<OL>﹑<UL>。这些标签用于定义列表项。

(4)根据浏览器的设置或不同的浏览器,标签所修饰的内容可能显示,也可能不显示。一个很重要的应用是对于标签<IMG>的“ALT”属性说明,用户可以通过浏览器的设置来决定是否下载图像。不可缺省的“ALT”属性表示图像不能显示时的替换文本,通常能够反映图片的内容。因此加权这个标签属性是完全必要的。除了<IMG>外,标签<AREA>(客户方图像映射的链接集合),<APPLET>(JavaApplet),<EMBED>(加入多媒体对象)也有这个属性。

相对于文本文档的单词权重计算,Web页面中的词频计算表示为:

tfw

i,j

k=1

!wk?fk(3)

tfw

i,j

称为单词的加权频率(weightedfrequency)。f

表示词的第k

次出现(暂定f

的值恒为1),w

表示词在第k次出现时修饰它的HTML标签权重。

3.2单词的类区分能力的加权

近年来,一些研究者[3,4]对使用TF*IDF权重函数给特征词加权的合理性提出了异议,因为一个文本中对分类有用的词条只占一小部分,而大部分词条与要判别的类无关,属于“噪音词条”。结果两个文本的相似度在很大程度上是由噪音词条的词频差异,而非有用词条的词频差异决定。这些噪音完全可能淹没有用信息,从而影响分类精度。TF*IDF法中的IDF函数在本质上就是一种试图抑制噪音的加权。然而,IDF函数简单地认为文本频数少的单词就重要,文本频数多的单词就无用,这显然是太武断了。IDF的简单结构使得它不可能很好地反映单词的有用程度。另外,对于文本分类来讲,更为重要的是一个单词的类区分能力,而这一点在TF-IDF公式中没有得到很好的体现。

因此,本文在TF*IDF公式的基础上,又扩展了一项单词的类区分能力,其通用公式如公式(2)所示。新扩展的项class-Disc(t)用于描述单词与各个类别之间的相关程度。在文献[2]中,陆玉昌等人对信息增益﹑信息熵﹑互信息﹑文本证据权等作为权重调整因子的性能进行了比较,发现互信息是效果最好的

初建崇,刘培玉,王卫玲:Web文档中词语权重计算方法的改进193

标签

<TITLE>…</TITLE><H1>…</H1><H2>…</H2><B>…</B><EM>…</EM><I>…</I>

<BLANK>…</BLANK><IMGalt=…

权重

54322222

表1

HTML中标签权重的分配

TF*IDF0.6920.7010.6360.8120.742

TF*IDF改进公式

0.8290.7950.7730.8870.744

政治

经济

军事体育计算机

权重

类别表2

分类结果的F1测试值的比较

一个。但是因为文本向量空间的特征集是高维而且稀疏的,如果能够用互信息通过变量的分布函数及其积分函数,找到一个比较合适的目标函数来选取特征,要比直接使用互信息精度高。在本文中以广义的信息论为理论基础,提出了一种新的基于二次熵的互信息评估函数来衡量特征与类别之间的关系,作为权重计算的classDisc(t)项。

由广义信息论知广义熵定义如下:

Ja

n[p(c1|x),p(c2|x),…,p(cn|x)]=

(2

1-a

-1)

-1

i=1

!pa

(ci|x)-"

#

其中,a是一个正参数,a≠1。不同的a值可以得到不同的熵分离度,当a=2,就得到了二次熵定义。

广义熵具有对称的特点,hn(p1,p2,…,pn)=hn(p2,p1,…,

pn)=…=hn(pn,…,p1)≥0,如果pk=1而且pi=0,1≤i≤n,i≠k,

则hn(p1,p2,…,pn)=0,hm+1(p1,p2,…,pn,0)=hm+1(p1,p2,…,pn)。

对于任意的概率分布pi≥0,(i=1,2,…,n),

i=1

!pi

=1,有

hn(p1,p2,…,pn)≤hn(1n,1n,…,1n

对于所有的事件,熵函数是连续函数。为了评估所选取的特征,向量空间每一点的熵函数都要进行计算,在熵函数值较大的空间部分,不同类的样本必然在较大的程度上互相重叠,所以熵函数的期望值可以表征类别的分离程度,作为选取特征分类性能的评价指标。

综合以上理论,类别和特征的二次熵函数如下:

H(C)=-logn

i=1

!p(ci)

H(X)=-logX

p(xj)2

dx

在互信息中,使用二次摘函数度量互信息量还需要求出度量变量的概率密度函数的分布,将每个特征xi都作为中心点,σ是xi的方差,求其概率密度分布为:

p(xi)=n

i=1

!G(xi-xj,!I)

结合熵函数的期望值等理论,得出基于二次熵的互信息在两个变量ci和xi之间的度量为:

MI′

(C,X)=log

i=1

!X

p(ci

,xj

)2

dxj)(n

i=1

!

’p(ci

)2

p(xj

)2

dxj

i=1

!X

p(ci

,xj

)p(ci

)p(xj

)dxj

)2

(4)

用基于二次熵的特征变量集X和类别变量集C之间的互信息评估函数,对每个特征xj,求其二次熵互信息,作为权重因子中的一项classDisc(t)。

综合以上两方面对权值计算公式的调整,改进后的权重计算公式为

Wi=tfw

i,j?idf?MI′

(C,xi)(5)

考虑到文档长度不一样对词频的统计具有一定的影响,一个特征词在长的文档中比在短的文档中更有可能被提取出来,因此采用对每个特征词的权重进行归一化量化的方法来消除

这种影响。处理的方法如下:

W′i=

Wi

i=1

!W

2(

其中,W′i为特征词xi的最后权重值,m为文档中的特征词个数。

4实验与分析

Web文档的权重计算是Web文档处理中的一个基础问题,为了验证本文提出的权重计算方案的优势,选取了对Web

文本分类作为实验问题来考察此改进方案的价值。

4.1分类器的选择

Web文本分类一直是对Web上的海量信息进行组织和管

理的重要手段之一。现今已有诸多新的分类方法被提出来,例如ExpertNetwork,Widrow-Hoff﹑EG﹑支持向量机的文本分类以及神经网络的文本分类等等。

在本文中选取最为常用的基于K-NN的改进方法作为分类方法,并采用cosine距离作为距离计算方法:

sim(D1,D2)=

j=1

!W

D1j*WD2j

j=1

!(W

D1j

)2

*t

j=1

!(W

D2j

)2

(

4.2实验及结果

实验数据是从网上下载的1565篇新闻,包括政治267篇﹑经济200篇﹑军事581篇﹑体育248篇和计算机269篇共5类。简单地对表1中所给出的8种标签进行加权,权值如表中所示。

实验采用的评估指标为F1测试值,它综合考虑了文本分

类的准确率与查全率,其具体计算公式如下:

F1测试值=准确率×

查全率×2准确率+查全率

在实验过程中,分别采用TF*IDF以及改进后的权重计算公式对特征词进行加权,并对Web文本进行了分类,分类结果的F1测试值如表2所示。

(下转198页)

(上接194页)

从表2中可以看出,由于改进后的权值公式能够突出文本中的重要词,抑制次要词语,所以能够明显提高分类的效果。

5结论

TF*IDF公式是文本分类中权值计算的一种有效方法,但

是它只是一种经验公式,并没有很深的理论基础。本文结合

Web文本的特点,提出了一种改进的权重计算公式,同时将

HTML标签的修饰功能以及单词的类区分能力在权值公式中

予以体现。经实验验证,改进的权值公式在实际分类系统中取得了很好的分类效果。(收稿日期:2006年11月)

参考文献:

[1]ShankarS,KarypisG.Afeatureweightadjustmentalgorithmfor

documentcategorization[C]//SIGKDD’00Workshop.

[2]陆玉昌,鲁明羽,李凡,等.向量空间中单词权重函数的分析和构造[J].

计算机研究与发展,2002,39(10):1205-1210.

[3]JoachimsT.AprobabilisticoftheRocchioalgorithmwithTFIDF

fortextcategorization[C]//The14thInt’1ConfonMachineLearning(ICML’97),Nasvile,TN,USA,1997.

[4]李凡,鲁明羽,陆玉昌.文本特征选择新方法的研究[J].清华大学学

报,2001,41(7):98-101.

[5]YangYi-ming.Anevaluationofstatisticalapproachtotextclassi-

ficationCMU-CS-97-127[R].ComputerScienceDepartment,CarnegieMellonUniversity,1997.

[6]陈治平,林亚平,童调生.基于N层向量空间模型的信息检索算法[J].

计算机研究与发展,2002,39(10):1233-1237.

[7]ChenKe-li,ZongCheng-qiang.Anew-weightingalgorithmforlin-

earclassifier[C]//InternationalConferenceonNaturalLanguagePro-cessingandKnowledgeEngineering,Beijing,2003:650-655.[8]RiboniD.Featureselectionforwebpageclassification[C]//Shiraz,

Iran.EURASIA-ICT2002,ProceedingsoftheWorkshop,AustrianComputerSociety,2002:1-5.

1.控制点模型建立,确定相应的游客运送矩阵TRm×n

。本文问题中,游客运送矩阵可表示为:TR6×

3=

TRTRW

TRTRE

!"

2.考虑运载方式对运载游客的最大负载能力等因素,确定相应的约束条件

ST,并对游客运送矩阵TR6×3

进行初始化;3.确定流量控制(Traffic-flowcontrol)优先级矩阵PRITC:

定时检测各特征路径上的游客状态(数量与平均等候时间),并进行优先级排队,得到游客通过该控制点的优先级矩阵PRITR;并对不同的运送通道确定运送的优先级矩阵PRIVa;然后根据所得到的PRITR和PRIVa,确定该节点的游客流量控制优先级矩阵:

PRITC=PRITR×PRIVa=

PRITRW×PRIT

Va_W

PRITRE×PRIT

Va_E

#$$$$$$$%

&

’’’’’’’(6×3

4.在满足约束ST的条件下,根据流量控制优先级矩阵PRITC来更新该控制

节点的游客运送矩阵TR6×3

,从而实现游客流量的定时优化控制;5.重复上述两个步骤,执行下一周期的流量控制指令。

图4节点TR游客流量控制策略实施步骤

Va_BrW=BrW-TRBr

Va_ShW=ShW-TRSh

Va_ChW=ChW-TRCh

)++++*++++,

Va_BrE=BrE-TRBr

Va_ShE=ShE-TRSh

Va_ChE=ChE-TRCh

)++++*++++,

因此,通道空闲优先级为:

PRIVa=

PRIVa_W

PRIVa_E

#

$$$$$$$%

&’’’’’’’(

PRIVa_Br

WPRIVa_Sh

PRIVa_Ch

PRIVa_Br

PRIVa_Sh

PRIVa_Ch

#$$$$$$$$%

&’’’’’’’’(

(9)

根据原则1和原则2,得到节点TR的游客流量控制优先级矩阵为:

PRITC=PRITR×PRIVa=

PRITRW×PRIT

Va_W

PRITRE×PRIT

Va_E

#$$$$$$$$$%

&

’’’’’’’’’(6×3

(10)

(3)节点TR的游客流量控制策略描述

在节点TR的游客运送模型的基础上,通过定时游客流量控制优先级矩阵,以不断更新游客的运送矩阵来控制。节点TR的游客流量控制策略描述如图4所示。

结论

本文以2010年上海世博园区总体规划方案为基础,构建

参观者在园区内部游览路线的基本模型,利用群体智能算法进行路径规划的优化设计的探讨,提出相应的最优方案求解的指导性策略,并对可能出现的典型游客拥塞问题,给出了游客流量的控制策略。(收稿日期:2007年1月)

参考文献:

[1]WangD,MaL,ZhuW.Researchofpedestrianflowintheworld

Expo2010ShanghaibasedonInternetsurvey[J].UrbanPlanning,2006,3:58-63.

[2]XiaoHui,YanYong,XiaoYun-shi.Swarmintelligencebasedtraffic

optimizationstrategyinsideShanghaiExpoArea[C]//RIUPEEEC2006,Macao,China,July,2006:13-14.

[3]KennedyJ,EberhartRC.Particleswarmoptimization[C]//ProcIEEE

InternationalConfonNeuralNetworks.Piscataway:IEEE,Perth,1995:1942-1948.

[4]EberhartRC,ShiY.Particleswarmoptimization:developments,

applicationsandresources[C]//ProcCongressonEvolutionaryCom-putation.Piscataway:IEEE,Soul,2001:81-86.

[5]汪镭,康琦,吴启迪.基于多元最优信息规划的微粒群优化算法[J].

控制与决策,2004,19(12):1364-1367.

[6]EsminA,Lambert-TorresG.Ahybridparticleswarmoptimization

appliedtolosspowerminimization[J].IEEETransactionsonPowerSystems,2005,20(2):859-866.

[7]吴立成,孙富春,孙增圻.柔性空间机器人振动抑制轨迹规划算法[J].

机器人,2003,25(3):250-254.

[8]李宁,邹彤,孙德宝.带时间窗车辆路径问题的粒子群算法[J].系统

工程理论与实践,2004,24(4):130-135.

最简单的权重计算方法

表 1 100 名大学生对择偶指标体系重要性的评价结果 、 第一步:以 67%(2/3)为界限,若选择“重要”“非常重要”、“极为重 最简单的权重计算方法 权重:反映指标在指标体系中重要性程度的数量。 研究问题:择偶指标体系权重集计算 1.外貌(身高、体重、长相魅力) 2.性格(情绪稳定性、性格匹配性、性格魅力) 3.成就(才华、财富) 4.潜力(升值空间) 一、定量统计法 假定随机抽取 50 名男大学生,50 名女大学生,填写一份调查问卷,结果 如表 1 所示: 要”的比例合计小于 67%,则删除该指标。由表 1 知,4 个指标累计比例均大 于 67%,均应保留。 第二步:把不重要赋值 1,有点重要赋值 2,重要赋值 3,非常重要赋值 4,极为重要赋值 5,若仅选择重要及以上数据进入统计,则这三种选项的权重

分别为:3/(3+4+5)=0.25;4/(3+4+5)=0.33;5/(3+4+5)=0.42。 第三步:计算每个指标的权重。指标1的权重 =(40*0.25+30*0.33+20*0.42)/{(40*0.25+30*0.33+20*0.42) +(30*0.25+40*0.33+10*0.42)+(40*0.25+30*0.33+10*0.42) +(30*0.25+40*0.33+20*0.42)}=28.3/(28.3+24.9+24.1+29.1)=28.3/106.4=0.266 指标2权重=24.9/106.4=0.234指标3权重=24.1/106.4=0.226 指标4权重=29.1/106.4=0.274 二、专家评定法 假设请三位专家对4个指标进行评价,结果如表2所示。 表2专家评定结果表 第一步,请每位专家就4个指标的重要性打分,4个指标评分的总和为100。第二步,计算每一指标的均值,见最后一列。 第三步,计算4个指标的权重。 指标1权重30/100=0.30 指标2权重26.67/100=0.27

确定权重的方法及原则

?权重 ?确定权重的原则 ?权值因子判断表法 ?专家直观判定法 ?层次分析法 ?排序法 权重 权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。 权重表示在评价过程中,是被评价对象的不同侧面的重要程度的定量分配,对各评价因子在总体评价中的作用进行区别对待。事实上,没有重点的评价就不算是客观的评价,每个人员的性质和所处的层次不同,其工作的重点也肯定是不能一样的。因此,相对工作所进行的业绩考评必须对不同内容

对目标贡献的重要程度做出估计,即权重的确定。 总之,权重是要从若干评价指标中分出轻重来,一组评价指标体系相对应的权重组成了权重体系。一组权重体系{Vi|I=1,2,…n},必须满足下述两个条件: (1)0

(1)0

VaR分析的三种计算方法

VaR度量的三种经典方法 1.正态分布法 正态分布法计算组合VaR有三种计算方法: A.假设债券组合的对数日收益率服从均值为u,标准差为σ的正态分布。则由独立同分2?Δt的σ内组合的对数收益率服从均值为u?Δt,方差为布随机变量和的特征知,持有期Δt正态分布。通过计算债券组合的收益率分布,估计分布参数,直接计算债券组合的VaR。若将债券组合看作单一债券,则此种方法也适用于单个债券的VaR计算。具体步骤为: 1、根据成分债券的价格矩阵和对应持仓量矩阵计算债券组合的价格序列,这里价格使用债券的盯市价格(以持仓量计算权重); 2、根据债券组合的价格序列计算对数日收益率; 3、根据成分债券的当前价格和当前持仓量计算债券组合的当前价格P(以持仓量计算权重);0 4、由债券组合的对数收益率序列计算其标准差,作为收益率的波动率σ; 5、计算置信度α对应的标准正态分布的分位数z;α?z?σ?Δt,也称为相对VaR,√PVaR= 6、计算组合的在置信度下的最大损失金额VaR为:α0Δt为持有期;P。其中?是指以组合的当前价格为基点考察持有期内组合的价指变化P√0Δt?P?z?σ?Δt (此值为负),是指以 √ uP为:在该置信度下,债券组合绝对VaR α00持有期内组合的预期收益率为基点考察持有期内组合的变化P?E(P),其中u为债券组合的收益率均值。 B.假设债券组合中各成分债券的对数收益率服从多元正态分布,均值为向量U,协方差矩阵为V。通过计算成分债券的收益率矩阵,估计向量U和协方差矩阵V,进而计算债券组合的VaR. 1、计算成分债券的对数收益率矩阵R,每一列表示一种成分债券的收益率序列; 2、由成分债券的当前持仓量计算权重向量W(分量和为1); 3、计算收益率矩阵的列均值向量U,计算列均值的加权和,得到债券组合的收益率均值u;T;W?V?W,则债券组合的方差为V计算收益率矩阵的列协方差,得到协方差矩阵. T√W?Δt?W?z?,也就是相?V√P=4、计算组合在置信度下的最大损失金额为:VaRα0对VaR; T√W?Δt (此值为负)?V?W,Δt?P?z?√uP债券组合在该置信度下的最差价格为:α00也就是绝对VaR,其中u为组合收益率的均值。 C.根据成分债券的VaR计算组合VaR 假设债券组合由n种债券组成,R为这些成分债券的收益率矩阵。 V为第i种成分债券i的当前持仓量, VaR为第i种债券的1日VaR,根据上述方法A计算得到。则第i种成分债i?VaR,设 向量VaR为VaR V为:券在组合中的ii V?VaR11V?VaR 22…VaR=… V?VaR)(nn设corr为各成分债券收益率的相关系数矩阵,则债券组合的T日VaR度量如下:√T VaR??VaR?corr=VaR√T组合2. 历史模拟法 计算历史资产变动情况,模拟资产在未来的变动情况。具体步骤为: 1、获得成分债券的历史盯市价格P,计算历史盯市价格的简单日收益率ΔR(即债券的日变化率),ΔR的每一列表示一种成分债券的历史日收益率序列,设每只成分债券获得N个日收益率。

确定权重的方法

确定权重的方法表7-1 地质环境质量评价定权方法一览表 序号 定权方法1 专家打分法 2 调查统计法1.重要性打分法 2.“栅栏”法 3.“网格”法 4.列表打勾 ü集合统计法T 1.频数截取法 2.聚类求均值法 3.中间截取求均 值法. 3 序列综合法1.单定权因子排序法 2.多定权因子排序法 4 公式法1.三元函数法 2.概率法 3.信息量法 4.相关系数法 5.隶属函数法 5 数理统计法1.判别分析法 2.聚类分析法 3.因子分析法 6 层次分析法 7 复杂度分析法 一、专家打分法 专家打分法即是由少数专家直接根据经验并考虑反映某评价观点后定出权重,具体做法和基本步骤如下: 第一步选择评价定权值组的成员,并对他们详细说明权重的概念和顺序以及记权的方法。 第二步列表。列出对应于每个评价因子的权值范围,可用评分法表示。例如,若有五个值,那么就有五列。行列对应于权重值,按重要性排列。 第三步发给每个参予评价者一份上述表格,按下述步骤四~九反复核对、填写,直至没有成员进行变动为止。 第四步要求每个成员对每列的每种权值填上记号,得到每种因子的权值分数。 第五步要求所有的成员对作了记号的列逐项比较,看看所评的分数是否能代表他们的意见,如果发现有不妥之处,应重新划记号评分,直至满意为止。 第六步要求每个成员把每个评价因子(或变量)的重要性的评分值相加,得出总数。

第七步每个成员用第六步求得的总数去除分数,即得到每个评价因子的权重。 第八步把每个成员的表格集中起来,求得各种评价因子的平均权重,即为“组平均权重”。 第九步列出每种的平均数,并要求评价者把每组的平均数与自己在第七步得到的权值进行比较。 第十步如有人还想改变评分,就须回到第四步重复整个评分过程。如果没有异议,则到此为止,各评价因子(或变量)的权值就这样决定了。 二、调查统计法 具体作法有下面四种。 1.重要性打分法:重要性打分法是指要求所有被征询者根据自己对各评价因子的重要性的认识分别打分,其步骤如下: a.对被征询者讲清统一的要求,给定打分范围,通常1~5分或1~100分都可。 b.请被征询者按要求打分。 c.搜集所有调查表格并进行统计,给出综合后的权重。 2.列表划勾法:该方法如图7-2所示。事先给出权值,制成表格。由被调查者在认为合适的对应空格中打勾。对应每一评价因子,打勾1~2个,打2个勾表示程度范围。这样就完成一个样本的调查结果。 在样本调查的基础上,除采用一般的求个样本的均值作为综合结果外,还可采用如下方法: 图7-2 列表划勾法示意图 备择程 因子序号 度 W 1 2 3 …m-1 m 0.2 √√√ 0.4 √√√ 0.6 √√ 0.8 √ 1.0 a.频数截取法 频数截取法的主要步骤如下: 第一步:列中值频率分布表,见表7-2。记对应第个评价因子第个样本给的权值区间数为〔〕,

最简单的权重计算方法

最简单的权重计算方法 权重:反映指标在指标体系中重要性程度的数量。 研究问题:择偶指标体系权重集计算 1.外貌(身高、体重、长相魅力) 2.性格(情绪稳定性、性格匹配性、性格魅力) 3.成就(才华、财富) 4.潜力(升值空间) 一、定量统计法 假定随机抽取50名男大学生,50名女大学生,填写一份调查问卷,结果如表1所示: 表1 100名大学生对择偶指标体系重要性的评价结果 第一步:以67%(2/3)为界限,若选择“重要”、“非常重要”、“极为重要”的比例合计小于67%,则删除该指标。由表1知,4个指标累计比例均大于67%,均应保留。 第二步:把不重要赋值1,有点重要赋值2,重要赋值3,非常重要赋值4,极为重要赋值5,若仅选择重要及以上数据进入统计,则这三种选项的权重分别

为:3/(3+4+5)=0.25;4/(3+4+5)=0.33;5/(3+4+5)=0.42。 第三步:计算每个指标的权重。指标1的权重=(40*0.25+30*0.33+20*0.42)/{(40*0.25+30*0.33+20*0.42)+(30*0.25+40*0.33+10*0.42)+(40*0.25+30*0.33+10*0.42)+(30*0.25+40*0.33+20*0.42)} = 28.3/(28.3+24.9+24.1+29.1)=28.3/106.4=0.266 指标2权重=24.9/106.4=0.234指标3权重=24.1/106.4=0.226指标4权重=29.1/106.4=0.274 二、专家评定法 假设请三位专家对4个指标进行评价,结果如表2所示。 表2 专家评定结果表 第一步,请每位专家就4个指标的重要性打分,4个指标评分的总和为100。第二步,计算每一指标的均值,见最后一列。 第三步,计算4个指标的权重。 指标1权重30/100=0.30 指标2权重26.67/100=0.27

权重的确定方法汇总

一、指标权重的确定 1.综述 目前关于属性权重的确定方法很多,根据计算权重时原始数据的来源不同,可以将这些方法分为三类:主观赋权法、客观赋权法、组合赋权法。 主观赋权法是根据决策者(专家)主观上对各属性的重视程度来确定属性权重的方法,其原始数据由专家根据经验主观判断而得到。常用的主观赋权法有专家调查法(Delphi法)、层次分析法(AHP )[106-108]、二项系数法、环比评分法、最小平方法等。本文选用的是利用人的经验知识的有序二元比较量化法。 主观赋权法是人们研究较早、较为成熟的方法,主观赋权法的优点是专家可以根据实际的决策问题和专家自身的知识经验合理地确定各属性权重的排序,不至于出现属性权重与属性实际重要程度相悖的情况。但决策或评价结果具有较强的主观随意性,客观性较差,同时增加了对决策分析者的负担,应用中有很大局限性。 鉴于主观赋权法的各种不足之处,人们又提出了客观赋权法,其原始数据由各属性在决策方案中的实际数据形成,其基本思想是:属性权重应当是各属性在属性集中的变异程度和对其它属性的影响程度的度量,赋权的原始信息应当直接来源于客观环境,处理信息的过程应当是深入探讨各属性间的相互联系及影响,再根据各属性的联系程度或各属性所提供的信息量大小来决定属性权重。如果某属性对所有决策方案而言均无差异(即各决策方案的该属性值相同),则该属性对方案的鉴别及排序不起作用,其权重应为0;若某属性对所有决策方案的属性值有较大差异,这样的属性对方案的鉴别及排序将起重要作用,应给予较大权重.总之,各属性权重的大小应根据该属性下各方案属性值差异的大小来确定,差异越大,则该属性的权重越大,反之则越小。 常用的客观赋权法[109-110]有:主成份分析法、熵值法[111-112]、离差及均方差法、多目标规划法等。其中熵值法用得较多,这种赋权法所使用的数据是决策矩阵,所确定的属性权重反映了属性值的离散程度。

权重的三种计算方法举例

权重的计算方法举例 权重:反映指标在指标体系中重要性程度的数量。 研究问题:择偶指标体系权重集计算 1.外貌(身高、体重、长相魅力) 2.性格(情绪稳定性、性格匹配性、性格魅力) 3.成就(才华、财富) 4.潜力(升值空间) 一、定量统计法 假定随机抽取50名男大学生,50名女大学生,填写一份调查问卷,结果如表1所示: 表1 100名大学生对择偶指标体系重要性的评价结果 第一步:以67%(2/3)为界限,若选择“重要”、“非常重要”、“极为重要”的比例合计小于67%,则删除该指标。由表1知,4个指标累计比例均大于67%,均应保留。 第二步:把不重要赋值1,有点重要赋值2,重要赋值3,非常重要赋值4,极为重要赋值5,若仅选择重要及以上数据进入统计,则这三种选项的权重分别为:3/(3+4+5)=0.25;4/(3+4+5)=0.33;5/(3+4+5)=0.42。 第三步:计算每个指标的权重。指标1的权重=(40*0.25+30*0.33+20*0.42)/{(40*0.25+30*0.33+20*0.42)+(30*0.25+40*0.33+10*0.42)+(40*0.25+30*0.33+10*0.42)+(30*0.25+40*0.33+20*0.42)} = 28.3/(28.3+24.9+24.1+29.1)=28.3/106.4=0.266 指标2权重=24.9/106.4=0.234指标3权重=24.1/106.4=0.226 指标4权重=29.1/106.4=0.274

二、专家评定法 假设请三位专家对4个指标进行评价,结果如表2所示。 表2 专家评定结果表 第一步,请每位专家就4个指标的重要性打分,4个指标评分的总和为100。第二步,计算每一指标的均值,见最后一列。 第三步,计算4个指标的权重。 指标1权重30/100=0.30 指标2权重26.67/100=0.27 指标3权重23.33/100=0.23 指标4权重20/100=0.20

权重的确定方法

权重的确定方法 权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。在模糊决策中,权重至关重要,他反映了各个因素在综合决策过程中所占有的地位和所起的作用,直接影响决策的结果。通常是根据经验给出权重,不可否认这在一定程度上能反映实际情况,但凭经验给出的权重有时不能客观的反映实际情况,导致评判结果“失真”。比较客观的权重的判定方法有如下几种: 1.确定权重的统计方法 1.1专家估测法 该法又分为平均型、极端型和缓和型。主要根据专家对指标的重要性打分来定权,重要性得分越高,权数越大。优点是集中了众多专家的意见,缺点是通过打分直接给出各指标权重而难以保持权重的合理性。 设因素集U={n u u u ,...,2,1},现有k 个专家各自独立的给出各个因素i u (i=1,2,...,n )的权重, ∑==k j ij i a k a 11(i=1,2,...,n ),即)1,...,1,1(1 1211∑∑∑====k j nj k j j k j j a k a k a k A 。 1.2加权统计方法 当专家人数k<30人时,可用加权统计方法计算权重。 按公式i s i i k x w a ∑==1计算(其中s 为序号数)然后可得权重A 。 1.3频数统计方法 由所有专家独立给出的各个因素的权重,得到权重分配表,对各个因素i u (i=1,2,...,n )进行但因素的权重统计实验,步骤如下: 第一步:对因素i u (i=1,2,...,n )在它的权重ij a (j=1,2,...,k)中找出最大值i M 和最小值i m , 即{}ij k j i a M ≤≤=1max ,{} ij k j i a m ≤≤=1min . 第二步;适当选取整数p,利用公式p m M i i -计算出权重分为p 组的组距,并将权重从小到大分 为p 组. 第三步:计算出落在每组内权重的频数和频率. 第四步:根据频数和频率的分布请况,取最大频率所在分组的组中值为因素i u 的权重i a (i=1,2,...,n ),从而得权重A=(n a a a ,...,,21). 1.4因子分析权重法 根据数理统计中因子分析方法,对每个指标计算共性因子的累积贡献率来定权。累积贡献率越大,说明该指标对共性因子的作用越大,所定权数也越大。 1.5信息量权数法 根据各评价指标包含的分辨信息来确定权数。采用变异系数法,变异系数越大,所赋的

权重的确定方法

权重的确定方法 ——数学建模协会A.权重简介 在统计理论和实践中,权重是表明各个评价指标(或者评价项目)重要性的权数,表示各个评价指标在总体中所起的不同作用。权重有不同的种类,各种类别的权重有着不同的数学特点和经济含义,一般有以下几种权重。 按照权重的表现形式的不同,可分为绝对数权重和相对数权重。相对数权重也称比重权数,能更加直观地反映权重在评价中的作用。 按照权重的形成方式划分,可分为人工权重和自然权重。自然权重是由于变换统计资料的表现形式和统计指标的合成方式而得到的权重,也称为客观权重。人工权重是根据研究目的和评价指标的内涵状况,主观地分析、判断来确定的反映各个指标重要程度的权数,也称为主观权重。 按照权重形成的数量特点的不同划分,可分为定性赋权和定量赋权。如果在统计综合评价时,采取定性赋权和定量赋权的方法相结合,获得的效果更好。 按照权重与待评价的各个指标之间相关程度划分,可分为独立权重和相关权重。 独立权重是指评价指标的权重与该指标数值的大小无关,在综合评价中较多地使用独立权重,以此权重建立的综合评价模型称为“定权综合”模型。 相关权重是指评价指标的权重与该指标的数值具有函数关系,例如,当某一评价的指标数值达到一定水平时,该指标的重要性相应的减弱;或者当某一评价指标的数值达到另一定水平时,该指标的重要性相应地增加。相关权重适用于评价指标的重要性随着指标取值的不同而发生变化的条件下,基于相关权重建立的综合评价模型被称为“变权模型”。比如评估环境质量多采用“变权综合”模型。 确定权重的方法较多,这里介绍统计平均法、变异系数法和层次分析法,这些也是实际工作种常用的方法。 B.确定权重的原则 一、系统优化原则 在评价指标体系中,每个指标对系统都由它的作用和贡献,对系统而言都有它的重要性。所以,在确定它们的权重时,不能只从单个指标出发,而是要处理好各评价指标之间的关系,合理分配它们的权重。应当遵循系统优化原则,把整体最优化作为出发点和追求的目标。在这个原则指导下,对评价指标体系中各项评价指标进行分析对比,权衡它们各自对整体的作用和效果,然后对它们的相对重要性做出判断。确定各自的权重,即不能平均分配,又不能片面强调某个指标、单个指标的最优化,而忽略其他方面的发展。在实际工作中,应该使每个指标发挥其应有的作用。 二、评价者的主观意图与客观情况相结合的原则 评价指标权重反映了评价者和组织对人员工作的引导意图和价值观念。当他们觉得某项指标很重要,需要突出它的作用时,就必然各该指标以较大的权数。但现实情况往往与人们的主观意愿不完全一致,比如,确定权重时要考虑这样几个问题:(1)历史的指标和现实的指标;(2)社会公认的和企业的特殊性;(3)同行业、同工种间的平衡。所以,必须同时考虑现实情况,把引导意图与现实情况结合起来。前面已经讲过,评价经营者的经营业绩应该把经济效益和社会效益同时加以考虑。 三、民主与集中相结合的原则 权重是人们对评价指标重要性的认识,是定性判断的量化,往往受个人主观因素的影响。不

绩效考核指标权重的计算方法

绩效考核指标权重的计算方法在企业人力资源管理中,有许多涉及到权重的设置,如素质评价、绩效考核等。在一般的情况下,管理者都知道权重的重要性,但在设定权重时却往往会依凭自己积累起来的经验以及评价因素的定位来 进行判断。事实上,这种确定权重的方式存在很强的主观性,在实践中会导致一些不必要的偏差。如何在设定权重时,既考量管理者多年来积累起来的经验判断,又科学客观地定位各评价因素,避免一些不必要的偏差,使评价结果更接近于实际情况呢?下面的几种方法,或许能给你带来一定的收获。 一、简单排序编码法 这种方法通过管理者对各项考评因素的重视程度进行排序 编码,然后确定权重的一种简单的方法,需要管理者从过去的历史数据及个人的经验对各项考评项目作出正确的排序。 比如在绩效考核过程中,某一职位有四个KPI的考评因素,分别为A,B,C,D,依企业的要求及目标设定者的经验,各项考评因素的重要性排序为B,D,C,A;然后再按照自然数顺序由大到小对其进行分配,分别为4,3,2,1。然后将权数归一化,最后结果为A: 1/(4+3+2+1)=0.1;B:4/(4+3+2+1)=0.4C:2/(4+3+2+1)=0.2;D: 3/(4+3+2+1)=0.3。 这种简单排序编码法计算权数的方法简单,但也存在主观因素,存在一定的不合理性。但至少它比管理者单纯地依据自身经验进行设定的方式要客观一些。 二、倍数环比法 倍数环比法首先将各个考评因素随机排列,然后按照顺序对

各项因素进行比较,得出各因素重要度之间的倍数关系,又称环比比率,再将环比比率进行统一转换为基准值,最后进行归一化处理,确定其最终权重。这种方法需要对考评因素有客观的判断依据,需要有客观准确的历史数据作为支撑。 以上述四个因素为例,如下表。 说明:表格第二行,0.3表示A的重要性是B的0.3倍;2表示B的重要性是C的2倍,0.55表示C的重要性是D的0.55倍;1表示D本身。第三 行,是以D为基准进行的比率归一化,因C的重要性是D的0.55倍,因此取值为0.55*1=0.55;B是C的2倍,所以取值为 0.55*2=1.1;以下类推。最终权重则以合计数为分母,各基准值为分子算出。这种倍数环比法决定权重的方法较为实用,计算也简单,由于有准确的历史数据作支撑,因此具有较高的客观科学性。 三、优序对比法 倍数环比法虽然较为实用,但事实上,许多企业的历史数据常常不能反映因素之间的客观关系,而且也有些因素不能用量化的形式进行计算。如何评定它们之间的重要程度呢?优序对比法通过各项因素两两比较,充分考虑各项因素之间的互相联系,从而确定其权重。 首先需要构建判断尺度,一般情况下,重要程度判断尺度可用1,2,3,4,5五级表示,数字越大,表明重要性越大。当两个目标对比时,如果一个目标性为5,则另一目标重要性为0;如果一个目标为3,则另一个目标为2。 仍以上述四个因素为例,进行说明。 说明:合计列是将该行与其他因素两两比较得出的值进行加总,最终权数则是以各行合计数除以总合计得出。

权重的确定方法

权重的确定方法 综合评价指标体系内部各元素间存在质和量的联系。由指标体系的结构模型(如层次模型),我们已经确定了指标体系质的方面的联系,那么权重则反映各系统各元素之间量的方面联系纽带,它对于系统综合评价具有重要的意义。无论是在模糊综合评价,还是层次分析、灰色系统评价无一例外的用到了评价指标的权重。 权重的概念 韦氏大词典中对权重(Weight)的解释为:“在所考虑的群体或系列中,赋予某一项目的相对值”;“在某一频率分布中,某一项目的频率”;“表示某一项目相对重要性所赋予的一个数”。从中我们可以得出两点结论: (1)权重是表示因素重要性的相对数值。 (2)权重是通过概率统计得出的频率分布中的频率。 由此可以看出权重具有随机性与模糊性,它是一个模糊随机量。在综合评价中权重可以定义为元素对于整体贡献的相对重要程度,即元素能够反映总体的程度。 权重的确定方法 对实际问题选定被综合的指标后,确定各指标的权的值的方法有很多种。有些方法是利用专家或个人的知识和经验,所以有时称为主观赋权法。但这些专家的判断本身也是从长期实际中来的,不是随意设想的,应该说有客观的基础;有些方法是从指标的统计性质来考虑,它是由调查所得的数据决定,不需征求专家们的意见,所以有时称为客观赋权法。在这些方法中,德尔菲(Delphi)方法是被经常被采用的,其它方法就相对来说用得不多,这里列举几个在下面,以供比较。 1. 德尔菲法 德尔菲法又称为专家法,其特点在于集中专家的知识和经验,确定各指标的权重,并在不断的反馈和修改中得到比较满意的结果。基本步骤如下: (1)选择专家。这是很重要的一步,选得好不好将直接影响到结果的准确性。一般情况下,选本专业领域中既有实际工作经验又有较深理论修养的专家10~30人左右,并需征得专家本人的同意。 (2)将待定权重的p个指标和有关资料以及统一的确定权重的规则发给选定的各位 专家,请他们独立的给出各指标的权数值。 (3)回收结果并计算各指标权数的均值和标准差。 (4)将计算的结果及补充资料返还给各位专家,要求所有的专家在新的基础上确定

确定权重的7种方法

确定权重的7种方法 表7-1 地质环境质量评价定权方法一览表 一、专家打分法 专家打分法即是由少数专家直接根据经验并考虑反映某评价观点后定出权重,具体做法和基本步骤如下: 第一步选择评价定权值组的成员,并对他们详细说明权重的概念和顺序以及记权的方法。 第二步列表。列出对应于每个评价因子的权值范围,可用评分法表示。例如,若有五个值,那么就有五列。行列对应于权重值,按重要性排列。 第三步发给每个参予评价者一份上述表格,按下述步骤四~九反复核对、填写,直至没有成员进行变动为止。 第四步要求每个成员对每列的每种权值填上记号,得到每种因子的权值分数。 第五步要求所有的成员对作了记号的列逐项比较,看看所评的分数是否能代表他们的意见,如果发现有不妥之处,应重新划记号评分,直至满意为止。 第六步要求每个成员把每个评价因子(或变量)的重要性的评分值相加,得出总数。

第七步每个成员用第六步求得的总数去除分数,即得到每个评价因子的权重。 第八步把每个成员的表格集中起来,求得各种评价因子的平均权重,即为“组平均权重”。 第九步列出每种的平均数,并要求评价者把每组的平均数与自己在第七步得到的权值进行比较。 第十步如有人还想改变评分,就须回到第四步重复整个评分过程。如果没有异议,则到此为止,各评价因子(或变量)的权值就这样决定了。 二、调查统计法 具体作法有下面四种。 1.重要性打分法:重要性打分法是指要求所有被征询者根据自己对各评价因子的重要性的认识分别打分,其步骤如下: a.对被征询者讲清统一的要求,给定打分范围,通常1~5分或1~100分都可。 b.请被征询者按要求打分。 c.搜集所有调查表格并进行统计,给出综合后的权重。 2.列表划勾法:该方法如图7-2所示。事先给出权值,制成表格。由被调查者在认为合适的对应空格中打勾。对应每一评价因子,打勾1~2个,打2个勾表示程度范围。这样就完成一个样本的调查结果。 在样本调查的基础上,除采用一般的求个样本的均值作为综合结果外,还可采用如下方法: 图7-2 列表划勾法示意图 备择程 因子序号 度 W 1 2 3 …m-1 m 0.2 √√√ 0.4 √√√ 0.6 √√ 0.8 √ 1.0 a.频数截取法 频数截取法的主要步骤如下: 第一步:列中值频率分布表,见表7-2。记对应第个评价因子第个样本给的权值区间数为〔〕,=1,2,…,相对表中征询权值的几个区间,计算每一征询权值区间中所包含样本权值的频数,并推求

权重的三种计算方法举例

权重的计算方法举例 权重:反映指标在指标体系中重要性程度的数量。 研究问题:择偶指标体系权重集计算 1.外貌(身高、体重、长相魅力) 2.性格(情绪稳定性、性格匹配性、性格魅力) 3.成就(才华、财富) 4.潜力(升值空间) 一、定量统计法 假定随机抽取50名男大学生,50名女大学生,填写一份调查问卷,结果如表1所示: 表1 100名大学生对择偶指标体系重要性的评价结果 第一步:以67%(2/3)为界限,若选择“重要”、“非常重要”、“极为重要”的比例合计小于67%,则删除该指标。由表1知,4个指标累计比例均大于67%,均应保留。 第二步:把不重要赋值1,有点重要赋值2,重要赋值3,非常重要赋值4,极为重要赋值5,若仅选择重要及以上数据进入统计,则这三种选项的权重分别为:3/(3+4+5)=0.25;4/(3+4+5)=0.33;5/(3+4+5)=0.42。 第三步:计算每个指标的权重。指标1的权重=(40*0.25+30*0.33+20*0.42)/{(40*0.25+30*0.33+20*0.42)+(30*0.25+40*0.33+10*0.42)+(40*0.25+30*0.33+10*0.42)+(30*0.25+40*0.33+20*0.42)} = 28.3/(28.3+24.9+24.1+29.1)=28.3/106.4=0.266指标2权重=24.9/106.4=0.234指标3权重=24.1/106.4=0.226 指标4权重=29.1/106.4=0.274

二、专家评定法 假设请三位专家对4个指标进行评价,结果如表2所示。 表2专家评定结果表 第一步,请每位专家就4个指标的重要性打分,4个指标评分的总和为100。第二步,计算每一指标的均值,见最后一列。 第三步,计算4个指标的权重。 指标1权重30/100=0.30 指标2权重26.67/100=0.27 指标3权重23.33/100=0.23 指标4权重20/100=0.20 ?三、对偶比较法 假设请三位专家对4个指标进行对偶比较,专家甲结果如表3所示。 类似地,求出其他两位专家的权重

指标的权重设计方法

指标的权重设计方法有哪些? 答:设定指标权重的常见方法有四种:直接判断法、重要性排序法、三维确定法和权值因子分析法。 一、直接判断法 直接判断法是指由指标设定者根据自己的经验和对各项考核指标重要程度的认识,或者从引导意图出发,对各项考核指标的权重直接进行分配。 这种方法有效的前提是指标设定者对考核对象的工作和职责十分了解,如是员工的直接上级等。这种方法的优点是:第一,简单易行,容易操作;第二,适合规模比较小、绩效指标比较简单的企业考核; 第三,节省时间,决策效率高。这种方法的主要缺点在于:第一,基于个人的经验判断,主观性强; 第二,个人色彩比较强,容易招致员工的不满和质疑。 二、重要性排序法 重要性排序法就是将考核指标按照其重要性依次排序,并赋予分值,最后总根据每个考核指标在绩效指标体系整体重要程度得分中所占比重来确定每个考核指标的权重。 这种方法同样是基于个人的经验判断,但相对直接判断法而言,它有以下优点:第一,允许多个指标设定者各自做出判断,在一定程度上消除了单纯个人的主观性;第二,将每个指标设定者对指标重要性的判断结果以定量的方式进行综合处理,更加科学;第三,简单易行,省时省力,但是这种方法的缺点在于其打分过程仍然在较大程度上受主观臆断的影响,因此,其结果的客观性,准确性仍有欠缺。 三、三维确定法 三维确定法是一种定性与定量相结合的权重确定方法,也是企业在确定每一个指标权重时最常用的一种方法。三维确定法认为,决定一个指标权重的主要因素有三个:在现有资源配置和条件下该指标的可实现程度、重要程度和紧急程度。只有三者综合起来考虑才能得出合理的权重系数。 三维确定法的主要操作步骤如下:第一,将一组指标先按重要程度、紧急程度、可实现程度采用“五点打分法”分别打分;第二,将每个指标的重要程度得分、紧急程度得分和可实现程度得分相乘,得出该指标的综合分数;第三,将每个指标的综合分数相加,然后确定每个指标综合分数在总综合分数中所占的比例;第四,最终得出每个指标的权重值。 四、权值因子分析法 权值因子分析法相对于前三种方法而言是最科学但同时也是最复杂的方法,因而这种方法一般需要专业人员的参与,以确保其成功实施。 这种方法的步骤如下:

绩效考核指标权重地计算方法

在企业人力资源管理中,有许多涉及到权重的设置,如素质评价、绩效考核等。在一般的情况下,管理者都知道权重的重要性,但在设定权重时却往往会依凭自己积累起来的经验以及评价因素的定位来进行判断。事实上,这种确定权重的方式存在很强的主观性,在实践中会导致一些不必要的偏差。如何在设定权重时,既考量管理者多年来积累起来的经验判断,又科学客观地定位各评价因素,避免一些不必要的偏差,使评价结果更接近于实际情况呢?下面的几种方法,或许能给你带来一定的收获。 一、简单排序编码法 这种方法通过管理者对各项考评因素的重视程度进行排序编码,然后确定权重的一种简单的方法,需要管理者从过去的历史数据及个人的经验对各项考评项目作出正确的排序。 比如在绩效考核过程中,某一职位有四个KPI的考评因素,分别为A,B,C,D,依企业的要求及目标设定者的经验,各项考评因素的重要性排序为B,D,C,A;然后再按照自然数顺序由大到小对其进行分配,分别为4,3,2,1。然后将权数归一化,最后结果为A:1/(4+3+2+1)=0.1;B:4/(4+3+2+1)=0.4C:2/(4+3+2+1)=0.2;D:3/(4+3+2+1)=0.3。 这种简单排序编码法计算权数的方法简单,但也存在主观因素,存在一定的不合理性。但至少它比管理者单纯地依据自身经验进行设定的方式要客观一些。 二、倍数环比法 倍数环比法首先将各个考评因素随机排列,然后按照顺序对各项因素进行比较,得出各因素重要度之间的倍数关系,又称环比比率,再将环比比率进行统一转换为基准值,最后进行归一化处理,确定其最终权重。这种方法需要对考评因素有客观的判断依据,需要有客观准确的历史数据作为支撑。 以上述四个因素为例,如下表。 说明:表格第二行,0.3表示A的重要性是B的0.3倍;2表示B的重要性是C的2倍,0.55表示C的重要性是D的0.55倍;1表示D本身。第三行,是以D为基准进行的比率归一化,因C的重要性是D的0.55倍,因此取值为0.55*1=0.55;B是C的2倍,所以取值为0.55*2=1.1;以下类推。最终权重则以合计数为分母,各基准值为分子算出。 这种倍数环比法决定权重的方法较为实用,计算也简单,由于有准确的历史数据作支撑,因此具有较高的客观科学性。 三、优序对比法 倍数环比法虽然较为实用,但事实上,许多企业的历史数据常常不能反映因素之间的客观关系,而且也有些因素不能用量化的形式进行计算。如何评定它们之间的重要程度呢?优序对比法通过各项因素两两比较,充分考虑各项因素之间的互相联系,从而确定其权重。 首先需要构建判断尺度,一般情况下,重要程度判断尺度可用1,2,3,4,5五级表示,数字越大,表明重要性越大。当两个目标对比时,如果一个目标性为5,则另一目标重要性为0;如果一个目标为3,则另一个目标为2。 仍以上述四个因素为例,进行说明。

权重评价方法

2.2 权重确定 确定体系指标之后需要确定各指标在体系结构中所发挥影响的大小,即各指标的权重。比较常见的权重确定方法有层次分析法、专家打分法、模糊分析法、最大熵技术法、主成分分析法、特征值法、灰色关联法、概率统计法等。 2.2.1 层次分析法(AHP法) 层次分析法是应用最多的一种权重确定方法,该方法是美国运筹学家Pittsburgh大学教授Satie于20世纪70年代初,在为美国国防部研究“根据各个工业部门对国家福利的贡献大小而进行电力分配”课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。它将决策问题按总目标、各层子目标、评价准则直至具体的备选方案的顺序分解为不同的层次结构,然后得用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和的方法递阶归并各备选方案对总目标的最终权重,最终权重最大者即为最优方案。 以下用数学公式来表述具体步骤: ①构建层次结构模型 图2.2 AHP法结构示意图 ②构造判断矩阵

B= ???12111B B B i i22212B B B ?????????????ij j j B B B 21,其中B ij =j i b b ,表示第i 个因素与第j 个因素重要性之比。重要性的确定一般采用1-9标度法进行,即对各要素重要性进行人为拟定重要程度,级别分为1-9九类程度依次递增。目标层与准则层,准责层与指标层直接都是使用这种方法构建矩阵。 ③权重计算 计算相邻层级之间的层次单排序权重就是计算矩阵最大特征值与特征向量,即计算满足B·ν=λ·ν,其中λ为特征值,ν为特征向量,特征向量的每一个分量即为相对应的要素单排序权重。 ④一致性检验 CI=1max --n n λ,RI=1max ^--n n λ(其中^ λ m ax 为随机从B 中任取分量构成的矩阵 最大特征向量),CR=RI CI ; 当CR<0.1时,不一致性可接受,否则必须调整判断矩阵 这种方法的优点是系统、实用,既使用了数学的严谨推导,又保留了人为思考的空间,同时在数学推导方面仅进行较简单的求特征值特征向量与加权求和,简化了过程。缺点是备选指标较少时导致主观因素过甚,而备选指标过多时又会大大增加计算的复杂性,只能通过一些近似计算法来计算,结果的精确性便大大降低。不过现在已有相关计算软件如yaahp0.5.2可以直接进行相关计算,大大减少了研究人员的工作量。 2.2.2 专家打分法(Delphi 法) 专家打分法是最简便也是应用较多的一种方法,顾名思义就是将所列出的所有影响因子打印成册交给若干专家打分,之后收集起来按照各专家打分的平均值确定权重,或者将以往各专家学者所书文献中相关影响因子出现次数作为依据来确定权重。这种方法的优点有简便易行、强调主观色彩等,但缺点也较明显,没有比较扎实的科学依据,仅凭经验办事。刘建秀(1998)[86],钱贞兵(2010) [87]等人便是使用此种方法确定的权重。

权重确定方法归纳

权重确定方法归纳 多指标综合评价是指人们根据不同的评价目的,选择相应的评价形式据此选择多个因素或指标,并通过一定的评价方法将多个评价因素或指标转化为能反映评价对象总体特征的信息,其中评价指标与权重系数确定将直接影响综合评价的结果。 按照权数产生方法的不同多指标综合评价方法可分为主观赋权评价法和客观赋权评价法两大类,其中主观赋权评价法采取定性的方法由专家根据经验进行主观判断而得到权数,然后再对指标进行综合评价,如层次分析法、综合评分法、模糊评价法、指数加权法和功效系数法等。客观赋权评价法则根据指标之间的相关关系或各项指标的变异系数来确定权数进行综合评价,如熵值法、神经网络分析法、TOPSIS法、灰色关联分析法、主成分分析法、变异系数法等。两种赋权方法特点不同,其中主观赋权评价法依据专家经验衡量各指标的相对重要性,有一定的主观随意性,受人为因素的干扰较大,在评价指标较多时难以得到准确的评价。客观赋权评价法综合考虑各指标间的相互关系,根据各指标所提供的初始信息量来确定权数,能够达到评价结果的精确但是当指标较多时,计算量非常大。下面就对当前应用较多的评价方法进行阐述。 一、变异系数法 (一)变异系数法简介 变异系数法是直接利用各项指标所包含的信息,通过计算得到指标的权重。是一种客观赋权的方法。此方法的基本做法是:在评价指标体系中,指标取值差异越大的指标,也就是越难以实现的指标,这样的指标更能反映被评价单位的差距。例如,在评价各个国家的经济发展状况时,选择人均国民生产总值(人均GNP)作为评价的标准指标之一,是因为人均GNP不仅能反映各个国家的经济发展水平,还能反映一个国家的现代化程度。如果各个国家的人均GNP没有多大的差别,则这个指标用来衡量现代化程度、经济发展水平就失去了意义。 由于评价指标体系中的各项指标的量纲不同,不宜直接比较其差别程度。为了消除各项评价指标的量纲不同的影响,需要用各项指标的变异系数来衡量各项指标取值的差异程度。各项指标的变异系数公式如下:

最简单的权重计算方法

最简单的权重计算方法 最简单的权重计算方法 权重:反映指标在指标体系中重要性程度的数量。 研究问题:择偶指标体系权重集计算 1.外貌(身高、体重、长相魅力) 2.性格(情绪稳定性、性格匹配性、性格魅力) 3.成就(才华、财富) 4.潜力(升值空间) 一、定量统计法 假定随机抽取50名男大学生,50名女大学生,填写一份调查问卷,结果如表1所示: 表1 100名大学生对择偶指标体系重要性的评价结果

第一步:以67%( 2/3)为界限,若选择“重要”、“非常重要”、“极为重要” 的比例合计小于67%,则删除该指标。由表1知,4个指标累计比例均大于67%, 均应保留。 第二步:把不重要赋值1,有点重要赋值2,重要赋值3,非常重要赋值4, 极为重要赋值5,若仅选择重要及以上数据进入统计, 则这三种选项的权重分别 为:3/ (3+4+5 ) =0.25 ; 4/ (3+4+5 ) =0.33 ; 5/ (3+4+5 ) =0.42。 第三步:计算每个指标的权重。指标1的权重= (40*0.25+30*0.33+20*0.42 ) /{ ( 40*0.25+30*0.33+20*0.42 ) + (30*0.25+40*0.33+10*0.42 ) + ( 40*0.25+30*0.33+10*0.42 ) + (30*0.25+40*0.33+20*0.42 ) } = 28.3/ ( 28.3+24.9+24.1+29.1 ) =28.3/106.4=0.266 指标 2 权重=24.9/106.4=0.234 指标 3 权重=24.1/106.4=0.226 指标 4 权重=29.1/106.4=0.274 二、专家评定法 假设请三位专家对4个指标进行评价,结果如表2所示 表2专家评定结果表

权重法计算方法

权重法计算方法 因素项目权 重 外部因素内部因素 总分优劣系数 均价 (元/㎡) 均价合 成交通区位 自然 资源 品牌规模 社区 类型 景观 容积 率 配套 物业 服务 车位 数量 户型 格局 项目14%15%4%12%13%4%8%5%5%8%5%7% 恒大翡翠华庭35%423514553433 3.350.8940374002316宝地铭门25%533134353334 3.250.92153872001659龙湖紫都城15%443443333534 3.770.794436100727国瑞城15%453255343424 3.810.7860896300743瑞家坚果10%453112213244 2.76 1.0856900749富力尚悦居100%3133 2.53453453 2.995 1.000——6193

第一列,项目权重,根据主观意识判断,以本项目为100%,根据区域竞品的竞争大小判定所占百分比。第一行,各种因素对区域内(不只是本项目)影响因素的判定,同样是主观判定的,相加得100%。 正中数据是以本项目为标准,周边项目相对于本项目各项指数的设立,也是主观判定的。 总分:此数据为每一项数据乘以百分比之和:例如 (4*0.14+2*0.15+3*0.04+5*0.12+1*0.13+4*0.04+5*0.08+5*0.05+3*0.05+4*0.08+3*0.05+3*0.07=3.35 优劣系数:本项目总分除以竞品项目总分,例如:2.995/3.35=0.89403 均价:现在的均价 均价合成:项目权重*优劣系数*均价,例如:35%*0.89403*7400=2316

相关主题
文本预览
相关文档 最新文档