当前位置:文档之家› 主成分分析法在住宅特征价格模型中的应用

主成分分析法在住宅特征价格模型中的应用

第23卷第1期山东建筑大学学报嘲.23N0.1型篁兰旦型些堡塑型墅堕些型型堡垦墅坠;型

文章编号:1673—7644(2008)01—0015一晒

主成分分析法在住宅特征价格模型中的应用

高建,周丽萍,王文科,刘志新

(西北工业大学力学与土木建筑学院,陕西西安710cr72))

摘要:线性函数以计算简便、结果精确而广泛应用于特征价格模型中。但考虑线性函数中自变量数目较多并且存在一定相关性的问题。本文提出应用主成分分析法,对特征价格函数中的系数进行标准化处理,排除了变量问的线性关系对特征价格模型所产生的误差。同时,对西安市住宅市场进行实证研究,建立基于主成分分析的特征价格模型,并与线性函数的参数估计结果进行比较,以实际数据证实主成分分析法的可行性和有效性。

关键词:房地产估价;特征价格;主成分分析

中图分类号:F293.35文献标识码:A

AI删c拍蚰ofpriIlcipal∞m】pID玳nt锄alysisiIlb0憾iIlghedonicprice

m—础I

GAOJiaIl,ZHOUⅡ-ping,WANGWen—ke,以以.

(scI啪l0fMechanics&Ci、rilc【髓灯∞ti傩,NorIhfesl咖P嗣ybecllIlicalUnive璐i哆,)【i’蚰7100r72,(Km)Al斑ract:Thelinearmncti帆h嬲alI℃adybeen诵delyappliedinhedollic叫celnodelsbec卸seofitssirnplecalculation肌daccurateresult.Consideringcertajnp∞blemsinla增e咖111)er粕drelativit)roftIle谢ables,tllispapersuggests印plyillgprincipal

component粕如is(P(认)tostaIldald汝tllec础icientsintIleht,doIlicp矗c幽mction,excludingtlleeⅡor山att}le

m场、rit)rofo∞珏ici朗tsinhed砌cpIicemodelpmduced.As硼ex一距lple,tllehousiIlg胧以etin)【i’舳isstudiedu¥iIlgtllePCA如asedhedoIlic面cerI加del.Compared诮tIlt:hepa-ram嘶cestimati∞results0flinear‰ction,iti8p】御edtllatdleme出odi8llsdmand鲫perior.

K眄w咖s:砌estateevaluation;hedonicmodel;皿ncipalcoⅡ掣mnta|lalysis

O引言

特征价格模型自20世纪20年代产生以来,在国外已逐步形成了一套完整的科学体系,并具有广泛的应用,特别是在房地产领域,已经成为一种有效的评估和分析工具。而国内研究的展开仅有十多年的历史,在模型的函数选择、应用领域等方面的研究还不够深入。目前,国内研究以线性函数、对数函数为主[1,2],然而,函数形式的选择至今也没有严格的理论约束[3’4】。陈安明(2006年)首次提出应用主成分分析法B】,建立特征价格模型确定新建住宅项目的单位销售均价,但在结果分析时并没有绐出有效的数据证明该方法的优越性。本文从特征三价格模型的建立出发,通过分别计算基于主成分介析法和线性函数的特征模型的参数估计,以数据诡明结果的可行性和有效性。

1特征价格模型的建立

特片价格模型是一种基于商品价格耳眨决于商品各方面属性给予消费者的满足这一效用沧的观点而建立起来的价格模型,在价格预测、价格洋估等方面

收稿日期:加0r7一07—05

基金项目:西北工业大学研究生创业种子基金项目(跚31)

作者简介:高建(1983一),女,河北高碑店人,西北工业大学力学与土木建筑学院在读硕士,研究方向:建筑经济与管理

16山东建筑大学学报2008年

具有广泛的应用。自硒dker(1967年)把特征价格理论应用到住房市场分析以来,特征价格模型已经发展成为房地产领域广泛应用的模型之一。

住宅特征价格模型的一般形式如下【6J:

Pf=P(S,Ⅳf,Q)(1)其中:P为住宅的市场价格;s;为住宅的建筑特征向

量;。Ⅳi为住宅的邻里特征向量;Q为住宅的区位特征向量。特征价格模型没有理论定式,通常根据实际问题并铟数据来确定。在实际应用中,研究者考虑了白变量和因变量的相互关系,采用了多种函数形式,包括线宦兰函数、二次函数、对数函数、半对数函数、指数函数冬享等。就国内研究现状来看,线性函数以其计算简便、刍§果精确而被广泛应用,具体形式如下:

P=口o+∑of置+e(2)其中t:口。为常数项;o;为住宅特征的影响系数;置为自变量;表示住宅特征;£为随机误差。

线性函数的特点是拥有较多的变量,为模型的建3Z提供了丰富的信息,增强了模型的精确性。但多璺变量样本也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存车生相关性而增加问题分析的复杂性,同时对分析带.多长不便。如果分别分析各个变量,分析又可能是孤j立的。而不是综合的。盲目减少变量个数会损失彳艮多信息,容易产生错误的结果。因此需要找到一个台理的方法,减少分析变量的同时,尽量减少原变量包含信息的损失,对所收集的数据信息作全面的分耄沂。由于各变量间存在一定的相关关系,因此有可菊咆用较少的综合指标分别综合存在于各变量中的各害类信息。主成分分析法就是这样一种客观的多元绩三计方法。将主成分分析法引入特征价格模型,建立基于主成分分析的特征价格函数,进一步改进线性函数的模拟效果【7]。

2主成分分析法在特征价格模型中的应用

2.1主成分分析法

主成分分析法,是因子分析法的一种特殊形式,最耳是由美国心理学家C‰esspe删an于1904年提础,其基本思想是将实测的多个指标,用少数几个潜在的相互独立的主成分指标的线性组合来表示,构成的线性组合可以反映原多个实测指标的主要信息。主成分分析是从解释变量方差的角度出发,假设变量的方差能完全被主成分所解释,使得分析与评价指标变量时,能够找出主导因素,切断相关的干扰,做出更为准确的估量与评价。

主成分分析法强调差异性原理,指标权重系数具有客观性;它对自谈话量进行变换后形成了彼此相互独立的主成分,消除了评价指标之间的相关影响,因此这种方法不要求选择完全独立的指标,从而降低了指标选择的难度。此外,该方法确定的权数是基于数据分析而得到的指标之间的内在结构关系,不受主观因素的影响,而得到的综合指标(主成分)之间彼此独立,减少信息的交叉,使得分析评价结果具有客观性和准确性[8]。

2.2主成分分析法在特征价格模型中的应用[81设站个住宅样本的m个特征变量所构成的矩阵如下:

X=

菇11石21

算12茹笠

戈lm菇2m

对上述矩阵进行标准化处理得:

互:华(3)

其中:

i=丢豁,s;=击塞‰一孔

i=l,2,…,n,,=1,2,…,m

根据公式取=i与蚤乞乞得出住宅数据的相关矩阵R=(‰)。。。,由此计算相关矩阵的特征根为:Al≥A2≥…≥A。≥0,相应的特征向量厶=(‘-,如,…,k)’,,=1,2,…,m。于是标准化后的特征变量转换成主成分:

Fi。zLi=tnzl+l口z2+…+lmZ。

J=l,2,…,m(4)若主成分累计贡献率:

∑(~,∑-)≥85%(||}<m)

则选择前后个主成分为主成分变量。

以住宅销售价格P作为因变量,以主成分变量作为自变量,采用线性函数建立住宅特征价格模型:

m稚;枷

●●●

筮!塑直蕉笠;圭盛坌坌堑鎏垄焦室缱堑鱼整夔型生鲤应旦!Z

P=口o+口lF1+口2R+…+口I凡+£(5)3实证研究

本文选择西安市七个区域的92个住宅项目作为分析样本,建立基于主成分分析的住宅项目特征定价模型。

3.1特征变量的选择及其量化

本文的变量选择以我国国情为基础、以研究目标为导向,结合西安房地产市场的现状展开。综合分析得出10个住宅特征进入Hed砌c模型变量,其中区位特征变量1个,建筑特征变量3个,邻里特征变量6个,依次分别为:交通条件;建筑面积、楼层、朝向;生活配套、小区环境、文体设施、邻近大学、物业管理、教育配套。

根据以往较成熟的变量量化方法,本文采取实际数据的直接量化,5点“ket表量表量化,综合指标量化和虚拟变量量化等方法,具体如下:交通条件:小区方圆500m内的公交线路站点,每个1分;建楼层数,层;朝向:住宅朝向,南北朝向赋值l,其他为O;生活配套:小区内或1000m内有无超市,商场,菜场,银行,邮局和医院,每项1分,共计6分;小区环境:小区环境分为5个等级:极差1分,差2分,一般3分,好4分,很好5分;文体设施:小区内或1000m内无游泳池,健身场地,球场以及公共活动室,每项1分,共4分;邻近大学:小区附近1000m内有大专院的记1分,否则记0分;物业管理:小区物业管理水平分为5个等级:极差1分,差2分,一般3分,好4分,很好5分;教育配套:小区内或1000m内有幼儿园,小学,中学,每项1分,共3分。

3.2特征变量的主成分分析

对所收集的92组样本数据利用SPssl3.0软件进行主成分分析。主成分分量的选取,一般有两种方法:一是以特征值大于某数值为提取标准,系统默认为1;另一种方法为自定义提取主成分的数量。本文选取第一种方法,选择特征值大于0.7,结果如表l所示。从表1看出,前6个因子累计占总方差的贡献率为85.242%>85%,因此选取前6个因子

筑面积:住宅的总建筑面积,矗;楼层:住宅所在的为主成分分量。

表l总方差解释表

主成分系数矩阵(表2)是根据主成分系数和原始变量标准化值经过计算得到的。设表中系数为%,设主成分变量名为E(i=l,2,3,4,5,6),则公式为:

lO

E=∑口辨(6)3.3基于主成分分析特征价格函数的参数估计将主成分因子作为自变量,单价作为因变量,对模型进行线性回归分析。模型的估计方法为最小二乘法。即在sPssl3.O中选择强行进入法作为回归分析方法,选择6个主成分因子进入回归模型,据此得出西安市房地产估价模型:

P=3317.478+350.43lFl+45.893B+99.721几+61.379凡+22.208凡+4.086凡(7)将式(6)代入式(7)可得

P=3317.478+32.836Xl+145.209恐一

1.弼恐+国.355五+1∞.646墨一7.嘟瓦+

147.394骂一10.033凰+6.011玛+

14.379Xlo(8)

!!出丕建箕太堂堂拯至坚生

衷2主成分系数矩阵

4结果分析‘91

公式(8)中,特征因素前的系数为其隐含价格,

反映了特征因素对住宅价格影响的大小。总体来

说,可以分为三类:楼层、物业管理和生活配套的系

数均超过100,对住宅价格具有较大的影响;交通条

件、建筑面积、邻近大学的系数在10一100之间,对

住宅价格有正相关作用;朝向、小区环境、文体设施、

教育配套的系数最低,住宅价格的影响最小。具体

来说,建筑面积每增加1矗,价格将上调32.836元。

公交线路每增加一条。价格上调69.355元。随着

社会经济水平的增长,物业管理、生活配套的作用日

益重要,已经显示出高于建筑特征的意义。

主成分分析法是对线性函数的改进和优化。应

用SPsS软件直接对收集的样本进行多元线性回归,

比较两种函数形式的不同。

(1)两活函数形式的D值均小于2(表3),表明相

邻两点的残差为正相关。但1.899>1.830,更接近于

2,表明残差与自变量间存在更显著的独立性。

表3函数的Dulbin_watsom检验

函数形式DnIl如一Wats㈣检验(D值)

主成分分析法线性函数1.8991.830

(2)比较两种函数的残差直方图(图l,图2),主成分分析法的残差分布更接近于正态分布。

(3)比较变量的共线性诊断值,表4说明,主成份分析法中主成分因子的共线性诊断值均小于线性函数自变量的V玎值,进一步说明主成分分析中,各因子间的共线性问题不显著。

Histogram

D印end铷tVariable:单价

l。

Mean=7.65E一16

Std.Dev=O.966

N=92

图l主成分分析法的残差直方图

Histog舢

DependeIltVariable:单价

_

。Z

厂黑

|l

蘸,,j,l90?_‘

4.20246

标准化线差

Mean=7.65E—16

Std.Dev=O.966

N=92

图2线性函数的残差直方图

表4函数自变量的共线性诊断比较主成分v1F值线性函数vIF值Fl

F3

F4

F5

1.000

1.000

1.000

1.000

1.000

1.000

建筑面积

楼层

小区环境

交通条件

物业管理

文体设施

生活配套

教育配套

朝向

2.101

2.267

2.035

1.635

1.792

1.611

2.282

1.122

1.174

笙!塑直建笠;圭盛坌坌堑鎏查焦窒缱堑盆整夔型生丝廑旦!竺

5结论

本文通过收集了晓组完整的商品住宅的信息,利用主成分分析法,提出主成分因子,排除了变量的线性关系对城市住宅价格特征价格不利影响,由此得出了基于主成分因子的西安市房地产价格的特征方程,并对特征系数进行比较,分析对西安市住宅价格的影响。

建立基于主成分分析法的特征价格模型,改进了线性函数中自变量间的线性关系问题,同时,与线性函数进行比较,在不损失样本信息的前提下,参数估计的结果具有更好的模拟效果。

然而,特征价格模型的选取的住宅特征在一定程度上受到资料获取难度的限制,一些对住宅价格有影响的特征没有进入模型分析,使得回归模型中自变量对因变量的解释程度不是很高,须在以后的研究中迸一步改进。参考文献:

【1]温海珍.城市住宅的特征价格:理论分析与实证研究[D].浙江:浙江大学建筑工程学院,2004.

[2]周华.基于特征价格的西安市住宅价格空间分异研究[D].陕西:西北大学建筑工程学院,2005.

[3]H吐吐eadJM,B哪vierRA,H跚鲫B.0ntIlei且棚e

0f觚伽旧1formc垴ceiIlhed∞ic谢ce矗瑚lcd疆坞:矗lrtk目ddellee【J】.En“Hm℃malMaIl哪删,1997,21(5):759—765.

[4]M0l【MK,cIl蹰PK,cllos.AhedolIicpri∞Ⅱ州elh砸哪epl叩小ti∞i|I}10llgKong[J].Joumlal0fRealEstateFiI瑚∞ⅢdE‘HlolIli∞,1995,lO(1):37—48.

[5]陈安明.基于主成分分析的住宅项目特征定价模型[J].重庆大学学报(自然科学版),2006,29(6):145一147.

[6]柳欣欣.大连住宅价格影响因素分析及实证研究[D].大连:大连理工大学,2005.

[7]刘先通,袁长迎,段宝福,等.sPsslO.O统计分析软件与应用[M].北京:国防工业出版社,2002.

[8]云虹.主要成分分析法在承诺评价模型中的应用[J].管理学报,2006,3(5):538—542.

[9]富毅.基于特征价格的杭州市住宅价格空问分异研究[D].杭州:浙江大学,猢6.

?+一+一+一+-+-—●一+—+—+—+—+一十-+一—卜-—}—.+一+一+——卜—+-+一+一—+.一+一+*—卜—+一+—?卜——卜—+-—●‘-—卜—+-—+--+-—卜-?1一-—-—?。-卜一—卜—‘卜—。+—-—卜-+-—●一?

科技书刊参考文献著录中应注意的问题

学报编辑部蔚莹

参考文献是科技文献的必要组成部分,是为撰写或编辑论著而引用的有关图书资料。虽然参考文献著录的标准已实行多年,但在实际操作中,仍是问题不断,其主要原因是作者不熟悉著录规则,或对规则理解不透。下面就结合目前参考文献著录中存在的不足,谈一下作者应注意的几个问题。

1只著录最必要、最新的文献

目前,在参考文献的著录中转引的现象普遍存在,因无法查到原文献,这一部分文献的著录往往不规范,这样不仅使文献本身的科学性大打折扣,也无法真实地反映该论著的起点和深度。因此,作者在著录时应注意,只著录最必要、最新的文献。著录的文献要精选,仅限于著录作者亲自阅读过并在论著中直接引用的文献,而且,无特殊需要时不必罗列众所周知的教科书中的一般知识性内容或某些陈旧史料。

2只著录公开发表的文献

与国外不同,我国在国标GB77J4_87中规定,只能著录公开发表的文献。公开发表是指在国内外公开发行的报刊或正式出版的图书上发表。未公开发表的资料,一般不宜列入参考文献表,如未正式出版的会议论文集、专题报告及产品说明书等,如需标著,可在正文中随文做说明或注释。另外,对于网络文献的选择应尤其慎重,因为目前对于网络文献是否公开发表尚无明确的定义,但其中很多文献是没有经过审稿和编辑过程的,且更新速度快,文献的科学性和可追塑性无法保证。

3采用标准化的著录格式

(1)标引顺序

采用顺序编码制时,经常出现的问题有:只列文后参考文献表,而未在正文标出文献被引用的位置;或是先按文献的重要程度列参考文献表,后将表中的著录项序号注入文中,结果常常是先出现的文献序号比后出现的大。因此应注意,必须按引用文献在正文中出现的先后顺序编码,此序号即是文后参考文献表中各文献的序号,它们应是一一对应的。

(下转第73页)

相关主题
文本预览
相关文档 最新文档