基于多元线性回归的商品住宅价格预测模型_王骏飞
- 格式:pdf
- 大小:1.06 MB
- 文档页数:2
基于多元线性回归模型的住宅商品房价格影响因素研究摘要:近年来,房价的飞速发展一直备受关注,其带来的一系列问题将对房地产行业的良性发展、政府的调控能力以及国民经济的可持续发展带来影响。
因此研究住宅商品房价格的影响因素,有助于把握房地产市场的发展规律,对整个国家经济的发展具有重要意义。
本文将以2015年全国28个城市的相关经济数据整理分析建立起多元线性回归模型。
文中主要选取住宅商品房平均售价作为因变量,以城市人均可支配收入,城市的财政收入,就业人口,受教育程度等8个维度作为自变量来进行分析,通过多元线性回归等一系列相关方法来了解商品房价格的影响因素。
研究发现,住宅商品房价格与财政收入,人均可支配收入,房屋竣工面积,受教育程度及住宅销售面积有显著的相关关系。
关键词:住宅商品房价格;多元线性回归;影响因素1 引言住房问题是民生问题,研究房价是研究我国住房体系的核心内容。
通过文献分析法发现,对房价的研究主要采用以下五种模型。
第一种,多元线性回归模型。
曾铄寓(2015)和郭晓宇(2014)首先画出因变量与各个解释变量的散点图,从图中看出线性关系,建立模型,分别得到了房价主要受到地区生产总值的影响[1]和人均可支配收入是影响当期房价的最主要因素[2]的结论,并且曾铄寓(2015)还运用了进入法和逐步回归法。
党光远和杨涛(2014)把影响因素分为供给和需求两个方面,得到了影响唐山房价的因素中地区生产总值和住宅竣工面积是最重要的两个因素[3]。
时维阔和张坤(2009)得出房价受人均可支配收入、房屋平均造价和房屋竣工面积三方面因素影响的结论[4]。
第二种,双对数模型。
刘广平、陈立文、许海平(2015)用面板数据进行层级回归,得到了以下结论:一是经适房价格对商品房价格产生了显著的正向影响;二是经适房供给量对商品房价格产生了显著的负向影响; 三是经适房供给量在两者之间起着正向的调节作用[5]。
第三种,杨贵中和邓学芬(2007)先是采用对数线性模型进行逐步回归,发现残差不符合正态分布,改用多项式混合模型,进行检验和事后模拟,得到影响成都市住房价格最重要的因素是市区人口和住宅施工面积这一结论[6]。
基于多元统计方法的城市房价预测模型研究近年来,随着城市化进程的加速以及人口对城市生活的需求增加,大城市房价持续上涨已成为常态。
然而,对于房产买卖市场,许多人需要更为具体的预测方式,以便在市场波动中及时作出决策。
因此,建立基于多元统计方法的城市房价预测模型已经成为社会各界的迫切需求。
一、基于多元线性回归的城市房价预测模型多元线性回归是一种流行的多元统计方法,它利用多个变量之间的线性关系来预测因变量的值。
在城市房价预测中,多元线性回归可以分析诸如地理位置、房产类型、人口密度、教育水平等变量与房价之间的相关性。
虽然多元线性回归是一种很有用的方法,但是它的模型存在了多重共线性以及数据的异方差性等问题,这些问题会导致预测结果不准确。
面对这些问题,研究人员需要多方面思考,才能提高预测模型的预测精度。
二、基于因子分析的城市房价预测模型因子分析是基于公共因素的多元统计分析方法,其目的是将大量的变量简化成少数几个综合变量,以便研究人员能够更好地解释数据。
因子分析在城市房价预测中,可以将各种因素分为房产本身的属性和地理环境等外在因素,并抽象出一些通用性的因素。
例如,建筑状况、房屋面积、邻近交通状况等因素可以被视为房产自身的属性,地理位置、环境卫生、交通便利等因素可以被归纳到外在因素中。
三、基于人工神经网络的城市房价预测模型人工神经网络是一种模拟人类神经网络的计算机系统,其最大的优势在于可以模拟人类的“学习”和“记忆”能力。
在城市房价预测中,人工神经网络可以通过模拟人类大脑的工作方式来预测房价等变量。
人工神经网络建立在一组与房价预测相关的训练数据上,通过反向传播算法不断调整权重和阈值,从而实现对房价等变量的预测。
总结:基于多元统计方法的城市房价预测模型研究是一项复杂而又重要的工作。
在此过程中,研究人员需要综合考虑多种模型和方法,并选择最适合的一种来预测房产市场。
同时,对于预测精度的提高还需持续的细化数据,完善模型,提高数据采集及报告的精准度和透明度等多方面努力。
《多元线性回归分析的实例研究》篇一一、引言多元线性回归分析是一种统计方法,用于研究多个变量之间的线性关系。
在实际生活和科研工作中,这种分析方法广泛应用于经济、医学、生态学等领域。
本文以一个具体实例为例,深入探讨多元线性回归分析的步骤和应用。
该实例关注于房屋价格的影响因素分析。
二、研究背景及目的随着房地产市场的发展,房屋价格受到多种因素的影响。
为了探究这些因素如何共同影响房屋价格,本文选取了一组具有代表性的房屋数据,并运用多元线性回归分析方法进行实证研究。
研究目的在于揭示影响房屋价格的主要因素,为购房者和房地产投资者提供参考依据。
三、数据与方法(一)数据来源本研究的数据来源于某城市房屋交易数据库,涵盖了多个区域的房屋信息,包括房屋价格、房屋面积、房屋年龄、周边环境、学区等因素。
(二)研究方法本研究采用多元线性回归分析方法,通过建立模型来研究各因素与房屋价格之间的线性关系。
具体步骤包括:数据清洗、变量选择、模型建立、模型检验和结果解释等。
四、多元线性回归分析步骤及结果(一)变量选择与数据清洗根据研究目的和前人研究成果,本研究选择了以下变量:房屋价格(因变量)、房屋面积、房屋年龄、周边环境(包括交通、商业、绿化等)、学区等(自变量)。
在数据清洗阶段,剔除了异常值和缺失值,确保数据的准确性和可靠性。
(二)模型建立根据选定的变量,建立多元线性回归模型。
模型形式如下:P = β0 + β1 × Area + β2 × Age + β3 × Environment + β4 × Schoo l + ε其中,P表示房屋价格,Area表示房屋面积,Age表示房屋年龄,Environment表示周边环境因素,School表示学区因素,βi 为各变量的回归系数,ε为随机误差项。
(三)模型检验通过SPSS软件进行模型检验。
首先进行多重共线性检验,发现各变量之间不存在明显的共线性问题。
基于回归分析的房价模型及预测随着生活水平的提高和城市化进程的加速,房地产市场已经成为了国民经济的重要组成部分。
对于购房者而言,他们需要了解市场上的房价走势,以便更好地做出投资决策。
而对于开发商而言,他们需要明确自己产品的价值,以便正确定价并获得市场份额。
因此,基于回归分析的房价模型及预测在当前的经济背景下显得极其重要。
本文将介绍回归分析的相关知识,并利用Python语言建立基于多元线性回归的房价模型,并预测房价走势。
一、回归分析的知识介绍回归分析是一种通过对因变量与自变量之间的关系进行建模来对因变量进行预测的统计分析方法。
简单来说,回归分析就是用已知的自变量数据来预测未知的因变量数据。
在回归分析中,自变量与因变量之间的关系可以用一条直线或曲线来表示,这条直线或曲线称为回归线或回归曲线。
在回归分析中,自变量数量的不同可以分为简单线性回归和多元线性回归。
如果自变量只有一个,称为简单线性回归;如果自变量有多个,称为多元线性回归。
在建立回归模型之前,需要考虑一些问题,例如选择哪些自变量,如何评价模型的拟合程度等。
二、基于多元线性回归的房价模型建立在本文中,我们选择了三个自变量,分别是房屋面积、房间数量和街区位置。
我们使用Python语言来建立回归模型,其中使用了Pandas、NumPy、Scikit-learn和Matplotlib 等库。
具体代码如下所示:```pythonimport pandas as pdimport numpy as npfrom sklearn.linear_model import LinearRegressionimport matplotlib.pyplot as plt# 读取房屋数据data = pd.read_csv('house.csv')x = data.iloc[:, 1:4].valuesy = data.iloc[:, 0].values# 拟合回归模型model = LinearRegression()model.fit(x, y)R2 = model.score(x, y)print('R2 coefficient:', R2)# 显示散点图plt.scatter(data['Area'], data['Price'], color='blue')plt.xlabel('Area')plt.ylabel('Price')我们首先使用Pandas库读取房价数据,并将数据分为自变量和因变量。
基于多元线性回归的房价预测模型python本文旨在简要介绍基于多元线性回归的房价预测模型在房地产市场中的重要性,并概述本文的目的和结构。
房地产市场中的房价预测对于买卖双方具有重要意义。
了解未来房价的趋势和表现可以帮助买家做出明智的购买决策,同时卖家也可以更准确地定价并制定销售策略。
因此,建立准确可靠的房价预测模型成为了房地产市场中的一个重要课题。
本文的目的是介绍基于多元线性回归的房价预测模型在 Python 中的应用。
通过使用多元线性回归模型,我们可以利用多个自变量(如房屋面积、位置、年龄等)来预测房价。
Python 是一种广泛应用于数据科学领域的编程语言,具有强大的数据处理和分析能力,因此选择 Python 作为实现工具。
本文将按照以下结构进行组织:简介:对基于多元线性回归的房价预测模型进行简要介绍,包括其重要性和应用场景。
数据收集和预处理:介绍如何收集和处理用于构建房价预测模型的数据。
多元线性回归模型:给出多元线性回归模型的理论基础和公式推导。
模型实现:使用 Python 实现多元线性回归模型,并介绍相关的 Python 库和工具。
模型评估和优化:介绍如何对模型进行评估和优化,包括交叉验证和特征选择等方法。
结论:总结本文的主要内容,并对未来的研究方向进行展望。
通过本文的阅读,读者将能够了解基于多元线性回归的房价预测模型在房地产市场中的重要性和应用价值,并学会使用 Python 构建和优化这样的预测模型。
多元线性回归模型是一种用于预测因变量与多个自变量之间关系的统计模型。
该模型基于以下基本原理和公式进行计算:自变量:指影响因变量的多个因素,如房屋面积、房间数量、地理位置等。
因变量:指要预测的变量,即房价。
回归系数:表示自变量对因变量的影响程度,可通过回归分析得到。
通过多元线性回归模型,我们能够利用已有的自变量数据来预测因变量的值,即根据房屋的多个特征来预测其价格。
在Python中,我们可以使用相关的库和函数来实现基于多元线性回归的房价预测模型。
基于多元线性回归分析房地产价格的影响因素一、本文概述随着经济的发展和城市化进程的加快,房地产行业在中国经济中占据了举足轻重的地位。
房地产价格受到众多因素的影响,包括宏观经济因素、地理位置、基础设施、政策环境等。
为了更好地理解和预测房地产价格的变化,本文旨在通过多元线性回归分析方法,深入探究影响房地产价格的主要因素,并构建预测模型。
本文首先将对多元线性回归分析的基本原理和步骤进行简要介绍,为后续的研究提供理论基础。
随后,将详细阐述房地产价格影响因素的选择原则和方法,确保所选因素能够全面、客观地反映房地产市场的实际情况。
在数据收集和处理方面,本文将采用权威、可靠的数据来源,并对数据进行预处理,以保证分析结果的准确性。
通过多元线性回归分析,本文将揭示各影响因素对房地产价格的贡献程度,以及它们之间的相互作用关系。
在此基础上,本文将构建房地产价格预测模型,并对其进行验证和评估。
将提出相应的政策建议和措施,以期为政府、企业和投资者提供有益的参考和借鉴。
本文的研究不仅有助于深入理解房地产市场的运行规律,还可以为房地产市场的健康发展提供科学支持,具有重要的理论价值和实践意义。
二、文献综述在房地产市场中,价格的形成与变动受到众多因素的影响,这一点已得到了广泛的学术关注。
早期的研究主要集中在单一因素对房地产价格的影响,如地理位置、经济指标、政策调整等。
然而,随着研究的深入,学者们开始意识到单一因素的研究方法可能无法全面揭示房地产价格变动的内在机制。
因此,越来越多的研究开始关注多个因素的综合影响,并尝试使用多元线性回归分析方法进行实证研究。
在多元线性回归分析的框架下,学者们对房地产价格影响因素的研究取得了丰富的成果。
一方面,经济因素如经济增长率、通货膨胀率、利率等被证实对房地产价格有显著影响。
经济增长率和通货膨胀率的上升通常会导致房地产价格上涨,而利率的变动则会对房地产价格产生反向影响。
另一方面,社会因素如人口增长、家庭结构、教育水平等也对房地产价格产生不可忽视的影响。
商品房价格回归分析和预测摘要:通过多元线性回归方法对近年的XX房地产市场发展状况进行回归分析,分析影响XX商品房价格的6个因素建立多元线性回归模型,利用SPSS软件得出结果,再对模型进行拟合优度,线性关系,显著性检验,最后根据计算与实际数据关系,得出模型并对商品房未来价格进行预测.关键词:多元线性回归,商品房平均价格,影响因子,SPSS软件.1引言商品房作为一种特殊的商品,在市场上受价值规律影响,其价格主要由商品房本身的价值和供求关系决定,即商品房的价值决定价格,且价格围绕价值上下波动;当商品房供给大于需求时,其价格下降,反之其价格攀升,这是以简单价值规律的视角得出的结论.一般来说,一个地区的商品房价格是由需求、供给及各种经济杠杆(如利率) 等因素来决定的,但在资本组合投资日益多样化的现代社会,商品房的价格还会受到债券及股票等金融资产等因素的影响,从而影响需求关系.但是,目前的房地产市场似乎没有遵循价值规律,不论供求关系以及其商品房价值本身如何,房价的变化让普通人难以琢磨.连续五年以来,全国各地的商品.房价格一路攀升,成为了当前经济生活中的一个热点问题,不少专家发表文章称,房地产市场是国家经济走势的晴雨表,是宏观经济疲软或者坚挺的重要标志,这充分说明了房地产市场在国家经济生活中的重要性.因此,为了科学、客观分析一个地区的商品房市场发展趋势并提出适当的预测,为有关部门的决策提供一定的科学依据就成为一个重要的研究方向.文中引入6项可能对商品房价影响的因素,利用多元线性回归分析建立的XX市商品房平均价格的数学模型,得出模型的有效性,从而指导政府调控房价,以及居民未来购房消费.2 房地产行业特点和现状分析这几年准备购房的普通消费者大多感到房价上涨带来的压力,房价与承受能力的矛盾显得突出.国际上一般认为,住宅价格相当于3~6倍的居民家庭收入时,是比较合理的房价收入比.从2005年看,XX市城镇居民户均可支配收入4万多元,能承受的房款总额只有24万元左右,购买100m2住宅只能承受2400元/m2的价格,这与商品房平均价格还有不少距离.目前,高位运行的房价已经超过大多数民众的支付承受能力,中低收入居民更是望房兴叹.对于中国这样一个长期处于住房难的大国来说,2001年最令人鼓舞的转折就是告别了城镇住房短缺时代.全国城镇人均住房建筑面积突破20平方米,达到中等收入国家水平.研究房地产市场的经营发展趋势,把握市场的机遇与风险,直接关系到房地产业与住房金融的稳健运行,也是关系到国家通过拉动内需实现国民经济良性循环的重要课题.房地产业在国计民生中发挥的作用越发显著[1][2].2.1全国房价现状1 商品房和商品住宅均价非常明显的上涨.2009年1—10月,全国商品房和住宅均价分别为4751元/平方米和4544元/平方米,分别较去年同期增长20.8%和22.7%,绝对水平和增速均创历史新高.而1999年全国商品房和商品住宅均价也只有2000元.2 多个重点城市近期成交均价接近或超过历史最高水平并呈稳步上升态势.截至2009年11月,20个重点城市中已有北京、上海、广州、深圳等12个城市先后突破历史最高水平.与今年1月相比,深圳、北京、厦门、南昌等9个城市住宅成交均价涨幅超过30%.3 全国房价绝对水平创新高,但累计涨幅不及GDP、人均可支配收入的增长.2009年1—10月,全国住宅均价达到4544元/平方米的新高,较去年同期上涨22.7%,而前三季度GDP、人均GDP等指标的增速不到10%,但居民储蓄存款同比增长24.8%,达到26万亿的历史高位.1998年-2008年,全国住宅均价累计上涨97%,而同期GDP、人均GDP、人均可支配收入的累计增幅均达到或超过2倍.1998-2004年,全国住宅均价累计上涨37%,低于同期GDP 等指标涨幅,而2004-2009年,全国住宅均价累计上涨79%,与同期GDP、人均GDP、人均可支配收入和居民储蓄存款涨幅基本持平.4 重点城市1998—2009年涨幅普遍低于同期GDP和人均可支配收入.1997年-2009年,北京等重点城市住房均价累计上涨150%-300%不等,但除上海外,其他重点城市的住宅均价涨幅均低于同期GDP累计涨幅,如北京住房均价累计上涨312%,但GDP上涨375%;深圳住房均价累计上涨191%,但GDP累计上升432%.上海的住宅均价涨幅尽管高于GDP涨幅,但同期居民储蓄存款累计上涨511%[3][4].2.2 房地产市场增长趋势从去年起人们预言的“房地产冬天”仍然没有到来,甚至今年上半年房地产市场仍然顽强地攀升.针对市场一般分析认为,房地产产业持续增长的动力可以总结得到以下几个方面[5]1.国民经济的持续快速增长.近几年来,我国国民经济增长率持续超过7%,高经济增长率和良好的经济增长质量可以推动城市化规模的不断扩大,大量农转非人口涌入城市必然要实现住房消费,从而为房地产市场带来新的购买力需求.国民经济的持续快速增长,也使城市中低收入劳动者的经济收入持续增长,这在一方面“激活”了中低收入者的购房需求,为房地产业的持续发展塑造了最广泛的消费群体;另一方面,也使原来购买力较强的消费者提升了消费层次,从而推动着住房品质的不断提升.因此,经济增长速度与增长质量是决定房地产发展的前提与基础[6][7]2.体制与机制的市场化.长期以来,我国主要靠国家和集体来建房分房,这种供给模式是中国城市居民居住环境差的主要原因.国家住房制度的改革,把建房与购房一同推向市场,从而使住房成为自由流通的商品.市场机制的引入,使建房者成为自负盈亏的法人,购房者用货币去选择适应个人需求的商品.这种产权的明晰化、个体化,催生了当前这个世界上最大的房地产市场,而这个巨大并且日益增长的市场需求,正是我国房地产业几年来持续火爆的载体[8].3.与消费观念更新配套的住房按揭贷款.市场经济不但提升了购买力,更重要的是催化了人们全新的消费观念.20世纪80年代以来在市场经济体制下就业的劳动者,大多数不会等到攒够钱以后再去买住房,而是充分利用住房按揭贷款来实现“居者有其屋”.据统计,70%以上的购房者都会选择利用银行住房贷款.目前全国商业银行个人住房按揭贷款已经超过6000亿元.大量的按揭贷款间接注入和不断递增的住房开发贷款已经成为支撑房地产市场最重要的资金来源[9].从房地产行业的特点现状,近几年我们看到房价一直居高不下,房价持续走高,2010年新年伊始,国务院就出台关于规范房地产市场的举措.在这样的大环境下,本文以市场入手,选取2000-2008年的XX 房地产市场商品房平均价格,从6个市场因素对商品房市场的影响,对商品房平均价格建立多元线性回归模型,运用SPSS 软件得出数据,从而实现对可预见的未来的商品房平均价格进行测控.3 多元线性回归模型设因变量为y ,k 个自变量分别为k x x x ,,,21 ,描述因变量y 如何依赖于自变量k x x x ,,,21 和误差项 的方程称为多元回归模型(multiple regression model ).其一般形式可表示为: k k x x x y 22110.式中k ,,,,210 是模型的参数, 为误差项.此式表明:y 是k x x x ,,,21 的线性函数部分)k k x x x 22110(加上误差项 .误差项反映了除k x x x ,,,21 对y 的线性关系之外的随机因素对y 的影响,是不能由k x x x ,,,21 与y 之间的线性关系所揭示的变异性.多元线性回归模型通常要满足6个假设:假设1:),,2,1(0)(n i u E i ,即零均值假设.假设2:),,2,1()()(222n i u E u Var i i ,即同方差假设.假设3:),,2,1,;(0,),(n j i j i u u E u u Cov j i j i ,即无序列相关假设.假设4:),2,1;,2,1(,0),(n i k j u X Cov i ji ,即假设解释变量与随机误差项不相关.假设5:),2,1)(,0(~2n i N u i ,即随机误差项服从正态分布,即),0(~2N U .假设6:解释变量k x x x ,,,21 为非随机变量,且它们之间不存在严格的线性相关,即不存在多重共线性.4 多元线性模型的建立通过以上对多元线性回归模型的了解,我们下面来分析一下商品房平均价格与其影响因素关系,并根据搜集来的相关数据建立多元线性回归模型.4.1 模型假设同一元线性回归模型的参数估计一样,多元线性回归模型参数估计的任务仍有两项:一是求得反映变量之间数量关系的结构参数的估计量,而是求得随机误差项方差的估计量.我们假设商品房平均价格为y ,住房竣工面积为1x ,商品房销售面积为2x ,社会年平均股票指数为3x ,建筑业贷款为4x ,个人住房公积金贷款利率5x ,商业贷款利率6x .得出多元线性回归模型如下:0112233445566y x x x x x x其中, 为误差项或称扰动项,误差项具有0 均值、同方差且服从正态分布,误差项之间不相关,代表的是y 的变化中没有被影响因子所解释的部分.( 的随机因素太多,此处不做讨论)[10][11][12][13]4.2数据统计通过调阅XX 水母网,旅房网,汇总得数据如表1所示:表1 2000—2008年商品房平均价格及其影响因素数据统计年份 单价/千元2m 住房竣工面积/4210m 商品房销售面积/4210m社会年平均股票指数/% 建筑业贷款/910元 个人住房公积金贷款利率/% 商业贷款利率/% 2000 1.56 78.29 62.31 13.83 8.89 4.59 6.21 2001 1.65 66.08 69.79 18.87 9.72 4.59 6.21 2002 1.82 33.30 143.39 19.64 8.78 4.59 6.21 2003 1.66 204.39 127.59 15.77 17.08 4.05 5.40 2004 1.85 151.28 151.76 14.73 13.01 4.05 5.40 2005 2.10 167.89 227.04 16.78 10.39 4.23 5.72 2003.04195.82298.8011.7215.124.415.72620073.14131.02195.9216.3318.874.59 6.12 20083.52193.66293.8715.4011.55 5.22 6.924.3 SPSS输出回归分析在SPSS软件中输入表1中数据,单击【分析】,选择【回归】选项,再选择线性选项.我们选择的置信度为90%,即显著性水平为0.1.输出数据如下表2-4值Significance F回归分析 6.000 4.50820.9890.046残差 2.0000.072总计8.000 4.580表4 回归系数检验和置信区间模型系数值标准误差P_value下限90.0%上限90.0%常数项-3.704 1.278 0.101 -7.435 0.027 x1-0.002 0.002 0.402 -0.008 0.004 x20.006 0.002 0.059 0.002 0.011 x3-0.047 0.048 0.434 -0.188 0.094 x40.098 0.028 0.075 0.015 0.180 x5-0.610 2.737 0.844 -8.602 7.382x 61.2362.053 0.608 -4.758 7.2294.4多元线性回归方程根据表4的结果,得到商品房的单价y 和商品房竣工面积(1x ) 、商品房销售面积(2x ) 、年平均股指(3x ) 、建筑业贷款(4x )、个人住房公积金贷款利率(5x ,5 年以上)、商业贷款利率(6x 、5年以上)的多元线性回归方程为:1234563.7040.0020.0060.0470.0980.610 1.236y x x x x x x5 模型有效性检验5.1 回归方程的拟合优度跟一元回归类似,多元线性回归方程需要用多重判定系数来评价其拟合优度.多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合优度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例. 由表中的SPSS 输出的结果表2可知:072.0,508.4,580.4 SSE SSR SST注:SST 总平方和,SSR 回归平方和,SSE 残差平方和,SSE SSR SST因此可以得到98428.0580.4508.412SST SSE SST SSR R ,即98.428%,2R是判定系数,1 R 说明拟和是完全的,0 R 说明y 的变化与x 无关.实际意义是:在商品房单价取值的变差中,能被商品房竣工面积、商品房销售面积、年平均股指、建筑业贷款、个人住房公积金贷款利率和商业贷款的多元线性回归方程所解释的比例为98.428%.而调整的多重判定系数936.0111122 k n n R R a .它考虑了样本量n 和模型中自变量的个数k 的影响,它表示在用样本量和模型中自变量的个数进行调整后,在商品房取值的变差中,能被商品房竣工面积、商品房销售面积、年平均股指、建筑业贷款、个人住房公积金贷款利率和商业贷款的多元线性回归方程所解释的比例为93.6%.这两个数字都接近1,因此说明其拟合度较高.5.2 线性关系检验线性关系检验是检验因变量y 与k 个自变量之间的关系是否显著,也称为总体显著性检验.(即讨论y 与k 个因素之间的关系) 第一步:提出假设.0:100 k Hk H ,,,:211 中至少有一个不等于0 第二步:计算检验的统计量F .1,~1 k n k F k n SSE K SSR F 第三步:做出统计决策.989.201 k n SSE k SSR F ,751.0)2,6(05.0 F .因为F 远远大于)2,6(05.0F ,所以拒绝原假设0H .这意味着商品房单价与商品房竣工面积、商品房销售面积、年平均股指、建筑业贷款、个人住房公积金贷款利率和商业贷款之间的线性关系是显著的.但这并不意味着商品房单价与每个变量之间的关系都显著,因为F 检验说明的是总体的显著性.要判断每个自变量对商品房单价的影响是否显著,需要对各回归系数分别进行t 检验(回归系数检验).5.3 回归系数检验在回归方程通过线性关系检验后,就可以对各个回归系数i 有选择地进行一次或多次检验.根据SPSS 的输出结果的表4中value P _是否小于1.0 来判断,因此只有商品房销售面积、建筑业贷款通过检验,其余4个系数均大于0.1,未通过检验.这说明在影响商品房单价的6个自变量中,只有商品房销售面积、建筑业贷款的影响是显著的,而其他4个自变量均不显著.这意味着其他4个自变量对预测商品房单价的作用已经不大.5.4 置信区间在输出的回归结果中,给出了个回归系数的置信区间.比如2 的90%的置信区间为(0.002,0.011).这一置信区间的含义是:在商品房竣工面积、年平均股指、建筑业贷款、个人住房公积金贷款利率和商业贷款不变的条件下,商品房销售面积每增加2410m ,商品房价格平均增加额在0.002千元—0.011千元之间.其它的各项回归系数的含义同理结合图表4都可以知道.6 经济意义从多元线性回归方程:1234563.7040.0020.0060.0470.0980.610 1.236y x x x x x x可以得出各回归系数的实际意义为:(表中654321,,,,,x x x x x x 即模型中的自变量)002.01 表示在商品房销售面积、年平均股指、建筑业贷款、个人住房公积金贷款利率、商业贷款不变的条件下,商品房竣工面积每增加2410m ,商品房单价下降0.002千元006.02 表示在商品房竣工面积、年平均股指、建筑业贷款、个人住房公积金贷款利率、商业贷款不变的条件下,商品房销售面积每增加2410m ,商品房单价上涨0.006千元047.03 表示在商品房竣工面积、商品房销售面积、建筑业贷款、个人住房公积金贷款利率、商业贷款不变的条件下,年平均股指每增加1%,商品房单价下降0.047千元098.04 表示在商品房竣工面积、商品房销售面积、年平均股指、个人住房公积金贷款利率、商业贷款不变的条件下,建筑业贷款每增加910元,商品房单价上升0.098千元610.05 表示在商品房竣工面积、商品房销售面积、年平均股指、建筑业贷款、商业贷款不变的条件下,个人住房公积金贷款利率每增加1%,商品房单价下降0.61千元236.16 表示在商品房竣工面积、商品房销售面积、年平均股指、建筑业贷款、个人住房公积金贷款利率不变的条件下,商业贷款每增加1%,商品房单价上升1.236千元7模型意义运用上述模型计算得到y 的模型计算值(即模型预测值)和实际值做比较表5 y 的计算值与实际值对照表年份 实际价格/千元模型价格/千元 2000 1.56 1.61015 2001 1.65 1.52391 2002 1.82 1.90276 2003 1.66 1.78931 2004 1.85 1.69057 2005 2.10 2.04164 2006 3.04 3.00790 2007 3.14 3.05565 20083.523.44892文中通过多元线性回归模型对2000-2008年调查的数据进行分析,通过SPSS 软件输出结果,并且对模型的可信度的分析并且对比实际结果,表明,文中建立的模型对分析商品房市场是有效的.在给出未来时期内的商品房竣工面积、商品房销售面积、年平均股指、建筑业贷款、个人住房公积金贷款利率和商业贷款等数据的情况下依据该公式,可以计算出商品房价格的预测值,可以大体观测商品房的波动情况.从而为政府宏观调控部门,房地产相关部门,房地产从业人士,以及有商品房消费需求的居民提供分析依据和知道.这有利于各方主题进行理性决策,采取有效措施,以规避风险,提高收益,这有利于房地产市场的改革和规范化进程,实现房地产业的健康,稳定和快速发展.我们也可以调查其他省市的的商品房市场,计算得出商品房竣工面积,商品房销售面积,年平均股指,建筑业贷款,个人住房公积金贷款利率,商业贷款等数据,从而绘制其它省市的商品房价格走向.在可预见的未来期间内,实现可以对09年的商品房走向做出分析预测[15][16].但是由于文中讨论的影响因素,例如住房竣工面积和商品房销售面积这些数据随着购买者的观望与否,消费预期等上下浮动,而且与购买者的年龄层次,买房原因等相关,比如08年奥运会,许多年轻人选择在这一年结婚,因而买房者增加,这些是个人主观影响结果.社会年平均股票指数这个数据实际计算时是在一年结束之后作出的统计结果.而在我们的计算分析过程中发现,影响房价的关键因素在于商品房销售面积、建筑业贷款.至于这二者与商品房均价的直接影响不在本文的探讨.8 模型预测突破的瓶颈.房地产开发的土地来源少,主要是旧城区的改造,企事业单位通过土地置换外迁、郊区闲置土地开发和占用耕地.随着国内经济的快速增长.可以预见居民收入仍将保持快速增长势头,居民购房能力仍将提高,而工业化、城市化的推进必然将迎来城市人口的快速膨胀和第三产业的迅猛发展,不可避免的对未来城市房地产的供应带来压力.从目前市场表现来看,近年来房地产已经存在“超买”现象,供需矛盾的存在使得这一现象更加突出,进而推动房地产价格上涨.作为应对,房地产开发商着重开发高层和小高层楼房,以提高容积率来稀释土地成本,缓解商品房的增长压力,但施工成本不断提高,因此商品房价格上扬不可避免.参考文献[1] 董保行. 我国房地产市场与价格的经济学探讨[J]. 粤港澳市场与价格,2000(6):11-17[2] 张坤, 关于国内商品房价格变化影响因素的综述[J]. 消费导刊,2009(15):21-24[3] 吴永柱. 近年来我国住房价格偏高的原因分析[D]. 兰州大学,2007(9):33-40[4] 周浩明,陈敦旭. 我国房地产泡沫的现状、成因及其治理对策[J]. 南经济管理干部学院学报,2005(2):110-119[5] 万欢. 对我国房地产泡沫问题的思考[J]. 经济,2004(10):20-27[6] 宋金梅.我国房地产泡沫的原因分析[J]. 江西职业技术学院学报,2007(4):55-57[7] 清风. 住房空置率与房价的悖论[J]. 中国地产,2006(4):7-9[8] 张磊,郑丕谔,张晔,王中权. 房地产价格分析及对策研究[J]. 经济体制改革,2006(5):24-27[9] 林素刚. 宏观调控背景下的中国房地产价格分析[J]. 南通大学学报.2006 (1):25-27[10] 夏明珠. 影响我国房地产价格变化因素分析[J]. 安徽建筑,2007 (1):63-69[11] 章恒. 房地产价格的影响因素分析[J]. 现代商业, 2008 (14) :12-14[12] 曹力元,刘林生. 房地产价格的影响因素分析[J]. 现代商业, 2007 (29):57-59[13] 肖元真,李薇洁. 我国2006年房地产发展现状和2007年前景展望[J]. 现代经济管理,2007(1):99-104[14]Dwyer L, Forsyth P. Measuring the benefit and yield of forergner tourism[J].Inernational Journal of Social Economics,1997(3):27-31[15] 李翔. 房地产业和房地产市场问题分析与对策建议—房地产业和房地产市场高层座谈会综述[ J ]. 中国城市经济,006(8):4-9[16]梁云芳,高铁梅,贺书平. 房地产市场与国民经济协调发展的实证分析[ J ] . 中国社会科学,2006(3):74 -84The Analyses and Forcast the Price of the CommercialBuildingsxxxxxxxx UniversityTutor: xx(Professor)Abstrac t The paper uses the model fo multiple linear regression to forcast the development of real property and the average price of commercial residential buildings.First,we find the affections which play an important roles in the commercial buildings of Yantai,such as the foor space of commercial buildings,the sales area of commercial buildings,the average stock index of a year,the construction loans and personal rate of accumulation fund,second,using the software of SPSS to found themodel of multiple linear,then do the significance test,calculate the result of the model,through it,we can forcast and analyses the price of the future commercial buildings.Keywords the Multiple Linear Model,the Average Price of Commercial Buildings,Affections,SPSS致谢在论文进行过程中,xx教授给予我大力支持,提供了大量重要文献,指导我完成论文初稿并帮助我反复修改,在此表示衷心的感谢.xx老师严谨治学的教学风范,严于律己的个人情操给给我巨大影响,我将时时铭记这些.同时对我大学四年中所有教导过我的老师在此也谨致谢意.另外感谢在我论文写作过程中为我提供帮助的xx,xx,xx等人.。
××大学《应用数理统计》课程课外报告学号:0000000000姓名:×××学院:×××专业:技术经济及管理成绩:日期:2011年12月8日重庆市住宅商品房平均销售价格的多元线性回归模型摘要住宅商品房的销售价格成为影响人民幸福指数的重要因素。
以多元线性回归为出发点,选取重庆市2001年至2010年连续十年的住宅商品房平均销售价格为因变量,同时选取四个影响因素,利用统计软件SPSS 对各因素的影响情况进行分析和筛选,最终确定住宅商品房平均销售价格与其中的因素之间的回归方程为:31299.34292.0149.2456X X Y -+=其中Y 表示住宅商品房平均销售价格,X 1 表示城镇居民家庭可支配收入,X 2表示建材类购进价格指数。
最后进行了检验,得出的结果在误差范围内,表明这个模型在一定程度上反映了重庆市住宅商品房平均销售价格与选取的各因素之间的关系。
关键词:多元线性回归,SPSS ,逐步分析正文一、问题提出,问题分析房地产业作为国民经济的支柱产业,已经成为国民经济新的增长点和消费热点。
作为四个直辖市之一的重庆是一个大城市大农村:城市建设和房地产开发主要集中在九个主城区,一共有四十个区市县;农业人口占总人口的三分之二。
今后随重庆市城市化进程的加快,农村人口的转移,住宅商品房的销售价格成为影响重庆人民幸福指数的重要因素。
因此,对重庆住宅商品房平均销售价格的研究与预测是十分必要的。
为了研究影响住宅商品房销售价格,有必要找出与之相关的因素及其他们之间的关系。
由于住房是必需品,人们有购买这种商品的欲望,住宅商品房平均销售价格必定与重庆城镇居民家庭人均可支配收入有关系。
此外,还有许多与商品房价格相关的因素,如商品房竣工面积、销售面积、建筑业贷款、住房公积金贷款利率、建材价格等。
这里选取了之中有代表性数据来源可靠的四个影响因素,采用逐步分析法处理数据,得出因素对住宅商品房销售价格影响的多元线性回归模型。
基于多元线性回归模型的房价预测黎小丽摘㊀要:房价现象是现今社会尤为关注的一个点,针对近几年房价几乎持续上涨这一现实问题,以惠州市为例,利用粗糙理论和相关性分析,确定GDP㊁人均收入㊁人均支出㊁施工面积和竣工面积为影响房价的主要因素,通过2010 2017年惠州市房价数据,建立多元线性回归模型并对其分析,预测房地产价格未来走势,进而根据影响因素提出有利于房地产市场健康㊁稳定发展的政策建议,是非常重要而迫切的研究课题,具有很强的理论和现实意义㊂关键词:多元线性回归模型;房价预测;相关性分析一㊁引言随着惠州市经济发展水平的加快和一线城市住房体制改革的不断深入,更多人口迁入二线城市,在二线城市购房㊂目前,从 五限 (限商,限卖,限价,限制,限购)政策出来看,惠州是粤港澳大湾区唯一不限购城市,目前整个粤港澳大湾区(9+2城市)大量外溢至惠州㊂惠州,这个临深得天独厚城市,将受益于深圳东进㊁粤港澳大湾区发展,人口逐步增加,城市发展也日益增多㊂故,这一举措加速了惠州市房价的抬升㊂如今的房地产开发已上升为产业的概念,对城市的影响力逐渐增强,价格的运行变得尤为重要㊂如何分析惠州市房地产价格波动,以及如何有效预测房地产价格未来走势已成为重要研究问题㊂因此有必要建立合理的价格模型,寻找价格变化规律,从而使分析预测更加准确㊂房地产作为一种重要商品,其价格影响因素众多,包括GDP㊁居民收支㊁开发施工面积㊁和竣工面积等㊂且每个因素影响程度不断变化,造成房价的不断波动㊂基于此,文章提出利用粗糙集模型和相关性分析,分析影响惠州市房价变化的因素㊂二㊁影响房价的因素分析及数据收集(一)影响房价的因素分析1.粗糙集模型粗糙集理论是一种处理不精确㊁不一致,不完整等各种不完备的信息有效的工具,且具有易用性㊂此外,该理论以对观察和测量所得数据进分类的能力为基础,以集合论为数学工具完成对不确定知识的处理㊂一般来说,粗糙集约简可概括为如下步骤:第一,以观察和测量的数据对象为行,以数据对象的属性为列,形成决策表㊂第二,对决策表进行进一步整理,删除相应错误及多余的内容㊂第三,对属性值进行相应约简,既要删除对结果影响较小的属性值,又要考察决策表中的具体属性值㊂在约简过程中,应保证各决策表是相容的㊂第四,再次对决策表进行整理,对某些具体属性值进行合并㊂不同决策表的核,即各约简决策表的交集应相同㊂决策表的核作为所有约简的计算基础,不可继续约简㊂通过决策表计算可知,短期内,影响惠州市房价的因素主要有GDP㊁人均收入㊁施工面积和竣工面积㊂2.相关性分析相关性分析是对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度的分析方法㊂相关性分析可首先对多个变量间关系进行判断,如变量间存在相关关系,则可对其相关性及相关程度进行具体描述㊂由于实际需要的分析情景不同,相关性分析又可以分为线性相关分析㊁偏相关分析和距离相关分析三种类型㊂利用R语言对影响房价的因素进行线性相关分析㊂其中,GDP㊁人均收入㊁人均支出和施工面积的相关性皆大于0.8,显著性概率p皆稳定在0.01左右,说明上述影响因素与房价的相关性极为密切㊂由此我们可以得出,GDP㊁人均收入㊁人均支出和施工面积为影响惠州市房价的主要因素㊂3.得出结论结合粗糙集理论和相关性分析结论可知,GDP㊁人均收入㊁人均支出㊁施工面积和竣工面积为影响惠州市房价的主要因素㊂(二)数据集介绍1.数据收集文章讨论影响惠州市房价变化的因素及模型预测,其中,房价作为因变量,其他影响因素作为自变量分析㊂在预测惠州市房价走势时,惠州市房屋销售价格和房价影响因素来自广东省统计信息网和惠州市政府网站,数据长度为2010 2017年㊂2.数据属性由上文可知,影响惠州市房价的主要因素为GDP㊁居民收支㊁开发施工面积㊁和竣工面积㊂由于房价的变化受多个变量影响,故对影响惠州市房价的主要因素做出具体介绍㊂一是惠州市GDP㊂GDP(国民生产总值)是指在一定时期内一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量经济状况的最佳指标㊂二是居民可支配收入㊂居民可支配收入是日常生活的主要来源,它决定着居民购买力的大小,即消费水平的高低,进而影响市场需求量㊂三是居民消费支出㊂居民消费支出是指城乡居民个人和家庭用于生活消费以及集体用于个人消费的全部支出㊂通过居民平均每人全年消费支出指标来综合反映城乡居民生活消费水平㊂四是开发施工面积㊂房屋施工面积是一定时期内施工的房屋建筑面积之和㊂新开工面积反映一定时期内房屋建筑新开工的规模,是分析施工战线长短和编制施工计划的依据㊂五是竣工面积㊂竣工面积是指房屋按照设计要求已全部完工,达到入住和使用条件,经验收鉴定合格或达到竣工验收标准,可正式移交使用的房屋建筑面积总和,是说明在建房屋建成程度的指标㊂图1 惠州市近几年房价数据及其影响因素三㊁多元线性回归模型预测房价(一)建立多元线性回归模型线性回归(LinearRegression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进㊀㊀㊀(下转第84页)续表变量股票市场参与度基金市场参与度债券市场参与度保险市场参与度民间借贷市场参与度金融市场参与度性别0.00004[0,1.000]0.153[0,0.361]-0.298∗[0,0.093]-0.278[0,0.234]0.206∗[0,0.088]-0.762∗[0,0.083]婚姻0.642∗[0,0.064]0.435∗∗[0,0.045]0.529∗∗[0,0.021]0.649∗∗[0,0.031]-0.076[0,0.626]-0.546[0,0.337]学历0.446∗[0,0.063]0.227[0,0.130]0.205[0,0.194]-0.185[0,0.375]-0.354∗∗∗[0,0.001]0.704∗[0,0.073]健康0.158[0,0.504]0.180[0,0.227]0.325∗∗[0,0.038]0.322[0,0.119]0.204∗[0,0.057]0.930∗∗[0,0.017]收入对数2.130∗∗∗[0,0.000]1.554∗∗∗[0,0.000]1.271∗∗∗[0,0.000]2.140∗∗∗[0,0.000]0.863∗∗∗[0,0.000]1.522∗∗∗[0,0.000]四㊁政策建议文章的实证结果得出,居民风险态度会显著影响家庭是否参与金融市场和金融市场参与度㊂因此,提高居民对金融风险的认知水平,加强政府对金融市场的监管力度,对于家庭合理参与金融市场,利用金融产品和服务来保障自己的福利水平有非常重要的推动作用㊂因此,各部门可以从以下方面着手㊂(一)提高居民金融素养增强居民对金融市场的认知程度,能够有效增加居民参与金融市场的概率,同时,能够避免决策失误,实现家庭投资收益和福利最大化㊂(二)设计符合居民需求的金融产品金融机构在制订和设计金融产品时,应将居民对于金融服务的风险和态度引入到所设计的理念中,尽量制订出符合我国城镇居民实际需求的金融产品,增强家庭对于金融市场的认识和了解㊂(三)健全金融配套服务体系,降低了信用风险完善商业银行金融服务行业内部信息公开披露机制,将会更有利于商业银行行为内部的企业,加强对行业自身的法律约束与自律,促进商业银行金融服务产业才会在太阳下健康地发展㊂参考文献:[1]陈其进,陈华.中国居民个体风险态度及影响因素分析:基于城镇居民㊁农民工和农村居民的对比研究[J].上海经济研究,2014(12):78-89.[2]胡振,臧日宏.风险态度㊁金融教育与家庭金融资产选择[J].商业经济与管理,2016(8):64-76.作者简介:陈絮雯,长沙理工大学㊀经济与管理学院㊂(上接第82页)行建模的一种回归分析,当因变量受到多个自变量影响时,所进行的分析便被称为多元线性回归㊂综上所述可知惠州市房价受多个因素影响,因而可以考虑建立多元线性回归模型㊂以住宅价格为因变量Y,各影响因素为解释变量建立多元回归模型为:Y=a+b1x1+b2x2+...+bkxk其中,b1,b2...bk,k=1,2,3...是回归参数(系数),表示在其他影响因素保持不变的情况下,xk变化一单位时商品住宅价格Y平均变动的单位数㊂a为常数项㊂通过求解这一函数方程,可以得到相应的数值及其相互关系,并由此做出必要的分析.多元线性回归分析在实际中应用极为广泛,它准确直观地描述了因变量随多个自变量的变化情况,并定量描述出各个自变量与因变量的相关性与相关程度,便于研究过程中的具体分析㊁模型的建立和预测㊂(二)结果分析在多元线性回归得出的数据中,R2表示拟合优度,R2接近于1,说明两变量的共变量比率越高,表示拟合程度越高㊂在实际R语言运行结果中,我们得到R2=0.9251,比较接近1,说明回归模型的拟合程度较好㊂F统计量代表所有影响因素整体对房价的显著性,F值越大,回归方程的显著性也就越明显,模型的置信度也就最高㊂在实际运行结果中,各自变量p值都小于0.01,说明回归模型置信度较高㊂bk代表回归系数,代表因变量与对应自变量的相关程度㊂由运行结果可知,多元线性回归方程为Y=6.104+9.939x1+3.794x2-5.186x3㊂四㊁结论与建议利用多元线性回归模型得出的公式可计算出:2018年估价为:Y=6.104+9.939∗3839.6+3.794∗31091-5.186∗22969=11049根据以上对惠州市房价的分析预测可以看出,惠州市房价上涨速度虽已减缓,但在一段时间内仍会呈现上涨趋势㊂在此趋势下,房地产形势也愈发严峻㊂房地产是反映一国经济状况的晴雨表,是我国国民经济发展的支柱行业,是十数亿人民的安居乐业之本㊂由于房价形成具有复杂性和客观性,对于政府来说,应从以下几方面入手解决:第一,应进一步完善土地供应办法,完善土地开发制度,规范土地市场;第二,加强经济适用房建设,缓解住房压力;第三,采用市场化方法,尽快出台房地产税以有效抑制投机性需求,降低泡沫风险㊂而对于居民来说,应结合自身需求,理性购房消费,以谨慎的态度对待房地产价格变化和房地产投资,以防不必要的上当受骗㊂参考文献:[1]李大营,许伟,陈荣秋.基于粗糙集和小波神经网络模型的房地产价格走势预测研究[J].管理评论,2009,21(11):18-22.[2]党光远,杨涛.唐山市房价影响因素的多元线性回归分析[J].河北联合大学学报(社会科学版),2014,14(2):21-25.[3]朝克,吕丽娟.基于多元线性回归的内蒙古自治区房价影响因素研究[J].内蒙古科技与经济,2011(17):7-9.作者简介:黎小丽,广东财经大学统计与数学学院㊂。