中国民用汽车保有量的组合预测
- 格式:pdf
- 大小:303.96 KB
- 文档页数:5
北京市机动车保有量预测随着我国经济的快速发展,民用汽车的保有量也迅速增长。
机动车保有量的发展影响到环境质量、交通安全、道路建设等诸多方面。
在我国,尤其是大中型城市,机动车已成为城市空气污染的重要来源。
因此,合理预测机动车保有量是未来进行机动车污染防治规划、道路发展规划等的重要前提。
本文将采用时间序列预测法和一元线性回归模型对2020年末和2030年末北京市机动车保有量进行预测。
法一:时间序列预测法2005年至2015年北京市机动车保有量数据如表1所示。
表1北京市机动车保有量数据北京机动车保有量变化趋势图如图1所示,可以观察到其变化趋势在2010 年末出现了明显的转折,2010年末之后的机动车保有量增长幅度较2010年之前相比明显放缓,这种情况形成的主要原因是在2011年北京开始调控机动车的数量,实行了摇号政策。
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016年份图1北京机动车保有量变化趋势由于摇号政策实行前和实行后,北京市机动车保有量增长情况呈现出了不同趋势,而且摇号政策在今后极有可能继续施行,所以为避免预测结果过于偏离实际,在采用时间序列预测时仅采用2011年末及以后的数据,如图2所示。
>辆万I量有保车动机图2时间序列预测机动车保有量得到预测方程:y = 17.46% - 34611其中x为年份,y为机动车保有量。
从图中还能看到,R2值为0.9657,接近于1,因此拟合优度很好,可以采用此预测方程来预测2020年末和2030年末北京市机动车保有量,如表2所示。
表2时间序列预测结果年份2016 2017 2018 2019 2020 2025 2030 机动车辆数(万辆)588.4 605.8 623.3 640.7 658.2 745.5 832.8 其中2017年机动车保有量为605.8万辆,2020年为658.2万辆,2030年为832.8万辆,无法达到《北京市2013-2017年清洁空气行动计划重点任务分解》、《北京市缓解交通拥堵总体方案(2016—2020年)》等方案设立的“2017年底将全市机动车保有量控制在600万辆以内,2020年控制在630万辆以内”的目标。
纯电动汽车保有量预测以及充电设施需求分析
熊长寿;吴嘀;陈涛
【期刊名称】《智能电网(汉斯)》
【年(卷),期】2011(001)003
【摘要】电动汽车充电设施的合理规划与建设不仅能够提高充电设施的运营效益,还能够减小对电网的谐波危害等。
因此论文对纯电动汽车充电设施的需求分析方法进行了研究。
首先分析了现有汽车保有量预测方法的不足,提出了基于残差灰色模型的纯电动汽车汽车保有量的预测方法。
并以重庆市为例,对重庆市的纯电动汽车保有量进行了预测,验证了论文提出的预测方法的准确性,并得出了今后10年电动汽车保有量。
根据充电设施的建设原则,提出了充电设施的需求分析计算方法,在此基础上对重庆市充电站的建设进行了需求分析,得出了重庆市的纯电动汽车充电站与充电桩的需求数量。
【总页数】5页(P73-77)
【作者】熊长寿;吴嘀;陈涛
【作者单位】[1]不详;;[1]不详;;[1]不详
【正文语种】中文
【中图分类】F4
【相关文献】
1.熵值组合预测模型在民用汽车保有量预测中的应用 [J], 彭晗;吴金妹;王璐
2.贵阳市电动汽车保有量预测与充电设施运营模式研究 [J], 莫莉;
3.基于计量模型的中国民用汽车保有量因素分析与预测 [J], 姜皓
4.城市汽车保有量极限值分析与预测 [J], 姚广铮;刘小明;陈艳艳;崔凯俊
5.基于改进Compertz-PCA的汽车保有量联合预测 [J], 杜丹丰;贾金航
因版权原因,仅展示原文概要,查看原文内容请购买。
2011年2月第27卷 第1期消费经济CON S UM ER ECONOM ICSF eb .2011V o1.27 N o .1收稿日期:20101213基金项目:教育部人文社会科学重点研究基地重大项目(10JJ D 790032);教育部新世纪优秀人才支持计划。
作者简介:孙 巍(1963-),男,吉林吉林市人,吉林大学商学院数量经济研究中心副主任、教授、博士生导师;张馨月(1983-)女,辽宁沈阳人,吉林大学商学院数量经济专业博士研究生。
中国家用车拥有量的饱和点测算基于G o mpertz 模型的动态面板估计孙 巍1 2张馨月2(1 吉林大学数量经济研究中心,长春130012;2 吉林大学商学院,长春130012)摘 要:本文采用年我国城镇居民收入和家用车拥有量数据,基于非线性增长曲线的动态面板模型,估算中国家用车市场的饱和点。
结果表明,收入持续快速提高是导致家用车需求爆发性增长的主要原因;在假定其他条件不变的情况下,家用车市场的长期均衡点约出现在2025~2030年,相应的家用车拥有量约为15344万辆。
关键词:家用车拥有量;饱和点;G o m pertz 模型;动态面板中图分类号:F 407 471 文献标识码:A文章编号:1007-5682(2011)01-0046-04一、引言自经济转型以来,中国汽车需求呈现世界历史上前所未有的攀升。
截至2010年11月底,中国汽车累积产销分别完成1640 01万辆和1639 54万辆,同比分别增长33 71%和34 5%。
这意味着在国际金融危机的冲击仍然延续的背景下,中国汽车产销规模已经超过美国1700万辆的历史最高纪录。
30年间,中国民用汽车拥有量从135 84万辆增长到7000多万辆,其中私人汽车拥有量的激增是导致整体乘用车市场需求剧增的主要原因。
!十二五∀规划提出了全面建设小康社会的发展目标,还会加速这一增长趋势。
然而,这种超常的需求状态是中国居民消费结构升级过程中的阶段性特征,未来的发展必然会随着快速的市场供给使得这个特殊市场很快趋于饱和的均衡状态。
2022年中国汽车保有量、新注册登记机动车数量及驾驶人数量分析一、保有量机动车辆简称“机动车”,由自带动力装置驱动或牵引,不用轨道,可在陆地上行驶的轮式“车辆”。
在中国一般指在道路上行驶的,供乘用或(和)运送物品或进行专项作业的车辆,包括汽车、挂车、无轨电车、农用运输车、摩托车、机动三轮车和运输用拖拉机(包括带挂车的轮式拖拉机)以及轮式专用机械车等,但不包括任何在轨道上运行的车辆。
据公安部统计,2022年上半年中国机动车保有量达4.06亿辆,其中汽车保有量达3.1亿辆,占机动车保有量的76.4%。
截至2022年6月底,全国有81个城市的汽车保有量超过100万辆,同比增加7个城市,37个城市超过200万辆,20个城市超过300万辆,8个城市超过400万辆。
其中,北京汽车保有量超过600万辆,成都、重庆汽车保有量超过500万辆,苏州、上海、郑州、西安、武汉汽车保有量超过400万辆。
在政策的大力推动下,近年来我国新能源汽车市场高速发展,截止2022年6月底,中国新能源汽车保有量达1001万辆,其中纯电动汽车保有量达810.4万辆,占新能源汽车保有量的81.0%。
近年来中国新能源汽车保有量占汽车保有量的比例逐年攀升,2021年中国新能源汽车保有量占汽车保有量的2.60%,较2016年的0.47%增长了2.13%,2022年上半年中国新能源汽车保有量占汽车保有量的比例达3.23%,未来将继续保持增长趋势。
从2018-2022年上半年中国新能源汽车保有量对比数据来看,2022年上半年中国新能源汽车保有量增幅最为明显,2022年上半年中国新能源汽车保有量达1001万辆,较2021年同期增加了397.60万辆,同比增长65.89%,创近年来同期历史新高。
二、新注册登记机动车数量2022年上半年,全国新注册登记机动车1657万辆,与去年同期相比减少214万辆,下降11.43%,2022年上半年前3个月机动车新注册登记量与去年同期持平,受疫情影响4月和5月机动车新注册登记量明显低于去年同期,但随着汽车产业复工复产加快,6月机动车新注册登记量达到270万辆,与去年6月基本持平。
中国汽车保有量数据测算方法1.引言1.1 概述中国汽车保有量是指在中国境内登记和运行的所有汽车的数量。
随着中国经济的快速发展和人们生活水平的提高,汽车已经成为人们日常出行的重要工具。
汽车保有量数据的准确测算对于制定交通规划、优化道路资源利用、制定环保政策等方面具有重要意义。
为了准确测算中国汽车保有量,需要收集和整理大量的数据,并运用合适的方法进行处理和分析。
首先,数据来源包括政府部门、行业协会、汽车制造商、汽车经销商等多个渠道,这些数据涵盖了汽车车辆登记信息、销售数据、报废报废数据等。
通过收集这些数据,可以全面了解到中国汽车市场的发展状况,从而有效进行保有量的测算。
在数据处理方法方面,可以采用多种方法进行汽车保有量的测算。
常见的方法包括统计法、抽样调查法、模型估计法等。
统计法是根据全国范围内的汽车登记数据进行统计分析,借助数学模型和统计学方法来估算全国汽车保有量。
抽样调查法则是通过选择一定数量的样本来进行调查,然后根据样本的特征和统计学原理推算得出全国范围内的保有量。
模型估计法是建立数学模型,通过输入相关的变量和参数进行计算,从而得出汽车保有量的估计结果。
本文将介绍中国汽车保有量数据的测算方法,包括数据来源和处理方法。
通过对这些方法的分析和比较,可以对不同方法的优劣进行评价,并得出相应的结论。
同时,文章还将对测算结果进行分析,以便更好地理解中国汽车市场的发展趋势,并为相关领域的决策提供科学依据。
综上所述,中国汽车保有量数据测算方法是一个复杂而又重要的问题。
通过深入了解数据的来源和处理方法,可以更准确地计算出中国汽车保有量的数据,为各个领域的决策提供有力支持。
本文将在接下来的章节中详细介绍相关内容,并分析探讨不同方法的优劣,以期得出准确可靠的测算结果。
1.2文章结构1.2 文章结构本文主要介绍了中国汽车保有量数据的测算方法,文章结构如下:1. 引言1.1 概述1.2 文章结构1.3 目的2. 正文2.1 数据来源2.2 数据处理方法3. 结论3.1 结果分析3.2 方法优劣评价在引言部分,我们将对中国汽车保有量的重要性进行概述,以及说明本文的目的和对应的章节结构。
我国汽车需求函数分析一、前言随着我国经济持续稳定高速的增长,汽车消费市场也在全面增长。
分析和预测近年来国内汽车需求量对各汽车厂商展开经营活动、发现经营契机、增强产品竞争力和提高市场占有率等具有重要的指导意义。
本文采用质的分析方法与量的分析方法相结合,首先用质的分析方法判断家用汽车需求的主要影响因素及其对需求的影响程度。
然后用时间序列方法通过组合指数曲线趋势法、增长率法和灰色系统模型法,根据中国国家统计局的权威数据,对家用汽车需求进行预测。
利用组合预测的关键是确定各个单一预测方法的加权系数,论文通过使组合预测误差平方和最小化来确定最优加权系数。
运用时间序列方法的步骤是先根据数据对每百户汽车拥有量作预测,在假设城市人口扩张速度的基础上,对总需求量作预测。
二、定性预测:汽车需求的主要影响因素分析所谓汽车需求,就是消费者在一定时期内在各种可能的价格下愿意并且能够购买的汽车商品的数量。
影响汽车需求的因素概括起来主要有以下几个方面:(1)居民收入下面为2000年到2011年我国城镇人均收入和增长率的图表,由图上数据可以看出,我国城镇居民的可支配收入每年都在增加,收入增长率也保持在一个高位上。
从各国汽车市场的比较研究中可以发现,人均收入水平与汽车普及率存在显著的相关关系。
表现为汽车拥有率随着人均收入水平上升而上升的普遍趋势,这一趋势一直持续到轿车普及率达到每千人500 辆左右才会有所减慢或出现回落。
国际经验表明,随着居民收入水平的不断提高,汽车的需求主要是由家用轿车的需求拉动的。
现阶段中国汽车拥有率是严重偏低的,我国过低的汽车人均保有量显示出我国轿车需求的巨大潜力。
随着生活质量的改善、收入水平的提高,除了满足了基本的生活必需消费之外,居民已经有能力承担更高层级的消费活动了,在这里,我们结合汽车需求的收入弹性的知识,来分析一下,居民收入水平的改变到底对汽车需求量会不会产生重要的影响。
下图为我国历年来的全国汽车销量和增长率图表:结合城镇居民收入和增长率图表,得出以下的需求收入弹性:收入弹性总体上都是大于1的,而且很多都是比1要大很多,需求收入弹性很高,说明居民收入水平的变化对汽车的需求量有着很大的影响作用,汽车行业就目前来说在经济发展中有着很好的机会。
私家车保有量的预测与控制摘要本文研究的是私家车保有量的增长及如何控制的问题. 寻找私家车保有量烦人增长规律,对于确预测私人汽车保有量,对制定经济政策和进行经济宏观调控、保证社会经济和谐发展有重要的作用. 因此本文就该问题进行分析与探讨.对于问题一,我们首先通过作图先初步影响私家车保有量的因素进行分析,得到噪声对汽车保有量的影响不大,接着我们用数学中的分类思想首先建立了聚类模型,深入地分析了影响私人汽车保有量的各个因素,最终确定运营公交车辆数、公交车营运总里程、汽油(93号)年均价和公交营运总数这四个指标是影响汽车保有量的主要因素. 在对类聚模型改进的基础上建立了主成分分析模型,确定出了三个主要成分,再利用多元线性回归预测出了2010年的某地区汽车保有量为136.7788万辆. 在此基础上,我们又建立了灰色预测模型并进行了绝对残差和相对残差验证、关联度检验和后验差检验,预测得出2010年汽车保有量为188.7183万辆. 为了验证预测值是否准确,我们又建立BP神经网络模型并其进行预测,得出2010汽车保有量为163.8847万辆. 最后我们通过相对误差值这个指标对所建立模型进行了比较,得出模型的预测值相对更为准确.对于问题二,我们根据问题一中所建立的模型预测出某地区某年私家车的数量,再根据汽车废气排放量不超过国III排放标准的原则,并结合影响废弃排放的各个因素间的关系建立了调控模型,()得到私家车总量与公家车的最大比例为15.92%. 在此基础上,(我们又用数学中线性规划知识建立了线性规划模型,并定性的由该地区的汽车尾气的排放情况得出应该增加公交车的数量限制私人汽车保有量的调控措施. )最后,我们还对所建立的模型进行了客观的评价,所建立的模型通过适当的图表对问题进行分析,直观明了,但在分析影响汽车保有量问题中只分析了题中所给出的几个因素,结果与实际值存在一定的偏差.在本文的最后,我们对模型进行了改进,我们结合了基因表达式编程思想,应用GEP技术对私家车保有量进行预测,其优点是简单、预测精度高,同时避免了在建立上述模型中确定参数的主观性. 改进后的模型结合GEP的时间序列模型能够在数据挖掘领域得到了广泛应用,同时也能运用到组合优化,聚类,关联规则,时间序列预测等领域.关键词:聚类主成分分析灰色预测BP神经网络调控模型线性规划我国经济的快速发展为私人汽车提供了巨大的发展空间. 据中国汽车工业协会估算,截止到2006年底,中国私人汽车保有量约为2650万辆,占全国汽车保有量的60%左右. 在2006年,我国汽车销量为710多万辆,私人购买比例超过77%,中国已经成为仅次于美国的全球第二大新车市场.据世界银行的研究,汽车保有量(尤其是私人汽车)与人均国民收入成正比. 2003年,我国国内人均GDP首次突破1000美元,这预示着中国汽车开始进入家庭消费阶段. 而事实表明,随着中国人均GDP的稳健增长,近年来,我国的家用汽车销量以两位数的增速急剧扩大. 汽车特别是用于消费的私人汽车保有量的多少,与经济发展程度、居民收入以及道路建设等有着密切的联系. 随着私人汽车消费时代的到来,汽车保有量上升的一个重要因素就是国内汽车消费的快速增长. 消费者购买力的增强和个体私营经济的快速发展,也带动了私人汽车的大发展. 私人汽车保有量与一个国家或地区的社会经济发展的有关数据有着密切关系. 附表提供了我国某一经济发达地区的一些相关统计数据.然而,当我们快速迈进以私人汽车为主体的汽车社会的时候,也面临着新的考验,除了能源紧缺、燃油价格上涨、土地资源有限等诸多不利因素对汽车发展带来巨大的压力外,目前,交通产生的尾气已经成为城市环境的最主要污染源,如果对小汽车这种快速增长不从战略的高度加以科学引导和调整,它将不再单纯体现经济建设成就,巨大的负面效应也将成为社会法杖的阻碍因素. 我国于上世纪1999年对生产的小汽车废气CO、HC、NOX和PM允许排放量制订了国家标准(相当于欧洲标准). 规定生产的汽车从2000年1月1日起实施国Ⅰ排放标准,从2005年1月1日起实施国Ⅱ排放标准,从2007年7月1日起实施国Ⅲ排放标准,从2010年1月1日起实施国Ⅳ和国Ⅴ排放标准(实现基本与欧洲标准同步). 据有关资料介绍,在城市交通中,小汽车与公共汽车相比,单位小汽车排放的污染物比公共汽车高9倍.请研究下述问题:1、根据附表中的相关数据建立数学模型,分析影响该地区私人汽车保有量的因素,并预测到2010年该地区私人汽车保有量有多少?2、假设私人汽车的年运行公里数是公交车年运行公里数的五分之一. 按照汽车废气国III排放标准(欧III)(要求CO排放量每公里不超过2.3克,HC+NOX 排放量每公里不超过0.56克,PM排放量每公里不超过0.05克), 如何根据该地区的汽车废气的排放情况,来调控公交车和私人汽车保有量?●汽车保有量和对影响其的有利因素都是对时间的函数.●假定除居民人均可支配收入和居民储蓄款余额对私人汽车保有量有影响外,其他变量为一定值.●在问题一中汽车保有量只与给出的因素有关,我们选取了其中的一部份而与其它的部分没有关系.●所给的数据完全可靠,是实际情况的真实反映;●由于数据分析中发现城市干线噪声均值变化极小,所以在问题求解中忽略了噪声对私家车保有量的影响●汽车排放的废气主要为碳氢化合物(HC),氮氧化合物(NO),一氧化碳x (CO),微粒(PM),其他废气成份质量忽略不计.●社会是稳定的,发展是平稳的,不考虑因突发事件而导致保有量的突变;●各因素之间相互独立,不存在一个因素的变化而导致其他因素的剧烈变化●私人汽车的年运行公理数是公交车年运行公里数的五分之一●题中给出的单位小汽车排放量的污染物比公交车高9倍,这一比例保持不变,即小汽车每一种排放的污染物都是公交车的10倍三、符号说明3.1问题一符号说明y调整利率前的私家车保有量ix影响私人汽车保有量的个因素iβ回归系数矩阵x第j个指标的样本的均值js第j个指标的样本的方差jR相关矩阵系数λ第i个特征值iμ第i个特征值的特征向量ip a p 个指标变量的总累计贡献率i z第i 个主成分3.2问题二符号说明1y 私家车总量 2y公交车总量m 一辆私家车行驶1公里排放的污染物总量 c m 一辆私家车行驶1公里的CO 排放量 H m一辆私家车行驶1公里的x HC NO + m ρ一辆私家车行驶1公里的PM 排放量 n 一辆公共汽车行驶1公里排放的气体总量 c n 一辆公交车行驶1公里的CO 排放量 H n一辆公交车行驶1公里的x HC NO + n ρ 一辆公交车行驶1公里的PM 排放量 0S 一辆私家车年运行的公里数 1S 一辆公交车年运行的公里数C M 所有私家车行驶0S 公里的CO 排放量 H M所有私家车行驶0S 公里的x HC NO +排放量 M ρ 所有私家车行驶0S 公里的PM 排放量 C N 所有公交车行驶0S 公里的CO 排放量 H N所有公交车行驶0S 公里的x HC NO +排放量 N ρ所有公交车行驶0S 公里的PM 排放量四、问题一分析、模型建立与求解4.1 问题一的分析保有量指得就是一个地区拥有车辆的数量,一般是指在当地登记的车. CPI 消费者物价指数(Consumer Price Index),英文缩写为CPI,是反映与居民生活有关的商品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标. 我们都知道从紧的货币政策,如加息、提高人民币存款准备金等等. 对该地区私人汽车保有量有抑制作用. 因为首先假如购买汽车需要贷款的话,由于利息提高,还贷额增加;其次,对居民来说,同样用于购买汽车的20w现金,由于加息,存在银行里获取的利息变高了,而汽车是贬值品,此消彼长这样老百姓的购车欲望就会下降.通过对题意可知问题一要求我们根据附表中的相关数据建立数学模型,分析影响该地区私人汽车保有量的因素,并预测到2010年该地区私人汽车保有量. 首先我们根据题中所提供的影响汽车保有量的各项因素,通过1996年至2008年近13年间的各项指标的数据,分析各项指标与汽车保有量之间的关系,同时也对各个指标间的相关性作了分析,并得到了一下几个潜在信息:(1)该地区人均国内生产总值,由题中“汽车保有量与人均国民收入成正比”知,其促进私人汽车保有量的增加;(2)全社会固定资产投资总额的增长,由于汽车消费占有重要份额,所以其与私人汽车保有量的增加有密切关系;(3)道路总长的增多为居民的交通带来了方便,因而也推动了对汽车的购买;(4)居民人均可支配收入高低和居民储蓄款余额的水平对汽车的购买有直接影响;(5)汽油年均价从1996-2008年持续提升,在一定程度上加大了居民承担汽车消费的压力,是不利因素.以上只是根据题中所提供的数据进行了简单的主观上的分析,并没有很好地对问题一进行细致分析,于是我们借助MATLAB画出了各个因素与汽车保有量之间的相关性散点图,具体如下所示:以上所绘制的图很直观地展现出了各个指标在汽车保有量之间的关系,4.2类聚模型4.2.1类聚模型的思想聚类分析又称为群分析或者类分析,它是依据某种准则或算法对个体(样本或变量)进行分类的一种多元统计分析技术. 通俗地讲,聚类分析就是多元统计分析中研究所谓“物以类聚”现象的方法,其职能就是对一批样本或者变量,按照其在性质上的亲疏程度进行分类. 例如,对不同省市区故居GDP 、人均收入、通货膨胀率等指标进行分类,对居民消费习惯按照习惯按照其消费支出结构进行分类等.4.2.2类聚模型的建立根据题目中所给数据,我们我们取以上10类指标:它们分别为:1x 为人均国内生产总值;2x 为全社会消费品零售总额;3x 为全社会固定资产投资总额;4x 为运营公交车辆数;5x 为公交营运总数;6x 为公交车营运总里程;7x 为道路总长8x ;为居民人均可支配收入;9x 为居民储蓄款余额;10x 为汽油(93号)年均价.(一)距离和相似系数距离设有n 个样本,每个样本观测p 个变量,数据结构为⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡np n n p p x x x x x x x x x ...... (2)12222111211, 其中,x ij 是第i 个样本第j 个指标的观测值. 因为每个样本点有p 个变量,我们可以将每个样本点看作p 维空间中的一个点,那么各样本点间的接近程度可以用距离来度量. 以d ij 为第i 样本点与第j 样本点间的距离长度,距离越短,表明两样本点间相似程度高. 最常见的距离指标有: 绝对距离:∑-=jk ik ij x x d欧氏距离:()∑=-=pk jk ikij x xd 12切比雪夫距离:jk ik pk ij x x d -=≤≤1max马氏距离:[]211)()(j i j i ij X X S X X d -'-=-,其中. 相似系数对于p 维总体,由于它是由p 个变量构成的,而且变量之间一般都存在内在联系,因此往往可用相似系数来度量各变量间的相似程度. 相似系数介于-1至1之间,绝对值越接近于1,表明变量间的相似程度越高. 常见的相似系数有:夹角余弦:cos ,1,,nki kj ij xxi j p ϑ==∑相关系数:n i x x x X ip i i i ,...,2,1),...,,(21==,S 是样本数据矩阵相应的样本协方差矩阵,即S 的元素11()()1nij ki i kj j k s x x x x n ==---∑()(),1,,nkii kj j ij xx x x r i j p --==∑我们选择的十个指标很具有很强的相似性,所以我们采用相似系数中的相关系数来评判这十个指标的相似性.(二)聚类方法系统聚类分析是聚类分析中应用最广泛的一种方法,凡是具有数值特征的变量和样本都可以采用系统聚类法. 选择适当的距离和聚类方法,可以获得满意的聚类结果.分类的形成先将所有的样本各自算作一类,将最近的两个样本点首先聚类 ,再将这个类和其他类中最靠近的结合,这样继续合并,直到所有的样本合并为一类为止. 若在聚类过程中,距离的最小值不唯一,则将相关的类同时进行合并.类与类间的距离系统聚类方法的不同取决于类与类间距离的选择,由于类与类间距离的定义有许多种,例如定义类与类间距离为最近距离、最远距离或两类的重心之间的距离等,所以不同的选择就会产生不同的聚类方法. 常见的有:最短距离法、最长距离法、重心距离法、类平均法、离差平方和法等.设两个类l G ,m G ,分别含有n 1和n 2个样本点, 最短距离法:{}m j l i ij lm G X G X d d ∈∈=,,min最长距离法:{}m j l i ij lm G X G X d d ∈∈=,,max 重心法:两类的重心分别为m l x x ,,则21x x lm d d =类平均法:∑∑∈∈=i i jj G X G X ijlm dn n d 211离差平方和法:首先将所有的样本自成为一类,然后每次缩小一类,每缩小一类离差平方和就要增大,选择使整个类内离差平方和增加最小的两类合并,直到所有的样本归为一类为止.其中我们采用最长距离法来对这十个指标进行分类. 4.2.3聚类模型的求解定性考察反映汽车保有量的十项评价指标,可以看出,某些指标之间可能存在较强的相关性. 比如人均国内生产总值、全社会消费品零售总额与居民储蓄款余额可能存在较强的相关性, 运营公交车辆数和公交车营运总里程之间可能存在较强的相关性. 为了验证这种想法,运用MATLAB 软件计算十个指标之间的表格 1 十个指标之间的相关系数矩阵可以看出某些指标之间确实存在很强的相关性,因此可以考虑从这些指标中选取几个有代表性的指标进行聚类分析. 为此,把十个指标根据其相关性进行R 类,再从每个类中选取代表性的指标. 通过MATLAB软件,我们得到聚类树型图(见图1),也直观的说明了上述聚类的全过程.图 1 聚类树形图表格2各个指标的分类由上表作出如下分析:第一类:运营公交车辆数、公交车营运总里程、汽油年均价、公交营运总数呈密切的关系,汽油价格影响公交营运总里程和运营的公交车数量,而运营的公交车数量又对公交运营总数有影响.第二类:人均国内生产总值、居民储蓄存款余额、道路总长、全社会消费品零售总额、人均可支配配收入有密切关系,除道路总长外都属于经济指标,而些经济指标又会对社会建设产生影响,因此归为一类.第三类:全社会固定资产投资总额与上述的两类没有很大的联系,因此单独归为一类.4.3主成分分析模型 4.3.1主成分分析模型分析本文采用了主成分分析方法的原因是因为主成分分析方法在各个变量之间相关关系的研究基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多变量所反映的信息,进而尽量用这几个较少的变量来刻画个体的一种方法,是一种降维处理方法,我们通过对所给数据的分析,得出本题目恰好符合主成分分析的条件,能够运用主成分分析法来解决题中的问题一.对主成分分析模型的补充假设:题中所给的历史数据并没有明确地指出影响该地区的私人汽车保有量的因素,因此,基于主成分分析法是建立在各个变量相关的基础上,我们通过对题目中所提供的十一个变量进行相关性分析,得到以下结论:除城市交通干线噪音均值这一因素与其他相关性为负外,其余的变量之间存在着较强的相关性. 所以在这一模型中我们忽略了这一因素对私家车保有量的影响,即假定影响私家车保有量的只有十个因素.4.3.2主成分分析模型的建立在聚类中我们从各个变量之间的相关系数中,我们只采用的是题中所给的数据,并没有再另外收集数据,由于数据收集过窄,造成某些变量之间似乎存在有相同或相反变化趋势的假象,因此我们考虑运用主成分分析,选出几个主要成分对汽车保有量进行预测,避免了多重共性而造成预测偏差的弊端.根据本文所提供的影响汽车保有量的因素有人均国内生产值,全社会消费零售总额,居民人均可支配收入等十个因素. 针对题中所给的1996—2008年的数据,利用主成分分析法进行建模分析,具体步骤如下: 1、对各个影响因素的原始数据进行标准化处理设影响汽车保有量的因素分别为12310,,,,x x x x ⋅⋅⋅,由于各个指标属于不同的数量级,没有统一的标准,所以在进行主成分分析之前,需要对指标数据进行标准化处理,消除量纲,以使得每一个变量的均值都为0,方差为1. 具体处理方法如下:,(1,2,13;1,2,10)ij j ijjx x x i j s -==⋅⋅⋅=⋅⋅⋅ 其中21111()(1,2,10;13)1n nj ij j ij j i i x x s x x j n n n ====-=⋅⋅⋅=-∑∑ 即,j j x s 分别为第j 个指标的样本的均值和样本方差 2、利用标准化后的数据计算相关系数矩阵R()()()(),1,2,,10ij nkiikijij R r xx xx r i j ⨯=--==⋅⋅⋅∑10103、计算相关系数矩R 特征值和特征向量,确定主成分 具体求解过程:令E-R =0λ,可以求得10个特征值(1,2,,10)i i λ=⋅⋅⋅,它是主成分的方差,对其从小到大进行排列为123100λλλλ≥≥≥⋅⋅⋅≥≥其对应的特征向量为()()1231012,,,,,1,2,10Tj j j nj u u u u u u u u j ⋅⋅⋅=⋅⋅⋅=⋅⋅⋅ 其中则第i 主成分的表达式为:11221010+1,2,10i i i i i Y u X u X u X u X i ==+⋅⋅⋅=⋅⋅⋅,其中各个主成分确定指标:所有线性组合中的方差最大原则(方差越大,数据离散程度越大,代表原始数据包含的信息量越大,因而分析越准确)由上述原则确定出1Y 为第一主成分,2Y 为第二主成分,3Y 为第三主成分,以此类推4、选择P(P M)≤个主成分,计算综合评价值① 计算题特征值()1,2,j j m λ=⋅⋅⋅的信息贡献率和累积信息贡献率 主成分j Y 的信息贡献率: ()11,2,31010jj mkk b j m λλ===⋅⋅⋅=∑则112101,,,pkk p mkk a Y Y Y λλ===⋅⋅⋅∑∑为主成分的累积贡献率当p a 值接近于1(0.85,0.90.0.95)时,则选择前p 个指标变量12,,,p Y Y Y ⋅⋅⋅作为主成分,来代替原来的指标变量. 累计贡献率p a 的值越大,表明j Y 综合12,,p x x x ⋅⋅⋅信息能力越强,因此我们把k y 称为x 的主成分. 取主成分的排序时按特征根12,,,p u u u ⋅⋅⋅取值的大小顺序排列. 在本文中的应用中,取m 个主成分,m p <,且使得累计贡献率尽量高. ② 计算综合得分1pj j j j j Z b y b j y ==∑(为第个主成分的信息贡献率,为第j 主成分)在主成分分析的基础上,我们得出了几个主要成分,将原来的12个指标转化成了少量几个指标来预测2010年的汽车保有量. 我们将得出的几个主要成分作为因变量,与最终的汽车保有量间建立多元回归方程,并通过其来预测2010年汽车保有量.01122k k y x x x ββββ=++++ ,最小二乘法估计0ˆβ,1ˆβ….. ˆk β使残差平方和22011ˆˆˆˆ()(...)i i i k kQ y y y x x βββ=-=----∑∑最小. 由此可以得到求解0ˆβ,1ˆβ….. ˆk β的标准方程为:00ˆ0ˆ00,1,2,...,i iQQ i kββββββ==⎧∂=⎪∂⎪⎨∂⎪==⎪∂⎩借助SPSS 计算出0ˆβ,1ˆβ….. ˆk β 最终得到2010年汽车保有量预测值y分析得到我们只有1996年至2008年间的影响汽车保有量因素的各项指标值,但要预测2010年的汽车保有量,我们必须得到2009和2010年影响汽车保有量因素的各个指标值,因此我们建立差值拟合模型,通过其拟合出光滑曲线求得2009年和2010年的各项指标值.根据上述所得的2009年和2010年的影响汽车保有量因素的各个指标值,我们就能够预测出题意要求的2010年汽车保有量. 4.3.3主成分分析模型的求解我们首先借助MATLAB 对十个影响因素进行了标准化,将题中所给的原始数据标准化为如下表数据:年份 变量1 变量2 变量3 变量4 变量5 变量6 变量7 变量8 变量9 变量10 1996 -1.31 -1.16 -1.44 -0.96 -0.97 -0.97 -1.26 -1.69 -1.17 -1.1999 1997 -1.11 -1.12 -1.26 -0.91 -0.84 -0.91 -1.2 -1.21 -1.07 -0.91963 1998 -0.96 -0.96 -1.01 -0.89 -1.09 -0.88 -1.07 -0.94 -0.95 -0.88462000 -0.54 -0.78 -0.59 -0.83 -0.58 -0.8 -0.7 -0.58 -0.77 -0.5255 2001 -0.41 -0.31 -0.39 -0.56 -0.45 -0.57 -0.5 -0.17 -0.55 -0.38537 2002 -0.26 -0.14 -0.09 -0.56 -0.31 -0.56 -0.07 0.121 -0.24 -0.44668 2003 0.165 0.103 0.444 0.09 -0.29 -0.03 0.406 0.33 0.106 -0.21896 2004 0.46 0.349 0.808 0.32 -0.2 0.295 0.668 0.469 0.441 0.201443 2005 0.747 0.645 1.053 0.657 0.803 0.712 0.896 0.868 0.917 0.569296 2006 1.081 1.015 1.34 1.227 1.16 1.357 1.035 1.107 1.323 1.445137 2007 1.553 1.385 1.55 1.565 1.523 1.572 1.261 1.199 1.361 1.550238 2008 1.53 1.864 0.321 1.708 1.912 1.607 1.464 1.376 1.486 1.64658表格 3 1996年--2008年各指标变量标准化后的值将原始数据进行了标准化处理之后,各指标之间有个统一的标准,既可以通过标准化后的数据分析其主成分.根据上表标准化后的数据计算相关系数矩阵如下表所示:变量变量1 变量2 变量3 变量4 变量5 变量6 变量7 变量8 变量9 变量10变量1 1 0.988 0.919 0.981 0.955 0.979 0.987 0.976 0.99 0.98变量2 0.988 1 0.868 0.982 0.967 0.976 0.979 0.966 0.984 0.975变量3 0.919 0.868 1 0.868 0.807 0.878 0.932 0.932 0.922 0.869变量4 0.981 0.982 0.868 1 0.971 0.998 0.96 0.929 0.985 0.985变量5 0.955 0.967 0.807 0.971 1 0.973 0.922 0.908 0.957 0.978变量6 0.979 0.976 0.878 0.998 0.973 1 0.957 0.928 0.987 0.99变量7 0.987 0.979 0.932 0.96 0.922 0.957 1 0.982 0.987 0.945变量8 0.976 0.966 0.932 0.929 0.908 0.928 0.982 1 0.969 0.938变量9 0.99 0.984 0.922 0.985 0.957 0.987 0.987 0.969 1 0.978变量10 0.98 0.975 0.869 0.985 0.978 0.99 0.945 0.938 0.978 1表格 4 标准化后的数据相关系数矩阵根据以上求得的相关系数矩阵计算其特征值和特征向量,并将其从大到小进行排列,确定其主成分. 结果如表所示:主成分特征值方差贡献率% 累计贡献率%1 9.582392563 95.82392563 95.823925632 0.270496163 2.704961626 98.528887263 0.077287887 0.772878868 99.301766134 0.037115353 0.371153531 99.672919665 0.017305818 0.173058182 99.845977846 0.008374608 0.08374608 99.929723927 0.003953462 0.039534624 99.969258558 0.002356264 0.023562644 99.9928211919 0.000709541 0.00709541 99.999916610 8.34E-06 8.34E-05 100表格 5 相关系数矩阵的特征值和特征向量由上表可以知道,第一,第二,第三主成分的累计贡献率已高达99.3%,说明前三个主成分提供了原始数据的足够信息,通过检验,提取前三个主成分. 故只需要求出第一、第二、第三主成分123,,z z z 即可.计算三个特征值的特征向量123,,u u u ,再求出各个变量12310,,,,x x x x ⋅⋅⋅在主成分123,,z z z 上的载荷.0.32200.0394-0.09570.3198-0.1364-0.38680.2966 0.7107 -0.4858 0.3189 -0.2272 0.22920.3117 -0.4400 -0.00400.3192 -0.2088 0.35840.3185 0.2109 -0.30z = 010.3144 0.2969 -0.53370.3221 0.0275 0.06080.3182 0.2295 0.2135⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦1123456789102123456780.33200.31980.29660.31890.31170.13920.31850.31440.32210.31820.03940.13640.71070.22720.44000.20880.21090.2969z x x x x x x x x x x z x x x x x x x x =+++++++++=-+---+++ 第一主成分第二主成分9103123456789100.02750.22950.09570.38680.48580.22920.00400.35840.30010.53370.06080.2135x x z x x x x x x x x x x +=--++-+--++ 第三主成分因为这三个主要成分的特征值之和所占的比例(累计贡献率)达到了0.993,所以我们可以忽略其他成分,直接将这三个主要成分来评估所有影响汽车保有量的因素.要预测2010年的汽车保有量,必须知道2009年影响汽车保有量各个指标的数据,我们用差值拟合法拟合出了一条比较光滑的曲线,并且运用MATLAB 预年份人均国内生产总值(元) 全社会消费品零售总额(亿元) 定资产投资总额(亿元) 运营公交车辆数(辆) 公交营运总数(亿人次) 城市交通干线噪音均值(分贝)2009 83276.89 2570.939 1380.567 8319.383 22.56544 69.7 2010 87906.79 2967.504 1460.905 8837.24 24.72267 70年份 公交车营运总里程(万公里) 道路总长(公里) 居民人均可支配收入(元) 居民储蓄款余额(亿元) 汽油(93号)年均价 (元/升) 私人汽车保有量(万辆)2009 73077.8 3111.074 32021.82 4293.801 5.309565 201078274.043236.44633028.914612.1335.472174表格 6 2009年和2010年各项指标值从上表中我们可以得到2009年和2010年的各个指标值,但是这些指标值没有统一的标准很难作出准确的预测,因此,我们对其同样采用数据标准化,得到如下标准化后的数据:年份 变量1 变量2 变量3 变量4 变量5 变量6 变量7 变量8 变量9 变量10 2009年 1.413 1.454 1.507 1.346 1.441 1.308 1.178 1.191 1.289 0.965 2010年 1.631 1.849 1.709 1.557 1.711 1.516 1.284 1.282 1.496 0.965表格 7 2009年和2010年各项标准化后的指标值由上表我们得到了2009年和2010年的影响汽车保有量的各个指标值,根据β的主成分估计: () () () ()11211112211221,0,,,=0Ta Q Q Q a a Q Q Q a a a Q Q Q a a Q a a a β⎛⎫== ⎪ ⎪⎝⎭⎛⎫== ⎪⎝⎭⎛⎫⎪⎝⎭ 和是分别对和分块后所得的矩阵其中为标准化正交矩阵,为的主成分估计值可以算出主成分估计值,我们借助MATLAB 计算得到了回归方程的各个系数分别为:012345678910172.7572,0.0002,0.0139,0.511,0.0049, 3.4085,0.00050.0019,0.009,0.0026,8.8787βββββββββββ=-===-====-=-==由此得到如下成分回归方程:12345678910172.75720.00020.01390.5110.0049 3.40850.00050.00190.0090.00268.8787y x x x x x x x x x x =-++-+++--++根据表2中2009年和2010年影响汽车保有量的各个指标值,我们就将这些数据直接代入到上述式子中,就直接求得200920102011121.2928136.7788152.2558y y y === 即我们得出2009年的汽车保有量为121.2928万辆,2010年汽车保有量为136.7788万辆4.4灰色预测模型4.4.1灰色预测模型的理论思想:GM(1,1)模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型. 其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型. 4.4.2灰色预测模型的建立一、数据的检验与处理首先,为了保证建模方法的可行性,需要对已知数据列做必要的检验处理. 设参考数据为))(,),2(),1(()0()0()0()0(n x x x x =,计算数列的级比()()()()()001,2,3,x k k k n x k λ-==⋅⋅⋅ 如果所有的级比()k λ都落在可容覆盖2211,n n e e -++⎛⎫⎪⎝⎭内,则数列(0)x 可以作为模型)1,1(GM 的数据进行灰色预测. 否则,需要对数列(0)x 做必要的交换处理,使其落在可容范围内. 即取适当的常c ,作平移交换()()()()00,1,2,y k x k c k n =+=⋅⋅⋅则使数列()()()()()()()()00001,2,y y y y n =⋅⋅⋅的级比()()()()()001,2,3,,y y k k X k n y k λ-=∈=⋅⋅⋅ 二、建立过程:GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预测的离散形式的微分方程模型.设时间序列()0X 有n 个观察值,()()()()()()(){}00001,2,,X x x x n = ,为了使其成为有规律的时间序列数据,对其作一次累加生成运算,即令()()()()101tn xt x n ==∑。