《统计软件应用》期末课程论文范文
- 格式:doc
- 大小:1.47 MB
- 文档页数:17
应用统计学毕业论文应用统计学毕业论文统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
作为应用统计学专业的毕业生,我在我的毕业论文中选择了一个有趣且具有挑战性的主题:分析社交媒体对个人情绪的影响。
社交媒体已经成为现代社会中不可或缺的一部分。
人们通过社交媒体平台分享他们的生活、思想和情绪。
然而,社交媒体的普及也引发了一些担忧,例如社交媒体对个人情绪的影响。
我的研究旨在探索社交媒体对个人情绪的影响,并通过统计学方法来分析和解释这种影响。
首先,我收集了一份包含个人社交媒体使用数据和情绪指标的样本。
通过使用API接口,我能够获取参与者在社交媒体平台上的活动数据,例如发帖数量、点赞数量和评论数量。
同时,我还使用了情绪分析工具来分析参与者在社交媒体上发布的内容,并将其转化为情绪指标,例如积极情绪和消极情绪的比例。
接下来,我使用统计学方法来分析数据。
我首先计算了参与者在社交媒体平台上的活动水平和情绪指标之间的相关性。
通过计算相关系数,我能够确定社交媒体活动与个人情绪之间的关联程度。
我发现,活跃度和积极情绪之间存在着正相关关系,而活跃度和消极情绪之间则存在着负相关关系。
为了进一步探索社交媒体对个人情绪的影响,我进行了回归分析。
我将社交媒体活动水平作为自变量,将情绪指标作为因变量,并使用线性回归模型进行分析。
通过回归分析,我发现社交媒体活动水平对个人情绪有显著的影响。
特别是在积极情绪方面,社交媒体活动水平的增加与积极情绪的增加呈正相关关系。
此外,我还进行了一些子群分析,以探索不同人群在社交媒体对个人情绪的影响方面是否存在差异。
我将参与者分为不同的年龄组、性别组和职业组,并对每个子群进行了统计分析。
结果显示,不同人群在社交媒体对个人情绪的影响方面存在一定的差异。
例如,年轻人在社交媒体活动水平和消极情绪之间的关联程度更高,而女性在社交媒体活动水平和积极情绪之间的关联程度更高。
最后,我通过讨论和结论部分总结了我的研究结果。
SPSS《统计分析软件》论文《统计分析软件》论文报告金融发展模型——中国GDP与若干可测变量理论及回归关系研论文题目 :究: 课程及课堂号序号 : 姓名 : 学号 : 专业班级 : 学院 : 邮箱 : 完成时间 :中南财经政法大学《统计分析软件》论文报告作者声明本论文报告是在老师的指导下由本人独立撰写完成的,没有剽窃、抄袭、造假等违反道德、学术规范和其他侵权行为。
对本论文报告的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
因本论文报告引起的法律结果完全由本人承担。
特此声明。
作者专业 :作者学号 :作者签名 : ,手写有效,201 年月日,手填时间,《统计分析软件》论文报告金融发展模型——中国GDP与若干可测变量理论及回归关系研究摘要,中国金融市场的发展尚处于初步阶段,但基于普适西方经济学原理的一些基本规律还是具备的。
本文通过对GDP与金融市场的若干可测变量,贷款余额、证券融资额、投资总额以及CPI理论关系的论述,并结合中国历年GDP与该几项变量间的实证回归分析,来建立GDP与该几项可测变量的量化关系,并论证实际情况下,前述理论之适用性。
并建立GDP与该四项可测变量的回归模型,称之为“金融发展模型”,借以进一步说明我国金融市场正在健康地发展。
关键词,金融发展,GDP,贷款余额,证券融资额,投资总额一、贷款余额与GDP的关系(一)、一般理论一般认为,贷款与经济是相互作用的,研究表明,贷款余额变化既是经济观察规模变化的原因又是它的结果(谢平等,2002)。
经济增长需要资金支持,引发了贷款需求。
GDP规模越大,贷款需求也就越大。
贷款增长又反过来促进了经济增长。
贷款作为经济主体的一种融资形式,其实质在于创造货币和配置金融资源,它增大了货币总量并加快了金融资源的流转速度。
贷款调剂了资金余缺,缓解企业和消费者的流动性约束,增大投资和消费需求,并扩大了生产能力,进而推动了GDP增长。
上述贷款与GDP相互作用的过程可简单表示如下式:贷款??投资、消费??GDP??贷款???????(?表示增加)。
spss统计分析课程论文范文SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。
下文是店铺为大家整理的关于spss统计分析论文的范文,欢迎大家阅读参考!spss统计分析论文篇1统计分析软件SPSS的特点和应用分析【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验一、前言统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。
该软件是一款在统计中应用很广的统计分析软件,目前在各专业毕业论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的爱好者。
本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点(一)操作简便SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。
只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。
对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。
因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。
应用统计学课程论文农民人均生活收入及消费支出的线性回归分析工程管理091陈佳09133101摘要:SPSS是Statistics Package for Social Science(社会科学统计软件包)的缩写。
它在经济、管理、医学及心理学等方面的研究起着很重要的作用。
在我国的国民经济问题中,增加农民收入是我国扩大内需的关键,通过运用SPSS分析方法对我国农民的收入及消费支出进行了线性回归分析, 以便能够更好地了解我国农村居民的收入结构和消费结构与消费行为等。
关键词:农民人均收入消费支出线性回归分析1.我国农民人均收入与消费支出背景分析我国是一个农业大国,至今仍有9亿农村人口,占全国人口总数的70%,农民是我国最大的群体,农村消费能力的提升直接关系到国民经济的全局。
从农村市场看,中国有近六成人口生活在农村。
农村城镇化的进程对经济增长的带动作用是非常明显的,世界上还没有哪个国家有规模如此巨大的城镇化。
农村居民的收入虽然低于城市居民,但是基数巨大,且农村人口的收入也在稳定增长。
我国农业和农村经济发展已经进入了新的阶段,一些支撑农村经济老的经济增长点作用在减弱,如何继续保持农民收入不断增长,是摆在我们面前的重要课题。
随着加入WTO这种新形势,我们应着眼于对农业和农村经济结构进行战略性调整,为农业和农村经济发展开拓新的领域,为农民收入增长寻求新的来源。
随着经济的发展,我国农民的收入水平和消费水平的结构也发生了很大变化,农民生活水平的提高和消费的增加对于实现国民经济又好又快发展、正确处理好内需和外需的关系至关重要。
但从总体来看,农民消费水平仍然较低,调查显示有的地区都不及城市居民人均消费支出的三分之一。
2.我国城镇居民消费结构及趋势的统计分析下表是出自《中国统计年鉴—2008》这一资料性年刊,它系统收录了全国和各省、自治区、直辖市2007年经济、社会各方面的统计数据,用以探究我国农村居民消费结构及其趋势。
《应用统计学》结课论文——浅析人口自然增长率与经济发展的关系系别:工程管理专业:工程管理班级:B110804班姓名:学号:浅析人口自然增长率与经济发展的关系工程管理 B110804班摘要:十八届三中全会为解决中国老龄化问题,使中国人口稳定分布出台了“单独二胎"政策。
早在上个世纪70年代为控制人口增长我国开展了计划生育政策使当时的人口增长率迅速降下降,接近世代更替水平。
此后,人口自然增长率很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关。
本文从经济方面出发,研究国民收入和人均JDP对人口自然增长率的影响,运用回归方程更加形象具体的展现经济水平对人口的影响。
关键字:人口自然增长率;国民收入;人均JDP;回归方程;引言:影响中国人口自然增长率的因素有很多,但据主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。
(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。
(5)男女性别比例,现有的男女性别比例可能会影响下一代的人口增长率。
为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国民收入”和“人均GDP”作为经济整体增长的代表,暂不考虑文化程度、人口分布还有男女比例的影响.一、模型设定1、理论分析人口增长与经济发展的关系问题是一个长期以来一直困扰人类和社会发展的问题,只是不同时期问题的侧重点不同而已。
有些理论强调人口增长对经济发展的消极影响,有些则强调积极影响。
对于人口增长与经济发展的关系问题的讨论最有影响的文献当推马尔萨斯在1798年发表的《人口论》.马尔萨斯的先验假设是,粮食生产充其量以算术级数增长,而人口(如果没有其他因素的制约)将以几何级数增长,其结果是产生大量的“过剩人口”.这种过剩人口只能以饥荒、瘟疫、战争等消极手段或独身、节欲等积极手段来消除.马尔萨斯的人口论隐含:1)人口增长受到粮食供应或土地等自然资源的约束,当因人口增长过快造成失衡时,只能通过消除过剩人口的办法实现平衡;2)从动态来看,如果经济发展,人均消费水平提高,人口的加快增长会将消费水平重新拉回到维持生存所必需的最低水平,即所谓的“贫困陷阱”。
Spss社会统计软件应用2013-2014学年第二学期期末作业《社会统计软件应用》课程论文论文题目:分析大学生恋爱中的消费观情况学生姓名:黄陈洁学号:201208490207专业班级:城市管理121班2014 年6 月8 日分析大学生恋爱中的消费观情况摘要:本文是以浙江农林大学天目学院为例,对在校期间谈过恋爱的大一至大三的学生进行调查,从性别、恋爱情况、生活费来源、消费观念、消费方式等方面来比较当代大学生恋爱中的消费观。
研究表明:绝大多数学生的生活费是由父母来支付,有超过50%的学生会为也了自己另一半的喜好放弃自己的原来的消费观念,生活所需和娱乐花费是他们消费的主要的方面,男生、女生一起出去所产生的花费以男生支付为主,但是许多女生都还是不介意AA制的,AA制和无所谓谁支付这两种付费方式也占有很大的比例。
关键词:消费观恋爱付费方式攀比心理1引言本研究的目的就是通过对当代大学生恋爱中的消费来源、消费情况、方式及消费观念的调查,来寻找出影响他们在恋爱时消费观念的因素。
本课题所关注的主要问题是:当代恋爱中的大学生每个月的生活费是否会对消费观产生影响?另一半在购物或者旅游方面的意愿是否会影响自己的消费?男女生对出去玩时对于谁付钱是否定律?在买礼物时是以自己的消费观为主还是单纯的以对方的喜好为主。
2 研究方法与数据收集2.1 问题设置一开始我把自己预想的问题写了25个,然后根据每个问题的内容进行分类,把相同性质或者内容由重叠的问题放在一起,然后在每一类中进行筛选,在将每个类别进行排序,进行了多次的顺序调整,最后誊写。
另外我想提的一点是刚开始我把答案的设置写的比较繁琐,比方说第14题“乘客的素质”的答案我设置了很多现象,比方说购票有序,自觉让座,候车有序等现象,但是我发现这样列举永远不可能全面,所以我就把所有的答案都设置成一样的,这样方便调查对象理解,也简化了答案。
2.3 调查对象浙江农林大学天目学院部分恋爱过的学生2.4 调查方法2.4.1 座谈访问因为我现在无法了解学院各系学生是否全体处于恋爱状态,因此我从身边自己熟悉的同学入手,对他们进行访谈。
统计学课程论文(5篇)统计学课程论文(5篇)统计学课程论文范文第1篇自1998年之后,统计学课程两次被教育部列为高等学校经济学类各专业的共同核心课程和工商管理类各专业的九门核心课程之一。
2000年,教育部还特地组织力气进行讨论,为统计学课程的教学确定了基本教学要求、详细教学内容和教学要点,指出统计学“不是着重于统计方法数学原理的推导,而是侧重于阐明统计方法背后隐含的统计思想,以及这些方法在实际各领域中的详细应用②”。
至此,统计学的主要教学内容也被明确了下来,主要包括绪论、描述统计、推断统计、经济管理中采纳的统计方法和国民经济统计基础学问等。
在教育部的指挥棒下,统计学老师开头了统计学教学的讨论探究、试验论证和改革创新。
统计学也由此开头肩负起培育同学统计学问方面的基本技能和应用统计方法发觉、分析、解决问题的力量之重任。
二、当前高校统计学课程的教学现状一提到统计学,同学普遍反映难学、难懂、难理解,广阔老师也倍感难讲、难教、难入心。
教育部虽然统一确定了统计学课程的主要教学内容和基本教学要求,从人才培育的角度提出了课程性质和地位、教学任务及总体要求,但是各高校在开展统计学教学过程中还应结合本校实际对其提出详细要求或做出适当调整。
可是圆满的是,在调查中笔者发觉很多高校生搬硬套,从而导致当前统计学课程教学中仍存在以下共性问题。
第一,教材选用的针对性不强,教材建设落后于实践需要。
很多老师在教材选用过程中完全不考虑学校层次、生源质量、专业设置、师资结构等实际状况的差异而盲目选择,甚至消失了一本、二本和三本院校选用同一本统计学教材的怪相。
因此,老师在教学中只能随机自行删减、调整内容,基本教学要求根本得不到保证。
另外,目前国内有些统计学教材完全忽视从应用层面上介绍统计学在专业领域的运用,从而导致有些同学把统计学课程当成了一门高等数学课程,把统计学教材当作一本数学书籍。
其次,教学大纲设计严峻滞后,学时少、内容多的冲突尖锐。
经济学毕业论文的数据处理与统计软件应用随着信息技术的快速发展,数据处理与统计软件在经济学领域的应用变得越来越重要。
本文将探讨在经济学毕业论文中,如何正确地处理数据并利用统计软件进行数据分析。
一、引言经济学作为一门社会科学,研究经济现象和经济规律的产生、发展和演变过程,通常需要大量的数据支持。
然而,对庞大的数据进行处理和分析是一项复杂而困难的任务,传统的手工处理方法已经无法满足需求。
因此,借助统计软件可以极大地提高数据的处理效率和准确性,为经济学研究提供有力支持。
二、数据处理在经济学毕业论文中,数据的处理是至关重要的一步。
首先,需要对数据进行收集和整理。
数据的来源可以包括文献调研、实地调查、统计数据等。
然后,需要进行数据清洗,包括去除异常值、填补缺失值等。
之后,可以进行数据转换,例如进行对数化处理、标准化等。
最后,需要进行数据的存储和备份,以便后续的分析。
三、统计软件的选择对于经济学毕业论文来说,选择一个适合的统计软件非常重要。
目前,常用的统计软件有SPSS、Stata、Eviews等。
这些软件都具有强大的数据处理和分析功能,可以满足经济学研究的需求。
在选择统计软件时,需要考虑到软件的易用性、统计方法的适应性和数据可视化的功能等因素。
四、SPSS的应用SPSS是一款功能强大的统计软件,被广泛应用于经济学研究中。
它提供了丰富的统计分析方法,包括描述统计、回归分析、方差分析等。
通过SPSS,可以进行数据可视化,绘制图表和图形以展示数据的分布和趋势。
此外,SPSS还具有批量处理数据和进行数据转换的功能,可快速完成复杂的统计计算。
五、Stata的应用Stata是另一款被广泛应用于经济学研究的统计软件。
与SPSS相比,Stata在数据的处理和分析方面更为灵活和高效。
它支持更多的统计方法和模型,包括面板数据分析、时间序列分析等。
通过Stata,可以进行高级的统计计算和模型拟合,并生成高质量的图表和报告。
六、Eviews的应用Eviews是专门用于计量经济学和时间序列分析的统计软件。
管理科学与工程学院课程设计(论文)基于PCA和模糊C-均值聚类的白酒年份识别研究姓名彭洋洋学号 1120140500课程名称统计分析与软件应用任课教师陈亚林提交日期 2014年 1月15日目录摘要 (2)关键词 (2)Abstract (2)一、引言 (3)1.1研究背景 (3)1.2研究现状 (3)1.2.1白酒识别研究 (4)1.2.2模糊聚类算法研究 (5)1.3研究意义 (6)1.4技术路线 (6)二、模糊聚类理论 (7)2.1模糊聚类的数学模型 (7)2.2模糊聚类算法 (8)2.2.1基于模糊等价关系的模糊聚类算法 (8)2.2.2基于目标函数的模糊聚类算法 (9)三、基于模糊聚类的白酒年份识别 (9)3.1主成分PCA降维 (9)3.1.1利用样本协方差矩阵S求解主成分 (10)3.1.2从样本相关系数矩阵求解主成份 (10)3.1.3根据主成份得分进行降维 (10)3.2 变异系数加权处理 (11)3.2.1变异系数加权 (11)3.2.2加权后的样本矩阵 (11)3.3模糊C均值聚类(FCM) (11)3.4聚类的有效性分析 (12)3.4.1有效性函数 (13)3.4.2有效分类的判别方式 (13)四、实证分析 (14)4.1仪器设备设臵 (14)4.2白酒年份识别 (14)五、结束语 (21)六、参考文献 (21)基于PCA和模糊C-均值聚类的白酒年份识别研究摘要:传统的以感官指标来识别白酒的方法受品酒人员的主观因素影响较大,识别的结果存在较大的不确定性。
因此,本文针对白酒的年份识别问题,以不同年份的古井贡酒为研究对象,通过基于目标函数的模糊c-均值聚类分析方法(FCM)对不同年份的古井贡酒酒样进行鉴别和区分。
为减少误差,去除冗余数据,辅以主成份(Principal Component Analysis, PCA)分析技术和变异系数加权法,采用F-统计量检验选择最佳聚类数。
摘要:本报告旨在通过对统计软件的实训,探讨其在统计学教学与研究中的应用。
通过实训,学生能够掌握统计软件的基本操作,了解各类统计方法,并能将理论知识与实际应用相结合。
本文将从实训目的、实训内容、实训过程和实训成果四个方面进行阐述。
关键词:统计软件;实训;应用;统计学一、实训目的1. 掌握统计软件的基本操作,包括数据输入、编辑、处理和分析等。
2. 熟悉各类统计方法,如描述统计、推断统计、回归分析等。
3. 将理论知识与实际应用相结合,提高学生的实际操作能力和解决实际问题的能力。
二、实训内容1. 数据输入与编辑:学习如何利用统计软件进行数据输入、编辑、整理和清洗。
2. 描述统计:掌握描述统计方法,如均值、标准差、方差、中位数等,并学会使用统计软件进行计算。
3. 推断统计:学习推断统计方法,如t检验、方差分析、卡方检验等,并学会使用统计软件进行假设检验。
4. 回归分析:掌握线性回归、非线性回归等回归分析方法,并学会使用统计软件进行建模和分析。
5. 其他统计方法:学习时间序列分析、聚类分析、因子分析等统计方法。
三、实训过程1. 理论讲解:教师对统计软件的基本操作和各类统计方法进行讲解,并结合实例进行演示。
2. 实践操作:学生在教师的指导下,利用统计软件进行实际操作,完成各项实训任务。
3. 讨论与交流:学生在实训过程中遇到问题,可以与同学和教师进行讨论和交流,共同解决问题。
四、实训成果1. 学生掌握了统计软件的基本操作,能够熟练地进行数据输入、编辑、处理和分析。
2. 学生熟悉了各类统计方法,并能将其应用于实际问题中。
3. 学生提高了实际操作能力和解决实际问题的能力,为今后的学习和工作打下了坚实基础。
五、实训总结通过本次统计软件实训,学生不仅掌握了统计软件的基本操作和各类统计方法,更重要的是将理论知识与实际应用相结合,提高了实际操作能力和解决实际问题的能力。
以下是对本次实训的几点总结:1. 注重理论与实践相结合:统计软件实训过程中,教师注重理论与实践相结合,使学生能够将所学知识应用于实际工作中。
我国旅游收入的实证分析一、经济理论陈述在研读了大量统计和计量资料的基础上,选择了三个大方面进行研究,既包括旅游人数,人均旅游花费和基本交通建设。
其中,在旅游人数这个解释变量的划分上,我们考虑到随着全球经济一体化的发展,越来越多的外国游客来中国旅游消费。
中国旅游的国际市场是个有发展潜力的新兴市场,尽管外国游客前来旅游的方式包罗万象而且消费能力也不尽相同,但从国际服务贸易的角度出发,我们在做变量选择时,运用国际营销的知识进行市场细分,划分了国际和国内两个市场。
这样,在旅游人数这个解释变量的最终确定上,我们选择了2X入境旅游X国内旅游人数,3人数。
这点选择除了理论支持外,在现实旅游业发展中我们也看到很多景区包括成都的近郊也有不少外国游客的身影。
所以,我们选取这两个解释变量等待下一步进行模型设计和检验。
另外,对于人均旅游花费,我们在进行市场细分时,没有延续前两个变量的选择模式,有几个原因。
首先,外国游客前来旅游的形式和消费方式各异且很难统计。
我们在花大力气收集数据后,仍然没有比较权威的统计数据资料。
其次,随着国家对农业的不断重视和扶持,我国农业有了长足发展。
农村居民纯收入增加,用于旅游的花费也有所上升。
而且鉴于农村人口较多,前面的市场细分也不够细化,在这个解释变量的确定上,我们选择农村人均旅游花费,既是从我国基本国情出发,也是对第一步研究分析的补充。
所以我们确定了4X农村X城镇居民人均旅游花费和5居民人均旅游花费。
旅游发展除了对消费者市场的划分研究,还应考虑到该产业的基础硬件设施。
在众多可选择对象中我们经分析研究结合大量文献资料决定从交通建设着手。
在我国,交通一般分布为公路,铁路,航班,航船等。
由于考虑到我国一般大众的旅游交通方式集中在公路和铁路上,为了避免解释变量的过多过繁以及可能带来的多重共线形等问题,我们只选取了前二者。
即确定了6X铁路长度这两个X公路长度和7解释变量。
其中,考虑到我国旅游业不断发展过程中,高速公路的修建也不断增多,在6X的确定过程中,我们已经将其拟合,尽量保证解释变量的完整和真实。
二、相关数据三、计量经济模型的建立Y=c(1)+c(2)*X2+c(3)*X3+c(4)*X4+c(5)*X5+c(6)*X6+U我们建立了下述的一般模型:其中Y——1994-2003年各年全国旅游收入C(1)——待定参数X——国内旅游人数(万人)2X——入境旅游人数(万人)3X——城镇居民人均旅游花费(元)4X——农村居民人均旅游花费(元)5X——公路长度(含高速)(万公里)6X——铁路长度(万公里)7U——随即扰动项四、模型的参数估计和检验利用Eviews软件,采用以上数据对该模型进行OLS回归,结果如下:Dependent Variable: YMethod: Least SquaresDate: 12/23/10 Time: 01:56Sample: 1994 2003Included observations: 10Variable Coefficie Std. Error t-Statistic Prob.ntC -340.5047 1357.835 -0.250770 0.0882 X2 -0.001616 0.013520 -0.119529 0.1524 X3 0.232358 0.128017 1.815050 0.1671 X4 6.391052 1.716888 3.722463 0.0337 X5 -1.046757 1.224011 -0.855187 0.0453 X6 5.673429 6.667266 0.850938 0.4573 X7 -474.3909355.7167-1.3336200.2745R-squared0.996391 Mean dependent var 2494.200 Adjusted R-squared 0.989174 S.D. dependentvar980.4435 S.E. of regression 102.0112 Akaike infocriterion12.28407 Sum squared resid 31218.86 Schwarz criterion 12.49588Log likelihood -54.42035 F-statistic138.0609 Durbin-Watson stat3.244251 Prob(F-statistic)0.000944由此可见,该模型可决系数很高,F 检验显著,但是2X 、6X 、7X 的系数t 检验不显著,且7X 的系数符号不符合经济意义,说明存在严重的多重共线性。
所以进行以下修正:〈一〉.统计方法检验及修正 多重共线性的检验:首先对Y 进行各个解释变量的逐步回归, 由最小二乘法,结合经济意义和统计检验得出拟合效果最好的两个解释变量如下:Dependent Variable: Y Method: Least Squares Date: 12/23/10 Time: 02:00 Sample: 1994 2003Included observations: 10VariableCoefficientStd. Error t-Statistic Prob.C -3193.041 606.2101 -5.267217 0.0012 X4 9.729003 1.435442 6.777703 0.0003 X5-1.1970362.059371-0.5812630.1293R-squared0.957285 Mean dependent2494.200varAdjusted R-squared0.945081S.D. dependentvar980.4435S.E. of regression229.7654Akaike infocriterion13.95532Sum squared resid369544.9Schwarz criterion14.04609 Log likelihood-66.77660F-statistic78.43859Durbin-Watson stat0.791632Prob(F-statistic)0.000016继续采用逐步回归法将其余解释变量代入,得出拟合效果最好的三个解释变量,结果如下:Dependent Variable: YMethod: Least SquaresDate: 12/23/10 Time: 02:01Sample: 1994 2003Included observations: 10Variable Coefficient Std. Error t-Statistic Prob.C-3391.810514.1119-6.5974160.0006 X20.0294140.014525 2.0250420.0393 X4 6.355459 2.050175 3.0999590.0211 X5-0.284542 1.772604-0.1605220.1077R-squared0.974627Mean dependentvar2494.200Adjusted R-squared0.961940S.D. dependentvar980.4435S.E. of regression191.2739Akaike infocriterion13.63446Sum squared resid219514.3Schwarz criterion13.75550 Log likelihood-64.17232F-statistic76.82334Durbin-Watson stat 1.328513Prob(F-statistic)0.000035以上模型估计效果最好,继续逐步回归得到以下结果:Dependent Variable: YMethod: Least SquaresDate: 12/23/10 Time: 02:40Sample: 1994 2003Included observations: 10Variable Coefficient Std. Error t-Statistic Prob.C-1973.943441.5947-4.4700340.0066 X2-0.0050950.011431-0.4457290.6744 X30.3282790.080682 4.0688020.0096X4 4.665485 1.158665 4.0266020.0101 X5-1.7140200.999029-1.7156860.1469R-squared0.994114Mean dependentvar2494.200Adjusted R-squared0.989406S.D. dependentvar980.4435S.E. of regression100.9150Akaike infocriterion12.37329Sum squared resid50919.23Schwarz criterion12.52458 Log likelihood-56.86644F-statistic211.1311Durbin-Watson stat 3.034041Prob(F-statistic)0.000009各项拟合效果都较好。
虽然2X的t检验不是很显著,但考虑到其经济意义在模型中的重要地位,暂时保留。
继续引入6X。
Dependent Variable: YMethod: Least SquaresDate: 12/23/10 Time: 02:41Sample: 1994 2003Included observations: 10Variable Coefficient Std. Error t-Statistic Prob.C-2034.155525.2137-3.8730040.0179 X2-0.0070330.014095-0.4989770.6440 X30.2995620.128626 2.3289460.0803 X4 4.787986 1.339888 3.5734230.0233 X5-1.511851 1.282385-1.1789370.1638 X6 2.062334 6.6592470.3096950.7723R-squared0.994252Mean dependentvar2494.200Adjusted R-squared0.987067S.D. dependentvar980.4435S.E. of regression111.4976Akaike infocriterion12.54959Sum squared resid49726.89Schwarz criterion12.73114 Log likelihood-56.74797F-statistic138.3830Durbin-Watson stat 3.130122Prob(F-statistic)0.000144根据以上回归结果可得,6X的引入使得模型中2X的t检验均不X、6显著,再考察二者的相关系数为0.949132,说明2X高度相关,模型X、6产生了多重共线性,因此将6X去掉。