2015重庆大学数理统计大作业

  • 格式:doc
  • 大小:811.50 KB
  • 文档页数:17

下载文档原格式

  / 17
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生课程考核试卷

(适用于课程论文、提交报告)

科目:数理统计教师:琼荪

姓名: xxx 学号: 20150702xxx 专业:机械工程类别:学术

上课时间: 2016 年 3 月至 2016 年 4 月

考生成绩:

卷面成绩平时成绩课程综合成绩

阅卷评语:

阅卷教师 (签名)

我国上世纪70-90年代民航客运量回归分析

摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国民航经历了曲折的发展。随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式。我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入x1、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素。利用SPSS和excel软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因。

关键词:民航客运量影响因素回归模型

一、问题提出及问题分析

2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时。截止2004年底,我国定期航班航线达到1200条,其中国航线(包括、澳门航线)975条,国际航线225条,境民航定期航班通航机场133个(不含、澳门),形成了以、、机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国127个城市,联结38个国家80个城市的航空运输网络。民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中型飞机680架,均为世界上最先进的飞机。2004年中国民航运输总周转量达到230亿吨公里(不包括、澳门特别行政区以及省),在国际民航组织188个缔约国中名列第3位。

从上述事实可以看出我国民航的发展所取得的成果显著。当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值(亿元),城市居民消费水平(绝对元),定期航班航线里程(万千里)等[1]。为了研究过去的情况,从中国统计年鉴[2]得到1994年统计摘要,分析类似因素对我国航空客运量的影响。

二、数据描述

如下为所得统计数据:

表1 1978-1993年统计数据

三、模型建立:

(1)提出假设条件,明确概念,引进参数;

参考相关书籍[3]

,设随机变量民航客运量为Y (万人),解释变量1X ,2X ,

3X ,4X ,5X 分别为国民收入(亿元),消费额(亿元),铁路客运量(万人),

民航航线里程(万公里),来华旅游入境人数(万人),且回归函数

11225501155(|,,,)E Y X x X x X x x x βββ==⋅⋅⋅==++⋅⋅⋅+,称

201155,0,Y x x E D DY βββεεεσ=++⋅⋅⋅++===,为多元线性回归模型,

015,,,βββ⋅⋅⋅为回归系数,ε为随机误差。

125(,,,,),1,2,,5i i i i x x x y i ⋅⋅⋅=⋅⋅⋅为上述来自多元线性回归模型的样本值,满足:

201155125,0,,1,2,,5,

,,,i i i i i i y x x E D i βββεεεσεεε⎧=++⋅⋅⋅++===⋅⋅⋅⎨

⋅⋅⋅⎩相互独立

为了便于对模型进行参数估计、模型检验、变量选择等,有必要对模型作如下一些基本假定。

1. 解释变量1X ,2X ,3X ,4X ,5X 是可控制的、非随机变量,互不相关。

2. 随机误差项具有零均值和同方差的性质,即2,1,2,,5i D i εσ==⋅⋅⋅,并且

125,,,εεε⋅⋅⋅相互独立,则有(),0,,,1,2,5i j Cov i j i j =≠=…,εε。 3. 随机变量误差项服从正态分布,即()2~0,,1,2,5i N i =…εσ (2)模型构建:

由表1通过EXCEL 绘制变量,1,2,,5i X i =⋅⋅⋅对因变量Y 的关系散点图如下:

图1 民航客运量与国民收入关系图

图2 民航客运量与消费额关系图

图3 民航客运量与铁路客运量关系图

图4 民航客运量与民航航线里程关系图

图5 民航客运量与来华旅游入境人数关系图

由以上的散点图看出:y 与3x 存在非线性关系,但与其它几个变量基本是线性相关的。所以首先考虑回归模型为多元线性模型。

四、模型求解。

采用最小二乘估计法求解模型参数,采用SPSS 软件计算,得到如下结果:

表2 拟合过程小结

R

R 平方

调整后的 R 平方标准估算的错误

Durbin-Watson(U)

1

.999a

.998.997

49.49240

1.993

模型摘要b

模型a. 预测变量:(常量),x5, x3, x4, x2, x1b. 因变量:y

表3 方差分析

平方和自由度

均方F

显著性

回归13818876.76952763775.3541128.303

.000b

残差24494.981102449.498总计

13843371.750

15

b. 预测变量:(常量),x5, x3, x4, x2, x1

ANOVA a

模型1

a. 因变量:y

表4 回归过程统计量

标准系数

B标准错误贝塔容许VIF (常量)450.909178.078 2.532.030

x2-.561.125-2.485-4.478.001.0011740.508

x1.354.085 2.447 4.152.002.0011963.337

x3-.007.002-.083-3.510.006.315 3.171

x421.578 4.030.531 5.354.000.01855.488

x5.435.052.5648.440.000.04025.193

1

a. 因变量:y

系数a

模型

非标准化系数

t显著性

共线性统计

图6 残差图

则回归方程为

12345

450.9090.3540.5610.00721.5780.435

y x x x x x

=+--++

五、模型分析检验

(1)决定系数

由决定系数2R=0.998看出回归方程高度显著。

(2)方差分析表

12345

1128.303=0.000,,,y

F P x x x x x

=,值,这说明,整体上对有高度显著的影响。(3)回归系数的显著性检验(t检验):