数理统计大作业

  • 格式:docx
  • 大小:257.65 KB
  • 文档页数:9

下载文档原格式

  / 9
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数理统计论文财政收入回归模型的建立与分析

学院名称航空科学与工程

专业名称飞行器设计

学生姓名

学生学号

2012年11月

摘要:本文采用多元线性回归的方法,对河北省1995年到2010年的财政收入数据与第一产业、第二产业中的工业、建筑业和第三产业的总产值进行了相关性分析,并在此基础上采用逐步回归法对影响财政收入的以上各因素进行选择与剔除,得到影响财政收入的主要因素为工业和第三产业,并给出两者与财政收入的计算公式。最后通过对比公式预测与实际公布的2011年河北省财政收入,验证了公式的准确性与精度,因此,本文的结论可以为河北省将来的财政收入预测提供准确简便的计算方法。

关键词:财政收入多元回归逐步回归法

引言

财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。

河北濒临渤海湾,自古以来一直都是华北一带经济大省。改革开放以来,河北省经济和社会发展的各个领域发生了历史性的重大变革,影响财政收入的因素也可能很多,为了研究影响河北省财政收入增长的主要原因,分析财政收入的增长规律,预测河北省财政未来的增长趋势,需要建立计量经济模型。

由于计算机技术的发展,统计软件的使用大大简化了回归分析方法的人工劳动,也因为其较高的计算精度而普遍在统计学中使用。SAS、SPSS、S-PLUS等成为目前使用最广的统计软件,本文使用了SPSS软件作为计算工具,更加精确、简化的对影响财政收入的各因素进行分析。

正文

一、变量选取

本文研究的是河北省不同年份的财政收入状况,而影响财政收入状况的因素很多,在不同的参考资料中给出不同的解释,大多数相关的研究文献中都把总税收、地区生产总值这两个指标作为影响财政收入的基本因素,还有一些文献中也提出了其他一些变量,比如就业人员数、固定资产投资等。本文主要从影响经济因素的第一产业、第二产业中的工业、建筑业和第三产业总产值四个方面对其进行分析研究。

二、回归分析

在实际建模中,由于经济指标较之一般指标更为综合,其包含信息交互性强,指标间具多重共线性的现象在经济总量预测问题中不可避免。多重共线性的存在,一方面使得入选的经济指标作为其他指标的综合反映,无法独立反映与财政收入之间的结构因果关系;另一方面,多重共线性使得统计检验失效,即使模型达到良好拟合优度,其对财政收入增长趋势的预测也不再有效。

目前主要通过三类方法克服模型变量的多重共线性问题:差分法;减小参数估计量的方差;排除引起共线性的变量。前两种方法都只能减轻多重共线性对模型的影响,而第三类方法,能从根本上寻找引起多重共线性的解释变量,将其排除出原模型,因而更为有效。本文拟将利用该原理的应用——逐步回归方法建立多元线性回归模型。

如果随机变量y 与p 个普通变量x 1、x 2、……、x p 有关,并可以用下面式子描述

{y =β0+β1x 1+β2x 2+⋯+βp x p +ε

E (ε)=0,Var (ε)=σ2<+∞

其中β0,β1,β2,……,βp ,σ2是与x 1,x 2,……,x p 无关的未知参量,ε是不可观测的随机变量。此模型则为p 元理论线性回归模型。

下面,我们给出检测单一变量是否具有显著性的回归效果的方法。我们选择假设检验问题如下:

原假设:H 0i :βi =0,(i =1,2,…,p) 备择假设:H 1i :βi ≠0

由于β

̂i ~N(βi ,c ii σ2),其中c ii 是矩阵(X T X )−1主对角线上的元素。又Q σ2

~χ2(n −p −1),且β̂i 与Q 独立。于是,可以构造t 分布

t i =β

̂i −βi √

c ii σ√

Q σ2⁄n −p −1

=β̂−βσ̂√c ii

−p −1)

其中σ̂=√Q

n−p−1,Q 为残差,Q =∑(y i −β0−β1x i1−β2x i2−⋯−βp x ip )2n i=0=(Y −Xβ)T

(Y −

Xβ)。

这里,我们选择显著性水平α=0.05,那么,很容易给出拒绝域为

W i ={t i :|t i |>t 1−α2

(n −p −1)}={t i :|t i |>t 0.975(n −p −1)}

如果|t i |≥t 1−α2

(n −p −1),则拒绝原假设H 0i ;否则,接受H 0i ,认为y 与x i 线性关系不显

著。

三、相关性分析

由于选取的因素较为复杂,且有一定程度波动,其与财政收入的之间的相关性需要进行初步验证,以剔除明显不相关的项目,这样做一方面可以减少后续工作的计算量,两一方面可以减小数据的不相关造成的计算结果不稳定或误差大等情况。以下为通过矩阵列表方式得到的财政收入、第一产业、工业、建筑业和第三产业之间的相关性。由图可知,在 0.01 水平(双侧)

上,财政收入与各影响因素之间显著相关。

财政收入第一产业工业建筑业第三产业财政收入Pearson 相关性 1 .996**.998**.993**.998**

显著性(双侧).000 .000 .000 .000

N 16 16 16 16 16 第一产业Pearson 相关性.996** 1 .995**.994**.997**

显著性(双侧).000 .000 .000 .000

N 16 16 16 16 16 工业Pearson 相关性.998**.995** 1 .990**.996**

显著性(双侧).000 .000 .000 .000

N 16 16 16 16 16 建筑业Pearson 相关性.993**.994**.990** 1 .997**

显著性(双侧).000 .000 .000 .000

N 16 16 16 16 16 第三产业Pearson 相关性.998**.997**.996**.997** 1

显著性(双侧).000 .000 .000 .000

N 16 16 16 16 16

表1. 相关性检验

四、回归分析

逐步回归法是多次采用进入方法对变量进行检测,直到没有能够进入的其他变量,这种方法也可以对相关性较大的影响因素进行整合,进而减少自变量的数目,在统计中普遍采用。因此,本文的回归方法采取逐步回归法,采取F检验的方法,进入准则为0.05,移除准则为0.1。得到如下结果:

模型汇总

模型R R 方调整 R 方标准估计的误差