当前位置:文档之家› 回归分析与因子分析之比较

回归分析与因子分析之比较

回归分析与因子分析之比较
回归分析与因子分析之比较

回归分析与因子分析之比较

刘婷玉 数学与统计学院06级

【摘 要】回归分析与因子分析是数理统计中常用的两种数据处理方法,本文对他们进行比较,分析了两种方法的区别与联系,各自的使用和适用范围,对教学质量的提高及在实际中对于有效选择此两种统计方法提供了依据。

【关键词】回归分析 因子分析 比较

一、 问题提出

回归分析和因子分析都是研究因变量与因子间关系的一种数据处理方法,在模型上看,只是因子结构不一样,他们之间到底有什么内在联系,值得我们研究并加以利用。

二、 问题分析

1、 统计模型和类型

多元线性回归模型表示方法为

i ki k i i i ki i i i k k u X b X b X b b Y n i X X X Y n u

X b X b X b b Y +++++==+++++=ΛΛΛΛ221102122110,,2,1)

,,,,(得:个样本观测值

其解析表达式为:

???????+++++=+++++=+++++=n kn k n n n k k k k u X b X b X b b Y u X b X b X b b Y u X b X b X b b Y ΛΛ

ΛΛΛΛΛΛΛ2211022222121021121211101

多元模型的矩阵表达式为

??????? ??+???????? ????????? ?

?=??????? ??u u u b b b b X X X X X X X X X Y Y Y n k kn k k n n n M M M ΛΛΛM M M M 2121021222211121121111 ??????? ??=???????? ??=??????? ??=??????

? ??=+=u u u b b b b X X X X X X X X X Y Y Y n k kn k k n n n U B X Y U

XB Y M M M ΛΛΛM M M M 2121021222211121121111

一般地,设X=(x1, x2, …,xp)’为可观测的随机变量,且有 i m im i i i i e f a f a f a X +?+???+?+?+=2211μ 。在因子分析中,p 维的变量向量x 被赋予一个随机结构,x =α+Af+ε具体也可以写成以下形式:

111112211

221122222

1122m m m m p p p pm m p x a f a f a f x a f a f a f x a f a f a f μεμεμε-=++++-=++++-=++++L L L L

L (1)

其中α是p 维向量,A 是p ×r 参数矩阵,f 是r 维潜变量向量,称为

公共因子(Common factors),而ε是p维的变量向量,称为特殊因子(Specific factors),满足下列假定:

E(ε) =0,cov(ε) =Δ(对角矩阵)E(f) =0,cov (f,ε)=0,cov(f) =I (2) 它把每个变量分解为两部分,一部分是由这些变量内含的公共因子所构成的,即公共因子部分,另一部分是每个变量各自独有的因子,即所谓特殊因子部分。应当注意,因子模型不具有唯一性,设T是一个正交矩阵,由I

'可知,因子模型x =α+Af+ε与模型x =α

TT

+(AT)(T′f)+ε等价。后者载荷矩阵为AT,新的公共因子T′f。正是由于因子模型的不唯一性,所以当原模型不适合专业解释时,则作一个正交变换T,把原模型改变为新模型,在新模型中再去寻找因子的专业解释,这就为因子旋转提供了理论的基础。

由两者的比较可知,两种模型都是用某几个因子来解释变量的,只是因子构成不一样,回归分析的因子之间可能存在相关关系,但是后者却是独立的。回归分析模型写成了原观测变量的线性组合,因子分析是描述原指标X协方差阵结构的一种模型,对原观测变量分解成公共因子和特殊因子两部分,当公共因子的个数m=原变量个数p 时,就不能考虑特殊因子了,此时因子分析也对应于一种线性组合了,饿而且因子模型的系数矩阵表明了原变量和公共因子的相关程度。

2、目的和作用

回归分析是为了分析一个变量如何依赖其它变量而提出的一种统计分析方法,它的目的是要确定引起因变量变化的各个因素,多元线性回归是研究一个因变量(Y)和多个自变量(Xi)之间数量上相

互依存的线性关系。利用回归分析可以进行因素分析、调整混杂因素和统计预测。

因子分析是用于研究个体测量指标的协方差(或相关)结构的探索性数据分析的多元技术。它找出若干可以解释可观测指标之间的变差或者联系的潜变量从而简化高维数据,并对相似指标进行分组及检测多重共线性,将高维数据在低维空间中图示以利于直观考察数据的分布情况及检测异常值。目标是通过减少变量的个数来了解数据的结构,在某种意义上可以取代原始数据,而且通过图示和多元推断技术更容易进行研究。它就是用少数几个有意义因子来描述多个指标或因素之间的联系,与此同时,又能保存住原有数据结构所提供的大部分信息,这样就可以找出潜在的特征。其目的为化简数据、浓缩信息、探讨内在结构,也就是说将分散在多个变量中的同类信息集中起来、提纯,从而便于分析、解释和利用。

同样是因变量和因子之间的关系,但是回归分析却能得出确切的数值关系,而且通常是定量的(不过对定性因素可以采用虚拟变数的处理方法)。但因子分析一般适用于定性的,不可观测的数据。不过,回归分析的关系不精简明了,而且确定的因子也是根据人为经验事先定好的,不如因子分析的全面,可能还得做逐步回归等才能剔除或增加变量。

3、适用原则

首先,回归分析和因子分析使用的数据不一样。回归分析同时需要因子和因变量的数据,数据结构为因变量和因子对应的顺序数据,

即{n i X Y i i ,,2,1,Λ=}。而因子分析只需要在不同情况下对应的因变量的值,无需知道X 的确切数值,只要根据调的数值就行了,也即这种方法可以揭示因子内部的关系。

其次,样本容量的要求也不同。回归分析最小样本容量 n ≥

k+1。对Y X X X B ''=-1)(? ,有(X`X)-1存在?| X`X | ≠0 ? X`X 为k+1

阶的满秩阵,R(AB) ≤ min(R(A),R(B)),R(X) ≥ k+1,因此,必须有n ≥k+1。根据经验,有①n ≥ 30或者n ≥ 3(k+1)才能满足模型估计的基本要求。②n ≥ 3(k+1)时,t 分布才稳定,检验才较为有效。根据Gromuch(1983)的观点,因子分析的样本量要求如下:一般原则是要求样本数目至少是变量个数的五倍,能有一比十的比例是较可被接受的,有些研究建议观察值个数为变量个数的二十倍;总样本最好应有100个或以上的观察值,通常不要少于50个观察值。

最后,模型假设也有不同之处:

在回归分析中,有如下假设:

① 解释变量 Xi 是确定性变量,不是随机变量;解释变量

之间互不相关,即无多重共线性。

② 随机误差项具有0均值和同方差。

③ 随机误差项不存在序列相关关系。

④ 随机误差项与解释变量之间不相关。

⑤ 随机误差项服从0均值、同方差的正态分布。

在因子分析中,假定:

① 公共因子的均数为0,方差为1。

②特殊因子的均数为0,方差为δi ,且特殊因子互不相关。

③公共因子与特殊因子相互独立。

由比较可知,两种分析方法在两类因子的相关性上有相似之处,差别主要在于回归分析中的随机误差项要求服从0均值、同方差的正态分布。

4、 模型的解

ij R 回归分析应用最小二乘估计,其矩阵表示如下:

它具有①线性(估计量都是被解释变量观测值的线性组合)②无偏性(估计量的数学期望=被估计的真值)③有效性(估计量的方差是所有线性无偏估计中最小的)

而因子分析有若干种方法

① 主成分法(principal component factor )

m j p i l a ji j ij ,,2,1;,,2,1,ΛΛ===λ

每一个公共因子的载荷系数之平方和等于对应的特征根,即该

()()1

?0?0????2??)????()?)(?()?()?(???),0(~???211212

2--'=''=='+'-=??''+''-'=''='''+''-'-'=-''-'=-'-='=

-=-=-==+==-==∑∑k n e e Y X X X B B

X X Y X B Q B X X B Y X B

Y Y Y X B B X Y B X X B Y X B B X Y Y Y B X Y X B

Y Q B X Y B X Y e e B X Y Y

Y E y y Q N U U XB Y B X Y

n i i i n i i e σσ?为什么

公共因子的方差。212i p

i ij j

g a ==∑=λ。 ② 主因子法(principal factor )

设原变量的相关矩阵为R=(ij r ),其逆矩阵为R-1=(ij r )。各变量

特征方差的初始值取为逆相关矩阵对角线元素的倒数,ii i r /1'=δ。

则共同度的初始值为∑==m

j ij a h 1221

。 ③ 极大似然法(maximum likelihood factor )

假定原变量服从正态分布,公共因子和特殊因子也服从正态分布,构造因子负荷和特殊方差的似然函数,求其极大,得到唯一解。

由上可知,因子载荷的统计意义是第i 个变量与第j 个公共因子的相关系数,表示i X 依赖巧的份量(比重)。统计中应称为权。现称载荷,表示第i 个变量在第

j 个因子上的负荷,反映了第i 个变量在第j 个因子上的相对重要性。另外,回归的系数是唯一确定的,而因子模型的系数矩阵不唯一,且该矩阵表明了原变量和公共因子的相关程度。差阵的特征值所对应的特征向量。某解释变量前回归系数的含义是,在其他解释变量保持不变的条件下,该变量变化一个单位,被解释变量将平均发生偏回归系数大小的变动。另外,因子分析中的载荷矩阵是不可逆的,只能通过可观测的原变量去估计不可观测的公共因子,ij b 是因子载荷矩阵中的元素,是第i 变量Xi 与第j 个公共因

子j Z 的相关系数,即表示i X 依赖j Z 的份量,是第i 变量在第

j 个公共因子上的负荷,它反映了第i 变量在第j 个公共因子上的相对重

要性。j ε是第j 个原观测变量的特殊因子,且此处的i X 与j Z 的均值都为0,方差都为1。

5、 效果检验

对多元线性回归可作如下平方和分解:

回归方程的总体检验:

()0

,01221MSE MSR =F :1H 0

21:0H H F F k

n y y k

y y k n SSE k SSR F

F k H 否则接收则拒绝④如果计量③根据样本资料计算统②据给定的都为零

并非所有的①*?--∑-∑-∧=

--=*

?====?

?? ??αββββΛ

回归系数的检验:

()()[]()0

,0F F 1/,2,11/1,2,1,2,1=

F F F

k :1H 0

:0H H H k

n k X X X SSE k X X X SSR k X X X SSR k 否则接收则拒绝④如果③计算统计量②据给定的①*?----*

?≠=ΛΛΛαββ 而对于因子分析而言,是没有统计检验的,只是在模型中各个量的统计意义上有所表现:

(1)特征根(Eigenvalue), (H.Kaiser)所谓特征值,是指每一行因子负荷量平方加总后之总和,表示该因子能解释全体变异的能力。每一个公共因子的载荷系数之平方和等于对应的特征根,即该公共因子的方差。它可以被看成是主成分影响度的指标,代表引入因子、主成分后可解释平均多少原始变量的信息。因每一变量之变异数均为1,若所抽取的因子特征根小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大。因此一般可以用特征根大于1作为纳入标准。

(2)变量共同度(Communalities),也称为公共方差(common variance),反映全部公共因子变量对原有变量i X 的总方差解释说明比例。原有变量i X 的共同度为因子载荷矩阵A 中第i 行元素的

平方和∑==m j ij a h 1221

,21h 越接近于1(原有变量i X 标准化前提下,总

方差为1),说明公共因子解释原有变量越多的信息。如果大部分变量

的共同度都高于0.8,则说明提取出的公共因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。可以说,各个变量的共同度是衡量因子分析效果的一个指标公共因子j F 的方差贡献定义为因子载荷矩阵A 中第j 列各元素的平方和,方差贡献反映了该因子对所有原始变量总方差的解释能力,其值越高,说明因子重要程度越高。累积贡献率达到80% ~85%就比较满意了。

因子载荷(负荷)ij a 是随机变量i X 与公共因子j f 的相关系数。设称2j g 为公共因子j f 对X 的“贡献”,是衡量公共因子j f 重要性的一

个指标。

6、 步骤

① 回归分析

A 、 找出被选变量

B 、 试建回归模型

C 、 评核回归模型

D 、 修改回归模型

E 、 解释并应用回归模型

② 因子分析

A 、 输入原始数据p n X ?,计算样本均值和方差,进

行标准化计算(处理);

B 、 求样本相关系数矩阵R=()p p ij r ?;

C 、 求相关系数矩阵的特征根i λ(o p >λλλΛ,,21)和

相应的标准正交的特征向量i l ;

D、确定公共因子数;

h;

E、计算公共因子的共性方差2

i

F、对载荷矩阵进行旋转,以求能更好地解释公共因

子;

G、对公共因子作出专业性的解释。

三、结束语

回归分析和因子分析是两种常用的数据处理方法,通过主成分分析和因子分析的对比,我们可以很清楚的看出回归分析和因子分析有一定的关系,本文只给出一部分区别和联系。希望通过本文的分析,能给初学者有一定的帮助,在学习和研究中能提供信息。另外,由以上比较可知,在处理数据时,若数据包含因子的信息,则可以先进行回归分析,再用因子分析进行进一步验证和扩展,发现其内在规律,以尽量全面客观的解释客观事实。

参考文献

[1] 高惠璇.应用多元统计分析[M].北京大学出版社,2005,1.

[2] 何晓群,刘义卿.应用回归分析[M].中国人民大学出版社.

[3] 张尧庭.多元统计分析选讲.北京:中国统计出版社出版,2002

[4] 数学建模方法及其应用韩中庚北京:高等教育出版社,2005

[5] 回归分析及其试验设计茆诗松、丁元、周纪芗、吕乃刚华东师范大学出版社,2001

[6] 多元线性回归的数学模型[ J ] 刘严. 沈阳工程学院学报, 2005, 1 (2、3) : 128~129.

[7] 于秀林、任雪松编著。《多元统计分析》中国统计出版社l望〕9年版

[8] 实用统计方法梅长林、周家良科学出版社2002 [9] 多元线性回归模型

[10] 林海明.对主成分分析法运用中十个问题的解析[J].统计与决策(理论版),2007,(8):16-18.

[11]张文彤。SPSS统计分析高级教程[M]。上海:高等教育出版社,2004。应用多元科研中常用的统计方法——自由分布统计检验颜金锐中国统计出版社2002

关于财政收入影响因素 的统计分析报告.doc

关于财政收入影响因素的统计分析报告 14经济统计1班 陈秋昱 陈翔强 毛翔宇 2016年4月13日

目录 影响我国财政收入因素的统计分析 (3) 一、引言 (3) 二、财政收入影响因素的分析 (3) 2.1变量的选择 (3) 2.2数据说明 (3) 三、模型建立 (4) 3.1模型数据 (4) 3.2相关分析 (6) 3.3模型建立 (7) 四、模型检验 (7) 五、个别数据的折线图分析 (9) 5.1从业人数与国家财政收入间关系 (9) 5.2居民消费价格指数于财政收入间关系 (9) 5.3财政收入占GDP的时间变化 (10) 六、从模型中得到的结果 (10) 6.1财政收入对GDP的依存度 (10) 6.2财政收入对能源消费总量的依存度 (10) 6.3财政收入对实际利用外资的依存度 (11) 6.4财政收入对居民消费价格指数的依存度 (11) 七、结论 (11)

影响我国财政收入因素的统计分析 摘要:影响一国财政收入的因素有很多,如税收收入,三大产业产值,固定资产投资等,本文选取GDP、能源消费总量、从业人员总数、全社会固定资产投资总额、实际利用外资总额、全国城乡居民储蓄存款年底总额、居民人均消费水平、消费品零售总额、居民消费价格指数这9个指标,建立了财政收入影响因素的模型,分析了影响财政收入主要因素及其影响程度。 一、引言 财政作为最为重要的政府活动,是政府职能的具体体现,能够有力地促进经济的发展,促进人民生活水平的提高,并能够调节资源配置。因此,财政收入的变化情况关系着一个国家经济的发展和社会的进步。财政收入的主要来源有税收,国有资产经营收益,政府性基金收益等。同时,一个国家财政收入的规模还要受到经济规模等诸多因素的影响。因此我们以财政收入为因变量,GDP、能源消费总量、从业人员总数、全社会固定资产投资总额等9 个经济指标为自变量,利用R软件进行回归分析,建立财政收入影响因素模型,分析影响我国财政收入的主要因素为何。 二、财政收入影响因素的分析 2.1变量的选择 研究影响财政收入的影响因素离不开基本经济指标,许多文献资料中都把税收、GDP这两个指标列为影响财政收入最重要的影响因素。而本文通过对较多指标的综合分析,企图在众多而复杂的指标当中寻找财政收入比较重要的决定因素。 2.2数据说明 1、财政收入:财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。 2、GDP:国内生产总值(GDP=Gross Domestic Product)是指一个国家(国界范围内)所有常驻单位在一定时期内生产的所有最终产品和劳务的市场价值。GDP 是国民经济核算的核心指标,也是衡量一个国家或地区总体经济状况重要指标。 3、能源消费总量:能源消费总量是一定时期内全国或某地区用于生产、生活所消费的各种能源数量之和。是反映全国或全地区能源消费水平、构成与增长速度的总量指标。 3

犯罪率影响因素的线性回归分析

犯罪率影响因素的线性回归分析 摘要 犯罪是人类社会的顽疾,人类为对付犯罪付出了沉重的代价。据国际社会统计,犯罪所造成的危害远远超过二战所造成的损失。犯罪作为一种社会现象,是由各种因素决定的,马克思认为是社会客观历史条件,特别是经济条件决定着犯罪。故我们运用现代科学技术方法,充分利用信息资源,尝试建立一个回归模型,解释刑事犯罪率的变化,降低刑事犯罪率,保障社会和谐。 关键词:刑事犯罪率;基尼系数;城市化率; Linear regression analysis of factors influencing the criminal crime rate ABSTRACT Crime is disease in the human society, mankind against crime to pay a high price. According to international society .The harm of crime, is beyond the losses of lives and property caused by warⅡ. Crime, as a social phenomenon, is decided by various factors, the mark thinks social objective history conditions, and especially economic condition decides crime. We use modern science and technology, make full use of information resources, and try to establish a regression model to explain the changes in crime rates, lower crime rate, ensure social harmony. Key words: crime;criminal Gini coefficient;Urbanization rate;

农民收入影响因素的多元回归分析

农民收入影响因素的多元回归分析 自改革开放以来,虽然中国经济平均增长速度为9.5 % ,但二元经济结构给经济发展带来的问题仍然很突出。农村人口占了中国总人口的70 %多,农业产业结构不合理,经济不发达,以及农民收入增长缓慢等问题势必成为我国经济持续稳定增长的障碍。正确有效地解决好“三农”问题是中国经济走出困境,实现长期稳定增长的关键。其中,农民收入增长是核心,也是解决“三农”问题的关键。本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,寻找其根源,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。 一、回归模型的建立 (1)数据的收集 根据实际的调查分析,我们在影响农民收入因素中引入3个解释变量。即:X2-财政用于农业的支出的比重, X3-乡村从业人员占农村人口的比重, X4-农作物播种面积

(1)回归模型的构建 Y i=1+2X2+3X3+4X4+u i 二、回归模型的分析 (1)多重共线性检验 系数a 模型非标准化系数标准系数 t Sig. 共线性统计量 B 标准误差试用版容差VIF 1 (常量) -2983.479 803.141 -3.715 .003 X2 -14.221 15.007 -.141 -.948 .361 .579 1.726 X3 5.201 3.760 .258 1.383 .190 .368 2.717 X4 .021 .006 .614 3.677 .003 .459 2.177 a. 因变量: y 表1 多重共线性是指解释变量之间存在相关关系,判断解释变量之间的多重共线性一般可看方差膨胀因子VIF和容忍度这两个指标,如果解释变量之间存在多重共线性,一般采用逐步剔除VIF最大的解释变量来消除解释变量之间多重共线性的问题。从表1可知,解释变量,X1,X2,X3三者的方差膨胀因子VIF分别为1.726,2.717和2.177,均小于10。且三者的容忍度均大于0.1。所以可以判断解释变量X1,X2,X3三者之间不存在多重共线性。 (2)模型异方差的检验 异方差产生的原因有:数据质量原因、模型设定原因。由异方差 引起的后果一般会导致回归系数估计结果误差较大、有关统计检验失 去意义、模型的预测失效等危害,所以在建立模型的过程中必须要检 验模型之间是否存在异方差。若存在异方差解决办法——加权最小二 乘法。

影响因素分析汇总

影响因素分析汇总

高三地理复习材料(影响因素分析汇总)1.影响太阳辐射强弱的因素: ①太阳高度角(纬度决定);②大气状况(天气、气候);③海拔高低(主要是大气密度)。 2.影响气温高低的因素: ①纬度位置(太阳辐射);②地形地势(海拔? 闭塞?背风坡?迎风坡?对气流阻隔?);③ 大气环流;④海陆位置及海陆分布(海洋性? 大陆性?);⑤洋流;⑥下垫面热容量,反射 率等(植被状况)。 3.影响降水多少的因素: ①大气环流(气压带、风带;季风环流;大气 活动中心);②地形(迎风坡?背风坡?气流 阻隔?);③海陆位置(离海远近?离岸风、 向岸风?);④洋流。 4.影响气压大小的因素: ①地势(海拔)→气压随高度增加而降低;②气温→同一高度气温高气压低。 5.影响气候的因素: ①纬度位置(太阳辐射);②大气环境(降水); ③下垫面(海陆位置,地形,洋流,地表状况 等);④人类活动(影响小气候和全球变暖)。6地表形态的影响因素: ①内力作用:地震,火山,变质作用;②外力作用:风化,侵蚀,搬运,沉积,固结成岩。 7.影响海水温度的因素: ①太阳辐射(热量收支)←纬度;②洋流; ③陆地气候。 8.海水盐度大小的影响因素: ①降水量、蒸发量(气候、纬度);②洋流; ③结冰、融冰;④河流径流的注入;⑤与外界 海水交换状况(海域是否闭塞)。 9.影响潮汐大小的因素: ①地形条件(是否呈口大内小喇叭状开口); ②气象条件(风向);③天文条件(日、月、 地位置)。 10.影响水资源多少的因素: ①降水量、蒸发量(河川径流量大小);②水循环活跃程度。 11.影响渔场形成因素: ①大陆架:海水深浅及获得阳光多少;②径流: 营养物质多少;③纬度:温带水域;④洋流: 寒暖流交汇或上升流。 12.影响降水形成的因素: ①有充足水汽、有凝结核、有上升气流;②大气环流;③地形;④洋流。 13.影响暴雨形成的因素: ①源源不断水汽供应;②强烈上升气流;③形成降水的天气系统持续时间长。 14.影响地震烈度的影响因素: ①地震本身的震级和震源深度;②地表状况 (震中距大小);③地质构造情况(断层发 育?);④地面建筑物抗震程度。 15.农业发展的区位因素: ①自然条件:气候、地形、水源、土壤;②社 会经济因素:市场、劳动力、交通、政策、科 技、农业机械。 16.乳畜业发展的区位条件: ①自然:气候适宜种植牧草和饲料作物;②市 场:城市众多,人口密集,市场需求大;③交 通:交通便利;④科技:先进的科技。 【高三地理复习材料第 2 页共 13 页】

多元线性回归模型案例

我国农民收入影响因素的回归分析 本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。?农民收入水平的度量常采用人均纯收入指标。影响农民收入增长的因素是多方面的,既有结构性矛盾因素,又有体制性障碍因素。但可以归纳为以下几个方面:一是农产品收购价格水平。二是农业剩余劳动力转移水平。三是城市化、工业化水平。四是农业产业结构状况。五是农业投入水平。考虑到复杂性和可行性,所以对农业投入与农民收入,本文暂不作讨论。因此,以全国为例,把农民收入与各影响因素关系进行线性回归分析,并建立数学模型。 一、计量经济模型分析 (一)、数据搜集 根据以上分析,我们在影响农民收入因素中引入7个解释变量。即:2x -财政用于农业的支出的比重,3x -第二、三产业从业人数占全社会从业人数的比重,4x -非农村人口比重,5x -乡村从业人员占农村人口的比重,6x -农业总产值占农林牧总产值的比重,7x -农作物播种面积,8x —农村用电量。

资料来源《中国统计年鉴2006》。 (二)、计量经济学模型建立 我们设定模型为下面所示的形式: 利用Eviews 软件进行最小二乘估计,估计结果如下表所示: DependentVariable:Y Method:LeastSquares Sample: Includedobservations:19 Variable Coefficient t-Statistic Prob. C X1 X3 X4 X5 X6 X7 X8 R-squared Meandependentvar AdjustedR-squared 表1最小二乘估计结果 回归分析报告为: () ()()()()()()()()()()()()()()() 2345678 2? -1102.373-6.6354X +18.2294X +2.4300X -16.2374X -2.1552X +0.0100X +0.0634X 375.83 3.7813 2.066618.37034 5.8941 2.77080.002330.02128 -2.933 1.7558.820900.20316 2.7550.778 4.27881 2.97930.99582i Y SE t R ===---=230.99316519 1.99327374.66 R Df DW F ====二、计量经济学检验 (一)、多重共线性的检验及修正 ①、检验多重共线性 (a)、直观法 从“表1最小二乘估计结果”中可以看出,虽然模型的整体拟合的很好,但是x4x6

因素分析法

因素分析法(Factor Analysis Approach),又称指数因素分析法,是利用统计指数体系分析现象总变动中各个因素影响程度的一种统计分析方法,包括连环替代法、差额分析法、指标分解法、定基替代法。因素分析法是现代统计学中一种重要而实用的方法,它是多元统计分析的一个分支。使用这种方法能够使研究者把一组反映事物性质、状态、特点等的变量简化为少数几个能够反映出事物内在联系的、固有的、决定事物本质特征的因素。 因素分析法的最大功用,就是运用数学方法对可观测的事物在发展中所表现出的外部特征和联系进行由表及里、由此及彼、去粗取精、去伪存真的处理,从而得出客观事物普遍本质的概括。其次,使用因素分析法可以使复杂的研究课题大为简化,并保持其基本的信息量。 2应用编辑 是通过分析期货商品的供求状况及其影响因素,来解释和预测期货价格变化趋势的方法。期货交易是以现货交易为基础的。期货价格与现货价格之间有着十分紧密的联系。商品供求状况及影响其供求的众多因素对现货市场商品价格产生重要影响,因而也必然会对期货价格重要影响。所以,通过分析商品供求状况及其影响因素的变化,可以帮助期货交易者预测和把握商品期货价格变化的基本趋势。在现实市场中,期货价格不仅受商品供求状况的影响,而且还受其他许多非供求因素的影响。这些非供求因素包括:金融货币因素,政治因素、政策因素、投机因素、心理预期等。因此,期货价格走势基本因素分析需要综合地考虑这些因素的影响。 商品供求状况对商品期货价格具有重要的影响。基本因素分析法主要分析的就是供求关系。商品供求状况的变化与价格的变动是互相影响、互相制约的。商品价格与供给成反比,供给增加,价格下降;供给减少,价格上升。商品价格与需求成正比,需求增加,价格上升;需求减少,价格下降。在其他因素不变的条件下,供给和需求的任何变化,都可能影响商品价格变化,一方面,商品价格的变化受供给和需求变动的影响;另一方面,商品价格的变化又反过来对供给和需求产生影响:价格上升,供给增加,需求减少;价格下降,供给减少,需求增加。这种供求与价格互相影响、互为因果的关系,使商品供求分析更加复杂化,即不仅要考虑供求变动对价格的影响,还要考虑价格变化对供求的反作用。 连环替代法 它是将分析指标分解为各个可以计量的因素,并根据各个因素之间的依存关系,顺次用各因素的比较值(通常即实际值)替代基准值(通常为标准值或计划值),据以测定各因素对分析指标的影响。 例如,设某一分析指标M是由相互联系的A、B、C三个因素相乘得到,报告期(实际)指标和基期(计划)指标为: 报告期(实际)指标M1=A1 * B1 * C1 基期(计划)指标 M0=A0 * B0 * C0 在测定各因素变动指标对指标R影响程度时可按顺序进行: 基期(计划)指标M0=A0 * B0 * C0 (1)

回归分析与因子分析之比较

回归分析与因子分析之比较 刘婷玉 数学与统计学院06级 【摘 要】回归分析与因子分析是数理统计中常用的两种数据处理方法,本文对他们进行比较,分析了两种方法的区别与联系,各自的使用和适用范围,对教学质量的提高及在实际中对于有效选择此两种统计方法提供了依据。 【关键词】回归分析 因子分析 比较 一、 问题提出 回归分析和因子分析都是研究因变量与因子间关系的一种数据处理方法,在模型上看,只是因子结构不一样,他们之间到底有什么内在联系,值得我们研究并加以利用。 二、 问题分析 1、 统计模型和类型 多元线性回归模型表示方法为 i ki k i i i ki i i i k k u X b X b X b b Y n i X X X Y n u X b X b X b b Y +++++==+++++=ΛΛΛΛ221102122110,,2,1) ,,,,(得:个样本观测值 其解析表达式为:

???????+++++=+++++=+++++=n kn k n n n k k k k u X b X b X b b Y u X b X b X b b Y u X b X b X b b Y ΛΛ ΛΛΛΛΛΛΛ2211022222121021121211101 多元模型的矩阵表达式为 ??????? ??+???????? ????????? ? ?=??????? ??u u u b b b b X X X X X X X X X Y Y Y n k kn k k n n n M M M ΛΛΛM M M M 2121021222211121121111 ??????? ??=???????? ??=??????? ??=?????? ? ??=+=u u u b b b b X X X X X X X X X Y Y Y n k kn k k n n n U B X Y U XB Y M M M ΛΛΛM M M M 2121021222211121121111 一般地,设X=(x1, x2, …,xp)’为可观测的随机变量,且有 i m im i i i i e f a f a f a X +?+???+?+?+=2211μ 。在因子分析中,p 维的变量向量x 被赋予一个随机结构,x =α+Af+ε具体也可以写成以下形式: 111112211 221122222 1122m m m m p p p pm m p x a f a f a f x a f a f a f x a f a f a f μεμεμε-=++++-=++++-=++++L L L L L (1) 其中α是p 维向量,A 是p ×r 参数矩阵,f 是r 维潜变量向量,称为

机组耗水率影响因素的回归分析

机组耗水率影响因素的回归分析 摘要 数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程[1]。回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。 本文运用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。首先收集数据并利用MATLAB软件[2]进行数据处理,作出散点图。分析图发现耗水率与出库流量、库水位有明显的线性关系。在此基础上假设并建立模型。对回归参数做点估计及区间估计,并作出显著性检验,发现显著效果良好,然后利用残差图[3]检验回归效果,发现异常点,进而改进模型,最后利用回归方程做点预测和区间预测。 关键词:相互关系;多元线性回归分析;线性回归方程;显著性检测

目录 1 设计目的 (1) 2 设计原理 (1) 2.1 线性回归方程的建立 (1) 2.2 参数估计 (1) 2.3 回归模型的假设检验 (2) 2.4 回归系数的假设检验和区间估计 (3) 2.5 利用回归模型进行预测 (3) 3 设计题目 (4) 4 实现过程 (4) 4.1 回归方程的确立 (4) 4.2 回归方程显著性检验 (6) 4.3 模型改进 (7) 4.4 回归预测 (8) 5 设计总结 (10) 参考文献 (10)

我国国内旅游收入影响因素的多元回归分析

我国国内旅游收入影响因素的多元分析 班级:统计学129 姓名: 杨芳 学号:200712918 2010年3月3日

问题背景: 我国的旅游业一直保持较高的发展速度,旅游作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。我国的旅游业分为国际旅游和国内旅游两大市场,虽然国际旅游外汇收入的年均增长率高于国内旅游收入,但国内旅游收入在中国旅游收入中占50%以上的比例,因此,有必要对影响我国国内旅游业快速发展的因素进行分析。数据的选择及处理: 影响国内旅游收入的因素有很多,本文选择了影响国内旅游收入因素(y)的因素有人均收入(x1)、国内旅游人数(x2)、城镇人均旅游支出(x3)、农村人均旅游支出(x4)、公路里程(x5)、铁路里程(x6)。 国内旅游收入数据资料 年份国内旅游收 入(亿元) 人均收 入(元) 国内旅游 人数(百 万人次) 城镇人均 旅游支出 (元) 农村人 均旅游 支出 (元) 公路里程 (万公 里) 铁路里 程(万公 里) 1994 1023.51 4044 524 414.67 54.88 111.78 5.9 1995 1375.7 5046 629 464.02 61.47 115.7 6.2389 1996 1638.38 5846 640 534.1 70.45 118.58 6.49 1997 2112.7 6420 644 599.8 145.68 122.64 6.6 1998 2391.18 6796 695 607 197 127.85 6.64 1999 2831.92 7159 719 614.8 249.5 135.17 6.74 2000 3175.54 7858 744 678.6 226.6 140.27 6.87 2001 3522.4 8622 784 708.3 212.7 169.8 7.0058 2002 3878.36 9398 878 739.7 209.1 176.52 7.19 2003 3442.27 10542 870 684.9 200 180.98 7.3 2004 4710.7 12336 1102 731.8 210.2 187.07 7.44 2005 5285.9 14053 1212 737.1 227.6 334.52 7.54376 2006 6229.74 16165 1394 766.4 221.9 345.6999 7.70838 2007 7770.6 19524 1610 906.9 222.5 358.3715 7.79659 数据来自《中国统计年鉴2008》 国内旅游收入(亿元):指国内游客在国内旅行、游览过程中用于交

化学分析中误差的影响因素及处理措施

化学分析中误差的影响因素及处理措施 摘要:化学分析是利用化学方法测定物质化学成分的过程,在这个过程中,分析人员通过仪器、量器、容器等工具,使用有关化学试剂,经过一系列的操作步骤而得到化学分析测试数据。本文从误差来源、误差控制、分析实验室质量保证、综合评价质量保证等方面对化学分析中的误差的产生进行讨论,并提出控制误差的方法。 关键词:化学分析误差因素处理措施 化学分析是根据定量化学反应的计量关系,对待测组分进行分析测试的过程。化学分析过程经常包含多个繁琐的步骤,往往需要经过一系列的复杂操作步骤才能得到化学分析的测试数据。这其中,分析方法、分析过程、仪器与试剂精度、实验条件等方面都会对测量结果产生影响,并导致误差产生[1]。 一、分析化学中的误差种类 由于化学实验中存在环境不同,借助因素不同以及操作者的不同而产生多种误差,在测验分析中,根据误差产生的原因和误差表现出来的特征可以将化学分析中存在的误差分为系统误差、随机误差和过失误差三种。 (一)系统误差 系统误差是由于某种固定原因造成的,其测定结果要么偏高,要么偏低,其正负差值也呈现出一定的规律性,而且在同一条件下,进行重复测定后,还会呈现出误差,这就使其表现出单向性和重复性的特点。根据系统误差形成的因素的不同,可以将系统误差产生的原因集结于方法误差、人为误差以及辅助品误差三种。方法误差是指试验方法的科学性缺失,在化学反应过程中由于实验进程间断性实施,进行空间的不同,以及对指示剂的选择等造成其误差出现。人为误差是指操作过程中分析人员的不正确性或是不规范化操作,引起实际值与正确值之间的偏差;或是由于分析人员自身因素造成,例如试剂点滴刻度的读数不可能完全标准。辅助品误差,往往集中于容器误差、水和试剂误差两方面。由于容器的刻度不准确,天平砝码不准确等原因,造成误差出现,而在试验中,试剂和水的比例误差以及受其他元素的干扰性等,而形成误差。系统误差的大小,正负,从理论上讲,是能够检定和校正的。 (二)随机误差 随机误差有某些偶然原因造成,是有各种随机因素共同作用的结果,测定结果在一定范围内波动,正负与大小都无法测量,具有不确定性,每次测量结果不固定,是分析化学中不可避免性的误差。例如环境温度、湿度不同,实验结果会出现不同,压强不同,实验结果就会出现偏差等。随机误差很难找到具体原因,但是经过多次测定,就会发现数据会呈现出一定规律,而进行一些平均数测定后,

就业人数影响因素的回归分析

计量经济学案例分析 就业人数影响因素的回归分析 学院:数理学院 班级: 学号: 姓名:

、刖言 我国虽然社会经济体制转型还没有最终完成,但劳动力商品化和按要素分配已经占主导地位,收入分配差距拉大,基尼系数超过0.4,必然失业率的作用越来越大。 内需不足依赖出口的局面已经形成,就业问题日益严重。我国目前劳动生产率还不太高,市场的潜力十分巨大,处在市场经济不发展,政府的力量还很强的阶段。 般说来,发展中国家都急于赶超发达国家,很难处理好发展和增长、内涵扩大再生产和外延扩大再生产的关系。正是这些最基本的战略关系没有处理好,使各种经济结构失衡,造成产品积压和消费不足、就业岗位短缺并存且日益严重的局面。 人口和劳动就业直接影响着经济发展和社会稳定,关系到人们的切身利益。扩 大就业,促进再就业,关系改革发展稳定的大局,关系人们生活水平的提高,关系国家的长治久安,不仅是重大的经济问题,也是重大的政治问题。在就业问题上, 中国政府始终将促进就业作为国民经济和社会发展的战略性任务。 就业作为国家宏观调控经济政策的四大目标之一,是与人们关系最为密切的一 环。而中国作为一个人口大国,要彻底解决该问题是个不小的挑战。本文旨在通过对1985年到2011年27年数据进行分析,建立一个关于就业人数影响因素的多元线性回归模型,找出其中影响的主要因素,从而能够得出更有针对性的扩大就业的意见。 二、数据的收集与录用 本文选取数据为1985—2011年27年的人民币兑美元汇率、总人口数(万人)、国内生产总值(亿元)、全社会固定资产投资(亿元)、进出口总额(亿元)、各项税收(亿元)、流通中现金供应量(亿元)、就业人数(万人),数据均来源于国家统计局网站中国统计年鉴2011.见下表

基于多元线性回归模型的影响居民消费水平相关因素分析

计量分析软件课程论文 论文题目:基于多元线性回归模型的影响居民消费 水平相关因素分析 姓名:学号: 学院:专业: 联系电话: 年月日 基于多元线性回归模型的影响居民消费 水平相关因素分析 一、研究背景 中国GDP总量超越日本,成为仅次于美国的第二大经济体,但我国人均GDP 依然很低,全球排名87位,这很大程度上制约了居民消费水平的提高。到2020年实现全面建成小康社会的目标,十八大明确提出提高居民人均收入和人均消费水平,共享改革开放成果。我国居民消费水平在改革开放后有了很大提高,但消费水平依然很低,消费量占GDP比重依然很小。为此,本文旨在根据全国经济宏观政策、国内生产总值、职工平均工资指数、城镇居民消费价格指数、普通中学及高等学校在校生数、卫生机构数和基本设施铁路公路货运量等因素的变化情况,来分析如何提高居民消费水平,以判断是否能使居民消费水平有很大的提高。本文通过对1978-2010年影响居民消费水平因素数据的分析,找到影响居民消费水平的主要原因,通过计量经济分析方法来建立合理的模型,探讨影响居民消费增长的长期趋势规律,并给政府提出合理的建议,以提高居民消费水平。 二、影响居民消费水平的因素 宏观经济模型) + GDP- + + =,经济发展应该紧紧抓住消费这一 I (M C X G 驾马车,而居民消费水平的高低受制于多种因素。凯恩斯消费理论认为居民消费主要受收入影响,我国居民消费一直很低,消费意愿不强,本文通过计量分析找

到影响我国居民消费水平的主要因素,从根本上改善消费不足,促进我国经济的持续稳定健康发展。 消费分为居民消费和,居民消费包括农村居民消费和城镇居民消费。本文结合居民消费水平的影响因素,列出了国内生产总值、职工平均工资指数、城镇居民消费价格指数、普通中学及高等学校在校生数、卫生机构数和基本设施铁路公路货运量等相关因素,进行计量分析,得到回归模型。 三、居民消费水平模型的总体分析框架 (1)多元线性回归法OLS 概述[1] 回归分析是计量经济分析中使用最多的方法,在现实问题研究中,因变量往往受制于多个经济变量的影响,通过统计资料,根据多个解释变量的最优组合来建立回归方程预测被解释变量的回归分析称为多元线性回归法。其模型基本形式为: 其中0β、1β、2β、3β…k β是1+k 个未知参数,称为多元回归系数。Y 称为被解释变量,t X 1、t X 2、t X 3…kt X 是k 个可以精确测量和可控的一般解释变量, t μ是随机误差项。当2≥k 时,上式为多元线性回归模型。 (2)多元回归模型的建立 定义被解释变量和解释变量,被解释变量为居民消费水平(Y 元),解释变量为国内生产总值(1X 亿元)、职工平均工资指数(2X )、城镇居民消费价格指数(3X )、普通中学及高等学校在校生数(4X 万人)、卫生机构数(5X 个)和基本设施铁路公路货运量(6X 万吨)。 (3)统计数据选取 本文所有数据均来自中国统计局和中国统计局外网中国统计年鉴。[2] 1978 184 21261 169732 195301 1979 208 175142 382929 1980 238 180553 493327 1981 264 190126 471336 1982 288 193438 492737 1983 316 196017 520197

多因素分析

多因素分析 温州医学院环境与公共卫生学院叶晓蕾

概念 多因素分析是同时对观察对象的两个或两个以上的变量进行分析。 常用的统计分析方法有: 多元线性回归、Logistic回归、COX比例风险回归模型、因子分析、主成分分析,等。

多变量资料数据格式 例号X1X2…X p Y 1X11X12…X1p Y1 2X21X22…X2p Y2 ┆┆┆…┆┆ n X n1X n2…X np Y n Y为定量变量——Linear Regression Y为二项分类变量——Binary Logistic Regression Y为多项分类变量——Multinomial Logistic Regression Y为有序分类变量——Ordinal Logistic Regression Y为生存时间与生存结局——Cox Regression

第十五章多元线性回归 (multiple linear regressoin) P.261 Y,X——直线回归 Y,X1,X2,…X m——多元回归(多重回归) 例:欲研究血压受年龄、性别、体重、性格、 职业(体力劳动或脑力劳动)、饮食、吸烟、 血脂水平等因素的影响。

β0为回归方程的常数项(constant),表示各自变量均为0时y 的平均值; m 为自变量的个数; β1、β2、βm 为偏回归系数(Partial regression coefficient )意义:如β1表示在X 2、X 3…… X m 固定条件下,X 1 每增减一个单位对Y 的效应(Y 增减β个单位)。 e 为去除m 个自变量对Y 影响后的随机误差,称残差(residual)。 e X X X Y m m +++++=ββββ 22110多元回归方程的一般形式 一、多元回归模型

影响因素分析汇总(一)

影响因素分析汇总(一) 1. 影响太阳辐射强弱的因素: ①太阳高度角(纬度决定)②大气状况(天气、气候) ③海拔高低(主要是大气密度) 2. 影响气温高低的因素: ①纬度位置(太阳辐射) ②地形地势(海拔?闭塞?背风坡?迎风坡?对气流阻 隔?) ③大气环流④海陆位置及海陆分布(海洋性?大陆性?) ⑤洋流⑥下垫面热容虽,反射率等(植被状况) 3. 影响降水多少的因素: ①大气环流(气压带、风带;季风环流;大气活动中心) ②地形(迎风坡?背风坡?气流阻隔?) ③海陆位置(离海远近?离岸风、向岸风?) ④洋流 4. 影响气压大小的因素: ①地势(海拔)7气压随高度增加而降低 ②气温7同一高度气温高气压低 5. 影响气候的因素: ①纬度位置(太阳辐射)②大气环境(降水)

③下垫面(海陆位置,地形,洋流,地表状况等) ④人类活动(影响小气候和全球变暖) 6地表形态的影响因素: ①内力作用:地震,火山,变质作用 ②外力作用:风化,侵蚀,搬运,沉积,固结成岩 7.影响海水温度的因素: ①太阳辐射(热虽收支)—纬度 ②洋流③陆地气候 10. 影响水资源多少的因素: ①降水虽、蒸发虽(河川径流虽大小) ②水循环活跃程度 11. 影响渔场形成因素: ①大陆架:海水深浅及获得阳光多少 ②径流:营养物质多少 ③纬度:温带水域 ④洋流:寒暖流交汇或上升流 12. 影响降水形成的因素: ①有充足水汽、有凝结核、有上升气流 ②大气环流③地形④洋流 13. 影响暴雨形成的因素: ①源源不断水汽供应

②强烈上升气流 ③形成降水的天气系统持续时间长 14. 影响地震烈度的影响因素: ①地震本身的震级和震源深度 ②地表状况(震中距大小) ③地质构造情况(断层发育?) ④地面建筑物抗震程度 15. 农业发展的区位因素: ①自然条件:气候、地形、水源、土壤 ②社会经济因素:市场、劳动力、交通、政策、科技、农业机械 16. 乳畜业发展的区位条件: ①自然:气候适宜种植牧草和饲料作物 ②市场:城市众多,人口密集,市场需求大 ③交通:交通便利④科技:先进的科技 17. 工业发展的区位因素: ①原料,动力(燃料)②土地、水源 ③劳动力④市场⑤交通运输 ⑥农业基础、技术⑦政府政策 18. 新义工业,高技术产业发展区位因素: ①地理置优越②环境优美与气候宜人

多元回归分析SPSS

多元线性回归分析预测法 多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法) [编辑] 多元线性回归分析预测法概述 在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。 多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 [编辑] 多元线性回归的计算模型[1] 一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为: 其中,b 0为常数项,为回归系数,b1为固定时,x1每增加一 个单位对y的效应,即x 1对y的偏回归系数;同理b2为固定时,x2每增加一 个单位对y的效应,即,x 2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: 其中,b 0为常数项,为回归系数,b1为固定时,x2每增加 一个单位对y的效应,即x 2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: y = b 0 + b1x1 + b2x2 + e 建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自 变量的选择,其准则是: (1)自变量对因变量必须有显著的影响,并呈密切的线性相关; (2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的; (3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之 因的相关程度; (4)自变量应具有完整的统计数据,其预测值容易确定。 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为 解此方程可求得b 0,b1,b2的数值。亦可用下列矩阵法求得

影响因素分析

影响因素分析 从以上氧化风机对循环泵电流运行趋势的影响和其它因素对脱硫效率的影响的历史数据绘制成的表格可以得出,氧化空气是引起循环泵电流波动范围较大的主要原因。浆液密度、吸收塔液位、吸收塔浆液pH值、负荷以及煤质含硫量对脱硫效率均有较大影响。但影响脱硫效率的因素不限于上述因素,还包括浆液喷嘴垂直度,浆液喷射高度、浆液喷嘴间距、覆盖率、烟气温度、烟气流速、循环泵出力等因素。 1.1发电机功率影响 负荷增加,脱硫效率短时上升,但随后逐渐减小。这是因为负荷增加,增加的烟气量因吸收塔行程,进出口烟气量还未达到平衡,出口SO2总量低于进口SO2总量。随着时间推移,吸收塔出口SO2总量逐渐增加,入口SO2总量保持不变,脱硫效率逐渐减小。同时,入口SO2总量增加,浆液中的SO2量越来越多,如果吸收塔浆液容量足够,溶于浆液中的SO2量将达到一个稳定值。如果吸收塔浆液容量不足,溶于浆液中的SO2量达到饱和溶解度,不再吸收,未被吸收的SO2量从吸收塔出口排走。 负荷增加,烟气量增加,烟气在吸收塔内的流速增加,在塔内停留的时间变短,烟气与浆液的接触时间缩短,传质不充分,吸收塔出口SO2量增加,脱硫效率呈下降趋势,最终达到一个稳定状态。负荷减少,烟气量减少,脱硫效率应有大幅上升,但事实表明,脱硫装置上升的幅度不大,在负荷230MW时,也仅能达到96%。这一现象说明,可能是浆液中SO2溶解度达到饱和或者是塔内存在烟气走廊的现象。 1.2氧化空气影响 本套脱硫装置由于塔内氧化空气布置较特殊,氧化空气喷口至塔底间距约300mm,吸收塔液位5700mm,氧化空气从喷口喷出后需要穿越高度5400mm的浆液层,这样氧化池中的浆液将会含有大量空气,浆液循环泵抽取的浆液中也因此携带大量空气,空气经循环泵压缩变成小气 泡,当其到达喷淋喷嘴出口时,由于喷嘴出口背压较低,小气泡喷出后迅速膨胀,体积扩大。扩大后的气泡与后续浆液碰撞,减小了其势能,因而液柱垂直高度降低。液柱高度降低引起浆液在塔内吸收段行程缩短,吸收不充分。 浆液中氧化空气较多对设备运行也非常不利。空气隐没于浆液中进入循环泵,引起浆液循环总量减少,循环泵出口母管压力降低,液柱高度降低。氧化空气进入循环泵,容易造成泵叶轮发生汽蚀,这是氧化空气带给设备的最大危害。气泡不停地进入循环泵,经泵压缩后体积呈时大时小变化,引起泵出口压力不稳定,作用于叶轮上的反作用力不稳定,引起泵振动和轴向窜动。从趋势图中可以看出,氧化风机停运后对循环泵电流的影响已经大幅减小,但仍能还有波动,证明浆液中应该还含有气泡。气泡怎么产生的呢?经分析,循环泵进口的切泡池上部无遮液板,浆液在下落过程中与烟气接触,浆液中溶有气体,降落到切泡池再进入循环泵所致。加装遮液板后,循环泵电流波动明显减小。关键问题在于氧化风机运行时,如何减少氧化空气进入循环泵的量是必须考虑的问题。 1.3吸收塔液位影响 吸收塔液位越高,循环泵入口浆液静压头越高,循环泵抽取的浆液量越多,母管压力越高,喷淋高度越高,浆液在塔内停留时间长,与气体接触的时间延长,接触界面增加,气体穿越气膜/液膜界面机会多,吸收效果更佳。同时液位高,氧化区高度增加,氧化反应充分,有利于提高脱硫率。亚硫酸钙氧化不充分会导致过饱和,因亚硫酸钙溶解度大于碳酸钙,会抑制石灰石的溶解,要提高脱硫率,就得补入更多的石灰石浆液。另外亚硫酸钙的溶解会增强浆液酸性,不利于对SO2的吸收,进而降低脱硫率。 1.4吸收塔浆液pH值影响 吸收塔浆液pH值过低或者过高,浆液的酸碱度对SO2的吸收也有非常明显的影响。当pH

统计学多元回归分析方法

多元线性回归分析 在数量分析中,经常会看到变量与变量之间存在着一定的联系。要了解变量之间如何发生相互影响的,就需要利用相关分析和回归分析。回归分析的主要类型:一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析以及逻辑回归分析等。 1.1 回归分析基本概念 相关分析和回归分析都是研究变量间关系的统计学课题。在应用中,两种分析方法经常相互结合和渗透,但它们研究的侧重点和应用面不同。 在回归分析中,变量y称为因变量,处于被解释的特殊地位;而在相关分析中,变量y与变量x处于平等的地位,研究变量y与变量x的密切程度和研究变量x与变量y的密切程度是一样的。 在回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量;而在相关分析中,变量x和变量y都是随机变量。 相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数;而回归分析则是侧重于考察变量之间的数量变化规律,并通过一定的数学表达式来描述变量之间的关系,进而确定一个或者几个变量的变化对另一个特定变量的影响程度。 具体地说,回归分析主要解决以下几方面的问题。 (1)通过分析大量的样本数据,确定变量之间的数学关系式。

(2)对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。 (3)利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确度。 作为处理变量之间关系的一种统计方法和技术,回归分析的基本思想和方法以及“回归(Regression)”名称的由来都要归功于英国统计学F·Galton(1822~1911)。 在实际中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常分为一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析和逻辑回归分析等类型。 1.2 多元线性回归 1.2.1 多元线性回归的定义 一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的。其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响。 一元线性回归分析讨论的回归问题只涉及了一个自变量,但在实际问题中,影响因变量的因素往往有多个。例如,商品的需求除了受自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响;影响水果产量的外界因素有平均气温、平均日照

相关主题
文本预览
相关文档 最新文档