当前位置：文档之家› 几种主要的油藏模型

几种主要的油藏模型

1、黑油模型（Black Oil ）：

黑油模型是指非挥发性原油的数学模型，是相对于油质极轻的挥发性油而言，因油质重而色泽较深，故称之为黑油其基本假设为：

<1> 油藏中的渗流为等温渗流； <2> 油藏中最多只有油气水三相，每一相的渗流均遵守达西定律；

<3> 油藏烃类只含有油气两个组分，油组分是指将地层原油在地面标准状况下经历分离后所残存的液体，而其组分是指全部分离出来的天然气。油藏状况下油气两种组分可能形成油气两相，油组分完全存在于油相中，而气组分则可以以自由气的形式存在于气相内，也可以以溶解气的方式存在于油相中，所以地层中油相应为油组分和气组分的某种组合。常规黑油模型一般不考虑油组分向气组分的挥发过程；

<4> 油藏中气体的溶解和逸出是瞬间完成的，即认为油藏中油气两相瞬时地达到相平衡状态；

<5> 油水之间不互溶；

<6> 由于天然气在水中溶解度很小，可以认为它不溶于水。油气水三相渗流基本微分方程：

()()()()[()]()

()ro o o o o o o o ro gd rg g gd o g g o og g g s o g

o g rw w w w w w

w w kk S P D q t kk kk S S P D P D R q q t kk S P D q t ρφργμρρφρφργγμμρφργμ???????-?+=???????

??+???

???-?+??-?++=???????

???????-?+=???????

油相：气相：水相：油水两相渗流基本微分方程：

()()()

()ro og og o o o o o rw w w w w w w w kk S P D q t kk S P D q t ρφργμρφργμ???????-?+=???????

???????-?+=???????

油相：水相：注意：

1、式中的产量项是以质量计的单位时间内单位地层体积的产出（注入）量；

2、og o gd ρρρ=+，地面油的相对密度为地面油与溶解气相对密度之和。

3、,,og o gd o o gd gd g g γγγγργρ=+==

辅助方程：

饱和度（三相）1o g w S S S ++= 饱和度（两相）1o g S S +=

毛管力（三相）：()

()o w cow w g

o cog g p p p S p p p S -=???-=?? 毛管力（两相）：()o w cow w p p p S -=

密度（三相）：(,)()

()

(,)o o o b g g g w w w gd gd o b p p p p p p ρρρρρρρρ=??

=??=??=?

密度（两相）()()og og o w w w p p ρρρρ=???=??

相渗（三相）：(,)

()()ro ro g w rg rg g rw rw w k k S S k k S k k S =??

=??

=? 相渗（两相）：()()ro ro w rw rw w k k S k k S =??=?

粘度（三相）：(,)

()()o o o b g g g w

w w p p p p μμμμμμ?=?

=??

=? 粘度（两相）：()()o o o w w w p p μμμμ=??=?

定解条件：

（1）外边界条件

第一类外边界条件（Dirichlet ）：给出外边界G 上的压力位某一已知函数：

(,,,)G p p f x y z t =。

意思为G 上任一点(),,x y z 在时间t 时的压力p 为给定的函数(,,,)p f x y z t ,若边界上压力为一常数1C ，则边界条件简化为：1G p C =当油藏边界有非常活跃的水驱，在油田开发过程中可以保持油水边界上的压力不变的时候可以认为属于这一类边界条件第二类外边界条件（Neumann ）：给定外边界上的流量或法线方向压力梯度：

(,,,)G

q p

f x y z t n

?=?。

其中n 表示法线方向，(,,,)q f x y z t 为一已知函数，它与给定的流量函数差一常数因子。当流量为常数2C 时，简化为

p C n

?=?，当油藏边界为不渗透边界，如尖灭或

有断层遮挡时，也可以认为属于这种边界条件，但此时20C ≡ 第三类外边界条件（混合边界条件）：在边界上给出p 和

??的线性组合： 3(

)(,,,)G

p f x y z t n

α?+=?。

其中α为正的常数，这种边界条件比较少见。（2）内边界（即井边界）条件分两类：

定产量q ：对于不可压缩流体渗流有

0K q μ????Φ+= ???

生产井0q <，注水井0q >，关井0q =。

定井底流压wf p ：

(),,,rw

wf p

p x y z t =

若wf p 为常数，

()3,,,rw

wf p

p x y z t C ==

（3）初始条件：包括压力和饱和度的初始分布。

初始压力分布：

若初始油藏压力分布为某一已知函数(),,x y z Φ，则此时的压力初始条件为

()(),,,,,p x y z o x y z =Φ

油藏投入开发之前，油藏内流体处于静平衡状态，此时单相区内油藏压力按液柱重量随深度h 的增加而增加，压力梯度为

γ= 油水或油气过渡带及其附近区域，油藏各相的压力均按各相本身的压力梯度计算，同一点上载不同相间的压力差即为油藏该点的毛管压力。初始饱和度分布：

若开发前油藏内水饱和度w S 的分布为已知函数(),,wo S x y z ，则饱和度的初始条件为：

(),,w wo S S x y z =

在三相流动时，还要加上气相饱和度g S 的初始分布

(),,g g S S x y z =

这种饱和度初始分布往往是根据油藏各点的毛管压力值用毛管压力曲线求得的。

以上未知数为：

绝对渗透率：,,,l k l x y z =,孔隙度φ以及网格剖分的步长,,x y z ???以及顶深Depth ————>Grid

油、气、水相对渗透率，饱和度：,,,,rl l k S l o g w =————>Scal

油、气、水粘度密度及溶解气密度：,,,,l l l o g w μρ=，gd ρ，岩石压缩系数————>PVT 气相、和水相压力梯度：g γ，w γ 油气水产量：o q ，g q ，w q

溶解汽油比：

此外关于网格剖分的数据：

2、热采模型(Thermal)

多组分数学模型

n 在注蒸汽热力采油过程中，假定油藏流体由油，气（汽），水三相组成，其中存在1

n个组分均可气相，油相和水相中，相与组分之间关系个碳氢化合物组分和一个水组分，

如下：

1、多组分渗流方程

()()()()y p p p y rg ro rw j g g g oj o o o wj w w w j

g o w j g g oj o o wj w w kk kk kk

gD x gD x gD q S x S x S t

ρρρρρρμμμφρρρ????-+?-+?-+?????????=++???

2、能量守恒方程

[]()()()()()111,,111p p p 1c c c c c c

n n rg ro j g g g g oj o o o o j j g o n rw wj w w w w l l loss

j l o g w

n n n j j g g j j o o j j w w r pr j j j kk kk T y H gD x H gD kk

x H gD H q Q y H S y H S y H S C T t t λρρρρμμρρμφρρρφρ=======??????+??-+??-????

????????+??-+-????????

=+++- ?????

∑∑∑∑∑∑∑

3、辅助方程饱和度归一化方程

1o g w S S S ++=

摩尔分数归一化方程

n n n j

j j j y

======∑∑∑

平衡常数方程

j j oj wj oj

y y K K x x =

毛管压力方程

cow o w p p p =-

cgo g o p p p =-

以上多组分数学模型共37c n +个方程，其中未知数为：,,,,,,,,,j oj wj o w g o w g y y y p p p S S S T 共计37c n +个未知数。

三相四组分数学模型实际应用过程中，通常将油藏流体的组分进行简化，若注蒸汽热力采油过程中考虑蒸汽蒸馏效应，可假设四个组分：水组分，溶解气组分，原油可蒸馏组分和原油不可蒸馏组分。水组分可存在于水相和气相中，但不能存在于油相中；溶解气组分和可蒸馏组分可存在于气相与油相中，但不能存在于水相中；不可蒸馏组分只能存在于油相中，相与组分之间的关系

1. 溶解气组分渗流方程

()()()11111y p p y rg ro g g g o o o g g o o g o kk kk gD x gD q S x S t ρρρρφρρμμ???

????-+?-+=+?????????

2. 可蒸馏组分渗流方程

()()()22221y p p y rg ro g g g o o o g g o o g o kk kk gD x gD q S x S t ρρρρφρρμμ???

????-+?-+=+?????????

3. 不可蒸馏组分渗流方程

()[]333p ro o o o o o o kk x gD q x S t ρρφρμ?????-+=?????

4. 水组分渗流方程

()()()y p p y rg rw w g g g w w w w w g g w w g w kk kk gD gD q S S t ρρρρφρρμμ???

????-+?-+=+?????????

5. 能量守恒方程

[]()()()()()(),1,21,2,3,,,1,21,2,3p p p 1rg ro j g g g g oj o o o o j w j g o rw w w w w l l loss l o g w

w j j g g j j o o j w w R R j w j kk kk

T y H gD x H gD kk

H gD H q Q y H S y H S H S C T t t λρρρρμμρρμφρρρφρ=====??????+??-+??-+

??????????????-+-=

????????

+++- ?????

∑∑∑∑∑

6. 辅助方程

饱和度归一化方程

1o g w S S S ++=

摩尔分数归一化方程

1212311

w y y y x x x ++=++=

平衡常数方程

()111222o o s w g

y K x y K x p T y p ===

毛管压力方程

cow o w p p p =-

cgo g o p p p =-

以上方程未知数：12123,,,,,,,,,,,,w o w g o w g y y y x x x p p p S S S T ，共13个未知数

三相三组分数学模型对于原油粘度较大或相对密度较大的稠油，原油的可蒸馏组分较少，在蒸汽吞吐开采阶段，油层压力相对较高，通常不出现蒸汽蒸馏效应，，因次可以将三相四组分模型进一步简化为三相三组分数学模型，三个组分分别为：溶解气组分，黑油组分和水组分。水组分可以存在于水相中，也可以存在于气相中；溶解气组分可存在于气相和油相中，但不能存在于水相中；黑油组分只能存在于油相中，但不能存在于气相和水相中。水组分渗流方程：

()()y p p y g rg g rw w w g g w w vw w g wsc g w w wsc w kk kk S gD gD q S B t B ρρφρρφρμμρ???????-+?-+=+????

???????

水组分渗流方程：

()p ro o o o vo o o o kk S gD q B t B φρμ???????-+= ?

???????油组分方程：

()()0p p rg g so r so o g g o o vg g g o o g o kk S R kk R S gD gD q B B t B B ρρφμμ???????????-+??-+=+?? ????? ??????????????

气组分渗流方程：

[]()()(),,,,,,p 1rl l l l l l l loss l l l

R R l o g w l o g w

l o g w l kk T H gD H q Q S H C T t t λρρφρφρμ===??????+??-+-=+-??????∑∑∑能量守恒方程：

辅助方程：

1o g w S S S ++=

cow o w p p p =-

cgo g o p p p =- ()

s w g

p T y p =

三相二组分数学模型一般来说，稠油的溶解汽油比较小，且饱和压力较低，因次可以不考虑溶解气的分离，模拟计算时将溶解气考虑在粘温关系中，这样三相三组分模型可以进一步简化为三相二组分数学模型，二组分分别为：油组分和水组分。

()()()p p rg g rw w w w g g g w w w g g w g kk kk gD gD q q S S t ρρρρφρρμμ?????

????-+??-++=+?????????????

水组分方程：

()()

p ro o o o o o o o kk gD q S t ρρφρμ???

??-+=?????

油组分方程：

[]()()(),,,,,,p 1rl l l l l l l loss l l l

R R l o g w l o g w

l o g w l kk T H gD H q Q S H C T t t λρρφρφρμ===????

??+??-+-=+-??????∑∑∑能量守恒方程：

辅助方程：

1o g w S S S ++= cow o w p p p =-

cgo g o p p p =-

()g s p p T =

3、组分模型(Compositional)

组分模型中，通常也将油藏流体分为油气水三相，为考虑相间传质现象，将油藏流体分为很多组分，如N 个组分，其中的各个组分都可以存在于油气水三相中的任何一相（为简单起见，如这些组分在水中的溶解度不大，则可以只考虑存在于油相或者气相中），任一i 组分在各相间的分配关系遵从相平衡原理。

()(),

1,2,;,,rj j ij j j j j ij j j j KK C p D q S C i j o g w t ργφρμ?????-?+===???????

∑∑

注意：

ij C 表示i 组分在j 相中的质量分数

辅助方程：

饱和度约束方程：1o g w S S S ++= 质量分数约束方程：

1,,,N

i C

j o g w ===∑

高压物性参数方程：

密度：121212(,,,,)(,,,,)(,,,,)o o o o o No g g g g g Ng w w w w w Nw p C C C p C C C p C C C ρρρρρρ?=?

=??

粘度：121212(,,,,)(,,,,)(,,,,)

o o o o o No g g g g g Ng w w w w w Nw p C C C p C C C p C C C μμμμμμ?=?

=??

相平衡方程：每两相之间，对每一个组分有一个平衡常数K ,此即为该两相的相压力，组分和温度的函数

()()12121212,,,,,,,,,,,,,,,,,,,,o o No g g ig

igo o g io

ig igw

g w Ng g g Ng w w Nw iw

C K f T p p c c C C K f T p p c c C c c c c c c c c

?==???

?==?? 渗透率方程：(,)

()()ro ro g w rg rg g rw rw w k k S S k k S k k S =??

=??

毛管压力方程：()

()o w cow w g

o cog g p p p S p p p S -=???-=??

4、流线模型(FrontSim)

5、流线-组分模型(FrontSim-Composition)

excel一元及多元线性回归实例

野外实习资料的数理统计分析一元线性回归分析一元回归处理的是两个变量之间的关系，即两个变量X和Y之间如果存在一定的关系，则通过观测所得数据，找出两者之间的关系式。如果两个变量的关系大致是线性的，那就是一元线性回归问题。对两个现象X和Y进行观察或实验，得到两组数值：X1，X2,…，Xn和Y1，Y2，…，Yn,假如要找出一个函数Y=f(X),使它在 X=X1,X2, …,Xn时的数值f(X1),f(X2), …,f(Xn)与观察值Y1，Y2，…，Yn趋于接近。在一个平面直角坐标XOY中找出（X1，Y1），（X2，Y2），…，（Xn，Yn）各点，将其各点分布状况进行察看，即可以清楚地看出其各点分布状况接近一条直线。对于这种线性关系，可以用数学公式表示： Y = a + bX 这条直线所表示的关系，叫做变量Y对X的回归直线，也叫Y对X 的回归方程。其中a为常数，b为Y对于X的回归系数。对于任何具有线性关系的两组变量Y与X，只要求解出a与b的值，即可以写出回归方程。计算a与b值的公式为：

式中：为变量X的均值，Xi为第i个自变量的样本值，为因变量的均值，Yi为第i个因变量Y的样本值。n为样本数。当前一般计算机的Microsoft Excel中都有现成的回归程序，只要将所获得的数据录入就可自动得到回归方程。得到的回归方程是否有意义，其相关的程度有多大，可以根据相关系数的大小来决定。通常用r来表示两个变量X和Y之间的直线相关程度，r为X和Y的相关系数。r值的绝对值越大，两个变量之间的相关程度就越高。当r为正值时，叫做正相关，r为负值时叫做负相关。r 的计算公式如下：式中各符号的意义同上。在求得了回归方程与两个变量之间的相关系数后，可以利用F检验法、t检验法或r检验法来检验两个变量是否显著相关。具体的检验方法在后面介绍。

eviews多元线性回归案例分析

中国税收增长的分析一、研究的目的要求改革开放以来，随着经济体制的改革深化和经济的快速增长，中国的财政收支状况发生了很大的变化，中央和地方的税收收入1978年为519.28亿元到2002年已增长到17636.45亿元25年间增长了33倍。为了研究中国税收收入增长的主要原因，分析中央和地方税收收入的增长规律，预测中国税收未来的增长趋势，需要建立计量经济学模型。影响中国税收收入增长的因素很多，但据分析主要的因素可能有：（1）从宏观经济看，经济整体增长是税收增长的基本源泉。（2）公共财政的需求，税收收入是财政的主体，社会经济的发展和社会保障的完善等都对公共财政提出要求，因此对预算指出所表现的公共财政的需求对当年的税收收入可能有一定的影响。（3）物价水平。我国的税制结构以流转税为主，以现行价格计算的DGP等指标和和经营者收入水平都与物价水平有关。（4）税收政策因素。我国自1978年以来经历了两次大的税制改革，一次是1984—1985年的国有企业利改税，另一次是1994年的全国范围内的新税制改革。税制改革对税收会产生影响，特别是1985年税收陡增215.42%。但是第二次税制改革对税收的增长速度的影响不是非常大。因此可以从以上几个方面，分析各种因素对中国税收增长的具体影响。二、模型设定为了反映中国税收增长的全貌，选择包括中央和地方税收的‘国家财政收入’中的“各项税收”（简称“税收收入”）作为被解释变量，以放映国家税收的增长；选择“国内生产总值（GDP）”作为经济整体增长水平的代表；选择中央和地方“财政支出”作为公共财政需求的代表；选择“商品零售物价指数”作为物价水平的代表。由于税制改革难以量化，而且1985年以后财税体制改革对税收增长影响不是很大，可暂不考虑。所以解释变量设定为可观测“国内生产总值（GDP）”、“财政支出”、“商品零售物价指数” 从《中国统计年鉴》收集到以下数据财政收入（亿元） Y 国内生产总值(亿元） X2 财政支出（亿元） X3 商品零售价格指数（%) X4 1978519.283624.11122.09100.7 1979537.824038.21281.79102 1980571.74517.81228.83106

多元线性回归模型

多元线性回归模型一、单选题 1.可决定系数2R 是指（） A 、剩余平方和占总离差平方和的比重 B 、总离差平方和占回归平方和的比重 C 、回归平方和占总离差平方和的比重 D 、回归平方和占剩余平方和的比重 2.调整的多重可决定系数2R 和2R 多重可决定系数之间的关系是（） A 、22 11n R R n k -=-- B 、22111 n R R n k -=--- C 、2211(1)1n R R n k -=-+-- D 、2211(1)1n R R n k -=---- 3.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中，计算的多重可决定系数为0.8500，则调整后的可决定系数为（） A 、0.8603 B 、0.8389 C 、0.8655 D 、0.8327 4.设k 为模型中参数的个数，则回归平方和为（） A 、2 1 ()n i i Y Y =-∑ B 、21?()n i i i Y Y =-∑ C 、21?()n i i Y Y =-∑ D 、21 ()n i i Y Y =-∑ 5.最常用的统计检验准则包括拟合优度检验、变量的显著性检验和（） A 、方程的显著性检验 B 、多重共线性检验 C 、异方差检验 D 、预测检验 6.设k 为回归模型中参数的个数（不含截距项），n 为样本容量，RSS 为残差平方和，ESS 为回归平方和，则对总体回归模型进行显著性检验时构造的F 统计量为（） A 、ESS F TSS = B 、//(1) ESS k F RSS n k =-- C 、/1/(1)ESS k F TSS n k =- -- D 、RSS F TSS =

多元线性回归模型习题及答案

多元线性回归模型一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中，计算得多重决定系数为，则调整后的多重决定系数为（ D ） A. B. C. 下列样本模型中，哪一个模型通常是无效的（B ） A. i C （消费）=500+i I （收入） B. d i Q （商品需求）=10+i I （收入）+i P （价格） C. s i Q （商品供给）=20+i P （价格） D. i Y （产出量）=0.6i L （劳动）0.4i K （资本） 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后，在的显著性水平上对 1b 的显著性作t 检验，则1b 显著地不等于零的条件是其统计量t 大于等于（ C ） A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中，1b 的实际含义是（ B ） A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中，若某个解释变量对其余解释变量的判定系数接近于１，则表明模型中存在（ C ） A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中，检验0:0(0,1,2,...) t H b i k ==时，所用的统计量服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数与多重判定系数之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8．关于经济计量模型进行预测出现误差的原因，正确的说法是（ C ）。 A.只有随机因素 B.只有系统因素 C.既有随机因素，又有系统因素、B 、C 都不对 9．在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数)：（ C ） A n ≥k+1 B n

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ，鸡肉价格P 1，猪肉价格P 2与牛肉价格P 3的相关数据。年份 Y/千克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 （1）求出该地区关于家庭鸡肉消费需求的如下模型： 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ （2）请分析，鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。先做回归分析，过程如下：输出结果如下：

多元线性回归模型案例

我国农民收入影响因素的回归分析本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。?农民收入水平的度量常采用人均纯收入指标。影响农民收入增长的因素是多方面的，既有结构性矛盾因素，又有体制性障碍因素。但可以归纳为以下几个方面：一是农产品收购价格水平。二是农业剩余劳动力转移水平。三是城市化、工业化水平。四是农业产业结构状况。五是农业投入水平。考虑到复杂性和可行性，所以对农业投入与农民收入，本文暂不作讨论。因此，以全国为例，把农民收入与各影响因素关系进行线性回归分析，并建立数学模型。一、计量经济模型分析 (一)、数据搜集根据以上分析，我们在影响农民收入因素中引入7个解释变量。即：2x -财政用于农业的支出的比重，3x -第二、三产业从业人数占全社会从业人数的比重，4x -非农村人口比重，5x -乡村从业人员占农村人口的比重，6x -农业总产值占农林牧总产值的比重，7x -农作物播种面积，8x —农村用电量。

资料来源《中国统计年鉴2006》。 (二)、计量经济学模型建立我们设定模型为下面所示的形式：利用Eviews 软件进行最小二乘估计，估计结果如下表所示： DependentVariable:Y Method:LeastSquares Sample: Includedobservations:19 Variable Coefficient t-Statistic Prob. C X1 X3 X4 X5 X6 X7 X8 R-squared Meandependentvar AdjustedR-squared 表1最小二乘估计结果回归分析报告为： () ()()()()()()()()()()()()()()() 2345678 2? -1102.373-6.6354X +18.2294X +2.4300X -16.2374X -2.1552X +0.0100X +0.0634X 375.83 3.7813 2.066618.37034 5.8941 2.77080.002330.02128 -2.933 1.7558.820900.20316 2.7550.778 4.27881 2.97930.99582i Y SE t R ===---=230.99316519 1.99327374.66 R Df DW F ====二、计量经济学检验 (一)、多重共线性的检验及修正 ①、检验多重共线性 (a)、直观法从“表1最小二乘估计结果”中可以看出，虽然模型的整体拟合的很好，但是x4x6

第三章多元线性回归模型(stata)

一、邹式检验（突变点检验、稳定性检验） 1.突变点检验 1985—2002年中国家用汽车拥有量（t y ，万辆）与城镇居民家庭人均可支配收入（t x ，元），数据见表。表中国家用汽车拥有量（t y ）与城镇居民家庭人均可支配收入（t x ）数据年份 t y （万辆） t x （元）年份 t y （万辆） t x （元） 1985 1994 1986 1995 4283 1987 1996 1988 1997 1989 1998 1990 1999 5854 1991 2000 6280 1992 2001 1993 2002 下图是关于t y 和t x 的散点图：

从上图可以看出，1996年是一个突变点，当城镇居民家庭人均可支配收入突破元之后，城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。：两个字样本（1985—1995年，1996—2002年）相对应的模型回归参数相等H H ：备择假设是两个子样本对应的回归参数不等。 1 在1985—2002年样本范围内做回归。

在回归结果中作如下步骤(邹氏检验)： 1、 Chow 模型稳定性检验（lrtest）用似然比作chow检验，chow检验的零假设：无结构变化，小概率发生结果变化* 估计前阶段模型 * 估计后阶段模型 * 整个区间上的估计结果保存为All * 用似然比检验检验结构没有发生变化的约束得到结果如下;

(如何解释) 2.稳定性检验（邹氏稳定性检验）以表为例，在用1985—1999年数据建立的模型基础上，检验当把2000—2002年数据加入样本后，模型的回归参数时候出现显著性变化。 * 用F-test作chow间断点检验检验模型稳定性 * chow检验的零假设：无结构变化，小概率发生结果变化 * 估计前阶段模型 * 估计后阶段模型 * 整个区间上的估计结果保存为All

(完整word版)多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后，人口自然增长率（即人口的生育率）很大程度上与经济的发展等各方面的因素相联系，与经济生活息息相关，为了研究此后影响中国人口自然增长的主要原因，分析全国人口增长规律，与猜测中国未来的增长趋势，需要建立计量经济学模型。影响中国人口自然增长率的因素有很多，但据分析主要因素可能有：（1）从宏观经济上看，经济整体增长是人口自然增长的基本源泉；（2）居民消费水平，它的高低可能会间接影响人口增长率。(3)文化程度，由于教育年限的高低，相应会转变人的传统观念，可能会间接影响人口自然增长率（4）人口分布，非农业与农业人口的比率也会对人口增长率有相应的影响。二·模型设定为了全面反映中国“人口自然增长率”的全貌，选择人口增长率作为被解释变量，以反映中国人口的增长；选择“国名收入”及“人均GDP”作为经济整体增长的代表；选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。从《中国统计年鉴》收集到以下数据（见表1）：表1 中国人口增长率及相关数据

设定的线性回归模型为： 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数利用EViews 估计模型的参数，方法是： 1、建立工作文件：启动EViews ，点击File\New\Workfile ，在对话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年度)，并在“Start date ”中输入开始时间“1988”，在“end date ”中输入最后时间“2005”，点击“ok ”，出现“Workfile UNTITLED ”工作框。其中已有变量：“c ”—截距项 “resid ”—剩余项。在“Objects ”菜单中点击“New Objects”，在“New Objects”对话框中选“Group”，并在“Name for Objects”上定义文件名，点击“OK ”出现数据编辑窗口。年份人口自然增长率（%。）国民总收入（亿元）居民消费价格指数增长率（CPI ）% 人均GDP （元） 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024

多元线性回归模型的各种检验方法-7页文档资料

对多元线性回归模型的各种检验方法对于形如 u X X X Y k k +++++=ββββΛΛ22110 （1）的回归模型，我们可能需要对其实施如下的检验中的一种或几种检验：一、对单个总体参数的假设检验：t 检验在这种检验中，我们需要对模型中的某个（总体）参数是否满足虚拟假设0H ：j j a =β，做出具有统计意义（即带有一定的置信度）的检验，其中j a 为某个给定的已知数。特别是，当j a =0时，称为参数的（狭义意义上的）显著性检验。如果拒绝 0H ，说明解释变量j X 对被解释变量Y 具有显著的线性影响，估计值j β?才敢使用；反之，说明解释变量 j X 对被解释变量Y 不具有显著的线性影响，估计值j β?对我们就没有意义。具体检验方法如下：（1）给定虚拟假设 0H ：j j a =β；（2）计算统计量 )?(?)?()(?j j j j j j Se a Se E t βββββ-= -= 的数值；（3）在给定的显著水平α 下（ α 不能大于 1.0即 10%，也即我们不能在置信度小于90%以下的前提下做结论），查出双尾t （1--k n ）分布的临界值2/αt ；（4）如果出现 2/αt t >的情况，检验结论为拒绝0H ；反之，无法拒绝0H 。

t 检验方法的关键是统计量 )?(?j j j Se t βββ-= 必须服从已知的 t 分布函数。什么情况或条件下才会这样呢？这需要我们建立的模型满足如下的条件（或假定）：（1）随机抽样性。我们有一个含n 次观测的随机样 (){}n i Y X X X i ik i i ,,2,1:,,,,21ΛΛ=。这保证了误差u 自身的随机性，即无自相关性， 0))())(((=--j j i i u E u u E u Cov 。（2）条件期望值为0。给定解释变量的任何值，误差 u 的期望值为零。即有这也保证了误差u 独立于解释变量 X X X ,,,21Λ，即模型中的解释变量是外生性的，也使得 0)(=u E 。 (3）不存在完全共线性。在样本因而在总体中，没有一个解释变量是常数，解释变量之间也不存在严格的线性关系。（4）同方差性。常数==2 21),,,(σk X X X u Var Λ。（5）正态性。误差u 满足 ),0(~2 σNormal u 。在以上5个前提下，才可以推导出：由此可见， t 检验方法所要求的条件是极为苛刻的。二、对参数的一个线性组合的假设的检验需要检验的虚拟假设为 0H ：21j j ββ=。比如21ββ=无法直接检验。设立新参数 211ββθ-=。

多元线性回归实例分析

SPSS--回归-多元线性回归模型案例解析！(一）多元线性回归，主要是研究一个因变量与多个自变量之间的相关关系，跟一元回归原理差不多，区别在于影响因素（自变量）更多些而已，例如：一元线性回归方程为：毫无疑问，多元线性回归方程应该为：上图中的x1, x2, xp分别代表“自变量”Xp截止，代表有P个自变量，如果有“N组样本，那么这个多元线性回归，将会组成一个矩阵，如下图所示：那么，多元线性回归方程矩阵形式为：其中：代表随机误差，其中随机误差分为：可解释的误差和不可解释的误差，随机误差必须满足以下四个条件，多元线性方程才有意义（一元线性方程也一样） 1：服成正太分布，即指：随机误差必须是服成正太分别的随机变量。 2：无偏性假设，即指：期望值为0 3：同共方差性假设，即指，所有的随机误差变量方差都相等 4：独立性假设，即指：所有的随机误差变量都相互独立，可以用协方差解释。今天跟大家一起讨论一下，SPSS---多元线性回归的具体操作过程，下面以教程教程数据为例，分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系，建立拟合多元线性回归模型。数据如下图所示：

点击“分析”——回归——线性——进入如下图所示的界面：

将“销售量”作为“因变量”拖入因变量框内，将“车长，车宽，耗油率，车净重等10个自变量拖入自变量框内，如上图所示，在“方法”旁边，选择“逐步”，当然，你也可以选择其它的方式，如果你选择“进入”默认的方式，在分析结果中，将会得到如下图所示的结果：（所有的自变量，都会强行进入）如果你选择“逐步”这个方法，将会得到如下图所示的结果：（将会根据预先设定的“F统计量的概率值进行筛选，最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切，贡献最大的，如下图可以看出，车的价格和车轴跟因变量关系最为密切，符合判断条件的概率值必须小于0.05，当概率值大于等于0.1时将会被剔除）

多元线性回归模型的各种检验方法

对多元线性回归模型的各种检验方法对于形如 u X X X Y k k +++++=ββββ 22110 （1）的回归模型，我们可能需要对其实施如下的检验中的一种或几种检验：一、对单个总体参数的假设检验：t 检验在这种检验中，我们需要对模型中的某个（总体）参数是否满足虚拟假设0 H ：j j a =β，做出具有统计意义（即带有一定的置信度）的检验，其中j a 为某个给定的已知数。特别是，当j a =0时，称为参数的（狭义意义上的）显著性检验。如果拒绝0H ，说明解释变量j X 对被解释变量Y 具有显著的线性影响，估计值j β?才敢使用；反之，说明解释变量j X 对被解释变量Y 不具有显著的线性影响，估计值j β?对我们就没有意义。具体检验方法如下：（1）给定虚拟假设 0H ：j j a =β；

（2）计算统计量 )?(?)?()(?j j j j j j Se a Se E t βββββ-=-= 的数值； 11?)?(++-==j j jj jj j C C Se 1T X)(X ，其中σβ （3）在给定的显著水平α下（α不能大于1.0即 10%，也即我们不能在置信度小于90%以下的前提下做结论），查出双尾t （1--k n ）分布的临界值2/αt ；（4）如果出现 2/αt t >的情况，检验结论为拒绝 0H ；反之，无法拒绝0H 。 t 检验方法的关键是统计量 )?(?j j j Se t βββ-=必须服从已知的t 分布函数。什么情况或条件下才会这样呢？这需要我们建立的模型满足如下的条件（或假定）：（1）随机抽样性。我们有一个含n 次观测的随机样(){}n i Y X X X i ik i i ,,2,1:,,,,21 =。这保证了误差u 自身的随机性，即无自相关性，

常见非线性回归模型

常见非线性回归模型 1.简非线性模型简介非线性回归模型在经济学研究中有着广泛的应用。有一些非线性回归模型可以通过直接代换或间接代换转化为线性回归模型,但也有一些非线性回归模型却无法通过代换转化为线性回归模型。柯布—道格拉斯生产函数模型 y AKL 其中L和K分别是劳力投入和资金投入, y是产出。由于误差项是可加的, 从而也不能通过代换转化为线性回归模型。对于联立方程模型,只要其中有一个方程是不能通过代换转化为线性,那么这个联立方程模型就是非线性的。单方程非线性回归模型的一般形式为 y f(x1,x2, ,xk; 1, 2, , p) 2.可化为线性回归的曲线回归在实际问题当中，有许多回归模型的被解释变量y与解释变量x之间的关系都不是线性的，其中一些回归模型通过对自变量或因变量的函数变换可以转化为

线性关系，利用线性回归求解未知参数，并作回归诊断。如下列模型。（1）y 0 1e x （2）y 0 1x2x2p x p （3）y ae bx (4)y=alnx+b 对于（1）式，只需令x e x即可化为y对x是线性的形式y01x，需要指出的是，新引进的自变量只能依赖于原始变量，而不能与未知参数有关。对于（2）式，可以令x1=x,x2=x2,?,x p=x p,于是得到y关于x1,x2,?, x p 的线性表达式y 0 1x12x2 pxp 对与（3）式，对等式两边同时去自然数对数，得lnylnabx ,令 y lny, 0 lna, 1 b，于是得到y关于x的一元线性回归模型： y 0 1x。乘性误差项模型和加性误差项模型所得的结果有一定差异，其中乘性误差项模型认为yt本身是异方差的，而lnyt是等方差的。加性误差项模型认为yt是等方差的。从统计性质看两者的差异，前者淡化了y t值大的项（近期数据）的作用，强化了y t值小的项（早期数据）的作用，对早起数据拟合得效果较好，而后者则对近期数据拟合得效果较好。影响模型拟合效果的统计性质主要是异方差、自相关和共线性这三个方面。异方差可以同构选择乘性误差项模型和加性误差项模型解决，必要时还可以使用加权最小二乘。

SPSS多元线性回归分析实例操作步骤

SPSS 统计分析多元线性回归分析方法操作与分析实验目的：引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量，来研究上海房价的变动因素。实验变量：以年份、商品房平均售价（元/平方米）、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。实验方法：多元线性回归分析法软件：spss19.0 操作过程：第一步：导入Excel数据文件 1.open data document——open data——open；

2. Opening excel data source——OK. 第二步： 1.在最上面菜单里面选中Analyze——Regression——Linear，Dependent （因变量）选择商品房平均售价，Independents（自变量）选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率；Method选择Stepwise. 进入如下界面： 2.点击右侧Statistics，勾选Regression Coefficients（回归系数）选项组中的Estimates；勾选Residuals（残差）选项组中的Durbin-Watson、

Casewise diagnostics默认；接着选择Model fit、Collinearity diagnotics；点击Continue. 3.点击右侧Plots，选择*ZPRED（标准化预测值）作为纵轴变量，选择DEPENDNT（因变量）作为横轴变量；勾选选项组中的Standardized Residual Plots（标准化残差图）中的Histogram、Normal probability plot；点击Continue.

多元线性回归分析模型

企业销售额影响因素分析及回归模型学号：1003131014 姓名：李绍林班级：10级人力资源管理一、问题提出（一）研究问题：随着市场经济的进一步发展，也加剧了企业在市场运行中的不确定性，如何在复杂多变的市场中占据主导，如何在经济流通的过程中，充分利用各种有利的因素，来确保企业销售额的增长，如何控制经济流通中的各项开支，如何组合来服务于企业销售额的增长。因此，在这里通过分析某家公司的企业销售状况，试图研究影响企业销售额的各因素及其之间的关系，建立企业销售额及其因素的回归模型，并进行经济分析。（二）数据来源某企业开支与销售额关系表：

二、定性分析为了研究企业销售额的影响因素，我们对相关数据进行简单的定性分析，并各因素同因变量的相关关系做了一个简单的预测。个人可支配收入反映一个地区或市场上消费者的购买能力，单独来看，应与企业的销售额呈正相关关系，即企业产品的目标市场群体的个人可支配收入起高，企业所能获得的销售额也会相应提高。商业回扣是企业为了改善销售商之间的关系，同时加强同销售商之间的合作，通过商业回扣的方式来吸引销售商，商业回扣作为企业的一个重要的营销策略，这也会减少企业的利润，商业回扣作为影响企业销售额的重要因素，商业回扣投入情况同企业的销售额多少有一定的关系。商品价格能够通过企业产品的需求来影响企业的销售量，两者共同作用于企业的销售额，是影响企业销售额的一个关系因子。如何制定价格策略来提高企业的销售额，具有重要的现实意义。研究与发展经费反映企业的研发能力和对市场的捕捉能力，能够适应市场需求来适应开发新的产品，不断开拓新的市场，提高产品的质量和水平，这能够为企业的扩大市场份额和企业销售额的提高。广告费用是企业为了对产品进行推广和让消费者更好地了解产品和创造需求，引导消费者的购买欲望，同时有利于树立产品和企业的形象。当然广告费用的支出也是影响企业销售额的一个重要因子。销售费用是企业为了产品的销售在产品的流通和销售过程中发生的一系列费用的总和，其与企业的销售额有一定的关系。因此，我们选择企业的销售额作为被解释变量y ，选取个人可支配收入、商业回扣、商品价格、研究与发展经费、广告费、销售费作为解释变量，分别设其为x1、x2、x3、x4、x5、x6 。三、相关分析（一）数据基本描述 Descriptive Statistics

多元线性回归模型练习题及答案

多元线性回归模型练习一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中，计算得可决系数为0.8500，则调整后的可决系数为（ D ） A. 0.8603 B. 0.8389 C. 0.8655 D.0.8327 2.用一组有30个观测值的样本估计模型 01122t t t t y b b x b x u =+++后，在0.05的显著性水平上对1b 的显著性作t 检验，则1b 显著地不等于零的条件是其统计量t 大于等于（ C ） A. ) 30(05.0t B. ) 28(025.0t C. ) 27(025.0t D. ) 28,1(025.0F 3.线性回归模型 01122......t t t k kt t y b b x b x b x u =+++++ 中，检验 0:0(0,1,2,...) t H b i k ==时，所用的统计量服从( C ) A.t(n-k+1) B.t(n-k-2) C.t(n-k-1) D.t(n-k+2) 4. 调整的可决系数与多元样本判定系数之间有如下关系( D ) A. 2211n R R n k -= -- B. 22 1 11n R R n k -=--- C. 2211(1)1n R R n k -=- +-- D. 221 1(1) 1n R R n k -=---- 5.对模型Y i =β0+β1X 1i +β2X 2i +μi 进行总体显著性F 检验，检验的零假设是( A ) A. β1=β2=0 B. β1=0 C. β2=0 D. β0=0或β1=0 6．设k 为回归模型中的参数个数，n 为样本容量。则对多元线性回归方程进行显著性检验时，所用的F 统计量可表示为（ B ） A. )1() (--k RSS k n ESS B ． C ． )1()1()(2 2---k R k n R D ．)() 1/(k n TSS k ESS -- 7．多元线性回归分析中（回归模型中的参数个数为k ），调整后的可决系数2 R 与可决系数2 R 之间的关系（ A ） ) 1 ( ) 1 ( 2 2 - - k R k R - n

多元线性回归模型的案例讲解

多元线性回归模型的案例讲解 Document number：NOCG-YUNOO-BUYTT-UU986-1986UT

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ，鸡肉价格P 1，猪肉价格P 2与牛肉价格P 3的相关数据。年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/ 千克) 1980 397 1992 911 1981 413 1993 931 1982 439 1994 1021 1983 459 1995 1165 1984 492 1996 1349 1985 528 1997 1449 1986 560 1998 1575 1987 624 1999 1759 1988 666 2000 1994 1989 717 2001 2258 1990 768 2002 2478 1991 843 （1）求出该地区关于家庭鸡肉消费需求的如下模型： 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ （2）请分析，鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。先做回归分析，过程如下：输出结果如下：

所以，回归方程为： 123ln 0.73150.3463ln 0.5021ln 0.1469ln 0.0872ln Y X P P P =-+-++ 由上述回归结果可以知道，鸡肉消费需求受家庭收入水平和鸡肉价格的影响，而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显着。验证猪肉价格和鸡肉价格是否有影响，可以通过赤池准则（AIC ）和施瓦茨准则（SC ）。若AIC 值或SC 值增加了，就应该去掉该解释变量。去掉猪肉价格P 2与牛肉价格P 3重新进行回归分析，结果如下： Variable Coefficient Std. Error t-Statistic Prob.?? C LOG(X) LOG(P1) R-squared ????Mean dependent var Adjusted R-squared ????. dependent var . of regression ????Akaike info criterion Sum squared resid ????Schwarz criterion Log likelihood ????F-statistic Durbin-Watson stat ????Prob(F-statistic)

(完整版)多元线性回归模型公式

二、多元线性回归模型在多要素的地理环境系统中，多个（多于两个）要素之间也存在着相互影响、相互关联的情况。因此，多元地理回归模型更带有普遍性的意义。（一）多元线性回归模型的建立假设某一因变量y 受k 个自变量k x x x ,...,,21的影响，其n 组观测值为（ka a a a x x x y ,...,,,21）， n a ,...,2,1=。那么，多元线性回归模型的结构形式为： a ka k a a a x x x y εββββ+++++=...22110（3.2.11）式中： k βββ,...,1,0为待定参数； a ε为随机变量。如果k b b b ,...,,10分别为k ββββ...,,,210的拟合值，则回归方程为 ?=k k x b x b x b b ++++...22110（3.2.12）式中： 0b 为常数； k b b b ,...,,21称为偏回归系数。偏回归系数i b （k i ,...,2,1=）的意义是，当其他自变量j x （i j ≠）都固定时，自变量i x 每变化一个单位而使因变量y 平均改变的数值。根据最小二乘法原理，i β（k i ,...,2,1,0=）的估计值i b （k i ,...,2,1,0=）应该使 ()[]min (2) 1 2211012 →++++-=??? ??-=∑∑==∧ n a ka k a a a n a a a x b x b x b b y y y Q （3.2.13）有求极值的必要条件得 ???????==??? ??--=??=??? ??--=??∑∑=∧=∧n a ja a a j n a a a k j x y y b Q y y b Q 110) ,...,2,1(0202（3.2.14）将方程组（3.2.14）式展开整理后得：

第二章回归分析中的几个基本概念

第四章一、练习题（一）简答题 1、多元线性回归模型的基本假设是什么？试说明在证明最小二乘估计量的无偏性和有效性的过程中，哪些基本假设起了作用？ 2、多元线性回归模型与一元线性回归模型有哪些区别？ 3、某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为 fedu medu sibs edu 210.0131.0094.036.10++-= R 2=0.214 式中，edu 为劳动力受教育年数，sibs 为该劳动力家庭中兄弟姐妹的个数，medu 与fedu 分别为母亲与父亲受到教育的年数。问（1）若medu 与fedu 保持不变，为了使预测的受教育水平减少一年，需要sibs 增加多少？（2）请对medu 的系数给予适当的解释。（3）如果两个劳动力都没有兄弟姐妹，但其中一个的父母受教育的年数为12年，另一个的父母受教育的年数为16年，则两人受教育的年数预期相差多少？ 4、以企业研发支出（R&D ）占销售额的比重为被解释变量（Y ），以企业销售额（X1）与利润占销售额的比重（X2）为解释变量，一个有32容量的样本企业的估计结果如下： 099 .0)046.0() 22.0() 37.1(05.0)log(32.0472.022 1=++=R X X Y 其中括号中为系数估计值的标准差。（1）解释log(X1)的系数。如果X1增加10%，估计Y 会变化多少个百分点？这在经济上是一个很大的影响吗？（2）针对R&D 强度随销售额的增加而提高这一备择假设，检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。（3）利润占销售额的比重X2对R&D 强度Y 是否在统计上有显著的影响？ 5、什么是正规方程组？分别用非矩阵形式和矩阵形式写出模型： i ki k i i i u x x x y +++++=ββββΛ22110，n i ,,2,1Λ=的正规方程组，及其推导过程。 6、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数，以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据，得到两个可能的解释性方程：方程A ：3 215.10.10.150.125?X X X Y +--= 75.02 =R 方程B ：4 217.35.50.140.123?X X X Y -+-= 73.02=R 其中：Y ——某天慢跑者的人数

多元线性回归模型原理

研究在线性关系相关性条件下，两个或者两个以上自变量对一个因变量，为多元线性回归分析，表现这一数量关系的数学公式，称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展，其基本原理与一元线性回归模型类似，只是在计算上为复杂需借助计算机来完成。计算公式如下：设随机y与一般变量X1,X2,L X k的线性回归模型为：其中°, 1,L k是k 1个未知参数，°称为回归常数，「L k称为回归系数；y称为被解释变量；x1, X2,L x k是k个可以精确可控制的一般变量，称为解释变量。当P 1时，上式即为一元线性回归模型，k 2时，上式就叫做多元形多元回归模型。是随机误差，与一元线性回归一样，通常假设同样，多元线性总体回归方程为y °1x1 2x2 L k x k 系数1表示在其他自变量不变的情况下，自变量乂［变动到一个单位时引起的因变量y 的平均单位。其他回归系数的含义相似，从集合意义上来说，多元回归是多维空间上的一个平面。多元线性样本回归方程为：? ?° ?1x1 ?2x2 L ?k x k 多元线性回归方程中回归系数的估计同样可以采用最小二乘法。由残差平方和：SSE (y ?) 0 根据微积分中求极小值得原理，可知残差平方和SSE存在极小值。欲使SSE达到最小，SSE对 °, 1丄k的偏导数必须为零。将SSE对 ° ,1丄k求偏导数，并令其等于零，加以整理后可得到k 1各方程 SSE 式：—— 2 (y ?) ° i 通过求解这一方程组便可分别得到°, 1,L k的估计值，彳，?…?k回归系数的估计值，当自变量个数较多时，计算十分复杂，必须依靠计算机独立完成。现在，利用SPSS，只要将数据输入，并指定因变量和相应的自变量，立刻就能得到结果。对多元线性回归，也需要测定方程的拟合程度、检验回归方程和回归系数的显着性。