15 多元线性回归分析
- 格式:ppt
- 大小:330.00 KB
- 文档页数:40
第三章多元线性回归模型一、名词解释1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量影响的现象,表现在线性回归模型中有多个解释变量,这样的模型被称做多元线性回归模型,多元是指多个解释变量2、调整的可决系数R2:又叫调整的决定系数,是一个用于描述多个解释变量对被解释变量的联合影响程2 2-2 2 门度的统计量‘克服了R随解释变量的增加而增大的缺陷,与R的矢系为R2=1 -(1 -R2)-n — k —1 3、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1单位对被解释变量带来的平均影响程度。
4、正规方程组:采用OLS方法估计线性回归模型时,对残差平方和矢于各参数求偏导,并令偏导数为0后得到的方程组,其矩阵形式为XX A XYo5、方程显著1•生检验:是针对所有解释变量对被解释变量的联合影响是否显著所作的检验,旨在对模型中被解释变量与解释变量之间的线性矢系在总体上是否显著成立作岀判断。
、单项选择题1、C : F统计量的意义2、A: F统计量的定义22 Z ei3、B :随机误差项方差的估计值:? ・n _k_14、A :书上P92和P93公式5、C: A参看导论部分内容;B在判断多重共线等问题的时候,很有必要;D在相同解释变量情况下可以衡量6、C :书上P99,比较F统计量和可决系数的公式即可7、A :书P818、D : A截距项可以不管它;B不考虑betaO ;C相矢矢系与因果矢系的辨析9、B :注意!只是在服从基本假设的前提下,统计量才服从相应的分布10、 D : AB不能简单通过可决系数判断模型好坏,还要考虑样本量、异方差等问题;三、多项选择题1、ACDE :概念性2、BD :概念性3、BCD :总体显著,则至少一个参数不为04、BC :参考可决系数和F统计量的公式5、AD :考虑极端情况,ESS=O,可发现CE错四、判断题、1 ' " 2、” 3 > X 4 > X:调整的可决系数5、”五、简答题1、答:多元线性回归模型与一元线性回归模型的区别表现在如下几个方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了个“解释变量之间不存在线性相矢尖系”的假定:三是多元线性回归模型的参数估计式的表达更为复杂。
计量经济学试题1一 名词解释(每题5分,共10分) 1. 经典线性回归模型2. 加权最小二乘法(WLS ) 二 填空(每空格1分,共10分)1.经典线性回归模型Y i = B 0 + B 1X i + µi 的最小二乘估计量b 1满足E ( b 1 ) = B 1,这表示估计量b 1具备 性。
2.广义差分法适用于估计存在 问题的经济计量模型。
3.在区间预测中,在其它条件不变的情况下,预测的置信概率越高,预测的精度越 。
4.普通最小二乘法估计回归参数的基本准则是使 达到最小。
5.以X 为解释变量,Y 为被解释变量,将X 、Y 的观测值分别取对数,如果这些对数值描成的散点图近似形成为一条直线,则适宜配合 模型。
6.当杜宾-瓦尔森统计量 d = 4时,ρˆ= ,说明 。
7.对于模型i i i X Y μββ++=10,为了考虑“地区”因素(北方、南方两种状态)引入2个虚拟变量,则会产生 现象。
8. 半对数模型LnY i = B 0 + B 1X i + µI 又称为 模型。
9.经典线性回归模型Y i = B 0 + B 1X i + µi 的最小二乘估计量b 0、b 1的关系可用数学式子表示为 。
三 单项选择题(每个1分,共20分)1.截面数据是指--------------------------------------------------------------( )A .同一时点上不同统计单位相同统计指标组成的数据。
B .同一时点上相同统计单位相同统计指标组成的数据。
C .同一时点上相同统计单位不同统计指标组成的数据。
D .同一时点上不同统计单位不同统计指标组成的数据。
2.参数估计量βˆ具备有效性是指------------------------------------------( ) A .0)ˆ(=βar V B.)ˆ(βarV 为最小 C .0)ˆ(=-ββD.)ˆ(ββ-为最小 3.如果两个经济变量间的关系近似地表现为:当X 发生一个绝对量(X ∆)变动时,Y 以一个固定的相对量(Y Y /∆)变动,则适宜配合的回归模型是------------------------------------------------------------------------------------------- ( )A .i i i X Y μβα++= B.i i i X Y μβα++=ln C .i ii X Y μβα++=1D.i i i X Y μβα++=ln ln 4.在一元线性回归模型中,不可能用到的假设检验是----------( ) A .置信区间检验 B.t 检验 C.F 检验 D.游程检验5.如果戈里瑟检验表明 ,普通最小二乘估计的残差项有显著的如下性质:24.025.1i i X e +=,则用加权最小二乘法估计模型时,权数应选择-------( )A .i X 1 B. 21i X C.24.025.11i X + D.24.025.11i X +6.对于i i i i X X Y μβββ+++=22110,利用30组样本观察值估计后得56.827/)ˆ(2/)ˆ(2=-∑-∑=iiiY Y Y Y F ,而理论分布值F 0.05(2,27)=3.35,,则可以判断( )A . 01=β成立 B. 02=β成立 C. 021==ββ成立 D. 021==ββ不成立7.为描述单位固定成本(Y )依产量(X )变化的相关关系,适宜配合的回归模型是:A .i i i X Y μβα++= B.i i i X Y μβα++=ln C .i ii X Y μβα++=1D.i i i X Y μβα++=ln ln 8.根据一个n=30的样本估计ii i e X Y ++=10ˆˆββ后计算得d=1.4,已知在95%的置信度下,35.1=L d ,49.1=U d ,则认为原模型------------------------( )A .存在正的一阶线性自相关 B.存在负的一阶线性自相关 C .不存在一阶线性自相关 D.无法判断是否存在一阶线性自相关9.对于ii i e X Y ++=10ˆˆββ,判定系数为0.8是指--------------------( ) A .说明X 与Y 之间为正相关 B. 说明X 与Y 之间为负相关 C .Y 变异的80%能由回归直线作出解释 D .有80%的样本点落在回归直线上10. 线性模型i i i i X X Y μβββ+++=22110不满足下列哪一假定,称为异方差现象-------------------------------------------------------------------------------( )A .0)(=j i ov C μμ B.2)(σμ=i ar V (常数) C .0),(=i i ov X C μ D.0),(21=i i ov X X C11.设消费函数i i i X D Y μβαα+++=10,其中虚拟变量⎩⎨⎧=南方北方01D ,如果统计检验表明1α统计显著,则北方的消费函数与南方的消费函数是--( )A .相互平行的 B.相互垂直的 C.相互交叉的 D.相互重叠的12. 在建立虚拟变量模型时,如果一个质的变量有m 种特征或状态,则一般引入几个虚拟变量:----------------------------------------------------------------( )A .m B.m+1 C.m -1 D.前三项均可 13. 在模型i i iX Y μββ++=ln ln ln 10中,1β为---------------------( )A .X 关于Y 的弹性 B.X 变动一个绝对量时Y 变动的相对量 C .Y 关于X 的弹性 D.Y 变动一个绝对量时X 变动的相对量14.对于i i i e X Y ++=10ˆˆββ,以S 表示估计标准误差,iY ˆ表示回归值,则-------------------------------------------------------------------------------------------( )A .S=0时,0)ˆ(=-∑ti Y Y B.S=0时,∑==-ni i i Y Y 120)ˆ( C .S=0时,)ˆ(ii Y Y -∑为最小 D.S=0时,∑=-ni i i Y Y 12)ˆ(为最小 15.经济计量分析工作的基本工作步骤是-----------------------------( )A .设定理论模型→收集样本资料→估计模型参数→检验模型B .设定模型→估计参数→检验模型→应用模型C .理论分析→数据收集→计算模拟→修正模型D .确定模型导向→确定变量及方程式→应用模型16.产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为:X Y5.1356ˆ-=,这说明-----------------------------------------------------------( )A .产量每增加一台,单位产品成本平均减少1.5个百分点B .产量每增加一台,单位产品成本减少1.5元C .产量每增加一台,单位产品成本减少1.5个百分点D .产量每增加一台,单位产品成本平均减少1.5元17.下列各回归方程中,哪一个必定是错误的------------------------( )A .8.02.030ˆ=+=XY i i r X Y B. 91.05.175ˆ=+-=XY i i r X Y C .78.01.25ˆ=-=XY ii r X Y D. 96.05.312ˆ-=--=XY ii r X Y18.用一组有28个观测值的样本估计模型i i i X Y μββ++=10后,在0.05的显著性水平下对1β的显著性作t 检验,则1β显著地不等于0的条件是统计量t 大于-------------------------------------------------------------------------------------( )A .t 0.025(28) B. t 0.05(28) C. t 0.025(26) D. t 0.05(26)19.下列哪种形式的序列相关可用DW 统计量来检验(V t 为具有零均值、常数方差,且不存在序列相关的随机变量)---------------------------------( )A .t t t V +=-1ρμμ B.t t t t V +⋅⋅⋅++=--121μρρμμ C. t t V ρμ= D. ⋅⋅⋅++=-12t t t V V ρρμ20.对于原模型t t t X Y μββ++=10,一阶差分模型是指------------( )A .)()()(1)(1t tt t t t t X f X f X X f X f Y μββ++=B .t t t X Y μβ∆+∆=∆1C .t t t X Y μββ∆+∆+=∆10D .)()()1(11101----+-+-=-t t t t t t X X Y Y ρμμρβρβρ四 多项选择题(每个2分,共10分)1.以Y 表示实际值,Yˆ表示回归值,i e 表示残差项,最小二乘直线满足------------------------------------------------------------------------------------------( )A .通用样本均值点(Y X ,) B.ii Y Y ˆ∑=∑ C .0),ˆ(=i i ov e Y C D.0)ˆ(2=-∑i i Y Y E .0)ˆ(=-∑Y Y i2.剩余变差(RSS )是指--------------------------------------------------( )A .随机因素影响所引起的被解释变量的变差B .解释变量变动所引起的被解释变量的变差C .被解释变量的变差中,回归方程不能作出解释的部分D.被解释变量的总变差与解释变量之差E.被解释变量的实际值与回归值的离差平方和3. 对于经典线性回归模型,0LS估计量具备------------------------()A.无偏性 B.线性特性 C.正确性 D.有效性 E.可知性4. 异方差的检验方法有---------------------------------------------------()A.残差的图形检验 B.游程检验 C.White检验D.帕克检验E.方差膨胀因子检验5. 多重共线性的补救有---------------------------------------------------()A.从模型中删掉不重要的解释变量 B.获取额外的数据或者新的样本 C.重新考虑模型 D.利用先验信息 E. 广义差分法五简答计算题(4题,共50分)1.简述F检验的意图及其与t检验的关系。
多元线性回归模型原理Y=β0+β1*X1+β2*X2+...+βn*Xn+ε其中,Y表示因变量,X1、X2、..、Xn表示自变量,β0、β1、β2、..、βn表示模型的参数,ε表示误差项。
通过对数据进行拟合,即最小化误差平方和,可以估计出模型的参数。
多元线性回归模型的原理是基于最小二乘法,即通过最小化残差平方和来估计参数的值。
残差是指模型预测值与真实值之间的差异,最小二乘法的目标是找到一组参数,使得所有数据点的残差平方和最小。
通过求解最小二乘估计,可以得到模型的参数估计值。
为了评估模型的拟合程度,可以使用各种统计指标,例如R方值、调整R方值、标准误差等。
R方值表示模型解释因变量方差的比例,取值范围在0到1之间,值越接近1表示模型对数据的拟合程度越好。
调整R方值考虑了模型中自变量的个数和样本量之间的关系,可以更准确地评估模型的拟合程度。
标准误差表示模型预测值与真实值之间的标准差,可以用于评估模型的预测精度。
在建立多元线性回归模型之前,需要进行一些前提条件的检查,例如线性关系、多重共线性、异方差性和自变量的独立性。
线性关系假设要求自变量与因变量之间存在线性关系,可以通过散点图、相关系数等方法来检验。
多重共线性指的是自变量之间存在高度相关性,会导致参数估计的不稳定性,可以使用方差膨胀因子等指标来检测。
异方差性指的是残差的方差不恒定,可以通过残差图、方差齐性检验等方法来检验。
自变量的独立性要求自变量之间不存在严重的相关性,可以使用相关系数矩阵等方法来检验。
当满足前提条件之后,可以使用最小二乘法来估计模型的参数。
最小二乘法可以通过不同的方法来求解,例如解析解和数值优化方法。
解析解通过最小化误差平方和的一阶导数为零来求解参数的闭式解。
数值优化方法通过迭代来求解参数的数值估计。
除了最小二乘法,还有其他方法可以用于估计多元线性回归模型的参数,例如岭回归和lasso回归等。
岭回归和lasso回归是一种正则化方法,可以对模型进行约束,可以有效地避免过拟合问题。
高考回归分析知识点回归分析是统计学中一种重要的分析方法,用于研究变量之间的关系和预测。
在高考数学中,回归分析也是一个重要的知识点。
本文将介绍高考中常见的回归分析知识点,并结合具体例子进行解析。
一、简单线性回归1. 定义:简单线性回归是指在研究两个变量之间关系时,其中一个变量为自变量,另一个变量为因变量,且二者之间存在线性关系的情况。
2. 公式:简单线性回归模型的数学表示为:Y = α + βX + ε,其中Y为因变量,X为自变量,α和β为常数,ε为误差项。
3. 参数估计:通过最小二乘法可以估计出回归系数α和β的值,从而建立回归方程。
示例:假设我们想研究学生的学习时间与考试分数之间的关系。
我们收集了一组数据,学习时间(自变量X)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]考试分数(分数):[60, 70, 75, 80, 85, 90]通过简单线性回归分析,我们可以建立回归方程为:Y = 55 + 0.75X,说明学习时间对考试分数有正向影响。
二、多元线性回归1. 定义:多元线性回归是指在研究多个自变量与一个因变量之间关系时的回归分析方法。
它可以用来探究多个因素对因变量的影响程度,并进行预测和解释。
2. 公式:多元线性回归模型的数学表示为:Y = α + β₁X₁ + β₂X₂+ ... + βₚXₚ + ε,其中Y为因变量,X₁、X₂、...、Xₚ为自变量,α和β₁、β₂、...、βₚ为常数,ε为误差项。
3. 参数估计:同样通过最小二乘法可以估计出回归系数α和β₁、β₂、...、βₚ的值,从而建立回归方程。
示例:我们想研究学生的考试分数与学习时间、家庭收入、家庭教育水平等因素之间的关系。
我们收集了一组数据,学习时间(自变量X₁)、家庭收入(自变量X₂)、家庭教育水平(自变量X₃)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]家庭收入(万元):[8, 10, 12, 15, 18, 20]家庭教育水平(年):[10, 12, 14, 16, 18, 20]考试分数(分数):[60, 70, 75, 80, 85, 90]通过多元线性回归分析,我们可以建立回归方程为:Y = 50 +0.7X₁ + 1.2X₂ + 1.5X₃,说明学习时间、家庭收入和家庭教育水平都对考试分数有正向影响。
多元线性回归的名词解释多元线性回归是一种经济学和统计学中常用的方法,用于分析多个自变量与一个连续因变量之间的关系。
在这种回归分析中,解释变量(自变量)可以是连续或分类变量,而被解释变量(因变量)通常是连续变量。
本文将对多元线性回归的关键名词进行解释,以帮助读者更好地理解和应用该方法。
一、回归分析回归分析是研究两个或多个变量之间关系的统计方法。
在多元线性回归中,我们可以使用多个自变量来预测一个连续的因变量。
回归分析可以帮助我们了解各个自变量对因变量的贡献程度,以及它们之间的相互作用。
二、线性回归线性回归是一种回归分析的方法,假设自变量和因变量之间存在线性关系。
这意味着在多元线性回归中,我们假设因变量是自变量的线性组合,具体表现为一个多元线性方程。
通过最小化预测值和实际观测值之间的误差平方和,我们可以估计出各个自变量的系数,并对因变量进行预测。
三、自变量和因变量在多元线性回归中,自变量是我们用来解释或预测因变量的变量。
自变量可以是连续变量,如年龄、收入等,也可以是分类变量,如性别、教育程度等。
因变量是我们希望预测或解释的变量,通常是一个连续变量,如房屋价格、销售额等。
四、最小二乘法最小二乘法是多元线性回归中参数估计的常用方法。
该方法通过最小化预测值与实际观测值之间的误差平方和来确定各个自变量的系数。
通过求解估计方程,我们可以得到最佳的系数估计,从而建立起自变量与因变量之间的线性关系。
五、多重共线性多重共线性是多元线性回归中一个重要的问题。
当自变量之间存在高度相关性时,可能会导致估计的系数不稳定或不精确。
为了检测和解决多重共线性问题,我们可以计算自变量之间的相关系数矩阵,并使用方差膨胀因子(VIF)来评估自变量之间的共线性程度。
六、拟合优度拟合优度是衡量多元线性回归模型拟合优良程度的指标。
拟合优度可以用于评估模型对观测值的解释能力。
常见的拟合优度指标包括决定系数(R²),它可以解释因变量的变异程度中可归因于自变量的比例。
多元线性回归拟合分析(1)楚雄师范学院2012年数学建模竞赛第一次实战训练(一)第一题论文题目多元非线性回归拟合模型姓名郜红霞杨环刘发稳2012年8月20日多元非线性回归拟合模型摘要:本文推论了多元非线性数据拟合的通用数学模型,利用最小二乘法和极值原理,导出求解多元非线性回归方程的规范方程组。
并用矩阵形式对规范方程组进行表述,在所表述的诸矩阵中,结构矩阵是其基础。
用它可方便地转化出其他矩阵,这将大大简化程序的编制和规范方程组的解算。
计算机根据输入数据自变量的个数和实验所作次数的多少,求解出相应的多元非线性回归方程及其评估方程质量的数据。
关键字:规范方程;非线性回归方程;最小二乘法;结构矩阵;极值原理;对称矩阵;数据分析;计算机拟合;矩阵形式自变量。
1 问题重述要求:1.检验强影响点;2.正态性检验;3.相关性检验;4.自变量的多重共线性检验;5.残差的相关性分析,模型的合理分析。
x=(470 81 82 50 13.7 225)'。
6.预测2 问题分析先建立基础的多元线性回归方程,以初步确定输入变量与输出变量的关系,若预测效果不理想,则需要对方程进行进一步优化,考虑建立非线性回归方程模型或其他更优模型,反复进行判断和优化,最后得到较理想的预测方程。
并用一定的评价标准对得出的预测方程进行判定,最后,用实验数据对模型预测的精度进行验证。
3 基本假设与符号说明iy多元线性回归的输出变量β回归系数βˆ回归系数估计值yˆ输出变量估计值Q 残差平方和E 拟合误差ε无偏估计值2s方差R 复相关系数SE 标准误差4 模型建立3.1 问题分析3.2 模型建立(1)我们先假设输入变量和输出变量之间的关系是线性函数关系,建立多元线性回归模型。
{),0(~...2' '11'σεεβββNx xYmm ++++=(2)为了在研究两个指定变量之间的相关关系的同时,控制可能对其产生影响的其他变量,我们在研究任意两个输入变量的相互作用的判断中,运用了偏相关分析先对任意两个输入变量之间是否有交互作用进行判断。
四、回归分析 15分可能涉及范围:多元线性回归、logistic 回归。
要求: 1、提供某一资料,选择统计分析方法2、偏回归系数、标准偏回归系数、决定系数、校正决定系数、OR 等常用指标的意义与应用3、列回归方程例 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值如下表:(1)欲分析影响空腹血糖浓度的有关因素,宜采用什么统计分析方法?多元线性回归分析(2)已知甘油三酯(X2)、胰岛素(X3)和糖化血红蛋白(X4)是主要影响因素,现欲比较上述因素对血糖浓度的相对影响强度,应计算何种指标?标准偏回归系数可用来比较各自变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越大,对Y 的作用越大。
SPSS 输出的多元回归分析结果中给出的各变量的标准偏回归系数,比较三个标准偏回归系数:甘油三脂0.354: 胰岛素0.360: 糖化血红蛋白0.413≈1:1.02:1.17(倍) 糖化血红蛋白对血糖的影响强度大小依次为:糖化血红蛋白X4、胰岛素X3、甘油三脂X2(3)分析其回归模型的好坏宜选用何种指标?校正决定系数( R 2a )作为评价标准一般说决定系数(R 2)越大越优,但由于R 2是随自变量的增加而增大,因此,不能简单地以R 2作为评价标准,而是用校正决定系数( R 2a )作为评价标准。
R 2a 不会随无意义的自变量增加而增大。
(4)根据给出SPSS 结果,做出正确的结论。
空腹血糖浓度与总胆固醇无关,与甘油三脂、空腹胰岛素、糖化血红蛋白线性相关。
(5)列出回归方程。
最优回归方程为:432663.0287.0402.05.6ˆX X X y+-+= Model Summary(最终模型的拟合优度检验验表)相关分析【完全分析答案】jszb1、此资料包含有四个变量,属于多变量计量资料,为多因素设计。
要分析多因素对空腹血糖浓度的影响,宜采用 多元线性回归分析。
2、根据样本数据求得模型参数β0, β1, β2, β3,β4的估计值b0,b1,b2,b3,b4β0又称为截距,β1, β2, …,βm 称为偏回归系数(partial regressin coefficient )或简称为回归系数。
医学统计学考题(按章节)第4题【15分】__回归分析四、回归分析 15分可能涉及范围:多元线性回归、logistic 回归。
要求: 1、提供某⼀资料,选择统计分析⽅法2、偏回归系数、标准偏回归系数、决定系数、校正决定系数、OR 等常⽤指标的意义与应⽤3、列回归⽅程例 27名糖尿病⼈的⾎清总胆固醇、⽢油三脂、空腹胰岛素、糖化⾎红蛋⽩、空腹⾎糖的测量值如下表:(1)欲分析影响空腹⾎糖浓度的有关因素,宜采⽤什么统计分析⽅法?多元线性回归分析(2)已知⽢油三酯(X2)、胰岛素(X3)和糖化⾎红蛋⽩(X4)是主要影响因素,现欲⽐较上述因素对⾎糖浓度的相对影响强度,应计算何种指标?标准偏回归系数可⽤来⽐较各⾃变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越⼤,对Y 的作⽤越⼤。
SPSS 输出的多元回归分析结果中给出的各变量的标准偏回归系数,⽐较三个标准偏回归系数:⽢油三脂0.354: 胰岛素0.360: 糖化⾎红蛋⽩0.413≈1:1.02:1.17(倍)糖化⾎红蛋⽩对⾎糖的影响强度⼤⼩依次为:糖化⾎红蛋⽩X4、胰岛素X3、⽢油三脂X2(3)分析其回归模型的好坏宜选⽤何种指标?校正决定系数( R 2a )作为评价标准⼀般说决定系数(R 2)越⼤越优,但由于R 2是随⾃变量的增加⽽增⼤,因此,不能简单地以R 2作为评价标准,⽽是⽤校正决定系数( R 2a )作为评价标准。
R 2a 不会随⽆意义的⾃变量增加⽽增⼤。
(4)根据给出SPSS 结果,做出正确的结论。
空腹⾎糖浓度与总胆固醇⽆关,与⽢油三脂、空腹胰岛素、糖化⾎红蛋⽩线性相关。
(5)列出回归⽅程。
最优回归⽅程为:432663.0287.0402.05.6?X X X y+-+= Model Summary(最终模型的拟合优度检验验表)相关分析【完全分析答案】jszb1、此资料包含有四个变量,属于多变量计量资料,为多因素设计。
要分析多因素对空腹⾎糖浓度的影响,宜采⽤多元线性回归分析。
二、多元线性回归模型在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。
因此,多元地理回归模型更带有普遍性的意义。
(一)多元线性回归模型的建立假设某一因变量y 受k 个自变量k x x x ,...,,21的影响,其n 组观测值为(ka a a a x x x y ,...,,,21),n a ,...,2,1=。
那么,多元线性回归模型的结构形式为:a ka k a a a x x x y εββββ+++++=...22110(3.2.11)式中:k βββ,...,1,0为待定参数; a ε为随机变量。
如果k b b b ,...,,10分别为k ββββ...,,,210的拟合值,则回归方程为ŷ=k k x b x b x b b ++++...22110(3.2.12)式中:0b 为常数;k b b b ,...,,21称为偏回归系数。
偏回归系数i b (k i ,...,2,1=)的意义是,当其他自变量j x (i j ≠)都固定时,自变量i x 每变化一个单位而使因变量y 平均改变的数值。
根据最小二乘法原理,i β(k i ,...,2,1,0=)的估计值i b (k i ,...,2,1,0=)应该使()[]min (2)12211012→++++-=⎪⎭⎫⎝⎛-=∑∑==∧n a ka k a a a na a a xb x b x b b y y y Q (3.2.13)有求极值的必要条件得⎪⎪⎩⎪⎪⎨⎧==⎪⎭⎫ ⎝⎛--=∂∂=⎪⎭⎫⎝⎛--=∂∂∑∑=∧=∧n a ja a a jn a a a k j x y y b Q y y b Q 110),...,2,1(0202(3.2.14) 将方程组(3.2.14)式展开整理后得:⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧=++++=++++=++++=++++∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑===================na a ka k n a ka n a ka a n a ka a n a ka n a aa k n a ka a n a a n a a a na a na aa k n a ka a n a a a n a a n a a na ak n a ka n a a n a a y x b x b x x b x x b x y x b x x b x b x x b x y x b x x b x x b x b x y b x b x b x nb 11221211101121221221121012111121211121011112121110)(...)()()(...)(...)()()()(...)()()()(...)()( (3.2.15)方程组(3.2.15)式,被称为正规方程组。