概率论GL9[1].4多元线性回归
- 格式:ppt
- 大小:316.50 KB
- 文档页数:13
多元线性回归方法介绍回归分析主要研究因变量与自变量的关系,因变量是随机变量,自变量是因素变量,是可以加以控制的变量。
多元回归分析一般解决以下问题:第一,确定因变量与多个因素变量之间联系的定量表达式,通常称为回归方程式或数学模型,并确定它们联系的密切程度;第二,通过控制可控变量的数值,借助于球而出的数学模型来预测或控制因变量的取值和精度;第三,进行因素分析,从影响因变量变化的因素中寻找出哪些因素对因变量的影响最为显著,哪些因素不显著,以区别主要因素和次要因素。
在操作过程中,需要列出影响Y 的多个因素与Y 之间的关系方程。
一般地,设因变量Y 于k 个自变量X1,X2,……,XK线性相关:Y=B0+ B1X1+ B2X2+ … + B k X k+ε(1)其中Y 为可观察的随机变量,X1,X2,…,Xk为可观察的一般变量,B0,B1,B2,…,Bk为待定模型参数,其中B0为截距,ε为不可观测的随机误差。
有n组独察的样本数据(yi,x i1,…,xik),i=1,2,…,n,带入方程(1)中,有:y i= b0+ b1x i1+ b2x i2+ … + b k x ik+ e i i=1,2,…, n其中n 个随机变量ei相互独立且服从同一正态分布Nor(0,σ2)。
根据最小二乘原则,求B0,B1,B2,…,Bk的估计值b0,b1,…,bk,使上式的误差平方和∑(ei)2=∑[y i-(b0+b1x i1+b2x i2+…+b k x ik)]2最小,为此,分别将上式对b0,b1,…,bk求偏导数,令其等于0,当x1,x2,…,xk相互独立时,由极值原理,可求出总体回归系数矩阵B 总体=[B0,B1,B2,…,Bk]T的估计值矩阵B样本=[b0,b1,…,bk]T:B样本=(XTX)-1XTX进而得到回归方程:y=b0+b1x1+b2x2+…+b k x k 本文将依据上述原理对后面的变量关系进行回归分析。
第二节 多元线性回归在许多实际问题中, 常常会遇到要研究一个随机变量与多个变量之间的相关关系,例如,某种产品的销售额不仅受到投入的广告费用的影响,通常还与产品的价格、消费者的收入状况以及其它可替代产品的价格等诸多因素有关系. 研究这种一个随机变量同其他多个变量之间的关系的主要方法是运用多元回归分析. 多元线性回归分析是一元线性回归分析的自然推广形式,两者在参数估计、显著性检验等方面非常相似. 本节只简单介绍多元线性回归的数学模型及其最小二乘估计.一、多元线性回归模型设影响因变量Y 的自变量个数为P ,并分别记为,21,,,p x x x 所谓多元线性模型是指这些自变量对Y 的影响是线性的,即p p x x x Y 22110,),0(~2 N其中p ,,,,210 ,2 是与p x x x ,,,21 无关的未知参数,称Y 为对自变量,21,,,p x x x 的线性回归函数.记n 组样本分别是),,,,(21i ip i i y x x x ),,2,1(n i ,则有n np p n n n p p p p x x x y x x x y x x x y 2211022222211021112211101, 其中n ,,,21 相互独立,且),0(~2 N i ,n i ,,2,1 ,这个模型称为多元线性回归的数学模型. 令Y =n y y y21, X =np n n p p x x x x x x x x x212222*********,p 10,n 21 则上述数学模型可用矩阵形式表示为 X Y其中 是n 维随机向量,它的分量相互独立。
X 称为设计矩阵或资料矩阵。
二、多元线性回归模型的基本假定1.解释变量是确定性的变量,不是随机变量,设计矩阵中要求列向量不能有密切的线性相关性,也称为多重共线性;2. 随机误差项具有0均值和同方差,且随机误差项相互独立,即:j i j i n i E j i i 0),cov(,2,10)(2 3.正态分布条件: 2(0,)N I :,其中I 表示单位矩阵。