多元相关与回归分析优秀课件
- 格式:ppt
- 大小:702.50 KB
- 文档页数:82
第三节 多元线性相关与回归分析一、标准的多元线性回归模型上一节介绍的一元线性回归分析所反映的是1个因变量与1个自变量之间的关系。
但是,在现实中,某一现象的变动常受多种现象变动的影响。
例如,消费除了受本期收入水平的影响外,还会受以往消费和收入水平的影响;一个工业企业利润额的大小除了与总产值多少有关外,还与成本、价格等有关。
这就是说,影响因变量的自变量通常不是一个,而是多个。
在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。
这就产生了测定与分析多因素之间相关关系的问题。
研究在线性相关条件下,两个和两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。
多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型相类似,只是在计算上比较麻烦一些而已。
限于本书的篇幅和程度,本节对于多元回归分析中与一元回归分析相类似的内容,仅给出必要的结论,不作进一步的论证。
只对某些多元回归分析所特有的问题作比较详细的说明。
多元线性回归模型总体回归函数的一般形式如下:t kt k t t u X X Y ++⋯++=βββ221 (7.51)上式假定因变量Y 与(k-1)个自变量之间的回归关系可以用线性函数来近似反映.式中,Y t 是变量Y 的第t个观测值;X jt 是第j 个自变量X j 的第t个观测值(j=1,2,……,k);u t 是随机误差项;β1,β2,… ,βk 是总体回归系数。
βj 表示在其他自变量保持不变的情况下,自变量X j 变动一个单位所引起的因变量Y 平均变动的数额,因而又叫做偏回归系数。
该式中,总体回归系数是未知的,必须利用有关的样本观测值来进行估计。
假设已给出了n个观测值,同时1ˆβ,2ˆβ…,k βˆ为总体回归系数的估计,则多元线性回归模型的样本回归函数如下:t kt k t t e X X Y ++⋯++=βββˆˆˆ221 (7.52)(t =1,2,…,n)式中,e t 是Y t 与其估计t Y ˆ之间的离差,即残差。
医学统计学第七章多元线性回归与相关上海交通大学医学院生物统计学教研室张莉娜医学研究统计分析方法生命现象多样性相关性复杂性随机性多元统计分析方法多元回归分析判别分析聚类分析Logistic 回归Cox 回归……事物间的相互联系往往是多方面的,在很多情况下对应变量y 发生影响的自变量往往不止一个。
如:➢人的体重与身高、胸围➢体表面积与身高、体重➢血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史➢糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂➢……➢多元线性回归的目的就是用一个多元线性回归方程表示多个自变量和1个应变量间的关系。
m m i i x b x b x b x b b y+⋅⋅⋅++⋅⋅⋅+++=22110ˆ:截距i b : (样本)偏回归系数偏回归系数表示其他自变量固定的情况下,x i 改变一个单位,y 平均改变b 个单位。
0b εββββα+++++++=m m i i x x x x y ΛΛ2211),0(~2σεN i b多元回归分析数据格式P126编号身高(cm)x1体重(kg)x2肺活量(L)y1135.132.0 1.75 3163.646.2 2.75 5156.237.1 2.75 7167.841.5 2.75 9145.033.0 2.50 11165.549.5 3.00 13153.341.0 2.75 15160.547.2 2.25 17147.640.5 2.00 19155.144.7 2.75 21143.031.5 1.75 23160.840.4 2.75 25158.237.5 2.00 27144.534.7 2.25问题:➢身高、体重与肺活量有无线性关系?➢用身高和体重预测肺活量有多高的精度?➢单独用身高、或体重是否也能达到同样效果?➢身高的贡献大,还是体重的贡献大?➢当x 1=150,x 2=30时,=1.8073,表示对所有身高为150cm ,体重为30kg 的13岁男童,估计平均肺活量为1.8073(L)。