par(mfrow=c(2,2))
plot(lm1,which=c(1:4))
删除异常样本
通过Cook diatance图,检验发现47号数据为异常值, 需要将其删除
R 语句:
a.std=a.std(-47, )
多重共线性
含义及检验
什么是多重共线性?
定义:
存在多重共线性的变量之间,存在较强的相关性, 在建模中会影响模型的准确性,应该建模前予以处 理。
R语句: >lm1=lm(ROE~ROEt+ATO+PM+LEV+GROWTH+PB+
ARR+INV+ASSET, data=a1) > summary(lm1)
显著性检验
回归方程与回归系数的显著性检验
F检验-回归方程显著性检验
假设
H0 : i 0i vs
检验统计量
H1 : i 0i
依据模型删除变量
“最优”回归选择
回归方程中若忽略了对因变量有显著影响的自变量 ,模型必有较大偏差;但若自变量选的过多,模型 效果也不会很好。
统计学中对回归模型提出许多不同的准则,以及多 种方法对模型进行变量选择
R软件提供了用于逐步回归进行变量选择的函数:
step(object,scale=0,direction=c(“both” , “backward”, “forward”))
学生化残差:
R软件如下函数获得学生化残差: rstudent(object)
残差图
(a)不论回归值大小,残差具有相同分布,满足模型 的各建设条件;
(b)回归值与残差波动大小有关,即等方差假设有问 题;
(c)表示线性模型不合适,应考虑非线性模型