拟合优度检验和方差检验
- 格式:ppt
- 大小:237.00 KB
- 文档页数:5
§3.3 多元线性回归模型的统计检验 一、拟合优度检验1、可决系数与调整的可决系数在一元线性回归模型中,使用可决系数2R 来衡量样本回归线对样本观测值的拟合程度。
在多元线性回归模型中,我们也可用该统计量来衡量样本回归线对样本观测值的拟合程度。
记∑-=2)(Y Y TSS i 为总离差平方和,∑-=2)ˆ(Y Y ESS i 为回归平方和,∑-=2)ˆ(ii Y Y RSS 为剩余平方和,则 2222)ˆ()ˆ)(ˆ(2)ˆ())ˆ()ˆ(()(Y Y Y Y Y Y Y Y Y Y Y Y Y Y TSS ii i i i i ii i i -∑+--∑+-∑=-+-∑=-∑= 由于∑∑-=--)ˆ()ˆ)(ˆ(Y Y e Y Y Y Y iiii∑∑∑∑++++=i ki i k i i i e Y X e X e e βββˆˆˆ110=0 所以有:ESS RSS Y Y Y Y TSS ii i +=-+-=∑∑22)ˆ()ˆ( (3.3.1) 即总离差平方和可分解为回归平方和与剩余平方和两部分。
回归平方和反映了总离差平方和中可由样本回归线解释的部分,它越大,剩余平方和越小,表明样本回归线与样本观测值的拟合程度越高。
因此,可用回归平方和占总离差平方和的比重来衡量样本回归线对样本观测值的拟合程度:TSSRSSTSS ESS R -==12 (3.3.2)该统计量越接近于1,模型的拟合优度越高。
在应用过程中发现,如果在模型中增加一个解释变量,2R 往往增大。
这是因为残差平方和往往随着解释变量个数的增加而减少,至少不会增加。
这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。
但是,现实情况往往是,由增加解释变量个数引起的2R 的增大与拟合好坏无关,因此在多元回归模型之间比较拟合优度,2R 就不是一个适合的指标,必须加以调整。
在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。
f检验表完整版一、F检验的概述1.F检验的定义F检验,又称F分布检验,是一种用于比较两个样本均值是否显著不同的统计方法。
它是由英国统计学家威廉·戈塞特(William Gosset)在20世纪初发现的,主要用于方差分析、独立性检验和拟合优度检验等。
2.F检验的应用场景F检验广泛应用于以下场景:(1)方差分析:在实验设计中,比较多个实验组与对照组的均值差异是否显著。
(2)独立性检验:检验两个分类变量之间是否存在显著关联。
(3)拟合优度检验:评估线性回归模型的拟合效果,检验观测值与预测值之间的差异是否显著。
二、F检验的计算过程1.总体方差的计算总体方差(σ)表示所有观测值与总体均值之间的差异平方和的平均值。
计算公式为:σ= Σ(xi - μ)/ n其中,xi为每个观测值,μ为总体均值,n为样本数量。
2.样本方差的计算样本方差(S)表示样本中每个观测值与样本均值之间的差异平方和的平均值。
计算公式为:S = Σ(xi - x)/ (n - 1)其中,xi为每个观测值,x为样本均值,n为样本数量。
3.F值的计算F值是用来比较总体方差与样本方差的比值。
计算公式为:F = (Σ(xi - μ)/ σ) / (Σ(xi - x)/ S)4.F检验的判断标准当F值大于临界值时,认为两个样本的均值存在显著差异。
临界值的确定取决于显著性水平和自由度。
自由度等于样本数量减去1。
三、F检验的优缺点1.优点(1)F检验具有较强的推断能力,可以较为准确地判断均值差异。
(2)适用范围广泛,可以应用于多种统计分析场景。
2.缺点(1)对样本数量有一定要求,当样本数量较小(如n < 30)时,F检验的准确性降低。
(2)对总体分布有一定要求,当总体分布与假设不符时,F检验的结果可能出现偏差。
四、F检验在实际应用中的案例分析1.案例介绍某研究者想要探究不同教学方法对学生数学成绩的影响,随机抽取了两个班级进行实验。
实验结束后,分别计算出两个班级的数学成绩均值,分别为70和80。