U和Q的相对大小反映了因子x对y的影响程度, 在n固定的情况下,如果回归
方差所占y方差的比重越大,剩余方差所占的比重越小,就表明回归的效果
越好, 即:x的变化对y的变化起主要作用, 利用回归方程所估计出的ŷ也会
越接近观测值y。
ŷ的方差占y的方差的比重(U/(U+Q))可作为衡量回归模型效果的标准:
ŷ
y -y
ŷ -y
y
x
syy
1 n
n t 1
( yt
y)2
1 n
n t 1
( yt
y)2
1 n
n t 1
( yt
yt )2
“回归平方和”与“剩余平方和”
对上式两边分别乘以n,研究各变量的离差平方和的关系。为避免过多数学符
号,等号左边仍采用方差的记号syy。
n
n
syy ( yt y)2 ( yt yt )2 U Q
回忆前文所讲, y的第i个观测值yi服从怎样的分布?
yi ~ N (β0 +βxi , σ2)
e=yi- (β0 +βxi ) 服从N(0, σ2)
于是, yi (0 xi ) 服从标准正态分布N (0,1)
0.4
在95%的置信概率下:
因为定理: 若有z ~ N (, 2 ), 则有 z ~ N (0,1)
通过方差分析可知,可用“回归平方和”U与“剩余平方和”Q的比值来衡 量回归效果的好坏。可以证明,假设总体的回归系数为0的条件下,统计 量:
U
F=
1 Q
注意Q的自由度为n-2, 即:残差e的方差的无 偏估计为:Q/(n-2)
n2 服从分子自由度为1,分母自由度为n - 2的F分布
上式可以用相关系数的平方来表示: