例9-4 用例9-1所得直线回归方程,计算当
X0 = 12时,µ Y |X0 的95%可信区间和相应个
体 Y 值的95%预测区间。
由例9-1得到回归方程 Y = 1.6617+0.1392X, X = 9.5 , lxx = 42 ; 由例9-2得到
t0.05 / 2, 6 = 2.447
X0=12时尿肌酐含量总体均数的95%可信区间:
在图9-5中,这是两条比实曲线之间范围 更宽的虚曲线,也是中间窄、两头宽, 同样在 X0 = X 处最窄。
给定 X = X0 时,相应 Y 的均数的可信区间与其个体 Y 值的预测区间的含义不同: 可信区间: 在固定的 X0 处,如果反复抽样100次, 可算出100个相应 Y 的总体均数的可信区间,平均 有100×(1-α)个可信区间包含总体均数。 预测区间:一个预测值的取值范围,即预测100个 个体值中平均将有100×(1-α)个个体值在求出的 范围内。
统计学意义, 可计算 F 统计量。
MS回: 回归均方; MS残: 残差均方。 F 服从自由度为 回, 残 的 F 分布。 求 F 值后, 查 F 界值表, 得 P 值, 按所取检验 水准作出推断结论。
实际计算的两种方法: ① 将 Xi 依次代入回归方程求得 再求 SS残 与 SS回 ; ② 直接求 SS回 ,再得到 SS残 。 ,
2. t 检 验
β = 0 是否成立 ?
b0 t , n 2 Sb Sb SY
SY.X
SY
X
SY l XX
X
X
SS残 n2
回归的剩余标准差 (standard deviation of residuals)
Sb 样本回归系数标准误,扩大自变量的取值范围可 减小Sb ,使回归系数的估计更稳定。