19
6.3 多元回归的OLS 估计量
以二元回归变量为例 两个回归变量时的 OLS 估计量是下式的解:
min b0 ,b1 ,b2 [Yi (b0 b1 X 1i b2 X 2i )]2
i 1
n
OLS 估计量使 Yi 的真值与基于回归线估计的预测值之差的 平均平方和最小. 该最小化问题可通过微积分求解 由此得0 和 1 的 OLS 估计量. OLS 在多元回归模型中的理解和运用同一元情形
在加利福尼亚数据集中确实发了这种情况吗?
8
具有较少英语学习者的学区往往具有较高的测试成绩 具有较少英语学习者百分率(PctEL)的学区往往具有较小 的班级 在 PctEL 相当的学区中,班级规模的效应较小 (记住:整体的 “测试成绩差距” = 7.4) 怎么处理遗漏变量偏差?
9
寻求克服遗漏变量偏差的方法
其中小标 i 表示 n 个观测中的第 i 个观测, 是存在两个回归变量 X 1i 和 X 2i 时的总体多元回归模型(population multiple regression model)。
16
术语
考虑两个回归变量的情形: Yi = 0 + 1X1i + 2X2i + ui, i = 1,…,n Y 为因变量 X1, X2 为两个自变量 (回归变量、控制变量) (Yi, X1i, X2i) 表示 Y, X1, 和 X2 的 ith 个观测. 0 = 未知总体截距(常数项) 1 = 固定 X2 不变情况下, X1 变化一个单位对 Y 的效应(Y 的期 望变化) 2 = 固定 X1 不变情况下, X2 变化一个单位对 Y 的效应(Y 的期 望变化) ui = 回归误差 (遗漏因素) 同方差和异方差