第7讲包含虚拟变量的回归分析43页
- 格式:ppt
- 大小:300.50 KB
- 文档页数:22
第七章多元回归分析虚拟变量第七章多元回归分析——虚拟变量模型y = β虚拟变量+ β1x1 + β2x2 + . . . βk x k + u表示两个类型的虚拟变量表示多个类型的虚拟变量虚拟变量之间的交叉项虚拟变量和连续变量的交叉项Chow检验线性概率模型项目评估和自选择偏差虚拟变量虚拟变量就是取1 或者0 的变量?例:male (= 1 若为男性, 0 其它情况), south (= 1 若在南方, 0 其它情况), 等. ?虚拟变量也叫二元变量一个独立的虚拟变量考虑一个包括一个连续变量(x)和一个虚拟变量(d)的模型y = β+ δ0d + β1x + u这可以解释成截距项的变化若d = 0, 那么y = β+ β1x + u若d = 1, 那么y = (β+ δ0) + β1x + ud = 0 的样本是参照组δ0 > 0 的例子y y = (β0 + δ0) + β1xd = 1{ δslope = β1d =0 }βy = β0 + β1xx从多个数值的类型变量到虚拟变量?我们可以用虚拟变量来控制有多种类型因素?假设样本中的个人是中学辍学或者仅仅中学毕业或者大学毕业现在要拿仅仅中学毕业和大学毕业的人和中学辍学的人比较定义hsgrad = 1 如果仅仅是中学毕业, 0 其它情况; colgrad = 1 如果大学毕业, 0 其它情况多个数值的类型变量(续)?任何类型变量都可以变成一组虚拟变量?因为参照组由常数项表示了, 那么如果一共有n 个类型,就应该由n –1 虚拟变量如果有太多的类型,通常应该对其进行分组例:前10 , 11 –25, 等虚拟变量之间的交叉项求虚拟变量的交叉项就相当于对样本进行进一步分组例:有男性(male)的虚拟变量和hsgrad(仅仅中学毕业)和colgrad (大学毕业)的虚拟变量加入male*hsgrad 和male*colgrad, 共有五个虚拟变量–> 共有六种类型参照组是女性中学辍学的人此时hsgrad 代表女性仅仅中学毕业者, colgrad 表示女性大学毕业者交叉项表示男性仅仅中学毕业者和男性大学毕业者虚拟变量之间的交叉项(续)?模型可以写成y = β0 + δ1male + δ2hsgrad +δ3colgrad + δ4male*hsgrad + δ5male*colgrad+ β1x + u, 那么:若male = 0 且hsgrad = 0 且colgrad = 0则y = β0 + β1x + u若male = 0 且hsgrad = 1 且colgrad = 0则y = β0 + δ2hsgrad + β1x + u若male = 1且hsgrad = 0且colgrad = 1则y = β0 + δ1male + δ3colgrad + δ5male*colgrad+ βx + u1其它变量与虚拟变量的交叉项?也可以考虑虚拟变量d 和连续变量x 之间的交叉项y = β+ δ1d + β1x + δ2d*x + u若d = 0, 那么y = β+ β1x + u若d = 1, 那么y = (β+ δ1) + (β1+ δ2) x + u这里的两种情况可以看成是斜率的变化δ0 > 0 且δ 1 < 0的例子yy = β+ β1xd = 0d = 1y = (β0 + δ0) + (β 1 + δ1) x。