Y i 0 1 D 1 i i ,
i 1 , 2 ,, n .
❖
其中Y i 为个人月支出;D1i 误差项且 E i =0
=
1, 未婚者的月期望支出为:
E Y i|D 1 i 0 E 0 1 0 i 0
❖ 已婚者的月期望支出为:
E Y i|D 1 i 1 E 0 1 1 i 0 1
下面给出含有一个定量变量和一个定性 变量的协方差模型,含有多个定量和定 性变量的协方差模型原理相似不再赘述。
Y i 0 1 D 1 i + 1 X 1 i i , i 1 , 2 ,, n .
其中Y i 表示大学生月话费支出,X 1 i 表示月生活
1,独生子女
费支出; ; 表示模型随机误差项 D1i=0,非独生子女
下面我们建立含有虚拟变量为自变量的回归模型。
1.方差分析模型(ANOVA模型) 在回归分析中,虚拟变量与定量变量一样
可以作为模型的回归元。一个回归模型的自 变量只有虚拟变量,这样的模型称为方差分 析模型(analysis of variance,ANOVA)。为 说明方差分析模型,我们看下面一个只含有 一个虚拟变量的ANOVA模型,含有多个虚拟 变量的ANOVA模型原理相似不再赘述。
i
且 。 Ei =0
则根据模型有: 非独生大学生月话费支出期望值为:
E Y i|D 1 i 0 E 0 1 0 + 1 X 1 i i 0 1 X 1 i
独生大学生月话费支出期望值为:
E Y i |D 1 i 1 E 0 1 1 + 1 X 1 i i 0 1 1 X 1 i
那么,像这样取值只为0、1的变量称为虚拟变量或哑变 量,并用符号表示,从而与常用符号区别开。我们把赋值为 0的一类称为基准类。需要注意的是虚拟变量的赋值是人为 的、任意的,根据人们的习惯而定。如前所提到的性别变量, 也可以用1表示女性,用0表示男性。