假定3>2,其几何意义:
问题:
虚拟变量为何只选“0”, ‘1“,选择0,1,2 等 可以吗
同一种属性,两个变量能够表示几种状态? 思考,如果在模型中引入季节效应?月份效应?
(3)多个虚拟变量的引入——多种因素
例:研究学历(本科及以上,本科以下),性别(男、女)对员工工资的 影响。
在例1基础上,再引入代表学历的虚拟变量D2:
离散选择模型(离散被解释变量)
D (2)多个虚拟变量的设定和引入 0 女职工本科以上学历的平均薪金:
本科以下
当回归模型有截距项时,只能引入 m-1 个虚拟变量
注意:加法方式引入虚拟变量,考察了截距的不同。
交互作用的引入方法:在模型中引入相关变量的乘积。
反映性别的虚拟变量可取为: 女职工本科以下学历的平均薪金:
几何意义:
•两个函数有相同的斜率,说明男女职工平均薪金对工龄的变 化率是一样的。
•如果2>0,表明两个函数截距不相同,且男职工平均薪金比 女职工高,两者平均薪金水平相差2。 •如果2<0,表明两个函数截距不相同,且男职工平均薪金比女 职工低,两者平均薪金水平相差2。 •如果2=0,表明两个函数截距相同,即男职工,女职工的平
均薪金没有显著差异。
可以通过传统的回归检验,对2的统计显著性进行 检验,以判断企业男女职工的平均薪金水平是否有 显著差异。
2
0
(2)多个虚拟变量的设定和引入
——一种因素多种状态(水平):
例:研究收入和教育水平(分为高,中,低三类)对个人保健支出的影响。
教育水平考虑三个层次:
低学历:高中以下,
中等学历:高中,及大中专 高学历:大学及其以上。
2、基本概念
定量因素——可直接测度,数值性的因素 定性因素——属性因素,表征某种属性存在