二元选择模型
- 格式:doc
- 大小:946.00 KB
- 文档页数:10
logit 和probit模型的系数解释-回复Logit和Probit模型是常用的二元选择模型,用于分析二元变量的选择行为。
它们通常用于解释个体在做出选择时的决策,可以帮助我们理解各种影响因素对选择行为的影响。
在这篇文章中,我将逐步回答有关Logit和Probit模型的系数解释的问题,介绍这两个模型的基本原理、模型形式、系数解释和使用注意事项,以及如何解读模型中的系数。
首先,让我们从基本原理开始,了解Logit和Probit模型的背后逻辑。
Logit 和Probit模型都属于广义线性模型(Generalized Linear Models),它们基于一个相似的假设:选择行为是一个概率事件,可以由一组解释变量进行解释。
这些解释变量可以是个体特征(如年龄、性别、教育水平等),也可以是一些特定的因素(如收入水平、市场利率等)。
模型的目的是通过对这些解释变量的分析,预测和解释个体做出选择的概率。
接下来,让我们详细了解Logit和Probit模型的模型形式。
Logit模型使用的是逻辑函数(Logistic Function),而Probit模型使用的是标准正态分布的累积分布函数。
具体来说,Logit模型的形式为:p(y=1 x) = F(xβ) = 1 / (1 + e^(-xβ))其中,p(y=1 x)表示个体在给定解释变量x的情况下选择y=1的概率,F(x β)表示Logistic函数,x是解释变量的值,β是模型的系数。
相比之下,Probit模型的形式稍有不同:p(y=1 x) = Φ(xβ)其中,Φ(xβ)表示标准正态分布的累积分布函数,其他符号的含义与Logit 模型相同。
两个模型的模型形式不同,但它们都具有类似的特点:在x 趋近于正无穷时,概率趋近于1,而在x 趋近于负无穷时,概率趋近于0。
这种形式可以帮助我们理解个体选择行为的变化趋势。
现在让我们转向系数解释的问题。
模型的系数代表着解释变量对选择行为的影响程度。
二元选择模型一 线性概率模型(LPM)如果应变量的取值是二元的,则我们可定义应变量的取值如下:⎩⎨⎧=择第二个方案个被观测的决策主体选如果第择第一个方案个被观测的决策主体选如果第i i Y i 0,, 1 如果我们直接用最小二乘法作应变量对解释变量的回归,这样得到的模型称为线性概率模型。
如用i X 2表示解释变量(为简单记,我们在模型中只引入一个解释变量,如果要用多个解释变量来说明第i 个决策者的选择行为,则只要进行简单推广即可),则线性概率模型为i i i u X Y ++=221ββ (1)其中i u 是相互独立且均值为零的随机变量。
由于应变量i Y 只取两个值,所以从总体上看i Y 的均值即i Y 的数学期望可直接由期望的定义获得:i i i i P P P Y E =-⨯+⨯=)1(01)(其中i P 为第i 个决策者选择第一个方案的概率。
另一方面,由(4.26)式可得i Y 的数学期望为i i X Y E 221)(ββ+=故线性概率模型可表示为i i X P 221ββ+= (2)但如对解释变量的范围没作任何限制,则(2)式右边的值有可能会超出区间[0,1]的范围,从而使该式没有意义。
为了解释这个问题,通常的做法是将线性概率模型写成如下形式:⎪⎩⎪⎨⎧≥+<+<+≤+=1 ,110 ,0 0221221221221i i i i i X X X X P ββββββββ当当当, (3)按最小二乘法,利用观测到的样本值,对1)式进行估计,得i Y 的预测方程ii X Y 221ˆˆˆββ+= (4) 该预测方程即为第i 个决策主体选择第一个方案的概率的估计值。
如果第i 个决策主体的解释变量的值为02X X i =,则该决策主体选择第一个方案的概率的估计值为021ˆˆˆX Y i ββ+=。
而斜率项系数的意义则是:当解释变量增加一个单位时,决策主体选择第一个方案的概率增加2β。
二元选择模型的建立
二元选择模型是一种用来评估两个不同选项的得失情况的模型,其中一个选项的得失会被衡量和评估,以帮助用户做出最佳决定。
建立二元选择模型的过程可分为以下几个步骤:
1. 确定问题:确定比较的问题,是跟踪投资回报,比较两个投资机会,还是决定所采取的目标市场等。
2. 建立模型:将所有与该问题有关的数据分类收集并且建立选择模型,是一个表格或图表,或者一个数学模型等。
3. 加入偏好因素:建立模型的过程中,应考虑偏好的因素,比如风险大小、可承受的损失,或者对未来收益的期望等。
4. 评估得失:用不同的指标评估每个选择的得失,评估模型中各个依据及其对失误机率及后果的影响等。
5. 做出最终决定:最后,根据二元选择模型的评估结果,作出最佳决定。
二元选择模型和二值响应模型
"二元选择模型"(Binary Choice Model)和"二值响应模型"(Binary Response Model)通常在统计学和计量经济学中使用,用于处理对一个二元结果的建模和分析。
尽管这两个术语有时可以互换使用,但它们通常涉及到略微不同的概念。
1.二元选择模型(Binary Choice Model):这个术语通常用于描述一类模型,其中观测值的因变量(响应变量)只有两个可能的取值,通常是0和1。
这个模型用于解释一个二元决策或选择的过程。
例如,考虑一个人是否购买某个产品(购买=1,不购买=0),这种情况下可以使用二元选择模型来建模。
2.常见的二元选择模型包括Logit模型(逻辑回归)和Probit模型(概率模型),它们都是处理二元结果的广泛应用的模型。
3.二值响应模型(Binary Response Model):这个术语更加通用,它指的是对于某个事件或观测结果的响应只有两个可能取值的模型。
这也可以包括那些不仅仅涉及到选择或决策的情境,还包括其他类型的二元结果。
例如,是否违约(违约=1,未违约=0)也可以用二值响应模型来建模。
4.二值响应模型可以包括二元选择模型,但不限于此,因为它可以应用于更广泛的情境,包括一些不涉及明确选择的问题。
总体而言,这两个术语都涉及到处理二元结果的模型,而具体使用哪一个取决于具体的上下文和研究问题。
逻辑回归和概率模型是处理这类问题时常见的方法,它们在许多领域,包括经济学、社会科学和医学等方面都有广泛的应用。
二元选择摸型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。
在实际经济问题中,被解释变量也可能是定性变量。
如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。
当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。
这里主要介绍Tobit (线性概率)模型,Probit (概率单位)模型和Logit 模型。
1.Tobit (线性概率)模型 Tobit 模型的形式如下,y i = α + β x i + u i (1) 其中u i 为随机误差项,x i 为定量解释变量。
y i 为二元选择变量。
此模型由James Tobin 1958年提出,因此得名。
如利息税、机动车的费改税问题等。
设 1 (若是第一种选择) y i =0 (若是第二种选择)-0.20.00.20.40.60.81.01.2330340350360370380XY对y i 取期望,E(y i ) = α + β x i (2) 下面研究y i 的分布。
因为y i 只能取两个值,0和1,所以y i 服从两点分布。
把y i 的分布记为, P ( y i = 1) = p i P ( y i = 0) = 1 - p i 则E(y i ) = 1 (p i ) + 0 (1 - p i ) = p i (3) 由(2)和(3)式有p i = α + β x i (y i 的样本值是0或1,而预测值是概率。
) (4)以p i = - 0.2 + 0.05 x i 为例,说明x i 每增加一个单位,则采用第一种选择的概率增加0.05。
现在分析Tobit 模型误差的分布。
由Tobit 模型(1)有,u i = y i - α - β x i =⎩⎨⎧=--=--0,1,1i i i i y x y x βαβαE(u i ) = (1- α - β x i ) p i + (- α - β x i ) (1 - p i ) = p i - α - β x i 由(4)式,有E(u i ) = p i - α - β x i = 0因为y i 只能取0, 1两个值,所以,E(u i 2) = (1- α - β x i )2 p i + (- α - β x i )2 (1 - p i )= (1- α - β x i )2 (α + β x i ) + (α +β x i )2 (1 - α - β x i ), (依据(4)式) = (1- α - β x i ) (α + β x i ) = p i (1 - p i ) , (依据(4)式) = E(y i ) [1- E(y i ) ]上两式说明,误差项的期望为零,方差具有异方差。
当p i 接近0或1时,u i 具有较小的方差,当p i 接近1/2时,u i 具有较大的方差。
所以Tobit 模型(1)回归系数的OLS 估计量具有无偏性和一致性,但不具有有效性。
假设用模型(4)进行预测,当预测值落在 [0,1] 区间之内(即x i 取值在[4, 24] 之内)时,则没有什么问题;但当预测值落在[0,1] 区间之外时,则会暴露出该模型的严重缺点。
因为概率的取值范围是 [0,1],所以此时必须强令预测值(概率值)相应等于0或1(见图1)。
线性概率模型常写成如下形式,图11, α + β x i ≥ 1p i = α + β x i , 0 < α + β x i < 1 (5) 0, α + β x i ≤ 0然而这样做是有问题的。
假设预测某个事件发生的概率等于1,但是实际中该事件可能根本不会发生。
反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。
虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。
由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量x i 所对应的所有预测值(概率值)都落在(0,1)之间。
(2)同时对于所有的x i ,当x i 增加时,希望y i 也单调增加或单调减少。
显然累积概率分布函数F (z i ) 能满足这样的要求。
采用累积正态概率分布函数的模型称作Probit 模型。
用正态分布的累积概率作为Probit 模型的预测概率。
另外logistic 函数也能满足这样的要求。
采用logistic 函数的模型称作logit 模型。
-4-22400.20.40.60.810510********0.20.40.60.81累积正态概率分布曲线 logistic 曲线2.Probit (概率单位)模型,仍假定 y i = α + β x i , 而 p i = F ( y i ) =⎰∞--iy t dt e2221π(6)累积概率分布函数曲线在p i = 0.5附近的斜率最大。
对应y i 在实轴上的值,相应概率值永远大于0、小于1。
显然Probit 模型比Tobit 模型更合理。
Probit 模型需要假定y i 服从正态分布。
3.logit 模型该模型是McFadden 于1973年首次提出。
其采用的是logistic 概率分布函数。
其形式是 p i = F (y i ) = F (α + β x i ) =iy e-+11=)(11i x eβα+-+ (7)对于给定的x i ,p i 表示相应个体做出某种选择的概率。
Probit 曲线和logit 曲线很相似。
两条曲线都是在p i = 0.5处有拐点,但logit 曲线在两个尾部要比Probit 曲线厚。
利用(6)和(7)式得到的概率值见表1。
表1 Probit 模型和logit 模型概率值y i正态分布函数-y t 2逻辑概率分布p i =1-2.0 0.0228 0.1192 -1.5 0.0668 0.1824 -1.0 0.1587 0.2689 -0.5 0.3085 0.3775 0.0 0.5000 0.5000 0.5 0.6915 0.6225 1.0 0.8413 0.7311 1.5 0.9332 0.8176 2.0 0.9772 0.8808 3.00.9987 0.9526图2 Probit 曲线、logit 曲线比较示意图logit 曲线计算上也比较方便,所以Logit 模型比Probit 模型更常用。
对上式作如下变换,p i (1+ i y e -) = 1 (8) 对上式除以p i ,并减1得e -y i = i p 1-1 = i i p p -1取倒数后,再取对数,y i = log (i i p p-1)所以 log (iip p -1) = y i = α + β x i (9) 由上式知回归方程的因变量是对数的某个具体选择的机会比。
logit 模型的一个重要优点是把在 [0,1] 区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。
logit 累积概率分布函数的斜率在p i = 0.5时最大,在累积分布两个尾端的斜率逐渐减小。
说明相对于p i = 0.5附近的解释变量x i 的变化对概率的变化影响较大,而相对于p i 接近0和1附近的x i 值的变化对概率的变化影响较小。
对于Logit 模型使用极大似然法估计参数是一个很好的选择。
首先分析含有两个参数(α 和β)的随机试验。
假设被估计的模型如下p i =)(11i x e βα+-+=iy e -+11(10)在样本中p i 是观测不到的。
相对于x i 的值,只能得到因变量y i 取值为0或1的信息。
极大似然估计的出发点就是寻找样本观测值最有可能发生条件下的α 和 β 的估计值。
从样本看,如果第一种选择发生了n 次,第二种选择发生了N -n 次。
设采取第一种选择的概率是p i 。
采取第二种选择的概率是(1- p i )。
重新将样本数据排列,使前n 个观测值为第一种选择,后N -n 个观测值为第二种选择(观测值是0,1的,但相应估计的概率却各不相同)。
例1 (file:case5)南开大学国际经济研究所1999级研究生考试分数及录取情况见数据表(N = 95)。
定义变量SCORE :考生考试分数;Y :考生录取为1,未录取为0;虚拟变量D1:应届生为1,非应届生为0。
-0.20.00.20.40.60.81.01.2100200300400SC OR EY-0.20.00.20.40.60.81.01.2-0.20.00.20.40.60.81.01.2D 1Y图1 样本观测值(file:logit1)得Logit 模型估计结果如下(EViews 命令:Quick, estimate equation 分别选Probit 或Logit ):注:Akaike information criterion = -2T L log + 2TkSchwarz criterion = -2TL log + k T T Ln )(Hannan-Quinn criterion = -2TL log + 2 k T LnT Ln )(Average Log likelihood function = TLlog其中k 为被估参数个数,T 为样本容量。
McFadden R-squared = 1-)ˆ(log )~(log ββL L 因为D1的系数没有显著性。
说明“应届生”和“非应届生”不是决定是否录取的重要因素。
剔除D1。
得Logit 模型估计结果如下p i = F (y i ) =)6794.07362.243(11i x e +--+ 拐点坐标 (358.7, 0.5)注意:表达式中指数的写法。
-0.20.00.20.40.60.81.01.2100200300400SC OR EYFLOGI图2 Logit 模型预测值,拐点坐标 (358.7, 0.5)在估计Probit 模型过程中,D1的系数也没有显著性。
剔除D1,Probit 模型最终估计结果是p i = F (y i ) = F (-144.456 + 0.4029 x i ) 拐点坐标 (358.5, 0.5)-0.20.00.20.40.60.81.01.2100200300400SC OR EY FPR OB图3 Probit 模型预测值,拐点坐标 (358.5, 0.5)两种估计模型的若干预测结果如下表,Probit模型Logit模型score Y p i Y p i350 -3.44 0.0003 -5.95 0.0026355 -1.43 0.0764 -2.55 0.0738359 0.00 0.5000 0.00 0.5000360 0.59 0.7224 0.85 0.7032365 2.60 0.9953 4.24 0.9858370 4.62 0.9999 7.64 0.9995表2 数据表obs Y SCORE D1 obs Y SCORE D1 obs Y SCORE D11 1 401 1 34 0 332 1 67 0 275 02 1 401 0 35 0 332 1 68 0 273 03 1 392 1 36 0 332 1 69 0 273 14 1 387 0 37 0 331 1 70 0 272 15 1 384 1 38 0 330 1 71 0 267 06 1 379 0 39 0 328 1 72 0 266 17 1 378 0 40 0 328 1 73 0 263 18 1 378 0 41 0 328 1 74 0 261 19 1 376 1 42 0 321 1 75 0 260 010 1 371 0 43 0 321 1 76 0 256 011 1 362 0 44 0 318 1 77 0 252 012 1 362 1 45 0 318 0 78 0 252 113 1 361 1 46 0 316 1 79 0 245 114 0 359 1 47 0 308 0 80 0 243 115 0 358 1 48 0 308 1 81 0 242 016 1 356 1 49 0 304 0 82 0 241 017 0 356 1 50 0 303 1 83 0 239 118 0 355 1 51 0 303 1 84 0 235 019 0 354 1 52 0 299 1 85 0 232 020 0 354 0 53 0 297 1 86 0 228 121 0 353 1 54 0 294 0 87 0 219 122 0 350 0 55 0 293 1 88 0 219 123 0 349 0 56 0 293 1 89 0 214 124 0 349 0 57 0 292 0 90 0 210 125 0 348 1 58 0 291 1 91 0 204 126 0 347 1 59 0 291 1 92 0 198 027 0 347 1 60 0 287 1 93 0 189 128 0 344 1 61 0 286 1 94 0 188 1例3:农户劳动力的非农业就业模型(file:logitzhou)。