数学建模专题汇总-离散模型
- 格式:doc
- 大小:1.53 MB
- 文档页数:84
离散模型§ 1 离散回归模型一、离散变量如果我们用0,1,2,3,4,⋯说明企业每年的专利申请数,申请数是一个离散的变量,但是它是间隔尺度变量,该变量类型不在本章的讨论的被解释变量中。
但离散变量0和1可以用来说明企业每年是否申请专利的事项,类似表示状态的变量才在本章的讨论中。
在专利申请数的问题中,离散变量0,1,2,3 和4 等数字具有具体的经济含义,不能随意更改;而在是否申请专利的两个选择对象的选择问题中,数字0和1只是用于区别两种不同的选择,是表示一种状态。
本专题讨论有序尺度变量和名义尺度变量的被解释变量。
、离散因变量在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1 表示,而将家庭不购买住房的决策用数字0 表示。
1 yesx0 no如果x 作为说明某种具体经济问题的自变量,则应用以前介绍虚拟变量知识就足够了。
如果现在考虑某个家庭在一定的条件下是否购买住房问题时,则表示状态的虚拟变量就不再是自变量,而是作为一个被说明对象的因变量出现在经济模型中。
因此,需要对以前讨论虚拟变量的分析方法进行扩展,以便使其能够适应分析类似家庭是否购房的问题。
因为在家庭是否购房问题中,虚拟因变量的具体取值仅是为了区别不同的状态,所以将通过虚拟因变量讨论备择对象选择的回归模型称为离散选择模型。
三、线性概率模型现在约定备择对象的0 和1 两项选择模型中,下标i 表示各不同的经济主体,取值0或l的因变量 y i表示经济主体的具体选择结果,而影响经济主体进行选择的自变量 x i 。
如果选择响应YES 的概率为 p(y i 1/ x i ) ,则经济主体选择响应NO 的概率为 1 p(y i 1/ x i),则E(y i /x i) 1 p(y i 1/x i) 0 p(y i 0/x i)= p(y i 1/x i)。
根据经典线性回归,我们知道其总体回归方程是条件期望建立的,这使我们想象可以构造线性概率模型p(y i 1/ x i) E(y i / x i) x iβ0 1 x i1 L k x ik u i描述两个响应水平的线性概率回归模型可推知,根据统计数据得到的回归结果并不一定能够保证回归模型的因变量拟合值界于[0,1]。
当涉及离散模型时,下面是一个例题及其解析,涉及图论中的最短路径问题:例题:假设有一个城市网络,由以下的道路和距离组成:A城市与B城市之间的距离为5B城市与C城市之间的距离为3C城市与D城市之间的距离为4A城市与D城市之间的距离为8现在要找到A城市到D城市的最短路径。
使用Dijkstra算法来计算。
解析:Dijkstra算法是一种常用的图论算法,用于解决最短路径问题。
下面是使用Dijkstra算法解决该例题的步骤:创建一个集合S来存储已经找到最短路径的城市,初始时S为空。
创建一个距离列表dist[]来存储从A城市到其他城市的距离,初始时将dist[A]设置为0,其他城市的距离设置为无穷大。
选择dist[]中距离最小的城市,将其加入集合S,并更新与该城市相邻的城市的距离。
在这个例子中,初始时A城市的距离最小。
更新与A城市相邻的城市的距离。
由于A城市与B城市的距离为5,将dist[B]更新为5。
继续选择dist[]中距离最小的城市,将其加入集合S,并更新与该城市相邻的城市的距离。
在这个例子中,B城市的距离最小。
更新与B城市相邻的城市的距离。
由于B城市与C城市的距离为3,将dist[C]更新为8(5+3)。
继续选择dist[]中距离最小的城市,将其加入集合S,并更新与该城市相邻的城市的距离。
在这个例子中,C城市的距离最小。
更新与C城市相邻的城市的距离。
由于C城市与D城市的距离为4,将dist[D]更新为12(8+4)。
最后,A城市到D城市的最短路径为A->B->C->D,总距离为12。
通过Dijkstra算法,我们找到了A城市到D城市的最短路径,并计算出了总距离为12。
这个算法通过不断更新距离列表dist[]来逐步找到最短路径。
在实际应用中,Dijkstra算法可以用于解决各种最短路径问题,例如路由优化、地图导航等。
实验09 离散模型(2学时)(第8章离散模型)1. 层次分析模型1.1(验证,编程)正互反阵最大特征根和特征向量的实用算法p263~264已知正互反阵261????1/21A?4????1/461/1??注:[263]定理2 n阶正互反阵A的最大特征根≥n。
★(1) 用MATLAB函数求A的最大特征根和特征向量。
调用及运行结果(见[264]):1 3.0092k =1>> w=V(:,k)/sum(V(:,k))w =0.58760.32340.0890[263])(2) 幂法(见n正互反矩阵,算法步骤如下:A为n×(0)w 1);a. 任取n 维非负归一化初始列向量(分量之和为)k?1)((k2,0,1,?Aww,k?;计算b.1)?(k w1)k?(?w1)k?(w归一化,即令c. ;n?1)?(k w i1i?)(1)k(k?1)k?(?)n|?|w,(i?w?1,2,w即,当d. 对于预先给定的精度ε时,iib;为所求的特征向量;否则返回到步骤1)?(kn w1??i?。
e. 计算最大特征根)(k wn1i?i 注:)k(k?1)(((k)k)???wAw??ww?1)(k? w?i n,i?1,2,??)k(w i文件如下:函数式m [lambda w]=p263MI(A,d)function——求正互反阵最大特征根和特征向量%幂法% A 正互反方阵% d 精度 2 % lambda 最大特征根归一化特征列向量% w0.000001,则d取if(nargin==1) %若只输入一个变量(即A)d=1e-6;end的阶数取方阵A n=length(A); %任取归一化初始列向量w0=w0/sum(w0);%w0=rand(n,1);1while ww=A*w0;%归一化w=ww/sum(ww);all(abs(w-w0)<d) if; breakendw0=w;endlambda=sum(ww./w0)/n;的最大特征根和特征向量。
离散模型§ 1 离散回归模型一、离散变量如果我们用0,1,2,3,4,…说明企业每年的专利申请数,申请数是一个离散的变量,但是它是间隔尺度变量,该变量类型不在本章的讨论的被解释变量中。
但离散变量0和1可以用来说明企业每年是否申请专利的事项,类似表示状态的变量才在本章的讨论中。
在专利申请数的问题中,离散变量0,1,2,3和4等数字具有具体的经济含义,不能随意更改;而在是否申请专利的两个选择对象的选择问题中,数字0和1只是用于区别两种不同的选择,是表示一种状态。
本专题讨论有序尺度变量和名义尺度变量的被解释变量。
二、离散因变量在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1 表示,而将家庭不购买住房的决策用数字0表示。
10yes x no⎧=⎨⎩ 如果x 作为说明某种具体经济问题的自变量,则应用以前介绍虚拟变量知识就足够了。
如果现在考虑某个家庭在一定的条件下是否购买住房问题时,则表示状态的虚拟变量就不再是自变量,而是作为一个被说明对象的因变量出现在经济模型中。
因此,需要对以前讨论虚拟变量的分析方法进行扩展,以便使其能够适应分析类似家庭是否购房的问题。
因为在家庭是否购房问题中,虚拟因变量的具体取值仅是为了区别不同的状态,所以将通过虚拟因变量讨论备择对象选择的回归模型称为离散选择模型。
三、线性概率模型现在约定备择对象的0和1两项选择模型中,下标i 表示各不同的经济主体,取值0或l 的因变量i y 表示经济主体的具体选择结果,而影响经济主体进行选择的自变量i x 。
如果选择响应YES的概率为(1/)i p y =i x ,则经济主体选择响应NO的概率为1(1/)i i p y -=x ,则(/)1(1/)0(0/)i i i i i i E y p y p y =⨯=+⨯=x x x =(1/)i i p y x =。
根据经典线性回归,我们知道其总体回归方程是条件期望建立的,这使我们想象可以构造线性概率模型(1/)(/)i i i i i p y x E y x '===x β011i k ik i x x u βββ=++++描述两个响应水平的线性概率回归模型可推知,根据统计数据得到的回归结果并不一定能够保证回归模型的因变量拟合值界于[0,1]。
如果通过回归模型式得到的因变量拟合值完全偏离0或l 两个数值,则描述两项选择的回归模型的实际用途就受到很大的限制。
为避免出现回归模型的因变量预测值偏离0或1的情形,需要限制因变量的取值范围并对回归模型式进行必要的修正。
由于要对其进行修正,那么其模型就会改变,模型改变会导致似然函数改变,这就是我们下面要讨论的。
现在我们讨论的模型与判别分析的目的是一样的,但有区别。
§ 2 二元离散选择模型一、效用函数为了使得二元选择问题的有进一步研究可能,首先建立一个效用函数。
在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1 表示,而将家庭不购买住房的决策用数字0表示。
用1i U 表示第i 个人选择买房的效用,0i U 表示第i 个人选择不买房的效用。
其效用均为随机变量,于是有11110000(1)(2)i i i i U u U u αα'⎧=++⎪⎨'=++⎪⎩i i X βX β (1)将(1)-(2),得()10101012()()i i i i U U u u αα'-=-+-+-i X ββ记:*10i i i y U U =-*12ααα=-*10=-βββ *10i i i u u u =-则有 ****i i Y u α'=++i X β,格林称该模型为潜回归。
这是二元选择模型的切入点。
称*i Y 为过渡变量(潜在的),这个变量是不可观测的。
当效用差*i Y 大于零,则应该选“1”,即购房;当效用差*i Y 小于零,则应该选“0”,即不购房。
故()****(1)(0)()1i i i p Y p Y P u F αα**''==>=>-=--i i X βX β-- ()****(0)(0)()i i i p Y p Y P u F αα**''==≤=≤-=-i i X βX β--此处已经通过*i Y ,将自变量与事件发生的概率联系起来了。
为概率提供了一个潜在的结构模型。
现在的问题是()F ⋅服从何种分布?()F ⋅既然是分布函数,则必须满足分布函数的条件.二、两类常用的模型根据以上的分析,我们的问题已经转化为作为()F ⋅有什么形状,即密度函数f 具有什么样的函数形式。
采用累积标准正态概率分布函数的模型称作Probit 模型,或概率单位模型,用正态分布的累积概率作为Probit 模型的预测概率。
另外logistic函数也能满足这样的要求,采用logistic 函数的模型称作logit 模型,或对数单位模型。
注:分布在此时是以y 轴为对称。
(一)Logit 模型 因为()******(1)(0)()()i i i i p Y p Y P u P u F ααα***'''==>=>-=<+=+i i i X βX βX β-如果我们取F (.)为逻辑函数(LOGIT ),即1()()11xx xe x F x e e-Λ===++(满足分布函数的条件),有 ()*********1(1)()11i ii i iep Y F eeααααα'+*''--+''==+=Λ+==++X βi X βX βX βX β为了更简化模型 ****i iu Y +'+=βX i α,我们令**α⎛⎫= ⎪⎝⎭ββ,()121i i i ik x x x '=x ,*i i u u =则 *i i i Y u '=+x β有 ()*F α*'+i X β=exp()()1exp()i i i ''Λ='+x βx βx β(1/)i i p y x ==exp()()1exp()i i i ''Λ='+x βx βx β exp()(1/)1exp()i i i i p y x '=='+x βx β[]1exp()(1/)exp()i i i i p y x ''+==x βx β(1/)(1/)exp()exp()i i i i i i p y x p y x ''=+==x βx β (1/)exp()(1/)exp()i i i i i i p y x p y x ''==-=x βx β(1/)exp()(1/)exp()i i i i i i p y x p y x ''==-=x βx β(1/)exp()1(1/)i i i i i p y x p y x ='=-=x β(非线性)(1/)ln 1(1/)i i i i i p y x p y x ='=-=x β (广义非线性)(1)ln1(1)i i i i p y u p y ='=+-=x β (2)称(2)式为逻辑斯蒂回归模型。
(二)PROBIT 模型更为一般的情形,如果选择F (.)是标准正态分布,则产生PROBIT 回归模型。
(1/)i i i p p y x ===21())2i i t dt '-∞'Φ=-⎰x βx β1()i i p -'Φ=x β (3)称(3)式为PROBIT 回归模型。
注 Probit 曲线和logit 曲线很相似。
标准正态概率分布曲线logistic 分布曲线使用哪个分布是一个很自然的问题,logit 曲线除了在尾部比正态分布厚得多以外,两条曲线都是在p i = 处有拐点,logit 曲线更接近一个自由度为7的t 分布(格林书认为自由度是4的t 分布)。
所以,对于'x β的中间值(比如到之间)来说,两种分布会给出类似的概率,但是当'x β非常小时,逻辑斯蒂回归模型比PROBIT 回归模型倾向于给出0y =(*0y ≤)较大的概率值,而在'x β非常大时,倾向于给出0y =(*0y ≤)较小的概率值。
利用函数式可以得到的概率值见表一。
表一 Probit 模型和logit 模型概率值y i正态分布函数 p i =⎰∞--iy t dt e2221π逻辑概率分布 p i =iy e-+11特点尾薄尾厚§ 3 二元离散选择模型最大似然估计下面我们来构造二元离散选择模型的似然函数。
这是二元离散选择模型最关键的问题。
因为 *(1)(0)()i i i i p Y p Y P u '==>=>-x β *(0)(0)()i i i i p Y p Y P u '==≤=≤x β- 我们假设有以Y 轴为对称的概率密度函数f(.),则*(1)(0)(0)i i i i p Y p Y p u '==>=+>x β()i i P u '=>x β-1()i i P u '=-≤x β-1()()i i F F ''=-=x βx β-*(0)(0)()()1()i i i i i i p Y p Y P u F F '''==≤=≤==-x βx βx β--于是模型的似然函数为[]1201(,,,)1()()i i n i i Y Y P Y Y Y F F ==''=-∏∏x βx β[][]111()()iinY Y i i i L F F -=''=-∏x βx β两边同时取自然对数,则[][]{}1ln ln ()(1)ln 1()ni i i i i L Y F Y F =''=+--∑x βx β对数似然函数最大化的条件是0X βi =⎥⎦⎤⎢⎣⎡---+=∂∂∑=ni i i i ii i F f Y F f Y L1)1()1(ln (4) 一、对数单位模型的似然函数将()()1e F e ''''=Λ=+X βX βX βX β和()()2()()[1()]1d e d e '''Λ''==Λ-Λ'+X βX βX βX βX βX β代入(4),则似然方程为[]1ln ()0ni i i i L y =∂'=-Λ=∂∑X βX β。