决策理论与方法第三章效用函数
- 格式:ppt
- 大小:2.34 MB
- 文档页数:27
§4 效用函数方法一、效用的概念有时有些问题, 用前节方法不一定很合理. 例6 问题1 有两方案A 1, B 1,A 1: 稳获100元;B 1 : 41%获250元, 59%获0元. 问题2A 2: 稳获10000元;B 2 : 掷硬币,直到正面,获2N 元. 直观上,一般在问题1中, 选A 1, 在问题2中, 选A 2. 理论上,问题1中, 选B 1,因为11()0.412500.590102.5100()E B E A =⨯+⨯=>=在问题2中, 选B 2, 因为222211()22...10000()22E B E A =⨯+⨯+=∞>= 所以, 期望最大原则, 此处不尽合理.例7 设用20元买彩票,中奖率0.5, 奖金80,E=20元, 甲经济暂时较拮据, 几天没吃饱, 视20元效用大; 乙经济较宽松, 并不认为20元效用很大, 很可能买. 这就是货币的效用值, 给人提示为:(1) 决策者应结合实际进行决策;(2) 可以根据效用值来进行决策.二、效用曲线的确定及类别1. 货币效用函数 最初描述对货币量的感受度效用值U =log a (货币量M ).可推广运用到决策中.2. 确定效用函数基本方法因为这是一种主观量,所以,一般设最喜欢决策(或某一货币量M), 效用值为1, 最不喜欢的决策(或某一货币量m), 效用值为0, 其它的决策(或货币量k), 效用值为0~1中的数. U效用M 货币量O应用时, 将各因素折合为效用值, 计算各方案的综合效用值, 然后选择效用值最大的方案.3. 效用曲线的具体确定(1) 直接提问法向决策者提问:你企业获利100,200,…万元, 你的满意度各是多少? 效用曲线.(不很准,不常用)(2) 对比提问法A 1: 可无风险得到一笔金额x ;A 2: 以概率P 得到一笔金额y ,或以1P -得到z 且z x y >>,(或y x z >>)各效用表示(),(),()U z U x U y .设两种方案等价, 则有()(1)()()PU y P U z U x +-=.上式有4个变量, 知道其中3, 就可确定第4个量. 通过提问可确定, 有4种:(1) 固定,,y x z , 问P 取何值时, 1A 与2A 等价,(2) 固定,,P y z , 问x 取何值时, 1A 与2A 等价,(3) 固定,,P x y , 问z 取何值时, 1A 与2A 等价,(4) 固定,,P x z , 问y 取何值时, 1A 与2A 等价;例8 设0.5P =,610z =,5510y =-⨯, 且()1,()0U z U y ==, 如下图所示.(i) 首问当x 何值时, 有 0.5()0.5()()U y U z U x +=若答为250000x =-⇒ 则()0.5U x =(ii) 二问当x '何值时, 有 0.5()0.5()()U x U z U x '+=若答75000x '=, 则()0.75U x '= (iii) 三问当x ''何值时,有0.5()0.5()()U y U x U x ''+= 若答420000x ''=-, 则()0.25U x ''=, 从而可绘出效用曲线. 属于保守型. 8y510z 2-10.5()U x 货币x x 'x ''4. 效用曲线的大致分类 *5. 效用曲线的应用举例 例 设某石油企业的效用函数如右图. 欲试验钻井采油, 情况如下树.试根据决策者的 效用曲线进行决策解由效用曲线, 查得纯收入与效用值的对应值, 标O x 1保守型效用货币风险型中间型混合型20000-10000-100002000030000x O 1U 0.613000|-27000|0.98-3000-0.270.68在决策树边(纯收入=收入—支出).300010000[1](1)[2](2)270000.980.60.85--∆∆∆效用值纯收入试验好钻井出油0.15不出油130000∆-不钻井0.4不好[3]10000-∆钻井(3)0.10出油0.90不出油不试验10000[4](4)0.55-∆钻井出油不钻井0.45不出油270000.98∆130000∆-不钻井30000.6∆-30000.6∆-300001∆100000.27∆-00.68∆0.0980.833期望效用值0.67250.8330.60.68在事件状态点(2),(3),(4)效用期望值分别为 2max (0.833,0.60)0.833=3max (0.098,0.60)0.60=4max (0.672,0.68)0.68=在事件状态点(1)效用期望值为0.60.8330.40.60.7398⨯+⨯=1max (0.7398,0.68)0.7398=⇒试验最后决策: (1)试验; (2)若好, 则钻井;不好,则不钻井.*6. 其它效用曲线函数 线性112()()U x c a x c =+- 指数23()11()(1)a x c U x c a e -=+- 双指数3322()()11()(2)a x c a x c U x c a e e --=+-- 指数+线性22()1133()(1)()a x c U x c a e a x c -=+-+- 幂函数41213()[()]aU x a a c x a =+- 对数函数1132()log()U x c a c x c =+-。
第一章1.1 如计划用六个鸡蛋煎蛋饼,已向碗里打了五个好蛋,准备打第六鸡蛋时,有三种不同的方案可供选择,即方案1a :打入 方案2a :单打 方案3a :丢弃由于第六个蛋事前不知是好是坏,每种方案均面对两种不确定的结果,即状态1θ:第六个蛋是好蛋 状态2θ:第六个蛋是坏蛋 如用)2,1;3,2,1(==j i o ij 分别表示方案i a 在状态j θ下的决策结果好蛋(1θ)坏蛋(2θ)打入(1a ) 11o 12o 单打(2a ) 21o 22o 丢弃(3a ) 31o32o收益函数1. 设决策问题的收益值为q ,状态变量为θ,决策变量(方案或策略)为a 。
当决策变量a 和状态变量θ确定后,收益值q 随之确定。
q 是a 和θ的函数,称为收益函数,记作),(θa Q q =,如决策变量和状态变量均为离散的,即),..,2,1(m i a a i ==,),..,2,1(n j j ==θθ,则收益函数可表示为),..,2,1;,..,2,1(),,(n j m i a Q q j i ij ===θ这可以用矩阵表示,称为收益矩阵,既⎪⎪⎪⎪⎪⎭⎫⎝⎛==⨯mn m m n n nm ij q q q q q q q q q q Q .....................)(212222111211 2.损失函数损失值(遗憾值),表示没有采取最满意方案或策略时造成的损失,当决策变量a 和状态变量θ确定后,损失值r 是a 和θ的函数,称为损失函数,记着),(θa R r =,如决策变量和状态变量均为离散的,即),..,2,1(m i a a i ==,),..,2,1(n j j ==θθ,则损失函数可表示为),(j i ij a R r θ= ),..,2,1;,..,2,1(n j m i ==,损失函数也可表示为损失矩阵。
损失值可以通过收益值计算出来,公式为mk ijkj ij q q r ≤≤-=1max 。