贝叶斯决策方法课后习题
- 格式:docx
- 大小:62.01 KB
- 文档页数:4
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ==22628()0.20.80.2936P A C θ==从而有1111122()()()0.4582()()()()P A A P A P A θπθπθθπθθπθ==+2221122()()()0.5418()()()()P A A P A P A θπθπθθπθθπθ==+1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()X P λ∴3(3)3!e P X λλλ-==1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+==从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有 351()()()504(1),01()()P A A P A d θπθπθθθθθπθθ==-<<⎰(2)361()()()47040(1),01()()P A A P A d θπθπθθθθθπθθ==-<<⎰1.5 解:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<<1.6 证明:设随机变量()X P λ ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则 (),0!x e P x x λλλλ-=> 1(),0()e ααβλβπλλλα--=>Γ因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝∙∝= 所以 (,1)x G a x λαβ++ 1.7 解:(1)由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=∙=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (2) 由题意可知 12202()36xm x d x θθθ=∙=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝∙∝--=- 由上可知 (5,297)A Be θ1.9 解:设X 为某集团中人的高度,则2(,5)X N θ∴25(,)10X N θ∴2(176.53)5()p x θθ--= 由题意可知2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝∙222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝∙∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ 其中为已知 又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝∙222222251()()1252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x x N σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝∙00111n n n ααααθθθθθ++++∝∙∝ 因此 θ的后验分布仍是Pareto 分布。
一、单选题1. 根据某机构对失踪飞机的调查得知:失踪的飞机中有70%的后来被找到,在被找到的飞机中,有60%安装有紧急定位传送器,而未被找到的失踪飞机中,有90%未安装紧急定位传送器,紧急定位传送器是在飞机失事坠毁时发送信号,让搜救人员可以定位的装置.现有一架安装有紧急定位传送器的飞机失踪,则它被找到的概率为()A.B.C.D.2. 某一地区的患有癌症的人占0.004,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.02.现抽查了一个人,试验反应是阳性,则此人是癌症患者的概率约为()A.0.16 B.0.32 C.0.42 D.0.843. 随机化回答技术是为调查敏感性问题特别设计的问卷调查技术,其基本特征是被调查者对所调查的问题采取随机回答的方式,避免在没有任何保护的情况下直接回答敏感性问题,从而既对被调查者的隐私和秘密加以保护,又能获得所需要的真实信息.某公司为提升员工的工作效率,规范管理,决定出台新的员工考勤管理方案,方案起草后,为了解员工对新方案是否满意,决定采取如下随机化回答技术进行问卷调查:所有员工每人抛掷一枚质地均匀的硬币两次,约定“若结果为一次正面朝上一次反面朝上,则按①回答问卷,否则按②回答问卷”.①:若第一次抛掷硬币出现正面朝上,则在问卷中画“√”,否则画“×”;②:若你对新考勤管理方案满意,则在问卷中画“√”,否则画“×”.当所有员工完成问卷调查后,统计画√,画×的比例为3∶2,用频率估计概率,则该公司员工对考勤管理方案的满意率为()A.50% B.60% C.70% D.80%4. 托马斯·贝叶斯(ThomasBayes)在研究“逆向概率”的问题中得到了一个公式:,这个公式被称为贝叶斯公式(贝叶斯定理),其中称为的全概率.假设甲袋中有3个白球和2个红球,乙袋中有2个白球和2个红球.现从甲袋中任取2个球放入乙袋,再从乙袋中任取2个球.已知从乙袋中取出的是2个白球,则从甲袋中取出的也是2个白球的概率为()A.B.C.D.5. 某货车为某书店运送书籍,共箱,其中箱语文书、箱数学书、箱英语书.到达目的地时发现丢失一箱,但不知丢失哪一箱.现从剩下的箱书中随机打开箱,结果是箱语文书、箱数学书,则丢失的一箱是英语书的概率为()A.B.C.D.6. 一堆苹果中大果与小果的比例为,现用一台水果分选机进行筛选.已知这台分选机把大果筛选为小果的概率为,把小果筛选为大果的概率为.经过一轮筛选后,现在从这台分选机筛选出来的“大果”里面随机抽取一个,则这个“大果”是真的大果的概率为()A.B.C.D.二、多选题7. 某校开展“一带一路”知识竞赛,甲组有7名选手,其中5名男生,2名女生;乙组有7名选手,其中4名男生,3名女生.现从甲组随机抽取1人加入乙组,再从乙组随机抽取1人,表示事件“从甲组抽取的是男生”,表示事件“从甲组抽取的是女生”,B表示事件“从乙组抽取1名女生”,则下列结论正确的是()A.,是对立事件B.C.D.8. 若某市场销售的某种产品中,甲品牌、乙品牌的市场占有比例为,优质品率分别为、,在该市场中任意买一件这种产品,则下列结论中正确的有().A.买到的是甲品牌产品的概率为0.2B.若已知买到的产品是乙品牌,则这件产品是优质品的概率是0.9C.买到的是优质品的概率为0.8D.若已知买到的是优质品,则这件产品是甲品牌的概率是0.5三、填空题9. 一学生接连参加同一课程的两次考试,第一次及格的概率为p,若第一次及格则第二次及格的概率也为p;若第一次不及格则第二次及格的概率为.若已知他第二次已经及格,则他第一次及格的概率为 __.10. 学校给每位教师随机发了一箱苹果,李老师将其分为两份,第1份占总数的40%,次品率为5%,第2份占总数的60%,次品率为4%.若李老师分份之前随机拿了一个发现是次品后放回,则该苹果被分到第1份中的概率为______.11. 流行性感冒,简称流感,是流感病毒引起的一种急性呼吸道疾病.已知三个地区分别有的人患了流感,且这三个地区的人口数之比是,现从这三个地区中任意选取1人,若选取的这人患了流感,则这人来自B地区的概率是_______.12. 某同学连续两次投篮,已知第一次投中的概率为0.8,在第一次投中的情况下,第二次也投中的概率为0.7,且第一次投不中,第二次投中的概率为0.5,则在第二次投中的条件下,第一次也投中的概率为______.四、解答题13. 某电子设备厂所用的元件是由三家元件制造厂提供的,根据以往的记录得到以下数据:元件制造厂次品率提供元件的份额1 0.01 0.12 0.02 0.73 0.03 0.2设这三家工厂的产品在仓库中是均匀混合的且不区别标志(1)在仓库中随机抽取1个元件,求它是次品的概率;(2)在仓库中随机抽取1个元件,若已知抽取的是次品,求该次品出自元件制造厂3的概率.14. 为提升学生的综合素养能力,学校积极为学生搭建平台,组织学生参与各种社团活动.在学校辩论队活动中,甲同学积极参与.为了更好的了解每个同学的社团参与情况和能力水平,对每位参与辩论队的同学进行跟踪记录.社团老师了解到,甲自加入辩论队以来参加过100场辩论比赛:甲作为一辩出场20次,其中辩论队获胜14次;甲作为二辩出场30次,其中辩论队获胜21次;甲作为三辩出场25次,其中辩论队获胜20次;甲作为四辩出场25次,其中辩论队获胜20次.用该样本的频率估计概率,则:(1)甲参加比赛时,求该辩论队某场比赛获胜的概率;(2)现学校组织6支辩论队,进行单循环比赛,即任意两支队伍均有比赛,规定至少3场获胜才可晋级.社团老师决定每场比赛均派甲上场,已知甲所在辩论队顺利晋级,记其获胜的场数为,求的分布列和数学期望.15. 玻璃杯整箱出售,共3箱,每箱20只.假设各箱含有0,1,2只残次品的概率对应为0.8,0.1和0.1.一顾客欲购买一箱玻璃杯,在购买时,售货员随意取一箱,而顾客随机查看4只玻璃杯,若无残次品,则买下该箱玻璃杯;否则不买.设事件表示“顾客买下所查看的一箱玻璃杯”,事件表示“箱中恰好有只残次品”求:(1)顾客买下所查看的一箱玻璃杯的概率;(2)在顾客买下的一箱中,没有残次品的概率.16. 设甲、乙、丙三个地区爆发了某种流行病,三个地区感染此病的比例分、、.现从这三个地区任抽取一个人.(1)求此人感染此病的概率;(结果保留三位小数)(2)若此人感染此病,求此人来自乙地区的概率.(结果保留三位小数).。
1.什么叫贝叶斯决策?如何进行贝叶斯决策?风险型决策方法是根据预测各种事件可能发生的先验概率,然后再采用期望值标准或最大可能性标准来选择最佳决策方案。
这样的决策具有一定的风险性,因为先验概率是根据历史资料或主观判断所确定的概率,未经试验证实,为了减少这种风险,需要较准确的掌握和估计这些先验概率。
这就要通过科学实验,调查,统计分析等方法获得较为准确的情报信息,以修正先验概率,并据以确定各方案的期望损益值,拟订可供选择的决策方案,协助决策者做出正确的决策。
一般来说,利用贝叶斯定理要求得后验概率,据以进行决策的方法称为贝叶斯决策方法。
贝叶斯决策方法步骤:(1)进行预后验分析,决定是否值得搜集补充资料以及从补充资料中可能得到的结果和如何决定最优对策。
(2)收集补充资料,取得条件概率,包括历史概率和逻辑概率,对历史概率要加以检验,辨明其是否适合计算后验概率。
(3)用概率的乘法定理计算联合概率,用概率的加法定理计算边际概率,用贝叶斯定理计算后验概率。
(4)用后验概率进行决策分析。
2.如何进行预后验分析和后验分析?预后验分析是后验概率决策分析的一种特殊形式的演算,这里的特殊形式是指用一套概率对多种行动策略组合进行多次计算,从中择优。
预后验分析有两种形式,一是扩大型,预后验分析,这实际上是一种反推决策树分析,二是常规型预后验分析,这实际上是一种正向分析,用表格形式进行。
扩大型分析要解决的问题是搜集追加信息对决策者有多大的价值,如果试验应采取什么行动策略,常规型分析要解决的问题是,如果试验应采取什么行动策略,但是这两种分析方法所得出的结论是一致的。
根据预后验分析,如果认为采集信息和进行调查研究是值得的,那么就应该决定去做这项工作。
一旦取得了新的信息,决策者就结合这些新信息进行分析,计算各种方案的期望损益值,选择最佳的行动方案,结合运用这些信息并修正先验概率,称为后验分析,这正是发挥贝叶斯决策理论威力的地方。
3.什么是先验分析?先验分析就是决策者要详细列出各种自然状态及其概率,各种备选行动方案与自然状态的损益值,并根据这些信息对备选方案作出抉择的决策过程,当时间,人力和财力不允许搜集更完备的信息时,决策者往往用这类方法进行决策,在贝叶斯决策中,先验分析是进行更深入分析的必要条件。
数据挖掘的第二次作业1•下表由雇员数据库的训练数据组成,数据己泛化。
例如,年龄“31・・・35〃表示31到35的Z 间。
对于给定的行,count表示department, status, age和salary在该行上具有给定值的元组数。
status是类标号属性。
1)countStatus分为2个部分:Department分为4个部分:Senior 共计52Sales 共计110Junior 共计113Systems 共计31Marketing 共计14Secretary 共计10Age分为6个部分:Salary分为6各部分:21...25 共计20 26K..30K 共计4626..30 共计49 31K..35K 共计4031 …35 共计79 36K...40K 共计436 …40 共计10 41K...45K 共计441...45 共计3 46K...50K 共计6346...50 共计4 66K...70K 共计8Info(D)= -磊 log2善-詈Sg2 罟=0.889位Info(departmet)—沁占)+忌V-厭0幻初-存。
灯韵=0.8504位Gain^department) = Info(D) — Info^department) = 0.0386位Gain(age) = Info(D) — Info(age) = 0.3892 位(4.4 0. 0\ 63 / 30 . 30 33 . 33\ , 8 ( 8 - 8 0. 0\(-ilog 2---log 2-) + —*(--log 2---lo g2-) + —♦(--log 2---lo g2-) = 0.3812 位Gain^salary) = Info^D) — Info^salary) = 0.5078位由以上的计算知按信息增益从人到小对屈性排列依次为:salary 、age. department,所以定department status age salary count sales senior 31...35 46K...50K 30 systems junior 21...25 46K...50K 20 systems junior 26...30 46K...50K 3 marketing senior36 (40)46K...50K10由这个表可知department 和age 的信息增益将都为0。
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gammaλλ- 1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(636311714631636315338533810<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x ex x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】 (2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XN θ∴2(176.53)5()p x θθ--= 由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)xN θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】 1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(636311714631636315338533810<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x ex x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】(2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XNθ ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
第二章 贝叶斯推断2.1 解:由题意可知 ()1,01πθθ=<<设12,,...,n X X X 是从随机变量X 中抽取的随机样本,则11()()(1)nii n x ni i p x p x θθθθ==∑==-∏从而有 ()()1()(1),01nii x nx p x πθθπθθθθ=∑∝∙∝-<<所以 1(1,1)ni i x Be n x θ=++∑(1) 由题意可知 n=1,x=3∴(2,4)x Be θ∴21ˆ243Eθ==+ (2) 由题意可知 1233,3,2,5n x x x ====∴(4,11)x Be θ∴44ˆ41115Eθ==+ 2.2 解:设X 为银行为顾客服务的时间,则()x p x e λλλ-=设λ的先验分布为(,)Ga αβ,则20.20.040.21ααβαββ⎧=⎪=⎧⎪⇒⎨⎨=⎩⎪=⎪⎩ 由题意可知 3.8x =从而有 ()()()x p x πλλπλ∝∙()11111n ni ii i x x nx n n n ee ee λβλλβαλβααλλλλ==⎛⎫⎪-+- ⎪-+--+-+-⎝⎭∑∑∝∙==因此有 (,)(20.04,76.2)x Ga n nx Ga λαβ++=所以有 20.04ˆ()0.2676.2E x λλ=== ()()()1110ˆ() 4.0021nnx n nx nx E x e d n n αλβαββθλλλλαα++∞-+--+-++==∙==Γ++-⎰ 2.3 解:设X 为磁带的缺陷数,则()X p θ∴3133311()()!ii x i i i i e p x p x x θθθθ=-==∑==∏∏由题意可知 ()21,02e θπθθθ-=>从而有 ()()3132104()i i x x p x e e e θθθπθθπθθθθ=---∑∝∙∝=因此 (11,4)x Ga θ11ˆ()()16EMSE Var x θθ== 2.4 解:设X 为n 个产品中不合格数,则(,)X bin n θ 由题意可知 ()49(1),01πθθθθ∝-<< (1) 由题意可知(20,)X bin θ∴317()(1)p x θθθ∝-∴()()()x p x πθθπθ∝∙31749726(1)(1)(1)θθθθθθ∝-∙-=- 因此 (8,27)x Be θ又626725()7(1)26(1)0x πθθθθθ'∝---所以 7ˆ33MD θ=(2) 由题意可知(20,)X bin θ 且()726(1)πθθθ=-∴20()(1)p x θθ∝-∴()()()x p x πθθπθ∝∙72620746(1)(1)(1)θθθθθ∝-∙-=-因此 (8,47)x Be θ所以 78ˆˆ,5355MD E θθ== 2.5 解:设2(,2)X N θ ,则222σ= 令2204nnσσ==设(,1)N u θ ,则1τ=,且211(,)x N u θτ其中 2201222200u x u στστστ------=+++22210111τστ=+214ˆ()()0.14EMSE Var x n θθτ===≤+ 2.6 解:设X 为1000名成年人中投赞成票的人数,则(1000,)X bin θ(1)由题意可知 7107102901000(710)(1),01p C θθθθ=-<<a.()()710290711290710(710)(1)(1)A p πθθπθθθθθθ∝∙∝-∙=-∴710(712,291)Be θb.()()7102903713290710(710)(1)(1)B p πθθπθθθθθθ∝∙∝-∙=-∴710(714,291)Be θ(2)a.712ˆ(710)0.7098712291E E θθ===+b. 714ˆ(710)0.7104714291E E θθ===+ (3)由题意可知10001000()(1),01xx x p x C θθθθ-=-<<a.()()100011000()(1)(1)x x x x A x p x πθθπθθθθθθ-+-∝∙∝-∙=-∴(2,1001)x Be x x θ+-∴2ˆ()1003EAx E x θθ+== b.()()1000331000()(1)(1)x x x x B x p x πθθπθθθθθθ-+-∝∙∝-∙=-∴(4,1001)x Be x x θ+-∴4ˆ()1005EB x E x θθ+==∴ˆEA θ-ˆEB θ=21003x +-41005x +=2.7 解:由题意可知 1(),0p x x θθθ=<<1(),0,1,2,...,i n p x x i n θθθ∴=<<=令{}1012max ,,,...,n x x x θθ=,则()101()()()n m x p x d n ααθαθθπθθαθ+∞+=∙=+⎰从而有 ()()111()(),()n n p x n x m x ααθπθαθπθθθθ++++==>11111()1ˆ()(1)n E n n n E x d n αααθαθθθθθθαθ++∞+++-+===+-⎰1221121()1()(2)n n n n E x d n αααθαθθθθθαθ++∞+++-+==+-⎰22222(1)1111ˆ()()()()(2)(1)En n MSE Var x E x E x n n ααθθθθαθαθ+-+-==-=-+-+- 2.8 解:(1)由题意可知 21221()2n x n p x x e θθθ--⎛⎫∝ ⎪⎝⎭()(1)e βαθπθθ--+∝因此 ()221(1)(1)22212xnx nn x x e e eββααθθθπθθθθ+-----++-+⎛⎫∝∝⎪⎝⎭所以 (,)22n xx IGa θαβ++(2)222()1222x Var x n n βθαα⎛⎫+ ⎪⎝⎭=⎛⎫⎛⎫+-+- ⎪ ⎪⎝⎭⎝⎭2()12x E x nβθα+=+- (3) 由题意可知 2221()n nx p x eθθθ-⎛⎫∝ ⎪⎝⎭()22(1)2nx nx eβαθπθθ+--++∝2(,)22n nxx IGa θαβ∴++22ˆ12MDnx n βθα+∴=++ 22ˆ12E nxn βθα+=+-。
贝叶斯决策的例题练习公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]一、贝叶斯决策(Bayes decision theory)【例】某企业设计出一种新产品,有两种方案可供选择:—是进行批量生产,二是出售专利。
这种新产品投放市场,估计有3种可能:畅销、中等、滞销,这3种情况发生的可能性依次估计为:,和。
方案在各种情况下的利润及期望利润如下表。
企业可以以1000元的成本委托专业市场调查机构调查该产品销售前景。
若实际市场状况为畅销,则调查结果为畅销、中等和滞销的概率分别为、和;若实际市场状况为中等,则调查结果为畅销、中等和滞销的概率分别为、和;若实际市场状况为滞销,则调查结果为畅销、中等和滞销的概率分别为、和。
问:企业是否委托专业市场调查机构进行调查解:1.验前分析:记方案d1为批量生产,方案d2为出售专利E(d1)=*80+*20+*(-5)=(万元)E(d2)=40*+7*+1*=(万元)记验前分析的最大期望收益为E1,则E1=max{E(d1),E(d2)}=(万元)因此验前分析后的决策为:批量生产E1不作市场调查的期望收益2.预验分析:(1)设调查机构调查的结果畅销、中等、滞销分别用H1、H2、H3表示由全概率公式P(H1)=*+*+*=P(H2)=*+*+*=P(H3)=*+*+*=(2)由贝叶斯公式有P(?1|H1)=*=P(?2|H1)=*=P(?3|H1)=*=P(?1|H2)=*=P(?2|H2)=*=P(?3|H2)=*=P(?1|H3)=*=P(?2|H3)=*=P(?3|H3)=*=(3)用后验分布代替先验分布,计算各方案的期望收益值a)当市场调查结果为畅销时E(d1|H1)=80* P(?1|H1)+20* P(?2|H1)+(-5)* P(?3|H1)=80*+20*+(-5)*=(万元)E(d2|H1)=40* P(?1|H1)+7* P(?2|H1)+1* P(?3|H1)=40*+7*+1*=(万元)因此,当市场调查畅销时,最优方案是d1,即批量生产b)当市场调查结果为中等时E(d1|H2)=80* P(?1|H2)+20* P(?2|H2)+(-5)* P(?3|H2)=(万元)E(d2|H2)=40* P(?1|H2)+7* P(?2|H2)+1* P(?3|H2)=40*+7*+1*=(万元)所以市场调查为中等时,最优方案是:d1,即批量生产c)当市场调查结果为滞销时E(d1|H3)=80* P(?1|H3)+20* P(?2|H3)+(-5)* P(?3|H3)=80*+20*+(-5)*=(万元)E(d2|H3)=40* P(?1|H3)+7* P(?2|H3)+1* P(?3|H3)=40*+7*+1*=(万元)因此市场调查为滞销时,最优方案是:d2,即出售专利(4)通过调查,该企业可获得的收益期望值为E2= E(d1|H1)* P(H1)+ E(d1|H2)* P(H2)+ E(d2|H3)* P(H3)=*+*+*=(万元)通过调查,该企业收益期望值能增加E2-E1=(万元)因此,在调查费用不超过万元的情况下,应进行市场调查3.验后分析(1)本题中调查费用1000<9600,所以应该进行市场调查(2)当市场调查结果为畅销时,选择方案1,即批量生产(3)当市场调查结果为中等时时,选择方案1,即批量生产(4)当市场调查结果为滞销时,选择方案2,即出售专利。
第二章:贝叶斯决策理论 主要考点:1. 最小错误率贝叶斯分类器;2. 最小风险贝叶斯分类器;3. 多元正态分布时的最小错误率贝叶斯分类器。
典型例题:P45,2.23,2.24。
例题1:在一个一维模式两类分类问题中,设12()1/3,()2/3p p ωω==,两类的类概率密度分别为2212(/)(1)),(/)(1))p x x p x x ωω=-+=--1)求最小错误率贝叶斯分类器的阈值。
2)设损失为0310L ⎛⎫= ⎪⎝⎭,求最小风险贝叶斯分类器的阈值。
解:由于p(w1)=1/3, p(w2)=2/3,则最小错误率贝叶斯分类器的阈值θ=p(w2)/p(w1)=2其相应的决策规则为:,)1()2()2/()1/(w p w p w x p w x p >< 则21{w w x ∈2>< 即 12ln 24ln 24w x x w x ⎧<-⎪⎪∈⎨⎪>-⎪⎩ (2) 当L=0310时,122221113,01,0λλλλ====从而最小风险贝叶斯决策规则的阈值为:1222221111()()(30)*1/3.3/2()()(10)*2/3p w p w λλλλλ--===--判决规则为:12(/)(/)p x w p x w λ><,则21{w w x ∈23/2==>exp(4)3/2x -= 12ln(3/2)4ln(3/2)4w x x w x ⎧<-⎪⎪∈⎨⎪>-⎪⎩例2p45,2.23解:这里两类协方差矩阵相等。
负对数似然比判别规则为111222(/)()lnln 0(/)()x p x p x p x p ωωωωωω∈<⎧--=⇒⎨∈>⎩ ()()()()11111/2112221/2111122112211exp(()())(/)2||2ln ln11(/)exp(()())2||2[()()(11())()]/21111exp ,222020T i i i i nT T T T ix x p x p x x x x x x x x x p x x x x x x μμωπωμμπωμμπμμμμ------⎡⎤=---⎢∑--∑-∑-=---∑-∑=-∑---∑-+⎛⎫=+-- ⎪-⎝⎭⎥⎣⎦∑∑ =I.故()1111202021x x x x -⎛⎫-- ⎪-⎝⎭=例32.24 解:()()()112111211111/211122221/2221112/34/32/34/311exp(()())(11()exp ,22/)2||2ln ln11(/)exp(()())2||2[()(T T T i i i i nT ix x p x p x p x x x x x x x μμωπωμμπμωμμπ------⎛⎫⎛⎫∑∑ ⎪ ⎪-⎝⎭⎝⎭--∑-∑-=--⎡⎤=---⎢⎥-∑-∑=-⎣⎦∑-∑∑4/3-2/34/32/3=,=故()()1121221122)()()]/211111120112020202/34/32/34/381ln213/4ln234433/T x x x x x x x x x x x x x μμμ---∑-++-⎛⎫⎛⎫⎛⎫⎛⎫=+----+ ⎪ ⎪ ⎪ ⎪---⎝⎭⎝⎭⎝⎭⎝⎭=-∑∑4/3-2/34/32/3例4:假设两类二维正态分布参数如下,试给出负对数似然比判别规则。
1.1 设是一批。
记样本为x.()()22682268(0.1)*0.1*0.90.1488(0.2)*0.2*0.80.29360.1488*0.70.10.54180.1488*0.70.2936*0.30.2936*0.30.20.45820.1488*0.70.2936*0.3p x C p x C x x θθπθπθ==≈==≈==≈+==≈+后验分布:1.2 设一卷磁带1.3 设是一批产品的不合格率,从中抽取8个1.7 设随机变量X 的密度函数为1.11某人每天早上在车站等2.1设随机变量X服从几何分布2.2 设某银行为一位顾客服务时间2.5设x1,x2……是来自正态分布n>=362.10对正态分布N(0,1)作观察3.11 设X,…..XN相互独立,且XI3.12设n=3,x1=3,x2-03.13 超参数的估计值为(当0《x《S2》4.1 某公司准备经营一种新产品4.6已知如下收益矩阵Q ,写出相应的损失矩阵4.10设二行动线性决策问题的收益函数为()()()()()()()()()()()()()0121212121212101662011820122566,,,0,3056,,,530,00,1015304101305910.Q a Q a a a L a L a Q a Q a a a L a L a L a d L a d a θθθθθθθθθθθθθθθθθθθθ+=-+⇒=≤≥==-><=-==-==-=⎰⎰当时,,则在和处的损失函数为当时,,则在和处的损失函数为服从上的均匀分布最优行动是4.16 某人有4百万元财产,考虑是否参加火灾保险。
1.什么叫贝叶斯决策?如何进行贝叶斯决策?
风险型决策方法是根据预测各种事件可能发生的先验概率,然后再采用期望值标准或最大可能性标准来选择最佳决策方案。
这样的决策具有一定的风险性,因为先验概率是根据历史资料或主观判断所确定的概率,未经试验证实,为了减少这种风险,需要较准确的掌握和估计这些先验概率。
这就要通过科学实验,调查,统计分析等方法获得较为准确的情报信息,以修正先验概率,并据以确定各方案的期望损益值,拟订可供选择的决策方案,协助决策者做出正确的决策。
一般来说,利用贝叶斯定理要求得后验概率,据以进行决策的方法称为贝叶斯决策方法。
贝叶斯决策方法步骤:
(1)进行预后验分析,决定是否值得搜集补充资料以及从补充资料中可能得到的结果和如何决定最优对策。
(2)收集补充资料,取得条件概率,包括历史概率和逻辑概率,对历史概率要加以检验,辨明其是否适合计算后验概率。
(3)用概率的乘法定理计算联合概率,用概率的加法定理计算边际概率,用贝叶斯定理计算后验概率。
(4)用后验概率进行决策分析。
2.如何进行预后验分析和后验分析?
预后验分析是后验概率决策分析的一种特殊形式的演算,这里的特殊形式是指用一套概率对多种行动策略组合进行多次计算,从中择优。
预后验分析有两种形式,一是扩大型,预后验分析,这实际上是一种反推决策树分析,二是常规型预后验分析,这实际上是一种正向分析,用表格形式进行。
扩大型分析要解决的问题是搜集追加信息对决策者有多大的价值,如果试验应采取
什么行动策略,常规型分析要解决的问题是,如果试验应采取什么行动策略,但是这两种分析方法所得出的结论是一致的。
根据预后验分析,如果认为采集信息和进行调查研究是值得的,那么就应该决定去做这项工作。
一旦取得了新的信息,决策者就结合这些新信息进行分析,计算各种方案的期望损益值,选择最佳的行动方案,结合运用这些信息并修正先验概率,称为后验分析,这正是发挥贝叶斯决策理论威力的地方。
3.什么是先验分析?
先验分析就是决策者要详细列出各种自然状态及其概率,各种备选行动方案与自然状态的损益值,并根据这些信息对备选方案作出抉择的决策过程,当时间,人力和财力不允许搜集更完备的信息时,决策者往往用这类方法进行决策,在贝叶斯决策中,先验分析是进行更深入分析的必要条件。
4.贝叶斯决策有哪些优点?哪些局限?
贝叶斯决策的优点表现在以下几个方面:
(1)如果说在第14章中大多用的是不完善的信息或主观概率的话,那么贝叶斯决策则提供了一个进一步研究的科学方法,也就是说,它能对信息的价值或是否需要采集新的信息作出科学判断。
(2)它能对调查结果的可能性加以数量化的评价,而不是像一般的决策方法那样对调查结果,或者是完全相信,或者是完全不相信。
(3)如果说任何调查结果都不可能是完全准确的,而先验知识或主观概率也不是完全可以相信的,那么贝叶斯决策则巧妙的将这两种信息有机的结合起来了。
(4)它可以在决策过程中,根据具体情况不断的使用,使决策逐步完善和更加科学。
贝叶斯决策方法也有其局限性,主要表现在以下几个方面:
(1)它所需要的数据多,分析计算比较复杂,特别在解决复杂问题时,这个矛盾就更加突出。
(2)有些数据必须使用主观概率,有些人不太相信,这也妨碍了贝叶斯决策方法的推广使用。
5. 某决策问题由以下损益值表示:
单位:万元
以1I 2I 表示市场调查结果的两种状态,根据历史资料,可得出以下概率值:11()=0.8p I s ,21()=0.2p I s ,12()=0.4p I s ,22()=0.4p I s
要求:
(1)计算1()p I ,2()p I
(2)计算后验概率11()p s I ,21()p s I 和12()p s I
(3)计算市场调查信息的价值
(4)应用决策树法进行决策分析
(1)P(I1)=p(I1|S1)*p(S1)+p(I1|S2)P(S2)=0.8*0.4+0.4*0.6=0.56
P(I2)=p(I2|S1)*p(S1)+p(I2|S2)P(S2)=0.2*0.4+0.6*0.6=0.44
(2)p(S1|I1)=p(S1)*P(I1|S1)/(p(S1)p(I1|S1)+p(S2)p(I1|S2)=0.4*0.8/(0.4*0.8+0.6*0.4)=0.5714
p(S2|I1)=p(S2)*P(I1|S2)/(p(S2)p(I1|S2)+p(S1)p(I1|S1)=0.6*0.4/(0.6*0.4+0.4*0.8)=0. 4286
p(S1|I2)=p(S1)*P(I2|S1)/(p(S1)p(I2|S1)+p(S2)p(I2|S2)=0.4*0.2/(0.4*0.2+0.6*0.6)=0. 1818
p(S2|I2)=p(S2)*P(I2|S2)/(p(S2)p(I2|S2)+p(S1)p(I2|S1)=0.6*0.6/(0.6*0.6+0.4*0.2)=0. 8182
(3)采用d1的期望值:100*0.4+300*0.6=220;
采用d2的期望值:400*0.4+200*0.6=280;
两期望值之差:280-220=60即为价值
所以价值为60。
d1 0.4 100
d2 0.6 300 (4) I1
所以如果调查是I1,选择d2
所以如果调查是I2,选择d1。