当前位置:文档之家› 决策树学习

决策树学习

管理学盈亏平衡分析和决策树计算题

盈亏平衡分析 某建筑工地需抽除积水保证施工顺利进行,现有A 、B 两个方案可供选择。 A 方案:新建一条动力线,需购置一台2.5W 电动机并线运转,其投资为1400元,第四年 末残值为200元,电动机每小时运行成本为0.84元,每年预计的维护费用120元, 因设备完全自动化无需专人看管。 B 方案:购置一台3.86KW 的(5马力)柴油机,其购置费用为550元,使用寿命为4年, 设备无残值。运行每小时燃料费为0.42元,平均每小时维护费为0.15元,每小 时的人工成本为0.8元。 若寿命都为4年,基准折现率为10%,试比较A 、B 方案的优劣。 解:两方案的总费用都与年开机小时数t 有关,故两方案的年成本均可表示t 的函数。 )4%,10,/(200)4%,10,/(1400F A P A C A -=t t 84.056.51884.0120+=++ t P A C B )8.015.042.0()4%,10,/(550+++= t 37.151.175+= 令C A =C B ,即518.56+0.84t=173.51+1.37t 可解出:t =651(h),所以在t =651h 这一点上, C A =C B =1065.4(元) A 、 B 两方案的年成本函数如图13所示。从图中可见,当年开机小时数低于651h ,选B 方案有利;当年开机小时数高于651h 则选A 方案有利。 图13 A 、B 方案成本函数曲线

决策树问题 55.某建筑公司拟建一预制构件厂,一个方案是建大厂,需投资300万元,建成后如销路 好每年可获利100万元,如销路差,每年要亏损20万元,该方案的使用期均为10年; 另一个方案是建小厂,需投资170万元,建成后如销路好,每年可获利40万元,如销路差每年可获利30万元;若建小厂,则考虑在销路好的情况下三年以后再扩建,扩建投资130万元,可使用七年,每年盈利85万元。假设前3年销路好的概率是0.7,销路差的概率是0.3,后7年的销路情况完全取决于前3年;试用决策树法选择方案。 决策树图示 考虑资金的时间价值,各点益损期望值计算如下: 点①:净收益=[100×(P/A,10%,10)×0.7+(-20)×(P/A,10%,10)×0.3]-300=93.35(万元) 点③:净收益=85×(P/A,10%,7)×1.0-130=283.84(万元) 点④:净收益=40×(P/A,10%,7)×1.0=194.74(万元) 可知决策点Ⅱ的决策结果为扩建,决策点Ⅱ的期望值为283.84+194.74=478.58(万元)点②:净收益=(283.84+194.74)×0.7+40×(P/A,10%,3)×0.7+30×(P/A,10%,10)×0.3-170=345.62(万元) 由上可知,最合理的方案是先建小厂,如果销路好,再进行扩建。在本例中,有两个决策点Ⅰ和Ⅱ,在多级决策中,期望值计算先从最小的分枝决策开始,逐级决定取舍到决策能选定为止。 56.某投资者预投资兴建一工厂,建设方案有两种:①大规模投资300万元;②小规模投 资160万元。两个方案的生产期均为10年,其每年的损益值及销售状态的规律见表15。 试用决策树法选择最优方案。 表15 各年损益值及销售状态

(完整word版)管理学决策树习题及答案

注意答卷要求: 1.统一代号:P 为利润,C 为成本,Q 为收入,EP 为期望利润 2.画决策树时一定按照标准的决策树图形画,不要自创图形 3.决策点和状态点做好数字编号 4.决策树上要标出损益值 某企业似开发新产品,现在有两个可行性方案需要决策。 I 开发新产品A ,需要追加投资180万元,经营期限为5年。此间,产品销路好可获利170万元;销路一般可获利90万元;销路差可获利-6万元。三种情况的概率分别为30%,50%,20%。 II.开发新产品B ,需要追加投资60万元,经营期限为4年。此间,产品销路好可获利100万元;销路一般可获利50万元;销路差可获利20万元。三种情况的概率分别为60%,30%,10%。 (1)画出决策树 销路好 0.3 170 90 -6 100 50 20

(2)计算各点的期望值,并做出最优决策 求出各方案的期望值: 方案A=170×0.3×5+90×0.5×5+(-6)×0.2×5=770(万元) 方案B=100×0.6×4+50×0.3×4+20×0.1×4=308(万元) 求出各方案的净收益值: 方案A=770-180=590(万元) 方案B=308-60=248(万元) 因为590大于248大于0 所以方案A最优。 某企业为提高其产品在市场上的竞争力,现拟定三种改革方案:(1)公司组织技术人员逐渐改进技术,使用期是10年;(2)购买先进技术,这样前期投入相对较大,使用期是10年;(3)前四年先组织技术人员逐渐改进,四年后再决定是否需要购买先进技术,四年后买入技术相对第一年便宜一些,收益与前四年一样。预计该种产品前四年畅销的概率为0.7,滞销的概率为0.3。如果前四年畅销,后六年畅销的概率为0.9;若前四年滞销,后六年滞销的概率为0.1。相关的收益数据如表所示。 (1)画出决策树 (2)计算各点的期望值,并做出最优决策 投资收益 表单位:万元 解(1)画出决策树,R为总决策,R1为二级决策。

基于粗糙集—决策树的上市公司财务预警

□财会月刊· 全国优秀经济期刊□·26 ·2012.6下旬一、有关财务危机预测的研究方法 财务危机预测模型是由Beaver 最早提出来的,之后许多预测方法被用于公司财务危机预测研究。 20世纪60年代主要是Beaver 和Altman 分别采用单变量判别分析和多变量判别分析进行财务危机预警研究。 20世纪80年代,Ohlson 首先将Logistic 模型应用于财务预警领域,20世纪90年代神经网络又被引入财务危机预测。20世纪80年代,Frydman 等将决策树引入了财务预警研究中,决策树(DT )在解决分类问题上具有简单和易于理解的优点。 决策树是一种对大量数据集进行分类的非常有效的方法,通过决策树的构造模型,从大量信息中挖掘有效的数据,提取有价值的分类规则,从而获得有用的知识,帮助决策者准确预测。它的基本算法是贪心算法,采用自顶向下的递归方式构造决策树。 根据决策树增长的方法不同,学者们提出了很多经典的决策树算法。1986年J .R.Quinlan 提出了决策树ID3算法,有人在此基础上提出了一些改进的SLIQ 、SPRINT 、CHAID 等一些算法。 这些算法运用也被运用到财务预警方面。姚靠华、陈晓红(2007)运用这些算法对我国上市公司的财务预警问题进行了研究。 1982年Z.Pawlak 教授提出了粗糙集理论,运用粗糙集的方法可以对属性进行约简,把粗糙集的知识运用到决策树上,国内外学者提出了很多不同的建树方法并应用到很多领域。2001年赵卫东、李旗号运用粗糙集知识对决策树进行了优化,通过引入粗糙集理论中可分辨的概念给出一种方法,这种方法通过优化降低了树的高度。 2009年Iftikhar U.Sikder 和Toshinori Munakata 的基于粗糙集和决策树对低地震活动前兆因素的描述,他们运用粗糙集和决策树的方法,使用了信息增益和熵产生一系列规则,对地震进行预警。 运用决策树方法形成一系列规则,对训练数据集进行分类,然后根据形成的规则对训练数据集之外的数据进行分类,应用在财务领域,可以对财务进行预警。本文运用建造决策树的一种新方法,通过实证研究,对国内制造业上市公司进行财务预警分析。 二、基于变精度加权平均粗糙度的决策树生成算法 (一)对象聚类 系统聚类也称为层次聚类,是聚类分析中广泛应用的一种方法。聚类分析是建立在某种优化意义下,对样品或指标(变量)之间存在的相似性进行比较,将“相近似”的对象归并成类的一种方法。 本文使用SPSS16.0对138家制造业公司进行分类,聚类步骤如下: 1.数据标准化。系统聚类首先要对各个原始数据进行一些相互比较运算,而各个原始数据往往由于量纲不同而影响这种比较和运算。因此,需要对原始数据进行必要的变换处理,以消除量纲不同造成的影响。 数据处理主要是对各个数据进行标准化,数据的标准化是将数据按比例缩放,使之落入一个小的特定区间,方法如下: 对于一个正向指标X i ,假定当它取值大于或者等于α时为最佳,此时,把它所有取值等于或者大于α的值标准化后取值为1; 同理,假定当X i 的取值小于或者等于β时为最差,标准化后取值为0;取值为区间(β,α)的数据δ,标准化之后为:(δ-β)/(α-β)。 2.计算聚类统计量。根据变换以后的数据计算得到聚类统计量。它用来表明各样品或变量间的关系相似或者近似程度。 常用的统计量有距离和相似系数两大类。本文使用欧式距离计算聚类统计量。欧式距离计算方法如下: 假设每个样品有p 个指标,用y ij 表示第i 个样品的第j 个指标,d ij 表示第i 个样品与第j 个样品之间的距离,欧式距离可表示为: d ij =[(y ik -y jk )2]1/2(1) 基于粗糙集—决策树的上市公司财务预警 刘澄(博士生导师) 胡巧红孙莹 (北京科技大学东凌经济管理学院北京100083) 【摘要】传统的财务预警研究往往把企业财务状况分成ST 和非ST 两类,过于笼统。为此本文首先运用聚类的方法把138家制造业上市公司分为财务状况健康、良好、一般、预警和危机5个层次,这使得对企业财务预警的研究更贴合实际,并且使实证研究结果更加准确。然后运用粗糙集中的变精度加权平均粗糙度来构造决策树的改进算法,对这些公司进行分类,进而提出公司财务状况预警的规则,这样生成的决策树财务预警规则防噪声能力更强,分类效果更好。 【关键词】决策树粗糙集财务预警 ∑ p k=1

届南开大学《管理学》试题及答案

17秋学期(1709)《经管学》在线作业一 一、单选题(共30道试卷,共60分。)1.(C)是进行组织设计的基本出发点。 A. 人员配备 B. 组织文化 C. 组织目标 D. 组织结构满分:2分2.领导的特质理论告诉我们. A A. 领导是天生的 B. 领导的行为决定了领导才能 C. 下属的服从是领导之所以为领导的关键 D. 领导行为是可以模仿的满分:2分3.决策方法中的“硬技术”是指(A)。 A. 计量决策方法 B. 专家意见法 C. 定性决策法 D. 决策树法满分:2分4.(B )是指企业经管系统随着企业内外部环境的变化,而不断更新自己的经营理念、经营方针和经营目标,为达此目的,必须相应的改变有关的经管方法和手段,使其与企业的经营目标相适应。 A. 激励原理 B. 动态原理 C. 创新原理 D. 可持续发展原理满分:2分5.被称为“科学经管之父”的经管学家是(A)。 A. 泰勒 B. 法约尔 C. 德鲁克 D. 西蒙满分:2分6.现在很多大公司都实行所谓的“门户开放”政策(比如IBM),即鼓励各级员工通过多种途径直接向公司高层领导反映意见、提出建议,公司总裁也会设立专门的信箱,以接收这些意见或者抱怨。这里的沟通渠道可以看成是一种(B)。 A. 下行沟通 B. 上行沟通 C. 对角沟通 D. 横向沟通满分:2分7.非程序化决策往往是有关企业重大战略问题的决策,主要由(B)承担。 A. 一线工人 B. 上层经管人员 C. 中层经管人员 D. 低层经管人员满分:2分8.下面关于内部招聘的说法不正确的是(B)。 A. 内部员工的竞争结果必然有胜有败,可能影响组织的内部团结。 B. 内部招聘人员筛选难度大,成本高。 C. 可能在组织中滋生“小集团”,削弱组织效能。 D. 组织内的“近亲繁殖”现象,可能不利于个体创新。满分:2分9.(D)是指依靠企业各级行政组织的法定权力,通过命令、指示、规定、制度、规范以及具有约束性的计划等行政手段来经管企业的方法。 A. 教育方法 B. 经济方法 C. 法制方法 D. 行政方法满分:2分10.目标经管的提出者是(C)。 A. 泰罗 B. 法约尔 C. 德鲁克 D. 巴纳德满分:2分11.解决复杂问题应采用的沟通方式是(D)。 A. 链式 B. 轮式 C. 环式 D. 全通道式满分:2分12.(D)就是对一系列典型的事物进行观察分析,找出各种因素之间的因果关系,从中找出事物发展变化的一般规律,这种从典型到一般的研究方法也称为实证研究。 A. 演绎法 B. 调查法 C. 实验法 D. 归纳法满分:2分13.泰罗经管理论的代表着作是(B)。

2021年管理学决策树习题及答案

注意答卷要求: 欧阳光明(2021.03.07) 1.统一代号:P为利润,C为成本,Q为收入,EP为期望利润2.画决策树时一定按照标准的决策树图形画,不要自创图形3.决策点和状态点做好数字编号 4.决策树上要标出损益值 某企业似开发新产品,现在有两个可行性方案需要决策。 I开发新产品A,需要追加投资180万元,经营期限为5年。此间,产品销路好可获利170万元;销路一般可获利90万元;销路差可获利-6万元。三种情况的概率分别为30%,50%,20%。 II.开发新产品B,需要追加投资60万元,经营期限为4年。此间,产品销路好可获利100万元;销路一般可获利50万元;销路差可获利20万元。三种情况的概率分别为60%,30%,10%。 (1)画出决策树

(2)计算各点的期望值,并做出最优决策 求出各方案的期望值: 方案A=170×0.3×5+90×0.5×5+(-6)×0.2×5=770(万元) 方案B=100×0.6×4+50×0.3×4+20×0.1×4=308(万元) 求出各方案的净收益值: 方案A=770-180=590(万元) 方案B=308-60=248(万元) 因为590大于248大于0 所以方案A 最优。 某企业为提高其产品在市场上的竞争力,现拟定三种改革方案:(1)公司组织技术人员逐渐改进技术,使用期是10年;(2)购 销路好 0.3 170 90 -6 100 50 20

买先进技术,这样前期投入相对较大,使用期是10年;(3)前四年先组织技术人员逐渐改进,四年后再决定是否需要购买先进技术,四年后买入技术相对第一年便宜一些,收益与前四年一样。预计该种产品前四年畅销的概率为0.7,滞销的概率为0.3。如果前四年畅销,后六年畅销的概率为0.9;若前四年滞销,后六年滞销的概率为0.1。相关的收益数据如表所示。 (1)画出决策树 (2)计算各点的期望值,并做出最优决策 投资收益表单位:万元 解(1)画出决策树,R为总决策,R1为二级决策。

管理学盈亏平衡分析和决策树计算题

盈亏平衡分析 某建筑工地需抽除积水保证施工顺利进行,现有A 、B 两个方案可供选择。 A 方案:新建一条动力线,需购置一台2.5W 电动机并线运转,其投资为1400元,第四年 末残值为200元,电动机每小时运行成本为0.84元,每年预计的维护费用120元,因设备完全自动化无需专人看管。 B 方案:购置一台3.86KW 的(5马力)柴油机,其购置费用为550元,使用寿命为4年, 设备无残值。运行每小时燃料费为0.42元,平均每小时维护费为0.15元,每小时的人工成本为0.8元。 若寿命都为4年,基准折现率为10%,试比较A 、B 方案的优劣。 解:两方案的总费用都与年开机小时数t 有关,故两方案的年成本均可表示t 的函数。 )4%,10,/(200)4%,10,/(1400F A P A C A -=t t 84.056.51884.0120+=++ t P A C B )8.015.042.0()4%,10,/(550+++= t 37.151.175+= 令C A =C B ,即518.56+0.84t=173.51+1.37t 可解出:t =651(h),所以在t =651h 这一点上, C A =C B =1065.4(元) A 、 B 两方案的年成本函数如图13所示。从图中可见,当年开机小时数低于651h ,选B 方案有利;当年开机小时数高于651h 则选A 方案有利。 图13 A 、B 方案成本函数曲 线

决策树问题 55.某建筑公司拟建一预制构件厂,一个方案是建大厂,需投资300万元,建成后如销路 好每年可获利100万元,如销路差,每年要亏损20万元,该方案的使用期均为10年; 另一个方案是建小厂,需投资170万元,建成后如销路好,每年可获利40万元,如销路差每年可获利30万元;若建小厂,则考虑在销路好的情况下三年以后再扩建,扩建投资130万元,可使用七年,每年盈利85万元。假设前3年销路好的概率是0.7,销路差的概率是0.3,后7年的销路情况完全取决于前3年;试用决策树法选择方案。 决策树图示 考虑资金的时间价值,各点益损期望值计算如下: 点①:净收益=[100×(P/A,10%,10)×0.7+(-20)×(P/A,10%,10)×0.3]-300=93.35(万元) 点③:净收益=85×(P/A,10%,7)×1.0-130=283.84(万元) 点④:净收益=40×(P/A,10%,7)×1.0=194.74(万元) 可知决策点Ⅱ的决策结果为扩建,决策点Ⅱ的期望值为283.84+194.74=478.58(万元)点②:净收益=(283.84+194.74)×0.7+40×(P/A,10%,3)×0.7+30×(P/A,10%,10)×0.3-170=345.62(万元) 由上可知,最合理的方案是先建小厂,如果销路好,再进行扩建。在本例中,有两个决策点Ⅰ和Ⅱ,在多级决策中,期望值计算先从最小的分枝决策开始,逐级决定取舍到决策能选定为止。 56.某投资者预投资兴建一工厂,建设方案有两种:①大规模投资300万元;②小规模投 资160万元。两个方案的生产期均为10年,其每年的损益值及销售状态的规律见表15。 试用决策树法选择最优方案。 表15 各年损益值及销售状态

机器学习 决策树(ID3)算法及案例

机器学习--决策树(ID3)算法及案例 1基本原理 决策树是一个预测模型。它代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,每个分支路径代表某个可能的属性值,每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。一般情况下,决策树由决策结点、分支路径和叶结点组成。在选择哪个属性作为结点的时候,采用信息论原理,计算信息增益,获得最大信息增益的属性就是最好的选择。信息增益是指原有数据集的熵减去按某个属性分类后数据集的熵所得的差值。然后采用递归的原则处理数据集,并得到了我们需要的决策树。 2算法流程 检测数据集中的每个子项是否属于同一分类: If是,则返回类别标签; Else 计算信息增益,寻找划分数据集的最好特 征 划分数据数据集 创建分支节点(叶结点或决策结点)

for每个划分的子集 递归调用,并增加返回结果 到分支节点中 return分支结点 算法的基本思想可以概括为: 1)树以代表训练样本的根结点开始。 2)如果样本都在同一个类.则该结点成为树叶,并记录该类。 3)否则,算法选择最有分类能力的属性作为决策树的当前结点. 4)根据当前决策结点属性取值的不同,将训练样本根据该属性的值分为若干子集,每个取值形成一个分枝,有几个取值形成几个分枝。匀针对上一步得到的一个子集,重复进行先前步骤,递归形成每个划分样本上的决策树。一旦一个属性只出现在一个结点上,就不必在该结点的任何后代考虑它,直接标记类别。 5)递归划分步骤仅当下列条件之一成立时停止: ①给定结点的所有样本属于同一类。 ②没有剩余属性可以用来进一步划分样本.在这种情况下.使用多数表决,将给定的结点转换成树叶,并以样本中元组个数最多的类别作为类别标记,同时也可以存放该结点样本的类别分布[这个主要可以用来剪枝]。 ③如果某一分枝tc,没有满足该分支中已有分类的样本,则以样本的多数类生成叶子节点。 算法中2)步所指的最优分类能力的属性。这个属性的选择是本算法种的关键点,分裂属性的选择直接关系到此算法的优劣。 一般来说可以用比较信息增益和信息增益率的方式来进行。 其中信息增益的概念又会牵扯出熵的概念。熵的概念是香农在研究信息量方面的提出的。它的计算公式是:

管理学决策树习题及答案

. 注意答卷要求: EP为期望利润P1.统一代号:为利润,C为成本,Q为收入,2.画决策树时一定按照标准的决策树图形画,不要自创图形 3.决策点和状态点做好数字编号.决策树上要标出损益值4 某企业似开发新产品,现在有两个可行性方案需要决策。年。此间,产品销路好5I开发新产品A,需要追加投资180万元,经营期限为万元。三种情况的90可获利170万元;销路一般可获利万元;销路差可获利-6 概率分别为30%,50%,20%。年。此间,产品销路好开发新产品B,需要追加投资万元,经营期限为460II.三种情况的万元。万元;销路差可获利2050可获利100万元;销路一般可获利,10%。,概率分别为60%30%(1)画出决策树0.3 销路好 170 0.5销路一90 2 0.1 销路差-6 A 开发产品1 0.6 销路好 100 B 开发产品0.3 销路一般 3 50 0.1

销路差 20 4 / 1 . (2)计算各点的期望值,并做出最优决策 求出各方案的期望值: 方案A=170×0.3×5+90×0.5×5+(-6)×0.2×5=770(万元) 方案B=100×0.6×4+50×0.3×4+20×0.1×4=308(万元) 求出各方案的净收益值: 方案A=770-180=590(万元) 方案B=308-60=248(万元) 因为590大于248大于0 所以方案A最优。 某企业为提高其产品在市场上的竞争力,现拟定三种改革方案:(1)公司组织技术人员逐渐改进技术,使用期是10年;(2)购买先进技术,这样前期投入相对较大,使用期是10年;(3)前四年先组织技术人员逐渐改进,四年后再决定是否需要购买先进技术,四年后买入技术相对第一年便宜一些,收益与前四年一样。预计该种产品前四年畅销的概率为0.7,滞销的概率为0.3。如果前四年畅销,后六年畅销的概率为0.9;若前四年滞销,后六年滞销的概率为0.1。相关的收益数据如表所示。 (1)画出决策树 (2)计算各点的期望值,并做出最优决策 投资收益 为总决策,)画出决策树,1(解 RR1为二级决策。 4 / 2

管理学决策树习题及答案

管理学决策树习题及答案-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

注意答卷要求: 1.统一代号:P为利润,C为成本,Q为收入,EP为期望利润 2.画决策树时一定按照标准的决策树图形画,不要自创图形 3.决策点和状态点做好数字编号 4.决策树上要标出损益值 某企业似开发新产品,现在有两个可行性方案需要决策。 I开发新产品A,需要追加投资180万元,经营期限为5年。此间,产品销路好可获利170万元;销路一般可获利90万元;销路差可获利-6万元。三种情况的概率分别为30%,50%,20%。 II.开发新产品B,需要追加投资60万元,经营期限为4年。此间,产品销路好可获利100万元;销路一般可获利50万元;销路差可获利20万元。三种情况的概率分别为60%,30%,10%。 (1)画出决策树

(2)计算各点的期望值,并做出最优决策 求出各方案的期望值: 方案A=170×0.3×5+90×0.5×5+(-6)×0.2×5=770(万元) 方案B=100×0.6×4+50×0.3×4+20×0.1×4=308(万元) 求出各方案的净收益值: 方案A=770-180=590(万元) 方案B=308-60=248(万元) 因为590大于248大于0 所以方案A 最优。 170 90 -6 100 50 20

某企业为提高其产品在市场上的竞争力,现拟定三种改革方案:(1)公司组织技术人员逐渐改进技术,使用期是10年;(2)购买先进技术,这样前期投入相对较大,使用期是10年;(3)前四年先组织技术人员逐渐改进,四年后再决定是否需要购买先进技术,四年后买入技术相对第一年便宜一些,收益与前四年一样。预计该种产品前四年畅销的概率为0.7,滞销的概率为0.3。如果前四年畅销,后六年畅销的概率为0.9;若前四年滞销,后六年滞销的概率为 0.1。相关的收益数据如表所示。 (1)画出决策树 (2)计算各点的期望值,并做出最优决策 投资收益 表单位:万元 解(1)画出决策树,R为总决策,R1为二级决策。

管理学决策树习题及答案

注意答卷要求: 1.统一代号:P为利润,C为成本,Q为收入,EP为期望利润 2.画决策树时一定按照标准的决策树图形画,不要自创图形 3.决策点和状态点做好数字编号 4.决策树上要标出损益值 某企业似开发新产品,现在有两个可行性方案需要决策。 I开发新产品A,需要追加投资180万元,经营期限为5年。此间,产品销路好可获利170万元;销路一般可获利90万元;销路差可获利-6万元。三种情况的概率分别为30%,50%, 20%。 II.开发新产品B,需要追加投资60万元,经营期限为4年。此间,产品销路好可获利100万元;销路一般可获利50万元;销路差可获利20万元。 三种情况的概率分别为60%,30%,10%。 (1)画出决策树 170 90 -6 100 50 20

(2)计算各点的期望值,并做出最优决策 求出各方案的期望值: 方案 A=170X0.3 >5+90X0.5 >5+(-6)区.2 >5=770(万元) 方案 B=100X0.6 >4+50X 0.3 >4+20X 0.1 >4=308(万元) 求出各方案的净收益值: 方案 A=770-180=590(万元) 方案 B=308-60=248(万元) 因为590大于248大于0 所以方案A 最优。 某企业为提高其产品在市场上的竞争力,现拟定三种改革方案:( 1)公司组织 技术人员逐渐改进技术,使用期是10年;(2)购买先进技术,这样前期投入相 对较大,使用期是10年;(3)前四年先组织技术人员逐渐改进,四年后再决定 是否需要购买先进技术,四年后买入技术相对第一年便宜一些, 收益与前四年一 样。预计该种产品前四年畅销的概率为 0.7,滞销的概率为0.3。如果前四年畅 销,后六年畅销的概率为0.9 ;若前四年滞销,后六年滞销的概率为 0.1。相关 的收益数据如表所示。 (1)画出决策树 (2)计算各点的期望值,并做出最优决策 表 解(1)画出决策树,R 为总决策,R1为二级决策。 投资收益 单位:万元

机器学习之决策树在sklearn中的实现

小伙伴们大家好~o( ̄▽ ̄)ブ,首先声明一下,我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4以上 Scikit-learn 0.20.0 (你的版本至少要0.20 Graphviz 0.8.4 (没有画不出决策树哦,安装代码conda install python-graphviz Numpy 1.15.3 Pandas 0.23.4 Matplotlib 3.0.1 SciPy 1.1.0 用SKlearn 建立一棵决策树 这里采用的数据集是SKlearn中的红酒数据集。 1 导入需要的算法库和模块

from sklearn import tree #导入tree模块 from sklearn.datasets import load_wine #导入红酒数据集 from sklearn.model_selection import train_test_split #导入训练集和测试集切分包
2 探索数据
wine = load_wine() wine.data wine.data.shape

机器学习实验报告

决策树算法 一、决策树算法简介: 决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树方法的基本思想是:利用训练集数据自动地构造决策树,然后根据这个决策树对任意实例进行判定。其中决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数有两大优点:1)决策树模型可以读性好,具有描述性,有助于人工分析;2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。 决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集。第二步,决策树的剪技:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数扼集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除、决策树方法最早产生于上世纪60年代,到70年代末。由J Ross Quinlan提出了ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进,既适合于分类问题,又适合于回归问题。 本节将就ID3算法展开分析和实现。 ID3算法: ID3算法最早是由罗斯昆(J. Ross Quinlan)于1975年在悉尼大学提出的一种分类预测算法,算法的核心是“信息熵”。ID3算法通过计算每个属性的信息增益,认为信息增益高的是好属性,每次划分选取信息增益最高的属性为划分标准,重复这个过程,直至生成一个能完美分类训练样例的决策树。 在ID3算法中,决策节点属性的选择运用了信息论中的熵概念作为启发式函数。 在这种属性选择方法中,选择具有最大信息增益(information gain)的属性作为当前划分节点。通过这种方式选择的节点属性可以保证决策树具有最小的分枝数量,使得到的决策树冗余最小。

机器学习算法总结_决策树(含代码)

第六章 提升算法 6.1 引言 当做重要决定时,大家可能都会考虑吸取多个专家而不是一个人的意见。机器学习处理问题时也是如此,这就是提升算法背后的思路,提升算法是对其它算法进行组合的一种方式,接下来我们将对提升算法,以及提升算法中最流行的一个算法AdaBoost 算法进行介绍,并对提升树以及简单的基于单层决策树的Adaboost 算法进行讨论。 提升方法是一种常用的统计学习方法,应用广泛且有效,在分类问题上,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类性能。一个分类器在训练数据上能够获得比其他分类器更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数据,这时就称为该分类器出现了过拟合(overfitting )。提升算法能够有效地防止过拟合现象的发生。 图1 过拟合现象示意图 提升算法是一种为了拟合自适应基函数模型(adaptive basis-function models, ABM )的贪心算法,自适应基函数模型可表达为: ()()01M m m m f X w w X φ==+∑ (6-1) 其中,m φ是一种分类算法或者回归算法,被称为弱分类器(weak learner )或者基分类器(base learner )。也可以表达为如下形式: 1()(;)M m m m f X b X βγ==∑ (6-2) 提升算法的目的是对以下公式的优化:

1 min (,())N i i f i L y f x =∑ (6-3) 其中,?(,)L y y 称为损失函数(loss function ),f 是ABM 模型。不同的损失函数有着不同 的性质,对应不同的提升算法,如表1所示。 将(2)式代入(3)式可得如下表达式: ,11min ,(;)m m N M i m i m i m L y x βγβφγ==?? ??? ∑∑ (6-4) 因为学习的是加法模型,如果能够从前向后,每一步只学习一个基分类器及其系数,那 么就可以简化优化的复杂度,具体推导过程如下所示: (),1 min ,(;)m m N i m i m i L y x βγβφγ=∑ (6-5) 表1 常见损失函数以及相应提升算法 名称 损失函数 导数 *f 算法 平方误差 21 (())2 i i y f x - ()i i y f x - []|i y x E L2Boosting 绝对误差 ()i i y f x - sgn(()) i i y f x - (|)i median y x Gradient boosting 指数损失 () exp ()i i y f x - () exp ()i i i y y f x -- 1 log 21i i ππ- AdaBoost 对数损失 ()log 1i i y f e -+ i i y π- 1 log 21i i ππ- LogitBoost 01 ()arg min (,(;))N i i i f X L y f x γ γ==∑ (6-6) 1,1 (,)argmin (,()(;))N m m i m i i i L y f x x βγ βγβφγ-==+∑ (6-7) 1()()(;)m m m m f X f X X βφγ-=+ (6-8) 算法不进行回溯对参数进行修改,因此该算法称为前向分步算法。 6.2 AdaBoost 算法 AdaBoost (Adaptive boosting )算法,也称为自适应提升算法。训练数据中的每个样本,并赋予其一个权重,这些权重构成向量D 。一开始,这些权重都初始化为相等值,首先 在训练数据上训练出一个弱分类器并计算该分类器的错误率,然后在同一数据集上再次训练弱分类器。再次训练分类器的过程中,将会重新调整每个样本的权重,其中上一次分对的样本权重会降低,而上一次分错的样本权重会提高。

决策树练习题

决策树作业题 公司拟建一预制构件厂,一个方案是建大厂,需投资300万元,建成后如销路好每年可获利100万元,如销路差,每年要亏损20万元,该方案的使用期均为10年;另一个方案是建小厂,需投资170万元,建成后如销路好,每年可获利40万元,如销路差每年可获利30万元;若建小厂,则考虑在销路好的情况下三年以后再扩建,扩建投资130万元,可使用七年,每年盈利85万元。假设前3年销路好的概率是0.7,销路差的概率是0.3,后7年的销路情况完全取决于前3年;为了适应市场的变化,投资者又提出了第三个方案,即先小规模投资160万元,生产3年后,如果销路差,则不再投资,继续生产7年;如果销路好,则再作决策是否再投资140万元扩建至大规模(总投资300万元),生产7年。前3年和后7年销售状态的概率见表16,大小规模投资的年损益值同习题58。试用决策树法选择最优方案。 表16 销售概率表 决策树例题 1.某投资者预投资兴建一工厂,建设方案有两种:①大规模投资300万元;②小规模投资160万元。两 个方案的生产期均为10年,其每年的损益值及销售状态的规律见下表。试用决策树法选择最优方案。

(2)计算各状态点的期望收益值 节点②:[100*0.7+(-20)*0.3]*10-300=340; 节点③:[60*0.7+20*0.3]*10-160=320; 将各状态点的期望收益值标在圆圈上方。 (3)决策 比较节点②与节点③的期望收益值可知,大规模投资方案优于小规模投资方案,故应选择大规模投资方案,用符号“//”在决策树上“剪去”被淘汰的方案。 2.某项目有两个备选方案A和B,两个方案的寿命期均为10年,生产的产品也完全相同,但投资额 及年净收益均不相同。A方案的投资额度为500万元,其年净收益在产品销售好时为150万元,销售差时为50万元;B方案的投资额度为300万元,其年净收益在产品销售好时为100万元,销售差时为10万元,根据市场预测,在项目寿命期内,产品销路好时的可能性为70%,销路差的可能性为30%,试根据以上资料对方案进行比较。

利用期望值决策树等解管理学计算题示范

利用期望值、决策树和其他数学模型分析解题示范 管理学一些经典计算题如下 1.某化工厂1990年生产某种产品,售价1000元,销售量为48000台,固定费用3200万元,变动费用2400万元,求盈亏平衡点产量? 解答: 令W ——单件产品价格,C V ——单件产品变动费用,F ——固定费用,X ——销售量; 令S ——销售收入,所以,S=WX 令Y ——总费用,所以,Y=F+C V X 盈亏平衡时:S=Y ,即WX=F+ C V X ,得到盈亏平衡点产量X 0=V C W F - 因此,代入计算:F=3200万元 W=1000元 C V X=2400万元 X=48000台(由后两式得出C V =5000元) 最后得到:X 0=64000台 2.某企业计划生产一产品,经市场调查后预计该产品的销售前景有两种可能:销路好,其概率是0.6,销路差,其概率是0.4,可采用的方案有两个:一个是新建一条流水线,需投资2000万元,另一个是对原有设备进行技术改造,需投资500万元,两个方案的使用期均为 解答: 第二步: 计算期望值 结点2的期望值为 =-??-+?2000104.02006.0700】)(【1400 700 -200 500 100

结点3的期望值为 =-??+?500104.01006.0500】【2900 因此,从期望值来看,第二种方案更好。 解答: 第一步: 排列各个工序的顺序,在每个字母下面画上箭头,用来表示这个字母代表的工序 第二步:每个工序的头和尾都要有一个事件,用圆圈代表这个事件,并按照从左到右,从上 A B C D E H F G I J

相关主题
文本预览
相关文档 最新文档