H信息系统项目管理师考点分析之八：决策树分析

格式：doc
大小：46.50 KB
文档页数：2

下载文档原格式

决策树分析方法

客户流失的预测
总结词
采用决策树分析方法对客户流失进行预测，帮助企业了解可能导致客户流失的关键因素，从而制定相应的客户保持策略。
详细描述
通过对企业历史数据的深入挖掘和分析，利用决策树算法构建一个客户流失预测模型。该模型可以识别出那些具有较高流失风险的客户，并为企业提供相应的解决策略，如针对这些客户提供更加个性化的服务和优惠，加强客户关系维护等。
集成学习方法
深度学习
将决策树与其他机器学习方法集成，如随机森林、梯度提升等，可以提高预测性能和可解释性。
利用深度学习技术改进决策树的训练和优化过程，提高模型的表示能力和预测精度。
特征选择和表示学习
可解释性和透明度
发展更有效的特征选择和表示学习方法，以更好地捕捉数据中的复杂模式和关系。
研究提高决策树可解释性的方法，如决策树剪枝、可视化技术等，以满足用户对模型透明度的需求。
决策树在回归问题中的应用
适用场景
决策树在回归问题中也有广泛应用，如预测房屋售价、股票价格等连续值。
实例
在预测房屋售价场景中，决策树可以通过对房屋属性进行划分，并赋予各个属性不同的权重，最终得出房屋售价的预测值。
决策树在时间序列预测中的应用
适用场景
决策树可以应用于时间序列预测问题中，如股票价格、气候预测等。
决策树的计算过程
数据准备
收集和准备需要分析的数据集，对数据进行清洗、预处理和规范化等操作，使其符合决策
树算法的要求。
特征选择
选择与目标变量相关性较高的特征作为节点，并计算每个特征的信息增益、基尼指数等指标，为决策树的建立提供依据
。
树的建立
根据选择出的特征，从根节点开始，按照一定的顺序将数据集划分成若干个子集，然后为每个子集生成新的分支，如此递归地构建出整个决策树。

信息系统项目管理师计算专题1

2021年5月高级& 中级计算专题1【例1】项目需购买一项资产，投入50万元，50%的概率能收入100万元，20%的概率能收入200万元，15%的概率能收入250万元，10%的概率不赚不赔，5%的概率亏损500万元。

则投资这项资产的投资回报为（）万元。

A、102.5B、77.5C、60.5D、52.5【解析】收入：100*50% + 200 * 20% + 250* 15% + 0*10% +（-500）*5% =102.5投资回报= 收入–投入= 102.5 -50 =52.5【例2】决策树分析法通常用决策树图表进行分析，根据下表的决策树分析法计算，图中机会节点的预期收益EMV分别是90和( ？)(单位:万元)A、160 B.150 C.140 D.100开发或升级开发升级顺利不利顺利不利75% $30025% $6075% $15025% $70-$ 100-$ 40机会节点的EMV $90机会节点的EMV （？）$110$30 TrueFalse-$40$200【例3】在对某项目采购供应商的评价中，评价项有:技术能力、管理水平、企业资质等，假定满分为10分，技术能力权重为20%，三个评定人的技术能力打分分别为7分，8分，9分，那么该供应商的"技术能力"的单项综合分为()。

A、24 C、4. 8 D、1. 6B、8【解析】（7+8+9）/3 * 20% =1.6【例4】评估和选择最佳系统设计方案时，甲认为可以采用点值评估方法，即根据每一个价值因素的重要性，综合打分在选择最佳的方案。

乙根据甲的提议，对系统A 和系统B 进行评估，评估结果如下表所示，那么乙认为()A 、最佳方案是AB 、最佳方案是BC 、条件不足，不能得出结论D 、只能用成本/效益分析方法做出判断。

评估因素的重要性系统A 系统B 评估值评估值硬件40%9080软件40%8085供应商支持20%8090【解析】系统A= 90 *40%+ 80 * 40% + 80* 20% =84系统B = 80*40%+85*40%+90*20% =843、自制与外购决策--采购管理【例5】某项目实施需要甲产品，若自制，单位产品的可变成本为12元，并需另外购买一台专用设备，该设备价格为4000元；若采购，则一件需要17元，现在该项目需要此产品800件，如果你是项目经理，你会采用()的方式获得。

决策树分析与统计

决策树分析与统计在现代数据分析与机器学习领域，决策树是一种非常重要的算法。

它不仅具有直观易懂的特点，也具备强大的分类和回归能力。

决策树通过树形结构展示决策过程，能够帮助我们理解数据并做出相关决策。

本文将深入探讨决策树的基本概念、构建方法、优缺点以及其在统计分析中的应用。

一、决策树的基本概念决策树是一种用于分类和回归的模型，其通过一系列规则将数据集划分成多个小部分，最终形成一个树状结构。

在这棵树中，每个内部节点代表一个特征（属性），每条边代表一个特征值分裂，而每个叶子节点则表示最终的结果或预测值。

二、决策树的构建方法构建决策树的关键在于如何选择特征来进行数据划分。

常用的方法有：1. 信息增益信息增益是基于信息论的重要概念，用于评估选择某一特征进行划分后能带来的信息量增加。

计算公式为：[ IG(D, A) = H(D) - H(D|A) ]其中，( H(D) )为数据集D的信息熵，( H(D|A) )为给定特征A后的条件熵。

信息增益越高，意味着通过该特征进行划分后，数据的不确定性减少得越多，从而可用于选择最优特征进行分裂。

2. 基尼指数基尼指数是另一种衡量特征优劣的方法，主要被用于CART （Classification and Regression Trees）算法中。

其计算公式为：[ Gini(D) = 1 - (p_i)^2 ]其中，( p_i )代表类别i在数据集D中所占的比例。

基尼指数越低，表示数据集中类别越纯粹，也就越适合用该特征进行分裂。

3. 剪枝为了避免过拟合，决策树模型通常需要进行剪枝操作。

剪枝的主要思想是在树的生成过程中，如果发现某些节点的存在对模型预测效果并无显著提升，则应将其去掉。

常见的剪枝方法有预剪枝和后剪枝。

三、决策树的优缺点决策树作为一种流行的数据挖掘技术，其优势与劣势并存。

优点直观易懂：决策树采用树形结构展示，每一步都可以清晰地看到如何做出分类或预测，因此极具可解释性。

软考高级《信息系统项目管理师》计算公式汇总(考前必背)

软考高级《信息系统项目管理师》计算公式汇总一、进度计算关键路径：项目中时间最长的活动顺序。

总浮动时间：本活动的最迟完成时间－本活动最早完成时间（注：关键路径总浮动时间为零）。

自由浮动时间：紧后活动最早开始时间的最小值－本活动的最早完成时间（当紧后活动只有一个的时候自由浮动时间为0，当有2 个紧后活动时取最小值）。

三点估算法：（乐观时间＋4 最可能时间＋悲观时间）/6。

二、成本计算（1）偏差指标进度偏差SV＝EV－PVSV>0：进度提前SV＝0：进度符合预期SV<0：进度落后成本偏差CV＝EV－ACCV>0：成本节约CV＝0：成本符合预期CV<0：成本超支（2）绩效指标进度绩效指数SPI＝EV/PVSPI>0：进度提前SPI＝0：进度符合预期SPI<0：进度落后成本绩效指数CPI＝EV/ACCPI>0：成本节约CPI＝0：成本符合预期CPI<0：成本超支（3）完工尚需估算典型ETC＝（BAC－EV）/CPI非典型ETC＝BAC－EV（4）完工估算典型：EAC＝AC＋（BAC－EV）/CPI非典型：EAC＝AC＋（BAC－EV）进度成本同时作用EAC＝（BAC－EV）/（CPI*SPI）V AC（完工偏差）＝BAC－EAC（5）完工尚需绩效指数TCPI＝（BAC－EV）/（BAC－AC）TCPI＝（BAC－EV）/（EAC－AC）（BAC 不可行，分母变EAC）三、单选计算净现值分析：净现值分析是指把所有预期的未来现金流入与流出都折算成现值，以计算一个项目预期的净货币收益与损失。

净现值越大越好！（1）确定项目现金流现金流（利润）＝现金流入－现金流出＝收益－成本（2）计算净现值：t：现金流持续时间A：每年的现金流量r：折现率投资收益率分析：投资收益率是将净收入除以投资额的所得值。

计算多年份项目的投资收益率时，对收益和投资进行折现。

投资收益率ROI＝（总的折现收益－总的折现成本）/折现成本＝折现利润/折现成本ROI越大越好。

如何利用决策树分析解决问题

如何利用决策树分析解决问题决策树是一种常见且有效的数据分析工具，它能够帮助我们理清问题的逻辑关系并做出准确的决策。

无论是在商业、科研还是日常生活中，决策树都具有广泛的应用。

本文将介绍如何利用决策树分析解决问题，并提供一些实用的技巧和案例分析。

一、决策树的基本概念决策树是一种以树状结构表示决策规则的模型。

它由根节点、内部节点和叶节点组成，其中根节点代表问题的提出，内部节点代表问题的判断条件，叶节点代表问题的解决方案。

通过依次对问题进行判断，最终到达叶节点得到问题的解决方案。

二、决策树的构建方法构建一棵决策树需要以下几个步骤：1. 收集数据：收集问题相关的数据，并整理成表格的形式。

表格的每一行代表一个样本，每一列代表一个特征。

2. 选择划分属性：根据数据的特征进行划分属性的选择，常用的指标有信息增益、信息增益率、基尼指数等。

3. 构建决策树：根据选择的划分属性，递归地对数据进行划分，直到所有的样本都属于同一个类别或者无法继续划分为止。

4. 剪枝处理：根据实际情况对决策树进行剪枝处理，避免过拟合问题。

三、决策树的应用案例1. 商业决策：决策树可以帮助企业根据过去的销售数据和市场情况，对不同的产品进行合理的定价策略、推广策略和促销策略的制定。

2. 医学诊断：决策树可以对疾病的症状和检测结果进行分析，并帮助医生判断疾病的类型和治疗方案。

3. 个人贷款：银行可以利用决策树对个人信用评级进行分析，从而判断是否给予贷款以及贷款的利率和额度。

4. 电子商务推荐系统：决策树可以根据用户的购买记录和兴趣偏好，为用户推荐相似的商品或服务。

四、决策树分析的注意事项1. 数据质量：决策树的准确性和稳定性依赖于数据的质量，因此需要对数据进行清洗和预处理，排除噪声和异常值。

2. 属性选择：划分属性的选择对构建决策树的准确性和效率有重要影响，需要根据具体问题选择合适的划分属性。

3. 过拟合问题：决策树容易过拟合训练数据，在构建决策树时需要进行剪枝处理或采用其他方法避免过拟合。

决策树原理和简单例子

决策树原理和简单例子决策树是一种常用的机器学习算法，它可以用于分类和回归问题。

决策树的原理是基于一系列的规则，通过对特征的判断来对样本进行分类或预测。

下面将通过原理和简单例子来介绍决策树。

1. 决策树的原理决策树的构建过程是一个递归的过程，它将样本集合按照特征的不同取值分割成不同的子集，然后对每个子集递归地构建决策树。

构建决策树的过程是通过对特征的选择来确定每个节点的划分条件，使得信息增益或信息增益比最大。

2. 决策树的构建假设有一个分类问题，样本集合包含n个样本，每个样本有m个特征。

决策树的构建过程如下：(1) 若样本集合中的样本都属于同一类别，则构建叶子节点，并将该类别作为叶子节点的类别标签。

(2) 若样本集合中的样本特征为空，或者样本特征在所有样本中取值相同，则构建叶子节点，并将该样本集合中出现次数最多的类别作为叶子节点的类别标签。

(3) 若样本集合中的样本特征不为空且有多个取值，则选择一个特征进行划分。

常用的划分方法有信息增益和信息增益比。

(4) 根据选择的特征的不同取值将样本集合划分成多个子集，对每个子集递归地构建决策树。

(5) 将选择的特征作为当前节点的判断条件，并将该节点加入决策树。

3. 决策树的例子假设有一个二分类问题，样本集合包含10个样本，每个样本有2个特征。

下面是一个简单的例子：样本集合：样本1：特征1=0，特征2=1，类别=1样本2：特征1=1，特征2=1，类别=1样本3：特征1=0，特征2=0，类别=0样本4：特征1=1，特征2=0，类别=0样本5：特征1=1，特征2=1，类别=1样本6：特征1=0，特征2=0，类别=0样本7：特征1=1，特征2=0，类别=0样本8：特征1=0，特征2=1，类别=1样本9：特征1=1，特征2=1，类别=1样本10：特征1=0，特征2=1，类别=1首先计算样本集合的信息熵，假设正样本和负样本的比例都是1:1，信息熵为1。

选择特征1进行划分，计算信息增益：对于特征1=0的样本，正样本有2个，负样本有2个，信息熵为1。

信息系统项目管理师五类常见计算题

信息系统项目管理师五类常见计算题1静态回收期与投资回报率IT项目投资收益分析（财务）方法投资回收期（PBP）（Pay Back Period）例子：投资回报率（ROI）2 动态回收期与投资收益率根据表中的数据，该产品的动态投资回收期是__(7)__年，投资收益率是__(8)__。

（7）A．1 B．2 C．2.27 D．2.73（8）A．42% B．44% C．50% D．100%投资收益率=1/动态投资回收期从该表能够看出，到第三年即2007年开始收回投资，动态投资回收率要考虑贴现率，只是此表已给出净现值。

第三年要收回-929.93+428.67+396.92=100.34 万元才能将投资全部收回，第三年总共能够收入净现值为367.51，则100.34万元大概需要100.34/367.51=0.27年。

因此，动态投资回收率=2年+0.27年=2.27年。

投资收益率的计算： 925.93万元需要2.27年才能收回，因此每年平均回收925.93/2.27万元，投资收益率=平均每年需要回收金额/总投资金额=925.93/2.27/925.93=1/2.27=0.44=44%3 关键路径识别与进度规划项目有关的任务如下：第一项任务是比较现有电子商务平台，按照正常速度估算完成这项任务需要花10天，成本为15000元。

但是，假如使用同意的最多加班工作量，则可在7天、18750元的条件下完成。

一旦完成比较任务，就需要向最高层管理层提交项目计划与项目定义文件，以便获得批准。

项目团队估算完成这项任务按正常速度为5天，成本3750元，假如赶工为3天，成本为4500元。

当项目团队获得高层批准后，各项工作就能够开始了。

项目团队估计需求分析为15天，成本45000元，如加班则为10天，成本58500元。

设计完成后，有3项任务务必同时进行：①开发电子商务平台数据库；②开发与编写实际网页代码；③开发与编写电子商务平台表格码。

项目管理常用工具-决策树

决策树预测项目期望值，做出风险决策什么是决策树决策树是一种运用树状网络图形，根据期望（损益）值决策准则进行项目战略决策分析的工具。

决策树的作用能有效地对风险型项目进行战略决策分析；运用树状网络图直观、方便、易操作；是一种定量的决策分析工具，可以有效地解决多级（序贯）决策问题。

怎么做决策树由以下四部分组成，如下图：☐决策节点方案节点—树枝✧树梢决策树图—图11.画出决策树A 先画一决策节点“☐”；B 从决策节点引出方案分枝，分枝上注明方案名或代号；C 方案分枝的末端画上方案节点“ ”；D 从每个方案节点引出状态分枝“—”，分枝上注明状态名、代号及其出现的概率；C 树梢末画上结果节点“△”，旁边注明相应的损益值。

提示：按照从左到右的顺序画决策树，画决策树的过程本身就是一个对决策问题进一步深入探索的过程。

例：某计算机制造商为开发一种市场需要的新产品考虑筹建一个分厂。

经过调查研究取得以下有关资料：决策树---表1决策树—图22．计算各方案的期望值损益值按从右到左的顺序计算期望损益值，并将结果标注在相应的状态节点处。

点⑤：[100*0.9+(-20)*0.1]*7(年)=616点②：(-20)*0.1*7(年)=140100*0.7*3(年)+616*0.7+(-20)*0.3*3(年)+(-140)*0.3-300(建大厂投资)=281.2点⑧：(40*0.9+30*0.1)*7(年)=273点⑨：[95*0.9+(-20)*0.1]*7(年)-200(扩建投资)=384.5 因384.5>273,说明扩建方案好;划掉不扩建方案,并将点9的期望值转移到点6处.点⑦：30*1.0*7(年)=210点③：40*0.7*3(年)+384.5*0.7+30*0.3*3(年)+210*0.3-120(建小厂投资)=323.2带有期望损益值的决策树：（单位：万元）见下页图决策树—图33.确定最优方案选择收益期望值最大（或损失值最小）的方案作为最优方案，并将期望值标在决策节点处。

项目管理中的决策分析方法

项目管理中的决策分析方法在项目管理中，决策分析是一种重要的方法，用于帮助项目经理和团队做出明智的决策，以实现项目的目标。

决策分析方法能够帮助项目团队评估不同的方案和选择，并确定最佳的决策路径。

本文将介绍几种常见的决策分析方法，并探讨其在项目管理中的应用。

一、敏感性分析敏感性分析是一种常用的决策分析方法，旨在评估项目中不同变量对结果的影响。

通过对项目关键变量进行敏感性分析，项目团队可以了解到不同变量的重要性，并据此制定相应的决策策略。

例如，在一个建筑项目中，项目经理可以通过敏感性分析来评估材料成本、人力资源和工期等因素对项目成本和进度的影响，以便及时做出调整和决策。

二、决策树分析决策树分析是一种通过构建决策树来辅助决策的方法。

决策树是一种图形化的工具，将决策问题分解为一系列的决策和可能的结果，以帮助项目团队理解不同决策路径的优劣，并选择最佳的决策方案。

决策树分析可以在复杂的决策问题中提供清晰的决策路径，帮助项目团队做出明智的决策。

三、成本效益分析成本效益分析是一种常用的决策分析方法，用于评估不同决策方案的成本和效益。

通过比较不同方案的成本和效益，项目团队可以确定最具经济效益的决策方案。

成本效益分析可以帮助项目团队在有限的资源下做出最优的决策，并最大限度地实现项目目标。

四、风险分析风险分析是一种用于评估项目风险和制定风险应对策略的决策分析方法。

通过对项目风险进行分析和评估，项目团队可以了解到不同风险事件的概率和影响，并据此制定相应的风险应对策略。

风险分析可以帮助项目团队在项目执行过程中及时应对风险，减少风险对项目目标的影响。

五、多属性决策分析多属性决策分析是一种常用的决策分析方法，用于评估不同决策方案的多个属性，并确定最佳的决策方案。

通过对不同方案的属性进行量化和评估，项目团队可以了解到不同方案在不同属性上的优劣，并据此做出决策。

多属性决策分析可以帮助项目团队综合考虑各种因素，选择最适合项目目标的决策方案。

决策树知识点总结

决策树知识点总结1. 决策树算法原理决策树算法的核心思想是通过对特征进行逐步划分，将数据集划分为不同的子集，使得每个子集内的数据尽可能属于同一类别。

在划分过程中，算法会选择一个最优的特征进行划分，使得划分后的子集的纯度最大。

通常情况下，我们会选择信息增益或基尼指数作为划分标准，以找到最优的划分特征。

决策树算法的训练过程可以分为以下几步：（1）选择最优的划分特征：通过计算每个特征的信息增益或基尼指数，选择最优的划分特征。

（2）将数据集按照最优特征进行划分：根据最优特征的取值将数据集划分为不同的子集。

（3）递归的训练子树：对划分得到的每个子集进行递归的训练，直到满足停止条件为止。

这样就可以得到一棵完整的决策树，用于对新数据进行预测。

2. 常见的决策树算法目前比较常见的决策树算法包括ID3、C4.5、CART和CHAID等。

ID3（Iterative Dichotomiser 3）算法是一种基于信息增益进行特征选择的决策树算法。

该算法在每次划分时选择信息增益最大的特征进行划分，直到所有特征都被使用或者剩余数据集中的样本属于同一类别。

C4.5算法是ID3算法的改进版，它使用信息增益比进行特征选择，解决了ID3算法可能会选择取值较多的特征进行划分的问题。

CART（Classification And Regression Tree）算法可以用于分类和回归问题，它使用基尼指数进行特征选择，对分类问题得到的决策树是二叉树结构。

CHAID（Chi-squared Automatic Interaction Detection）算法是一种基于卡方检验进行特征选择的决策树算法，适用于分类问题。

3. 决策树的优缺点（1）优点：决策树算法易于理解和解释，生成的决策树可以直观地表示分类的过程和结果。

此外，决策树算法可以处理数值型和类别型的数据，对缺失值和异常值具有较好的鲁棒性。

另外，决策树算法可以自动选择特征，不需要人工选择。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信息系统项目管理师考点分析之八：决策树分析
一、决策树分析讲解
决策树分析采用决策树图表进行分析，它描述了每一种可能的选择和这种情况发生的概率。

如下图：
其中：
矩形图代表决策点，表示需要在这点上作出选择；
圆形图代表每一种选择的收益点。

P代表概率，P=0.6,表示概率为60%；
各点的投入值如下：
M->N调研论证阶段，投入40万；
P->Q如采用设计开发方式，需投入260万，如成功则获利600万，失败则罚款100万。

P->R如采用设备更新，需投入160万，如成功则获利600万，失败则罚款100万。

期望值的计算方法：各概率分支的【（获利值-当前整条路径的投入值）*概率值】之和。

根据上面的计算方法，Q、R和N三个收益点的期望值计算如下：
Q点收益的期望值=（600-260-40）*0.8+（-100-260-40）*0.2=160
R点收益的期望值=（600-160-40）*0.5+（-100-160-40）*0.5=50
N点收益的期望值计算不同于Q和R点，因为后面决策点P，这种情况，通常我们取后面决策点期望值最大的参与计算，如下：
N点收益的期望值=160（这里取Q点）*0.4+（-40）*0.6=40。

结论：通过对Q、R、N点的计算，选择Q点为最佳方案。

注：从历年试题看，实际考试题目要比例题简单。

二、其他软考真题
●某公司希望举办一个展销会以扩大市场，选择北京、天津、上海、深圳作为候选会址。

获利情况除了会址关系外，还与天气有关。

天气可分为晴、多云、多雨三种。

通过天气预报，估计三种天气情况可能发生的概率为0.25、0.50、0.25，其收益（单位：人民币万元）情况见下表。

使用决策树进行决策的结果为（61）。

(2009年上半年)
（61）A．北京B．天津C．上海D．深圳
分析：
北京：4.5*0.25+4.4*0.5+1*0.25=1.125+2.2+0.25=3.575
天津: 5*0.25 +4*0.50 + 1.6*0.25=1.25+2+0.4=3.65
上海6*0.25 + 3*0.5 + 1.3*0.25=1.5+1.5+0.325=3.325
深圳5.5*0.25 + 3.9*0.5 + 0.9*0.25=1.375+1.95+0.225=3.55
答案：B
●某电子商务公司要从A地向B地的用户发送一批价值90000元的货物。

从A地到B地有水、陆两条路
线。

走陆路时比较安全，其运输成本为10000元;走水路时一般情况下的运输成本只要7000元，不过一旦遇到暴风雨天气，则会造成相当于这批货物总价值的10%的损失。

根据历年情况，这期间出现暴风雨天气的概率为1/4，那么该电子商务公司_(70)。

（2008年上半年）
(70)A.应选择走水路B.应选择走陆路
C.难以选择路线
D.可以随机选择路线
分析：本题采用计算期望成本最低的分支作为最佳方案。

Ø水路
好天气P=0.75成本=7000
坏天气P=0.25成本=7000+90000*0.1=16000
Ø陆路
好天气P=0.75成本= 10000
坏天气P=0.75成本= 10000
水路期望成本=7000*0.75+16000*0.25=9250
陆路期望成本=10000*0.5+10000*0.5=10000
因走水路的期望成本低于走陆路的期望成本，故本题选取水路。

答案：A。