决策树与随机森林

格式：ppt
大小：3.01 MB
文档页数：25

下载文档原格式

/ 25

了解机器学习中的随机森林算法和决策树模型

了解机器学习中的随机森林算法和决策树模型一、介绍机器学习中的随机森林算法和决策树模型是常用的监督学习方法，被广泛应用于分类和回归问题。

本文将详细介绍这两个模型的原理以及它们在机器学习中的应用。

二、决策树模型1. 原理决策树是通过一系列的判断条件对数据进行分类或预测的模型。

其原理是基于对样本特征属性进行分割，直至得到能够完全分开不同类别的叶节点。

决策树模型具有易于理解、可解释性强等优点，适用于处理有离散特征和连续特征的数据集。

2. 构建过程决策树模型构建过程包括选择最佳划分属性、生成子节点以及递归构建子树等步骤。

通过计算划分属性的信息增益或其他指标，选择最佳属性作为当前节点的分裂条件。

然后将数据集按照该属性值进行划分，并递归地生成子节点，直到满足停止条件（如达到叶节点或深度限制）为止。

3. 应用领域决策树模型在多个领域都能得到广泛应用。

例如，在医学领域，可以利用决策树模型对患者的症状和各种检测指标进行分类，以辅助医生做出诊断决策。

在金融领域，可以通过构建决策树模型进行信用评分，帮助银行判断借款人的还款能力。

三、随机森林算法随机森林是一种基于集成学习思想的算法，它由多个决策树组成。

它通过对原始数据集进行有放回抽样（bootstrap）得到多个样本子集，并利用这些子集构建不同的决策树。

最后通过投票或平均等方式综合各决策树的结果来做出最终预测。

随机森林算法能够处理高维度数据和离群点，并且不容易过拟合。

2. 构建过程随机森林算法包括两个重要步骤：创建随机子集和构建决策树。

创建随机子集时，首先从原始数据集中进行有放回抽样得到训练集，然后再从每个特征子集中选择最佳划分属性。

构建决策树的过程与决策树模型相似，但在节点划分时只考虑随机子集中的一部分特征。

3. 应用领域随机森林算法被广泛用于文本分类、图像识别、推荐系统等领域。

在文本分类中，可以利用随机森林对文章或评论进行情感分析，帮助企业了解用户对其产品的态度。

在推荐系统中，可以利用随机森林对用户的历史行为进行分析，并给出个性化的推荐结果。

《决策树与随机森林》课件

交叉验证
使用交叉验证来评估模型的泛化能力，以避免过拟合。
随机森林的参数调整
1 2
决策树数量
调整决策树的数量，以找到最优的模型性能。
特征子集大小
调整在每一步分裂中选择的特征子集大小，以找到最优的模型性能。
3
决策树深度
调整决策树的深度限制，以防止过拟合或欠拟合。
05
决策树与随机森林的应用场景
分类问题
THANKS
感谢观看
随机森林的优缺点
可解释性强
每棵决策树都可以单独解释，有助于理解模型的工作原理。
鲁棒
对异常值和噪声具有较强的鲁棒性。
随机森林的优缺点
对参数敏感
随机森林中的参数如树的数量、特征选择比例等对模型性能影响较大。
可能产生过拟合
当数据集较小或特征过多时，随机森林可能产生过拟合。
04
随机森林算法
随机森林的生成
决策树的基本原理
特征选择
选择最能划分数据集的特征进行分裂，以减少决策树的深度和复杂度。
剪枝
通过去除部分分支来降低过拟合的风险，提高模型的泛化能力。
决策规则
将每个叶子节点映射到一个类别或值，根据该节点所属类别或值进行预测。
决策树的优缺点
优点
易于理解和解释，分类效果好，对异常值和缺失值容忍度高。
在构建每棵决策树时，随机选择一部分特征进行划分，增加模型的泛化能力。
多样性
通过生成多棵决策树，增加模型的多样性，降低过拟合的风险。
集成学习
将多棵决策树的预测结果进行汇总，利用投票等方式决定最终输出，提高分类任务的准确率。
随机森林的优缺点
高效
能够处理大规模数据集，计算效率高。

决策树和随机森林

决策树和随机森林
决策树和随机森林都是基于树的算法，他们都可以用来解决分类和回
归问题。

决策树是一种树状图数据结构，它以关于属性的条件分支形式存
储数据。

决策树的优势在于模型易于解释和理解，非常适合作为通过视觉
或可视化的方式表达和解释结果的模型。

它可以用于编码大量的属性关系，并能够有效的处理具有缺失值和噪声的数据集。

然而，决策树也有一些缺点，例如它的复杂性和过拟合的可能。

而随机森林是一种机器学习算法，它位于决策树和贝叶斯方法之间，
通过在大量决策树之间进行加权，来降低过拟合现象。

它可以建立一个由
多个决策树组成的森林，并且可以有效处理大量的数据。

随机森林算法改
善了决策树的过拟合现象，具有更高的分类准确性和鲁棒性。

另外它也可
以有效地处理各种类型的属性，处理大量的实例和多种样本分布。

决策树和随机森林在解决不同的问题时有所不同。

对于具有较少噪声
的数据集，决策树通常具有更高的准确性。

但是，对于有噪声的数据集，
随机森林通常可以更好地处理这些噪声，而且也不太可能出现过拟合的情况。

此外，随机森林也可以有效地处理具有多种样本分布的数据集。

总的来说。

决策树与随机森林模型的比较与使用指南(Ⅰ)

决策树与随机森林模型的比较与使用指南在机器学习领域，决策树和随机森林是两种常见的分类和回归模型。

它们都可以用于处理结构化数据，如表格数据或特征向量。

本文将对决策树与随机森林这两种模型进行比较，并提供使用指南。

一、决策树决策树是一种树形结构的模型，用于表示各种可能的决策路径。

它通过对数据的特征进行递归分割，最终生成一个树状结构。

在决策树中，每个节点代表一个特征，每个分支代表一个可能的取值，而每个叶子节点代表一个类别或数值输出。

使用决策树模型时，可以根据特征的重要性来进行特征选择，也可以解释模型的预测结果。

此外，决策树模型对数据的缺失值和异常值有较强的鲁棒性，能够处理非线性关系和交互效应。

但是，决策树模型也存在一些缺点。

它容易过拟合，尤其是在处理高维数据时。

另外，决策树对数据的微小变化较为敏感，容易产生不稳定的结果。

二、随机森林随机森林是一种集成学习方法，通过构建多个决策树来进行分类或回归。

在随机森林中，每个决策树都是由对原始数据进行有放回抽样得到的不同训练集构建而成。

最终的预测结果是由所有决策树的预测结果取平均值或投票决定。

随机森林模型具有较高的准确率和泛化能力，对于大规模高维数据集也有很好的表现。

它能够有效地减少过拟合的风险，对噪声和异常值有一定的鲁棒性。

然而，随机森林模型也有一些缺点。

它对于数据集中的线性关系不够敏感，有时可能会产生较大的计算开销。

此外，由于随机森林模型的复杂性，对于模型的解释相对困难。

三、如何选择在选择模型时，可以根据实际的问题和数据情况来进行权衡。

如果数据集较小，并且希望得到模型的解释和可视化结果，可以选择决策树模型。

如果数据集较大，并且追求更高的准确率和泛化能力，可以选择随机森林模型。

另外，在使用随机森林模型时，可以通过调节决策树的数量、树的深度和特征的个数等超参数来优化模型的性能。

在训练过程中，还可以通过交叉验证等方法来评估模型的性能，并进行模型选择。

总之，决策树和随机森林是两种常见的机器学习模型，它们各自具有一定的优势和不足。

数据分析中的决策树和随机森林算法

数据分析中的决策树和随机森林算法数据分析在各个领域中发挥着重要的作用，帮助人们更好地理解和应对复杂的问题。

而在数据分析的过程中，决策树和随机森林算法是常见且广泛应用的两种方法。

它们能够从大量的数据中提取有价值的信息，辅助决策和预测。

本文将详细介绍决策树和随机森林算法的原理和应用，并对比它们的优缺点。

一、决策树算法决策树算法是一种基于树形结构的监督学习方法，通过将数据集分割成较小的子集，逐步构建决策树来进行决策和预测。

决策树的节点表示属性或特征，分支代表属性的取值，叶节点表示决策结果。

决策树的构建过程主要包括三个步骤：特征选择、树的构建和剪枝。

特征选择是指通过某种指标选择最佳的特征作为节点，将数据集划分成更具分类能力的子集。

树的构建是指根据选择的特征递归地将子集进一步划分，直到子集中的数据都属于同一类别或者满足停止条件。

剪枝是为了避免过拟合，通过删除某些节点来简化决策树。

决策树算法具有以下优点：易于理解和解释，可以处理数值型和离散型数据，对缺失值和异常值具有较好的鲁棒性。

然而，决策树的训练过程容易受到训练集的噪声和特征选择的不准确性等因素的影响，容易产生过拟合现象。

二、随机森林算法随机森林算法是一种集成学习方法，由多个决策树组成。

每个决策树都是通过对原始数据集进行有放回抽样（bootstrap）得到的。

在每个节点上，随机森林会随机选择一部分特征进行特征选择，再选择最佳特征进行节点分割。

最终，随机森林通过投票或平均值来进行决策。

随机森林算法继承了决策树算法的优点，并对其进行了改进。

相比于单个决策树，随机森林具有更高的预测准确性和鲁棒性。

通过集成多个决策树，随机森林可以降低过拟合的风险，并且能够处理大规模高维数据集。

此外，随机森林还可以通过特征重要性评估每个特征在分类任务中的重要程度。

然而，随机森林算法也存在一些缺点。

首先，随机森林的训练过程较慢，特别是在处理大规模数据集时。

其次，随机森林模型的结果较难解释，不如决策树直观。

决策树、支持向量机、logistic、随机森林分类模型的数学公式

决策树、支持向量机、logistic、随机森林分类模型的数学公式决策树（Decision Tree）是一种基于树状结构进行决策的分类和回归方法。

决策树的数学公式可以表示为：对于分类问题：f(x) = mode(Y), 当节点为叶子节点f(x) = f_left, 当 x 属于左子树f(x) = f_right, 当 x 属于右子树其中，mode(Y) 表示选择 Y 中出现最频繁的类别作为预测结果，f_left 和 f_right 分别表示左子树和右子树的预测结果。

对于回归问题：f(x) = Σ(y_i)/n, 当节点为叶子节点f(x) = f_left, 当 x 属于左子树f(x) = f_right, 当 x 属于右子树其中，Σ(y_i) 表示叶子节点中所有样本的输出值之和，n 表示叶子节点中样本的数量，f_left 和 f_right 分别表示左子树和右子树的预测结果。

支持向量机（Support Vector Machine，简称 SVM）是一种非概率的二分类模型，其数学公式可以表示为：对于线性可分问题：f(x) = sign(w^T x + b)其中，w 是超平面的法向量，b 是超平面的截距，sign 表示取符号函数。

对于线性不可分问题，可以使用核函数将输入空间映射到高维特征空间，公式变为：f(x) = sign(Σα_i y_i K(x_i, x) + b)其中，α_i 和 y_i 是支持向量机的参数，K(x_i, x) 表示核函数。

Logistic 回归是一种常用的分类模型，其数学公式可以表示为：P(Y=1|X) = 1 / (1 + exp(-w^T x))其中，P(Y=1|X) 表示给定输入 X 的条件下 Y=1 的概率，w 是模型的参数。

随机森林（Random Forest）是一种集成学习方法，由多个决策树组成。

对于分类问题，随机森林的数学公式可以表示为：f(x) = mode(Y_1, Y_2, ..., Y_n)其中，Y_1, Y_2, ..., Y_n 分别是每个决策树的预测结果，mode 表示选择出现最频繁的类别作为预测结果。

决策树与随机森林模型的比较与使用指南(四)

决策树与随机森林模型的比较与使用指南随着大数据和人工智能技术的迅猛发展，机器学习模型在各个领域得到了广泛的应用。

决策树和随机森林作为经典的机器学习算法，在数据挖掘和预测建模中扮演着重要的角色。

本文将对决策树和随机森林进行比较，并提供使用指南，帮助读者更好地理解和应用这两种模型。

1. 决策树模型决策树是一种基于树形结构来进行决策的模型。

它通过对样本数据进行分类和预测，构建一个树形的决策流程。

在决策树中，每个节点代表一个属性，每个分支代表这个属性的一个取值，而每个叶子节点代表一个类别或者一个数值。

决策树的优点是易于理解和解释，能够处理多种数据类型，并且可以处理大规模的数据集。

然而，决策树容易过拟合，对噪声和异常值敏感，因此需要进行剪枝操作来避免过拟合。

2. 随机森林模型随机森林是一种集成学习方法，它由多个决策树组成。

在随机森林中，每棵决策树都是基于不同的随机样本和随机特征构建的，然后将它们进行整合得到最终的预测结果。

随机森林通过利用多个模型的集成来提高预测的准确性和稳定性，同时减少了过拟合的风险。

由于随机森林能够处理高维数据和大规模数据集，并且不需要对数据进行特征缩放，因此在实际应用中得到了广泛的应用。

3. 决策树与随机森林的比较在比较决策树和随机森林时，可以看出它们各自的特点。

决策树简单直观，易于理解和解释，但容易过拟合；而随机森林通过集成多个决策树，提高了预测的准确性和稳定性，同时减少了过拟合的风险。

因此，在实际应用中，可以根据具体的场景和数据特点来选择合适的模型。

4. 使用指南在使用决策树和随机森林模型时，需要注意以下几点：- 数据准备：对于决策树和随机森林模型，需要对数据进行预处理和特征工程，包括缺失值处理、数据标准化、特征选择等操作。

此外，需要将数据集划分为训练集和测试集，用于模型的训练和评估。

- 模型选择：在选择模型时，需要根据实际情况和数据特点来决定使用决策树还是随机森林。

如果数据集较小，且希望获得更好的解释性和可解释性，可以选择决策树模型；如果数据集较大，且需要更高的预测准确性和稳定性，可以选择随机森林模型。

决策树和随机森林区别

决策树和随机森林区别
决策树和随机森林是数据挖掘和机器学习领域中常用的两种建模技术，它们被广泛应用于分类和回归任务。

两者区别如下：
•决策树（Decision Tree）：决策树是一种树状结构，用于从数据中生成决策规则。

它基于一系列的决策节点和叶子节点构建而成。

决策节点表示一个属性或特征，叶子节点表示一个类别或值。

决策树的建立过程包括选择最佳的属性来分割数据，通常使用信息增益、基尼不纯度等指标来评估分割质量。

决策树适用于分类和回归任务，可以处理离散和连续数据。

决策树易于理解和解释，但容易过拟合。

•随机森林（Random Forest）：随机森林是一种集成学习方法，它结合多个决策树以提高模型的性能和稳定性。

随机森林中的每个决策树都是在不同的数据子集和特征子集上训练的。

在每个决策树的建立过程中，随机选择属性进行分割，以增加模型的多样性。

最终的预测结果是由所有决策树的投票或平均值来决定的。

随机森林通常具有较高的准确性和泛化能力，对于大规模数据和高维数据表现出色。

对于决策树，您可以将其视为一个基本的决策规则生成器，而随机森林则是一种通过组合多个决策树来改进性能的技术。

在实际应用中，根据问题的性质和数据的特点，您可以选择使用决策树或随机森林来构建预测模型。

决策树与随机森林模型的比较与使用指南(六)

决策树与随机森林模型的比较与使用指南引言在机器学习领域，决策树和随机森林是两种常见的模型。

它们都属于监督学习算法，用于分类和回归任务。

本文将比较这两种模型的特点和适用场景，并给出它们的使用指南。

1. 决策树决策树是一种以树状图作为基本模型的预测模型，它使用树状图来呈现算法的决策过程。

决策树的节点表示特征属性，分支表示在这个特征上的取值，叶子节点表示最终的分类或回归结果。

决策树算法的优点是易于理解和解释，可以处理数值型和标称型数据，对缺失值不敏感。

但是，决策树也有一些缺点。

它很容易产生过拟合问题，尤其是在处理复杂的数据集时。

决策树的不稳定性也使得它对数据的微小变化非常敏感。

2. 随机森林随机森林是一种集成学习方法，它由多棵决策树组成。

每棵树都是独立训练的，而且在选择划分节点时，随机森林会引入随机性，使得每棵树都有所不同。

最终的分类或回归结果是由多棵树的结果综合得到的。

随机森林相对于单棵决策树有很多优点。

它不容易过拟合，因为多棵树的结果会互相抵消。

同时，随机森林对于高维数据和大规模数据的处理能力也相对较好。

另外，随机森林对于缺失值的处理也很有效。

3. 比较在决策树和随机森林之间进行比较，可以得出以下结论：- 决策树相对简单，易于理解和解释，但容易过拟合；- 随机森林是一种集成学习方法，能够降低过拟合风险，对缺失值和大规模数据处理能力强。

因此，在实际应用中，可以根据数据集的复杂度和规模来选择合适的模型。

对于简单的问题，可以选择决策树；而对于复杂的问题，尤其是大规模数据集，随机森林可能是更好的选择。

4. 使用指南在使用决策树和随机森林模型时，有一些常见的注意事项需要考虑：- 数据预处理：对于决策树和随机森林模型来说，数据预处理是非常重要的。

包括缺失值处理、数据标准化、特征选择等步骤，都会对模型的性能产生影响。

- 超参数调优：在使用随机森林模型时，需要对一些超参数进行调优，例如树的数量、最大深度、最小叶子节点等。

决策树与随机森林的原理与应用

决策树与随机森林的原理与应用决策树和随机森林是机器学习领域中常见且强大的算法。

它们不仅在分类和回归问题上表现出色，还具有解释性强的优势。

本文将详细介绍决策树和随机森林的原理以及在实际应用中的一些案例。

一、决策树的原理决策树是一种基于树状结构进行决策的算法。

它通过对数据集进行递归划分，使得每个子集中的样本具有相同或者相似的特征，最终生成一个可解释的决策树模型。

1. 特征选择决策树的特征选择是通过计算每个特征的信息增益或者基尼指数来进行的。

信息增益衡量了在给定特征的条件下，划分前后的信息不确定性减少的程度；而基尼指数则可以度量一个子集中样本被错误分类的概率。

2. 决策树的生成决策树的生成是通过递归地选择最佳划分特征来进行的。

将数据集划分为足够纯净的子集，可以采用各种算法，如ID3、C4.5和CART算法。

这些算法根据特征选择的不同方法，生成了不同类型的决策树。

3. 决策树的剪枝为了避免决策树过拟合训练数据，需要进行剪枝操作。

剪枝是通过对生成的决策树进行修剪，移除一些不必要的节点，从而提高决策树的泛化能力。

二、随机森林的原理随机森林是一种基于集成学习的算法，它集成了多个决策树来进行分类和回归任务。

随机森林的核心思想是利用随机化的方式构建多个决策树，然后通过投票方式进行结果集成。

1. 随机特征选择在随机森林中，每个决策树的特征选择是随机进行的。

不同的决策树可能选取的特征不同，这样可以增加模型的多样性，提高整体性能。

2. 自助采样法随机森林使用自助采样法（Bootstrap Sampling）对原始数据集进行有放回的采样，生成多个不同训练集来构建多个决策树。

这样可以使得每个决策树的训练集略有差异，增加模型的多样性。

3. 随机森林的集成随机森林的集成是通过对多个决策树的结果进行投票或平均来得到最终的预测结果。

在分类问题中，采用投票的方式选择出现次数最多的类别；在回归问题中，采用平均的方式获得数值型的输出。

三、决策树和随机森林的应用决策树和随机森林在各个领域都有广泛的应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

PPT文档演模板
决策树与随机森林
联合熵和条件熵
o 两个随机变量X，Y的联合分布，可以形成联合熵Joint Entropy，用H(X,Y)表示
o H(X,Y) – H(Y)
n (X,Y)发生所包含的信息熵，减去Y单独发生包含的信息熵——在Y发生的前提下，X发生“新” 带来的信息熵
n 该式子定义为Y发生前提下，X的熵：
决策树与随机森林
决策树的实例(Weka自带测试数据)
PPT文档演模板
•注：Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis)，是一款免费的，非商业化(与之对应的是SPSS公司商业数据挖掘产品-Clementine )的，基于JAVA环境下开源的机器学习 (machine learning)以及数据挖掘(data minining)软件。它和它的源代码可在其官方网站下载。
o 条件熵H(X|Y) = H(X,Y) – H(Y)
PPT文档演模板
决策树与随机森林
推导条件熵的定义式
PPT文档演模板
决策树与随机森林
相对熵
o 相对熵，又称互熵，交叉熵，鉴别信息，Kullback 熵，Kullback-Leible散度等
o 设p(x)、q(x)是X中取值的两个概率分布，则p对q的相对熵是
PPT文档演模板
决策树与随机森林
信息增益
o 概念：当熵和条件熵中的概率由数据估计(特别是极大似然估计)得到时，所对应的熵和条件熵分别称为经验熵和经验条件熵。
o 信息增益表示得知特征A的信息而使得类X的信息的不确定性减少的程度。
o 定义：特征A对训练数据集D的信息增益g(D,A)，定义为集合D的经验熵H(D)与特征A给定条件下D 的经验条件熵H(D|A)之差，即：
PPT文档演模板
决策树与随机森林
信息增益的计算方法
o 计算数据集D的经验熵 o 计算特征A对数据集D的经验条件熵H(D|A) o 计算信息增益：g(D,A)=H(D) – H(D|A)
o 对偶式 n H(Y|X)= H(X,Y) - H(X) n H(Y|X)= H(Y) - I(X,Y)
o I(X,Y)= H(X) + H(Y) - H(X,Y) n 有些文献将该式作为互信息的定义式
o 试证明：H(X|Y) ≤H(X) ，H(Y|X) ≤H(Y)
PPT文档演模板
决策树与随机森林
n g(D,A)=H(D) – H(D|A) n 显然，这即为训练数据集D和特征A的互信息。
PPT文档演模板
决策树与随机森林
基本记号
o 设训练数据集为D，|D|表示其容量，即样本个数。设有K个类Ck，k=1,2,…,K，|Ck|为属于类Ck的样本个数。Σk|Ck|=|D|。设特征A有 n个不同的取值{a1,a2…an}，根据特征A的取值将D划分为n个子集D1,D2,…Dn,|Di|为Di的样本个数，Σi|Di|=D。记子集Di中属于类Ck 的样本的集合为Dik，|Dik|为Dik的样本个数。
o I(X,Y)=D(P(X,Y) || P(X)P(Y))
PPT文档演模板
决策树与随机森林
计算H(X)-I(X,Y)
PPT文档演模板
决策树与随机森林
整理得到的等式
o H(X|Y) = H(X,Y) - H(Y) n 条件熵定义
o H(X|Y) = H(X) - I(X,Y) n 根据互信息定义展开得到 n 有些文献将I(X,Y)=H(Y) – H(Y|X)作为互信息的定义式
强大的Venn图：帮助记忆
PPT文档演模板
决策树与随机森林
决策树示意图
PPT文档演模板
决策树与随机森林
决策树 (Decision Tree)
o 决策树是一种树型结构，其中每个内部结点表示在一个属性上的测试，每个分支代表一个测试输出，每个叶结点代表一种类别。
o 决策树学习是以实例为基础的归纳学习。 o 决策树学习采用的是自顶向下的递归方法，
o 说明：
n 相对熵可以度量两个随机变量的“距离” o 在“贝叶斯网络”、“变分推导”章节使用过
n 一般的，D(p||q) ≠D(q||p) n D(p||q)≥0、 D(q||p) ≥0 提示：凸函数中的Jensen不等式
PPT文档演模板
决策树与随机森林
互信息
o 两个随机变量X，Y的互信息，定义为X，Y 的联合分布和独立分布乘积的相对熵。
决策树与随机森林
PPT文档演模板
2020/11/10
决策树与随机森林
目标任务与主要内容
o 复习信息熵
n 熵、联合熵、条件熵、互信息
o 决策树学习算法
n 信息增益 n ID3、C4.5、CART
o Bagging与随机森林的思想
n 投票机制
o 分类算法的评价指标
n ROC曲线和AUC值
PPT文档演模板
n 显然，属于有监督学习。 n 从一类无序、无规则的事物(概念)中推理出决策
树表示的分类规则。
PPT文档演模板
决策树与随机森林
决策树学习的生成算法
o 建立决策树的关键，即在当前状态下选择哪个属性作为分类依据。根据不同的目标函数，建立决策树主要有一下三种算法。
n ID3 n C4.5 n CART
其基本思想是以信息熵为度量构造一棵熵值下降最快的树，到叶子节点处的熵值为零，此时每个叶节点中的实例都属于同一类。
PPT文档演模板
决策树与随机森林
决策树学习算法的特点
o 决策树学习算法的最大优点是，它可以自学习。在学习的过程中，不需要使用者了解过多背景知识，只需要对训练实例进行较好的标注，就能够进行学习。
PPT文档演模板
决策树与随机森林
对熵的理解
o 熵是随机变量不确定性的度量，不确定性越大，熵值越大；若随机变量退化成定值，熵为0
n 均匀分布是“最不确定”的分布
o 熵其实定义了一个函数(概率分布函数)到一个值(信息熵)的映射。
n P(x)H (函数数值) n 泛函
o 回忆一下关于“变分推导”章节Fra bibliotek对于泛函的内容。
决策树与随机森林
复习：熵
o 将离散随机变量X的概率分布为P(X=xi)，则定义熵为：
o 若P为连续随机变量，则概率分布变成概率密度函数，求和符号变成积分符号。
o 在不引起混淆的情况下，下面谈到的“概率分布函数”，其含义是：
n 1、若X为离散随机变量，则该名称为概率分布函数；
n 2、若X为连续随机变量，则该名称为概率密度函数。