CHAPTER12-离群点检测

格式：ppt
大小：229.50 KB
文档页数：14

下载文档原格式

/ 14

实现离群点检测的机器学习算法

实现离群点检测的机器学习算法离群点检测（Outlier detection）是机器学习中的一项重要任务，旨在识别数据集中与其他数据点不太相似或异常的数据点。

离群点也被称为异常值，它们与正常的数据点存在明显的偏离或异常行为。

离群点检测的目标是从大量的数据中准确地识别这些异常值，以便进一步分析和采取相应的措施。

实现离群点检测的机器学习算法有多种，下面将介绍一些常用的方法：1. 统计学方法：这些方法利用统计学原理来识别离群点。

其中一个常用的方法是基于数据的标准差或均值的阈值判断。

如果数据点的值偏离均值或标准差超过一定的阈值，则将其标记为离群点。

这种方法简单易用，但对于复杂的数据分布可能不够准确。

2. 基于距离的方法：这些方法通过计算数据点与最近邻数据点之间的距离来判断是否为离群点。

其中一种常见的方法是K近邻算法，它通过计算每个数据点与其K个最近邻数据点的距离，并将距离较远的点标记为离群点。

还有一种方法是基于密度的离群点检测算法，如LOF（局部离群因子）算法，它衡量数据点周围的局部密度与其邻近数据点的局部密度之比，从而识别离群点。

3. 基于聚类的方法：这些方法将数据点分为不同的聚类，并将边界上的数据点标记为离群点。

其中一个常用的算法是DBSCAN（基于密度的聚类应用噪声）算法，它通过将数据点组织成高密度区域和低密度区域来判断离群点。

也有一些其他的聚类算法可用于离群点检测，如基于谱聚类、层次聚类等。

4. 基于深度学习的方法：近年来，深度学习在离群点检测中的应用日益增多。

深度学习模型可以自动从数据中学习特征，并且对非线性和高维数据具有较好的处理能力。

一些常用的深度学习模型，如自编码器（Autoencoder）和变分自编码器（Variational Autoencoder），可以用于离群点检测。

这些模型可以通过重构误差或潜在空间的分布来判断数据点的异常性。

总结而言，离群点检测是机器学习中的一项重要任务，可以通过多种算法实现。

CHAPTER12-离群点检测

法实现

不考虑估算当前子集关于其补集的相异度, 该算法从集合中选择了一个子集合的序列来分析

对每个子集合, 它确定其与序列中前一个子集合的相异度差异
为了减轻输入顺序对结果的任何可能的影响, 以上的处理过程可以被重复若干次, 每一次采用子集合的一个不同的随机顺序

在所有的迭代中有最大平滑因子值的子集合成为异常集
3
离群点分析

应用:

信用卡欺诈检测
网络流量异常监测
顾客分割：确定极低或极高收入的客户的消费行为医疗分析：发现对多种治疗方式的不寻常的反应

离群点的类型

全局离群点：数据对象显著的偏离数据集中的其余对象
情景离群点：如果数据对象在给定特定情景下，显著的偏离其它对象
集体离群点：数据对象的某个子集显著偏离整个数据集
4

离群点分析

采用数据可视化方法来进行离群点探测如何？

不适用于包含周期性曲线的数据
对于探测有很多分类属性的数据 , 或高维数据中的离群点效率很低统计学方法基于距离的方法基于偏差的方法基于密度的方法
5

方法

基于统计学的离群点检测

对给定的数据集合假设了一个分布或概率模型(例如, 正态分布), 然后根据模型采用不一致性检验(discordancy test)来确定离群点
14
第12章离群点检测
费高雷通信与信息工程学院
2015年春季
第12章：离群点检测
离群点分析基于统计学的方法基于距离的方法
基于偏离的方法
2
离群点分析

第9章离群点检测

图9-5 基于聚类的离群点检测二维数据集
9.2离群点检测
基与聚类的离群点检测挖掘方法如下：
26
9.2离群点检测
基与聚类的离群点检测挖掘方法如下：表9-1 离群因子表 X 1 1 1 2 2 2 6 2 3 5 5 Y 2 3 1 1 2 3 8 4 2 7 2 OF1 2.2 2.3 2.9 2.6 1.7 1.9 5.9 2.5 2.2 4.8 3.4
9.2离群点检测
21
‒ 结论 • LOF算法计算的离群度不在一个通常便于理解的范围[0,1]，而是一个大于1的数，并且没有固定的范围。而且数据集通常数量比较大，内部结构复杂，LOF极有可能因为取到的近邻点属于不同数据密度的聚类簇，使得计算数据点的近邻平均数据密度产生偏差，而得出与实际差别较大甚至相反的结果。 ‒ 优点 • 通过基于密度的局部离群点检测就能在样本空间数据分布不均匀的情况下也可以准确发现离群点。
1 2 2 1
18
图9.2 基于密度的局部离群点检测的必要性
9.2离群点检测
19
图9.2中，p1相当于C2的密度来说是一个局部离群点，这就形成了基于密度的局部离群点检测的基础。此时，评估的是一个对象是离群点的程度，这种“离群”程度就是作为对象的局部离群点因子（LOF），然后计算。
reach _ distk ( x, xi ) max{distk ( xi ), dist ( x, xi )}
工作假设H为，假设n个对象的整个数据集来自一个初始的分布模型F，即： H: oi∈F，其中i=1，2，…，n 不和谐检验就是检查对象oi关于分布F是否显著地大（或小）。
9.2离群点检测基于正态分布的一元离群点检测 • 正态分布曲线特点：N（μ，σ2） • 变量值落在（μ-σ，μ+σ）区间的概率是68.27% • 变量值落在（μ-2σ，μ+2σ）区间的概率是95.44% • 变量值落在（μ-3σ，μ+3σ）区间的概率是99.73%

L O F 离群点检测算法

数据挖掘（五）离群点检测5 异常检测方法异常对象被称作离群点。

异常检测也称偏差检测和例外挖掘。

异常检测的方法：（1）基于模型的技术：首先建立一个数据模型，异常是那些同模型不能完美拟合的对象；如果模型是簇的集合，则异常是不显著属于任何簇的对象；在使用回归模型时，异常是相对远离预测值的对象。

（2）基于邻近度的技术：通常可以在对象之间定义邻近性度量，异常对象是那些远离其他对象的对象。

（3）基于密度的技术：仅当一个点的局部密度显著低于它的大部分近邻时才将其分类为离群点。

（1）统计方法。

统计学方法是基于模型的方法，即为数据创建一个模型，并且根据对象拟合模型的情况来评估它们。

大部分用于离群点检测的统计学方法都是构建一个概率分布模型，并考虑对象有多大可能符合该模型。

离群点的概率定义：离群点是一个对象，关于数据的概率分布模型，它具有低概率。

这种情况的前提是必须知道数据集服从什么分布，如果估计错误就造成了重尾分布。

异常检测的混合模型方法：对于异常检测，数据用两个分布的混合模型建模，一个分布为普通数据，而另一个为离群点。

聚类和异常检测目标都是估计分布的参数，以最大化数据的总似然（概率）。

聚类时，使用EM算法估计每个概率分布的参数。

然而，这里提供的异常检测技术使用一种更简单的方法。

初始时将所有对象放入普通对象集，而异常对象集为空。

然后，用一个迭代过程将对象从普通集转移到异常集，只要该转移能提高数据的总似然（其实等价于把在正常对象的分布下具有低概率的对象分类为离群点）。

（假设异常对象属于均匀分布）。

异常对象由这样一些对象组成，这些对象在均匀分布下比在正常分布下具有显著较高的概率。

优缺点：（1）有坚实的统计学理论基础，当存在充分的数据和所用的检验类型的知识时，这些检验可能非常有效；（2）对于多元数据，可用的选择少一些，并且对于高维数据，这些检测可能性很差。

（2）基于邻近度的离群点检测。

一个对象是异常的，如果它远离大部分点。

挖掘建模之离群点检测

Python数据分析与挖掘实战
第5章挖掘建模之离群点检测
2020-10-15
目录
1
分类与预测
2
聚类分析
3
关联规则
4
时序模式
5
离群点检测
6
小结
2
离群点检测
l 就餐饮企业而言，经常会碰到这样的问题： • 如何根据客户的消费记录检测是否为异常刷卡消费？ • 如何检测是否有异常订单？
l 这一类异点检测方法
x
1
x 2
e 2 2 x R
2
10
离群点检测——基于模型的离群点检测方法
11
离群点检测——基于模型的离群点检测方法
（2）混合模型的离群点检测 l 混合是一种特殊的统计模型，它使用若干统计分布对数据建模。每一个
分布对应一个簇，而每个分布的参数提供对应簇的描述，通常用中心和发散描述。 l 混合模型将数据看作从不同的概率分布得到的观测值的集合。概率分布可以是任何分布，但是通常是多元正态的，因为这种类型的分布不难理解，容易从数学上进行处理，并且已经证明在许多情况下都能产生好的结果。这种类型的分布可以对椭圆簇建模。
基于密度基于聚类
考虑数据集可能存在不同密度区域这一事实，从基于密度的观点分析，离群点是在低密度区域中的对象。一个对象的离群点得分是该对象周围密度的逆。
给出了对象是离群点的定量度量，并且即使数据具有不同的区域也能够很好的处理；大数据集不适用；参数选择是困难的。
一种是利用聚类检测离群点的方法是丢弃远离其他簇的小簇；另一种更系统的方法，首先聚类所有对象，然后评估对象属于簇的程度（离群点得分）。
基于聚类技术来发现离群点可能是高度有效的；聚类算法产生的簇的质量对该算法产生的离群点的质量影响非常大。

数据挖掘第12章--离群点检测：离群点和离群点分析

示例：“今天的温度为280C。这是一个异常（离群点）吗？”如果是多伦多的
冬天，则这是一个离群点；如果是多伦多的夏天，则这是正常的一般地，在情境离群点检测中，所考虑数据对象的属性划分为两组：
情境属性：数据对象的情境属性定义对象的情境
行为属性：定义对象的特征，并用来评估对象关于它所处的情境是否是离群点
可理解性
在许多应用中，用户可能不仅要检测离群点，而且要知道被检测到的点为何是离
群点。 7 8
离群点检测方法
监督方法半监督方法无监督方法统计学方法
基于邻近性方法
基于聚类方法
8
8
谢
谢
关
注
欢
迎
指
导
离群点检测的挑战正常对象和离群点的有效建模正常数据与异常数据离群点乊间的边界通常并不清晰在离群点检测中处理噪声低质量的数据和噪声的存在给离群点检测带来了巨大的挑战针对应用的离群点检测离群点检测高度依赖亍应用类型使得不可能开发通用的离群点检测方法可理解性谢谢谢谢关关
数据挖掘与商务智能
范勤勤物流研究中心
6
8
离群点检测的挑战
正常对象和离群点的有效建模
离群点检测的质量高度依赖于正常（非离群点）对象和离群点的建模
正常数据与异常数据（离群点）之间的边界通常并不清晰
针对应用的离群点检测
离群点检测高度依赖于应用类型，使得不可能开发通用的离群点检测方法
在离群点检பைடு நூலகம்中处理噪声
低质量的数据和噪声的存在给离群点检测带来了巨大的挑战
第十二章离群点检测
1
离群点和离群点分析
什么是离群点？
什么是离群点？
假定使用一个给定的统计过程来产生数据对象集，离群点是一个数据对象，它显著不同于其他数据对象，好像它是被不同的机制产生的一样。

离群点分析

数据处理方法数据处理方法离群点的简介离群点的简介离群点的检测方法离群点的检测方法21基于统计分布的离群点检测基于统计分布的离群点检测23基于密度的离群点的检测基于密度的离群点的检测22基于距离的离群点的检测基于距离的离群点的检测24基于偏差的离群点的检测基于偏差的离群点的检测11离群点的含义在数据库中包含着少数的数据对象它们与数据的一般行为或特征不一致这些数据对象叫做离群点
2. 2.4 基于距离和(DS)检测算法: 与DB (p, d)离群点一样，DS离群点使用同样的距离公式，如绝对距离或欧式距离，但不根据pct和dmin来判定孤立点，而是先计算数据对象两两之间的距离，再计算每个对象与其他对象的距离之和。设M为用户期望的孤立点个数，则距离之和最大的前M个对象即为要挖掘的孤立点，这样可消除用户设臵参数pct和dmin的需要。
离群点分析
1
离群点的简介数据处理方法一
目
录
2
离群点的检测方法 2.1 2.2 2.3 基于统计分布的离群点检测基于距离的离群点的检测基于密度的离群点的检测基于偏差的离群点的检测

2.4
第1节
1.1 离群点的含义
离群点的简介
在数据库中包含着少数的数据对象，它们与数据的一般行为或特征不一致，这些数据对象叫做离群点。
数据行为不一致的离群点，往往预示着欺诈行为，因此成为执法者所关注的。此外，在销售中确定极高和极低收入的客户的销售行为，或者在医疗分析中发现对各种医疗处臵的不寻常的反应。
1.4 离群点检测遇到的困难
第一，在时间序列样本中发现离群点一般比较困难，因为这些离群点可能会隐藏在趋势、季节性或者其他变化中；第二，对于维度为非数值型的样本，在检测过程中需要多加考虑，比如对维度进行预处理等；第三，针对多维数据，离群点的异常特征可能是多维度的组合，而不是单一维度就能体现的。

离群点试题及答案

离群点试题及答案1. 离群点是指在数据集中与大多数数据点明显不同的数据点。

请判断以下哪个选项最符合离群点的定义。

A. 数据集中的中位数B. 数据集中的均值C. 数据集中的众数D. 数据集中的异常值答案：D2. 在数据清洗过程中，识别并处理离群点是非常重要的步骤。

以下哪种方法不适合用于识别离群点？A. 箱型图分析B. Z-分数C. 均值和标准差D. 线性回归答案：D3. 假设我们有一个数据集，其均值为50，标准差为10。

如果一个数据点的值为70，那么该数据点的Z-分数是多少？A. 1B. 2C. -1D. -2答案：B4. 离群点的存在可能会对数据分析结果产生哪些影响？A. 提高数据集的准确性B. 降低数据集的准确性C. 增加数据集的复杂性D. 减少数据集的复杂性答案：B5. 在统计学中，通常认为Z-分数超过多少可以认为是离群点？A. 1B. 2C. 3D. 4答案：C6. 箱型图是一种常用的离群点检测方法。

箱型图中的“胡须”通常代表什么？A. 数据集的中位数B. 数据集的均值C. 数据集的四分位数范围D. 数据集的离群点答案：C7. 假设一个数据集有四个数据点：10, 12, 15, 20。

该数据集的中位数是多少？A. 12B. 13C. 14D. 15答案：B8. 在处理离群点时，以下哪个选项是正确的处理方法？A. 直接删除B. 替换为均值C. 替换为中位数D. 替换为众数答案：C9. 如果一个数据点的Z-分数为-3，这意味着什么？A. 该数据点是离群点B. 该数据点是数据集的中心点C. 该数据点是数据集的中位数D. 该数据点是数据集的众数答案：A10. 在数据分析中，离群点的检测和处理可以帮助我们：A. 减少数据的噪声B. 增加数据的噪声C. 增加数据的偏差D. 减少数据的偏差答案：A。

数据挖掘之5——离群点检测

离群点检测（异常检测）是找出其行为不同于预期对象的过程，这种对象称为离群点或异常。

离群点和噪声有区别，噪声是观测变量的随机误差和方差，而离群点的产生机制和其他数据的产生机制就有根本的区别。

全局离群点：通过找到其中一种合适的偏离度量方式，将离群点检测划为不同的类别；全局离群点是情景离群点的特例，因为考虑整个数据集为一个情境。

情境离群点：又称为条件离群点，即在特定条件下它可能是离群点，但是在其他条件下可能又是合理的点。

比如夏天的28℃和冬天的28℃等。

集体离群点：个体数据可能不是离群点，但是这些对象作为整体显著偏移整个数据集就成为了集体离群点。

离群点检测目前遇到的挑战•正常数据和离群点的有效建模本身就是个挑战；•离群点检测高度依赖于应用类型使得不可能开发出通用的离群点检测方法，比如针对性的相似性、距离度量机制等；•数据质量实际上往往很差，噪声充斥在数据中，影响离群点和正常点之间的差别，缺失的数据也可能“掩盖”住离群点，影响检测到有效性；•检测离群点的方法需要可解释性；离群点检测方法1. 监督方法训练可识别离群点的分类器；但是监督方法检测离群点目前遇到几个困难：1.两个类别（正常和离群）的数据量很不平衡，缺乏足够的离群点样本可能会限制所构建分类器的能力；2.许多应用中，捕获尽可能多的离群点（灵敏度和召回率）比把正常对象误当做离群点更重要。

由于与其他样本相比离群点很稀少，所以离群点检测的监督方法必须注意如何训练和如何解释分类率。

One-class model，一分类模型考虑到数据集严重不平衡的问题，构建一个仅描述正常类的分类器，不属于正常类的任何样本都被视为离群点。

比如SVM决策边界以外的都可以视为离群点。

2.无监督方法正常对象在其中一种程度上是“聚类”的，正常对象之间具有高度的相似性，但是离群点将远离正常对象的组群。

但是遇到前文所述的集体离群点时，正常数据是发散的，而离群点反而是聚类的，这种情形下更适合监督方法进行检测。

lof离群点检测算法

lof离群点检测算法LOF离群点检测算法引言：在现实世界中，数据的异常情况往往会对分析和决策产生重要影响。

因此，离群点检测成为了数据挖掘和机器学习领域中的重要任务之一。

离群点是指与其他数据点明显不同的数据对象，其特征值与大多数数据点相差较大。

离群点检测算法的目标是从数据集中识别出这些离群点。

本文将介绍一种常用的离群点检测算法——LOF （Local Outlier Factor）。

1. LOF算法概述LOF算法于2000年由Breunig等人提出，它基于密度的概念，通过比较数据点周围邻域的密度来判断其离群程度。

LOF算法的核心思想是：对于一个数据点，如果它的邻域密度较低，而其邻域中的其他数据点的密度较高，则该数据点可能是离群点。

LOF算法的计算步骤如下：步骤1：计算每个数据点的k距离（k-distance），k距离表示数据点与离它最近的k个邻居之间的距离。

k距离的计算可以使用欧氏距离或其他距离度量方法。

步骤2：计算每个数据点的可达距离（reachability distance），可达距离表示数据点与其邻居之间的距离。

可达距离的计算方式是，对于每个数据点p，计算其邻居q的k距离和p到q之间的距离的最大值。

步骤3：计算每个数据点的局部可达密度（local reachability density），局部可达密度表示数据点的邻域密度。

局部可达密度的计算方式是，对于每个数据点p，计算其邻居q的可达距离的倒数的平均值。

步骤4：计算每个数据点的离群因子（local outlier factor），离群因子表示数据点的离群程度。

离群因子的计算方式是，对于每个数据点p，计算其邻域q的局部可达密度的平均值与p的局部可达密度的比值。

2. LOF算法的优势相比于其他离群点检测算法，LOF算法具有以下优势：2.1 非参数化：LOF算法不需要对数据分布做出任何假设，因此对于任何类型的数据都可以有效地进行离群点检测。

2.2 高效性：LOF算法的计算复杂度较低，可适用于大规模数据集。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信用卡欺诈检测
网络流量异常监测
顾客分割：确定极低或极高收入的客户的消费行为医疗分析：发现对多种治疗方式的不寻常的反应

离群点的类型

全局离群点：数据对象显著的偏离数据集中的其余对象
情景离群点：如果数据对象在给定特定情景下，显著的偏离其它对象
集体离群点：数据对象的某个子集显著偏离整个数据集
第12章离群点检测
费高雷通信与信息工程学院
2015年春季
第12章：离群点检测
离群点分析基于统计学的方法基于距离的方法
基于偏离的方法
2
离群点分析

什么是离群点? 对象的集合, 它们与数据的其它部分不一致离群点可能是度量或执行错误所导致离群点也可能是固有的数据变异性的结果问题：给定一个 n 个数据点或对象的集合 , 及预期的离群点的数目k, 发现与剩余的数据相比是相异的, 例外的, 或不一致的前k个对象两个子问题：定义在给定的数据集合中什么样的数据可以被认为是不一致的找到一个有效的方法来挖掘这样的离群点
义为某类对象的最小子集 , 这些对象的去除会导致剩余集合的相异度的最大减少

相异度函数 (dissimilarity function)：是满足如下条件的任意函数：当给定一组对象时，如果对象间相似，返值就较小；对象间的相异度越大，函数返回的值就越大
例: 给定n个对象的子集合{x1,…,xn}, 一个可能的相异度函数是集合中对象的方差

对许多不一致性检验来说, 如果一个对象 o根据给定的检验是一个离群点, 那么对恰当定义的p和d，o也是一个DB(p,d)
离群点
9
基于偏离的离群点检测

通过检查一组对象的主要特征来确定离群点，与给出的描
述偏离的对象被认为是离群点

两个重要的概念：

异常集(exception set)：它是偏离或离群点的集合 , 被定
12
课程结束感谢各位同学的支持！
本课程所有资料

实验一：/s/1hqpLJGK 密码：5xyg 实验二：/s/1gdq3KB5 密码：qs90 所有课件：/s/1sjDjZch 密码：5yne
14
法实现

不考虑估算当前子集关于其补集的相异度, 该算法从集合中选择了一个子集合的序列来分析

对每个子集合, 它确定其与序列中前一个子集合的相异度差异
为了减轻输入顺序对结果的任何可能的影响, 以上的处理过程可以被重复若干次, 每一次采用子集合的一个不同的随机顺序

在所有的迭代中有最大平滑因子值的子集合成为异常集
检验要求的参数

数据集参数: 例如, 假设的数据分布分布参数: 例如平均值和方差

和预期的离群点的数目
6
基于统计学的离群点检测

工作假设H是一个命题：n个对象的整个数据集合来自一个
初始的分布模型F

即 H：Oi ∈F，i =1, 2, …, n

不一致性检验：验证一个对象 Oi 关于分布 F 是否显著地大 (或小)，即F产生Oi的概率是否足够小主要的方法
10
基于偏离的离群点检测

平滑因子(smoothing factor)：

一个为序列中的每个子集计算的函数. 它估算从原始的数据集合中移走子集合可以带来的相异度的降低程度.

平滑因子值最大的子集是异常集
一般的寻找全局最优的异常集的任务是NP难问题
11
基于偏离的离群点检测

一个顺序的方法在计算上是可行的, 能够用一个线性的算
4

离群点分析

采用数据可视化方法来进行离群点探测如何？

不适用于包含周期性曲线的数据
对于探测有很多分类属性的数据 , 或高维数据中的离群点效率很低统计学方法基于距离的方法基于偏差的方法基于密度的方法
5

方法

基于统计学的离群点检测

对给定的数据集合假设了一个分布或概率模型(例如, 正态分布), 然后根据模型采用不一致性检验(discordancy test)来确定离群点

群点被发现；或者观察到的分布不能恰当地被任何标准的分布来模拟
8
基于距离的离群点检测

为了解决统计学方法带来的一些限制，引入了基于距离的离群点的概念基于距离的离群点:

DB(p, d)-离群点是数据集T中的一个对象o, 使得 T中的
对象至少有p部分与o的距离大于d

将基于距离的离群点看作是那些没有“足够多”邻居的对象（邻居是基于距给定对象的距离来定义的）

参数的方法：假设数据服从特定分布，分布的参数通过最大似然估计得到
非参数方法：够造直方图，检测数据是否落入直方图的某一箱中
7

基于统计学的离群点检测

缺点

绝大多数检验是针对单个属性的，而许多数据挖掘问题要求在多维空间中发现离群点统计学方法要求关于数据集合参数的知识 ( 如 , 数据分布), 但是在许多情况下，数据分布可能是未知的当没有特定的检验时，统计学方法不能确保所有的离

CHAPTER12-离群点检测

合集下载

实现离群点检测的机器学习算法

CHAPTER12-离群点检测

第9章离群点检测

L O F 离群点检测算法

挖掘建模之离群点检测

数据挖掘第12章--离群点检测：离群点和离群点分析

离群点分析

离群点试题及答案

数据挖掘之5——离群点检测

lof离群点检测算法

文档推荐

最新文档

CHAPTER12-离群点检测

合集下载

实现离群点检测的机器学习算法

CHAPTER12-离群点检测

第9章 离群点检测

L O F 离 群 点 检 测 算 法

挖掘建模之离群点检测

数据挖掘 第12章--离群点检测：离群点和离群点分析

离群点分析

离群点试题及答案

数据挖掘之5——离群点检测

lof离群点检测算法

文档推荐

最新文档

第9章离群点检测

L O F 离群点检测算法

数据挖掘第12章--离群点检测：离群点和离群点分析