使用第1步找到的频集产生期望的规则 apriori算法的详细介绍见课本。
6.3 数据挖掘的关联算法
6.3.2 简单形式的关联规则算法(单维、单层和 布尔关联规则)
❖ 2 频集算法的几种优化方法
基于划分的方法 基于hash的方法 基于采样的方法 减少交易的个数
6.3 数据挖掘的关联算法
6.3.2 简单形式的关联规则算法(单维、单层和 布尔关联规则)
比如Support(X=>Y )=同时购买商品X和Y的交易数总交易数 同时交易数据集D中具有置信度c,即D中包含X的事务至少有c%同时也包含Y,描述
为:confidence(X=>Y)= 比如购买了商品X,同时购买商品Y可信度,confidence(X=>Y)=同时购买商品X和Y
的交易数购买了商品X的交易数 一般称满足一定要求的规则为强规则。通常称满足最小支持度和最小置信度的关联
X13=(30~40,高,Y, 一般,Y);X14=(>40,中,N, 很好,N)
6.1 分类规则挖掘
6.1.2 决策树 1.决策树的构造过程
决策树的构造算法:
决策树的构造算法可通过训练集T完成,其中T={<x,cj>},而 x=(a1,a2,…,an)为一个训练实例,它有n个属性,分别列于属性表 (A1,A2,…,An)中,其中ai表示属性Ai的取值。Cj∈C={C1,C2,…,Cm}为x 的分类结果。从属性表中选择属性Ai作为分类属性;若属性Ai的取值有ki 个,则将T划分为ki个子集,T1,…,Tki,其中Tij={<x,C>|<x,C>}∈T,且x 的属性取值A为第i个值;接下来从属性表中删除属性Ai;对于每一个 Tij(1≤j≤K1),令T=Tij;如果属性表非空,返回第1步,否则输出。