这条规则其实是错误的,因为购买足球的比例 是75%,甚至大于66%。
关联规则度量
期望 可信度 改善度
兴趣度?
描 (描置述述信X了的度对出-于现支关对持联度Y的规)出/则现 影 M(a响xX{多置==大信> ,度Y)是,在支置没持信有度任}与 期 一何望 条条可 规件信 则影度 的响的 兴时比 趣,值度Y在。大所于 0有,交实易际P中(利Y出|用X现)价/P的值(Y频越) 率大有 ;多小大于。0即则没实有际X利的用作价用 值下越,小Y本。身的支持度。
剪枝: {I1,I2,I3}的2-项子集是{I1,I2}, {I1,I3}和 {I2,I3}。 {I1,I2,I3}的所有2-项子集都是L2的元素。 因此,保留{I1,I2,I3}在C3中。
{I2,I3,I5}的2-项子集是{I2,I3}, {I2,I5}和 {I3,I5}。 {I3,I5}不是L2的元素,因而不是频繁的。 因此,由C3中删除{I2,I3,I5}。
2
4
{I2,I3} {I2,I3} {I2,I3} {I2,I3}
3
2
{I2,I4}{ I2,I4}
4 2
{I2,I5} {I2,I5}
5
4
{I1,I2} {I1,I2} {I1,I2} {I1,I2}
6
4
{I1,I3} {I1,I3} {I1,I3} {I1,I3}
候选2项集的散列表
频繁项集产生强关联规则
剪枝后C3= {{I1,I2,I3}, {I1,I2,I5}}。
对每个交易,使用subset函数找出交易 中是候选的所有子集,并对每个这样的 候选累加计数,所有满足最小支持度的
候选形成频繁项集L。
C3
扫描D,对每 个候选计数