❖ 粗糙集对不精确概念的描述方法是:通过上近似概念和 下近似概念这两个精确概念来表示;一个概念(或集合 )的下近似指的是其中的元素肯定属于该概念;一个概 念(或集合)的上近似指的是其中的元素可能属于该概 念。
❖ 粗糙集方法则有几个优点:不需要预先知道的额外信息 ,如统计中要求的先验概率和模糊集中要求的隶属度; 算法简单,易于操作。
❖ 国外现状:
成熟、 产品:SAS、CLEMENTINE、UNICA、各大数据库
❖ 国内现状:
起步 产品:大部分是实验室产品
数据挖掘分类
❖ 挖掘对象
▪ 基于数据库的挖掘 ▪ 基于web的挖掘 ▪ 基于文本的挖掘 ▪ 其他:音频、视频等多媒体数据库
数据挖掘分类
❖ 应用
▪ 响应模型 ▪ 交叉销售 ▪ 价值评估 ▪ 客户分群
遗传算法
❖ 遗传算法(Genetic Algoritms,简称GA )是以自然选择和遗传理论为基础,将生 物进化过程中“适者生存”规则与群体内 部染色体的随机信息交换机制相结合的搜 索算法 ;
❖ 遗传算法主要组成部分包括编码方案、适 应度计算、父代选择、交换算子和变异算 子。
序列模式
❖ 是指在多个数据序列中发现共同的行为模 式。
谢谢
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
Hale Waihona Puke 策树❖ 决策树学习是以实例为基础的归纳学习算 法,着眼于从一组无次序/无规则的事例中 推理出决策树表示形式的分类规则;
❖ 决策树基本算法是:贪心算法,它以自顶向 下递归、各个击破方式构造决策树.
关联规则
❖ 关联规则是形式如下的一种规则,“在购 买面包和黄油的顾客中,有90%的人同时 也买了牛奶”(面包+黄油 → 牛奶);