2020/10/13
7
数据挖掘系统的结构
智慧数据 财富未来
图形用户接口
模式评价 数据挖掘引擎
数据库或数据仓库服务器
数据清洗和集成
过滤
数据库
数据仓库
2020/10/13
知识库
8
数据挖掘标准流程
业务理解、数据预处理(数据理解和 数据准备)包含60%工作量;
60
CRISP-DM1999年欧盟机构联合起草. 通过近几年的 发展,在各种KDD过程模型中成为标准流程。
联机分析处理( OLAP) 对数据汇总、合并、聚集,验证假设
数据挖掘(DM,Data Mining) 数据建模、算法(非常规方法)
上世纪70年代以来,关系式数据库
上世纪80年代后期,数据仓库
1995年后,数据挖掘
数据挖掘是一门交叉学科,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。 知识发现(Knowledge Discovery in Database, KDD)
-美林数据挖掘研究中心
© 2011 MERIT. All Rights Reserved. MERIT & its logo, are trademarks of MERIT.
目录
2020/10/13
智慧数据 财富未来
1.数据挖掘基本原理 2.数据预处理技术 3.数据挖掘技术 4.最优化技术 5.文本挖掘技术 6.图像和视频分析技术 7.可视化技术
需要注意的是,以上6个步骤并非完全按照此顺序 来执行。在实际应用中,需要针对不同的应用环境 和实际情况作出必要的调整。
此外,一个数据挖掘项目通常并不是一次性地执行 了上述6个步骤就结束了,它往往是一个反复迭代、 不断完善的过程。