智能化的数据分析与数据挖掘应用

  • 格式:doc
  • 大小:25.00 KB
  • 文档页数:1

下载文档原格式

  / 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2014年齐鲁软件设计大赛赛题说明

基于数据挖掘技术的智能化数据分析系统设计与开发

赛题背景:

目前在我国,“数据海量,信息缺乏”是很多行业在数据爆炸过程中普遍所面对的尴尬。很多企业的数据库只能实现数据的录入、查询、统计等较低层次的功能,却无法发现数据中存在的各种有用的信息。

数据挖掘又称数据库中的知识发现,一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程,是目前人工智能和数据库领域研究的热点问题。

数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策,目前已广泛应用于科学、工程、商业、医学等领域。

数据挖掘主要有数据准备、规律寻找和规律表示3个步骤,常见功能包括关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等等。市场上种类丰富的数据挖掘软件工具也为这一应用的普及提供了很好的技术支撑。

(注意:并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。)

赛题要求:

各赛队自主选定问题的行业应用背景及本次数据挖掘针对的问题;

各赛队自行获取数据挖掘所需的大量数据;

数据挖掘工具可自选;

针对数据挖掘产生的结果请从应用角度进行解释,并说明该结果对于问题决策的意义;

开发文档中请详细描述开发过程及所有中间结果、最终结果。

南京邮电大学命题组

2014.3.20