第二章 工程数据的计算机处理
- 格式:ppt
- 大小:351.00 KB
- 文档页数:38
由于数据库系统所获数据量的迅速膨胀(已达 或 数量级),从而导致了现实世界数据库中常常包含许多含有噪声、不完整( )、甚至是不一致( )的数据。
显然对数据挖掘所涉及的数据对象必须进行预处理。
那么如何对数据进行预处理以改善数据质量,并最终达到完善最终的数据挖掘结果之目的呢?数据预处理主要包括:数据清洗( )、数据集成( )、数据转换( )和数据消减( )。
本章将介绍这四种数据预处理的基本处理方法。
数据预处理是数据挖掘(知识发现)过程中的一个重要步骤,尤其是在对包含有噪声、不完整,甚至是不一致数据进行数据挖掘时,更需要进行数据的预处理,以提高数据挖掘对象的质量,并最终达到提高数据挖掘所获模式知识质量的目的。
例如:对于一个负责进行公司销售数据分析的商场主管,他会仔细检查公司数据库或数据仓库内容,精心挑选与挖掘任务相关数据对象的描述特征或数据仓库的维度( ),这包括:商品类型、价格、销售量等,但这时他或许会发现有数据库中有几条记录的一些特征值没有被记录下来;甚至数据库中的数据记录还存在着一些错误、不寻常( )、甚至是不一致情况,对于这样的数据对象进行数据挖掘,显然就首先必须进行数据的预处理,然后才能进行正式的数据挖掘工作。
所谓噪声数据是指数据中存在着错误、或异常(偏离期望值)的数据;不完整( )数据是指感兴趣的属性没有值;而不一致数据则是指数据内涵出现不一致情况(如:作为关键字的同一部门编码出现不同值)。
而数据清洗是指消除数据中所存在的噪声以及纠正其不一致的错误;数据集成则是指将来自多个数据源的数据合并到一起构成一个完整的数据集;数据转换是指将一种格式的数据转换为另一种格式的数据;最后数据消减是指通过删除冗余特征或聚类消除多余数据。
不完整、有噪声和不一致对大规模现实世界的数据库来讲是非常普遍的情况。
不完整数据的产生有以下几个原因:( )有些属性的内容有时没有,如:参与销售事务数据中的顾客信息;( )有些数据当时被认为是不必要的;( )由于误解或检测设备失灵导致相关数据没有记录下来;( )与其它记录内容不一致而被删除;( )历史记录或对数据的修改被忽略了。
1. 根据产品设计过程的特点,可将设计划分为:①功能设计确定产品功能和结构之间的对应关系。
②布局设计完成技术实体部分(零部件)的排列组合。
③参数设计定义零部件的几何形状及尺寸参数。
④公差设计制定形状、位置及尺寸精度。
2. 根据各设计任务所占的比重不同,又可将设计划为:①新设计②适应性设计③参数化。
3. 计算机辅助设计简称CAD,是指工程技术人员以计算机为工具,用各自的专业知识对产品进行总体设计、绘图、仿真、分析及编写技术文档等设计活动的总称。
4. 计算机辅助制造简称CAM,是指使用计算机系统进行生产规划、管理和控制产品制造的全过程,它既包括与加工过程直接联系的计算机监测与控制,也包括使用计算机来管理生产经营,提供计划进度表等。
6.CAD/CAM系统的功能与任务:功能:①人机交互功能(即人机接口)②图形显示处理功能③信息存贮与管理功能④信息输入输出功能⑤工程信息传输与交换任务:①产品几何建模②工程绘图③工程计算分析④有限元分析⑤优化设计⑥计算机辅助工艺规程设计(CAPP)⑦数控编程⑧动态仿真⑨工程数据管理⑩应用软件二次开发7. 常见的CAD/CAM单项技术:计算机辅助绘图,简称CAG 计算机辅助工程分析简称CAE计算机辅助工艺设计简称CAPP 计算机辅助数控编程简称NCP企业资源计划简称ERP 计算机辅助质量控制简称CAQ产品数据管理简称PDM 虚拟设计简称VR-CAD 虚拟制造,简称VM8.CAD/CAM的发展趋势为:智能化、数字化、信息化(网络化)、柔性化。
第二章C AD/CAM系统的组成:硬件系统、软件系统、技术人员。
CAD/CAM硬件系统组成:计算机及其外围设备(主机、存储器、输入输/出设备、网络通信设备以及生产加工设备等有形物质设备)软件系统:包括系统软件、支撑软件和应用软件。
CAD/CAM系统的软件:控制CAD/CAM系统运行,并使系统发挥最大功效的计算机程序、数据及相关文档资料的总和。