数据采集和处理技术第3版课后习题答案马明建共42页文档共42页文档
- 格式:ppt
- 大小:2.77 MB
- 文档页数:42
数据采集与处理技术1-8章课后习题答案马明建第三版第一章绪论1.1 数据采集系统的任务:答:数据采集的任务就是采集传感器输出的模拟信号并转换成计算机能识别的数字信号,然后送入计算机进行相应的计算和处理,得出所需数据。
同时,将计算得到的数据进行显示或打印,以便实现对某些物理量的监视,其总一部分数据还将被生产过程中的计算机控制系统用来控制某些物理量。
(P15)1.2数据采集系统主要实现哪些基本功能?.答:数据采集系统主要实现以下9个方面的基本功能:数据采集;模拟信号处理;数字信号处理;开关信号处理;二次数据计算;屏幕显示;数据存储;打印输出;人机联系。
(P15)1.3简述数据采集系统的基本结构形式,并比较其特点。
答:数据采集系统的基本结构形式主要有两种:一种是微型计算机数据采集系统,另一种是集散型数据采集系统。
微型计算机数据采集系统的特点是:系统结构简单,技术容易实现,满足中小规模数据采集要求;对环境要求不高;价格低廉,系统成本低;可座位集散型数据采集系统的一个基本组成部分;其相关模板和软件都比较齐全,容易构成西欧它能够,便于使用与维修。
集散型数据采集系统的主要特点是:系统适应能力强;系统可靠性高;系统实时响应性好;对系统硬件要求不高;特别适合在恶劣环境下工作。
(P16)1.4数据采集系统的软件功能模块是如何划分的?各部分都完成哪些功能?答:数据采集系统软件功能模块一般由以下部分组成:(1)模拟信号采集与处理程序。
其主要功能是对模拟输入信号进行采集、标度变换、滤波处理以及二次数据计算,并将数据存入磁盘。
(2)数字信号采集与处理程序。
其功能是对数字输入信号进行采集及码制之间的转换。
(3)脉冲信号处理程序。
其功能是对输入的脉冲信号进行电平高低判断和计数。
(4)开关信号处理程序。
其功能是判断开关信号输入状态变化情况,若发生变化,则执行相应的处理程序。
(5)运行参数设置程序。
其功能是对数据采集系统的运行参数进行设置。
1.4 数据仓库和数据库有何不同?有哪些相似之处?答:区别:数据仓库是面向主题的,集成的,不易更改且随时间变化的数据集合,用来支持管理人员的决策,数据库由一组内部相关的数据和一组管理和存取数据的软件程序组成,是面向操作型的数据库,是组成数据仓库的源数据。
它用表组织数据,采用ER数据模型.相似:它们都为数据挖掘提供了源数据,都是数据的组合.1。
3 定义下列数据挖掘功能:特征化、区分、关联和相关分析、预测聚类和演变分析。
使用你熟悉的现实生活的数据库,给出每种数据挖掘功能的例子。
答:特征化是一个目标类数据的一般特性或特性的汇总。
例如,学生的特征可被提出,形成所有大学的计算机科学专业一年级学生的轮廓,这些特征包括作为一种高的年级平均成绩(GPA:Grade point aversge)的信息,还有所修的课程的最大数量.区分是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。
例如,具有高GPA 的学生的一般特性可被用来与具有低GPA 的一般特性比较.最终的描述可能是学生的一个一般可比较的轮廓,就像具有高GPA 的学生的75%是四年级计算机科学专业的学生,而具有低GPA 的学生的65%不是。
关联是指发现关联规则,这些规则表示一起频繁发生在给定数据集的特征值的条件.例如,一个数据挖掘系统可能发现的关联规则为:major(X,“computing science”) ⇒ owns(X, “personal computer”)[support=12%, confidence=98%] 其中,X 是一个表示学生的变量。
这个规则指出正在学习的学生,12%(支持度)主修计算机科学并且拥有一台个人计算机。
这个组一个学生拥有一台个人电脑的概率是98%(置信度,或确定度).分类与预测不同,因为前者的作用是构造一系列能描述和区分数据类型或概念的模型(或功能),而后者是建立一个模型去预测缺失的或无效的、并且通常是数字的数据值。
1.4数据仓库和数据库有何不同?有哪些相似之处?答:区别:数据仓库是面向主题的,集成的,不易更改且随时间变化的数据集合,用来支持管理人员的决策,数据库由一组内部相关的数据和一组管理和存取数据的软件程序组成,是面向操作型的数据库,是组成数据仓库的源数据。
它用表组织数据,采用ER数据模型。
相似:它们都为数据挖掘提供了源数据,都是数据的组合。
1.3定义下列数据挖掘功能:特征化、区分、关联和相关分析、预测聚类和演变分析。
使用你熟悉的现实生活的数据库,给出每种数据挖掘功能的例子。
答:特征化是一个目标类数据的一般特性或特性的汇总。
例如,学生的特征可被提出,形成所有大学的计算机科学专业一年级学生的轮廓,这些特征包括作为一种高的年级平均成绩(GPA:Gradepointaversge)的信息,还有所修的课程的最大数量。
??区分是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。
例如,具有高GPA的学生的一般特性可被用来与具有低GPA的一般特性比较。
最终的描述可能是学生的一个一般可比较的轮廓,就像具有高GPA的学生的75%是四年级计算机科学专业的学生,而具有低GPA的学生的65%不是。
??关联是指发现关联规则,这些规则表示一起频繁发生在给定数据集的特征值的条件。
例如,一个数据挖掘系统可能发现的关联规则为:major(X,“computingscience”)?owns(X,“personalcomputer”)[support=12%,confidence=98%]其中,X是一个表示学生的变量。
这个规则指出正在学习的学生,12%(支持度)主修计算机科学并且拥有一台个人计算机。
这个组一个学生拥有一台个人电脑的概率是98%(置信度,或确定度)。
??分类与预测不同,因为前者的作用是构造一系列能描述和区分数据类型或概念的模型(或功能),而后者是建立一个模型去预测缺失的或无效的、并且通常是数字的数据值。
它们的相似性是他们都是预测的工具:分类被用作预测目标数据的类的标签,而预测典型的应用是预测缺失的数字型数据的值。
习题参考答案第1 章数据库概述2.与文件管理相比,数据库管理有哪些优点?答:将相互关联的数据集成在一起,具有较少的数据冗余,程序与数据相互独立,保证数据的安全可靠,最大限度地保证数据的正确性,数据可以共享并能保证数据的一致性。
3.比较文件管理和数据库管理数据的主要区别。
答:数据库系统与文件系统相比实际上是在应用程序和存储数据的数据库之间增加了一个系统软件,即数据库管理系统,使得以前在应用程序中由开发人员实现的很多繁琐的操作和功能,都可以由这个系统软件完成,这样应用程序不再需要关心数据的存储方式,而且数据的存储方式的变化也不再影响应用程序。
而在文件系统中,应用程序和数据的存储是紧密相关的,数据的存储方式的任何变化都会影响到应用程序,因此不利于应用程序的维护。
4.数据库管理方式中,应用程序是否需要关心数据的存储位置和结构?为什么?答:不需要。
因为在数据库系统中,数据的存储位置以及存储结构保存在数据库管理系统中,从数据到物理存储位置的转换是由数据库管理系统自动完成的。
6.在数据库系统中,应用程序可以不通过数据库管理系统而直接访问数据库文件吗?答:不能。
7.数据独立性指的是什么?它能带来哪些好处?答:数据独立性指的是数据的逻辑独立性和物理独立性。
逻辑独立性带来的好处是当表达现实世界信息的逻辑结构发生变化时,可以不影响应用程序;物理独立性带来的好处是当数据的存储结构发生变化时,可以不影响数据的逻辑组织结构,从而也不影响应用程序。
8.数据库系统由哪几部分组成,每一部分在数据库系统中的作用大致是什么?答:数据库系统由三个主要部分组成,即数据库、数据库管理系统和应用程序。
数据库是数据的汇集,它以一定的组织形式存于存储介质上;数据库管理系统是管理数据库的系统软件,它可以实现数据库系统的各种功能;应用程序指以数据库数据为核心的应用程序。
9.在文件服务器结构和客户/服务器结构中,对数据的处理有什么区别?.k5.在数据库系统中,数据库的作用是什么?答:在数据库系统中,数据库是存放数据的场所。
1.4 数据仓库和数据库有何不同?有哪些相似之处?答:区别:数据仓库是面向主题的,集成的,不易更改且随时间变化的数据集合,用来支持管理人员的决策,数据库由一组内部相关的数据和一组管理和存取数据的软件程序组成,是面向操作型的数据库,是组成数据仓库的源数据。
它用表组织数据,采用ER数据模型。
相似:它们都为数据挖掘提供了源数据,都是数据的组合。
1.3 定义下列数据挖掘功能:特征化、区分、关联和相关分析、预测聚类和演变分析。
使用你熟悉的现实生活的数据库,给出每种数据挖掘功能的例子。
答:特征化是一个目标类数据的一般特性或特性的汇总。
例如,学生的特征可被提出,形成所有大学的计算机科学专业一年级学生的轮廓,这些特征包括作为一种高的年级平均成绩(GPA:Grade point aversge)的信息,还有所修的课程的最大数量。
区分是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。
例如,具有高GPA 的学生的一般特性可被用来与具有低GPA 的一般特性比较。
最终的描述可能是学生的一个一般可比较的轮廓,就像具有高GPA 的学生的75%是四年级计算机科学专业的学生,而具有低GPA 的学生的65%不是。
关联是指发现关联规则,这些规则表示一起频繁发生在给定数据集的特征值的条件。
例如,一个数据挖掘系统可能发现的关联规则为:major(X, “computing science”) ⇒ owns(X, “personal computer”)[support=12%, confidence=98%] 其中,X 是一个表示学生的变量。
这个规则指出正在学习的学生,12%(支持度)主修计算机科学并且拥有一台个人计算机。
这个组一个学生拥有一台个人电脑的概率是98%(置信度,或确定度)。
分类与预测不同,因为前者的作用是构造一系列能描述和区分数据类型或概念的模型(或功能),而后者是建立一个模型去预测缺失的或无效的、并且通常是数字的数据值。
《数据采集的途径》作业一、选择题1. 下列哪种途径不属于数据采集的范畴?A. 问卷调查B. 网络爬虫C. 数据清洗D. 传感器采集答案:C解析:数据清洗是对已经采集到的数据进行处理和优化的过程,不属于数据采集的范畴。
而问卷调查、网络爬虫和传感器采集都是常见的数据采集方法。
2. 在大数据环境下,以下哪种技术常用于实时数据采集?A. SQL数据库B. NoSQL数据库C. 关系型数据库D. Excel表格答案:B解析:NoSQL数据库(如MongoDB、Cassandra)因其灵活的数据模型和高扩展性,常被用于大数据环境下的实时数据采集。
3. 下列哪种工具主要用于网页数据采集?A. PythonB. ExcelC. SPSSD. SQL Server答案:A解析:Python通过其强大的库(如BeautifulSoup、Scrapy)支持网页数据采集,而Excel、SPSS和SQL Server主要用于数据分析和处理。
4. 在物联网中,常用的数据采集设备是?A. 智能手机B. 传感器C. 笔记本电脑D. 平板电脑答案:B解析:传感器是物联网中最常用的数据采集设备,可以实时监测和记录各种物理量(如温度、湿度、压力等)。
5. 在企业中,常用的内部数据采集方法不包括?A. 业务系统日志B. 客户反馈调查C. 员工满意度调查D. 公开数据集下载答案:D解析:公开数据集下载属于外部数据采集方法,而业务系统日志、客户反馈调查和员工满意度调查则是企业内部数据采集的常用方法。
二、填空题6. 在数据采集中,_____是一种通过编写程序自动从网页抓取数据的方法。
答案:网络爬虫解析:网络爬虫是一种自动化技术,用于从互联网上抓取大量数据,广泛应用于市场分析、舆情监控等领域。
7. 在物联网应用中,_____常用于实时监测环境参数。
答案:传感器解析:传感器能够实时感知并记录环境中的各种参数(如温度、湿度、光照强度等),是物联网应用中不可或缺的数据采集设备。
页眉内容思考题与习题11-1填空题:(1)信号是数据的电编码或电磁编码,分为模拟信号和数字信号两种。
(2)数据通信是利用数据传输技术传输数据信息,可实现的和终端、终端和计算机、计算机和计算机之间的数据信息传涕。
(3)一般的数据通信系统主要由数据终端设备、数据电路和中央处理机构系。
(4)数据电路终接设备实际上是数据电路和数据终端设备的接口设备。
(5)衡量数据传输质量的最终指标是数据速率和可靠性。
1-2选择填空题:(1)数据通信系统中发送装置的主要功能是()。
A.将信号从信源发送到目的地B.将信源的数据转发到传输介质C.生成待传送的数据ID.产生适合在传输系统中传输的信号(2)数据通信系统的发送装置的功能一般不包括()。
A.调制信号B.适配电压C.检测与纠正差错 D .暂存数据(3)实际通信系统中的某些DCE设备(如调制解调器)对应于是通信系统模型中的()。
A.信宿与信源B.信源与发送器C.信宿与接收器D.发送器与接收器1-3画出数据通信系统的模型,并说明各个部分的作用(略)1-4简述题(以下略)(1)简述数据通信的发展历史。
(2)什么是数据通信?数据通信研究的内容包括哪些方面?(3)对数据通信最基本的要求是什么?(4)什么是数据通信业务?举例说明数据通信业务。
(5)数据通信传输信道有哪几种类型?每一种传输信道有什么特点?(6)数据通信技术标准的制定机构主要有哪些?1-5计算题:(1)某数据传输系统的调制速率为2400Baud,当每信号码元为4比特的代码时,试求该系统的数据传信率是多少?解:R b = log2 M• R B = log2 16 • 2400 = 9600bit /s(提示:每信号码元为4比特的代码,说明该信号采用16进制传输。
)(2)某信道占用频带为300〜3400Hz,若采用8电平传输,若调制速率为1600Baud,求该信道的频带利用率。
解:4 _ 10g2 M• R R _ 10g2 8 • 1600 _ 4800 _ 1 55“一工工明-3400 - 300 —3100 一•(3)在9600bit/s的线路上,进行1小时的连续传输,测试结果为有150比特的差错,问该数据通信系统的误码率是多少?解:R =——150——=4.34 x 10-6b 9600 x 360012页脚内容页眉内容(4)设数据信号码元周期为417X10-6秒,当采用16电平传输时,试求调制速率和数据传信速率。