浙大远程数据挖掘离线作业答案
- 格式:doc
- 大小:91.06 KB
- 文档页数:9
浙⼤远程操作系统原理离线作业及答案操作系统原理离线作业⼀、单选题1.进程P0和P1的共享变量定义及其初值为boolean flag[2];int turn=0;flag[0]=FALSE;flag[1]=FALSE;若进程P0和P1访问临界资源的类C代码实现如下:void P0() //P0进程{ while(TURE){flag[0]=TRUE; turn = 1;while (flag[1] && turn == 1) ;临界区;flag[0] = FALSE;}}void P1() //P1进程{ while(TURE){flag[1]=TRUE; turn = 0;while (flag[0] && turn == 0) ;临界区;flag[1] = FALSE;}}则并发执⾏进程P0和P1时产⽣的情况是:DA.不能保证进程互斥进⼊临界区、会出现“饥饿”现象B.不能保证进程互斥进⼊临界区、不会出现“饥饿”现象C.能保证进程互斥进⼊临界区、会出现“饥饿”现象 D.能保证进程互斥进⼊临界区、不会出现“饥饿”现象2.有两个进程P1和P2描述如下:shared data:int counter = 6;P1 :Computing;counter=counter+1;P2 :counter=counter-2;两个进程并发执⾏,运⾏完成后,counter的值不可能为 C 。
A. 4B. 5C. 6D. 73.某计算机采⽤⼆级页表的分页存储管理⽅式,按字节编址,页⼤⼩为210字节,页表项⼤⼩为2字节,逻辑地址结构为:页⽬录号页号页内偏移量逻辑地址空间⼤⼩为216页,则表⽰整个逻辑地址空间的页⽬录表中包含表项的个数⾄少是BA.64 B.128 C.256 D.5124.在动态分区系统中,有如下空闲块:空闲块块⼤⼩(KB)块的基址1 80 602 75 1503 55 2504 90 350此时,某进程P请求50KB内存,系统从第1个空闲块开始查找,结果把第4个空闲块分配给了P进程,请问是⽤哪⼀种分区分配算法实现这⼀⽅案? CA.⾸次适应B. 最佳适应C. 最差适应D. 下次适应5.在⼀页式存储管理系统中,页表内容如下所⽰。
大学课程《数据挖掘》试题参考答案范围:∙ 1.什么是数据挖掘?它与传统数据分析有什么区别?定义:数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
区别:(1)数据挖掘的数据源与以前相比有了显著的改变;数据是海量的;数据有噪声;数据可能是非结构化的;(2)传统的数据分析方法一般都是先给出一个假设然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来。
即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。
在缺乏强有力的数据分析工具而不能分析这些资源的情况下,历史数据库也就变成了“数据坟墓”-里面的数据几乎不再被访问。
也就是说,极有价值的信息被“淹没”在海量数据堆中,领导者决策时还只能凭自己的经验和直觉。
因此改进原有的数据分析方法,使之能够智能地处理海量数据,即演化为数据挖掘。
∙ 2.请根据CRISP-DM(Cross Industry Standard Process for Data Mining)模型,描述数据挖掘包含哪些步骤?CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述.该模型将一个KDD工程分为6个不同的,但顺序并非完全不变的阶段.1: business understanding: 即商业理解. 在第一个阶段我们必须从商业的角度上面了解项目的要求和最终目的是什么. 并将这些目的与数据挖掘的定义以及结果结合起来.2.data understanding: 数据的理解以及收集,对可用的数据进行评估.3: data preparation: 数据的准备,对可用的原始数据进行一系列的组织以及清洗,使之达到建模需求.4:modeling: 即应用数据挖掘工具建立模型.5:evaluation: 对建立的模型进行评估,重点具体考虑得出的结果是否符合第一步的商业目的.6: deployment: 部署,即将其发现的结果以及过程组织成为可读文本形式.(数据挖掘报告)∙ 3.请描述未来多媒体挖掘的趋势随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已满足不了应用的需要,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴涵于其中的有价值的知识。
数据挖掘习题答案数据挖掘习题答案数据挖掘作为一门重要的技术和方法,广泛应用于各个领域。
在学习数据挖掘的过程中,习题是不可或缺的一部分。
通过解答习题,我们可以更好地理解和掌握数据挖掘的原理和应用。
以下是一些常见的数据挖掘习题及其答案,供大家参考。
一、选择题1. 数据挖掘的目标是什么?A. 发现隐藏在大数据中的模式和关联B. 提供数据存储和管理的解决方案C. 分析数据的趋势和变化D. 优化数据的存储和传输速度答案:A. 发现隐藏在大数据中的模式和关联2. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 回归D. 排序答案:D. 排序3. 数据挖掘的过程包括以下几个步骤,哪个是第一步?A. 数据清洗B. 数据集成C. 数据转换D. 数据选择答案:B. 数据集成4. 下列哪个不是数据挖掘中常用的算法?A. 决策树B. 支持向量机C. 朴素贝叶斯D. 深度学习答案:D. 深度学习5. 下列哪个不是数据挖掘的应用领域?A. 金融B. 医疗C. 娱乐D. 政治答案:D. 政治二、填空题1. 数据挖掘是从大量数据中发现________和________。
答案:模式,关联2. 数据挖掘的主要任务包括分类、聚类、回归和________。
答案:预测3. 数据挖掘的过程包括数据集成、数据清洗、数据转换和________。
答案:模式识别4. 决策树是一种常用的________算法。
答案:分类5. 数据挖掘可以应用于金融、医疗、娱乐等多个________。
答案:领域三、简答题1. 请简要介绍数据挖掘的主要任务和应用领域。
答:数据挖掘的主要任务包括分类、聚类、回归和预测。
分类是将数据集划分为不同的类别,聚类是将数据集中相似的样本归为一类,回归是根据已有的数据预测未知数据的值,预测是根据已有的数据预测未来的趋势和变化。
数据挖掘的应用领域非常广泛,包括金融、医疗、娱乐等。
在金融领域,数据挖掘可以用于信用评估、风险管理等方面;在医疗领域,数据挖掘可以用于疾病诊断、药物研发等方面;在娱乐领域,数据挖掘可以用于推荐系统、用户行为分析等方面。
您的本次作业分数为:100分1.【第001章】孤立点挖掘适用于下列哪种场合?A 目标市场分析B 购物篮分析C 模式识别D 信用卡欺诈检测正确答案:D2.【第01章】根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。
A 关联分析B 分类和预测C 演变分析D 概念描述正确答案:B3.【第01章】数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。
A 所涉及的算法的复杂性B 所涉及的数据量C 计算结果的表现形式D 是否使用了人工智能技术正确答案:B4.【第01章】下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。
A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:D5.【第01章】下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:A6.【第01章】帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是()。
A 关联分析B 分类和预测C 聚类分析D 孤立点分析E 演变分析正确答案:C7.【第01章】下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。
A 选择任务相关的数据B 选择要挖掘的知识类型C 模式的兴趣度度量D 模式的可视化表示正确答案:B8.【第01章】假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。
A 关联分析B 分类和预测C 孤立点分析D 演变分析E 概念描述正确答案:E9.【第02章】下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?A 空间填充曲线B 散点图矩阵C 平行坐标D 圆弓分割正确答案:B10.【第02章】计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?A 算术平均值B 截尾均值C 中位数D 众数正确答案:B11.【第02章】字段Size = {small, medium, large}属于那种属性类型?A 标称属性B 二元属性C 序数属性D 数值属性正确答案:C12.【第02章】字段Hair_color = {auburn, black, blond, brown, grey, red, white}属于那种属性类型?A 标称属性B 二元属性C 序数属性D 数值属性正确答案:A13.【第03章】哪种数据变换的方法将数据沿概念分层向上汇总?A 平滑B 聚集C 数据概化D 规范化正确答案:C14.【第03章】下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?A 数据清理B 数据集成C 数据变换D 数据归约正确答案:A15.【第03章】()通过将属性域划分为区间,从而减少给定连续值的个数。
2015秋浙江大学网络学院《数据挖掘》在线作业及答案单选题1.置信度(confidence)是衡量兴趣度度量()的指标。
A 简洁性B 确定性C 实用性D 新颖性正确答案:B 单选题2.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?A 上卷B 下钻C 切块D 转轴正确答案:A 单选题3.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:A 单选题4.下列哪个描述是正确的?A 分类和聚类都是有指导的学习B 分类和聚类都是无指导的学习C 分类是有指导的学习,聚类是无指导的学习D 分类是无指导的学习,聚类是有指导的学习正确答案:C单选题5.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?A 算术平均值B 截尾均值C 中位数D 众数正确答案:B 单选题6.规则:age(X,”19-25”) ∧buys(X, “popcorn”) => buys(X, “coke”)是一个()。
A 单维关联规则B 多维关联规则C 混合维关联规则D 不是一个关联规则正确答案:B 单选题7.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。
A 关联分析B 分类和预测C 孤立点分析D 演变分析 E概念描述正确答案:E 单选题8.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?A 数据清理B 数据集成C 数据变换D 数据归约正确答案:A 单选题9.进行数据规范化的目的是()。
A 去掉数据中的噪声B 对数据进行汇总和聚集C 使用概念分层,用高层次概念替换低层次“原始”数据D 将属性按比例缩放,使之落入一个小的特定区间正确答案:D 单选题10.平均值函数avg()属于哪种类型的度量?A 分布的B 代数的C 整体的D 混合的正确答案:B 单选题11.下面哪种分类方法是属于统计学的分类方法?A 判定树归纳B 贝叶斯分类C 后向传播分类D 基于案例的推理正确答案:B 单选题12.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
第1章概述作业一一.填空题:1.从资源共享的角度来定义计算机网络,计算机网络指的是利用_通信线路__将不同地理位置的多个独立的__自治计算机系统_连接起来以实现资源共享的系统。
2.从传输范围的角度来划分计算机网络,计算机网络可以分为_局域网_、城域网_和_广域网_。
其中,Internet属于_广域网__。
3.在TCP/IP的应用层协议使用的是_客户服务器方式_,在这里,客户是服务请求方,服务器是服务提供方。
美国的IBM公司在1974年宣布了它研制的网络体系结构_ SNA __。
4.通信线路的_带宽__是指通信线路上允许通过的信号频带范围(或通频带) ,单位是HZ。
但在计算机网络中,它又用来表示网络的通信线路所能传送数据的能力。
5.数据通信中的信道传输速率单位用b/s表示,b/s的含义是__每秒比特__。
6.目前,“带宽”常用作描述信道传送数据能力的物理量,其单位是b/s (bit/s),比之大的单位有:_ Kb/s ___、Mb/s、_ Gb/s __等。
7.将计算机网络划分为局域网LAN、城域网MAN、广域网WAN是按_网络的作用范围(或覆盖的范围)_划分的。
8.各节点都与中心节点连接,呈辐射状排列在中心节点周围,这种拓扑结构称为_星型拓扑结构_。
9.假设某用户通过电线部门的ADSL技术以2M(即2Mb/s)带宽接入Internet,在正常情况下其下载速度大约是_ 244KB(大写B表示字节)_。
10.在发送报文之前,先将较长的报文划分成为一个个更小的等长数据段,在每一个数据段前面,加上一些由必要的控制信息组成的首部(header)后,就构成了一个_分组_。
11.在计算机网络中,_各个子层_及其__各子层的协议_的集合称为网络体系结构。
12.开放系统互联,采用分层体系结构的模型称为__ OSI __参考模型。
13.在OSI参考模型中,在对等层次上传送的数据单位,都称为该层的_协议数据单元(PDU)_。
操作系统原理第三次作业(第4、5章)-1问答题1.用户在使用配置UNIX/Linux 操作系统的计算机时不能将用户软盘随便插进和拿出,试从UNIX/Linux子文件系统的使用原理说明它需要一定的操作的依据和操作的步骤。
UNIX系统只有一个安装UNIX操作系统的根设备的文件系统常驻系统,在硬盘上的其它盘区和软盘上的文件系统被安装前UNIX OS不知道,系统要使用其它文件系统,必须先用mount命令将其安装到系统,被安装的子文件系统的根安装到根设备树形目录的某一节点上。
子文件系统在安装时将该子系统的管理块(superblock)和有关目录信息拷贝到系统缓冲区和活动索引节点表,管理块中存放该子文件系统所对应盘区的管理信息,如即将分配的空闲块号和空闲索引节点号等。
子文件系统安装后进行文件读写增删,文件创建和删除等操作,其变化要记录在系统缓冲区中管理块和活动索引节点表中。
子文件系统使用完毕后要使用umount拆卸命令拆卸安装上去的文件系统,在拆卸时系统将内存系统缓冲区中的管理块和活动索引节点表信息拷贝到将拆卸的子文件系统盘中,保证信息的完整性。
软盘的子文件系统,它需按规定使用,步骤如下:(1)插入软盘(2)使用安装命令安装软盘文件系统(3)读/写盘中文件(4)使用拆卸命令拆卸软盘文件系统(5)取出软盘如使用软盘时随便插进和拿出软盘,就可能造成软盘信息的丢失2. 什么是文件共享?试述UNIX系统中文件共享的实现方法和命令的使用。
文件共享是允许不同的用户使用不同的名字名存取同一文件。
UNIX的文件共享方式有二种:(1)基于索引节点的共享方式--文件硬连接UNIX系统将文件控制块FCB中文件名和文件说明分开。
文件说明为索引节点,各文件索引节点集中存放在索引节点区。
而文件名与索引节点号构成目录,同一级目录构成目录文件,在文件区存放。
为了共享文件,只是在二个不同子目录下取了不同的文件名,但它们具有相同的索引节点号。
第5章运输层作业五一.填空题:1.从通信和信息处理的角度看,在TCP/IP模型中向其上面的应用层提供通信服务的协议层称为_运输_层。
2.传输层使用了___网络层__提供的服务,并通过执行_传输层协议_,针对最高层屏蔽__通信子网_在技术、设计上的差异与服务不足,向_更高层(或写应用层)_提供了一个标准的完善的通信服务。
3.TCP协议可以为其用户提供_可靠_、面向连接的、全双工的数据流传输服务。
4.UDP协议可以为其用户提供不可靠、__无连接的数据传输服务。
5.人们把将要发送的完整的数据块称为报文,在运输层直接对应用层交下来的报文进行封装的协议是_ UDP _。
6.在运输层,TCP协议传递给网络层IP协议的数据单元称为_报文段_。
7.TCP/IP的运输层有两个不同的协议,它们是TCP和UDP,其中文名分别叫做传输控制协议和_用户数据报协议__。
前者是面向连接的协议,而后者则属于无连接协议。
使用UDP协议,系统资源开销小,UDP报文段的首部只有_8_字节。
而对于TCP来说,其报文段的首部至少有_20_字节,传输开销比较大,TCP开销大的另一个原因是占有CPU的处理时间。
因此,在应用层开发中运输层使用哪个协议要视具体情况而定。
诸如“万维网、电子邮件和文件传输”服务在运输层使用_ TCP_协议封装,而“域名转换协议DNS和IP电话”服务在运输层使用_ UDP协议封装。
8.熟知端口即系统端口号是IANA指派的。
FTP服务使用的熟知端口号是_21_,简单邮件传输协议SMTP使用的熟知端口号是_25_,邮局协议POP3使用的熟知端口号是_110_。
9.在TCP/IP网络中,两个应用进程之间建立的Socket连接是由4个数字确定的,包括双方的IP地址和双方的__端口号__。
10.主机A向主机B发送TCP报文段,首部中的源端口是m而目的端口是n。
当B向A发送回信时,其TCP报文段的首部中的源端口和目的端口分别是_ n 和m __。
操作系统原理第二次离线作业(第3章)-1应用题1.在一个请求分页系统中,采用FIFO页面置换算法时,假如一个作业的页面访问顺序为4,3,2,1,4,3,5,4,3,2, l,5,当分配给该作业的物理块数M为4时,试试写出页面访问的过程,并计算访问中所发生的缺页次数和缺页率?解:FIFO置换算法用FIFO置换算法产生缺页次数 10 次缺页率83%2.某采用页式存储管理的系统,假如系统分配给一个作业的物理块数为4,作业执行时依次访问的页为: 2,3,2,1,5,2,4,5,3,2,5,2。
采用LRU页面置换算法时,计算出程序访问过程中所发生的缺页过程和缺页次数。
解:LRU算法问答题1.试述在设有快表的分页存贮管理系统的地址变换机构和地址变换过程。
在CPU给出有效地址(逻辑地址)后,系统将有效地址分离为页号和页内地址。
系统将页号与页表长度进行比较,如果页号大于页表寄存器中的页表长度,则访问越界,产生越界中断。
地址变换机构又自动地将页号送入高速缓存,确定所需要的页是否在快表中。
若是,则直接读出该页所对应的物理块号,送入物理地址寄存器;与此同时,将有效地址(逻辑地址)寄存器中页内地址直接装入物理地址寄存器的块内地址字段中,这样便完成了从逻辑地址到物理地址的变换。
若在快表中未找到对应的页表项,则根据页表寄存器中的页表始址和页号计算出该页在页表项中的位置,通过查找页表,得到该页的物理块号,将此物理块号装入物理地址寄存器中,与有效地址寄存器中页内地址组合成物理地址;同时,把从页表中读出的页表项存入快表中的一个寄存器单元中,以取代一个旧的页表项。
2.试述动态分区、分页和分段三种存储管理方案中如何实现信息的存储保护。
1. 越界保护在动态分区的保护的常用方法是由系统提供硬件:一对界限寄存器。
这可以是上界限寄存器、下界限寄存器,或者是基址寄存器、限长寄存器。
基址寄存器存放起始地址,作为重定位(地址映射)使用;限长寄存器存放程序长度,作为存贮保护使用。
浙江大学远程教育学院《工程数学》课程作业姓名:学号:年级:学习中心:—————————————————————————————《复变函数与积分变换》第一章1.1计算下列各式:(2)、(a-bi)3解(a-bi)3=a3-3a2bi+3a(bi)2-(bi)3=a3-3ab2+i(b3-3a2b) ;(3)、;解====1.2、证明下列关于共轭复数的运算性质:(1);证()-i()==(2)证===--==()()=--即左边=右边,得证。
(3)=(Z2≠0)证==()====1.4、将直线方程ax+by+c=0 (a2+b2≠0)写成复数形式[提示:记x+iy=z]z+A+B=0,其中A=a+ib,B=2C(实数) 。
解由x=,y=代入直线方程,得()+()+c=0,az+-bi()+2c=0,(a-ib)z+( a+ib)+2c=0,故z+A+B=0,其中A=a+ib,B=2C1.5、将圆周方程a(x2+y2)+bx+cy+d=0 (a≠0)写成复数形式(即用z 与来表示,其中z=x+iy)解:x=,y=,x2+y2=z代入圆周方程,得az+()+()+d=0,2az+(b-ic)z+(b+ic)+2d=0故Az++B+C=0,其中A=2a,C=2d均为实数,B=b+ic 。
1.6求下列复数的模与辅角主值:(1)、=2,解arg()=arctan= 。
1.8将下列各复数写成三角表示式:(2)、i;解=1,arg()=arctan()= -a故i=+i。
1.10、解方程:Z3+1=0解方程Z3+1=0,即Z3=-1,它的解是z=,由开方公式计算得Z==+i,k=0,1,2即Z0==+i,Z1==1,Z2=+ i=i 。
1.11指出下列不等式所确定的区域,并指明它是有界的还是无界的?是单连通区域还是多连通区域?(1)、2<<3;解圆环、有界、多连域。
(3)、<arg z<;解圆环的一部分、单连域、有界。