智慧树知到《大数据工具应用》章节测试答案
- 格式:doc
- 大小:30.56 KB
- 文档页数:19
大数据可视化智慧树知到课后章节答案2023年下浙江大学第一章测试1.以下不属于可视化的作用的是()A:信息记录 B:数据采集 C:数据分析 D:传播交流答案:数据采集2.数据可视化萌芽于什么时间()A:18世纪 B:17世纪 C:15世纪 D:16世纪答案:16世纪3.可视分析学是何时兴起的()A:19世纪 B:21世纪 C:18世纪 D:20世纪答案:21世纪4.张量场可视化属于可视化的哪个分支学科()A:信息可视化 B:可视分析学 C:科学可视化 D:人机交互学答案:科学可视化5.使用以下哪种可视化工具不需要编程基础()A:Tableau B:Processing C:Vega D:D3.js 答案:Tableau6.数据可视化的原则是细节优先。
A:错 B:对答案:错7.文本可视化属于信息可视化。
A:对 B:错答案:对8.可视分析学涉及到的学科包括()A:计算机图形学 B:数据挖掘C:统计分析 D:人机交互答案:计算机图形学;数据挖掘;统计分析;人机交互9.以下哪些工具是数据可视化工具()A:Matlab B:Tableau C:D3.js D:Vega 答案:Tableau;D3.js ;Vega10.这个视频中体现了可视化的哪些作用()A:数据分析 B:信息记录 C:数据过滤 D:传播交流答案:数据分析;信息记录第二章测试1.有的人在发朋友圈的时候,会把一张图片切成9份,然后再按顺序拼出一个九宫格,如下图所示。
虽然图片被分割开来,但是我们仍旧能够感知到图片原来完整的样子,这体现了格式塔理论的()原则。
A:接近原则 B:相似原则 C:连续原则 D:闭包原则答案:连续原则2.下图所示的图片体现了格式塔理论的()原则。
A:连续原则 B:相似原则 C:接近原则 D:闭包原则答案:接近原则3.下图所示的图片体现了格式塔理论的()接近原则A:接近原则 B:相似原则 C:闭包原则 D:连续原则答案:相似原则4.下图所示的可视化中运用了以下哪个视觉通道?()A:高度 B:形状 C:亮度 D:颜色答案:高度5.下图所示的可视化中体现了哪种类型的视觉通道?()A:分组型B:分类型C:定性型D:定量型答案:分组型6.根据格式塔理论,人们在观看时,眼脑在一开始的时候会先区分一个形象的各个单一的组成部分,然后再将各个部分组合起来,使之成为一个易于理解的统一体。
大数据解析与应用导论知到章节测试答案智慧树2023年最新浙江大学第一章测试1.下列属于多元统计方法的为()参考答案:回归分析;主元分析2.多元统计分析的图表示法有()参考答案:散布图矩阵;调和曲线图;轮廓图;雷达图3.完整的数据分析过程,包括数据采集、数据清洗和数据分析。
()参考答案:对4.下列场景适用于回归分析的是 ( )参考答案:天气预报5.下面哪一句体现了主元分析的思想()参考答案:牵牛要牵牛鼻子第二章测试1.一般常见的缺失值处理的方法有()参考答案:回归填充法;最近邻插补填充法;插值填充;替换填充法2.一般常见的数据归一化的方法有()参考答案:最小最大规范化;零均值规范化3.少量的异常值完全不会影响数据分析。
()参考答案:错4.下列哪种方法不是数据填补的手段 ( )参考答案:均值标准化5.主成分分析的英文名是()。
参考答案:Principal Component Analysis第三章测试1.下面哪个是SVM在实际生活中的应用()参考答案:图片分类;邮件分类2.以下说法正确的有哪些()参考答案:SVM是一种线性方法;软间隔的引入可以解决轻度线性不可分问题3.拉格朗日乘子法可用于线性可分SVM的模型求解。
()参考答案:对4.SVM的中文全称叫什么?()参考答案:支持向量机5.SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?()参考答案:大数据集第四章测试1.一元线性回归有哪些基本假定?()参考答案:解释变量X是确定性变量,Y是随机变量;;随机误差项和解释变量X不相关;;随机误差项服从零均值、同方差的正态分布。
;随机误差项具有零均值、同方差和序列不相关的性质;2.最典型的两种拟合不佳的情况是()。
参考答案:欠拟合;过拟合3.岭回归适用于样本很少,但变量很多的回归问题。
()参考答案:对4.最小二乘方法的拟合程度衡量指标是()。
参考答案:残差平方和5.关于最小二乘法,下列说法正确的是。
云计算与大数据技术知到章节测试答案智慧树2023年最新北京联合大学绪论单元测试1.下列哪些应用属于大数据技术的应用()。
参考答案:音视频网站上通过分析注册用户的浏览习惯,为用户推送感兴趣的音视频。
;手机银行或网上银行在用户画像基础上,对用户群进行定位,挖掘潜在金融服务需求。
;政务领域中的智慧城市建设,如智慧交通、智慧医疗、智慧教育等。
;电商网站上对注册用户浏览信息记录、分析、挖掘,为用户推送感兴趣的商品。
2.日常我们用到的云服务器、钉钉办公软件、百度网盘等应用都是云计算服务厂商提供的云计算服务。
()参考答案:对第一章测试1.云计算的服务模式包括()。
参考答案:平台即服务;软件即服务;基础设施即服务2.云计算的劣势有()。
参考答案:风险被集中;数据泄密的环节增多;严重依赖网络3.云计算部署模型有()。
参考答案:公有云;私有云;混合云4.云计算是把有形的产品(网络设备、服务器、存储设备、各种软件等)转化为服务产品(IaaS,PaaS,SaaS),并通过网络让人们远程在线使用。
()参考答案:对5.云计算是一种计算模式,能够提供随时随地、便捷的、随需应变的网络接入,访问可配置的计算资源共享池。
()参考答案:对第二章测试1.虚拟化技术主要用于云计算物理资源的池化,物理资源不包括()。
参考答案:操作系统2.虚拟技术特性有()。
参考答案:隔离;封装;分区;相对于硬件独立3.虚拟化的益处包括()。
参考答案:实现节能减排;实现动态负载均衡;实现资源最优利用;通过系统自愈功能提升可靠性4.个人PC上使用比较多的虚拟化工具有()。
参考答案:Virtual Box;VMware Workstation5.虚拟化是一项技术,而云是一种环境或服务。
()参考答案:对6.虚拟化的主要功能是把单个资源抽象成多个给用户使用,而云计算则是帮助不同部门或公司访问一个自动置备的资源池。
()参考答案:对第三章测试1.开放系统的存储类型分为内置存储和外挂存储,其中外挂存储可分为()。
第一章测试1.与MapReduce相比,Spark更适合处理以下哪种类型的任务()A:较少迭代次数的短任务B:较多迭代次数的长任务C:较少迭代次数的长任务D:较多迭代次数的短任务答案:D2.Standalone模式下配置Spark集群时,master节点的工作端口号需要在conf文件夹下的哪个文件指明()A:regionserverB:spark-defaults.confC:spark-env.shD:slaves答案:C3.以下关于SPARK中的spark context,描述错误的是:()A:可以控制dagsheduler组件B:控制整个application的生命周期C:SparkContext为Spark的主要入口点D:可以控制task scheduler组件答案:B4.以下对Spark中Work的主要工作描述错误的是()A:不会运行业务逻辑代码B:会运行业务逻辑代码C:管理当前节点内存D:接收master分配过来的资源指令答案:B5.配置Standalone模式下的Spark集群,Worker节点需要在conf文件夹下的哪个文件中指明()A:spark-env.shB:regionserverC:spark-defaults.confD:slaves答案:D6.Spark支持的分布式部署方式中哪个是错误的()A:standaloneB:Spark on localC:spark on YARND:spark on mesos答案:B7.Spark单机伪分布式模式,它的特点是在一台节点上既有Master服务,又有Worker服务()A:对B:错答案:A8.在部署Spark独立模式时,配置spark内部通信的端口为()A:16010B:7077C:9870D:7070答案:B9.在部署Spark独立模式时,配置spark的web端口为()A:4040B:9870C:7077D:8080答案:C10.Spark的bin目录是spark运行脚本目录,该目录中包含了加载spark的配置信息,提交作业等执行命令的脚本()A:错B:对答案:B第二章测试1.valrdd=sc.parallelize(1 to 10).filter(_%2== 0)rdd.collect上述代码的执行结果为()A:Array(1, 3, 5,7,9)B:Array(1,2,3,4,5,6,7,8,9,10)C:Array(1,10)D:Array(2, 4, 6, 8, 10)答案:D2.下面哪个操作是窄依赖()A:groupB:joinC:filterD:sort答案:C3.下面哪个操作肯定是宽依赖()A:flatMapB:mapC:reduceByKeyD:sample答案:C4.以下操作中,哪个不是Spark RDD编程中的操作。
大数据分析与应用知到章节测试答案智慧树2023年最新咸阳职业技术学院第一章测试1.HDFS 已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,开源社区形成了 K-V( key-value)、列式、()、图这四类 NoSQL 数据库体系。
参考答案:文档2.麦肯锡全球研究所对大数据的定义是()。
参考答案:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征3.大数据应用场景不包括()。
参考答案:人群标签,精准营销4.DataWorks是一个提供了大数据OS能力、并以all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。
同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。
()参考答案:对5.云原生数据仓库MySQL版(简称ADB,原AnalyticDB for MySQL)是一种高并发低延时的PB级新一代云原生数据仓库,全面兼容MySQL协议以及SQL:2003 语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视和业务探索。
()参考答案:对第二章测试1.ETL是Extract、 Transform、 Loading三个字母的缩写,即抽取、转换、()。
参考答案:装载2.HBase是一个构建在HDFS上的分布式列存储系统,用于海量结构化、半结构化数据存储。
()参考答案:对3.数据规约:在尽可能保持数据原貌的前提下,最大限度地精简数据量。
主要包括属性选择和数据抽样两种方法。
()参考答案:对4.数据清洗是针对原始数据,对出现的噪声进行修复、平滑或者剔除。
包括异常值、缺失值、重复记录、错误记录等;同时过滤掉不用的数据,包括某些行或某些列。
()参考答案:对5.使用算法确保历史模型能够用户预测特定的结果。
()参考答案:对第三章测试1.SQL集数据查询、数据操纵、数据定义和数据库控制功能于一体,语句ALTER TABLE实现数据定义功能。
大数据概论智慧树知到课后章节答案2023年下上海商学院上海商学院第一章测试1.下列哪个表述是错误的?A:在芯片里运行的程序可以是C语言编写。
B:在芯片里运行的程序可以是面向对象语言编写。
C:在芯片里运行的程序可以是汇编语言编写。
D:在芯片里运行的程序可以是二进制语言编写。
答案:在芯片里运行的程序可以是面向对象语言编写。
2.以下哪一种不是计算机操作系统?A:Linux B:iOS C:Android D:Oracle答案:iOS3.微软对Windows界面的开发主要受到哪家公司的启发?A:3M B:施乐 C:IBM D:苹果答案:苹果4.Windows和Linux或者iOS和Android之间的最大区别在于什么?A:速度:前者快后者慢 B:用户体验:前者优后者差 C:价格:前者贵后者便宜 D:思想:前者封闭后者开源答案:思想:前者封闭后者开源5.医疗领域如何利用大数据?A:用户行为分析 B:社保资金安全 C:个性化医疗 D:临床决策支持答案:用户行为分析;社保资金安全;个性化医疗;临床决策支持6.现在非结构化数据已经占人类数据量的25%。
A:对 B:错答案:错7.大数据与云计算结合起来将给世界带来一场深刻的管理技术革命与社会治理创新。
A:错 B:对答案:对8.Python是一种面向对象、()计算机程序设计语言。
A:编译型 B:解释型答案:解释型9.ASCII码使用一个字节编码。
A:错 B:对答案:对10.GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。
答案:对第二章测试1.人类科学主要经过了经验科学、理论科学、计算科学、数据科学四个阶段。
A:错 B:对答案:对2.大数据的利用过程是()。
A:采集-清洗-统计-挖掘 B:采集-挖掘-清洗-统计 C:采集-统计-清洗-挖掘 D:采集-清洗-挖掘-统计答案:采集-清洗-统计-挖掘3.信息只有通过反思、启发和学习等过程被每个个体予以有效处理,才能有用。
第一章测试1.下面的语句中,( ) 是DDL的例子。
A:createB:deleteC:selectD:insert答案:A2.显示登录的用户名,可以用的命令是:( )A:REM userB:DESCRIB userC:SELECT userD:SHOW user答案:D3.下面哪一个like命令会返回名字象HOTKA的行?( )A:where ename like ‘HOT%’B:where ename like ‘%TOK%’C:where ename like ‘H_T%D:where ename like ‘%TKA’答案:C4.哪个函数与||运算有相同的功能:( )A:instrB:concatC:substrD:ltrim答案:B5.下列哪个聚合函数的参数要求必须是数值型( )。
A:minB:sumC:maxD:count答案:B6.Order by子句仅对检索数据的显示有影响,并不改变表中行的内部顺序。
( )A:对B:错答案:A7.having子句是随着group by子句的出现而出现的,没有group by就没有having。
A:对B:错答案:A8.在查询中,建议多使用列别名提升输出结果的可读性。
A:错B:对答案:B第二章测试1.Test表有一列: test_data number(5,4),下面哪个值可以添加到该列中()。
A:222B:2222.2C:22.2D:2.2答案:D2.对于ROLLBACK命令,以下准确的说法是:( )A:撤销本次登录以来所有的数据修改B:撤销上一个COMMIT命令C: 撤销刚刚进行的数据修改操作D:撤销到上次执行提交或回退操作的点答案:D3.表的主键特点中,说法正确的是:( )A:主键的列可以为空值B:主键的每一列都必须惟一C:主键可以定义在表级或列级D:一个表可以定义多个主键答案:C4.删除emp表的全部数据,但不提交,以下正确的语句是:( )A:DELETE TABLE EMPB: DELETE * FROM EMPC:DELETE FROM EMPD:TRUNCATE TABLE EMP答案:C5.下面有关表和视图的叙述中错误的是:( )A:对视图的数据修改最终传递到基表B:视图的数据可以来自多个表C:删除视图不会影响基表的数据D:基表不存在,不能创建视图答案:D6.使用索引可以提高查询的速度,但索引不是越多越好。
第一章测试1.大数据的英文描述是()A:Big dataB:Large dataC:Great dataD:Heavy data答案:A2.下面最大的储存单位是()A:TBB:KBC:PBD:GB答案:C3.大数据之父是()A:维克托·迈尔-舍恩伯格B:姚期智C:查尔斯·巴赫曼D:詹姆斯·高斯林答案:A4.大数据的特点包括()A:ValueB:VarietyC:VelocityD:Volume答案:ABCD5.第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A:ScienceB:PNASC:NatureD:Cell答案:AC6.大数据是只和互联网相关的计算机技术。
A:错B:对答案:A7.企业中大部分的数据都是非结构化数据。
A:对B:错答案:A8.大数据技术的基础是由阿里巴巴首先提出的。
A:错B:对答案:A9.大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
A:对B:错答案:A10.大数据对网络安全没有威胁。
A:错B:对答案:A第二章测试1.目前,企业的数据架构存在的最大比例问题是()A:运营成本高B:高耗能C:拓展性差D:资源利用率低答案:C2.目前,企业数据分析处理面临的主要问题是缺少数据全方位分析方法。
A:错B:对答案:B3.地图导航根据以往的行程记录,绘制了最优路程,标明了可能堵车的地点,这表现了大数据分析理念中的()A:注重相关性而不是因果性B:注重效率而不是准确C:注重相对性而不是绝对性D:注重全体而不是局部答案:A4.最早提出大数据研发计划的国家是()A:日本B:美国C:中国D:法国答案:B5.大数据可能被运用的行业有()A:医疗B:农业C:金融D:教育答案:ABCD6.2015年9月18日云南省启动我国首个大数据综合试验区的建设工作。
A:对B:错答案:B7.大数据的价值密度很高。
A:对B:错答案:B8.日本政府将IT产业,尤其是大数据及云计算作为促进经济增长,解决内部矛盾一个关键。
第一章单元测试1、判断题:大数据是人们在大规模数据的基础上做到的事情,这些事情是在小规模数据的基础上无法完成的。
()选项:A:对B:错答案: 【对】2、判断题:随着互联网多媒体应用的出现,非结构化数据将占有更大的比重。
()选项:A:对B:错答案: 【对】3、单选题:任何一列都不可再分的数据为下列哪种数据?()选项:A:结构化数据B:文本数据C:半结构化数据D:无结构数据答案: 【结构化数据】4、多选题:在《大数据时代》中所提到的大数据三个特征为()。
选项:A:效率而非精确B:种类而非数量C:全面而非抽样D:相关而非因果答案: 【效率而非精确;全面而非抽样;相关而非因果】5、多选题:下列哪些是深度学习框架?()选项:A:Scikit-learnB:PyTorchC:TensorFlowD:Jupyter答案: 【PyTorch;TensorFlow】第二章单元测试1、单选题:大数据产生的萌芽阶段为:()选项:A:21实际初到2010年B:20世纪90年代到21世纪初C:2011年至今D:19世纪90年代到20世纪初答案: 【20世纪90年代到21世纪初】2、判断题:“深度学习”概念是杰弗里辛顿及他的学生鲁斯兰萨拉赫丁诺夫于2005年提出的。
()选项:A:错B:对答案: 【错】3、判断题:机器学习的最佳场景是大数据。
()选项:A:错B:对答案: 【对】4、多选题:下列属于数据智能的超强魔力的是:()选项:A:描述性分析B:预测性分析C:诊断性分析D:指令性分析答案: 【描述性分析;预测性分析;诊断性分析;指令性分析】《人工智能北京共识》于2019年5月25日发布,提出各个参与方应遵循有益于人类共同命运构建和社会发展的几条原则?()选项:A:15B:10C:25D:20答案: 【15】第三章单元测试1、单选题:一下属于分类算法的是()。
选项:A:线性回归B:DBSCANC:K-MeansD:逻辑回归答案: 【逻辑回归】2、多选题:以下属于带有正则化的回归算法的是()。
第一章1.大数据分析的最终目的是()答案:通过数据分析来挖掘数据背后的价值2.数据采集的方式包括()答案:主动数据采集;网络下载数据;购买数据3.Wireshark是手机数据的采集软件()答案:对4.手机和手机APP是同时连通网络的()答案:错5.360随身WIFI的目的是()答案:构造局域网,从而让手机连通电脑6.对于电脑+手机+360WIFI而言,它们之间存在的网络包括()答案:360WIFI构成的无线网络;笔记本电脑连接的Internet网络;手机的4G网络7.手机APP的联网效率是指手机联上网络的时间T1和手机APP联上网络的时间T2之差()答案:对8.在上一题中,T1-T2的值越小时,手机APP的联网效率越高。
()答案:错9.开始手机数据收集之前,需要先关闭手机的3G或者4G网络,仅让手机连接360WIFI的网络()答案:对10.在手机断开WIFI之后,手机APP会()答案:立即断开网络第二章1.打开Wireshark软件,可以从主界面的【Open】选项打开*.CSV文件()答案:错2.分析手机APP的联网效率需要用到()答案:ICMPV6协议;IP协议;TCP协议3.双击【我的电脑】,可以查看计算机中的IP地址()答案:错4.打开手机的设置,可以查看到手机的IP地址答案:对5.Wireshark能够记录手机的IP地址并在目标地址位置显示出来()答案:错6.三次握手协议是属于()答案:TCP协议7.TCP协议中的FIN表示建立连接答案:错8.手机APP连接网络时用到()协议答案:三次握手协议9.手机连接网络是用到()协议答案:ICMPv610.手机数据捕获软件是()答案:Wireshark第三章1.在实验中是手机最先连接到网络()答案:错2.手机联网时间可以通过查找三次握手协议获得答案:错3.手机APP联网时间可以通过查找三次握手协议获得答案:错4.当ICMPv6的type为()时,手机连通了网络答案:1365.当TCP的flag为()时,表示手机APP连通了网络答案:06.80端口是TCP协议中加密传输需要用到的端口()答案:错7.TCP协议中非加密传输需要用到的端口()答案:808.大数据分析的一般方法是先对海量数据进行分析,再约减数据答案:错9.手机端的自动数据采集需要()软件答案:Wireshark;Excel10.Wireshark软件能够进行脚本录制()答案:错第四章1.在查找字符串中是否包含字符AB或BA,则应该构造正则表达式()答案:AB|BA2.下列哪个正则表达式能够表示0个或多个空格()答案:\s+3.要匹配A1、A2、A3、…、A9,则需要构造正则表达式( )答案:A[1-9]4.要匹配A0、A12、A123、…、A119,则需要构造正则表达式( )答案:A[1-9]5.正则表达式中符号|的意思是()答案:管道符6.Excel支持通配符查询()答案:对7.Excel中的筛选功能能够约减数据集()答案:错8.Excel中能选出满足条件的所有选项,不论这些选项是否是在同一列中。
智慧树知到《大数据工具应用》章节测试答案
第一章
1、2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集。
A:计算
B:访问
C:应用
D:分析
答案: 分析
2、用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和()。
A:Variety
B:Vainly
C:Vagary
D:Valley
答案: Variety
3、大数据分析四个方面的工作主要是:数据分类、()、关联规则挖掘和时间序列预测。
A:数据统计
B:数据计算
C:数据聚类
D:数据清洗
答案: 数据聚类
4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。
B:错
答案: 错
5、目前的大数据处理技术只能处理结构化数据。
A:对
B:错
答案: 错
第二章
1、我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是()。
A:mdf
B:mdb
C:dbf
D:xls
答案: mdb
2、大多数日志文件的后缀名是()。
A:txt
B:csv
C:xml
D:log
答案: log
3、本课程重点介绍的weka软件的专有文件格式是()。
A:MongoDB
C:value
D:key map
答案: ARFF
4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()。
A:专业性
B:排他性
C:一致性
D:共享性
答案: 一致性
5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标。
A:电话号码
B:关键词
C:网页地址
D:用户名
答案: 网页地址
6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()。
A:otd
B:jpg
C:png
D:gif
答案: otd。