2020年智慧树知道网课《大数据概论》课后章节测试满分答案
- 格式:docx
- 大小:1.45 MB
- 文档页数:26
第一章测试1【单选题】(2分)大数据的英文描述是()A.HeavydataB.LargedataC.GreatdataD.Bigdata2【单选题】(2分)下面最大的储存单位是()A.KBB.TBC.GBD.PB3【单选题】(2分)大数据之父是()A.詹姆斯·高斯林B.姚期智C.查尔斯·巴赫曼D.维克托·迈尔-舍恩伯格4【多选题】(2分)大数据的特点包括()A.VelocityB.ValueC.VolumeD.Variety5【多选题】(2分)第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A.PNASB.ScienceC.NatureD.Cell6【判断题】(2分)大数据是只和互联网相关的计算机技术。
A.错B.对7【判断题】(2分)企业中大部分的数据都是非结构化数据。
A.错B.对8【判断题】(2分)大数据技术的基础是由阿里巴巴首先提出的。
A.错B.对9【判断题】(2分)大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
A.对B.错。
第一章测试1【单选题】(10分)以下不属于可视化的作用的是()A.数据采集B.传播交流C.信息记录D.数据分析2【单选题】(10分)数据可视化萌芽于什么时间()A.15世纪B.18世纪C.17世纪D.16世纪3【单选题】(10分)可视分析学是何时兴起的()A.20世纪B.18世纪C.21世纪D.19世纪4【单选题】(10分)张量场可视化属于可视化的哪个分支学科()A.信息可视化B.人机交互学C.科学可视化D.可视分析学5【单选题】(10分)使用以下哪种可视化工具不需要编程基础()A.D3.jsB.ProcessingC.VegaD.Tableau6【判断题】(10分)数据可视化的原则是细节优先。
A.错B.对7【判断题】(10分)文本可视化属于信息可视化。
A.错B.对8【多选题】(10分)可视分析学涉及到的学科包括()A.人机交互B.计算机图形学C.统计分析D.数据挖掘9【多选题】(10分)以下哪些工具是数据可视化工具()A.VegaB.MatlabC.D3.jsD.Tableau10【多选题】(10分)这个视频中体现了可视化的哪些作用()A.信息记录B.数据过滤C.传播交流D.数据分析第二章测试1【单选题】(10分)有的人在发朋友圈的时候,会把一张图片切成9份,然后再按顺序拼出一个九宫格,如下图所示。
虽然图片被分割开来,但是我们仍旧能够感知到图片原来完整的样子,这体现了格式塔理论的()原则。
A.闭包原则B.连续原则C.接近原则D.相似原则2【单选题】(10分)下图所示的图片体现了格式塔理论的()原则。
A.相似原则B.接近原则C.连续原则D.闭包原则3【单选题】(10分)下图所示的图片体现了格式塔理论的()接近原则A.闭包原则B.接近原则C.连续原则D.相似原则4【单选题】(10分)下图所示的可视化中运用了以下哪个视觉通道?()A.形状B.亮度C.颜色D.高度5【单选题】(10分)下图所示的可视化中体现了哪种类型的视觉通道?()A. 定量型B. 分组型C.定性型D.分类型6【判断题】(10分)根据格式塔理论,人们在观看时,眼脑在一开始的时候会先区分一个形象的各个单一的组成部分,然后再将各个部分组合起来,使之成为一个易于理解的统一体。
第一章测试1【判断题】 (10分)材料是人类社会生活的精神基础。
A.对B.错2【判断题】 (10分)青铜是铜锡合金。
A.对B.错3【判断题】 (10分)芯片是各种集成电路和原件刻蚀在线路板上的一个综合体。
A.错B.对4【判断题】 (10分)日常生活中家庭用到的空调洗衣机、冰箱电视的壳体材料基本是塑料这种高分子材料。
A.错B.对5【单选题】 (10分)材料是人类用于制造各种产品和有用物件的()。
A.生产力B.原料C.设备D.物质6【单选题】 (10分)恩格斯曾经这样论述,人类从低级阶段向文明阶段的发展,是从学会制开始的。
A.青铜器B.瓷器C.陶器D.铁器7【单选题】 (10分)目前风力发电机叶片所用的材料为。
A.高分子材料B.金属材料C.无机非金属材料D.复合材料8【多选题】 (10分)根据材料对社会历史发展作用,人类社会按照材料命名可以包括的时代为。
A.铁器时代B.新材料时代C.石器时代D.青铜器时代E.硅时代9【多选题】 (10分)以金属为主制造的建筑物包括。
A.金门大桥B.港珠澳大桥C.埃菲尔铁塔D.世界贸易中心大厦E.三峡大坝10【多选题】 (10分)超导计算机中的运算速度可以达到每秒8000万次,元件完全不发热。
这些优异性能主要基于超导陶瓷的基本特征。
A.完全抗磁性B.高度绝缘性C.完全导电性D.良好导热性E.完美半导体第二章测试1【判断题】 (10分)材料的组成与结构决定了材料的基本性质。
A.错B.对2【判断题】 (10分)材料合成是把原子和分子通过分子间作用力的方式结合起来,最终变成有着微观结构的宏观材料。
A.错B.对3【判断题】 (10分)原子的核外电子,包括原子核,是可以借助于显微镜这样的设备观察到的。
A.对B.错4【判断题】 (10分)金属键就是带正电荷的金属原子与核外带负电荷的自由电子通过静电作用而形成的化学键。
A.对B.错5【单选题】 (10分)材料的宏观尺度,就是通过人的肉眼可以见到的超过人眼极限分辨率以上的尺度。
大数据导论商丘工学院智慧树知到答案2024年第一章测试1.大数据的前沿技术是()。
A:数据定义B:数据结构.C:数据处理D:数据分析答案:D2.大数据赖以生存的土壤是()。
A:互联网B:前沿技术C:物联网D:网络信息答案:A3.第三次信息化浪潮的标志是哪些技术的兴起?( )A:云计算B:大数据C:个人计算机D:物联网答案:ABD4.以下是大数据存储面临的挑战的选项是( )。
A:数据问题B:管理问题C:应用问题D:系统问题答案:BCD5.信息科技为大数据时代提供哪些技术支撑?( )A:网络带宽不断增加B:CPU 处理能力大幅提升C:存储设备容量不断增加D:数据量不断增大答案:ABC6.大数据产业指的是什么()。
A:一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合B:提供分布式计算、数据挖掘、统计分析等服务的各类企业C:提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业D:提供数据分享平台、数据分析平台、数据租售平台等服务的企业答案:A7.万维网之父是 ( )。
A:蒂姆●伯纳斯-李B:彼得●德鲁克C:舍恩伯格D:斯科特布朗答案:A8.以下哪一项不属于大数据的特征()。
A:数据价值密度高B:单位处理数据的速度高C:数据类型复杂D:数据量大答案:A9.大数据存储的特点与挑战有( )。
A:成本问题B:容量问题C:安全问题D:延迟问题答案:ABCD10.大数据可以帮助发现规律,大数据可以帮助解释现象,大数据可以帮助预测未来。
()A:对 B:错答案:A第二章测试1.大数据的最显著特征是( )。
A:数据类型多样B:数据价值密度高C:数据处理速度快D:数据规模大答案:D2.下列不属于 Google云计算平台技术架构的是()。
A:结构化数据表 BigTableB:分布式锁 ChubbyC:并行数据处理 MapReduceD:弹性云计算 EC2答案:D3.物联网的全球发展形势可能提前推动人类进入“智能时代”,也称()。
第一章测试1【判断题】(1分)大视频时代的出现是媒体融合的表现之一。
A.错B.对2【判断题】(1分)发展县级融媒体是中国媒体融合战略的重要抓手。
A.错B.对3【判断题】(1分)全媒体才是媒体融合的高级形态。
A.对B.错4【判断题】(1分)融合新闻具有突出的技术特征。
A.错B.对5【判断题】(1分)融合新闻必须每条都使用全部的新媒体技术。
A.错B.对6【单选题】(1分)下列媒体融合范畴中哪个是位于最深层的改革?A.渠道融合B.组织融合C.业务融合D.受众融合7【单选题】(1分)按照“任何一种媒介,其受众累计达到5千万才能成为媒体”的说法,下列传播形态成为“媒体”用时最短的是?A.互联网B.微信C.抖音D.微博8【多选题】(1分)媒体融合要“融”的层面包括:A.组织融合B.资源融合C.规制融合D.业务融合9【多选题】(1分)“四全媒体”是指?A.全效媒体B.全程媒体C.全员媒体D.全息媒体E.全能媒体10【判断题】(1分)人类传播史上没有出现过新生媒体彻底取代既有媒体的现象。
A.错B.对第二章测试1【单选题】(1分)融合新闻采编的“信息服务”要求,是受哪个因素的直接冲击影响而提出的。
A.编辑部策划B.传播技术C.互联网产品思维D.政策要求2【单选题】(1分)融媒体记者的全能胜任指的是?A.跨岗位B.跨组织C.跨媒体D.跨选题3【多选题】(1分)融媒新闻流管理的维度包括:A.“单事件”的全链管理B.“全平台”的生态管理C.内外环境的政策管理D.“多事件”的议程管理4【判断题】(1分)全媒体记者在前方新闻现场的职能增加,意味着后方团队职能的缩减。
A.对B.错5【判断题】(1分)融合新闻中记者编辑的分工方式,从过去的环节分工转变成角色分工。
A.错B.对6【判断题】(1分)融媒体记者素养在运用层面集中表现为:恰如其分、灵活地选择融合新闻的媒介组合方式。
A.错B.对7【判断题】(1分)融媒记者、融媒编辑必须具备互联网思维。
绪论单元测试1【判断题】(100分)在当今形势下,网络传播已经成为了主流的传播媒介。
A.对B.错第一章测试1【判断题】(10分)协议是计算机网络中为实现实体(各种应用程序、文件传送软件、数据库管理系统、电子邮件系统及终端等)之间的通信所制定的规则的集合。
A.错B.对2【多选题】(10分)人们在关于公民新闻的研究中的共识包括:A.强调新技术对于公民新闻发展的作B.强调公众在新闻报道活动中的参与C.要方便网友们在网上分享信息D.认为应当把公民的各种新闻信息生产行为综合在一起3【多选题】(10分)社会化媒体的特征包括:A.主角是用户,而不是网站的运营者B.主角是运营者,而不是网站的用户C.内容生产与社交的结合D.碎片化信息成为主流4【单选题】(10分)人们更多的是记住信息存储的位置,而不是信息本身,这也被称为A.木桶效应B.马太效应C.谷歌效应D.茧房效应5【单选题】(10分)在社会化媒体平台上,媒体内容的再分发能力,很大程度上取决于它们激活的()网络的规模A.组织传播B.群体传播C.人际传播D.大众传播6【多选题】(10分)WEB2.0时代的特征是:A.社交和分享成为传播动力B.关系成为传播渠道C.个性化信息服务得以实现D.每个节点成为一个传播中心7【多选题】(10分)媒介融合包括:A.机构融合B.业务融合C.平台与市场融合D.技术融合E.产业融合8【判断题】(10分)场景变量指的是不同场景下人们的特定需求,以及相关行为方式A.对B.错9【多选题】(10分)万物互联时代,新闻生产空间从“媒体空间”向“现场空间”的迁移,这带来了哪些现象()A.自媒体直播B.卷入式体验C.专业性传播D.原生态直播10【多选题】(10分)智能化媒体的技术基础包括:A.语音交互技术B.手势或体感交互技术C.视线交互技术D.3D打印技术E.面部识别交互技术第二章测试1【多选题】(10分)关于网络技术进步的速度与进程,有人用互联网三定律来概括:A.150定律B.梅特卡夫定律C.大数定律D.摩尔定律E.吉尔德定律2【判断题】(10分)作为媒介的互联网的复合性还体现为“公共话语空间”与“私人话语空间”的统一性上。
2020智慧树知到《大数据算法》章节测试[完整答案]智慧树知到《大数据算法》章节测试答案1.11.以下关于大数据的特点,叙述错误的是()。
答案:速度慢A、速度慢B、多元、异构C、数据规模大D、基于高度分析的新价值2.在《法华经》中,“那由他”描写的“大”的数量级是()。
答案:10A、10B、10C、10D、1083.以下选项中,大数据涉及的领域中包括()。
答案:社交网络计算机艺术医疗数据A、社交网络B、医疗数据C、计算机艺术D、医疗数据4.大数据的应用包括()。
答案:推荐科学研究预测商业情报分析A、预测B、推荐C、商业情报分析D、科学研究5.目前,关于大数据已有公认的确定定义。
×6.大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。
()√1.21.大数据求解计算问题过程的第三步一般是()。
答案:算法设计与分析A、判断可计算否B、判断能行可计算否C、算法设计与分析D、用计算机语言实现算法2.在大数据求解计算问题中,判断是否为能行可计算的因素包括()。
答案:资源约束数据量时间约束A、数据量B、资源约束C、速度约束D、时间约束3.大数据求解计算问题过程的第一步是确定该问题是否可计算。
√4.大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。
√1.31.资源约束包括()。
答案:网络带宽外存CPU内存A、CPUB、网络带宽C、内存D、外存2.大数据算法可以不是()。
答案:精确算法串行算法内存算法A、云计算B、精确算法C、内存算法D、串行算法3.大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。
×4.MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。
√5.大数据算法是仅在电子计算机上运行的算法。
解忧书店 JieYouBookshop 第一章单元测试1【多选题】 (2分)下列属于多元统计方法的为()A.决策树B.神经网络C.回归分析D.主元分析2【多选题】 (2分)多元统计分析的图表示法有()A.轮廓图B.雷达图C.散布图矩阵D.调和曲线图3【判断题】 (2分)完整的数据分析过程,包括数据采集、数据清洗和数据分析。
()A.对B.错4【单选题】 (2分)下列场景适用于回归分析的是 ( )A.人脸识别B.天气预报C.水果分拣D.信息浓缩5【单选题】 (2分)下面哪一句体现了主元分析的思想()A.物以类聚,人以群分B.笨鸟先飞C.牵牛要牵牛鼻子D.人不是一座孤岛第二章单元测试1【多选题】 (2分)一般常见的缺失值处理的方法有()A.插值填充B.回归填充法C.最近邻插补填充法D.替换填充法2【多选题】 (2分)一般常见的数据归一化的方法有()A.回归填充法B.最小最大规范化C.零均值规范化D.替换填充法3【判断题】 (2分)少量的异常值完全不会影响数据分析。
()A.对B.错4【单选题】 (2分)下列哪种方法不是数据填补的手段 ( )A.替换填充法B.回归填充法C.插值填充法D.均值标准化5【单选题】 (2分)主成分分析的英文名是()。
A.Principal Component AnalysisB.Ordinary Least SquaresC.Canonical Component AnalysisD.Partial Least Squares第三章单元测试1【多选题】 (2分)下面哪个是SVM在实际生活中的应用()A.邮件分类B.文本翻译C.房价预测D.图片分类2【多选题】 (2分)以下说法正确的有哪些()A.SVM是一种线性方法B.软间隔的引入可以解决轻度线性不可分问题C.SVM只能够解决回归问题D.核方法不能解决非线性问题3【判断题】 (2分)拉格朗日乘子法可用于线性可分SVM的模型求解。
智慧树知到大数据工具应用章节测试答案第一题:大数据工具是指用于处理大规模数据的软件和技术工具。
它们能够帮助用户快速、高效地处理和分析海量数据,从而发现数据中隐藏的规律和价值。
大数据工具的应用范围非常广泛,包括数据清洗、数据存储、数据分析、数据可视化等方面。
第二题:Hadoop是一种分布式计算框架,主要用于存储和处理大规模数据。
它由Hadoop分布式文件系统(HDFS)和Hadoop分布式计算框架(MapReduce)两部分组成。
HDFS用于将数据分布式存储在多台机器上,而MapReduce则用于将数据分布式处理和计算。
Hadoop具有高可靠性、高扩展性和高容错性的特点,适用于处理大规模数据。
第三题:Hive是一种基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言,可以将结构化数据映射到Hadoop集群上进行查询和分析。
Hive将查询语句转化为MapReduce任务,在Hadoop集群上执行。
Hive适用于处理结构化数据,如日志数据、用户行为数据等。
它提供了丰富的数据处理函数和数据转换功能,能够满足大部分数据分析的需求。
第四题:Spark是一种快速、通用的大数据处理引擎,它可以在内存中高效地处理大规模数据。
Spark提供了丰富的API,支持多种编程语言,如Java、Scala和Python。
Spark的核心概念是弹性分布式数据集(RDD),它是一种抽象的数据结构,可以在集群中并行处理和计算。
Spark具有高速、易用和可扩展的特点,适用于各种大数据处理场景。
第五题:Flink是一种流式处理框架,它能够实时处理和分析数据流。
Flink提供了流处理和批处理两种模式,可以处理无界数据流和有界数据集。
Flink具有低延迟、高吞吐量和容错性的特点,适用于实时数据处理和流式计算。
Flink支持多种数据源和数据接收器,可以与其他大数据工具无缝集成。
第六题:Kafka是一种分布式消息队列系统,用于高吞吐量的发布/订阅消息传输。
第一章测试1【单选题】(2分)大数据分析的最终目的是()A.通过数据分析来挖掘数据背后的价值B.发现数据C.处理数据D.查找数据2【多选题】(2分)数据采集的方式包括()A.购买数据B.主动数据采集C.网络下载数据3【判断题】(2分)Wireshark是手机数据的采集软件()A.错B.对4【判断题】(2分)手机和手机APP是同时连通网络的()A.对B.错5【单选题】(2分)360随身WIFI的目的是()A.让电脑成为一个WIFI发射装置B.构造局域网,从而让手机连通电脑C.让手机APP连通电脑D.让电脑上网6【多选题】(2分)对于电脑+手机+360WIFI而言,它们之间存在的网络包括()A.路由器产生的网络B.笔记本电脑连接的Internet网络C.手机的4G网络D.360WIFI构成的无线网络7【判断题】(2分)手机APP的联网效率是指手机联上网络的时间T1和手机APP联上网络的时间T2之差()A.错B.对8【判断题】(2分)在上一题中,T1-T2的值越小时,手机APP的联网效率越高。
()A.对B.错9【判断题】(2分)开始手机数据收集之前,需要先关闭手机的3G或者4G网络,仅让手机连接360WIFI的网络()A.对B.错10【单选题】(2分)在手机断开WIFI之后,手机APP会()A.立即断开网络B.继续连接网络C.无法判断第二章测试1【判断题】(2分)打开Wireshark软件,可以从主界面的【Open】选项打开*.CSV文件()A.对B.错2【多选题】(2分)分析手机APP的联网效率需要用到()A.IP协议B.TCP协议C.DNS协议D.ICMPV6协议3【判断题】(2分)双击【我的电脑】,可以查看计算机中的IP地址()A.对B.错4【判断题】(2分)打开手机的设置,可以查看到手机的IP地址A.对B.错5【判断题】(2分)Wireshark能够记录手机的IP地址并在目标地址位置显示出来()A.对B.6【单选题】(2分)三次握手协议是属于()A.IP协议B.ICMPV6协议C.TCP协议D.DNS协议7【判断题】(2分)TCP协议中的FIN表示建立连接A.对B.错【单选题】(2分)手机APP连接网络时用到()协议A.三次握手协议B.ICMPv6C.通讯协议9【单选题】(2分)手机连接网络是用到()协议A.通讯协议B.ICMPv6C.三次握手协议10【单选题】(2分)手机数据捕获软件是()A.ExcelB.SplunkC.WiresharkD.TotalControl第三章测试1【判断题】(2分)在实验中是手机最先连接到网络()A.对B.错2【判断题】(2分)手机联网时间可以通过查找三次握手协议获得A.对B.错3【判断题】(2分)手机APP联网时间可以通过查找三次握手协议获得A.对B.错4【单选题】(2分)当ICMPv6的type为()时,手机连通了网络A.135B.138C.136D.1375【单选题】(2分)当TCP的flag为()时,表示手机APP连通了网络A.2B.1C.3D.6【判断题】(2分)80端口是TCP协议中加密传输需要用到的端口()A.错B.对7【单选题】(2分)TCP协议中非加密传输需要用到的端口()A.80B.8080C.8001D.4438【判断题】(2分)大数据分析的一般方法是先对海量数据进行分析,再约减数据A.对B.错9【多选题】(2分)手机端的自动数据采集需要()软件A.ExcelB.SplunkC.TotalControlD.Wireshark10【判断题】(2分)Wireshark软件能够进行脚本录制()A.错B.对第四章测试1【单选题】(2分)在查找字符串中是否包含字符AB或BA,则应该构造正则表达式()A.AB+BAB.AB或BAC.BA或ABD.AB|BA2【单选题】(2分)下列哪个正则表达式能够表示0个或多个空格()A.空格B.\sC.\s+D.\s*3【单选题】(2分)要匹配A1、A2、A3、…、A9,则需要构造正则表达式()A.A1-9B.A[1-9]C.A9D.A14【单选题】(2分)要匹配A0、A12、A123、…、A119,则需要构造正则表达式()A.A[1-9]B.A\d{0,}C.A0-9D.A\d{1,}5【单选题】(2分)正则表达式中符号|的意思是()A.且B.非C.管道符D.或6【判断题】(2分)Excel支持通配符查询()A.错B.对7【判断题】(2分)Excel中的筛选功能能够约减数据集()A.错B.对8【判断题】(2分)Excel中能选出满足条件的所有选项,不论这些选项是否是在同一列中。
第一章测试1【单选题】(2分)下列哪个表述是的?A.在芯片里运行的程序可以是汇编语言编写。
B.在芯片里运行的程序可以是C语言编写。
C.在芯片里运行的程序可以是二进制语言编写。
D.在芯片里运行的程序可以是面向对象语言编写。
2【单选题】(2分)以下哪一种不是计算机操作系统?A.iOSB.LinuxC.OracleD.Android3【单选题】(2分)微软对Windows界面的开发主要受到哪家公司的启发?A.IBMB.3MC.施乐D.苹果4【单选题】(2分)Windows和Linux或者iOS和Android之间的最大区别在于什么?A.价格:前者贵后者便宜B.思想:前者封闭后者开源C.用户体验:前者优后者差D.速度:前者快后者慢5【多选题】(2分)医疗领域如何利用大数据?A.用户行为分析B.个性化医疗C.临床决策支持D.社保资金安全6【判断题】(2分)现在非结构化数据已经占人类数据量的25%。
A.对B.错7【判断题】(2分)大数据与云计算结合起来将给世界带来一场深刻的管理技术革命与社会治理创新。
A.对B.错8【单选题】(2分)Python是一种面向对象、()计算机程序设计语言。
A.解释型B.编译型9【判断题】(2分)ASCII码使用一个字节编码。
A.错B.对10【判断题】(2分)GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。
A.对B.错第二章测试1【判断题】(2分)人类科学主要经过了经验科学、理论科学、计算科学、数据科学四个阶段。
A.错B.对2【单选题】(2分)大数据的利用过程是()。
A.采集-清洗-统计-挖掘B.采集-统计-清洗-挖掘C.采集-清洗-挖掘-统计D.采集-挖掘-清洗-统计3【判断题】(2分)信息只有通过反思、启发和学习等过程被每个个体予以有效处理,才能有用。
A.错B.对4【判断题】(2分)数据是作为信息的重要来源,信息经过加工转化为知识。
A.对B.错5【判断题】(2分)在大量知识积累基础上,总结成原理和法则,就形成了智慧。
A.对B.错6【判断题】(2分)信息是有时效性的。
A.错B.对7【单选题】(2分)在一个系统中,()贯穿整个系统,对信息的管理和控制使系统的运行更加有序。
A.系统B.信息流C.信息D.消息8【单选题】(2分)系统测试的步骤是()。
A.单元测试、子系统测试、系统测试、验收测试B.验收测试、系统测试、子系统测试、单元测试C.系统测试、子系统测试、单元测试、验收测试。
D.单元测试、系统测试、子系统测试、验收测试9【单选题】(2分)知识阶层中最底层也是最基础的是()。
A.信息B.智慧C.数据D.知识10【多选题】(2分)信息的主要形式维度有()。
A.声音B.图表C.视频D.文本E.动画第三章测试1【多选题】(2分)数据分析的三个层次是()。
A.预测分析B.定性分析C.规范分析D.描述分析2【单选题】(2分)数据分析的第一步是()。
A.数据获取B.需求分析C.数据预处理D.数据建模分析3【判断题】(2分)收集的数据在处理之前必须经过预处理的步骤。
A.对B.错4【单选题】(2分)()是指通过对比分析、分组分析、交叉分析、回归分析A.数据建模分析B.数据预处理C.模型评估D.模型优化5【单选题】(2分)把()溶入数据挖掘过程是数据挖掘成功的关键。
A.统计决策B.业务经验C.预测分析D.需求分析6【单选题】(2分)从概念的范围大小来说,下列正确的排序是()。
A.人工智能>机器学习>深度学习B.深度学习>机器学习>人工智能C.机器学习>深度学习>人工智能D.人工智能>深度学习>机器学习7【判断题】(2分)按照训练的数据有无标签,可以将机器学习方法分为监督学习算法和无监督学习算法。
A.错B.对8【判断题】(2分)一般将所有数据分为训练集、验证集和测试集。
A.错B.对9【判断题】(2分)预测数据如果是连续的,则这种预测模型属于回归模型。
A.错B.对10【单选题】(2分)在评估多分类模型(多于2个以上的分类)可以采用()A.查全率B.F1C.查准率D.混淆矩阵第四章测试1【单选题】(2分)HDFS是一个()文件系统。
A.实时性B.随机访问C.集中式D.分布式2【单选题】(2分)HDFS采用的是()结构A.Client/ServerB.Node/NodeC.Master/SlaveD.Browser/Server3【单选题】(2分)()是海量数据处理的并行编程模式。
A.MapReduceB.HDFSC.PIGD.HIVE4【多选题】(2分)大数据计算模式有()。
A.交互式计算模式B.批量计算模式C.图计算模式D.流式计算模式5【单选题】(2分)交通领域智能交通的大数据计算模式属于()。
A.批量计算模式B.交互式计算模式C.图计算模式D.流式计算模式6【多选题】(2分)下列属于关系型数据库系统软件的有()。
A.SQLServerB.MySQLC.OracleD.NoSQL7【单选题】(2分)()是基于列存储技术的内存数据库。
A.SQLServerB.OracleC.MonetDBD.MySQLE.NoSQL8【单选题】(2分)关系代数中,从两个关系中找出相同元组的运算称为()运算。
A.差B.并C.交D.合9【单选题】(2分)计算字段累加和的函数是()。
A.mapB.sumC.countD.add10【单选题】(2分)用于数据库恢复的文件是()。
A.数据库文件B.备注文件C.日志文件D.索引文件第五章测试1【多选题】(2分)编程语言有()。
A.高级语言B.机器语言C.汇编语言D.注释语言2【多选题】(2分)下列属于面向对象编程语言的有()。
A.C++B.JavaC.CD.Python3【单选题】(2分)对各种脏数据进行对应方式的处理,得到标准、干净、连续的数据,提供给数据统计、数据挖掘等使用的方法称为()。
A.数据清洗B.数据挖掘C.数据归一D.数据集成4【单选题】(2分)设置日期字段格式为“2019-10-10”,属于满足数据清洗中的()。
A.数据权威性B.数据完整性C.数据唯一性D.数据一致性E.数据合法性5【单选题】(2分)通过身份证号来补全性别、年龄、籍贯等属于满足数据清洗中的()。
A.数据一致性B.数据权威性C.数据合法性D.数据完整性6【单选题】(2分)数据库中设置按主键去除重复的方法属于满足数据清洗中的()。
A.数据合法性B.数据权威性C.数据完整性D.数据唯一性E.数据一致性7【单选题】(2分)数据集的类别分布不均被称为()。
A.过采样B.欠采样C.数据不平衡D.数据饱和8【多选题】(2分)下列属于特征降维的方法有()。
A.Code-DecodeB.One-HotC.LDAD.PCA9【单选题】(2分)指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串称为()。
A.字符集B.通配符C.语法D.正则表达式10【单选题】(2分)元字符\d表示()。
A.匹配字母或数字或下划线B.匹配除换行符以外的任意字符C.匹配一个数字字符D.匹配任意的空白符第六章测试1【多选题】(2分)人工智能的要素有()。
A.计算能力B.大数据C.学习算法2【单选题】(2分)AlphaGo之所以能够打败人类是因为它依靠了()。
A.计算机B.大数据和智能算法C.专家系统D.严密的逻辑推理3【多选题】(2分)人工智能所需的条件有()。
A.清晰的领域界限B.AI专家C.自动标注数据D.超大计算量E.海量数据4【单选题】(2分)现在的自动驾驶系统最高可以达到()级别。
A.L1B.全自动C.L4D.L2E.L35【判断题】(2分)交通大数据的信息种类包括出行者、位置、车辆、交通流、气象、舆情、活动、用地。
A.对B.错6【多选题】(2分)基于大数据的税务稽查方法有()。
A.统计分析模型B.定性分析模型C.数据挖掘模型D.深度学习模型7【单选题】(2分)()是深度学习模型的一种,全称为卷积神经网络。
A.LSTMB.GRUC.RNND.CNN8【判断题】(2分)可以通过分词、计数、规范化和加权将文本转化为数值向量。
A.错B.对9【单选题】(2分)在输出层不能使用以下()激活函数来分类图像。
A.TanhB.IfC.SigmodD.ReLU10【判断题】(2分)在神经网络中,每个参数可以有不同的学习率。
A.错B.对。