《我们的大数据时代》继续教育考试题库
- 格式:doc
- 大小:105.00 KB
- 文档页数:20
2020年最新公需科目《大数据》考试题(含答案)一、选择题1.关于 SecndaryNameNde 哪项是正确的?a)它是 NameNde 的热备 b)它对内存没有要求c)它的目的是帮助 NameNde 合并编辑日志,减少 NameNde 启动时间d)SecndaryNameNde 应与 NameNde 部署到一个节点答案.C。
二、单选题2.在数据生命周期管理实践中,( B)是执行方法。
(单选题) A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理3.下列关于聚类挖掘技术的说法中,错误的是(B )。
(单选题) A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B.要求同类数据的内容相似度尽可能小C.要求不同类数据的内容相似度尽可能小与分类挖掘技术相似的是,都是要对数据进行分类处理4.大数据时代,数据使用的关键是( D )。
(单选题) A.数据收集B.数据存储C.数据分析D.数据再利用三、多选题5.网球比赛,与其他体育项目一样,涉及大量数据。
正确错误6.下列关于大数据的说法中,错误的是(AD )。
A.大数据具有体量大.结构单一.时效性强的特征B.处理大数据需采用新型计算架构和智能算法等新技术C.大数据的应用注重相关分析而不是因果分析D.大数据的应用注重因果分析而不是相关分析E.大数据的目的在于发现新的知识与洞察并进行科学决策7.20世纪中后期至今的媒介革命,以()的出现为标志。
ACDA.互联网B.自动化C.计算机D.数字化8.下列哪些国家已经将大数据上升为国家战略?ABCDA.英国B.日本C.美国D.法国9.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是()。
■A.从被动反应走向主动预见型管理■B.从粗放化管理走向精细化管理■C.从单兵作战走向联合共享型管理■D.从柜台式管理走向全天候管理10.根据周琦老师所讲,进入了阿里巴巴集团之后,高德对大数据的处理和基础架构的能力得到了提升。
2020年最新公需科目《大数据》考试题(含答案)一、填空题1.Hadp三种运行的模式.单机版 . 伪分布式和分布式。
二、多选题2.网球比赛,与其他体育项目一样,涉及大量数据。
正确错误3.以下选项中,不属于信息时代的定律的是()。
A.吉尔德定律B.摩尔定律C.麦特卡尔夫定律■D.达律多定律4.世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的?AA.1946年B.1947年C.1948年D.1949年5.吴军博士认为在未来的社会里,利用大数据.利用机器智能来为人类服务的人在操控世界。
正确错误6.根据周琦老师所讲,高德实时挑选样本进行算路,对发布数据质量进行评估,异常则实时报警。
正确错误7.根据周琦老师所讲,进入了阿里巴巴集团之后,高德对大数据的处理和基础架构的能力得到了提升。
(判断题 1 分)■正确错误 52.依据黑龙江大农场的应用,精准农业技术能够将产量提高 5%-10%。
(判断题 1 分)分.1 分正确得■错误8.我国农业信息化基础条件坚实,表现为“农业信息化发展已具备基础”.“技术条件日益成熟”。
对9.按照涉及自变量的多少,可以将回归分析分为(CD )。
A.线性回归分析B.非线性回归分析C.一元回归分析D.多元回归分析E.综合回归分析10.信息技术(IT)主要包括()。
A.通信技术B.计算机技术C.传感技术D.微电子技术三、论述题11.下列关于计算机存储容量单位的说法中,错误的是( C)。
A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符,12.请画出云计算的三层服务模型?答.一般而言,云计算架构可以用三层SPI模型来表述。
1.基础设施即服务(IaaS,Infrastructrue as a Service)这种把主机集中管理,以市场机制通过虚拟化层对外提供服务,用按使用量收费的盈利模式,形成了云计算的基础层。
这就是基础设施即服务(IaaS,Infrastructrue as a Service),构成了云计算的基础层。
大数据专业考试题及答案一、选择题(每题2分,共20分)1. 大数据的“4V”特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)B. Variety(多样性)D. Visibility(可见性)答案:D2. 在大数据技术中,Hadoop生态系统中的核心组件是:A. SparkB. HBaseC. HiveD. HDFS答案:D3. 以下哪个不是大数据存储技术?A. NoSQL数据库B. 关系型数据库C. 分布式文件系统D. 内存数据库答案:B4. 以下哪个是大数据分析的关键技术?A. 数据清洗B. 数据可视化C. 数据挖掘D. 所有选项都是答案:D5. 大数据平台中,用于实时数据处理的技术是:A. MapReduceB. StormC. HadoopD. Cassandra答案:B...(此处省略其他选择题)二、简答题(每题10分,共30分)1. 简述大数据与传统数据仓库的主要区别。
答案:大数据与传统数据仓库的主要区别在于:大数据处理的数据量更大、数据类型更多样化、处理速度更快,并且大数据技术更倾向于分布式存储和计算,而传统数据仓库通常采用集中式存储和处理。
2. 解释什么是数据挖掘,并举例说明其应用场景。
答案:数据挖掘是从大量数据中通过算法自动或半自动地发现有趣模式和知识的过程。
例如,在零售业中,数据挖掘可以用来分析顾客的购买行为,从而进行个性化推荐和库存管理。
3. 描述Hadoop生态系统中MapReduce的工作流程。
答案:MapReduce的工作流程包括Map阶段和Reduce阶段。
在Map 阶段,输入数据被分割成多个小块,每个小块由一个Map任务处理,生成中间键值对。
在Reduce阶段,中间键值对根据键进行分组,并传递给Reduce任务,Reduce任务对每个键对应的所有值进行处理,生成最终的输出结果。
三、计算题(每题15分,共30分)1. 假设有一个大数据集,需要使用MapReduce进行处理。
精心整理2019年度大数据技术及应用试题单选题:1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。
A互联网经济BCD2、(A)ABCD3ABCD问题4、1965年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度每18个月左右可以翻一番,这被称为(摩尔定律)5、21世纪初,关于查询结果排序我们找到了一种新的方法。
(大数据方法:用户的点击数据)6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。
7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。
8、根据本课程,交通数据采集的来源不包括(A)ABCD9101112)1314、15、本课程提出,搜索引擎是一个搜索框,输一些关键词,然后出来一些页面的列表,需要用户点开看,这种架构蕴含的基本假设不包括(A)A这些文档彼此不是独立的B这些文档是静态的C假设用户找一个文档,而不是找一个答案D这些文档是独立的16、根据本课程,以下哪项不属于智慧城市的特点(C)A更广泛的互联互通B更深入的智慧化C更传统的方式D17、1819(20ABCD21AB充分利用了物联网、云计算、智慧计算方式等先进信息技术手段C全面感知、分析、整合、共享城市运行中的各项关键信息D实现资源优化配置、城市高效管理及生活品质提升22、根据本课程,以下哪项不属于智慧城市体系构成的环节(A)A数据公开B形成数据报告C数据采集D数据处理、分析23、本课程提到,大数据之所以用“bigdata”,而不用“largedata”,实际上它是指一种全新的(思维方式),一种抽象的概念。
24252627(28)29(30、1工业2、为积极推进我国大数据的产业发展,要以(绿色、开放、创新、协调、共享)的发展理念为指导。
3、根据本课程,作为中国智慧城市的代表,“碧桂园佛山新城之光”的特色体现在(ABCDE)。
继续教育-大数据时代的专利运用策略题库1.国家知识产权局(专利审查)能力成为世界五大强局之一。
2.构建中国专利运营体系的目的是(支撑创新驱动发展)3.国家专利导航试点工程首批试点园区包括:长春生物医药专利导航示范区、上海张江生物医药专利导航示范区、杭州物联网专利导航示范区4.国家知识产权局下属(专利局)成为世界五大强局之一。
5.根据本讲,2018年我国进行了第(5)批专利导航试点工程。
6.(专利运营)是高价值的专利应用,是知识产权的价值最大化的实现。
7.下列选项中属于区域创新质量评价专利导航应用城市是(武汉)8.下列选项中属于超硬材料产业发展方向的是(产业链和专利布局的关联、产业竞争中的专利控制力、专利布局揭示出的产业发展方向)9.本课中,(美国)超硬材料产业布局的优化路径为产业价值链环节的结构优化和产业链不断升级奠定了基础。
10.郑州超硬材料产业链与专利布局的关系是(如影随形)。
11.超硬材料产业共有(三次)转移,每次转移和专利布局时间、区域演进完全吻合,完全匹配。
12.(科学技术)是引领发展的第一动力。
13.《国家知识产权战略纲要》颁布后,连续(7年)按照制度运行三大板块实施专利战略年度推进计划。
主要任务是(制度运行保障体系、支撑经济社会发展、制度创新)。
14.区域类专利导航强调(匹配度)15.通过实践、探索和总结,专利导航项目包括(区域布局、人才管理、科技研发)。
16.下列选项中属于区域创新质量评价类专利导航应用城市是(武汉)。
17.专利导航源于(专利信息)的公开。
18.区域类专利导航项目包括(创新要素投入、专利匹配度、区域创新发展竞争力)19.通过实践、探索和总结,专利导航项目包括:产业规划、区域布局、研发立项20.()HSV-1技术发展方向重组治疗性基因或调节性基因的优化溶瘤病毒系统改进和优化溶瘤病毒启动子改进和优化溶瘤病毒联用21.在信息公开属性中体现,如果要开展创新活动,充分利用发明创造信息可以为新活动节约40%的(时间成本)和60%的(经费成本)22.大数据发展的重大意义为(大数据成为推动经济发展的新动力、大数据成为社会监督的新方式、大数据成为重塑国家竞争优势的新机遇、大数据成为新时达经济效益提升的新能源)。
2020年最新公需科目《大数据》考试题(含答案)一、选择题1.关于 SecndaryNameNde 哪项是正确的?a)它是 NameNde 的热备 b)它对内存没有要求c)它的目的是帮助 NameNde 合并编辑日志,减少 NameNde 启动时间d)SecndaryNameNde 应与 NameNde 部署到一个节点答案.C。
二、单选题2.大数据时代,数据使用的关键是( D )。
(单选题) A.数据收集B.数据存储C.数据分析D.数据再利用三、多选题3.在网络爬虫的爬行策略中,应用最为基础的是(AB )。
A.深度优先遍历策略B.广度优先遍历策略C.高度优先遍历策略D.反向链接策略E.大站优先策略4.下列关于数据生命周期管理的核心认识中,正确的是(ABC )。
A.数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B.在不同的数据存在阶段,数据的价值是不同的C.根据数据价值的不同应该对数据采取不同的管理策略D.数据生命周期管理旨在产生效益的同时,降低生产成本E.数据生命周期管理最终关注的是社会效益5.由于有了现代信息技术的支撑,研制一个新型号的航天器,周期缩减到(A)以内。
A.18个月B.12个月C.24个月D.6个月6.贵州发展大数据的顶层设计是要逐步建成三个中心,即()。
BCDA.大数据人才中心B.大数据金融中心C.大数据内容中心D.大数据服务中心7.2010年“中央1号文件”指出.要推进农村信息化。
√正确错误8.宁家骏委员指出,我国民生领域信息化服务水平显著提升。
√正确错误9.贵州电子商务的发展路径是.与阿里.京东.腾讯等电商企业强化合作,改善信息基础条件.物流条件,培育电商主体和平台,积极发展()。
A.电子商务+跨境B.电子商务+社区C.电子商务+物流D.电子商务+农村10.传统的“统治”或“管理”观念认为,公共事务的管理权只属于政府对11.根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。
∙ 1.()提供的支撑技术,有效解决了大数据分析、研发的问题,比如虚拟化技术、并行计算、海量存储和海量管理等。
(单选题1分)得分:1分o A.线计算o B.面计算o C.点计算o D.云计算∙ 2.根据周琦老师所讲,高德交通信息服务覆盖全国高速()以上。
(单选题1分)得分:1分o A.70%o B.90%o C.50%o D.60%∙ 3.根据涂子沛先生所讲,社交媒体是在哪一年出现的?(单选题1分)得分:1分o A.2004年o B.1965年o C.1988年o D.1989年∙ 4.“十二五”规划纲要:首次把()纳入国家规划层面。
(单选题1分)得分:1分o A.质量控制信息化o B.资源环境信息化o C.市场流通信息化o D.生产经营信息化∙ 5.2015年“双11”:阿里平台每秒钟订单创建()笔。
(单选题1分)得分:1分o A.4万o B.24万o C.34万o D.14万∙ 6.世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的?(单选题1分)得分:1分o A.1948年o B.1947年o C.1946年o D.1949年∙7.据报道,近50年来影响人类生活的十大科技发明中,()与信息技术有关。
(单选题1分)得分:1分o A.6项o B.7项o C.5项o D.8项∙8.以下选项中,不属于信息时代的定律的是()。
(单选题1分)得分:1分o A.吉尔德定律o B.摩尔定律o C.达律多定律o D.麦特卡尔夫定律∙9.大数据元年是指()。
(单选题1分)得分:1分o A.2012年o B.2013年o C.2011年o D.2010年∙10.林雅华博士指出,目前,我国政务微博总数中仅有()是活跃的。
(单选题1分)得分:1分o A.36%o B.26%o C.46%o D.16%∙11.关于大数据在社会综合治理中的作用,以下理解不正确的是()。
(单选题1分)得分:1分o A.大数据的运用有利于走群众路线o B.大数据的运用能够杜绝抗生素的滥用o C.大数据的运用能够加强交通管理o D.大数据的运用能够维护社会治安∙12.大数据的本质是()。
单选题共30题每题只有一个正确选项;选择正确得1分;错误得0分..1.众所周知;百度和谷歌是非常着名的B;我们可以通过它们获得很多信息..A.网络新闻B.搜索引擎C.网络购物D.社交网站2.以下哪个不是智慧城市建设过程中面临的共性问题A..A.缺乏资金支持B.软硬件关联性不强C.行业创新体系平台的建设欠缺D.缺乏跨界思维3.C改变了我们的生活出行的方式的一部分;而这一个改变也会导致了我们今天交通方式上的出行需求上的改变和交通模式上的整个变化;包括出行模式上的变化..A.网络新闻B.网络视频C.网络购物D.搜索引擎4.D的出现;使互联网得到了飞速地发展..A.台式机B.笔记本C.平板电脑D.智能手机5.A年公布了中共中央国务院关于全面实施预算绩效管理的意见..A.2018B.2017C.2016D.20156.从中国IT技术发展来说;中国IT产业未来发展以D为业务引擎..A.社交网络B.移动互联网C.云计算D.大数据7.以下不属于云计算的服务模型的是D..A.软件即服务B.平台即服务C.基础设施即服务D.资源即服务8.A网上报销使报销环节不用贴票;完全用电子票据替代纸质票据;这是一个社会首创;也是解决社会痛点的工程..A.差旅电子凭证B.车票凭证C.饭票凭证D.以上都不对9.我们的上世纪的D年代;出现了互联网的技术..A.60B.70C.80D.9010.根据IT技术的发展周期来划分;目前我们正处于D时代..A.小型机B.个人桌面电脑C.互联网D.移动云计算11.大数据面临的主要风险中C是本课程中没有提及的..A.安全风险B.道德风险C.伦理风险D.军事风险12.信息社会目前已经全面进入大数据时代;从发布数据、由用户产生数据的WEP1.0;发展到A;数据量逐渐增大..A.WEP2.0B.WEP3.0C.WEP4.0D.WEP5.013.在B年;瑞士达沃斯论坛上发布的大数据大影响报告指出;数据已经成为一种新的经济资产类别;就像货币或黄金一样;许多国家政府更是把大数据上升到战略的层面..A.2011B.2012C.2013D.201414.智慧交通管理的第一要素是A..A.数据平台B.专家系统C.仿真评价系统D.真实环境测评15.上世纪九十年代;国家审计遇到的挑战是A..A.大数据B.云计算C.信息泄露D.会计电算化16.习近平总书记强调;我们要织好B这一核心防护网;为虚拟社会的安全可控筑起一道坚不可摧的防火墙..A.成本B.技术C.管理D.教育17.原飞利浦高科技园在1平方公里的范围内平均每天产生D项专利A.1B.2C.3D.418.B;联合国“全球脉动”计划发布了一个研究报告;叫大数据开发:机遇与挑战..A.2012 年 3 月B.2012 年 5 月C.2013 年 3 月D.2013 年 5 月19.网络社会的虚拟性创造了公民参与的新空间;老百姓可以通过互联网参政议政;表达自己的看法..下列有关“虚拟社会”的说法中;正确的是D..A.现实社会是虚拟社会的延伸B.网民在互联网上以符号化的形式存在C.在虚拟世界活动的人是虚拟的D.现实世界是虚拟世界的一部分20.C年的时候我们也建成了无锡的城市大数据中心..A.2013B.2014C.2015D.201621.网络身份的B对于政治参与提出挑战..A.稳定性B.隐蔽性C.安全性D.可见性22.中国智慧城市兴起;跟物联网的发展;跟A温家宝总理到无锡来吹响向物联网进军的号角是分不开的..A.2009年8月7号B.2009年8月17号C.2008年8月7号D.2008年8月17号23.信息惠民是指通过对数据有效的加工处理;形成A的信息来普惠百姓的过程..A.有价值B.丰富C.安全D.以上都不对24.在2009年的C;IBM正式提出了智慧地球赢在中国..A.1月14号B.2月4号C.2月14号D.1月4号25.以下不属于智慧交通管理的要素是D..A.数据平台B.专家系统C.仿真评价系统D.真实环境测评26.通过A;可以让领导及时看到整理分析后的数据报告;最终为智慧能源、智慧交通等各行业提供服务..A.可量化技术B.可实现化技术C.可视化技术D.可产量化技术27.在C;我们党提出要建设物质文明建设和精神文明..A.党的十五大B.党的十七大C.改革开放初期D.党的十八大28.有关文化建设的要求;在“两步走”战略当中的A阶段提出..A.第一个B.第二个C.第三个D.第四个29.云计算是指服务的交付和使用模式;用户通过B以按需、易扩展的方式获得所需的服务..A.电路B.网络C.半导体D.电脑30.有统计;截止到D年底;我国在全球已经建成了30个海外中国文化中心..A.2013B.2014C.2015D.2016多选题共20题每题有多个正确选项;完全选择正确得2分;多选、漏选、不选得0分..31.医疗健康大数据的应用主要体现在哪些方面ABCD..A.药物研究B.门诊诊断C.病人行为及其相关数据D.管理医疗社保基金32.交通数据采集的主要的数据源有ABCD..A.电子车牌B.线圈采集C.GPS采集D.视频采集33.我们对交通数据的分析可以对交通起到ABC作用..A.进行路口的优化B.改善路口的交通状态C.进行区域性的交通组织优化D.制定预案34.健康跟我们的ABCDE有关系;所以智慧健康是可以因人而异的设定你的健康生活方式..A.生活方式B.遗传因素C.气候D.社会E.医疗35.以下ABCD是属于智慧交通数据的采集..A.视频监控B.车载的RFID的采集信息C.GPS的数据;包括地理信息GIS的地理信息D.GIS的地理信息E.路网信息36.互联网要跟我们今天日常生活里面的各方面、各体系结合在一起;才能真正地BCD..A.服务我们的生活B.服务我们国家C.服务我们的城市D.服务我们的老百姓37.财政部门数据的特点有ABCD..A.涉及部门少B.构成简单C.价值高D.延伸性强E.数据量小38.智慧政务包括ABCD..A.高效的管理B.政务的透明C.优质的服务D.政务的准确39.云计算的实质;简单说就是ABC的结合;继而实现数据更新的虚拟化过程..A.计算虚拟化B.存储虚拟化C.网络虚拟化D.数据虚拟化40.目前;国家审计的审计对象形式包括DE..A.音频B.视频C.图片D.电子数据E.纸质账本41.“两步走”战略中的第二个阶段是从2030年到本世纪中叶;在基本实现现代化的基础上;把我国建成ABCDE的社会主义现代化强国..A.富强B.民主C.文明D.和谐E.美丽42.促进文化事业的发展需要完善公共文化服务体系;具体措施包括BCDE..A.要降低公益性文化单位的活力;引入竞争机制B.要激发公益性文化单位的活力C.要继续引入竞争机制;推动公共文化事务发展D.要健全现代文化产业体系和市场体系E.要推动国际传播能力建设;提高国家文化软实力43.大数据时代的审计工作具有CDE的特点..A.自动计算B.存储密集C.数据密集D.计算密集E.智力密集44.“三个坚持”ACE是新时代文化建设的基本要求..A.坚持为人民服务、为社会主义服务B.坚持以人为本、全民共享C.坚持百花齐放、百家争鸣D.坚持科教兴国、大力发展科学技术E.坚持创造性转化、创新性发展45.下列有关网络传播的说法中;正确的包括BE..A.网络传播具有专业性B.网络传播具有口水效应C.事件具有缩小效应D.在互联网上;小群体意见容易被忽视E.事件有放大效应46.互联网公司包括ABCDE..A.谷歌B.eBayC.雅虎D.阿里巴巴E.腾讯47.从业务模式来说;满足ABC;我们就可以认为是一个云计算..A.服务可租用;用户所需资源不在客户一端而在网络B.服务可计算、可计量;服务能力具有分钟级或秒级的计量能力;便于付费C.高性价比;具有较之传统模式5倍以上的性价比优势D.弹性扩展;随时满足业务的需求48.今天的智能手机;可以做很多事情;如ABCD;甚至在企业中可以审批一些公文;都是可以使用智能手机完成..A.可以上网B.可以订票C.可以订餐D.可以做一些办公处理工作49.物联网的定义是指通过信息传感设备;按照约定的协议;把任何物品与互联网连接起来;进行信息交换和通讯;以实现智慧化ABCDE的一种网络..A.识别B.定位C.跟踪D.监控E.管理50.ABC的普及;已经完全改变了人们的生活出行方式;也改变了未来城市的交通需求..A.网络购物B.网络电视C.网上支付D.网上游戏判断题共30题判断正确得1分;错误得0分..黄色为正确51.1960年代的计算模型是个人计算;主要用于办公和游戏..A.对B.错52.Zynga是在纳斯达克上市的;主要使用S3服务..A.对B.错53.从发展角度来看;云计算无处不在;并且起到日益重要的作用..A.对B.错54.移动互联网技术的发展更加的推进云技术的不断发展;云产品平台应用的发展..A.对B.错55.推动中国文化繁荣兴盛不需要建立文化自信..A.对B.错56.要做好一个大数据;不需要设计一个大型的系统..A.对B.错57.大数据的利用成了新时代的一个显微镜;一个望远镜..A.对B.错58.总书记曾经讲过要让散落在中华大地上的文物;收藏在博物馆里面的这些文化产品要活起来..A.对B.错59.在城市交通管理上拥有绝对决策权的是交通管理部门..A.对B.错60.对城市路网的优化是在于是把路口管理好..A.对B.错61.党的十九大报告提出了新时代文化建设的基本要求;就是三个坚持;坚持为人民服务;为社会主义服务;坚持百花齐放;百家争鸣;坚持创造性转化;创新性发展..A.对B.错62.智慧交通仿真体系出不了最佳的交通优化方案..A.对B.错63.智慧城市的建设仅仅是在新城区;在我们的老城因为基础设施的问题目前不可以进行落实..A.对B.错64.没有高度的文化自信;没有文化的繁荣兴盛;就没有中华民族伟大复兴..A.对B.错65.智慧园区不仅是工作的地方;也是社会交往;也是社会活动和社会服务的地方..A.对B.错66.中国领导人民在革命建设改革中创造的革命文化也是我们能够建立文化自信的一个宝贵财富..A.对B.错67.从网络突发事件的治理与防控来看;随着互联网的发展;我们的信息传递方式对舆论控制能力提出了挑战..A.对B.错68.1980年;美国着名未来学家阿尔文·托夫勒在第三次浪潮一书中将大数据盛赞为“第三次浪潮的华彩乐章”..A.对B.错69.大数据是智慧城市建设的一个核心..A.对B.错70.用数据驱动发展;这不算是人类进入大数据时代一个新的特点..A.对B.错71.要抓紧智慧城市的内涵建设A.对B.错72.大数据不是独立存在的;它的产生、处理以及利用一定要与我们所接触的或所听到一些概念相关;这里面的相关概念包括云计算、物联网以及云计算和物联网之间的关系;这三者是相辅相成的..A.对B.错73.国家审计数据中心解决了审计大数据的存、管、用..A.对B.错74.出租车上出现的广告字;不属于云广告的具体应用..A.对B.错75.计算安全问题是云计算得以应用发展的一个最大障碍..A.对B.错76.大数据分析的意义也是非常广泛的;科学家通过大数据分析可以发现隐藏于其中的有价值的信息和知识..A.对B.错77.云计算概念也是众说纷纭;没有统一的定义;现在很多定义尝试着从学术架构、工程师、开发人员、管理人员等不同的角度去定义..A.对B.错78.“大数据”是指数据海量、计算复杂的数据集合;其在一定时间内难以依靠已有数据处理技术来进行有效的采集、管理和分析..A.对B.错79.2011年全球被创建和被复制的数据总量为1.9ZB..A.对B.错80.大数据应用是一蹴而就的事情;不需要一个过程..A.对B.错。
2020年最新公需科目《大数据》考试题(含答案)一、单选题1.数据清洗的方法不包括( D)。
(单)A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理2.下列关于网络用户行为的说法中,错误的是( C)。
(单选题) A.网络公司能够捕捉到用户在其网站上的所有行为B.用户离散的交互痕迹能够为企业提升服务质量提供参考C.数字轨迹用完即自动删除D.用户的隐私安全很难得以规范保护3.当前社会中,最为突出的大数据环境是(A )。
(单选题) A.互联网B.物联网C.综合国力D.自然资源二、多选题4.近几年,我国电子信息产业一直保持了()以上的年增长速度,成为国民经济各个领域中间的佼佼者。
A.7%B.8%C.9%D.10%5.根据周琦老师所讲,以下哪些属于数据挖掘的内容?ABC分A.补充与完善路网属性B.建立道路拥堵概率与拥堵趋势变化模型C.多维分析统计用户出行规律D.高德地图导航有躲避拥堵功能6.吴军博士认为凡是简单.重复的工作,在未来的时代里一定是机器做得比人更好。
正确错误7.人类历史上的五次媒介革命具体指的是语言出现.()。
A.印刷术B.文字出现C.电话.广播.电视D.计算机.互联网.数字化8.第一个提出大数据概念的公司是()。
A.微软公司B.谷歌公司C.脸谱公司■D.麦肯锡公司9.大数据要求企业设置的岗位是()。
A.首席信息官和首席数据官B.首席信息官和首席工程师C.首席分析师和首席工程师D.首席分析师和首席数据官10.我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。
√正确错误11.2012年,我国农村居民家庭每百户拥有移动电话197.8部。
√正确错误12.大数据作为一种数据集合,它的含义包括()。
ACDA.数据很大B.很有价值C.构成复杂D.变化很快13.医疗健康数据的基本情况不包括以下哪项? CA.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据14.“(b)阿里巴巴•贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。
大数据技术与应用1.1(继续教育公需课答案)本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March1. 【多选题】大数据技术领域的发展得到国家的高度重视,近年来不断推出了些促进这些领域创新和产业发展的指导意见、发展规划和行动纲要,主要有哪些?正确答案:[A,B,C,D,E]A: 2015年8月31日:《促进大数据发展行动纲要》 B: 2015年12月29日:《“互联网+”行动的指导意见》 C: 2017年7月8日:《新一代人工智能发展规划》 D: 2017年4月10日:《云计算发展三年行动计划(2017-2019年)》 E: 2015年5月8日:《中国制造2025》2. 【判断题】人工采集效率低、成本高、错误多。
自动化采集靠技术实现,效率高、采集的数据量大。
对错3. 【多选题】数据资源向信息、知识、价值转换的流程可以概括成5个环节:()()()()()正确答案:[A,B,C,D] A: 数据采集 B: 数据存储 C: 数据处理 D: 数据分析与挖掘 E: 知识应用4. 【判断题】由于数据采集都是在多点进行的,数据存储也从传统中央磁盘存储变成分布式云存储。
云存储的优点是容量大、费用低。
对错5. 【判断题】数据是所表达的对象或事件的信息的载体,记录了对象的属性特征。
对错6. 【多选题】数据采集可以划分为()和()。
A: 人工采集 B: 自动化采集7. 【多选题】大数据有3个显著的特征:A: 数据规模大 B: 数据变化快 C: 数据类型复杂8. 【多选题】大数据时代是()()()()4大技术领域齐头并进发展的时代,也可称作“大智移云”时代。
A: 大数据 B: 人工智能 C: 移动互联网(或物联网) D: 云计算9. 【判断题】目前大数据存储的另一趋势是向数据中心集中,以便于大数据的管理、集成和综合分析。
对错10. 【多选题】大数据的产生是由于信息技术及应用的不断发展和进步的几个阶段:A: 从信息系统应用的发展来看,80年ERP系统用于企业管理,数据规模在MB; B: 90年度信息技术用于客户管理,即CRM系统,数据规模达到GB级; C: 2000年互联网时代的Web技术使企业数据达到TB级; D: 近年来,互联网+物联网在企业中应用使数据达到PB级。
2016-2017年继续教育公共大数据培训试题及答案∙ 1.宁家骏委员指出,过去我们研制一个新型号的航天器,平均需要多长时间?(单选题1分)得分:1分o A.7-8年o B.5-6年o C.3-4年o D.1-2年∙ 2.大数据元年是指(单选题1分)得分:0分o A.2010年o B.2011年o C.2013年o D.2012年∙ 3.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》提出,到2020年,统筹区域布局,依托现有资源建成()区域临床医学数据示范中心。
(单选题1分)得分:1分o A.300个o B.100个o C.400个o D.200个∙ 4.医疗健康数据的基本情况不包括以下哪项?(单选题1分)得分:1分o A.诊疗数据o B.个人健康管理数据o C.公共安全数据o D.健康档案数据∙ 5.()提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每18个月左右可以翻一番。
(单选题1分)得分:1分o A.乔布斯o B.比尔•盖茨o C.爱因斯坦o D.戈登•摩尔∙ 6.吴军博士认为过去五十年是()的时代。
(单选题1分)得分:1分o A.拉尔定律o B.摩尔定律o C.科尔定律o D.艾尔定律∙7.根据周琦老师所讲,高德2014年被()全资收购了。
(单选题1分)得分:1分o A.腾讯o B.搜狐o C.百度o D.阿里巴巴∙8.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的()。
(单选题1分)得分:1分o A.45%o B.60%o C.75%o D.95%∙9.根据周琦老师所讲,高德早在()就开始投入资源来做全国交通信息的采集和发布。
(单选题1分)得分:1分o A.2002年o B.2007年o C.2004年o D.2005年∙10.戈登•摩尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每()左右可以翻一番。
(单选题1分)得分:1分o A.4个月o B.1个月o C.6个月o D.18个月∙11.根据周琦老师所讲,高德交通信息服务覆盖()多个城市以及全国高速路网。
2020年最新公需科目《大数据》考试题(含答案)一、单选题1.下列关于数据重组的说法中,错误的是( A)。
(单选题)A.数据重组是数据的重新生产和重新采集B.数据重组能够使数据焕发新的光芒C.数据重组实现的关键在于多源数据融合和数据集成D.数据重组有利于实现新颖的数据模式创新二、多选题2.茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?A.复旦B.清华C.北大D.浙大3.美国大的猎头公司储备人才考虑的因素包括()。
ABCD分A.智商B.经历C.情商D.价值观4.大数据系统体系建设规划包括以下哪些内容?ABCD分A.采数据B.搭平台C.编代码D.建模型5.中央网络安全和信息化领导小组,是中国全面深化改革得以顺利进行.中国社会现代化转型得以顺利完成的压仓之石。
正确错误6.在网络爬虫的爬行策略中,应用最为基础的是(AB )。
A.深度优先遍历策略B.广度优先遍历策略C.高度优先遍历策略D.反向链接策略E.大站优先策略7.根据周琦老师所讲,高德地图使用大数据能进行小路的识别。
√正确错误1.医疗健康数据的基本情况不包括以下哪项?A.诊疗数据B.个人健康管理数据C.健康档案数据D.公共安全数据8.2012年,我国农村居民家庭每百户拥有移动电话197.8部。
√正确错误9.宁家骏委员指出,()主导了21世纪。
ACDA.云计算B.移动支付C.大数据D.物联网10.大数据作为一种数据集合,它的含义包括()。
ACDA.数据很大B.很有价值C.构成复杂D.变化很快11.Web2.0强调(C)。
A.机构B.单位C.个人D.网站12.2008年以后,第()信息传输技术.传输2亿路信号。
得分.0分A.三代B.一代C.二代D.四代13.根据涂子沛先生所讲,以下说法正确的有哪些?ABCD分A.数据垃圾对商业公司是一个挑战B.个人要把数据当做自己的遗产C.中国社会迟早要面临数据遗产问题D.国家要制定合适的法律来规范数据遗产继承的问题14.传统的“统治”或“管理”观念认为,公共事务的管理权只属于政府对15.“()阿里巴巴·贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。
大数据考试题库1.数据管理与处理题题目一:请列举三种常见的数据存储方式,并对它们进行比较和分析。
解析:数据存储方式是指将数据存储在不同的介质中以满足不同的需求和要求。
常见的数据存储方式包括关系型数据库、非关系型数据库和分布式文件系统。
1)关系型数据库:关系型数据库使用表格结构来组织和存储数据,具有严格的数据模式和数据约束。
它使用SQL语言进行数据操作和查询,能够提供复杂的数据关系和事务支持。
但是,关系型数据库在处理大规模数据时性能较差,并且扩展性有限。
2)非关系型数据库:非关系型数据库以键值对、文档、列族等形式存储数据,结构灵活且具备良好的可扩展性。
它可以处理非结构化和半结构化数据,适用于大规模和高并发的数据存储和访问。
但是,非关系型数据库对数据一致性和事务支持较差。
3)分布式文件系统:分布式文件系统将大量数据分散存储在多个节点上,实现数据的分布式管理和处理。
它具有良好的可扩展性和容错性,支持高并发和大规模数据处理。
但是,分布式文件系统在数据一致性和事务管理方面存在一定的挑战。
综上所述,不同的数据存储方式适用于不同的场景和需求。
关系型数据库适合处理事务性和结构化数据;非关系型数据库适合处理非结构化和大规模数据;分布式文件系统适合处理分布式和并行计算。
题目二:大数据处理常常需要进行数据清洗操作,请介绍至少三种常见的数据清洗技术,并说明其应用场景和优缺点。
解析:数据清洗是指对原始数据进行处理和过滤,去除错误、冗余或不完整的数据,以提高数据质量和可用性。
常见的数据清洗技术包括数据去重、数据格式化、数据填充。
1)数据去重:数据去重是对数据进行重复项的识别和删除。
它可以帮助保证数据的一致性和准确性,避免重复计算和冗余存储。
数据去重常用于数据清洗、数据集成和数据仓库等场景。
但是,数据去重技术对数据量较大时性能较差。
2)数据格式化:数据格式化是将数据转化为统一的格式,以方便后续的处理和分析。
格式化可以包括数据类型转换、日期格式化等操作。
2020年最新公需科目《大数据》考试题(含答案)一、选择题1.HDFS 中的 blck 默认保存几份?a)3 份 b)2 份 c)1 份 d)不确定答案.A 默认 3 份二、填空题2.Hadp三种运行的模式.单机版 . 伪分布式和分布式。
3.MapReduce任务过程分为两个处理阶段.map阶段和reduce阶段。
三、单选题4.智慧城市的构建,不包含( C)。
(单选题)A.数字城市B.物联网C.联网监控D.云计算大数据的最显著特征是( A)。
(单选题)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高5.下列关于网络用户行为的说法中,错误的是( C)。
(单选题) A.网络公司能够捕捉到用户在其网站上的所有行为B.用户离散的交互痕迹能够为企业提升服务质量提供参考C.数字轨迹用完即自动删除D.用户的隐私安全很难得以规范保护四、多选题6.医疗健康数据的基本情况不包括以下哪项? CA.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据7.()说明如果联网越多,从介入方式.技术上越来越突破,则网络规模越大.成本越低,网络的成本可能会趋向于零。
A.梅特卡尔夫定律B.摩尔定律C.吉尔德定律D.新摩尔定律8.人类历史上的五次媒介革命具体指的是语言出现.()。
A.印刷术B.文字出现C.电话.广播.电视D.计算机.互联网.数字化9.医疗健康数据的基本情况不包括以下哪项?A.诊疗数据B.个人健康管理数据■C.公共安全数据D.健康档案数据10.2009年,甲型H1N1流感在全球爆发,谷歌(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了()。
BA.77%B.97%C.67%D.87%11.由于历史的原因,我国医院的信息化建设层次不齐.水平不一。
正确错误1.促进大数据发展部级联席会议在哪一年的4月13日召开了第一次会议?CA.2013年B.2014年C.2016年D.2015年12.依据黑龙江大农场的应用,精准农业技术能够将总成本降低15%-20%。
1 我们的大数据时代 (一) 单选题(每题2分) 1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 2. 下列关于大数据的分析理念的说法中,错误的是(D) A. 在数据基础上倾向于全体数据而不是抽样数据 B. 在分析方法上更注重相关分析我不是因果分析 C. 在分析效果上更追究效率而不是绝对精确 D. 在数据规模上强调相对数据而不是绝对数据 3. 万维网之父是(C) A. 彼得·德鲁克 B. 舍恩伯格 C. 蒂姆·伯纳斯—李 D. 斯科特·布朗 4. 下列关于普查的缺点的说法中,正确的是(A)。 A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象 B. 误差不易被控制 C. 对样本的依赖性比较强 D. 评测结果不够稳定 5.下列关于聚类挖掘技术的说法中,错误的是(B)。 A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B. 要求同类数据的内容相似度尽可能小 C. 要求不同类数据的内容相似度尽可能小 D. 与分类挖掘技术相似的是,都是要对数据进行分类处理 6. 智慧城市的构建,不包含(C)。 A. 数字城市 B. 物联网 C. 联网监控 D. 云计算 7.大数据的起源是(C)。 A. 金融 B. 电信 C. 互联网 D. 公共管理 8. 智慧城市的智慧之源是(C)。 A. 数字城市 B. 物联网 C. 大数据 D. 云计算 9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。 2
A. 因果;相关 B. 相关;因果 C. 并列;相关 D. 因果;并列 10. 下列关于数据交易市场的说法中,错误的是(C)。 A. 数据交易市场是大数据产业发展到一定程度的产物 B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场 C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D. 数据交易市场是大数据资源化的必然产物 11. 下列关于计算机存储容量单位的说法中,错误的是(C)。 A. 1KB<1MB<1GB B. 基本单位是字节(Byte) C. 一个汉字需要一个字节的存储空间 D. 一个字节能够容纳一个英文字符 12. 当前大数据技术的基础是由(C)首先提出的。 A. 微软 B. 百度 C. 谷歌 D. 阿里巴巴 13. 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。 A. 美国 B. 日本 C. 中国 D. 韩国 14. 下列演示方式中,不属于传统统计图方式的是(D)。 A. 柱状图 B. 饼状图 C. 曲线图 D. 网络图 15. 当前社会中,最为突出的大数据环境是(A)。 A. 互联网 B. 物联网 C. 综合国力 D. 自然资源 16. 可以对大数据进行深度分析的平台工具是(C)。 A. 传统的机器学习和数据分析工具 B. 第二代机器学习工具 C. 第三代机器学习工具 D. 未来机器学习工具 17. 智能健康手环的应用开发,体现了(D)的数据采集技术的应用。 A. 统计报表 B. 网络爬虫 C. API接口 D. 传感器 18. 过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是(C)。 A. 数据清洗 3
B. 数据融合 C. 数据规约 D. 数据挖掘 19. 制成大数据业务的基础是(A)。 A. 数据科学 B. 数据应用 C. 数据硬件 D. 数据人才 20. 面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是(A)。 A. 大数据解决方案模式 B. 大数据信息分类模式 C. 大数据处理服务模式 D. 大数据资源提供模式 21. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B)。 A. 在数据基础上倾向于全体数据而不是抽样数据 B. 在分析方法上更注重相关分析而不是因果分析 C. 在分析效果上更追究效率而不是绝对精确 D. 在数据规模上强调相对数据而不是绝对数据 22. 数据仓库的最终目的是(D)。 A. 收集业务需求 B. 建立数据仓库逻辑模型 C. 开发数据仓库的应用分析 D. 为用户和业务部门提供决策支持 23. 大数据的最显著特征是(A)。 A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 24. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。 A. 数据管理人员 B. 数据分析员 C. 研究科学家 D. 软件开发工程师 25. 下列论据中,能够支撑“大数据唔多不能”的观点的是(A)。 A. 互联网金融打破了传统的观念和行为 B. 大数据存在泡沫 C. 大数据具有非常高的成本 D. 个人隐私泄露与信息安全担忧 多选题(每题3分) 26. 下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)。 A. 日本:走尖端IT路线 B. 英国:视大数据为新的自然资源 C. 韩国:重视基础、首都先行 4
D. 印度:以IT外包转型为突破口 E. 澳大利亚: 原则先行、谨慎发展 27. 当前,大数据产业发展的特点是(BCE)。 A. 规模较大 B. 规模较小 C. 增速很快 D. 增速缓慢 E. 多产业交叉融合 28. 下列关于大数据的说法中,错误的是(AD)。 A. 大数据具有体量大、结构单一、时效性强的特征 B. 处理大数据需采用新型计算机架构和智能算法等新技术 C. 大数据的应用注重相关分析而不是因果分析 D. 大数据的应用注重因果分析而不是相关分析 E. 大数据的目的在于发现新的知识与洞察并进行科学决策 29. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(ABC)。 A. 传统营销模式比基于大数据的营销模式投入更小 B. 传统营销模式比基于大数据的营销模式针对性更强 C. 传统营销模式比基于大数据的营销模式转化率低 D. 基于大数据的营销模式比传统营销模式实时性更强 E. 基于大数据的营销模式比传统营销模式标准性更强 30. 按照服务目的不同,数据流通平台可分为(CDE)。 A. 政府数据开放平台 B. 企业数据开放平台 C. 数据交易市场 D. 数据研发市场 E. 数据废弃交易市场 31. 下列论据中,能够支撑“大数据唔多不能”的观点的是(ADE)。 A. 互联网金融打破了传统的观念和行为 B. 大数据存在泡沫 C. 大数据具有非常高的成本 D. 大数据医疗正在走进平民百姓 E. 数据资产型企业前景光明 32. 大数据的价值体现在(ABCDE)。 A. 大数据给思维方式带来了冲击 B. 大数据为政策制定提供科学依据 C. 大数据助力智慧城市提升公共服务水平 D. 大数据实现了精准营销 E. 大数据的发力点在于预测 33. 当前大数据技术的基础包括(ABD)。 A. 分布式文件系统 B. 分布式并行计算 C. 关系型数据库 D. 分布式数据库 E. 非关系型数据库 34. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用是(BD)。 A. 能够直观反映成对数据之间的空间关系 5
B. 能够主观反映多维数据之间的空间关系 C. 能够静态演化事物的变化及变化的规律 D. 能够动态演化事物的变化及变化的规律
E. 提供高性能并行计算技术的强力支撑 35. 下列关于计算机存贮容量单位换算关系的公式中,正确的是()。 A. 1KB=1012Byte B. 1KB=1024Byte C. 1GB=1024KB D. 1GB=1012MB E. 1GB=1024MB
判断题(每题2分) 36. 第三方数据处理模式表现为:服务商通过软件即服务或平台即服务云服务形式为用户提供自己的数据上传到服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果。(√)
37. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息精确。(×)
38. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同最好集中处理。(×)
39. 在美国的大数据大棋中,“五眼”是指配合美国进行全球监控的包含美国、英国、加拿大、荷兰在内的五个国家。(√)
40. 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(×) 41.当前,企业提供的大数据解决方案大多基于Ha doop开源项目。(√) 42. 澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府。(√) 43. 大数据可以分析与挖掘出之前人们不知道或者没有注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值。(√)
44.数据资产型企业产品线的盈利,主要通过提供收费服务来获取。(√) 45.在大数据的范畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行为特征,充分挖掘大数据的价值,变数据为资产。(×)
(二) 单选题(每题2分) 1、当前大数据技术的基础是由( C)首先提出的。 A:微软 B:百度 C:谷歌