大数据时代试题
- 格式:docx
- 大小:24.41 KB
- 文档页数:11
第一套试题1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)A:微软 B:百度 C:谷歌 D:阿里巴巴2、大数据的起源是(C )。
(单选题,本题2分)A:金融 B:电信 C:互联网 D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模 B:活性 C:关联度 D:颗粒度5、数据清洗的方法不包括( D)。
(单选题,本题2分)A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表 B:网络爬虫 C:API接口 D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。
(单选题,本题2分)A:数字城市 B:物联网 C:联网监控 D:云计算9、大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。
大数据试题及答案1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)2、大数据的起源是(C)。
(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D)反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。
(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组可以使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。
(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算9、大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官XXX通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B)。
(单选题,此题2分)A:在数据基础上倾向于部分数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、以下关于XXX对大数据特点的说法中,错误的是(D)。
(单选题,此题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。
大数据考试题库和答案一、单项选择题1. 大数据的4V特征不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D2. 以下哪一项不是Hadoop生态系统中的组件?A. HDFSB. MapReduceC. SparkD. Cassandra答案:D3. 在大数据中,以下哪个术语指的是数据的存储格式?A. ETLB. OLAPC. NoSQLD. Hadoop答案:C4. 以下哪个不是大数据技术的优势?A. 处理速度快B. 成本低C. 存储容量小D. 可扩展性高答案:C5. 大数据技术可以应用于以下哪个领域?A. 金融B. 医疗C. 教育D. 所有以上选项答案:D二、多项选择题1. 大数据技术可以解决以下哪些问题?A. 数据挖掘B. 数据存储C. 数据分析D. 数据可视化答案:ABCD2. 以下哪些是大数据技术的关键组成部分?A. 分布式存储B. 分布式计算C. 数据库D. 机器学习答案:ABCD3. 在大数据领域,以下哪些是常见的数据源?A. 社交媒体B. 传感器数据C. 交易记录D. 网络日志答案:ABCD三、判断题1. 大数据技术只能处理结构化数据。
(错误)2. 机器学习是大数据技术的一个重要应用领域。
(正确)3. Hadoop是一个开源的大数据存储和处理框架。
(正确)4. NoSQL数据库不支持事务处理。
(错误)5. 大数据技术可以完全替代传统的数据库技术。
(错误)四、简答题1. 请简述大数据的4V特征。
答案:大数据的4V特征包括:- Volume(体量大):数据量巨大,通常以TB或PB为单位。
- Velocity(速度快):数据生成和处理的速度非常快。
- Variety(种类多):数据类型多样化,包括结构化、半结构化和非结构化数据。
- Veracity(真实性):数据的质量和准确性。
2. 请解释什么是ETL过程。
大数据考试题目及答案一、单选题(每题2分,共20分)1. 大数据的4V特征不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 下列哪个不是大数据技术的应用领域?A. 金融B. 医疗C. 教育D. 核能答案:D4. 在大数据存储中,以下哪个不是HDFS的特点?A. 高可靠性B. 可扩展性C. 低延迟D. 高吞吐量答案:C5. 以下哪个不是NoSQL数据库的类型?A. 文档型数据库B. 列族数据库C. 图数据库D. 关系型数据库答案:D6. 大数据的实时处理框架不包括以下哪一项?A. StormB. FlinkC. HadoopD. Kafka Streams答案:C7. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据解释答案:D8. 在大数据技术中,以下哪个不是数据挖掘的算法?A. 决策树B. 聚类C. 线性回归D. 深度学习答案:D9. 以下哪个不是大数据安全和隐私保护的挑战?A. 数据泄露B. 数据篡改C. 数据滥用D. 数据共享答案:D10. 大数据技术中,以下哪个不是数据可视化工具?A. TableauB. PowerBIC. HadoopD. QlikView答案:C二、多选题(每题3分,共15分)11. 大数据技术可以应用于以下哪些领域?A. 电子商务B. 社交媒体分析C. 交通管理D. 环境监测答案:ABCD12. Hadoop生态系统中包括以下哪些组件?A. HBaseB. HiveC. PigD. MongoDB答案:ABC13. 大数据技术面临的挑战包括以下哪些?A. 数据存储B. 数据处理C. 数据安全D. 数据隐私答案:ABCD14. 以下哪些是大数据技术的优势?A. 处理大规模数据集B. 提高决策速度C. 降低成本D. 提高数据准确性答案:ABCD15. 以下哪些是大数据分析的关键步骤?A. 数据预处理B. 数据探索C. 数据建模D. 结果解释答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能处理结构化数据。
《大数据时代》试题单选题1、大数据的核心就是(B)【P26】A、告知与许可B、预测C、匿名化D、规模化2、大数据不是要教机器像人一样思考。
相反,它是(A)【P26】A、把数学算法运用到海量的数据上来预测事情发生的可能性。
B、被视为人工智能的一部分。
C、被视为一种机器学习。
D、预测与惩罚。
3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。
【P32】A、降低B、不变C、提高D、无关4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法【P35】A、所有数据B、绝大部分数据C、适量数据D、少量数据5、大数据的简单算法与小数据的复杂算法相比(A)【P40】A、更有效B、相当C、不具备可比性D、无效6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。
【P46】A、安全性B、完整性C、混杂性D、完整性和混杂性7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)【P61】A、信息B、数字C、文字D、方位8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)【P48】A、原因B、是什么C、关联物D、预测的关键9、建立在相关关系分析法基础上的预测是大数据的(C)【P51】A、基础B、前提C、核心D、条件10、(C)下列说法正确的是【P75-77】A、有价值的数据是附属于企业经营核心业务的一部分数据;B、数据挖掘它的主要价值后就没有必要再进行分析了;C、所有数据都是有价值的;D、在大数据时代,收集、存储和分析数据非常简单;11、关于数据创新,下列说法正确的是(D)【P78-85】A、多个数据集的总和价值等于单个数据集价值相加;B、由于数据的再利用,数据应该永久保存下去;C、相同数据多次用于相同或类似用途,其有效性会降低;D、数据只有开放价值才能得到真正释放。
12、关于数据估值,下列说法错误的是(B)【P113】A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴;B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;C、数据的价值可以通过授权的第三方使用来实现D、目前可以通过数据估值模型来准确的评估数据的价值评估13、在大数据时代,下列说法正确的是(B)。
大数据考试题目及答案一、单项选择题(每题2分,共10题)1. 大数据的4V特征中,不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(准确性)答案:D2. Hadoop的核心组件包括以下哪些?A. HDFSB. MapReduceC. YARND. 以上都是答案:D3. 下列哪个不是大数据的存储技术?A. NoSQL数据库B. 分布式文件系统C. 传统关系型数据库D. 内存数据库答案:C4. 在大数据技术中,用于实时处理数据流的框架是?A. HadoopB. SparkC. HiveD. Pig答案:B5. 大数据环境下,数据挖掘的主要目标是什么?A. 数据清洗B. 数据存储C. 数据分析D. 数据可视化答案:C二、多项选择题(每题3分,共5题)1. 大数据技术可以应用于以下哪些领域?A. 金融分析B. 医疗健康C. 交通规划D. 教育研究答案:ABCD2. 以下哪些是大数据技术的优势?A. 处理速度快B. 存储成本低C. 可扩展性强D. 数据安全性高答案:ABC3. 在大数据技术中,以下哪些是数据预处理的步骤?A. 数据清洗B. 数据转换C. 数据聚合D. 数据压缩答案:ABCD4. 大数据技术中,以下哪些是数据挖掘的常用算法?A. 决策树B. 聚类分析C. 神经网络D. 关联规则答案:ABCD5. 大数据技术中,以下哪些是数据可视化的工具?A. TableauB. Power BIC. D3.jsD. QlikView答案:ABCD三、简答题(每题5分,共2题)1. 请简述大数据技术在商业智能中的应用。
答:大数据技术在商业智能中的应用主要体现在通过分析和挖掘大量数据,帮助企业发现潜在的市场趋势、顾客行为模式以及业务流程中的效率问题,从而优化决策过程,提高运营效率,增强竞争力。
2. 描述一下大数据技术在医疗健康领域的应用。
大数据考试题及答案一、单项选择题(每题2分,共10题)1. 大数据的4V特性不包括以下哪一项?A. 体量大B. 速度快C. 价值密度高D. 多样性答案:C2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. YARND. HDFS答案:D3. 下列哪个不是大数据技术的应用领域?A. 金融分析B. 医疗健康C. 交通规划D. 传统制造业答案:D4. Spark与Hadoop相比,最大的优势在于?A. 更高的存储容量B. 更快的查询速度C. 更强的数据分析能力D. 更低的硬件要求答案:C5. 在大数据中,用于实时处理的框架是?A. HadoopB. SparkC. FlinkD. Storm答案:D二、多项选择题(每题3分,共5题)1. 大数据技术可以解决以下哪些问题?A. 数据挖掘B. 机器学习C. 预测分析D. 数据备份答案:ABC2. 下列哪些是大数据技术中常用的数据库?A. MySQLB. MongoDBC. CassandraD. Oracle答案:BC3. 大数据技术在电商领域的应用包括?A. 用户行为分析B. 商品推荐系统C. 库存管理优化D. 客户服务自动化答案:ABCD4. 以下哪些是大数据处理框架?A. HadoopB. SparkC. TensorFlowD. Elasticsearch答案:AB5. 大数据技术可以应用于以下哪些行业?A. 教育B. 政府C. 娱乐D. 农业答案:ABCD三、简答题(每题5分,共2题)1. 请简述大数据技术的主要特点。
答:大数据技术的主要特点包括数据体量大、处理速度快、数据种类多和真实性高。
它能够处理结构化、半结构化和非结构化数据,通过快速分析和处理海量数据,帮助企业和组织做出更精准的决策。
2. 请简述大数据在医疗健康领域的应用。
答:大数据在医疗健康领域的应用包括:通过分析患者数据进行疾病预测和预防;利用医疗影像数据进行辅助诊断;通过患者反馈和药物反应数据优化治疗方案;以及通过基因组数据进行个性化医疗等。
《大数据》题目单选题一、,其中他们的含VeracityVariety 、Velocity4V 特点:Volume、大数据的1)。
4 )(3 )、(义分别是(1DBCA )、( 2 )、------------------------------------------ , ------------- 数据体D. C.数据类型繁多B.A.价值密度低处理速度快量巨大而在于对这些含有意义大数据技术的战略意义不在于掌握庞大的数据信息,2))。
的数据进行(5 B内容处理速度处理D.数据信息B.专业化处理C.A.)的发布,大数据不再仅用来描述7 随着谷歌(6 )和(3)DCB。
(8 )大量的数据,还涵盖了处理数据的—6: A.Map B.DocsC. YouTubeD. Map ReduceD. Google Docs7: A. Google Mobile B. iGoogle C. GoogleD.进度B. 速度C.精度8: A. 质量斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜4)进行的红移巡天项目,2012年4月发布的关于Quasar spectra 的数据为(9 )。
B —A. 932,891,133B. 228,468C. 1,457,002D. 668,054下列哪一项不属于大数据的治理:(10 ) C 5) ----------------------------- 信息生命周D. 针对大用户C. 成本问题B. 安全问题A.期管理IBM的大数据战略以其在2012年5月发布智慧分析洞察“ 3A5步”动态路线6)图作为基础,指的是在(11 )的基础上(12 )、,进而------------------------------ (13 ),优化决策策划能够救业务绩效。
CBA 一A. 采取行动(Act)B.获取洞察(Anticipate )D. 应用管理(man agemen)C.掌握信息(Alig n )在云生态环境中,用户需求相当于(14 ),云数据中心相当于7)(15 ),云服务相当于(16 )。
《大数据》题目一、单选题1)大数据的4V特点:Volume、Velocity、Variety、Veracity,其中他们的含义分别是( 1DBCA )、( 2 )、( 3 )、( 4 )。
A.价值密度低ﻩﻩB.处理速度快ﻩC.数据类型繁多ﻩ D.数据体量巨大2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行(5B )。
A. 数据信息B. 专业化处理C.速度处理ﻩD. 内容处理3)随着谷歌( 6)和(7)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的( 8)。
DCB6: A.MapB.Docs ﻩﻩC. YouTubeﻩD.MapReduce7: A. GoogleMobileﻩ B. iGoogleﻩC. GoogleFile System ﻩD.Google Docs8: A.质量B.速度ﻩ C.精度ﻩD.进度4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜进行的红移巡天项目,2012年4月发布的关于Quasar spectra的数据为( 9 )。
BA.932,891,133ﻩﻩB. 228,468 ﻩﻩC. 1,457,002ﻩﻩD. 668,0545)下列哪一项不属于大数据的治理:(10 )CA. 安全问题 B. 成本问题ﻩ C. 针对大用户ﻩ D. 信息生命周期管理6)IBM的大数据战略以其在2012年5月发布智慧分析洞察“3A5步”动态路线图作为基础,指的是在( 11 )的基础上( 12 )、,进而( 13 ),优化决策策划能够救业务绩效。
CBAA. 采取行动(Act)ﻩB. 获取洞察(Anticipate)C. 掌握信息(Align)D. 应用管理(management)7)在云生态环境中,用户需求相当于( 14 ),云数据中心相当于( 15 ),云服务相当于(16 )。
DCBA. 降水B. 水滴C.水库ﻩD. 阳光8)尿布啤酒是大数据分析的( 17 )CA. A/B测试ﻩB. 分类ﻩﻩC. 关联规则挖掘ﻩﻩD. 数据聚类9)在GAPMINDER的Wealth & Health of Nations 中,中国在什么区域( 18)BA.黄色 B.红色ﻩ C.绿色D. 蓝色10)舆情研判,信息科学侧重( 19 ),社会和管理科学侧重突发群体事件管理中的群体心理行为及( 20 ),新闻传播学侧重对( 21 )。
大数据的考试题目和答案一、单项选择题(每题2分,共20分)1. 大数据的核心特征不包括以下哪一项?A. 体量大B. 速度快C. 价值密度高D. 多样性答案:C2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 在大数据时代,以下哪种技术不是处理数据的关键技术?A. 数据挖掘B. 机器学习C. 云计算D. 传统数据库答案:D4. 下列哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C5. 以下哪个不是大数据的存储技术?A. NoSQL数据库B. 云存储C. 传统关系型数据库D. 分布式文件系统答案:C6. 大数据的4V特性中,哪个代表数据的准确性?A. VolumeB. VelocityC. VarietyD. Veracity答案:D7. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据解释答案:D8. 以下哪个不是大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 纸质文档答案:D9. 在大数据技术中,以下哪个不是数据挖掘的算法?A. 决策树B. 聚类分析C. 线性回归D. 神经网络答案:C10. 大数据的实时处理技术不包括以下哪一项?A. StormB. FlinkC. HadoopD. Spark Streaming答案:C二、多项选择题(每题3分,共15分)11. 大数据技术可以应用于以下哪些行业?A. 零售B. 交通C. 教育D. 娱乐答案:ABCD12. 大数据的挑战包括以下哪些方面?A. 数据安全B. 数据隐私C. 数据存储D. 数据分析答案:ABCD13. 以下哪些是大数据的存储解决方案?A. 数据仓库B. 数据湖C. 云存储D. 传统数据库答案:ABC14. 以下哪些是大数据处理框架?A. HadoopB. SparkC. StormD. TensorFlow答案:ABC15. 大数据的分析方法包括以下哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能用于处理结构化数据。