大数据相关题库
- 格式:doc
- 大小:48.50 KB
- 文档页数:11
大数据考试题一、选择题1.大数据是指()。
A.海量数据存储B.海量数据处理C.海量数据分析D.以上皆是2.以下哪个行业中不适合应用大数据技术()。
A.金融B.教育C.医疗D.制造3.大数据技术的主要特点包括()。
A.高速B.大容量C.多样性D.以上皆是4.数据挖掘是大数据技术中的一种()。
A.数据收集方法B.数据处理方法C.数据分析方法D.数据存储方法5.以下哪种技术不属于大数据技术中的数据存储方法()。
A.关系数据库B.分布式文件系统C.非关系型数据库D.数据仓库二、填空题1.大数据技术的核心是()。
答:数据分析2.大数据处理能力的衡量指标是()。
答:吞吐量3.数据清洗是大数据处理过程中的()。
答:第一步4.大数据技术广泛应用于()行业。
答:金融、电商、物流等5.数据挖掘的目标是()。
答:发现隐藏在大数据中的有价值信息三、简答题1.请简述大数据的三个V特点。
答:大数据的三个V特点是:高速(Velocity)、大容量(Volume)和多样性(Variety)。
高速指的是数据的快速产生和传输速度,要求系统能够实时处理大量的数据;大容量意味着大数据处理系统需要具备海量数据存储和处理的能力;多样性指的是大数据来源的多样性,包括结构化数据和非结构化数据等。
2.数据挖掘是什么?简要介绍其在大数据领域的应用。
答:数据挖掘是通过自动或半自动的方式,在大数据中发现模式、关联、异常等有价值的信息的过程。
在大数据领域,数据挖掘技术被广泛应用于市场分析、用户画像、推荐系统等方面。
通过数据挖掘,企业可以挖掘出用户的偏好、需求,从而优化产品设计和营销策略,提升竞争力。
3.请简述大数据技术在金融行业中的应用。
答:大数据技术在金融行业中的应用广泛,包括风险管理、反欺诈、营销分析等方面。
在风险管理方面,大数据技术可以通过对大量的交易数据进行实时监控和分析,及时发现异常交易和风险事件,并采取相应措施预防风险。
在反欺诈方面,大数据技术可以对用户的行为数据进行分析,建立起用户画像,准确识别风险,防止欺诈行为的发生。
大数据考试题库和答案一、单项选择题1. 大数据的4V特征不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D2. 以下哪一项不是Hadoop生态系统中的组件?A. HDFSB. MapReduceC. SparkD. Cassandra答案:D3. 在大数据中,以下哪个术语指的是数据的存储格式?A. ETLB. OLAPC. NoSQLD. Hadoop答案:C4. 以下哪个不是大数据技术的优势?A. 处理速度快B. 成本低C. 存储容量小D. 可扩展性高答案:C5. 大数据技术可以应用于以下哪个领域?A. 金融B. 医疗C. 教育D. 所有以上选项答案:D二、多项选择题1. 大数据技术可以解决以下哪些问题?A. 数据挖掘B. 数据存储C. 数据分析D. 数据可视化答案:ABCD2. 以下哪些是大数据技术的关键组成部分?A. 分布式存储B. 分布式计算C. 数据库D. 机器学习答案:ABCD3. 在大数据领域,以下哪些是常见的数据源?A. 社交媒体B. 传感器数据C. 交易记录D. 网络日志答案:ABCD三、判断题1. 大数据技术只能处理结构化数据。
(错误)2. 机器学习是大数据技术的一个重要应用领域。
(正确)3. Hadoop是一个开源的大数据存储和处理框架。
(正确)4. NoSQL数据库不支持事务处理。
(错误)5. 大数据技术可以完全替代传统的数据库技术。
(错误)四、简答题1. 请简述大数据的4V特征。
答案:大数据的4V特征包括:- Volume(体量大):数据量巨大,通常以TB或PB为单位。
- Velocity(速度快):数据生成和处理的速度非常快。
- Variety(种类多):数据类型多样化,包括结构化、半结构化和非结构化数据。
- Veracity(真实性):数据的质量和准确性。
2. 请解释什么是ETL过程。
大数据考试题目及答案一、单项选择题(每题2分,共10题)1. 大数据的4V特征中,不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(准确性)答案:D2. Hadoop的核心组件包括以下哪些?A. HDFSB. MapReduceC. YARND. 以上都是答案:D3. 下列哪个不是大数据的存储技术?A. NoSQL数据库B. 分布式文件系统C. 传统关系型数据库D. 内存数据库答案:C4. 在大数据技术中,用于实时处理数据流的框架是?A. HadoopB. SparkC. HiveD. Pig答案:B5. 大数据环境下,数据挖掘的主要目标是什么?A. 数据清洗B. 数据存储C. 数据分析D. 数据可视化答案:C二、多项选择题(每题3分,共5题)1. 大数据技术可以应用于以下哪些领域?A. 金融分析B. 医疗健康C. 交通规划D. 教育研究答案:ABCD2. 以下哪些是大数据技术的优势?A. 处理速度快B. 存储成本低C. 可扩展性强D. 数据安全性高答案:ABC3. 在大数据技术中,以下哪些是数据预处理的步骤?A. 数据清洗B. 数据转换C. 数据聚合D. 数据压缩答案:ABCD4. 大数据技术中,以下哪些是数据挖掘的常用算法?A. 决策树B. 聚类分析C. 神经网络D. 关联规则答案:ABCD5. 大数据技术中,以下哪些是数据可视化的工具?A. TableauB. Power BIC. D3.jsD. QlikView答案:ABCD三、简答题(每题5分,共2题)1. 请简述大数据技术在商业智能中的应用。
答:大数据技术在商业智能中的应用主要体现在通过分析和挖掘大量数据,帮助企业发现潜在的市场趋势、顾客行为模式以及业务流程中的效率问题,从而优化决策过程,提高运营效率,增强竞争力。
2. 描述一下大数据技术在医疗健康领域的应用。
大数据考试题目及答案一、单项选择题(每题2分,共20分)1. 大数据技术的核心目标是处理哪种类型的数据?A. 结构化数据B. 半结构化数据B. 非结构化数据D. 所有上述数据类型答案:D2. 在大数据分析中,以下哪个算法主要用于聚类分析?A. 决策树B. 神经网络C. K-meansD. 线性回归答案:C3. Hadoop的核心组件包括以下哪个?A. SparkB. HiveC. HBaseD. MapReduce答案:D4. 数据挖掘中的“关联规则”通常与哪位学者的名字联系在一起?A. 马斯洛B. 纳维斯C. 阿普拉姆D. 汉斯答案:B5. 大数据的“4V”特性不包括以下哪一项?A. 体量大B. 速度快C. 价值高D. 成本高答案:D6. 在大数据架构中,数据湖主要用于存储什么类型的数据?A. 仅结构化数据B. 仅非结构化数据C. 结构化和非结构化数据D. 仅半结构化数据答案:C7. 下列哪项不是大数据分析的常见应用场景?A. 市场分析B. 风险管理C. 客户细分D. 纸质文档打印答案:D8. 大数据技术可以有效地处理“数据孤岛”问题,这主要是指:A. 数据的物理隔离B. 数据的逻辑隔离C. 数据的格式不统一D. 数据的存储位置分散答案:B9. 在大数据环境下,以下哪个数据库更适合处理非关系型数据?A. MySQLB. OracleC. MongoDBD. SQL Server答案:C10. 大数据的实时分析通常依赖于哪种技术?A. 数据仓库B. 批处理C. 流处理D. 数据挖掘答案:C二、多项选择题(每题3分,共15分)11. 大数据的存储技术包括以下哪些选项?(多选)A. 云存储B. 分布式文件系统C. 关系型数据库D. NoSQL数据库答案:A B D12. 在大数据的生态系统中,以下哪些组件是常见的?(多选)A. HadoopB. SparkC. MongoDBD. Excel答案:A B C13. 大数据的分析过程通常包括哪些步骤?(多选)A. 数据采集B. 数据清洗C. 数据可视化D. 数据丢弃答案:A B C14. 以下哪些因素会影响大数据的性能?(多选)A. 数据的规模B. 数据的处理速度C. 数据的存储格式D. 数据的来源答案:A B C15. 在大数据安全领域,以下哪些措施是重要的?(多选)A. 数据加密B. 访问控制C. 数据备份D. 系统防火墙答案:A B C D三、简答题(每题10分,共20分)16. 请简述大数据的“4V”特性是什么?答案:大数据的“4V”特性指的是体量大(Volume)、速度快(Velocity)、类型多(Variety)、价值高(Value)。
大数据考试题目及答案一、单选题(每题2分,共10分)1. 大数据的“4V”特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Visualization(可视化)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. MapReduceD. YARN答案:A3. 以下哪个不是大数据技术?A. SparkB. HadoopC. MongoDBD. MySQL答案:D4. 大数据的分析处理通常不包括以下哪个阶段?A. 数据收集B. 数据清洗C. 数据存储D. 数据展示答案:D5. 下列哪个选项不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C二、多选题(每题4分,共20分)1. 大数据技术可以应用于以下哪些行业?A. 电子商务B. 物流C. 制造业D. 教育答案:A、B、C、D2. 以下哪些是Hadoop生态系统的组成部分?A. HDFSB. MapReduceC. SparkD. HBase答案:A、B、C、D3. 大数据的分析方法包括哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:A、B、C、D4. 大数据的挑战包括哪些?A. 数据安全B. 数据隐私C. 数据存储D. 数据处理答案:A、B、C、D5. 以下哪些是大数据分析工具?A. RB. PythonC. SASD. Excel答案:A、B、C三、判断题(每题2分,共10分)1. 大数据技术只能用于处理非结构化数据。
()答案:错误2. Hadoop可以处理PB级别的数据。
()答案:正确3. 大数据技术不需要考虑数据的实时性。
()答案:错误4. 大数据技术可以提高决策的效率和准确性。
()答案:正确5. 大数据技术无法应用于个人隐私保护。
()答案:错误四、简答题(每题10分,共20分)1. 简述大数据的“4V”特征。
大数据1、SQL Server 2008是一个( )的数据库系统。
——[单选题]A 网状型B 层次型C 关系型D 以上都不是正确答案:C2、DBMS是什么()——[单选题]A 操作系统B 数据库管理系统C 数据库D 数据库管理员正确答案:B3、SQL Server中的系统级信息存储于哪个数据库( )。
——[单选题]A masterB modelC tempdbD msdb正确答案:A4、数据库系统由哪()部分组成。
——[单选题]A 计算机硬件、软件、数据库和数据B 计算机硬件、软件、数据库和数据用户C 计算机硬件、软件和数据D 计算机硬件、软件、数据库正确答案:B5、关系数据模型 ()。
——[单选题]A 只能表示实体间的 1 : 1 联系B 只能表示实体间的 1 : n 联系C 只能表示实体间的 m : n 联系D 只能表示实体间的上述 3 种联系正确答案:D6、假如有两个表的连接是这样的: table_a inner join table_b 其中table_a和table_b是两个具有公共属性的表,这种连接会生成哪种结果集?——[单选题]A 包括table_a中的所有行,不包括table_b的不匹配行B 包括table_b中的所有行,不包括table_a的不匹配行C 包括和两个表的所有行D 只包括table_a和table_b满足条件的行正确答案:D7、要查询book表中所有书名中包含“计算机”的书籍情况,可用( )语句。
——[单选题]A SELECT * FROM book WHERE book_name LIKE ‘计算机*’B SELECT * FROM book WHERE book_name LIKE ‘计算机%’C SELECT * FROM book WHERE book_name = ‘计算机*’D SELECT * FROM book WHERE book_name = ‘计算机%’正确答案:B8、以下运算符中优先级最低的是:——[单选题]A +(加)B =(等于)C likeD =(赋值)正确答案:D9、下面字符串能与通配符表达式 [ABC]%a 进行匹配的是:——[单选题]A BCDEFB A_BCDC ABC_aD A%a正确答案:C10、在SELECT语句中,用于去除重复行的关键字是 :——[单选题]A TOPB DISTINCTC PERCENTD HAVING正确答案:B11、若想查询出所有姓张的、且出生日期为空的学生信息,则WHERE条件应为 ( )——[单选题]A 姓名LIKE ‘张%’ AND 出生日期 = NULLB 姓名LIKE ‘张*’ AND 出生日期 = NULLC 姓名LIKE ‘张%’ AND 出生日期 IS NULLD 姓名LIKE ‘张_’ AND 出生日期 IS NULL正确答案:C12、SELECT查询中,要把结果中的行按照某一列的值进行排序,所用到的子句是:——[单选题]A ORDER BYB WHEREC GROUP BYD HAVING正确答案:A13、下列运算符中可以实现模糊查询的是( )。
大数据试题及答案一、单选题1. 大数据的4V特性不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Validity(有效性)答案:D2. 在大数据分析中,以下哪项技术主要用于数据的存储和管理?A. HadoopB. SparkC. R语言D. SQL答案:A3. 大数据的实时分析通常指的是什么?A. 批量处理数据B. 流式处理数据C. 离线分析数据D. 数据挖掘答案:B4. 下列哪个是大数据分析的典型应用场景?A. 财务报告编制B. 客户行为分析C. 产品成本核算D. 员工绩效评估答案:B5. 在大数据架构中,MapReduce通常用于什么?A. 数据存储B. 数据查询C. 数据处理D. 数据可视化答案:C二、多选题6. 下列哪些是大数据技术生态系统中常见的组件?(多选)A. HadoopB. MongoDBC. HiveD. Cassandra答案:A, C, D7. 在大数据的背景下,以下哪些因素可能对数据隐私和安全构成威胁?(多选)A. 数据泄露B. 不当的数据共享C. 黑客攻击D. 法律监管不足答案:A, B, C, D8. 大数据技术可以帮助企业实现哪些目标?(多选)A. 提高运营效率B. 增强市场竞争力C. 降低成本D. 提升客户满意度答案:A, B, C, D三、判断题9. 所有大数据问题都可以通过单一的大数据技术解决。
(对/错)答案:错10. 大数据技术的发展完全依赖于开源社区。
(对/错)答案:错四、简答题11. 简述大数据技术在医疗健康领域的应用。
答案:大数据技术在医疗健康领域的应用包括疾病预测、个性化医疗、医疗影像分析、临床决策支持、药物研发、患者健康管理等。
通过分析大量的医疗记录和健康数据,可以帮助医生做出更准确的诊断,为患者提供个性化的治疗方案,同时优化医疗资源的分配和使用。
12. 描述一下什么是数据湖以及它在大数据分析中的作用。
大数据试题及答案一、选择题1. 以下哪项技术不是大数据处理的核心技术?A. 分布式存储B. 分布式计算C. 数据挖掘D. 关系型数据库答案:D2. 以下哪个大数据处理框架是Apache软件基金会开发的?A. HadoopB. SparkC. FlinkD. All of the above答案:D3. 在大数据技术中,以下哪个技术用于实现数据的分布式存储?A. HDFSB. HBaseC. RedisD. Kafka答案:A4. 以下哪个大数据技术用于实现数据的分布式计算?A. MapReduceB. StormC. SparkD. Hive答案:A5. 以下哪个大数据技术用于实现实时数据处理?A. HadoopB. Spark StreamingC. FlinkD. Kafka答案:C二、填空题1. 大数据处理技术主要包括________、________、________和________。
答案:分布式存储、分布式计算、数据挖掘、数据可视化2. Hadoop框架中的________用于分布式存储,________用于分布式计算。
答案:HDFS、MapReduce3. 在大数据技术中,________是用于实现实时数据流处理的技术,________是用于实现实时计算的技术。
答案:Kafka、Flink4. 以下属于大数据应用场景的有:________、________、________。
答案:金融风控、智能推荐、物联网三、判断题1. 大数据技术仅适用于处理大规模数据集。
()答案:错误。
大数据技术不仅可以处理大规模数据集,还可以应用于中小数据集,提高数据处理和分析的效率。
2. Hadoop是一个开源的大数据处理框架,可以用于分布式存储和分布式计算。
()答案:正确。
3. Spark比Hadoop更适用于实时数据处理。
()答案:正确。
Spark具有更高的数据处理速度,可以满足实时数据处理的需求。
四、简答题1. 简述大数据技术的特点和挑战。
大数据的考试题目和答案一、单项选择题(每题2分,共20分)1. 大数据的核心特征不包括以下哪一项?A. 体量大B. 速度快C. 价值密度高D. 多样性答案:C2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 在大数据时代,以下哪种技术不是处理数据的关键技术?A. 数据挖掘B. 机器学习C. 云计算D. 传统数据库答案:D4. 下列哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C5. 以下哪个不是大数据的存储技术?A. NoSQL数据库B. 云存储C. 传统关系型数据库D. 分布式文件系统答案:C6. 大数据的4V特性中,哪个代表数据的准确性?A. VolumeB. VelocityC. VarietyD. Veracity答案:D7. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据解释答案:D8. 以下哪个不是大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 纸质文档答案:D9. 在大数据技术中,以下哪个不是数据挖掘的算法?A. 决策树B. 聚类分析C. 线性回归D. 神经网络答案:C10. 大数据的实时处理技术不包括以下哪一项?A. StormB. FlinkC. HadoopD. Spark Streaming答案:C二、多项选择题(每题3分,共15分)11. 大数据技术可以应用于以下哪些行业?A. 零售B. 交通C. 教育D. 娱乐答案:ABCD12. 大数据的挑战包括以下哪些方面?A. 数据安全B. 数据隐私C. 数据存储D. 数据分析答案:ABCD13. 以下哪些是大数据的存储解决方案?A. 数据仓库B. 数据湖C. 云存储D. 传统数据库答案:ABC14. 以下哪些是大数据处理框架?A. HadoopB. SparkC. StormD. TensorFlow答案:ABC15. 大数据的分析方法包括以下哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能用于处理结构化数据。
大数据试题及答案一、选择题1. 大数据的4V特征中,不包括下列哪一项?A. 多样性(Variety)B. 速度(Velocity)C. 可访问性(Veracity)D. 价值(Value)答案:C2. 下列关于Hadoop的描述,哪一项是错误的?A. Hadoop是一个开源的分布式存储和计算平台。
B. Hadoop的核心是HDFS和MapReduce。
C. Hadoop可以处理结构化和非结构化数据。
D. Hadoop无法与其他数据库软件集成。
答案:D3. 在大数据分析中,数据清洗的目的是什么?A. 减少数据量B. 提高数据质量C. 增加数据种类D. 加快数据处理速度答案:B4. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 关联规则学习D. 机器翻译答案:D5. 数据仓库的主要作用是什么?A. 存储实时数据B. 支持决策制定C. 提高数据传输速度D. 加密数据保护答案:B二、填空题1. 大数据环境下,数据的________和________是保证数据安全的重要措施。
答案:加密、访问控制2. 在大数据应用中,________可以帮助企业发现潜在的客户群体和市场趋势。
答案:数据挖掘3. 为了提高数据分析的准确性,通常需要对数据进行________处理。
答案:标准化4. 大数据技术的发展,促进了________和________领域的融合,推动了智能化决策的发展。
答案:信息技术、业务管理5. 数据治理是确保数据________、________和________的关键过程。
答案:准确性、完整性、一致性三、简答题1. 简述大数据的基本概念及其对现代企业的影响。
答案:大数据指的是传统数据处理应用软件难以处理的大规模、高增长率和多样化的数据集合。
它通过高速处理数据,能够揭示隐藏在数据背后的模式、趋势和关联,对现代企业的影响主要体现在提高了决策效率、优化了客户服务、增强了市场竞争力等方面。
2. 描述数据仓库和大数据平台之间的区别。
大数据行业测试题目及答案一、单选题(每题2分,共10分)1. 大数据的4V特性不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Veracity(真实性)答案:D2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. SparkD. YARN答案:C3. 下列哪个不是大数据技术?A. HadoopB. MongoDBC. CassandraD. Oracle答案:D4. 以下哪个不是大数据存储技术?A. NoSQLB. SQLC. HBaseD. HDFS答案:B5. 大数据的分析方法不包括以下哪一项?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:B二、多选题(每题3分,共15分)1. 大数据的来源包括以下哪些?A. 社交媒体B. 交易记录C. 传感器数据D. 电子邮件答案:A, B, C, D2. 以下哪些是大数据的处理框架?A. HadoopB. SparkC. FlinkD. Kafka答案:A, B, C, D3. 大数据的分析工具包括以下哪些?A. RB. PythonC. SASD. Excel答案:A, B, C4. 大数据在以下哪些行业中有应用?A. 金融B. 医疗C. 教育D. 零售答案:A, B, C, D5. 以下哪些是大数据的挑战?A. 数据安全B. 数据隐私C. 数据质量问题D. 存储成本答案:A, B, C, D三、判断题(每题2分,共10分)1. 大数据技术可以处理结构化和非结构化数据。
(对)2. 大数据技术只适用于大型企业。
(错)3. 大数据可以提高决策的准确性。
(对)4. 大数据技术不需要考虑数据的实时性。
(错)5. 大数据技术可以自动发现数据中的模式和关联。
(对)四、简答题(每题5分,共20分)1. 请简述大数据的4V特性。
答案:大数据的4V特性包括Volume(体量)、Velocity(速度)、Variety(多样性)和Veracity(真实性)。
大数据1、联通大数据产业解决方案中,DDS的意思是指? (1.0分)——[单选题]A 政务驱动服务B 数据驱动服务C 数据处理服务D 数据改进服务正确答案:B2、与运营商数据相比,政府数据的体量和维度更偏向于下面哪一种? (1.0分)——[单选题]A 大致相等B 小C 更大D 极少正确答案:C3、政务行业大数据解决方案中,以下哪项不是市场监管部门的关注点? (1.0分)——[单选题]A 识别监管对象真实身份B 查找监管对象经营地点C 掌控监管对象经营行为D 掌握市场主体的社保缴纳情况正确答案:D4、政务行业大数据对于社会治理大数据分析模块不包括哪项功能? (1.0分)——[单选题]A 人口热力分析B 人口结构分析C 人口来源分析D 政府办公正确答案:D5、联通大数据社会治理系统数据来源没有哪项? (1.0分)——[单选题]A 政府B 运营商C 银行D 物联网正确答案:C6、人口大数据标签数量大约有多少个? (1.0分)——[单选题]A 3800+B 2000+C 1000+D 500+正确答案:A7、以下不是人口大数据优势的是哪个? (1.0分)——[单选题]A 无感知采集B 全生命周期C 全国集中D 通知用户采集正确答案:D8、人口大数据中如何判定户籍所在地? (1.0分)——[单选题]A 身份证前六位B 春节路径C 每日工作路径D 常驻地位置正确答案:C9、人口大数据目前还不能实现的场景是哪一个? (1.0分)——[单选题]A 人口统计B 人口监测C 人口评估D 人员比对正确答案:D10、人口大数据的集中程度目前是实现了什么集中? (1.0分)——[单选题]A 全国集中B 部分集中C 省级集中D 市级集中正确答案:A11、药品溯源大数据中,对于食药监管的核心是什么? (1.0分)——[单选题]A 全B 大C 广D 严正确答案:A12、克强总理提到:百分之多少的数据掌握在政府手中 (1.0分)——[单选题]A 0.2B 0.6C 0.8D 0.5正确答案:C13、2020年大数据产业规模将超多少亿的规模? (1.0分)——[单选题]A 百亿B 万亿C 千亿D 十亿正确答案:B14、下面哪一个不是文旅大数据方案产品所直接面向的客户? (1.0分)——[单选题]A 文旅厅B 博物馆C 游客D 景区正确答案:C15、下列哪一类洞察是基于联通DPI数据,分析互联网APP、网站、微博、微信公众号等开展的? (1.0分)——[单选题]A 终端洞察B 互联网洞察C 区域洞察D 人口洞察正确答案:B16、以下不是联通APP洞察产品主要受众的是: (1.0分)——[单选题]A 互联网企业B 投资机构C 咨询公司D 政府机构正确答案:D17、以下不属于标准化SaaS数赢洞察的产品优势 (1.0分)——[单选题]A 中小企业为主,成本低B 业务流程简单,使用方便C 即开即用、省时高效D 只提供定制化服务正确答案:D18、朋友圈广告投放数据报表不能提供哪项指标? (1.0分)——[单选题]A 公众号关注数量B 公众号文章转发数量C 广告点击数量D 公众号内部访问时长正确答案:D19、广告产品更适合服务于下列哪类客户? (1.0分)——[单选题]A 寻求针对目标人群的精准投放B 预算大,潜客定向窄,注重销售转化效果C 有预算,定向范围较大,注重品牌宣传D 预算大,但客户没有素材和落地页正确答案:C20、朋友圈广告投放中,最常见的图片尺寸为下列哪个? (1.0分)——[单选题]A 800*450B 900*450C 400*550D 850*630正确答案:A21、可以根据点击过广告的人群进行重新投放的功能被称为什么? (1.0分)——[单选题]A lookalikeB 人群属性定向C 重定向人群D 自定义投放正确答案:C22、数睿广告不能定向的人群是下列哪一个? (1.0分)——[单选题]A 大连市的人群B 中小学老师C 25-45女性D 爱好金融、房产的男性正确答案:B23、在广告投放时候,联通大数据支撑朋友圈广告2分钟内反复刷5次,算作几次曝光?(1.0分)——[单选题]A 2B 1C 3D 5正确答案:B24、数睿广告产品中,朋友圈订单的起充金额为? (1.0分)——[单选题]A 1000B 2000C 1万D 5000正确答案:D25、下列有关数睿广告适用场景,最准确的说法是? (1.0分)——[单选题]A 品牌推广为主,效果为辅B 效果转化为主,品牌推广为辅C 品牌宣传D 效果ROI转化正确答案:A26、营销平台失联复联加密方式 (1.0分)——[单选题]A MD5(16位小写)B MD5(16位大写)C MD5(32位小写)D MD5(32位大写)正确答案:D27、数字营销产品优势表述正确的是? (1.0分)——[单选题]A 数据集中、画像全面、一站式服务、多租户模式、多渠道渠道B 数据集中、画像全面、一站式服务C 一站式服务、多租户模式、多渠道渠道、安全性D 画像全面、一站式服务、多租户模式、多渠道渠道正确答案:A28、联通大数据数睿广告产品中,朋友圈渠道推广的订单,可以不具备哪一项? (1.0分)——[单选题]A 开通微信公众号B 具备对应的行业资质C 客户有自己的小程序D 公众号开通广告主功能正确答案:C29、联通大数据产品中,线上广告可投放的行业,不包括以下哪个? (1.0分)——[单选题]A 医疗B 房产C 母婴D 教育正确答案:A30、数盾风控产品提供征信验证和风险评估服务,以及全方位的风控解决方案的前提是:(1.0分)——[单选题]A 充分保障用户隐私安全B 充分保障数据全面C 避免损失D 及时响应正确答案:A31、下面选项中,属于大数据数言预警模式的是: (1.0分)——[单选题]A 人工预警和智能预警B 人工预警C 智能预警D 手动预警正确答案:A32、大数据产品优势中,下面对于数据能力采集处理快描述错误的是: (1.0分)——[单选题]A 每毫秒10万组词逻辑匹配B 每秒钟高速流式大数据处理10万篇文章C 每分钟2200万贴吧全扫描D 每日去重原创信息采集近1.5亿正确答案:A33、联通大数据产品体系中,下面不是数言舆情产品的优势的是: (1.0分)——[单选题]A 复杂B 安全C 全面D 快速正确答案:A34、一般情况下,能力开放平台提供的数据均为生产平台的哪一类数据? (1.0分)——[单选题]A 真实明文数据B 真实脱敏数据C 伪造明文数据D 伪造脱敏数句正确答案:B35、客户可以通过开通以下哪个权限,从而能够自主地在能力开放平台上传数据? (1.0分)——[单选题]A CRTB APIC FTPD VPN正确答案:C36、以下字段中,能力开放平台不会脱敏处理的字段是哪个? (1.0分)——[单选题]A 手机号B IMEI号C 在网时长D 经纬度信息正确答案:C37、能力开放平台以多租户的方式进行管理运营,各租户之间数据资源,网络、计算资源如何相互规划,保证各合作伙伴的资源使用稳定及其模型资产安全。
大数据局考试题库及答案一、单选题1. 大数据是指数据量达到什么级别?A. 千兆字节(GB)B. 十亿字节(TB)C. 千兆兆字节(PB)D. 兆兆兆字节(ZB)答案:C2. 以下哪个不是大数据的5V特性之一?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Visibility(可见性)答案:D3. 大数据技术中,Hadoop的核心技术是?A. SparkB. HiveC. HBaseD. MapReduce答案:D4. 数据挖掘中,以下哪个算法属于分类算法?A. K-meansB. AprioriC. KNND. PageRank答案:C5. 数据仓库与数据库的主要区别在于?A. 数据仓库只存储历史数据B. 数据库只存储历史数据C. 数据库只存储实时数据D. 数据仓库只存储实时数据答案:A二、多选题6. 大数据的来源可以包括以下哪些方面?A. 社交媒体B. 交易记录C. 传感器数据D. 政府公开数据答案:A, B, C, D7. 以下哪些是大数据应用的领域?A. 医疗健康B. 金融分析C. 交通管理D. 教育研究答案:A, B, C, D8. 大数据技术可以解决哪些问题?A. 数据存储B. 数据分析C. 数据可视化D. 数据安全答案:A, B, C, D三、判断题9. 大数据技术只能处理结构化数据。
(对/错)答案:错10. 数据挖掘是大数据技术的核心组成部分。
(对/错)答案:对四、简答题11. 简述大数据的4V特性。
答案:大数据的4V特性包括Volume(体量),即数据的规模;Velocity(速度),即数据的生成和处理速度;Variety(多样性),即数据的类型和结构;Veracity(真实性),即数据的准确性和可靠性。
五、案例分析题12. 某电商平台需要分析用户购买行为,以优化推荐算法。
请列出可能使用到的大数据技术和工具。
答案:可能使用到的大数据技术和工具包括:- 数据采集工具:如Flume、Kafka等,用于实时收集用户行为数据。
大数据考试试题及答案一、选择题1. 以下哪项不是大数据的特点?A. 体量大B. 多样性C. 速度快D. 存储方式单一答案:D2. 下列哪种技术不属于大数据处理的常用技术?A. HadoopB. SparkC. MySQLD. Flink答案:C3. 大数据处理中,哪种技术适合处理流式数据?A. HadoopB. SparkC. FlinkD. Hive答案:C4. 下列哪种操作属于数据清洗的过程?A. 去重B. 数据压缩C. 数据备份D. 数据加密答案:A5. 以下哪种技术适合进行数据可视化?A. TableauB. HadoopC. KafkaD. Storm答案:A二、填空题1. 大数据的四个V分别是()、()、()、()。
答案:Volume、Velocity、Variety、Value2. 大数据技术中用来实现实时流式计算的框架是()。
答案:Flink3. 大数据处理中常用的存储系统有()和()。
答案:HDFS、HBase4. 数据清洗的过程通常包括数据去重、数据转换和()。
答案:数据过滤5. 在大数据处理中,用于数据交互的消息队列系统有()和()。
答案:Kafka、RabbitMQ三、简答题1. 请简要说明大数据的定义及其应用领域。
答:大数据是指体量巨大、处理速度快且包含多样性数据的信息资产。
大数据的应用领域包括但不限于金融、医疗、营销和科学研究等领域。
2. 请说明大数据处理中的数据清洗过程的重要性及具体步骤。
答:数据清洗是大数据处理中的关键步骤,其重要性在于保证数据的准确性和可靠性。
数据清洗的具体步骤包括数据去重、数据转换、数据过滤等。
3. 请简要介绍大数据处理中常用的数据可视化工具及其作用。
答:常用的数据可视化工具包括Tableau、Power BI等,其作用是将大数据处理后的结果以图表形式直观展现,帮助用户更好地理解数据和分析结果。
以上为大数据考试试题及答案,请考生认真作答。
祝各位考生顺利通过考试!。
大数据练习题(打印版)# 大数据练习题(打印版)## 一、选择题1. 大数据的4V特征不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Value(价值高)2. Hadoop的核心组件不包括以下哪一项?A. HDFS(Hadoop Distributed File System)B. MapReduceC. HiveD. Cassandra3. 下列哪个不是大数据技术?A. SparkB. HadoopC. MongoDBD. SQL Server## 二、填空题1. 在大数据存储中,HDFS采用了_________策略来提高数据的可靠性。
2. MapReduce编程模型中的两个核心步骤是_________和_________。
3. 大数据技术可以应用于_________、_________、_________等多个领域。
## 三、简答题1. 简述大数据与传统数据库的主要区别。
2. 描述Hadoop生态系统中HDFS、MapReduce和YARN的作用及其相互关系。
3. 举例说明大数据技术在商业智能中的应用。
## 四、计算题1. 假设有一个大数据集,其大小为1TB,需要在Hadoop集群中进行处理。
如果集群有10个节点,每个节点的存储容量为100GB,那么理论上这个集群最多可以存储多少数据?请给出计算过程。
2. 在一个大数据项目中,使用MapReduce进行数据处理。
如果Map阶段有100个Map任务,每个Map任务处理的数据量为10GB,Reduce阶段有20个Reduce任务,每个Reduce任务处理的数据量为5GB。
假设Map任务和Reduce任务的执行时间相同,那么整个数据处理过程需要多长时间?(假设每个任务的执行时间为1小时)## 五、案例分析题某电商平台希望通过大数据分析来优化其推荐系统。
请分析以下问题:1. 该电商平台可以从哪些数据源获取数据?2. 如何利用大数据技术对这些数据进行处理和分析?3. 通过大数据分析,该电商平台可以获得哪些商业洞察?4. 请给出一个具体的大数据分析方案,包括数据收集、处理、分析和应用的各个环节。
大数据考试题及答案一、单选题(每题2分,共20分)1. 大数据的4V特性不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Value(价值高)答案:D2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 下列哪个不是NoSQL数据库的类型?A. 文档型数据库B. 列族数据库C. 图数据库D. 关系型数据库答案:D4. 在大数据技术中,以下哪个不是数据仓库的构建工具?A. HadoopB. HiveC. PigD. MongoDB答案:D5. 以下哪个不是大数据处理框架?A. HadoopB. StormC. FlinkD. Docker答案:D6. 数据挖掘中的“分类”任务通常使用哪种算法?A. 线性回归B. 决策树C. 聚类D. 异常检测答案:B7. 在大数据中,以下哪个不是数据集成的关键步骤?A. 数据清洗B. 数据转换C. 数据存储D. 数据分析答案:D8. 以下哪个是大数据分析的常用工具?A. ExcelB. RC. PythonD. 以上都是答案:D9. 以下哪个不是大数据安全和隐私保护的挑战?A. 数据泄露B. 数据篡改C. 数据滥用D. 数据共享答案:D10. 在大数据中,以下哪个不是数据可视化的常用工具?A. TableauB. Power BIC. MATLABD. Photoshop答案:D二、多选题(每题3分,共15分)11. 大数据的来源可能包括以下哪些?A. 社交媒体B. 传感器数据C. 传统数据库D. 网络日志答案:ABCD12. 在大数据处理中,以下哪些是MapReduce的特点?A. 高容错性B. 高扩展性C. 适用于实时处理D. 易于编程答案:ABD13. 以下哪些是大数据存储技术的特点?A. 高效性B. 可扩展性C. 成本效益D. 低延迟答案:ABC14. 在大数据中,以下哪些是数据清洗的目的?A. 去除重复数据B. 纠正错误数据C. 填补缺失数据D. 增强数据安全性答案:ABC15. 以下哪些是大数据分析的步骤?A. 数据收集B. 数据预处理C. 数据探索D. 结果解释答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能应用于互联网行业。
大数据试题及答案一、选择题(每题2分,共20分)1. 大数据的4V特征指的是什么?A. 体量大、速度快、多样性、价值高B. 体量大、速度快、多样性、真实性C. 体量大、速度快、真实性、价值高D. 体量大、真实性、多样性、价值高答案:A2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. FlumeD. HDFS答案:D3. 下列哪个不是大数据技术?A. HadoopB. SparkC. MongoDBD. MySQL答案:D4. 以下哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 游戏答案:D5. 以下哪个是大数据的分析工具?A. ExcelB. RC. PythonD. Word答案:B6. 大数据的实时分析通常使用什么技术?A. 批处理B. 流处理C. 数据挖掘D. 数据清洗答案:B7. 在大数据中,用于处理半结构化数据的技术是?A. SQLB. NoSQLC. XMLD. JSON答案:B8. 大数据的存储通常需要使用哪种类型的存储系统?A. 块存储B. 文件存储C. 对象存储D. 所有以上答案:D9. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据转换D. 数据存储答案:D10. 大数据的“体量大”通常指的是数据量达到多少?A. GB级别B. TB级别C. PB级别D. EB级别答案:C二、填空题(每题2分,共10分)1. 大数据技术可以处理的数据类型包括结构化数据、________数据和非结构化数据。
答案:半结构化2. 在Hadoop生态系统中,________是用来进行数据计算的分布式内存计算框架。
答案:Spark3. 大数据的“速度快”是指数据的________速度。
答案:处理和分析4. 在大数据技术中,________是一种用于存储大量非结构化数据的分布式文件系统。
答案:HDFS5. 大数据的“价值高”是指数据中蕴含的________价值。
大数据考试试题题库500题[含答案]一、选择题1.医疗健康数据的基本情况不包括以下哪项?c(单选题1分)得分.1分A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据2.根据周琦老师所讲,高德2014年被(C)全;A.搜狐;B.腾讯;C.阿里巴巴;D.百度;3.20世纪中后期至今的媒介革命,以(acd )的出现为标志。
(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化4.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高(abd)的信息服务水平。
(多选题3分)得分.3分A.农业生产经营B.质量安全控制C.文化交流D.市场流通5.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测6.贵州发展大数据的“八个一”建议包括(ab;得分.3分;A.制定一个工作计划.建立一个领导机构B.培养 D.中央网络安全和信息化领导小组组长是李克强。
7.“十二五”以来我国信息化发展的亮点包括以;A.信息产业的支撑性.保障性.带动性作用进一步;B.信息基础设施建设取得长足进步,为信息化全面;D.两化融合成为当前我国工业创新驱动.转型升级;8.下列各项表述中正确的有哪些?ad(多选题3分)得分.0分A.我国中央网络安全和信息化领导小组宣告成立是在2013年。
B.中央网络安全和信息化领导小组组长是习近平。
C.我国中央网络安全和信息化领导小组宣告成立是在2014年。
D.中央网络安全和信息化领导小组组长是李克强;9.云计算的特点包括以下哪些方面?abc(多选题3分)得分.3分A.服务可计算B.高性价比C.服务可租用D.低使用度10.贵州发展大数据的顶层设计是要逐步建成三个中心,即(acd)。
(多选题3分)得分.0分A.大数据人才中心B.大数据金融中心C.大数据内容中心D.大数据服务中心11.大数据作为一种数据集合,当我们使用这个概念的时候,实际包含有哪几层含义?abc (多选题3分)得分.0分A.数据很大B.构成复杂C.变化很快D.蕴含大价值12.大数据的主要特征表现为(abcd)。
大数据考试试题及答案一、选择题(每题2分,共20分)1. 大数据的4V特性不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. HDFSD. Pig答案:C3. 下列哪个选项不是大数据技术?A. 数据挖掘B. 数据清洗C. 机器学习D. 数据库管理答案:D4. 在大数据时代,以下哪个不是数据来源?A. 社交媒体B. 传感器C. 传统数据库D. 人工录入答案:D5. 下列哪个不是大数据的分析工具?A. RB. PythonC. ExcelD. Hadoop答案:C6. 以下哪个不是大数据的典型应用场景?A. 客户行为分析B. 金融欺诈检测C. 天气预报D. 个人隐私保护答案:D7. 在大数据架构中,以下哪个不是数据湖的概念?A. 存储原始数据B. 数据格式多样化C. 数据实时分析D. 数据集中存储答案:C8. 以下哪个不是大数据的挑战?A. 数据安全B. 数据存储C. 数据隐私D. 数据共享答案:D9. 在大数据技术中,以下哪个不是分布式计算框架?A. SparkB. HadoopC. FlinkD. Oracle答案:D10. 下列哪个不是大数据的分析方法?A. 描述性分析B. 预测性分析C. 规范性分析D. 比较性分析答案:D二、填空题(每题2分,共10分)1. 大数据技术可以处理的数据类型包括结构化数据、半结构化数据和______数据。
答案:非结构化2. Hadoop的核心组件包括______和MapReduce。
答案:HDFS3. 在大数据领域,______是一种用于实时数据流处理的框架。
答案:Apache Kafka4. 大数据的分析过程通常包括数据采集、数据存储、______和数据可视化。
答案:数据分析5. 机器学习是大数据技术中的一个重要组成部分,它包括监督学习、无监督学习和______学习。
大数据试题及答案解析一、单选题(每题2分,共10分)1. 大数据的4V特性指的是什么?A. 体积、速度、多样性、价值B. 体积、速度、多样性、可视化C. 体积、速度、可视化、价值D. 体积、多样性、可视化、价值答案:A2. 下列哪个不是大数据的典型应用场景?A. 客户行为分析B. 网络安全监控C. 天气预报D. 个人电脑操作系统答案:D3. Hadoop生态系统中,用于数据存储的是?A. HBaseB. HiveC. FlumeD. HDFS答案:D4. 大数据技术中,用于处理实时数据流的框架是?A. HadoopB. SparkC. KafkaD. HBase答案:C5. 下列哪个不是大数据分析的常见工具?A. RB. PythonC. ExcelD. Hadoop答案:C二、多选题(每题3分,共15分)1. 大数据技术可以应用于以下哪些领域?A. 金融分析B. 医疗健康C. 教育D. 游戏开发答案:A、B、C2. 在大数据处理中,以下哪些技术是常用的?A. 数据挖掘B. 机器学习C. 数据可视化D. 数据清洗答案:A、B、C、D3. 下列哪些是大数据存储技术?A. 数据库B. 文件系统C. 内存计算D. 云存储答案:A、B、D4. 在大数据架构中,以下哪些组件是Hadoop生态系统的一部分?A. HDFSB. HBaseC. SparkD. Kafka答案:A、B5. 大数据中的数据清洗包括哪些步骤?A. 缺失值处理B. 异常值处理C. 数据去重D. 数据转换答案:A、B、C、D三、判断题(每题1分,共5分)1. 大数据技术只能用于处理海量数据。
()答案:错误2. 大数据技术可以提高决策的效率和准确性。
()答案:正确3. 大数据技术不需要考虑数据的安全性。
()答案:错误4. 大数据技术可以完全替代传统的数据分析方法。
()答案:错误5. 大数据技术在处理数据时不需要考虑数据的时效性。
()答案:错误四、简答题(每题5分,共20分)1. 请简述大数据技术在金融领域的应用。
大数据相关题库1、当前大数据技术的基础是由( C)首先提出的。
(单选题,本题2分)A:微软 B:百度 C:谷歌 D:阿里巴巴2、大数据的起源是(C )。
(单选题,本题2分)A:金融 B:电信 C:互联网 D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。
(单选题,本题2分)A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模 B:活性 C:关联度 D:颗粒度5、数据清洗的方法不包括( D)。
(单选题,本题2分)A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表 B:网络爬虫 C:API接口 D:传感器7、下列关于数据重组的说法中,错误的是( A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。
(单选题,本题2分)A:数字城市 B:物联网 C:联网监控 D:云计算9、大数据的最显着特征是( A)。
(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。
(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A )。
(单选题,本题2分)A:互联网 B:物联网 C:综合国力 D:自然资源13、在数据生命周期管理实践中,( B)是执行方法。
(单选题,本题2分)A:数据存储和备份规范 B:数据管理和维护C:数据价值发觉和利用 D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是( C)。
(单选题,本题2分)A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参考C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于计算机存储容量单位的说法中,错误的是( C)。
(单选题,本题2分) A:1KB<1MB<1GB B:基本单位是字节(Byte)C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符,16、下列关于聚类挖掘技术的说法中,错误的是(B )。
(单选题,本题2分)A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B:要求同类数据的内容相似度尽可能小C:要求不同类数据的内容相似度尽可能小D:与分类挖掘技术相似的是,都是要对数据进行分类处理17、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是( D)。
(单选题,本题2分)A:美国 B:日本 C:中国 D:韩国18、下列关于大数据的分析理念的说法中,错误的是(D )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据19、万维网之父是( C)。
(单选题,本题2分)A:彼得·德鲁克 B:舍恩伯格 C:蒂姆·伯纳斯-李 D:斯科特·布朗20、 Mac OS系统的开发者是(C )。
(单选题,本题2分)A:微软公司 B:惠普公司 C:苹果公司 D:IBM公司21、大数据时代,数据使用的关键是( D)。
(单选题,本题2分)A:数据收集 B:数据存储 C:数据分析 D:数据再利用22、下列关于数据交易市场的说法中,错误的是( C)。
(单选题,本题2分)A:数据交易市场是大数据产业发展到一定程度的产物B:商业化的数据交易活动催生了多方参与的第三方数据交易市场C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D:数据交易市场是大数据资源化的必然产物23、下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
(单选题,本题2分)A:互联网金融打破了传统的观念和行为 B:大数据存在泡沫C:大数据具有非常高的成本 D:个人隐私泄露与信息安全担忧24、数据仓库的最终目的是(D )。
(单选题,本题2分)A:收集业务需求 B:建立数据仓库逻辑模型C:开发数据仓库的应用分析 D:为用户和业务部门提供决策支持25、支撑大数据业务的基础是( B)。
(单选题,本题2分)A:数据科学 B:数据应用 C:数据硬件 D:数据人才26、在网络爬虫的爬行策略中,应用最为基础的是(AB )。
(多选题,本题3分)A:深度优先遍历策略 B:广度优先遍历策略C:高度优先遍历策略 D:反向链接策略 E:大站优先策略27、当前,大数据产业发展的特点是(ACE )。
(多选题,本题3分)A:规模较大 B:规模较小 C:增速很快 D:增速缓慢 E:多产业交叉融合28、下列关于数据生命周期管理的核心认识中,正确的是(ABC )。
(多选题,本题3分)A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B:在不同的数据存在阶段,数据的价值是不同的C:根据数据价值的不同应该对数据采取不同的管理策略D:数据生命周期管理旨在产生效益的同时,降低生产成本E:数据生命周期管理最终关注的是社会效益29、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。
答案选C更正(多选题,本题3分)A:传统营销模式比基于大数据的营销模式投入更小B:传统营销模式比基于大数据的营销模式针对性更强C:传统营销模式比基于大数据的营销模式转化率低D:基于大数据的营销模式比传统营销模式实时性更强E:基于大数据的营销模式比传统营销模式精准性更强30、下列关于脏数据的说法中,正确的是( ABCDE)。
(多选题,本题3分)A:格式不规范 B:编码不统一 C:意义不明确 D:与实际业务关系不大E:数据不完整31、数据再利用的意义在于( ABC)。
(多选题,本题3分)A:挖掘数据的潜在价值 B:实现数据重组的创新价值C:利用数据可扩展性拓宽业务领域 D:优化存储设备,降低设备成本E:提高社会效益,优化社会管理32、按照涉及自变量的多少,可以将回归分析分为(CD )。
(多选题,本题3分)A:线性回归分析 B:非线性回归分析 C:一元回归分析D:多元回归分析 E:综合回归分析33、传统数据密集型行业积极探索和布局大数据应用的表现是( BCE)。
(多选题,本题3分)A:投资入股互联网电商行业 B:打通多源跨域数据C:提高分析挖掘能力 D:自行开发数据产品E:实现科学决策与运营34、大数据人才整体上需要具备(ABE )等核心知识。
(多选题,本题3分)A:数学与统计知识 B:计算机相关知识C:马克思主义哲学知识 D:市场运营管理知识E:在特定业务领域的知识35、下列关于大数据的说法中,错误的是(AD )。
(多选题,本题3分)A:大数据具有体量大、结构单一、时效性强的特征B:处理大数据需采用新型计算架构和智能算法等新技术C:大数据的应用注重相关分析而不是因果分析D:大数据的应用注重因果分析而不是相关分析E:大数据的目的在于发现新的知识与洞察并进行科学决策36、在噪声数据中,波动数据比离群点数据偏离整体水平更大。
( F)(判断题,本题2分)是否37、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。
因此,大数据收集的信息量要尽量精确。
( F)(判断题,本题2分)是否38、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。
因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
(T )(判断题,本题2分)是否39、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。
(F )(判断题,本题2分)是否40、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。
( F)(判断题,本题2分)是否41、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。
( T)(判断题,本题2分)是否42、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。
( F)(判断题,本题2分)是否43、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。
在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
( F)(判断题,本题2分)是否44、啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。
(F )(判断题,本题2分)是否45、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
( F)(判断题,本题2分)是否46.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A。
数据规模大 B。
数据类型多样 C。
数据处理速度快D。
数据价值密度高47.下列关于大数据的分析理念的说法中,错误的是(D)A.在数据基础上倾向于全体数据而不是抽样数据B。
在分析方法上更注重相关分析而不是因果分析C。
在分析效果上更追求效率而不是绝对精确D。
在数据规模上强调相对数据而不是绝对数据49.下列关于普查的缺点的说法中,正确的是(A)A.工作量较大,容易导致调查内容有限、产生重复和遗漏现象B。
误差不易被控制C。
对样本的依赖比较强D。
评测结果不够稳定50.下列关于聚类挖掘技术的说法中,错误的是(B)A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。
要求同类数据的内容相似度尽可能小C。
要求不同类数据的内容相似度尽可能小D。
与分类挖掘技术相似的是,都是要对数据进行分类处理51.智慧城市的构建,不包含(C)A.数字城市B。
物联网C。
联网监控D。
云计算52.大数据的起源是(C)A.金融B。