大数据试题及答案
- 格式:doc
- 大小:48.50 KB
- 文档页数:9
大数据财会试题及答案一、单项选择题(每题2分,共20分)1. 大数据技术的核心价值在于()。
A. 数据的存储B. 数据的处理C. 数据的分析D. 数据的可视化答案:C2. 在大数据时代,以下哪个不是数据来源?A. 社交媒体B. 传感器C. 传统数据库D. 纸质文档答案:D3. 大数据的“4V”特性不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D4. 以下哪个不是大数据技术处理数据的常用方法?A. 分布式计算B. 云计算C. 人工智能D. 传统数据库查询答案:D5. 在大数据环境下,以下哪个不是数据挖掘的目的?A. 预测分析B. 聚类分析C. 关联规则学习D. 数据清洗答案:D6. Hadoop生态系统中,以下哪个组件不是用于数据存储的?A. HDFSB. HBaseC. HiveD. Pig答案:D7. 以下哪个不是大数据在财会领域的应用?A. 财务报告分析B. 风险管理C. 客户关系管理D. 产品开发答案:D8. 大数据技术在财会领域的应用不包括以下哪项?A. 提高审计效率B. 优化财务决策C. 减少数据存储成本D. 提升客户服务质量答案:C9. 以下哪个不是大数据技术在财会领域的挑战?A. 数据安全和隐私保护B. 数据质量控制C. 技术人才短缺D. 减少数据存储成本答案:D10. 以下哪个不是大数据技术的优势?A. 处理速度快B. 存储成本低C. 易于数据集成D. 易于数据迁移答案:D二、多项选择题(每题3分,共15分)1. 大数据技术在财会领域的应用包括()。
A. 财务报告分析B. 客户关系管理C. 产品开发D. 风险管理答案:ABD2. 大数据的“4V”特性包括()。
A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Veracity(真实性)答案:ABC3. 在大数据环境下,数据挖掘的目的是()。
大数据试题及答案1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)2、大数据的起源是(C)。
(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D)反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。
(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组可以使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。
(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算9、大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官XXX通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B)。
(单选题,此题2分)A:在数据基础上倾向于部分数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、以下关于XXX对大数据特点的说法中,错误的是(D)。
(单选题,此题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。
大数据试题及答案一、选择题1. 大数据的定义是什么?A. 数据量大B. 数据类型多样C. 数据处理速度快D. 以上答案都正确答案:D2. 大数据的特点包括以下哪些?A. 高速B. 多样C. 值低廉D. 以上答案都正确答案:D3. 大数据的主要应用领域是什么?A. 金融B. 医疗C. 汽车D. 以上答案都正确答案:D4. 大数据技术的核心是什么?A. 数据分析B. 数据存储C. 数据传输D. 以上答案都正确答案:A5. 大数据技术中的Hadoop是指什么?A. 数据存储系统B. 数据处理框架C. 数据传输协议D. 以上答案都正确答案:B二、填空题1. 大数据的“3V”指的是什么?A. 速度、结构、验证B. 速度、多样性、价值C. 速度、规模、价值D. 速度、多样性、验证答案:C2. 大数据处理中常用的编程语言是什么?答案:Python3. 大数据分析常用的统计方法是什么?答案:回归分析4. 大数据技术中的“MapReduce”指的是什么?答案:数据处理模型5. 大数据技术中的“数据挖掘”是指什么?答案:从大量数据中发现隐藏的模式和关联三、简答题1. 请简要介绍大数据的发展历程。
答案:大数据的发展历程可以分为三个阶段。
第一阶段是数据集中存储和处理,通过数据库管理系统来解决大规模数据的存储和处理问题。
第二阶段是数据分布处理,通过并行计算来解决数据量大的问题。
第三阶段是以Hadoop等为代表的分布式计算技术,通过云计算和分布式存储来解决大数据的处理问题。
2. 请简要介绍大数据技术的应用领域。
答案:大数据技术在金融、医疗、电商、物流等领域都有广泛的应用。
在金融领域,大数据可以用于风险评估、交易分析等方面;在医疗领域,大数据可以用于疾病预测、医疗资源分配等方面;在电商领域,大数据可以用于用户行为分析、商品推荐等方面;在物流领域,大数据可以用于路径规划、货物跟踪等方面。
3. 请简要介绍大数据技术的挑战和未来发展方向。
大数据考试试题及答案1. 选择题1) 大数据的关键特征是什么?A. 数据的规模巨大B. 数据的多样性C. 数据的高速产生和流转D. 数据的价值潜力答案:A、B、C、D 全部都是2) 大数据技术的基本架构包括以下哪些层次?A. 数据采集与清洗层B. 数据存储与管理层C. 数据分析与挖掘层D. 数据展示与应用层答案:A、B、C、D 全部都有3) 大数据分析的主要方法包括以下哪些?A. 关联分析B. 聚类分析C. 回归分析D. 时间序列分析答案:A、B、C、D 全部都有2. 填空题1) 大数据的三个V分别代表什么?(简写形式即可)答案:V(Volume)代表数据规模,V(Velocity)代表数据高速产生和流转,V(Variety)代表数据多样性2) 大数据技术的核心是____和____。
答案:存储与计算3) 大数据分析的关键是____和____。
答案:数据挖掘和模型建立3. 简答题1) 请简述大数据的应用领域。
答案:大数据在各行各业都有广泛的应用。
例如,电商领域可以通过大数据分析用户消费行为,进行个性化推荐;物流领域可以利用大数据优化配送路径,提高效率;医疗领域可以通过大数据分析患者病历,辅助疾病诊断等。
2) 大数据分析的方法有哪些?答案:大数据分析的方法包括关联分析、聚类分析、分类与预测、异常检测、文本分析等。
4. 计算题1) 如果一家公司的服务器每天产生1TB(1TB = 1024GB)的数据,假设这些数据需要保存1年,计算一共需要多少存储空间?答案:1TB * 365天 = 365TB2) 某电商网站每天访问量为1000万人次,每个访问用户产生平均10个点击行为数据,假设每条点击行为数据大小为1KB,计算每天需要存储多少数据?答案:1000万人次 * 10个 = 1亿个点击行为数据1亿个 * 1KB = 100TB总结:大数据的考试试题主要包括选择题、填空题、简答题和计算题。
选择题涵盖大数据的特征、技术架构和分析方法。
大数据笔试题试题及答案1、以下哪种操作能够实现实体完整性() [单选题]A、减少数据冗余B、设置唯一键C、设置外键(正确答案)D、设置主键2、关于SecondaryNameNode 哪项是正确的() [单选题]A、它的目的是帮助NameNode合并并编辑日志,减少NameNode启动时间(正确答案)B、它对内存没有要求C、它是NameNode的热备D、SecondaryNameNode应与NameNode部署到一个节点3、更新数据表中的记录用以下哪一项() [单选题]A、UPDATE(正确答案)B、UPDATESC、DELETED、INSERT4、以下哪项不是事务的特性() [单选题]A、唯一性B、原子性C、一致性D、持久性E.可靠性(正确答案)5、返回字符串长度的函数是() [单选题]A、length(正确答案)B、leftC、longD、len6、一个字符串类型的值能存储最大容量是() [单选题]A、1GB、512MB(正确答案)C、128MBD、256MB7、关于DATETIME与TIMESTAMP两种数据类型的描述,错误的是()[单选题]A、 TIMESTAMP可以自动记录当前日期时间B、两者值的范围不一样C、两者占用空间不一样D、两者值的范围一样(正确答案)8、以下语句错误的是() [单选题]A、alter table emp delete column addcolumn;(正确答案)B、alter table emp add column addcolumn int;C、alter table emp modify column addcolumn charD、alter table emp change addcolumn addcolumn int;9、以下表示可变长度字符串的数据类型是() [单选题]A、 VARCHAR(正确答案)B、 TEXTC、 ENUMD、 CHAR10、在Oracle数据库中DROP、DELETELGTRUNCATE不确的说法是() [单选题]A、DROP语句将删除表的结构,不释放表所占用的空间(正确答案)B、TRUNCATE不带查询条件C、DELETE和TRUNCATE只删除表的数据不删除表的结构D、TRUNCATE删除表数据的同时将自动ID置人11、事势是数据库进行的基本工作单位。
大数据趣味问答试题及答案1. 大数据的定义是什么? [单选题] *A. 数据量大(正确答案)B. 数据类型多样C. 数据处理速度快D. 所有以上选项2. 大数据的主要特点不包括以下哪一项? [单选题] *A. 三V特性(Volume、Velocity、Variety)(正确答案)B. 数据质量好C. 数据来源单一D. 价值密度低3. 大数据的应用领域不包括以下哪一项? [单选题] *A. 金融行业(正确答案)B. 医疗健康领域C. 教育行业D. 游戏行业4. 大数据存储技术不包括以下哪一项? [单选题] *A. Hadoop分布式文件系统(HDFS)(正确答案)B. NoSQL数据库C. SQL数据库D. 关系型数据库5. 大数据分析和挖掘的方法包括以下哪些? [单选题] *A. 关联规则挖掘(正确答案)B. 聚类分析C. 分类预测D. 所有以上选项6. 大数据分析工具和平台包括以下哪些? *A. Hive(正确答案)B. Spark(正确答案)C. R语言(正确答案)D. Python(正确答案)大数据是指数据量超过传统数据库处理能力的数据集合。
[单选题] *对(正确答案)错大数据的主要特点包括体量大、速度快和价值高。
[单选题] *对(正确答案)错大数据的应用领域只限于市场营销。
[单选题] *对错(正确答案)大数据技术的主要组成部分包括数据采集和存储、数据处理和分析以及数据可视化和展示。
[单选题] *对(正确答案)错大数据安全和隐私保护的挑战只限于数据泄露。
[单选题] *对错(正确答案)大数据在各行业的应用案例只限于电商推荐系统。
[单选题] *对错(正确答案)大数据对个人隐私的影响只限于可能导致个人信息泄露。
[单选题] *对错(正确答案)大数据的未来发展趋势只限于AI与大数据的融合。
[单选题] *对错(正确答案)谈谈你对生活中大数据技术的看法和感受(字数不可过少) [填空题] *_________________________________。
大数据试题及答案大数据试题及答案第一章:概述⑴什么是大数据?大数据是指规模巨大、复杂多样的数据集合,无法通过传统的数据处理工具进行处理与分析。
⑵大数据的特点有哪些?- 体量大:大数据的规模通常以TB、PB、EB等级进行衡量。
- 多样性:大数据包含结构化数据、半结构化数据和非结构化数据。
- 时效性:大数据的产生和更新速度很快。
- 高速性:大数据的处理需要高速的数据存储和计算能力。
⑶大数据的应用领域有哪些?- 金融行业:大数据可以用于风险控制、反欺诈、客户细分等。
- 零售行业:大数据可以用于商品推荐、库存管理、营销策略等。
- 医疗行业:大数据可以用于疾病诊断、药物研发、患者管理等。
第二章:大数据技术⑴大数据的存储技术- 分布式文件系统:HDFS、Ceph等。
- NoSQL数据库:Redis、MongoDB等。
- 列存储数据库:HBase、Cassandra等。
⑵大数据的计算技术- 分布式计算框架:MapReduce、Spark、Flink等。
- 流式计算框架:Storm、Kafka等。
- 图计算框架:GraphX、Giraph等。
⑶大数据的处理技术- 数据清洗与预处理:数据过滤、去重、缺失值处理等。
- 数据挖掘与分析:关联规则挖掘、聚类分析、预测建模等。
- 可视化与报表:数据可视化工具、报表工具等。
第三章:大数据分析⑴数据采集与清洗- 数据采集:从各种数据源中提取数据,如数据库、日志文件、网络爬虫等。
- 数据清洗:对采集到的数据进行去噪、去重、格式化等处理。
⑵数据存储与管理- 数据存储:将清洗后的数据存储到相应的存储系统中,如HDFS、数据库等。
- 数据管理:对存储的数据进行分类、索引、备份等管理。
⑶数据分析与挖掘- 数据预处理:对存储的数据进行特征选择、降维、标准化等处理。
- 数据建模:通过机器学习算法构建预测模型或分类模型。
- 数据评估:对建模结果进行评估和优化。
第四章:大数据应用案例⑴网络广告推荐系统⑵金融风控系统⑶物流运输优化系统第五章:附件本文档所涉及的附件包括示例代码、数据集、技术文档等,请参考附件部分的内容。
大数据试题及答案1. 选择题:1. 下列哪项不属于大数据的四个"V"特点?A. Volume(数据量大)B. Value(数据价值高)C. Velocity(数据处理速度快)D. Variety(数据类型多样)答案:B. Value(数据价值高)2. 下列哪个不是大数据的常见来源?A. 传感器数据B. 金融交易数据C. 社交媒体数据D. 游戏排行榜数据答案:D. 游戏排行榜数据3. 大数据技术中,下列哪个属于数据存储和处理工具?A. Apache HadoopB. Apache SparkC. TableauD. Python答案:A. Apache Hadoop4. 在大数据处理中,下列哪项不属于数据清洗和预处理的步骤?A. 数据收集B. 数据分析C. 数据转换D. 数据集成答案:B. 数据分析2. 填空题:1. 大数据中,_______ 指的是数据的速率和延迟,即数据的产生和消耗速度之间的平衡。
答案:Velocity(数据处理速度快)2. 大数据技术中,________________ 是一种用于处理大规模数据计算的开源集群处理框架。
答案:Apache Hadoop3. 大数据分析常用的编程语言包括____________ 和____________。
答案:Python 和 R4. 在大数据清洗和预处理过程中,数据转换的步骤包括数据筛选、数据归一化和_____________。
答案:数据聚合3. 简答题:1. 请简述大数据的定义和特点。
答:大数据是指数据量庞大、类型多样、处理速度快且具有高价值的数据集合。
大数据的特点主要可以归纳为四个"V",即Volume(数据量大)、Velocity(数据处理速度快)、Variety(数据类型多样)和Value(数据价值高)。
大数据具有海量的数据量,数据来源广泛,包括传感器数据、社交媒体数据等;处理速度快,需要使用专门的大数据技术和工具进行高效的数据存储、处理和分析;数据类型多样,包括结构化数据和非结构化数据;数据具有高价值,可以帮助企业做出更准确的决策和预测。
大数据试题及答案一、单选题1. 大数据的4V特性不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Validity(有效性)答案:D2. 在大数据分析中,以下哪项技术主要用于数据的存储和管理?A. HadoopB. SparkC. R语言D. SQL答案:A3. 大数据的实时分析通常指的是什么?A. 批量处理数据B. 流式处理数据C. 离线分析数据D. 数据挖掘答案:B4. 下列哪个是大数据分析的典型应用场景?A. 财务报告编制B. 客户行为分析C. 产品成本核算D. 员工绩效评估答案:B5. 在大数据架构中,MapReduce通常用于什么?A. 数据存储B. 数据查询C. 数据处理D. 数据可视化答案:C二、多选题6. 下列哪些是大数据技术生态系统中常见的组件?(多选)A. HadoopB. MongoDBC. HiveD. Cassandra答案:A, C, D7. 在大数据的背景下,以下哪些因素可能对数据隐私和安全构成威胁?(多选)A. 数据泄露B. 不当的数据共享C. 黑客攻击D. 法律监管不足答案:A, B, C, D8. 大数据技术可以帮助企业实现哪些目标?(多选)A. 提高运营效率B. 增强市场竞争力C. 降低成本D. 提升客户满意度答案:A, B, C, D三、判断题9. 所有大数据问题都可以通过单一的大数据技术解决。
(对/错)答案:错10. 大数据技术的发展完全依赖于开源社区。
(对/错)答案:错四、简答题11. 简述大数据技术在医疗健康领域的应用。
答案:大数据技术在医疗健康领域的应用包括疾病预测、个性化医疗、医疗影像分析、临床决策支持、药物研发、患者健康管理等。
通过分析大量的医疗记录和健康数据,可以帮助医生做出更准确的诊断,为患者提供个性化的治疗方案,同时优化医疗资源的分配和使用。
12. 描述一下什么是数据湖以及它在大数据分析中的作用。
大数据考试试题题库500题[含答案]一、选择题1.大数据作为一种数据集合,它的含义包括(acd )。
(多选题3分)得分.3分A.数据很大B.很有价值C.构成复杂D.变化很快2.内存够大,所以集群的瓶颈不可能是 a 和 d3.大数据仅仅是指数据的体量大。
(判断题1分)正确错误1 得分.1分4.下列哪些国家已经将大数据上升为国家战略?abcd(多选题3分)得分.3分A.英国B.日本C.美国D.法国5.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。
(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理6.建立大数据需要设计一个什么样的大型系统?abcd(多选题3分)得分.3分A.能够把应用放到合适的平台上B.能够开发出相应应用C.能够处理数据D.能够存储数据7.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是abcd(多选题3分)得分.3分A.从柜台式管理走向全天候管理B.从粗放化管理走向精细化管理C.从被动反应走向主动预见型管理D.从单兵作战走向联合共享型管理8.20世纪中后期至今的媒介革命,以(acd )的出现为标志。
(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化9.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析10.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测11.贵州发展大数据的“八个一”建议包括(ab;得分.3分;A.制定一个工作计划.建立一个领导机构B.培养 D.中央网络安全和信息化领导小组组长是李克强。
12.下列各项表述中正确的有哪些?ad(多选题3分)得分.0分A.我国中央网络安全和信息化领导小组宣告成立是在2013年。
大数据试题及答案一、选择题1. 大数据的4V特征中,不包括下列哪一项?A. 多样性(Variety)B. 速度(Velocity)C. 可访问性(Veracity)D. 价值(Value)答案:C2. 下列关于Hadoop的描述,哪一项是错误的?A. Hadoop是一个开源的分布式存储和计算平台。
B. Hadoop的核心是HDFS和MapReduce。
C. Hadoop可以处理结构化和非结构化数据。
D. Hadoop无法与其他数据库软件集成。
答案:D3. 在大数据分析中,数据清洗的目的是什么?A. 减少数据量B. 提高数据质量C. 增加数据种类D. 加快数据处理速度答案:B4. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 关联规则学习D. 机器翻译答案:D5. 数据仓库的主要作用是什么?A. 存储实时数据B. 支持决策制定C. 提高数据传输速度D. 加密数据保护答案:B二、填空题1. 大数据环境下,数据的________和________是保证数据安全的重要措施。
答案:加密、访问控制2. 在大数据应用中,________可以帮助企业发现潜在的客户群体和市场趋势。
答案:数据挖掘3. 为了提高数据分析的准确性,通常需要对数据进行________处理。
答案:标准化4. 大数据技术的发展,促进了________和________领域的融合,推动了智能化决策的发展。
答案:信息技术、业务管理5. 数据治理是确保数据________、________和________的关键过程。
答案:准确性、完整性、一致性三、简答题1. 简述大数据的基本概念及其对现代企业的影响。
答案:大数据指的是传统数据处理应用软件难以处理的大规模、高增长率和多样化的数据集合。
它通过高速处理数据,能够揭示隐藏在数据背后的模式、趋势和关联,对现代企业的影响主要体现在提高了决策效率、优化了客户服务、增强了市场竞争力等方面。
2. 描述数据仓库和大数据平台之间的区别。
大数据处理与分析考试试题及答案一、选择题1. 大数据的定义是以下哪一项?A. 数据量超过1TB的数据B. 数据量超过100TB的数据C. 数据量超过1PB的数据D. 数据量超过1EB的数据答案:C. 数据量超过1PB的数据2. 大数据处理的特点是以下哪一项?A. 数据量大B. 处理速度快C. 数据种类繁多D. 数据质量高答案:A. 数据量大3. 下列哪项属于大数据处理的挑战?A. 存储问题B. 安全问题C. 隐私问题D. 数据质量问题答案:B. 安全问题4. Hadoop是以下哪一个大数据处理框架的代表?A. Apache SparkB. Apache CassandraC. MapReduceD. Apache Kafka答案:C. MapReduce5. 大数据分析的目的是以下哪一项?A. 提高数据存储能力B. 增加数据处理速度C. 发现潜在的业务机会D. 优化数据传输效率答案:C. 发现潜在的业务机会二、填空题1. 关系数据库一般使用______作为数据查询语言。
(SQL)2. 数据治理是保证数据______、______、______和______的一种管理方式。
(准确性、可用性、完整性、安全性)3. 在大数据处理中,______是指对数据进行有效的汇总和调整,以适应分析或查询的需要。
(数据聚合)4. ______是一种数据存储和访问模式,能够有效地存储和查询大规模分布式数据。
(分布式文件系统)5. 大数据分析的常用技术包括______、______和______等。
(机器学习、数据挖掘、自然语言处理)三、简答题1. 请简述大数据处理的四个V特点。
答:大数据处理的四个V特点分别是:Volume(数据量大)、Velocity(处理速度快)、Variety(数据种类繁多)和Value(价值密度低)。
Volume表示大数据的特点是数据量巨大,超出了传统数据库的处理能力;Velocity表示大数据处理需要在短时间内进行高速处理;Variety表示大数据包括结构化数据、非结构化数据和半结构化数据等多种数据类型;Value表示大数据中包含了大量的背景信息和潜在的商业价值。
大数据期末试题及答案一、选择题1. 大数据的含义是指:a) 数据规模大于1TBb) 数据类型多样且规模庞大c) 数据存储在云服务器中d) 数据加密处理答案:b) 数据类型多样且规模庞大2. 大数据的处理技术包括以下哪些方面?a) 数据采集与存储b) 数据清洗与预处理c) 数据分析与挖掘d) 数据可视化与展示e) 全部答案都对答案:e) 全部答案都对3. Hadoop是一种用于处理大数据的开源框架,它包括以下哪些组件?a) HDFSb) MapReducec) HBased) Hivee) 全部答案都对答案:e) 全部答案都对4. 大数据技术对于企业的好处主要体现在哪些方面?a) 增加数据存储成本b) 提高数据处理速度c) 支持实时数据分析d) 减少数据安全风险答案:b) 提高数据处理速度c) 支持实时数据分析5. 关于大数据隐私保护的说法,哪个是正确的?a) 大数据不需要进行隐私保护b) 大数据隐私保护不受法律法规限制c) 大数据处理过程中必须保护用户隐私d) 大数据隐私保护仅限于企业内部答案:c) 大数据处理过程中必须保护用户隐私二、简答题1. 大数据处理的挑战有哪些?请简要描述其中一项挑战及应对措施。
答案:大数据处理挑战包括数据规模庞大、数据质量不一致、数据安全与隐私保护等方面。
其中,数据安全与隐私保护是一个重要的挑战。
大数据包含大量敏感信息,如个人隐私、商业机密等,如果未经妥善保护,会导致用户数据泄露、企业声誉受损等问题。
应对这一挑战,企业可以采取数据加密技术、访问控制策略、安全审计等手段来保护数据安全与隐私。
2. 请简要介绍Hadoop的基本原理。
答案:Hadoop的基本原理是将大规模数据分布式存储和并行处理。
它采用了分布式文件系统HDFS(Hadoop Distributed File System)来存储数据,将数据分割成多个块,并分布在多个节点上进行存储。
同时,Hadoop使用MapReduce编程模型来进行数据处理,将数据划分成多个小任务,在集群中并行计算,最后将结果合并返回。
1+x大数据试题+参考答案一、单选题(共80题,每题1分,共80分)1、关于Sqoop数据的导入导出描述不正确的是?()A、实现从MySQL到Hive的导入导出B、实现从MySQL到Oracle的导入导出C、实现从HDFS到Oracle的导入导出D、实现从HDFS到MySQL的导入导出正确答案:B2、关于ZooKeeper临时节点的说法正确的是?()A、创建临时节点的命令为:create -s /tmp myvalueB、临时节点允许有子节点C、一旦会话结束,临时节点将被自动删除D、临时节点不能手动删除正确答案:C3、下列关于调度器的描述不正确的是?()A、先进先出调度器可以是多队列B、容器调度器其实是多个FIFO队列C、公平调度器不允许管理员为每个队列单独设置调度策略D、先进先出调度器以集群资源独占的方式运行作业正确答案:A4、Hive 适合()环境A、Hive 适合关系型数据环境B、Hive 适合用于联机(online)事务处理C、适合应用在大量不可变数据的批处理作业D、提供实时查询功能正确答案:C5、下列哪些不是 ZooKeeper 的特点()A、可靠性B、顺序一致性C、多样系统映像D、原子性正确答案:C6、tar 命令用于对文件进行打包压缩或解压,-t 参数含义()A、查看压缩包内有哪些文件B、创建压缩文件C、向压缩归档末尾追加文件D、解开压缩文件正确答案:A7、下列哪些不是 HBase 的特点()A、高可靠性B、高性能C、面向列D、紧密性正确答案:D8、把公钥追加到授权文件的命令是?()A、ssh-addB、ssh-copy-idC、ssh-keygenD、ssh正确答案:B9、HDFS有一个gzip文件大小75MB,客户端设置Block大小为64MB。
当运行mapreduce任务读取该文件时input split大小为?A、64MBB、75MBC、一个map读取64MB,另外一个map读取11MB正确答案:B10、大数据平台实施方案流程中,建议整个项目过程顺序是()。
大数据考试试题及答案一、选择题1. 以下哪项不是大数据的特点?A. 体量大B. 多样性C. 速度快D. 存储方式单一答案:D2. 下列哪种技术不属于大数据处理的常用技术?A. HadoopB. SparkC. MySQLD. Flink答案:C3. 大数据处理中,哪种技术适合处理流式数据?A. HadoopB. SparkC. FlinkD. Hive答案:C4. 下列哪种操作属于数据清洗的过程?A. 去重B. 数据压缩C. 数据备份D. 数据加密答案:A5. 以下哪种技术适合进行数据可视化?A. TableauB. HadoopC. KafkaD. Storm答案:A二、填空题1. 大数据的四个V分别是()、()、()、()。
答案:Volume、Velocity、Variety、Value2. 大数据技术中用来实现实时流式计算的框架是()。
答案:Flink3. 大数据处理中常用的存储系统有()和()。
答案:HDFS、HBase4. 数据清洗的过程通常包括数据去重、数据转换和()。
答案:数据过滤5. 在大数据处理中,用于数据交互的消息队列系统有()和()。
答案:Kafka、RabbitMQ三、简答题1. 请简要说明大数据的定义及其应用领域。
答:大数据是指体量巨大、处理速度快且包含多样性数据的信息资产。
大数据的应用领域包括但不限于金融、医疗、营销和科学研究等领域。
2. 请说明大数据处理中的数据清洗过程的重要性及具体步骤。
答:数据清洗是大数据处理中的关键步骤,其重要性在于保证数据的准确性和可靠性。
数据清洗的具体步骤包括数据去重、数据转换、数据过滤等。
3. 请简要介绍大数据处理中常用的数据可视化工具及其作用。
答:常用的数据可视化工具包括Tableau、Power BI等,其作用是将大数据处理后的结果以图表形式直观展现,帮助用户更好地理解数据和分析结果。
以上为大数据考试试题及答案,请考生认真作答。
祝各位考生顺利通过考试!。
大数据试题及答案一、单选题1. 大数据的定义是指:A. 数据量很大B. 数据类型很多C. 数据处理速度很快D. 以上都是答案:D. 以上都是2. 大数据的特点不包括:A. 高速性B. 高可靠性C. 高一致性D. 高稳定性答案:C. 高一致性3. 大数据的价值主要体现在哪些方面?A. 经济价值B. 科学价值C. 社会价值D. 以上都是答案:D. 以上都是4. 下列哪个不属于大数据的四V特性?A. 速度B. 体积C. 价值D. 多样性答案:C. 价值5. 大数据对企业的意义主要体现在哪些方面?A. 帮助决策B. 提升效益C. 优化服务D. 以上都是答案:D. 以上都是二、多选题1. 对于大数据的应用,以下哪些属于典型场景?A. 电商推荐系统B. 金融风控C. 医疗诊断D. 农业监测答案:A. 电商推荐系统 B. 金融风控 C. 医疗诊断 D. 农业监测2. 大数据技术主要包括以下哪些方面?A. 数据挖掘B. 机器学习C. 云计算D. 分布式计算答案:A. 数据挖掘 B. 机器学习 C. 云计算 D. 分布式计算3. 大数据的应用领域主要包括以下哪些?A. 金融行业B. 医疗行业C. 教育行业D. 娱乐行业答案:A. 金融行业 B. 医疗行业 C. 教育行业 D. 娱乐行业4. 大数据的生命周期包括以下哪些阶段?A. 数据收集B. 数据存储C. 数据分析D. 数据展示答案:A. 数据收集 B. 数据存储 C. 数据分析 D. 数据展示5. 大数据的隐私保护措施主要包括以下哪些?A. 数据脱敏B. 数据加密C. 访问控制D. 数据备份答案:A. 数据脱敏 B. 数据加密 C. 访问控制三、简答题1. 大数据技术的发展对社会带来了哪些影响?大数据技术的发展对社会带来了广泛的影响。
首先,大数据技术可以帮助企业提升效益,优化决策,实现智能化管理。
其次,大数据技术在医疗、金融、教育等领域的应用,可以提升服务质量,改善用户体验。
大数据安全考试试题及答案第一部分:选择题1. 大数据安全的定义是什么?A. 使用大数据分析解决安全问题B. 保护大规模数据存储和处理系统的安全性C. 维护大数据的完整性和机密性D. 防止大数据被非授权访问和篡改答案:B. 保护大规模数据存储和处理系统的安全性2. 大数据安全的主要威胁是什么?A. 数据泄露B. 数据丢失C. 未经授权的访问D. 数据篡改答案:A. 数据泄露3. 大数据安全的基础是什么?A. 加密技术B. 访问控制C. 安全存储D. 安全传输答案:B. 访问控制4. 以下哪项是大数据安全的最佳实践?A. 定期备份数据B. 使用强密码和多因素认证C. 限制对数据的访问权限D. 加密所有敏感数据传输答案:C. 限制对数据的访问权限第二部分:简答题1. 请简要描述大数据安全的风险和挑战。
大数据安全的风险和挑战主要包括:- 数据泄露:大数据中包含大量敏感信息,一旦泄露可能导致严重的后果。
- 数据丢失:大规模数据存储和处理系统面临着硬件故障和自然灾害等风险,需要采取措施进行备份和恢复。
- 未经授权的访问:恶意用户可能试图获取未经授权的访问权限,并以此为基础进行各种攻击。
- 数据篡改:对于大数据系统,数据的完整性至关重要。
未经授权的篡改可能导致错误的分析结果和决策。
2. 请列举几种保护大数据安全的措施。
保护大数据安全的措施包括:- 访问控制:根据用户的身份和角色,限制对数据的访问权限,确保只有授权用户可以访问。
- 数据加密:对敏感数据进行加密,以防止非授权用户在数据传输或存储过程中获取敏感信息。
- 安全存储:使用具有高度可靠性和冗余机制的存储系统,以防止数据丢失。
- 安全传输:通过使用安全协议和加密技术,确保在数据传输过程中的机密性和完整性。
- 监测和审计:实时监测和记录数据访问和操作,以便快速检测和应对安全事件。
第三部分:案例分析最近发生了一起大数据泄露事件,导致公司的客户信息被不法分子获取并滥用的情况。
大数据试题及答案第1题,联通大数据产业解决方案中,DDS的意思是指?(1.0分)*[单选题]*A、政务驱动服务B、数据驱动服务(正确答案)C、数据处理服务D、数据改进服务第2题,与运营商数据相比,政府数据的体量和维度更偏向于下面哪一种?(1.0分)*[单选题]*A、大致相等B、小C、更大(正确答案)D、极少第3题,政务行业大数据解决方案中,以下哪项不是市场监管部门的关注点?(1.0分)*[单选题]*A、识别监管对象真实身份B、查找监管对象经营地点C、掌控监管对象经营行为D、掌握市场主体的社保缴纳情况(正确答案)第4题,政务行业大数据对于社会治理大数据分析模块不包括哪项功能?(1.0分)*[单选题]*A、人口热力分析B、人口结构分析[单选题]*C 、人口来源分析D 、政府办公(正确答案)第5题,联通大数据社会治理系统数据来源没有哪项?(1.0分)* A 、政府B 、运营商C 、银行(正确答案)D 、物联网第6题,人口大数据标签数量大约有多少个?(1.0分)*[单选题]A 、3800+(正确答案)B 、2000+C 、1000+D 、500+第7题,以下不是人口大数据优势的是哪个?(1.0分)*[单选题]A 、无感知采集B 、全生命周期C 、全国集中D 、通知用户采集(正确答案)第8题,人口大数据中如何判定户籍所在地?(1.0分)*[单选题]A 、身份证前六位B 、春节路径C 、每日工作路径(正确答案)D 、常驻地位置第9题,人口大数据目前还不能实现的场景是哪一个?(1.0分)*[单选题]*A、人口统计B、人口监测C、人口评估D、人员比对(正确答案)第10题,人口大数据的集中程度目前是实现了什么集中?(1.0分)*[单选题]*A、全国集中(正确答案)B、部分集中C、省级集中D、市级集中第11题,药品溯源大数据中,对于食药监管的核心是什么?(1.0分)*[单选题]*A、全(正确答案)B、大C、广D、严第12题,克强总理提到:百分之多少的数据掌握在政府手中(1.0分)*[单选题]*A、0.2B、0.6C、0.8(正确答案)D、0.5第13题,2020年大数据产业规模将超多少亿的规模?(1.0分)*[单选题]*A、百亿B、万亿(正确答案)C、千亿第14题,下面哪一个不是文旅大数据方案产品所直接面向的客户?(1.0分)*[单选题]*A、文旅厅B、博物馆C、游客(正确答案)D、景区第15题,下列哪一类洞察是基于联通DPI数据,分析互联网APP、网站、微博、微信公众号等开展的?(1.0分)*[单选题]*A、终端洞察B、互联网洞察(正确答案)C、区域洞察D、人口洞察第16题以下不是联通APP洞察产品主要受众的是:(1.0分)*[单选题]*A、互联网企业B、投资机构C、咨询公司D、政府机构(正确答案)第17题,以下不属于标准化SaaS数赢洞察的产品优势(1.0分)*[单选题]*A、中小企业为主,成本低B、业务流程简单,使用方便C、即开即用、省时高效D、只提供定制化服务(正确答案)A、lookalikeB 、人群属性定向C 、重定向人群(正确答案)D 、自定义投放第18题,朋友圈广告投放数据报表不能提供哪项指标?(1.0分)*[单选题]*A、公众号关注数量B、公众号文章转发数量C、广告点击数量D、公众号内部访问时长(正确答案)第19题,广告产品更适合服务于下列哪类客户?(1.0分)*[单选题]*A、寻求针对目标人群的精准投放B、预算大,潜客定向窄,注重销售转化效果C、有预算,定向范围较大,注重品牌宣传(正确答案)D、预算大,但客户没有素材和落地页第20题,朋友圈广告投放中,最常见的图片尺寸为下列哪个?(1.0分)*[单选题]*A、800*450(正确答案)B、900*450C、400*550D、850*630第21题,可以根据点击过广告的人群进行重新投放的功能被称为什么?(1.0分)*[单选题]*第22题,数睿广告不能定向的人群是下列哪一个?(1.0分)*[单选题]*A、大连市的人群B、中小学老师(正确答案)C、25-45女性D、爱好金融、房产的男性第23题,在广告投放时候,联通大数据支撑朋友圈广告2分钟内反复刷5次,算作几次曝光?(1.0分)*[单选题]*A、2B、1(正确答案)C、3D、5第24题,数睿广告产品中,朋友圈订单的起充金额为?(1.0分)*[单选题]*A、1000B、2000C、1万D、5000(正确答案)第25题,下列有关数睿广告适用场景,最准确的说法是?(1.0分)*[单选题]*A 、品牌推广为主,效果为辅(正确答案)B 、效果转化为主,品牌推广为辅C 、品牌宣传D、效果ROI转化第26题,营销平台失联复联加密方式(1.0分)*[单选题]*A、MD5(16位小写)B、MD5(16位大写)C、MD5(32位小写)D、MD5(32位大写)(正确答案)第27题,数字营销产品优势表述正确的是?(1.0分)*[单选题]*A、数据集中、画像全面、一站式服务、多租户模式、多渠道渠道(正确答案)B、数据集中、画像全面、一站式服务C、一站式服务、多租户模式、多渠道渠道、安全性D、画像全面、一站式服务、多租户模式、多渠道渠道第28题,联通大数据数睿广告产品中,朋友圈渠道推广的订单,可以不具备哪一项?(1.0分)*[单选题]*A、开通微信公众号B、具备对应的行业资质C、客户有自己的小程序(正确答案)D、公众号开通广告主功能第29题,联通大数据产品中,线上广告可投放的行业,不包括以下哪个?(1.0分)*[单选题]*A、医疗(正确答案)B、房产C、母婴D、教育第30题,数盾风控产品提供征信验证和风险评估服务,以及全方位的风控解决方案的前提是:(1.0分)*[单选题]*A、充分保障用户隐私安全(正确答案)B、充分保障数据全面C、避免损失D、及时响应第31题,下面选项中,属于大数据数言预警模式的是:(1.0分)*[单选题]*A、人工预警和智能预警(正确答案)B、人工预警C、智能预警D、手动预警第32题,大数据产品优势中,下面对于数据能力采集处理快描述错误的是:(1.0分)*[单选题]*A、每毫秒10万组词逻辑匹配(正确答案)B、每秒钟高速流式大数据处理10万篇文章C、每分钟2200万贴吧全扫描D、每日去重原创信息采集近1.5亿第33题,联通大数据产品体系中,下面不是数言舆情产品的优势的是:(1.0分)*[单选题]*A、复杂(正确答案)B、安全C、全面D、快速第34题,一般情况下,能力开放平台提供的数据均为生产平台的哪一类数据?(1.0分)*[单选题]*A、真实明文数据B、真实脱敏数据(正确答案)C、伪造明文数据D、伪造脱敏数句第35题,客户可以通过开通以下哪个权限,从而能够自主地在能力开放平台上传数据?(1.0分)*[单选题]*A、CRTB、APIC、FTP(正确答案)D、VPN第36题,以下字段中,能力开放平台不会脱敏处理的字段是哪个?(1.0分)*[单选题]*A、手机号B、IMEI号C、在网时长(正确答案)D、经纬度信息第37题,能力开放平台以多租户的方式进行管理运营,各租户之间数据资源,网络、计算资源如何相互规划,保证各合作伙伴的资源使用稳定及其模型资产安全。
大数据考试试题及答案1、在HBase写数据的业务逻辑实现过程中,如下哪个接口或类是不需要涉及的?* [单选题] *A、 PutB、HTableC、HBaseAdmin(正确答案)D、PutList2、在MapReduce的应用程序开发中,下列哪个JAVA类负责管理和运行一个计算任务? * [单选题] *A、 Job(正确答案)B、ContextC、FileSystemD、Configuration3、 FusionInsightHD中,Oozie在提交作业前需要先上传本作所依赖配置文件和jar 包到HDFS。
* [单选题] *A、正确(正确答案)B、错误4、在FusionInsightHD产品中,关于Kafka安全和非安全端口描述错误的是?(注:旧API是指旧ProducerAPI和ConsumerAPI。
其中,旧ConsumerAPI:是指Kafka.consumer ConsumerConnector中定义的接口;旧ProducerAPI:是指Kafka.producer.Producer定义的接口。
) [单选题] * [单选题] *A、 Kafka集群安全访问端口默认为21007,非安全访问端口默认为21005B、旧API通过21005端口访问某个Topic的前提是:服务端参数allow.everyone.if.no.ac1.found设置为ture,且此Topic未设置ACL属性C、旧API仅支持访问21005端口;新API兼容访问非安全端口21007D、对于设置了ACL的Topic,可以使用旧API连接21005端口进行访问(正确答案)5、以下哪些方法可以生成DStream对象? * *A、KafkaUtils.createStream(…)(正确答案)B、KafkaUtils.createDirectStream(…)(正确答案)C、StreamingContext.socketStream(…)(正确答案)D、StreamingContext.fileStream(…)(正确答案)6、 FusionInsightHD系统中,关于Hive提供的文件格式,哪个不是列式文件? * [单选题] *A、 CRCB、ParquetC、RCfileD、TextFile(正确答案)7、 FusionInsightHD中,对Solr各类资源的创建和读写权限使用,以下说法错误的是? * [单选题] *A、 Solr用户组用户可以创建配置集,并在创建Collection时指定该配置集(正确答案)B、 Solr用户组的用户可以创建CollectionC、 Collection创建者、对该Collection具有读写权限角色以及Solradmin角色可以对Collection进行更新D、只有Collection创建者和Solradmin角色可以删除Collection8、在Spark中,以下哪项是DataFrame取交集的算子? * [单选题] *A、 filter(condifionExpr:String):DataFrameB、 join(right:DataFrame,joinExprs:Column):DataFrameC、 intersect(other:DataFrame):DataFrame(正确答案)D、 dropDuplicates():DataFrame9、通过HBase的createTable方法创建一张表,必须传入的参数有? * [单选题] *A、表名B、表名和别名C、表名和列名(正确答案)D、可以为空10、 HDFS客户所在的节点的系统时间与FusionInsightHD集群的系统时间要保持一致,若有时间差,那么时间差应小于几分钟? * [单选题] *A、5(正确答案)B、10C、20D、3011、在Fiume级联传输程中,可以使用failover模式传输,这样如果下一Flume节点故障或者数据接受异常时,可以自动切换到另外一路上继续传输。
1、当前大数据技术的基础是由( C)首先提出的。
(单选题,本题2分)A:微软 B:百度 C:谷歌 D:阿里巴巴2、大数据的起源是(C )。
(单选题,本题2分)A:金融 B:电信 C:互联网 D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。
(单选题,本题2分)A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模 B:活性 C:关联度 D:颗粒度5、数据清洗的方法不包括( D)。
(单选题,本题2分)A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表 B:网络爬虫 C:API接口 D:传感器7、下列关于数据重组的说法中,错误的是( A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。
(单选题,本题2分)A:数字城市 B:物联网 C:联网监控 D:云计算9、大数据的最显著特征是( A)。
(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。
(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A )。
(单选题,本题2分)A:互联网 B:物联网 C:综合国力 D:自然资源13、在数据生命周期管理实践中,( B)是执行方法。
(单选题,本题2分)A:数据存储和备份规范 B:数据管理和维护C:数据价值发觉和利用 D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是( C)。
(单选题,本题2分)A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参考C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于计算机存储容量单位的说法中,错误的是( C)。
(单选题,本题2分)A:1KB<1MB<1GB B:基本单位是字节(Byte)C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符,16、下列关于聚类挖掘技术的说法中,错误的是(B )。
(单选题,本题2分)A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B:要求同类数据的内容相似度尽可能小C:要求不同类数据的内容相似度尽可能小D:与分类挖掘技术相似的是,都是要对数据进行分类处理17、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是( D)。
(单选题,本题2分)A:美国 B:日本 C:中国 D:韩国18、下列关于大数据的分析理念的说法中,错误的是(D )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据19、万维网之父是( C)。
(单选题,本题2分)A:彼得·德鲁克 B:舍恩伯格 C:蒂姆·伯纳斯-李 D:斯科特·布朗20、 Mac OS系统的开发者是(C )。
(单选题,本题2分)A:微软公司 B:惠普公司 C:苹果公司 D:IBM公司21、大数据时代,数据使用的关键是( D)。
(单选题,本题2分)A:数据收集 B:数据存储 C:数据分析 D:数据再利用22、下列关于数据交易市场的说法中,错误的是( C)。
(单选题,本题2分)A:数据交易市场是大数据产业发展到一定程度的产物B:商业化的数据交易活动催生了多方参与的第三方数据交易市场C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D:数据交易市场是大数据资源化的必然产物23、下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
(单选题,本题2分)A:互联网金融打破了传统的观念和行为 B:大数据存在泡沫C:大数据具有非常高的成本 D:个人隐私泄露与信息安全担忧24、数据仓库的最终目的是(D )。
(单选题,本题2分)A:收集业务需求 B:建立数据仓库逻辑模型C:开发数据仓库的应用分析 D:为用户和业务部门提供决策支持25、支撑大数据业务的基础是( B)。
(单选题,本题2分)A:数据科学 B:数据应用 C:数据硬件 D:数据人才26、在网络爬虫的爬行策略中,应用最为基础的是(AB )。
(多选题,本题3分)A:深度优先遍历策略 B:广度优先遍历策略C:高度优先遍历策略 D:反向链接策略 E:大站优先策略27、当前,大数据产业发展的特点是(ACE )。
(多选题,本题3分)A:规模较大 B:规模较小 C:增速很快 D:增速缓慢 E:多产业交叉融合28、下列关于数据生命周期管理的核心认识中,正确的是(ABC )。
(多选题,本题3分)A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B:在不同的数据存在阶段,数据的价值是不同的C:根据数据价值的不同应该对数据采取不同的管理策略D:数据生命周期管理旨在产生效益的同时,降低生产成本E:数据生命周期管理最终关注的是社会效益29、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。
答案选C更正选题,本题3分)A:传统营销模式比基于大数据的营销模式投入更小B:传统营销模式比基于大数据的营销模式针对性更强C:传统营销模式比基于大数据的营销模式转化率低D:基于大数据的营销模式比传统营销模式实时性更强E:基于大数据的营销模式比传统营销模式精准性更强(多30、下列关于脏数据的说法中,正确的是( ABCDE)。
(多选题,本题3分)A:格式不规范 B:编码不统一 C:意义不明确 D:与实际业务关系不大 E:数据不完整31、数据再利用的意义在于( ABC)。
(多选题,本题3分)A:挖掘数据的潜在价值 B:实现数据重组的创新价值C:利用数据可扩展性拓宽业务领域 D:优化存储设备,降低设备成本E:提高社会效益,优化社会管理32、按照涉及自变量的多少,可以将回归分析分为(CD )。
(多选题,本题3分)A:线性回归分析 B:非线性回归分析 C:一元回归分析D:多元回归分析 E:综合回归分析33、传统数据密集型行业积极探索和布局大数据应用的表现是( BCE)。
(多选题,本题3分) A:投资入股互联网电商行业 B:打通多源跨域数据C:提高分析挖掘能力 D:自行开发数据产品E:实现科学决策与运营34、大数据人才整体上需要具备(ABE )等核心知识。
(多选题,本题3分)A:数学与统计知识 B:计算机相关知识C:马克思主义哲学知识 D:市场运营管理知识E:在特定业务领域的知识35、下列关于大数据的说法中,错误的是(AD )。
(多选题,本题3分)A:大数据具有体量大、结构单一、时效性强的特征B:处理大数据需采用新型计算架构和智能算法等新技术C:大数据的应用注重相关分析而不是因果分析D:大数据的应用注重因果分析而不是相关分析E:大数据的目的在于发现新的知识与洞察并进行科学决策36、在噪声数据中,波动数据比离群点数据偏离整体水平更大。
( F)(判断题,本题2分)是否37、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。
因此,大数据收集的信息量要尽量精确。
( F)(判断题,本题2分)是否38、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。
因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
(T )(判断题,本题2分)是否39、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。
(F )(判断题,本题2分)是否40、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。
( F)(判断题,本题2分)是否41、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。
( T)(判断题,本题2分)是否42、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。
( F)(判断题,本题2分)是否43、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。
在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
( F)(判断题,本题2分)是否44、啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。
(F )(判断题,本题2分)是否45、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
( F)(判断题,本题2分)是否46.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A。
数据规模大 B。
数据类型多样 C。
数据处理速度快D。
数据价值密度高47.下列关于大数据的分析理念的说法中,错误的是(D)A.在数据基础上倾向于全体数据而不是抽样数据B。
在分析方法上更注重相关分析而不是因果分析C。
在分析效果上更追求效率而不是绝对精确D。
在数据规模上强调相对数据而不是绝对数据49.下列关于普查的缺点的说法中,正确的是(A)A.工作量较大,容易导致调查内容有限、产生重复和遗漏现象B。
误差不易被控制C。
对样本的依赖比较强D。
评测结果不够稳定50.下列关于聚类挖掘技术的说法中,错误的是(B)A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。
要求同类数据的内容相似度尽可能小C。
要求不同类数据的内容相似度尽可能小D。
与分类挖掘技术相似的是,都是要对数据进行分类处理51.智慧城市的构建,不包含(C)A.数字城市B。
物联网C。
联网监控D。
云计算52.大数据的起源是(C)A.金融B。
电信C。