当前位置:文档之家› HCIA大数据试题库及答案

HCIA大数据试题库及答案

HCIA大数据试题库及答案
HCIA大数据试题库及答案

HCIA大数据试题库及答案

1. 下列选项中无法通过大数据技术实现的是?()

A. 商业模式发现

B.信用评估

C.商品推荐

D.运营分析

【正确答案】

2. FusionInsight Manager 的主要功能有以下哪些?()

A.数据集成

B.系统管理

C.安全管理【正确答案】

D.服务治理【正确答案】

【正确答案】

3. 假设每个用户最低资源保障设置为 yarn ,scheduler , capacity , root ,

QueueA.minimum-user-limit-percent=24。则以下说法错误的是?()

A.第 3 个用户提交任务时,每个用户最多获得 33.33%的资源

B.第 2 个用户提交任务时,每个用户最多获得 50%的资源

C.第 4 个用户提交任务时,每个用户最多获得 25%的资源

D.第 5 个用户提交任务时,每个用户最多获得 20%的资源

【正确答案】

4. 华为大数据解决方案中平台架构包括以下哪些组成部分?()

A.Hadoop 层

B.FusioInght Manager【正确答案】

C.GaussDB 200

D.DataFram【正确答案】

【正确答案】

5. Spark 自带的资源管理框架是?()

A.Stand alone

B.Mesos

C.YARN

D.Docker

【正确答案】

6. 关于 RDD,下列说法错误的是?()

A.RDD 具有血统机制(Lineage)

B.RDD 默认存储在磁盘

C.RDD 是一个只读的,可分区的分布式数据集

D.RDD 是Spark 对基础数据的抽象

【正确答案】

7. 关于 Spark SQL&Hive 区别与联系,下列说法正确的是?

()

A.Spark SQL 依赖 Hive 的元数据

B.Spark SQL 的执行引擎为 Spark core,Hive 默认执行引擎为MapReduce

C.Spark SQL 不可以使用 Hive 的自定义函数【正确答案】

D.Spark SQL 兼容绝大部分 Hive 的语法和函数【正确答案】

【正确答案】

8. 在FusionInsight 集群中,Spark 主要与以下哪些组件进行交互?()

A.HDFS

B.YARN【正确答案】

C.Hive

D.ZooKeeper【正确答案】

【正确答案】

9. 关于 Hive 在FusionInsight HD 中的架构描述错误的是?()

A.只要有一个 HiveServer 不可用,整个 Hive 集群便不可用

B.MotaStore 用于提供元数据服务,依赖于 DBService

C.在同一时间点,HiveServer 只要一个处于 Active 状态,另一个则处于 Standby 状态

D.HiveServer 负责接收客户端请求.解析.执行 HQL 命令并返回查询结果

【正确答案】

10.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsight Hive 中,可以指定表数据的输入和输出格式处理。()

A.TRUE

B.FALSE

【正确答案】

11. 以下关于 HBase 中HMaster 的功能描述哪些是正确的?()

A.Region 负载均衡,Region 分裂以及分裂后的 Region 分配

B.负责建表/修改表/删除表【正确答案】

C.负责 RegionServer 的负载均衡【正确答案】

D.RegionServer 失效后的 Region 迁移【正确答案】

【正确答案】

12. Nimbus 在Streaming 架构中的功能包括?()

A.监控任务执行状态

B.任务调度【正确答案】

C.启动/关闭工作进程

D.资源分配【正确答案】

【正确答案】

13. Topology 在任务完成后会自动结束运行。()

A.TRUE

B.FALSE

【正确答案】

14. 下面关于 flink 窗口的描述错误的是()

A.滚动窗口在时间上是重叠的

B.滚动窗口在时间上是不重叠的

C.滑动动窗口之间时间点不存在重叠【正确答案】

D.滑动窗口之间时间点存在重叠

【正确答案】

15. 在FusionInsight Manager 界面中,对 Loader 的操作不包括下列哪个选项?()

A.切换 Loader 主备节点

B.启动 Loader 实例

C.配置 Loader 参数

D.查看 Loader 服务状态

【正确答案】

16. 创建 Loader 作业中,可以在以下哪个步骤中设置过滤器类型?()

A.输入设置

B.转换

C.基本信息

D.输出

【正确答案】

17. 以下哪些数据源可以通过 Loader 实现与 FusionInght HD 的数据交换?()

A.NoSQL

B.FTP Server【正确答案】

C.SFTP Server【正确答案】

D.MySQL【正确答案】

【正确答案】

18. Kafka 日志的清理方式有两种:delete 和compact。默认值是 delete。()

A.TRUE

B.FALSE

【正确答案】

19. kafka-cluster mirroring 工具可以实现以下那些功能?()

A.kafka 集群数据同步方案

B.kafka 单集群内数据备份

C.kafka 单集群内数据恢复

D.以全部不对

【正确答案】

20. fusioninsight HD 产品中,一个典型的 kafka 集群包含若干个 producer 若干个consummer 和一个 zookeeper 集群? ()

A.true

B.false

【正确答案】

21. ZKFC 进程部署在 hdfs 中的以下那个节点上?()

A.active namenode

B.standby namenode【正确答案】

C.datanode

D.以上全部不对

【正确答案】

22. 以下关于 Kafka Partition 偏移量的描述不正确的是?()

A.每条消息在文件中的位置称为 offset(偏移量)

B.消费者通过(offset.partition.topic)跟踪记录

C. 唯一标记一条消息

D.Offset 是一个 String 型字符串

【正确答案】

23. Channel 的作用类似队列,用于临时缓存进来的数据,当Sink 成功地将数据发送到下一跳的 Channel 或最终目的,数据会从 Channel 移除()

A.TRUE

B.FALSE

【正确答案】

24. Zookeeper 中的数据节点 znode 分为哪几种类型?()

A.semi-persistent

B.ephemeral

C.temporary

D.persistent【正确答案】

【正确答案】

25. HDFS 联邦环境下,NameSpace(命名空间)包含以下哪些内容?()

A.目录

B.文件【正确答案】

C.块【正确答案】

D.以上全不正确

【正确答案】

26. HDFS 存储数据时,关键数据根据实际业务需要保存在具有高度可靠性的节点中,通过修改DataNode 的存储策略,系统可以将数据强制保存在指定的节点组中。()

A.TRUE

B.FALSE

【正确答案】

27. RDD 有Transformation 和Action 算子,下列属于 Action 算子的是?()

A.map

B.saveAsTextFile

C.Filter

D.reduceByKey

【正确答案】

28. Spark on Yarn-client 适合用于生产环境是因为可以更快的看到 APP 的输出。()

A.TRUE

B.FALSE

【正确答案】

29. 以下关于 Hive SQL 基本操作描述正确的是?()

A.创建外部表必须要指定 location 信息

B.创建外部表使用 external 关键字,创建普通表需要指定internal 关键字

C.加载数据到 Hive 时源数据必须是 HDFS 的一个路径

D.创建表时可以指定列分割符

【正确答案】

30. 在Streaming 中,消息可靠性级别中精确一次是通过 ACK 机制来实现的。()

A.TRUE

B.FALSE

【正确答案】

31. Flume 适用于以下哪些场景的数据收集?()

A.Thrift,Avro,Syslog,Kafka 等数据源上收集数据

B.本地文件数据采集【正确答案】

C.应用系统产生的日志采集【正确答案】

D.大量数据的实时数据采集

【正确答案】

32. 在 Zookeeper 和Yarn 的协同工作中,当 Active ResourceManager 产生故障时,Standby ResourceManager 会从以下哪些目录中获取 Application 相关信息?()

A.metastore

B.Statestore

C.Storeage

D.Warehouse

【正确答案】

33. ZooKeeper 所有节点都可以处理读请求。()

A.TRUE

B.FALSE

【正确答案】

34. HDFS 的副本放置策略中,同一机架不同的服务器之间的距离是()

A.3

B.2

C.1

D.4

【正确答案】

35. 下列哪些措施是为了保障数据的完整性()

A. 元数据可靠性保证

B.重建失效数据盘的副本数据【正确答案】

C.安全模式【正确答案】

D.集群数据均衡【正确答案】

【正确答案】

36. Zookeeper 的Scheme 认证方式不包括以下哪项?()

A.digest

B.sasl

C.auth

D.world

【正确答案】

37. MapReduce 过程中,以下属于 Shuffle 机制的是?()

A.Copy

B.Partition

https://www.doczj.com/doc/e41455383.html,bine

D.Sort/Merge【正确答案】

【正确答案】

38. FusionInsight Manager 可以对哪些项目进行健康检查?()

A.角色

B.主机【正确答案】

C.服务【正确答案】

D.实例【正确答案】

【正确答案】

39. FusionInsight Manager 与外部管理平台对接时,支持哪些接口?()

A.VPN

B.Syslog

C.FTP【正确答案】

D.SNMP【正确答案】

【正确答案】

40. 下列选项中适合 MapReduce 的场景有?()

A.实时交互计算

B.迭代计算

C.流式计算

D.离线计算

【正确答案】

41. 以下关于 FusionInsight 中CarbonData 说法正确的有?()

A.使用 Carbon 的目的是对大数据即席查询提供超快速响应。

B.Carbon 使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少 60%-80%数据存储空间,大大节省硬件存储成本。【正

大数据考试题含答案精编WORD版

大数据考试题含答案精 编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

1 多选传统大数据质量清洗的特点有: A. 确定性 B. 强类型性 C. 协调式的 D. 非确定性 2 多选以下选项中属于数据的作用的是()。 A. 沟通 B. 验证假设 C. 建立信心 D. 欣赏 3 多选数据建立信心的作用需具备的条件包括()。 A. 可靠数据源 B. 多方的数据源 C. 合适的数据分析 D. 信得过的第三方单位 4 多选数据只有在与()的交互中才能发挥作用。

A. 人 B. 物 C. 消费者 D. 企业 5 单选大数据可能带来(),但未必能够带来()。 A. 精确度;准确度 B. 准确度;精确度 C. 精确度;多样性 D. 多样性;准确度 6 多选大数据的定义是: A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 B. 任何超过了一台计算机处理能力的数据量 C. 技术 D. 商业 7 多选大数据五大类应用方向是: A. 查询

B. 触达 C. 统计 D. 预警 E. 预测 8 多选以下哪些指标是衡量大数据应用成功的标准? A. 成本更低 B. 质量更高 C. 速度更快 D. 风险更低 9 多选大数据有哪些价值? A. 用户身份识别 B. 描述价值 C. 实时价值 D. 预测价值 E. 生产数据的价值 10 多选大数据的预测价值体现在:

A. 预测用户的偏好、流失 B. 预测热卖品及交易额 C. 预测经营趋势 D. 评价 11 单选什么是大数据使用的最可靠方法? A. 大数据源 B. 样本数据源 C. 规模大 D. 大数据与样本数据结合 12 多选大数据是描述()所发生的行为。 A. 未来 B. 现在 C. 过去 D. 实时 13 多选传统研究中数据采集的方法包括: A. 网络监测

大数据试题答案与解析_最全

1、当前大数据技术的基础是由( C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是 ( C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单,本题2分)

A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是( A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 大数据的最显著特征是( A)。(单选题,本题2分) A:数据规模大 B:数据类型多样

C:数据处理速度快 D:数据价值密度高 10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地 点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 12、当前社会中,最为突出的大数据环境是(A )。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是(单选题,本题2分) A:数据存储和备份规 B:数据管理和维护 C:数据价值发觉和利用

数据库原理试题及答案

数据库原理试题答案(B卷) 一、填空题(每题 2 分,共 20 分) 1、实体 2、日志文件 3、完整性 4、关系 5、关系演算 6、外模式 / 模式 7、更新 8、集成的 9、先来先服务 10、人工智能 二、选择题(每题 1 分) 1 、C 2 、 D 3 、 B 4 、 A 5 、 B 6 、 C 7 、 C 8 、 C 9 、 B 10 、 C 三、简答题(每题 5 分,共 20 分) 1 、答案要点:数据库系统中的常见故障有:事务内部的故障(事务故障)( 1 分)、系统故障( 1 分)、介质故障( 2 分)、计算机病毒( 1 分)。 2 、答案要点:数据模型通常由数据结构( 1 分)、数据操作( 2 分)、完整性约束( 2 分)三部分组成。 3 、答案要点:不是所有的视图都是可更新的( 2 分);因为有些视图的更新不能唯一地有意义地转换成对相应基本表地更新( 3 分)。 4 、答案要点:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行执行它们时的结果相同( 5 分)。 四、(共 10 分) 1 、 80 , 90 2 、 T 1 T 2 Slock A 读 A = 50 Y = A Unlock A Xlock A A=Y-10 Slock A 写回 A = 40 等待 Unlock A 等待 读 A = 40 Y = A Unlock A Xlock A A=Y × 2 写回 A = 80 Unlock A

五、(共 10 分) 六、(共 20 分) 1 、关系代数: (1)sno ( cno =‘ 2 ' (SC) )(2分) (2) Sno,Sn ( Cn=' 数据库概论 ' ) (2分) (3) Sno,SN (S ( Cno , sno (SC) ÷ Cno ( C )) ) (2分) ALPHA 语言 ? GET W(SC.SNO): https://www.doczj.com/doc/e41455383.html,O=' 2' (2分) ? RANGE C X SC Y GET W (S.SNO.S.SN): X( Y(https://www.doczj.com/doc/e41455383.html,O=https://www.doczj.com/doc/e41455383.html,O ^ Y.SNO=S.SNO ^ https://www.doczj.com/doc/e41455383.html,=' 数据库概论 ' (2分) ? RANGE C X SC Y GET W(S.SNO,S.SN): X( Y(https://www.doczj.com/doc/e41455383.html,O=https://www.doczj.com/doc/e41455383.html,O ^ Y.SNO=S.SNO)) (2分) 2 、( 1 ) SELECT COUNT(*) FROM STUDENT (2分) (2) SELECT SNO FROM SC GROUP BY SNO HAVING COUNT(*)>5 (3分) (3) DELECT FROM SC WHERE https://www.doczj.com/doc/e41455383.html,O IN (SELECT https://www.doczj.com/doc/e41455383.html,O FROM C WHERE CN=' 数据结构 ') DELETE FROM C WHERE CN= ‘数据结构' (3分) 七、(共 10 分) 科室(科室代码,科室名称) (1分) 医生(工号,姓名,名称,聘用日期,聘用期限,科室) (1分) 病人(病历号,姓名,年龄,工作单位) (1分) 就诊(医生工号,病历号,就诊日期) (2分) 一、填空题(每空 2 分,共 20 分) 1、关系中主码的取值必须唯一且非空,这是由 ___________ 完整性规则决定的。 2、当数据库被破坏后,如果事先保存了数据库副本和 ________________ ,就有可能恢复数据库。 3、数据库的 ____________ 是指数据库的正确性和相容性。 4、关系数据操作语言的特点是:操作对象与结果均为 ___________ 、操作的非过程性强、语言一体化、并且建立在数学理论基础之上。 5、SQL 是一种介于关系代数和 _____________ 之间的结构化的查询语言。 6、对于每一个外模式,数据库系统都有一个 _______________ 映象,它定义了该外模式与模式之间的对应关系。 7、视图是一个需表,它一经定义就可以和基本表一样被查询,但 _________ 操作将有一定的限制。 8、数据仓库是一个面向主题的、 _____________ 、不可更新的、随时间不断变化的数据集合。 9、避免活锁的简单方法是采用 _____ 的策略。 10、知识库系统和主动数据库系统是将数据库技术和 ________ 技术相结合产生的。 二、选择题(每小题 1 分,共 10 分) 1、SQL 中,下列涉及空值的操作,不正确的是 ( )

数据库试题及答案

《数据库》试题 使用教材:Visual FoxPro 数据库应用 试题范围:全册 出版社:高等教育出版时版次:第3版 学校名称:文县职业中专 一、选择题 1、在有关数据库的概念中,若干记录的集合称为() A. 文件 B. 字段 C. 数据项 D. 表 2、在Visual FoxPro中,向数据库文件中追加数据使用语句() A、INSERT B、REPLACE C、APPEND D、ADD 3、在Visual FoxPro中,删除数据库的所有记录,仅保留库结构的命令是( ) A、delete all B、pack C、recall D、zap 4、在Visual FoxPro中,分屏显示当前数据库中年龄字段大于20的所有记录,正确的命令为( ) A、display all for nl>20 B、display all while nl>20 C、list for nl while nl>20 D、list while nl>20 5、在Visual FoxPro中,skip命令移动记录指针的基准是( ) A、第一条记录 B、当前记录 C、指定纪录 D、库文件尾6、逻辑运算符在运算时的优先顺序是() A.NOT→AND→OR B.AND→NOT→OR C.OR→NOT→AND D.从左至右按先后次序 7、在关系运算中,查找满足一定条件的元组的运算称之为()A. 投影 B. 选择 C. 关联 D. 复制 8、下面的赋值表达式不正确的是() A.STORE "HELLO WORLD!" TO STR B. STORE 123456 TO

A1,B1 C.WORD="FOXPRO" D.STORE 12,34 TO A2,B29、不能作为索引关键字的数据类型是() A.数值型 B.备注型 C.日期型 D.字符型 10、当前表中含xm(姓名,字符型)字段,显示姓“李”的记录的命令是() A.DISP FOR "李"=xm B.DISP FOR xm=李 C.DISP FOR SUBS(xm,1,1)= ‘李’ D.DISP FOR SUBS(xm,1,2)=‘李’ 11、用命令DIMENSION A(4,5)定义后,A数组中共有()个数据元素。 A. 4 B. 5 C. 9 D. 20 12、在Visual FoxPro的一个工作区中,同一时刻最多能打开( )个库文件。 A、10 B、1 C、任意多 D、256 13、33.结构化程序设计中的三种基本结构是顺序结构、分支结构和() A、选择结构 B、循环结构 C、混合结构 D、跳转结构 14、假定STUDENT.DBF学生数据库文件中前六条记录均为男生的记录,执行以下命令序列: USE.STUDENT GOTO 3 LOCATE NEXT 3 FOR 性别="男" 后,记录指针定位在( ) A、第3条记录上 B、第4条记录上 C、第5条记录上 D、第6条记录上 15、68.下面有关表索引的几种说法,正确的是() A.索引和排序一样,它改变记录的物理顺序。

2017年公需科目大数据考试 所有测试题答案

2017年公需科目大数据考试所有测试题答案 (网上收集,经用过还可以,信不过可以不用) 网络时代的国家治理 1. 林雅华博士认为,“治理”是一个全新的政治概念,它既不同于“统治”,也不同 于“管理”。(正确) 2. 互联网时代最为典型的特征是扁平化、单一向度。(错误) 3. 林雅华博士认为,《舌尖上的中国》系列节目之所以获得成功,是网络时代的国家 治理让民众参与进来的有效体现。(正确) 4. 网络时代的国家治理应以文化人、以德化人、以礼化人。(正确) 5. 林雅华博士认为,在越来越复杂化的现代社会中,我们庞大的国家机器也许无法面 面俱到,如果能够广泛地征集群众的智慧,对国家治理而言不失为有效之道。(正确) 6. 我国下列哪些城市曾因PX项目问题发生过群体性事件?(多选题)(ABCD) A.大连 B.镇海 C.昆明 D.厦门 7. 茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?(单选题)(清华) 8. 林雅华博士指出,在网络时代,电子政务的发展刻不容缓。(正确) 9. 美国首个联邦首席信息官是下列哪位总统任命的?(单选题)(奥巴马) 10. 林雅华博士指出,Windows XP“停服”事件是一个事关我国信息安全的重大事件。(正确) 11. 林雅华博士指出,目前中国的是一个复杂社会,是一个转型社会。(正确) 大数据改变未来(学习笔记) 1. ENIAC诞生于哪一年?(1946年) 2. 大数据仅仅是指数据的体量大。(错误) 3. 吴军博士认为,所有未来的公司,某种程度上都是大数据公司。(正确) 4. 计算机是根据逻辑推理来回答天为什么是蓝色的。(错误) 5. 吴军博士认为机器无法取代人类成为放射科医生。(错误) 6. 大数据的思维会把原来销售的概念变成服务的概念。(正确) 7. 吴军博士认为,彻底解决保护个人隐私的问题,需要一些新的方法,比如双向监督的方法。(正确) 大数据在交通方面的应用(学习笔记) 1. 根据周琦老师所讲,高德交通信息服务覆盖(110)多个城市以及全国高速路网。 2. 根据周琦老师所讲,将大数据智能化融入高德地图,能够提供更精准的到达时间预 测和实时躲避拥堵功能。(正确) 3. 根据周琦老师所讲,通过索引技术,在分析具体问题时,可以回调出每条道路对应

数据库试题及答案_

笔试样卷一 参考答案 一、简答题(25分) 1.数据库阶段数据管理的主要特点是什么? 2.解释DB、DBMS、DBS三个概念? 3.什么是物理数据独立性和逻辑数据独立性? 4.试说明DBMS的主要功能? 5.在ER模型转换为关系模型时,联系类型要根据不同的情况作不同的处理,试说明之。 二、计算题(20分) 1.设有关系R和S R: S: A B C A B C 3 6 7 3 4 5 2 5 7 7 2 3 7 3 4 4 4 3 列表计算R∪S、R-S、R×S、π 3,2(S)、δ B<5 (R)。(5分) 2.设有三个关系 S (SNO, SNAME, AGE, SEX, SDEPT) SC (SNO, CNO, GRANDE) C (CNO, CNAME, CDEPT, TNAME) 试用关系代数表达式表示下列查询

(1)检索LIU老师所授课程的课程号、课程名 (2)检索年龄大于23岁的男学生的学号和姓名 (3)检索学号为S3的学生所学课程的课程名和认课教师姓名 (4)检索WANG同学不学的课程的课程号 (5)检索至少选修了两门课程的学生的学号(10分) 三、设有三个基本表(45分) S (SNO, SNAME, AGE, SEX, SDEPT) SC (SNO, CNO, GRANDE) C (CNO, CNAME, CDEPT, TNAME) 1.试用T-SQL的查询语句表达下列查询 (1)检索LIU老师所授课程的课程号、课程名 (2)检索年龄大于23岁的男学生的学号和姓名 (3)检索学号为S3的学生所学课程的课程名和认课教师姓名 (4)检索WANG同学不学的课程的课程号 (5)检索至少选修了两门课程的学生的学号(10分) 2.试用T-SQL的查询语句表达下列查询 (1)统计有学生选修的课程的门数 (2)求选修C4课程的学生的年龄 (3)求LIU老师所授课程的每门课程的学生的平均成绩 (4)统计每门课程的学生选修人数 (5)求年龄大于所有女同学年龄的男学生的姓名和年龄(10分)3.试用T-SQL更新语句完成下列更新操作 (1)往表S中插入一个学生资料(‘S9’, ‘WU’, 18)

数据库习题及答案,第三版

2004-2005学年第二学期期末考试 D 2002级计算机科学与技术专业《数据库原理与应用》课程试题 一、选择题(15分,每空1分): 1 .数据库系统中,物理数据独立性( physical data independenee )是指 _ 。 A. 数据库与数据库管理系统的相互独立 B. 应用程序与DBMS 的相互独立 C. 应用程序与存储在磁盘上数据库的物理模式是相互独立的 D. 应用程序与数据库中数据的逻辑结构相互独立 2. _____________________ 数据库系统的特点是 、数据独立、减少数据冗余、避免数据不一 致和加强了数据保护。 A. 数据共享 B .数据存储 C.数据应用 D .数据保密 3. 数据库管理系统能实现对数据库中数据的查 询、 插入、修改和删除等操作的数据库语言称为 A. 数据定义语言(DDL ) B .数据管理语言 C.数据操纵语言(DML ) D .数据控制语言 4. 在关系代数的专门关系运算中,从表中取出满足条件的属性的操作称为①;从表中选出满足某种 条件的元组的操作称为②;_将两个关系中具有共同属性值的元组连接到一起构成新表的操作称为③。 A. 选择 B .投影 C.连接 D.扫描 5. _________________________ 关系模型中,一个候选码 。 A .可由多个任意属性组成 B. 至多由一个属性组成 C. 可由一个或多个其值能唯一标识该关系模式中任何元组的属性组成 D. 必须由多个属性组成 7.数据库中只存放视图的 __________ 。 A .操作 B .对应的数据 C. 定义 D.限制 9.数据库管理系统通常提供授权功能来控制不同用户访问数据的权限, O A. 可靠性 B. —致性 C.完整性 D .安全性 6. SQL 语言是 语言。 A .层次数据库 C .关系数据库 B. 网络数据库 D .非数据库 &关系数据库规范化是为解决关系数据库中 问题而引人的。 A .数据冗余 B. 提高查询速度 C.减少数据操作的复杂性 D .保证数据的安全性和完整性 这主要是为了实现数据库的

大数据时代题目及答案(三套试题仅供参考)

大数据时代题目及答案(三套试题仅供参考)

第一套试题 1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单选题,本题2分) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、大数据的最显著特征是(A)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是执行方法。(单选题,本题2分) A:数据存储和备份规范 B:数据管理和维护 C:数据价值发觉和利用 D:数据应用开发和管理 14、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题2分) A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参考 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护 15、下列关于计算机存储容量单位的说法中,错误的是( C)。(单选题,本题2分) A:1KB<1MB<1GB B:基本单位是字节(Byte) C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符, 16、下列关于聚类挖掘技术的说法中,错误的是(B)。(单选题,本题2分) A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

数据库试题及答案汇编

《数据库技术与应用》样题 一、选择题( 共 30 分,1--20 每小题 1 分,21—25 每小题 2 分。下列各题 A )、B)、 C)、D)四个选项中,只有一个选项是正确的 ) 1 在 SQL Server 中,关于视图的正确叙述是 A)视图与数据库表相同,用来存储数据B)视图不能同数据库表进行连接操作 C)在视图上不能进行更新操作D)视图是从一个或多个数据库表导出的虚拟表 2 SQL 是那几个英文单词的缩写 A)Standard Query LanguageB)Structured Query Language C) Select Query LanguageD)以上都不是 3 不属于 SQL Server 系统全局变量的是()。 A 、@@ErrorB 、@@ConnectionC 、@@Fetch_StatusD 、@Records 4 下面描述错误的是() A 、每个数据文件中有且只有一个主数据文件 B 、日志文件可以存在于任意文件组中 C 、主数据文件默认为 primary 文件组 D 、文件组是为了更好地实现数据库文件组织 5 SQL Server 数据库文件有三类,其中主数据文件的后缀为( ) A 、.mdfB 、.ldfC 、.ndfD 、.idf 6、下面标识符不合法的是( ) A 、[my delete]B 、_mybaseC 、$moneyD 、trigger1 7 下面字符串能与通配符表达式[ABC]%a 进行匹配的是() A 、BCDEFB 、A_BCDC 、ABC_aD 、A% 8、下面对索引的相关描述正确的是()列值唯一的列适合间索引 A 、经常被查询的列不适合建索引B 、列值惟一的列适合建索引 C 、有很多重复值的列适合建索引D 、是外键或主键的列不适合建索引 9、在“连接”组中有两种连接认证方式,其中在( )方式下,需要客户端应用程序连接 时提供登录时需要的用户标识和密码。 A 、Windows 身份验证B 、SQL Server 身份验证 C 、以超级用户身份登录时D 、其他方式登录时 10、索引是在基本表的列上建立的一种数据库对象,它同基本表分开存储,使用它能够加快 数据的( )速度。 A 、插入B 、修改C 、删除D 、查询 在where 子句中出现频率较高的列应尽量创建索引 11、以下哪种情况应尽量创建索引( ) A 、在 Where 子句中出现频率较高的列B 、具有很多 NULL 值的列 C 、记录较少的基本表D 、需要更新频繁的基本表 12、域完整性用于保证给定字段中数据的有效性,它要求表中指定列的数据具有正确的数据 类型、格式和有效的( )。 A 、数据值B 、数据长度C 、取值范围D 、以上都不是 13 以下不属于表之间定义关系的是 A)一对一关系B) 一对多关系C) 多对多关系D) 少对多关系 14 目前数据库有三种基本的数据模型是 ________ 。 A 、 层次模型、网络模型、关系模型B 、对象模型、网络模型、关系模型 网络模型、对象模型、层次模型D 、层次模型、关系模型、对象模型 15 从“产品”表里查询出价格高于产品名称为“海天酱油”的产品的记录,此 SQL 语句为 A 、SELECT * FROM 产品WHERE 价格>海天酱油

大数据试题及答案

第一组试题 一、选择题 1、以下哪个不是大数据的特征(C ) A. 价值密度低 B. 数据类型繁多 C.访问时间短 D. 处理速度快 2、当前大数据技术的基础是由( C )首先提出的。(单选题,本题2 分)A:微软 B:百度 C:谷歌 D:阿里巴巴 3、大数据的起源是(C )。(单选题,本题2 分) A:金融 B:电信 C:互联网 D:公共管理 4、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C )。(单选题,本题 2 分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 5、(C )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题 2 分) A:规模 B:活性 C:颗粒度 D:关联度 6、智能健康手环的应用开发,体现了( C )的数据采集技术的应用。(单选 题,本题 2 分) A:统计报表 B:网络爬虫 C:传感器 D:API 接口 7、下列关于数据重组的说法中,错误的是(C )。(单选题,本题2 分)A:数据重组实现的关键在于多源数据融合和数据集成 B:数据重组能够使数据焕发新的光芒 C:数据重组是数据的重新生产和重新采集 D:数据重组有利于实现新颖的数据模式创新

8、智慧城市的构建,不包含(C )。(单选题,本题2 分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、当前社会中,最为突出的大数据环境是(C )。(单选题,本题2 分)A:综合国力 B:物联网 C:互联网 D:自然资源 二、判断题 1.对于大数据而言,最基本。最重要的是要求就是减少错误、保证质量。因此,大数据收集的信息要尽量精确。() 2. 对于大数据而言,在数据规模上强调相对数据而不是绝对数据。() 3.基于大数据的营销模式和传统营销模式,传统营销模式比大数据营销模式投入更小。() 4.大数据具有体量大、结构单一、时效性强的特征。() 三、简答题 1.大数据发展过程中遇到的问题有哪些? 解析: (1)大数据是全数据,忽视甚至蔑视抽样; (2)连续数据就是大数据; (3)数据量级大是大数据; (4)数据量大好于量小。 2.咸鱼APP在投入使用发展过程中有哪些不足之处? 解析: (1)交易信任危机 (2)物流问题 (3)商品的售后及维修问题

数据库试题及答案_两套[1]

数据库试题及答案两套收藏 数据库原理试题(A卷) 一、填空题(每空 1 分,共 20 分) 1. 对于一个国家来说,数据库的建设规模、数据库信息量的 _安全性____________ 和 ____完整性_________ 已成为这个国家信息化程度的 _______衡量标准_________ 。 2. 数据模型通常由: ___数据结构_____________ 、_______数据操作_________ 和 __完整性约束___________ 三部分组成。 3. 游标的功能是把 __集合记录______________ 转换为 ___单记录_____________ 。 4. 最常用的数据库的恢复技术是_数据转储____________ 和 _登记日志文件__________。 5. __概念_____ 模型是现实世界到 __数据模型___________ 机器模型的中间桥梁。 6. 数据独立性是指___物理________ 和__逻辑___________ 独立性。 7. 数据库应用程序开发工具目前有_ C++, _____________ 、__________VB_______ 、_______DEF_________ 、和 ____________C#____ 等。 8. 目前数据库产品有 SQL Server 和 ____ORACLE____________ 、 ___ACESS_____________ 等。 二、选择题(每小题 1 分,共 10 分) 1. 关于冗余数据的叙述中,不正确的是 (C ) 。 A .冗余的存在容易破坏数据库的完整性 B .冗余的存在给数据库的维护增加困难. C .不应该在数据库中存储任何冗余数据 D .冗余数据是指可由基本数据导出的数据 2. 概念模型独立于 (C ) 。 A . ER 模型 B .硬件设备 C . DBMS D .操作系统 3. 下列叙述正确的为(D )。 A. 主码是一个属性,它能唯一表识一列 B. 主码是一个属性,它能唯一表识一行 C. 主码是一个属性或属性集,它能唯一表识一列 D. 主码是一个属性或属性集,它能唯一表识一行 4. 数据库三级模式体系结构的划分,有利于保持数据库的 (A ) 。 A .数据独立性 B .数据安全性 C .结构规范化 D .操作可行性 5. 一个关系中的候选关键字(B )。 A .至多一个 B .可多个 C .必须多个 D .至少 3 个 6. 常用的关系运算是关系代数和(C )。 A .集合代数 B .逻辑演算 C .关系演算 D .集合演算 7. 在基本层次联系中,记录型之间的联系是(D )。 A .一对一联系 B .一对多联系 C .多对多联系 D .多对一联系 8. 并发操作会带来哪些数据不一致性(D )。 A .不可修改、不可重复读、脏读、死锁 B .不可重复读、脏读、死锁 C .丢失修改、脏读、死锁 D .丢失修改、不可重复读、脏读 9. 在数据库与宿主语言之间传递信息是通过(A )。 A. 全局变量 B. 共性变量 C. 公共数据区 D. 系统缓冲区 10. 数据库的(B )是指数据的正确性和相容性。 A. 安全性 B. 完整性 C. 并发控制 D. 恢复 三、判断题(每小题 1 分,共 10 分 , 对不正确的要写出理由) 1. 子模式 DDL 是用来描述数据库的物理存储结构的。(F ) 2. 同一个关系模型的任两个元组值不能全同。 (T ) 3. 基本表是本身独立存在的表,在 SQL 中一个关系就对应基本表。(T ) 4. 数据流程图( DFD )是用于描述结构化方法中详细设计阶段的工具。(F ) 5. 若数据库中只包含成功事务提交的结果则此数据库成为处于安全状态 (T ) 6. 事务的持续性是指事务中包括的所有操作,要么都做,要么都不做。 (F ) 7. DB 用户的权限可分为具有 DBA 特权的用户和一般 DB 用户(T ) 8. 数据库的网状模型应满足的条件是必须有两个以上的结点。(T ) 9. CREAT TABLE 命令可直接定义主码、外码、参照表,系统就能够自动地执行实体完整性和参照完整性规则。( T)

数据库应用试卷及答案

数据库及应用(B卷) 一、选择题(从备选答案中选1 个正确的答案,每题2分、共24分) 1.支持所有用户建立、存储数据库的软件系统是。 A.数据库系统 B.数据库管理系统 C.应用程序 D.操作系统2.DB的三级模式结构中最接近外部存储器的是。 A.子模式 B.外模式 C.概念模式 D.内模式 3.在关系模式R中,函数依赖X→Y的语义是。 A.在R的某一关系中,若两个元组的X值相等,则Y值也相等 B.在R的每一关系中,若两个元组的X值相等,则Y值也相等 C.在R的某一关系中,Y值应与X值相等 D.在R的每一关系中,Y值应与X值相等 4. DBA是________的简称。 A.系统分析员 B.应用程序员 C.数据库管理员 D.数据录入员 5. _____是长期存储在计算机内的有组织,可共享的数据集合. A.数据库管理系统B.数据库系统 C.数据库D.文件组织6.数据库系统的核心是。 A. 数据库 B. 数据库管理系统 C. 数据模型 D. 软件工具 7.客观存在并可相互区别的事物叫________。 A.码 B.属性 C.实体 D. 实体集8.数据库的完整性是指数据的_____和_____。 (1)正确性(2)合法性(3)不被非法存取 (4)相容性 (5)不被恶意破坏 A. (1)和(3) B. (2)和(5) C. (1)和(4) D. (2)和(4) 9.一组具有相同数据类型的值的集合称为________。 A.关系 B.属性 C.分量 D.域 10.以下______封锁违反两段锁协议。 A.Slock A … Slock B … Xlock C …… Unlock A … Unlock B … Unlock C B.Slock A … Slock B … Xlock C …… Unlock C … Unlock B … Unlock A C.Slock A … Slock B … Xlock C …… Unlock B … Unlock C … Unlock A D.Sl ock A …Unlock A …Slock B … Xlock C …… Unlock B … Unlock C 11. “日志”文件用于保存________。 A.程序运行过程B.数据操作 C.程序执行结果D.对数据库的更新操作12…并发操作会带来哪些数据不一致性________ A.丢失修改、不可重复读、读脏数据、死锁 B.不可重复读、读脏数据、死锁

数据库试题及答案

一、选择题 1.在数据库系统中,把可以相互区别的客观事物称为(D ) A.属性 B. 字段 C.文件 D.实体 2.数据库的存储设备和存取方法变化不影响整体逻辑结构的特点,称为数据库的( D ) A.实体独立性B.物理数据独立性 C.客观独立性 D.逻辑数据独立性 3.学生社团可以接纳多名学生参加,但每个学生只能参加一个社团,从社团到学生之间的联系类型是( B ) A. 多对多 B. 一对多 C. 多对一 D. 一对一 4.如果关系模式R上有函数依赖AB→C和A→C,则R中存在(B ) A. 完全依赖 B.部分依赖 C. 传递依赖 D.多值依赖 5.关系模型的参照完整性约束是指(C) A.限制引用一个关系中的不同元组数据 B.限制引用不同关系中的元组数据 C.限制一个关系引用与之联系关系中不存在的元组数据 D.限制两个关系间的互相引用 6.在嵌入式SQL中,为了把集合操作转换成单记录处理方式,引进了以下哪个概念( B )

A.宿主语言B.游标 语言语言 7、单个用户使用的数据视图的描述称为(A )。 A. 外模式 B. 概念模式 C. 内模式 D. 存储模式 8.在SQL中,下列涉空值的操作,不正确的(D:AGE=NULL) 9.数据库系统的独立性是指(B) A. 不会因为数据的变化而影响应用程序 B. 不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序 C. 不会因为数据存储策略的变化而影响数据存储结构 D. 不会因为某些数据逻辑结构的变化而影响应用程序 10.设有T1和T2两个事务,若并发操作如下,则下面评价中正确的是(C )。 T1 T2 ①读A=100,B=5 ②读A=100 A=A*2 回写 ③求A+B=105,验证错 A. 该操作不存在问题 B. 该操作丢失修改 C. 该操作不能重复读 D. 该操作读“脏数据”

大数据时代题目及答案(三套试题仅供参考)

第一套试题 1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分) A:微软 B :百度 C:谷歌 D:阿里巴巴 2、大数据的起源是( C )。(单选题,本题 2分) A:金融 B :电信 C:互联网 D :公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题 2分) A:数据管理人员 B :数据分析员 C :研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模B:活性C:关联度D:颗粒度 5、数据清洗的方法不包括(D)。(单选题,本题 2分) A:缺失值处理 B :噪声数据清除 C :一致性检查 D :重复数据记录处理 6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。(单选题,本题2分) A:统计报表B:网络爬虫C:API接口D:传感器 7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题 2分) A :数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒 C :数据重组实现的关键在于多源数据融合和数据集成 D :数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含(C)。(单选题,本题 2分) A:数字城市B:物联网C:联网监控D:云计算 9、大数据的最显著特征是(A)。(单选题,本题 2分) A:数据规模大B:数据类型多样C:数据处理速度快 D :数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( B )。(单选题,本题 2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是( D )。(单选题,本题 2分) A:数据规模大B:数据类型多样 C :数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是( A )。(单选题,本题 2分) A:互联网B:物联网C:综合国力D:自然资源 13、在数据生命周期管理实践中,( B )是执行方法。(单选题,本题2分) A:数据存储和备份规范B:数据管理和维护 C:数据价值发觉和利用D:数据应用开发和管理 14、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题 2分) A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参考 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护 15、下列关于计算机存储容量单位的说法中,错误的是(C)。(单选题,本题 2分) A:1KB<1MB< 1GB B:基本单位是字节(Byte) C:一个汉字需要一个字节的存储空间D:一个字节能够容纳一个英文字符, 16、下列关于聚类挖掘技术的说法中,错误的是( B )。(单选题,本题 2分) A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B:要求同类数据的内容相似度尽可能小 1

云 + 大数据题库及答案

云+大数据题库及答案 1 、联通沃云提供的存储类产品有()。 A. 对象存储 ( 正确答案 ) B. 云硬盘 ( 正确答案 ) C. 交换机 D. 路由器 2 、普通云盘、高效云盘、 SSD 云盘中,按照最大 IOPS 性能进行排序,正确的是()。 A. 普通云盘 < 高效云盘 >< SSD 云盘 ( 正确答案 ) B. 高效云盘 < SSD 云盘 >< 普通云盘 C. 普通云盘 < SSD 云盘 >< 高效云盘 3 、 WAF 主要用于保护()的安全 A. 云主机 B. 私有网络 C. 公有网络 D. 网站 ( 正确答案 ) 4 、云计算的计收原则是()计收 A.1 ( 正确答案 ) B.0.9 C.0.2

D.0.1 5 、失联复联属于大数据中()产品 A. 沃指数 B. 数字营销 ( 正确答案 ) C. 能力开放平台 D. 医疗大数据 6 、云硬盘的作用是()。 A. 数据存储 ( 正确答案 ) B. 视频处理 C. 上传图片 D. 访问公网 7 、以下哪款产品是智慧足迹公司的自研产品 A. 商铺选址 ( 正确答案 ) B. 征信产品 C. 精准营销 8 、大数据征信产品中的位置服务验证类包含以下哪几个? A. 实时位置查询 ( 正确答案 ) B. 历史位置验证 ( 正确答案 ) C. 实时位置地市对比 ( 正确答案 ) D. 用户状态验证 9 、根据用途的不同,可分为以下几种云。 A. 公有云 ( 正确答案 )

B. 私有云 ( 正确答案 ) C. 混合云 ( 正确答案 ) D. 自有云 10 、联通现有哪几朵云。 A. 沃云 A ( 正确答案 ) B. 沃云 ( 自研 ) ( 正确答案 ) C. 华三行业云 ( 正确答案 ) D. 阿里云 11 、发展大数据业务的前提是() A. 合法 ( 正确答案 ) B. 合规 ( 正确答案 ) 12 、 PaaS 层服务是()。 A. 虚拟服务器、存储和网络资源 B. 以应用服务器的平台或开发环境为内容向客户提供服务( 正确答案 ) C. 以软件应用 ( 如 CRM 、 ERP 、 OA 等 ) 为内容向客户提供服务 13 、沃云 ( 自研 ) 是否支持按量计费? A. 可以 B. 不可以 ( 正确答案 ) 14 、在多云平台中,重置后的客户经理账号的密码为() A. 发展人编码

大数据考试题含答案知识讲解

1 多选传统大数据质量清洗的特点有: A. 确定性 B. 强类型性 C. 协调式的 D. 非确定性 2 多选以下选项中属于数据的作用的是()。 A. 沟通 B. 验证假设 C. 建立信心 D. 欣赏 3 多选数据建立信心的作用需具备的条件包括()。 A. 可靠数据源 B. 多方的数据源 C. 合适的数据分析 D. 信得过的第三方单位 4 多选数据只有在与()的交互中才能发挥作用。 A. 人 B. 物 C. 消费者 D. 企业 5 单选大数据可能带来(),但未必能够带来()。 A. 精确度;准确度 B. 准确度;精确度 C. 精确度;多样性 D. 多样性;准确度 6 多选大数据的定义是: A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 B. 任何超过了一台计算机处理能力的数据量 C. 技术 D. 商业 7 多选大数据五大类应用方向是: A. 查询 B. 触达 C. 统计 D. 预警 E. 预测 8 多选以下哪些指标是衡量大数据应用成功的标准? A. 成本更低 B. 质量更高 C. 速度更快 D. 风险更低 9 多选大数据有哪些价值? A. 用户身份识别

B. 描述价值 C. 实时价值 D. 预测价值 E. 生产数据的价值 10 多选大数据的预测价值体现在: A. 预测用户的偏好、流失 B. 预测热卖品及交易额 C. 预测经营趋势 D. 评价 11 单选什么是大数据使用的最可靠方法? A. 大数据源 B. 样本数据源 C. 规模大 D. 大数据与样本数据结合 12 多选大数据是描述()所发生的行为。 A. 未来 B. 现在 C. 过去 D. 实时 13 多选传统研究中数据采集的方法包括: A. 网络监测 B. 电话访谈 C. 对面访谈 D. 线上互动 14 单选大数据整合要保证各个数据源之间的()。 A. 一致性、协调性 B. 差异性、协调性 C. 一致性、差异性 D. 一致性、相容性 15 单选分类变量使用()建立预测模型。 A. 决策树 B. 分类树 C. 离散树 D. 回归树 16 多选()是大数据应用的步骤。 A. 数据输入 B. 建模分析 C. 使用决策支持工具输出结果 D. 验证假设 17 多选避免“数据孤岛”的方法包括: A. 关键匹配变量 B. 数据融合 C. 数据输入 D. 利用样本框

相关主题
文本预览
相关文档 最新文档