2019公需科目:大数据题库300题[含参考答案]
一、选择题
1.下列哪项通常是集群的最主要瓶颈
a)CPU b)网络 c)磁盘Id)内存
答案.C 磁盘
首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。小型机和大型机有什么特点?
2.cpu 处理能力强
3.内存够大,所以集群的瓶颈不可能是 a 和 d
4.下面哪个程序负责 HDFS 数据存储。
a)NameNdeb)Jbtrackerc)Datanded)SecndaryNameNdee)tasktracker
答案.C Datande
二、填空题
5.Map/Reduce框架由一个单独的master JbTracker 和每个集群节点一个slave TaskTracker 共同组成。
三、单选题
6.大数据的起源是(C )。(单选题)
A.金融
B.电信
C.互联网
D.公共管理
7.根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是
( C)。(单选题)
A.数据管理人员
B.数据分析员
C.研究科学家
D.软件开发工程师
8.数据清洗的方法不包括( D)。(单)