大数据通信考题8-9
- 格式:doc
- 大小:311.96 KB
- 文档页数:52
大数据考试题库和答案一、单项选择题1. 大数据的4V特征不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D2. 以下哪一项不是Hadoop生态系统中的组件?A. HDFSB. MapReduceC. SparkD. Cassandra答案:D3. 在大数据中,以下哪个术语指的是数据的存储格式?A. ETLB. OLAPC. NoSQLD. Hadoop答案:C4. 以下哪个不是大数据技术的优势?A. 处理速度快B. 成本低C. 存储容量小D. 可扩展性高答案:C5. 大数据技术可以应用于以下哪个领域?A. 金融B. 医疗C. 教育D. 所有以上选项答案:D二、多项选择题1. 大数据技术可以解决以下哪些问题?A. 数据挖掘B. 数据存储C. 数据分析D. 数据可视化答案:ABCD2. 以下哪些是大数据技术的关键组成部分?A. 分布式存储B. 分布式计算C. 数据库D. 机器学习答案:ABCD3. 在大数据领域,以下哪些是常见的数据源?A. 社交媒体B. 传感器数据C. 交易记录D. 网络日志答案:ABCD三、判断题1. 大数据技术只能处理结构化数据。
(错误)2. 机器学习是大数据技术的一个重要应用领域。
(正确)3. Hadoop是一个开源的大数据存储和处理框架。
(正确)4. NoSQL数据库不支持事务处理。
(错误)5. 大数据技术可以完全替代传统的数据库技术。
(错误)四、简答题1. 请简述大数据的4V特征。
答案:大数据的4V特征包括:- Volume(体量大):数据量巨大,通常以TB或PB为单位。
- Velocity(速度快):数据生成和处理的速度非常快。
- Variety(种类多):数据类型多样化,包括结构化、半结构化和非结构化数据。
- Veracity(真实性):数据的质量和准确性。
2. 请解释什么是ETL过程。
华为ict大数据考试题库及答案1. 华为ICT大数据考试题库及答案1.1 单选题1.1.1 问题:华为大数据平台的核心组件是什么?A. 华为云B. FusionInsightC. 华为手机D. 华为路由器答案:B. FusionInsight1.1.2 问题:以下哪个不是华为大数据平台FusionInsight的功能?A. 数据集成B. 数据存储C. 数据分析D. 视频监控答案:D. 视频监控1.2 多选题1.2.1 问题:华为大数据平台FusionInsight支持哪些类型的数据处理?A. 结构化数据B. 非结构化数据C. 半结构化数据D. 所有以上答案:D. 所有以上1.2.2 问题:华为大数据平台FusionInsight在哪些行业中有应用?A. 金融B. 电信C. 政府D. 教育答案:A. 金融 B. 电信 C. 政府1.3 判断题1.3.1 问题:华为大数据平台FusionInsight支持Hadoop生态。
答案:正确1.3.2 问题:华为大数据平台FusionInsight不支持实时数据处理。
答案:错误1.4 填空题1.4.1 问题:华为大数据平台FusionInsight支持的存储格式包括____和____。
答案:HDFS,HBase1.4.2 问题:华为大数据平台FusionInsight的数据处理引擎包括____和____。
答案:MRS,HBase1.5 简答题1.5.1 问题:简述华为大数据平台FusionInsight的主要优势。
答案:华为大数据平台FusionInsight的主要优势包括高性能、高可靠性、易扩展性和强大的数据处理能力。
它能够支持PB级别的数据存储和分析,同时提供灵活的数据集成和处理能力,满足不同行业和场景的需求。
1.5.2 问题:描述华为大数据平台FusionInsight在金融行业的应用场景。
答案:在金融行业,华为大数据平台FusionInsight可以用于风险控制、客户画像分析、交易监控等多个场景。
大数据开发基础(习题卷9)说明:答案和解析在试卷最后第1部分:单项选择题,共57题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]我们可以利用--query参数将表的查询结果导入 HDFS 中,使用该参数时需要注意必须要和()参数一起使用。
A)--tableB)--target-dirC)--fields-terminated-byD)--where2.[单选题]关于SVM泛化误差描述正确的是()A)超平面与支持向量之间距离B)SVM对未知数据的预测能力C)SVM的误差阈值D)SVM波动范围3.[单选题]Redis 中String数据类型不含以下哪种操作?A)MgetB)sizeC)strlenD)append4.[单选题]下列语句打开文件的位置应该在( )f = open('itheima.txt', 'w')A)C盘根目录下B)D盘根目录下C)Python安装目录下D)与源文件在相同的目录下5.[单选题]由于不同类别的关键词对排序的贡献不同,检索算法一般把查询关键词分为几类,以下哪一类不属于此关键词类型的是()。
A)引用词B)普通关键词C)高频词汇D)扩展关键词6.[单选题]使用OTS Java SDK进行表操作时需要创建,以下( )不属于构造此对象时必须提供的信息。
A)实例名称B)AccountIDC)EndpointD)AccessKeySecret7.[单选题]点击率问题是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。
假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是()。
A)模型预测准确率已经很高了,我们不需要做什么了B)模型预测准确率不高,我们需要做点什么改进模型C)无法下结论D)以上答案都不正确8.[单选题]打开一个已有文件,在文件末尾添加信息,正确的打开方式为( )。
1 多选传统大数据质量清洗的特点有:A. 确定性B. 强类型性C. 协调式的D. 非确定性2 多选以下选项中属于数据的作用的是()。
A. 沟通B. 验证假设C. 建立信心D. 欣赏3 多选数据建立信心的作用需具备的条件包括()。
A. 可靠数据源B. 多方的数据源C. 合适的数据分析D. 信得过的第三方单位4 多选数据只有在与()的交互中才能发挥作用。
A. 人B. 物C. 消费者D. 企业5 单选大数据可能带来(),但未必能够带来()。
A. 精确度;准确度B. 准确度;精确度C. 精确度;多样性D. 多样性;准确度6 多选大数据的定义是:A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合B. 任何超过了一台计算机处理能力的数据量C. 技术D. 商业7 多选大数据五大类应用方向是:A. 查询B. 触达C. 统计D. 预警E. 预测8 多选以下哪些指标是衡量大数据应用成功的标准?A. 成本更低B. 质量更高C. 速度更快D. 风险更低9 多选大数据有哪些价值?A. 用户身份识别B. 描述价值C. 实时价值D. 预测价值E. 生产数据的价值10 多选大数据的预测价值体现在:A. 预测用户的偏好、流失B. 预测热卖品与交易额C. 预测经营趋势D. 评价11 单选什么是大数据使用的最可靠方法?A. 大数据源B. 样本数据源C. 规模大D. 大数据与样本数据结合12 多选大数据是描述()所发生的行为。
A. 未来B. 现在C. 过去D. 实时13 多选传统研究中数据采集的方法包括:A. 网络监测B. 电话访谈C. 对面访谈D. 线上互动14 单选大数据整合要保证各个数据源之间的()。
A. 一致性、协调性B. 差异性、协调性C. 一致性、差异性D. 一致性、相容性15 单选分类变量使用()建立预测模型。
A. 决策树B. 分类树C. 离散树D. 回归树16 多选()是大数据应用的步骤。
A. 数据输入B. 建模分析C. 使用决策支持工具输出结果D. 验证假设17 多选避免“数据孤岛”的方法包括:A. 关键匹配变量B. 数据融合C. 数据输入D. 利用样本框18 多选以下属于机器学习的是:A. 监督式学习B. 非监督式学习C. 半监督式学习D. 强化学习19 多选机器学习的四大类分析技术的主要算法包括()A. 描述性统计B. 聚类分析C. 关联分析D. 分类与预测20 单选购物篮分析属于()。
《大数据》试题单选题1、大数据的核心就是(B)A、告知与许可B、预测C、匿名化D、规模化2、大数据不是要教机器像人一样思考。
相反,它是(A)A、把数学算法运用到海量的数据上来预测事情发生的可能性。
B、被视为人工智能的一部分。
C、被视为一种机器学习。
D、预测与惩罚。
3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。
A、降低B、不变C、提高D、无关4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法A、所有数据B、绝大部分数据C、适量数据D、少量数据5、大数据的简单算法与小数据的复杂算法相比(A)A、更有效B、相当C、不具备可比性D、无效6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。
A、安全性B、完整性C、混杂性D、完整性和混杂性7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)A、信息B、数字C、文字D、方位8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)A、原因B、是什么C、关联物D、预测的关键9、建立在相关关系分析法基础上的预测是大数据的(C)A、基础B、前提C、核心D、条件10、(C)下列说法正确的是A、有价值的数据是附属于企业经营核心业务的一部分数据;B、数据挖掘它的主要价值后就没有必要再进行分析了;C、所有数据都是有价值的;D、在大数据时代,收集、存储和分析数据非常简单;11、关于数据创新,下列说法正确的是(D)A、多个数据集的总和价值等于单个数据集价值相加;B、由于数据的再利用,数据应该永久保存下去;C、相同数据多次用于相同或类似用途,其有效性会降低;D、数据只有开放价值才能得到真正释放。
12、关于数据估值,下列说法错误的是(B)A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴;B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;C、数据的价值可以通过授权的第三方使用来实现D、目前可以通过数据估值模型来准确的评估数据的价值评估13、在大数据时代,下列说法正确的是(B)。
大数据的考试题目和答案一、单项选择题(每题2分,共20分)1. 大数据的核心特征不包括以下哪一项?A. 体量大B. 速度快C. 价值密度高D. 多样性答案:C2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 在大数据时代,以下哪种技术不是处理数据的关键技术?A. 数据挖掘B. 机器学习C. 云计算D. 传统数据库答案:D4. 下列哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C5. 以下哪个不是大数据的存储技术?A. NoSQL数据库B. 云存储C. 传统关系型数据库D. 分布式文件系统答案:C6. 大数据的4V特性中,哪个代表数据的准确性?A. VolumeB. VelocityC. VarietyD. Veracity答案:D7. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据解释答案:D8. 以下哪个不是大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 纸质文档答案:D9. 在大数据技术中,以下哪个不是数据挖掘的算法?A. 决策树B. 聚类分析C. 线性回归D. 神经网络答案:C10. 大数据的实时处理技术不包括以下哪一项?A. StormB. FlinkC. HadoopD. Spark Streaming答案:C二、多项选择题(每题3分,共15分)11. 大数据技术可以应用于以下哪些行业?A. 零售B. 交通C. 教育D. 娱乐答案:ABCD12. 大数据的挑战包括以下哪些方面?A. 数据安全B. 数据隐私C. 数据存储D. 数据分析答案:ABCD13. 以下哪些是大数据的存储解决方案?A. 数据仓库B. 数据湖C. 云存储D. 传统数据库答案:ABC14. 以下哪些是大数据处理框架?A. HadoopB. SparkC. StormD. TensorFlow答案:ABC15. 大数据的分析方法包括以下哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能用于处理结构化数据。
电信运营商行业大数据应用考试试题及答案(总6页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--企业级大数据平台架构电信行业大数据应用案例分享互联网+行业大数据应用案例分享第一套题1、哪个选项不属于大数据4V特点(B )A、VolumeB、ValidC、VarietyD、Value2、大数据的特点不包含( B )A、数据体量大B、价值密度高C、处理速度快D、数据不统一3、业界对大数据典型特征定义,一下哪像描述正确ABC4、Hadoop包括(ABC)A、Hadoop Distrbuted Filesystem(HDFS)B、HadoopMapReduceC、HbaseD、HadoopStreaming5、有关HDFS文件系统说法正确的是以下那些?(AD)A、HDFS本身是个高可用系统架构B、HDFS采取的是多NameNode、DataNode架构C、HDFS数据副本的数量越大越好D、HDFS NameNode分主备,主备不同时对外服务6、关于大数据的理念的描述,以下哪些不正确(BD)A、相关性比因果更重要B、要效率也要绝对精准C、大数据的核心价值是预测D、遵从隐私和法律并非大数据的风险7、HDFS文件系统适用于以下哪些场景(AC)A、将单文件分割成很多小块存储B、存储大量小文件C、流式数据读取D、实时数据读取8、对海量大数据管理可能面临的难题包括(ABCD)A、如何实现快速查找,提升检索效率;B、如何保证数据真实性,防止数据诈骗;C、如何实现PB级不同类型数据的存储;D、如何降低数据产生数量,节约存储资源。
9、大数据应用大大方便教育资源的管理,彻底改变教育模式,特别是在科研领域,面向数据密集型科研发现,将成为继三大范式之后的第四范式,此处提到的科学发展领域的三大范式是指(ABC)A、理论B、推演C、模拟D、计算第二套题1、运营商大数据主要遍布在一下哪些域(多选)( ABC )A、B域B、O域C、M域D、R域2、以下哪些是运营商大数据应用痛点(多选)(ABCD)A、价值呈现:大数据应用价值呈现和创新不足B、应用建设:周期长、门槛高、多冗余、体验差C、组织流程:应用跨部门,缺乏流程贯串和使能业务生产D、生态建设:无法有效构建和融入新的数字生态圈3、一下那个不是运营商大数据服务能力构建实录(B )A、基于“客户画像理论”构建六大能力模型B、对外变现C、基于场景化设计,构建应用数据服务产品D、基于“三维矩阵”开展数据服务产品设计4、基于“客户画像理论”构建六大能力模型是源自以下哪个着作(C )A、《犯罪心理》B、《原罪》C、《犯罪心理学(第七版)[Criminal behavior]》(美巴特尔等着)D、《精准营销》5、以下哪些属于“客户画像理论”构建六大能力模型之位置洞察(多选)(ABCD)A、常驻位置B、实时位置C、区域位置D、位置轨迹6、以下哪个不属于“客户画像理论”构建六大能力模型之行为预测(C )A、套餐推荐指数B、宽带推荐指数C、视频偏好指数D、客户离网预测7、以下哪些属于“客户画像理论”构建六大能力模型之价值管理(ACD )A、身份特质B、商品关注指数C、价值贡献D、来源去向8、以下哪个是网页财融合管理平台主要解决的问题(多选)( ABCD )A、促进财务和业务的精益化管理协同B、在整体上对收益、业务、网络建设等因素综合考虑,有序规划C、为基站选址及扩容、促销活动资源投入提供决策依据D、识别价值基站小区指导网络规划、保障;评估促销活动收益、优化营销资源合理投入9、以下哪种场景不是视频业务指标体系(C )A、业务体验指数B、用户发展指数C、基尼指数D、内容运营指数10、哪种资源通常是集群的最主要瓶颈(C )A、CPUB、网络C、磁盘IOD、内存11、运营商视频业务的发展目前出在以下哪个发展阶段(C )A、核心体验B、融合产品C、智慧运营D、区块链运营12、以下哪些是大数据的4V特性(多选)(ACDE)A、VolumeB、ValidC、VelocityD、ValueE、Variety13、常用的数据结构类型是(多选)( ABD )A、结构化数据B、非结构数据C、无结构化数据D、半结构数据14、Spark架构的组件包括哪些(多选)(ABCD)A、Spark SQL在HDFS文件上可根据自定义方式进行文件与表的映射关系B、Spark Streaming准实时流计算框架,数据可以消费MQ、Kafka等C、Spark MLlib机器机器学习算法库,封装了主流的机器学习算法D、Spark GraphX进行基于图计算的服务支持15、以下哪些是视频大数据使能场景化智慧运营依托的标签知识库(多选)( BC )A、业务体验指数库B、用户标签库C、内容标签库D、内容运营库16、以下哪些是视频标签知识库(多选)( ACD )A、基础标签B、网络标签C、人工标签D、衍生标签17、客户综合价值评估模型主要包括(多选)(ABD)A、历史价值B、社交价值C、智慧价值D、潜在价值18、以下哪些是大数据精准广告发展方向(多选)(ABC)A、精准化B、自动化C、平台化D、价值化19、以下哪些是运营商地理栅格的应用场景(多选)(ABCD)A、区域安全B、城市规划C、区域价值D、智慧旅游20、以下哪些是大数据的商业实践所涉及到的领域(多选)(ABCD)A、面向社会公共安全——应急指挥中心B、面向市政交通——交管部门、市政规划C、面向旅游景区——景区管理部门、旅行社D、面向商业——商场、商户等。
1、目前大数据技术的基础是由( C )第一提出的。
(单项选择题,此题 2 分)A:微软 B :百度 C:谷歌 D:阿里巴巴2、大数据的发源是( C )。
(单项选择题,此题 2 分)A:金融 B :电信 C:互联网 D:公共管理3、依据不一样的业务需求来成立数据模型,抽取最存心义的向量,决定选用哪一种方法的数据剖析角色人员是( C )。
(单项选择题,此题 2 分)A:数据管理人员 B :数据剖析员 C:研究科学家 D:软件开发工程师4、( D )反应数据的精美化程度,越细化的数据,价值越高。
(单项选择题,此题 2 分)A:规模 B :活性 C:关系度 D:颗粒度5、数据冲洗的方法不包含(D)。
(单项选择题,此题 2 分)A:缺失值办理 B :噪声数据消除C:一致性检查 D:重复数据记录办理6、智能健康手环的应用开发,表现了( D )的数据采集技术的应用。
(单项选择题,此题 2分)A:统计报表 B :网络爬虫 C:API 接口 D :传感器7、以下对于数据重组的说法中,错误的选项是( A )。
(单项选择题,此题 2 分)A:数据重组是数据的从头生产和从头采集 B :数据重组能够使数据焕发新的光辉C:数据重组实现的要点在于多源数据交融和数据集成 D :数据重组有利于实现新奇的数据模式创新8、智慧城市的建立,不包含(C)。
(单项选择题,此题 2 分)A:数字城市 B :物联网 C :联网监控 D :云计算9、大数据的最明显特色是( A )。
(单项选择题,此题 2 分)A:数据规模大 B :数据种类多样C:数据办理速度快 D :数据价值密度高10、美国海军军官莫里经过对古人航海日记的剖析,绘制了新的航海路线图,标了然狂风与洋流可能发生的地址。
这表现了大数据剖析理念中的(B )。
(单项选择题,此题 2 分)A:在数据基础上偏向于全体数据而不是抽样数据B:在剖析方法上更着重有关剖析而不是因果剖析C:在剖析成效上更追查效率而不是绝对精确D:在数据规模上重申相对数据而不是绝对数据11、以下对于舍恩伯格对大数据特色的说法中,错误的选项是(D )。
大数据考试试题题库500题[含答案]一、选择题1.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。
(判断题1分)得分.1分正确1 错误2.习近平总书记在2016年几月主持召开了网络安全和信息化工作座谈会?A(单选题1分)分.得1分A.4月B.2月C.3月D.5月3.根据周琦老师所讲,高德地图使用大数据能进行小路的识别。
(判断题1分)得分.1分正确1 错误4.2016年9月,国务院印发《促进大数据发展行动纲要》,10月,十八届六中全会将大数据上升为国家战略。
(判断题1分)得分.0分正确1 错误5.我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。
(判断题1分)得分.1分正确1 错误6.宁家骏委员指出,我国民生领域信息化服务水平显著提升。
(判断题1分)分.1分正确1 错误7.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。
(判断题1分)得分.1分正确1 错误8.习近平总书记指出,网信事业代表着新的生产力.新的发展方向,应该也能够在践行新发展理念上先行一步。
(判断题1分)得分.1分正确1 错误9.依据黑龙江大农场的应用,精准农业技术能够将产量提高5%-10%。
(判断题1分)得分.0分正确1 错误10.根据周琦老师所讲,进入了阿里巴巴集团之后,高德对大数据的处理和基础架构的能力得到了提升。
(判断题1分)得分.1分正确1 错误11.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。
(判断题1分)得分.0分正确1 错误12.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度.扁平化.相互竞合的方式进行。
(判断题1分)得分.1分正确1 错误13.根据涂子沛先生所讲,数据就是简单的数字。
(判断题1分)得分.1分正确错误114.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是abcd(多选题3分)得分.3分从柜台式管理走向全天候管理B.从粗放化管理走向精细化管理C.从被动反应走向主动预见型管理D.从单兵作战走向联合共享型管理15.大数据仅仅是指数据的体量大。
大数据行业考试题目及答案一、单项选择题(每题2分,共20分)1. 大数据的4V特性不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. YARND. HDFS答案:D3. 在大数据技术中,以下哪个不是NoSQL数据库?A. MongoDBB. CassandraC. MySQLD. Redis答案:C4. Spark的核心计算模型是基于以下哪种数据结构?A. 列表B. 集合C. 键值对D. 弹性分布式数据集(RDD)答案:D5. 以下哪个不是大数据技术中常用的数据挖掘算法?A. K-means聚类B. 决策树C. 线性回归D. 遗传算法答案:D6. 在大数据环境下,以下哪个指标用于衡量数据的准确性?A. 完整性B. 一致性C. 可扩展性D. 可用性答案:A7. 以下哪个不是大数据平台的组成部分?A. 数据存储B. 数据处理C. 数据可视化D. 网络传输答案:D8. 大数据技术中,以下哪个是用于实时处理的框架?A. HadoopB. SparkC. FlinkD. Storm答案:C9. 在大数据安全领域,以下哪个不是数据脱敏的方法?A. 替换B. 掩码C. 散列答案:C10. 大数据技术中,以下哪个是用于机器学习的库?A. TensorFlowB. NumPyC. PandasD. Matplotlib答案:A二、多项选择题(每题3分,共15分)11. 大数据技术可以应用于以下哪些领域?A. 金融B. 医疗C. 教育答案:ABCD12. 在Hadoop生态系统中,以下哪些组件是用于数据计算的?A. MapReduceB. HiveC. PigD. HBase答案:ABC13. 大数据技术中,以下哪些是数据仓库解决方案?A. Amazon RedshiftB. Google BigQueryC. SnowflakeD. MongoDB答案:ABC14. 在大数据技术中,以下哪些是数据可视化工具?A. TableauB. Power BIC. QlikViewD. Elasticsearch答案:ABC15. 大数据技术中,以下哪些是数据集成工具?A. Apache NiFiB. TalendC. Apache KafkaD. Apache Flume答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术可以处理结构化和非结构化数据。
(完整版)大数据复习题(答案)一、单选题1、大数据的起源是(B)。
A:金融B:互联网C:电信D:公共管理2、大数据的最明显特点是(B)。
A:数据类型多样B:数据规模大C:数据价值密度高D:数据处理速度快3、大数据时代,数据使用的最关键是(D)。
A:数据收集B:数据存储C:数据分析D:数据再利用4、云计算分层架构不包括(D)。
A: Iaas B: Paas C: Saas D: Yaas5、大数据技术是由(C)公司首先提出来的。
A:阿里巴巴B:百度C:谷歌D:微软6、数据的精细化程度是指(C),越细化的数据,价值越高。
A:规模B:活性C:颗粒度D:关联性7、数据清洗的方法不包括(C)A:噪声数据清除B:一致性检查C:重复数据记录处理D:缺失值处理智能手环的应用开发,体现了(C)的数据采集技术的应用。
A:网络爬虫B:API接口C:传感器D:统计报表9、下列关于数掲重组的说法中,错误的是(A)。
A:数据的重新生产和采集B:能使数据焕发新的光芒C:关键在于多源数据的融合和集成D:有利于新的数据模式创新10、美国海军军官莫里通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B)。
A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于含思伯格对大数据特点的说法中,错误的是(D)A:数据规模大B:数据类型多C:处理速度快D:价值密度高12、当前社会中,最为突出的大数据环境是(A)A:互联网B:自然环境C:综合国力D:物联网13、在数据生命周期管理实践中,(B)是执行方法。
A:数据存储和各份规范B:数据管理和维护C:数据价值发觉和利用D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是(C)。
A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于聚类挖报技术的说法中,错误的是(B)。
大数据局考试题库及答案一、单选题1. 大数据是指数据量达到什么级别?A. 千兆字节(GB)B. 十亿字节(TB)C. 千兆兆字节(PB)D. 兆兆兆字节(ZB)答案:C2. 以下哪个不是大数据的5V特性之一?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Visibility(可见性)答案:D3. 大数据技术中,Hadoop的核心技术是?A. SparkB. HiveC. HBaseD. MapReduce答案:D4. 数据挖掘中,以下哪个算法属于分类算法?A. K-meansB. AprioriC. KNND. PageRank答案:C5. 数据仓库与数据库的主要区别在于?A. 数据仓库只存储历史数据B. 数据库只存储历史数据C. 数据库只存储实时数据D. 数据仓库只存储实时数据答案:A二、多选题6. 大数据的来源可以包括以下哪些方面?A. 社交媒体B. 交易记录C. 传感器数据D. 政府公开数据答案:A, B, C, D7. 以下哪些是大数据应用的领域?A. 医疗健康B. 金融分析C. 交通管理D. 教育研究答案:A, B, C, D8. 大数据技术可以解决哪些问题?A. 数据存储B. 数据分析C. 数据可视化D. 数据安全答案:A, B, C, D三、判断题9. 大数据技术只能处理结构化数据。
(对/错)答案:错10. 数据挖掘是大数据技术的核心组成部分。
(对/错)答案:对四、简答题11. 简述大数据的4V特性。
答案:大数据的4V特性包括Volume(体量),即数据的规模;Velocity(速度),即数据的生成和处理速度;Variety(多样性),即数据的类型和结构;Veracity(真实性),即数据的准确性和可靠性。
五、案例分析题12. 某电商平台需要分析用户购买行为,以优化推荐算法。
请列出可能使用到的大数据技术和工具。
答案:可能使用到的大数据技术和工具包括:- 数据采集工具:如Flume、Kafka等,用于实时收集用户行为数据。
大数据理论考试(习题卷9)第1部分:单项选择题,共64题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]Spark核心层主要关注()问题。
A)存储B)计算C)传输D)连接答案:B解析:Spark核心层定义,Spark核心层主要关注计算问题。
2.[单选题]从连续图像到数字图像需要()。
A)图像灰度级设定B)图像分辨率设定C)确定图像的存储空间D)采样和量答案:D解析:数字图像又称离散图像,连续图像到数字图像需要离散化,离散化是通过采样和量化实现的。
3.[单选题]对事务的描述中不正确的是A)事务具有原子性B)事务具有隔离性C)事务回滚使用commit命令D)事务具有可靠答案:C解析:4.[单选题]关于__name__的说法,下列描述错误的是( )A)它是Python提供的一个方法B)每个模块内部都有一个__name__属性C)当它的值为’main‘时,表示模块自身在运行D)当它的值不为’main’时,表示模块被引用答案:A解析:__name__ 是属于 python 中的内置类属性5.[单选题]图像灰度方差说明了图像的哪一个属性()。
A)平均灰度B)图像对比度C)图像整体亮度D)图像细答案:B解析:方差反应图像的高频部分的大小;如果图片对比度小, 那方差就小;如果图片对比度很大, 那方差就大;方差=每个像素点的灰度值减去图像平均灰度值的平方和除以总的像素个数6.[单选题]关于队列的描述中,以下描述正确的是()。
C)在队列中只能插入数据D)队列是先进先出的线性表答案:D解析:队列既能插入也能删除数据,并且是先进先出的线性表7.[单选题]a=np.array([[1,2,3],[4,5,6]]),以下操作会改变数组本身形状的是()。
A)TB)a.reshape(2,3)C)a.ravel()D)a.resize()答案:D解析:a.T、a.reshape()、a.ravel()返回一个修改后的数组,但不会更改原始数组;a.resize函数会修改数组本身形状。
大数据考试题目及答案一、单选题(每题2分,共10分)1. 大数据的4V特点不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Visualization(可视化)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. MapReduceD. HDFS答案:D3. 下列哪个不是大数据分析工具?A. R语言B. PythonC. ExcelD. Photoshop答案:D4. 在大数据技术中,以下哪个是用于实时处理的框架?A. HadoopB. SparkC. MongoDBD. Cassandra答案:B5. 大数据技术中,以下哪个是用于数据仓库的?A. HadoopB. HiveC. KafkaD. Flume答案:B二、多选题(每题3分,共15分)6. 大数据技术可以应用于以下哪些领域?A. 金融分析B. 医疗健康C. 交通规划D. 社交媒体答案:ABCD7. 以下哪些是Hadoop生态系统中的组件?A. HBaseB. PigC. StormD. Cassandra答案:AB8. 大数据的存储技术包括以下哪些?A. 文件系统B. 列式存储C. NoSQL数据库D. 内存数据库答案:ABCD9. 以下哪些是大数据分析过程中可能用到的步骤?A. 数据清洗B. 数据转换C. 数据挖掘D. 数据可视化答案:ABCD10. 在大数据技术中,以下哪些是用于数据采集的?A. FlumeB. KafkaC. SqoopD. HBase答案:AB三、判断题(每题1分,共5分)11. 大数据技术可以处理结构化数据和非结构化数据。
(对)12. Hadoop只能用于离线数据处理,不能用于实时数据处理。
(错)13. 大数据技术可以减少数据存储的成本。
(对)14. 大数据技术不能用于预测分析。
(错)15. 所有类型的数据都可以用单一的大数据技术进行处理。
大数据试题及答案一、选择题(每题2分,共20分)1. 大数据的4V特征指的是什么?A. 体量大、速度快、多样性、价值高B. 体量大、速度快、多样性、真实性C. 体量大、速度快、真实性、价值高D. 体量大、真实性、多样性、价值高答案:A2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. FlumeD. HDFS答案:D3. 下列哪个不是大数据技术?A. HadoopB. SparkC. MongoDBD. MySQL答案:D4. 以下哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 游戏答案:D5. 以下哪个是大数据的分析工具?A. ExcelB. RC. PythonD. Word答案:B6. 大数据的实时分析通常使用什么技术?A. 批处理B. 流处理C. 数据挖掘D. 数据清洗答案:B7. 在大数据中,用于处理半结构化数据的技术是?A. SQLB. NoSQLC. XMLD. JSON答案:B8. 大数据的存储通常需要使用哪种类型的存储系统?A. 块存储B. 文件存储C. 对象存储D. 所有以上答案:D9. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据转换D. 数据存储答案:D10. 大数据的“体量大”通常指的是数据量达到多少?A. GB级别B. TB级别C. PB级别D. EB级别答案:C二、填空题(每题2分,共10分)1. 大数据技术可以处理的数据类型包括结构化数据、________数据和非结构化数据。
答案:半结构化2. 在Hadoop生态系统中,________是用来进行数据计算的分布式内存计算框架。
答案:Spark3. 大数据的“速度快”是指数据的________速度。
答案:处理和分析4. 在大数据技术中,________是一种用于存储大量非结构化数据的分布式文件系统。
答案:HDFS5. 大数据的“价值高”是指数据中蕴含的________价值。
联通数据通信专业技术等级资格论证考试试卷(数据)姓名论证资格评分一、填空题(总20分,每空0.5分)1、网络设备运行维护人员的基本要求:{ }、{ }、{ }。
2、中国联通各级维护机构应按照{ }、{ }的原则,开展网络设备的运行维护管理和生产工作。
3、机房管理制度必须包括:{ }、{ }、{ }、{ }等。
4、集中监控中心应实行{ 7*24 }小时值班制。
5、故障处理流程由{ }、{ }、{ }、{ }四个步骤组成。
6、各级网络运行维护部门在处理业务故障时应以客户利益为先,故障发生后应依据“{ }、{ }”、“{ }、{ }”、“{ }、{ }”的原则,首先尽快恢复客户业务,然后尽快找出故障点,完成故障处理。
7、对于特别重大故障及重大故障,应立即逐级上报,{ }小时内报至总部运行维护部和当地政府通信主管部门8、典型的七层OSI通信模型分为{ 物理层}、{数据链路程}、{ 网络层}、{ 传输层}、{ 会话层}、{ 表示层}、{ 应用层};路由器、桥分别工作于{ 网络}层、{ 数据链路层} 层。
9、从体系结构来看,TCP/IP是OSI七层模型的简化,它分为四层:{ 网络接口层}、{ 网络层}、{ 传输层}、{ 应用层}10、在TCP/IP网络中,常见的网络拓扑类型有{ 树} 、总线型、环型、{ 星} 。
11、每个IP地址的长度为{ 32 } 比特,由{ 4}个8位域组成。
12、中国联通IP承载网采用{ 接入}、{ 汇聚}、{ 骨干}三层网络结构13、根据数据电路的传输能力,数据通信可以有{ 单工传输}、{ 半双工传输}、{ 全双工传输}三种通信方式14、10Base2结构采用{ BNC }接头、每一区段最大传送距离是{ 185 }米,10BaseT结构采用{ RJ }接头、每一区段最大传送距离是{ 100 }米。
15、在B类地址中,如果用8位作为子网屏蔽,则可有{ 254 }个子网,每个子网可有{ 354 }台主机。
大数据考试试题及答案一、选择题(每题2分,共20分)1. 大数据的4V特性不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Validity(有效性)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. HDFSD. Pig答案:C3. 下列哪个选项不是大数据技术?A. 数据挖掘B. 数据清洗C. 机器学习D. 数据库管理答案:D4. 在大数据时代,以下哪个不是数据来源?A. 社交媒体B. 传感器C. 传统数据库D. 人工录入答案:D5. 下列哪个不是大数据的分析工具?A. RB. PythonC. ExcelD. Hadoop答案:C6. 以下哪个不是大数据的典型应用场景?A. 客户行为分析B. 金融欺诈检测C. 天气预报D. 个人隐私保护答案:D7. 在大数据架构中,以下哪个不是数据湖的概念?A. 存储原始数据B. 数据格式多样化C. 数据实时分析D. 数据集中存储答案:C8. 以下哪个不是大数据的挑战?A. 数据安全B. 数据存储C. 数据隐私D. 数据共享答案:D9. 在大数据技术中,以下哪个不是分布式计算框架?A. SparkB. HadoopC. FlinkD. Oracle答案:D10. 下列哪个不是大数据的分析方法?A. 描述性分析B. 预测性分析C. 规范性分析D. 比较性分析答案:D二、填空题(每题2分,共10分)1. 大数据技术可以处理的数据类型包括结构化数据、半结构化数据和______数据。
答案:非结构化2. Hadoop的核心组件包括______和MapReduce。
答案:HDFS3. 在大数据领域,______是一种用于实时数据流处理的框架。
答案:Apache Kafka4. 大数据的分析过程通常包括数据采集、数据存储、______和数据可视化。
答案:数据分析5. 机器学习是大数据技术中的一个重要组成部分,它包括监督学习、无监督学习和______学习。
∙最新,8-9月最近考试的赶紧∙ 1.浪潮集团有限公司董事长()表示“互联网+”背后的实质是对大数据的整合运用。
(单选题2分)o A.马云o B.于扬o C.李彥宏o D.孙丕恕∙ 2.计算机发展至今,每隔()年会出现一次人机交互界面的重大变革。
(单选题2分)o A.35o B.25o C.20o D.30∙ 3.根据咨询公司普华永道2015年的调查,有()的被调查者认为信任可能是一个问题。
(单选题2分)o A.69%o B.60%o C.65%o D.55%∙ 4.在我国,()年谢平在其研究报告中首次明确提出“互联网金融”的概念。
(单选题2分)o A.2014o B.2015o C.2016o D.2012∙ 5.下列不属于20世纪90年代中国相继启动的重大信息化应用工程的是()。
(单选题2分)o A.金保o B.本金税o C.金关o D.金卡∙ 6.()是把互联网的创新成果与经济社会各个领域深度融合,推进技术进步、效率提升和组织变革,提升实体经济创新力和生产力,形成更广泛的、以互联网为基础设施和创新要素的经济社会发展形态。
(单选题2分)o A.大数据o B.物联网o C.云计算o D.“互联网+”∙7.渠道在传统模式运营中,为厂家不提供的功能是()。
(单选题2分)o A.消费者需求o B.交易o C.传递价值o D.消费者的反馈∙8.“互联网+()”将促进公共交通服务效率、治理能力大幅提升。
(单选题2分)o A.有机农业o B.绿色生态o C.益民服务o D.便捷交通∙9.()不属于共享流量和用户的开放平台。
(单选题2分)o A.百度开放平台o B.AppStore应用商店o C.Facebooko D.腾讯开放平台∙10.()不是用极限思维打造极致的产品要求。
(单选题2分)o A.管理要盯得紧o B.供给要给得多o C.需求要抓得准o D.自己要逼得狠∙11.美国的波特教授认为()不是后发国家参与国际竞争经历的阶段。
数据通信基础测试卷(一)一、单项选择题。
1、数据与信息的关系表述不正确的是()A、数据是信息的数字表示B、数据时信息的载体C、数据与信息一一对应D、信息是数据的内在含义2、下列关于信道容量的叙述,正确的是()A、信道所能允许的最大数据传输速率B、信道所能提供的同时通话的路数C、以兆赫兹为单位的信道宽带D、信道所允许的最大误码率3、在计算机网络中,信源是指( )A、MODEMB、传输介质C、计算机D、电源4、现代网络系统是建立在技术基础上的计算机网络系统。
( )A、分组交换B、报文交换C、电路交换D、帧中继5、波特率等于()A、每秒传输的比特B、每秒钟可能发生的信号变化的次数C、每秒传输的周期数D、每秒传输的字节数6、在计算机网络通信系统中,作为信源的计算机发出的信号都是信号,作为信宿的计算机所能接收和识别的信号要求必须是信号。
()A、数字,数字B、数字,模拟C、模拟,数字D、模拟、模拟7、以下网络的技术指标中可以用字节每秒作为单位的是()A、比特率B、波特率C、吞吐量D、误码率8、数据链路两端的设备是()A、DTEB、DCEC、DFED、DTE或DCE9、计算机网络中广泛使用的交换技术是()A、线路交换B、报文交换C、分组交换D、信源交换10、对于数据通信方式下列说法中正确的是()A、通信方式可以分为单工通信、双工通信、半单工通信、半双工通信B、单工通信是指通信线路上的数据有时可以按单一方向传送C、半双工通信是指一个通信线路上允许数据双向通信,但不允许同时双向传送。
D、以上说法都不正确11、下列选项中不属于异步传输的特点的是()A、每个字符代码前后的起始和停止位标志字符的开始和结束B、起始和停止位兼做线路两端的同步时钟,而不再需要额外的时钟同步C、速率较低D、字符之间间隔长度一定12、分组交换还可以进一步分成和虚电路两种交换类型。
()A、永久虚电路B、数据报C、呼叫虚电路D、包交换13、帧中继节点在转发时发现拥塞则()A、暂停工作直至拥塞结束B、通知上一级节点停止发送直至拥塞结束C、把到来的帧转发至别处直至拥塞结束D、丢弃来到的帧,直至拥塞结束14、以下选项中属于影响数据传输的内部因素是()A、电磁干扰B、太阳噪音C、工业噪音D、脉动噪音15、下列关于误码率的描述正确的是()A、误码率是衡量数据通信系统正常工作状态下传输可靠性的参数B、采用光纤作为传输介质的数据传输系统的误码率为0C、对于一个数据传输系统误码率越高越好D、当用户一次传输1KB的文件时没有发现传输错误,那么该数据传输系统的误码率为016、使用技术,在发送者和接受者之间事先并不建立实际通路,当发送方有数据快要发送时,先将其存在第一个交换局,随后在传到下一个交换局,每次一个链路。