《大数据导论》在线作业
- 格式:docx
- 大小:40.73 KB
- 文档页数:22
大数据导论考试题及答案一、单项选择题(每题2分,共20分)1. 大数据的4V特性不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Validity(有效性)答案:D2. 以下哪个不是Hadoop生态系统中的组件?A. HBaseB. HiveC. SparkD. MongoDB答案:D3. 在大数据存储中,以下哪个不是分布式文件系统的特点?A. 高可靠性B. 高扩展性C. 低容错性D. 大规模答案:C4. 以下哪个不是大数据分析的关键步骤?A. 数据收集C. 数据存储D. 数据解释答案:D5. 大数据技术中,以下哪个不是数据挖掘的常用算法?A. 决策树B. 聚类分析C. 关联规则D. 线性回归答案:D6. 以下哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 传统制造业答案:D7. 大数据的实时处理框架不包括以下哪一项?A. StormB. FlinkC. HadoopD. Spark Streaming答案:C8. 在大数据技术中,以下哪个不是数据仓库的特点?B. 数据时变性C. 数据非易失性D. 数据的多维性答案:B9. 以下哪个不是大数据平台的架构组件?A. 数据采集B. 数据存储C. 数据处理D. 数据加密答案:D10. 大数据技术中,以下哪个不是数据可视化的作用?A. 数据展示B. 数据分析C. 数据存储D. 数据交互答案:C二、多项选择题(每题3分,共15分)1. 大数据技术可以应用于以下哪些领域?A. 社交网络分析B. 客户关系管理C. 供应链优化D. 交通规划答案:ABCD2. Hadoop生态系统中包括以下哪些组件?A. HDFSB. MapReduceC. YARND. Kafka答案:ABC3. 大数据存储技术中,以下哪些是分布式数据库的特点?A. 可扩展性B. 高可用性C. 数据一致性D. 支持事务处理答案:ABCD4. 大数据技术中,以下哪些是数据清洗的步骤?A. 缺失值处理B. 异常值检测C. 数据去重D. 数据转换答案:ABCD5. 大数据平台的架构组件包括以下哪些?A. 数据源B. 数据存储层C. 数据处理层D. 数据应用层答案:ABCD三、简答题(每题10分,共30分)1. 简述大数据的4V特性。
20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业ACD20春学期( 1709、 1803、 1809、 1903、 1909、2003)《大数据导论》在线作业 --------------------------- 单选题 1.第一个提出大数据概念的公司是 ()。
A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司正确答案 :A 2.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段 ()。
A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段正确答案 :C 3.下面哪一项不是中国发展大数据产业的基础 ()。
A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破 C.大数据应用推动势头良好 D.大数据产业支撑薄弱正确答案 :D 4.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段 ()。
A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段正确答案 :B 5.以下哪项不是数据可视化工具的特性 () A.实时性 B.简单操作 C.更丰富的展现D.仅需一种数据支持方式即可正确答案 :D 6.以下不是数据仓库基本特征的是 () A.数据仓库是面向主题的 B.数据仓库是面向事务的 C.数据仓库的数据是相对稳定的 D.数据仓库的数据是反映历史变化的正确答案 :B 7.哪个选项不属于大数据 4V特点 ? A.Volume B.Valid C.Variety D.Value 正确答案 :B 8.SAN是一种 () A.存储设备 B.专为数据存储而设计构建的网络 C.光纤交换机D.HBA 正确答案 :B 9.下列不属于商业大数据类型的是A.传统企业数据 B.机器和传感器数据 C.社交数据 D.电子商务数据正确答案 :B 10.数据仓库是随着时间变化的 ,下列不正确的是 () A.数据仓库随时间变化不断增加新内容 B.捕捉到的新数据会覆盖原来的快照 C.数据仓库随事件变化不断删去旧的数据内容 D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合正确答案 :C 11.IaaS 是 ()的简称 A.软件即服务 B.平台即服务 C.基础设施即服务D.硬件即服务正确答案 :C 12.PaaS是 ()的简称 A.软件即服务 B.平台即服务 C.基础设施即服务 D.硬件即服务正确答案 :B 13.医疗健康数据的基本情况不包括以下哪项 ? A.诊疗数据 B.个人健康管理数据 C.公共安全数据 D.健康档案数据正确答案 :C 14.大数据的特点不包含 A.数据体量大 B.价值密度高 C.处理速度快 D.数据不统一正确答案 :D 15.下列哪个工具常用来开发移动友好地交互地图 () A.LeafletB.Visual.lyC.BPizzaPieChartsD.Gephi 正确答案 :A --------------------------- 多选题 1.医疗大数据的来源主要包括 () A.制药企业 /生命科学 B.临床医疗 /实验室数据 C.费用报销 /利用率 D.健康管理 /社交网络正确答案 :A 2.常见的分类方法有A.决策树 B.贝叶斯网络 C.遗传算法 D.FP算法正确答案 :A 3.离群点检测的应用包括 ()等。
【奥鹏】[南开大学]19春学期(1709、1803、1809、1903)《大数据导论》在线作业试卷总分:100 得分:100第1题,IaaS是()的简称A、软件即服务B、平台即服务C、基础设施即服务D、硬件即服务正确答案:第2题,下面哪一项不是中国发展大数据产业的基础()。
A、信息化积累了丰富的数据资源B、大数据技术创新取得明显突破C、大数据应用推动势头良好D、大数据产业支撑薄弱正确答案:第3题,用于描述数据分散情况的是()A、分布图B、箱式图C、饼图D、折线图正确答案:第4题,PaaS是()的简称A、软件即服务B、平台即服务C、基础设施即服务D、硬件即服务正确答案:第5题,GFS中的文件切分成()的块进行存储A、32MBB、64MBC、128MBD、1G正确答案:第6题,大数据的最显着特征是() 。
A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高正确答案:第7题,SAN是一种()A、存储设备B、专为数据存储而设计构建的网络C、光纤交换机D、HBA正确答案:第8题,用于描述相等时间间隔下连续数据随时间变化趋势的是()A、折线图B、散点图C、条形图D、饼图正确答案:第9题,下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()A、ggplot2B、networkC、ggmapsD、animation正确答案:第10题,医疗健康数据的基本情况不包括以下哪项A、诊疗数据B、个人健康管理数据C、公共安全数据D、健康档案数据正确答案:第11题,以下哪项不是数据可视化工具的特性()A、实时性B、简单操作C、更丰富的展现D、仅需一种数据支持方式即可正确答案:第12题,数据仓库是随着时间变化的,下列不正确的是()A、数据仓库随时间变化不断增加新内容B、捕捉到的新数据会覆盖原来的快照C、数据仓库随事件变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合正确答案:第13题,DAS代表的意思是()A、两个异步存储B、数据归档软件C、连接一个可选的存储D、直连存储正确答案:第14题,大数据的特点不包含A、数据体量大B、价值密度高C、处理速度快D、数据不统一正确答案:第15题,下列哪个R语言扩展包可以创建带有点和边的网络图()A、ggplot2B、networkC、ggmapsD、animation正确答案:第16题,大数据的技术支撑有()A、计算速度加快B、存储成本下降C、机器智能化D、数据量增加正确答案:,B,C第17题,医疗领域如何利用大数据A、临床决策支持B、个性化医疗C、社保资金安全D、用户行为分析正确答案:,B,C,D第18题,大数据时代预测人类移动行为的数据来源有A、志愿者定位数据B、装有导航设备的出租车轨迹数据C、手机终端定位于通讯记录D、社会网络签到数据正确答案:,B,C,D第19题,互连网上出现的海量信息可以划分为三种,分别为( )A、结构化信息B、非结构化信息C、半结构化信息D、特殊化信息正确答案:,B,C第20题,大数据在社交网络中的应用A、用户偏好、情感、社交网络结构B、用户画像、精准推荐C、舆情监控、突发事件预警D、预测外部趋势正确答案:,B,C,D第21题,数据工厂包括A、低能耗数据中心B、超大规模讲分布式架构C、新一代智能自动化运维D、超强云安全正确答案:,B,C,D第22题,可使用##,##,##进行光滑。
南开大学20春学期《大数据导论》在线作业
试卷总分:100 得分:100
一、单选题(共15 道试题,共30 分)
1.大数据的特点不包含
A.数据体量大
B.数据不统一
C.处理速度快
D.价值密度高
答案:B
2.基础设施即服务的英文简称是
A.SaaS
B.PaaS
C.IaaS
答案:C
3.下面哪一项不是中国发展大数据产业的基础()。
A.大数据技术创新取得明显突破
B.大数据应用推动势头良好
C.大数据产业支撑薄弱
D.信息化积累了丰富的数据资源
答案:C
4.数据清洗的方法不包括
A.重复数据记录处理
B.缺失值处理
C.噪声数据清除
D.一致性检查
答案:A
5.以下不是数据仓库基本特征的是()
A.数据仓库的数据是相对稳定的
B.数据仓库的数据是反映历史变化的
C.数据仓库是面向事务的
D.数据仓库是面向主题的
答案:C
6.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
答案:A
7.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业-0001 试卷总分:100 得分:0一、单选题(共15道试题,共30分)1.医疗健康数据的基本情况不包括以下哪项?A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据2.数据仓库是随着时间变化的,下列不正确的是()A.数据仓库随时间变化不断增加新内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合3.大数据的特点不包含A.数据体量大B.价值密度高C.处理速度快D.数据不统一4.哪个选项不属于大数据4V特点?A.VolumeB.ValidC.VarietyD.Value5.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。
A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段6.下面哪一项不是中国发展大数据产业的基础()。
A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱7.基础设施即服务的英文简称是A.IaaSB.PaaSC.SaaS8.下列哪个R语言扩展包可以创建带有点和边的网络图()A.ggplot2workC.ggmapsD.animation9.MapReduce中的Map和Reduce函数使用()进行输入输出A.key/value 对B.随机数值C.其他计算结果10.大数据的最显著特征是()。
A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高11.下列不属于Google云计算平台技术架构的是()A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC212.以下不是数据仓库基本特征的是()A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的13.()是 Microsoft Office 的核心组件A.SQLB.WORDC.PPTD.EXCEL14.数据清洗的方法不包括A.缺失值处理B.噪声数据清除C. 一致性检查D.重复数据记录处理15.DAS代表的意思是()A.两个异步存储B.数据归档软件C.连接一个可选的存储D.直连存储二、多选题(共15道试题,共30分)1.大数据智能感知层:主要包括()及软硬件资源接入系统A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系2.层次方法可以分为()A.K均值算法B.K中心点算法C.凝聚法D.分裂法3.以下可以用于数据可视化的是()。
南开大学智慧树知到“物联网工程”《大数据导论》网课测试题答案(图片大小可自由调整)第1卷一.综合考核(共15题)1.大数据时代预测人类移动行为的数据特点是()。
A.多样化B.数据量大C.维数高D.变化快2.大数据时代预测人类移动行为的数据特点是()A.多样化B.数据量大C.维数高D.变化快3.下列不属于商业大数据类型的是()A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据4.MspReduce中的Map和Reduce函数使用()进行输入输出。
A.key/value对B.随机数值C.其他计算结果5.数据分析的类型根据数据分析深度可以分为()A.描述性分析B.预测性分析C.规则性分析6.数据隐私和安全是大数据发展面临的挑战。
() A.正确B.错误7.数据处理的两种方法是(),()A.批处理B.流处理C.单个处理D.交叉处理8.原始数据的错误,异常值和冲突值必须被清理。
典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。
()T.对F.错9.数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式。
()A.正确B.错误10.数据隐私和安全是大数据发展面临的挑战。
()T.对F.错11.IaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务12.MapReduce中的Map和Reduce函数使用()进行输入输出。
A.key/value对B.随机数值C.其他计算结果13.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据。
()A.对B.错14.基于大数据的临床决策支持系统的架构包括()A.支撑层B.大数据分析层C.网络层D.应用层15.常见的分类方法有()。
A.决策树B.贝叶斯网络C.遗传算法D.FP算法第2卷一.综合考核(共15题)1.云存储是一个由网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等组成的复杂系统。
20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业试卷总分:100 得分:92
一、单选题 (共 15 道试题,共 30 分)
1.大数据的特点不包含
A.数据体量大
B.价值密度高
C.处理速度快
D.数据不统一
答案:
2.基础设施即服务的英文简称是
A.IaaS
B.PaaS
C.SaaS
答案:A
3.下面哪一项不是中国发展大数据产业的基础()。
A.信息化积累了丰富的数据资源
B.大数据技术创新取得明显突破
C.大数据应用推动势头良好
D.大数据产业支撑薄弱
答案:D
4.数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
答案:D
5.以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
答案:B
6.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
答案:
7.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
答案:D
基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
答案:A
下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
答案:D
数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
答案:D
以下不是数据仓库基本特征的是()
A:数据仓库是面向主题的
B:数据仓库是面向事务的
C:数据仓库的数据是相对稳定的
D:数据仓库的数据是反映历史变化的
答案:B
数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段。
《大数据导论》在线作业一、单选题共15题,30分1基础设施即服务的英文简称是A IaaSB PaaSC SaaS我的答案:A2用于描述相等时间间隔下连续数据随时间变化趋势的是()A折线图B散点图C条形图D饼图我的答案:A3下列不属于商业大数据类型的是A传统企业数据B机器和传感器数据C社交数据D电子商务数据我的答案:B4以下哪项不是数据可视化工具的特性()A实时性B简单操作C更丰富的展现D仅需一种数据支持方式即可我的答案:D5MapReduce中的Map和Reduce函数使用()进行输入输出A key/value对B随机数值C其他计算结果我的答案:A6以下不是数据仓库基本特征的是()A数据仓库是面向主题的B数据仓库是面向事务的C数据仓库的数据是相对稳定的D数据仓库的数据是反映历史变化的我的答案:B7IaaS是()的简称A软件即服务B平台即服务C基础设施即服务D硬件即服务我的答案:C8大数据的最显著特征是() 。
A数据规模大B数据类型多样C数据处理速度快D数据价值密度高我的答案:A9大数据的特点不包含A数据体量大B价值密度高C处理速度快D数据不统一我的答案:D10数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A运营式系统阶段B用户原创内容阶段C感知式系统阶段我的答案:B11数据仓库是随着时间变化的,下列不正确的是()A数据仓库随时间变化不断增加新内容B捕捉到的新数据会覆盖原来的快照C数据仓库随事件变化不断删去旧的数据内容D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合我的答案:C12下列哪个工具常用来开发移动友好地交互地图()A LeafletB Visual.lyC BPizza Pie ChartsD Gephi我的答案:A13购物篮问题是的典型案例A数据变换B关联规则挖掘C数据分类我的答案:B14哪个选项不属于大数据4V特点?A VolumeB ValidC VarietyD Value我的答案:B15GFS中的文件切分成()的块进行存储A32MBB64MBC128MBD1G我的答案:B二、多选题共15题,30分1大数据采集主要包括()四种。
A系统日志采集B网络数据采集C数据库采集D其他数据采集我的答案:ABCD2大数据智能感知层:主要包括()及软硬件资源接入系统A数据传感体系B网络通信体系C传感适配体系D智能识别体系我的答案:ABCD3去除噪声使得数据光滑的技术主要有:A分箱B回归C离群点分析我的答案:CBA4大数据的技术支撑有()A计算速度加快B存储成本下降C机器智能化D数据量增加我的答案:ACB5它们把原数据变换或投影到较小的空间。
A小波变换B中心化变换C主成分分析D对数变换我的答案:AC6可使用进行光滑。
A最大值B箱中位数C箱边界D箱均值我的答案:CDB7数据处理的两种方法是A批处理B流处理C单个处理D交叉处理我的答案:AB8交通数据分析可用于:A交通流量实时分析B合理进行道路规划C信号灯智能调度D实时路况查询播报我的答案:ABCD9统计图表的可视化方法主要包括()A散点图B折线图C条形图D饼图我的答案:DCAB10医疗大数据特点:除了包含了大数据4个“V”的特点之外还有() A多态性B时效性C不完整性D冗余性我的答案:BADC11百度大数据引擎主要包含三大组件()A开放云B数据工厂C百度大脑。
我的答案:CBA12层次方法可以分为()A K均值算法B K中心点算法C凝聚法D分裂法我的答案:DC13网络数据采集常用的是通过或等方式从网站上获取数据信息。
A网络爬虫B网站公开APIC手动获取我的答案:AB14常见的分类方法有A决策树B贝叶斯网络C遗传算法D FP算法我的答案:CBA15数据归约(Data Reduction)主要有()A维度规约B样本规约C数据聚集D离散化概念分层我的答案:ABCD三、判断题共20题,40分1社交数据分析工具是基于社交网站的海量数据而衍生出来的服务型产品,但是同时它们反过来也为社交网站提供了巨大的参考价值。
A对B错我的答案:A2数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据A对B错我的答案:A3半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
A对B错我的答案:A4大数据虽然拥有大量的价值信息,但是价值密度较低A对B错我的答案:A5MapReduce则为海量的数据提供了并行计算,从而大大提高了计算效率;A对B错我的答案:A621世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。
A对B错我的答案:A7Spark是基于内存的大数据并行计算框架A对B错我的答案:A8谷歌大数据流感趋势已经可以替代当前政府在流感监测方面的工作。
( )A对B错我的答案:B9数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率“。
A对B错我的答案:A10利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
A对B错我的答案:B11内存分析数据量比海量分析数据量大A对B错我的答案:B12NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。
A对B错我的答案:A13云计算(Cloud Computing) 是一种分布在大规模数据中心、能动态的提供各种服务器资源以满足科研、电子商务等领域需求的计算平台。
A对B错我的答案:A14数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。
因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。
A对B错我的答案:A15FP-growth算法需要对数据库进行三次扫描A对B错我的答案:B16宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确支持“互联网+”医疗、“互联网+”健康。
A对B错我的答案:A17云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。
A对B错我的答案:A18大数据的挑战仅仅来自于数据的增长。
A对B错我的答案:B19交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。
A对B错我的答案:A20结构化数据是用excel结构表现的数据A对B错我的答案:B一、单选题共15题,30分1基础设施即服务的英文简称是AIaaSBPaaSCSaaS学生答案:A2用于描述相等时间间隔下连续数据随时间变化趋势的是() A折线图B散点图C条形图D饼图学生答案:A3下列不属于商业大数据类型的是A传统企业数据B机器和传感器数据C社交数据D电子商务数据学生答案:B4以下哪项不是数据可视化工具的特性()A实时性B简单操作C更丰富的展现D仅需一种数据支持方式即可学生答案:D5MapReduce中的Map和Reduce函数使用()进行输入输出Akey/value对B随机数值C其他计算结果学生答案:A6以下不是数据仓库基本特征的是() A数据仓库是面向主题的B数据仓库是面向事务的C数据仓库的数据是相对稳定的D数据仓库的数据是反映历史变化的学生答案:B7IaaS是()的简称A软件即服务B平台即服务C基础设施即服务D硬件即服务学生答案:C8大数据的最显著特征是() 。
A数据规模大B数据类型多样C数据处理速度快D数据价值密度高学生答案:A9大数据的特点不包含A数据体量大B价值密度高C处理速度快D数据不统一学生答案:D10数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A运营式系统阶段B用户原创内容阶段C感知式系统阶段学生答案:B11数据仓库是随着时间变化的,下列不正确的是()A数据仓库随时间变化不断增加新内容B捕捉到的新数据会覆盖原来的快照C数据仓库随事件变化不断删去旧的数据内容D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合学生答案:C12下列哪个工具常用来开发移动友好地交互地图()ALeafletBVisual.lyCBPizza Pie ChartsDGephi学生答案:A13购物篮问题是的典型案例A数据变换B关联规则挖掘C数据分类学生答案:B14哪个选项不属于大数据4V特点?AVolumeBValidCVarietyDValue学生答案:B15GFS中的文件切分成()的块进行存储A32MBB64MBC128MBD1G学生答案:B二、多选题共15题,30分1大数据采集主要包括()四种。
A系统日志采集B网络数据采集C数据库采集D其他数据采集学生答案:ABCD2大数据智能感知层:主要包括()及软硬件资源接入系统A数据传感体系B网络通信体系C传感适配体系D智能识别体系学生答案:ABCD3去除噪声使得数据光滑的技术主要有:A分箱B回归C离群点分析学生答案:ABC4大数据的技术支撑有()A计算速度加快B存储成本下降C机器智能化D数据量增加学生答案:ABC5和,它们把原数据变换或投影到较小的空间。
A小波变换B中心化变换C主成分分析D对数变换学生答案:AC6可使用,,进行光滑。
A最大值B箱中位数C箱边界D箱均值学生答案:BCD7数据处理的两种方法是,A批处理B流处理C单个处理D交叉处理学生答案:AB8交通数据分析可用于:A交通流量实时分析B合理进行道路规划C信号灯智能调度D实时路况查询播报学生答案:ABCD9统计图表的可视化方法主要包括()A散点图B折线图C条形图D饼图学生答案:ABCD10医疗大数据特点:除了包含了大数据4个“V”的特点之外还有() A多态性B时效性C不完整性D冗余性学生答案:ABCD11百度大数据引擎主要包含三大组件()A开放云B数据工厂C百度大脑。
学生答案:ABC12层次方法可以分为()AK均值算法BK中心点算法C凝聚法D分裂法学生答案:CD13网络数据采集常用的是通过或等方式从网站上获取数据信息。
A网络爬虫B网站公开APIC手动获取学生答案:AB14常见的分类方法有A决策树B贝叶斯网络C遗传算法DFP算法学生答案:ABC15数据归约(Data Reduction)主要有()A维度规约B样本规约C数据聚集D离散化概念分层学生答案:ABCD三、判断题共20题,40分1社交数据分析工具是基于社交网站的海量数据而衍生出来的服务型产品,但是同时它们反过来也为社交网站提供了巨大的参考价值。
A对B错学生答案:A2数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据A对B错学生答案:A3半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。