探索大数据和人工智能最全试题
- 格式:docx
- 大小:99.53 KB
- 文档页数:30
大数据与人工智能试题及答案下列数据中不属于大数据的是() [单选题] *A.某同学网上高考报名的数据(正确答案)B.电商平台的用户浏览、交易时产生的数据C.全体手机用户的联网信息、实时定位数据D.各地交通摄像头记录的全部数据下列不属于大数据的特征是() [单选题] *A.数据规模大B.数据类型多样C.数据迅变性D.数据价值密度高(正确答案)答案:D监控不间断地录制视频产生了大量的视频数据,而有价值的数据仅有十几秒,这主要体现了大数据的( )特征。
[单选题] *A.价值密度低(正确答案)B.数据体量大C.数据变化速度快D.数据类型多对于大数据特征的描述,错误的是()。
[单选题] *A.价值性(价值密度低)B.海量的数据规模(巨量性)C.快速的数据变化(迅变性)D.单一的数据类型(单一性)(正确答案)大数据的特征有() [单选题] *①价值性②巨量性③迅变性④多样性A.①②③B.①②④C.①③④D.①②③④(正确答案)下列大数据服务中,没有应用电商大数据的是() [单选题] *A.农业灾害预警(正确答案)B.商品精准营销C.商品自动补货D.商品智能推荐以下说法正确的是() [单选题] *大数据技术可以优化社会管理模式②大数据技术创新可以提升服务质量③大数据技术可以开辟科学研究的新途径④通过时大数据的挖掘以及对分析结果的应用,可以给生活带来便利A.①②④.B.①②③C.②③④D.①②③④(正确答案)大数据在我们的生活中无处不在,下列说法正确的是() [单选题] *A.大数据带给我们的全部都是正面的影响B.大数据给我们的生活带来便捷的同时也会产生负面影响(正确答案)C.大数据可能会带来个人信息泄露,我们应该全盘否定D.大数据只会给我们带来信息伤害与诈骗答案:B电商网站收集客户的个人数据,通过分析,根据客户的喜好推荐不同的商品属于大数据的哪一种典型应用() [单选题] *A.医疗健康B.社区管理C.智慧城市D.生活服务(正确答案)人工智能的英文缩写是( ) [单选题] *A.ATC.ITD.AI(正确答案)人工智能的目的是让机器能够( ),以实现某些脑力劳动的机械化. [单选题] *A.完全代替人的大脑B.模拟、延伸和扩展人的智能(正确答案)C.完全代替人的工作D.具有像人一样的高级智能“ 测试”是测试机器智能的一种方法() [单选题] *A.冯•诺侬曼B.明斯基C.麦卡锡D.图灵(正确答案)进行身份认证的技术手段很多,下列属于生物特征识别认证方式的是() [单选题] *A. USB KeyU证B.账号加密码认证C.短信验证码认证D.指纹识别认证(正确答案)下列应用,没有体现人工智能技术的是() [单选题] *A.通过指纹识别打开智能门锁B.无人驾驶汽车实现自动驾驶C.使用Word “自动更正”功能(正确答案)D.停车收费系统扫描识别车牌生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。
2020年专业技术人员公需科目人工智能眼中的大数据技术试题和答案单选题1.根据本讲,人工神经网络出现于()。
(0.4分)A.1943年B.1956年C.1980年D.1990年√答对2.根据本讲,物理符号系统出现于()。
(0.4分)A.1943年B.1956年C.1980年D.1990年√答对3.根据本讲,智能机器人出现于()。
(0.4分)A.1943年B.1956年C.1980年D.1990年√答对4.根据本讲,感知信息的三位一体用()可以代表。
(0.4分)A.视频B.文字C.语音信息D.图片√答对5.根据本讲,()是人类活动的基本模式。
(0.4分)A.环境作用B.主体活动C.主体跟客体相互作用D.主体对客体的单向作用。
√答对多选题1.根据本讲,我们认识到的资源有()。
(0.5分)A.物质B.算法C.技术D.能力E.信息√答对2.根据本讲,以下()是大数据的特点。
(0.5分)A.低速B.容量C.多样D.真实E.高速√答对3.根据本讲,人工智能的研究路径有()。
(0.5分)A.模拟思维B.模拟大脑皮层的结构C.模拟大脑思维的功能D.进一步模拟结构E.模拟行为×答错4.根据本讲,人工智能最简单的模型包括()。
(0.5分)A.系统B.平台C.主体D.客体E.载体√答对5.根据本讲,感知信息是()三位一体。
(0.5分)A.形式B.内容C.价值D.用户E.平台√答对判断题1.根据本讲,数据是信息的载体。
(0.4分)√答对2.根据本讲,在信息时代,最宝贵的资源是技术。
(0.4分)√答对3.根据本讲,高度重视数据就是高度重视信息。
(0.4分)√答对4.根据本讲,人工智能路径并没有形成统一的理论,是人工智能发展最重要的问题。
(0.4分)√答对5.根据本讲,主体跟客体相互作用是人类活动的基本模式。
(0.4分)√答对。
1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师2、整个 MapReduce的过程大致分为Map、 Shuffle、 Combine、()?A. ReduceC. CleanD. Loading3、在Spak的软件栈中,用于交互式查询的是A. SparkSQLD. Spark Streaming4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系?A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系5、下列选项中,不是 kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧义性C.知识依赖D.语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归10、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC.移娃D.大云11、HDFS中 Namenodef的 Metadata的作用是?A.描述数据的存储位置等属性B.存储数据C.调度数据D.12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?A大数据技术B.互联网技术C.游戏技术D.影像技术13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭14、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频15、以下数据单位换算错误的是?=1024BB. 1GB=1024MB=1000GBD. 1MB=1024KB16、下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性17、BP神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D.显层18、以下哪个不是语音识别的范畴?A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容20、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项中,哪项是分布式文件存储系统?B. FlumeC. KafkaD. Zookeeper22、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表24、下列选项中,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论級别的突破。
中国移动探索⼤数据与⼈⼯智能试题(⼀)⼤数据基础1、⽝數捋特征育5(不包括】E IV 提出的新持紅)? O A . 1 O B ,? o C. 3D. 42、吕前电⾔运营筍⼤数握发展仍辻在什么阶啟?@ A. 索 0 E ,应⽤O C 咸懸O D 扩展头下列选项中,不是⼤数堯出⼀部廿皓是?■ A.海昼.⼗隽 ''C.1啡真实性真备邸丙序贯?A.准确性Q c 可信赖度2.电?M 的拴业运三它理⼬⼖⼠」U 于⽐⼝⼆凭I ⼯划盼PiT :川⽦.咗='⼟巳⼆Li 吒札:苗「主5盼为輕L wocti ■寵⼀⼲託扭:昕ism 序吾名的园⼝斯⼈陶开isenFO 此O G 2DI2運 1 3. 2011C' D. ?DI0⽐北苍1豚:5⼩也5?⼨护锁磁克出和床叽在埠H ⼚却正注的?吭.⽹⽯⼚⼳总⽐?O C-⾎ O D 封邇□ B.不确左性 Z 0粗性k E 咅识*沪品保廡奇⼝郭分,下列伏曲盛之⼀7 O A.涪吉台瑜 O C.曲酣别@ B.佬备砖 ? J D.恒义理餐2、IBM 的深适左1997毎曲決定>5%旷為六个回合G,弔了⾟少步启快卡斷餐<歩天⾈⼦认?O A 15 @ B ? 22 O C. 30 O D ? 282. mapreduu 计854兰⽤于挪K 無? O A 券眈处理 @ C.农理 3 SparkS^CIIentS.在$堆写好spar 媲丰M 進过spark submit 命刽g 交⾄什么地⽅也⾏?O A. HDFS@ a s“y C B. HBASE O D ? Zookeeper 1、養国软件公司Splunk 是第⼀家上市的⼊数据处理公司,它罡在啷⼀年上您的? O A. 2009 o B- 2011 O D ? 2010@ C. 2012、以"FF是⼤敎花是?O A. 1 O B. 3@ C. 5 O D. 73、电信⾏业的客户关系管理中f肓户⽣命周期管理包括⼏个阶段?1. ⽉?世畀俎齐论以■⼈~⼼怡任)贱念与刃仝⼟4⼱了 g球苗曲怜C ?13?: >??在"⼏?冲刑⼔岀的⾃0遇信找仙BL*?5^Z?Hn.±5.丙3下审椰曲甌颐幵唄覆⼑谄?Q A.昨沁Q B. ?<8wej□ c?⽤户⾏为□ D.数有⾄2、嗤肄乔论坛UTK?瘦矩冬三砸-妾冇"全孩頸加渕⾆⾫1圾)》尼过龙古各⾢師珈越夭蜒$1些⽅乖莖X? 义?Q A. Q 3.改竺吨Q c砂冲吐Q D?恥匪安全I ⼼廖够三王魅I三:禎W匏辭、施.传胡坯為按博穌尿為引虾,外似I琵冬⼆W芜游酣,⼈朴振、聲F奇涓主雒郴F⿃當H3Z峯茫1題刊t妙?A.盘舐0 B?轴率0 csw影0 D? AST52、下列选顶中.不是⽬空i吾⾔处理的解决⽅法的呈?O A.规则⽅法? C週归⽅法O B.统H⽅法O D?深度字号⽅法3、IBM的深蓝在1997年的决定胜负的第六个回合中r⽤了多少步迫使卡斯怕罗夫投⼦认输O A. 15 ? B 22 O C. 30 O D. 281、在晋謝⽎颐領域r⼈⼯彗能可以结台按费告的?E些⽅⾯进^运算?A.财务状况SB.风险侯好C.芟财吕标□D.⾝体状况2,⼔前主许曲記5你異亡⾍苗⼈⼯書能发艇阶段,曲眩在⼘列葺些万tWY寻显善进于/A.進⾳⾅!|B.圉像上理U拧索太空D*叽器駐译2. a^Nd$QliH££S . £MttAMMS .更骄了电対SQUMO讹”⽽⽬科霑■^團■倒6迈.⽤切曲⾋帘r Prerto r DrtllE^T (岂植柯⽆皐:卒碎尬晅Wig "就不⼀⼀列¥7■: ,M那只丽*哼IHK*釧孚"忖<(?制和R+fJucHl=7Tffiqfj FQ A 丸it11!3%语⾳识别常⽒的壹⽤有四个?下列不杲當冃应庄芒罡?O c.导航1 、下列知t中,⽌⼯替⽼壬)基础字零有7c, BPmeas(⼆)⼈⼯智能1.下列谨頊中,不是⼈⼯昔能的基⾯设葩的是?A⼕咖务器 b GPU服务器C.专尽芯⽚i?D.专胃显悵2.总曲祚咗刁弟上更习于匿燦辻是存正⽍昌耙i⼯总£三⼘⾍它电鎏⽯兰.看EP⽍囲中.狰林屋三种堵构IB?B之⼀?■- c.蚩睾样>i D.令逍M ⼈⼯替能在更疗键辭域应⽤⼴泛,下列不是主妄应⽤圾录养是?O 4虚拟耻理O氐医芋影傑◎C圭⼑机昶O D,宫葬学1.巨前主流哥克仍然集中升昌⼈⼯替蚩⾐展航彦,那么在下列啣些⽅⾯取律昱苜谨歩?E.图像C挥索太空2 监膏学习的回⽈⽅注崗⾆:⼝A炭性回归B c券项武回归Q B.进辑回归D.单⼀回归(三)⼤数据技术介绍1.下列造项中,郡项是疔朽式⽂件存储磁?@ A- HDFS O E Flume'_ " C, Kafka O D. Zookeeper2. uidp educell算慎型运円于鄆种任务?()X塞线程上理C.批则< ROD是⽩多个什么俎成/|:电)A. palition B. computer C* Action D. T r ansfornnatio31. MapReduce⼼质上兵呈个港单悽型.便⽤起集很昱筆坡?那么下列珈些技相tMapReduce的便⽤简单化?X YARN B. OozieQ C? Hive Q D. Presto2、Hive是不适台⽤于卖时要求较⾼的应⽤场黒?有舜些原因?□ A.计莫速度慢Q B.C.计其速⽪快D.淞低1、下列歴项中r正瀚描it Flume刃谿S芳的⽀陆是?O A.只能佼⽤HDFS坯斷O c不就烦⽂昨琢@) B.可以配季据溥O D?不輙⽤⽬2. Spark是在i專⼀年开诗的?0 A. 2011 (§) B? 2010 0 c 2009 O D? 20123、Spark Streaming是什么钦件栈中的流计算?'?) A. Spark O C. Hadoop O B. Storm O D? Rume1、HDFS在骑箜场旦中表現识堂?2 ⽦后?予..mGiYr谆中丰坊监?忡.我们可以盘⼖敷病分帀?⾍島垃芍空汨厅少祢今析丈匪分先龛申*?□A.⼝R 恶Q C. A)& □ D.专逻分祈Q B.?Kgiis^^nT□ D.⽹⼔交咨P理爭核⼆1. 今年.枷盼桁務岀现⽦給住的新⽅法?从处液多d占(理E埋论込喘会产⽣理论駆!的姬商炉刘$5唤£为刘畑⼖咖忻如⼼按 *? @)A.机砂习O 吐AI??O G KM*7 O 0.習他■2、⽵郁现.利⽤⼤昨优化了什么.从停到柠⾼了枷私古,K?低徇魔6E本的⽬的7O⼈授⽊应⽤@B.擁蚀aO c. 车O D? wrss^3、下列选项中正确说明价砖质低的是7久100万数头{中肖50万肖效斑;1000万字憨拇中⾃100万⾃O D?10万仪敛35中化1万<5x5?2JS3MB. lTEJS头;中有1KB⾃。
人工智能题材的行测题
以下是一份关于人工智能题材的行测题,供参考:
1. 下列关于人工智能的描述,正确的是:
A. 人工智能是一种模拟人类智能的技术,它可以完全替代人类进行决策和思考
B. 人工智能只能应用于计算机科学领域,无法在其他领域发挥重要作用
C. 人工智能的应用场景广泛,包括但不限于医疗、金融、交通和制造业等领域
D. 人工智能的发展已经超越了人类的智能水平,成为了世界上最先进的技术
2. 关于人工智能的发展趋势,以下哪种描述不正确?
A. 人工智能技术将越来越成熟,应用场景将越来越广泛
B. 人工智能将会与物联网、大数据等技术深度融合,形成更加智能化的解决方案
C. 人工智能的发展将导致大量人类失业,因为机器可以完全替代人类的劳动
D. 人工智能将会在教育、医疗等领域发挥更加重要的作用,提高人们的生活质量
3. 下列关于人工智能伦理问题的描述,正确的是:
A. 人工智能的发展不应该受到任何限制,因为这会阻碍技术的进步
B. 人工智能的发展应该完全由政府来掌控,以确保技术的安全和可控性
C. 人工智能的应用应该注重保护个人隐私和数据安全,避免滥用和侵犯个人权益
D. 人工智能的发展不应该考虑伦理问题,因为这会影响技术的商业化进程。
人工智能伦理学慕课试题及答案完整人工智能的历史1. [多选题] 对人工智能常见的误解有哪些( )A.人工智能就是机器学习B.机器学习只是人工智能中的一个方向C.人工智能最近十年受到深度学习的驱动较多D.人工智能就是深度学习我的答案:AD2. [判断题] 哲学思维对于人工智能的重要性表现在,哲学所强调的批判性思维有助于认清人工智能发展中的问题。
( )我的答案:对3. [判断题] 深度学习在人工智能领域的表现并不突出。
( )我的答案:错符号人工智能1. [单选题] 人工智能作为一门学科的建立时间是( )。
年年年年我的答案:A2. [单选题] 人工智能与计算机学科的关系是( )。
A.计算机学科的主要驱动力是人工智能研究B.计算机是人工智能研究的一个领域C.人工智能是计算机学科的一个分支D.人工智能与计算机学科没有联系我的答案:C3. [单选题] 计算机之父是( )。
A.约翰·麦卡锡B.艾伦·图灵C.赫尔伯·西蒙D.马文·明斯基我的答案:B4. [判断题] 符号AI是将人的思维通过逻辑语言制成流形图让计算机去执行。
( )我的答案:对5. [判断题] 通用问题求解器需要寻找全局最优解。
( )我的答案:错人工神经网络1. [单选题] ( )是现在新出现的人工智能的研究方向。
A.深度学习B.人工神经元网络C.贝叶斯网络D.类脑人工智能我的答案:D2. [单选题] 深度学习中的“深度”是指( )。
A.计算机理解的深度B.中间神经元网络的层次很多C.计算机的求解更加精准D.计算机对问题的处理更加灵活我的答案:B3. [多选题] 人工神经元网络与深度学习的关系是( )。
A.人工神经元网络是深度学习的前身B.深度学习是人工神经元网络的一个分支C.深度学习是人工神经元网络的一个发展D.深度学习与人工神经元网络无关我的答案:AC4. [判断题] 符号AI不是人工智能的正统。
( )我的答案:错5. [判断题] 相比于人工神经元网络和深度学习,类脑人工智能对人类大脑的神经回路具有更深入的了解。
史上最全的大数据面试题,大数据开发者必看在大数据领域,面试常常是求职者获取工作机会的重要环节。
面试官会针对各个方面提问,从技术知识到项目经验,从算法能力到数据处理能力,全方位考察候选人的综合素质。
为了帮助大数据开发者准备面试,本文整理了一份史上最全的大数据面试题,供参考使用。
一、Hadoop基础知识1·Hadoop的核心组件有哪些?分别简要介绍。
2·HDFS的特点和工作原理是什么?3·MapReduce的工作原理是什么?举例说明MapReduce的运行流程。
4·Hadoop集群的搭建步骤和注意事项是什么?5·Hadoop环境中如何进行数据备份和恢复操作?二、Hadoop生态系统1·Hive和HBase有什么区别?适用场景分别是什么?2·Pig和Hive的功能和使用场景有何异同?3·Sqoop和Flume的作用及使用场景有哪些?4·ZooKeeper的作用是什么?简要介绍其应用场景。
5·Spark和Hadoop的区别是什么?它们之间如何共同工作?三、大数据处理技术1·数据采集的方法有哪些?请简要说明每种方法的原理和适用场景。
2·数据清洗的过程和步骤有哪些?如何处理用户输入的脏数据?3·数据存储有哪些方式?请简要介绍每种方式的特点和适用场景。
4·数据挖掘常用的算法有哪些?请简要说明每种算法的原理和适用场景。
5·数据可视化的方法和工具都有哪些?请简要介绍每种方法和工具的特点和适用场景。
四、大数据实战项目1·请简要介绍你参与过的大数据项目,包括项目背景、使用的技术和取得的成果。
2·在项目中如何解决数据倾斜的问题?请具体描述解决方案。
3·在项目中如何保证数据的安全性和隐私性?4·在处理大规模数据时,如何优化性能和提高效率?5·请描述一个你在项目中遇到的难题,并介绍你是如何解决的。
(一)大数据基础(二)人工智能(三)大数据技术介绍1、MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系? OA. 数量越多处理时间越长B.数量越多处理时间越短OC. 数星越小处理时间越短0 D. 没什么关系2、下列选项中,不是kafka适合的应用场景是?()A.日志收集B.消息系统C.业务系统0 D. 流式处理1、大数据特征有几种(不包括IBM提出的新特征) ? OA.1O B.2O C.3D.42、目前电信运营商大数据发展仍处在什么阶段?A.探索OC.成熟OD.扩展3.下列选项中,不是大数据的-部分的是?OA.海量计算:O B. 大量数据管理O C. 数据分析◎D. 单机计算1、数据真实性具备哪两种特质?V A. 准确性口B. 不确定性口C. 可信赖度口D. 杂乱性2.电信行业的企业运营:理中。
经营分析和市场监测中。
我们可以通过数据分析对业务和市场经营状况进行总结和分析。
主要分为哪些种类?A日报口B.周报C月报口0.专暨分析1。
EMC World是哪年在拉斯维加聯著名的威尼斯人店开畔的?口A 2009。
B. 2011◎C.2012◎D. 20102.随着闭源软件在数据分析领域的地盘不断缩小,老牌T厂高正在改变商业模式,向着什么靠拢?OA团源◎B.开源OC开放OD.封闭3.下列造项中正情说明价已度低的是?。
A. 100万数据中有50万有效数据。
B.1TB数据中有1KB有效数据。
C. 100万0数据中南100万有效数据◎D. 10万条数据中有1万有效数据1.语音识别产品体系有四部分,下列哪项不是体系之- ?◎A.语音合成◎B.请音擴放◎C. 语音识剔0 D.適义理解2. IBM的深蓝在1997年的决定胜负的第六个回台中,用了多少步迫使和斯帕罗夫投子认输OA.15◎B.22◎D.283. BP神经网络的学习规则是?O A梯度上升法。
B.梯度下降法。
C梯度提升法。
D.梯度曲线法、下列选项中,寒项是分布式文件存储系统?o A HDFSO B Flume0 c Katla◎D. Zokeepe2. mapreduceit算模型近用于哪种任务?( ) A. 多线程处理◎B. 有关联的行处理。
人工智能应用方向测试题一、单选题(共70题,每题1分,共70分)1、下列选择中,哪个不是关键词提取常用的算法?A、TextRankB、TE-IDFC、SSAD、1DA正确答案:C2、可以有效解决过拟合的方法包括A、增加特征数量B、训练更多的迭代次数C、采用正则化方法D、增加样本数量正确答案:C3、下列那种模型可以被用于文本相似度(documentSinIiIarity)问题?()A、上述所有方法均可B、在语料中训练一个由词到向量(WOrd2vector)的模型来对文本中呈现的上下文语境进行学习C^创建一个文献检索词矩阵(document-termmatrix)并且对每一个文本应用余弦相似性D、训练一个词包模型(abagofwordsmode1)来对文本中的词的发生率(occurrence)进行学习正确答案:A4、以下关于知识图谱的说法错误的是()。
A、知识图谱以结构化的形式、描述客观世界中存在的概、实体和实体间的关系B、实体之间通过它们之间的一些关系来连接,通过这种方式形成〃图〃C、知识图谱中一般每个实体都有一个ID来标识,称为标识符D、实体内通过关系来刻画内在属性正确答案:D5、在神经网络训练过程中,学习率过大,会导致以下什么结果?A、神经网络很快收敛B、神经网络精度提升C、神经网络精度降低D、神经网络难于收敛正确答案:D6、自动识别系统属于人工智能哪个应用领域?A、自然语言系统B、人类感官模拟C、专家系统D、机器学习正确答案:B7、据评估,2023年超过60%的人工智能应用程序在O上运行。
A、开源平台B、非开源平台C、网络平台D、网络平台正确答案:A8、1eNet和A1eXNet都属于()神经网络。
Λ^全连接B、卷积C、前馈型D、循环正确答案:B9、预测分析方法分为两大类,分别是定性分析法和()。
A、指数平滑法B、定量分析法C、平均法D、回归分析法正确答案:B10、图像处理一般指数字图像处理。
大数据与人工智能知到章节测试答案智慧树2023年最新哈尔滨商业大学第一章测试1.在数据量单位中,1PB等于()。
参考答案:1024TB2.大数据的最终价值体现()。
参考答案:实践3.人工智能起源于()。
参考答案:50-60年代4.被称为XCON的“专家系统”是由()发明。
参考答案:卡内基梅隆大学5.大数据具有4V特点包括()。
参考答案:高速;多样;精确;大量6.自然语言处理包括()。
参考答案:解码;编码7.在大数据时代,经常使用的数据量衡量单位为TB。
参考答案:错8.模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。
参考答案:对9.机器学习主要研究如何使计算机能够模拟或实现人类的学习功能。
参考答案:对10.在分布式人工智能系统中,每一个Agent又是一个全自治系统。
参考答案:错第二章测试1.数据的多样性包括()。
参考答案:数据格式的多样性;数据用途的多样性;数据来源的多样性2.最普通也是最常见的数据类型是()。
参考答案:文本3.将不同数据源的数据自动收集到一个装置中是指()。
参考答案:数据获取4.数据分析,是指从海量的数据中利用数据挖掘的方法,获取有用的有价值的数据信息。
参考答案:对5.数据量测方法有()。
参考答案:非接触式;接触式6.直接附加存储的英文缩写是()。
参考答案:DAS7.企业的数据处理大致分为()。
参考答案:操作性处理;分析性处理8.数据仓库特点包括()。
参考答案:面向主题;集成性;时变性;历史性;企业范围9.分箱方法包括()。
参考答案:等深分箱法;等宽分箱法;用户自定义区间10.数据规约的途径包括()。
参考答案:数据采样;属性选择第三章测试1.学习与发现是指机器的知识学习和规律发现。
参考答案:对2.系统与建造包括()。
参考答案:智能系统的分类;实现语言工具与环境;硬/软件体系结构;设计方法3.遗传算法采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。
中国移动探索⼤数据与⼈⼯智能试题(⼀)⼤数据基础(⼆)⼈⼯智能(三)⼤数据技术介绍1、MapReduce是⼀个线性可扩展模型,请问服务器数量与处理时间是什么关系? OA. 数量越多处理时间越长B.数量越多处理时间越短OC. 数星越⼩处理时间越短0 D. 没什么关系2、下列选项中,不是kafka适合的应⽤场景是?()A.⽇志收集B.消息系统C.业务系统0 D. 流式处理1、⼤数据特征有⼏种(不包括IBM提出的新特征) ? OA.1O B.2O C.3D.42、⽬前电信运营商⼤数据发展仍处在什么阶段?A.探索OC.成熟OD.扩展3.下列选项中,不是⼤数据的-部分的是?OA.海量计算:O B. ⼤量数据管理O C. 数据分析◎D. 单机计算1、数据真实性具备哪两种特质?V A. 准确性⼝B. 不确定性⼝C. 可信赖度⼝D. 杂乱性2.电信⾏业的企业运营:理中。
经营分析和市场监测中。
我们可以通过数据分析对业务和市场经营状况进⾏总结和分析。
主要分为哪些种类?A⽇报⼝B.周报C⽉报⼝0.专暨分析1。
EMC World是哪年在拉斯维加聯著名的威尼斯⼈店开畔的?⼝A 2009。
B. 2011◎C.2012◎D. 20102.随着闭源软件在数据分析领域的地盘不断缩⼩,⽼牌T⼚⾼正在改变商业模式,向着什么靠拢? OA团源◎B.开源OC开放OD.封闭3.下列造项中正情说明价已度低的是?。
A. 100万数据中有50万有效数据。
B.1TB数据中有1KB有效数据。
C. 100万0数据中南100万有效数据◎D. 10万条数据中有1万有效数据1.语⾳识别产品体系有四部分,下列哪项不是体系之- ?◎A.语⾳合成◎B.请⾳擴放◎C. 语⾳识剔0 D.適义理解2. IBM的深蓝在1997年的决定胜负的第六个回台中,⽤了多少步迫使和斯帕罗夫投⼦认输OA.15◎B.22◎D.283. BP神经⽹络的学习规则是?O A梯度上升法。
B.梯度下降法。
《探索大数据和人工智能》题库整理Flume采用了三层架构,分别为agent,collector和(B)A.MapB.storageC.ShuffleD.HashSpark是在哪一年开源的?(B)A.1980B.2010C.1990D.2000在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?(B)A.连接器B.客户端C.接口提供者D.数据采集学习没有标签的数据集的机器学习方法是?(B)A.监督学习B.无监督学习C.半监督学习D.强化学习以下不是非结构化数据的项是?(C)A.图片B.音频C.数据库二维表数据D.视频2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立(A)一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师整个MapReduce的过程大致分为Map、Shuffle、Combine、(A)?A.ReduceB.HashC.CleanD.Loading在Spak的软件栈中,用于交互式查询的是(A)A.SparkSQLB.MllibC.GraphXD.Spark Streaming在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?(B)A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系下列选项中,不是kafka适合的应用场景是?(C)A.日志收集B.消息系统C.业务系统D.流式处理大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是(D)A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据下列选项中,不是人工智能的算法中的学习方法的是?(A)A.重复学习B.深度学习C.迁移学习D.对抗学习自然语言处理难点目前有四大类,下列选项中不是其中之一的是(A)A.机器性能B.语言歧义性C.知识依赖D.语境传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
• 1.将来,农业信息化在机制上,将由政府主导、公司参加向政府引导、公司主体、市场运作、多方协作的格局发展。
(是)是否• 2.下面不属于人工智能研究基本内容的是(C)。
机器感知机器学习自动化机器思维• 3.中国的机器人专家从应用环境出发,将机器人分为两大类,即工业机器人和特种机器人。
(是)是否• 4.机器人的定义中,突出强调的是(B)。
含有人的形象模仿人的功效像人同样思维感知能力很强• 5.在没有大数据的条件下,人才的发现于选拔很难做到“全信息”,大数据能够协助人们解决这个问题。
(是)是否• 6.机器人能力评价不涉及哪个?(C )智能机能生物能活动范畴•7.大数据的价值重在挖掘,而挖掘就是分析。
(是)是否•8.深度学习源于人工神经网络的研究。
(是)是否•9.深度学习源于人工神经网络的研究。
(是)是否•10.(C )曾经赢得了“机器人王国”的美称。
美国英国日本中国•11.我们要围绕推动我国人工智能健康快速发展的现实规定,妥善应对人工智能可能带来的挑战,形成适应人工智能发展的制度安排,构建开放包容的国际化环境,扎实人工智能发展的经济基础。
(否)是否•12.人工智能使研究、开发用于模拟、延伸和拓展人的智能的理论、办法、技术及应用系统的一门新的技术科学。
(是)是否•13.( A)以住宅为平台,兼备建筑设备、网络通讯、信息家电和设备自动化,集系统、构造、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境。
智能家居专家系统模式识别智能控制•14.智能制造的核心是变化传统产品的本质,最后实现产品的“三化”,其中不涉及(D)。
数字化网络化智能化规模化•15.由于工业发展的需要,现在国内智能机器人行业的研发只集中于工业服务和智能助手两个方面。
(否)是否•16.从国家内部来看,人工智能通过优化自动化的方式能够提高社会运行效率。
(是)是否•17.下列选项中,属于图像识别技术应用的是(A)人脸识别支付编写 word 文档制作多媒体制作 ppt•18.世界上第一种将芯片植入体内的人是(A)凯文·沃里克布鲁克斯罗斯·昆兰杰弗里·辛顿•19.人工智能是一门(D )数学和生理学心理学和生理学语言学综合性的交叉学科和边沿学科•20.下列哪些不是人工智能概念的对的表述(D)人工智能是为了开发一类计算机使之能够完毕普通由人类所能做的事人工智能是研究和构建在给定环境下体现良好的智能体程序人工智能是通过机器或软件呈现的智能人工智能将其定义为人类智能体的研究•1.传感器是机器人的感测系统。
当前世界产生的数据总量的单位是? A. EB B. ZB C. PB D. TB随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模B 式,向着什么靠拢? A. 闭源 B. 开源 C. 开放 D. 封闭HBASE通过Zookeeper避免什么问题? A. HMaster的单点问题 B. HRegionServer的单点问题 C. HRegion的单点问题 D. Client的单点问题大数据本身是一个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过什么尺度的数据而诞生的? A. 单机 B. 20GB C. 100GB D. 500GB传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的数字,又称为什么呢? A. 给定标签 B. 离散 C. 分类 D. 回归目前主流研究仍然集中于弱人工智能发展阶段,那么在下列哪些方面取得显著进步? A. 语音识别 B. 图像处理 C. 探索太空 D. 机器翻译目前主流研究仍然集中于弱人工智能发展阶段,那么在下列哪些方面取得显著进步? A. 语音识别 B. 图像处理 C. 探索太空 D. 机器翻译下列选项中,哪项是可以用于数据采集的技术? A. Flume B. Hive C. Kafka D.Mahout麦肯锡全球研究所对大数据的定义是一种规模大到在某些方面大大超出了传统数据库软件工具能力范围的数据集合,那么这些方面分别是? A. 获取 B. 存储C. 管理D. 分析计算机视觉本身又包括了诸多不同的研究方向,比较基础和热门的几个方向主要包括了: A. 物体识别 B. 运动 C. 形态 D. 轮廓。
精选全文完整版(可编辑修改)人工智能训练师理论试题库单项选择题(第21~70题,共50题,每题1分,共50分。
每题有4个选项,其中只有1个选项是正确的。
)1.根据能力的不同等级,人工智能可以分为(B )。
A. 高人工智能和低人工智能B. 强人工智能和弱人工智能C. 大人工智能和小人工智能D. 深人工智能和浅人工智能2. 人工智能的四个层次分别是运算智能. 感知智能. (C ). 自主智能。
A. 认识智能B. 行为智能C. 认知智能D. 学习智能3. 1956年7月至8月,(D )召集的人工智能夏季研讨会在达特茅斯顺利举行。
A. 沃尔特B. 沃伦C. 爱德蒙D. 麦卡锡4. 人工智能发展进程中的第一次寒冬发生在(A )。
A. 1974-1980年B. 1980-1987年C. 1987-1993年D. 1993-2010年5. 在当前的人工智能领域,机器学习,或者更准确地说,(A )的技术路线已经成为研究的主流。
A. “大数据+深度学习”B. “数据+学习”C. “大数据+去计算”D. “云计算+去中心化”6. 诺贝尔物理学奖获得者(D )提出了量子计算的概念。
A. 杨振宁B. 霍金C. 爱因斯坦D. 理查德.费曼7. 现在主流搜索引擎Google、Bing、Yahoo、(C )等都有机器翻译的功能A. 新浪B. 网易C. 百度D. 新华网8. 智能语音技术具体可以分为自动语音识别、(C )、声纹识别、语音分类等。
A. 语音学习B. 语音分析C. 语音合成D. 语音转写9.(C ),也叫做说话人识别,是通过声音特征来判断说话人身份的技术。
A. 声音识别B. 声音辨别C. 声纹识别D. 声纹辨别10. 随着人工智能技术的发展,通过(A )、虹膜识别、指纹识别等生物识别技术已推广到银行业的各大主要应用场景中。
A. 人脸识别B. DNA识别C. 声纹识别D. 声音识别11. 目前,(B )已被广泛应用于信用卡催收、通知、理财营销等各场景。
探索大数据和人工智能最全试题1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师2、整个MapReduce 的过程大致分为Map、Shuffle、Combine、()?A.ReduceB.HashC.CleanD.Loading3、在Spak的软件栈中,用于交互式查询的是A.SparkSQLB.MllibC.GraphXD.SparkStreaming4、在数据量一定的情况下,MapReduce 是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系?A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系5、下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧义性C.知识依赖D.语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归10、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B.OneNETC.移娃D.大云11、HDFS中Namenodef 的Metadata 的作用是?A.描述数据的存储位置等属性B.存储数据C.调度数据D.12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?A大数据技术B.互联网技术C.游戏技术D.影像技术13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭14、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频15、以下数据单位换算错误的是?A.1KB=1024BB.1GB=1024MBC.1TB=1000GBD.1MB=1024KB16、下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性17、BP神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D.显层18、以下哪个不是语音识别的范畴?A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容20、2011年5月是哪家全球知名咨询公司在《Bigdata:Thenextfrontierfor innovation,competitionandproductivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项中,哪项是分布式文件存储系统?A.HDFSB.FlumeC.KafkaD.Zookeeper22、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表24、下列选项中,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论級别的突破。
而哪项技术将继续成为大数据智能分析的核心技术A机器学习B.智能物流C.脑科学D.智能终端27、以下哪个不属于大数据在电信行业的数据商业化方面的应用A.精准广告B.网络管理C.营销洞察D.大数据检测和决策28、RDD是由多个什么组成?A.partitionputerC.ActionD.Transformation29、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析30、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工看能称为()A.高人工智能B.低人工智能C.强人工智能D.弱人工智能31、mapreduce 计算模型适用于哪种任务?A.多线程处理B.有关联的行处理C.批处理D.实时数据变化处理32、当前世界产生的数据总量的单位是?A.KBB.ZBC.GBD.TB33、IBM提出的大数据5V特征包括更大(Volume)、更快(Velocity)、更多Variety)、更值钱(Value)和()A.更有效C.更真实(Veracity)D.更直观34、Spark.是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小A.内存B.硬盘C.磁带D.显卡35、下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系統D.流式处理36、数据采集的基本步骤(ETL)中不包括哪项?A.抽取转换B.加载C.计算D.37、以下哪种学习方法不属于人工智能算法?A.迁移学习B.对抗学习C.强化学习D.自由学习38、语音识别常用的应用有四个,下列不是常用应用的是?A聊天B.拨号C.导航D.设备控制39、下列选项中,哪项是由谷歌开发的人工能箅法框架?A.KafkaB.TensorflowC.CaffeD.Torch40、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高増长率和多样化的信息资产。
A.海量B.少数D.结构化41、MPP是指A.大规模并行处理系统B.受限的分布式计算模型C.集群计算资源管理框架D.分布式计算编程框架42、Hadoop 是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201643、在Spark的软件栈中,用于流计算的是?A.GraphXB.MllibC.SparkStreamingD.SparkSQL44、以下数据量可以称为大数据的是B.100KBC.100PBD.100MB45、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?A.图片识别B.语音识别C.自动驾驶D.消费金融46、IBM的()是第一个在国际象棋上战胜人类人工智能计算机。
A.AlphagoB.深蓝C.图灵机模型D.深度学习机器人47、下列选项中,不是人工智能的基础设施的是?A.CPU服务器B.GPU服务器C.专用芯片D.游戏显卡48、以下哪个不属于大数据在电信行业的应用?A数据商业化B.物流网络C.企业运营管理D.客户关系管理49、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。
A.大数据技术B.客户画像C.客户状态D.客户心情50、IBM提出的大数据5V特征包括()、更快(velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观51、Fume 采用了三层架构,分别为agent,collector 和()A.MapB.storageC.ShuffleD.Hash52、Hadoop2 系列版本中默认的HDFS的block是多大?A32MBB.64MBC.128MBD.16MB53、工信部官网正式发布大数据产业“一三五“发展规划是在哪一年A.1987B.1997C.2007D.201754、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C.梯度提升法D.梯度曲线法55、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A.精灵B.阿尔法蛋C.小度D.移娃56、对抗学习中两个网络互相竟争,一个负责生成样本,那么另一个负责做什么?A.判别样本B.计算样本C.统计样本D.生成样本57、以下应用没有使用你的地理位置信息的是?A.美团B.滴滴C.高德地图D.word58、下列选项中,不是大数据发展趋势的是A.大数据分析的革命性方法出现B.大数据与云计算将深度融合C.大数据一体机将陆续发布D.大数据未来可能会被淘汰59、在Spark的软件栈中,用于图计算的是A.SparkStreamingB.MllibC.GraphXD.SparkSQL60、HBASE的特点不包括哪些?A.面向行B.稀疏性C.多版本D.高可靠性61、总体来说,人工智能发展的未来趋势是?A.上升B.下降C.不动D.大幅度下降62、以下数据单位从小到大排列的顺序是?A.GB、B、KBB.B、KB、MBC.KB、ZB、PBD.B、MB、KB63、最初的大数据概念还比较模湖,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A.谷歌B.百度C.360D.bing64、下列选项中,哪个不是HBASE的特点?A面向行B.多版本C.扩展性D.稀疏性65、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB.MySQLC.HDFSD.Java二、多选题1、在数据清洗的过程中,总共可以归为三个阶段,它们分别是?A.数据加工B.数据质量检查C.数据校对D.数据标准化2、HBASE的特点不包括哪些?A.面向行B.稠密性C.多版本D.高可靠性3、麦肯锡全球研究所对大数据的定义是—种规模大到在获取、存储、管理、分析方面大大超出了传統数据库软件工具能力范围的数据集合,具有以下哪些特征?A.海量的数据规模B.快速的数据流转C.多样的数据类型D.价值密度低4、以下哪两项是人工智能发展的标志性产品?A.深蓝alphagoC.智能门禁D.智能手机5、在非电信领域,大数据可被应用到的以下哪些方面A.公共安全B.无明显应用C.智能运输D.智能建筑6、大数据应用领域成就有哪些?A.金融B.互联网电子商务C.工业生产D.没有明显成就7、以下属于计算机视觉的研究方向的有?A.物体识别和检测B.语音导航C.视觉问答(看图说话)D.机器翻译8、传统的机器学习算法可以分为哪三类?A.监督学习B.无监督学习C.半监督学习D.强化学习9、在人工智能发展历程中有过多次低谷期,这些低谷期最主要的两项原因是什么?A.运算力不足B.人员不足C.技术瓶颈D.费用太高10、HBASE的应用场景有哪些?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D.超大数据量11、使用有监督学习的问题可以被分为哪两类?A.回归问题B.抽样问题C.聚类问题D.分类问题12、下列选项属于人工智能的基本概念有A.机器学习B.深度学习C.BP神经网络D.卷积神经网络13、HBASE的应用场景有哪些?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D.超大数据量14、下列选项中,是大数据发展趋势的是A.开源大数据商业化进一步深化B.打包的大数据行业分析应用开拓新市场C.大数据细分市场规模进一步增大D.大数据推动公司并购的规模和数量进一步提升15、人工智能关键技术框架主要包括哪两层?A.基础设施B.算法C.技术D.人员16、2010年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了哪些大数据的重要组成技术?A.海量数据存储B.数据挖掘C.图像视频智能分析D.python17、世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?A.推动经济发展B.改善公共服务C.增进人民福祉D.保障国家安全18、下列选项中,哪两项是可以用于数据采集的技术?A.FlumeB.HiveC.KafkaD.Mahout19、关于RDD,说法正确的两项是?A.RDD不能由多个分区(partition) 组成B.弹性、集中式内存集C.RDD能生成ChildrenRDDD.是一个容错的、并行的数据结构20、以下用到语音识别技术的应用包括:A.苹果手机siriB.微信C.百度地图D.word21、人工智能目前在以下哪三个领域有了长足的发展?A.健康B.教育C.探索太空D.理财22、HDFS适用于什么样的应用场景?A.存储和管理PB级别的数据B.处理非结构化数据C.注重数据处理的吞吐量D.大量小文件23、Flume采用了三层架构,每一层均可以水平扩展,它们分别是?A.agentB.collectorC.storageD.source24、KAfak的总体数据流有三个关键角色,它们分别是A.ProducerB.MessageC.ClusterD.Consumer25、业务运营监控,可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营情况?A.网络B.业务C.气候D.用户26、自然语言处理的主要难点不包括以下哪两项A.语言独立性B.语言歧义性C.多国语言D.语境27.以下数据量不能说成大数据的是?A.100MBB.1000KBC.100PBD.1EB28、以下哪些属于大数据在电信行业的应用?A.网络管理和优化B.数据商业化C.客户关系管理D.企业运营管理29、通过地理位置信息可以分析出哪些信息?A.颜值B.家庭住址C.工作地址D.体重30、人工智能技术的基础设施不包括哪两部分?A.系统应用B.机器学习算法C.基础硬件D.算法框架31、自然语言处理需要解决的难点有哪些?A.语言歧义性B.语言鲁棒性C.知识依赖D.语境32、HDFS在哪些场景中表现很差?A.大量小文件B.随机读取C.修改文件D.存储和管理PB级别数据33、大数据的业务应用处理需要经过哪些流程?A.数据采集B.数据清洗C.数据建模D.数据加工34、HDFS适用于哪些场景?A.大量小文件B.存储和管理PB级别数据C.一次写入,多次读取D.低延迟读取35、人工智能在哪些领域应用广泛?A.健康医疗B.智能投顾C.智能教育D.智能法务36、以下哪两个属于大数据特征?A.数据体量大B.价值密度高C.数据种类多D.处理速度慢37、数据建模目前有两种比较通用的方式,分别是?A.通用建模B.专属建模C.范式建模D.维度建模38、以下应用使用了你的地理位置信息的是?A.滴滴B.百度地图C.wordD.excel39、BP神经网络模型拓扑结构包括?A.输入层B.隐层C.输出层D.显层40、HBase是在Hadoop之上构建的开源分布式结构化数据存储系统,它有哪些特点? 面向列存储A.非关系型B.面向列存储C.关系型D.面向行存储41、大数据可以被应用到的行业有?A.电信B.工业C.政府D.金融。