2020年智慧树知道网课《大数据分析及应用》课后章节测试满分答案
- 格式:docx
- 大小:917.93 KB
- 文档页数:41
第一章测试1【单选题】(2分)大数据的英文描述是()A.HeavydataB.LargedataC.GreatdataD.Bigdata2【单选题】(2分)下面最大的储存单位是()A.KBB.TBC.GBD.PB3【单选题】(2分)大数据之父是()A.詹姆斯·高斯林B.姚期智C.查尔斯·巴赫曼D.维克托·迈尔-舍恩伯格4【多选题】(2分)大数据的特点包括()A.VelocityB.ValueC.VolumeD.Variety5【多选题】(2分)第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A.PNASB.ScienceC.NatureD.Cell6【判断题】(2分)大数据是只和互联网相关的计算机技术。
A.错B.对7【判断题】(2分)企业中大部分的数据都是非结构化数据。
A.错B.对8【判断题】(2分)大数据技术的基础是由阿里巴巴首先提出的。
A.错B.对9【判断题】(2分)大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
A.对B.错。
第一章测试1【单选题】(10分)以下不属于可视化的作用的是()A.数据采集B.传播交流C.信息记录D.数据分析2【单选题】(10分)数据可视化萌芽于什么时间()A.15世纪B.18世纪C.17世纪D.16世纪3【单选题】(10分)可视分析学是何时兴起的()A.20世纪B.18世纪C.21世纪D.19世纪4【单选题】(10分)张量场可视化属于可视化的哪个分支学科()A.信息可视化B.人机交互学C.科学可视化D.可视分析学5【单选题】(10分)使用以下哪种可视化工具不需要编程基础()A.D3.jsB.ProcessingC.VegaD.Tableau6【判断题】(10分)数据可视化的原则是细节优先。
A.错B.对7【判断题】(10分)文本可视化属于信息可视化。
A.错B.对8【多选题】(10分)可视分析学涉及到的学科包括()A.人机交互B.计算机图形学C.统计分析D.数据挖掘9【多选题】(10分)以下哪些工具是数据可视化工具()A.VegaB.MatlabC.D3.jsD.Tableau10【多选题】(10分)这个视频中体现了可视化的哪些作用()A.信息记录B.数据过滤C.传播交流D.数据分析第二章测试1【单选题】(10分)有的人在发朋友圈的时候,会把一张图片切成9份,然后再按顺序拼出一个九宫格,如下图所示。
虽然图片被分割开来,但是我们仍旧能够感知到图片原来完整的样子,这体现了格式塔理论的()原则。
A.闭包原则B.连续原则C.接近原则D.相似原则2【单选题】(10分)下图所示的图片体现了格式塔理论的()原则。
A.相似原则B.接近原则C.连续原则D.闭包原则3【单选题】(10分)下图所示的图片体现了格式塔理论的()接近原则A.闭包原则B.接近原则C.连续原则D.相似原则4【单选题】(10分)下图所示的可视化中运用了以下哪个视觉通道?()A.形状B.亮度C.颜色D.高度5【单选题】(10分)下图所示的可视化中体现了哪种类型的视觉通道?()A. 定量型B. 分组型C.定性型D.分类型6【判断题】(10分)根据格式塔理论,人们在观看时,眼脑在一开始的时候会先区分一个形象的各个单一的组成部分,然后再将各个部分组合起来,使之成为一个易于理解的统一体。
绗竴绔?1銆?011骞撮害鑲敗鐮旂┒闄㈡彁鍑虹殑澶ф暟鎹畾涔夋槸锛氬ぇ鏁版嵁鏄寚鍏跺ぇ灏忚秴鍑轰簡甯歌鏁版嵁搴撳伐鍏疯幏鍙栥€佸偍瀛樸€佺鐞嗗拰锛? 锛夎兘鍔涚殑鏁版嵁闆嗐€?A:璁$畻B:璁块棶C:搴旂敤D:鍒嗘瀽绛旀: 鍒嗘瀽2銆佺敤4V鏉ユ鎷ぇ鏁版嵁鐨勭壒鐐圭殑璇濓紝涓€鑸槸鎸囷細Value銆乂elocity 銆乂olume鍜岋紙锛夈€?A:VarietyB:VainlyC:VagaryD:Valley绛旀: Variety3銆佸ぇ鏁版嵁鍒嗘瀽鍥涗釜鏂归潰鐨勫伐浣滀富瑕佹槸锛氭暟鎹垎绫汇€侊紙锛夈€佸叧鑱旇鍒欐寲鎺樺拰鏃堕棿搴忓垪棰勬祴銆?A:鏁版嵁缁熻B:鏁版嵁璁$畻C:鏁版嵁鑱氱被D:鏁版嵁娓呮礂绛旀: 鏁版嵁鑱氱被4銆佹柊娴拰浜笢鑱斿悎鎺ㄥ嚭鐨勫ぇ鏁版嵁鍟嗗搧鎺ㄨ崘锛屾槸鐢变含涓滅洸鐩帹閫佸埌褰撳墠娴忚鏂版氮缃戠珯鐨勭敤鎴风殑椤甸潰涓婄殑銆?A:瀵?B:閿?绛旀: 閿?5銆佺洰鍓嶇殑澶ф暟鎹鐞嗘妧鏈彧鑳藉鐞嗙粨鏋勫寲鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?绗簩绔?1銆佹垜浠父鐢ㄧ殑寰蒋Office濂椾欢涓殑Access鏁版嵁搴撹蒋浠剁殑鏁版嵁搴撴枃浠舵牸寮忓悗缂€鍚嶆槸锛? 锛夈€?A:mdfB:mdbC:dbfD:xls绛旀: mdb2銆佸ぇ澶氭暟鏃ュ織鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:txtB:csvC:xmlD:log绛旀: log3銆佹湰璇剧▼閲嶇偣浠嬬粛鐨剋eka杞欢鐨勪笓鏈夋枃浠舵牸寮忔槸锛? 锛夈€?A:MongoDBB:ARFFC:valueD:key map绛旀: ARFF4銆佹暟鎹竻娲楀伐浣滅殑鐩殑涓昏鏄瑙e喅鏁版嵁鐨勫畬鏁存€с€佸敮涓€鎬с€佸悎娉曟€у拰锛? 锛夈€?A:涓撲笟鎬?B:鎺掍粬鎬?C:涓€鑷存€?D:鍏变韩鎬?绛旀: 涓€鑷存€?5銆佸叓鐖奔杞欢鐨勨€滆嚜瀹氫箟閲囬泦鈥濆伐浣滄柟寮忎笅锛岄渶瑕佸湪杞欢閲岃緭鍏ヤ竴涓紙锛夋潵浣滀负閲囬泦鐨勭洰鏍囥€?A:鐢佃瘽鍙风爜B:鍏抽敭璇?C:缃戦〉鍦板潃D:鐢ㄦ埛鍚?绛旀: 缃戦〉鍦板潃6銆佸叓鐖奔杞欢鐨勯噰闆嗚鍒欏彲浠ラ€氳繃鏂囦欢鐨勫舰寮忔潵瀵煎叆鎴栬€呭鍑猴紝杩欑鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:otdB:jpgC:pngD:gif绛旀: otd7銆丒xcel鍙互閫氳繃鈥滄暟鎹湁鏁堟€р€濇寜閽搷浣滄潵瑙勮寖鏁版嵁杈撳叆鐨勮寖鍥淬€?A:瀵?B:閿?绛旀: 瀵?8銆丒xcel涓嶈兘瀵煎叆txt鎴朿sv鏍煎紡鐨勬枃浠躲€?A:瀵?B:閿?绛旀: 閿?9銆佸叓鐖奔杞欢鍙兘瀵硅蒋浠跺唴寤轰簡鈥滅畝鏄撻噰闆嗏€濊鍒欑殑缃戠珯閲囬泦鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?10銆佸叓鐖奔杞欢杩涜鑷畾涔夐噰闆嗘椂锛岄渶瑕佷簡瑙e缃戦〉鐨勯〉闈㈢粨鏋勩€?A:瀵?B:閿?绛旀: 瀵?绗笁绔?1銆佷娇鐢―BSCAN绠楁硶瀵归涪灏捐姳鏁版嵁闆嗭紙Iris.arff锛夎繘琛岃仛绫伙紝灏唀psilon鍙傛暟璁剧疆涓?.2锛? minPoints鍙傛暟璁剧疆涓?锛屽拷鐣lass灞炴€э紝閭d箞灏嗗舰鎴愶紙锛変釜绨囥€?A: 1B: 2C: 3D: 4绛旀: 32銆佷娇鐢‥M绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝灏唍umClusters璁剧疆涓?锛屽嵆绨囨暟涓?锛屽叾浠栧弬鏁颁繚鎸侀粯璁ゅ€硷紝蹇界暐class灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒鐨勩€?A: 妯″瀷鐨勬渶澶т技鐒朵及璁″€兼槸-7.18B: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠?5娆?C: 绗洓涓皣鐨勫厛楠屾鐜囨槸0.14D: 绗洓涓皣鐨勫疄渚嬫暟涓?绛旀: 绗洓涓皣鐨勫疄渚嬫暟涓?3銆佷娇鐢⊿impleKMeans绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝淇濇寔榛樿鍙傛暟锛屽嵆3涓皣浠ュ強娆ф皬璺濈銆傞€夋嫨play灞炴€т负蹇界暐灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒銆?A: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?B: 浜х敓浜嗕笁涓腑蹇冪偣C: 鑱氬悎涓?涓皣锛屽垎鍒湁7锛?锛?涓疄渚?D: 骞虫柟鍜岃宸负8.928绛旀: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?4銆佷娇鐢ㄧ嚎鎬у洖褰掞紙LinearRegression锛夊垎绫诲櫒鍜岀敤M5P鍒嗙被鍣ㄥcpu.arff鍒嗗埆杩涜鍒嗙被锛岀敱鍏惰緭鍑虹殑璇樊鎸囨爣鍙煡锛? 锛夈€?A: LinearRegression鐨勬爣鍑嗚宸瘮M5P鐨勬爣鍑嗚宸皬B: LinearRegression鐨勫钩鍧囩粷瀵硅宸瘮M5P鐨勫钩鍧囩粷瀵硅宸皬C: LinearRegression鐨勭浉瀵硅宸瘮M5P鐨勭浉瀵硅宸皬D: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ绛旀: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ5銆佸垹鍘籧pu.arff鏁版嵁鏂囦欢涓殑CACH灞炴€у悗锛屼娇鐢∕5P鍒嗙被鍣ㄦ瀯寤烘柟妗堬紝鍦ㄧ粨鏋滀腑锛屽埌杈綥M2鐨勫疄渚嬫暟鏈夛紙锛変釜銆?A: 165B: 21C: 23D: 30绛旀: 216銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僿eather.nominal.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋outlook=sunny锛泃emperature=cool锛沨umidity =high锛泈indy=TRUE鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛?锛夈€?A: YesB: NoC: 娌℃湁缁撴灉D: 鏃犳硶鍒嗙被绛旀: No7銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僫ris.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋sepallength=4.4锛泂epalwidth=3.0锛沺etallength=1.3锛沺etalwidth=0.2鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛? 锛夈€?A: Iris-setosaB: Iris-versicolorC: Iris-virginicaD: 鏃犳硶鍒嗙被绛旀: Iris-setosa8銆佸叧浜嶹eka绂绘暎鍖栬鏄庢纭殑鏄紙锛夈€?A: 绂绘暎鍖栨槸灏嗘暟鍊煎睘鎬ц浆鎹负瀛楃涓插瀷灞炴€?B: 鏈夌洃鐫g鏁e寲鏈変袱绉嶇瓑瀹藉拰绛夐鏂规硶C: 绛夊绂绘暎鍖栨槸浣垮疄渚嬪垎甯冨潎鍖€鐨?D: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲绛旀: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲9銆佷互涓嬶紙锛変笉鏄疻eka鐨勬暟鎹被鍨嬨€?A: numericB: nominalC: stringD: decimal绛旀: decimal10銆佸叧浜嶹eka鐨勬枃浠剁被鍨嬫弿杩伴敊璇殑鏄紙锛夈€?A: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsxB: Weka澶勭悊鐨勬暟鎹泦绫讳技浜庡叧绯绘暟鎹簱妯瀹炰緥锛岀珫琛屽睘鎬?C: arff鏄疉SCII鏂囦欢锛屽彲浠ョ敤Word绛夋枃鏈紪杈戝櫒鎵撳紑鏌ョ湅D: @relation 瀹氫箟鏁版嵁闆嗗悕绉帮紝@data涔嬪悗鍛堢幇瀹炰緥锛屾瘡涓€琛屽氨鏄竴涓疄渚?绛旀: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsx11銆佷互涓嬪睘浜庡叧鑱斿垎鏋愮殑鏄紙锛夈€?A: CPU鎬ц兘棰勬祴B: 璐墿绡垎鏋?C: 鑷姩鍒ゆ柇楦㈠熬鑺辩被鍒?D: 鑲$エ瓒嬪娍寤烘ā绛旀: 璐墿绡垎鏋?12銆佸ぇ鏁版嵁鏃朵唬鐨勫埌鏉ワ紝浣挎垜浠棤娉曚汉涓哄湴鍘诲彂鐜版暟鎹腑鐨勫ゥ濡欙紝涓庢鍚屾椂锛屾垜浠洿搴旇娉ㄩ噸鏁版嵁涓殑鐩稿叧鍏崇郴锛岃€屼笉鏄洜鏋滃叧绯汇€傚叾涓紝鏁版嵁涔嬮棿鐨勭浉鍏冲叧绯诲彲浠ラ€氳繃浠ヤ笅锛? 锛夌畻娉曠洿鎺ユ寲鎺樸€?A: K-meansB: Bayes NetworkC: C4.5D: Apriori绛旀: Apriori13銆佹煇瓒呭競鐮旂┒閿€鍞邯褰曟暟鎹悗鍙戠幇锛屼拱鍟ら厭鐨勪汉寰堝ぇ姒傜巼涔熶細璐拱灏垮竷锛岃繖绉嶅睘浜庢暟鎹寲鎺樼殑锛? 锛夐棶棰樸€?A: 鍏宠仈瑙勫垯鍙戠幇B: 鑱氱被C: 鍒嗙被D: 鑷劧璇█澶勭悊绛旀: 鍏宠仈瑙勫垯鍙戠幇14銆佸湪杩涜鑷姩閫夋嫨灞炴€ф椂锛屽繀椤昏绔嬩袱涓璞★紝鍏朵腑纭畾浣跨敤浠€涔堟柟娉曚负姣忎釜灞炴€у瓙闆嗗垎閰嶄竴涓瘎浼板€肩殑瀵硅薄鏄笅闈㈢殑锛? 锛夈€?A: 鎼滅储鏂规硶B: 灞炴€ц瘎浼板櫒C: 鍏冨垎绫诲櫒D: 瑙勫垯鎸栨帢绛旀: 灞炴€ц瘎浼板櫒15銆佷互涓嬪睘浜庡睘鎬х┖闂寸殑鎼滅储鏂规硶鐨勬槸锛?锛夈€?A: GainRatioAttributeEvalB: BestFirstC: PrincipalComponentsD: SymmetricalUncertAttributeEval绛旀: BestFirst16銆佸湪weka杞欢鎺㈢储鑰呯晫闈腑锛屽埄鐢╒isualize鏍囩椤甸€氳繃鏇存敼鍚勪釜鍙傛暟鏉ヨ繘琛屾暟鎹泦鐨勫彲瑙嗗寲灞炴€ц缃悗锛岄渶瑕佸崟鍑讳互涓嬶紙锛夋寜閽紝鎵€鏈夋洿鏀规墠浼氱敓鏁堛€?A: Select AttributeB: SubSampleC: UpdateD: Fast scrolling绛旀: Update17銆佺粰瀹氬叧鑱旇鍒橝B锛屾剰鍛崇潃锛氳嫢A鍙戠敓锛孊涔熶細鍙戠敓銆?A:瀵?B:閿?绛旀: 閿?18銆佹敮鎸佸害鏄閲忓叧鑱旇鍒欓噸瑕佹€х殑涓€涓寚鏍囥€?A:瀵?B:閿?绛旀: 瀵?19銆丷anker鏂规硶鏃㈠彲浠ョ敤浜庡崟涓睘鎬ц瘎浼板櫒锛屽張鍙互鐢ㄤ簬灞炴€у瓙闆嗚瘎浼板櫒銆?A:瀵?B:閿?绛旀: 閿?20銆佸埄鐢╳eka杞欢杩涜鏁版嵁鍙鍖栨椂锛岀敤鎴峰彲浠ラ€夋嫨绫诲埆灞炴€у鏁版嵁鐐圭潃鑹诧紝濡傛灉绫诲埆灞炴€ф槸鏍囩О鍨嬶紝鍒欐樉绀轰负褰╄壊鏉°€?A:瀵?B:閿?绛旀: 閿?绗洓绔?1銆佽礉鍙舵柉缃戠粶涓殑鑺傜偣浠h〃锛? 锛夈€?A:鍙橀噺B:闅忔満杩囩▼C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 闅忔満鍙橀噺2銆佽礉鍙舵柉缃戠粶涓紝鑺傜偣闇€缁欏嚭姒傜巼鍒嗗竷鎻忚堪锛屽浜庣鏁e瀷闅忔満鍙橀噺鑰岃█锛屽彲浠ョ敤锛? 锛夌殑褰㈠紡琛ㄧず銆?A:鏉′欢姒傜巼瀵嗗害鍑芥暟B:姝f€佸垎甯?C:鏉′欢姒傜巼琛?D: 鍧囧寑鍒嗗竷绛旀: 鏉′欢姒傜巼琛?3銆佽礉鍙舵柉缃戠粶涓妭鐐逛箣闂寸殑杈逛唬琛紙锛夈€? A:闅忔満鍏崇郴B:姒傜巼鍥犳灉C:缁勫悎鍏崇郴D:闅忔満缁撴灉绛旀: 闅忔満鍏崇郴4銆佽礉鍙舵柉缃戠粶淇濆瓨鐨勬枃浠舵牸寮忔槸( )銆?A:XML BIFB:DOCXC: TXTD:XLS绛旀: XML BIF5銆佷笅闈紙锛変笉鏄弽鍚戜紶鎾缁忕綉缁滅殑缁撴瀯銆? A:杈撳叆灞?B:闅愬惈灞?C:璁$畻灞?D:杈撳嚭灞?绛旀: 璁$畻灞?6銆佺缁忕綉缁滀腑鐨勮妭鐐逛唬琛紙锛夈€?A:婵€鍔卞彉閲?B:婵€鍔卞嚱鏁?C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 婵€鍔卞嚱鏁?7銆佷笅鍒楋紙锛変笉鏄父瑙佺殑婵€鍔卞嚱鏁般€?A:绾挎€у嚱鏁?B:Sigmoid鍑芥暟C:闃堝€煎嚱鏁?D:姝e鸡鍑芥暟绛旀: 姝e鸡鍑芥暟8銆佸湪璐濆彾鏂綉缁滅紪杈戠晫闈㈡椂锛屽鏋滆妭鐐圭殑鍚嶇О娌℃硶瀹屽叏鏄剧ず锛岄渶瑕佷粠锛? 锛夎彍鍗曢」杩涜璋冩暣銆?A:Tools|SetDataB:View|Zoom OutC:View|Zoom InD:Tools|Layout绛旀: Tools|Layout9銆乄EKA涓€夋嫨绁炵粡缃戠粶鍒嗙被鍣ㄦ搷浣滄椂锛屽簲璇ラ€夋嫨锛? 锛夈€?A:rules鏉$洰涓嬬殑PARTB:functions鏉$洰涓嬬殑SGD鍒嗙被鍣?C:functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?D:榛樿鐨勫垎绫诲櫒绛旀: functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?10銆佷笅闈㈠叧浜嶱ackage Manager瀹夎鍚庣殑鐩綍璇存槑涓嶆纭殑鏄紙锛夈€?A:doc瀛愮洰褰曞瓨鏀続PI鏂囨。
大数据解析与应用导论知到章节测试答案智慧树2023年最新浙江大学第一章测试1.下列属于多元统计方法的为()参考答案:回归分析;主元分析2.多元统计分析的图表示法有()参考答案:散布图矩阵;调和曲线图;轮廓图;雷达图3.完整的数据分析过程,包括数据采集、数据清洗和数据分析。
()参考答案:对4.下列场景适用于回归分析的是 ( )参考答案:天气预报5.下面哪一句体现了主元分析的思想()参考答案:牵牛要牵牛鼻子第二章测试1.一般常见的缺失值处理的方法有()参考答案:回归填充法;最近邻插补填充法;插值填充;替换填充法2.一般常见的数据归一化的方法有()参考答案:最小最大规范化;零均值规范化3.少量的异常值完全不会影响数据分析。
()参考答案:错4.下列哪种方法不是数据填补的手段 ( )参考答案:均值标准化5.主成分分析的英文名是()。
参考答案:Principal Component Analysis第三章测试1.下面哪个是SVM在实际生活中的应用()参考答案:图片分类;邮件分类2.以下说法正确的有哪些()参考答案:SVM是一种线性方法;软间隔的引入可以解决轻度线性不可分问题3.拉格朗日乘子法可用于线性可分SVM的模型求解。
()参考答案:对4.SVM的中文全称叫什么?()参考答案:支持向量机5.SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?()参考答案:大数据集第四章测试1.一元线性回归有哪些基本假定?()参考答案:解释变量X是确定性变量,Y是随机变量;;随机误差项和解释变量X不相关;;随机误差项服从零均值、同方差的正态分布。
;随机误差项具有零均值、同方差和序列不相关的性质;2.最典型的两种拟合不佳的情况是()。
参考答案:欠拟合;过拟合3.岭回归适用于样本很少,但变量很多的回归问题。
()参考答案:对4.最小二乘方法的拟合程度衡量指标是()。
参考答案:残差平方和5.关于最小二乘法,下列说法正确的是。
第一章测试1【单选题】(3分)下列四项中,不属于数据库系统特点的是()。
A.数据完整性B.数据共享C.数据独立性高D.数据冗余度高2【单选题】(3分)数据库系统的数据独立性体现在()。
A.不会因为存储策略的变化而影响存储结构B.不会因为某些存储结构的变化而影响其他的存储结构C.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序D.不会因为数据的变化而影响到应用程序3【单选题】(3分)描述数据库全体数据的全局逻辑结构和特性的是()。
A.内模式B.用户模式C.模式D.外模式4【单选题】(3分)要保证数据库的数据独立性,需要修改的是()。
A.三层模式B.模式与内模式C.模式与外模式D.三层之间的两种映射5【单选题】(3分)用户或应用程序看到的那部分局部逻辑结构和特征的描述是(),它是模式的逻辑子集。
A.模式B.物理模式C.子模式D.内模式第二章测试1【单选题】(3分)一个关系只有一个()。
A.候选码B.外码C.主码D.超码2【单选题】(3分)关系代数运算是以()为基础的运算。
A.集合运算B.代数运算C.谓词演算D.关系运算3【单选题】(3分)关系数据库管理系统应能实现的专门关系运算包括()。
A.选择、投影、连接B.显示、打印、制表C.排序、索引、统计D.关联、更新、排序。
绪论单元测试1【多选题】(100分)你认为如何学好计算机应用基础这门课程?()A.带着问题去学B.勤加练习C.学以致用D.锲而不舍地钻研第一章测试1【单选题】(10分)第四代计算机使用的电子原件是()A.晶体管B.电子管C.大规模、超大规模集成电路D.中、小规模集成电路2【单选题】(10分)个人计算机简称为PC机,这种计算机属于()A.微型计算机B.小型计算机C.巨型计算机D.超级计算机3【多选题】(10分)计算机使用二进制主要是因为A.便于逻辑性B.容易实现C.运算规则简单D.可靠性高4【单选题】(10分)十进制数47转换为二进制数是多少?A.110111B.101111C.111001D.1011105【单选题】(10分)下列字符中,ASCII码值最小的是A.aB.xC.AD.Y6【单选题】(10分)构成CPU的主要部件是()A.内存、控制器和运算器B.控制器和运算器C.内存和控制器D.内存和运算器7【单选题】(10分)下列不属于系统软件的是()A.数据库管理系统B.操作系统C.防病毒软件D.程序设计语言和语言处理程序8【单选题】(10分)一条指令必须包括()A.操作码和地址码B.时间和信息C.信息和数据9【单选题】(10分)在微机中,存储容量为5MB,指的是()。
A.5×1024个字节B.5×l000×1000个字节C.5×1024×1000个字节D.5×1024×1024个字节10【单选题】(10分)能直接与CPU交换信息的存储器是()。
A.内存储器B.DCD-ROMC.硬盘存储器D.光盘存储器第二章测试1【单选题】(10分)要求在规定的时间内对外界的请求必须给予及时相应的操作系统是()。
A.多用户分时系统B.批处理系统时间C.实时系统D.网络操作系统2【单选题】(10分)下列是切换已打开的应用程序窗口的组合键是()A.ALt+TabB.ALt+oC.ALt+shiftD.ALt+space3【单选题】(10分)以下对Windows文件名取名规则的描述,()是不正确的。
大数据分析与应用知到章节测试答案智慧树2023年最新咸阳职业技术学院第一章测试1.HDFS 已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,开源社区形成了 K-V( key-value)、列式、()、图这四类 NoSQL 数据库体系。
参考答案:文档2.麦肯锡全球研究所对大数据的定义是()。
参考答案:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征3.大数据应用场景不包括()。
参考答案:人群标签,精准营销4.DataWorks是一个提供了大数据OS能力、并以all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。
同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。
()参考答案:对5.云原生数据仓库MySQL版(简称ADB,原AnalyticDB for MySQL)是一种高并发低延时的PB级新一代云原生数据仓库,全面兼容MySQL协议以及SQL:2003 语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视和业务探索。
()参考答案:对第二章测试1.ETL是Extract、 Transform、 Loading三个字母的缩写,即抽取、转换、()。
参考答案:装载2.HBase是一个构建在HDFS上的分布式列存储系统,用于海量结构化、半结构化数据存储。
()参考答案:对3.数据规约:在尽可能保持数据原貌的前提下,最大限度地精简数据量。
主要包括属性选择和数据抽样两种方法。
()参考答案:对4.数据清洗是针对原始数据,对出现的噪声进行修复、平滑或者剔除。
包括异常值、缺失值、重复记录、错误记录等;同时过滤掉不用的数据,包括某些行或某些列。
()参考答案:对5.使用算法确保历史模型能够用户预测特定的结果。
()参考答案:对第三章测试1.SQL集数据查询、数据操纵、数据定义和数据库控制功能于一体,语句ALTER TABLE实现数据定义功能。
绪论单元测试1【判断题】(20分)智能手机、飞机、动车以及家用电器中使用计算机芯片来实现自动控制。
A.错B.对2【判断题】(20分)手机上的各种APP应用程序是完成某种应用功能的计算机软件。
A.错B.对3【判断题】(20分)数据的传输与共享依靠的是计算机网络技术的支持。
A.错B.对4【判断题】(20分)拥有计算思维在如今的信息化社会变得尤为重要。
A.错B.对5【判断题】(20分)培养计算思维离不开了解计算机系统的基本概念和原理。
A.错B.对第一章测试1【判断题】(10分)英国科学家艾伦.图灵提出了图灵机模型,是计算机科学史上最为重要的理论模型。
A.错B.对2【判断题】(10分)目前计算系统以超大规模集成电路为基础,向巨型化、微型化、网络化与智能化的方向发展。
A.对B.错3【单选题】(10分)第一台电子计算机系统是1946年在美国研制,该机的英文缩写名是()A.EDSACB.ENIACC.EDVACD.MARK-4【单选题】(10分)微型计算机中使用的人事档案管理系统,属下列计算机应用中的()A.科学计算B.信息管理C.专家系统D.人工智能5【判断题】(10分)运算器是只负责算术运算基本部件。
A.错B.对6【判断题】(10分)控制器负责读取指令、分析指令并执行指令,同时协调控制计算机各部件的协同工作。
A.对B.错7【判断题】(10分)算盘是自动计算工具。
A.错B.对8【判断题】(10分)科学家帕斯卡发明了加法器。
A.错B.对9【判断题】(10分)科学家图灵提出了机器可以具有智能的观点。
A.错B.对10【判断题】(10分)冯诺依曼体系结构的计算机具有五大功能部件,输入设备、输出设备、运算器、控制器、存储器。
A.错B.对第二章测试1【单选题】(10分)计算机中所有信息的存储都采用()A.十六进制B.十进制C.八进制D.二进制2【单选题】(10分)计算机中,一个浮点数由两部分组成,他们是阶码和()A.小数B.整数C.基数D.尾数3【判断题】(10分)补码运算的特点是用加法可以实现减法、乘法和除法运算,能简化计算机中运算器的内部结构。
第一章单元测试1、单选题:大数据泛指巨量的()。
选项:A:数组集B:数字集C:数据集D:字符集答案: 【数据集】2、单选题:数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。
选项:A:统计分析方法B:定性与定量方法C:概率分析方法D:系统分析方法答案: 【统计分析方法】3、单选题:浏览数据这一步骤可以通过对大数据进行()来实现。
选项:A:流程化B:分析化C:简易化D:可视化答案: 【可视化】4、多选题:Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。
选项:A:流程优化能力B:数据处理能力C:决策力D:洞察发现力答案: 【流程优化能力;决策力;洞察发现力】5、多选题:我们通常用“4V”来反映大数据的特点,4V是指()。
选项:A:VelocityB:VarietyC:VariousD:Valid答案: 【Velocity;Variety】6、多选题:大数据分析可以应用在那些领域()。
选项:A:商业领域B:医疗卫生领域C:交通运输领域D:农业领域答案: 【商业领域;医疗卫生领域;交通运输领域;农业领域】7、多选题:大数据分析的过程包括()。
选项:A:数据理解B:数据处理C:数据优化D:数据准备答案: 【数据理解;数据准备】8、判断题:数据只要有足够的规模就可以称为大数据。
()选项:A:对B:错答案: 【对】9、判断题:大数据分析是大数据到知识,再到信息的关键步骤。
()选项:A:错B:对答案: 【错】10、判断题:大数据分析模型用于描述数据之间的关系。
如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。
()选项:A:对B:错答案: 【对】第二章单元测试1、单选题:数据仓库的定义于哪一年提出()。
选项:A:1991B:2015C:1902D:2002答案: 【1991】2、单选题:符合选择建立数据仓库平台的公认标准的是()。
选项:A:是否提供支持少量数据的数据加载B:是否支持对数据库的管理C:是否支持串联操作D:数据库对大数据量的支持能力答案: 【数据库对大数据量的支持能力】3、单选题:建立数据仓库的首要步骤是()。
第一章测试1【判断题】(20分)缩进对于Python程序至关重要。
A.对B.错2【判断题】(20分)在Python3.x中不能使用汉字作为变量名。
A.对B.错3【多选题】(20分)下面哪些是正确的Python标准库对象导入语句?A.frommathimportsinB.importmath.*C.importmath.sinassinD.frommathimport*4【判断题】(20分)Python支持面向对象程序设计。
A.对B.错5【多选题】(20分)下面属于Python编程语言特点的有?A.扩展库丰富B.支持函数式编程C.支持命令式编程D.代码运行效率高第二章测试1【判断题】(20分)已知列表x=[1,2,1,2,3,1],那么执行x.remove(1)之后,x的值为[2,2,3]。
A.对B.错2【判断题】(20分)已知列表x=[1,2,3],那么执行y=x.reverse()之后,y的值为[3,2,1]。
A.错B.对3【判断题】(20分)Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
A.对B.错4【判断题】(20分)表达式3>5andmath.sin(0)的值为0。
A.错B.对5【判断题】(20分)表达式4<5==5的值为True。
A.错B.对第三章测试1【判断题】(10分)生成器表达式的计算结果是一个元组。
A.对B.错2【判断题】(15分)包含列表的元组可以作为字典的“键”。
A.错B.对3【判断题】(20分)列表的rindex()方法返回指定元素在列表中最后一次出现的位置。
A.错B.对4【判断题】(15分)Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
A.错B.对5【判断题】(15分)列表可以作为字典元素的“键”。
A.对B.错6【判断题】(25分)Python语言中字符串对象的strip()只能删除字符串两端的空白字符,无法删除其他字符。
第一章测试1【单选题】(2分)大数据的英文描述是()A.HeavydataB.LargedataC.GreatdataD.Bigdata2【单选题】(2分)下面最大的储存单位是()A.KBB.TBC.GBD.PB3【单选题】(2分)大数据之父是()A.詹姆斯·高斯林B.姚期智C.查尔斯·巴赫曼D.维克托·迈尔-舍恩伯格4【多选题】(2分)大数据的特点包括()A.VelocityB.ValueC.VolumeD.Variety5【多选题】(2分)第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A.PNASB.ScienceC.NatureD.Cell6【判断题】(2分)大数据是只和互联网相关的计算机技术。
A.错B.对7【判断题】(2分)企业中大部分的数据都是非结构化数据。
A.错B.对8【判断题】(2分)大数据技术的基础是由阿里巴巴首先提出的。
A.错B.对9【判断题】(2分)大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
A.对B.错10【判断题】(2分)大数据对网络安全没有威胁。
A.对B.错第二章测试1【单选题】(2分)目前,企业的数据架构存在的最大比例问题是()A.运营成本高B.拓展性差C.高耗能D.资源利用率低2【判断题】(2分)目前,企业数据分析处理面临的主要问题是缺少数据全方位分析方法。
A.对B.错3【单选题】(2分)地图导航根据以往的行程记录,绘制了最优路程,标明了可能堵车的地点,这表现了大数据分析理念中的()A.注重全体而不是局部B.注重相关性而不是因果性C.注重效率而不是准确D.注重相对性而不是绝对性4【单选题】(2分)最早提出大数据研发计划的国家是()A.中国B.美国C.法国D.日本5【多选题】(2分)大数据可能被运用的行业有()A.金融B.农业C.医疗D.教育6【判断题】(2分)2015年9月18日云南省启动我国首个大数据综合试验区的建设工作。
A.对B.错7【判断题】(2分)大数据的价值密度很高。
A.对B.错8【判断题】(2分)日本政府将IT产业,尤其是大数据及云计算作为促进经济增长,解决内部矛盾一个关键。
A.错B.对9【判断题】(2分)非结构化数据对企业也富有价值。
A.错B.对10【判断题】(2分)企业的日数据生成量可达到1TB。
A.对B.错第三章测试1【单选题】(2分)HDFS中文件存储的基本节点是()A.WholeNodeB.NameNodeC.DataNodeD.BaseNode2【单选题】(2分)下面不属于ETL的功能是()A.抽取B.加载C.翻译D.转换3【多选题】(2分)自然语言处理的范畴包括()A.中文自动分词B.关联分析C.离群值检测D.机器翻译4【多选题】(2分)ApacheHadoop所涉及的核心技术包括()A.HDFSB.MapReduceC.EMCD.Hbase5【多选题】(2分)HDFS的主要结构包括()A.DataNodeB.ClientC.NameNodeD.Server6【多选题】(2分)下列算法中属于聚类算法的是()A.k-distanceB.DBSCANC.K-meansD.Apriori7【判断题】(2分)Hadoop可以运行在任何普通的PC机上。
A.错B.对8【判断题】(2分)Client是获取分布式文件的应用程序A.错B.对9【判断题】(2分)Hadoop是一种集中式存储和计算技术。
A.错B.对10【判断题】(2分)聚类之前的样本没有类别A.对B.错第四章测试1【单选题】(2分)Modeler在2009年被()收购后对产品的性能和功能进行了大幅度的改进和提升。
A.IBMB.苹果C.微软D.谷歌2【单选题】(2分)Modeler数据挖掘功能将复杂的统计方法和()技术结合到一起。
A.机器学习B.大数据C.信息安全D.软件工程3【单选题】(2分)Modeler可以将模型保存为()的通用格式,支持对其进行二次开发。
A.PKLB.PBC.PMMLD.CKPT4【多选题】(2分)下面()是基本数据流的节点。
A.变量文件节点B.导出节点C.选择节点D.导入节点5【多选题】(2分)Modeler中的常用节点选项面板包括:()。
A.源B.建模选项C.记录选项D.字段选项E.图形选项6【判断题】(2分)Modeler和Statistics是相互独立的两个数据分析软件。
A.错B.对7【判断题】(2分)Modeler可以对可变长度记录进行数据的处理。
A.对B.错8【判断题】(2分)Modeler能通过第三方提供开放的ODBC与其他数据库连接。
A.错B.对9【判断题】(2分)Modeler不支持生成散点图、分布图等来反映数据的特征。
A.错B.对10【判断题】(2分)Modeler支持数据挖掘CRISP-DM的标准流程。
A.对B.错第五章测试1【单选题】(2分)协方差分析中,如果两个变量的变化趋势一致,那么这两个变量之间的协方差就是()。
A.B.正值C.不清楚D.负值2【单选题】(2分)在抽样调查中,如果样本数量N为()时,就称为大样本。
A.N>=50B.N>=30C.N>=20D.N>=1003【单选题】(2分)在统计调查中,()误差是由观察、测量或计算等原因所造成的。
A.系统误差B.登记性误差C.随机性误差D.抽样误差4【多选题】(2分)常见的数据变换操作包括()。
A.数据规约B.平滑C.规范化D.聚集E.属性构造5【多选题】(2分)平滑处理在科学研究中广泛使用,常用方法有()。
A.聚类法B.滤波法C.加权移动平均D.单纯移动平均6【多选题】(2分)维数归约的主要方法有()。
A.逐步向前删除B.逐步向后删除C.逐步向前选择D.逐步向后选择7【判断题】(2分)抽样极限又称置信区间,是指一定概率下抽样误差的真实范围。
A.对B.错8【判断题】(2分)数据规约是指在尽可能保持数据原貌的前提下,最大限度地精简属性数量。
A.对B.错9【判断题】(2分)聚集也称为数据汇总,用来构建数据立方体。
A.错B.对10【判断题】(2分)在概率论和统计学中,协方差用于衡量两个变量的平均误差。
A.对B.错第六章测试1【单选题】(2分)在计算机领域,()用来描述数据的起源或者出处。
A.缘由B.溯源C.来源D.源头2【单选题】(2分)由于采集设备异常,造成接收的数据取值不合理,是属于()类型的数据质量问题。
A.空值B.缺少完整性约束C.数据失效D.噪声数据3【单选题】(2分)数据质量的相关技术中,()被用来检查文件系统或者数据库中数据的过程。
A.数据清洁B.数据集成C.数据剖析D.数据采集4【单选题】(2分)在四种数据集成技术中,()技术可以实现对各个数据源数据的抽取、清洗、转换和复制。
A.基于数据仓库的数据集成模型B.基于中间件的数据集成模型C.联邦数据库系统结构D.MPP数据库存储与处理架构5【多选题】(2分)数据剖析的分类是()。
A.非结构化数据B.单源数据C.多源数据D.结构化数据6【多选题】(2分)针对“空值”的数据清洁方法有()。
A.人工填写B.概率统计值填充C.均值填充D.全局变量填充7【判断题】(2分)数据溯源追踪的主要方法有标注法和反向查询法。
A.错B.对8【判断题】(2分)AHP质量评估方法一般是应用于质量指标权重值的确定。
A.对B.错9【判断题】(2分)数据质量的定性评估主要依靠支持者的主观判断。
A.错B.对10【判断题】(2分)综合评估方法结合了定性评估和定量评估的优点,适用范围更广泛。
A.对B.错第七章测试1【单选题】(2分)使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的()任务?A.建模描述B.寻找模式和规则C.预测建模D.探索性数据分析2【单选题】(2分)英文单词缩写KDD表示()含义?A.动态知识发现B.文档知识发现C.数据挖掘与知识发现D.领域知识发现3【单选题】(2分)以下()操作会降低Apriori算法的挖掘效率。
A.减小硬盘读写速率B.支持度阈值增大C.事务数减少D.项数减少4【多选题】(2分)寻找数据集中的关系是为了寻找精确、方便并且有价值地总结出数据的某一特征的表示,这个过程包括了以下()步骤?A.决定要使用的表示的特征和结构B.选择一个算法过程使评分函数最优C.决定如何量化和比较不同表示拟合数据的好坏D.决定用什么样的数据管理原则以高效地实现算法5【多选题】(2分)下面列出的条目中,()是数据仓库的基本特征。
A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是反映历史变化的D.数据仓库的数据是相对稳定的E.数据仓库的数据是集成的6【判断题】(2分)关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
A.对B.错7【判断题】(2分)给定关联规则AàB,意味着:若A发生,B也会发生。
A.对B.错8【判断题】(2分)Apriori算法产生的关联规则总是确定的A.对B.错9【判断题】(2分)对于项集来说,置信度没有意义。
A.对B.错10【判断题】(2分)数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。
A.错B.对第八章测试1【单选题】(2分)关于相关系数,下面不正确的描述是A.两变量之间的相关关系是单相关B.当r=0时,表示两变量间无相关C.如果自变量增长引起因变量的相应增长,就形成正相关关系D.当0≤|r|≤1时,表示两变量不完全相关2【单选题】(2分)当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在()关系A.直线正相关B.曲线正相关C.曲线负相关D.直线负相关3【单选题】(2分)评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示()。
A.低度相关B.高度相关C.中等相关D.无相关4【单选题】(2分)身高和体重之间的关系是()A.函数关系B.严格的依存关系C.无关系D.共变关系5【单选题】(2分)下列关系中,属于正相关关系的是()A.产品与单位成本B.商品的零售额和流通费率C.正常商品的价格和需求量D.身高与体重6【单选题】(2分)当所有的观察值y都落在直线yc=a+bx上时,则x与y之间的相关系数为()A.r=0B.r=1C.0<r<1<span=""></r<1<>D.-1<r<1<span=""></r<1<>7【单选题】(2分)两变量X和Y的相关系数为0.8,则其回归直线的判定系数为()A.0.5B.0.8C.0.9D.0.648【单选题】(2分)在完成了构造与评价一个回归模型后,我们可以()A.以给定的因变量的值估计自变量的值B.计算相关系数和判定系数C.估计未来所需样本的容量D.以给定的自变量的值估计因变量的值9【单选题】(2分)在回归分析中,两个变量()A.都是随机变量B.自变量是随机变量C.因变量是随机变量D.都不是随机变量10【单选题】(2分)以下指标恒为正的是()A.斜率bB.截距aC.相关系数rD.复相关系数第九章测试1【单选题】(2分)科学可视化主要关注的是()维现象的可视化。