数据挖掘——探索数据的奥秘智慧树知到课后章节答案2023年下青岛工学院
- 格式:docx
- 大小:16.93 KB
- 文档页数:15
译路畅通:英汉互译智慧树知到课后章节答案2023年下青岛工学院青岛工学院第一章测试1.在中国影响最深,流传最广的翻译标准是严复的“信、达、雅”。
()A:对 B:错答案:对2.翻译的基本单位有哪些?()A:段落 B:词语 C:句子 D:篇章答案:段落;词语;句子;篇章3.柳宗元的《江雪》的第一句“千山鸟飞绝”中的“千山”译为“a thousandmountains”.()A:错 B:对答案:错4.美国理论家奈达(Eugene A. Nida)把翻译定义为“ Translating consists inreproducing in the receptor language, the equivalent of the source language message first in terms of meaning and second in terms of style.”()A:对 B:错答案:对5.泰特勒提出了著名的翻译三原则,1)译文应该完全传达有原文的思想,2)译文的写法与风格与原文的写法与风格相同,3)译文应如同译语创作一样流畅。
()A:错 B:对答案:对6.语言的七大功能包括以下哪些选项?()A:美感功能 B:表情功能 C:信息功能 D:呼唤功能答案:美感功能;表情功能;信息功能;呼唤功能7.指称意义也称认知意义,指词语所指客体思想或行为之间的直接联系,指词的确切和字面的意义,就是字典意义。
()A:错 B:对答案:错8.蕴含意义也称为情感意义,指词内涵的情感和联想意义,或词的隐含意义。
()A:错 B:对答案:对9.翻译中的惯用法意识表现在学习者了解、熟悉并处处有意遵循英语的习惯用法,包括动词的用法、动词和其他词语的搭配(如动词与名词、介词、副词的搭配)、习语的用法、英语词汇中丰富的表达方式等。
()A:错 B:对答案:对10.广博文化可以从以下哪些方面理解?()A:知识面,比如历史,地理,风土人情,自然风貌,文学艺术,文化传统,宗教信仰等 B:扎实的双语基本功 C:汉英两种语言所反映的中西文化差异的知识 D:翻译理论以及翻译相研究相关学科的知识,比如语言学及各个分支哲学,哲学,文学,心理学,美学等答案:知识面,比如历史,地理,风土人情,自然风貌,文学艺术,文化传统,宗教信仰等;汉英两种语言所反映的中西文化差异的知识;翻译理论以及翻译相研究相关学科的知识,比如语言学及各个分支哲学,哲学,文学,心理学,美学等第二章测试1.在被动结构方面 _______。
软件质量保证与测试技术智慧树知到课后章节答案2023年下青岛工学院青岛工学院第一章测试1.导致软件缺陷的最大原因是()A:测试 B:设计 C:需求分析 D:编码答案:需求分析2.下列那种不属于软件缺陷()。
A:网上售票软件反应迟钝,用户难以正常买票 B:某软件在进行修改升级之后,原来正常的功能现在出错了C:银行POS机在用户取款时翻倍吐钱,取100,吐200 D:计算机病毒发作,屏幕出现熊猫烧香画面答案:计算机病毒发作,屏幕出现熊猫烧香画面3.测试的关键问题是()。
A:如何选择测试用例 B:如何验证程序的正确性 C:如何采用综合策略 D:如何组织软件评审答案:如何选择测试用例4.常见的软件测试模型有()。
A:V模型 B:W模型 C:M模型 D:H模型答案:V模型;W模型;H模型5.软件测试按照测试技术分类包含()。
A:白盒测试 B:手工测试 C:单元测试 D:黑盒测试答案:白盒测试;黑盒测试6.测试就是为了验证软件已正确地实现了用户的要求。
()A:对 B:错答案:错7.软件开发过程中,若能推迟暴露其中的错误,则为修复和改进错误所花费的代价就会降低。
()A:错 B:对答案:错8.软件测试只能发现错误,但不能保证测试后的软件没有错误。
()A:错 B:对答案:对9.敏捷测试是一种遵循敏捷软件开发规则和原则的测试实践。
()A:错 B:对答案:对10.测试用例设计时既需要考虑正确数据,也需要考虑错误数据。
A:错 B:对答案:对第二章测试1.CMM将软件组织的软件能力成熟度描述为()A:五级 B:四级 C:二级 D:三级答案:五级2.下列那种不属于企业规范()。
A:华为开发手册 B:阿里、腾讯、百度程序员编程指南规范 C:Google 编程规范 D:ISO9000答案:ISO90003.CMMI的全称为()。
A:软件能力成熟度模型集成 B:软件能力成熟度模型 C:软件质量标准 D:软件质量模型答案:软件能力成熟度模型集成4.软件质量可以通过以下哪些质量属性来度量()。
数据仓库与数据挖掘_青岛大学中国大学mooc课后章节答案期末考试题库2023年1.非频繁项集的超集有可能是频繁的。
参考答案:错误2.决策树中不包含以下哪种节点。
参考答案:外部节点(external node)3.数据集成是将多个数据源中的数据结合起来存放在一个一致的数据存储(如数据仓库)中。
数据源可能涉及多个数据库、数据立方体或一般文件。
参考答案:正确4.数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。
参考答案:正确5.若属性income的平均值和标准差分别为32000元和17000元,则使用z-score规范化后,65600元被转换为:参考答案:1.9766.朴素贝叶斯算法能够解决特征之间有相关性的问题。
参考答案:错误7.OLAP技术的核心是:参考答案:多维分析8.假定某属性的最小与最大值分别为8000元和14000元。
要将其映射到区间[0.0,1.0],按照最小-最大规范化方法对属性进行变换,属性值12600将变换为:参考答案:0.7679.后验概率P(H|X)表示条件X下H的概率。
参考答案:正确10.只要有两个频繁3项集,就一定能够生成一个候选4项集。
参考答案:错误11.先验概率是根据历史资料或主观估计的方法得到的概率。
参考答案:正确12.公司里面男性有60人,女性有40人,男性穿皮鞋的人数有25人,穿运动鞋的人数有35人,女性穿皮鞋的人数有10人,穿高跟鞋的人数有30人。
现在你只知道有一个人穿了皮鞋,推测他是男性的概率为:参考答案:0.71413.数据归约是用来得到数据集的归约表示,它比源数据集小得多,但仍接近于保持源数据的完整性。
参考答案:正确14.数据分类由两步过程组成:第一步,建立一个分类模型,描述指定的数据类集或概念集;第二步,使用模型进行分类。
参考答案:正确15.假设吸烟的本科生比例为15%,而吸烟的研究生占23%。
如果五分之一的大学生是研究生,其余的是本科生,那么吸烟的学生是研究生的概率是多少?参考答案:0.27716.决策树构建之后,为了避免过度拟合,需要对树进行剪枝。
数据挖掘智慧树知到课后章节答案2023年下山东建筑大学山东建筑大学第一章测试1.下列属于大数据时代特征的是:答案:非结构化数据越来越多;数据类型越来越复杂;大人群产生了大量数据2.对数据挖掘内涵描述正确的是答案:数据挖掘的对象一般是大量的不完整的数据;挖掘的结果可以是出乎意料的规则和内容3.聚类分析是预测型的数据挖掘,而关联分析是描述型的。
答案:错4.描述“性别”的属性是二元分类属性。
答案:对5.下列是分类型属性的是:答案:信用等级:3(级别为1-5,数值越高信用级别越高);邮政编码:250101 6.区间属性可以计算两个属性之间的倍数。
答案:错7.具有有限个值的属性才是离散属性。
答案:错8.定量属性可以取整数值。
答案:对9.关于连续属性与离散属性,下列说法正确的是:答案:连续属性的比率不一定有意义;连续属性有无限个取值10.连续属性可以进行离散转化成离散属性。
答案:对第二章测试1.和数据库中的数据一样,数据仓库中的数据也可以进行修改和删除。
答案:错2.以下哪项是元数据的包含的内容?答案:数据的更新频率;数据所做的转换;数据元素的含义;数据的来源3.事实表中存储的是维度。
答案:错4.数据仓库的数据是面向主题的,主题与业务系统中的数据库是一一对应的。
答案:错5.下列哪项不是OLAP多维分析操作?答案:透视6.维的层次越高,数据的粒度越大。
答案:对7.在OLAP多维分析操作中,旋转操作不改变数据,只是改变了数据集的展示方位。
答案:对8.星型模型不能表达维度的层次。
答案:对9.OLTP系统中的数据是数据仓库数据的主要来源。
答案:对10.数据仓库中不存储早期细节的数据。
答案:错第三章测试1.Mondrian中Schema是以XML文件的形式定义的。
Cube由维度构建出来的多维空间,是一系列Dimension Measure的集合区域,它们共用一个事实表。
答案:对2.维度表是事实表的一部分。
答案:错3.事实表是维表的一部分。
第一章测试1.大数据泛指巨量的()。
A:数组集B:字符集C:数据集D:数字集答案:C2.数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。
A:统计分析方法B:系统分析方法C:定性与定量方法D:概率分析方法答案:A3.浏览数据这一步骤可以通过对大数据进行()来实现。
A:简易化B:可视化C:流程化D:分析化答案:B4.Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。
A:洞察发现力B:决策力C:流程优化能力D:数据处理能力答案:ABC5.我们通常用“4V”来反映大数据的特点,4V是指()。
A:VarietyB:VelocityC:ValidD:Various答案:AB6.大数据分析可以应用在那些领域()。
A:农业领域B:医疗卫生领域C:商业领域D:交通运输领域答案:ABCD7.大数据分析的过程包括()。
A:数据优化B:数据准备C:数据理解D:数据处理答案:BC8.数据只要有足够的规模就可以称为大数据。
()A:对B:错答案:A9.大数据分析是大数据到知识,再到信息的关键步骤。
()A:错B:对答案:A10.大数据分析模型用于描述数据之间的关系。
如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。
()A:错B:对答案:B第二章测试1.数据仓库的定义于哪一年提出()。
A:2015B:1991C:1902D:2002答案:B2.符合选择建立数据仓库平台的公认标准的是()。
A:是否支持串联操作B:数据库对大数据量的支持能力C:是否支持对数据库的管理D:是否提供支持少量数据的数据加载答案:B3.建立数据仓库的首要步骤是()。
A:构建模型B:数据仓库管理C:确认主题D:数据预处理答案:C4.数据仓库的数据模型进行逻辑建模的分析角度是()。
A:逻辑分析B:经济分析C:政治分析D:业务分析答案:D5.建立数据仓库的选择平台是()。
A:分析工具B:数据库C:维度表D:建模工具答案:ABD6.建立数据仓库的步骤是()。
电子商务数据分析与应用智慧树知到课后章节答案2023年下青岛黄海学院青岛黄海学院第一章测试1.利用几种主要的财务比率之间的关系来综合分析企业财务状况,评价企业盈利能力和股东权益回报水平的电商数据分析方法是()。
A:杜邦拆解法B:对比分析法C:直接观察法D:七何分析法答案:杜邦拆解法2.电商数据分析的常用方法主要有()。
A:AB测试法B:转化漏斗法C:直接观察法D:对比分析法答案:AB测试法;直接观察法;对比分析法3.电子商务数据分析的主要数据指标有()。
A:销售活动指标B:网站运营指标C:消费者价值指标D:销售业绩指标答案:销售活动指标;网站运营指标;消费者价值指标;销售业绩指标4.商务数据采集的流程主要包括的环节有()。
A:数据挖掘B:明确分析对象C:明确采集要求D:按需求采集数据答案:明确分析对象;明确采集要求;按需求采集数据5.电子商务的实施要依靠互联网、企业内部网络等计算机网络技术来完成信息的交流和传输,需要计算机硬件与软件技术的支持。
()A:错 B:对答案:对6.商家可以通过生意参谋了解店铺目前经营状况,包括流量情况、访客数、销售情况及推广情况等,也可以分析商品交易、营销、物流、市场行情和竞争对手等数据。
()A:对 B:错答案:对第二章测试1.下列说法正确的是()。
A:淘宝店铺只能通过生意参谋分析市场容量B:分析市场容量时可以看绝对数据C:分析市场容量大小有利于制定销售和运营的计划与目标。
D:在分析数据的时候一定可以通过分析出来的表面数据,选择合适的商品行业。
答案:分析市场容量大小有利于制定销售和运营的计划与目标。
2.当无法通过直接观察来判断市场行情时,便可使用()来对数据进行分析。
A:行业稳定性B:行业波动系数C:行业极值D:行业集中度答案:行业稳定性;行业集中度3.环比可分为()。
A:月环比B:周环比C:日环比D:年环比答案:月环比;周环比;日环比;年环比4.下列有关波士顿矩阵说法正确的是()。
核医学(青岛大学)智慧树知到课后章节答案2023年下青岛大学青岛大学绪论单元测试1.核素显像的方法是根据:( )A:根据人体器官的组织密度的差异成像 B:放射性药物在不同的器官及病变组织中特异性分布而成像 C:射线穿透不同人体器官组织的差异成像 D:生物磁自旋原理答案:放射性药物在不同的器官及病变组织中特异性分布而成像2.已知一核素半衰期为2天,剂量为8mCi,请问8天后为:( )A:1mCi B:2mCil C:0.5mCi D:1.5mCi答案:0.5mCi3.关于放射防护的目的与原则,说法错误的是:( )A:个人剂量的限制 B:实践的正当化 C:限制非随机性效应 D:防止有害的确定性效应答案:限制非随机性效应4.β-粒子穿透力弱,例如能量为2MeV的β-粒子在软组织中的射程仅约为:( )A:8mmB:4mm C:6mm D:50px答案:50px5.关于γ射线下列哪项正确:( )A:在所有的核衰变中均发射 B:每次β衰变时发射 C:当原子核处于激发态时发射 D:每次α衰变时发射答案:当原子核处于激发态时发射6.关于正电子放射性核素下列哪项正确:( )A:常探测其发射的能量为511keV的γ光子 B:适于普通SPECT C:可通过普通的γ相机理想探测 D:常常有较长的半衰期答案:常探测其发射的能量为511keV的γ光子7.新型SPECT(有定位CT的)是通过下列哪项技术获得功能解剖图像的( )A:平面显像 B:图像融合技术 C:半定量显像技术 D:定量显像技术答案:图像融合技术8.回旋加速器生产的放射性核素常是:( )A:存在时间长 B:中子缺少 C:中子过剩 D:价格便宜答案:中子缺少9.在核医学探测器中,以下那-部分可以将光信号转换成电信号( )A:放大器 B:闪烁晶体 C:准直器 D:光电倍增管答案:光电倍增管10.由铅或钨合金制成,其作用是用来限制无规律的散射光子,允许特定方向上的光子通过的装置是( )A:光电倍增管 B:放大器 C:准直器 D:闪烁晶体答案:准直器第一章测试1.SUV(标准化摄取值)是目前18F-FDG PET/CT显像中最常用的半定量分析指标,其影响因素包括()A:血糖水平 B:图像重建参数 C:所有选项都是 D:注射剂量、患者体重 E:注射显像剂后至显像时间的时间间隔答案:所有选项都是2.18F-FDG在何种酶的催化下转化为6-磷酸-18F-FDG()A:葡萄糖-6-磷酸酶 B:磷酸化酶 C:葡萄糖转运蛋白 D:6-磷酸果糖激酶 E:己糖激酶答案:己糖激酶3.关于18F-FDG PET 肿瘤显像方法中错误的是()A:注射显像前后至显像时,检查者应处于安静状态 B:显像开始前排空膀胱 C:检查前取下项链、腰带、硬币等高密度物品 D:注射正电子显像剂前禁食4-6小时,同时禁水 E:注射部位选择病变对侧肢体答案:注射正电子显像剂前禁食4-6小时,同时禁水4.目前18F-FDG PET/CT比较难以鉴别诊断下列哪种疾病?()A:脑胶质瘤放疗后坏死与复发B:肺癌与肺活动性结核 C:乳腺癌与乳腺纤维瘤 D:直肠癌与直肠炎性息肉答案:肺癌与肺活动性结核5.下列最适合前列腺癌的显像剂是()A:68Ga-PSMA B:11C-CFT C:99m Tc-MDP D:18F-FDG答案:68Ga-PSMA6.18F-FDG PET/CT肿瘤显像可用于()A:判断疗效及预后评估 B:术前分期 C:查找原发灶 D:良恶性鉴别答案:判断疗效及预后评估;术前分期;查找原发灶;良恶性鉴别7.18F-FDG PET/CT肿瘤显像假阳性常见于()A:活动性结核 B:炎性肉芽肿 C:放疗后瘢痕组织 D:细支气管肺泡癌答案:活动性结核;炎性肉芽肿8.18F-FDG可以在下列哪些器官或组织中呈明显高摄取()A:脑皮质 B:心肌 C:肿瘤组织 D:骨髓答案:脑皮质;心肌;肿瘤组织9.99m Tc-奥曲肽可用于下列哪些病变显像?()A:类癌 B:胰腺神经内分泌瘤 C:肝细胞肝癌 D:小细胞肺癌答案:类癌;胰腺神经内分泌瘤;小细胞肺癌10.患者血糖水平升高,可导致病变SUV值下降()A:错 B:对答案:对11.患者长期应用激素,可导致病变SUV值升高()A:错 B:对答案:错12. 68Ga-PSMA显像是基于抗原-抗体特异性结合的原理()A:对 B:错答案:对13.心肌是18F-FDG PET/CT肿瘤显像中摄取变异度最大的器官()A:错 B:对答案:对14.11C-MET是目前临床应用最广的氨基酸代谢显像剂()A:错 B:对答案:对第二章测试1.一患者核素心肌灌注显像提示前壁固定性放射性缺损,FDG心肌代谢显像前壁摄取基本正常。
智慧树知道网课《数据挖掘》课后章节测试满分答案第一章测试1【单选题】(20分)什么是KDD?A.C.文档知识发现B.A.数据挖掘与知识发现C.D.动态知识发现D.B.领域知识发现2【判断题】(20分)数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。
A.错B.对3【多选题】(20分)数据挖掘的预测建模任务主要包括哪几大类问题?A.分类B.模式匹配C.模式发现D.回归4【多选题】(20分)以下哪些学科和数据挖掘有密切联系?A.人工智能B.计算机组成原理C.矿产挖掘D.统计5【判断题】(20分)离群点可以是合法的数据对象或者值。
A.错B.对第二章测试1【单选题】(20分)下面哪个属于定量的属性类型:A.区间B.序数C.标称D.相异2【单选题】(20分)只有非零值才重要的二元属性被称作:A.非对称的二元属性B.离散属性C.对称属性D.计数属性3【判断题】(20分)定量属性可以是整数值或者是连续值。
A.对B.4【单选题】(20分)中心趋势度量模(mode)是指A.数据集中出现频率最高的值B.算术平均值C.最大值D.最小值5【多选题】(20分)以下哪些是属于中心趋势的度量A.标准差B.中位数五数概括D.平均值第三章测试1【单选题】(20分)数据清洗的方法不包括A.一致性检查。
数据库与数据挖掘智慧树知到课后章节答案2023年下南京邮电大学南京邮电大学第一章测试1.下列属于关系模型的性质的是()答案:行列的顺序可以任意交换;分量必须取原子值;列是同质的2.根据实体完整性规则,下列说法正确的是()答案:主键非空3.下列做法最有可能违背用户定义完整性的是()答案:日期数据出现2月30日4.以下操作应用场景主要是获取两个集合的相对补集的是()答案:差操作5.从关系R中选择出若干属性组成新的关系属于()答案:连接操作6. ER图中菱形表示的是()答案:联系7.系统中的成绩联系属于()答案:联系;多对多关系8.下列说法错误的是()答案:AP原则系统不容忍时间延迟9.分布式系统可以同时满足CAP原则答案:错10.下列不属于关系型数据库局限性的是()答案:数据格式不完备第二章测试1.Hive中删除管理表不会删除表所指向的数据文件答案:错2.Hive会在数据读取时进行数据类型验证答案:对3.Hive在strict(严格)模式下查询分区表时,WHERE子句必须要加上分区过滤。
答案:对4.下列语句可以显示数据库test中的表名的包括()答案:SHOW TABLES IN test;;USE test;SHOW TABLES;5.Hive可以向视图(VIEW)中导入数据。
答案:错6.若分区表test包含的分区字段为(a,b),如何查看分区a=1下的所有分区()答案:SHOW PARTITIONS test PARTITION(a=1);7.以下命令可以查询date_records中约会成功匹配(match=1)次数的是()答案:SELECT count(*) FROM date_records WHERE match=1;;SELECTsum(match) FROM date_records;8.Hive使用右外连接(RIGHT OUTER JOIN)来连接两张表进行查询时,JOIN操作符右边的表如果没有符合ON后面连接条件的记录时,右边表指定选择的列的值将不会显示。
数据分析与统计智慧树知到课后章节答案2023年下山东工业职业学院山东工业职业学院第一章测试1.下面哪一个是数量标志( )。
答案:钢产量2.下列哪一个是品质标志( )。
答案:所有制3.构成统计总体的个别事物称为()。
答案:总体单位4.下列变量中属于连续变量的有()答案:身高;耕作深度;劳动生产率;平均工资5.总体的大量性是指总体的范围不能确定。
()答案:错第二章测试1.在对总体现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查研究,这种调查方法是()。
答案:典型调查2.有意识地选取几十块耕地来估算该地区的粮食产量,这种调查方式属于()答案:典型调查3.在统计调查中,调查单位与填报单位之间()答案:通常是有区别的,但有时也一致4.重点调查是()答案:;非全面调查;可用于经常性调查5.各种调查方法的结合运用,会造成重复劳动,因此不应提倡。
()答案:错第三章测试1.某连续型变量的组距数列,其末组为开口组,下限为600,其邻组的组中值为550,则末组的组中值为()。
答案:6502.组数与组距的关系是()。
答案:组数越多,组距越小3.有20 个工人看管机器台数资料如下: 2,5,4,4,3,4,3,4,4,2,2,4, 3,4,6,3,4,5,2,4。
如按以上资料编制分配数列,应采用()答案:4.统计分组的作用在于()答案:划分现象的类型;揭示现象的内部结构;保证统计分析结果的真实性5.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。
()答案:对第四章测试1.在相对指标中,可以用有名数表示的指标是()。
答案:强度相对指标;2.人口出生率是()。
答案:强度相对指标;3.下列指标中不是时期指标的是()。
答案:商品库存额4.下列指标中,属于时点指标的有()。
答案:期末职工数;;商品库存额;5.标准差大的平均数代表性小,标准差小的平均数代表性大( )答案:错第五章测试1.某银行1月1日存款余额为102万元,1月2日为108万元,1月3日为119万元,则三天平均存款余额为()答案:(102+108+119)÷32.定基增长速度与环比增长速度的关系是()。
数据挖掘——探索数据的奥秘智慧树知到课后章节答案2023年下青岛工学院青岛工学院第一章测试1.数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
()A:对 B:错答案:对2.下面哪些是时空数据的应用()。
A:气象学家使用人造卫星和雷达观察飓风 B:从多媒体数据库中发现有趣的模式 C:机动车辆管理者把GPS安装在汽车上,以便更好地监管和引导车辆 D:动物学家把遥感设备安装在野生动物身上,以便分析生态行为答案:气象学家使用人造卫星和雷达观察飓风;机动车辆管理者把GPS安装在汽车上,以便更好地监管和引导车辆;动物学家把遥感设备安装在野生动物身上,以便分析生态行为3.数据挖掘生命周期的数据理解阶段,起于原始数据收集,止于熟悉数据、识别数据质量问题。
()A:对 B:错答案:错4.以下关于数据挖掘规律的描述中,不正确的是()。
A:业务知识是数据挖掘过程每一步的中心 B:对所有领域的每个数据挖掘问题,总有模式可循。
C:数据准备超过数据挖掘过程的3/4 D:给定应用的正确模型只能通过实验发现答案:数据准备超过数据挖掘过程的3/45.关于数据挖掘生命周期的部署阶段,说法正确的是()。
A:部署阶段要完成模型的创建 B:执行部署步骤的通常是数据分析师 C:部署通常是数据挖掘项目的终点 D:建立模型的目的不能仅仅是增加对数据的了解答案:部署阶段要完成模型的创建6.“8,000”和“10,000”表示:()。
A:数据 B:信息 C:知识 D:智慧答案:数据7.“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:()。
A:数据 B:知识 C:信息 D:智慧答案:信息8.“飞机无法飞过高山”表示:()。
A:知识 B:智慧 C:数据 D:信息答案:知识9.数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。
()A:错 B:对答案:对10.根据顾客喜好摆放商品位置属于数据挖掘范畴。
()A:错 B:对答案:对第二章测试1.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的()任务?A:建模描述 B:寻找模式和规则 C:预测建模 D:探索性数据分析答案:探索性数据分析2.下列对学生相关属性描述中,不是标称属性的是()。
A:婚姻状况 B:学号 C:身高 D:头发颜色答案:身高3.下列哪些选项能表示序数属性的数据集中趋势度量()。
A:四分位数 B:众数 C:均值 D:标准差答案:众数4.()可以观察从一个分布到另一分布是否有漂移。
A:散点图 B:直方图 C:盒图 D:分位数-分位数图答案:分位数-分位数图5.考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()A:3 B:3.5 C:5 D:2答案:3.56.下列哪个不是专门用于可视化时间空间数据的技术:()A:等高线图 B:饼图 C:曲面图 D:矢量场图答案:饼图7.皮尔森相关系数取值为()时说明两个对象最不相似。
A:1 B:0 C:0.05 D:-1答案:-18.下列哪些指标可以度量数据的离散趋势度量:()。
A:四分位数极差 B:五数概括 C:四分位数 D:极差答案:四分位数极差;五数概括;四分位数;极差9.在探索性数据分析中,认为最有代表性,最能反映数据重要特征的五数概括,包括:()。
A:四分位数Q3 B:中位数Q2 C:最小值 D:最大值答案:四分位数Q3;中位数Q2;最小值;最大值10.四分位数极差(IQR)是第1个和第2个四分位数之间的距离。
()A:错 B:对答案:错第三章测试1.下面()不属于数据预处理的方法?A:聚集 B:变量代换 C:估计遗漏值 D:离散化答案:估计遗漏值2.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。
等频(等深)划分时,15在()箱子内?A:第二个 B:第四个 C:第三个 D:第一个答案:第二个3.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。
等宽划分时(宽度为50),15又在()箱子里?A:第三个 B:第一个 C:第二个 D:第四个答案:第一个4.所谓高维数据,指的是()。
A:所有选项都错误 B:数据属性很多 C:数据对象很多 D:所有选项都正确答案:数据属性很多5.结构化的数据是指一些数据通过统一的()的形式存储的,这类数据我们称为结构化的数据。
A:图像 B:二维表格 C:文档 D:声音答案:二维表格6.假定用于分析的数据包含属性age。
数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。
第二个箱子值为:()A:18.3 B:27.9 C:26.8 D:22.6答案:18.37.假定属性income的均值和标准差分别为54000美元和16000美元,使用Z-score规范化值83600美元转换为()。
A:2.201 B:1.850 C:0.778 D:1.987答案:1.8508.下列关于数据规范化说法错误的是()。
A:数据规范化是将属性的取值范围统一 B:数据规范化是为了给重要的属性赋予更大的权重 C:数据规范化是为了避免不同属性的不平等地位 D:数据规范化又称为数据标准化答案:数据规范化是为了给重要的属性赋予更大的权重9.缺失值处理方法中错误的是()。
A:对于分类属性,使用同类对象属性值的均值 B:转换为分类问题或数值预测问题 C:对于所有属性都可以使用均值 D:对于离散属性或定性属性,使用众数答案:对于所有属性都可以使用均值10.以下关于数据预处理的描述正确的是()。
A:核心内容就是缺失数据填充 B:需要借助领域知识 C:数据挖掘工作的基础性工作 D:主要靠标准化算法自动处理展开答案:需要借助领域知识;数据挖掘工作的基础性工作第四章测试1.数据挖掘典型案例“尿不湿和啤酒”中,沃尔玛对其顾客的购物行为进行了购物篮关联规则分析,从而知道顾客经常一起购买的商品有哪些。
()A:错 B:对答案:对2.“这个消费者对我们的活动有多大的反应”属于()这一数据挖掘任务。
A:共生组合 B:聚类 C:分类和类概率估计 D:相似性匹配答案:分类和类概率估计3.关于决策树的描述,正确的是()。
A:每个节点表示一个属性的测试 B:每个叶子节点代表一个分类标签 C:每个分支代表测试的结果 D:从根到叶子的路径代表分类规则答案:每个节点表示一个属性的测试;每个叶子节点代表一个分类标签;每个分支代表测试的结果;从根到叶子的路径代表分类规则4.为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的()任务?A:探索性数据分析 B:建模描述 C:预测建模 D:寻找模式和规则答案:建模描述5.用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘()任务?A:根据内容检索 B:预测建模 C:寻找模式和规则 D:建模描述答案:根据内容检索6.下列应用场景不属于分类的是()。
A:对信用卡申请者判断其信誉高低 B:医生根据患者的症状判断所患疾病类型C:为了解用户特点,公司将客户分群 D:推广新产品时预测已有客户是否对新产品感兴趣答案:为了解用户特点,公司将客户分群7.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A:1,2,4,5 B:1,2,3,4 C:1,2,3,5 D:1,3,4,5答案:1,2,4,58.利用信息增益方法作为属性选择度量建立决策树时,已知某训练样本集的4个条件属性的信息增益分别为: G(收入)=0. 940位,G(职业)=0.151位,G(年龄)=0.780位,G(信誉)=0.048位,则应该选择()属性作为决策树的测试属性。
A:收入 B:职业 C:信誉 D:年龄答案:收入9.以下哪些算法是分类算法()A:DBSCAN B:K-Mean C:EM D:C4.5答案:C4.510.BIRCH是一种()。
A:聚类算法 B:关联分析算法 C:特征选择算法 D:分类器答案:聚类算法第五章测试1.以下哪个聚类算法不属于基于网格的聚类算法()。
A:STING B:BIRCH C:WaveCluster D:MAFIA答案:BIRCH2.下面关于维的叙述中()是错误的。
A:“月、季、年”是时间维的层次 B:维的层次性是由观察数据细致程度不同造成的C:“某年某月某日”是时间维的层次 D:维是人们观察数据的特定角度答案:“某年某月某日”是时间维的层次3.根据聚类形成的簇的特点,如果有交集的簇之间必然存在包含关系,这种聚类称为()。
A:划分型聚类 B:所有选项均不是 C:层次型聚类 D:重叠聚类答案:层次型聚类4.P(22,1,42,10),Q(20,0,36,8)为两个向量对象,这两个对象的曼哈顿距离是()。
A:√233 B:6 C:11 D:√45答案:115.K-Means算法中的初始中心点()。
A:直接影响算法的收敛结果 B:必须足够分散 C:必须在每个簇的真实中心点的附近 D:可随意设置答案:直接影响算法的收敛结果6.聚类与分类的主要区别在于()。
A:数据有无标签 B:计算复杂度不同 C:数据维度不同 D:数据类型不同答案:数据有无标签;数据维度不同;数据类型不同7.关于聚类下列说法正确的是()。
A:聚类和分类没有区别 B:聚类有着广泛的应用 C:聚类可以发现偏离多数数据对象的孤立点 D:聚类可以作为其他数据挖掘分析过程的一个基础处理步骤答案:聚类有着广泛的应用;聚类可以发现偏离多数数据对象的孤立点;聚类可以作为其他数据挖掘分析过程的一个基础处理步骤8.从研究现状上看,下面不属于云计算特点的是()A:私有化 B:虚拟化 C:超大规模 D:高可靠性答案:私有化9.下列说法正确的是()。
A:K中心点能够解决有离群点的聚类问题 B:K-means算法能够解决有离群点的聚类问题 C:K-means++能够解决初始点影响聚类效果的问题 D:K-modes能够解决离散数据的聚类问题答案:K中心点能够解决有离群点的聚类问题;K-means++能够解决初始点影响聚类效果的问题;K-modes能够解决离散数据的聚类问题10.聚类针对有标签的数据。