智慧树Python数据分析与数据可视化答案章节
- 格式:doc
- 大小:105.00 KB
- 文档页数:35
Python数据分析陕西工商职业学院智慧树知到答案2024年第一章测试1.score = int(input())if score > 90:print('优秀')elif score > 70:print('良')elif score > 60:print('及格')以上代码执行后,当输入80的时候会打印的结果是()A:优秀B:及格C:报错D:良答案:D2.for i in range(5):i += 2print(i)以上程序运行输出()A:1 2 3 4 5B:2 3 4 5 6C:0 1 2 3 4D:2 4 6 8 10答案:B3.for i in range(0,9,2):print(i,end='')以上程序的输出结果是()A:都不对B:02468C:13579D:0369答案:B4.def exchange(a,b):a,b=b,areturn (a,b)x=10y=20x,y=exchange(x,y)print(x,y)以上代码的运行结果是()A:20 10B:10 10C:20 20D:10 20答案:A5. D = {'苹果': 4, '梨': 5, '榴莲': 1}如果想要将D字典中’榴莲’这个键跟它对应的值删除,该如何操作()A:del D['榴莲']B:D.kill('榴莲')C:D['榴莲'] = 0D:D{'榴莲'} = 0答案:A1.以下是对数组进行转置的是()。
A:TB:ndimC:ShapeD:size答案:A2.创建一个全0数组用到以下()函数。
A:zerosB:arrayC:eyesD:ones答案:A3.对于数组和矩阵以下说法正确的是()。
A:在进行计算时,两个矩阵相加和两个数组相加的规则和要求是一样的B:2行2列的两个数组相乘和把这两个数组转为矩阵后相乘的结果是一样的C:在进行计算时,两个矩阵相乘和两个数组相乘的规则和要求是一样的D:矩阵类似于二维数组答案:AD4.利用sort函数对数组进行排序,排序的结果()。
智慧树Python数据分析与数据可视化答案智慧树Python数据分析与数据可视化答案第一章单元测试1、缩进对于Python程序至关重要。
A:错B:对正确答案:【对】2、在Python 3.x中不能使用汉字作为变量名。
A:对B:错正确答案:【错】3、下面哪些是正确的Python标准库对象导入语句?A:from math importB:import math.sin as sinC:from math import sinD:import math.正确答案:【from math import *;from math import sin】4、Python支持面向对象程序设计。
A:对B:错正确答案:【对】5、下面属于Python编程语言特点的有?A:扩展库丰富B:代码运行效率高C:支持命令式编程D:支持函数式编程正确答案:【扩展库丰富;支持命令式编程;支持函数式编程】第二章单元测试1、已知列表x = [1, 2, 1, 2, 3, 1],那么执行x.remove(1)之后,x 的值为[2, 2, 3]。
A:对B:错正确答案:【错】2、已知列表x = [1, 2, 3],那么执行y = x.reverse()之后,y的值为[3, 2, 1]。
A:对B:错正确答案:【错】3、Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
A:错B:对正确答案:【对】4、表达式3 > 5 and math.sin(0)的值为0。
B:错正确答案:【错】5、表达式4 < 5 == 5的值为True。
A:错B:对正确答案:【对】第三章单元测试1、生成器表达式的计算结果是一个元组。
A:错B:对正确答案:【错】2、包含列表的元组可以作为字典的“键”。
A:错B:对正确答案:【错】3、列表的rindex()方法返回指定元素在列表中最后一次出现的位置。
A:对B:错正确答案:【错】4、Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
python数据分析课后习题B. 数据合并按照合并轴⽅向主要分为左连接、右连接、内连接和外连接C. 预处理过程主要包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系D. 数据标准化的主要对象是类别型的特征3. (单选题)以下关于缺失值检测的说法中,正确的是(B)。
A. null 和 notnull 可以对缺失值进⾏处理B. dropna⽅法既可以删除观测记录,亦可以删除特征C. fillna⽅法中⽤来替换缺失值的值只能是数据框D. pandas 库中的interpolate 模块包含了多种插值⽅法4. (单选题)关于标准差标准化,下列说法中错误的是(B)。
A. 经过该⽅法处理后的数据均值为0,标准差为1B. 可能会改变数据的分布情况C.Python中可⾃定义该⽅法实现函数:def StandardScaler(data):data=(data-data.mean())/data.std()return dataD. 计算公式为X*=(X-`X)/σ5. (单选题)以下关于pandas数据预处理说法正确的是(D)。
A. pandas没有做哑变量的函数B. 在不导⼈其他库的情况下,仅仅使⽤pandas 就可实现聚类分析离散化C. pandas 可以实现所有的数据预处理操作D. cut 函数默认情况下做的是等宽法离散化6. (单选题)以下关于异常值检测的说法中错误的是(D)。
A. 3σ原则利⽤了统计学中⼩概率事件的原理B. 使⽤箱线图⽅法时要求数据服从或近似服从正态分布C. 基于聚类的⽅法可以进⾏离群点检测D. 基于分类的⽅法可以进⾏离群点检测7. (单选题)有⼀份数据,需要查看数据的类型,并将部分数据做强制类型转换,以及对数值型数据做基本的描述性分析。
下列的步骤和⽅法正确的是(A)。
A. dtypes 查看类型,astype 转换类别,describe 描述性统计B. astype 查看类型,dtypes转换类别,describe描述性统计C. describe查看类型,astype转换类别,dtypes描述性统计D. dtypes 查看类型,describe 转换类别,astype 描述性统计8. (单选题)下列与标准化⽅法有关的说法中错误的是(A)。
Python数据科学导引智慧树知到课后章节答案2023年下内蒙古农业大学内蒙古农业大学第一章测试1.大数据的起源是()。
答案:互联网2.机器学习的实质是()。
答案:根据现有数据,寻找输入数据和输出数据的映射关系/函数3.Spark支持的分布式部署方式中哪个是错误的()。
答案:Spark on local4.以下表述正确的是:()答案:人工智能是人们长远以来的目标,期待机器像人一样有智慧。
;机器学习指机器有学习的能力,是人类达成人工智能目标的手段。
;人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。
;深度学习是机器学习的一种。
5.有效抑制机器学习过拟合的方法是()答案:平滑损失函数。
;加大数据量。
;重新设计损失函数,引入平滑函数。
6.下面表述正确的()答案:监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。
;监督学习指训练集所有输入数据都有相应输出数据与之对应。
;迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。
;强化学习指只有评价性输出结果的机器学习。
7.关于Spark中的RDD描述正确的()答案:Destributed:分布式,可以并行在集群计算。
;Resilient:表示弹性的,弹性表示。
;Datset:就是一个集合,用于存放数据的。
;RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark 中最基本的数据抽象。
8.大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。
()答案:对9.关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。
()答案:错10.Spark的四大组件为Spark Streaming、Mlib、Graphx、Spark R。
()答案:错第二章测试1.关于Python语言的变量,以下选项中说法正确的是()。
答案:随时命名、随时赋值、随时使用2.以下选项中,不是建立字典的方式是()。
智慧树知到《可视化导论》章节测试答案第一章1、以下不属于可视化的作用的是()A:传播交流B:信息记录C:数据采集D:数据分析正确答案:数据采集2、数据可视化萌芽于什么时间()A:15世纪B:16世纪C:17世纪D:18世纪正确答案: 16世纪3、可视分析学是何时兴起的()A:18世纪B:19世纪C:20世纪D:21世纪正确答案: 21世纪4、张量场可视化属于可视化的哪个分支学科()A:科学可视化B:信息可视化C:可视分析学D:人机交互学正确答案:科学可视化5、使用以下哪种可视化工具不需要编程基础()A:D3.jsB:TableauC:VegaD:Processing正确答案: Tableau6、数据可视化的原则是细节优先。
A:对B:错正确答案:错7、文本可视化属于信息可视化。
A:对B:错正确答案:对8、可视分析学涉及到的学科包括()A:计算机图形学B:数据挖掘C:人机交互正确答案:计算机图形学,数据挖掘,人机交互,统计分析9、以下哪些工具是数据可视化工具()<o:p></o:p>A:MatlabB:D3.jsC:TableauD:Vega正确答案: D3.js ,Tableau,Vega10、这个视频中体现了可视化的哪些作用()A:信息记录B:数据分析C:传播交流D:数据过滤正确答案:信息记录,数据分析第二章1、有的人在发朋友圈的时候,会把一张图片切成9份,然后再按顺序拼出一个九宫格,如下图所示。
虽然图片被分割开来,但是我们仍旧能够感知到图片原来完整的样子,这体现了格式塔理论的()原则。
WechatIMG24.pngA:接近原则B:相似原则D:连续原则正确答案:连续原则2、下图所示的图片体现了格式塔理论的()原则。
图片2.pngA:接近原则B:相似原则C:闭包原则D:连续原则正确答案:接近原则3、下图所示的图片体现了格式塔理论的()接近原则图片3.pngA:接近原则B:相似原则C:闭包原则D:连续原则正确答案:相似原则4、下图所示的可视化中运用了以下哪个视觉通道?()图片4.png<o:p></o:p>A:颜色B:高度C:亮度D:形状正确答案:高度5、下图所示的可视化中体现了哪种类型的视觉通道?()图片5.pngA:分类型B:定量型C:定性型D:分组型正确答案:分组型6、根据格式塔理论,人们在观看时,眼脑在一开始的时候会先区分一个形象的各个单一的组成部分,然后再将各个部分组合起来,使之成为一个易于理解的统一体。
数据可视化技术知到章节测试答案智慧树2023年最新广西科技大学第一章测试1.以下不属于Numpy常用功能的是()参考答案:画图2.以下哪个函数不能将文件存为二进制()参考答案:numpy.loadtxt3.numpy.savetxt的参数中,文件路径写在()参考答案:fname4.关于numpy.random.seed,下列说法错误的是()参考答案:seed( )不能为空5.numpy.random.normal可通过设置()参数设定正态分布的均值参考答案:loc6.关于numpy.random.rand和numpy.random.uniform,下列说法错误的是()参考答案:uniform从一个均匀分布(low,high)中随机采样7.numpy.random.binomial生成的随机数服从()参考答案:二项分布8.numpy.random.binomial可通过设置()参数设定成功的概率参考答案:p9.关于numpy.random.poisson,下列说法错误的是()参考答案:泊松分布是连续函数10.Numpy的函数中常用于表示集中趋势的统计量不包括()参考答案:numpy.std11.关于Numpy中常用的统计量函数,下列说法错误的是()参考答案:numpy.std计算的是样本方差的有偏估计12.关于Numpy中的距离计算,下列说法错误的是()参考答案:曼哈顿距离计算两点间的直角距离,numpy.linalg.norm中的ord参数设置为none第二章测试1.Pandas查看、检查数据中df.describe的功能是()参考答案:查看数值型列的汇总统计2.对于一个Series或DataFrame对象来说,如下选项中说法错误的是()。
参考答案:drop()方法可以用来删除缺失行3.查看数据框df前5行数据的函数是()参考答案:df.head()4.从数据框df中筛选出学校为S_1并且数学成绩大于60的数据正确的是()参考答案:null5.Pandas 适用于处理以下类型的数据是()参考答案:有序和无序(非固定频率)的时间序列数据;;与 SQL 或 Excel 表类似的,含异构列的表格数据;;带行列标签的矩阵数据,包括同构或异构型数据;;任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。
第一章1.什么是KDD?()答案:数据挖掘与知识发现2.数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。
()答案:对3.数据挖掘分析的步骤包括()答案:算法分析;数据预处理;模型评估;创建数据集4.当今社会,数据挖掘分析被广泛应用。
()答案:对5.()是未来大数据分析的发展趋势。
答案:实时性;非结构化数据;可视化第二章1.关于描述统计,包括()。
答案:集中趋势分析;离中趋势分析;相关分析2.以下属于推断统计的是()。
答案:离中趋势分析3.在数据特征的测度中,描述分布的形状的值为()答案:偏态;峰态4.测度集中趋势就是寻找数据水平的代表值或中心值()答案:对5.四分位数可以用于顺序数据、数值数据和分类数据()答案:错第三章1.下面哪个属于映射数据到新的空间的方法? ( )答案:傅立叶变换2.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()答案:数据预处理3.影响数据质量问题的因素有哪些()答案:其余选项都对4.数据预处理的常见方法有()答案:数据变换;数据清洗;数据集成5.数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()答案:对第四章1.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()答案:1,2,4,52.频繁项集、频繁闭项集、最大频繁项集之间的关系是: ( )答案:频繁项集频繁闭项集最大频繁项集3.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )答案:关联规则发现4.下面购物篮能够提取的3-项集的最大数量是多少()ID 购买项1 牛奶,啤酒,尿布2 面包,黄油,牛奶3 牛奶,尿布,饼干4 面包,黄油,饼干5啤酒,饼干,尿布6 牛奶,尿布,面包,黄油7 面包,黄油,尿布8 啤酒,尿布9 牛奶,尿布,面包,黄油10 啤酒,饼干答案:35.Apriori算法的计算复杂度受( )影响。
第一章单元测试1、单选题:大数据泛指巨量的()。
选项:A:数组集B:数字集C:数据集D:字符集答案: 【数据集】2、单选题:数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。
选项:A:统计分析方法B:定性与定量方法C:概率分析方法D:系统分析方法答案: 【统计分析方法】3、单选题:浏览数据这一步骤可以通过对大数据进行()来实现。
选项:A:流程化B:分析化C:简易化D:可视化答案: 【可视化】4、多选题:Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。
选项:A:流程优化能力B:数据处理能力C:决策力D:洞察发现力答案: 【流程优化能力;决策力;洞察发现力】5、多选题:我们通常用“4V”来反映大数据的特点,4V是指()。
选项:A:VelocityB:VarietyC:VariousD:Valid答案: 【Velocity;Variety】6、多选题:大数据分析可以应用在那些领域()。
选项:A:商业领域B:医疗卫生领域C:交通运输领域D:农业领域答案: 【商业领域;医疗卫生领域;交通运输领域;农业领域】7、多选题:大数据分析的过程包括()。
选项:A:数据理解B:数据处理C:数据优化D:数据准备答案: 【数据理解;数据准备】8、判断题:数据只要有足够的规模就可以称为大数据。
()选项:A:对B:错答案: 【对】9、判断题:大数据分析是大数据到知识,再到信息的关键步骤。
()选项:A:错B:对答案: 【错】10、判断题:大数据分析模型用于描述数据之间的关系。
如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。
()选项:A:对B:错答案: 【对】第二章单元测试1、单选题:数据仓库的定义于哪一年提出()。
选项:A:1991B:2015C:1902D:2002答案: 【1991】2、单选题:符合选择建立数据仓库平台的公认标准的是()。
选项:A:是否提供支持少量数据的数据加载B:是否支持对数据库的管理C:是否支持串联操作D:数据库对大数据量的支持能力答案: 【数据库对大数据量的支持能力】3、单选题:建立数据仓库的首要步骤是()。
绪论单元测试1.IPython提供了基于控制台命令环境的定制功能,可以将交互式Pythonshell包含在各种Python应用中。
( )A:对B:错答案:A第一章测试1.下列选项中,哪些属于Python语言的特点?()A:面向过程B:开源C:可移植性D:简单易学答案:BCD2.下列领域中,使用Python可以实现的是()A:Web开发B:游戏C:操作系统管理和服务器运维的自动化脚本D:科学计算答案:ABCD3.Python的优点之一是具有伪代码的本质。
( )A:对B:错答案:A4.Python具有可扩展的特性。
( )A:错B:对答案:B5.Python自带shell的性能优于IPython。
( )A:错B:对答案:A第二章测试1.下列选项中变量名不正确的是()。
A:2cdB:ITCASTC:_textD:hei_ma答案:A2.关于input()函数与print()函数的说法中,下列描述错误的是()。
A:input()函数会返回一个字符串类型数据B:input()函数可以接收使用者输入的数据C:print()函数输出的数据不支持换行操作D:print()函数可以输出任何类型的数据答案:C3.与x>yandy>z语句等价的是()A:not x<y or y<zB:x>y>zC:not x<y or not y<zD:x>y or not y<z答案:B4.关于赋值语句的作用,描述正确的是()A:变量和对象必须类型相同B:将变量绑定到对象C:将变量改写为新的值D:每个赋值语句只能给一个变量赋值答案:B5.下列运算符的使用错误的是()A:[1,2,3]+[4,5,6]B:100+‘a’C:3*’abc’D:10%3答案:B第三章测试1.元组支持增加、删除、修改元素等操作。
()A:对B:错答案:B2.列表的索引是从1开始。
()A:对B:错答案:B3.如果元组中只有1个元素时,需要在该元素后面加上逗号。
()A:错B:对答案:B4.下面不能创建一个字典的语句是()A:dict4 = {(1,2,3):”uestc”}B:dict1 = {}C:dict2 = {3:5}D:dict3 = {[1,2,3]:”uestc”}答案:D5.字符串是一个字符序列,例如,字符串s,从右侧向左第2个字符用什么索引()A:s[2]B:s[0:-2]C:s[-2]D:s[:2]答案:C第四章测试1.阅读下面程序:x = 0for x in range(5): x += 1 if x == 3: breakprint(x)输出结果为()。
《Python数据分析、挖掘与可视化》课后题答案第⼆章课后题答案1.输⼊⼀个包含若⼲⾃然数的列表,输出这些⾃然数的平均值,结果保留3位⼩数。
ls=eval(input())ans=float(sum(ls)/len(ls))print('{:.3f}'.format(ans))2.输⼊⼀个包含若⼲⾃然数的列表,输出这些⾃然数降序排列后的新列表。
ls=eval(input())ls=sorted(ls,reverse=True)print(ls)3.输⼊⼀个包含若⼲⾃然数的列表,输出⼀个新列表,新列表中每个元素为原列表中每个⾃然数的位数。
ls=eval(input())ans=list()for i in ls:st=str(i)ans.append(len(st))print(ans)4.输⼊⼀个包含若⼲数字的列表,输出其中绝对值最⼤的数字。
ls=eval(input())m=ls[0]for i in ls:if abs(i)>m:m=iprint(m)5.输⼊⼀个包含若⼲整数的列表,输出这些整数的乘积。
ls=eval(input())ans=1for i in ls:ans*=iprint(ans)6.输⼊两个包含若⼲整数的等长列表,把这两个列表看作两个向量,输出这两个向量的内积。
ls1=eval(input())ls2=eval(input())ans=0for i in range(min(len(ls1),len(ls2))):ans+=ls1[i]*ls2[i]print(ans)第三章课后题答案1.输⼊⼀个字符串,输出其中每个字符的出现次数。
(⽤Counter类)2.输⼊⼀个字符串,输出其中只出现了⼀次的字符及其下标。
3.输⼊⼀个字符串,输出其中每个唯⼀字符最后⼀次出现的下标。
4.输⼊包含若⼲集合的列表,输出这些集合的并集。
(⽤reduce()函数和operator模块)5.输⼊⼀个字符串,输出加密后的结果字符串。
智慧树Python数据分析与数据可视化答案章节名称 Python数据分析与数据可视化对应章节第一章成绩类型百分制截止时间 2020-06-07 23:59题目数 5总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 51【判断题】 (20分)缩进对于Python程序至关重要。
(A)A.对B.错正确本题总得分20分2【判断题】 (20分)在Python 3.x中不能使用汉字作为变量名。
(B)A.对B.错正确本题总得分20分3【多选题】 (20分)下面哪些是正确的Python标准库对象导入语句?(BC) A.import math.sin as sinB.from math import sinC.from math import *D.import math.*正确本题总得分20分4【判断题】 (20分)Python支持面向对象程序设计。
(A)A.对B.错正确本题总得分20分5【多选题】 (20分)下面属于Python编程语言特点的有?(BCD) A.代码运行效率高B.扩展库丰富C.支持函数式编程D.支持命令式编程正确本题总得分20分第二章测试名称 Python数据分析与数据可视化对应章节第二章成绩类型百分制截止时间 2020-06-07 23:59题目数 5总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 51【判断题】 (20分)已知列表x = [1, 2, 1, 2, 3, 1],那么执行x.remove(1)之后,x的值为[2, 2, 3]。
(A)A.错B.对正确本题总得分20分2【判断题】 (20分)已知列表x = [1, 2, 3],那么执行y = x.reverse()之后,y的值为[3, 2, 1]。
(B)A.对B.错正确本题总得分20分3【判断题】 (20分)Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
(B)A.错B.对正确本题总得分20分4【判断题】 (20分)表达式3 > 5 and math.sin(0)的值为0。
(A)A.错B.对正确本题总得分20分5【判断题】 (20分)表达式4 < 5 == 5的值为True。
(B)A.错B.对正确本题总得分20分第三章测试名称 Python数据分析与数据可视化对应章节第三章成绩类型百分制截止时间 2020-06-07 23:59题目数 6总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 61【判断题】 (10分)生成器表达式的计算结果是一个元组。
(B)A.对B.错正确本题总得分10分2【判断题】 (15分)包含列表的元组可以作为字典的“键”。
(A)A.错B.对正确本题总得分15分3【判断题】 (20分)列表的rindex()方法返回指定元素在列表中最后一次出现的位A.错B.对正确本题总得分20分4【判断题】 (15分)Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
(B)A.错B.对正确本题总得分15分5【判断题】 (15分)列表可以作为字典元素的“键”。
(A)错B.对正确本题总得分15分6【判断题】 (25分)Python语言中字符串对象的strip()只能删除字符串两端的空白字符,无法删除其他字符。
(B)A.对B.错查询后续题目答案请移步名称 Python数据分析与数据可视化对应章节第四章成绩类型百分制截止时间 2020-06-07 23:59题目数 7总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 71【判断题】 (10分)g = lambda x: 3不是一个合法的赋值表达式。
A.对B.错正确本题总得分10分2【判断题】 (15分)调用函数时传递的实参个数必须与函数形参个数相等才行。
对B.错正确本题总得分15分3【判断题】 (15分)在定义函数时,某个参数名字前面带有两个*符号表示可变长度参数,可以接收任意多个关键参数并将其存放于一个字典之中。
A.错B.对正确本题总得分15分4【判断题】 (15分)函数内部定义的局部变量当函数调用结束后被自动删除。
A.B.对正确本题总得分15分5【判断题】 (15分)在Python中,不能在一个函数的定义中再定义一个嵌套函数。
A.对B.错正确本题总得分15分6【判断题】 (15分)Python关键字and和or连接多个表达式时具有惰性求值特点,只计算必须计算的表达式。
A.错对正确本题总得分15分7【判断题】 (15分)在编写多层循环时,为了提高运行效率,应尽量减少内循环中不必要的计算。
A.错B.对正确本题总得分15分第五章测试得分:100评语:名称 Python数据分析与数据可视化对应章节第五章成绩类型百分制截止时间 2020-06-07 23:59题目数 5总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 51【判断题】 (20分)如果要操作docx格式的Word文档,可以按照扩展库python-docx。
A.对B.错正确本题总得分20分2【判断题】 (20分)使用内置函数open()打开文件时,只要文件路径正确就总是可以正确打开的。
A.错B.对正确本题总得分20分3【判断题】 (20分)二进制文件不能使用记事本程序打开。
A.错B.对正确本题总得分20分4【判断题】 (20分)以写模式打开的文件无法进读操作。
A.错B.对正确本题总得分20分5【判断题】 (20分)Python的主程序文件python.exe属于二进制文件。
A.错B.对正确本题总得分20分第六章测试得分:评语:名称 Python数据分析与数据可视化对应章节第六章成绩类型百分制截止时间 2020-06-07 23:59题目数 7总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 71【判断题】 (20分)扩展库numpy中的arange()函数功能和内置函数range()类似,只能生成包含整数的数组,无法创建包含实数的数组。
A.错对正确本题总得分20分2【判断题】 (15分)表达式np.empty((3,5)).sum()的值一定为0。
A.错B.对正确本题总得分15分3【判断题】 (15分)已知x.shape的值为(3, 5),那么语句x[:, 3] = 2的作用是把数组x所有行中列下标为3的元素值都改为2。
A.错B.正确本题总得分15分4【判断题】 (10分)扩展库numpy的isclose()返回包含若干True/False值的数组,而allclose()返回True或False值。
A.对B.错正确本题总得分10分5【判断题】 (10分)扩展库numpy的函数append()和insert()是在原数组的基础上追加或插入元素,没有返回值。
A.错B.正确本题总得分10分6【判断题】 (15分)已知x是一个足够大的numpy二维数组,那么语句x[0, 2] = 4的作用是把行下标为0、列下标为2的元素值改为4。
A.对B.错正确本题总得分15分7【判断题】 (15分)扩展库numpy在linalg模块中提供了计算奇异值分解的函数svd()。
A.对B.正确本题总得分15分第七章测试得分:100评语:名称 Python数据分析与数据可视化对应章节第七章成绩类型百分制截止时间 2020-06-07 23:59题目数 5总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 51【判断题】 (20分)扩展库pandas的read_csv()函数用于读取CSV文件中的数据并创建DataFrame对象。
A.错B.对正确本题总得分20分2【判断题】 (20分)使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数sheetname指定读取哪个工作表中的数据,并且该参数必须指定为工作表的名字,不能是序号。
A.对B.错正确本题总得分20分【判断题】 (10分)使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数na_values指定哪些值被解释为缺失值。
A.对B.错正确本题总得分10分4【判断题】 (20分)扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来删除重复的数据。
A.对B.错正确本题总得分20分【判断题】 (30分)如果DataFrame对象中索引是日期时间数据,或者包含日期时间类型数据列,可以使用resample()方法进行重采样,实现按时间段进行统计查看员工业绩的功能。
A.错B.对正确本题总得分30分第八章测试得分:100评语:名称 Python数据分析与数据可视化对应章节第八章成绩类型百分制截止时间 2020-06-07 23:59题目数 7总分数 100说明提示:选择题选项顺序为随机排列,若要核对答案,请以选项内容为准第1部分总题数: 71【判断题】 (20分)在机器学习扩展库sklearn中,Lasso是可以估计稀疏系数的线性模型,尤其适用于减少给定解决方案依赖的特征数量的场合。
如果数据的特征过多,而其中只有一小部分是真正重要的,此时选择Lasso 比较合适。
A.对B.错正确本题总得分20分2【判断题】 (20分)使用朴素贝叶斯算法进行分类时,分别计算未知样本属于每个已知类的概率,然后选择其中概率最大的类作为分类结果。
A.错B.对正确本题总得分20分3【判断题】 (10分)支持向量机(Support Vector Machine, SVM)是通过寻找超平面对样本进行分隔从而实现分类或预测的算法,分隔样本时的原则是使得间隔最大化,寻找间隔最大的支持向量。
A.对B.错正确本题总得分10分4【判断题】 (10分)KNN算法是k-Nearest Neighbor的简称,叫作k近邻算法,属于有监督学习算法,既可以用于分类,也可以用于回归。
A.错B.对正确本题总得分10分5【判断题】 (20分)DBSCAN(Density-Based Spatial Clustering of Applications with Noise)属于密度聚类算法,把类定义为密度相连对象的最大集合,通过在样本空间中不断搜索高密度的核心样本并扩展得到最大集合完成聚类,能够在带有噪点的样本空间中发现任意形状的聚类并排除噪点。
A.对B.错本题总得分20分6【判断题】 (10分)DBSCAN算法不需要预先指定聚类数量,但对用户设定的参数非常敏感。