2020年智慧树知道网课《Python数据分析与数据可视化》课后章节测试满分答案
- 格式:docx
- 大小:1.03 MB
- 文档页数:24
python数据分析课后习题B. 数据合并按照合并轴⽅向主要分为左连接、右连接、内连接和外连接C. 预处理过程主要包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系D. 数据标准化的主要对象是类别型的特征3. (单选题)以下关于缺失值检测的说法中,正确的是(B)。
A. null 和 notnull 可以对缺失值进⾏处理B. dropna⽅法既可以删除观测记录,亦可以删除特征C. fillna⽅法中⽤来替换缺失值的值只能是数据框D. pandas 库中的interpolate 模块包含了多种插值⽅法4. (单选题)关于标准差标准化,下列说法中错误的是(B)。
A. 经过该⽅法处理后的数据均值为0,标准差为1B. 可能会改变数据的分布情况C.Python中可⾃定义该⽅法实现函数:def StandardScaler(data):data=(data-data.mean())/data.std()return dataD. 计算公式为X*=(X-`X)/σ5. (单选题)以下关于pandas数据预处理说法正确的是(D)。
A. pandas没有做哑变量的函数B. 在不导⼈其他库的情况下,仅仅使⽤pandas 就可实现聚类分析离散化C. pandas 可以实现所有的数据预处理操作D. cut 函数默认情况下做的是等宽法离散化6. (单选题)以下关于异常值检测的说法中错误的是(D)。
A. 3σ原则利⽤了统计学中⼩概率事件的原理B. 使⽤箱线图⽅法时要求数据服从或近似服从正态分布C. 基于聚类的⽅法可以进⾏离群点检测D. 基于分类的⽅法可以进⾏离群点检测7. (单选题)有⼀份数据,需要查看数据的类型,并将部分数据做强制类型转换,以及对数值型数据做基本的描述性分析。
下列的步骤和⽅法正确的是(A)。
A. dtypes 查看类型,astype 转换类别,describe 描述性统计B. astype 查看类型,dtypes转换类别,describe描述性统计C. describe查看类型,astype转换类别,dtypes描述性统计D. dtypes 查看类型,describe 转换类别,astype 描述性统计8. (单选题)下列与标准化⽅法有关的说法中错误的是(A)。
Python数据科学导引智慧树知到课后章节答案2023年下内蒙古农业大学内蒙古农业大学第一章测试1.大数据的起源是()。
答案:互联网2.机器学习的实质是()。
答案:根据现有数据,寻找输入数据和输出数据的映射关系/函数3.Spark支持的分布式部署方式中哪个是错误的()。
答案:Spark on local4.以下表述正确的是:()答案:人工智能是人们长远以来的目标,期待机器像人一样有智慧。
;机器学习指机器有学习的能力,是人类达成人工智能目标的手段。
;人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。
;深度学习是机器学习的一种。
5.有效抑制机器学习过拟合的方法是()答案:平滑损失函数。
;加大数据量。
;重新设计损失函数,引入平滑函数。
6.下面表述正确的()答案:监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。
;监督学习指训练集所有输入数据都有相应输出数据与之对应。
;迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。
;强化学习指只有评价性输出结果的机器学习。
7.关于Spark中的RDD描述正确的()答案:Destributed:分布式,可以并行在集群计算。
;Resilient:表示弹性的,弹性表示。
;Datset:就是一个集合,用于存放数据的。
;RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark 中最基本的数据抽象。
8.大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。
()答案:对9.关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。
()答案:错10.Spark的四大组件为Spark Streaming、Mlib、Graphx、Spark R。
()答案:错第二章测试1.关于Python语言的变量,以下选项中说法正确的是()。
答案:随时命名、随时赋值、随时使用2.以下选项中,不是建立字典的方式是()。
第一章测试1.score = int(input())if score >90: print(‘优秀’)elif score >70: print(‘良’)elifscore >60: print(‘及格’) 以上代码执行后,当输入80的时候会打印的结果是()A:良B:及格C:报错D:优秀答案:A2.for i in range(5): i += 2 print(i) 以上程序运行输出()A:2 4 6 8 10B:0 1 2 3 4C:2 3 4 5 6D:1 2 3 4 5答案:C3.for i in range(0,9,2):print(i,end=’’) 以上程序的输出结果是()A:都不对B:02468C:13579D:0369答案:B4.def exchange(a,b): a,b=b,a return (a,b)x=10y=20x,y=exchange(x,y)print(x,y)以上代码的运行结果是()A:10 10B:10 20C:20 10D:20 20答案:C5. D = {‘苹果’: 4, ‘梨’: 5, ‘榴莲’: 1}如果想要将D字典中’榴莲’这个键跟它对应的值删除,该如何操作()A:D[‘榴莲’] = 0B:del D[‘榴莲’]C:D{‘榴莲’} = 0D:D.kill(‘榴莲’)答案:B第二章测试1.以下是对数组进行转置的是()。
A:sizeB:TC:ndimD:Shape答案:B2.创建一个全0数组用到以下()函数。
A:zerosB:eyesC:arrayD:ones答案:A3.对于数组和矩阵以下说法正确的是()。
A:2行2列的两个数组相乘和把这两个数组转为矩阵后相乘的结果是一样的B:在进行计算时,两个矩阵相加和两个数组相加的规则和要求是一样的C:在进行计算时,两个矩阵相乘和两个数组相乘的规则和要求是一样的D:矩阵类似于二维数组答案:BD4.利用sort函数对数组进行排序,排序的结果()。
第一章测试1【单选题】(10 分)以下不属于可视化的作用的是()A. 数据采集B. 传播交流C. 信息记录D. 数据分析2【单选题】(10 分)数据可视化萌芽于什么时间()A.15 世纪B.18 世纪C.17 世纪16 世纪3【单选题】(10 分)可视分析学是何时兴起的()A.20 世纪B.18 世纪C.21 世纪D.19 世纪4【单选题】(10 分)张量场可视化属于可视化的哪个分支学科()A.信息可视化人机交互学C.科学可视化D.可视分析学5【单选题】(10 分)使用以下哪种可视化工具不需要编程基础()A.D3.jsB.ProcessingC.VegaD.Tableau6【判断题】(10 分)数据可视化的原则是细节优先。
A. 错B. 对7【判断题】(10 分)文本可视化属于信息可视化。
A.错B.对8【多选题】(10 分)可视分析学涉及到的学科包括()A.人机交互B. 计算机图形学C.统计分析数据挖掘9【多选题】(10 分)以下哪些工具是数据可视化工具()VegaB.MatlabD3.jsTableau10【多选题】(10 分)这个视频中体现了可视化的哪些作用()信息记录B.数据过滤C. 传播交流D. 数据分析第二章测试1【单选题】(10 分)有的人在发朋友圈的时候,会把一张图片切成9 份,然后再按顺序拼出一个九宫格,图所示。
虽然图片被分割开来,但是我们仍旧能够感知到图片原来完整的样子,格式塔理论的()原则。
如下这体现了A.闭包原则B.连续原则C.接近原则D.相似原则2【单选题】(10 分)图所示的图片体现了格式塔理论的()原则。
A.相似原则B. 接近原则C. 连续原则D. 闭包原则3 【单选题】(10 分)下图所示的图片体现了格式塔理论的()接近原则A.闭包原则B.接近原则C.连续原则D.相似原则4【单选题】(10 分)形状B.亮度C. 颜色D. 高度5【单选题】(10 分)图所示的可视化中体现了哪种类型的视觉通道?()定性型C. 分类型6【判断题】(10 分)根据格式塔理论,人们在观看时,眼脑在一开始的时候会先区分一个形象的各个单一的组成部分,然后再将各个部分组合起来,使之成为一个易于理解的统一体。
绪论单元测试1【多选题】(3分)基于以下哪些原因,利用文件来保存数据是不够专业的,我们需要更专业的方式来管理数据。
A.大数据处理的不好B.硬盘放不进那么多数据C.数据安全性无法保证的D.高并发量处理的也不好2【单选题】(2分)以下哪个数据库是典型的非关系型数据库。
A.SQLServerB.MysqlC.MongoDBD.Oracle3【判断题】(1分)数据库的应用,提高了数据的独立性。
A.错B.对4【判断题】(1分)SQL这门语言不是由某个数据库管理系统的公司开发的,它是由一个国际化标准组织来定义的一门语言,市面上常见的数据库都支持SQL语言的应用。
A.错B.对5【判断题】(1分)SQL本质上就是一个字符串,我们平时常见的开发语言,比如Java、PHP、C#这些都是支持字符串的,所以SQL可以非常良好的嵌入到这些语言开发当中,配合这些开发语言去操作数据库。
A.错B.对第一章测试1【单选题】(2分)数据存放在()中A.表B.索引C.视图D.数据库2【判断题】(1分)选择合适的SQLServer2014版本,成功安装之后,默认其服务是启动状态A.对B.错3【判断题】(1分)每次计算机重启,SQLServer服务也会自动启动.A.对B.错4【单选题】(2分) SQLServer是()A.数据库B.数据库系统C.数据库管理员D.数据库管理系统5【单选题】(2分) SQLServer组织数据库采用A.层次模型B.数据模型C.关系模型D.网状模型第二章测试1【判断题】(1分)不可以使用netstart和netstop命令启动和停止启动SQLServer服务器引擎服务A.对B.错2【判断题】(1分)不可以使用“SQLServer配置管理器”启动和停止SQLServer的各项服务A.错B.对3【判断题】(1分)可以使用Windows操作系统的“服务”窗口启动和停止SQLServer的各项服务A.错B.对4【判断题】(1分)在SQLServer中,如果没有启用网络协议,只能从本地登录SQLServer,无法通过网络访问或管理SQLServer服务器。
数据可视化技术知到章节测试答案智慧树2023年最新广西科技大学第一章测试1.以下不属于Numpy常用功能的是()参考答案:画图2.以下哪个函数不能将文件存为二进制()参考答案:numpy.loadtxt3.numpy.savetxt的参数中,文件路径写在()参考答案:fname4.关于numpy.random.seed,下列说法错误的是()参考答案:seed( )不能为空5.numpy.random.normal可通过设置()参数设定正态分布的均值参考答案:loc6.关于numpy.random.rand和numpy.random.uniform,下列说法错误的是()参考答案:uniform从一个均匀分布(low,high)中随机采样7.numpy.random.binomial生成的随机数服从()参考答案:二项分布8.numpy.random.binomial可通过设置()参数设定成功的概率参考答案:p9.关于numpy.random.poisson,下列说法错误的是()参考答案:泊松分布是连续函数10.Numpy的函数中常用于表示集中趋势的统计量不包括()参考答案:numpy.std11.关于Numpy中常用的统计量函数,下列说法错误的是()参考答案:numpy.std计算的是样本方差的有偏估计12.关于Numpy中的距离计算,下列说法错误的是()参考答案:曼哈顿距离计算两点间的直角距离,numpy.linalg.norm中的ord参数设置为none第二章测试1.Pandas查看、检查数据中df.describe的功能是()参考答案:查看数值型列的汇总统计2.对于一个Series或DataFrame对象来说,如下选项中说法错误的是()。
参考答案:drop()方法可以用来删除缺失行3.查看数据框df前5行数据的函数是()参考答案:df.head()4.从数据框df中筛选出学校为S_1并且数学成绩大于60的数据正确的是()参考答案:null5.Pandas 适用于处理以下类型的数据是()参考答案:有序和无序(非固定频率)的时间序列数据;;与 SQL 或 Excel 表类似的,含异构列的表格数据;;带行列标签的矩阵数据,包括同构或异构型数据;;任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。
绪论单元测试1.IPython提供了基于控制台命令环境的定制功能,可以将交互式Pythonshell包含在各种Python应用中。
( )A:对B:错答案:A第一章测试1.下列选项中,哪些属于Python语言的特点?()A:面向过程B:开源C:可移植性D:简单易学答案:BCD2.下列领域中,使用Python可以实现的是()A:Web开发B:游戏C:操作系统管理和服务器运维的自动化脚本D:科学计算答案:ABCD3.Python的优点之一是具有伪代码的本质。
( )A:对B:错答案:A4.Python具有可扩展的特性。
( )A:错B:对答案:B5.Python自带shell的性能优于IPython。
( )A:错B:对答案:A第二章测试1.下列选项中变量名不正确的是()。
A:2cdB:ITCASTC:_textD:hei_ma答案:A2.关于input()函数与print()函数的说法中,下列描述错误的是()。
A:input()函数会返回一个字符串类型数据B:input()函数可以接收使用者输入的数据C:print()函数输出的数据不支持换行操作D:print()函数可以输出任何类型的数据答案:C3.与x>yandy>z语句等价的是()A:not x<y or y<zB:x>y>zC:not x<y or not y<zD:x>y or not y<z答案:B4.关于赋值语句的作用,描述正确的是()A:变量和对象必须类型相同B:将变量绑定到对象C:将变量改写为新的值D:每个赋值语句只能给一个变量赋值答案:B5.下列运算符的使用错误的是()A:[1,2,3]+[4,5,6]B:100+‘a’C:3*’abc’D:10%3答案:B第三章测试1.元组支持增加、删除、修改元素等操作。
()A:对B:错答案:B2.列表的索引是从1开始。
()A:对B:错答案:B3.如果元组中只有1个元素时,需要在该元素后面加上逗号。
()A:错B:对答案:B4.下面不能创建一个字典的语句是()A:dict4 = {(1,2,3):”uestc”}B:dict1 = {}C:dict2 = {3:5}D:dict3 = {[1,2,3]:”uestc”}答案:D5.字符串是一个字符序列,例如,字符串s,从右侧向左第2个字符用什么索引()A:s[2]B:s[0:-2]C:s[-2]D:s[:2]答案:C第四章测试1.阅读下面程序:x = 0for x in range(5): x += 1 if x == 3: breakprint(x)输出结果为()。
第一章测试1【多选题】(3分)已知某函数的参数为35.8,执行后结果为35,可能是以下函数中的()。
A.floorB.roundC.intD.abs2【单选题】(2分)以下表达式中,()的运算结果是False。
A.3<4and7<5or9>10B.24!=32C.(10is11)==0D.’abc’<’ABC’3【单选题】(2分)在以下Python循环中,foriinrange(1,3):foriinrange(2,5):print(i*j)语句print(i*j)共执行了()次。
A.6B.5C.3D.24【单选题】(2分)在Python中,对于函数中return语句的理解,的是()。
A.return可以带返回参数B.return可以不带返回参数C.可以有多条return语句,但只执行一条D.一定要有return语句5【判断题】(2分)一个直接或间接地调用自身的算法称为递归,它有两个条件,一个是要直接或间接地调用自身,另一个是必须有出口。
A.对B.错6【单选题】(2分)关于递归函数的描述,以下选项中正确的是()。
A.函数内部包含对本函数的再次调用B.函数比较复杂C.包含一个循环结构D.函数名称作为返回值7【单选题】(2分)关于形参和实参的描述,以下选项中正确的是()。
A.程序在调用时,将形参复制给函数的实参B.函数定义中参数列表里面的参数是实际参数,简称实参。
绪论单元测试1【多选题】(2分)Python在金融中的运用包括()A.绩效分析B.风险分析C.程序化交易D.量化分析第一章测试1【判断题】(2分)python语言支持中文字符作为变量名称,但具有语法意义的符号仅仅支持英文半角符号。
A.对B.错2【判断题】(2分)python中如果需要打印换行,则可以在字符n的左侧添加转义字符。
A.错B.对3【判断题】(2分)跨平台属于Python语言的一个特点。
A.对B.错4【判断题】(2分)Python语言不支持中文。
A.对B.错5【判断题】(2分)Python语言计算机内部存储1个中文字符占2个字节容量。
A.对B.错第二章测试1【单选题】(2分)下面不属于python关键字的有()。
A.whileB.elseC.ifD.then2【单选题】(2分) python的数据类型有()A.字符串B.列表C.字符D.序列3【多选题】(2分) python是一种()A.自然语言B.软件语言C.脚本语言D.跨平台语言4【多选题】(2分)python赋值可能涉及到的python元素有()A.赋值符号=B.字符串C.数值D.变量5【多选题】(2分)python命名时可以使用()A.数字B.字母C.下划线D.中文6【多选题】(2分)Python命名时下面说法正确的有()A.数字可以在最前面B.下划线可以在最前面C.字母可以在最前面D.汉字可以在最前面7【单选题】(2分)下面python命名合法的是()A.你若成风B.寻雾启示:庐州月C.自定义有何不可D.回忆-夏天8【多选题】(2分)下列类型属于容量变化类型的是()A.intB.listC.tupleD.dict9【单选题】(2分)python变量名称不能出现的是()A.下划线B.数字C.字母D.标点符号10【判断题】(2分)a,b=[10,20]属于序列赋值(通用性),其运行结果是a=10,b=20。
A.错B.对第三章测试1【单选题】(2分)importturtleast表示()A.调用turtle库中的t函数B.调用turtle库,并更改名称为tC.更改turtle库名称为tD.调用turtle库2【多选题】(2分)turtle.screensize可以设置画布的()A.大小B.底色C.位置D.比例3【多选题】(2分)turtle.screensize的默认配置是()A.白底色B.黑底色C.400x300D.800x6004【多选题】(2分)turtle.setup可以设置画布的()A.比例B.位置C.宽度D.高度5【单选题】(2分)下列turtle.setup语句中用比例方式设置画布的有()A.turtle.setup(500,400,200,100)B.turtle.setup(0.5,0.5,200,100)C.turtle.setup(0.5,1,200,100)D.turtle.setup(1,1,200,100)6【判断题】(2分)使用pendown()后画笔才会有笔记。
第一章测试1.下列标识符中,合法的是()。
A:Hello# B:hello C:2ndObj D:-hello 答案:B2.下列数值中,不属于整数类型的是()。
A:0x80 B:3.14 C:28 D:-28 答案:B3.下列选项中,对应的布尔值为True的是() A:None B:{} C:0 D:1 答案:D4.下列语句中,定义变量符合规范的是()。
A:b>=10 B:int a=10 C:a==10D:b=10 答案:D5.Python使用#符号注释单行语句。
() A:[ ] B:() C:{ } D:缩进答案:D6.Python使用#符号注释单行语句。
() A:对 B:错答案:A7.Python的单行注释以//开头。
() A:对 B:错答案:B8.标识符可以以数字开头。
() A:错 B:对答案:A9.Python中的标识符不区分大小写。
() A:对 B:错答案:B10. 3.14、10.506都属于浮点数。
() A:错 B:对答案:B ## 第二章测试11.Python中的每个if条件语句后面都要使用冒号。
() A:对 B:错答案:A12.只有if语句的判断条件为False,程序才能执行else语句。
() A:错 B:对答案:B13.循环语句可以嵌套使用。
() A:对 B:错答案:A14.在Python中没有switch-case语句。
() A:对 B:错答案:A15.Python中没有do-while循环。
() A:错 B:对答案:B16.阅读下面的一段程序:sum=0for i inrange(100):if(i%10):continuesum=sum+iprint(sum)执行程序,最终输出的结果是()。
A:4050 B:450 C:5050 D:45 答案:B17.下列语句中,用来结束整个循环的是()。
A:pass B:break C:continueD:else 答案:B18.下列语句中,能够控制程序循环执行的是()。
第一章测试1【判断题】(20分)缩进对于Python程序至关重要。
A.对B.错2【判断题】(20分)在Python3.x中不能使用汉字作为变量名。
A.对B.错3【多选题】(20分)下面哪些是正确的Python标准库对象导入语句?A.frommathimportsinB.importmath.*C.importmath.sinassinD.frommathimport*4【判断题】(20分)Python支持面向对象程序设计。
A.对B.错5【多选题】(20分)下面属于Python编程语言特点的有?A.扩展库丰富B.支持函数式编程C.支持命令式编程D.代码运行效率高第二章测试1【判断题】(20分)已知列表x=[1,2,1,2,3,1],那么执行x.remove(1)之后,x的值为[2,2,3]。
A.对B.错2【判断题】(20分)已知列表x=[1,2,3],那么执行y=x.reverse()之后,y的值为[3,2,1]。
A.错B.对3【判断题】(20分)Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
A.对B.错4【判断题】(20分)表达式3>5andmath.sin(0)的值为0。
A.错B.对5【判断题】(20分)表达式4<5==5的值为True。
A.错B.对第三章测试1【判断题】(10分)生成器表达式的计算结果是一个元组。
A.对B.错2【判断题】(15分)包含列表的元组可以作为字典的“键”。
A.错B.对3【判断题】(20分)列表的rindex()方法返回指定元素在列表中最后一次出现的位置。
A.错B.对4【判断题】(15分)Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
A.错B.对5【判断题】(15分)列表可以作为字典元素的“键”。
A.对B.错6【判断题】(25分)Python语言中字符串对象的strip()只能删除字符串两端的空白字符,无法删除其他字符。
A.错B.对第四章测试1【判断题】(10分)g=lambdax:3不是一个合法的赋值表达式。
A.对B.错2【判断题】(15分)调用函数时传递的实参个数必须与函数形参个数相等才行。
A.错B.对3【判断题】(15分)在定义函数时,某个参数名字前面带有两个*符号表示可变长度参数,可以接收任意多个关键参数并将其存放于一个字典之中。
A.对B.错4【判断题】(15分)函数内部定义的局部变量当函数调用结束后被自动删除。
A.错B.对5【判断题】(15分)在Python中,不能在一个函数的定义中再定义一个嵌套函数。
A.错B.对6【判断题】(15分)Python关键字and和or连接多个表达式时具有惰性求值特点,只计算必须计算的表达式。
A.错B.对7【判断题】(15分)在编写多层循环时,为了提高运行效率,应尽量减少内循环中不必要的计算。
A.对B.错第五章测试1【判断题】(20分)如果要操作docx格式的Word文档,可以按照扩展库python-docx。
A.错B.对2【判断题】(20分)使用内置函数open()打开文件时,只要文件路径正确就总是可以正确打开的。
A.错B.对3【判断题】(20分)二进制文件不能使用记事本程序打开。
A.错B.对4【判断题】(20分)以写模式打开的文件无法进读操作。
A.对B.错5【判断题】(20分)Python的主程序文件python.exe属于二进制文件。
A.对B.错第六章测试1【判断题】(20分)扩展库numpy中的arange()函数功能和内置函数range()类似,只能生成包含整数的数组,无法创建包含实数的数组。
A.错B.对2【判断题】(15分)表达式np.empty((3,5)).sum()的值一定为0。
A.错B.对3【判断题】(15分)已知x.shape的值为(3,5),那么语句x[:,3]=2的作用是把数组x所有行中列下标为3的元素值都改为2。
A.错B.对4【判断题】(10分)扩展库numpy的isclose()返回包含若干True/False值的数组,而allclose()返回True或False值。
A.错B.对5【判断题】(10分)扩展库numpy的函数append()和insert()是在原数组的基础上追加或插入元素,没有返回值。
A.错B.对6【判断题】(15分)已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。
A.对B.错7【判断题】(15分)扩展库numpy在linalg模块中提供了计算奇异值分解的函数svd()。
A.对B.错第七章测试1【判断题】(20分)扩展库pandas的read_csv()函数用于读取CSV文件中的数据并创建DataFrame对象。
A.错B.对2【判断题】(20分)使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数sheetname 指定读取哪个工作表中的数据,并且该参数必须指定为工作表的名字,不能是序号。
A.错B.对3【判断题】(10分)使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数na_values指定哪些值被解释为缺失值。
A.对B.错4【判断题】(20分)扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来删除重复的数据。
A.对B.错5【判断题】(30分)如果DataFrame对象中索引是日期时间数据,或者包含日期时间类型数据列,可以使用resample()方法进行重采样,实现按时间段进行统计查看员工业绩的功能。
A.对B.错第八章测试1【判断题】(20分)在机器学习扩展库sklearn中,Lasso是可以估计稀疏系数的线性模型,尤其适用于减少给定解决方案依赖的特征数量的场合。
如果数据的特征过多,而其中只有一小部分是真正重要的,此时选择Lasso比较合适。
A.错B.对2【判断题】(20分)使用朴素贝叶斯算法进行分类时,分别计算未知样本属于每个已知类的概率,然后选择其中概率最大的类作为分类结果。
A.对B.错3【判断题】(10分)支持向量机(SupportVectorMachine,SVM)是通过寻找超平面对样本进行分隔从而实现分类或预测的算法,分隔样本时的原则是使得间隔最大化,寻找间隔最大的支持向量。
A.错B.对4【判断题】(10分)KNN算法是k-NearestNeighbor的简称,叫作k近邻算法,属于有监督学习算法,既可以用于分类,也可以用于回归。
A.对B.错5【判断题】(20分)DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)属于密度聚类算法,把类定义为密度相连对象的最大集合,通过在样本空间中不断搜索高密度的核心样本并扩展得到最大集合完成聚类,能够在带有噪点的样本空间中发现任意形状的聚类并排除噪点。
A.对B.错6【判断题】(10分)DBSCAN算法不需要预先指定聚类数量,但对用户设定的参数非常敏感。
当空间聚类的密度不均匀、聚类间距相差很大时,聚类质量较差。
A.对B.错7【判断题】(10分)在样本的众多特征中,并不是每个特征都对要分析的问题有贡献。
即使是对问题有贡献的若干特征,每个特征的重要程度可能也不一样。
A.对B.错第九章测试1【单选题】(10分)扩展库matplotlib.pyplot中的函数plot()可以用来绘制哪种图形?A.柱状图B.饼状图C.折线图D.散点图E.雷达图2【单选题】(10分)扩展库matplotlib.pyplot中的函数scatter()可以用来绘制哪种图形?A.柱状图B.雷达图C.散点图D.饼状图E.折线图3【单选题】(10分)扩展库matplotlib.pyplot中的函数bar()可以用来绘制哪种图形?A.折线图B.散点图C.雷达图D.饼状图E.柱状图4【单选题】(10分)使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的位置?A.fillB.widthC.lwD.colorE.leftF.hatch5【单选题】(10分)使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的内部填充符号?A.colorB.widthC.fillD.lwE.hatchF.left6【单选题】(10分)使用可视化扩展库matplotlib的模块pyplot中的xticks()函数设置x轴刻度时,下面哪个参数用来设置刻度文本的旋转角度?A.rotationB.degreeC.degD.rot7【单选题】(10分)使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置饼状图的半径?A.startangleB.explodeC.centerD.radiusE.shadowF.colors8【判断题】(10分)假设已使用importmatplotlibasmpl导入可视化扩展库,那么mpl.rcParams['legend.fonts ize']=10语句的功能是设置图例的字号。
A.错B.对9【单选题】(10分)可视化扩展库matplotlib的模块pyplot中哪个函数可以用来设置同一个画布中多个子图之间的水平间距和垂直间距?A.tight_layout()B.plot()C.subplot()D.subplots_adjust()10【判断题】(10分)图例往往位于图形绘制结果的一角或一侧,也可以根据图形的特点来设置位置以及背景色等其他样式,主要用于对所绘制的图形中使用的各种符号和颜色进行说明,对于理解图形有重要的作用。
A.对B.错。