数据分析专项训练及答案
- 格式:doc
- 大小:335.50 KB
- 文档页数:12
数据分析期末复习专练一、选择题:本题共10小题,每小题3分,共30分。
在每小题给出的选项中,只有一项是符合题目要求的。
1.为了考察库存2000只灯泡的使用寿命,从中任意抽取15只灯泡进行实验,在这个问题中.下列说法正确的是()A.总体是2000只灯泡B.样本是抽取的15只灯泡C.个体是每只灯泡的使用寿命D.个体是2000只灯泡的使用寿命2.某校举办了一次“交通安全知识”测试,王老师从全校学生的答卷中随机抽取了200名学生的答卷,并将测试成绩分为,,,四个等级,绘制出如图所示的条形统计图.若该校学生共有1000名,则估计该校成绩为的学生人数为()A.30B.75C.150D.2003.以下调查中,适宜全面调查的是()A.了解某班学生的身高情况B.了解某批灯管的使用寿命C.了解当代大学生的主要娱乐方式D.了解全国中学生的课外阅读情况4.某班统计了该班全体学生60秒内高抬腿的次数,绘制出频数分布表:次数60≤<8080≤<100100≤<120120≤<140140≤<160160≤<180180≤<200频数1241417134给出以下结论:①组数是6;②组距是20;③全班有55名学生;④高抬腿次数在120≤<180范围内的学生占全班学生的80%.其中正确结论的个数为()A.1B.2C.3D.45.将数据83,85,87,89,84,85,86,88,87,90分组,86.5∼88.5这组的频数是()A.1B.2C.3D.46.如图,一、二两组同学将本组最近5次数学平均成绩分别绘制成折线统计图.由统计图可知,成绩进步幅度大的组是()A.一组B.二组C.一组、二组进步幅度一样大D.无法判断7.某校开展了“爱阅读”活动,七(1)班统计了1~6月全班同学的课外阅读数量(单位:本),绘制了折线统计图(如图所示),则下列说法中正确的是()A.6月份阅读数量最大B.阅读数量超过40本的月份共有5个C.相邻的两个月中,1月到2月的阅读数量增长最快D.4月份阅读数量为38本8.下图所示的两个统计图中,女生人数多的学校是()A.甲校B.乙校C.甲、乙两校女生人数一样多D.无法确定9.下列四种统计图:条形图、扇形图、折线图、直方图,能够显示数据分布情况的是()A. B. C. D.10.下图是某种学生快餐的营养成分统计图,若脂肪有30 ,则蛋白质有()A.135 B.130 C.125 D.120 二、填空题:本题共9小题,每小题3分,共27分。
数据分析试题及答案题目一:某电商平台收集了一年内用户的购物数据,数据包括用户ID、购买金额、购买时间等。
请你根据下面的数据,回答以下问题:(数据表格)用户ID 购买金额(元)购买时间001 100 2020-01-02002 200 2020-01-03003 300 2020-01-03004 150 2020-01-04005 250 2020-01-051. 请计算2020年1月份的总销售额和平均销售额。
2. 请统计2020年1月份每天的订单量。
3. 请找出购买金额最高的用户ID及其购买金额。
4. 请找出购买时间距离2020年1月2日最近的用户ID及其购买时间。
答案:1. 总销售额计算:2020年1月份的总销售额 = 100 + 200 + 300 + 150 + 250 = 1000元平均销售额计算:2020年1月份的平均销售额 = 1000 / 5 = 200元2. 每天的订单量统计:2020年1月2日订单量:12020年1月3日订单量:22020年1月4日订单量:12020年1月5日订单量:13. 购买金额最高的用户ID及其购买金额:购买金额最高的用户ID:003购买金额:300元4. 购买时间距离2020年1月2日最近的用户ID及其购买时间:购买时间距离2020年1月2日最近的用户ID:001购买时间:2020-01-02题目二:某汽车公司的销售数据如下所示,请根据下面的数据,回答以下问题:(数据表格)销售日期销售数量(辆)销售额(万元)2020-01-01 10 1002020-01-02 15 1502020-01-03 20 2002020-01-04 25 2502020-01-05 30 3001. 请计算2020年1月份的总销售数量和总销售额。
2. 请计算2020年1月份的平均销售数量和平均销售额。
3. 请找出销售数量最高和最低的日期。
4. 请计算销售数量和销售额之间的相关系数。
数据分析及应用试题库及答案一、单选题(共50题,每题1分,共50分)1、用顺序查找法对具有n个结点的线性表查找一个结点的时间复杂度为()A、A O(log2n2)B、B O(nlog2n)C、C O(n)D、D O(log2n)正确答案:C2、 a = np.array([10,100]) b = np.array([1,2]) print (np.power(a,b))输出结果A、A [100 10000]B、B [10,100]C、C [10 10000]D、D [100,100]正确答案:C3、某二叉树的前序序列为ABCD,中序序列为BDCA,则该二叉树的深度为______。
A、A 4B、B 3C、C 2D、D 不确定正确答案:A4、求最短路径的 FLOYD 算法的时间复杂度为()A、A O(n)B、B O(n+e)C、C O(n^2)D、D O(n^3)正确答案:D5、归并排序的时间复杂度()A、A O(log(N))B、B O(N*log(N))C、C O(N)D、D O(N^2)正确答案:B6、哪个函数用户将序列中所有元素作为参数调用指定函数,并将结果构成新的序列A、A lambdaB、B mapC、C filterD、D zip正确答案:B7、以下选项中,不是Python中文件操作的相关函数是()。
A、A open ()B、B load ()C、C read ()D、D write ()正确答案:B8、关于预处理的说法中,下列选项中描述不正确是A、A concat()函数可以沿着一条轴将多个对象进行堆叠B、B merge()函数可以根据一个或多个键将不同的DataFrame进行合并C、C 可以使用rename()方法对索引进行重命名操作D、D unstack()方法可以将列索引旋转为行索引正确答案:D9、下列函数中,可以用于创建等差数组的函数是A、A empty()B、B arange()C、C zeros()D、D ones()正确答案:B10、假设有命令import numpy as np Array1 = np.linspace(1,5,3,dtype=int) print(Array1)则,执行结果是A、A 30B、B 20C、C [[ 7 10] [15 22]]D、D [[ 5 8] [15 22]]正确答案:A11、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D12、在 n 个结点的顺序表中,算法的时间复杂度是 O(1)的操作是():A、A 访问第i个结点(1≤i≤n)和求第i个结点的直接前驱(2≤i≤n)B、B 在第i个结点后插入一个新结点(1≤i≤n)C、C 删除第i个结点(1≤i≤n)D、D 将n个结点从小到大排序正确答案:A13、下面不属于软件工程三要素的是______。
初中数据分析试题及答案一、单项选择题(每题2分,共20分)1. 下列哪个选项是描述数据集中趋势的统计量?A. 极差B. 中位数C. 众数D. 方差答案:B2. 一组数据的平均数是50,中位数是45,众数是40,这组数据可能呈现什么分布?A. 正偏态分布B. 负偏态分布C. 对称分布D. 不能确定答案:A3. 在统计学中,用于衡量数据离散程度的指标是?A. 平均数B. 中位数C. 众数D. 标准差答案:D4. 以下哪个不是数据分析中常用的图表类型?A. 条形图B. 折线图C. 饼图D. 树状图答案:D5. 如果一组数据的方差为0,这意味着什么?A. 数据中存在异常值B. 数据完全一致C. 数据没有变化D. 数据分布不均匀答案:B6. 相关系数的取值范围是?A. -1到1B. 0到1C. 1到100D. 任意实数答案:A7. 以下哪个统计图可以直观地表示出数据随时间的变化趋势?A. 散点图B. 条形图C. 折线图D. 饼图答案:C8. 在一组数据中,如果众数是唯一的,那么这组数据的众数是?A. 最大值B. 最小值C. 出现次数最多的值D. 平均值答案:C9. 一组数据的标准差越大,说明这组数据的?A. 集中程度越高B. 离散程度越高C. 变化越小D. 变化越大答案:B10. 以下哪个统计量可以用来衡量一组数据的离散程度?A. 平均数B. 中位数C. 众数D. 极差答案:D二、多项选择题(每题3分,共15分)1. 数据分析中,哪些统计量可以用来描述数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 以下哪些图表可以用来展示分类数据?A. 条形图B. 折线图C. 饼图D. 散点图答案:AC3. 在数据分析中,哪些因素可能会影响数据的离散程度?A. 数据的分布B. 数据的量级C. 数据的异常值D. 数据的集中趋势答案:ABC4. 以下哪些统计量可以用来衡量数据的相关性?A. 相关系数B. 标准差C. 回归分析D. 方差答案:AC5. 以下哪些因素可能会影响数据的分布形状?A. 数据的量级B. 数据的异常值C. 数据的集中趋势D. 数据的离散程度答案:ABD三、简答题(每题5分,共10分)1. 请简述中位数和众数在数据分析中的作用。
六年级数学数据分析专项练习题及答案一、选择题1. 下列哪个不是连续统计资料A. 今天上午10点钟每10分钟的体温B. 近一周每天的降水量C. 放在实验室里的草虫的重量D. 不同年级学生的体重2. 下列资料中哪个是离散统计资料A. 月份和季节的关系B. 过去一周每天的最高气温C. 一年级学生的身高D. 一天中不同时间段的读书时间3. 小明一周的学习时间如下:4, 5, 6, 7, 4, 5, 8(单位:小时)。
平均学习时间是多少?A. 5小时B. 6小时C. 7小时D. 8小时4. 某班学生参加了一次考试,得到的分数如下:85, 90, 92, 88, 83, 86, 95。
以下哪个图形可以正确表示这些分数?A. 折线图B. 饼图C. 柱状图D. 散点图5. 某班学生的年龄分布如下:10, 11, 11, 10, 12, 10, 11, 10, 12, 13。
以下哪个图形可以正确表示这些数据?A. 折线图B. 饼图C. 柱状图D. 散点图二、填空题1. 下列是连续数据的是________ (体温, 体重, 学生姓名)2. 某班同学的身高如下 (120cm, 130cm, 125cm, 135cm),其中众数为________3. 折线图适合表示________的变化4. 某地区一周的降水量如下 (10mm, 5mm, 15mm, 20mm, 8mm),其中极差为________三、解答题1. 小明的家人去年9月份的电费如下:120元、130元、110元、140元、130元。
求这些电费的平均值和中位数。
解析:平均值 = (120 + 130 + 110 + 140 + 130) / 5 = 130元中位数 = 130元2. 某小组同学去年参加了一次数学竞赛,得到的分数如下:80分、90分、85分、95分、88分。
请画出这些分数的柱状图,并标明横轴和纵轴的单位。
解析:横轴:分数纵轴:人数|100 ||90 || x80 | x x x|_____________80 85 90 953. 某年级的同学身高如下:120cm、125cm、115cm、130cm、135cm。
[必刷题]2024七年级数学下册数据分析专项专题训练(含答案)试题部分一、选择题:1. 下列数据中,众数是8的是()A. 2, 3, 5, 7, 8, 8, 9B. 1, 2, 3, 4, 5, 6, 7C. 6, 7, 8, 9, 10, 11, 12D. 4, 5, 6, 7, 8, 9, 102. 以下哪个统计量能够反映一组数据的波动大小?()A. 平均数B. 中位数C. 众数D. 方差3. 在一组数据中,若中位数是50,那么这组数据中至少有()个数据不小于50。
A. 1B. 2C. 50D. 无法确定4. 下列关于平均数、中位数和众数的关系,错误的是()A. 平均数、中位数和众数可以相等B. 平均数受极端值影响较大C. 中位数不受极端值影响D. 众数只能有一个5. 有一组数据:3, 5, 7, 9, 11, 13, x,若这组数据的平均数为8,那么x的值为()A. 7B. 9C. 11D. 136. 下列关于方差的说法,正确的是()A. 方差越大,数据分布越集中B. 方差越小,数据分布越分散C. 方差等于各数据与平均数的差的平方和的平均数D. 方差可以为负数7. 下列数据中,哪一个不是有效数据?()A. 2.5B. 0C. 3D. 无8. 下列关于频数分布表的说法,错误的是()A. 频数分布表可以直观地展示数据的分布情况B. 频数是指某个数据出现的次数C. 频率是指某个数据出现的次数与总次数的比值D. 频率之和必须等于19. 在一组数据中,若众数是50,那么这组数据中至少有()个数据等于50。
A. 1B. 2C. 50D. 无法确定10. 下列关于极差的说法,正确的是()A. 极差越大,数据分布越集中B. 极差越小,数据分布越分散C. 极差等于最大值与最小值的差D. 极差可以为负数二、判断题:1. 平均数、中位数和众数都是描述数据集中趋势的统计量。
()2. 在一组数据中,平均数一定大于等于中位数。
数据分析及应用模拟题含答案一、单选题(共30题,每题1分,共30分)1、下列函数中,用于沿着轴方向堆叠Pandas对象的是A、A 五分之一B、B 六分之一C、C 七分之一D、D 七分之五正确答案:D2、Numpy.random模块中用于对一个序列进行随机排序的函数是()。
A、A uniformB、B shuffleC、C permutationD、D normal正确答案:B3、将一个从大到小的数组,用以下排序方法排序成从小到大的,()最快。
A、A 插入排序B、B 冒泡排序C、C 快速排序D、D 堆排序正确答案:D4、代码if ‘p’ in ‘pip python’: print(‘pip python’.replace(‘p’, ‘P’))的执行结果是()A、A PiP pythonB、B pip PythonC、C PiP PythonD、D Pip Python正确答案:C5、以下程序的不可能输出结果是:from random import * print(round(random(),2))A、A 0.47B、B 0.54C、C 0.27D、D 1.87正确答案:D6、人患癌症的概率为1/1000.假设有一台癌症诊断仪S1,通过对它以往的诊断记录的分析,如果患者确实患有癌症它的确诊率为90%,如果患者没有癌症,被诊断成癌症的概率是10%。
某人在被诊断为癌症后,他真正患癌症的概率为()A、A 9/1000B、B 1/1000C、C 1/112D、D 9/10正确答案:C7、某算法的时间复杂度为,表明该算法的A、A 问题规模是n^2B、B 执行时间等于n^2C、C 执行时间与n^2成正相关D、D 问题规模与n^2成正比正确答案:C8、matpltlib中绘制图形,可以通过传递参数设置当前绘图区的标题及位置。
若标题是s,以下设置绘图区标题写法对的是:()A、A plt.text(x,y, s")"B、B plt.title(x,y, s")"C、C plt.text(s",loc= center )"D、D plt.title(s",loc= center )"正确答案:D9、import pandas as pd df=pd.DataFrame({ a :list(""opq""),b :[3,2,1]},index=[ e , f , g ]) 以下说法错误的是: ()A、A df[0:1]返回第0行的数据B、B df[0:1]返回第0列的数据C、C df[0]会报错D、D df[ e ]会报错正确答案:B10、假设在今日头条里面,有很多工作人员检查新闻是不是属于虚假新闻,所有新闻真实率到达了98%,工作人员在检验一个真实的新闻把它检验为一个虚假的新闻的概率为2%,而一个虚假的新闻被检验为真实的新闻的概率为5%.那么,一个被检验为真实的新闻确实是真实的新闻的概率是多大?B、B 0.9989C、C 0.9855D、D 0.96正确答案:B11、python语言中""A、A 按位取反B、B 按位异或C、C 按位与D、D 左移一位正确答案:D12、在软件开发中,下面任务不属于设计阶段的是______。
数据分析及应用模拟练习题含答案一、单选题(共30题,每题1分,共30分)1、蒙特卡罗算法是()的一种A、A 分支界限法B、B 概率算法C、C 贪心算法D、D 回溯算法正确答案:B2、下面属于良好程序设计风格的是______。
A、A 源程序文档化B、B 程序效率第一C、C 随意使用无条件转移语句D、D 程序输入输出的随意性正确答案:A3、假设有命令(P)import numpy as np bArray = np.array([[1,2,3],[4,5,6]])则,bArray.ndim的结果是A、A 逻辑覆盖法B、B 等价类划分C、C 边界值分析D、D 功能图法正确答案:A4、若实体A和B是一对多的联系,实体B和C是一对一的联系,则实体A和C的联系是______。
A、A 一对一B、B 一对多C、C 多对一D、D 多对多正确答案:B5、DataFrame对象df返回第一行以及返回最后一行的代码是:()A、A 除字典类型外,所有标准对象均可以用于布尔测试B、B 空字符串的布尔值是FalseC、C 空列表对象的布尔值是FalseD、D 值为0的任何数字对象的布尔值是False正确答案:A6、np.arange(1,10,1).reshape([3,3])[1:,2:]=(?)。
A、A [8 9]B、B [6 9]C、C [[6][9]]D、D 抛异常正确答案:C7、某二叉树共有150个结点,其中有50个度为1的结点,则______。
A、A 不存在这样的二叉树B、B 该二叉树有49个叶子结点C、C 该二叉树有50个叶子结点D、D 该二叉树有51个叶子结点正确答案:A8、x=np.arange(1,10,1).reshape([3,3]) y=np.arange(10,19,1).reshape(3,3) np.r_[x,y].shape==()A、A (6,3)B、B (3,6)C、C (3,3)D、D (6,6)正确答案:A9、在进行算术运算时,如果希望一次性输出多个统计指标可以使用()方法A、A statistics()B、B describe()C、C all()D、D results()正确答案:B10、关于哑变量的说法中,下列选项描述错误的是A、A 哑变量是人为虚设的变量B、B 哑变量在转换成指标矩阵后,其值通常为0或1C、C Pnadas中get_dummies()函数可以对类别进行哑变量处理D、D 哑变量的使用没有实际意义正确答案:D11、请找出数列11,18,38,83…的下一项()A、A 146B、B 168C、C 171D、D 203正确答案:C12、用import matplotlib.pyplot as pt引入pyplot模块后,下面可以对执行的代码是()A、A plt.plot([1,2,3])B、B pt.plot([1,2,3])C、C plt.plot[1,2,3]D、D pt.plot[1,2,3]正确答案:B13、pandas提供了对各种格式数据文件的读取和写入工具,其中不包括哪种?A、A CSV文件B、B 文本文件C、C 工作簿文件D、D EXE文件正确答案:D14、在下述论述中,正确的是()。