数据分析练习题(解答)
- 格式:doc
- 大小:146.50 KB
- 文档页数:3
一、选择题1.某市6月份日平均气温统计如图所示,则在日平均气温这组数据中,众数和中位数分别是( )A .21,21B .21,21.5C .21,22D .22,22C解析:C 【解析】这组数据中,21出现了10次,出现次数最多,所以众数为21, 第15个数和第16个数都是22,所以中位数是22. 故选C.2.在我县“我的中国梦”演讲比赛中,有7名同学参加了比赛,他们最终决赛的成绩各不相同.其中一名学生想要知道自己是否进入前3名,不仅要知道自己的分数,还得知道这7名学生成绩的( ) A .众数 B .方差C .平均数D .中位数D解析:D 【分析】由于其中一名学生想要知道自己能否进入前3名,共有7名选手参加,故应根据中位数的意义分析. 【详解】由于总共有7个人,且他们的成绩各不相同,第3的成绩是中位数,要判断是否进入前3名,故应知道中位数的多少. 故选:D . 【点睛】此题主要考查统计的有关知识,主要包括平均数、中位数、众数、方差的意义.反映数据集中程度的统计量有平均数、中位数、众数、方差等,各有局限性,因此要对统计量进行合理的选择和恰当的运用. 3.已知数据12,,,n x x x 的平均数是2,方差是0.1,则1242,42,,42n x x x ---的平均数和标准差分别为( ) A .2,1.6 B .210C .6,0.4D .210D 解析:D【分析】根据平均数和方差公式直接计算即可求得. 【详解】 解:()12312n x x x x x n=+++⋯+=, ∴()1231424242424226n x x x x n -+-+-+⋯+-=⨯-=, ()()()()22222123122220.1n S x x x x n ⎡⎤=-+-+-+⋯+-=⎣⎦,()()()()22222421231426426426426x n S x x x x n -⎡⎤=--+--+--+⋯+--⎣⎦ 0.116=⨯1.6=,∴42x S -=故选:D . 【点睛】本题考查了方差和平均数,灵活利用两个公式,进行准确计算是解答的关键. 4.下列说法正确的是( )A .为了解我国中学生课外阅读的情况,应采取全面调查的方式B .一组数据1、2、5、5、5、3、3的中位数和众数都是5C .若甲组数据的方差是003,乙组数据的方差是0.1,则甲组数据比乙组数据稳定D .抛掷一枚硬币100次,一定有50次“正面朝上”C 解析:C 【分析】可根据调查的选择、中位数和众数的求法、方差及随机事件的意义,逐个判断得结论. 【详解】解:因为我国中学生人数众多,其课外阅读的情况也不需要特别精确, 所以对我国中学生课外阅读情况的调查,宜采用抽样调查,故选项A 不正确; 因为B 中数据按从小到大排列为1、2、3、3、5、5、5,位于中间的数是3,故该组数据的中位数为3, 所以选项B 说法不正确;因为0.003<0.1,方差越小,波动越小,数据越稳定, 所以甲组数据比乙组数据稳定,故选项C 说法正确;因为抛掷硬币属于随机事件,抛掷一枚硬币100次,不一定有50次“正面朝上” 故选项D 说法不正确. 故选:C . 【点睛】本题的关键在于掌握调查的选择、中位数和众数的求法、方差及随机事件的意义.5.通过统计甲、乙、丙、丁四名同学某学期的四次数学测试成绩,得到甲、乙、丙、丁三明同学四次数学测试成绩的方差分别为S甲2=17,S乙2=36,S丙2=14,丁同学四次数学测试成绩(单位:分).如下表:第一次第二次第三次第四次丁同学 80 80 90 90则这四名同学四次数学测试成绩最稳定的是()A.甲B.乙C.丙D.丁C解析:C【分析】求得丁同学的方差后与前三个同学的方差比较,方差最小的成绩最稳定.【详解】丁同学的平均成绩为:14⨯(80+80+90+90)=85;方差为S丁214=[2×(80﹣85)2+2×(90﹣85)2]=25,所以四个人中丙的方差最小,成绩最稳定.故选C.【点睛】本题考查了方差的意义及方差的计算公式,解题的关键是牢记方差的公式,难度不大.6.如图是根据我市某天七个整点时的气温绘制成的统计图,则下列说法正确的是()A.这组数据的众数是14B.这组数据的中位数是31C.这组数据的标准差是4D.这组是数据的极差是9D解析:D【解析】【分析】根据中位数,众数、极差、标准差的定义即可判断.【详解】解:七个整点时数据为:22,22,23,26,28,30,31所以中位数为26,众数为22,平均数为:22+22+23+26+28+3032167+=;极差是31-22=9,标准差是:故D正确,故选:D【点睛】此题考查中位数,众数、极差、标准差的定义,解题关键在于看懂图中数据7.有甲乙两个箱子,其中甲箱内有98颗球,分别标记号码1~98,且号码不重复的整数,乙箱内没有球。
六年级数学数据分析专项练习题及答案一、选择题1. 下列哪个不是连续统计资料A. 今天上午10点钟每10分钟的体温B. 近一周每天的降水量C. 放在实验室里的草虫的重量D. 不同年级学生的体重2. 下列资料中哪个是离散统计资料A. 月份和季节的关系B. 过去一周每天的最高气温C. 一年级学生的身高D. 一天中不同时间段的读书时间3. 小明一周的学习时间如下:4, 5, 6, 7, 4, 5, 8(单位:小时)。
平均学习时间是多少?A. 5小时B. 6小时C. 7小时D. 8小时4. 某班学生参加了一次考试,得到的分数如下:85, 90, 92, 88, 83, 86, 95。
以下哪个图形可以正确表示这些分数?A. 折线图B. 饼图C. 柱状图D. 散点图5. 某班学生的年龄分布如下:10, 11, 11, 10, 12, 10, 11, 10, 12, 13。
以下哪个图形可以正确表示这些数据?A. 折线图B. 饼图C. 柱状图D. 散点图二、填空题1. 下列是连续数据的是________ (体温, 体重, 学生姓名)2. 某班同学的身高如下 (120cm, 130cm, 125cm, 135cm),其中众数为________3. 折线图适合表示________的变化4. 某地区一周的降水量如下 (10mm, 5mm, 15mm, 20mm, 8mm),其中极差为________三、解答题1. 小明的家人去年9月份的电费如下:120元、130元、110元、140元、130元。
求这些电费的平均值和中位数。
解析:平均值 = (120 + 130 + 110 + 140 + 130) / 5 = 130元中位数 = 130元2. 某小组同学去年参加了一次数学竞赛,得到的分数如下:80分、90分、85分、95分、88分。
请画出这些分数的柱状图,并标明横轴和纵轴的单位。
解析:横轴:分数纵轴:人数|100 ||90 || x80 | x x x|_____________80 85 90 953. 某年级的同学身高如下:120cm、125cm、115cm、130cm、135cm。
一、单选题1、某射击运动员在一次射击练习中,5次射击成绩(单位:环)记录如下:8,9,x,7,1 0,因记录员不小心,有一个数字被污染了,但记录员记得这组数据的众数为8,则这组数据的中位数是()A. 7B. 8C. 9D. 10参考答案: B【思路分析】本题为统计题,考查众数与中位数的意义.众数是一组数据中出现次数最多的数.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.先根据众数求出被污染了的数字,再根据中位数的定义即可求解。
【解题过程】解:∵记录员记得数据8,9,x,7,10的众数为8,∴x=8,从小到大排列为7,8,8,9,10,∴这组数据的中位数是8。
故选B。
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -2、数据5、7、5、8、6、13、5 的中位数是()。
A. 5B. 6C. 7D. 8参考答案: B【思路分析】本题主要考查中位数。
仔细读题,获取题中已知条件,结合中位数的相关知识,即可解答此题。
【解题过程】解:当变量值的项数N为奇数时,处于中间位置的变量值即为中位数;当N为偶数时,中位数则为处于中间位置的2个变量值的平均数。
这组数据按从小到大排列为:5、5、5、6、7、8、13,则中位数是6,故B项正确。
故本题正确答案为B。
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -3、某中学足球队的18名队员的年龄情况如表,这些队员年龄的众数和中位数分别是()。
第三章习题一、习题3、4解:由于各种催化剂下产品的得到率服从同方差的正态分布,所以此问题就是一个单因素方差分析问题,且24,64321=====n n n n n ,利用proc anova 过程得到方差分析表如下所示:由于检验p 值为0、3003>0、05 ,故接受原接受0 ,即认为四种不同催化剂对产品的得到率无显著影响。
二、习题3、5解:(1)首先利用proc anova 过程进行方差分析,其25,63,122,91====n n n n ,得到方差分析表如下:通过计算得到F=15、72, 检验p 值为小于0、0001,故拒绝原假设0H ,认为该电子科技公司过去三年的研究经费投入对当年生产能力的提高有显著差异。
(2)给出不同经费投入对生产提高的均值及其区间估计:高量的均值为2000.9,1333.8,8778.6===H M L u u u ,H M L u u u 、、的置信度为95%的置信区间为:]4282.7.3174.6[∈L u 、]6100.8.,6567.7[∈M u 、]8741.9.,5259.8[∈H u 通过计算得到两两均值之差的计算表:得到H M H L M L u u u u u u ---和,的置信都不小于95%的Bonferroni 同时置信区间为:]3476.0.1635.2[--∈-M L u u , ]2370.1.4074.3[--∈-H L u u ,]0371.0.0962.2[--∈-H M u u从H M H L M L u u u u u u ---和,的Bonferroni 同时置信区间都位于负值区间可知随着三年科研经费的投入越高,当年生产能力的改善越显著。
三、习题3、6解:(1)首先利用SAS 的proc anova 过程的means 语句,求出各水平的均值与标准差:如下所示:由上表可知,(a1,b1)组合与(a1,b3)组合的标准差分别为2、030875、2、8067751与其她组合的标准差相差较大,所以我认为假定误差的等方差性不太合理。
一.选择题1.九年级一班和二班每班选8名同学进行投篮比赛,每名同学投篮10次,对每名同学投中的次数进行统计,甲说:“一班同学投中次数为6个的最多”乙说:“二班同学投中次数最多与最少的相差6个.”上面两名同学的议论能反映出的统计量是(D)A.平均数和众数 B.众数和极差C.众数和方差 D.中位数和极差2.在“我的阅读生活”校园演讲比赛中,有11名学生参加比赛,他们决赛的最终成绩各不相同,其中一名学生想知道自己能否进入前6名,除了要了解自己的成绩外,还要了解这11名学生成绩的(D)A.众数 B.方差 C.平均数 D.中位数3.下列特征量不能反映一组数据集中趋势的是(C)A.众数 B.中位数 C.方差 D.平均数4.表为甲班55人某次数学小考成绩的统计结果,关于甲班男、女生此次小考成绩的统计量,下列叙述何者正确?(A)A.男生成绩的四分位距大于女生成绩的四分位距B.男生成绩的四分位距小于女生成绩的四分位距C.男生成绩的平均数大于女生成绩的平均数D.男生成绩的平均数小于女生成绩的平均数5.刻画一组数据波动大小的统计量是(B)A.平均数 B.方差 C.众数 D.中位数6.某班要从9名百米跑成绩各不相同的同学中选4名参加4×100米接力赛,而这9名同学只知道自己的成绩,要想让他们知道自己是否入选,老师只需公布他们成绩的(B)A.平均数 B.中位数 C.众数 D.方差7.小颖随机抽样调查本班20名女同学所穿运动鞋尺码,并统计如表:学校附近的商店经理根据表中决定本月多进尺码为23.0cm的女式运动鞋,商店经理的这一决定应用了哪个统计知识(A)A.众数 B.中位数 C.平均数 D.方差8.小洪根据演讲比赛中九位评委所给的分数制作了如下表格:如果去掉一个最高分和一个最低分,那么表格中数据一定不发生变化的是(B)A.平均数 B.中位数 C.众数 D.方差9.以下是期中考试后,班里两位同学的对话:小晖:我们小组成绩是85分的人最多;小聪:我们小组7位同学成绩排在最中间的恰好也是85分以上两位同学的对话反映出的统计量是(D)A.众数和方差 B.平均数和中位数C.众数和平均数 D.众数和中位数10.下列说法不正确的是(A)A.数据0、1、2、3、4、5的平均数是3B.选举中,人们通常最关心的数据是众数C.数据3、5、4、1、2的中位数是3D.甲、乙两组数据的平均数相同,方差分别是S=0.1,S乙²=0.11,则甲组数据比乙组数据更稳定甲²二.填空题11.用于衡量一组数据的波动程度的三个量为极差、方差、标准差.12.有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是中位数(填众数或方差或中位数或平均数)13.某服装店销售一款新式女式T恤,试销期间对该款不同型号女式T恤的销售量统计如下表:该店经理如果想要了解哪种型号女式T恤销售量最大,那么他应关注的统计量是众数.14.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件,对它们的使用寿命进行跟踪调查,结果如下:(单位:年)甲:4,6,6,6,8,9,12,13.乙:3,3,4,7,9,10,11,12.丙:3,4,5,6,8,8,8,10.三个厂家在广告中都称该产品的使用寿命是8年.请根据结果判断,厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲:平均数,乙:中位数,丙:众数.三.解答题15.某校要从八年级甲、乙两个班中各选取10名女同学组成礼仪队,选取的两个班女生的身高如下(单位:cm):甲班:168 167 170 165 168 166 171 168 167 170乙班:165 167 169 170 165 168 170 171 168 167(1)补充完成下面的统计分析表:(2)根据如表,请选择一个合适的统计量作为选择标准,说明哪一个班能被选取.解:(1)甲班的方差=1/10×[(168﹣168)2+(167﹣168)2+(170﹣168)2+…+(170﹣168)2]=3.2;乙班的中位数为168;补全表格如下:(2)选择方差做标准,∵甲班方差<乙班方差,∴甲班可能被选取.16.某酒店共有6名员工,所有员工的工资如下表所示:(1)酒店所有员工的平均月工资是多少元?(2)平均月工资能准确反映该酒店员工工资的一般水平吗?若能,请说明理由;若不能,如何才能较准确地反映该酒店员工工资的一般水平?谈谈你的看法.解:(1)平均月工资=(4000+600+900+500+500+400)÷6=1150(元),(2)∵能达到这个工资水平的只有1人,∴平均月工资不能准确反映该酒店员工工资的一般水平,这组数据的众数是500元,才能较准确地反映该酒店员工工资的一般水平,原因是它符合多数人的工资水平.17.在洋浦一新开业的以经营男式皮鞋为主的鞋店当服务员的阿丽是个做事善于观察的小姑娘,上班一段时间后,她发现各种尺码的男式皮鞋销量并不均衡,于是她把这个发现记录下来交给了她的老板:你认为这个销售记录对老板管理鞋店生意有用吗?如果你认为有用,请说明你的理由,并请你帮这个老板策划一下如何利用这些信息?解:这个销售记录对老板有用,∵众数体现数据的最集中的一点,这样可以确定进货的数量,∴鞋店老板最喜欢的是众数.∴建议老板进货时多进41号的男鞋.18.在八次数学测试中,甲、乙两人的成绩如下:甲:89,93,88,91,94,90,88,87乙:92,90,85,93,95,86,87,92请你从下列角度比较两人成绩的情况,并说明理由:(1)分别计算两人的极差;并说明谁的成绩变化范围大;(2)根据平均数来判断两人的成绩谁优谁次;(3)根据众数来判断两人的成绩谁优谁次;解:(1)甲的极差为:94﹣87=7分乙的极差为:95﹣85=10∴乙的变化范围大;∴乙的变化范围大.89,93,88,91,94,90,88,87 乙:92,90,85,93,95,86,87,92(2)甲的平均数为:(89+93+88+91+94+90+88+87)÷8=90,乙的平均数为:(92+90+85+93+95+86+87+92)÷8=90,∴两人的成绩相当;(3)甲的众数为88,乙的众数为92,∴从众数的角度看乙的成绩稍好;。
数据的分析单元练习题(附答案)数据的分析单元练习题⼀、选择题(每⼩题3分,共36分)1.为了解我校⼋年级800名学⽣期中数学考试情况,从中抽取了200名学⽣的数学成绩进⾏统计.下列判断:①这种调查⽅式是抽样调查;②800名学⽣是总体;③每名学⽣的期中考试数学成绩是个体;④200名学⽣是总体的⼀个样本;⑤200名学⽣是样本容量.其中正确的判断有()A.1个B.2个C.3个D.4个2.天⽓预报报道宜春市今天最⾼⽓温34℃,最低⽓温20℃,则今天宜春市⽓温的极差是() A.54℃ B.14℃ C.-14℃ D.-62℃3.⼀次数学测试后,随机抽取了⼋(⼀)班6名学⽣的成绩:80,85,86,88,88,95。
关于这组数据的说法中错误的是() A.极差是15 B.众数是88 C.中位数是86 D.平均数是874.⼈数相同的⼋年级甲、⼄两班学⽣在同⼀次数学单元测试,班级平均分和⽅差如下:80x x ==⼄甲,2240s =甲,2180s =⼄,则成绩较为稳定的班级是()A.甲班B.⼄班C.两班成绩⼀样稳定D.⽆法确定 5.某地连续9天的最⾼⽓温统计如下:这组数据的中位数和众数别是()A.24,25B.24.5,25C.25,24D.23.5,246.在学校对学⽣进⾏的晨检体温测量中,学⽣甲连续10天的体温与36℃的上下波动数据为0.2,0.3,0.1,0.1,0,0.2,0.1,0.1,0, 0.1,则在这10天中该学⽣的体温波动数据中不正确的是() A.平均数为0.12 B.众数为0.1 C.中位数为0.1 D. ⽅差为0.027.体育课上,⼋(1)班两个组各10⼈参加⽴定跳远,要判断哪⼀组成绩⽐较整齐,通常需要知道这两个组⽴定跳远成绩的()A .平均数 B.众数 C .⽅差 D .频率分布8.甲、⼄、丙、丁四⼈的数学测验成绩分别为90分、90分、x 分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是()A.100分B.95分C.90分D.85分 9.已知⼀组数据1、2、y 的平均数为4,那么()A.y=7B.y=8C.y=9D.y=1010.已知⼋年级四班全班35⼈⾝⾼的平均数与中位数都是160厘⽶,但后来发现其中有⼀位同学的⾝⾼登记错误,误将160厘⽶写成166厘⽶,正确的平均数为a 厘⽶,中位数为b 厘⽶。
五年级数据分析练习题数据分析练习题一、选择题1. 下列数据中,哪组数据的平均值最大?A. 2, 4, 6, 8, 10B. 3, 5, 8, 9, 12C. 4, 6, 7, 9, 11D. 1, 3, 5, 7, 92. 小明记录了一周每天的步数,结果为:6000, 8000, 9000, 7500, 7000, 10000, 8500。
小明这周的平均步数是多少?A. 8000B. 7600C. 8500D. 72003. 以下是小明班级同学的数学考试成绩:85, 90, 75, 91, 80, 88, 92, 86, 89。
请问成绩位于70~80分之间的有几位同学?A. 2B. 3C. 4D. 5二、填空题1. 小明在一款游戏中击败对手的次数分别是8次,5次,6次,7次,9次。
请计算小明击败对手的平均次数______次。
2. 以下是小红记录的每天学习时间(单位:小时):2, 3, 4, 5, 6。
请计算小红这五天的学习总时间______小时。
三、解答题1. 小明参加了一场马拉松比赛,他每公里的用时如下:1公里:5分钟2公里:4分钟3公里:6分钟4公里:5分钟5公里:6分钟请根据以上数据,计算小明完成10公里马拉松的总用时。
2. 以下是小李某个月的体重记录(单位:kg):周一:60周二:61周三:59周四:58周五:57周六:58周日:59请利用该数据,回答以下问题:a) 该周的平均体重是多少?b) 该周的最大值和最小值分别是多少?c) 该周的体重变化情况是如何的?以上是五年级数据分析的练习题,希望能够帮助学生加深对数据分析的理解和应用能力。
第1章 习 题一、习题1。
1解:(1)利用题目中的数据,通过SAS 系统proc univariate 过程计算得到:139.0=x 7.06387S =49.898312=S 0.142众数=51.0g 1-= 08192.5=CV126129.0g 2-=由得到的数据特征可知道,偏度为负,所以呈做偏态,峰度为负,所以均值两侧的极端值较少。
(2) 139.0=M31.0=R0.135Q 1= 5.144Q 3= 5.9R 131=-=Q Q375.139412141M 31=++=∧Q M Q (3) 通过SAS 系统proc capability 得到直方图,并拟合正态分布曲线:(4) 通过SAS 系统proc univariate 可以画出茎叶图,从茎叶图可以看出数据大致呈对称分布,由于所给数据都是整数,所以叶所代表的小位数都是0。
(5) 通过SAS 系统proc univariate 过程计算得到:0.971571W 0=00()H p P W W =≤= 0。
1741取0.05=α,因α>=0.1742p ,故不能拒绝0H ,认为样本来自正态总体分布。
通过画QQ图和经验分布曲线和理论分布函数曲线,从图中可以看出QQ图近似的在一条直线上,经验分布曲线的拟合程度也相当好,所以可以进一步说明此样本来自正态总体分布.Normal Line:Mu=139, Sigma=7.0639x 120125130135140145150155正态分位数-3-2-10123二、习题1.27.8574027=x 1.62568785 S =2.642860982=S0.13721437g 1= 20.6898884=CV -1.4238025g 2=由得到的数据特征可知道,偏度为正,所以呈右偏态,峰度为负,所以均值两侧的极端值较少。
(2)7.636800=M 5.03650=R6.5859 Q 1= 9.3717Q 3= 2.78580R 131=-=Q Q809.7412141M 31=++=∧Q M Q (3)通过SAS 系统proc capability 得到直方图,SAS 系统自动将数据分为中值为4.5,5。
九年级数学下册统计与概率的数据分析练习题一、平均数计算题1. 在一个班级里,学生们共有10人,他们的身高(单位:cm)如下:140, 145, 150, 152, 155, 156, 160, 162, 165, 170求这个班级学生的平均身高。
解答:首先将所有的身高相加,得到10人的总身高为 1,495 cm。
然后再将总身高除以人数,即 1,495 ÷ 10 = 149.5 cm。
所以这个班级学生的平均身高为 149.5 cm。
2. 一台车每小时以50公里的速度行驶120公里,然后又以60公里的速度行驶180公里。
求这段时间内车的平均时速。
解答:首先计算车以不同速度行驶的时间。
对于50公里的速度行驶120公里,所需的时间为 120 ÷ 50 = 2.4 小时。
对于60公里的速度行驶180公里,所需的时间为 180 ÷ 60 = 3 小时。
然后计算总共行驶的距离为 120 + 180 = 300 公里。
最后将总时间除以总距离,即 (2.4 + 3) ÷300 = 1.8 小时/公里。
所以这段时间内车的平均时速为 1.8 小时/公里。
二、中位数计算题3. 已知一组数为:3, 5, 6, 9, 12, 15, 17。
求这组数的中位数。
解答:首先将这组数按从小到大的顺序排列:3, 5, 6, 9, 12, 15, 17。
根据数据个数为奇数,中位数是数列排序后从中间位置找到的数,所以这组数的中位数为 9。
4. 已知一组数为:8, 7, 5, 11, 15, 9, 12, 10。
求这组数的中位数。
解答:首先将这组数按从小到大的顺序排列:5, 7, 8, 9, 10, 11, 12, 15。
根据数据个数为偶数,中位数是数列排序后中间两个数的平均值,所以这组数的中位数为 (9 + 10) / 2 = 9.5。
三、众数计算题5. 张三在一个月内进行了10次数学测试,得分如下:85, 92, 88, 92, 90, 92, 87, 85, 90, 92求张三这个月数学测试的众数。
一、选择题1.某校以“我和我的祖国”为主题的演讲比赛中,共有10位评委分别给出某选手的原始评分,在评定该选手成绩时,则从10个原始评分中去掉1个最高分和1个最低分,得到8个有效评分. 8个有效评分与10个原始评分相比,不变的是()A.平均数B.极差C.中位数D.方差2.某市6月份日平均气温统计如图所示,则在日平均气温这组数据中,众数和中位数分别是()A.21,21 B.21,21.5 C.21,22 D.22,223.小亮同学想知道自己的体重在班级中是否属于中等水平,则需了解全班同学体重的()A.平均数B.中位数C.众数D.极差4.近年来,我国持续大面积的雾霾天气让环保和健康问题成为焦点.为进一步普及环保和健康知识,我市某校举行了“建设宜居成都,关注环境保护”的知识竞赛,某班的学生成绩统计如下:成绩(分)60708090100人数4812115则该办学生成绩的众数和中位数分别是()A.70分,80分B.80分,80分C.90分,80分D.80分,90分5.在5轮“中国汉字听写大赛”选拔赛中,甲、乙两位同学的平均分都是90分,甲的成绩方差是15,乙的成绩的方差是3,下列说法正确的是()A.甲的成绩比乙的成绩稳定B.乙的成绩比甲的成绩稳定C.甲、乙两人的成绩一样稳定D.无法确定甲、乙的成绩谁更稳定6.某学习小组的5名同学在一次数学文化节竞赛活动中的成绩分别是:92分,96分,90分,92分,85分,则下列结论正确的是()A.平均数是92 B.中位数是90 C.众数是92 D.极差是77.下图是2019年5月17日至31日某市的空气质量指数趋势图.(说明:空气质量指数为0-50、51-100、101-150分别表示空气质量为优、良、轻度污染) 有如下结论:①在此次统计中,空气质量为优的天数少于轻度污染的天数; ②在此次统计中,空气质量为优良的天数占45; ③20,21,22三日的空气质量指数的方差小于26,27,28三日的空气质量指数的方差. 上述结论中,所有正确结论的序号是( ) A .① B .①③ C .②③ D .①②③ 8.一组数据:3,2,5,3,7,5,x ,它们的众数为5,则x =( ) A .2B .3C .5D .79.下表为某校八年级72位女生在规定时间内的立定投篮数统计, 投进的个数 5 6 7 8 9 10 11 12 13 14 15 人数37610118137142若投篮投进个数的中位数为a ,众数为b ,则+a b 的值为( ) A .20B .21C .22D .2310.在学校举行的“我为祖国献首歌”的合唱比赛中,六位评委给初三某班的评分分别是:87、90、83、87、87、83,这组数据的众数和中位数分别是( ) A .87,87B .87,85C .83,87D .83,8511.下列说法正确的是( )A .中位数就是一组数据中最中间的一个数B . 8. 99,1010,11,,这组数据的众数是9 C .如果123,,,,n x x x x ⋯的平均数是1,那么()()()121110n x x x -+-+⋯+-= D .一组数据的方差是这组数据的极差的平方12.甲、乙两人各射击6次,甲所中的环数是8,5,5,a ,b ,c ,且甲所中的环数的平均数是6,众数是8;乙所中的环数的平均数是6,方差是4.根据以上数据,对甲,乙射击成绩的正确判断是( ) A .甲射击成绩比乙稳定 B .乙射击成绩比甲稳定C .甲,乙射击成绩稳定性相同D .甲、乙射击成绩稳定性无法比较13.下表记录了甲、乙、丙、丁四名同学最近几次数学考试成绩的平均数与方差:要选择一名成绩好且发挥稳定的同学参加数学比赛,应该选择( ) A .甲 B .乙 C .丙 D .丁 14.一组数据3,4,4,5,若添加一个数4,则发生变化的统计量是( )A .平均数B .众数C .中位数D .方差15.某班体育委员记录了第一小组七位同学定点投篮(每人投10次)的情况,投进篮筐的个数为6,9,5,3,4,8,4,这组数据的众数是( ) A .3B .4C .5D .8二、填空题16.某单位要招聘1名英语翻译,对听、说、读、写进行素质测试,小张4项的分数分别为90分、85分、90分、80分.若把听、说、读、写的成绩按3:3:2:2计算,则小张的平均成绩为_____.17.如图是甲、乙两人6次投篮测试(每次投篮10个)成绩的统计图,甲、乙两人测试成绩的方差分别记作2S 甲、2S 乙,则2S 甲____2S 乙.(填“>”,“=”或“<”)18.一组数据4、5、a 、6、8的平均数5x =,则方差2s =________.19.已知一个样本的方差s 2=113[(x 1﹣8)2+(x 2﹣8)2+…+(x 13﹣8)2],那么这个样本的平均数是_____,样本中数据的个数是_____.20.一组数据:1,2,x ,y ,4,6,其中x <y ,中位数是2.5,众数是2.则这组数据的平均数是______;方差是______.21.某班体育委员对本班所有学生一周锻炼时间(单位:小时)进行了统计,绘制了统计图,如图所示,根据统计图提供的信息,下列推断不正确的是__________________ ①该班学生共有44人;②.该班一周锻炼时间为10小时的学生最多;③该班学生一周锻炼时间的中位数是11;④该班学生一周锻炼的平均时间为910111213115++++=小时.22.若5个正整数从小到大排序,其中中位数是4,如果这组数据的唯一众数是5,当这5个正整数的和为最大值时,这组数据的方差为______.23.某样本数据是:2,2,x,3,3,6如果这个样本的众数为2,那么这组数据的方差是______24.李老师为了了解学生的数学周考成绩,在班级随机抽查了10名学生的成绩,其统计数据如下表:分数(单位:分)126132136138142人数14212则这10名学生的数学周考成绩的中位数是________分.25.现有甲、乙两个合唱队队员的平均身高均为170cm,方差分别是2S甲,2S乙,且22S S<甲乙,则两个队的队员的身高较整齐的是______.26.某班一次数学竞赛考试成绩如下表所示,已知全班共有38人,且众数为60分,中位数为70分,则x2-2y=_________.成绩(分)30405060708090100人数235x6y34三、解答题27.在全民读书月活动中,某校随机调查了部分同学,本学期计划购买课外书的费用情况,并将结果绘制成如图所示的统计图.根据相关信息,解答下列问题.(1)这次调查获取的样本容量是.(直接写出结果)(2)这次调查获取的样本数据的众数是,中位数是.(直接写出结果)(3)若该校共有1000名学生,根据样本数据,估计该校本学期计划购买课外书的总花费.28.为了倡导“节约用水,从我做起”的活动,某市政府决定对市直机关500户家庭的用水情况作一次调查,调查小组随机抽查了其中100户家庭一年的月平均用水量(单位:吨).并将调查结果制成了如图所示的条形统计图.(1)这100个样本数据的平均数是、众数是和中位数是;(2)根据样本数据,估计该市直机关500户家庭中月平均用水量不超过12吨的约有多少户?29.受疫情影响,某地无法按原计划正常开学.在延迟开学期间该地区组织了在线教学活动.开学后,某校针对各班在线教学的个性化落实情况,通过初评决定从甲、乙、丙三个班中推荐一个作为在线教学先进班级,下表是这三个班的五项指标的考评得分表(单位:分):根据统计表中的信息解答下列问题:(1)请确定如下的“五项指标的考评得分分析表”中的a、b、c的值:(2)如果学校把“课程设置”、“课程质量”、“在线答疑”、“作业情况”、“学生满意度”这五项指标得分按照2∶2∶3∶1∶2的比例确定最终成绩,请你通过计算判断应推荐哪个班为在线教学先进班级?30.每年夏季全国各地总有未成年人因溺水而丧失生命,令人痛心疾首.今年某校为确保学生安全,开展了“远离溺水•珍爱生命”的防溺水安全知识竞赛.现从该校七、八年级中各随机抽取10名学生的竞赛成绩(百分制)进行整理、描述和分析(成绩得分用x表示,共分成四组:A.80≤x<85,B.85≤x<90,C.90≤x<95,D.95≤x≤100),下面给出了部分信息:七年级10名学生的竞赛成绩是:99,80,99,86,99,96,90,100,89,82;八年级10名学生的竞赛成绩在C组中的数据是:94,90,94.。
八年级数学下册《第二十章数据分析》练习题附答案-人教版一、选择题1.将一组数据中的每一个数减去50后,所得新的一组数据的平均数是2,则原来那组数据的平均数是( )A.50B.52C.48D.22.为鼓励市民珍惜每一滴水,某居委会表扬了100个节约用水模范户,8月份节约用水的情况如下表:每户节水量(单位:吨) 1 1.2 1.5节水户数52 30 18那么,8月份这100户平均节约用水的吨数为(精确到0.01t) ( )A.1.5tB.1.20tC.1.05tD.1t3.某校把学生的纸笔测试、实践能力、成长纪录三项成绩分别按50%、20%•、•30%的比例计入学期总评成绩,90分以上为优秀.甲、乙、•丙三人的各项成绩如下表(单位:分),学期总评成绩优秀的是( )纸笔测试实践能力成长记录甲 90 83 95乙 98 90 95丙 80 88 90A.甲B.乙丙C.甲乙D.甲丙4.某校男子足球队的年龄分布如图所示,则根据图中信息可知这些队员年龄的平均数,中位数分别是( )A.15.5,15.5B.15.5,15C.15,15.5D.15,155.如图所示为根据某市某天七个整点时的气温绘制成的统计图,则这七个整点时气温的中位数和众数分别是( )A.30 ℃,22 ℃B.26 ℃,22 ℃C.28 ℃,22 ℃D.26 ℃,26 ℃6.“保护水资源,节约用水”应成为每个公民的自觉行为.下表是某小区随机抽查到的10户家庭的月用水情况,则下列关于这10户家庭的月用水量说法错误的是( )月用水量(吨) 4 5 6 9户数(户) 3 4 2 1A.中位数是5吨B.众数是5吨C.极差是3吨D.平均数是5.3吨7.已知A组四人的成绩分别为90、60、90、60,B组四人的成绩分别为70、80、80、70,用下列哪个统计知识分析区别两组成绩更恰当( )A.平均数B.中位数C.众数D.方差8.2022年将在北京﹣张家口举办冬季奥运会,很多学校开设了相关的课程.如表记录了某校4名同学短道速滑选拔赛成绩的平均数与方差s2:队员1 队员2 队员3 队员4平均数(秒)51 50 51 50方差s2(秒2) 3.5 3.5 14.5 15.5)A.队员1B.队员2C.队员3D.队员49.甲、乙两班举行电脑汉字输入速度比赛,参赛学生每分钟输入汉字的个数经统计计算后结果如下表:班级参加人数中位数方差平均数甲 55 149 191 135乙 55 151 110 135(1)甲、乙两班学生成绩的平均水平相同;(2)乙班优秀的人数多于甲班优秀的人数;(每分钟输入汉字≥150个为优秀)(3)甲班成绩的波动情况比乙班成绩的波动小上述结论中正确的是( )A.(1)(2)(3)B.(1)(2)C.(1)(3)D.(2)(3)二、填空题10.某日天气预报说今天最高气温为8℃,气温的极差为10℃,则该日最低气温为_____.11.一组数据2,4,a,7,7的平均数x=5,则方差s2=.12.某计算机程序第一次算得m个数据的平均数为x,第二次算得另外n个数据的平均数为y,则这m+n个数据的平均数等于 .13.一家公司打算招聘一名英文翻译,对甲、乙两名应试者进行了听、说、读、写的英语水平测试,他们各项的成绩(百分制)如下:应试者听说读写甲85 83 78 75乙73 80 85 82如果这家公司想招一名口语能力较强的翻译,听、说、读、写成绩按照3∶3∶2∶2的比确定,则甲的得分为,乙的得分为,应该录取 .14.春节期间,重庆某著名旅游景点成为热门景点,大量游客慕名前往,市旅游局统计了春节期间5天的游客数量,绘制了如图所示的折线统计图,则这五天游客数量的中位数为.15.将5个整数从大到小排列,中位数是4;如果这个样本中的惟一众数是6,则这5个整数可能的最大的和是_____.三、解答题16.饮料店为了了解本店罐装饮料上半年的销售情况,随机调查了8天该种饮料的日销售量,结果如下(单位:听):33,32,28,32,25,24,31,35.(1)这8天的平均日销售量是多少听?(2)根据上面的计算结果,估计上半年(按181天计算)该店能销售这种饮料多少听?17.某公司招聘人才,对应聘者分别进行了阅读能力、思维能力和表达能力三项测试,其中甲、乙两人的测试成绩(百分制)如下表:(单位:分)(1)若根据三项测试的平均成绩在甲、乙两人中录用一人,那么谁将被录用?(2)若将阅读能力、思维能力和表达能力三项测试得分按1:3:1的比确定每人的最后成绩,谁将被录用?18.某中学对全校学生60秒跳绳的次数进行了统计,全校学生60秒跳绳的平均次数是100次,某班体育委员统计了全班50名学生60秒跳绳的成绩,列出的频数分布直方图如图所示(每个分组包括左端点,不包括右端点).(1)该班学生60秒跳绳的平均次数至少是多少?是否超过全校平均次数?(2)该班一个学生说:“我的跳绳成绩在我班是中位数.”请你给出该生跳绳成绩所在的范围.19.某校举办“校园唱红歌”比赛,选出10名同学担任评委,并事先拟定从如下四种方案中选择合理的方案来确定演唱者的最后得分(每个评委打分最高为10分).方案一:所有评委给分的平均分;方案二:在所有评委中,去掉一个最高分和一个最低分,再计算剩余评委的平均分;方案三:所有评委给分的中位数;方案四:所有评委给分的众数.为了探究上述方案的合理性,先对某个同学的演唱成绩进行统计实验,下图是这个同学的得分统计图:(1)分别按上述四种方案计算这个同学演唱的最后得分.(2)根据(1)中的结果,请用统计的知识说明哪些方案不适合用来确定这个同学演唱的最后得分?20.某中学的国旗护卫队需从甲、乙两队中选择一队身高比较整齐的队员担任护旗手,每队中每个队员的身高(单位:cm)如下表及图1所示:甲队178 177 179 179 178 178 177 178 177 179图1分析数据:两组样本数据的平均数、中位数、众数、方差如表所示:整理、描述数据:平均数中位数众数方差甲队178 178 b 0.6乙队178 a 178 c=,=,=;(2)根据表格中的数据,你认为选择哪个队比较好?请说明理由.21.今年五一旅游黄金周期间,某旅游区的开放时间为每天10小时,并每小时对进入旅游区的游客人数进行一次统计,下表是5月2日对进入旅游区人数的7次抽样统计数据.记数的次数第1次第2次第3次第4次第5次第6次第7次每小时进入旅游区的人318 310 310 286 280 312 284 数(1)(2)若旅游区的门票为60元/张,则5月2日这一天门票收入是多少?(3)据统计,5月1日至5月5日,每天进入旅游区的人数相同,5月6日和5月7日这两天进入旅游区的人数分别比前一天减少10%和20%,那么从5月1日至5月7日旅游区门票收入是多少?22.某年级共有150名女生,为了解该年级女生实心球成绩(单位:米)和一分钟仰卧起坐成绩(单位:个)的情况,从中随机抽取30名女生进行测试,获得了他们的相关成绩,并对数据进行整理、描述和分析.下面给出了部分信息.a.实心球成绩的频数分布如表所示:分组 6.2≤x<6.6 6.6≤x<7.07.0≤x<7.47.4≤x<7.87.8≤x<8.28.2≤x<8.6频数 2 m 10 6 2 1b.实心球成绩在7.0≤x<7.4这一组的是:7.0,7.0,7.0,7.1,7.1,7.1,7.2,7.2,7.3,7.3c.一分钟仰卧起坐成绩如图所示:根据以上信息,回答下列问题:(1)①表中m的值为;②一分钟仰卧起坐成绩的中位数为;(2)若实心球成绩达到7.2米及以上时,成绩记为优秀.①请估计全年级女生实心球成绩达到优秀的人数;②该年级某班体育委员将本班在这次抽样测试中被抽取的8名女生的两项成绩的数据抄录如表所示:女生代码A B C D E F G H实心球8.1 7.7 7.5 7.5 7.3 7.2 7.0 6.5一分钟仰卧起坐* 42 47 * 47 52 * 49其中有3名女生的一分钟仰卧起坐成绩未抄录完整,但老师说这8名女生中恰好有4人两项测试成绩都达到了优秀,于是体育委员推测女生E的一分钟仰卧起坐成绩达到了优秀,你同意体育委员的说法吗?并说明你的理由.参考答案1.【答案】B2.【答案】C3.【答案】C4.【答案】D.5.【答案】B6.【答案】C7.【答案】D.8.【答案】B9.【答案】B. 10.【答案】﹣2•℃ 11.【答案】3.6. 12.【答案】mx +nym +n13.【答案】81,79.3,甲 14.【答案】23.4. 15.【答案】21,20.16.【答案】解:(1)18×(33+32+28+32+25+24+31+35)=30(听).(2)181×30=5 430(听). 17.【答案】解:(1)∵=(85+90+80)÷3=85(分),=(95+80+95)÷3=90(分)∴<,∴乙将被录用;(2)根据题意得:==87(分),==86(分);∴>,∴甲将被录用.18.【答案】解:(1)该班学生60秒跳绳的平均次数至少是:(60×4+80×13+100×19+120×7+140×5+160×2)÷50=100.8(次). 因为100.8>100 所以超过全校平均次数.(2)这个学生的跳绳成绩在该班是中位数由4+13+19=36,可知该生跳绳成绩一定在100~120次范围内.19.【答案】解:(1)方案一最后得分为110(3.2+7.0+7.8+3×8+3×8.4+9.8)=7.7(分);方案二最后得分为18(7.0+7.8+3×8+3×8.4)=8(分);方案三最后得分为8分;方案四最后得分为8分或8.4分.(2)因为方案一中的平均数受极端数值的影响,不能反映这组数据的“平均水平”,所以方案一不适合用来确定最后得分.因为方案四中的众数有两个,众数失去了实际意义所以方案四也不适合用来确定最后得分.20.解:(1)乙队共10名队员,中位数落在第3组,为178,即a=178;甲队178出现的次数最多,故众数为178,即b=178;c=110×[(176﹣178)2×2+(177﹣178)2+(178﹣178)2×4+(179﹣178)2+(180﹣178)2×2]=1.8;(2)选甲队好.∵甲队的方差为0.6,乙队的方差为1.8∴甲队的方差小于乙队的方差∴甲队的身高比乙队整齐,故选甲队比较好.21.【答案】解:(1)=17(318+310+310+286+280+312+284)=300(人);(2)300×10×60=180 000(元);(3)5月1日至5月5日每天进入旅游区的人数为300×10=3 000(人);5月6日进入旅游区的人数为3 000×90%=2 700(人);5月7日进入旅游区的人数为2 700×80%=2 160(人);5月1日至5月7日进入旅游区的人数共为3 000×5+2 700+2 160=19 860(人);门票收入为19 860×60=1 191 600(元)22.【答案】解:(1)①m=30﹣2﹣10﹣6﹣2﹣1=9,故答案为:9;②由条形统计图可得,一分钟仰卧起坐成绩的中位数为45,故答案为:45;(2)①∵实心球成绩在7.0≤x<7.4这一组的是:7.0,7.0,7.0,7.1,7.1,7.1,7.2,7.2,7.3,7.3∴实心球成绩在7.0≤x<7.4这一组优秀的有4人∴全年级女生实心球成绩达到优秀的人数是:65答:全年级女生实心球成绩达到优秀的有65人;②同意理由:如果女生E的仰卧起坐成绩未到达优秀,那么只有A、D、F有可能两项测试成绩都达到优秀,这与恰有4个人两项成绩都达到优秀,矛盾,因此,女生E的一分钟仰卧起坐成绩达到了优秀.。
数据分析练习题一、填空题1,从一组数据中取出m个x1,n个x2,p个x3组成一个数据样本,则这个样本的平均数为2.数据1,x,2,5的中位数是3,则x=3.甲、乙两人在相同情况下各射靶10次,环数的方差分别是s=1.4,s=1.2,则射击稳定性高的是4.某中学举行一次演讲比赛,分段统计参赛学生的成绩如下表(分数为整数,满分为100分),则这次比赛的平均成绩为分。
5,若x、x2、3的方差为4,则2n+3,2x2+3,2r3+3的方差为二、选择题6,若x,y,z的平均数是6,则5x+3,5y-2,5z+5的平均数是().(A)6(B)30(C)33(D)327.从某市5000名初一学生中,随机地抽取100名学生,测得他们的身高数据,得到一个样本,则这个样本数据的平均数、中位数、众数、方差四个统计量中,服装厂最感兴趣的是().(A)平均数,(B)中位数(C)众数(D)方差8,小明对本班同学每天花多少零用钱进行了调查,计算出平均数为3,中位数为3,众数为2,极差为8,假如老师随机问一名同学每天花多少零用钱,最有可能得到的回答是().(A)3(B)2(C)8(D)不能确定9,已知x1,x2,?,X1o的平均数是a;x11,x12,.,x30的平均数是b,则x1,x2,,x30的平均数是().(A)-(a+ b)(B)-(a + b))(C)(10a + 20b)(D)(10a + 30b)304010.甲乙两人在跳远练习中,6次成绩分别为(单位:米):甲:3.8 3.8 3.9 3.9 4 4;乙:3.8 3.9 3.9 3.9 3.9 4.则这次跳远练习中,甲乙两人成绩方差的大小关系是()(B)s <s(D)无法确定三、解答题11.某农户在山上种了脐橙果树44株,现进入第三年收获期,收获时,先随意采摘5株果树上的脐橙,称得每株树上的脐橙重量如下(单位:千克):35,35,34,39,37,若市场上的脐橙售价为每千克5元,估计这年该农户卖脐橙的收入为多少元?12.如图,是某单位职工年龄的频数分布直方图,根据图形提供的信息,回答下列问题:(1)该单位职工的平均年龄为多少?(2)该单位职工在哪个年龄段的人数最多?(3)该单位职工年龄的中位数在哪个年龄段内?13.学期末,某班评选一名优秀学生干部,下表是班长、学习委员和团支部书记的得分情况假设在评选优秀干部时,思想表现、学习成绩、工作能力这三方面的重要比为3:3:4,通过计算说明谁应当选为优秀学生干部。
数据分析及应用习题库(附答案)一、单选题(共40题,每题1分,共40分)1、Python语言属于()。
A、A 机器语言B、B 汇编语言C、C 高级语言D、D 科学计算语言正确答案:C2、以下代码执行的输出结果为:()import numpy as np arr = np.array([1, 3, 5, 7]) print(arr[2] + arr[3])A、A 8B、B 12C、C 5D、D 13正确答案:B3、对于j=10,for i in range(j)循环内执行语句j-=1,那么该循环将执行(?)次。
A、A 10B、B 7C、C 6D、D 程序报错正确答案:A4、The correct syntax to add the labels ""x"", ""y"", and ""z"" to a Pandas Series:() import pandas as pdA、A pd.DataFrame([12","13","14"],index = ["x", "y", "z"])"B、B pd.List([12","13","14"],index = ["x", "y", "z"])"C、C pd.Series([12","13","14"],index = ["x", "y", "z"])"D、D df=pd.Series([12","13","14"],dict= ["x", "y", "z"])"正确答案:C5、将一颗骰子投掷两次,依次记录点数,两数之差绝对值为1的概率()A、A 0.1B、B 0.2C、C 0.3D、D 0.4正确答案:A6、网络报文记录及分析装置告警信息可以按照多种方式进行分类,其中不包含下列哪种方式()A、A 网络B、B IEDC、C 时间段D、D 模型正确答案:D7、假设有命令(P)import numpy as np bArray = np.array([[1,2,3],[4,5,6]])则,bArray.ndim的结果是A、A 逻辑覆盖法B、B 等价类划分C、C 边界值分析D、D 功能图法正确答案:A8、随机变量X、Y的协方差,记为Cov(X,Y)=(?)。
初中数学数据分析练习题和答案1. 某班级共有40名学生,他们参加了一次数学考试。
以下是每个学生的得分情况(满分100分):75, 83, 92, 68, 77, 85, 90, 73, 89, 78, 82, 87, 95, 62, 80, 84, 91, 79, 72, 88, 76, 81, 86, 94, 70,69, 74, 93, 71, 67, 75, 83, 92, 68, 77, 85, 90, 73, 89, 78, 82请根据以上数据回答以下问题:解答:1) 求全班学生的平均分数。
解析:要求全班学生的平均分数,需要将每个学生的得分相加,再除以学生总数。
75 + 83 + 92 + 68 + 77 + 85 + 90 + 73 + 89 + 78 + 82 + 87 + 95 + 62 + 80 + 84 + 91 + 79 + 72 + 88 + 76 + 81 + 86 + 94 + 70 +69 + 74 + 93 + 71 + 67 + 75 + 83 + 92 + 68 + 77 + 85 + 90 + 73 + 89 + 78 + 82 = 3024全班学生的平均分数为:3024 / 40 = 75.6分2) 求全班学生中的最高分和最低分。
解析:要求全班学生中的最高分和最低分,需要找出最大值和最小值。
最高分为:95分最低分为:62分3) 求全班学生中得分在80分以上的人数。
解析:要求得分在80分以上的人数,需要统计得分大于等于80分的学生人数。
得分大于等于80分的学生有:83, 92, 85, 90, 89, 82, 87, 95, 80, 84, 91, 88, 81, 86, 94, 83, 92, 85, 90, 89, 82。
得分在80分以上的人数为:21人4) 绘制全班学生成绩的频率分布直方图。
解析:为更好地展示全班学生成绩的分布情况,可以通过绘制频率分布直方图来呈现。
数据分析解答题练习1.市体育局对甲、乙两运动队的某体育项目进行测试,两队人数相等,测试后统计队员的成绩分别为:7分、8分、9分、10分(满分为10分).依据测试成绩学校进行了收集和整理,其中部分信息如下:信息一:甲队成绩统计表成绩7分8分9分10分人数101m7信息二:请根据以上信息,解答下列问题:(1)求m的值和扇形圆心角α的度数;(2)补全乙队成绩条形统计图;(3)请从中位数和平均数的角度分析哪个运动队的成绩较好.2.2021年是中国共产党成立100周年.为普及党史知识,培养爱国主义精神,今年五月份,某市党校举行党史知识竞赛,每个班级各选派15名学员参加了网上测试,现对甲、乙两班学员的分数进行整理分析如下:甲班15名学员测试成绩(满分100分)统计如下:87,84,88,76,93,87,73,98,86,87,79,85,84,85,98.乙班15名学员测试成绩(满分100分)统计如下:77,88,92,85,76,90,76,91,88,81,85,88,98,86,89(1)按如表分数段整理两班测试成绩班级70.5~75.575.5~80.580.5~85.585.5~90.590.5~95.595.5~100.5甲12a512乙033621表中a=;(2)补全甲班15名学员测试成绩的频数分布直方图;(3)两班测试成绩的平均数、众数、中位数、方差如表所示:班级平均数众数中位数方差甲86x8644.8乙8688y36.7表中x=,y=.(4)以上两个班级学员掌握党史相关知识的整体水平较好的是班;3.某校八年级举办的数学学科知识竞赛,总体成绩取得前两名的一班和二班参加的人数相等,比赛结束后,学生的成绩都为7分或8分或9分或10分(满分10分).依据统计数据绘制了如图所示的不完整的统计图表.一班成绩统计表:分数7分8分9分10分人数1108(1)在图①中,“7分”所在扇形的圆心角等于°;(2)将一班成绩统计表和二班成绩条形统计图补充完整;(3)经计算,二班的平均分是8.3分,中位数是8分,请写出一班的平均分、中位数;并从平均分和中位数的角度分析哪个班级成绩较好;(4)如果该校所要组织8人的代表队参加该地区班级团体赛,这8人从参与学校这次竞赛的学生中选派,应选择哪个班级参加?并说明理由.4.市团委举办以“我的中国梦”为主题的知识竞赛,甲、乙两所学校参赛人数相等,比赛结束后,发现学生成绩分别为70分、80分、90分、100分,并根据统计数据绘制了如下不完整的统计图表.甲校成绩扇形图①甲校成绩条形图②乙校成绩统计表③分数人数707809011008(1)在图①中,“80分”所在扇形的圆心角度数为.(2)请将图②补充完整.(3)经计算乙校的平均分是85分,中位数是80分,请写出甲校的平均分、中位数;并从平均分和中位数的角度分析哪个学校的成绩较好?5.某中学开展演讲比赛活动,九(1)班、九(2)班根据初赛成绩各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩(满分为100分)如图所示.(1)根据图填写如表:平均数/分中位数/分众数/分九(1)班8585九(2)班80(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好.(3)结合两班复赛成绩的方差,看哪个班这五名选手的成绩比较稳定.(4)如果在每班参加复赛的选手中分别选出2人参加决赛,你认为哪个班的实力更强一些?6.某校为了进一步倡导文明健康绿色环保生活方式,提高学生节能、绿色、环保、低碳意识,举办了“低碳生活,绿色出行”知识竞赛.每班选10名代表参加比赛,随机抽取2个班,记为甲班,乙班,现收集这两个班参赛学生的成绩如下:【收集数据】甲班808590969790901009993乙班878992959292859296100【分析数据】众数中位数平均数方差统计量班级甲班a b9236乙班9292c17.2【应用数据】(1)根据以上信息,填空:a=,b=,c=;(2)参赛学生人数为600人,若规定竞赛成绩90分及以上为优秀,请你根据以上数据,估计参加这次知识竞赛成绩优秀的学生有多少人?(3)结合以上数据,选择适当的统计量分析这两个班级中哪个班级成绩较好?7.2024年某市体育与健康评价考试执行新标准.男生体育基础体能考试分为必考项目(1000米)和选考项目(5选2)两部分.其中5项选考项目分别为:①投掷实心球;②引体向上;③立定跳远;④1分钟跳绳;⑤50米跑.对于选考项目(5选2),小明同学决定先选择1分钟跳绳作为第一项,再从立定跳远和50米跑中选择一项,作为第二项.为了选择体育基础体能考试的最佳选考项目,小明记录下最近连续10次立定跳远和50米跑的试测成绩,进行整理、描述和分析,部分信息如下:【数据收集与整理】信息一:50米跑试测成绩(单位:分)依次是85 80 95 85 95 90 95 95 95 100.信息二:立定跳远试测成绩中,80分与85分的次数相同,90分共4次.【数据描述】【数据分析】平均数中位数众数方差50米跑成绩91.595a35.25立定跳远成绩91.5b9035.25根据以上信息,解答下列问题:(1)填空:m=,a=,b=;(2)为了在体育考试中取得更好的成绩,你认为小明应该如何选择?请说明理由.8.某校举办国学知识竞赛,设定满分10分,学生得分均为整数.在初赛中,甲、乙两组(每组10人)学生成绩如下:(单位:分)甲组:5,6,6,6,6,6,7,9,9,10.乙组:5,6,6,6,7,7,7,7,9,10.组别平均数中位数众数方差甲组7a6 3.76乙组b7c(1)以上成绩统计分析表中a=,b=,c=;(2)小明同学说:“这次竞赛我得了7分,在我们小组中属中游略偏上!”观察上面表格判断,小明可能是组的学生;(3)从平均数和方差看,若从甲乙两组学生中选择一个组参加决赛,应选哪个组?并说明理由.12.2021年12月4日是第八个国家宪法日.甲、乙两班各选派5名学生参加学校宪法知识竞赛(满分100分),成绩如下:甲班:96,92,94,97,96;乙班:90,98,97,98,92.通过数据分析,列表如下:班级平均分中位数众数方差甲班95a96c乙班9597b11.2(1)a=,b=,c=;(2)从平均数和方差的角度分析,你认为选哪个班的学生参加比赛更合适?为什么?。
E X 1-0
设来自样本观测值如下表:
T EX1-1 某小学10名11岁学生的身高(单位:cm)数据如下: (1) 计算均值、方差、标准差、变异系数、偏度、峰度; (2) 计算中位数、上、下四分位数、四分位极差、三均数; (3) 作出直方图(范围130~145,a i-1≤x<a i ,间距3个单位); (4) 作出茎叶图;
(5) 写出次序统计量)()2()1(,...,,n x x x ;
(6) 进行正态性W 检验(适合与小样本3<=n<=50)。
需要计算)()1(i i n i x x d -=-+,试写出i d (其中,当n 为偶
数时,21n k i =≤≤;当n 为奇数时,2
11-=≤≤n k i ) 解:(1)
均值:∑==
n
i i
x
n
x 1
1;
方差:21
2
)(1
1
∑=--=
n
i i
x x
n s ;标准差2s s =;
变异系数:(%)100x
s
CV ⨯=;
偏度:∑=---=
n
i i
x x
s n n n g 1
33
1)(1
)2)(1(;
峰度:)
3)(2()1(3)(1
)3)(2)(1()1(3
1
4
4
2--------+=
∑
=n n n x x s n n n n n g n
i i 。
(2)
中位数:⎪⎩⎪
⎨⎧+=++是整数
不是整数
np x x np x M np np np )(2
1
,)1()()1]([;
上、下四分位数:75.03M Q =,25.01M Q =; 四分位极差:131Q Q R -=;
三均数:314
1
2141ˆQ M Q M
++=。
EX1-4 2002年11月以及1至11月全国部分省、市、区财政预算收入数据如表1.4所示(单位:亿元)。
设X 1为11月预算收入,X 2为1至11月预算收入,分别对X 1,X 2的观测值计算:
(7) X 1,X 2的观测值的Pearson 相关系数Spearman 相关系数。
Pearson 相关系数:yy
xx
xy xy s s s r =
其中∑=--=
n
i i
xx
x x
n s 1
2
)(1
1,∑=--=
n
i i
yy
y y
n s 1
2
)(1
1,21
2)()(1
1y y x x
n s i n
i i
xy
---=
∑=。
Spearman 相关系数:∑
∑
∑===----=
n
i i n i i n
i i i xy S S R R S S R R q 1
2
1
2
1
)()()
)((,
其中n R R R ,...,,21为n x x x ,...,,21的秩统计量,n S S S ,...,,21为n y y y ,...,,21的秩统计量。
例2-1,2-2 对于只有一个自变量的线性回归模型εββ++=110X Y ,利用观测值),...,2,1(),(n i x y i i =
(1)求β0,β1的最小二乘估计及)(2εσVar =的估计,其中x i 不完全相同。
(2)当回归模型为εβ+=X Y 时,它的最小二乘估计β
ˆ是否为β的无偏估计? (3)求X 的一个新观测值x 0处因变量Y 预测值y 0的置信度区间。
(4)求置信区间长度最小的x 0取值? 解:
(1)参考书中例2-1
由Y X X X T T T p 11
10)()ˆ,...,ˆ,ˆ(ˆ--==ββββ可得 ∑
∑
∑
===--=n i i n
i n
i i
i i x x y x x
x y
1
2
1
120
)
(ˆβ,∑
∑==--=n
i i n
i i i x x y x n y x 1
2
11
)
(ˆβ
(2)
由回归模型)1(ε
β+=X Y
其中⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n εεεε...21⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎣⎡=n x x x X (2)
1,⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n y y y Y (21)
0)(2)
(1
=--=∑
=n
i i i i x x y d dS ββ
β,即
∑
∑
===n
i i n
i i i x x y 1
21
β
设x i 不全为0,则最小二乘估计β
ˆ是∑
∑
=-==n
i i i n
i i x y x 1
1
1
2)(ˆβ
因为
02
)(1
22
2>=∑
=n
i i x d S d β
β故β
ˆ确实是)(βS 的最小值点。
由(1)X Y E β=)(
所以,它的最小二乘估计β
ˆ是β的无偏估计。
(3)参考书中的例2-2 对于给定置信水平α,由
)(]
)(1[ˆ01
00p n t x X X x MSE y y
T
T
-+-- 式,可得Y 在),...,,(1,00201-p x x x 处取值y 0的置信度为1-α的置信区间为
所以新观测值处取值y 0的置信度为1-α的置信区间为: 其中,∑
=---=
-=n
i i i x y n n SSE MSE 12
10)ˆˆ(2
1
)2/(ββ。
∑==n
i i
x
n
x 1
1。
(4)由上式可知,置信区间的长度在x 0=x 时达到最小,为
]1
1[)2(ˆ2/10n
MSE n t y
+-±-α。