2017届高考数学大一轮总复习 10.2 统计图表、数据的数字特征、用样本估计总体课件 理
- 格式:ppt
- 大小:3.10 MB
- 文档页数:45
第三节 统计图表、数据的数字特征、用样本估计总体1.频率分布直方图频率分布直方图由一些小矩形来表示,每个小矩形的宽度为!!! Δx i ###,高为!!! f iΔx i###,小矩形的面积恰为相应的__频率f i __,图中所有小矩形的面积之和为__1__. 作频率分布直方图的步骤⎩⎪⎨⎪⎧(1)求极差(即一组数据中!!! 最大值 ###与!!! 最小值 ###的差)(2)决定!!! 组距 ###与!!! 组数 ###(3)将数据!!! 分组 ###(4)列!!! 频率分布表 ###(5)画!!! 频率分布直方图 ###2.频率折线图(1)定义:在频率分布直方图中,按照分组原则,再在__左边__和__右边__各加一个区间.从所加的左边区间的__中点__开始,用线段依次连接各个矩形的__顶端中点__,直至右边所加区间的__中点__,就可以得到一条折线,我们称之为频率折线图.(2)作用:可以用它来估计__总体的分布__情况. 3.茎叶图(1)茎叶图表示数据的优点①茎叶图上__没有数据__的损失,所有的__数据__都可以从这个茎叶图中得到. ②茎叶图可以随时记录,方便__比较__. (2)茎叶图表示数据的缺点当数据量很大或有多组数据时,茎叶图就不那么直观清晰了. 4.数据的数字特征(1)众数、中位数、平均数①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. ②方差:标准差的平方s 2s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x i (i =1,2,3,…,n )是__样本数据__,n是__样本容量__,x -是__样本平均数__.提醒:1.辨明两个易误点(1)易忽视频率分布直方图中纵轴表示的应为频率组距.(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.2.标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.1.判断下列结论的正误(正确的打“√”,错误的打“×”) (1)在频率分布直方图中,小矩形的高表示频率. ( )(2)频率分布直方图中各个长方形的面积之和为1.( )(3)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( ) (5)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ) (6)一组数据的方差越大,说明这组数据的波动越大.( ) 答案:(1)× (2)√ (3)× (4)√ (5)× (6)√2.(教材习题改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( ),A .91.5和91.5B .91.5和92,C .91和91.5D .92和92解析:选A 这组数据由小到大排列为87,89,90,91,92,93,94,96.∴中位数是91+922=91.5,,平均数x -=87+89+90+91+92+93+94+968=91.5.3.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A .30辆B .40辆C .60辆D .80辆解析:选B 从频率分布直方图可知:速度大于或等于70 km/h 的频率为0.02×10=0.2,而汽车总量为200辆,所以被处罚的汽车约有200×0.2=40辆.4.某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为____________; (2)命中环数的标准差为____________解析:(1)x -=7+8+7+9+5+4+9+10+7+410=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s =2. 答案:(1)7 (2)2茎叶图 [明技法]由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.[提能力]【典例】 (1)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x ,y 的值分别为( )A .7,8B .5,7C .8,5D . 7,7解析:选D 甲的中位数为17, 故y =7,,乙的平均数为3×10+20+(9+6+6+x +9)5=17.4,,解得x =7.(2)(2017·山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C.3,7 D.5,7解析:选A甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.[刷好题]1.重庆市2017年各月的平均气温(℃)数据的茎叶图如下:,则这组数据的中位数是()A.19 B.20C.21.5 D.23解析:选B从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,选B.2.某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为________.,解析:由甲班学生成绩的众数是85,知x=5,由乙班学生成绩的中位数是83,得y=3.所以x+y=8.答案:8频率分布直方图[明技法](1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.[提能力]【典例】(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,,所以样本中分数小于70的频率为1-0.6=0.4,,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,,分数在区间[40,50)内的人数为100-100×0.9-5=5,,所以总体中分数在区间[40,50)内的人数估计为400×5=20.100(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,,所以=30,,所以样本中的男生人数为30×2=60,,女样本中分数不小于70的男生人数为60×12生人数为100-60=40,,所以样本中男生和女生人数的比例为60∶40=3∶2,,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2.[刷好题]1.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为______.解析:最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.答案:92.(2015·全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.,,图①,B地区用户满意度评分的频数分布表(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).,图②(2)根据用户满意度评分,将用户的满意度分为三个等级:解:(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.,记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.,由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.,所以A 地区用户的满意度等级为不满意的概率大.样本的数字特征[刷好题]用样本的数字特征估计总体涉及到的量有频数、频率、平均数、标准差、众数、中位数、极差等. 其中高考考查较多的是频率、平均数和方差.三种题型均有可能出现,难度不大,为中低档.[提能力]命题点1:样本的数字特征与直方图交汇【典例1】甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差,D .甲的成绩的极差小于乙的成绩的极差解析:选C 甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325=125,故选C .命题点2:样本的数字特征与茎叶图交汇【典例2】 为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:,①甲地该月14时的平均气温低于乙地该月14时的平均气温;,②甲地该月14时的平均气温高于乙地该月14时的平均气温;,③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;,④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.,其中根据茎叶图能得到的统计结论的编号为( )A .①③B .①④C .②③D .②④解析:选B 方法一 ∵x 甲=26+28+29+31+315=29,,x乙=28+29+30+31+325=30,∴x -甲<x -乙,,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.,方法二 甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B .,命题点3:样本的数字特征与优化决策问题【典例3】 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):,,.解析:x甲=x乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定. 答案:甲 [刷好题]1.若数据x 1,x 2,x 3,…,x n 的平均数为x -=5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( )A .5,2B .16,2C .16,18D .16,9解析:选C ∵x 1,x 2,x 3,…,x n 的平均数为5, ∴x 1+x 2+x 3+…+x n n=5,∴3x 1+3x 2+3x 3+…+3x n n +1=3×5+1=16,,∵x 1,x 2,x 3,…,x n 的方差为2,∴3x 1+1,3x 2+1,3x 3+1,…,3x n +1的方差是32×2=18.故选C .2.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早 7 点至晚 8 点甲、乙两个监测点统计的数据(单位:μg/m 3)列出的茎叶图,则甲、乙两地浓度的方差较小的是________.,解析:由茎叶图可知甲监测点的数据较为集中,乙监测点的数据较为分散,所以甲地的方差较小.答案:甲。
【走向高考】高考数学总复习 10-2统计图表、数据的数字特征和用样本估计总体课后作业北师大版一、选择题1.(·福建师大附中)如图是根据某校10位高一同学的身高(:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A.161 cm B.162 cmC.163 cm D.164 cm[答案] B[解析]通过茎叶图可知这10位同学的身高是155 cm,155 cm,157 cm,158 cm,161 cm,163 cm,163 cm,165 cm,171 cm,172 cm.这10个数据的中位数是将这些数据从小到大(或从大到小)排列后中间两个数据的平均数,即为161 cm和163 cm这两个数据的平均数,所以应选B.2.在样本的频率分布直方图中,共有11个小长方形,假设中间一个小长方形的面积等于其它10个小长方形的面积和的14,且样本容量为160,那么中间一组的频数为( )A.32 B.20 C.40 D.25 [答案] A[解析]由条件知,中间一组的频数为样本容量的1 5,∴频数为160×15=32.3.一组数据:20,30,40,50,50,60,70,80,其中平均数、中位数、众数的大小关系是( ) A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数[答案] D[解析]平均数为20+30+40+50+50+60+70+808=50,按由小到大排列可知,中位数是50,众数也是50.4.(文)假设M个数的平均数是X,N个数的平均数是Y,那么这M+N个数的平均数是( )A.X+Y2B.X+YM+NC.MX+NYM+ND.MX+NYX+Y[答案] C[解析]该题考查平均数的概念及运算.共有M+N个数,这M+N个数的和为(MX+NY),故这M+N个数的平均数为MX+NY M+N.(理)期中考试后,班长算出了全班40名同学的数学成绩的平均分为M.如果把M当成一个同学的分数,与原来的40个分数加在一起,算出这41个分数的平均值为N,那么M:N为( )A.40:41 B.1:1 C.41:40 D.2:1[答案] B[解析]设40个人的成绩依次为a1,a2,…,a40,那么M=a1+a2+…+a4040.当把该平均分M当成一个人的分数时,41个分数的平均值为N=a1+a2+…+a40+M41=40M+M41=M,故M:N=1:1.5.(·湖北文,5)有一个容量为200的样本,其频率分布直方图如下图.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18 B.36 C.54 D.72[答案] B[解析]此题考查频率分布直方图.做这类题应注意组距、各小矩形的面积和为1等.1-2(0.02+0.05+0.15+0.19)=0.18,所以0.18×200=36.6.某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].样本中产品净重小于100克的个数是36,那么样本中净重大于或等于98克并且小于104克的产品个数是( )A.90 B.75 C.60 D.45[答案] A[解析]本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100克的频率P=(0.050+0.100)×2=0.3,设样本容量为n,由36n=0.3,∴n98克而小于104克的产品的频率P′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.应选A.二、填空题7.一个样本a,99,b,101,c中,五个数顺次成等差数列,那么这个样本的标准差为________.[答案] 2[解析]∵a,99,b,101,c成等差数列,∴b=101+992=100,∴a=98,c=102.∴x=98+99+100+101+1025=100,∴s=15[98-1002+99-1002+100-1002+101-1002+102-1002]= 2.8.如下图,是虹美电视机厂产值统计图,产值最少的是第________季度,产值最多的是第________季度.第四季度比第二季度增产________%.[答案]二;四;150[解析]折线图描述某种现象在时间上的开展趋势.图中折线表示了虹美电视机厂四个季度产值先减少后增多,且第二季度最少,第四季度最多.第四季度比第二季度增产15万元,增产150%.三、解答题9.(·新课标文,19)某种产品的质量以其质量指标值衡量,质量指标值越大说明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表指标值[90,94)[94,98)[98,102)[102,106)[106,110] 分组频数82042228B指标值[90,94)[94,98)[98,102)[102,106)[106,110] 分组频数412423210(2)用B配方生产的一件产品的利润y(:元)与其质量指标值t的关系式为y =⎩⎪⎨⎪⎧-2, t <94,2, 94≤t <102,4, t ≥102.估计用B 配方生产的一件产品的利润大于0的概率,并求用B 配方生产的上述100件产品平均一件的利润.[解析] (1)由试验结果知,用A 配方生产的产品中优质品的频率为22+8100=0.3,所以用A 配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B 配方生产的产品中优质品的频率为32+10100=0.42,所以用B 配方生产的产品的优质品率的估计值为0.42.(2)由条件知,用B 配方生产的一件产品的利润大于0当且仅当其质量指标值t ≥94,由试验结果知,质量指标值t ≥94的频率为0.96.所以用B 配方生产的一件产品的利润大于0的概率估计值为0.96.用B 配方生产的产品平均一件的利润为 1100×[4×(-2)+54×2+42×4]=2.68(元.)一、选择题1.(·江西文,7)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图,假设得分值的中位数为m e ,众数为m 0,平均值为x ,那么( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x [答案] D[解析]此题主要考查统计的根底知识.5+6 2=5.5,平均值x=2×3+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930.2.甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如下图,那么以下说法正确的选项是( )B.甲的平均成绩比乙的平均成绩低C.甲成绩的方差比乙成绩的方差大D.甲成绩的方差比乙成绩的方差小[答案] C[解析]此题考查茎叶图知识及样本数据中的均值与方差的求解及其意义.可以求得两人的平均成绩相同,均为107,又S2甲=15[(98-107)2+(99+107)2+(105-107)2+(115-1072+(118-107)2]=66.8,而S2乙=15[(95-107)2+(106-107)2+(108-107)2+(112-107)2+(114-107)2]=44,应选C.二、填空题s2=________.[答案]16 5[解析]由条件可知平均数为7,所以s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165.a=________.假设要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,那么从身高在[140,150]内的学生中选取的人数应为________.[答案]0.030 3[解析]由所有小矩形面积为1不难得到a=0.030,而三组身高区间的人数比为321,由分层抽样的原理不难得到140~150区间内的人数为3人.三、解答题5.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(:千克),并将所得数据分组,画出频率分布直方图(如下图).(1)在答题卡上的表格中填写相应的频率;分组频率[1.00,1.05)[1.05,1.10)[1.10,1.15)[1.15,1.20)[1.20,1.25)[1.25,1.30)(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.[解析]本小题主要考查频率分布直方图,频数,概率等根本概念和总体分布的估计等统计方法.(1)根据频率分布直方图可知,频率=组距×频率组距故可得下表:分组频率[1.00,1.05)[1.05,1.10)[1.10,1.15)[1.15,1.20)[1.20,1.25)[1.25,1.30)(2)0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47.(3)120×1006=,所以水库中鱼的总条数约为条.6.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17. 在某报纸的一篇文章中,每个句子中所含的字的个数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比拟分析,得到什么结论?[分析] 将十位数字作茎,个位数字作叶,进行逐一统计.[解析](1)茎叶图如下图:电脑杂志报纸文章(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在20~40之间,中位数为27.5.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明.7.(文)(·吉林延边一模)某市统计局就某地居民的月收入调查了10000人,并根据所得数据画出样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1000,1500)).(1)求居民收入在[3000,3500)的频率;(2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中按分层抽样方法抽出100人作进一步分析,那么月收入在[2500,3000)的这段应抽取多少人?[解析](1)月收入在[3000,3500)的频率为0.0003×(3500-3000)=0.15.(2)∵0.0002×(1500-1000)=0.1,0.0004×(-1500)=0.2,0.0005×(2500-)=0.25,0.1+0.2+0.25=0.55>0.5,∴样本数据的中位数为+0.5-0.1+0.20.0005=+400=2400(元).(3)居民月收入在[2500,3000)的频数为0.25×10000=2500(人),再从10000人中用分层抽样方法抽出100人,那么月收入在[2500,3000)的这段应抽取100×250010000=25(人).(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?[解析](1)∵各小组的频率之和为1.00,第一、三、四、五小组的频率分布别是0.30,0.15,0.10,0.05. ∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.∴落在59.5~69.5的第二小组的小长方形的高=频率组距=,10)=0.04,那么补全的频率分布直方图如下图.(2)设九年级两个班参赛的学生人数为x人.∵第二小组的频数为40人,频率为0.40,∴40x=0.40,解得x=100.所以这两个班参赛的学生人数为100人.(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5,即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.。
第三节 统计图表、数据的数字特征、用样本估计总体[最新考纲] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、象形统计图、茎叶图等.2.数据的数字特征 (1)众数、中位数、平均数①众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.③平均数:样本数据x 1,x 2,…,x n 的平均数x =1n(x 1+x 2+…+x n ).(2)方差和标准差 ①方差:s 2=1n []x 1-x2+x 2-x2+…+x n -x2.②标准差:s =s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差的单位与原始测量单位相同,在统计中,通常用标准差来刻画数据的离散程度.3.频率分布直方图与频率分布折线图(1)频率分布直方图:每个小矩形的宽度为Δx i (分组的宽度),高为f iΔx i,小矩形的面积恰为相应的频率f i ,我们称这样的图形为频率分布直方图.(2)频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加上一个区间,从所加的左边区间的中点开始,用线段依次连接频率分布直方图中各个矩形的顶端中点,直至右边所加区间的中点就得到频率分布折线图.4.用样本估计总体通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.[常用结论]1.频率分布直方图的三个结论(1)频率分布直方图中相邻两横坐标之差Δx i 称为组距,纵坐标f i Δx i =频率组距,频率=组距×f iΔx i.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.一、思考辨析(正确的打“√”,错误的打“×”) (1)在频率分布直方图中,小矩形的高表示频率.( )(2)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (4)一组数据的方差越大,说明这组数据的波动越大. ( )[答案](1)× (2)√ (3)√ (4)√ 二、教材改编1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A .4B .8C .12D .16B [设频数为n ,则n 32=0.25,∴n =32×14=8.]2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92A[∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x=87+89+90+91+92+93+94+968=91.5.]3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有________人.25 [用水量为[2,2.5)的频率为0.5×0.5=0.25,则用水量为[2,2.5)的居民有100×0.25=25(人).]4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1 [5个数的平均数x=4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.] ⊙考点1 扇形图和折线图(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.1.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A[设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.] 2.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A[对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.]解答第1题时,理解“经济收入增加了一倍”是解题的关键.⊙考点2 茎叶图 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.1.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7A [由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3,故选A.]2.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )A .1B .2C .3D .4B [由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2,故选B.]3.甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x 甲,x 乙,则下列结论正确的是( )A.x 甲<x 乙;乙比甲得分稳定B.x 甲>x 乙;甲比乙得分稳定C.x 甲>x 乙;乙比甲得分稳定D.x 甲<x 乙;甲比乙得分稳定 A [因为x 甲=2+7+8+16+225=11,x 乙=8+12+18+21+255=16.8,所以x 甲<x 乙且乙比甲成绩稳定,故选A.]第3题,从数据重心位置及数据离散程度,亦可知道答案. ⊙考点3 频率分布直方图1.由频率分布直方图进行相关计算时,需掌握的两个关系式 (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. 2.利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标.(1)在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是( )A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1 000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分(2)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.①求乙离子残留百分比直方图中a ,b 的值;②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).(1)D [由频率分布直方图可得,成绩在[70,80]的频率最高,因此考生人数最多,故A 正确;由频率分布直方图可得,成绩在[40,60)的频率为0.25,因此,不及格的人数为 4 000×0.25=1 000,故B 正确;由频率分布直方图可得:平均分等于45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C 正确;因为成绩在[40,70)的频率为0.45,由[70,80]的频率为0.3,所以中位数为70+10×0.050.3≈71.67,故D 错误.故选D.](2)[解] ①由已知得0.70=a +0.20+0.15,故a =0.35.b =1-0.05-0.15-0.70=0.10.②甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05, 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.频率分布直方图中各小长方形的面积之和为1,在求参数的值时,经常用到这个结论.[教师备选例题]某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.[解](1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,解得x =0.007 5.即直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,∴月平均用电量的中位数在[220,240)内.设中位数为a ,则0.45+0.012 5×(a -220)=0.5,解得a =224,即中位数为224. 行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月均用水量的中位数.[解](1)由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a , 解得a =0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x <2.5.由0.50×(x -2)=0.5-0.48,解得x =2.04. 故可估计居民月均用水量的中位数为2.04吨. ⊙考点4 样本的数字特征利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小;标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.样本数字特征的计算(1)(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. (2)(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.(1)53 (2)0.98 [(1)由题意,该组数据的平均数为6+7+8+8+9+106=8, 所以该组数据的方差是16[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53. (2)x =10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.] 本例(2)中实际上就是用样本的平均数估计总体平均数.样本的数字特征与频率分布直方图或茎叶图交汇(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组[-0.20,0)[0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80) 企业数22453147(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.[解](1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100∑5i =1n i (y i -y )2=1100×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s =0.029 6=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 求标准差时,应先求平均数,再求方差,最后求标准差.[教师备选例题]1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则 ( )甲 乙A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 C [甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是-22+-12+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是-12+-12+-12+02+325=125,故选C.]2.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9 乙1010799甲 [x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.]甲、乙两人在相同条件下各射击10次,每次中靶环数情况如图所示:(1)请填写下表(写出计算过程):平均数 方差 命中9环及9环以上的次数甲 乙①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些); ③从折线图上两人射击命中环数的走势看(分析谁更有潜力). [解] 由题图,知甲射击10次中靶环数分别为9,5,7,8,7,6,8,6,7,7. 将它们由小到大排列为5,6,6,7,7,7,7,8,8,9. 乙射击10次中靶环数分别为2,4,6,8,7,7,8,9,9,10. 将它们由小到大排列为2,4,6,7,7,8,8,9,9,10. (1)x 甲=110×(5+6×2+7×4+8×2+9)=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=5.4.填表如下:甲乙∴甲成绩比乙稳定.②∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.。
10-2统计图表、数据的数字特征和用样本估计总体基 础 巩 固一、选择题1.(2012·潍坊统考)如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161 cmB .162 cmC .163 cmD .164 cm [答案] B[解析] 通过茎叶图可知这10位同学的身高是155 cm ,155 cm ,157 cm,158 cm,161 cm,163 cm,163 cm,165 cm,171 cm,172 cm.这10个数据的中位数是将这些数据从小到大(或从大到小)排列后中间两个数据的平均数,即为161 cm 和163 cm 这两个数据的平均数,所以应选B.2.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其它10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为( )A .32B .20C .40D .25 [答案] A[解析] 由条件知,中间一组的频数为样本容量的15,∴频数为160×15=32.3.已知一组数据:20,30,40,50,50,60,70,80,其中平均数、中位数、众数的大小关系是( )A .平均数>中位数>众数B .平均数<中位数<众数C .中位数<众数<平均数D .众数=中位数=平均数[答案] D[解析] 平均数为20+30+40+50+50+60+70+808=50,按由小到大排列可知,中位数是50,众数也是50.4.(文)(2012·山东文,4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差 [答案] D[解析] 本题考查样本的数字特征.A 的众数88,B 则为88+2=90.“各样本都加2”后,平均数显然不同.A 的中位数86+862=86,B 的中位数88+882=88,而由标准差公式S =1n[x 1-x -2+x 2-x-2+…+x n -x-2]知D 正确.(理)(2012·安徽理,5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 [答案] C[解析] 本题考查了数理统计中的平均数、中位数、方差、极差及条形图等问题. x -甲=15(4+5+6+7+8)=6,x -乙=15(5×3+6+9)=6,甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.故选C.5.(文)若M 个数的平均数是X ,N 个数的平均数是Y ,则这M +N 个数的平均数是( ) A.X +Y2B.X +YM +N C.MX +NYM +ND.MX +NYX +Y[答案] C[解析] 该题考查平均数的概念及运算.共有M +N 个数,这M +N 个数的和为(MX +NY ),故这M +N 个数的平均数为MX +NYM +N. (理)期中考试后,班长算出了全班40名同学的数学成绩的平均分为M .如果把M 当成一个同学的分数,与原来的40个分数加在一起,算出这41个分数的平均值为N ,那么M N 为( )A .40:41B .1:1C .41:40D .2:1 [答案] B[解析] 设40个人的成绩依次为a 1,a 2,…,a 40,则M =a 1+a 2+…+a 4040.当把该平均分M 当成一个人的分数时,41个分数的平均值为N =a 1+a 2+…+a 40+M41=40M +M41=M , 故M :N =1:1. 6.某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(单位:g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100g 的个数是36,则样本中净重大于或等于98g 并且小于104g 的产品个数是( )A .90B .75C .60D .45 [答案] A[解析] 本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100g 的频率P =(0.050+0.100)×2=0.3,设样本容量为n ,由已知36n=0.3,∴n =120.而净重大于或等于98g 而小于104g 的产品的频率P ′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.故选A.二、填空题7.(2012·湖南文,13)下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x -)2-(x 2-x -)2+…+(x n -x -)2],其中x -为x 1,x 2,…,x n 的平均数)[答案] 6.8[解析] 本题考查茎叶图、方差的概念. 由茎叶图知x -=8+9+10+13+155=11,∴s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.8.如图所示,是海尔电视机厂产值统计图,产值最少的是第________季度,产值最多的是第________季度.第四季度比第二季度增产________%.[答案] 二 四 150[解析] 折线图描述某种现象在时间上的发展趋势.图中折线表示了海尔电视机厂四个季度产值先减少后增多,且第二季度最少,第四季度最多.第四季度比第二季度增产15万元,增产150%.三、解答题9.(2012·北京理,17)近年来,某市为促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000t 生活垃圾,数据统计如下(单位:t):(2)试估计生活垃圾投放错误的概率;(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a ,b ,c 其中a >0,a +b +c =600.当数据a ,b ,c 的方差s 2最大时,写出a ,b ,c 的值(结论不要求证明),并求此时s 2的值.(注:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为数据x 1,x 2,…,x n 的平均数)[解析] (1)厨余垃圾投放正确的概率约为 “厨余垃圾”箱里厨余垃圾量厨余垃圾总量=400400+100+100=23.(2)设生活垃圾投放错误为事件A ,则事件A 表示生活垃圾投放正确.事件A 的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P (A )约为400+240+601 000=0.7.所以P (A )约为1-0.7=0.3.(3)当a =600,b =c =0时,s 2取得最大值. 因为x =13(a +b +c )=200,所以s 2=13[(600-200)2+(0-200)2+(0-200)2]=80 000.能 力 提 升一、选择题1.(文)(2012·江西文,6)小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A .30%B .10%C .3%D .不能确定[答案] C[解析] 本题考查了扇形图,条形图.由图2知小波一星期的食品开支为300元,其中鸡蛋开支为30元.占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.(理)(2012·陕西理,6)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x -甲,x -乙,中位数分别为m 甲,m 乙,则( )A.x -甲<x -乙,m 甲>m 乙B.x -甲<x -乙,m 甲<m 乙C.x -甲>x -乙,m 甲>m 乙 D.x -甲>x -乙,m 甲<m 乙[答案] B[解析] 本题考查了茎叶图、平均数、中位数,从茎叶图中知,甲:5,6,8,10,10,14,18,18,22,25,27,30,30,38,41,43;乙:10,12,18,20,22,23,23,27,31,32,34,34,38,42,43,48.x -甲=32016=20,x -乙=45716,m =18+222=20,n =27+312=29.故选B.2.甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如图所示,则下列说法正确的是( )A.甲的平均成绩比乙的平均成绩高 B .甲的平均成绩比乙的平均成绩低 C .甲成绩的方差比乙成绩的方差大 D .甲成绩的方差比乙成绩的方差小[答案] C[解析] 本题考查茎叶图知识及样本数据中的均值与方差的求解及其意义.可以求得两人的平均成绩相同,均为107,又S 2甲=15[(98-107)2+(99+107)2+(105-107)2+(115-107)2+(118-107)2]=66.8,而S 2乙=15[(95-107)2+(106-107)2+(108-107)2+(112-107)2+(114-107)2]=44,故选C.二、填空题3.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.[答案] 0.030 3[解析] 由所有小矩形面积为1不难得到a =0.030,而三组身高区间的人数比为321,由分层抽样的原理不难得到[140,150]区间内的人数为3人.4.(2012·广东文,13)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[答案] 1,1,3,3[解析] 本题考查统计中的平均数,中位数,标准差等.由题意不妨设x 1≤x 2≤x 3≤x 4,则x 1+x 2+x 3+x 44=2,x 2+x 32=2,所以x 1+x 4=4,x 2+x 3=4,又因为x 1,x 2,x 3,x 4∈N +,所以只有①⎩⎪⎨⎪⎧ x 1=1x 2=1x 3=3x 4=3与②⎩⎪⎨⎪⎧x 1=2x 2=2x 3=3x 4=2适合上式,而①使得方差为1,②使得方差为0. 所以这组数据为1,1,3,3. 三、解答题5.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示).(1)在答题卡上的表格中填写相应的频率;(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.[解析] 本小题主要考查频率分布直方图,频数,概率等基本概念和总体分布的估计等统计方法.(1)根据频率分布直方图可知,频率=组距×频率组距故可得下表:分组 频率 [1.00,1.05) 0.05 [1.05,1.10) 0.20 [1.10,1.15) 0.28 [1.15,1.20) 0.30 [1.20,1.25) 0.15 [1.25,1.30)0.02(2)0.30+0.15+0.02=中的概率约为0.47. (3)120×1006=2000,所以水库中鱼的总条数约为2000条.6.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17. 在某报纸的一篇文章中,每个句子中所含的字的个数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22. (1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?[分析] 将十位数字作茎,个位数字作叶,进行逐一统计. [解析] (1)茎叶图如图所示:(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在20~40之间,中位数为27.5.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明.7.(文)(2012·陕西文,19)假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解他们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如下:(1)估计甲品牌产品寿命小于200h 的概率;(2)这两种品牌产品中,某个产品已使用了200h ,试估计该产品是甲品牌的概率.[解析] (1)甲品牌产品寿命小于200h 的频率为5+20100=14, 用频率估计概率,所以甲品牌产品寿命小于200h 的概率为14. (2)根据抽样结果,寿命大于200h 的产品有75+70=145个,其中甲品牌产品是75个,所以在样本中,寿命大于200h 的产品是甲品牌的频率为75145=1529, 用频率估计概率,所以已使用了200h 的该产品是甲品牌的概率为1529. (理)(2012·广东文,17)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.(2)这100名学生语文成绩的平均分为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分).(3)数学成绩在[50,60)的人数为:100×0.05=5,数学成绩在[60,70)的人数为:100×0.4×12=20, 数学成绩在[70,80)的人数为:100×0.3×43=40, 数学成绩在[80,90)的人数为: 100×0.2×54=25, 所以数学成绩在[50,90)之外的人数为:100-5-20-40-25=10.。
考点规范练48基础巩固组1.(2015广州调研)如图所示的是2014年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为()A.85,84B.84,85C.86,84D.84,86答案:A解析:由题图可知,去掉一个最高分和一个最低分后,所剩数据为84,84,84,86,87, 故平均数为=85,众数为84.2.如图是一容量为100的样本的质量的频率分布直方图,样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()A.10B.20C.30D.40〚导学号32470828〛答案:B解析:由题意得组距为5,故样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2,频数为100×0.2=20,故选B.3.某中学高三(2)班甲、乙两名学生自高中以来每次考试成绩的茎叶图如图,下列说法正确的是()A.乙学生比甲学生发挥稳定,且平均成绩也比甲学生高B.乙学生比甲学生发挥稳定,但平均成绩不如甲学生高C.甲学生比乙学生发挥稳定,且平均成绩比乙学生高D.甲学生比乙学生发挥稳定,但平均成绩不如乙学生高答案:A解析:从茎叶图可知乙同学的成绩在[80,100)分数段的有9次,而甲同学的成绩在[80,100)分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在[90,100)分数段的最多,而甲同学的成绩集中在[80,90)分数段的最多.故乙同学比甲同学发挥较稳定且平均成绩也比甲同学高.4.(2015湖北黄冈月考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()A.2B.3C.4D.5答案:B解析:依题意可得10×(0.005+0.01+0.02+a+0.035)=1,则a=0.03.所以身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1.所以从身高在[140,150]内的学生中选取的人数应为×18=3.5.(2015河南三市调研)在检验某产品直径尺寸的过程中,将某尺寸分成若干组,[a,b)是其中的一组,抽查出的个体数在该组上的频率为m,该组在频率分布直方图上的高为h,则|a-b|等于()A.B.C.mhD.与h,m无关〚导学号32470829〛答案:A解析:根据概率分布直方图的概念可知,|a-b|×h=m,由此可知|a-b|=.6.(2015山东潍坊联考)某学校从高二甲、乙两个班中各选6名同学参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的众数是85,乙班学生成绩的平均分是81,则x+y的值为()A.6B.7C.8D.9答案:D解析:由众数的定义知x=5,由乙班的平均分为81得=81,解得y=4,故x+y=9.7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为() A.B.C.36 D.答案:B解析:根据茎叶图,去掉1个最低分87,1个最高分99,则[87+94+90+91+90+(90+x)+91]=91,∴x=4.∴s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=.8.(2015安徽淮南模拟)如果数据x1,x2,…,x n的平均数为,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为()A.和s2B.2+3和4s2C.2+3和s2D.2+3和4s2+12s+9〚导学号32470830〛答案:B解析:原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数、方差分别是2+3和4s2.9.(2015湖北,文14)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a= ;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .答案:(1)3 (2)6 000解析:(1)由频率分布直方图,得(1.5+2.5+a+2.0+0.8+0.2)×0.1=1,解得a=3;(2)消费金额在[0.5,0.9]内的购物者的人数为:10 000×(1-1.5×0.1-2.5×0.1)=10000×0.6=6 000.10.一个容量为200的样本的频率分布直方图如图,则样本数据落在[5,9)内的频率和频数分别为 .答案:0.2,40解析:利用等量关系:频率=小长方形的面积=小长方形的高×组距,可得样本数据落在[5,9)内的频率为0.05×4=0.2.又频率=,已知样本容量为200,所以所求频数为200×0.2=40.能力提升组11.(2015沈阳监测)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.据此估计允许参加面试的分数线大约是( )A .75B .80C .85D .90答案:B解析:因为参加笔试的400人中择优选出100人,故每个人被择优选出的概率P=.因为随机调查24名笔试者,则估计能够参加面试的人数为24×=6,观察表格可知,分数在[80,85)的有5人,分数在[85,90)的有1人,故面试的分数线大约为80分,故选B .12.(2015山东,文6)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③B.①④C.②③D.②④答案:B解析:由茎叶图可知,=29,=30,所以,①正确;[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6,[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,所以,故④正确.13.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈递减的等差数列分布,则网民年龄在[35,40)的频率为()A.0.04B.0.06C.0.2D.0.3〚导学号32470831〛答案:C解析:由已知得网民年龄在[20,25)的频率为0.01×5=0.05,在[25,30)的频率为0.07×5=0.35.因为年龄在[30,35),[35,40),[40,45]的上网人数呈递减的等差数列分布,所以其频率也呈递减的等差数列分布,又年龄在[30,45]的频率为1-0.05-0.35=0.6,所以年龄在[35,40)的频率为0.2.故选C.14.样本(x1,x2,…,x n)的平均数为,样本(y1,y2,…,y m)的平均数为),若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数=α+(1-α),其中0<α<,则n,m的大小关系为()A.n<mB.n>mC.n=mD.不能确定〚导学号32470832〛答案:A解析:由题意知样本(x1,…,x n,y1,…,y m)的平均数为,又=α+(1-α),即α=,1-α=.因为0<α<,所以0<,即2n<m+n,所以n<m,选A.15.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为.答案:160解析:∵小长方形的面积由小到大构成等比数列{a n},且a2=2a1,∴样本的频率构成一个等比数列,且公比为2,∴a1+2a1+4a1+8a1=15a1=1,∴a1=,∴小长方形面积最大的一组的频数为300×8a1=160.16.(2015安徽宣城模拟)对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h的电子元件的数量与使用寿命在300~600 h的电子元件的数量的比是.〚导学号32470833〛答案:解析:由于已知的频率分布直方图中组距为100,寿命在100~300 h的电子元件对应的矩形的高分别为:,则寿命在100~300 h的电子元件的频率为:100×=0.2,寿命在300~600 h的电子元件对应的矩形的高分别为:.则寿命在300~600 h的电子元件的频率为:100×=0.8,则寿命在100~300 h的电子元件的数量与寿命在300~600 h的电子元件的数量的比大约是.。
第十章统计、统计案例 10.2 统计图表、数据的数字特征及用样本估计总体课时规范训练理北师大版[A级基础演练]1.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20 B.100,20C.200,10 D.100,10解析:该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A.答案:A2.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93 B.123C.137 D.167解析:初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.答案:C3.(2015·高考安徽卷)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8 B.15C.16 D.32解析:已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16,故选C.答案:C4.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.解析:由平均数的计算公式得. x =4+6+5+8+7+66=6. 答案:65.(2014·高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.解析:底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.答案:246.(2015·湖南省十校联考)某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x +y 的值为________.解析:依题意,甲班学生的平均分85=78+79+85+80+x +80+92+967, 故x =5,乙班学生成绩的中位数为83,故其成绩为76,81,81,83,91,91,96,所以y =3,x +y =8.答案:87.(2014·高考新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.8.(2014·高考广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率[25,30]30.12(30,35]50.20(35,40]80.32(40,45]n1f1(45,50]n2f2(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.解:(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n1=7,n2=2,所以f1=n125=725=0.28,f2=n225=225=0.08.(2)样本频率分布直方图如图.(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.509 4,所以在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率为0.590 4.[B级能力突破]1.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A.30% B.10% C.3% D.不能确定解析:由题图2可知鸡蛋开支占食品开支的110,所以鸡蛋开支占总开支的30%×110=3%,故选C.答案:C2.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③B.①④C.②③D.②④解析:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.答案:B3.(2015·高考课标卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.答案:D4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4则:(1)平均命中环数为________;(2)命中环数的标准差为________.解析:利用平均值和标准差公式求解.(1)x -=7+8+7+9+5+4+9+10+7+410=7. (2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s =2.答案:(1)7 (2)25.(2016·鄂州模拟)某校为了解高三同学寒假期间的学习情况,抽查了100名同学,统计他们平均每天的学习时间,绘成频率分布直方图(如图).则这100名同学中平均每天的学习时间在6~8小时内的人数为________.解析:由(x +0.14+0.12+0.05+0.04)×2=1,得x =0.15.∴在6~8小时内的人数为0.150.15+0.14+0.12+0.05+0.04×100=30. 答案:306.(2016·咸宁模拟)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别________和________.解析:甲的平均数为20+-1-2+1+3+2+11+11+1510=24, 乙的平均数为20+-1-3-9+1+4+2+4+10+12+1010=23. 答案:24 237.育才中学的高二一班有男同学45名,女同学15名,老师按照分层抽样的方法组建了一个4人的课外兴趣小组.(1)求某同学被抽到的概率及课外兴趣小组中男、女同学的人数;(2)经过一个月的学习、讨论,这个兴趣小组决定选出两名同学做某项实验,方法是先从小组里选出1名同学做实验,该同学做完后,再从小组内剩下的同学中选1名同学做实验,求选出的两名同学中恰有一名女同学的概率;(3)实验结束后,第一名做实验的同学得到的实验数据为68,70,71,72,74,第二名做实验的同学得到的实验数据为69,70,70,72,74,请问哪位同学的实验更稳定?并说明理由.解:(1)P =445+15=115, ∴某同学被抽到的概率为115, 设该课外兴趣小组中有x 名男同学,则4560=x 4, ∴x =3,∴男、女同学的人数分别为3,1.(2)把3名男同学和1名女同学分别记为a 1,a 3,a 3,b ,则选取两名同学的基本事件有(a 1,a 2),(a 1,a 3),(a 1,b ),(a 2,a 1),(a 2,a 3),(a 2,b )(a 3,a 1),(a 3,a 2)(a 3,b ),(b ,a 1),(b ,a 2),(b ,a 3)共12种情况,其中恰有一名女同学的有6种情况,∴选出的两名同学中恰有一名女同学的概率P 1=612=12.(3)∵x 1=68+70+71+72+745=71, x 2=69+70+70+72+745=71,s 21= -2+-2+-2+-2+-25=4,s 22=-2+-2+-2+-25=3.2,∴x 1=x 2,s 21>s 22,故第二名同学的实验更稳定.。