用样本估计总体练习试题
- 格式:doc
- 大小:217.00 KB
- 文档页数:10
高一数学用样本估计总体试题1.一个样本的方差是.【答案】5【解析】由样本可得,所以平均数为4;所以样本的方差为.【考点】样本数值特征.2.在一次选拔运动员中,测得7名选手的身高(单位:cm)的茎叶图为:,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为.【答案】8【解析】由茎叶图可知:7名选手的身高分别为170、173、170+x、178、179、180、181,所以由此可得,所以x=8.【考点】茎叶图.3.在一次选拔运动员中,测得7名选手的身高(单位:cm)的茎叶图为:,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为.【答案】8【解析】由茎叶图可知:7名选手的身高分别为170、173、170+x、178、179、180、181,所以由此可得,所以x=8.【考点】茎叶图.4.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.5.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为6,则报考飞行员的学生人数是()A.36B.40C.48D.50【答案】C【解析】设报考飞行员的人数为,根据前3个小组的频率之比为,可设前三小组的频率分别为;由题意可知所求频率和为1,即,解得,则,解得.故选C.【考点】频率分布直方图.6.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约()A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.7.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( ).A.3.5B.-3C.3D.-0.5【答案】B【解析】数据相差了,平均数相差,故求出的平均数与实际平均数相差.【考点】平均数.8.某教师出了一份三道题的测试卷,每道题1分,全班得3分、2分、1分和0分的学生所占比例分别为30%、50%、10%和10%,则全班学生的平均分为分.【答案】2【解析】设班级总人数为n人,得3分的是人,得2分的是人,得1分的是人,得0分的是人,故班级平均分.【考点】数据的平均数公式及数据的基本处理能力.9.若样本的频率分布直方图中一共有个小矩形,中间一个小矩形的面积等于其余个小矩形面积和的,且样本容量为160,则中间一组的频数是()A.32B.20C.40D.25【答案】A【解析】设中间一个小矩形的面积为,其余个小矩形的面积之和为,依题意有,求解得到,所以中间一组的频率为,中间一组的频数为,故选A.【考点】频率分布直方图.10.200辆汽车通过某一段公路时,时速的频率分布直方图如右图所示,则时速在[50,70)的汽车大约有().A.60辆 B.80辆C.70辆D.140辆【答案】D【解析】需根据直方图中求出各个矩形的面积,即为各组频率,再由总数乘以频率即得各组频数.解:由直方图可知,时速在[50,60]的频率为0.03×10=0.3 时速在[60,70]的频率为0.04×10=0.4 所以时速在[50,70]的汽车大约有200×(0.3+0.4)=140辆.故答案为D.【考点】直方图点评:本题考查频率分布直方图的相关知识.直方图中的各个矩形的面积代表了频率,所以各个矩形面积之和为1.11.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,.(1)求图中的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.分数段【答案】(1).(2)73.(3)10【解析】(1)依题意得,,解得.(2)这100名学生语文成绩的平均分为:(分).(3)数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:.所以数学成绩在之外的人数为:.【考点】本题考查了频率分布直方图的运用点评:注意频率分布直方图中用小长方形面积的大小来表示在各个区间内取值的频率,所以在求频率时,通过已知求出所要区间的面积即可12.为了让学生了解更多“社会法律”知识,某中学举行了一次“社会法律知识竞赛”,共有800名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表,解答下列问题:(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,799,试写出第二组第一位学生的编号;(2)填充频率分布表的空格①②③④并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人?【答案】(1)016 ;(2) 1 8 2 0.28 3 14 4 0.20;(3)256.【解析】(1)编号为016- -2分(2) 1 8 2 0.28 3 14 4 0.20- 每空1分2分在被抽到的学生中获二奖的人数是9+7=16人, 1分占样本的比例是, 1分所以获二等奖的人数估计为800×32%=256人. 1分答:获二等奖的大约有256人. 1分【考点】系统抽样;频率分布表;频率分布直方图。
5.1.4用样本估计总体必备知识基础练进阶训练第一层1.(多选)下列说法中正确的为()A.数据的极差越小,样本数据分布越集中、稳定B.数据的平均数越小,样本数据分布越集中、稳定C.数据的标准差越小,样本数据分布越集中、稳定D.数据的方差越小,样本数据分布越集中、稳定2.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5)4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5)3则总体中大于或等于31.5的数据约占()A.2 11B.13C.1 2D.233.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x 和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()A.x-,s2+1002B.x-+100,s2+1002C.x-,s2D.x-+100,s24.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图所示,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.5.某车间20名工人年龄数据如下表:年龄/岁工人数/人191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,做出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.6.从高三学生中抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图,求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.关键能力综合练进阶训练第二层7.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数大于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差8.(多选)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中的数据用该组区间的中点值为代表,则下列说法中正确的是()A.成绩在[70,80)分的考生人数最多B.不及格的考生人数为1000人C.考生竞赛成绩的平均数约为70.5分D.考生竞赛成绩的中位数约为75分9.某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A ,B ,C 三个级别,其中A 级30棵,B 级60棵,C 级10棵,然后从A ,B ,C 三个级别的苹果树中分别随机抽取了3棵、6棵、1棵,测出其产量,制成了如下统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总产量,那么小李的估计值是________kg.苹果树长势A 级B 级C 级随机抽取棵数361所抽取果树的平均产量/kg 80757010.为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,用茎叶图表示如下:甲乙878593119123(1)根据图中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;(2)求被抽取的这10名职工成绩的平均数和方差.(分层抽样的平均数和方差公式:设样本中不同层的平均数分别为x -1,x -2,…,x -n ,方差分别为s 21,s 22,…,s 2n ,相应的权重分别为w 1,w 2,…,w n ,则这个样本的平均数和方差分别为x -=错误!w i x -i ,s 2=错误!w i [s 2i +(x -i -x -)2],其中x -为样本平均数.)11.某校医务室抽查了高一10位同学的体重(单位:kg )如下:74,71,72,68,76,73,67,70,65,74.(1)求这10个学生体重数据的平均数、中位数、方差、标准差;(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.12.高一(3)班有男同学27名,女同学21名.在一次语文测验中,男同学得分的平均数是82,中位数是75,女同学得分的平均数是80,中位数是80.(1)求这次测验全班成绩的平均数(精确到0.01);(2)估计全班成绩不超过80分的同学至少有多少人;(3)分析男同学得分的平均数与中位数相差较大的主要原因.核心素养升级练进阶训练第三层13.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么从甲、乙生产的零件中抽取的这100件产品的平均尺寸和方差分别是多少?14.已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少.参考答案与解析1.答案:ACD解析:由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故B 不正确,ACD 正确.2.答案:B解析:由题意知样本的容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.3.答案:D解析:因为每个数据都加上100,所以平均数也增加100,而离散程度应保持不变,即方差不变.4.答案:(1)13(2)62.5(3)64解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.(2)设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5.(3)0.20×50+0.40×60+0.25×70+0.10×80+0.05×90=64.5.解析:(1)这20名工人年龄的众数为:30,这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,做出这20名工人年龄的茎叶图如下.(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.6.解析:(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3,而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应大约位于第四个小矩形内.设其底边为x ,高为0.03,∴令0.03x =0.2得x ≈6.7,故中位数应约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.022×10)+95×(0.018×10)=76.4.7.答案:BC解析:由条形统计图知:甲射靶5次的成绩分别为:4,5,6,7,8;乙射靶5次的成绩分别为:5,5,5,6,9,所以x -甲=4+5+6+7+85=6;x -乙=5+5+5+6+95=6.所以x -甲=x -乙.故A 不正确.甲的成绩的中位数为6,乙的成绩的中位数为5,故B 正确.s 2甲=15[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=15×10=2,s 2乙=15[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=15×12=125,因为2<125,所以s 2甲<s 2乙.故C 正确.甲的成绩的极差为:8-4=4,乙的成绩的极差为:9-5=4,故D 不正确.8.答案:ABC解析:由频率分布直方图可知,成绩在[70,80)分的考生人数最多,所以A 正确.不及格的人数为4000×(0.01+0.015)×10=1000(人),所以B 正确.平均分约为(45×0.01+55×0.015+65×0.02+75×0.03+85×0.015+95×0.01)×10=70.5(分),所以C 正确.设中位数约为x 0分,因为(0.01+0.015+0.02)×10=0.45<0.5,(0.01+0.015+0.02+0.03)×10=0.75>0.5,所以0.45+(x 0-70)×0.03=0.5,解得x 0≈71.7,D 错误.9.答案:7600解析:由题中表格各等级苹果树的平均产量可估算果园的苹果总产量为80×3+75×6+70×110×100=7600kg .10.解析:(1)甲单位5名职工成绩的平均数x -甲=87+88+91+91+935=90,乙单位5名职工成绩的平均数x -乙=85+89+91+92+935=90,甲单位5名职工成绩的方差s 2甲=15×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差s 2乙=15×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.∵s 2甲<s 2乙,∴甲单位职工对法律知识的掌握更为稳定.(2)∵甲单位职工的权重w 甲=12,乙单位职工的权重w 乙=12,x -甲=90,x -乙=90,s 2甲=4.8,s 2乙=8,由分层抽样求平均数和方差的公式可得,这10名职工成绩的平均数x -=12×90+12×90=90,这10名职工成绩的方差s 2=w 甲[s 2甲+(x -甲-x -)2]+w 乙[s 2乙+(x -乙-x -)2]=12×[4.8+(90-90)2]+12×[8+(90-90)2]=6.4.11.解析:(1)这10个学生体重数据的平均数为x -=110×(74+71+72+68+76+73+67+70+65+74)=71.这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,∴这10个学生体重数据的中位数为71+722=71.5.这10个学生体重数据的方差为s 2=110×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11.这10个学生体重数据的标准差为s =s 2=11.(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为11.12.解析:(1)利用平均数计算公式,得x -=148×(82×27+80×21)≈81.13.(2)因为男同学得分的中位数是75,所以至少有14名男生得分不超过75分.又因为女同学得分的中位数是80,所以至少有11名女生得分不超过80分.所以全班至少有25人得分不超过80分.(3)男同学得分的平均数与中位数相差较大,说明男同学中两极分化现象严重,得分高的和得分低的相差较大.13.解析:由题知甲机床的平均尺寸和方差分别为x -甲=10,s 2甲=20,乙机床的平均尺寸和方差分别为x -乙=12,s 2乙=40,所以从甲、乙生产的零件中抽出的这100件产品的平均尺寸x -=40×10+60×1240+60=11.2,所以方差s 2=140+60×(40×20+60×40)+40×6040+60×(10-12)2=32.96.14.解析:(1)计算极差:30-21=9.决定组距和组数:取组距为2.∵92=412,∴共分5组.决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下5组:20.5~22.5,22.5~24.5,24.5~26.5,26.5~28.5,28.5~30.5.列出频率分布表如下:分组频数频率20.5~22.520.1022.5~24.530.1524.5~26.580.4026.5~28.540.2028.5~30.530.15合计20 1.00(2)取各小长方形上的中点并用线段连接就构成了频率分布折线图,作出频率分布直方图.(3)由频率分布表和频率分布直方图观察得:样本值出现在23~28之间的频率为0.15+0.40+0.20=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.。
考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2012·湖北高考文科·T2)容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为( )(A)0.35 (B)0.45(C)0.55 (D)0.65【解题指南】解答本题先要读懂频数分布表,再结合频率的求法求解.【解析】选B.数据落在区间[10,40)内的频数为9,样本容量为20,所求频率=0.45.P=9202.(2012·湖南高考文科·T5)与(2012·湖南高考理科·T4)相同设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为 y=0.85x-85.71,则下列结论中不正确的是()(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1cm,则其体重约增加0.85kg(D)若该大学某女生身高为170cm,则可断定其体重必为58.79kg【解题指南】根据线性相关,回归直线,样本点的中心等相关概念判断.【解析】选D.3. (2012·陕西高考文科·T3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()(A)46,45,56 (B) 46,45,53(C) 47,45,56 (D) 45,47,53【解题指南】根据中位数、众数、极差的概念进行计算,注意观察茎叶图中的数据.【解析】选A. 茎叶图中共有30个数据,所以中位数是第15个和第16个数字的平均数,即1(4547)462+=,排除C,D;再计算极差,最小数据是12,最大数据是68,所以681256-=,故选A.4.(2012·陕西高考理科·T6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为m甲、m乙,则()(A) x x <甲乙,m 甲>m 乙 (B) x x <甲乙,m 甲<m 乙 (C) x x >甲乙,m 甲>m 乙 (D) x x >甲乙,m 甲<m 乙【解题指南】平均数的大小可以根据茎叶图中数据分布的集中位置进行判断,中位数则需要确定第8个数与第9个数的平均值,然后再比较大小 【解析】选B.观察茎叶图可知x x <甲乙,甲组数据中的中位数是1(1822)202+=,乙组数据中的中位数是1(2731)292+=,∴m 甲<m 乙.故选B.5.(2012·安徽高考理科·T5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )()A 甲的成绩的平均数小于乙的成绩的平均数 ()B 甲的成绩的中位数等于乙的成绩的中位数 ()C 甲的成绩的方差小于乙的成绩的方差 ()D 甲的成绩的极差小于乙的成绩的极差【解题指南】根据平均数、方差、中位数的定义计算即可.【解析】选C .甲的成绩的方差为221(2212)25⨯+⨯=,乙的成绩的方差为221(1331) 2.45⨯+⨯=.甲的成绩的极差为4,乙的成绩的极差为4.6. (2012·新课标全国高考文科·T3)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为( )(A )-1 (B )0 (C )12(D )1【解题指南】理清相关系数与相关性强弱的关系是解决本题的关键. 【解析】选D. 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线112y x =+上,样本的相关系数应为1.7.(2012·江西高考文科·T6)小波一星期的总开支分布图如图1所示,一 星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比 为( )(A)30% (B)10% (C)3% (D)不能确定【解题指南】读图,理清鸡蛋开支、食品开支与总开支之间的百分比关系. 【解析】选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.8. (2012·江西高考理科·T9)样本()12,,n x x x …,的平均数为x ,样本的平均数为y()x y ≠.若样本的平均数()1z x yαα=+-,其中102α<<,则,n m 的大小关系为( )(A)n m < (B )n m > (C )n m = (D )不能确定 【解题指南】用,x y 表示出z ,结合已知条件,建立m n α、、所满足的关系式,由α的范围获得,n m 所满足的不等关系,进而判断出n 与m 的大小关系.【解析】选A.由已知得12+n x x x nx ++=…,12+m y y y my ++=…,()()1212+n m x x x y y y z m n++++++=+……nx m ym n +=+=()1x y αα+-整理得()()10x y m n αα-+-=⎡⎤⎣⎦,,x y ≠∴ ()10m n αα+-=即1n m αα=-,又10,,0121ααα⎛⎫∈∴<< ⎪-⎝⎭,1,n n m m ∴<∴<.9.(2012·山东高考文科·T4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) (A)众数 (B)平均数 (C)中位数 (D)标准差 【解题指南】本题考查用样本的数字特征来估计总体.【解析】选D. B 样本数据恰好是A 样本数据都加2后所得数据,则众数、中位数、平均数比原来的都多2,而标准差不变.10.(2012·山东高考理科·T4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )(A )7 (B )9 (C )10 (D )15【解题指南】本题考查系统抽样方法和数列项数的计算方式,由系统抽样抽出的数的编号是等差数列.【解析】选C. 采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即30=l ,第k 组的号码为解得2516≤≤k ,则满足2516≤≤k 的整数k 有10个,故应选C. 二、填空题11.(2012·天津高考理科·T9)某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取__________所学校,中学中抽取__________所学校. 【解题指南】根据抽取样本的比例计算. 【解析】从小学中抽取150330=30=18150+75+255⨯⨯(所),同理可得从中学中抽取75330=30=9150+75+2510⨯⨯(所).【答案】18 912. (2012·山东高考文科·T14)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.【解题指南】本题考查频率分布直方图,关键是抓住纵轴表示的是频率/组距. 【解析】最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9. 【答案】913.(2012·湖北高考文科·T11)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人.【解题指南】本题考查分层抽样,解答本题的关键是求出入样率.【解析】由842656⨯=,可知结果.【答案】614.(2012·浙江高考文科·T11)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.【解题指南】利用抽样比乘以组内人数即可求出. 【解析】此样本中男生人数为【答案】16015.(2012·广东高考文科·T13)由正整数组成的一组数据1234,,,,x x x x 其平均数和中位数都是2,且标准差等于1,则这组数据为 .(从小到大排列) 【解题指南】本题是考查统计的有关知识,要知道平均数及中位数(按从小到大或从大到小的顺序排列,若奇数个数据取中间的数,若偶数个数据取中间两个数的平均数)的求法,以及标准差公式.【解析】假设这组数据按从小到大的顺序排列为1234,x x x x ,,,则1234142323+++=2,+=4,4+=4,+=2,2x x x x x x x x x x ⎧⎪⎧⎪∴⎨⎨⎩⎪⎪⎩2212(2)(2)2x x ∴-+-=,同理可求得2234(2)(2)2x x -+-=,由1234,x x x x ,,,均为正整数,且1234()()x x x x ,,,均为圆22(2)(2)2x y -+-=上的点,分析知1234,x x x x ,,,应为1,1,3,3. 【答案】1,1,3,316.(2012·福建高考文科·T14)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_______.【解题指南】女运动员本来占多大的比例,抽取后也应该占多大的比例,这就是分层抽样的精髓.【解析】由题意知,女运动员数为42,因此抽取的女运动员人数为42281298⨯=.【答案】1217.(2012·江苏高考·T2)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_______名学生.【解题指南】关键算出高二年级学生人数在总数中的比例.【解析】高二年级学生人数占总数的310,样本容量为50,则50×310=15.【答案】15.18.(2012·辽宁高考文科·T19)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(Ⅰ)根据已知条件完成下面的22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?(Ⅱ)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附22112212211212(),n n n n n n n n n χ++++-=【解题指南】(1)据频率分布直方图可计算“体育迷”, “非体育迷”人数,按照提供的公式,计算相关数值,与所给数据比较,获得结论;(2)将所有的基本事件罗列,很容易解决问题. 【解析】由所给的频率分布直方图知, “体育迷”人数为100(100.020100.005)25⨯⨯+⨯=“非体育迷”人数为75,则据题意完成22⨯列联表:将22⨯列联表的数据代入公式计算:2100(30104515)2112212217525455511221221()100 3.03033n n n n n n n n n χ⨯-⨯⨯⨯⨯-===≈⨯⨯⨯22100(30104515)22122175254555221221)100 3.03033n n n n n n ⨯-⨯⨯⨯⨯-==≈⨯⨯因为3.030 3.841<,所以没有理由认为“体育迷”与性别有关. (2)由所给的频率分布直方图知 “超级体育迷”人数为100(100.005)5⨯⨯=, 记(1,2,3)i a i =表示男性,(1,2)j b j =表示女性,所有可能结果构成的基本事件空间为{}12132311213112223212(),(),(),(),(),(),(),(),(),()a a a a a a ab a b a b a b a b a b b b Ω=,共有10个基本事件组成,且每个基本事件出现是等可能的;用A 表示事件“任选2人,至少1名女性”, 则{}11213112223212(),(),(),(),(),(),()A a b a b a b a b a b a b b b =,共有7个基本事件组成,故“任选2人,至少1名女性”的概率为7()10P A =.19. (2012·安徽高考文科·T18)若某产品的直径长与标准值的差的绝对值不超过1mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm), 将所得数据分组,得到如下频率分布表:(Ⅰ)将上面表格中缺少的数据填在相应的位置上;(Ⅱ)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(Ⅲ)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.【解析】(I)(Ⅱ)不合格品的直径长与标准值的差落在区间(1,3]内的概率为0.50.20.7+=. (Ⅲ)合格品的件数为50002020198050⨯-=(件)20.(2012·湖南高考文科·T17)(本小题满分12分)某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.已知这100位顾客中的一次购物量超过8件的顾客占55%. (Ⅰ)确定x ,y 的值,并估计顾客一次购物的结算时间的平均值;(Ⅱ)求一位顾客一次购物的结算时间不超过2分钟的概率.(将频率视为概率) 【解析】(Ⅰ)由已知得251055,35,15,20y x y x y ++=+=∴==,该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,顾客一次购物的结算时间的平均值可用样本平均数估计,其估计值为:115 1.530225 2.5203101.9100⨯+⨯+⨯+⨯+⨯=(分钟).(Ⅱ)记A 为事件“一位顾客一次购物的结算时间不超过2分钟”,123,,A A A 分别表示事件“该顾客一次购物的结算时间为1分钟”, “该顾客一次购物的结算时间为1.5分钟”, “该顾客一次购物的结算时间为2分钟”.将频率视为概率,得123153303251(),(),()10020100101004P A P A P A ======.123123,,,A A A A A A A = 且是互斥事件,123123()()()()()P A P A A A P A P A P A ∴==++ 33172010410=++=. 故一位顾客一次购物的结算时间不超过2分钟的概率为710.21.(2012·福建高考文科·T18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: (Ⅰ)求回归直线方程y bx a =+,其中20b =-,a y bx =-;(Ⅱ)预计在今后的销售中,销量与单价仍然服从(I )中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解析】(Ⅰ)由于1234561()8.56x x x x x x x =+++++=, 1234561()806y y y y y y y =+++++=.所以80208.5250a y bx =-=+⨯=,从而回归直线方程为ˆ20250yx =-+. (Ⅱ)设工厂获得的利润为L 元,依题意得22(20250)4(20250)20330100020(8.25)361.25L x x x x x x =-+--+=-+-=--+当且仅当8.25x =时,L 取得最大值,故当单价定为8.25元时,工厂可获得最大利润.22.(2012·广东高考文科·T17)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中α的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分. (3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.【解题指南】(1)本题根据每个区间上的矩形的面积和为1,可建立关于a 的方程,解出a 的值.(2)由频率分布直方图求平均分:每个区间的中点值乘以区间上矩形面积之和. (3)本题关键是先把语文成绩在[50,60),[60,70),[70,80),[80,90)的人数求出来.根据每段的频率求出每段的频数.【解析】(1)由频率分布直方图知(0.040.030.022)101,0.005a a +++⨯=∴=. (2)550.05650.4750.3850.2950.0573⨯+⨯+⨯+⨯+⨯=. 所以平均分为73分.(3) 分别求出语文成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为0.051005,0.410040,0.310030,0.210020⨯=⨯=⨯=⨯=.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为:-+++=(人). 5,20,40,25.所以数学成绩在[50,90)之外的人数有100(5204025)10。
高一数学用样本估计总体试题答案及解析1.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取20人参加一项活动,则从身高在[120,130内的学生中选取的人数应为.【答案】10【解析】由频率分布直方图可得:;则[120,130),[130,140),[140,150]三组人数所占的比例为,则在[120,130内选取的人数应为.【考点】频率分布直方图.2.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约( )A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.4.某校五四演讲比赛中,七位评委为一选手打出的分数如下:90 86 90 97 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.B.C.D.【答案】B【解析】由题意知,去掉一个最高分和一个最低分后,所剩数据的平均数为;方差为故选B.【考点】样本平均数和方差的计算.5.统计某校800名学生的数学期末成绩,得到频率分布直方图如图所示,若考试采用100分制,并规定不低于60分为及格,则及格率为.【答案】0.8【解析】由图形可知及格率为,答案为0.8.【考点】频率分布直方图6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ).A.甲B.乙C.丙D.丁【答案】C.【解析】分析表格可知,乙与丙的平均环数最多,又丙的方差比乙小说明丙成绩发挥的较为稳定,所以最佳人选为丙.【考点】数据的平均数与方差的意义.7.一次选拔运动中,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( )A.5B.6C.7D.8【答案】D【解析】由图可知7名同学的身高分别为180、181、170、173、,178、179而7名同学的平均身高为177,所以有得=178,所以【考点】茎叶图8.由正整数组成的一组数据,其平均数和中位数都是,且标准差等于,则这组数据为 .(从小到大排列)【答案】【解析】由已知不妨假设,则,又因为标准差等于,所以,且都是正整数,观察分析可知这组数据只可为:1,1,3,3.【考点】1.平均数与中位数;2.标准差;3.方程组思想.9.某路段属于限速路段,规定通过该路段的汽车时速不得超过70km/h,否则视为违规扣分,某天有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图,如下图所示,则违规扣分的汽车大约为辆.【答案】120.【解析】易求得70-80这组的频率为1-0.05-0.18-0.38-0.27=0.12,则违规扣分的汽车大约为辆.【考点】频率分布直方图中每组对应的长方形面积为,总面积为1,频数=频率样本容量.10.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】0.04;440【解析】由频率分布直方图得:,解得;志愿者年龄在[25,35)的人数为.【考点】概率与统计.11.将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用表示,则x的值为( )A.0B.4C.5D.7【答案】A【解析】如果是最高得分的话,,所以是最大值,那么,解得,故选A.【考点】茎叶图12.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差______.【答案】3.2【解析】由平均数及方差的定义可得;.【考点】样本数据的数字特征:平均值与方差.13.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少;(3)这两个班参赛学生的成绩的中位数应落在第几小组内.【答案】(1)第二小组的频率为,补全的频率分布直方图详见解析;(2)100人;(3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.【解析】(1)先从所给的直方图中得出第一、三、四、五小组的频率,然后用1减去第一、三、四、五小组的频率和得到第二小组的频率,接着由确定第二小组的小长方形的高,从而可补全频率分布直方图;(2)用第二小组的频数除以该组的频率,即可计算出九年两个班参赛学生的总人数;(3)要确定中位数所在的小组,只需先确定各小组的频数,从第一小组开始累加,当和达到总人数的一半时的组就是中位数所在的小组.试题解析:(1)∵各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05∴第二小组的频率为:∴落在59.5~69.5的第二小组的小长方形的高,则补全的频率分布直方图如图所示(2)设九年级两个班参赛的学生人数为人∵第二小组的频数为40人,频率为0.40∴,解得所以这两个班参赛的学生人数为100人(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5所以九年级两个班参赛学生的成绩的中位数应落在第二小组内【考点】1.频率分布直方图;2.转化与运算能力.14.在样本的频率分布直方图中, 共有9个小长方形, 若第一个长方形的面积为0.02, 前五个与后五个长方形的面积分别成等差数列且公差互为相反数,若样本容量为160, 则中间一组(即第五组)的频数为()A.12B.24C.36D.48【答案】C【解析】设公差为d,那么9个小长方形的面积分别为0.02,0.02+d,0.02+2d,0.02+3d,0.02+4d,0.02+3d,0.02+2d,0.02+d,0.02,而9个小长方形的面积和为 1,可得0.18+16d=1 可以求得d=∴中间一组的频数为:160×(0.02+4d)=36.故答案为:36.故选C。
题号 1 2 3 4 5 6 7 答案 1.(2012·福建师大附中模拟)如右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161 cmB .162 cmC .163 cmD .164 cm解析:通过茎叶图可知这10位同学的身高是155 cm ,155 cm ,157 cm,158 cm ,161 cm ,163 cm ,163 cm,165 cm,171 cm ,172 cm.这10个数据的中位数是将这些数据从小到大(或从大到小)排列后中间两个数据的平均数,即为161 cm 和163 cm 这两个数据的平均数.故选B.答案:B2.(2013·辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60解析:由频率分布直方图,低于60分的频率为(0.01+0.005)×20=0.3.所以该班学生人数n =150.3=50. 答案:B3.(2013·黄冈模拟)一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A .40.6,1.1B .48.8,4.4C .81.2,44.4D .78.8,75.6解析:记原数据依次为x 1,x 2,x 3,…,x n ,则新数据依次为2x 1-80,2x 2-80,2x 3-80,…,2x n -80,且x 1+x 2+…+x n -80n n=1.2,因此有x 1+x 2+…+x n n =1.2+802=40.6,结合各选项知正确选项为A. 答案:A4.(2012·山东卷)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:当每个样本数据加上2后,众数、平均数、中位数都会发生变化,不变的是数据的波动情况,即标准差不变.故选D.答案:D5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x -解析:由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.故选D.答案:D6.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为( ) A.65 B.65C. 2 D .2解析:由题意知15(a +0+1+2+3)=1,解得a =-1,所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.故选D.答案:D7.(2013·四川卷)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的概率分布直方图是( )解析:由于频率分布直方图的组距为5,去掉C、D,又[0,5),[5,10)两组各一人,去掉B,故选A.答案:A8.(2013·徐州一模)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画出了如图所示的频率分布直方图,现要从这10 000人中再用分层抽样的方法抽出100人作进一步调查,则月收入在[2 500,3 000)(元)内应抽出________人.解析:由直方图可得[2500,3000)(元)月收入段共有10 000×0.000 5×500=2 500人,按分层抽样应抽出2500×10010 000=25人.答案:259.(2013·辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.解析:把5个班中参加该小组的人数从小到大排列,记为x1,x2,x3,x4,x5,(x i∈N,且x1,x2,x3,x4,x5各不相同),由题意(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20.因为x1,x2,x3,x4,x5∈N,且各不相同.若使x5-7最大,只需(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2最小,显然(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2最小值为0+1+1+4=6.所以(x5-7)2≤14,因此(x5-7)2≤9,则x5≤10,x5∈N,经验证x5=10时,x1=4,x2=6,x3=7,x4=8满足,所以样本数据中的最大值为10.答案:1010.某地区为了解70~80岁老人的日平均睡眠时间(单位:h),随机选择了50位老人在上述统计数据的分析中,一部分计算见算法流程图(注:符号“←”与“=”的含义相同),则输出的S的值是________.解析:由流程图可知,S=G1F1+G2F2+G3F3+G4F4+G5F5=4.5×0.12+5.5×0.20+6.5×0.40+7.5×0.20+8.5×0.08=6.42.答案:6.4211.(2012·肇庆二模)某校高二年级研究性学习小组,为了分析2011年我国宏观经济形势,上网查阅了2010年和2011年2—6月我国CPI同比(即当年某月与前一年同月相比)的增长数据(见下表),但2011年4,5,6三个月的数据(分别记为x,y,z)没有查到.有的同学清楚记得2011年2,3,4,5,6五个月的CPI数据成等差数列.(1)求x,y,z的值;(2)求2011年2—6月我国CPI 的数据的方差;(3)一般认为,某月CPI 达到或超过3个百分点就已经通货膨胀,而达到或超过5个百分点则严重通货膨胀.现随机地从下表2010年的五个月和2011年的五个月的数据中各抽取一个数据,求相同月份2010年通货膨胀,并且2011年严重通货膨胀的概率.附:我国20101个百分点=1%)解析:(1)依题意得4.9,5.0,x ,y ,z 成等差数列,所以公差d =5.0-4.9=0.1,故x =5.0+0.1=5.1,y =x +0.1=5.2,z =y +0.1=5.3,(2)由(1)知2011年2—6月我国CPI 的数据为:4.9,5.0,5.1,5.2,5.3,其平均数为x -=15(4.9+5.0+5.1+5.2+5.3)=5.1, 其方差为s 2=15[(4.9-5.1)2+(5.0-5.1)2+(5.1-5.1)2+(5.2-5.1)2+(5.3-5.1)2]=0.02.(3)用(m ,n )表示随机地从2010年的五个月和2011年的五个月的数据中各抽取一个数据的基本事件,其中m 表示2010年的数据,n 表示2011年的数据,则所有基本事件有:(2.7,4.9),(2.7,5.0),(2.7,5.1),(2.7,5.2),(2.7,5.3),(2.4,4.9),(2.4,5.0),(2.4,5.1),(2.4,5.2),(2.4,5.3),(2.8,4.9),(2.8,5.0),(2.8,5.1),(2.8,5.2),(2.8,5.3),(3.1,4.9),(3.1,5.0),(3.1,5.1),(3.1,5.2),(3.1,5.3),(2.9,4.9),(2.9,5.0),(2.9,5.1),(2.9,5.2),(2.9,5.3),共25种.其中满足相同月份2010年通货膨胀,并且2011年严重通货膨胀的基本事件有: (3.1,5.0),(3.1,5.1),(3.1,5.2),(3.1,5.3),共4种,所以P =425=0.16,即相同月份2010年通货膨胀,并且2011年严重通货膨胀的概率为0.16.12. 为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数(1)表中m ,n ,M (2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?解析:(1)M =10.02=50, m =50-(1+4+20+15+8)=2,N =1.0,n =250=0.04. (2)略.(3)在153.5~157.5范围内最多.13.(2012·衡阳模拟)在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图.(2)这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?解析:(1)∵各小组的频率之和为 1.00,第一、三、四、五小组的频率分布分别是0.30,0.15,0.10,0.05,∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.∴落在59.5~69.5的第二小组的小长方形的高=频率组距=0.4010=0.04,则补全的频率分布直方图如图所示.(2)设九年级两个班参赛的学生人数为x 人.∵第二小组的频数为40人,频率为0.40,∴40x=0.40,解得x =100. ∴这两个班参赛的学生人数为100人.(3)∵0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5, 即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,∴九年级两个班参赛学生的成绩的中位数应落在第二小组内.14.(2013·江门一模)甲、乙两药厂生产同一型号药品,在某次质量检测中,两厂各有5份样品送检,检测的平均得分相等(检测满分为100分,得分高低反映该样品综合质量的高低).成绩统计用茎叶图表示如图:(1)求a ;(2)某医院计划采购一批该型号药品,从质量的稳定性角度考虑,你认为采购哪个药厂的产品比较合适?(3)检测单位从甲厂送检的样品中任取两份作进一步分析,在抽取的两份样品中,求至少有一份得分在(90,100]之间的概率.解析:(1)依题意,88+89+90+91+925=84+88+89++a +965=90, 解得a =3.(2)因为x 甲=x 乙=90,s 2甲=15[(88-90)2+(89-90)2+(90-90)2+(91-90)2+(92-90)2]=2, s 2乙=15[(84-90)2+(88-90)2+(89-90)2+(93-90)2+(96-90)2]=17.2, 因为s 2甲<s 2乙,所以从质量的稳定性角度考虑,采购甲药厂的产品比较合适.(3)从甲厂的样品中任取两份的所有结果有:(88,89),(88,90),(88,91),(88,92),(89,90),(89,91),(89,92),(90,91),(90,92),(91,92),共10种,其中至少有一份得分在(90,100]之间的所有结果有:(88,91),(88,92),(89,91),(89,92),(90,91),(90,92),(91,92),共7种,所以在抽取的样品中,至少有一份分数在(90,100]之间的概率P =710.。
人教A版必修32.2.1用样本的频率分布估计总体分布课时
作业(附答案和解释)
c 时提升作业(十二)
用样本的频率分布估计总体分布
(25分钟 60分)
一、选择题(每小题5分,共25分)
1对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是( )
A频率分布折线图与总体密度曲线无关
B频率分布折线图就是总体密度曲线
c样本容量很大的频率分布折线图就是总体密度曲线
D如果样本容量无限增大、分组的组距无限减小,那么频率分布折线图就会无限接近总体密度曲线
【解析】选D总体密度曲线通常是用样本频率分布估计出的而频率分布折线图在样本容量无限增大,分组的组距无限减小的情况下会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线2一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为 ( )
A10组B9组c8组D7组
【解析】选B根据列频率分布表的步骤, = =89所以分为9组较为恰当
3有一个容量为45的样本数据,分组后各组的频数如下(125,155],3;(155,185],8;(185,215],9;(215,245],11;(245,275],10;(275,305],4由此估计,不大于275的数据约为总体的( )
A91%B92%c95%D30%
【解析】选A不大于275的样本数为3+8+9+11+10=41,所以约占总体百分比为×100%≈91%
4(8=65,。
高三数学用样本估计总体试题1.某学生在一门功课的22次考试中,所得分数如下茎叶图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117B.118C.118.5D.119.5【答案】B【解析】22次考试分数最大为98,最小为56,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118,故选B.【考点】茎叶图.2. PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,一般情况下PM2.5的浓度越大,大气环境质量越差.右边的茎叶图表示的是成都市区甲乙两个监测站某10日内每天的PM2.5浓度读数(单位:),则下列说法正确的是( )A.这10日内甲、乙监测站读数的极差相等B.这10日内甲、乙监测站读数的中位数中,乙的较大C.这10日内乙监测站读数的众数与中位数相等D.这10日内甲、乙监测站读数的平均数相等【答案】C【解析】甲的极差是98-43=55,乙的极差是94-37=57,两者不相等,A错误;甲的中位数是=74,乙的中位数是68,甲的中位数较大,B错误;乙的众数为68,与中位数相同,C正确;甲的平均数是(43+63+65+72+73+75+78+81+86+98)×=73.4乙的平均数是(37+58+61+65+68+68+71+77+82+94)×=68.1,可知D错误【考点】统计,茎叶图,极差,中位数,众数,平均数.3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5) 4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5) 3根据样本的概率分布估计,大于或等于31.5的数据约占()A.B.C.D.【答案】B【解析】大于或等于31.5的数据是最后的3组,故大于或等于31.5的数据约占=.4.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)(2)质量指标值的样本平均数为100,质量指标值的样本方差为104(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)根据频率分布表与频率分布直方图的关系,先根据:频率=频数/总数计算出各组的频率,再根据:高度=频率/组距计算出各组的高度,即可以组距为横坐标高度为纵坐标作出频率分布直方图;(2)根据题意欲计算样本方差先要计算出样本平均数,由平均数计算公式可得:质量指标值的样本平均数为,进而由方差公式可得:质量指标值的样本方差为;(3)根据题意可知质量指标值不低于95的产品所占比例的估计值为,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.试题解析:(1)(2)质量指标值的样本平均数为.质量指标值的样本方差为.所以这种产品质量指标值(3)质量指标值不低于95的产品所占比例的估计值为,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【考点】1.频率分布表;2.频率分布直方图;3.平均数与方差的计算5.某车间名工人年龄数据如下表:合计(1)求这名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这名工人年龄的茎叶图;(3)求这名工人年龄的方差.【答案】(1)众数为,极差为;(2)详见解析;(3).【解析】(1)根据频率分布表中的相关信息结合众数与极差的定义求出众数与极差;(2)根据频率分布表中的信息以及茎叶图的作法作出这名工人年龄的茎叶图;(3)根据茎叶图所反映的信息,先求出平均数,然后根据方差的计算公式求出这名工人年龄的方差.(1)这名工人年龄的众数为,极差为;(2)茎叶图如下:(3)年龄的平均数为,故这名工人年龄的方差为.【考点】本题考查茎叶图、样本的数字特征,考查茎叶图的绘制,以及样本的众数、极差、平均数以及方差的计算,属于中等题.6.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【答案】C【解析】由图知,样本总数为设第三组中有疗效的人数为,则,故选C.【考点】频率分布直方图.7.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论)【答案】(1);(2),;(3)第4组.【解析】(1)由频率分布表与频率分布直方图即可得结果;(2)由频率分布直方图即可得的值;(3)求平均数..(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6=2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是.从该校随机选取一名学生,估计这名学生该周课外阅读时间少于12小时的概率为.(2)课外阅读时间落在组的有17人,频率为,所以,课外阅读时间落在组的有25人,频率为,所以.(3)估计样本中的100名学生课外阅读时间的平均数在第4组.【考点】本小题主要考查频率分布表、频率分布直方图、频率与概率的关系等基础知识,难度不大,熟练基础知识是解决好本类题目的关键.8.(2014·厦门模拟)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】因为=1,得a=-1,所以s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.9.在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积的,且样本容量为300,则中间一组的频数为( )A.30B.40C.50D.60【答案】C【解析】设中间一个小矩形的面积为x,则其余(n-1)个小矩形面积和为5x,所以x=。
湘教版九年级数学上册第五章用样本推断总体单元评估检测试卷一、单选题(共10题;共30分)1.某班同学参加植树,第一组植树15棵,第二组植树18棵,第三组树数14棵,第四组植树19棵.为了把这个班的植树情况清楚地反映出来,应该制作的统计图为()A. 条形统计图B. 折线统计图C. 扇形统计图D. 条形统计图、扇形统计图均可2.(2017•德州)某专卖店专营某品牌的衬衫,店主对上一周中不同尺码的衬衫销售情况统计如下:该店主决定本周进货时,增加了一些41码的衬衫,影响该店主决策的统计量是()A. 平均数B. 方差C. 众数D. 中位数3.小宁同学根据全班同学的血型绘制了如图所示的扇形统计图,该班血型为A型的有20人,那么该班血型为AB型的人数为()A. 2人B. 5人C. 8人D. 10人4.母亲节快到了,某校团委随机抽取本校部分同学,进行母亲生日日期了解情况调查,分“知道、不知道、记不清”三种情况。
下面图①、图②是根据采集到的数据,绘制的扇形和条形统计图。
请你根据图中提供的信息,若全校共有990名学生,估计这所学校有知道母亲的生日的学生有()名。
A. 440B. 495C. 550D. 6605.下列说法中,正确的是()A. —个游戏中奖的概率是,则做10次这样的游戏一定会中奖B. 为了了解一批炮弹的杀伤半径,应采用全面调查的方式C. 一组数据8,8,7,10,6,8,9的众数是8D. 若甲组数据的方差是0.1,乙组数据的方差是0.2,则乙组数据比甲组数据波动小6.为了鼓励学生课外阅读,学校公布了“阅读奖励”方案,并设置了“赞成、反对、无所谓”三种意见.现从学校所有名学生中随机征求了名学生的意见,其中持“反对”和“无所谓”意见的共有名学生,估计全校持“赞成”意见的学生人数约为()A. B. C. D.7.某校为举办“庆祝建党90周年”的活动,从全校1400名学生中随机调查了280名学生,其中有80人希望举办文艺演出,据此估计该学校希望举办文艺演出的学生人数为()A. 1120B. 400C. 280D. 808.为了估计不透明的袋子里装有多少白球,先从袋中摸出10个球都做上标记,然后放回袋中去,充分摇匀后再摸出10个球,发现其中有一个球有标记,那么你估计袋中大约有()个白球.A. 10B. 20C. 100D. 1219.某市社会调查队对城区内一个社区居民的家庭经济状况进行调查。
专题9.2 用样本估计总体知识储备1.数据的最值、平均数、中位数、百分位数、众数4.频数(率)分布直方图5.用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.所以,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.6.分层抽样的均值与方差以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,x m,平均数为x,方差为s2;第二层有n个数,分别为y1,y2,…,y n,平均数为y,方差为t2.则x=m 11i m =∑x i ,s 2=11m i m =∑(x i -x )2,y =11nii y n=∑,t 2=211()nii y y n=-∑.如果记样本均值为a ,样本方差为b 2,则可以算出a=1m n +(1m i =∑x i +1ni =∑y i )=mx ny m n ++, b 2=2222[()][()]m s x a n t y a m n +-++-+=1m n+222()()mn ms nt x y m n ⎡⎤++-⎢⎥+⎣⎦. 7.常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k 的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.4.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.能力检测注意事项:本试卷满分100分,考试时间45分钟,试题共16题.答卷前,考生务必用0.5毫米黑色签字笔将自己的姓名、班级等信息填写在试卷规定的位置. 一、单选题1.(2020·河北高二学业考试)为了解全年级1180名学生的数学成绩分布情况,在一次数学调研测试后,某教师随机抽取了80份试卷并对试卷得分(满分:150分)进行了整理,得到如下频率分布表:若同一组数据用该区间的中点值作代表,则此次数学测试全年级平均分的估计值是( ). A .110 B .108. 5C .105D .102. 5【答案】B【解析】由题意可得,此次数学测试全年级平均分的估计值是650.025750.050850.100950.1251050.2501150.200⨯+⨯+⨯+⨯+⨯+⨯ 1250.1001350.0751450.075108. 5+⨯+⨯+⨯=.故选:B.2.(2020·广东广州市·高三月考)某学校鼓励学生参加社区服务,学生甲2019年每月参加社区服务的时长(单位:小时)分别为1x ,2x ,…,12x ,其均值和方差分别为x 和2s ,若2020年甲每月参加社区服务的时长增加1小时,则2020年甲参加社区服务时长的均值和方差分别为( ) A .x ,2s B .1x +,21s +C .x ,21s +D .1x +,2s【答案】D【解析】由题意可知12121()12x x x x =++⋅⋅⋅+,222121221[()()()]12s x x x x x x =-+-+⋅⋅⋅+-, 设2020年甲参加社区服务时长的均值和方差分别为'x ,'2s ,则'1212121211[(1)(1)(1)][()12]11212x x x x x x x x =++++⋅⋅⋅++=++⋅⋅⋅++=+, '222212121[(11)(11)(11)]12x x x x x x s =+--++--+⋅⋅⋅++--22212121[()()()]12x x x x x x =-+-+⋅⋅⋅+-2s =故选:D 3.(2020·湖北十堰市·高二期中)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.6,则,x y 的值分别A .58、B .57、C .78、D .7、7【答案】D 【解析】组数据的中位数为17,7x ∴=,乙组数据的平均数为17.4,()191616102917.45y ∴+++++=, 得8087y +=,则7y =,故选:D .4.(2020·湖北高三学业考试)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了50根棉花的纤维长度(单位:mm),其频率分布直方图如图所示.根据频率分布直方图,估计事件“棉花的纤维长度大于275mm”的概率为( )A .0.30B .0.48C .0.52D .0.70【答案】C 【解析】“棉花的纤维长度大于275mm”的概率为500.0040500.0064⨯+⨯0.52=.故选:C5.(2020·湖北高三学业考试)为做好精准扶贫工作,需关注贫困户的年收入情况.经统计,某贫困户近5年的年收分别为1a ,2a ,3a ,4a ,5a .下面给出的指标可以用来评估该贫困户年收入的稳定A .1a ,2a ,3a ,4a ,5a 的平均数B .1a ,2a ,3a ,4a ,5a 的标准差C .1a ,2a ,3a ,4a ,5a 的最大值D .1a ,2a ,3a ,4a ,5a 的中位数【答案】B【解析】标准差反映了各数据对平均数的偏离, 反映了一组数据的离散程度,在本题中即稳定程度, 而其他的统计量则不能反映稳定程度,故选:B6.(2020·全国高三专题练习)中国传统文化是中华民族智慧的结晶,是中华民族的历史遗产在现实生活中的展现.为弘扬中华民族传统文化,某校学生会为了解本校高一1000名学生的课余时间参加传统文化活动的情况,随机抽取50名学生进行调查.将数据分组整理后,列表如下:以下四个结论中正确的是( ). A .表中m 的数值为10B .估计该校高一学生参加传统文化活动次数不高于2场的学生约为180人C .估计该校高一学生参加传统文化活动次数不低于4场的学生约为360人D .若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为25 【答案】C【解析】A 选项,由题意可得,8%10%20%26%18%%4%2%1m +++++++=, 则12m =;故A 错;B 选项,由题意可得,样本中该校高一学生参加传统文化活动次数不高于2场的学生占比为8%12%20%+=,则该校高一学生参加传统文化活动次数不高于2场的学生约为100020%200⨯=人;故B 错; C 选项,由题意,样本中该校高一学生参加传统文化活动次数不低于4场的学生占比为18%12%4%2%36%,则该校高一学生参加传统文化活动次数不低于4场的学生约为360人;故C 正确;D 选项,从若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为10002050=;故D 错.故选:C. 7.(2020·山东临沂市·高一期末)某工厂12名工人的保底月薪如下表所示,第80百分位是( )A .3050B .2950C .3130D .3325【答案】A【解析】把这组数据从小到大排序:2710,2755,2850,2860,2880,2890,2920,2940,2950,3050,3130,3325, 所以%1280%9.6i n p =⨯=⨯=,所以第80百分位是3050,故选:A.8.(2020·黑龙江大庆市·大庆实验中学高二月考(文))在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) A .甲地:总体平均值为3,中位数为4B .乙地:总体平均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为2 【答案】D【解析】不妨通过构造特殊值法进行判断,对于甲地:0,0,0,0,4,4,4,4,4,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于乙地:0,0,0,0,0,0,0,0,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丙地,0,0,1,1,2 ,2,3,3,3,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丁地,当总体平均数是2时,若有一个数据超过7,则方差就超过了2,符合题意,因此,一定没有发生大规模群体感染的是丁地.故选:D.二、多选题9.(2020·河北沧州市·高二期中)甲、乙两名射击运动员在某次测试中各射击20次,两人测试成绩的条形图如图所示,则()A.甲运动员测试成绩的中位数等于乙运动员测试成绩的中位数B.甲运动员测试成绩的众数大于乙运动员测试成绩的众数C.甲运动员测试成绩的平均数大于乙运动员测试成绩的平均数D.甲运动员测试成绩的方差小于乙运动员测试成绩的方差【答案】AD【解析】由图可得甲运动员测试成绩中3次7环,8次8环,5次9环,4次10环,所以甲运动员测试成绩的中位数为8,众数为8,平均数为3788594108.520⨯+⨯+⨯+⨯=,方差2222(78.5)3(88.5)8(98.5)5(108.5)4192020 -⨯+-⨯+-⨯+-⨯=;乙运动员测试成绩中4次7环,7次8环,4次9环,5次10环,所以乙运动员测试成绩的中位数为8,众数为8,平均数为4778495108.520⨯+⨯+⨯+⨯=,方差2222(78.5)4(88.5)7(98.5)4(108.5)5232020 -⨯+-⨯+-⨯+-⨯=,故选项A正确,B不正确,C不正确,D正确,故选:AD10.(2020·河北巨鹿中学高二月考)2020年3月6日,在新加坡举行的世界大学生辩论赛中,中国选手以总分230.51分获得冠军.辩论赛有7位评委进行评分,首先这7位评委给出某对选手的原始分数,评定该队选手的成绩时从7个原始成绩中去掉一个最高分、一个最低分,得到5个有效评分,则5个有效评分与7个原始评分相比,可能变化的数字特征是( ) A .中位数 B .平均数C .方差D .极差【答案】BCD【解析】因为5个有效评分是7个原始评分中去掉一个最高分、一个最低分, 所以中位数不变,平均数、方差、极差可能发生变化, 所以可能变化的数字特征是平均数、方差、极差.故选:BCD.11.(2020·湖南省汨罗市第二中学高三开学考试)气象意义上从春季入夏季的标志为:“连续5天的日平均温度均不低于22℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):①甲地:5个数据的中位数为24,众数为22; ②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8. 则肯定进入夏季的地区有( ) A .①②③ B .②C .③D .①【答案】CD【解析】由统计知识,①甲地:5个数据的中位数为24,众数为22,5个数据中2个是22,有2个大于24,一个是24,可知①符合题意;而②乙地:5个数据的中位数为27,总体均值为24,有可能某一天的气温低于22℃,所以不符合题意;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.若有某一天的气温低于22℃,则总体方差就大于10.8,所以满足题意,故选:CD. 12.(2020·南京航空航天大学附属高级中学高二开学考试)已知一组数据1x ,2x ,3x ,4x ,5x 的平均数和方差均为2,则下列叙述正确的有( ) A .11x +,21x +,31x +,41x +,51x +的平均数为3 B .11x +,21x +,31x +,41x +,51x +的方差为3 C .12x ,22x ,32x ,42x ,52x 的方差为4D .122x +,222x +,322x +,422x +,522x +的方差为8 【答案】AD【解析】对,A B 选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变,故其平均数是3,方差是2;故A 正确;B 错误;对C ,将每个数据乘以2,故其方差变为原来的4倍,即为8,故C 错误; 对D ,将每个数据乘以2再加2,故其方差也变为原来的4倍,即为8,故D 正确. 故选:AD . 三、填空题13.(2020·贵溪市实验中学高三月考)甲乙两名链球运动员在比赛中各投掷5次,成绩如表(单位:米)22S S 甲乙、分别表示甲、乙两人比赛成绩的方差,则22S S 甲乙、的大小关系是_____________.(用<、=、>连接)【答案】22S S <甲乙【解析】7880778184805x 甲,()()()()()22222217880808077808180848065S 甲⎡⎤=-+-+-+-+-=⎣⎦,7680858277805x 乙,()()()()()22222217680808085808280778010.85S 乙⎡⎤=-+-+-+-+-=⎣⎦,则22S S <甲乙,故答案为:22S S <甲乙.14.(2020·西城区·北京铁路二中高三期中)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,给出下列四个结论:①第3天至第11天复工复产指数均超过80%;②这11天期间,复产指数增量大于复工指数的增量;③第9天至第11天复产指数增量大于复工指数的增量;④第1天至第3天复工指数的方差大于第2天至第4天复工指数的方差.其中所有正确结论的序号是____________________.【答案】①①【解析】由图像可得,第3天至第11天复工复产指数均超过80%,故①正确;由图像可得,第1天复产指数与复工指数的差大于第11天复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故②错误;由图像可得,第9天至第11天复产指数增量大于复工指数的增量;故③正确;由图像可得,第1天至第3天复工指数波动较小,第2天至第4天复工指数波动较大,所以第1天至第3天复工指数的方差小于第2天至第4天复工指数的方差,故④错误.故答案为:①①15.(2020·北京高一期末)某班数学兴趣小组组织了线上“统计”全章知识的学习心得交流:甲同学说:“在频率分布直方图中,各小长方形的面积的总和小于1”;乙同学说:“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”;丙同学说:“扇形图主要用于直观描述各类数据占总数的比例”;丁同学说:“标准差越大,数据的离散程度越小”.以上四人中,观点正确的同学是______.【答案】乙丙【解析】在频率分布直方图中,各小长方形的面积的总和等于1,故甲的观点错误;“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”,故乙的观点正确,“扇形图主要用于直观描述各类数据占总数的比例”,故丙的观点正确;“标准差越大,数据的离散程度越大”,故丁的观点错误.故答案为:乙丙.四、双空题16.(2020·滁州市第二中学高二月考)某高校在2013年的自主招生考试成绩中随机抽取50名学生的笔试成绩,绘制成频率分布直方图如图所示,由图中数据可知a=________;若要从成绩(单位:分)在[85,90),[90,95),[95,100]三组内的学生中,用分层抽样的方法选取12人参加面试,则成绩(单位:分)在[95,100]内的学生中,学生甲被选取的概率为________.【答案】0.04 0.4【解析】由频率分布直方图知,(0.0160.0640.060.02)51a++++⨯=,所以0.04a=.第3组的人数为0.06055015⨯⨯=,第4组的人数为0.04055010⨯⨯=,第5组的人数为0.0205505⨯⨯=,因为第3、4、5组共抽30名学生,所以利用分层抽样在30名学生中抽取12名学生.每组抽取的人数分别为:第3组:15126 30⨯=,第4组:10124 30⨯=第5组:512230⨯=,所以第3、4、5组分别抽取6人、4人、2人.则成绩在[95,100]内的5个学生中抽2个,学生甲被选取的概率为0.4故答案为:0.04;0.4。
第二节用样本估计总体
时间:45分钟分值:75分
一、选择题(本大题共6小题,每小题5分,共30分)
1.(2013·卷)如下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)的频率为( )
A.0.2 B.0.4
C.0.5 D.0.6
解析由茎叶图可知数据落在区间[22,30)的频数为4,所以数据
落在区间[22,30)的频率为4
10
=0.4,故选B.
答案 B
2.(2013·卷)对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图. 根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35)上为三等品. 用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是( )
A.0.09 B.0.20
C.0.25 D.0.45
解析由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-5×(0.02+0.04+0.06+0.03)=0.25,则二等品的频率为0.25+0.04×5=0.45,故任取1件为二等品的概率为0.45.
答案 D
3.(2013·卷)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成
[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( ) 解析由茎叶图知,各组频数统计如下表:
答案 A
4.(2014·预测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )
A.甲B.乙
C.甲乙相等D.无法确定
解析由茎叶图可知甲数据比较集中,所以甲地浓度的方差小,选A.
答案 A
5.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
最佳人选是( )
A.甲B.乙
C.丙D.丁
解析由题目表格中数据可知,丙平均环数最高,且方差最小,说明丙技术稳定,且成绩好,选C.
答案 C
6.样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…y m )的平均数z =αx +(1-α)y ,其中0<α<12
,则n ,m 的大小关系为( ) A .n <m
B .n >m
C .n =m
D .不能确定
解析 依题意得x 1+x 2+…+x n =n x ,y 1+y 2+…+y m =m y , x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n )z =(m +n )αx +(m +n )(1-α)y ,
所以n x +m y =(m +n )αx +(m +n )(1-α)y .
所以⎩⎪⎨⎪⎧
n =(m +n )α,m =(m +n )(1-α). 于是有n -m =(m +n )[α-(1-α)]
=(m +n )(2α-1).
因为0<α<12
,所以2α-1<0. 所以n -m <0,即n <m .
答案 A
二、填空题(本大题共3小题,每小题5分,共15分)
7.某校举行2014年元旦汇演,九位评委为某班的节目打出的分数(百分制)如茎叶统计图所示,去掉一个最高分和一个最低分后,所剩数据的中位数为________.
解析根据茎叶图,去掉一个最高分和一个最低分后,得到的数据为七个,中位数为85.
答案85
8.(2014·调研)
某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则
(1)图中的x=________;
(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.
解析由频率分布直方图知20x=1-20×(0.025+0.006 5+0.003+0.003),解得x=0.012 5.上学时间不少于1小时的学生频率为0.12,因此估计有0.12×600=72人可以申请住宿.
答案 0.012 5 72
9.(2014·联考)已知x 是1,2,3,x,5,6,7这七个数据的中位数,且
1,3,x ,-y 这四个数据的平均数为1,则1x
+y 的最小值为__________. 解析 由已知得3≤x ≤5,1+3+x -y 4
=1, ∴y =x ,
∴1x +y =1x +x ,又函数y =1x
+x 在[3,5]上单调递增,∴当x =3时取最小值103
. 答案 103
三、解答题(本大题共3小题,每小题10分,共30分)
10.(2014·调研)甲、乙两台机床同时生产一种零件,在10天中,两台机床每天出的次品数分别是:
10天生产中出次品的平均数较小?出次品的波动较小?
解 x 甲=110
×(0×3+1×2+2×3+3×1+4×1)=1.5, x 乙=110
×(0×2+1×5+2×2+3×1)=1.2, s 2
甲
=110×[(0-1.5)2+(1-1.5)2+(0-1.5)2+…+(2-1.5)2+(4-1.5)2]=1.65,
s22=
1
10
×[(2-1.2)2+(3-1.2)2+(1-1.2)2+…+(0-1.2)2+(1-
1.2)2]=0.76.
从结果看乙台机床10天生产中出次品的平均数较小,出次品的波动也较小.
11.(2013·新课标全国卷Ⅱ)经销商经销某种农产品,在一个销售季度,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度市场需求量的频率分布直方图,如下图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度的市场需求量,T(单位:元)表示下一个销售季度经销该农产品的利润.
(1)将T表示为X的函数;
(2)根据直方图估计利润T不少于57 000元的概率.
解(1)当X∈[100,130)时,T=500X-300(130-X)
=800X-39 000.
当X∈[130,150]时,T=500×130=65 000.
所以T =⎩⎪⎨⎪⎧
800X -39 000,100≤X <130,65 000,130≤X ≤150. (2)由(1)知利润T 不少于57 000元当且仅当120≤X ≤150.
由直方图知需求量X ∈[120,150]的频率为0.7,所以下一个销售季度的利润T 不少于57 000元的概率的估计值为0.7.
12.(2013·卷)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1、x 2, 估计x 1-x 2的值.
解 (1)设甲校高三年级学生总人数为n .
由题意知,30n
=0.05,即n =600.
样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲
校高三年级此次联考数学成绩及格率为1-530=56
. (2)设甲、乙两校样本平均数分别为x ′1,x ′2.
根据样本茎叶图可知,30(x ′1-x ′2)=30x ′1-30x ′2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.
因此x ′1-x ′2=0.5.故x 1-x 2的估计值为0.5分.。