用样本估计总体练习题
- 格式:doc
- 大小:98.50 KB
- 文档页数:8
高一数学用样本估计总体试题1.一个样本的方差是.【答案】5【解析】由样本可得,所以平均数为4;所以样本的方差为.【考点】样本数值特征.2.在一次选拔运动员中,测得7名选手的身高(单位:cm)的茎叶图为:,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为.【答案】8【解析】由茎叶图可知:7名选手的身高分别为170、173、170+x、178、179、180、181,所以由此可得,所以x=8.【考点】茎叶图.3.在一次选拔运动员中,测得7名选手的身高(单位:cm)的茎叶图为:,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为.【答案】8【解析】由茎叶图可知:7名选手的身高分别为170、173、170+x、178、179、180、181,所以由此可得,所以x=8.【考点】茎叶图.4.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.5.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为6,则报考飞行员的学生人数是()A.36B.40C.48D.50【答案】C【解析】设报考飞行员的人数为,根据前3个小组的频率之比为,可设前三小组的频率分别为;由题意可知所求频率和为1,即,解得,则,解得.故选C.【考点】频率分布直方图.6.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约()A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.7.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( ).A.3.5B.-3C.3D.-0.5【答案】B【解析】数据相差了,平均数相差,故求出的平均数与实际平均数相差.【考点】平均数.8.某教师出了一份三道题的测试卷,每道题1分,全班得3分、2分、1分和0分的学生所占比例分别为30%、50%、10%和10%,则全班学生的平均分为分.【答案】2【解析】设班级总人数为n人,得3分的是人,得2分的是人,得1分的是人,得0分的是人,故班级平均分.【考点】数据的平均数公式及数据的基本处理能力.9.若样本的频率分布直方图中一共有个小矩形,中间一个小矩形的面积等于其余个小矩形面积和的,且样本容量为160,则中间一组的频数是()A.32B.20C.40D.25【答案】A【解析】设中间一个小矩形的面积为,其余个小矩形的面积之和为,依题意有,求解得到,所以中间一组的频率为,中间一组的频数为,故选A.【考点】频率分布直方图.10.200辆汽车通过某一段公路时,时速的频率分布直方图如右图所示,则时速在[50,70)的汽车大约有().A.60辆 B.80辆C.70辆D.140辆【答案】D【解析】需根据直方图中求出各个矩形的面积,即为各组频率,再由总数乘以频率即得各组频数.解:由直方图可知,时速在[50,60]的频率为0.03×10=0.3 时速在[60,70]的频率为0.04×10=0.4 所以时速在[50,70]的汽车大约有200×(0.3+0.4)=140辆.故答案为D.【考点】直方图点评:本题考查频率分布直方图的相关知识.直方图中的各个矩形的面积代表了频率,所以各个矩形面积之和为1.11.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,.(1)求图中的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.分数段【答案】(1).(2)73.(3)10【解析】(1)依题意得,,解得.(2)这100名学生语文成绩的平均分为:(分).(3)数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:.所以数学成绩在之外的人数为:.【考点】本题考查了频率分布直方图的运用点评:注意频率分布直方图中用小长方形面积的大小来表示在各个区间内取值的频率,所以在求频率时,通过已知求出所要区间的面积即可12.为了让学生了解更多“社会法律”知识,某中学举行了一次“社会法律知识竞赛”,共有800名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表,解答下列问题:(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,799,试写出第二组第一位学生的编号;(2)填充频率分布表的空格①②③④并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人?【答案】(1)016 ;(2) 1 8 2 0.28 3 14 4 0.20;(3)256.【解析】(1)编号为016- -2分(2) 1 8 2 0.28 3 14 4 0.20- 每空1分2分在被抽到的学生中获二奖的人数是9+7=16人, 1分占样本的比例是, 1分所以获二等奖的人数估计为800×32%=256人. 1分答:获二等奖的大约有256人. 1分【考点】系统抽样;频率分布表;频率分布直方图。
用样本估计总体(平均数、中位数、众数)练习1、某厂10名工人在一个小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有( )A.a>b>c B.b>c>a C.c>a>b D.c>b>a2、如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________.①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.3、某次测量中A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A 样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( ) A.众数 B.平均数 C.中位数 D.标准差4、已知一组数据的频率分布直方图如图所示.求众数、中位数、平均数.5、如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数)分别是( )A.12.5、12.5 B.12.5 、13C.13、12.5 D.13、136、从下列频率分布直方图中估计所有中位数与众数之和为元。
7.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是( )A.3 B.4 C.5 D.68.关于统计数据的分析,有以下几个结论:①一组数不可能有两个众数;②将一组数据中的每个数据都减去同一个数后,方差没有变化;③调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样;④一组数据的方差一定是正数;⑤如右图是随机抽取的200辆汽车通过某一段公路时的时速分布直方图,根据这个直方图,可以得到时速在[50,60)的汽车大约是60辆.则这5种说法中错误的个数是( )A.2 B.3 C.4 D.59、某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成、绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分及众数.(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.10、如图是某市有关部门根据该市干部的月收入情况,画出的样本频率分布直方图,已知图中第一组的频数为4 000,请根据该图提供的信息解答下列问题.(1)求样本中月收入在[2 500,3 500)的人数;(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这组中应抽多少人?(3)试估计样本数据的中位数.答案:1、D 2、①② 3、D 4、众数:65,中位数:65,平均数:67 5、B 6、7400 7、C 8、B 9、(1)0.005(2)73(3)10人 10、(1)2000(2)20人(3)1750元。
新高考数学一轮复习考点知识专题讲解与练习考点知识总结57 用样本估计总体高考概览高考在本考点的常考题型为选择题、填空题,分值为5分,中、低等难度考纲研读1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图,并体会它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据的标准差3.能从样本数据中提取基本的数字特征(如平均数、标准差、百分位数),并做出合理的解释4.会计算分层随机抽样的样本均值与样本方差5.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题一、基础小题1.一组数据90,92,99,97,96,x的众数是92,则这组数据的中位数是() A.94 B.95 C.96 D.97答案A解析数据90,92,99,97,96,x的众数是92,则x=92,所以这组数据为90,92,92,96,97,99,则这组数据的中位数是12×(92+96)=94.故选A.2.如图所示是根据某市3月1日至10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2 B.0C.1 D.2答案D解析由折线图可知,这10天的最低气温按照从小到大的顺序排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.3.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积和的14,且样本量为80,则中间一组的频数为() A.0.25 B.0.5 C.20 D.16答案D解析设中间一组的频数为x,依题意有x80=14⎝⎛⎭⎪⎫1-x80,解得x=16.4.研究人员随机调查统计了某地1000名“上班族”每天在工作之余使用手机上网的时间,并将其绘制为如图所示的频率分布直方图,若同一组数据用该区间的中点值作代表,则可估计该地“上班族”每天在工作之余使用手机上网的平均时间是()A.1.78小时B.2.24小时C.3.56小时D.4.32小时答案C解析该地“上班族”每天在工作之余使用手机上网的平均时间是(1×0.12+3×0.2+5×0.1+7×0.08)×2=3.56小时.5.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级人数平均分数方差甲20x-2甲乙30x-3乙其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案C解析由题意可知两个班的数学成绩平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30×[2+(x-甲-x-)2]+3020+30×[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.6.2022年4月24日下午,随着最后1例新冠肺炎重症患者治愈,武汉重症病例实现了清零,抗疫工作取得了阶段性重大胜利.某方舱医院从出院的新冠肺炎患者中随机抽取100人,将这些患者的治疗时间(都在[5,30]天内)进行统计,制作出频率分布直方图如图所示,则估计该院新冠肺炎患者治疗时间的中位数是()A.16 B.17C.18 D.19答案B解析设这100名新冠肺炎患者治疗时间的中位数是x,∵(0.01+0.05)×5=0.3<0.5,(0.01+0.05+0.1)×5=0.8>0.5,∴x∈[15,20),0.3+(x-15)×0.1=0.5,解得x=17,则该院新冠肺炎患者治疗时间的中位数是17.故选B.7.(多选)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,下列说法中正确的是()A.这七人岁数的众数变为40B.这七人岁数的平均数变为49C.这七人岁数的中位数变为60D.这七人岁数的标准差变为24答案ABC解析根据众数、平均数、中位数的概念得5年后,每人的年龄相应增加5,而标准差不变,所以这七人年龄的众数变为40;平均数变为49;中位数变为60;标准差不变,为19.故选ABC.8.(多选)为了解运动健身减肥的效果,某健身房调查了20名肥胖者,测量了他们的体重(单位:千克).健身之前他们的体重情况如三维饼图1所示,经过半年的健身后,他们的体重情况如三维饼图2所示.对比健身前后,关于这20名肥胖者,下列结论正确的是()A.他们健身后,体重在区间[90,100)内的人数不变B.他们健身后,体重在区间[100,110)内的人数减少了2个C.他们健身后,体重在区间[110,120)内的肥胖者体重都有减轻D.他们健身后,这20名肥胖者的体重的中位数位于区间[90,100)答案ACD解析题图1中体重在区间[90,100),[100,110),[110,120)内的人数分别为8,10,2;题图2中体重在区间[80,90),[90,100),[100,110)内的人数分别为6,8,6.故选ACD.二、高考小题9.(2022·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析由频率分布直方图,知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;由频率分布直方图,知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;由频率分布直方图,知该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C不正确;由频率分布直方图,知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.故选C.10.(多选)(2022·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,x n的离散程度的是()A.样本x1,x2,…,x n的标准差B.样本x1,x2,…,x n的中位数C.样本x1,x2,…,x n的极差D.样本x1,x2,…,x n的平均数答案AC解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.11.(多选)(2022·新高考Ⅰ卷)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则() A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD解析由题可知x-=x1+x2+…+x nn ,y-=y1+y2+…+y nn=x1+x2+…+x nn+c=x-+c ,因为c ≠0,所以x -≠y -,A 错误;若样本数据x 1,x 2,…,x n 的中位数为x k ,因为y i =x i +c ,c ≠0,所以样本数据y 1,y 2,…,y n 的中位数为y k =x k +c ≠x k ,B 错误;设s x 表示样本数据x 1,x 2,…,x n 的标准差,s y 表示样本数据y 1,y 2,…,y n 的标准差,则样本数据y 1,y 2,…,y n 的标准差s y =1n (y 1-y -)2+(y 2-y -)2+…+(y n -y -)2=1n[(x 1+c )-(x -+c )]2+[(x 2+c )-(x -+c )]2+…+[(x n +c )-(x -+c )]2=1n (x 1-x -)2+(x 2-x -)2+…+(x n -x -)2=s x ,所以C 正确;设样本数据x 1,x 2,…,x n 中最大的为x n ,最小的为x 1,因为y i =x i +c ,所以样本数据y 1,y 2,…,y n 中最大的为y n ,最小的为y 1,极差为y n -y 1=(x n +c )-(x 1+c )=x n -x 1,所以D 正确.故选CD.12.(2022·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A .20B .40 C.64 D .80答案 D解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.13.(2022·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑4i =1p i =1,则下面四种情形中,对应样本的标准差最大的一组是( ) A .p 1=p 4=0.1,p 2=p 3=0.4B .p 1=p 4=0.4,p 2=p 3=0.1C .p 1=p 4=0.2,p 2=p 3=0.3D .p 1=p 4=0.3,p 2=p 3=0.2答案 B解析 对于A ,该组数据的平均数为x -A =(1+4)×0.1+(2+3)×0.4=2.5,方差为s 2A =(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;对于B ,该组数据的平均数为x -B =(1+4)×0.4+(2+3)×0.1=2.5,方差为s 2B =(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85;对于C ,该组数据的平均数为x -C=(1+4)×0.2+(2+3)×0.3=2.5,方差为s 2C =(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05;对于D ,该组数据的平均数为x -D =(1+4)×0.3+(2+3)×0.2=2.5,方差为s 2D =(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45.因此,B 项这一组样本数据的标准差最大.故选B.14.(2022·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.15.(2022·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 平均正点率x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.16.(2022·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案 53解析 这组数据的平均数为8,故其方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.三、模拟小题17.(2022·河北张家口第三次模拟)某中学春季运动会上,12位参加跳高半决赛同学的成绩各不相同,按成绩从高到低取前6位进入决赛,如果小明知道了自己的成绩后,则他可根据其他11位同学成绩的哪个数据判断自己能否进入决赛( )A.中位数B.平均数C.极差D.方差答案A解析12位同学参赛,按成绩从高到低取前6位进入决赛,正好一半,因此可根据中位数判断小明是否能进入决赛.故选A.18.(多选)(2022·广东省花都区高三上学期调研)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的有()A.中位数为3,众数为3B.平均数为3,众数为4C.平均数为3,中位数为3D.平均数为2,方差为2.4答案BD解析对于A,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,所以A不能判断;对于B,若平均数为3,且出现点数为6,则其余4个数的和为9,而众数为4,故其余4个数的和至少为10,所以B可以判断;对于C,当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,所以C不能判断;对于D,若平均数为2,且出现点数6,则方差s2>12=3.2>2.4,所以当平均数5×(6-2)为2,方差为2.4时,一定不会出现点数6.故选BD.19.(多选)(2022·安徽蚌埠高三模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A.甲的成绩的平均数等于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,x-甲=4+5+6+7+85=6,x-乙=3×5+6+95=6,A正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C正确;甲的成绩的极差为4,乙的成绩的极差也为4,D错误.20.(多选)(2022·广东肇庆第二次统一检测)某大学生暑假到工厂参加生产劳动,生产了100件产品,质检人员测量其长度(单位:厘米),将所得数据分成6组:[90,91),[91,92),[92,93),[93,94),[94,95),[95,96],得到如图所示的频率分布直方图,则关于这100件产品,下列说法中正确的是()A.b=0.25B.长度落在区间[93,94)内的个数为35C.长度的众数一定落在区间[93,94)内D.长度的中位数一定落在区间[93,94)内答案ABD解析对于A,由频率和为1,得(0.35+b+0.15+0.1×2+0.05)×1=1,解得b=0.25,故A正确;对于B,长度落在区间[93,94)内的个数为100×0.35=35,故B正确;对于C,这100件产品长度的众数不一定落在区间[93,94)内,故C错误;对于D,由(0.1×2+0.25)×1=0.45<0.5,(0.1×2+0.25+0.35)×1=0.8>0.5,知这100件产品长度的中位数一定落在区间[93,94)内,故D正确.故选ABD.21.(多选)(2022·湖南师大附中高三第二次月考)甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层随机抽样方法从两所学校一共抽取了110名学生的数学成绩,考生成绩都分布在[70,150]内,并作出了如下频数分布统计表,规定考试成绩在[120,150]内为优秀,则下列说法正确的有()分组[70,80)[80,90)[90,100)[100,110)AB.估计甲校优秀率为25%,乙校优秀率为40% C.估计甲校和乙校众数均为120D.估计乙校的数学平均成绩比甲校高答案ABD解析对于A,甲校抽取110×12002200=60人,乙校抽取110×10002200=50人,故x=10,y=7,故A正确;对于B,估计甲校优秀率为1560=25%,乙校优秀率为2050=40%,故B正确;对于C,甲校众数的估计值为105,115,乙校众数的估计值为115,125,故C 错误;对于D,甲校平均成绩为109.5,乙校平均成绩为114.6,故D正确.22.(多选)(2022·湖南六校联考)下图是某市6月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择6月1日至13日中的某一天到达该市,并停留2天,下列说法正确的有()A.该市14天空气质量指数的平均值大于100B.此人到达当日空气质量优良的概率为8 13C.此人在该市停留期间只有1天空气重度污染的概率为2 13D.每连续3天计算一次空气质量指数的方差,其中第5天到第7天的方差最大答案AD解析114×(86+25+57+143+220+160+40+217+160+121+158+86+79+37)=113.5,故A正确;在6月1日至13日这13天中,1日,2日,3日,7日,12日,13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率为613,故B不正确;6月1日至14日连续两天包含的样本点有13个,此人在该市停留期间只有1天空气重度污染的样本点是{4,5},{5,6},{7,8},{8,9},共4个,所以此人在该市停留期间只有1天空气重度污染的概率是413,故C不正确;由空气质量指数趋势图可以看出,从3月5日开始连续三天的空气质量指数方差最大,故D正确.故选AD.23.(2022·山东潍坊高三质检)为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为124,男员工的平均体重为70 kg ,标准差为4,女员工的平均体重为50 kg ,标准差为6.若样本中有20名男员工,则女员工的人数为________.答案 30解析 设男员工的权重为ω男,由题意可知样本的平均数x -=ω男x -男+(1-ω男)x -女=70ω-男+50(1-ω男)=20ω男+50,样本的方差s 2=ω男[s 2男+(x -男-x -)2]+(1-ω男)[s 2女+(x -女-x -)2],即ω男[42+(70-20ω男-50)2]+(1-ω男)[62+(50-20ω男-50)2]=124,解得ω男=0.4,因为样本中有20名男员工,所以样本中女员工的人数为200.4×(1-0.4)=30.一、高考大题1.(2022·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 新设备10.110.410.110.010.1旧设备 9.8 10.0 10.1 10.2 9.7 新设备10.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22.(1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x-≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)由表中的数据可得:x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3, s 21=110×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036,s 22=110×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.(2)由(1)中的数据可得y --x -=10.3-10=0.3,2s 21+s 2210=20.036+0.0410=20.0076=0.0304,因为0.3=0.09>0.0304,所以y --x ->2s 21+s 2210.所以可以认为新设备生产产品的该项指标的均值较旧设备有显著提高.2.(2022·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表(1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解(1)由表中数据可知,甲厂加工出来的一件产品为A级品的概率的估计值为40100=0.4,乙厂加工出来的一件产品为A级品的概率的估计值为28=0.28.100(2)甲分厂加工100件产品的总利润为40×(90-25)+20×(50-25)+20×(20-25)-20×(50+25)=1500元,所以甲分厂加工100件产品的平均利润为15元/件.乙分厂加工100件产品的总利润为28×(90-20)+17×(50-20)+34×(20-20)-21×(50+20)=1000元,所以乙分厂加工100件产品的平均利润为10元/件.故厂家应选择甲分厂承接加工业务.3.(2022·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.4.(2022·全国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解 (1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x -1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x-2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计该家庭使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).二、模拟大题5.(2022·河南郑州一模)河阴石榴是河南省荥阳市的特产,距今已有2100多年的历史,河阴石榴籽粒大,色紫红,甜味浓,被誉为“中州名果”.河阴石榴按照果径大小可以分为四类:标准果、优质果、精品果、礼品果.某超市老板从采购的一批河阴石榴中随机抽取100 kg,根据石榴的等级分类标准得到的数据如下表所示:(1)求a(2)用样本估计总体,超市老板参考以下两种销售方案进行销售:方案1:不分类卖出,单价为20元/kg;方案2:分类卖出,分类后的水果售价如下表所示:=0.2.解(1)a=100-10-30-40=20,礼品果所占比例是20100(2)理由一:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,因为x -=20.6>20,所以从超市老板的销售利润角度考虑,采用方案2比较好.理由二:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,虽然x -=20.6>20,但20.6-20=0.6,差额不太大,从超市老板后期对石榴分类的人力资源和时间成本角度考虑,采用方案1比较好.6.(2022·湖南师大附中第一次大练习)某学校团委组织了“文明出行,爱我中华”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(单位:分)整理后,得到如图所示的频率分布直方图(其中分组区间为[40,50),[50,60),…,[90,100]).(1)求成绩在[70,80)的频率,并补全此频率分布直方图;(2)求这次考试平均分的估计值(同一组中的数据以这组数据所在区间中点的值作代表);(3)若从成绩在[40,50)和[90,100]的学生中任选两人,求他们的成绩在同一分组区间的概率.解 (1)成绩在[70,80)的频率为1-(0.005+0.015+0.020+0.030+0.005)×10=0.25.补全频率分布直方图如下:(2)依题意可得,平均分x-=(45×0.005+55×0.015+65×0.020+75×0.025+85×0.030+95×0.005)×10=72.5.故这次考试平均分的估计值为72.5.(3)成绩在[40,50)和[90,100]的人数分别是3和3,所以从成绩在[40,50)和[90,100]内的学生中任选两人,将[40,50)分数段的3人编号为A1,A2,A3,将[90,100]分数段的3人编号为B1,B2,B3,从中任取两人,则样本空间Ω={(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,B3),(A2,A3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),(B1,B2),(B1,B3),(B2,B3)},共有15个样本点,这15个样本点发生的可能性是相等的.其中,在同一分数段内的事件所含样本点有(A1,A2),(A1,A3),(A2,A3),(B1,B2),(B1,B3),(B2,B3),共6个,故所求概率P=615=25.7.(2022·河北省衡水市第一中学高三上学期第一次调研)“2022年全国城市节约用水宣传周”已于5月9日至15日举行.成都市围绕“贯彻新发展理念,建设节水型城市”这一主题,开展了形式多样、内容丰富的活动.进一步增强全民保护水资源,防治水污染,节约用水的意识.为了解活动开展成效,某街道办事处工作人员赴一小区调查住户的节约用水情况,随机抽取了300名业主进行节约用水调查评分,将得到的分数分成6组:[70,75),[75,80),[80,85),[85,90),[90,95), [95,100],得到如图所示的频率分布直方图.(1)求a的值,并估计这300名业主评分的中位数;(2)若先用比例分配的分层随机抽样的方法从评分在[90,95)和[95,100]的业主中抽取5人,然后再从抽出的这5名业主中任意选取2人做进一步访谈,求这2人中至少有1人的评分在[95,100]的频率.解(1)∵第三组的频率为1-(0.020+0.025+0.030+0.035+0.050)×5=0.200,=0.040.∴a=0.2005又第一组的频率为0.025×5=0.125,第二组的频率为0.035×5=0.175,第三组的频率为0.200,∴前三组的频率之和为0.125+0.175+0.200=0.500,∴这300名业主评分的中位数为85.(2)由频率分布直方图,知评分在[90,95)的人数与评分在[95,100]的人数的比值为3∶2,∴采用比例分配的分层随机抽样法抽取5人,评分在[90,95)的有3人,评分在[95,100]的有2人.不妨设评分在[90,95)的3人分别为A1,A2,A3,评分在[95,100]的2人分别为B1,B2,则从5人中任选2人的所有可能情况有{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10种.其中选取的2人中至少有1人的评分在[95,100]的情况有{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共7种.故这2人中至少有1人的评分在[95,100]的概率为P=710.。
高一数学用样本估计总体试题答案及解析1.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取20人参加一项活动,则从身高在[120,130内的学生中选取的人数应为.【答案】10【解析】由频率分布直方图可得:;则[120,130),[130,140),[140,150]三组人数所占的比例为,则在[120,130内选取的人数应为.【考点】频率分布直方图.2.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约( )A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.4.某校五四演讲比赛中,七位评委为一选手打出的分数如下:90 86 90 97 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.B.C.D.【答案】B【解析】由题意知,去掉一个最高分和一个最低分后,所剩数据的平均数为;方差为故选B.【考点】样本平均数和方差的计算.5.统计某校800名学生的数学期末成绩,得到频率分布直方图如图所示,若考试采用100分制,并规定不低于60分为及格,则及格率为.【答案】0.8【解析】由图形可知及格率为,答案为0.8.【考点】频率分布直方图6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ).A.甲B.乙C.丙D.丁【答案】C.【解析】分析表格可知,乙与丙的平均环数最多,又丙的方差比乙小说明丙成绩发挥的较为稳定,所以最佳人选为丙.【考点】数据的平均数与方差的意义.7.一次选拔运动中,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( )A.5B.6C.7D.8【答案】D【解析】由图可知7名同学的身高分别为180、181、170、173、,178、179而7名同学的平均身高为177,所以有得=178,所以【考点】茎叶图8.由正整数组成的一组数据,其平均数和中位数都是,且标准差等于,则这组数据为 .(从小到大排列)【答案】【解析】由已知不妨假设,则,又因为标准差等于,所以,且都是正整数,观察分析可知这组数据只可为:1,1,3,3.【考点】1.平均数与中位数;2.标准差;3.方程组思想.9.某路段属于限速路段,规定通过该路段的汽车时速不得超过70km/h,否则视为违规扣分,某天有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图,如下图所示,则违规扣分的汽车大约为辆.【答案】120.【解析】易求得70-80这组的频率为1-0.05-0.18-0.38-0.27=0.12,则违规扣分的汽车大约为辆.【考点】频率分布直方图中每组对应的长方形面积为,总面积为1,频数=频率样本容量.10.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】0.04;440【解析】由频率分布直方图得:,解得;志愿者年龄在[25,35)的人数为.【考点】概率与统计.11.将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用表示,则x的值为( )A.0B.4C.5D.7【答案】A【解析】如果是最高得分的话,,所以是最大值,那么,解得,故选A.【考点】茎叶图12.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差______.【答案】3.2【解析】由平均数及方差的定义可得;.【考点】样本数据的数字特征:平均值与方差.13.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少;(3)这两个班参赛学生的成绩的中位数应落在第几小组内.【答案】(1)第二小组的频率为,补全的频率分布直方图详见解析;(2)100人;(3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.【解析】(1)先从所给的直方图中得出第一、三、四、五小组的频率,然后用1减去第一、三、四、五小组的频率和得到第二小组的频率,接着由确定第二小组的小长方形的高,从而可补全频率分布直方图;(2)用第二小组的频数除以该组的频率,即可计算出九年两个班参赛学生的总人数;(3)要确定中位数所在的小组,只需先确定各小组的频数,从第一小组开始累加,当和达到总人数的一半时的组就是中位数所在的小组.试题解析:(1)∵各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05∴第二小组的频率为:∴落在59.5~69.5的第二小组的小长方形的高,则补全的频率分布直方图如图所示(2)设九年级两个班参赛的学生人数为人∵第二小组的频数为40人,频率为0.40∴,解得所以这两个班参赛的学生人数为100人(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5所以九年级两个班参赛学生的成绩的中位数应落在第二小组内【考点】1.频率分布直方图;2.转化与运算能力.14.在样本的频率分布直方图中, 共有9个小长方形, 若第一个长方形的面积为0.02, 前五个与后五个长方形的面积分别成等差数列且公差互为相反数,若样本容量为160, 则中间一组(即第五组)的频数为()A.12B.24C.36D.48【答案】C【解析】设公差为d,那么9个小长方形的面积分别为0.02,0.02+d,0.02+2d,0.02+3d,0.02+4d,0.02+3d,0.02+2d,0.02+d,0.02,而9个小长方形的面积和为 1,可得0.18+16d=1 可以求得d=∴中间一组的频数为:160×(0.02+4d)=36.故答案为:36.故选C。
9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。
,nx +)标准差与方差据1x ,nx +,标22()(n x x x x +-++-2(n x x ++-知识点三:在频率分布直方图中,众数,中位数,平均数的估计值最高的小矩形底边中点的横坐标即是众数中位数左边和右边的所有小矩形的面积和是相等的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标3,b ,3,b ,【答案】45 45.85379⨯=975%∴+=25m故选:B.例题4.(PM2.5的浓度(单位:知这组数据的极差为A.73 B.75 C.77 D.79,,n x 的平均数个分数分别为18,,,x x ,6,8,,x 的平均数为228361001081210++++-=x ,28624++=x 8610++++x ,即12864+++=x x x 2624888-⨯=故答案为:14..(2022·全国55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数2,3,,)n ,则下列结论正确的是(2,3,,)n ,则它们的众数也满足该关系,12(21)(21)(21)nn y x x x nn++-+-++-=1nx n++- 121b =-,故B 正确;由方差的性质可得2c =C 正确;23,x x ,…,,假设其第80百分位数为1d , 是整数时,x 21,2x x --30,,x 的平均数为10,,x 这10个数的平均数为8,方差为30,,x ___________. 【详解】由题意得12306x x x +++=2309x ++=⨯1081080x ++=⨯=,222121058690x x x =⨯+=++,所以剩余的20个数的平均数为18080520-=, 30221350690660x +=-=+,所以剩余的20个数的方差为66020258-=,故答案为:82022·全国·高一单元测试)敢于冒险奋进精神的载体,A.这组数据的极差为50 B.这组数据的众数为76(0.005+0.75800.3-+故选:CD例题2.(学生人数比例、[(1)估计总体400名学生中分数小于60的人数;分数小于60的频率为()10.020.040.02100.2-++⨯=,所以[)60,70x ∈,即()0.2600.010.25x +-⨯=,解得65x =,则本次考试的及格分数线为65分.例题3.(2022·全国·高一单元测试)中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购进了160箱该特产,以x (单位:箱,100200x ≤≤)表示市场需求量,y (单位:元)表示经销该特产的利润.(1)根据频率分布直方图估计市场需求量的众数和平均数;(2)将y 表示为x 的函数;(3)根据频率分布直方图求利润不少于4800元的频率.【答案】(1)150,153(2)804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩(3)0.9(1)由频率分布直方图,得市场需求量的众数的估计值是150,需求量为[100,120)的频率为0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,需求量为[160,180)的频率为0.0125×20=0.25,需求量为[180,200]的频率为0.0075×20=0.15,则市场需求量的平均数约为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.(2)因为每售出1箱该特产获利50元,未售出的,每箱亏损30元,所以当100160≤<x 时,5030(160)804800y x x x =-⨯-=-,当160200x ≤≤时,160508000y =⨯=,所以804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩. (3)当100160≤<x 时,由8048004800x -≥,得120160x ≤<;当160200x ≤≤时,80004800y =>,所以当120200x ≤≤时,利润不少于4800元,所以由(1)知利润不少于4800元的频率为10.10.9-=.同类题型归类练A.此次测试众数的估计值为85(1)求频率分布直方图中a的值;(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)(1)求出表中m,p的值;(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;(1)请你估计该地区所有用户评分的25%,95%分位数;(1)求频率分布直方图中x的值以及样本中身高不低于175cm的学生人数;(1m ii x x =-∑同理可得21s m ∴=+1⎡、、A .20B .40C .64D .80根据此频率分布直方图,下面结论中不正确的是( ) A .该地农户家庭年收入低于4.5万元的农户比率估计为6% B .该地农户家庭年收入不低于10.5万元的农户比率估计为10% C .估计该地农户家庭年收入的平均值不超过6.5万元D .估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 【答案】C【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确; 该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确; 该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C. 故选:C.3.(多选)(2021·全国·高考真题)下列统计量中,能度量样本12,,,n x x x 的离散程度的是( )A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【详解】由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度;。
《用样本估计总体》典型例题及解析1.校医务室从初中部三个年级各抽出100名学生进行视力调查,通过问卷调查,各年级100名学生中存在视力问题的人数如下:初一视力不良的男生有18人,女生有16人;初二视力不良的男生有20人,女生有22人;初三视力不良的男生有24人,女生有25人.根据调查结果整理出统计表,绘出视力不良率(视力不良人数占被调查人数的百分比)条形图,并说明根据调查结果得出的结论.解析:初中部学生视力调查统计表根据上述调查结果可以得到:(1)视力不良率随年级不同而呈上升趋势,初三学生的视力情况比初二学生差,而初二学生的视力情况又比初一学生差;(2)男女生的视力不良率没有明显的差异;(3)应积极采取措施,防止学生视力下降.例2.为估计某产品的使用寿命,对大量的产品进行抽样检验,100个样品的使用时间记录如下:579 585 402 355 203 488 362 397 355 413 316 303 278316 501 479 197 265 333 276 566 384 312 289 123 326432 357 476 357 432 326 123 316 266 317 540 364 335276 320 227 510 338 146 368 311 317 369 586 374 323338 364 407 305 133 365 188 316 366 524 504 290 248352 447 489 368 425 307 327 495 331 213 410 573 214167 246 337 343 512 319 447 503 198 283 401 357 344225 187 346 451 375 416 234 476 357 (单位:小时)根据抽样检验的100个样本的数据填写下表,作出条形图,并对这种产品的寿命进行估计.解析:(1)产品使用寿命统计表(2)产品使用寿命分布条形图(3)从抽样检验的情况分析,多数产品的使用寿命在200小时~500小时,约占全部样品的86%.半数以上的产品使用寿命在250小时~450小时.。
随机抽样、用样本估计总体1.某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有 根棉花纤维的长度小于20 mm.惠生活 观影指南爱尚嘟嘟园迅播影院请支持我们,有更多资源和动力【答案】 30【解析】 因为频率分布直方图的矩形的高为,频率概率故矩形的高⨯组距即为频率.从图中可知长 度小于20 mm 的频率为(0.01+0.01+0.04)50⨯=.3,又总体为100根,故纤维长度小于20 mm 的根 数为1000⨯.3=30根. 惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力 课后作业夯基基础巩固2.从2 008名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽 样从2 008人中剔除8人,剩下的2 000人再按系统抽样的方法抽取,则这2 008名学生中每人入选的概率( )A.不全相等B.均不相等C.都相等,且为502008D.都相等,且为140【答案】 C 【解析】 随机抽样过程中,保证每个个体被抽取的可能性是相等的,所以每人入选的概率都相等,且为502008. 3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年 级的学生中应抽取的人数为… ( )A.6B.8C.10D.12【答案】 B【解析】 分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则30640n=,得n =8. 4.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的 频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90B.75C.60D.45【答案】A【解析】样本中产品净重小于100克的频率为(0.050+0.100)⨯2=0.3,频数为36.样本总数为36120 03= ..∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)20⨯=.75, ∴样本中净重大于或等于98克并且小于104克的产品的个数为1200⨯.75=90.5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【答案】A【解析】按照从小到大的顺序排列为87,89,90,91,92,93,94,96.∵有8个数据,∴中位数是中间两个数的平均数:91922+=91.5,平均数为8789909192939496918+++++++=.5,故选A.6.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A.55.2,3.6B.55.2,56.4C.64.8,63.6D.64.8,3.6【答案】D【解析】每一个数据都加上60时,平均数也应加上60,而方差不变.7.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为.【答案】40【解析】在系统抽样中,确定分段间隔k,对编号进行分段,(N k N n=为总体的容量,n 为样本的容量), ∴12004030N k n ===. 8.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容量为4的样本,已知 学号为6,34,48的同学在样本中,那么还有一个同学的学号应为 .【答案】 20【解析】 根据题意,56人应分为4组,每组14人,第一组为6号,第二组为6+14=20号,第三组为20+14=34号,第四组为34+14=48号,故还有一个同学的学号为20.9.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是 .【答案】 52.5%【解析】 结合频率分布直方图可以看出:生产数量在[55,65)的人数频率为0.04100⨯=.4,生产数量在[65,75)的人数频率为0.025⨯10=0.25,而生产数量在[65,70)的人数频率约为0.25⨯102=.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%. 10.(2011江苏高考,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差2s = .【答案】 165【解析】 ∵10685675x ++++==, ∴2s = 22222(107)(67)(87)(57)(67)1655-+-+-+-+-=. 11.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为.【答案】 5 【解析】 该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为10818(6=分),方差为 2222221[(1418)(1718)(1818)(1818)(2018)(2118)]56-+-+-+-+-+-=,故填5. 12.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如 下表:惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适【解】 (1)画茎叶图,如图所示,中间数为数据的十位数.从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此乙总体得分情况比甲好(2)根据公式得3333x x =,=甲乙;s =甲 3.96s ,=乙 3.35;甲的中位数是33,乙的中位数是综合比较选乙参加比赛较为合适.。
用样本估计总体练习题1.在频率分布直方图中,小矩形的高表示 ( )A. B.组距×频率 C.频率D. 2.在用样本频率估计总体分布的过程中,下列说法中正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确3.在统计中,样本的标准差可以近似地反映总体的 ( )A.平均状态B.分布规律C.波动大小D.最大值和最小值4.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数0.4是指1号球占总体分布的 ( )A.频数B.频率C.D.累计频率5. 一个容量为20的样本数据,分组后组距与频数如下表:则样本在区间上[10,50)的频率为 ( )A.0.5B.0.25C.0.6D.0.7 6.在某项体育比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ) A.92,2B.92,2.8C.93,2D.93,2.8 7.在一次数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,那么这个小组的平均分是 ( )A.97.2B.87.29C.92.32D.82.868.为了调查某一路口某时段的汽车流量,记录了15天同一时段通过该路口的汽车辆数,其中有2天是142辆,2天是145辆,6天是156辆,5天是157辆.那么这15天在该时段通过该路口的汽车平均辆数为( )频率样本容量频率组距频率组距A.146B.150C.153D.6009. 数据-2,-1,0,1,2的方差是 .10.一个容量为n的样本分成若干组,已知某组的频数和频率分别是60和0.3,则n= .11.已知一个样本方差为s 2= [(x1-4)2+(x2-4)2+…+(x10-4)2],则这个样本的容量是,平均数是 .12.甲乙两种冬小麦实验品种连续5年的平均单位面积产量如下:其中产量比较稳定的小麦是 .。
§ 用样本估计总体 一、选择题 1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是 ( ) A.总体容量越大,估计越精确 B.总体容量越小,估计越精确 C.样本容量越大,估计越精确 D.样本容量越小,估计越精确 2.频率分布直方图中,小长方形的面积等于 ( ) A.组距 B.频率 C.组数 D.频数 3.一个容量为100的样本,其数据的分组与各组的频数如下表
组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数 12 13 24 15 16 13 7 则样本数据落在(10,40)上的频率为 ( ) A. B. C. D. 4.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为 ( ) A.20% B.69% C.31% D.27% 5.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重 (单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102), [102,104), [104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是 ( ) A.90 B.75 C.60 D.45 6.对某校 名学生的体重(单位:)进行统计,得到如图所示的频率分布直方图,则学生体重在以上的人数为( )
A. B. C. D. 7.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ).
A. 65 D.2 8.为了了解某地区10 000名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,请你估计该地区高三男生中体重在[,]的学生人数是( ) A.40 B.400 C.4 000 D.4 400 9.如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到
8题 这10位同学身高的中位数是 ( ) A.161 cm B.162 cm C.163 cm D.164 cm
10.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图.根据茎叶图,下列描述正确的是( )
A.甲种树苗的平均高度大于乙种树苗的平均高度,且甲种树苗比乙种树苗长得整齐 B.甲种树苗的平均高度大于乙种树苗的平均高度,但乙种树苗比甲种树苗长得整齐 C.乙种树苗的平均高度大于甲种树苗的平均高度,且乙种树苗比甲种树苗长得整齐 D.乙种树苗的平均高度大于甲种树苗的平均高度,但甲种树苗比乙种树苗长得整齐 11.对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h的电子元件的数量与使用寿命在300~600 h的电子元件的数量的比是( )
12.一组数据的平均数是,方差是,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ) A., B., C., D., 二、填空题
13.一个容量为n的样本,分成若干组,已知甲组的频数和频率分别为36和14,则容量n=__,且频率为16的乙组的频数是___. 14.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________.若取组距为2,则应分成________组;若第一组的起点定为,则在[,内的频数为________. 15.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 16.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知________.
甲运动员的成绩好于乙运动员;②乙运动员的成绩好于甲运动员;③甲、乙两名运 动员的成绩没有明显的差别;④甲运动员的最低得分为0分. 17.甲、乙两名同学学业水平考试的9科成绩如茎叶图所示,请你根据茎叶图判断谁的平均分高________.(填“甲”或“乙”)
18. 如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为___.(注:方差2222121()()()nsxxxxxxn
L
,其中x为x1,x2,…,xn的平均数)
19.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
20.某校开展“爱我青岛,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________. 三、解答题 21.(2013·合肥高一检测)在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17, 23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17 在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19, 32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22 (1)将这两组数据用茎叶图表示; (2)将这两组数据进行比较分析,你会得到什么结论?
22.(创新拓展)如图是一个样本的频率分布直方图,且在[15,18)内频数为8.(1)求样本容量; (2)若[12,15)一组的小长方形面积为,求[12,15) 一组的频数;(3)求样本在[18,33)内的频率. 23.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产
0891035 18题
19题 20题
22题 品为优质品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果: A配方的频数分布表
指标值 分组 [90,94) [94,98) [98,102) [102,106) [106,110]
频数 8 20 42 22 8 B配方的频数分布表
指标值 分组 [90,94) [94,98) [98,102) [102,106) [106,110]
频数 4 12 42 32 10 (1)分别估计用A配方,B配方生产的产品的优质品率;
(2)已知用B配方生产的一件产品的利润y(单位:元)与其质量指标值t的关系式为y= -2,t<94,2,94≤t<102,4,t≥102. 估计用B配方生产的一件产品的利润大于0的概率,并求用B配方生产的上述100件产品平均一件的利润. 24.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题: (1)求分数在[120,130)内的频率;
(2)若在同一组数据中,将该组区间的中点值(如:组区间[100,110)的中点值为100+1102=105.)作为这组数据的平均分,据此,估计本次考试的平均分; (3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.
25.某制造商3月生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm),将数据进行分组,得到如下频率分布表: (1)补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图; (2)若上述频率作为概率,已知标准乒乓球直径为 mm,试求这批乒乓球的直径误差不超过 mm的概率; (3)统计方法中,同一组数据常用该组区间的中点值(例如区间[,的中点值是作为代表.据此估计这批乒乓球直径的平均值(结果保留两位小数). 26.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
分组 频数 频率 [, 10 [, 20 [, 50 [,] 20 合计 100
25题