【高考数学精准解析】多维层次练:第九章+第2节+用样本估计总体
- 格式:pdf
- 大小:1.15 MB
- 文档页数:11
第2节用样本估计总体【选题明细表】基础巩固(时间:30分钟)1.(2018·贵阳一模)贵阳地铁1号线12月28日开通运营,某机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数、中位数、平均数的和为( D )(A)170 (B)165 (C)160 (D)150解析:数据70,60,60,50,60,40,40,30,30,10的众数是60,中位数是45,平均数是45,故众数、中位数、平均数的和为150,故选D.2.如图是某市今年10月份某天6时至20时温度变化折线图,下列说法错误的是( D )(A)这天温度极差为8 ℃(B)这天温度的中位数在9 ℃附近(C)这天温度无明显变化的是早上6时至早上8时(D)这天温度变化率绝对值最大的是上午11时至中午13时解析:由折线图可得,最高气温为14 ℃,最低气温为6 ℃,所以这天温度极差为8 ℃,故排除A;从6时至20时温度从低到高依次排列,可得这天温度的中位数为9 ℃附近,故排除B;由折线图可得,从6时至8时,温度没有明显变化,故排除C;由折线图可得,从13时至15时,温度变化率绝对值最大,故D是错误的.故选D.3.(2018·开封三模)学校根据某班的期中考试成绩绘制了频率分布直方图(如图所示),根据图中所给的数据可知a+b等于( C )(A)0.024 (B)0.036 (C)0.06 (D)0.6解析:根据频率分布直方图得,(0.01+a+b+0.018+0.012)×10=1,解得a+b=0.06.故选C.4.(2018·江西二模)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( A )(A)=4,s2<2 (B)=4,s2>2(C)>4,s2<2 (D)>4,s2>2解析:某7个数的平均数为4,方差为2,加入一个新数据4后,这8个数的平均数为=×(7×4+4)=4,方差为s2=×[7×2+(4-4)2]=<2.故选A.5.(2018·南安一中模拟)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( C )(A)6万元(B)8万元(C)10万元(D)12万元解析:设11时到12时的销售额为x万元,依题意有=,所以x=10,故选C.6.(2018·龙岩模拟)党的十八大以来,脱贫攻坚取得显著成绩,2013年至2016年4年间,累计脱贫5 564万人,2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3 000户家庭的2017年所得年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为( A )(A)900户(B)600户(C)300户(D)150户解析:由频率分布直方图得:年收入不超过6万的家庭所占频率为(0.005+0.010)×20=0.3,所以年收入不超过6万的家庭大约为0.3×3 000=900.故选A.7.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70~99分),若甲、乙两组学生的平均成绩一样,则a= ;甲、乙两组学生的成绩相对整齐的是.解析:由题意可知==89,解得a=5.因为=×(142+1+0+92+62)=,=×(132+42+0+92+82)=,所以<,故成绩相对整齐的是甲组.答案:5 甲组能力提升(时间:15分钟)8.(2018·沙市区校级一模)已知四个正数x1,x2,x3,x4的标准差s=0.2,则数据2x1-1,2x2-1,2x3-1,2x4-1的方差为( D )(A)0.2 (B)0.4 (C)0.8 (D)0.16解析:根据题意,设四个正数x 1,x2,x3,x4的平均数为,则有=(x 1+x2+x3+x4),又由其标准差s=0.2,则有其方差)2+(x2-)2+(x3-)2+(x4-)2]=0.04,s2=[(x对于数据2x1-1,2x2-1,2x3-1,2x4-1,其平均数为,则有=(2x 1-1+2x2-1+2x3-1+2x4-1)=2-1,则其方差s′2=[(2x 1-1-2+1)2+(2x2-1-2+1)2+(2x3-1-2+1)2+(2x 4-1-2+1)2]=4s2=0.16,故选D.9.(2018·济宁二模)2017年底,某单位对100名职工进行绩校考核,依考核分数进行评估,考核评估后,得其频率分布直方图如图所示,估计这100名职工评估得分的中位数是.解析:由频率分布直方图得:评估得分在[60,70)的频率为0.015×10=0.15,评估得分在[70,80)的频率为0.040×10=0.4,所以估计这100名职工评估得分的中位数是70+×10=78.75.答案:78.7510.(2018·北京模拟)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未污损,即9,10,11,1,那么这组数据的方差s2可能的最大值是.解析:设这组数据的最后2个分别是10+x,y,则9+10+11+(10+x)+y=50,得x+y=10,故y=10-x,故s2=[1+0+1+x2+(-x)2]=+x2,显然x最大取9时,s2最大是.答案:11.如图茎叶图是甲、乙两人在5次综合测评中的成绩(为整数),其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是.解析:由图可知,甲的平均分为90.设被污损的数为x,乙的成绩分别是83,83,87,90+x,99,其中被污损的成绩为0到9中的某一个.由甲的平均成绩超过乙的平均成绩,得<90.所以x<8.又x 是0到9的十个整数中的其中一个,所以x<8的概率为=.答案:12.(2018·全国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解:(1)如图所示.(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为=×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为=×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0 .35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3). 13.(2018·新乡一模)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎,试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?解:(1)甲厂这批轮胎宽度的平均值为:=(195+194+196+193+194+197+196+195+193+197)=195(cm),乙厂这批轮胎宽度的平均值为:=(195+196+193+192+195+194+195+192+195+193)=194(cm).(2)甲厂这批轮胎宽度在[194,196]内的数据为195,194,196,194,196,195,平均数为=(195+194+196+194+196+195)=195,方差为=[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+ (195-195)2]=,乙厂这批轮胎宽度在[194,196]内的数据为195,196,195,194,195,195.平均数为=(195+196+195+194+195+195)=195,方差为=[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=.因为两厂标准轮胎宽度的平均数相等,但乙厂的方差更小.所以乙厂的轮胎相对更好.。
9.2 用样本估计总体(精练)【题组一 总体取值规律的估计】1.(2020·江苏苏州市·星海实验中学高一期中)为了解学生课外阅读的情况,随机统计了n 名学生的课外阅读时间,所得数据都在[50,150]中,其频率分布直方图如图所示.已知在[50,75)中的频数为100,则n 的值是( )A .500 B .1000 C .10000 D .25000【答案】B【解析】由图可得在[50,75)中的频率为0.004250.1⨯=,所以10010000.1n ==,故选:B. 2.(2021·北京昌平区·高一期末)某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[90,100],样品数据分组为[90,92),[92,94),[94,96),[96,98),[98,100].已知样本中产品净重小于94克的个数为36,则样本中净重大于或等于92克并且小于98克的产品的个数是( )A .45B .60C .75D .90【答案】D【解析】[90,92),[92,94),[94,96),[96,98)对应的频率分别为:0.1,0.2,0.3,0.25设样本容量为n因为净重小于94克的个数为36,所以()0.10.236n+=,解得120n=则样本中净重大于或等于92克并且小于98克的产品的个数为()0.20.30.2512090++⨯=故选:D3.(2021·北京市第四中学顺义分校高一期末)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间[]0,50t∈),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )A.0.028 B.0.030 C.0.280 D.0.300【答案】A【解析】由(0.0060.0400.0200.006)101a++++⨯=得0.028a=.故选:A4.(2020·广东云浮市·高一期末)在容量为50的样本中,某组的频率为0.18,则该组样本的频数为( ).A.9 B.10 C.18 D.20【答案】A【解析】由题意,频数=样本容量×频率500.189=⨯=.故选:A5.(2021·湖南长沙市)“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨):一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由; (3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由. 【答案】(1)0.3;(2)16.2万;(3)2.8吨.【解析】(1)由概率统计相关知识,可知各组频率之和的值为1 即频率分布直方图各小矩形面积之和为1()0.50.080.160.40.520.120.080.0421a ∴⨯+++++++=解得:0.3a =(2)由图可知,不低于2.5吨人数所占百分比为()0.50.30.120.080.0427%⨯+++= ∴全市月均用水量不低于2.5吨的人数为:600.2716.2⨯=(万)(3)由(2)可知,月均用水量小于2.5吨的居民人数所占百分比为:73% 即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨 故2.53x <<假设月均用水量平均分布,则()82%73%2.5 2.80.3x -=+=(吨)6.(2020·天津河西区·)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30、42、41、36、44、40、37、37、25、45、29、43、31、36、49、34、33、43、38、42、32、34、46、39、36,根据上述数据得到样本的频率分布表如下:分组频数频率[]25,3030.12(]30,3550.20(]35,4080.32(]40,451n1f(]45,502n2f(1)确定样本频率分布表中1n、2n、1f和2f的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(]30,35的概率. 【答案】(1)17n=,22n=,10.28f=,20.08f=;(2)详见解析;(3)0.5904.【解析】(1)由题意知17n=,22n=,170.2825f∴==,220.0825f==;(2)样本频率分布直方图为:(3)根据样本频率分布直方图,每人的日加工零件数落在区间(]30,35的概率0.2, 设所取的4人中,日加工零件数落在区间(]30,35的人数为ξ,则()~4,0.2B ξ,,所以4人中,至少有1人的日加工零件数落在区间(]30,50的概率约为0.5904. 【题组二 总体百分数的估计】1.(2020·全国高一课时练习)一组数据12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位数分别是______、________. 【答案】25 39【解析】把数据从小到大排序为12,15,24,25,31,32,34,36,36,37,39,42,48,50共14个数, 14×25%=3.5, 14×75%=10.5, 所以第25,75百分位数分别是第4,11项数据,即是25,39. 故答案为:25,39.2.(2021·安徽宿州市·高一期末)若一组数据为82,81,79,78,95,88,92,84,则该组数据的75%分位数是___________. 【答案】90【解析】由题可得一共有8个数据,则该组数据的75%分位数在第6位和第7位之间,为()8892902+=.故答案为:90.3.(2020·山东东营市·广饶一中高一期末)数据10,9,8,7,6,5,4,3,2,1的25%分位数、80%分位数分别是_______; 【答案】3;8.5【解析】将数据10,9,8,7,6,5,4,3,2,1从小到大排序得:1,2,3,4,5,6,7,8,9,10, 当%25%p =时,10%1025% 2.5i p ==⨯=,25%∴分位数为3. 当%80%p =时,10%1080%8i p ==⨯=,80%∴分位数为89=8.52+.故答案为:3;8.5. 4.(2020·天津市滨海新区大港太平村中学高一期末)树人中学高一1班23名男生身高的样本数据(单位:cm )按从小到大排序,排序结果如下:164,165,165,166,167,168,168,168,170,170,170,172, 172,172,173,173,173,173,174,175,175,175,176. 由数据估计树人中学高一年级男生身高的第50百分位数为________.【答案】172【解析】由2350%11.5⨯=,将样本数据从小到大排列,第12个数字为172,所以可估计树人中学高一年级男生身高的第50百分位数为172.故答案为:172.5.(2020·山东泰安市·高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.【答案】172【解析】百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,本题第90百分位数是173,所以1741732x+=,172x=故答案为:1726.(2020·临高县临高中学高一期末)下列数据是30个不同国家中每10000名患某种疾病的男性的死亡人数:1.5 3.2 5.2 5.6 5.6 7.1 8.7 9.2 10.0 11.213.2 13.7 13.8 14.5 15.2 15.7 16.5 18.8 19.2 23.927 27 28.9 28.9 33.1 33.8 34.8 40.6 41.6 50.1这组数据的第70百分位数是_______________.【答案】27.【解析】按从小到大排列此30个数据,指数3070%21i=⨯=,则第70百分位数是2727272+=,故答案为:27.7.(2020·全国高一课时练习)某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下65,65,66,74,73,81,80,则它们的第三四分位数是________ .【答案】80【解析】从小到大排序为65,65,66,73,74,80,81,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据80.故答案为:808.(2020·江苏高一期中)已知一组数据1,3,2,,4m,且这组数据的平均数为3,则m的值为__________. 【答案】5【解析】由题意132435m++++=,解得5m=故答案为:5【题组三总体集中趋势的估计】1.(2020·全国高一课时练习)10名工人某天生产同一零件,生产的件数是15、17、14、10、15、17、17、16、14、12.设其平均数为a ,中位数为b ,众数为c ,则有( )A .a b c >>B .c b a >>C .c a b >>D .b c a >>【答案】B【解析】将生产的件数由小到大排列为:10、12、14、14、15、15、16、17、17、17,()11517141015171716141214.710a ∴=+++++++++=,中位数为15b =, 众数为17c =.因此,c b a >>.故选:B.2.(2021·安徽宿州市·高一期末)2020年宿州市某中学参加高中数学建模(应用)能力测试,高一年级有60人,高二年级有40人.高一的平均成绩为70分,高二的平均成绩为80分,则参加测试的100名学生的平均成绩为( ) A .72分 B .73分C .74分D .75分【答案】C【解析】由题意可得,参加测试的100名学生的平均成绩为6070408074100⨯+⨯=.故选:C.3.(2021·北京房山区·高一期末)根据气象学上的标准,连续5天的日平均气温低于10C 即为入冬.现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数): ①甲地:5个数据的中位数为7,众数为6; ②乙地:5个数据的平均数为8,极差为3; ③丙地:5个数据的平均数为5,中位数为4; ④丁地:5个数据的平均数为6,方差小于3. 则肯定进入冬季的地区是( ) A .甲地 B .乙地C .丙地D .丁地【答案】D【解析】①甲地:5个数据的中位数为7,众数为6;则这5个数据可能为6,6,7,10,11;即连续5天的日平均气温不是都低于10C ,所以甲地不一定入冬,故A 错;②乙地:5个数据的平均数为8,极差为3;则这5个数据可能为7,7,8,8,10;即连续5天的日平均气温不是都低于10C ,所以乙地不一定入冬,故B 错;③丙地:5个数据的平均数为5,中位数为4;则这5个数据可能为1,2,4,7,11;即连续5天的日平均气温不是都低于10C ,所以丙地不一定入冬,故C 错;④丁地:5个数据的平均数为6,方差小于3.如有数据大于等于10,则方差必大于等于()210616355-=>,不满足题意,因此丁地这续5天的日平均气温都低于10C ,所以丁地一定入冬,故D 正确; 故选:D.4.(2020·全国高一)某组数据的茎叶图如图所示,其众数为a ,中位数为b ,平均数为c ,则( )A .a b c >> B .a c b >> C .b a c >> D .c a b >>【答案】A【解析】由图中数据可得23a =,202120.52b +== 89131517202123232632332012c +++++++++++==所以a b c >>故选:A5.(2020·全国高一)已知一组数据的频率分布直方图如图所示,则众数、中位数、平均数分别为( )A .63,64,66B .65,65,67C .55,64,66D .64,65,64【答案】B【解析】由频率分布直方图可知,众数为6070652+=; 由100.0350.040.5⨯+⨯=,所以面积相等的分界线为65,即中位数为65; 平均数为550.3650.4750.15850.1950.0567⨯+⨯+⨯+⨯+⨯=.故选:B .6.(2020·广东汕头市·金山中学高一月考)甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学的平均分高;③甲同学的平均分比乙同学的平均分低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是( )A.③④B.①②④C.②④D.①③④【答案】A【解析】由茎叶图知甲同学的成绩为72,76,80,82,86,90;乙同学的成绩为69,78,87,88,92,96.故甲同学成绩的中位数小于乙同学成绩的中位数,①错;计算得甲同学的平均分为81,乙同学的平均分为85,故甲同学的平均分比乙同学的平均分低,因此②错、③对;计算得甲同学成绩的方差小于乙同学成绩的方差,故④对.7.(2020·山东枣庄市·滕州市第一中学新校高一月考)从某食品厂生产的面包中抽取100个,测量这些面包的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数82237285(1)在相应位置上作出这些数据的频率分布直方图;(2)估计这种面包质量指标值的平均数x(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定?”【答案】(1)见解析;(2)100;(3)见解析.【解析】(1)画图.(2)质量指标值的样本平均数为800.08900.22x=⨯+⨯1000.371100.28+⨯+⨯1200.05100+⨯=.所以这种面包质量指标值的平均数的估计值为100.(3)质量指标值不低于85的面包所占比例的估计值为0.220.370.280.050.92+++=,由于该估计值大于0.9,故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定.”8.(2020·安徽蚌埠市·蚌埠二中高一月考)某学校对男、女学生进行有关“习惯与礼貌”的评分,记录如下:男:54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,58;女:77,55,69,58,76,70,77,90,51,53,63,64,69,83,83,65,100,75.(1)分别计算男、女学生得分的平均数;(2)分别计算男、女学生得分的四分位数.【答案】(1)男生平均数为61.05,女生平均数为71;(2)男生得分的四分位数: 50, 58, 71.5;女生得分的四分位数: 63, 69.5, 77.【解析】(1)男学生的平均数为1547057469058634685735566384456753558945820x+++++=++++++++++++++ 61.05=,女学生得分的平均数2775569587670779051536364698383651007518x=+++++++++++++++++71=.(2)男、女学生得分从小到大排列为男:35,38,44,46,46,54,55,56,57,58,58,58 ,63,66,70,73,75,85, 90,94;女:51,53,55,58,63,64,65,69,69,70,75,76,77,77,83,83, 90, 100;男、女学生得分的四分位数如下表25%分位数50%分位数75%分位数男生50 58 71.5女生63 69.5 779.(2021·安徽宿州市·高一期末)某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M 名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.分组 频数 频率 [40,50)[50,60)25p[60,70) s0.30[70,80)mn[80,90) 100.10[90,100]合计M1(1)求出表中,M p 及图中a 的值;(2)估计该校学生阅读素养的成绩中位数以及平均数.【答案】(1)100,0.25,0.02M p a ===;(2)中位数是2003,平均数是68.5. 【解析】(1)由频率统计表可知:101000.1M ==,250.25100p ∴== 由频率分布直方图可知:(0.0050.0250.030.010.01)101a +++++⨯=,解得0.02a = (2)∵前两组的频率和为0.050.250.30.5+=<,前三组的频率和为0.050.250.30.60.5++=> ∴中位数在[60,70)内,设中位数为x ,则0.050.25(60)0.030.5x ++-⨯=,解得2003x =,即中位数为2003.平均数为450.05550.25650.3750.2850.1950.168.5⨯+⨯+⨯+⨯+⨯+⨯= ∴估计该校学生阅读素养的成绩中位数是2003,平均数是68.5. 10.(2020·全国高一单元测试)某班的全体学生共有50人,参加数学测试(百分制)成绩的频率分布直方图如图,数据的分组依次为:[)20,40,[)40,60,[)60,80,[]80,100. 依此表可以估计这一次测试成绩的中位数为70分.(1)求表中a ,b 的值;(2)请估计该班本次数学测试的平均分. 【答案】(1)0.02a =,0.015b =;(2)68分. 【解析】(1)由中位数为70可得,0.005200.0120100.5a ⨯+⨯+=,解得0.02a =.又()200.0050.010.021b ⨯+++=, 解得0.015b =.(2)由频率分布直方图可知,每组的频率依次为:0.1,0.2,0.4,0.3,则该班本次数学测试的平均分的估计值为:300.1500.2700.4900.368⨯+⨯+⨯+⨯=分.10.(2020·调兵山市第一高级中学高一月考)某城市交通部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[)[)[]50,60,60,70,,90,100⋅⋅⋅分成5组,制成如图所示频率分直方图.(1)求图中x 的值;(2)求这组数据的平均数和中位数;(3)已知满意度评分值在[)50,60内的男生数与女生数的比为3:2,若在满意度评分值为[)50,60的人中随机抽取2人进行座谈,求2人均为男生的概率. 【答案】(1)0.02x =;(2)平均数为77,中位数设为5407;(3)310.【解析】(1)由()0.0050.010.0350.030101x ++++⨯=,解得0.02x =.(2)这组数据的平均数为550.05650.2750.35850.3950.177⨯+⨯+⨯+⨯+⨯=. 中位数设为m ,则()0.050.2700.0350.5m ++-⨯=,解得5407m =. (3)满意度评分值在[)50,60内有1000.005105⨯⨯=人,其中男生3人,女生2人.记为12312,,,,A A A B B , 记“满意度评分值为[)50,60的人中随机抽取2人进行座谈,恰有1名女生”为事件A ,从5人中抽取2人有:12A A ,13A A ,11A B ,12A B ,23A A ,21A B ,22A B ,31A B ,32A B ,12B B 所以总基本事件个数为10个,A 包含的基本事件个数为3个, 所以 ()310P A =. 【题组四 总体离散程度的估计】1.(2020·甘肃白银市·高一期末)已知数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,方差为p ,则下列说法中,错误的是( ) A .数据1232,2,2x x x 的中位数为2kB .数据1232,2,2x x x 的众数为2mC .数据1232,2,2x x x 的平均数为2nD .数据1232,2,2x x x 的方差为2p 【答案】D【解析】若数据123,,x x x 的中位数为k ,众数为m ,平均数为n ,则由性质知数据1232,2,2x x x 的中位数,众数,平均数均变为原来的2倍,故,,A B C 正确;则由方差的性质知数据1232,2,2x x x 的方差为4p ,故D 错误; 故选D .2.(2020·四川省绵阳南山中学高一开学考试)数据1x ,2x ,3x …,n x 分别是某学校教职工()*3,n n n N≥∈个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入数据1n x +,则对这()1n +个数据,下列说法正确的是( ) A .年收入平均数增大,中位数可能不变,方差变大 B .年收入平均数增大,中位数一定变大,方差变大C .年收入平均数增大,中位数可能不变,方差可能不变D .年收入平均数可能不变,中位数可能不变,方差可能不变 【答案】A【解析】因为数据1x ,2x ,3x …,n x 分别是某学校教职工个人的年收入,所以世界首富的收入1n x +会远远大于1x ,2x ,3x …,n x ,故这1n +个数据的平均数会大大增加; 而中位数为数据中间的数或中间两个数的平均数,所以中位数有可能不变;因为世界首富的收入远远大于1x ,2x ,3x …,n x ,所以数据的集中程度受1n x +的影响很大,数据离散程度加大,所以方差变大. 故选:A3(2020·定边县第四中学高一期末)x 是1x ,2x ,…,100x 的平均值,1a 为1x ,2x ,…40x 的平均值,2a 为41x ,42x ,…100x 的平均值,则下列各式正确的是( )A.12235a ax+=B.12325a ax+=C.12x a a=+D.122a ax+=【答案】A【解析】因为1a为1x,2x,...40x的平均值,2a为41x,42x, (100)x的平均值,所以1240140x x x a++⋯+=,4142100260x x x a++⋯+=,则有1121002124060231001005x x x a a a ax++⋯+++===.故选:A.4.(多选)(2021·山东德州市·高一期末)国家为了实现经济“双循环”大战略,对东部和西部地区的多个县市的某一类经济指标进行调查,得出东部,西部两组数据的茎叶图如图所示,则下列结论正确的是( )A.西部的平均数为13.3B.东部的极差小于西部的极差C.东部的30%分位数是11.6D.东部的众数比西部的众数小【答案】ACD【解析】对于A:()11.211.512.412.513.113.113.613.613.713.914.414.915.01313.3++++++++++++÷=即西部的平均数为13.3,故A正确;对于B:东部的最大值为15.1,最小值为10.8,极差为15.110.8 4.3-=;西部的最大值为15.0,最小值为11.2,极差为15.011.2 3.8 4.3-=<;故B错误;对于C:东部共13个数据,1330% 3.9⨯=,即从小到大的第4个数11.6为东部的30%分位数,所以东部的30%分位数是11.6,故C正确;对于D:东部的众数为11.3,西部的众数为13.1和13.6均大于11.3,故D正确;故选:ACD5.(多选)(2020·全国高一单元测试)在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是( )A.平均数3x≤B.标准差2s≤C.平均数3x≤且极差小于或等于2D.众数等于1且极差小于或等于4【答案】CD【解析】对于A选项,若平均数3x≤,不能保证每天新增病例数不超过5人,不符合题意;对于B选项,标准差反映的是数据的波动大小,例如当每天感染的人数均为10,标准差是0,显然不符合题意;对于C选项,若极差等于0或1,在3x≤的条件下,显然符合指标;若极差等于2,假设最大值为6,最小值为4,则3x>,矛盾,故每天新增感染人数不超过5,符合条件,C正确;对于D选项,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.故选:CD.6.(多选)(2020·济南市·山东师范大学附中高一月考)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200,乙队体重的平均数为68,方差为300,又已知甲、乙两队的队员人数之比为1:3,则关于甲、乙两队全部队员的体重的平均数和方差的说法正确的是( )A.平均数为67 B.平均数为66 C.方差为296 D.方差为287【答案】BD【解析】依题意,甲的平均数160x=,乙的平均数268x=,而甲、乙两队的队员人数之比为1:3,所以甲队队员在所有队员中所占比重为14,乙队队员在所有队员中所占比重为34故甲、乙两队全部队员的体重的平均数为:1360686644x=⨯+⨯=;甲、乙两队全部队员的体重的方差为:()()22213200606630068665922828744s ⎡⎤⎡⎤=⨯+-+⨯+-=+=⎣⎦⎣⎦.故选:BD.7.(多选)(2020·江苏无锡市·高一期末)已知一组数据1x ,2x ,3x ,4x ,5x 的平均数和方差均为2,则下列叙述正确的有( )A .11x +,21x +,31x +,41x +,51x +的平均数为3B .11x +,21x +,31x +,41x +,51x +的方差为3C .12x ,22x ,32x ,42x ,52x 的方差为4D .122x +,222x +,322x +,422x +,522x +的方差为8 【答案】AD【解析】对,A B 选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变, 故其平均数是3,方差是2;故A 正确;B 错误;对C ,将每个数据乘以2,故其方差变为原来的4倍,即为8,故C 错误; 对D ,将每个数据乘以2再加2,故其方差也变为原来的4倍,即为8,故D 正确. 故选:AD .8.(2020·全国高一课时练习)某城区举行“奥运知识”演讲比赛,中学组根据初赛成绩在高一、高二年级中分别选出10名同学参加决赛,这些选手的决赛成绩如图所示.团体成绩 众数 极差 平均数 方差 高一年级 22 39.6 高二年级85.727.8(1)请把上边的表格填写完整.(2)考虑平均数与方差,你认为哪个年级的团体成绩更好些? 【答案】(1)填表见解析;(2)高二年级的团体成绩更好些.【解析】(1)高一年级的成绩为80,87,89,80,88,99,80,77,91,86; 高二年级的成绩为85,97,85,87,85,88,77,87,78,88. 由此可知高一年级成绩的众数是80,平均数x =85+110(-5+2+4-5+3+14-5-8+6+1)=85.7; 高二年级成绩的众数是85,极差是20. 团体成绩 众数 极差 平均数 方差 高一年级 80 22 85.7 39.6 高二年级 85 2085.727.8(2)因为两个年级的得分的平均数相同,高二年级成绩的方差小,说明高二年级的成绩偏离平均数的程度小,所以高二年级的团体成绩更好些.9.(2020·胶州市教育局高一期末)某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑)(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【答案】(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为25;(3)3700元. 【解析】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=>所以中位数为x 满足7080x << 由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差1022110(90)610i i x s =-⨯==∑所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为222221100...)801008(90)8x x s +---⨯=(2025==(3)将3座教学楼完全包裹的球的最小直径为:22219280204366444100210++=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;将一座教学楼完全包裹的球的最小直径为2222020604400490070++=<=因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元;将1号教学楼与2号教学楼完全包裹的球的最小直径为:2222080601040012100110++=<=又因为22220806010400490070++=>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元;所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元.11.(2020·河南开封市·高一期末)为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…,[90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图;(2)请根据频率分布直方图,估计样本的中位数和方差.(每组数据以区间的中点值为代表).【答案】(1)第四组的频率为0.3;作图见解析;(2)2203;194.【解析】因为各组的频率和等于1,所以第四组的频率为1(0.0100.0150.0150.0250.005)1010.70.3 -++++⨯=-=. 补全的频率分布直方图如图所示.(2)前三组的频率之和为:(0.0100.0150.015)100.40.5++⨯=<前四组的频率之和为:0.40.03100.70.5+⨯=>设中位数为x ,则应有(70,80)x ∈又0.4(70)0.030.5x +-⨯=,2203x ∴=即样本的中位数为2203 抽取学生的平均数约为10(450.010550.015650.015750.030850.025950.005)71x =⨯⨯+⨯+⨯+⨯+⨯+⨯=所以,样本的方差为:222210[(4571)0.010(5571)0.015(6571)0.015s =⨯-⨯+-⨯+-⨯222(7571)0.030(8571)0.025(9571)0.005]+-⨯+-⨯+-⨯67.638.4 5.4 4.84928.8194=+++++=.。
第2讲用样本估计总体组基础关1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为()A.14 B.15 C.16 D.17答案 B=0.3,又因解析由频数分布表可知,样本中数据在[20,40)上的频率为4+530为样本数据在[20,60)上的频率为0.8,所以样本在[40,60)内的频率为0.8-0.3=0.5,数据个数为30×0.5=15.2.甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如表:甲乙丙丁平均成绩x-86898985方差s2 2.1 3.5 2.1 5.6从这四人中选择一人参加国际奥林匹克数学竞赛,最佳人选是()A.甲B.乙C.丙D.丁答案 C解析丙平均成绩高,方差s2小(稳定),故最佳人选是丙.3.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.8答案 C解析解法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70=0.7.故选C.100解法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图所示.易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70=0.7.故选C.1004.(2019·钦州模拟)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第三组B.第四组C.第五组D.第六组答案 B解析由图可得,前四组的频率为(0.0375+0.0625+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第四组,所以B 正确.5.如图所示,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B 答案 B解析 由图可知A 组的6个数为2.5,10,5,7.5,2.5,10,B 组的6个数为15,10,12.5,10,12.5,10,所以x -A =2.5+10+5+7.5+2.5+106=6.25,x -B =15+10+12.5+10+12.5+106≈11.67.显然x -A <x -B .又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B.6.(2020·重庆名校联盟调研)在样本频率分布直方图中共有9个小矩形,若其中1个小矩形的面积等于其他8个小矩形面积和的25,且样本容量为210,则该组的频数为( )A .28B .40C .56D .60 答案 D解析 设该小矩形的面积为x,9个小矩形的总面积为1,则其他8个小矩形的面积和为52x ,所以x +52x =1,所以x =27,所以该组的频数为27×210=60.7.已知一组数据x 1,x 2,…,x n 的方差为2,若数据ax 1+b ,ax 2+b ,…,ax n+b (a >0)的方差为8,则a 的值为_______.答案 2解析 根据方差的性质,知a 2×2=8,解得a =2.8.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为________.答案 3解析 由频率分布直方图,知5×(0.01+0.02+a +0.04+0.04+0.06)=1,解得a =0.03,即使用时间在[15,20),[20,25),[25,30]三组内的学生人数之比为4∶3∶1,则从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为38×8=3.组 能力关1.(2019·葫芦岛一模)一个样本容量为10的样本数据,它们组成一个公差为2的等差数列{a n },若a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A .12,13B .13,13C .13,12D .12,14 答案 B解析 依题意得a 23=a 1a 7,∴(a 1+2×2)2=a 1(a 1+6×2),解得a 1=4,所以此样本的平均数为S 1010=13,中位数为a 5+a 62=13.2.(多选)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和90后从事互联网行业岗位分布条形图,则下列结论中一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.90后从事运营岗位的人数比80前从事互联网行业的人数多D.互联网行业中90后从事技术岗位的人数比80后从事技术岗位的人数多答案ABC解析对于A,由饼状图可知互联网行业从业人员中90后占了56%,故A正确.对于B,由条形图可知互联网行业中从事技术岗位的90后占56%×39.6%=22.176%,超过总人数的20%,故B正确.对于C,由两图数据可计算出整个互联网行业从事运营岗位的90后占56%×17%=9.52%,大于互联网行业中的80前总人数,故C正确.对于D,因为80后从事技术岗位的人数所占比例不清楚,所以互联网行业中从事技术岗位的90后人数不一定比80后的人数多,故D错误.故选ABC.3.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y的分组企业数[-0.20,0)2[0,0.20)24[0.20,0.40)53[0.40,0.60)14[0.60,0.80) 7(1)业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y -=1100×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s 2=1100 i =15n i (y i -y -)2=1100×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,s =0.0296=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.组 素养关(2019·石家庄市一模)小明在石家庄市某物流公司找到了一份派送员的工作,该公司给出了甲、乙两种日薪薪酬方案,其中甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪140元,每日派送的前55单没有奖励,超过55单的部分每单奖励12元.(1)请分别求出甲、乙两种薪酬方案中日薪y (单位:元)与派送单数n 的函数关系式;(2)根据该公司100天所有派送员的派送记录,发现每名派送员的日平均派送单数与天数满足下表:①设一名派送员的日薪为x (单位:元),根据以上数据,试分别求出甲、乙两种方案中日薪x 的平均数及方差;②结合①中的数据,根据统计的知识,帮助小明分析,他选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:0.62=0.36,1.42=1.96,2.62=6.76,3.42=11.56,3.62=12.96,4.62=21.16,15.62=243.36,20.42=416.16,44.42=1971.36)解 (1)由题意知,甲方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =100+n ,n ∈N ;乙方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =⎩⎨⎧140(n ≤55,n ∈N ),12n -520(n >55,n ∈N ). (2)①由(1)及表格可知,甲方案中,日薪为152元的有20天,日薪为154元的有30天,日薪为156元的有20天,日薪为158元的有20天,日薪为160元的有10天,则x -甲=1100×(152×20+154×30+156×20+158×20+160×10)=155.4, s 2甲=1100×[20×(152-155.4)2+30×(154-155.4)2+20×(156-155.4)2+20×(158-155.4)2+10×(160-155.4)2]=6.44,乙方案中,日薪为140元的有50天,日薪为152元的有20天,日薪为176元的有20天,日薪为200元的有10天,则x -乙=1100×(140×50+152×20+176×20+200×10)=155.6,s 2乙=1100×[50×(140-155.6)2+20×(152-155.6)2+20×(176-155.6)2+10×(200-155.6)2]=404.64.②解法一:由①可知,x-甲<x-乙,但两者相差不大,且s2甲远小于s2乙,即甲方案中日薪的波动相对较小,所以小明选择甲方案比较合适.解法二:由①可知,x-甲<x-乙,即甲方案中日薪的平均数小于乙方案中日薪的平均数,所以小明选择乙方案比较合适.。
本节《普通高中课程标准数学教科书-必修二(人教A 版)第九章《9.2.2总体百分位数的估计》,本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用,体会用样本估计总体的思想与方法。
从而发展学生的直观想象、逻辑推理、数学建模的核心素养。
掌握求一组数据的百分位的基本步骤:1.数学建模:在具体情境中运用百分位数解决问题;2.逻辑推理:求总体百分位数的基本步骤;3.数学运算:会求总体百分位数4.数据分析:体会百分位数的意义1.教学重点:理解百分位数的概念及其简单应用2.教学难点:掌握求一组数据的百分位的基本步骤:多媒体三、达标检测1.下列一组数据的第25百分位数是( )解把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i2.知100个数据的第75百分位数是9.3,则下列说法正确的是( )解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C3.某公司2018年在各个项目中总投资500万元,如图是几类项目的投资占比情况,已知在1万元以上的项目投资中,少于3万元的项目投资占 ,那么不少于3万元的项目投资共有( )4. 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?解:由题意知分别落在各区间上的频数为在[80,90)上有60×0.15=9,在[90,100)上有60×0.25=15,在[100,110)上有60×0.3=18,在[110,120)上有60×0.2=12,在[120,130]上有60×0.1=6.从以上数据可知第50百分位数一定落在区间[100,110)上,综上可知,第50百分位数和第75百分位数分别估计为103.3cm,112.5 cm.5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;2)请你找出珍珠质量较小的前15%的珍珠质量;3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,则第25百分位数是错误!=8.15,第50百分位数是错误!=8.5,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.6.某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b 的值.(3)根据(2)中求得的数据a=0.001 5,b=0.002 0.计算用电量的75%分位数.[解] (1)当0≤x≤200时,yx;当200<x≤400时,y=0.5×200+0.8×(xx-60;当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140. 所以y与x之间的函数解析式为y=本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用教学中要注重学生的主体地位,调动学生积极性,使数学教学成为数学活动的教学。
专题9.2 用样本估计总体及统计图表【考试要求】1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义;3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义;4.了解样本估计总体的取值规律;5.能用样本估计百分位数,理解百分位数的统计含义.【知识梳理】1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率. 2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是 s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].4.百分位数如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:一组n 个观测值按数值大小排列.如,处于p %位置的值称第p 百分位数.【微点提醒】1.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是mx -+a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.3.中位数相当于第50百分位数.【疑误辨析】1.判断下列结论正误(在括号内打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的方差越大,说明这组数据越集中.( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )【答案】 (1)√ (2)× (3)√【解析】 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距×频率组距=频率. 【教材衍化】2.(必修3P1002(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )A.4B.8C.12D.16 【答案】 B【解析】 设频数为n ,则n 32=0.25,∴n =32×14=8. 3.(必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【答案】 A【解析】 ∵这组数据为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5, 平均数x -=87+89+90+91+92+93+94+968=91.5. 【真题体验】4.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】 A【解析】 法一 设新农村建设前经济收入为a ,则新农村建设后经济收入为2a ,则由饼图可得新农村建设前种植收入为0.6a ,其他收入为0.04a ,养殖收入为0.3a .新农村建设后种植收入为0.74a ,其他收入为0.1a ,养殖收入为0.6a ,养殖收入与第三产业收入的总和为1.16a ,所以新农村建设后,种植收入减少是错误的.法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的.5.(2019·新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数【答案】 C【解析】 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.6.(2019·上海黄浦区质检)已知样本容量为200,在样本的频率分布直方图中,共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的13,则该组的频数为________. 【答案】 50【解析】 设除中间一个小矩形外的(n -1)个小矩形面积的和为p ,则中间一个小矩形面积为13p ,p +13p =1,p =34,则中间一个小矩形的面积等于13p =14,200×14=50,即该组的频数为50.【考点聚焦】考点一 频率分布直方图【例1】 (2019·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.【答案】见解析【解析】(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x=0.05,∴x =120. (2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5,∴a =953≈32,则中位数为32. (3)(ⅰ)5个年龄组成绩的平均数为x -1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x -2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).【规律方法】 1.频率分布直方图的性质.(1)小长方形的面积=组距×频率组距=频率; (2)各小长方形的面积之和等于1;(3)小长方形的高=频率组矩,所有小长方形的高的和为1组距. 2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.【训练1】 某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频率分布表. A 地区用户满意度评分的频率分布直方图图①B 地区用户满意度评分的频率分布表(1)在图②中作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户和满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.【答案】见解析【解析】(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.考点二样本的数字特征【例2】 (1)(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x 1,x 2,…,x n 的平均数B.x 1,x 2,…,x n 的标准差C.x 1,x 2,…,x n 的最大值D.x 1,x 2,…,x n 的中位数(2)(2019·聊城模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2 【答案】 (1)B (2)A【解析】(1)刻画评估这种农作物亩产量稳定程度的指标是标准差.(2)∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x -=28+48=4. 又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A. 规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【训练2】 抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.【答案】 2【解析】 x -甲=15(87+91+90+89+93)=90,x -乙=15(89+90+91+88+92)=90,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.【反思与感悟】1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.3.频率分布表和频率分布直方图都可直观描述样本数据的分布规律.【易错防范】直方图与条形图不要搞混频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.【核心素养提升】【数据分析】——百分位数的统计含义1.数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.2.数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科学、技术、工程和现代社会生活的各个方面.3.数据分析主要表现为:收集和整理数据,理解和处理数据,获得和解释结论,概括和形成知识.4.百分位数是统计学述语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围.但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.【案例】 阶梯电价的设计(此材料见2017版课程标准P130)【情境】为了实现绿色发展,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:107 101 78 99 208 127 74 223 31 131214 135 89 66 60 115 189 135 146 127203 97 96 62 65 111 56 151 106 8162 91 67 93 212 159 61 63 178 194194 216 101 98 139 78 110 192 105 9622 50 138 251 120 112 100 201 98 84137 203 260 134 156 61 70 100 72 164174 131 93 100 163 80 76 95 152 18288 247 191 70 130 49 114 110 163 202265 18 94 146 149 147 177 339 57 109107 182 101 148 274 289 82 213 165 224142 61 108 137 90 254 201 83 253 113130 82 170 110 108 63 250 237 120 84154 288 170 123 172 319 62 133 130 127107 71 96 140 77 106 132 106 135 132167 82 258 542 51 107 69 98 72 48109 134 250 42 320 113 180 144 116 530200 174 135 160 462 139 133 304 191 283121 132 118 134 124 178 206 626 120 274141 80 187 88 324 136 498 169 77 57根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?【答案】见解析【解析】选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.通过样本估计总体百分位数的要领是对样本数据进行排序,得到有序样本(在统计学中称之为顺序统计量).利用电子表格软件,对上面的样本数据进行排序,可以得到下面的结果:8 18 22 31 42 48 49 50 51 5657 57 60 61 61 61 62 62 63 6365 66 67 69 70 70 71 72 72 7476 77 77 78 78 80 80 82 82 8283 84 84 88 88 89 90 91 93 9394 95 96 96 96 97 98 98 98 99100 100 100 101 101 101 105 106 106 106107 107 107 107 108 108 109 109 110 110110 111 112 113 113 114 115 116 118 120120 120 121 123 124 127 127 127 130 130130 131 131 132 132 132 133 133 134 134134 135 135 135 135 136 137 137 138 139139 140 141 142 144 416 146 147 148 149151 152 154 156 159 160 162 163 163 164165 167 169 170 170 172 174 174 177 178178 180 182 182 187 189 191 191 192 194194 200 201 201 202 203 203 206 208 212213 214 216 223 224 237 247 250 250 251253 254 258 260 265 274 274 283 288 289304 319 320 324 339 462 498 530 542 626样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8 kW·h,最大用电量为626 kW·h,极差为618.初中统计内容中学过的中位数,相当于50%分位数.因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130 kW·h左右.下面确定75%和95%这两个电量临界值.类似中位数的计算,因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).依据确定了的电量临界值,阶梯电价可以规定如下:用户每月用电量不超过178 kW·h(或每年用电量不超过2 136 kW·h),按第一档电价标准缴费;每月用电量(单位:kW·h)在区间(178,297]内(或每年用电量在区间(2 136,3 564]内),其中的178 kW·h按第一档电价标准缴费,超过178 kW·h的部分按第二档电价标准缴费;每月用量超过297 kW·h(或每年用电量超过3 564 kW·h),其中的178 kW·h按第一档电价标准缴费,(297-178)=119 kW·h按第二档电价标准缴费,超过297 kW·h的部分按第三档电价标准缴费. 社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.【评析】分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大.对第p百分位数,严格的定义如下:第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.【案例应用1】对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题.也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好.【案例应用2】假设想为退休存够钱.可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%.所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%.【分层训练】【基础巩固题组】(建议用时:40分钟)一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45B.50C.55D.60【答案】 B【解析】 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n =150.3=50.2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )A.甲B.乙C.丙D.丁【答案】 C【解析】 由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差【答案】 C【解析】 由图可得,x -甲=4+5+6+7+85=6,x -乙=3×5+6+95=6,A 项错误; 甲的成绩的中位数为6,乙的成绩的中位数为5,B 项错误;s 2甲=(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)25=2, s 2乙=3×(5-6)2+(6-6)2+(9-6)25=2.4,C 项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D 项错误.4.(2019·茂名联考)甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是( )A.极差B.平均数C.中位数D.都不相同【答案】 B【解析】 由题中数据的分布,可知极差不同,甲的中位数为16+212=18.5,乙的中位数为14+182=16, x -甲=5+16+12+25+21+376=583, x -乙=1+6+14+18+38+396=583, 所以甲、乙的平均数相同.故选B.二、填空题5.某校女子篮球队7名运动员身高(单位:cm)的数据分别为:171,172,17x ,174,175,180,181,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.【答案】 2【解析】 170+17×(1+2+x +4+5+10+11)=175, 17×(33+x )=5,即33+x =35,解得x =2. 6.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】 (1)0.04 (2)440【解析】 设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,解得h =0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.7.已知样本数据x 1,x 2,…,x n 的平均数x -=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的平均数为________.【答案】 11【解析】 由x 1,x 2,…,x n 的平均数x -=5,得2x 1+1,2x 2+1,…,2x n +1的平均数为2x -+1=2×5+1=11.三、解答题8.某校2019届高三文(1)班在一次数学测验中,全班N 名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生有14人.(1)求总人数N 和分数在120~125的人数n ;(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?【答案】见解析【解析】(1)分数在110~120内的学生的频率为p 1=(0.04+0.03)×5=0.35,所以该班总人数N =140.35=40. 分数在120~125内的学生的频率为p 2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10,分数在120~125内的人数n =40×0.10=4.(2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,即为105+1102=107.5.设中位数为a ,∵0.01×5+0.04×5+0.05×5=0.50,∴a =110.∴众数和中位数分别是107.5,110.9.(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】见解析【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.【能力提升题组】(建议用时:20分钟)10.(2019·湖北部分重点中学模拟)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x (个)为每天商品的销量,y (元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率是( )A.19B.110C.15D.18【答案】 B【解析】 由题意知y =⎩⎪⎨⎪⎧5x ,x =18,19,95+(x -19)(4-3),x =20,21,即y =⎩⎪⎨⎪⎧5x ,x =18,19,76+x ,x =20,21. 当日销量不少于20个时,日利润不少于96元.当日销量为20个时,日利润为96元.当日销量为21个时,日利润为97元.日利润为96元的有3天,记为a ,b ,c ,日利润为97元的有2天,记为A ,B ,从中任选2天有(a ,A ),(a ,B ),(a ,b ),(a ,c ),(b ,A ),(b ,B ),(b ,c ),(c ,A ),(c ,B ),(A ,B )共10种情况, 其中选出的这2天日利润都是97元的有(A ,B )1种情况,故所求概率为110. 11.(2019·北京海淀区模拟)已知样本x 1,x 2,…,x n 的平均数为x ;样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m ∈N *)的大小关系为( )A.n =mB.n ≥mC.n <mD.n >m 【答案】 C【解析】 由题意得z =1n +m (nx +my )=n n +m x +⎝ ⎛⎭⎪⎫1-n n +m y ,∴a =n n +m, ∵0<a <12,∴0<n n +m <12, 又n ,m ∈N *,∴2n <n +m ,∴n <m .12.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.【答案】 16【解析】 依题意,x 1,x 2,x 3,…,x 10的方差s 2=64.则数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.13.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?【答案】见解析【解析】(1)样本数据的频率分布直方图如图所示:(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.。