新高考数学二轮总复习课件专题六统计与概率小题专项练
- 格式:pptx
- 大小:1.78 MB
- 文档页数:29
核心考点2 用样本估计总体核心知识· 精归纳1.频率分布直方图的相关结论(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积. (3)直方图中每组样本的频数为频率×总数. 2.中位数、众数、平均数、百分位数 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的_中位数__.(2)众数一组数据中出现次数_最多__的数据称为这组数据的众数.(3)平均数 一组数据的_算术平均数__即为这组数据的平均数,n 个数据x 1,x 2,…,x n 的平均数x = 1n(x 1+x 2+…+x n ) . (4)百分位数①第p 百分位数的定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据_小于或等于__这个值,且至少有 (100-p)% 的数据大于或等于这个值.②计算一组n 个数据的第p 百分位数的步骤:第1步,按_从小到大__排列原始数据.第2步,计算i =_n ×p %__.第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第_(i +1)__项数据的平均数.3.样本的数字特征如果有n 个数据x 1,x 2,…,x n ,那么:平均数为x = 1n(x 1+x 2+…+x n ) , 标准差为s =1n [x 1-x 2+x 2-x 2+…+x n -x 2],方差为s 2= 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] .多维题组· 明技法角度1:统计图表1. (2023·郑州三模)为了树立和践行绿水青山就是金山银山的理念,A市某高中全体教师于2023年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计600棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为5∶3∶2,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为( C )A.30棵B.50棵C.72棵D.80棵【解析】由题意可知,梧桐树苗有40%×600=240颗,根据人数占比可得中年教师应分得梧桐的数量为240×35+3+2=72颗.故选C.2. (2023·市中区校级二模)某调查机构抽取了部分关注济南地铁建设的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图.根据图中(35岁以上含35岁)的信息,关于该样本的结论不一定正确的是( C )A.男性比女性更关注地铁建设B.关注地铁建设的女性多数是35岁以上C.35岁以下的男性人数比35岁以上的女性人数多D.35岁以上的人对地铁建设关注度更高【解析】由等高条形图可得:由左图知,样本中男性数量多于女性数量,所以男性比女性更关注地铁建设,故A正确;由右图知女性中35岁以上的占多数,从而样本中多数女性是35岁以上,从而得到关注地铁建设的女性多数是35岁以上,故B正确;由左图知男性人数大于女性人数,由右图知35岁以下的男性占男性人数比35岁以上的女性占女性人数的比例少,所以无法判断35岁以下的男性人数与35岁以上的女性人数的多少,故C不一定正确;由右图知样本中35岁以上的人对地铁建设关注度更高,故D正确.故选C.3. (2023·雁塔区校级模拟)某滑冰馆统计了某小区居民在该滑冰馆一个月的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( B )A .该小区居民在该滑冰馆的锻炼天数在区间(25,30]内的最少B .估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465C .估计该小区居民在该滑冰馆的锻炼天数的中位数为16D .估计小区居民在该滑冰馆的锻炼天数的平均值为15【解析】 该小区居民在该滑冰馆的锻炼天数在区间(20,25]内的最少,A 错误;估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为(0.06+0.013+0.02)×5=0.465,B 正确;(0.02+0.04)×5=0.3,(0.02+0.04+0.047)×5=0.535,∴中位数落在区间[10,15),设中位数为x ,则:0.3+(x -10)×0.047=0.5,解得x ≈14,C 错误;0.013×5×52+0.04×5×5+102+0.047×5×10+152+0.06×5×15+202+0.013×5×20+252+0.02×5×25+302≈14,D 错误.故选B. 角度2:样本与总体数据的估计4. (2023·长沙模拟)某校1 000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( D )A .频率分布直方图中a 的值为0.004B .估计这20名学生考试成绩的第60百分位数为75C .估计这20名学生数学考试成绩的众数为80D .估计总体中成绩落在[60,70)内的学生人数为150【解析】 由频率分布直方图,得:10(2a +3a +7a +6a +2a )=1,解得a =0.005,故A错误;前三个矩形的面积和为10(2a+3a+7a)=0.6,∴这20名学生数学考试成绩的第60百分数为80,故B错误;这20名学生数学考试成绩的众数为75,故C错误;总体中成绩落在[60,70)内的学生人数为3a×10×1 000=150,故D正确.故选D.5. (多选)(2023·台江区校级模拟)在某市高三年级举行的一次调研考试中,共有30 000人参加考试.为了解考生的某科成绩情况,抽取了样本容量为n的部分考生成绩,已知所有考生成绩均在[50,100],按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出如图所示的频率分布直方图.若在样本中,成绩落在区间[50,60)的人数为16,则由样本估计总体可知下列结论正确的为( AC )A.x=0.016B.n=1 000C.考生成绩的第70百分位数为76D.估计该市全体考生成绩的平均分为71【解析】因为(x+0.030+0.040+0.010+0.004)×10=1,解得x=0.016,故A正确;因为成绩落在区间[50,60)内的人数为16,所以样本容量n=160.016×10=100,故B错误;因为(0.016+0.030)×10=0.46<0.7,(0.016+0.030+0.040)×10=0.86>0.7,所以考生成绩的第70百分位数落在区间[70,80),设考生成绩的第70百分位数为x,则0.46+(x-70)×0.04=0.7,解得x=76,即考生成绩的第70百分位数为76,故C正确;学生成绩平均分为0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6,故D错误.故选AC.角度3:样本数据的数字特征6. (2023·河南三模)某学校对班级管理实行量化打分,每周一总结,若一个班连续5周的量化打分不低于80分,则为优秀班级.下列能断定该班为优秀班级的是( D ) A.某班连续5周量化打分的平均数为83,中位数为81B.某班连续5周量化打分的平均数为83,方差大于0C.某班连续5周量化打分的中位数为81,众数为83D.某班连续5周量化打分的平均数为83,方差为1【解析】根据题意,依次分析选项:对于A,若数据为88,87,81,80,79,满足平均数为83,中位数为81,但不能断定该班为优秀班级;对于B,若数据为88,87,81,80,79,满足平均数为83,其方差一定大于0,但不能断定该班为优秀班级;对于C ,若数据为83,83,81,80,79,满足中位数为81,众数为83,但不能断定该班为优秀班级;对于D ,设数据的最低分为x ,若数据平均数为83,方差为1,则有(83-x )2<5,必有x >80,可以断定该班为优秀班级.故选D.7. (2023·雁峰区校级模拟)若数据x 1+m 、x 2+m 、…、x n +m 的平均数是5,方差是4,数据3x 1+1、3x 2+1、…、3x n +1的平均数是10,标准差是s ,则下列结论正确的是( A )A .m =2,s =6B .m =2,s =36C .m =4,s =6D .m =4,s =36 【解析】 根据题意,设数据x 1、x 2、…、x n 的平均数为x -,标准差为σ,数据3x 1+1、3x 2+1、…、3x n +1的平均数是10,则3x 1+1+3x 2+1+…+3x n +1n =3x 1+x 2+…+x n n+1=3x -+1=10,可得x -=3,而数据x 1+m 、x 2+m 、…、x n +m 的平均数是5,则有x 1+m +x 2+m +…+x n +m n =x 1+x 2+…+x n n +m =x -+m =5,可得m =2,由方差公式可得[x 1+m -x -+m ]2+[x 2+m -x -+m ]2+…+[x n +m -x -+m ]2n =x 1-x -2+x 2-x -2+…+x n -x -2n=σ2=4,s 2=[3x 1+1-3x -+1]2+[3x 2+1-3x -+1]2+…+[3x n +1-3x -+1]2n =9x 1-x -2+9x 2-x -2+…+9x n -x -2n =9σ2=36,解得s =6.故选A. 方法技巧· 精提炼1.关于平均数、方差的计算(1)利用平均数、方差的性质可简化运算,要熟记.(2)方差描述一组数据围绕平均数波动的幅度.2.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.加固训练· 促提高1. (2023·湖北模拟)云南某镇因地制宜,在政府的带领下,数字力量赋能乡村振兴,利用“农抬头”智慧农业平台,通过大数据精准分析柑橘等特色产业的生产数量、价格走势、市场供求等数据,帮助小农户找到大市场,开启“直播+电商”销售新模式,推进当地特色农产品“走出去”;通过“互联网+旅游”聚焦特色农产品、绿色食品、生态景区资源.下面是2022年7月到12月份该镇甲、乙两村销售收入统计数据(单位:百万):甲:5,6,6,7,8,16;乙:4,6,8,9,10,17.根据上述数据,则( B )A .甲村销售收入的第50百分位数为7百万B .甲村销售收入的平均数小于乙村销售收入的平均数C .甲村销售收入的中位数大于乙村销售收入的中位数D .甲村销售收入的方差大于乙村销售收入的方差【解析】 因为6×0.5=3,所以这组数据的第50百分位数为6+72=6.5,故A 错误;x 甲=16×(5+6+6+7+8+16)=8,x 乙=16×(4+6+8+9+10+17)=9,故甲村销售收入的平均数小于乙村销售收入的平均数,故B 正确;甲村销售收入的中位数为6+72=6.5,乙村销售收入的中位数为8+92=8.5,则甲村销售收入的中位数小于乙村销售收入的中位数,故C 错误;甲村销售收入的方差s 21=16×[(5-8)2+(6-8)2+(6-8)2+(7-8)2+(8-8)2+(16-8)2]=413,乙村销售收入的方差s 22=16×[(4-9)2+(6-9)2+(8-9)2+(9-9)2+(10-9)2+(17-9)2]=503,所以甲村销售收入的方差小于乙村销售收入的方差,故D 错误.故选B.2. (2023·碑林区校级模拟)如图,一组数据x 1,x 2,x 3,…,x 9,x 10的平均数为5,方差为s 21,去除x 9,x 10这两个数据后,平均数为x -,方差为s 22,则( D )A.x ->5,s 21>s 22B .x -<5,s 21<s 22 C.x -=5,s 21<s 22 D .x -=5,s 21>s 22【解析】 由题意可得:110∑i =110x i =5,x 9=1,x 10=9,则∑i =110x i =50,故x =18∑i =18x i =18(∑i =110x i -x 9-x 10)=18(50-1-9)=5,∵x 9,x 10是波幅最大的两个点的值,则去除x 9,x 10这两个数据后,整体波动性减小,故s 21>s 22.故选D.。