第一部分专题四 概率与统计-2021届高三数学二轮专题复习精品课件
- 格式:ppt
- 大小:2.00 MB
- 文档页数:45
2021年高考数学二轮复习第一部分专题四概率与统计教学案文2.古典概型与几何概型(3年6考)图、样本数字特征等)有机地交融在一起,有时仅考查利用统计知识(特别是线性回归方程)解决实际问题,题型主要有:1.概率与用样本估计总体交汇问题2.回归分析与统计的交汇问题偶考点变量间的相关关系、统计案例偶考点独立性检验与统计的交汇问题考点(一) 主要考查用统计图表估计总体以及利用样本的数字特征估计总体,且以统计图表的考查为主.用样本估计总体平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个(2)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③ B.①④C.②③ D.②④(3)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .100,10B .200,10C .100,20D .200,20[解析] (1)由图形可得各月的平均最低气温都在0 ℃以上,A 正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,B 正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C 正确;平均最高气温高于20℃的月份有2个,故D 错误.(2)∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙.又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.(3)易知样本容量为(3 500+4 500+2 000)×2%=200;抽取的高中生人数为2 000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.[答案] (1)D (2)B (3)D[方法技巧]1.方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算. (2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大. 2.与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可以求出其他数据.(2)已知频率分布直方图,求某个范围内的数据.可利用图形及某范围结合求解.[演练冲关]1.(xx·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了xx 年1月至xx 年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析:选A 根据折线图可知,xx 年8月到9月、xx 年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确.2.(xx·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7解析:选A 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.3.某电子商务公司对10 000名网络购物者xx 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析:(1)由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. (2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000. 答案:(1)3 (2)6 000考点(二)主要考查线性回归方程的求解及应[典例感悟][典例] (1)(xx·兰州诊断)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^=6.5x +17.5,则表中m 的值为( )A .45B .50C .55D .60(2)(xx·南昌模拟)设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kgD .若该中学某高中女生身高为160 cm ,则可断定其体重必为50.29 kg [解析] (1)x -=2+4+5+6+85=5,y -=30+40+50+m +705=190+m5.∵当x -=5时,y -=6.5×5+17.5=50, ∴190+m5=50,解得m =60. (2)因为回归直线方程y ^=0.85x -85.71中x 的系数为0.85>0,因此y 与x 具有正线性相关关系,所以选项A 正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(x -,y -),所以选项B 正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,所以若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kg ,所以选项C 正确,选项D 不正确.[答案] (1)D (2)D[方法技巧]求回归直线方程的关键及实际应用(1)求回归直线方程的关键是正确理解b ^,a ^的计算公式和准确地求解.(2)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.[演练冲关]1.(xx 届高三·湖北七市(州)联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如表所示(单位:万元):由上表可得回归方程为y =10.2x +a ,据此模型,预测广告费为10万元时的销售额约为( ) A .101.2万元 B .108.8万元 C .111.2万元D .118.2万元解析:选C 根据统计数据表,可得x -=15×(2+3+4+5+6)=4,y -=15×(29+41+50+59+71)=50,而回归直线y ^=10.2x +a ^经过样本点的中心(4,50),∴50=10.2×4+a ^,解得a ^=9.2,∴回归方程为y ^=10.2x +9.2.当x =10时,y =10.2×10+9.2=111.2,故选C.2.(xx 届高三·湘中名校联考)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >3.841,那么有把握认为“X 和Y 有关系”的百分比为( )C .99.5%D .95%解析:选D 由表中数据可得,当k >3.841时,有0.05的机率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的机率,也就是有95%的把握认为变量之间有关系,故选D.[典例感悟][典例] (1)(xx·全国卷Ⅲ)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M ,I ,N 中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( )A.815B.18C.115D.130(2)(xx·全国卷Ⅰ)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A.14 B.π8 C.12D.π4(3)(xx 届高三·湖北五市十校联考)在矩形ABCD 中,AD =1,AB =2AD ,在CD 上任取一点P ,△ABP 的最大边是AB 的概率为( )A.22B.32C.2-1D.3-1[解析] (1)∵Ω={(M,1),(M,2),(M,3),(M,4),(M,5),(I,1),(I,2),(I,3),(I,4),(I,5),(N,1),(N,2),(N,3),(N,4),(N,5)},∴事件总数有15种.∵正确的开机密码只有1种,∴P =115.(2)不妨设正方形的边长为2,则正方形的面积为4,正方形的内切圆的半径为1,面积为π.由题意,得S 黑=12S 圆=π2,故此点取自黑色部分的概率P =π24=π8.(3)分别以A ,B 为圆心,AB 的长为半径画弧,交CD 于P 1,P 2,则当P 在线段P 1P 2间运动时,能使得△ABP 的最大边是AB ,在Rt △P 2BC中,BP 2=2,BC =1,故CP 2=3,DP 2=2-3,同理CP 1=2-3,所以P 1P 2=2-(2-3)×2=23-2,所以P 1P 2CD=3-1,即△ABP 的最大边是AB的概率为3-1.[答案] (1)C (2)B (3)D[方法技巧]1.利用古典概型求概率的关键及注意点(1)正确求出基本事件总数和所求事件包含的基本事件总数. (2)对于较复杂的题目条件计数时要正确分类,分类时应不重不漏. 2.几何概型的适用条件及求解关键(1)当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解.(2)求解关键是寻找构成试验的全部结果的区域和事件发生的区域,有时需要设出变量,在坐标系中表示所需要的区域.[演练冲关]1.(xx 届高三·湘中名校联考)从集合A ={-2,-1,2}中随机选取一个数记为a ,从集合B ={-1,1,3}中随机选取一个数记为b ,则直线ax -y +b =0不经过第四象限的概率为( )A.29B.13C.49D.14解析:选A 从集合A ,B 中随机选取一个数后组合成的数对有(-2,-1),(-2,1),(-2,3),(-1,-1),(-1,1),(-1,3),(2,-1),(2,1),(2,3),共9对,要使直线ax -y +b =0不经过第四象限,则需a ≥0,b ≥0,共有2对满足,所以所求概率P =29,故选A.2.(xx·长春质检)如图,扇形AOB 的圆心角为120°,点P 在弦AB上,且AP =13AB ,延长OP 交弧AB 于点C ,现向扇形AOB 内投一点,则该点落在扇形AOC 内的概率为( )A.14B.13C.27D.38解析:选A 设OA =3,则AB =33,AP =3,由余弦定理可求得OP =3,则∠AOP =30°,所以扇形AOC 的面积为3π4,又扇形AOB 的面积为3π,从而所求概率为3π43π=14.3.(xx·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( )A.110 B.15 C.310 D.25解析:选D 记两次取得卡片上的数字依次为a ,b ,则一共有25个不同的数组(a ,b ),其中满足a >b 的数组共有10个,分别为(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3),(5,4),因此所求的概率P =1025=25.4.(xx·天津高考)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为( )A.45B.35C.25D.15解析:选C 从5支彩笔中任取2支不同颜色的彩笔,有10种不同取法:(红,黄),(红,蓝),(红,绿),(红,紫),(黄,蓝),(黄,绿),(黄,紫),(蓝,绿),(蓝,紫),(绿,紫).而取出的2支彩笔中含有红色彩笔的取法有(红,黄),(红,蓝),(红,绿),(红,紫),共4种,故所求概率P =410=25.5.(xx·江苏高考)记函数f (x )=6+x -x 2的定义域为D .在区间[-4,5]上随机取一个数x ,则x ∈D 的概率是________.解析:由6+x -x 2≥0,解得-2≤x ≤3,则D =[-2,3],则所求概率P =3--25--4=59.答案:59[必备知能·自主补缺] (一) 主干知识要记牢 1.概率的计算公式 (1)古典概型的概率计算公式P (A )=事件A 包含的基本事件数m基本事件总数n;(2)互斥事件的概率计算公式P (A ∪B )=P (A )+P (B );(3)对立事件的概率计算公式P (A )=1-P (A );(4)几何概型的概率计算公式P (A )=构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.2.抽样方法(1)三种抽样方法的比较 类别 共同点 各自特点 相互联系适用范围 简单随 机抽样是不放回抽样,抽样过程中,每从总体中逐个抽取总体中的个数较少系统 抽样个个体被抽到的机会(概率)相等将总体均分成几部分,按事先确定的规则,在各部分抽取 在起始部分抽样时,采用简单随机抽样总体中的个数比较多 分层 抽样 将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成(2)分层抽样中公式的运用①抽样比=样本容量个体总量=各层样本容量各层个体数量;②层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量. 3.用样本数字特征估计总体 (1)众数、中位数、平均数定义特点众数在一组数据中出现次数最多的数据 体现了样本数据的最大集中点,不受极端值的影响,而且不唯一 中位数 将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数不受极端值的影响,仅利用了排在中间数据的信息,只有一个 平均数 样本数据的算术平均数与每一个样本数据有关,只有一个(2)方差和标准差方差和标准差反映了数据波动程度的大小. ①方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2];②标准差:s =1n[x 1-x-2+x 2-x-2+…+x n -x-2] .(二) 二级结论要用好 1.频率分布直方图的3个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.2.与平均数和方差有关的4个结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ; (2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑i =1n (x i -x -)2=1n ∑i =1nx 2i -x -2,即各数平方的平均数减去平均数的平方.求s 2时,可根据题目的具体情况,结合题目给出的参考数据,灵活选用公式形式. 3.线性回归方程线性回归方程y ^=b ^x +a ^一定过样本点的中心(x ,y ).[针对练1] (xx 届高三·惠州调研)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):由最小二乘法求得回归方程y =0.67x +a ,则a 的值为________. 解析:因为x -=10+20+30+40+505=30,y -=62+68+75+81+895=75,所以回归直线一定过样本点的中心(30,75),将其代入y ^=0.67x +a ^,可得75=0.67×30+a ^,解得a ^=54.9. 答案:54.9(三) 易错易混要明了1.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.2.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.3.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.4.在求解几何概型的概率时,要注意分清几何概型的类别(体积型、面积型、长度型、角度型等).[针对练2] 一种小型电子游戏的主界面是半径为r 的圆,点击圆周上的点A 后,该点在圆周上随机转动,最后落在点B 处,当线段AB 的长不小于3r 时自动播放音乐,则一次转动能播放音乐的概率为________.解析:如图,当|AB |≥3r ,即点B 落在劣弧CC ′上时才能播放音乐.又劣弧CC ′所对应的圆心角为2π3,所以一次转动能播放音乐的概率为2π32π=13. 答案:13[课时跟踪检测]A 组——12+4提速练一、选择题1.(xx·南昌模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n =( )A .860B .720C .1 020D .1 040解析:选D 根据分层抽样方法,得 1 2001 000+1 200+n×81=30,解得n =1 040.2.(xx 届高三·西安八校联考)某班对八校联考成绩进行分析,利用随机数表法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是( )(注:下表为随机数表的第8行和第9行)⎭⎪⎬⎪⎫63 01 63 78 59 16 95 55 67 19 98 10 5071 75 12 86 73 58 07 44 39 52 38 79第8行⎭⎪⎬⎪⎫33 21 12 34 29 78 64 56 07 82 52 42 0744 38 15 51 00 13 42 99 66 02 79 54第9行 A .07 B .25 C .42D .52解析:选D 依题意得,依次选出的个体分别为12,34,29,56,07,52,…因此选出的第6个个体是52,故选D.3.(xx·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )A .5B .7C .10D .50解析:选D 根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50,故选D.4.(xx·全国卷Ⅱ)从区间[0,1]随机抽取2n 个数x 1,x 2,…,x n ,y 1,y 2,…,y n ,构成n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( )A.4n mB.2nmC.4m nD.2m n解析:选C 因为x 1,x 2,…,x n ,y 1,y 2,…,y n 都在区间[0,1]内随机抽取,所以构成的n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n )都在边长为1的正方形OABC 内(包括边界),如图所示.若两数的平方和小于1,则对应的数对在扇形OAC 内(不包括扇形圆弧上的点所对应的数对),故在扇形OAC 内的数对有m 个.用随机模拟的方法可得S 扇形S 正方形=m n ,即π4=m n,所以π=4mn.5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1解析:选D 因为所有样本点都在直线y =12x +1上,所以这组样本数据完全正相关,故其相关系数为1.6.甲、乙两位歌手在“中国新歌声”选拔赛中,5次得分情况如图所示.记甲、乙两人的平均得分分别为x 甲,x 乙,则下列判断正确的是( )A.x 甲<x 乙,甲比乙成绩稳定B.x 甲<x 乙,乙比甲成绩稳定C.x 甲>x 乙,甲比乙成绩稳定D.x 甲>x 乙,乙比甲成绩稳定 解析:选B x 甲=76+77+88+90+945=85,x 乙=75+88+86+88+935=86,s 2甲=15[(76-85)2+(77-85)2+(88-85)2+(90-85)2+(94-85)2]=52,s 2乙=15[(75-86)2+(88-86)2+(86-86)2+(88-86)2+(93-86)2]=35.6,所以x 甲<x 乙,s 2甲>s 2乙,故乙比甲成绩稳定,故选B.7.(xx·洛阳统考)若θ∈[0,π],则sin ⎝ ⎛⎭⎪⎫θ+π3>12成立的概率为( )A.13B.12C.23D .1 解析:选B 依题意,当θ∈[0,π]时,θ+π3∈⎣⎢⎡⎦⎥⎤π3,4π3,由sin ⎝ ⎛⎭⎪⎫θ+π3>12得π3≤θ+π3<5π6,即0≤θ<π2.因此,所求的概率为π2π=12. 8.将一枚骰子先后抛掷两次,并记朝上的点数分别为m ,n ,m 为2或4时,m +n >5的概率为( )A.227 B.29 C.13 D.23解析:选D 依题意得,先后抛掷两次骰子所得的点数对(m ,n )为:(1,1),(1,2),(1,3),(1,4),(1,5),…,(6,5),(6,6),共有36组,其中当m =2或4时,相应的点数对(m ,n )共有12组.当m =2时,满足m +n >5,即n >3的点数对(m ,n )共有3组;当m =4时,满足m +n >5,即n >1的点数对(m ,n )共有5组,因此所求的概率为3+512=23.9.(xx·惠州调研)齐王与田忌赛马,田忌的上等马优于齐王的中等马,劣于齐王的上等马,田忌的中等马优于齐王的下等马,劣于齐王的中等马,田忌的下等马劣于齐王的下等马,现从双方的马匹中各随机选一匹进行一场比赛,则田忌的马获胜的概率为( )A.13B.14C.15D.16解析:选A 设田忌的上、中、下三个等次的马分别为A ,B ,C ,齐王的上、中、下三个等次的马分别为a ,b ,c ,从双方的马匹中各随机选一匹进行一场比赛的所有可能结果有Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,Ca ,Cb ,Cc ,共9种,田忌马获胜有Ab ,Ac ,Bc ,共3种,所以田忌的马获胜的概率为13.10.(xx 届高三·西安八校联考)在平面区域{(x ,y )|0≤x ≤1,1≤y ≤2}内随机投入一点P ,则点P 的坐标(x ,y )满足y ≤2x 的概率为( )A.34B.23C.12D.14解析:选D 依题意得,不等式组⎩⎪⎨⎪⎧0≤x ≤1,1≤y ≤2表示的平面区域为如图所示的正方形ABCD 的内部(含边界),其面积为1×1=1,不等式组⎩⎪⎨⎪⎧0≤x ≤1,1≤y ≤2,y ≤2x表示的平面区域为图中阴影部分(含边界),其面积为12×12×1=14,因此所求的概率为14.11.(xx 届高三·广东五校联考)在区间[-1,1]上随机取一个数k ,使直线y =k (x +3)与圆x 2+y 2=1相交的概率为( )A.12B.13C.24D.23解析:选C 若直线y =k (x +3)与圆x 2+y 2=1相交,则圆心到直线的距离d =|3k |1+k2<1,解得-24<k <24,故在区间[-1,1]上随机取一个数k ,使直线y =k (x +3)与圆x 2+y 2=1相交的概率为P =222=24.12.已知样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =a x +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定解析:选A 由题意可得,x =x 1+x 2+…+x nn,y =y 1+y 2+…+y mm,则z =x 1+x 2+…+x n +y 1+y 2+…+y m n +m =n n +m ·x 1+x 2+…+x n n +m n +m ·y 1+y 2+…+y mm =n n +m·x +mn +m ·y =a x +(1-a )y ,所以nn +m=a ,mn +m =1-a ,又0<a <12,所以0<n n +m <12<mn +m,故n <m .二、填空题13.(xx·石家庄质检)设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________.解析:设样本数据的平均数为x -,则y i =2x i -1的平均数为2x --1,则y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x -+1)2+(2x 2-1-2x -+1)2+…+(2x 2 017-1-2x -+1)2]=4×12 017[(x 1-x -)2+(x 2-x -)2+…+(x 2 017-x -)2]=4×4=16.答案:1614.(xx 届高三·广西三市联考)已知函数f (x )=log a x +log 1a 8(a >0,且a ≠1),在集合14,13,12,3,4,5,6,7中任取一个数a ,则f (3a +1)>f (2a )>0的概率为________. 解析:∵3a +1>2a ,f (3a +1)>f (2a ),f (x )=log a x -log a 8,∴a >1.又f (2a )>0,∴2a >8,即a >4,符合条件的a 的值为5,6,7,故所求概率为38.答案:3815.(xx·张掖模拟)在区间[0,π]上随机取一个数θ,则使2≤2sin θ+2cos θ≤2成立的概率为________.解析:由2≤2sin θ+2cos θ≤2,得22≤sin θ+π4≤1,结合θ∈[0,π],得满足条件的θ∈⎣⎢⎡⎦⎥⎤0,π2,∴使2≤2sin θ+2cos θ≤2成立的概率为π2π=12.答案:1216.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为x -甲,x -乙,则x -甲>x -乙的概率是________.解析:设污损处的数字为m ,由15(84+85+87+90+m +99)=15(86+87+91+92+94),得m=5,即当m =5时,甲、乙两人的平均成绩相等.m 的取值有0,1,2,3,…,9,共10种可能,其中,当m =6,7,8,9时,x -甲>x -乙,故所求概率为410=25.答案:25B 组——能力小题保分练1.(xx·成都模拟)两位同学约定下午5:30~6:00在图书馆见面,且他们5:30~6:00之间到达的时刻是等可能的,先到的同学须等待,若15分钟后还未见面便离开.则这两位同学能够见面的概率是( )A.1136 B.14 C.12 D.34解析:选D 如图所示,以5:30作为原点O ,建立平面直角坐标系,设两位同学到达的时刻分别为x ,y ,设事件A 表示两位同学能够见面,所构成的区域为A ={(x ,y )||x -y |≤15},即图中阴影部分,根据几何概型概率计算公式得P (A )=30×30-2×12×15×1530×30=34.2.(xx·广州模拟)四个人围坐在一张圆桌旁,每个人面前放着一枚完全相同的硬币,所有人同时抛出自己的硬币.若硬币正面朝上,则这个人站起来;若硬币正面朝下,则这个人继续坐着.那么没有相邻的两个人站起来的概率为( )A.14B.716C.12D.916解析:选B 四个人按顺序围成一桌,同时抛出自己的硬币抛出的硬币正面记为0,反面记为1,则总的基本事件为(0,0,0,0),(0,0,0,1),(0,0,1,0),(0,0,1,1),(0,1,0,0),(0,1,0,1),(0,1,1,0),(0,1,1,1),(1,0,0,0),(1,0,0,1),(1,0,1,0),(1,0,1,1),(1,1,0,0)(1,1,0,1),(1,1,1,0),(1,1,1,1),共有16种情况.若四个人同时坐着,有1种情况;若三个人坐着,一个人站着,有4种情况;若两个人坐着,两个人站着,此时没有相邻的两个人站起来有2种情况.所以没有相邻的两个人站起来的情况共有1+4+2=7种,故所求概率为716.3.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A .13,12B .13,13C .12,13D .13,14解析:选B 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,即(8-2d )(8+4d )=64,又d ≠0,所以d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为S 1010=4+22×510=13,中位数为12+142=13.4.根据如下样本数据:x 3 4 5 6 7y4.0a -5.4 -0.50.5b -0.6得到的回归方程为y =bx +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位解析:选B 依题意得,4.0+a -5.4-0.5+0.5+b -0.65=0.9,故a +b =6.5;①又样本点的中心为(5,0.9),故0.9=5b +a ,②联立①②,解得b =-1.4,a =7.9,则y ^=-1.4x +7.9, 所以当x 每增加1个单位时,y 就减少1.4个单位.5.正六边形ABCDEF 的边长为1,在正六边形内随机取点M ,则使△MAB 的面积大于34的概率为________.解析:如图所示,作出正六边形ABCDEF ,其中心为O ,过点O 作OG ⊥AB ,垂足为G ,则OG 的长为中心O 到AB 边的距离.易知∠AOB =360°6=60°,且OA =OB ,所以△AOB 是等边三角形,所以OA =OB =AB =1,OG=OA ·sin 60°=1×32=32,即对角线CF 上的点到AB 的距离都为32. 设△MAB 中AB 边上的高为h ,则由S △MAB =12×1×h >34,解得h >32.所以要使△MAB 的面积大于34,只需满足h >32,即需使M 位于CF 的上方.故由几何概型得,△MAB 的面积大于34的概率P =S 梯形CDEF S 正六边形ABCDEF =12. 答案:126.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.解析:总体容量为6+12+18=36.当样本容量为n 时,由题意可知,系统抽样的抽样距为36n,分层抽样的抽样比是n 36,则采用分层抽样法抽取的乒乓球运动员人数为6×n 36=n6,篮球运动员人数为12×n 36=n 3,足球运动员人数为18×n 36=n2,可知n 应是6的倍数,36的约数,故n =6,12,18.当样本容量为n +1时,剔除1个个体,此时总体容量为35,系统抽样的抽样距为35n +1,因为35n +1必须是整数,所以n 只能取6,即样本容量n 为6.答案:6第二讲 大题考法——概率与统计题型(一)主要考查随机事件的概率、古典概型、频率分布直方图、茎叶图等的应用.概率与用样本估计总体的交汇问题[典例感悟][典例1] (xx·全国卷Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?[解] (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700,所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19,(x ∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800(元),20台的费用为4 300(元),10台的费用为4 800(元),因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000(元).若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000(元),10台的费用为4 500(元),因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050(元).比较两个平均数可知,购买1台机器的同时应购买19个易损零件.[备课札记]。