2018年高考数学二轮复习第1部分重点强化专题专题3概率与统计突破点8独立性检验与回归分析学案文
- 格式:doc
- 大小:439.00 KB
- 文档页数:11
第十三章概率与统计本章知识结构图第一节 概率及其计算考纲解读1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3.掌握古典概型及其概率计算公式。
4.了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义。
命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。
知识点精讲一、必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件。
二、概率在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。
对于必然事件A ,;对于不可能事件A ,=0.三、基本事件和基本事件空间在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。
四、两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为Aμ.()P A =AμμΩ。
五、互斥事件的概率1、互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A 与事件B 互斥,则()()()P A B P A P B =+ 。
2、对立事件事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。
()()1P A p A =- 。
3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。
概率与统计热点一 常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率;(3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列.解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23. 设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i . (1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥,∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪⎫133×23+C 44⎝ ⎛⎭⎪⎫134=19.(3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=827,P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3) =C 14⎝⎛⎭⎪⎫131·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭⎪⎫133×23=4081,P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4) =C 04⎝⎛⎭⎪⎫234+C 44⎝ ⎛⎭⎪⎫134=1781.所以ξ的分布列是ξ 0 2 4 P82740811781【类题通法】(1)本题44人中恰有i 人参加甲游戏的概率P =C i 4⎝⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i ,这是本题求解的关键. (2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件A i 的概率和.【对点训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为34,23,12,乙队每人答对的概率都是23,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分. (1)求ξ=2的概率;(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率. 解 (1)ξ=2,则甲队有两人答对,一人答错,故P (ξ=2)=34×23×⎝ ⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124;(2)设甲队和乙队得分之和为4为事件A ,甲队比乙队得分高为事件B .设乙队得分为η,则η~B ⎝ ⎛⎭⎪⎫3,23.P (ξ=1)=34×⎝ ⎛⎭⎪⎫1-23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-23×12=14,P (ξ=3)=34×23×12=14,P (η=1)=C 13·23·⎝⎛⎭⎪⎫132=29,P (η=2)=C 23·⎝ ⎛⎭⎪⎫232·13=49,P (η=3)=C 33⎝⎛⎭⎪⎫233=827,∴P (A )=P (ξ=1)P (η=3)+P (ξ=2)P (η=2)+P (ξ=3)·P (η=1) =14×827+1124×49+14×29=13, P (AB )=P (ξ=3)·P (η=1)=14×29=118, ∴所求概率为P (B|A )=P (AB )P (A )=11813=16.热点二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立.(1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和均值(数学期望).解 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5. (1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4) =P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)· P (A 3)P (A 4)=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681.(2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59, P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29, P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081, P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881. 故X 的分布列为X 2 3 4 5 P59291081881E (X )=2×59+3×29+4×1081+5×881=22481.【类题通法】求离散型随机变量的均值和方差问题的一般步骤 第一步:确定随机变量的所有可能值; 第二步:求每一个可能值所对应的概率; 第三步:列出离散型随机变量的分布列; 第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【对点训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求: ①顾客所获的奖励额为60元的概率; ②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解(1)设顾客所获的奖励额为X.①依题意,得P(X=60)=C11C13C24=12,即顾客所获的奖励额为60元的概率为1 2.②依题意,得X的所有可能取值为20,60.P(X=60)=12,P(X=20)=C23C24=12,即X的分布列为X 20 60P 1212所以顾客所获的奖励额的数学期望为E(X)=20×12+60×12=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为X120 60 100P 162316X1的数学期望为E(X1)=20×16+60×23+100×16=60(元),X1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X240 60 80P 162316X2的数学期望为E(X2)=40×16+60×23+80×16=60(元),X2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.热点三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.解(1)由频率分布直方图知:第3组的人数为5×0.06×40=12.第4组的人数为5×0.04×40=8.第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.①设“甲或乙进入第二轮面试”为事件A,则P(A)=1-C310C312=511,所以甲或乙进入第二轮面试的概率为5 11.②X的所有可能取值为0,1,2,P(X=0)=C24C26=25,P(X=1)=C12C14C26=815,P(X=2)=C22C26=115.所以X的分布列为X 012P 25815115E(X)=0×25+1×815+2×115=1015=23.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X 服从超几何分布.【对点训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2.P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给数据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,即P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,故P (C )=1020×1620+820×420=0.48. 热点四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^ x ,其中x ,y 为样本平均值.解 (1)由题意知n =10,x =1n ∑n i =1x i =8010=8, y =1n ∑n i =1y i=2010=2,又l xx =∑ni =1x 2i -n x 2=720-10×82=80, l xy =∑ni =1x i y i -n x y =184-10×8×2=24, 由此得b^=l xy l xx=2480=0.3, a^=y -b ^x =2-0.3×8=-0.4,故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b^=0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元).【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱.(2)求线性回归方程的关键是正确运用b^,a ^的公式进行准确的计算.【对点训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?非读书迷 读书迷总计 男 15 女 45 总计(2)将频率视为概率.1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X .若每次抽取的结果是相互独立的,求X 的分布列、期望E (X )和方差D (X ). 解 (1)完成2×2列联表如下:非读书迷 读书迷 总计 男 40 15 55 女 20 25 45 总计6040100K 2=100×(40×25-15×20)60×40×55×45≈8.249>6.635,故有99%的把握认为“读书迷”与性别有关. (2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25.由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i (i =0,1,2,3).X 的分布列为 X0 1 2 3 P27125 54125 36125 8125均值E (X )=np =3×25=65,方差D (X )=np (1-p )=3×25×⎝ ⎛⎭⎪⎫1-25=1825.。
【走向高考】2018年高考数学总复习 11-8条件概率、事件的独立性(理) 课后作业 北师大版一、选择题1.10张奖券中有2张有奖,甲、乙两人从中各抽1张,甲先抽,然后乙抽,设甲中奖的概率为P 1,乙中奖的概率为P 2,那么( )A .P 1>P 2B .P 1<P 2C .P 1=P 2D .P 1、P 2大小不确定[答案] C[解析] 设“甲中奖”事件用A 表示,“乙中奖”事件用B 表示,则P(A)=P 1=210=15. B =A ·B+A·B,且A ·B 与A·B 彼此互斥,则 P(B)=P(A ·B)+P(A·B).又P(A ·B)=810×29=845,P(A·B)=210×19=145,∴P(B)=P 2=845+145=945=15. 2.从混有5张假钞的20张百元钞票中任意抽取2张,将其中一张在验钞机上检验发现是假钞,则这两张都是假钞的概率为( )A.217B.215C.15D.310 [答案] A[解析] 记“抽到的两张中至少一张是假钞”为事件A ,记“抽到的2张都是假钞”为事件B , 则P(A)=C 25+C 15C 115C 220,P(B)=C 25C 220=P(A∩B) ∴P(B|A)=P A∩B P A =217.3.甲射击命中目标的概率是12,乙射击命中目标的概率是13,丙射击命中目标的概率是14,现在三人同时射击目标,求目标被击中的概率是( )A.34B.23C.45D.710 [答案] A[解析] 设甲命中目标为事件A ,乙命中目标为事件B ,丙命中目标为事件C ,则目标被击中的事件可以表示为A +B +C ,即击中目标表示事件A ,B ,C 中至少有一个发生,但应注意A ,B ,C 这三个事件并不是互斥的,因为目标可能同时被两人或三人击中,因此可视为目标被击中的事件的对立事件是目标未被击中,即三人都未击中目标,它可以表示为A ·B ·C ,而三人射击结果相互独立的P(A ·B ·C )=P(A )·P(B )P(C )=[1-P(A)]·[1-P(B)]·[1-P(C)]=(1-12)(1-13)(1-14)=14. 故目标被击中的概率为1-P(A ·B ·C )=1-14=34.4.甲、乙二人进行一次围棋比赛,约定先胜3局者获得这次比赛的胜利,比赛结束,假设在一局中,甲获胜的概率为0.6,乙获胜的概率为0.4,各局比赛结果相互独立,已知前2局中,甲、乙各胜1局,则再赛2局结束这次比赛的概率为( )A .0.36B .0.52C .0.24D .0.648 [答案] B[解析] 记“第i 局甲获胜”为事件A i (i =3,4,5),“第j 局乙获胜”为事件B j (j =3,4,5). 设“再赛2局结束这次比赛”为事件A ,则 A =A 3·A 4+B 3·B 4,由于各局比赛结果相互独立,故P(A)=P(A 3·A 4+B 3·B 4)=P(A 3·A 4)+P(B 3·B 4)=P(A 3)P(A 4)+B(B 3)P(B 4)=0.6×0.6+0.4×0.4=0.52.5.一个家庭中有两个小孩,已知其中一个是女孩,则另一个也是女孩的概率为( ) A.12 B.13 C.14 D.16 [答案] B[解析] 一个家庭的两个小孩只有4种可能:{两个都是男孩},{第一个是男孩,第二个是女孩},{第一个是女孩,第二个是男孩},{两个都是女孩},由题目假定可知,这4个基本事件发生是等可能的,根据题意,设基本事件空间为Ω,A 为“其中一个是女”B 为“另一个也是女”,则Ω={(男,男),(男,女),(女,男),(女,女)}.A ={(男,女),(女,男),(女,女)} B ={(女,女)}∴P(B|A)=P A∩B P A =1434=13.6.(2018·湖北理,7)如图,用K 、A 1、A 2三类不同的元件连接成一个系统.当K 正常工作且A 1、A 2至少有一个正常工作时,系统正常工作.已知K 、A 1、A 2正常工作的概率依次为0.9、0.8、0.8,则系统正常工作的概率为( )A .0.960B .0.864C .0.720D .0.576 [答案] B[解析] 本题考查相互独立事件同时发生的概率计算. 系统正常工作,则元件K 正常.A 1,A 2至少有一个正常.∴P =P(K∩A 1∩A 2)+P(K∩A 1∩A -2)+P(K∩A -1∩A 2)=0.9×0.8×0.8+0.9×0.8×0.2+0.9×0.2×0.8=0.864.二、填空题7.甲、乙两个袋中均装有红、白两种颜色的小球,这些球除颜色外完全相同,其中甲袋装有4个红球,2个白球,乙袋中装有1个红球,5个白球,现分别从甲、乙两袋中各随机取出一个球,则取出的两球都是红球的概率为________.[答案]19[解析] P =C 14C 16·C 11C 16=19.8.甲、乙、丙三人将参加某项测试,他们能达标的概率分别是0.8、0.6、0.5,则三人都达标的概率是________,三人中至少有一人达标的概率是________.[答案] 0.24 0.96[解析] 本题主要考查相互独立事件的概率和对立事件. 三人都达标的概率为0.8×0.6×0.5=0.24,至少有一人达标的概率为1-(1-0.8)·(1-0.6)·(1-0.5)=1-0.18=0.96. 三、解答题9.(2018·江苏卷)某厂生产甲、乙两种产品,甲产品的一等品率为80%,二等品率为20%;乙产品,一等品率为90%,二等品率为10%.生产一件甲产品,若是一等品可获利4万元,若是二等品则要亏损1万元;生产一件乙产品,若是一等品可获利6万元,若是二等品则要亏损2万元.设生产各种产品相互独立(1)记X(单位:万元)为生产1件甲产品和1件乙产品可获得的总利润,求X 的分布列 (2)求生产4件甲产品所获得的利润不少于10万元的概率. [解析] 本题主要考查概率的有关知识,考查运算求解的能力. 解:(1)由题设知,X 的可能取值为10,5,2,-3,且 P(X =10)=0.8×0.9=0.72,P(X =5)=0.2×0.9=0.18, P(X =2)=0.8×0.1=0.18, P(X =-3)=0.2×0.1=0.02. 由此得X 的分布列为:(2)设生产的4由题设知4n -(4-n)≥10,解得n≥145,又n∈N 得n =3,或n =4.所以P =C 34×0.83×0.2+C 44×0.84=0.8192. 故所求概率为0.8192.一、选择题1.市场上供应的灯泡中,甲厂产品占70%,乙厂占30%,甲厂产品的合格率是95%,乙厂产品的合格率是80%,则从市场上买到的一个甲厂的合格灯泡的概率是( )A .0.665B .0.56C .0.24D .0.285 [答案] A[解析] 记A =“甲厂产品”,B =“合格产品”,则P(A)=0.7,P(B|A)=0.95. ∴P(A∩B)=P(A)·P(B|A)=0.7×0.95=0.665.2.从甲袋中摸出一个红球的概率是13,从乙袋中摸出1个红球的概率是12,从两袋内各摸出1个球,则23等于( )A .2个球不都是红球的概率B .2个球都是红球的概率C .至少有1个红球的概率D .2个球中恰好有1个红球的概率 [答案] C[解析] P(A)=1-13×12=56.P(B)=13×12=16.P(C)=1-(1-12)(1-13)=23.P(D)=13×(1-12)+(1-13)×12=12.二、填空题3.(2018·湖南理,15)如下图,EFGH 是以O 为圆心、半径为1的圆的内接正方形.将一颗豆子随机地扔到该圆内,用A 表示事件“豆子落在正方形EFGH 内”,B 表示事件“豆子落在扇形OHE(阴影部分)内”,则(1)P(A)=________;(2)P(B|A)=________. [答案] (1)2π (2)14[解析] 本小题考查的内容是几何概型与条件概率. (1)P(A)=S EFGH s 圆O =2×2π=2π. (2)P(B|A)=P B∩A P A =S △OEH S EFGH =14.4.(2018·安徽理)甲罐中有5个红球,2个白球和3个黑球,乙罐中有4个红球,3个白球和3个黑球,先从甲罐中随机取出一球放入乙罐,分别以A 1,A 2和A 3表示由甲罐取出的球是红球,白球和黑球的事件;再从乙罐中随机取出一球,以B 表示由乙罐取出的球是红球的事件.则下列结论中正确的是________(写出所有正确结论的编号).①P(B)=25;②P(B|A 1)=511;③事件B 与事件A 1相互独立; ④A 1,A 2,A 3是两两互斥的事件;⑤P(B)的值不能确定,因为它与A 1,A 2,A 3中究竟哪一个发生有关. [答案] ②④[解析] 由条件概率知②正确.④显然正确.而且P(B)=P(B∩(A 1∪ A 2∪A 3)) =P(B∩A 1)+P(B∩A 2)+P (B∩A 3)=P(A 1)·P(B|A 1)+P(A 2)P(B|A 2)+P(A 3)P(B|A 3) =510·511+210·411+310·411=922. 故①③⑤不正确. 三、解答题5.一批零件中有10个合格品,2个次品,安装机器时从这批零件中任选1个,取到合格品才能安装;若取出的是次品,则不再放回.(1)求最多取2次零件就能安装的概率;(2)求在取得合格品前已取出的次品数X 的分布列. [解析] (1)第一次就能安装的概率:1012=56;第二次就能安装的概率:212·1011=533;最多取2次零件就能安装的概率为56+533=6566;(2)由于随机变量X 表示取得合格品前已取出的次品数,所以X 可能的取值为0、1、2; ∵P(X=0)=56,P(X =1)=533,P(X =2)=212·111·1010=166.∴X 的分布列为6.0.9,发芽后幼苗的成活率为0.8,试求玉米新品种的一粒种子能成长为幼苗的概率.[解析] 设玉米种发芽的事件为A ,发芽后成活为事件B.种子成长为幼苗的事件为AB(即发芽,又成活为幼苗),由已知得,出芽后的幼苗成活率为P(B|A)=0.8,P(A)=0.9.由条件概率公式P(B|A)=P AB P A ,得P(AB)=P(B|A)×P(A)=0.8×0.9=0.72.所以该玉米新品种的一粒种子,能成长为幼苗的概率为0.72.7.甲、乙两个篮球运动员互不影响地在同一位置投球,命中率分别为12与p ,且乙投球2次均未命中的概率为116.(1)求乙投球的命中率p ;(2)若甲投球1次,乙投球2次,两人共命中的次数记为X ,求X 的分布列和均值. [解析] (1)设“甲投球一次命中”为事件A ,“乙投球一次球中”为事件B. 由题意得(1-P(B))2=(1-p)2=116, 解得p =34或p =54(舍去),所以乙投球的命中率为34.(2)由题设和(1)知P(A)=12,P(A )=12,P(B)=34,P(B )=14,X 可能的取值为0,1,2,3,故P(X =0)=P(A )P(B ·B )=12×⎝ ⎛⎭⎪⎫142=132,P(X =1)=P(A)P(B ·B )+C 12P(B)P(B )P(A ) =12×⎝ ⎛⎭⎪⎫142+2×34×14×12=732, P(X =3)=P(A)P(B·B)=12×⎝ ⎛⎭⎪⎫342=932,P(X =2)=1-P(X =0)-P(X =1)-P(X =3)=1532,X 的分布列为X 的均值EX =0×132+1×32+2×32+3×32=2.。
2018年高考数学总复习概率及其计算(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018年高考数学总复习概率及其计算(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018年高考数学总复习概率及其计算(word版可编辑修改)的全部内容。
第十三章概率与统计本章知识结构图第一节概率及其计算考纲解读1。
了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3。
掌握古典概型及其概率计算公式.4。
了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义.命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。
知识点精讲一、必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件;②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件.二、概率在相同条件下,做次重复实验,事件A发生次,测得A发生的频率为,当很大时,A发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A的概率,记作。
对于必然事件A,;对于不可能事件A,=0.三、基本事件和基本事件空间在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。
四、两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为A μ。
高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。
2018全国高考真题数学统计与概率专题(附答案解析)1.(全国卷I,文数、理数第3题.5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A2.(全国卷I,文数19题.12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数 1 3 2 4 9 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案解析】解:(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=. 3.(全国卷I ,理数20题12分)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品,检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为()01p p <<,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为()f p ,求()f p 的最大值点0p ; (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【答案解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-.因此 2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =.当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数,依题意知(180,0.1)YB ,=+.X Y=⨯+,即402520225X Y所以(4025)4025490=+=+=.EX E Y EY(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于400EX>,故应该对余下的产品作检验.4.(全国卷Ⅱ,文数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5C.0.4D.0.3【答案】D5.(全国卷Ⅱ,文数、理数18题.12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5y t=-+;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案解析】解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.6.(全国卷Ⅱ,理数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5 C.0.4 D.0.3【答案】A7.(全国卷Ⅲ,文数5题.5分)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为A.0.3 B.0.4 C.0.6 D.0.7【答案】B8.(全国卷Ⅲ,文数、理数18题.12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()0.0500.0100.0013.8416.63510.828P K kk≥.【答案解析】解:(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.学科%网以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知7981802m +==. 列联表如下:超过m 不超过m第一种生产方式 15 5 第二种生产方式515(3)由于2240(151555)10 6.63520202020K ⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.9.(北京卷,文数17题,13分)电影公司随机收集了电影的有关数据,经分类整理得到下表: 电影类型 第一类 第二类 第三类 第四类 第五类 第六类 电影部数 140 50 300 200 800 510 好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;学科*网(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案解析】(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000. 第四类电影中获得好评的电影部数是200×0.25=50, 故所求概率为500.0252000=. (Ⅱ)方法一:由题意知,样本中获得好评的电影部数是 140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1 =56+10+45+50+160+51=372.故所求概率估计为37210.8142000-=. 方法二:设“随机选取1部电影,这部电影没有获得好评”为事件B .没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.由古典概型概率公式得16280.8142)00(0P B ==. (Ⅲ)增加第五类电影的好评率, 减少第二类电影的好评率. 10.(北京卷,理数17题,12分)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率; (Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.【答案解析】解:(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数是200×0.25=50. 故所求概率为500.0252000=. (Ⅱ)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评”. 故所求概率为P (AB AB +)=P (AB )+P (AB )=P (A )(1–P (B ))+(1–P (A ))P (B ). 由题意知:P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (Ⅲ)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ. 11.(天津卷,文数,15题,13分)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A ,B ,C ,D ,E ,F ,G 表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i )试用所给字母列举出所有可能的抽取结果;(ii )设M 为事件“抽取的2名同学来自同一年级”,求事件M 发生的概率.【答案解析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识.考查运用概率知识解决简单实际问题的能力.满分13分. (Ⅰ)解:由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(Ⅱ)(i )解:从抽出的7名同学中随机抽取2名同学的所有可能结果为{A ,B },{A ,C },{A ,D },{A ,E },{A ,F },{A ,G },{B ,C },{B ,D },{B ,E },{B ,F },{B ,G },{C ,D },{C ,E },{C ,F },{C ,G },{D ,E },{D ,F },{D ,G },{E ,F },{E ,G },{F ,G },共21种.(ii )解:由(Ⅰ),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A ,B },{A ,C },{B ,C },{D ,E },{F ,G },共5种. 所以,事件M 发生的概率为P (M )=521. 12.(天津卷,理数,16题,13分)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16. 现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I )应从甲、乙、丙三个部门的员工中分别抽取多少人?(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.【答案解析】本小题主要考查随机抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.学.科网(Ⅰ)解:由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.(Ⅱ)(i)解:随机变量X的所有可能取值为0,1,2,3.P(X=k)=34337C CCk k-⋅(k=0,1,2,3).所以,随机变量X的分布列为随机变量X的数学期望11218412 ()0123353535357E X=⨯+⨯+⨯+⨯=.(ii)解:设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(i)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=67.所以,事件A发生的概率为67.13.(江苏卷,3题,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为__________.【答案解析】答案:90解析:8989909191905++++=14.(浙江卷,7题,4分)设0<p<1,随机变量ξ的分布列是ξ0 1 2P12p-122p 则当p在(0,1)内增大时,A.D(ξ)减小B.D(ξ)增大C.D(ξ)先减小后增大D.D(ξ)先增大后减小【答案】D第11 页共11 页。
突破点8 独立性检验与回归分析[核心知识提炼]提炼1 变量的相关性(1)正相关:在散点图中,点散布在从左下角到右上角的区域.(2)负相关:在散点图中,点散布在从左上角到右下角的区域.(3)相关系数r:当r>0时,两变量正相关;当r<0时,两变量负相关;当|r|≤1且|r|越接近于1,相关程度越高,当|r|≤1且|r|越接近于0,相关程度越低.提炼2 线性回归方程方程y^=b^x+a^称为线性回归方程,其中b^=∑i=1nx i y i-n x-y-∑i=1nx2i-n x2,a^=y--b^x-.回归直线恒过样本中心(x,y).提炼3 独立性检验(1)确定分类变量,获取样本频数,得到2×2列联表.(2)求观测值:k=n ad-bc2a+b c+d a+c b+d.(3)根据临界值表,作出正确判断.如果k≥kα,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y有关系”.[高考真题回访]回访1 变量的相关性1.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )图81A.逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关D [对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.]2.(2012·全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C.12D .1D [样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y ^i ,代入相关系数公式r =1-∑i =1ny i -y ^i2∑i =1ny i -y2=1.]3.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序12345678零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04抽取次序 9 10 11 12 13 14 15 16零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i,y i)(i=1,2,…,n)的相关系数r=[解] (1)由样本数据得(x i,i)(i=1,2,…,16)的相关系数r=∑16i=1x i-x i-8.5∑16i=1x i-x2∑16i=1i-8.52≈-2.780.212×16×18.439≈-0.18.2分由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.4分(2)(ⅰ)由于x=9.97,s≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(x-3s,x+3s)以外,因此需对当天的生产过程进行检查.6分(ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.8分∑16i=1x2i≈16×0.2122+16×9.972≈1 591.134,10分剔除第13个数据,剩下数据的样本方差为115(1 591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.12分回访2 独立性检验4.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:图82(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法(3)附:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828K2=2a+b c+d a+c b+d.[解] (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62.3分(2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 kg旧养殖法 62 38 新养殖法34665分K 2的观测值k =200×62×66-34×382100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.8分(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.12分热点题型1 回归分析题型分析:高考命题常以实际生活为背景,重在考查回归分析中散点图的作用、回归方程的求法和应用,难度中等.【例1】 在一次抽样调查中测得样本的5组数据,得到一个变量y 关于x 的回归方程模型,其对应的数值如下表:x 0.25 0.5 1 2 4 y1612521(1)试作出散点图,根据散点图判断,y =a +bx 与y =x+m 哪一个适宜作为变量y 关于x 的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立变量y 关于x 的回归方程;(3)根据(2)中所求的变量y 关于x 的回归方程预测:当x =3时,对应的y 值为多少?(保留四位有效数字)[解] (1)作出变量y 与x 之间的散点图,如图所示,2分由图可知变量y与x近似地呈反比例函数关系,那么y=kx+m适宜作为变量y关于x的回归方程模型.4分(2)由(1)知y=kx+m适宜作为变量y关于x的回归方程模型,令t=1x,则y=kt+m,由y与x的数据表可得y与t的数据表如下:t 4210.50.25y 161252 16分作出y与t的散点图,如图所示.8分由图可知y与t近似地呈线性相关关系.又t-=1.55,y-=7.2,∑i=15t i y i=94.25,∑i=15t2i=21.312 5,所以k=∑i=15t i y i-5t-y-∑i=15t2i-5t2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,m=y--k t-=7.2-4.1344×1.55≈0.8,所以y=4.134 4t+0.8,所以y关于x的回归方程为y=4.134 4x+0.8.10分(3)由(2)得y 关于x 的回归方程是y =4.134 4x+0.8,当x =3时,可得y =4.134 43+0.8≈2.178.12分[方法指津]1.正确理解计算b ^,a ^的公式和准确的计算,是求线性回归方程的关键.其中回归直线必过样本中心(x -,y -).2.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. [变式训练1] 二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y (单位:万元/辆)进行整理,得到如下数据:使用年数x234567售价y 20 12 8 6.4 4.4 3z =ln y 3.00 2.48 2.08 1.86 1.48 1.10下面是z 关于x 的折线图:图83(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关系数加以说明;(2)求y 关于x 的回归方程,并预测某辆A 型号二手车当使用年数为9年时售价约为多少;(b ^,a ^小数点后保留两位数字)(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年. 参考公式:b ^=∑ ni =1x i -xy i -y∑ ni =1x i -x2=∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a ^=y -b ^x ,r =∑ ni =1x i -xy i -y∑ni =1x i -x2∑ ni =1y i -y2.参考数据:∑16i =1x i y i =187.4,∑16i =1x i z i =47.64,∑16i =1x 2i =139,∑ 6i =1x i -x 2=4.18, ∑ 6i =1y i -y 2=13.96,∑ 6i =1z i -z2=1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.[解] (1)由题意,知x =16×(2+3+4+5+6+7)=4.5,1分 z =16×(3.00+2.48+2.08+1.86+1.48+1.10)=2,2分又∑16i =1x i z i =47.64,∑ 6i =1x i -x 2=4.18, ∑ 6i =1z i -z2=1.53,∴r =47.64-6×4.5×24.18×1.53=- 6.366.395 4≈-0.99,∴z 与x 的相关系数大约为-0.99,说明z 与x 的线性相关程度很高.4分(2)b ^=47.64-6×4.5×2139-6×4.52=-6.3617.5≈-0.36,5分∴a ^=z -b ^x =2+0.36×4.5=3.62, ∴z 与x 的线性回归方程是z ^=-0.36x +3.62, 6分又z =ln y ,∴y 关于x 的回归方程是y ^=e -0.36x +3.62.7分 令x =9,得y ^=e -0.36×9+3.62=e 0.38,∵ln 1.46≈0.38,∴y ^=1.46,即预测某辆A 型号二手车当使用年数为9年时售价约为1.46万元. 8分(3)当y ^≥0.711 8, 即e-0.36x +3.62≥0.711 8=eln 0.711 8=e-0.34时,则有-0.36x +3.62≥-0.34, 解得x ≤11,因此,预测在收购该型号二手车时车辆的使用年数不得超过11年.12分热点题型2 独立性检验题型分析:尽管全国卷Ⅰ在近几年未在该点命题,但其极易与分层抽样、古典概型等知识交汇,是潜在的命题点之一,需引起足够的重视.【例2】 (2017·长沙二模)某学校的特长班有50名学生,其中有体育生20名,艺术生30名,在学校组织的一次体检中,该班所有学生进行了心率测试,心率全部介于50次/分到75次/分之间,现将数据分成五组,第一组[50,55),第二组[55,60),……,第五组[70,75],按上述分组方法得到的频率分布直方图如图84所示,已知图中从左到右的前三组的频率之比为a ∶4∶10.图84(1)求a 的值,并求这50名学生心率的平均值;(2)因为学习专业的原因,体育生常年进行系统的身体锻炼,艺术生则很少进行系统的身体锻炼,若从第一组和第二组的学生中随机抽取1名,该学生是体育生的概率为0.8,请将下面的列联表补充完整,并判断是否有99.5%的把握认为心率小于60次/分与常年进行系统的身体锻炼有关?说明你的理由.心率小于60次/分 心率不小于60次/分 合计 体育生 20 艺术生 30 合计50P (K 2≥k 0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.6357.87910.828参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.[解] (1)因为第二组数据的频率为0.032×5=0.16,故第二组的频数为0.16×50=8,所以第一组的频数为2a,第三组的频数为20,第四组的频数为16,第五组的频数为4.所以2a=50-20-16-8-4=2,故a=1. 3分所以这50名学生的心率平均值为52.5×250+57.5×850+62.5×2050+67.5×1650+72.5×450=63.7. 5分(2)由(1)知,第一组和第二组的学生(即心率小于60次/分的学生)共10名,其中体育生有10×0.8=8(名),故列联表补充如下:心率小于60次/分心率不小于60次/分合计体育生81220艺术生22830合计104050所以K2=10×40×20×30≈8.333>7.879,故有99.5%的把握认为心率小于60次/分与常年进行系统的身体锻炼有关.12分[方法指津]求解独立性检验问题时要注意:一是2×2列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到K2之后的结论.[变式训练2] (2017·兰州三模)随着手机的发展,“微信”逐渐成为人们交流的一种形式.某机构对“使用微信交流”的态度进行调查,随机抽取了50人,他们年龄的频数分布及对“使用微信交流”赞成人数如下表.年龄(单位:岁)[15,25)[25,35)[35,45)[45,55)[55,65)[65,75] 频数51015105 5赞成人数5101272 1(1)若以“年龄45岁为分界点”,由以上统计数据完成下面2×2列联表,并判断是否有99%的把握认为“使用微信交流”的态度与人的年龄有关;百度文库- 让每个人平等地提升自我11年龄不低于45岁的人数年龄低于45岁的人数合计赞成不赞成合计(2)若从年龄在[55,65)的被调查人中随机选取2人进行追踪调查,求2人中至少有1人不赞成“使用微信交流”的概率.参考数据:P(K2≥k0)0.150.100.050.0250.0100.0050.001 k0 2.072 2.706 3.841 5.024 6.6357.87910.828 K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.[解] (1)2×2列联表如下:年龄不低于45岁的人数年龄低于45岁的人数合计赞成102737不赞成10313合计203050K2=220×30×37×13≈9.98>6.635.所以有99%的把握认为“使用微信交流”的态度与人的年龄有关.6分(2)设年龄在[55,65)中不赞成“使用微信交流”的人为A,B,C,赞成“使用微信交流”的人为a,b,则从5人中随机选取2人有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab,共10种结果,其中2人中至少有1人不赞成“使用微信交流”的有AB,AC,Aa,Ab,BC,Ba,Bb、Ca、Cb,共9种结果,所以2人中至少有1人不赞成“使用微信交流”的概率为P=910.12分。