2021新高考数学二轮总复习专题六统计与概率6.4.3统计与概率问题综合应用学案含解析.docx
- 格式:docx
- 大小:131.37 KB
- 文档页数:6
专题4.3 统计与概率1.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【试题来源】2020年海南省高考数学试卷(新高考全国Ⅱ卷) 【答案】(1)0.64;(2)答案见解析;(3)有.【解析】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为(3)根据22⨯列联表中的数据可得222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关. 2.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【试题来源】2020年新高考全国卷Ⅱ(海南卷) 【答案】(1)0.64;(2)答案见解析;(3)有.【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得22⨯列联表;(3)计算出2K ,结合临界值表可得结论.【解析】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为(3)根据22⨯列联表中的数据可得222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关. 3.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【试题来源】2020年全国统一高考数学试卷(文)(新课标Ⅱ)【答案】(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率;(2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论. 【解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【名师点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.4.甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率.【试题来源】2020年全国统一高考数学试卷(理)(新课标Ⅱ) 【答案】(1)116;(2)34;(3)716. 【分析】(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率;(2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概率;(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率.【解析】(1)记事件:M 甲连胜四场,则()411216P M ⎛⎫== ⎪⎝⎭;(2)记事件A 为甲输,事件B 为乙输,事件C 为丙输, 则四局内结束比赛的概率为()()()()411424P P ABAB P ACAC P BCBC P BABA ⎛⎫'=+++=⨯= ⎪⎝⎭,所以,需要进行第五场比赛的概率为314P P '=-=; (3)记事件A 为甲输,事件B 为乙输,事件C 为丙输, 记事件:M 甲赢,记事件:N 丙赢,则甲赢的基本事件包括:BCBC 、ABCBC 、ACBCB 、BABCC 、BACBC 、BCACB 、BCABC 、BCBAC ,所以,甲赢的概率为()4511972232P M ⎛⎫⎛⎫=+⨯= ⎪ ⎪⎝⎭⎝⎭.由对称性可知,乙赢的概率和甲赢的概率相等,所以丙赢的概率为()97123216P N =-⨯=. 【名师点睛】本题考查独立事件概率的计算,解答的关键就是列举出符合条件的基本事件,考查计算能力,属于中等题.5.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)80i i x x =-=∑(,2021)9000i i y y =-=∑(,201))800i i i x y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=12211))))ni iiiin ni i x y x x y y y x ===----∑∑∑((((,≈1.414.【试题来源】2020年全国统一高考数学试卷(理)(新课标Ⅱ) 【答案】(1)12000;(2)0.94;(3)详见解析【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式20()()iix x y y r --=∑计算即可;(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.【解析】(1)样区野生动物平均数为201111200602020i i y ==⨯=∑, 地块数为200,该地区这种野生动物的估计值为2006012000⨯=(2)样本(,)i ix y(i=1,2,…,20)的相关系数为20()()0.943i ix x y yr--===≈∑(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.6.改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:交付金额(元)支付方式(1)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(2)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.【试题来源】2019年北京市高考数学试卷(理)【答案】(1)25;(2)见解析;(Ⅱ)见解析. 【分析】(1)由题意利用古典概型计算公式可得满足题意的概率值;(2)首先确定X 可能的取值,然后求得相应的概率值可得分布列,最后求解数学期望即可. (Ⅱ)由题意结合概率的定义给出结论即可.【解析】(1)由题意可知,两种支付方式都是用的人数为1003025540---=人,则: 该学生上个月A ,B 两种支付方式都使用的概率4021005p ==. (2)由题意可知,仅使用A 支付方法的学生中,金额不大于1000的人数占35,金额大于1000的人数占25,仅使用B 支付方法的学生中,金额不大于1000的人数占25,金额大于1000的人数占35,且X 可能的取值为0,1,2.()32605525p X ==⨯=,()22321315525p X ⎛⎫⎛⎫==+=⎪ ⎪⎝⎭⎝⎭,()32625525p X ==⨯=,X 的分布列为其数学期望:()0121252525E X =⨯+⨯+⨯=. (Ⅱ)我们不认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化.理由如下: 随机事件在一次随机实验中是否发生是随机的,是不能预知的,随着试验次数的增多,频率越来越稳定于概率.学校是一个相对消费稳定的地方,每个学生根据自己的实际情况每个月的消费应该相对固定,出现题中这种现象可能是发生了“小概率事件”.【名师点睛】本题以支付方式相关调查来设置问题,考查概率统计在生活中的应用,考查概率的定义和分布列的应用,使学生体会到数学与现实生活息息相关.7.为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成,A B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到()P C 的估计值为0.70.(1)求乙离子残留百分比直方图中,a b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【试题来源】2019年全国统一高考数学试卷(理)(新课标Ⅱ) 【答案】(1) 0.35a =,0.10b =;(2) 4.05,6.【分析】(1)由()0.70P C =及频率和为1可解得a 和b 的值;(2)根据公式求平均数. 【解析】(1)由题得0.200.150.70a ++=,解得0.35a =,由0.050.151()10.70b P C ++=-=-,解得0.10b =.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为0.1520.2030.3040.2050.1060.057 4.05⨯+⨯+⨯+⨯+⨯+⨯=,乙离子残留百分比的平均值为0.0530.1040.1550.3560.2070.1586⨯+⨯+⨯+⨯+⨯+⨯=【名师点睛】本题考查频率分布直方图和平均数,属于基础题. 8.设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望;(2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率. 【试题来源】2019年天津市高考数学试卷(理) 【答案】(1)见解析;(2)20243【分析】(1)由题意可知分布列为二项分布,结合二项分布的公式求得概率可得分布列,然后利用二项分布的期望公式求解数学期望即可;(2)由题意结合独立事件概率公式计算可得满足题意的概率值.【解析】(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故2~3,3X B ⎛⎫ ⎪⎝⎭,从面()()33210,1,2,333k kk P X k C k -⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭. 所以,随机变量X 的分布列为随机变量X 的数学期望()323E X =⨯=. (2)设乙同学上学期间的三天中7:30之前到校的天数为Y ,则2~3,3Y B ⎛⎫ ⎪⎝⎭. 且{3,1}{2,0}M X Y X Y =====.由题意知事件{}3,1X Y ==与{}2,0X Y ==互斥,且事件{}3X =与{}1Y =,事件{}2X =与{}0Y =均相互独立, 从而由(1)知{}{}()()3,12,0P M P X Y X Y =====()()3,12,0P X Y P X Y ===+== (3)(1)(2)(0)P X P Y P X P Y ===+==824120279927243=⨯+⨯=. 【名师点睛】本题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.9.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.828【试题来源】2019年全国统一高考数学试卷(文)(新课标Ⅱ)【答案】(1)43 ,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的22⨯列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有95%的把握认为男、女顾客对该商场服务的评价有差异.【解析】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==,50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.【名师点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算2K的值,独立性检验,属于简单题目.10.11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X 个球该局比赛结束. (1)求P (X =2);(2)求事件“X =4且甲获胜”的概率.【试题来源】2019年全国统一高考数学试卷(理)(新课标Ⅱ) 【答案】(1)0.5;(2)0.1【分析】(1)本题首先可以通过题意推导出()2P X =所包含的事件为“甲连赢两球或乙连赢两球”,然后计算出每种事件的概率并求和即可得出结果; (2)本题首先可以通过题意推导出4P X所包含的事件为“前两球甲乙各得1分,后两球均为甲得分”,然后计算出每种事件的概率并求和即可得出结果.【解析】(1)由题意可知,()2P X =所包含的事件为“甲连赢两球或乙连赢两球” 所以20.50.40.50.60.5P X(2)由题意可知,4P X 包含的事件为“前两球甲乙各得1分,后两球均为甲得分”所以40.50.60.50.4+0.50.40.50.40.1P X【名师点睛】本题考查古典概型的相关性质,能否通过题意得出()2P X =以及4P X所包含的事件是解决本题的关键,考查推理能力,考查学生从题目中获取所需信息的能力,是中档题.11.为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X .(1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i =表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i =,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=. ①证明:1{}i i p p +-(0,1,2,,7)i =为等比数列;②求4p ,并根据4p 的值解释这种试验方案的合理性. 【试题来源】2019年全国统一高考数学试卷(理)(新课标Ⅱ) 【答案】(1)见解析;(2)①见解析;②41257p =. 【分析】(1)首先确定X 所有可能的取值,再来计算出每个取值对应的概率,从而可得分布列;(2)①求解出,,a b c 的取值,可得()110.40.50.11,2,,7i i i i p p p p i -+=++=⋅⋅⋅,从而整理出符合等比数列定义的形式,问题得证;②列出证得的等比数列的通项公式,采用累加的方式,结合8p 和0p 的值可求得1p ;再次利用累加法可求出4p . 【解析】(1)由题意可知X 所有可能的取值为1-,0,1()()11P X αβ∴=-=-;()()()011P X αβαβ==+--;()()11P X αβ==-则X 的分布列如下:(2)0.5α=,0.8β=0.50.80.4a ∴=⨯=,0.50.80.50.20.5b =⨯+⨯=,0.50.20.1c =⨯=①()111,2,,7i i i i p ap bp cp i -+=++=⋅⋅⋅ 即()110.40.50.11,2,,7i i i i p p p p i -+=++=⋅⋅⋅,整理可得()11541,2,,7ii i p p p i -+=+=⋅⋅⋅ ()()1141,2,,7i i i i p p p p i +-∴-=-=⋅⋅⋅{}1i i p p +∴-()0,1,2,,7i =⋅⋅⋅是以10p p -为首项,4为公比的等比数列②由①知()110144i i i i p p p p p +-=-⋅=⋅,78714p p p ∴-=⋅,67614p p p -=⋅,……,01014p p p -=⋅,作和可得()880178011114414441143p p p p p ---=⋅++⋅⋅⋅+===-,18341p ∴=-, ()4401234401184144131144441434141257p p p p p --∴=-=⋅+++==⨯==--+. 4p 表示最终认为甲药更有效的.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为410.0039257p =≈,此时得出错误结论的概率非常小,说明这种实验方案合理.【名师点睛】本题考查离散型随机变量分布列的求解、利用递推关系式证明等比数列、累加法求解数列通项公式和数列中的项的问题.本题综合性较强,要求学生能够熟练掌握数列通项求解、概率求解的相关知识,对学生分析和解决问题能力要求较高. 12.电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率; (3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系. 【试题来源】2018年全国普通高等学校招生统一考试(理)(北京卷)【答案】(1) 概率为0.025;(2) 概率估计为0.35;(3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ【分析】(1)先根据频数计算是第四类电影的频率,再乘以第四类电影好评率得所求概率,(2)恰有1部获得好评为第四类电影获得好评第五类电影没获得好评和第四类电影没获得好评第五类电影获得好评这两个互斥事件,先利用独立事件概率乘法公式分别求两个互斥事件的概率,再相加得结果,(3) k ξ服从0-1分布,因此()=1k D p p ξ-,即得1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.【解析】解:(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数是200×0.25=50. 故所求概率为500.0252000=. (2)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评”. 故所求概率为P (AB AB +)=P (AB )+P (AB ) =P (A )(1–P (B ))+(1–P (A ))P (B ). 由题意知P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.【名师点睛】互斥事件概率加法公式:若A ,B 互斥,则P(A+B)=P(A)+P(B),独立事件概率乘法公式:若A ,B 相互独立,则P(AB)=P(A)P(B).13.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,【试题来源】2018年全国普通高等学校招生统一考试(理)(新课标III卷)【答案】(1)第二种生产方式的效率更高.理由见解析;(2)80;(3)能.【分析】(1)计算两种生产方式的平均时间即可.(2)计算出中位数,再由茎叶图数据完成列联表.(3)由公式计算出2k,再与6.635比较可得结果.【解析】(1)第二种生产方式的效率更高.理由如下:(1)由茎叶图可知用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(2)由茎叶图可知用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(3)由茎叶图可知用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知7981802m +==. 列联表如下:(3)由于()224015155510 6.63520202020K ⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.【名师点睛】本题主要考查了茎叶图和独立性检验,考察学生的计算能力和分析问题的能力,贴近生活.14.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17)建立模型①:ˆ30.413.5yt =-+;根据2010年至2016年的数据(时间变量t 的值依次为1,2,,7)建立模型②:ˆ9917.5yt =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【试题来源】2018年全国普通高等学校招生统一考试(文)(新课标II卷)【答案】(1)利用模型①预测值为226.1,利用模型②预测值为256.5,(2)利用模型②得到的预测值更可靠.【分析】(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果;(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆy=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆy=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(1)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆy =99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(2)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.【名师点睛】若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回x y求参数.归直线方程有待定参数,则根据回归直线方程恒过点(,)15.已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一。
《计数原理与概率》高考复习指导一、考试说明:1.考试内容(1)分类计数原理与分步计数原理,排列与组合.(2)等可能性事件的概率,互斥事件有一个发生的概率,相互独立事件同时发生的概率.2.考试要求(1)掌握分类计数原理与分步计数原理,并能用它们分析和解决一些简单的应用问题.(2)理解排列与组合的意义,掌握排列数与组合数的计算公式,掌握组合数的两个性质,并能用它们解决一些简单的应用问题.(3)了解等可能性事件的概率的意义,会用排列组合公式计算一些等可能性事件的概率.(4)了解互斥事件的意义,会用互斥事件的概率加法公式计算一些事件的概率.(5)了解相互独立事件的意义,会用相互独立事件的概率乘法公式计算一些事件的概率,会计算事件在n次独立重复试验中恰好发生k次的概率.二、高考试题分析排列与组合、概率与统计是高中数学的重要内容.一方面,这部分内容占用教学时数多达36课时,另一方面,这部分内容是进一步学习高等数学的基础知识,因此,它是高考数学命题的重要内容.从近三年全国高考数学(新材)试题来看,主要是考查排列与组合、概率与统计的基本概念、公式及基本技能、方法,以及分析问题和解决问题的能力.试题特点是基础和全面.题目类型有选择题、填空题、解答题,一般是两小(9分~10分)一大(12分),解答题通常是概率问题.试题难度多为低中档.为了支持高中数学课程的改革,高考数学命题对这部分将进一步重视,但题目数量、难度、题型将会保持稳定.例1.(1999年全国)在一块并排10垄的田地中,选择2垄分别种植A、B两种作物,每种作物种植一垄,为有利于作物生长,要求A、B两种作物间的间隔不小于6垄,则不同的选垄方法共有_______种(用数字作答).[解析]A种植在左边第一垄时,B有3种不同的种植方法;A种植在左边第二垄时,B有两种不同的种植方法;A种植在左边第三垄时,B只有一种种植方法.B在左边种植的情形与上述情形相同.故共有2(3+2+1)=12种不同的选垄方法.∴应填12.例2.(2003年新教材)将3种作物种植在如图所示的5块试验田里,每一块种植一种作物且相邻的试验田不能种植同一作物,不同的种植方法共有______种(以数字作答).[解析]将5块试验田从左到右依次看作甲、乙、丙、丁、戊,3种作物依次看作A、B、C,则3种作物都可以种植在甲试验田里,由于相邻的试验田不能种植同一种作物,从而可知在乙试验田里只能有两种作物.同理,在丙、丁、戊试验田里也只能有两种作物可以种植.由分步计数原理,不同的种植方法共有3×2×2×2=48种.∴应填:48例3.(2003年全国高考题)某城市中心广场建造一个花圃,花圃分为6个部分(如图),现要栽种4种不同颜色的花,每部分栽种1种且相邻部分不能栽种同样颜色的花,不同的栽法有_______种.[解析]由于第1、2、3块两两相邻,我们先安排这三块,给第1、2、3块种花时分别有4、3、2种种法,所以共有4×3×2=24种不同种法.下面给第4块种花,若第4块与第6块同色,只有一种种植方法,则第5块只有2种种法,若第4块与第2块同色时,共有2×1=2种种法.若第4块与第6块不同色,但第4块与第2块同色,则第6块有2种种植的方案,而第5块只有1种种法,共有2种不同的种植方法.若第4块与第6块不同色,但第4块与第2块不同色,则第6块有1种种法,则第5块也有一种不同种法,所以第4块与第6块不同色时,有1种种法.综上共有24×(2+2+1)=120种不同的种植方法.例4.(2003年春季考试题)某班新年联欢会原定的5个节目已排成节目单,开演前又增加了两个新节目,如果将这两个节目插入原节目单中,那么不同的插法的种数为A 、42B 、30C 、20D 、12[解析]将两个新节目插入5个固定顺序节目单有两种情况:(1)两个新节目相邻的插法种数为226A ;(2)两个节目不相邻的插法种数为26A ;由分类计数原理共有2226642A A +=种方法,选A.例5.(2004重庆)(本小题满分12分)设甲、已、丙三人每次射击命中目标的概率分别为0.7、0.6和0.5。
概率及其计算一、考纲解读1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3.掌握古典概型及其概率计算公式。
4.了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义。
二、命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下.三、知识点精讲(一).必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件;②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件。
(二).概率在相同条件下,做次重复实验,事件A发生次,测得A发生的频率为,当很大时,A发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A的概率,记作。
对于必然事件A,;对于不可能事件A,=0(三).两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同 ()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为A μ.()P A =A μμΩ。
(四).互斥事件1、互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A 与事件B 互斥,则()()()P A B P A P B =+ 。
2、对立事件 事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。
()()1P A p A =- 。
3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。
四、解答题总结一、选择题1.从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为A.0.6B.0.5C.0.4D.0.32.若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为A.0.3B.0.4C.0.6D.0.73.如图,正方形ABCD内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A.14B.8πC.12D.4π4.从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C.310D.255.有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为A .45B .35C .25D .156.甲、乙两人下棋,两人下成和棋的概率是21,甲获胜的概率是31,则甲不输的概率为A .65B .52C .61D .31 7.为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是A .13B .12C .23D .568.某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为A .B .C .D . 9.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为A .15B .25C .825D .92510.小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M ,I ,N 中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是A .815B .18C .115D .13011.如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为A .310 B .15 C .110 D .120 710583831012.在区间[]0,2上随机地取一个数x ,则事件“1211log ()12x -+≤≤”发生的概率为A .34B .23C .13D .1413.掷两颗均匀的骰子,则点数之和为5的概率等于A .118B .19C .16D .11214.在区间[2,3]-上随机选取一个数X ,则1X ≤的概率为A .45B .35C .25D .1515.从中任取个不同的数,则取出的个数之差的绝对值为的概率是A .B .C .D .16.若某公司从五位大学毕业生甲、乙、丙、丁、戊中录用三人,这五人被录用的机会均等,则甲或乙被录用的概率为A .B .C .D . 17.在长为12cm 的线段上任取一点。
2021年高考数学二轮复习 概率与统计综合题2 文(文)二、概率与统计综合题概率解答题为每年高考的必考内容,主要考查互斥事件和对立事件的关系、古典概型和几何概型.要求学生能准确理解题意,迅速确定是古典概型还是几何概型,然后用概率公式求解.对于古典概型,要准确列出所有基本事件的个数和所求事件包含的基本事件个数.对于几何概型,一定要明确其与面积(体积、长度等)的关系.对于较复杂的问题,可以借助于图形和表格帮助分析.阅卷案例2 (xx·山东济南一模)一个袋中装有五个形状、大小完全相同的球,其中有两个红球,三个白球.(1)从袋中随机取两个球,求取出的两个球颜色不同的概率;(2)从袋中随机取一个球,将球放回袋中,然后再从袋中随机取一个球,求两次取出的球中至少有一个红球的概率.审题(1切入点:转化为古典概型的概率计算.关注点:分别准确列出随机取两个球及两个球颜色不同的可能结果.(2)切入点:转化为古典概型的概率计算.关注点:分别准确列出第一次取出一球,放回后再取出一球及两次取出的球中至少有一个红球的数.解题【解】 (1)两个红球记为a 1,a 2,三个白球记为b 1,b 2,b 3,从袋中随机取两个球,其一切可能的结果组成的基本事件有:(a 1,a 2),(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3),(b 1,b 2),(b 1,b 3),(b 2,b 3)共10个.(2分)设事件A 为“取出的两个球颜色不同”,A 中的基本事件有:(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3)共6个.(4分)P (A )=610=35.(6分) (2)从袋中随机取一个球,将球放回袋中,然后再从袋中随机取一个球,其一切可能的结果组成的基本事件有:(a 1,a 1),(a 1,a 2),(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,a 1),(a 2,a 2),(a 2,b 1),(a 2,b 2),(a 2,b 3),(b 1,a 1),(b 1,a 2),(b 1,b 1),(b 1,b 2),(b 1,b 3),(b 2,a 1),(b 2,a 2),(b 2,b 1),(b 2,b 2),(b 2,b 3),(b 3,a 1),(b 3,a 2),(b 3,b 1),(b 3,b 2),(b 3,b 3)共25个.(8分)设事件B 为“两次取出的球中至少有一个红球”,B 中的基本事件有:(a 1,a 1),(a 1,a 2),(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,a 1),(a 2,a 2),(a 2,b 1),(a 2,b 2),(a 2,b 3),(b 1,a 1),(b 1,a 2),(b 2,a 1),(b 2,a 2),(b 3,a 1),(b 3,a 2)共16个.(10分)P (B )=1625.(12分) 阅卷现场评分细则第(1)问得分点及说明得分点:①表示出“随机取两个球”的所有结果,得2分;②表示出“两个球颜色不同”的所有结果,得2分;③运用古典概型公式并计算P (A )=35,得2分.说明:求“随机取两个球”或“两个球颜色不同”的所有可能结果没有求对,不得分. 第(2)问得分点及说明得分点:①表示出“先取出一球,放回后再取出一球”的所有结果,得2分;②表示出“两次取出的球中至少有一个红球”的所有结果,得2分;③运用古典概型公式并计算P (B )=1625得2分. 说明:求“先取出一对,放回后再取出一对”或“两次取出的球中至少有一个红球”的所有可能结果没有求对,不得分.满分规则规则1得步骤分:是得分点的步骤,有则给分,无则没分如第(1)问中或第(2)问中都是按照“三步曲”来完成.先求分母,再求分子,最后代入古典概型公式.规则2得关键分: 解题过程的关键点,有则给分,无则没分如第(1)问中或第(2)中红球经得a 1,a 2;白球经得b 1,b 2,b 3.及思考问题中一个放回和一个不放回.规则3规范答题得分:概率问题一般都有实际背景,解答时要将复杂事件拆分为简单事件,不可以只给出一些表达式,忽略文字解析所以本题解答中的每一问都需按照如下形式:一改→二列分母→三列分子→四代X 公式→五总结.阅卷心得狠抓基础保成绩,分步解决克难题通过高考阅卷,可以看出学生基础知识的掌握和计算能力非常薄弱.例如,数学概念不清楚,不能准确地理解数学语言,证明推理能力弱,缺乏思维的严谨性,运算能力差,数学过程的表述过于简单.这就告诉我们,在考前的关键阶段,要把常用的基础知识把握准.题目再难,每个题目中的条件总是可以推导出结论的,哪怕只推导出一个结论,也可能是得分点.如根据法则和公式进行正确运算、变形等.总之,考场答题重点要突出,过程以踩点、清晰、完整、工整、简洁为佳.变题2.(xx·安徽江南十校联考)某校在一次期末数学测试中,为统计学生的考试情况,从学校的2 000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于60分到140分之间(满分150分),将统计结果按如下方式分成八组:第一组[60,70),第二组[70,80),……,第八组:[130,140],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)估计该校的2 000名学生这次考试成绩的平均分(可用中值代替各组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差大于10分的概率.解:(1)由频率分布直方图知第七组的频率f 7=1-(0.004+0.012+0.016+0.03+0.02+0.006+0.004)×10=0.08.直方图如图.(2)估计该校的2 000名学生这次考试的平均成绩为:65×0.04+75×0.12+85×0.16+95×0.3+105×0.2+1 15×0.06+125×0.08+135×0.04=97(分).(3)第六组有学生3人,分别记作A1,A2,A3,第八组有学生2人,分别记作B1,B2,则从中任取2人的所有基本事件为(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A1,A2),(A1,A3),(A2,A3),(B1,B2),共10个.分差大于10分表示所选2人来自不同组,其基本事件有6个:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),所以从中任意抽取2人,分差大于10分的概率P=610=35.29883 74BB 璻 25949 655D 敝q><37920 9420 鐠l32924 809C 肜28905 70E9 烩j25502 639E 掞K。
核心考点2 用样本估计总体核心知识· 精归纳1.频率分布直方图的相关结论(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积. (3)直方图中每组样本的频数为频率×总数. 2.中位数、众数、平均数、百分位数 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的_中位数__.(2)众数一组数据中出现次数_最多__的数据称为这组数据的众数.(3)平均数 一组数据的_算术平均数__即为这组数据的平均数,n 个数据x 1,x 2,…,x n 的平均数x = 1n(x 1+x 2+…+x n ) . (4)百分位数①第p 百分位数的定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据_小于或等于__这个值,且至少有 (100-p)% 的数据大于或等于这个值.②计算一组n 个数据的第p 百分位数的步骤:第1步,按_从小到大__排列原始数据.第2步,计算i =_n ×p %__.第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第_(i +1)__项数据的平均数.3.样本的数字特征如果有n 个数据x 1,x 2,…,x n ,那么:平均数为x = 1n(x 1+x 2+…+x n ) , 标准差为s =1n [x 1-x 2+x 2-x 2+…+x n -x 2],方差为s 2= 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] .多维题组· 明技法角度1:统计图表1. (2023·郑州三模)为了树立和践行绿水青山就是金山银山的理念,A市某高中全体教师于2023年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计600棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为5∶3∶2,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为( C )A.30棵B.50棵C.72棵D.80棵【解析】由题意可知,梧桐树苗有40%×600=240颗,根据人数占比可得中年教师应分得梧桐的数量为240×35+3+2=72颗.故选C.2. (2023·市中区校级二模)某调查机构抽取了部分关注济南地铁建设的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图.根据图中(35岁以上含35岁)的信息,关于该样本的结论不一定正确的是( C )A.男性比女性更关注地铁建设B.关注地铁建设的女性多数是35岁以上C.35岁以下的男性人数比35岁以上的女性人数多D.35岁以上的人对地铁建设关注度更高【解析】由等高条形图可得:由左图知,样本中男性数量多于女性数量,所以男性比女性更关注地铁建设,故A正确;由右图知女性中35岁以上的占多数,从而样本中多数女性是35岁以上,从而得到关注地铁建设的女性多数是35岁以上,故B正确;由左图知男性人数大于女性人数,由右图知35岁以下的男性占男性人数比35岁以上的女性占女性人数的比例少,所以无法判断35岁以下的男性人数与35岁以上的女性人数的多少,故C不一定正确;由右图知样本中35岁以上的人对地铁建设关注度更高,故D正确.故选C.3. (2023·雁塔区校级模拟)某滑冰馆统计了某小区居民在该滑冰馆一个月的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( B )A .该小区居民在该滑冰馆的锻炼天数在区间(25,30]内的最少B .估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465C .估计该小区居民在该滑冰馆的锻炼天数的中位数为16D .估计小区居民在该滑冰馆的锻炼天数的平均值为15【解析】 该小区居民在该滑冰馆的锻炼天数在区间(20,25]内的最少,A 错误;估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为(0.06+0.013+0.02)×5=0.465,B 正确;(0.02+0.04)×5=0.3,(0.02+0.04+0.047)×5=0.535,∴中位数落在区间[10,15),设中位数为x ,则:0.3+(x -10)×0.047=0.5,解得x ≈14,C 错误;0.013×5×52+0.04×5×5+102+0.047×5×10+152+0.06×5×15+202+0.013×5×20+252+0.02×5×25+302≈14,D 错误.故选B. 角度2:样本与总体数据的估计4. (2023·长沙模拟)某校1 000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( D )A .频率分布直方图中a 的值为0.004B .估计这20名学生考试成绩的第60百分位数为75C .估计这20名学生数学考试成绩的众数为80D .估计总体中成绩落在[60,70)内的学生人数为150【解析】 由频率分布直方图,得:10(2a +3a +7a +6a +2a )=1,解得a =0.005,故A错误;前三个矩形的面积和为10(2a+3a+7a)=0.6,∴这20名学生数学考试成绩的第60百分数为80,故B错误;这20名学生数学考试成绩的众数为75,故C错误;总体中成绩落在[60,70)内的学生人数为3a×10×1 000=150,故D正确.故选D.5. (多选)(2023·台江区校级模拟)在某市高三年级举行的一次调研考试中,共有30 000人参加考试.为了解考生的某科成绩情况,抽取了样本容量为n的部分考生成绩,已知所有考生成绩均在[50,100],按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出如图所示的频率分布直方图.若在样本中,成绩落在区间[50,60)的人数为16,则由样本估计总体可知下列结论正确的为( AC )A.x=0.016B.n=1 000C.考生成绩的第70百分位数为76D.估计该市全体考生成绩的平均分为71【解析】因为(x+0.030+0.040+0.010+0.004)×10=1,解得x=0.016,故A正确;因为成绩落在区间[50,60)内的人数为16,所以样本容量n=160.016×10=100,故B错误;因为(0.016+0.030)×10=0.46<0.7,(0.016+0.030+0.040)×10=0.86>0.7,所以考生成绩的第70百分位数落在区间[70,80),设考生成绩的第70百分位数为x,则0.46+(x-70)×0.04=0.7,解得x=76,即考生成绩的第70百分位数为76,故C正确;学生成绩平均分为0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6,故D错误.故选AC.角度3:样本数据的数字特征6. (2023·河南三模)某学校对班级管理实行量化打分,每周一总结,若一个班连续5周的量化打分不低于80分,则为优秀班级.下列能断定该班为优秀班级的是( D ) A.某班连续5周量化打分的平均数为83,中位数为81B.某班连续5周量化打分的平均数为83,方差大于0C.某班连续5周量化打分的中位数为81,众数为83D.某班连续5周量化打分的平均数为83,方差为1【解析】根据题意,依次分析选项:对于A,若数据为88,87,81,80,79,满足平均数为83,中位数为81,但不能断定该班为优秀班级;对于B,若数据为88,87,81,80,79,满足平均数为83,其方差一定大于0,但不能断定该班为优秀班级;对于C ,若数据为83,83,81,80,79,满足中位数为81,众数为83,但不能断定该班为优秀班级;对于D ,设数据的最低分为x ,若数据平均数为83,方差为1,则有(83-x )2<5,必有x >80,可以断定该班为优秀班级.故选D.7. (2023·雁峰区校级模拟)若数据x 1+m 、x 2+m 、…、x n +m 的平均数是5,方差是4,数据3x 1+1、3x 2+1、…、3x n +1的平均数是10,标准差是s ,则下列结论正确的是( A )A .m =2,s =6B .m =2,s =36C .m =4,s =6D .m =4,s =36 【解析】 根据题意,设数据x 1、x 2、…、x n 的平均数为x -,标准差为σ,数据3x 1+1、3x 2+1、…、3x n +1的平均数是10,则3x 1+1+3x 2+1+…+3x n +1n =3x 1+x 2+…+x n n+1=3x -+1=10,可得x -=3,而数据x 1+m 、x 2+m 、…、x n +m 的平均数是5,则有x 1+m +x 2+m +…+x n +m n =x 1+x 2+…+x n n +m =x -+m =5,可得m =2,由方差公式可得[x 1+m -x -+m ]2+[x 2+m -x -+m ]2+…+[x n +m -x -+m ]2n =x 1-x -2+x 2-x -2+…+x n -x -2n=σ2=4,s 2=[3x 1+1-3x -+1]2+[3x 2+1-3x -+1]2+…+[3x n +1-3x -+1]2n =9x 1-x -2+9x 2-x -2+…+9x n -x -2n =9σ2=36,解得s =6.故选A. 方法技巧· 精提炼1.关于平均数、方差的计算(1)利用平均数、方差的性质可简化运算,要熟记.(2)方差描述一组数据围绕平均数波动的幅度.2.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.加固训练· 促提高1. (2023·湖北模拟)云南某镇因地制宜,在政府的带领下,数字力量赋能乡村振兴,利用“农抬头”智慧农业平台,通过大数据精准分析柑橘等特色产业的生产数量、价格走势、市场供求等数据,帮助小农户找到大市场,开启“直播+电商”销售新模式,推进当地特色农产品“走出去”;通过“互联网+旅游”聚焦特色农产品、绿色食品、生态景区资源.下面是2022年7月到12月份该镇甲、乙两村销售收入统计数据(单位:百万):甲:5,6,6,7,8,16;乙:4,6,8,9,10,17.根据上述数据,则( B )A .甲村销售收入的第50百分位数为7百万B .甲村销售收入的平均数小于乙村销售收入的平均数C .甲村销售收入的中位数大于乙村销售收入的中位数D .甲村销售收入的方差大于乙村销售收入的方差【解析】 因为6×0.5=3,所以这组数据的第50百分位数为6+72=6.5,故A 错误;x 甲=16×(5+6+6+7+8+16)=8,x 乙=16×(4+6+8+9+10+17)=9,故甲村销售收入的平均数小于乙村销售收入的平均数,故B 正确;甲村销售收入的中位数为6+72=6.5,乙村销售收入的中位数为8+92=8.5,则甲村销售收入的中位数小于乙村销售收入的中位数,故C 错误;甲村销售收入的方差s 21=16×[(5-8)2+(6-8)2+(6-8)2+(7-8)2+(8-8)2+(16-8)2]=413,乙村销售收入的方差s 22=16×[(4-9)2+(6-9)2+(8-9)2+(9-9)2+(10-9)2+(17-9)2]=503,所以甲村销售收入的方差小于乙村销售收入的方差,故D 错误.故选B.2. (2023·碑林区校级模拟)如图,一组数据x 1,x 2,x 3,…,x 9,x 10的平均数为5,方差为s 21,去除x 9,x 10这两个数据后,平均数为x -,方差为s 22,则( D )A.x ->5,s 21>s 22B .x -<5,s 21<s 22 C.x -=5,s 21<s 22 D .x -=5,s 21>s 22【解析】 由题意可得:110∑i =110x i =5,x 9=1,x 10=9,则∑i =110x i =50,故x =18∑i =18x i =18(∑i =110x i -x 9-x 10)=18(50-1-9)=5,∵x 9,x 10是波幅最大的两个点的值,则去除x 9,x 10这两个数据后,整体波动性减小,故s 21>s 22.故选D.。
6.4.3统计与概率问题综合应用
必备知识精要梳理
离散型随机变量的期望与方差
(1)E(X)=x1p1+x2p2+…+x i p i+…+x n p n为X的均值或数学期望.
(2)D(X)=(x1-E(X))2·p1+(x2-E(X))2·p2+…+(x i-E(X))2·p i+…+(x n-E(X))2·p n叫做随机变量X的方差.
(3)均值与方差的性质:E(aX+b)=aE(X)+b;E(ξ+η)=E(ξ)+E(η);D(aX+b)=a2D(X).
关键能力学案突破
热点一离散型随机变量的期望与方差
【例1】(2020山西临汾高三适应性训练,19)今年情况特殊,小王在居家自我隔离时对周边的水产养殖产业进行了研究.A、B两个投资项目的利润率分别为投资变量X和Y.根据市场分析,X 和Y的分布列分别为:
X5%10%
P0.80.2
(1)若在A,B两个项目上各投资100万元,ξ和η分别表示投资项目A和B所获得的利润,求方差D(ξ),D(η);
(2)若在A,B两个项目上共投资200万元,那么如何分配,能使投资A项目所得利润的方差与投资B项目所得利润的方差的和最小,最小值是多少?
[注:D(aX+b)=a2D(X)]
解题心得期望与方差的一般计算步骤
(1)理解离散型随机变量的意义,写出变量X的所有可能取的值;
(2)求X取各个值时的概率,写出分布列;
(3)根据分布列,正确运用期望与方差的定义或公式进行计算.
若变量X服从二项分布等特殊分布时,期望与方差可直接利用公式求解.
【对点训练1】(2020四川宜宾高三诊断,19)某烘焙店加工一个成本为60元的蛋糕,然后以每个120元的价格出售,如果当天卖不完,剩下的这种蛋糕作餐厨垃圾处理.
(1)若烘焙店一天加工16个这种蛋糕,求当天的利润y(单位:元)关于当天需求量n(单位:个,n ∈N)的函数解析式;
(2)烘焙店记录了100天这种蛋糕的日需求量(单位:个),整理得下表:
①若烘焙店一天加工16个这种蛋糕,X表示当天的利润(单位:元),求X的分布列与数学期望及方差;
②若烘焙店一天加工16个或17个这种蛋糕,仅从获得利润大的角度考虑,你认为应加工16个还是17个?请说明理由.
热点二统计数据及概率在现实决策问题中的应用
【例2】(2020山西太原5月模拟,20)为实现2020年全面建设小康社会
,某地进行产业的升级改
造.经市场调研和科学研判,准备大规模生产某高科技产品的一个核心部件,目前只有甲、乙两种设备可以独立生产该部件.如图是从甲设备生产的该核心部件中随机抽取400个,对其尺寸x进行统计后整理的频率分布直方图.
根据行业质量标准规定,该核心部件尺寸x满足:|x-12|≤1为一级品,1<|x-12|≤2为二级品,|x-12|>2为三级品.
(1)现根据频率分布直方图中的分组,用分层抽样的方法先从这400个部件中抽取40个,再从所抽取的40个部件中,抽取出所有尺寸x∈[12,15]的部件,再从所有尺寸x∈[12,15]的部件中抽取2件,记ξ为这2个部件中尺寸x∈[14,15]的个数,求ξ的分布列和数学期望;
(2)将甲设备生产的部件成箱包装出售时,需要进行检验.已知每箱有100个部件,每个部件的检验费用为50元.检验规定:若检验出三级品需更换为一级或二级品;若不检验,让三级品进入买家,厂家需向买家每个支付200元补偿.现从一箱部件中随机抽检了10个,结果发现有1个三
级品.若将甲设备的样本频率作为总体的概率,以厂家支付费用作为决策依据,问是否对该箱中剩余部件进行一一检验?请说明理由;
(3)为加大生产力度,厂家需增购设备.已知这种部件的利润如下:一级品的利润为500元/个;二级品的利润为400元/个;三级品的利润为200元/个.乙种设备生产的该部件中一、二、三级
品的概率分别是2
5,1
2
,1
10
.若将甲设备的样本频率作为总体的概率,以厂家的利润作为决策依据,则
应选购哪种设备?请说明理由.
解题心得利用均值和方差进行决策的方法
利用随机变量的均值与方差可以帮助我们作出科学的决策.其中随机变量ξ的均值的意义在于描述随机变量的平均程度,而方差则描述了随机变量稳定与波动或集中与分散的状况.品
种的优劣、仪器的好坏、预报的准确与否、机器的性能好坏等很多指标都与这两个特征量有关.
(1)若我们希望实际的平均水平较理想时,则先求随机变量ξ1,ξ2的均值.当E(ξ1)=E(ξ2)时,不应误认为它们一样好.需要用D(ξ1),D(ξ2)来比较这两个随机变量的偏离程度.
(2)若我们希望比较稳定时,应先考虑方差,再考虑均值是否相等或者接近.
【对点训练2】(2020广东惠州一模,20)计划在某水库建一座至多安装3台发电机的水电站,过去50年的水文资料显示,水库年入流量X(年入流量:一年内上游来水与库区降水之和,单位:亿立方米)都在40以上.其中,不足80的年份有10年,不低于80且不超过120的年份有35年,超过120的年份有5年.将年入流量在以上三段的频率作为相应段的概率,并假设各年的年入流量相互独立.
(1)求未来4年中,至多有1年的年入流量超过120的概率;
(2)水电站希望安装的发电机尽可能运行,但每年发电机最多可运行台数受年入流量X限制,并有如下关系:。