频率分布直方图与茎叶图
- 格式:ppt
- 大小:321.50 KB
- 文档页数:30
专题十概率、统计问题二:统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.学科-网2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
6.6 分布列基础(精练)(基础版)1.(2022·云南·昆明市第一中学西山学校)国家“双减”政策落实之后,某市教育部门为了配合“双减”工作,做好校园课后延时服务,特向本市小学生家长发放调查问卷了解本市课后延时服务情况,现从中抽取100份问卷,统计了其中学生一周课后延时服务总时间(单位:分钟),并将数据分成以下五组:[)[)[)[)[]100,120,120,140,140,160,160,180,180,200,得到如图所示的频率分布直方图.(1)根据如图估计该市小学生一周课后延时服务时间的众数、平均数、中位数(保留小数点后一位);(2)通过调查分析发现,若服务总时间超过160分钟,则学生有不满情绪,现利用分层随机抽样的方法从样本问卷中随机抽取8份,再从抽取的8份问卷中抽取3份,记其中有不满情绪的问卷份数为X ,求X 的分布列及均值.【答案】(1)150,151,150.9;(2)分布列见解析,34.【解析】(1)众数:150;第1到5组频率分别为:0.05,0.15,0.55,0.2,0.05,平均数:1100.051300.151500.551700.21900.05151x =⨯+⨯+⨯+⨯+⨯=, 设中位数为x ,则中位数在第3组,则()0.21400.02750.5x +-⨯=,150.9x ≈; (2)用分层随机抽样抽取8份问卷,其中学生有不满情绪的有8×(0.2+0.05)=2份,∴X 的可能取值为0,1,2,∴()306238C C 5C 140P X ===,()216238C C 15C 281P X ===,()126238C C 3C 282P X ===,∴X 的分布列为:题组一 超几何分布∴()515330121428284E X =⨯+⨯+⨯=. 2.(2022·北京·高三专题练习)为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记X 表示学生的考核成绩,并规定85X >为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:.(1)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核为优秀的概率;(2)从图中考核成绩满足[]70,79X ∈的学生中任取3人,设Y 表示这3人中成绩满足8510X -≤的人数,求Y 的分布列和数学期望;(3)根据以往培训数据,规定当8510.510X P ⎛-⎫≤≥⎪⎝⎭时培训有效.请你根据图中数据,判断此次冰雪培训活动是否有效,并说明理由.【答案】(1)15(2)分布列见解析,()158E Y = (3)有效,理由见解析 【解析】(1)解:设该名学生的考核成绩优秀为事件A ,由茎叶图中的数据可知,30名同学中,有6名同学的考核成绩为优秀,故()15P A =. (2)解:由8510X -≤可得7595X ≤≤,所以,考核成绩满足[]70,79X ∈的学生中满足8510X -≤的人数为5,故随机变量Y 的可能取值有0、1、2、3,()3338C 10C 56P Y ===,()213538C C 151C 56P Y ===,()123538C C 152C 28P Y ===,()3538C 53C 28P Y ===,所以,随机变量Y 的分布列如下表所示:因此,()115155150123565628288E Y =⨯+⨯+⨯+⨯=. (3)解:由85110X -≤可得7595X ≤≤,由茎叶图可知,满足7595X ≤≤的成绩有16个, 所以851610.51030X P ⎛-⎫≤=≥⎪⎝⎭,因此,可认为此次冰雪培训活动有效. 3.(2022·宁夏中卫·三模(理))共享电动车(sharedev )是一种新的交通工具,通过扫码开锁,实现循环共享.某记者来到中国传媒大学探访,在校园喷泉旁停放了10辆共享电动车,这些电动车分为荧光绿和橙色两种颜色,已知从这些共享电动车中任取1辆,取到的是橙色的概率为0.4P =,若从这些共享电动车中任意抽取3辆.(1)求取出的3辆共享电动车中恰好有一辆是橙色的概率;(2)求取出的3辆共享电动车中橙色的电动车的辆数X 的分布列与数学期望. 【答案】(1)12;(2)分布列见解析,数学期望为65.【解析】(1)因为从10辆共享电动车中任取一辆,取到橙色的概率为0.4,所以橙色的电动车有4辆,荧光绿的电动车有6辆.记A 为“从中任取3辆共享单车中恰好有一辆是橙色”,则()2164310C C 1C 2P A ⨯==. (2)随机变量X 的所有可能取值为0,1,2,3.所以()3064310C C 10C 6P X ⨯===,()2164310C C 11C 2P X ⨯===, ()()1264310C C 32C 10P X P A ⨯====,()0364310C C 13C 30P X ⨯===.所以分布列为数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=.4.(2022·广东·华南师大附中三模)“双减”政策实施后,为了解某地中小学生周末体育锻炼的时间,某研究人员随机调查了600名学生,得到的数据统计如下表所示:(1)估计这600名学生周末体育锻炼时间的平均数t ;(同一组中的数据用该组区间的中点值作代表) (2)在这600人中,用分层抽样的方法,从周末体育锻炼时间在[)40,60内的学生中抽取15人,再从这15人中随机抽取3人,记这3人中周末体育锻炼时间在[)50,60内的人数为X ,求X 的分布列以及数学期望()E X . 【答案】(1)58.5;(2)分布列答案见解析,数学期望:95.【解析】(1)估计这600名学生周末体育锻炼时间的平均数 350.1450.2550.3650.15750.15850.158.5t =⨯+⨯+⨯+⨯+⨯+⨯=.(2)依题意,周末体育锻炼时间在[)40,50内的学生抽6人,在[)50,60内的学生抽9人,则()363154091C P X C ===,()216931527191C C P X C ===,()12693152162455C C P X C ===,()3931512365C P X C ===,故X 的分布列为: 则()42721612901239191455655E X =⨯+⨯+⨯+⨯=. 5.(2022·云南保山·模拟预测(理))某高中学校为了解学生的课外体育锻炼时间情况,在全校学生中随机抽取了200名学生进行调查,并将数据分成六组,得到如图所示的频率分布直方图.将平均每天课外体育锻炼时间在[40,60)上的学生评价为锻炼达标,将平均每天课外体育锻炼时间在[0,40)上的学生评价为锻炼不达标(1)根据频率分布直方图估计这200名学生每天课外体育锻炼时间的众数、中位数;(2)为了了解学生课外体育锻炼时间不达标的原因,从上述锻炼不达标的学生中按分层抽样的方法抽取10人,再从这10人中随机抽取3人,记这三人中每天课外体育锻炼时间在[0,20)的人数为ξ,求ξ的分布列和数学期望.【答案】(1)中位数为28.125,众数等于25(2)分布列见解析,0.9【解析】(1)众数就是直方图中最高矩形底边中点的横坐标,则样本众数等于25.由频率分布直方图可得,在[0,10)上的频率为0.08,在[10,20)上的频率为0.16,在[20,30)上的频率为0.32,0.080.160.50.080.160.32<<+++,则中位数在区间[20,30)上.设中位数为0x ,则()00.24200.0320.5+-⨯=x ,028.125x =,即样本中位数为28.125.(2)根据题意,在[0,10),[10,20),[20,30),[30,40)上抽取的人数分别为1,2,4,3,其中在[0,20)上抽取的人数为3,则0ξ=,1,2,3.3127373310103576321(0),(1),1202412040ξξ⨯========C C C P P C C , 2133733310102171(2),(3)12040120C C C P P C C ξξ=====⨯==. 从而得到随机变量ξ的分布列如下表:随机变量ξ的期望72171()01230.9244040120E ξ=⨯+⨯+⨯+⨯=6.(2022·北京市朝阳区人大附中朝阳分校模拟预测)自“新型冠状肺炎”疫情爆发以来,科研团队一直在积极地研发“新冠疫苗”.在科研人员不懈努力下,我国公民率先在2020年年末开始使用安全的新冠疫苗,使我国的“防疫”工作获得更大的主动权.研发疫苗之初,为了测试疫苗的效果,科研人员以白兔为实验对象,进行了一些实验:(1)实验一:选取10只健康白兔,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒的环境中,实验结果发现:除2号、3号、7号和10号四只白兔仍然感染了新冠病毒,其他白兔未被感染.现从这10只白兔中随机抽取3只进行研究,将仍被感染的白兔只数记作X ,求X 的分布列和数学期望.(2)实验二:疫苗可以再次注射第二针、加强针,但两次疫苗注射时间间隔需大于三个月.科研人员对白兔多次注射疫苗后,每次注射的疫苗对白兔是否有效互相不影响.试问:若将实验一中未被感染新冠病毒的白兔的频率当做疫苗的有效率,那么一只白兔注射两次疫苗后的有效率能否保证达到90%?如若可以,请说明理由;若不可以,请你参考上述实验给出注射疫苗后有效率在90%以上的建议. 【答案】(1)分布列见解析;数学期望()65E X =; (2)无法保证;建议:需要将注射一次疫苗的有效率提高到90%以上. 【解析】(1)由题意得:X 所有可能的取值为0,1,2,3,()3631020101206C P X C ∴====;216431060111202C C P XC ; 1264310363212010C C P X C ;3431041312030C P XC ; X ∴的分布列为:∴数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=; (2)由已知数据知:实验一中未被感染新冠病毒的白兔的频率为0.6,则注射一次疫苗的有效率为0.6, ∴一只白兔注射两次疫苗的有效率为:()2110.60.8484%90%--==<, ∴无法保证一只白兔注射两次疫苗后的有效率达到90%;设每支疫苗有效率至少达到x 才能满足要求,()21190%x ∴--≥,解得:0.990%x ≥=,∴需要将注射一次疫苗的有效率提高到90%以上才能保证一只白兔注射两次疫苗后的有效率达到90%.7.(2022·全国·高三专题练习(理))高二年级某班学生在数学校本课程选课过程中,已知第一小组与第二小组各有六位同学.每位同学都只选了一个科目,第一小组选《数学运算》的有1人,选《数学解题思想与方法》的有5人,第二小组选《数学运算》的有2人,选《数学解题思想与方法》的有4人,现从第一、第二两小组各任选2人分析选课情况.(1)求选出的4 人均选《数学解题思想与方法》的概率;(2)设ξ为选出的4个人中选《数学运算》的人数,求ξ的分布列和数学期望. 【答案】(1)415(2)分布列见解析,期望为1 【解析】(1)解:设“从第一小组选出的2人选《数学解题思想与方法》”为事件A ,“从第二小组选出的2人选《数学解题思想与方法》”为事件B ,由于事 件A 、B 相互独立,且22542266C C 22(),()C 3C 5P A P B ====, 所以选出的4人均选《数学解题思想与方法》的概率为224()()()3515P A B P A P B ⋅=⋅=⨯=.(2)解:由题意,随机变量ξ可能的取值为0,1,2,3,可得4(0)15P ξ==,211125524422226666C C C C C 22(1)C C C C 45P ξ==⋅+⋅=,152266C 11(3)C C 45P ξ==⋅=,2(2)1(0)(1)(3)9P P P P ξξξξ==-=-=-==, 所以随机变量ξ的分布列为:ξ0 1 23 P415224529145所以随机变量ξ的数学期望 42221012311545945E ξ=⨯+⨯+⨯+⨯=. 1.(2022·北京·人大附中三模)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图: 组号分组频数1[)0,262 [)2,48题组二 二项分布每周课外阅读时间小于6小时的学生我们称之为“阅读小白”,大于等于6小时且小于12小时的学生称之为“阅读新手”,阅读时间大于等于12小时的学生称之为“阅读达人”.(1)从样本中随机选取一名学生,已知这名学生的阅读时间大于等于6小时,问这名学生是“阅读达人”概率; (2)从该校学生中选取3人,用样本的频率估计概率,记这3人中“阅读新手和阅读小白”的人数和为X ,求X 的分布列和数学期望;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论) 【答案】(1)1069(2)分布列答案见解析,()2710E X =(3)第4组【解析】(1)解:从样本中随机选取一名学生,其中阅读时间大于等于6小时的学生人数为1003169-=, “阅读达人”的学生人数为10,故所求概率为1069. (2)解:从该校学生中任选一人,该学生是“阅读小白”或“阅读新人”的概率为90910010=, 所以,9~3,10X B ⎛⎫ ⎪⎝⎭,则()3110101000P X ⎛⎫=== ⎪⎝⎭,()397293101000P X ⎛⎫=== ⎪⎝⎭,()21391271C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭,()223912432C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:()927310100E X =⨯=. (3)解:样本中的100名学生该周课外阅读时间的平均数为10.0630.0850.1770.2290.25110.12130.06150.02170.02⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=7.68.因此,样本中的100名学生该周课外阅读时间的平均数在第4组.2.(2022·安徽·合肥一六八中学模拟预测(理))《关于加快推进生态文明建设的意见》,正式把“坚持绿水青山就是金山银山”的理念写进中央文件,成为指导中国加快推进生态文明建设的重要指导思想.为响应国家号召,某市2020年植树节期间种植了一批树苗,2022年市园林部门从这批树苗中随机抽取100棵进行跟踪检测,得到树高的频率分布直方图如图所示:(1)求树高在225-235cm 之间树苗的棵数,并求这100棵树苗树高的平均值;(2)若将树高以等级呈现,规定:树高在185-205cm 为合格,在205-235为良好,在235-265cm 为优秀.视该样本的频率分布为总体的频率分布,若从这批树苗中机抽取3棵,求树高等级为优秀的棵数ξ的分布列和数学期望.【答案】(1)15;220.5(2)分布列见解析;期望为0.6【解析】(1)树高在225-235cm 之间的棵数为:()10010.00530.0150.02000250.011015⎡⎤⨯-⨯++++⨯=⎣⎦..树高的平均值为:0.051900.152000.22100.252200.152300.12400.052500.05260220.5⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)由(1)可知,树高为优秀的概率为:0.10.050.050.2++=, 由题意可知()~3,0.2B ξ,则ξ的所有可能取值为0,1,2,3,()0330C 0.80.512P ξ===, ()1231C 0.80.20.384P ξ==⨯=, ()2232C 0.80.20.096P ξ==⨯=,()3333C 0.20.008P ξ===,故ξ的分布列为:因为()~3,0.2B ξ,所以()30.20.6E ξ=⨯=3.(2022·新疆克拉玛依·三模(理))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中的a 值,并根据直方图估计该市全体中学生的测试分数的中位数和平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)将频率作为概率,若从该市全体中学生中抽取4人,记这4人中测试分数不低于90分的人数为X ,求X 的分布列及数学期望.【答案】(1)0.02a =,中位数为74.3,平均数为74.5;(2)分布列见解析,25.【解析】(1)由频率分布直方图和茎叶图知,测试分数在[50,60),[60,70),[70,80),[90,100]的频率依次为:0.1,0.25,0.35,0.1,因此,测试分数位于[)80,90的频率为10.10.250.350.10.2----=,则0.20.0210a ==, 显然测试分数的中位数t 在区间[70,80)内,则有:()700.0350.50.10.25t -⨯=--,解得:74.3t ≈, 测试分数的平均数为:550.1650.25750.35850.2950.174.5⨯+⨯+⨯+⨯+⨯=. (2)测试分数不低于90分的频率为110,X 的所有可能值是:0,1,2,3,4, 显然1(4,)10XB ,()4419C ()(),N,41010k k k P X k k k -==∈≤, 所以X 的分布列为:数学期望()124105E X =⨯=. 4.(2022·全国·模拟预测)为了中国经济的持续发展制定了从2021年2025年发展纲要,简称“十四五”规划,为了普及“十四五”的知识,某党政机关举行“十四五”的知识问答考试,从参加考试的机关人员中,随机抽取100名人员的考试成绩的部分频率分布直方图,其中考试成绩在[)70,80上的人数没有统计出来.(1)估算这次考试成绩的平均分数;(2)把上述的频率看作概率,把考试成绩的分数在[]80,100的学员选为“十四五”优秀宣传员,若从党政机关所有工作人员中,任选3名工作人员,其中可以作为优秀宣传员的人数为ξ,求ξ的分布列与数学期望.【答案】(1)70.5(2)分布列见解析,数学期望为0.9【解析】(1)设分数在[)70,80内的频率为x ,根据频率分布直方图得,()0.010.0150.020.0250.005101x ++++⨯+=,解得0.25x =,可知分数在[)70,80内的频率为0.25,则考试成绩的平均分数为450.10550.15650.2750.25850.25950.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.(2)根据频率分布直方图可知考试成绩在[]80,100的频率为()0.0250.005100.3+⨯=,则0,1,2,3ξ=.()003334300.30.71000P C ξ==⨯=,()12344110.30.71000P C ξ==⨯=()22318920.30.71000P C ξ==⨯=,()3332730.31000P C ξ===,故随机变量ξ的分布列为因为该分布为二项分布,所以该随机变量的数学期望为()30.30.9E ξ=⨯=.5.(2022·江苏苏州·模拟预测)如图,在数轴上,一个质点在外力的作用下,从原点O 出发,每次等可能地向左或向右移动一个单位,质点到达位置的数字记为X .(1)若该质点共移动2次,位于原点O 的概率;(2)若该质点共移动6次,求该质点到达数字X 的分布列和数学期望. 【答案】(1)12;(2)分布列见解析,0.【解析】(1)质点移动2次,可能结果共有224⨯=种,若质点位于原点O ,则质点需要向左、右各移动一次,共有12C 2=种,故质点位于原点O 的概率2142P ==. (2)质点每次移动向左或向右,设事件A 为“向右”,则A 为“向左”,故1()()2P A P A ==, 设Y 表示6次移动中向左移动的次数,则1(6,)2Y B ,质点到达的数字62X Y =-,所以06611(6)(0)C ()264P X P Y =====,16613(4)(1)C ()232P X P Y =====,266115(2)(2)C ()264P X P Y =====, 36615(0)(3)C ()216P X P Y =====,466115(2)(4)C ()264P X P Y =-====, 56613(4)(5)C ()232P X P Y =-====,66611(6)(6)C ()264P X P Y =-====, 所以X 的分布列为:1()(62)2()626602E X E Y E Y =-=-+=-⨯⨯+=.6.(2022·北京通州·模拟预测)第24届冬季奥林匹克运动会,于2022年2月在北京市和张家口市联合举行.某校寒假期间组织部分滑雪爱好者参加冬令营集训.训练期间,冬令营的同学们都参加了“单板滑雪”这个项目相同次数的训练测试,成绩分别为A 、B 、C 、D 、E 五个等级,分别对应的分数为5、4、3、2、1.甲、乙两位同学在这个项目的测试成绩统计结果如图所示.(1)根据上图判断,甲、乙两位同学哪位同学的单板滑雪成绩更稳定?(结论不需要证明) (2)求甲单板滑雪项目各次测试分数的众数和平均数;(3)若甲、乙再同时参加两次测试,设甲的成绩为4分并且乙的成绩为3分或4分的次数为X ,求X 的分布列(频率当作概率使用).【答案】(1)乙比甲的单板滑雪成绩更稳定 (2)众数为3分,平均数为2.9分 (3)分布列答案见解析【解析】(1)解:由图可知,乙比甲的单板滑雪成绩更稳定.(2)解:因为甲单板滑雪项目测试中4分和5分成绩的频率之和为0.325, 3分成绩的频率为0.375,所以,甲单板滑雪项目各次测试分数的众数为3分,测试成绩2分的频率为10.20.3750.250.0750.1----=,所以,甲单板滑雪项目各次测试分数的平均数为10.220.130.37540.2550.075 2.9⨯+⨯+⨯+⨯+⨯=. (3)解:由题意可知,在每次测试中,甲的成绩为4分,并且乙的成绩为3分或4分的概率为30.250.375216⨯⨯=, 依题意,3~2,16X B ⎛⎫ ⎪⎝⎭,所以,()2131********P X ⎛⎫=== ⎪⎝⎭,()12313391C 1616128P X ==⋅⋅=,()239216256P X ⎛⎫=== ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:X0 1 2 P1692563912892561.(2022·全国·高三专题练习(理))冰壶是2022年2月4日至2月20日在中国举行的第24届冬季奥运会的比赛项目之一.冰壶比赛的场地如图所示,其中左端(投掷线MN 的左侧)有一个发球区,运动员在发球区边沿的投掷线MN 将冰壶掷出,使冰壶沿冰道滑行,冰道的右端有一圆形的营垒,以场上冰壶最终静止时距离营垒区圆心O 的远近决定胜负,甲、乙两人进行投掷冰壶比赛,规定冰壶的重心落在圆O 中,得3分,冰壶的重心落在圆环A 中,得2分,冰壶的重心落在圆环B 中,得1分,其余情况均得0分.已知甲、乙投掷冰壶的结果互不影响,甲、乙得3分的概率分别为13,14;甲、乙得2分的概率分别为25,12;甲、乙得1分的概率分别为15,16.(1)求甲所得分数大于乙所得分数的概率;(2)设甲、乙两人所得的分数之差的绝对值为X ,求X 的分布列和期望.题组三 独立重复实验【答案】(1)1130(2)分布列见解析,期望为:169180【解析】(1)由题意知甲得0分的概率为1211135515---=,乙得0分的概率为1111142612---=,甲所得分数大于乙所得分数分为:甲得3分乙得2或1或0分,甲得2分乙得1或0分,甲得1分乙得0分所以所求概率为1121111(1)()3456125123011⨯-+⨯++⨯=.(2)X 可能取值为0,1,2,3,()11211111290345256151290P X ==⨯+⨯+⨯+⨯=()112111111111++35565251283246121805P X ==⨯+⨯+⨯+⨯⨯⨯=()11111121231215180P X ==⨯+⨯+⨯+⨯=()11211121545334P X ==⨯+⨯=所以,随机变量X 的分布列为:所以()298331216918001239018018405E X =⨯+⨯+⨯+⨯= 2.(2022·全国·高三专题练习(理))为弘扬奥运精神,某校开展了“冬奥”相关知识趣味竞赛活动.现有甲、乙两名同学进行比赛,共有两道题目,一次回答一道题目.规则如下:∴抛一次质地均匀的硬币,若正面向上,则由甲回答一个问题,若反面向上,则由乙回答一个问题.∴回答正确者得10分,另一人得0分;回答错误者得0分,另一人得5分.∴若两道题目全部回答完,则比赛结束,计算两人的最终得分.已知甲答对每道题目的概率为45,乙答对每道题目的概率为35,且两人每道题目是否回答正确相互独立.(1)求乙同学最终得10分的概率;(2)记X 为甲同学的最终得分,求X 的分布列和数学期望. 【答案】(1)37100(2)分布列见解析,X 的数学期望为10【解析】(1)记“乙同学最终得10分”为事件A ,则可能情况为甲回答两题且错两题;甲、乙各答一题且各对一题;乙回答两题且对一题错一题, 则()1111141313123722252525252525100P A =⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=,所以乙同学得10分的概率是37100. (2)甲同学的最终得分X 的所有可能取值是0,5,10,15,20. ()1111111313131640225252525252510025P X ==⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()111213121645222525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯==,()141114*********102225252525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()1412164152252510025P X ==⨯⨯⨯⨯==,()141416420252510025P X ==⨯⨯⨯==.X 的分布列为()4191105101520102525252525E X =⨯+⨯+⨯+⨯+⨯=,所以X 的数学期望为10. 3.(2022·青海·海东市第一中学模拟预测(理))“民族要复兴,乡村必振兴”,为了加强乡村振兴宣传工作,让更多的人关注乡村发展,某校举办了有关城乡融合发展、人与自然和谐共生的知识竞赛.比赛分为初赛和复赛两部分,初赛采用选手从备选题中选一题答一题的方式进行,每位选手最多有5次答题机会,选手累计答对3题或答错3题即终止比赛,答对3题者直接进入复赛,答错3题者则被淘汰.已知选手甲答对每个题的概率均为35,且相互间没有影响.(1)求选手甲被淘汰的概率;(2)设选手甲在初赛中答题的个数为X ,试求X 的分布列和数学期望. 【答案】(1)9923125(2)分布列见解析,2541625【解析】(1)设“选手甲被淘汰”为事件A ,因为甲答对每个题的概率均为35,所以甲答错每个题的概率均为25.则甲答了3题都错,被淘汰的概率为33328C 5125⎛⎫= ⎪⎝⎭;甲答了4个题,前3个1对2错,被淘汰的概率为22323272C 555625⎛⎫⨯⨯= ⎪⎝⎭;甲答了5个题,前4个2对2错,被淘汰的概率为2224322432C 5553125⎛⎫⎛⎫⋅⨯= ⎪⎪⎝⎭⎝⎭. 所以选手甲被海的概率()87243299212562531253125P A =++=. (2)易知X 的可能取值为3,4,5,对应甲被淘汰或进入复赛的答题个数,则()3333333273C C 5525P X ⎛⎫⎛⎫==+= ⎪ ⎪⎝⎭⎝⎭,()2222333232322344C C 555555625P X ⎛⎫⎛⎫==⨯⨯+⨯⨯=⎪ ⎪⎝⎭⎝⎭, ()2224322165C 55625P X ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭. X 的分布列为则()7234216256225413456255625E X =⨯+⨯+⨯=. 4.(2022·湖南·长沙一中模拟预测)某靶场有A ,B 两种型号的步枪可供选用,其中甲使用A B ,两种型号的步枪的命中率分别为14,13;,(1)若出现连续两次子弹脱靶或者子弹打光耗尽的现象便立刻停止射击,若击中标靶至少3次,则可以获得一份精美礼品,若甲使用B 型号的步枪,并装填5发子弹,求甲获得精美礼品的概率;(2)现在A B ,两把步枪中各装填3发子弹,甲打算轮流使用A B ,两种步枪进行射击,若击中标靶,则继续使用该步枪,若未击中标靶,则改用另一把步枪,甲首先使用A 种型号的步枪,若出现连续两次子弹脱靶或者其中某一把步枪的子弹打光耗尽的现象便立刻停止射击,记X 为射击的次数,求X 的分布列与数学期望. 【答案】(1)1381(2)分布列见解析;X 的数学期望为3512.【解析】(1)甲击中5次的概率为513⎛⎫ ⎪⎝⎭1243=,甲击中4次的概率为14511C (1)()33-⋅10243=,甲击中3次的概率为()322511C 3133⎛⎫⎛⎫-⋅- ⎪⎪⎝⎭⎝⎭28243=, 所以甲获得精美礼品的概率为11028391324324324324381++==. (2)X 的所有可能取值为2,3,4,5,(2)P X =11(1)(1)43=--321432=⨯=,(3)P X ==111113(1)(1)14434416⨯--+⨯⨯=,(4)P X ==1111111(1)1(1)(1)(1)4334334-⨯⨯⨯+-⨯⨯-⨯-524=,11111111(5)(1)(1)1(1)(1)144334334P X ==⨯-⨯⨯-⨯+-⨯⨯-⨯⨯1111(1)14433+⨯-⨯⨯⨯548=,所以X 的分布列为:所以1355()23452162448E X =⨯+⨯+⨯+⨯3512=. 5.(2022·全国·二模(理))“百年征程波澜壮阔,百年初心历久弥坚”.为庆祝中国建党一百周年,哈市某高中举办了“学党史、知党情、跟党走”的党史知识竞赛.比赛分为初赛和决赛两个环节,通过初赛选出两名同学进行最终决赛.若该高中A ,B 两名学生通过激烈的竞争,取得了初赛的前两名,现进行决赛.规则如下:设置5轮抢答,每轮抢到答题权并答对则该学生得1分,答错则对方得1分.当分差达到2分或答满5轮时,比赛结束,得分高者获胜.已知A ,B 每轮均抢答且抢到答题权的概率分别为23,13,A ,B 每一轮答对的概率都为12,且两人每轮是否回答正确均相互独立. (1)求经过2轮抢答A 赢得比赛的概率;:(2)设经过抢答了X 轮后决赛结束,求随机变量X 的分布列和数学期望.【答案】(1)14(2)分布列见解析;期望为134【解析】(1)记事件C 为“经过2轮抢答A 赢得比赛” A 学生每轮得一分的概率()2111132322P A =⨯+⨯=,B 学生每轮得一分的概率()1121132322P B =⨯+⨯=,()21124P C ⎛⎫== ⎪⎝⎭,所以经过2轮抢答A 赢得比赛的概率为14.(2)X 的可能取值为2,4,5.2轮比赛甲赢或乙赢的概率为()2221122C 22P X ⎛⎫=== ⎪⎝⎭,4轮比赛甲赢或乙赢的概率为()121111142C 22224P X ==⨯⨯⨯=, 5轮比赛甲赢或乙赢的概率为()11151424P X ==--=.X 的分布列为:()111132452444E X =⨯+⨯+⨯=,数学期望为134.6.(2022·湖南·长沙市明德中学二模)沙滩排球是一项每队由两人组成的两队在由球网分开的沙地上进行比赛的运动.它有多种不同的比赛形式以适应不同人、不同环境下的比赛需求.国家沙滩排球队为备战每年一次的世界沙滩排球巡回赛,在文昌高隆沙湾国家沙滩排球训练基地进行封闭式训练.在某次训练中,甲、乙两队进行对抗赛,每局依次轮流发球(每队不能连续发球),连续赢得2个球的队获胜并结束该局比赛,并且每局不得超过5个球.通过对甲、乙两队过去对抗赛记录的数据分析,甲队发球甲队赢的概率为23,乙队发球甲队赢的概率为12,每一个球的输赢结果互不影响,已知某局甲先发球. (1)求该局第二个球结束比赛的概率;(2)若每赢1个球记2分,每输一个球记0分,记该局甲队累计得分为ξ,求ξ的分布列及数学期望. 【答案】(1)12(2)分布列见解析,18754【解析】(1)记:“甲队发球甲队赢”为事件A ,“乙队发球甲队赢”为事件B ,“第二个球结束比赛”为事件C ,则()23P A =,()12P B =,()()1132P A P B ==,,C AB AB =,因为事件AB 与AB 互斥,所以()()()()P C P ABAB P AB P AB ==+()()()()P A P B P A P B =+2111132322=⨯+⨯=,所以该局第二个球结束比赛的概率为12.(2)依题意知随机变量ξ的所有可能取值为0246,,, ()()()()1110326P P AB P A P B ξ====⨯=;()()()()2P P ABA ABAB P ABA P ABAB ξ===+21111115323323236=⨯⨯+⨯⨯⨯=; ()()4P P AB ABAABABAABABA ξ==()()()()P AB P ABA P ABABA P ABABA=+++21112111112121153++=323233232332323108=⨯+⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯; ()()()()()6P P ABAB ABABA ABABA P ABAB P ABABA P ABABAξ===++21212121211112113232323233232354=⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=. 所以ξ的分布列为ξ0 2 46 P16536531081154故数学期望()15531118702466361085454E ξ=⨯+⨯+⨯+⨯=. 1.(2022·江苏省木渎高级中学模拟预测)2012年国家开始实施法定节假日高速公路免费通行政策,某收费站统计了2021年中秋节前后车辆通行数量,发现该站近几天车辆通行数量2100(,)0N ξσ~,若()(1200,80)01200P a P b ξξ>=<<=,则当82ab b a ≥+时下列说法正确的是( )A .12a =B .14b =C .34a b +=D .12a b -=【答案】C【解析】因2100(,)0N ξσ~,且()(1200,80)01200P a P b ξξ>=<<=,则有122b a +=,即21a b =-,不等式82ab b a ≥+为:24(1)1(21)0b b b -≥⇔-≤,则12b =,14a =, 所以34a b +=,14a b -=-,A ,B ,D 均不正确,C 正确.故选:C2.(2022·江苏·高三专题练习)随机变量()2,XN μσ,已知其概率分布密度函数22()21()e2x f x μσσπ-=在2x =处取得最大值为12π,则(0)P X >=( )附:()0.6827,(22)0.9545P X P X μσμσμσμσ-≤≤+=-≤≤+=. A .0.6827 B .0.84135C .0.97725D .0.9545【答案】B【解析】由题意2μ=,1122σππ=,2σ=,所以2(2)41()e2x f x π-=, (022)0.6827P X ≤≤=,所以1(0)(10.6827)0.158652P X <=-=, (0)10.158650.84135P X ≥=-=.故选:B .3.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量题组四 正态分布(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人);故选:B4.(2022·广东·大埔县虎山中学高三阶段练习)(多选)已知某校高三年级有1000人参加一次数学模拟考试,现把这次考试的分数转换为标准分,标准分的分数转换区间为(]60,300,若使标准分X 服从正态分布N()180,900,()0.6826P X μσμσ-<≤+=,(22)0.9545P X μσμσ-<≤+=,3309().973P X μσμσ-<≤+=,则( )A .这次考试标准分超过180分的约有450人B .这次考试标准分在(]90,270内的人数约为997C .甲、乙、丙三人恰有2人的标准分超过180分的概率为38D .()2402700.0428P X <≤= 【答案】BC【解析】依题意得180μ=,2900σ=,30σ=,因为()()11802P X P X μ>=>=, 所以这次考试标准分超过180分的约有110005002⨯=人,故A 不正确;()()90270180330180330P X P X <≤=-⨯<≤+⨯(33)P X μσμσ=-<≤+=0.9973,所以这次考试标准分在(]90,270内的人数约为10000.9973997⨯≈人,故B 正确; 依题意可知,每个人的标准分超过180分的概率为12,所以甲、乙、丙三人恰有2人的标准分超过180分的概率为223113C 1228⎛⎫⎛⎫⋅⋅-= ⎪⎪⎝⎭⎝⎭,故C 正确; ()240270P X <≤()180230180330P X =+⨯<≤+⨯()23P X μσμσ=+<≤+。
第一讲 频率分布直方图一:考纲解读、有的放矢统计部分要求不太高,主要是考抽样方法与频率分布直方图和茎叶图有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.二:核心梳理、茅塞顿开3. 作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.4. 频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.5. 作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.三:例题诠释,举一反三知识点1:利用频率分布直方图分析总体分布例题1:(2011中山期末A )2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 ( ) A .30辆 B .60辆 C .300辆D .600辆变式:(2009山东卷理B)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品 净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45变式:(2011杭州质检B )某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2(2010安徽卷B )某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45, (Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
必修2数学第九章统计知识点一、随机抽样。
1. 简单随机抽样。
- 定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
- 常用方法:抽签法和随机数法。
- 抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
- 随机数法:利用随机数表、随机数生成器或统计软件来产生随机数,根据随机数抽取样本。
2. 系统抽样。
- 定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。
- 步骤:- 先将总体的N个个体编号。
- 确定分段间隔k,对编号进行分段,当(N)/(n)(n是样本容量)是整数时,取k = (N)/(n);当(N)/(n)不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数N'能被n整除,这时k=(N')/(n)。
- 在第1段用简单随机抽样确定第一个个体编号l(l≤ k)。
- 按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l + k),再加k得到第3个个体编号(l+2k),依次类推,直到获取整个样本。
3. 分层抽样。
- 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样。
- 步骤:- 根据已有的信息,将总体分成互不相交的层。
- 计算各层中个体的个数与总体个数的比。
- 按各层个体数占总体数的比确定各层应抽取的样本容量。
- 在每一层中进行简单随机抽样或系统抽样,获取相应的样本个体,合在一起得到分层抽样的样本。
- 特点:使样本具有较强的代表性,而且在各层抽样时,可灵活选用不同的抽样方法。
二、用样本估计总体。
直方图和其他频率分布图(histogram and other frequency distributions)直方图和其他频率分布图(histogram and other frequency distributior.s包括多边形图、茎叶图、点图、分位图、CDF图、累积多边形图。
概述频率分布表明了一组数据不同数值出现的频数。
直方图是最常用的频率分布图,与条形图很相似,但是两者之问有些重要的区别。
这部分也包含了其他的频率分布图。
多边形图和直方图的形状一样,但是用线而不是条柱连接频率值;茎叶图通过运用单个数值作为数据点的标识来保存单个数值:点图是在一条垂线上用小圆圈表示每个数据点;分位图和累积点线图表示有多少测量值(或测量值的百分比)小于或等于每个值。
适用场合·数据是数值型时;·想弄清楚数据分布的形状;·确定一个过程的输出是否近乎符合正态分布;·分析一个过程是否满足顾客的要求;·分析供应商的过程输出的分布情况;·检查两个时间段内过程是否发生交化;·确定两个或多个过程输出是否不同;·将分布情况快速简单地表示出来。
决策树(图表5. 68)有助于确定最适合于表示不同的数据和目的的图形。
实施步骤构建1.从一个过程中搜集至少50个连续的数据点。
如果没有那么多数据,就使用点图。
2.用直方图计算表(参阅图表5.81)建立直方图。
通过填写计算表确定组数,组距和组边界值。
计算完步骤2的组距(W)后,判断并将其调整到一个方便计算的数比如,你可以将0.9调整到1.0。
W的小数位不能比图中数的小数位多。
3.在图纸上画x轴和y轴。
y轴表示数据出现的个数。
用计算表中计算得到的L值在x轴标刻度。
这些数值之差是组距。
条柱间不要留空隙。
4.对于每个数据,准确找出其落入的组,并在该组上增加一个x或涂上一段条柱。
如果数据刚好落在组限处,则将该数据记入其右侧的一组内。