高考理科概率与统计专题
- 格式:doc
- 大小:563.00 KB
- 文档页数:12
年全国高考理科数学试题分类汇编八、概率与统计第部分.【年陕西卷(理)】从正方形四个顶点及其中心这个点中,任取个点,则这个点的距离不小于该正方形边长的概率为( ) 【答案】【解析】C p 选反向解题.53C 4C 4-1.2525=== .【年重庆卷(理)】已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由观测的数据得线性回归方程可能为( ) 【答案】【解析】根据正相关知回归直线的斜率为正,排除,C D ,回归直线经过点(,)x y --,故选A .【年陕西卷(理)】设样本数据1210,,,x x x 的均值与方差分别为与,若i i y x a =+(a 为非零常数, 1,2,,10i =),则12,10,y y y 的均值与方差分别为( )【答案】【解析】A 选变均值也加此数,方差不样本数据加同一个数,. .【年湖南卷(理)】对一个容量为的总体抽取容量为的样本,若选取简单随机抽样、系统抽样与分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为1p ,2p ,3p ,则 【答案】【解析】根据随机抽样的原理可得三种抽样方式都必须满足每个个体被抽到的概率相等,即 321p p p ==,故选 .【年山东卷(理)】为了研究某药厂的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[),[),[),[),[],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有人,第三组中没有疗效的有人,则第三组中有疗效的人数为 【答案】【解析】第一组与第二组频率之与为200.450÷=500.361818612⨯=-=.【年全国新课标Ⅰ(理)】位同学各自在周六、周日两天中任选一天参加公益活动,则周六、周日都有同学参加公益活动的概率 【答案】:【解析】:位同学各自在周六、周日两天中任选一天参加公益活动共有4216=种,周六、周日都有同学参加公益活动有两种情况:①一天一人一天三人有11428C A =种;②每天人有246C =种,则周六、周日都有同学参加公益活动的概率为867168+=;或间接解法:位同学都在周六或周日参加公益活动有种,则周六、周日都有同学参加公益活动的概率为1627168-=;选. .【年全国新课标Ⅱ(理)】某地区空气质量监测资料表明,一天的空气质量为优良的概率是,连续两为优良的概率是,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( ) 【答案】 【解析】.【年广东卷(理)】已知某地区中小学生人数与近视情况分别如图与图所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取的学生进行调查,则样本容量与抽取的高中生近视人数分别为 【答案】【解析】由题意知:该地区中小学生总人数为:35004500200010000++=人,所以样本容量为100002%200⨯=,应抽取高中生人数为:420040794⨯=++,所以抽取的高中生近视人数为4050%20⨯=人.故选..【年湖北卷(理)】根据如下样本数据得到的回归方程为a bx y+=ˆ,则【答案】【解析】画出散点图如图所示,的值大致随的增加而减小,因而两个变量呈负相关,所以0<b ,0>a10.【年湖北卷(理)】由不等式⎪⎩⎪⎨⎧≤--≥≤0200x y y x 确定的平面区域记为1Ω,不等式⎩⎨⎧-≥+≤+21y x y x ,确定的平面区域记为2Ω,在1Ω中随机取一点,则该点恰好在2Ω内的概率为( ) 【答案】【解析】依题意,不等式组表示的平面区域如图, 由几何概型概率公式知,该点落在2Ω内的概率为111221722218222BDFCEFBDFSSP S⨯⨯-⨯⨯-===⨯⨯. .【年江西卷(理)】某人研究中学生的性别与成绩、视力、智商、阅读量这个变量之间的关系,随机抽查名中学生,得到统计数据如表至表,则与性别有关联的可能性最大的变量是 【答案】【解析】根据独立性检验相关分析知,阅读量与性别相关数据较大,选.【年浙江卷(理)】已知甲盒中仅有个球且为红球,乙盒中有m 个红球与n 个蓝球(3m ≥,3)n ≥,从乙盒中随机抽取(1i i =,2)个球放入甲盒中.(a )放入i 个球后,甲盒中含有红球的个数记为(1i i ξ=,2);(b )放入i 个球后,从甲盒中取个球是红球的概率记为(1i p i =,2).则 【答案】【解析】,,,所以>;由已知ξ的取值为、,ξ的取值为、、,所以,(ξ)﹣(ξ).故选第部分.【年辽宁卷(理)】正方形的四个顶点(1,1),(1,1),(1,1),(1,1)A B C D ----分别在抛物线2y x =-与2y x =上,如图所示,若将一个质点随机投入正方形中,学科网则质点落在阴影区域的概率是 . 【答案】【解析】∵(﹣,﹣),(,﹣),(,),(﹣,),∴正方体的的面积×,根据积分的几何意义以及抛物线的对称性可知阴影部分的面积[(﹣)﹣(﹣)]×,则由几何槪型的概率公式可得质点落在图中阴影区域的概率是.故答案为:.【年广东卷(理)】从,中任取七个不同的数,则这七个数的中位数是的概率为 。
专题14概率与统计(选择题、填空题)(理科专用)【2022年全国乙卷】1.某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为123,,p p p ,且3210p p p >>>.记该棋手连胜两盘的概率为p ,则( )A .p 与该棋手和甲、乙、丙的比赛次序无关B .该棋手在第二盘与甲比赛,p 最大C .该棋手在第二盘与乙比赛,p 最大D .该棋手在第二盘与丙比赛,p 最大【答案】D 【解析】 【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率p 甲;该棋手在第二盘与乙比赛且连胜两盘的概率p 乙;该棋手在第二盘与丙比赛且连胜两盘的概率p 丙.并对三者进行比较即可解决 【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,比赛顺序为乙甲丙及丙甲乙的概率均为12, 则此时连胜两盘的概率为p 甲 则[][]21321331231211(1)(1)(1)(1)22p p p p p p p p p p p p p =-+-+-+-甲 123123()2p p p p p p =+-;记该棋手在第二盘与乙比赛,且连胜两盘的概率为p 乙, 则123123213123(1)(1)()2p p p p p p p p p p p p p =-+-=+-乙 记该棋手在第二盘与丙比赛,且连胜两盘的概率为p 丙 则132132312123(1)(1)()2p p p p p p p p p p p p p =-+-=+-丙则[]()123123213123123()2()20p p p p p p p p p p p p p p p p p -=+--+-=-<甲乙[]()213123312123231()2()20p p p p p p p p p p p p p p p p p -=+--+-=-<乙丙即p p <甲乙,p p <乙丙,则该棋手在第二盘与丙比赛,p 最大.选项D 判断正确;选项BC 判断错误;p 与该棋手与甲、乙、丙的比赛次序有关.选项A 判断错误.故选:D【2022年新高考1卷】2.从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( ) A .16B .13C .12D .23【答案】D 【解析】 【分析】由古典概型概率公式结合组合、列举法即可得解. 【详解】从2至8的7个整数中随机取2个不同的数,共有27C 21=种不同的取法,若两数不互质,不同的取法有:()()()()()()()2,4,2,6,2,8,3,6,4,6,4,8,6,8,共7种, 故所求概率2172213P -==. 故选:D.【2021年甲卷理科】3.将3个1和2个0随机排成一行,则2个0不相邻的概率为( ) A .0.3 B .0.5C .0.6D .0.8【答案】C 【解析】 【分析】利用古典概型的概率公式可求概率. 【详解】解:将3个1和2个0随机排成一行,可以是:00111,01011,01101,01110,10011,10101,10110,11001,11010,11100,共10种排法,其中2个0不相邻的排列方法为:01011,01101,01110,10101,10110,11010,共6种方法,故2个0不相邻的概率为6=0.610, 故选:C.【2021年乙卷理科】4.在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于74的概率为( )A .79B .2332C .932D .29【答案】B 【解析】 【分析】设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,分别求出,A Ω对应的区域面积,根据几何概型的的概率公式即可解出. 【详解】如图所示:设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,其面积为111SΩ=⨯=.设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,即图中的阴影部分,其面积为133********A S =-⨯⨯=,所以()2332A S P A S Ω==. 故选:B. 【点睛】本题主要考查利用线性规划解决几何概型中的面积问题,解题关键是准确求出事件,A Ω对应的区域面积,即可顺利解出. 【2021年新高考1卷】5.有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则( )A .甲与丙相互独立B .甲与丁相互独立C .乙与丙相互独立D .丙与丁相互独立【答案】B 【解析】 【分析】根据独立事件概率关系逐一判断 【详解】11561()()()()6636366P P P P =====甲,乙,丙,丁, ,1()0()()()()()36P P P P P P =≠==甲丙甲丙,甲丁甲丁, 1()()()()0()()36P P P P P P =≠=≠乙丙乙丙,丙丁丁丙, 故选:B 【点睛】判断事件,A B 是否独立,先计算对应概率,再判断()()()P A P B P AB =是否成立【2021年新高考2卷】6.某物理量的测量结果服从正态分布()210,N σ,下列结论中不正确的是( )A .σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大B .该物理量在一次测量中大于10的概率为0.5C .该物理量在一次测量中小于9.99与大于10.01的概率相等D .该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等 【答案】D 【解析】 【分析】由正态分布密度曲线的特征逐项判断即可得解. 【详解】对于A ,2σ为数据的方差,所以σ越小,数据在10μ=附近越集中,所以测量结果落在()9.9,10.1内的概率越大,故A 正确;对于B ,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B 正确;对于C ,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C 正确;对于D ,因为该物理量一次测量结果落在()9.9,10.0的概率与落在()10.2,10.3的概率不同,所以一次测量结果落在()9.9,10.2的概率与落在()10,10.3的概率不同,故D 错误. 故选:D.【2020年新课标1卷理科】7.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+ D .ln y a b x =+【答案】D 【解析】 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题. 【2020年新课标2卷理科】8.在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( ) A .10名 B .18名C .24名D .32名【答案】B 【解析】【分析】算出第二天订单数,除以志愿者每天能完成的订单配货数即可. 【详解】由题意,第二天新增订单数为50016001200900+-=, 9001850=,故至少需要志愿者18名. 故选:B 【点晴】本题主要考查函数模型的简单应用,属于基础题. 【2020年新课标3卷理科】9.在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( ) A .14230.1,0.4p p p p ==== B .14230.4,0.1p p p p ==== C .14230.2,0.3p p p p ==== D .14230.3,0.2p p p p ====【答案】B 【解析】 【分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组. 【详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65As =-⨯+-⨯+-⨯+-⨯=; 对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85Bs =-⨯+-⨯+-⨯+-⨯=; 对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05Cs =-⨯+-⨯+-⨯+-⨯=; 对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45Ds =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组的标准差最大. 故选:B. 【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题. 【2020年新高考1卷(山东卷)】10.某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( ) A .62% B .56% C .46% D .42%【答案】C 【解析】 【分析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,然后根据积事件的概率公式()P A B ⋅=()()()P A P B P A B +-+可得结果. 【详解】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅, 则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-=所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%. 故选:C. 【点睛】本题考查了积事件的概率公式,属于基础题. 【2021年新高考1卷】11.有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同 【答案】CD 【解析】 【分析】A 、C 利用两组数据的线性关系有()()E y E x c =+、()()D y D x =,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B 、D 的正误. 【详解】A :()()()E y E x c E x c =+=+且0c ≠,故平均数不相同,错误;B :若第一组中位数为i x ,则第二组的中位数为i i y x c =+,显然不相同,错误;C :()()()()D y D x D c D x =+=,故方差相同,正确;D :由极差的定义知:若第一组的极差为max min x x -,则第二组的极差为max min max min max min ()()y y x c x c x x -=+-+=-,故极差相同,正确;故选:CD【2021年新高考2卷】12.下列统计量中,能度量样本12,,,n x x x 的离散程度的是( )A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC 【解析】 【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项. 【详解】由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势; 故选:AC.【2020年新高考1卷(山东卷)】13.信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.( )A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y ) 【答案】AC 【解析】 【分析】对于A 选项,求得()H X ,由此判断出A 选项;对于B 选项,利用特殊值法进行排除;对于C 选项,计算出()H X ,利用对数函数的性质可判断出C 选项;对于D 选项,计算出()(),H X H Y ,利用基本不等式和对数函数的性质判断出D 选项.【详解】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确. 对于B 选项,若2n =,则1,2i =,211p p =-, 所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦, 当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误. 对于C 选项,若()11,2,,i p i n n==,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且 ()21j m j P Y j p p +-==+( 1,2,,j m =). ()2222111log log m mi i i i i iH X p p p p ===-⋅=⋅∑∑ 122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅. ()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅++⋅+++⋅+++12222122212221221121111log log log log m m m m m m p p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++由于()01,2,,2i p i m >=,所以 2111i i m i p p p +->+,所以 222111log log i i m i p p p +->+, 所以222111log log i i i i m ip p p p p +-⋅>⋅+, 所以()()H X H Y >,所以D 选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.【2020年新高考2卷(海南卷)】14.我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【解析】【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.【2022年全国甲卷】15.从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】6 35.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有48C70n==个结果,这4个点在同一个平面的有6612m=+=个,故所求概率1267035mPn===.故答案为:635.【2022年新高考2卷】16.已知随机变量X 服从正态分布()22,N σ,且(2 2.5)0.36P X <≤=,则( 2.5)P X >=____________.【答案】0.14##750. 【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为()22,X N σ,所以()()220.5P X P X <=>=,因此()()()2.522 2.50.50.360.14P X P X P X >=>-<≤=-=. 故答案为:0.14.。
专题十二概率统计大题(一)命题特点和预测:分析近8年的全国新课标1理数试卷,发现8年8考,每年1题.以实际生活问题为背景,第1问多为考查抽样方法、总体估计等统计问题或概率计算、条件概率、正态分布等概率问题,第2问多为随机变量分布列及其期望计算、回归分析或独立性检验等问题,位置为18题或19题,难度为中档题.2019年仍将以实际生活问题为背景,第1问多为考查抽样方法、总体估计等统计问题或概率计算、条件概率、正态分布等概率问题,第2问多为随机变量分布列及其期望计算、回归分析或独立性检验等问题,难度仍为中档题.(二)历年试题比较:年份题目2018年【2018新课标1,理20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为,求的最大值点.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?2017年【2017新课标1,理19】(12分)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2 (,)Nμσ.(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求(1)P X≥及X的数学期望;(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得,,其中ix 为抽取的第i 个零件的尺寸,.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则,,.2016年 【2016高考新课标理数1】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X 表示2台机器三年内共需更换的易损零件数,n 表示购买2台机器的同时购买的易损零件数.(I )求X 的分布列; (II )若要求,确定n 的最小值;(III )以购买易损零件所需费用的期望值为决策依据,在19n =与20n =之中选其一,应选用哪个?2015年 【2015高考新课标1,理19】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xy w821()ii x x =-∑46.656.36.8289.81.61469108.8表中i i w x = ,w =1881ii w=∑(Ⅰ)根据散点图判断,y=a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为z =0.2y -x.根据(Ⅱ)的结果回答下列问题: (ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,……,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:,=v u αβ-2014年 【2014课标Ⅰ,理18】从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下图频率分布直方图:(I)求这500件产品质量指标值的样本平均值x和样本方差2s(同一组的数据用该组区间的中点值作代表);(II)由直方图可以认为,这种产品的质量指标Z服从正态分布()2,Nμσ,其中μ近似为样本平均数x,2σ近似为样本方差2s.(i)利用该正态分布,求;(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间的产品件数.利用(i)的结果,求EX.附:若则,。
重难点04 概率与统计新高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差。
概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。
取代了传统意义上的应用题,成为高考中的亮点。
解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注。
求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因;(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.捆绑法:题目中规定相邻的几个元素捆绑成一个组,当作一个大元素参与排列。
相离问题插空排:元素相离(即不相邻)问题,可先把无位置要求的几个元素全排列,再把规定的相离的几个元素插入上述几个元素的空位和两端。
定序问题缩倍法:在排列问题中限制某几个元素必须保持一定的顺序,可用缩小倍数的方法。
标号排位问题分步法:把元素排到指定位置上,可先把某个元素按规定排入,第二步再排另一个元素,如此继续下去,依次即可完成。
有序分配问题逐分法:有序分配问题指把元素分成若干组,可用逐步下量分组法。
对于二项式定理的应用,只要会求对应的常数项以及对应的n项即可,但是应注意是二项式系数还是系数。
新高考统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
高考理科概率与统计专题公司标准化编码 [QQX96QT-XQQB89Q8-NQQJ6Q8-MQM9N]2017高考理科专题 概率与统计(解析)一、选择题1. 5个车位分别停放了,,,,,5A B C D E 辆不同的车,现将所有车开出后再按,,,,A B C D E 的次序停入这5个车位,则在A 车停入了B 车原来的位置的条件下,停放结束后恰有1辆车停在原来位置上的概率是( )A. 38B. 340C. 16D. 1122.如图是八位同学400米测试成绩的茎叶图(单位:秒),则( ) A. 平均数为64 B. 众数为7 C. 极差为17 D. 中位数为3.五个人围坐在一张圆桌旁,每个人面前放着完全相同的硬币,所有人同时翻转自己的硬币.若 硬币正面朝上, 则这个人站起来; 若硬币正面朝下, 则这个人继续坐着. 那么, 没有相邻的两 个人站起来的概率为( ) A.516 B. 1132 C. 1532 D. 124. 5名学生进行知识竞赛.笔试结束后,甲、乙两名参赛者去询问成绩,回答者对甲说:“你们5人的成绩互不相同,很遗憾,你的成绩不是最好的”;对乙说:“你不是最后一名”.根据以上信息,这5人的笔试名次的所有可能的种数是( ) A. 54 B. 72 C. 78 D. 965.已知5件产品中有2件次品,现逐一检测,直至能确定...所有次品为止,记检测的次数为ξ,则E ξ=( ) A. 3 B.72 C. 185D. 4 6.将编号为1,2,3,4,5,6的六个小球放入编号为1,2,3,4,5,6的六个盒子,每个盒子放一个小球,若有且只有三个盒子的编号与放入的小球编号相同,则不同的放法总数是A. 40B. 60C. 80D. 1007.某厂家为了解广告宣传费与销售轿车台数之间的关系,得到如下统计数据表:根据数据表可得回归直线方程ˆˆˆy bx a =+,其中ˆ 2.4b =, ˆˆa y bx =-,据此模型预测广告费用为9万元时,销售轿车台数为 A. 17 B. 18 C. 19 D. 20二、填空题8.有3女2男共5名志愿者要全部分到3个社区去参加志愿服务,每个社区1到2人,甲、乙两名女志愿者需到同一社区,男志愿者到不同社区,则不同的分法种数为__________.10.从1,2,3,4,5,6,7这七个数中,随机抽取3个不同的数,则这3个数的和为偶数的概率是________. 三、解答题11.一企业从某生产线上随机抽取100件产品,测量这些产品的某项技术指标值x ,得到的频率分布直方图如图.(1)估计该技术指标值x 平均数x ;(2)在直方图的技术指标值分组中,以x 落入各区间的频率作为x 取该区间值的频率,若4x x ->,则产品不合格,现该企业每天从该生产线上随机抽取5件产品检测,记不合格产品的个数为ξ,求ξ的数学期望E ξ.12.某保险公司针对企业职工推出一款意外险产品,每年每人只要交少量保费,发生意外后可一次性获赔50万元.保险公司把职工从事的所有岗位共分为A 、B 、C 三类工种,根据历史数据统计出三类工种的每赔付频率如下表(并以此估计赔付概率). (Ⅰ)根据规定,该产品各工种保单的期望利润都不得超过保费的20%,试分别确定各类工种每张保单保费的上限;(Ⅱ)某企业共有职工20000人,从事三类工种的人数分布比例如图,老板准备为全体职工每人购买一份此种保险,并以(Ⅰ)中计算的各类保险上限购买,试估计保险公司在这宗交易中的期望利润.13.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等极如下表: 质量指标值m 等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图: (1)根据以上抽样调查数据 ,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品90%”的规定(2)在样本中,按产品等极用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X 近似满足()~218,140X N ,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少14. “微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(1)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关 附: ()()()()()22n ad bc k a b c d a c b d -=++++,(2)若小王以这40位好友该日走路步数的频率分布来估计其所有微信好友每日走路步数的概率分布,现从小王的所有微信好友中任选2人,其中每日走路不超过5000步的有X 人,超过10000步的有Y 人,设X Y ξ=-,求ξ的分布列及数学期望. 15.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表:从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图: (Ⅰ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定(Ⅱ)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(Ⅲ)该企业为提高产品质量,开展了“质量提升月”活动,活动后在抽样检测,产品质量指标值X 近似满足()218,140X N ~,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少16.仪器经过检验合格才能出厂,初检合格率为34:若初检不合格,则需要进行调试,经调试后再次对其进行检验;若仍不合格,作为废品处理,再检合格率为45.每台仪器各项费用如表: 项目 生产成本 检验费/次 调试费 出厂价 金额(元)10001002003000(Ⅰ)求每台仪器能出厂的概率;(Ⅱ)求生产一台仪器所获得的利润为1600元的概率(注:利润=出厂价-生产成本-检验费-调试费);(Ⅲ)假设每台仪器是否合格相互独立,记X 为生产两台仪器所获得的利润,求X 的分布列和数学期望.17.随着社会发展,淮北市在一天的上下班时段也出现了堵车严重的现象。
第18题概率与统计高考考点命题分析三年高考探源考查频率概率、随机变量分布列及正态分布高考全国卷每年必有一道概率与统计解答题,该题通常以实际问题为背景,考查考生的数学建模及数据分析等核心素养,可以是较容易的题,也可以是难度较大的题,考查热点是概率的计算、随机变量的分布列、期望与方差的应用、正态分布、用样本估计总体、统计案例.2020课标全国Ⅰ19 2020课标全国Ⅲ18 2019课标全国Ⅱ18 2019课标全国I 21★★★统计与统计案例2021课标全国Ⅰ17 2021课标全国Ⅱ17 2020课标全国Ⅱ18 2020课标全国Ⅲ18 2019课标全国Ⅲ17★★★例题(2021高考全国I )某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.99.8 10.0 10.1 10.29.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5y 21S 和22S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果2212210S S y x +-≥则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1)221210,10.3,0.036,0.04x y S S ====;(2)新设备生产产品的该项指标的均值较旧设备有 解:(1)9.810.31010.29.99.81010.110.29.71010x +++++++++==,(2分)10.110.410.11010.110.310.610.510.410.510.310y +++++++++==,(4分)22222222210.20.300.20.10.200.10.20.30.03610S +++++++++==,(8分) 222222222220.20.10.20.30.200.30.20.10.20.0410S +++++++++==.(8分)(2)依题意,20.320.1520.1520.025y x -==⨯==,0.0360.040.007610+=(10分)2212210s s y x +-≥,所以新设备生产产品的该项指标的均值较旧设备有显著提高. (12分)1.(2022届江苏省泰州市兴化市高三4月模拟)设(),X Y 是一个二维离散型随机变量,它们的一切可能取的值为(),i j a b ,其中,i j N *∈,令(,)ij i j p P X a Y b ===,称(,)ij p i j N *∈是二维离散型随机变量(),X Y 的联合分布列.与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式:(),X Y1b 2b 3b ... 1a 1,1p 1,2p 1,3p (2)a 2,1p 2,2p 2,3p (3)a3,1p3,2p3,3p ·…… … … … …现有()n n N ∈个相同的球等可能的放入编号为1,2,3的三个盒子中,记落下第1号盒子中的球的个数为X ,落入第2号盒子中的球的个数为Y . (1)当n =2时,求(),X Y 的联合分布列;(2)设0(,),nk m p P X k Y m k N ====∈∑且k n ≤计算0nk k kp =∑.2.(陕西省西安市高三下学期二模)某中学对学生进行体质测试(简称体测),随机抽取了100名学生的体测结果等级(“良好以下”或“良好及以上”)进行统计,并制成列联表如下: 良好以下 良好及以上 合计 男 25 女 10 合计70100(2)事先在本次体测等级为“良好及以上”的学生中按照性别采用分层抽样的方式随机抽取了9人.若从这9人中随机抽取3人对其体测指标进行进一步研究,求抽到的3人全是男生的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥0.10 0.05 0.025 0.010 0.001 0k2.7063.8415.0246.63510.828会上参与全民健身活动的人越来越多,小明也有大量好友参与了“健步团”,他随机选取了其中的40人,记录了他们某一天的走路步数,并将数据整理如下:步量性别5001~60006001~70007001~80008001~9000>9000男 1 2 3 6 8 女21062(2)如果每人一天的走路步数超过8000步就会被系统评定为“健步型”,否则为“良好型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关健步型良好型总计男女总计附:参考公式()()()()() 2n ad bcKa b c d a c b d-=++++.临界值表:()2P K k≥0.10 0.05 0.025 0.010 0k 2.706 3.841 5.024 6.635专业队,与两名高山滑雪爱好者乙、丙组成的业余队进行友谊比赛.约定赛制如下:业余队中的两名队员轮流与甲进行比赛............,若甲连续豪两场.....则专业队获胜;若甲连续输两场.....则业余队获胜:若比赛三场还没有决出胜负,则视为平局,比赛结束.已知各场比赛相互独立,每场比赛都分出胜负,且甲与乙比赛,乙赢概率为13;甲与丙比赛,丙赢的橱率为p,其中1132p<<.(1)若第一场比赛,业余队可以安接乙与甲进行比赛,也可以安排丙与甲进行比赛.请分别计算两种安排下业余队获胜的概率;若以获胜概率大为最优决策,问:业余队第一场应该安排乙还是丙与甲进行比赛?(2)为了激励专业队和业余队,赛事组织规定:比赛结束时,胜队获奖金3万元,负队获奖金1.5万元;若平局,两队各获奖金1.8万元.在比赛前,已知业余队采用了(1)中的最优决策与甲进行比赛,设赛事组织预备支付的奖金金额共计X万元,求X的数学期望()E X的取值范围.5.(2022届广东省广州市高三二模)某校为全面加强和改进学校体育工作,推进学校体育评价改革,建立了日常参与,体质监测和专项运动技能测试相结合的考查机制,在一次专项运动技能测试中,该校班机抽取60名学生作为样本进行耐力跑测试,这60名学生的测试成绩等级及频数如下表成绩等级优良合格不合格频数7 11 41 1(1)从这60名学生中随机抽取2名学生,这2名学生中耐力跑测试成绩等级为优或良的人数记为X ,求()1P X =;(2)将样本频率视为概率,从该校的学生中随机抽取3名学生参加野外拉练活动,耐力跑测试成绩等级为优或良的学生能完成该活动,合格或不合格的学生不能完成该活动,能完成活动的每名学生得100分,不能完成活动的每名学生得0分.这3名学生所得总分记为Y ,求Y 的数学期望.6.(2022届重庆市高三质量检测)冰壶被喻为冰上的“国际象棋”,是以团队为单位在冰上进行的投掷性竞赛项目,每场比赛共10局,在每局比赛中,每个团队由多名运动员组成,轮流掷壶、刷冰、指挥.两边队员交替掷壶,可击打本方和对手冰壶,以最终离得分区圆心最近的一方冰壶数量多少计算得分,另外一方计零分,以十局总得分最高的一方获胜.冰壶运动考验参与者的体能与脑力,展现动静之美,取舍之智慧.同时由于冰壶的击打规则,后投掷一方有优势,因此前一局的得分方将作为后一局的先手掷壶.已知甲、乙两队参加冰壶比赛,在某局中若甲方先手掷壶,则该局甲方得分概率为25;若甲方后手掷壶,则该局甲方得分概率为23,每局比赛不考虑平局.在该场比赛中,前面已经比赛了六局,双方各有三局得分,其中第六局乙方得分.(1)求第七局、第八局均为甲方得分的概率; (2)求当十局比完,甲方的得分局多于乙方的概率.7.(2022届内蒙古赤峰市高三模拟)为评估设备M 生产某种零件的性能,从设备M 生产零件的流水线上随机抽取100个零件作为样本,测量其直径后,整理得到下表: 直径/mm 58596061626364 65 66 67686970717273合计个数2 1 13 5 6 1931164 4 2 1 2 2 1 10065μ=σ(1)为评判一台设备的性能,从该设备加工的零件中任意抽取一件,记其直径为X ,并根据以下不等式进行评判(P 表示相应事件的概率),()0.6826P X μσμσ-<≤+≥;()220.9545P X μσμσ-<≤+≥;()330.9973P X μσμσ-<≤+≥.评判规则为:若同时满足上述三个不等式,则设备等级为甲;若仅满足其中两个,则等级为乙;若仅满足其中一个,则等级为丙;若全部都不满足,则等级为丁,试判断设备M 的性能等级.(2)将直径小于等于2μσ-或直径大于2μσ+的零件认为是次品.(i )从设备M 的生产流水线上随机抽取3件零件,计算其中次品件数Y 的数学期望()E Y ; (ii )从样本中随机抽取2件零件,计算其中次品件数Z 的概率分布列和数学期望()E Z . 8.(2022届四川省绵阳市高三第三次诊断性考试)随着科技进步,近来年,我国新能源汽车产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年我国新能源乘用车的年销售量数据:年份 2016 2017 2018 2019 2020 2021 年份代码x1 2 3 4 5 6 新能源乘用车年销售y (万辆)5078126121137352(2)若用e nx y m =模型拟合y 与x 的关系,可得回归方程为0.3337.71e x y =,经计算该模型和第(1)问中模型的2R (2R 为相关指数)分别为0.87和0.71,请分别利用这两个模型,求2022年我国新能源乘用车的年销售量的预测值;(3)你认为(2)中用哪个模型得到的预测值更可靠?请说明理由. 参考数据:设ln u y =,其中ln i i u y =. yu()()61iii x x y y =--∑()()61i ii x x u u =--∑3.63e 5.94e 6.27e144 4.78 841 5.70 37.71 380 528参考公式:对于一组具有线性相关关系的数据()()123i i x y i n =⋅⋅⋅,,,,,,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为()()()121ˆnii i nii xx y ybxx==--=-∑∑,ˆˆay bx =-. 9.(2022届四川省攀枝花市高三第三次统一考试)2022年2月4日,北京冬奥会盛大开幕,这是让全国人民普遍关注的体育盛事,因此每天有很多民众通过手机、电视等方式观看相关比赛.某机构将每天收看相关比赛的时间在2小时以上的人称为“冰雪运动爱好者”,否则称为“非冰雪运动爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人):冰雪运动爱好者非冰雪运动爱好者合计 女性 20 50 男性15合计 100的前提下认为性别与是否为“冰雪运动爱好者”有关?(2)将频率视为概率,现从参与调查的女性人群中用随机抽样的方法每次抽取1人,共抽取3次,记被抽取的3人中“冰雪运动爱好者”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列、数学期望()E X 和方差()D X . 附:()()()()()22n ad bc K a b c d a c b c -=++++,其中n a b c d =+++. ()20P K k ≥0.05 0.025 0.010 0.005 0.001 0k3.8415.0246.6357.87910.828北京冬奥会男子冰球主要比赛场馆是位于北京奥林匹克公园的“冰之帆”国家体育馆.本届冬奥会男子冰球有12支队伍进入正赛,中国首次组队参赛,比赛规则12支男子冰球参赛队先按照往届冬奥会赛制分成三个小组(每组4个队).正赛分小组赛阶段与决赛阶段;小组赛阶段各组采用单循环赛制(小组内任两队需且仅需比赛一次);决赛阶段均采用淘汰制(每场比赛胜者才晋级),先将12支球队按照小组赛成绩进行种子排名,排名前四的球队晋级四分之一决赛(且不在四分之一决赛中遭遇),其余8支球队按规则进行附加赛(每队比赛一次,胜者晋级),争夺另外4个四分之一决赛席位,随后依次是四分之一决赛、半决赛、铜牌赛、金牌赛(1)本届冬奥会男子冰球项目从正赛开始到产生金牌,组委会共要安排多少场比赛? (2)某机构根据赛前技术统计,率先晋级四分之一决赛的四支球队(甲乙丙丁队)实力相当,假设他们在接下来四分之一决赛、半决赛、铜牌赛、金牌赛中取胜率都依次为34、12、12、12,且每支球队晋级后每场比赛相互独立,试求甲、乙、丙、丁队都没获得冠军的概率.11.(2022届山东省枣庄市高三下学期一模)已知有一道有四个选项的单项选择题和一道有四个选项的多项选择题,小明知道每道多项选择题均有两个或三个正确选项.但根据得分规则:全部选对的得5分,部分选对的得2分,有选错的得0分.这样,小明在做多项选择题时,可能选择一个选项,也可能选择两个或三个选项,但不会选择四个选项.(1)如果小明不知道单项选择题的正确答案,就作随机猜测.已知小明知道单项选择题的正确答案和随机猜测的概率都是12,在他做完单项选择题后,从卷面上看,在题答对的情况下,求他知道单项选择题正确答案的概率.(2)假设小明在做该道多项选择题时,基于已有的解题经验,他选择一个选项的概率为12,选择两个选项的概率为13,选择三个选项的概率为16.已知该道多项选择题只有两个正确选项,小明完全不知道四个选项的正误,只好根据自己的经验随机选择.记X 表示小明做完该道多项选择题后所得的分数.求: (i )()0P X =;(ii )X 的分布列及数学期望.12.(2022届湖北省高三下学期4月二模)某企业使用新技术对某款芯片进行试生产,在试产初期,该款芯片的生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在生产中,前三道工序的次品率分别为123111,,1098P P P ===. (1)求该款芯片生产在进人第四道工序前的次品率;(2)如果第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行人工抽查检验.在芯片智能自动检测显示合格率为90%的条件下,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率.13.(2022届广西四市高三4月教学质量检测)近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.(1)该校教职工有410人,高二学生有620人,高三学生有610人, ①用分层抽样的方法,求高一学生每天抽检人数;②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理,并给出理由. (2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下: 第x 天12 3 4 5 用时y (小时) 1.21.21.11.01.0x y ②根据①中的计算结果,判定变量x 和y 是正相关,还是负相关,并给出可能的原因.10 3.16,相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑14.(2022届北京市通州区高三一模)某单位有A ,B 两个餐厅为员工提供午餐与晚餐服务,甲、乙两位员工每个工作日午餐和晚餐都在单位就餐,近100个工作日选择餐厅就餐情况统计如下:,A A(),A B(),B A(),B B 选择餐厅情况(午餐,晚餐)()甲员工30天20天40天10天乙员工20天25天15天40天(1)分别估计一天中甲员工午餐和晚餐都选择A餐厅就餐的概率,乙员工午餐和晚餐都选择B餐厅就餐的概率;E X;(2)记X为甲、乙两员工在一天中就餐餐厅的个数,求X的分布列和数学期望()(3)试判断甲、乙员工在晚餐选择B餐厅就餐的条件下,哪位员工更有可能午餐选择A餐厅就餐,并说明理由.。
概率与统计1.随机抽样方法简单随机抽样、系统抽样、分层抽样的共同点是抽样过程中每个个体被抽取的机会相等,且是不放回抽样.[问题1] 某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福社区的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次抽取的总户数为________. 答案 24解析 由抽样比例可知6x =480-200-160480,则x =24.2.对于统计图表问题,求解时,最重要的就是认真观察图表,从中提取有用信息和数据.对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率.茎叶图没有原始数据信息的损失,但数据很大或有多组数据时,茎叶图就不那么直观、清晰了. [问题2] 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图所示.若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为________.答案 203.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 众数为频率分布直方图中最高矩形的底边中点的横坐标.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).平均数等于频率分布直方图中每个小矩形的面积乘以小距形底边中点的横坐标之和. 标准差的平方就是方差,方差的计算(1)基本公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)简化计算公式①s 2=1n [(x 21+x 22+…+x 2n )-n x 2],或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方和的平均数减去平均数的平方.[问题3] 已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是________. 答案 0.15、0.145 4.变量间的相关关系假设我们有如下一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ).回归方程y ^=b ^x +a ^,其中⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x .[问题4] 回归直线方程y ^=b ^x +a ^必经过点________. 答案 (x ,y )5.独立性检验的基本方法一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表如表:根据观测数据计算由公式k =n (ad -bc )(a +b )(a +c )(b +d )(c +d )所给出的检验随机变量K 2的观测值k ,并且k 的值越大,说明“X 与Y 有关系”成立的可能性越大,可以利用数据来确定“X 与Y 有关系”的可信程度.[问题5] 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:则至少有________附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )答案 6.互斥事件有一个发生的概率P (A +B )=P (A )+P (B ) (1)公式适合范围:事件A 与B 互斥. (2)P (A )=1-P (A ).[问题6] 抛掷一枚骰子,观察掷出的点数,设事件A 为出现奇数点,事件B 为出现2点,已知P (A )=12,P (B )=16,则出现奇数点或2点的概率之和为________.答案 237.古典概型P (A )=mn (其中,n 为一次试验中可能出现的结果总数,m 为事件A 在试验中包含的基本事件个数)[问题7] 若将一枚质地均匀的骰子先后抛掷2次,则出现向上的点数之和为4的概率为________. 答案1128.几何概型一般地,在几何区域D 内随机地取一点,记事件“该点在其内部一个区域d 内”为事件A ,则事件A 发生的概率为P (A )=d 的度量D 的度量.此处D 的度量不为0,其中“度量”的意义依D 确定,当D 分别是线段、平面图形和立体图形时,相应的度量分别为长度、面积和体积等. 即P (A )=构成事件A 的区域长度(面积和体积)试验的全部结果所构成的区域长度(面积和体积)[问题8] 在棱长为2的正方体ABCD —A 1B 1C 1D 1中,点O 为底面ABCD 的中心,在正方体ABCD —A 1B 1C 1D 1内随机取一点P ,则点P 到点O 的距离大于1的概率为( ) A.π12 B .1-π12C.π6 D .1-π6答案 B解析 记“点P 到点O 的距离大于1”为A , P (A )=23-12×43π×1323=1-π12. 9.解排列、组合问题的依据是:分类相加,分步相乘,有序排列,无序组合.解排列、组合问题的规律是:相邻问题捆绑法;不相邻问题插空法;多排问题单排法;定位问题优先法;定序问题倍缩法;多元问题分类法;有序分配分步法;综合问题先选后排法;至多至少问题间接法. (1)排列数公式A m n =n (n -1)(n -2)…[n -(m -1)]=n !(n -m )!,其中m ,n ∈N *,m ≤n .当m =n 时,A n n =n ·(n -1)·……·2·1=n !,规定0!=1. (2)组合数公式C mn =A m n A m m =n (n -1)(n -2)…[n -(m -1)]m !=n !m !(n -m )!.(3)组合数性质C m n =C n-mn,C m n +C m -1n =C m n +1,规定C 0n =1,其中m ,n ∈N *,m ≤n .[问题9] (1)将5封信投入3个邮筒,不同的投法共有________种.(2)从4台甲型和5台乙型电视机中任意取出3台,其中至少要甲型和乙型电视机各一台,则不同的取法共有________种. 答案 (1)35 (2)70 10.二项式定理(1)定理:(a +b )n =C 0n a n +C 1n a n -1b +…+C r n a n -r b r +…+C n -1n ab n -1+C n n b n (n ∈N *).通项(展开式的第r +1项):T r +1=C rna n -r b r ,其中C r n (r =0,1,…,n )叫做二项式系数.(2)二项式系数的性质①在二项式展开式中,与首末两端“等距离”的两项的二项式系数相等,即C 0n =C n n ,C 1n =C n -1n ,C 2n =C n -2n ,…,C r n =C n -r n .②二项式系数的和等于2n (组合数公式),即C 0n +C 1n +C 2n +…+C n n =2n .③二项式展开式中,偶数项的二项式系数和等于奇数项的二项式系数和,即C 1n +C 3n +C 5n +…=C 0n +C 2n +C 4n +…=2n -1. 特别提醒:二项式系数最大项与展开式系数最大项是两个不同的概念,在求法上也有很大的差别,往往因为概念不清导致出错.[问题10] 设⎝⎛⎭⎫x -2x 6的展开式中x 3的系数为A ,二项式系数为B ,则A ∶B =________. 答案 4∶1 解析T r +1=C r 6x6-r(-1)r ⎝⎛⎭⎫2x r =C r 6(-1)r 2r362r x-,6-32r =3,r =2,系数A =60,二项式系数B =C 26=15,所以A ∶B =4∶1.4∶1.11.要注意概率P (A |B )与P (AB )的区别:(1)在P (A |B )中,事件A ,B 发生有时间上的差异,B 先A 后;在P (AB )中,事件A ,B 同时发生.(2)样本空间不同,在P (A |B )中,事件B 成为样本空间;在P (AB )中,样本空间仍为Ω,因而有P (A |B )≥P (AB ).[问题11] 设A 、B 为两个事件,若事件A 和B 同时发生的概率为310,在事件A 发生的条件下,事件B 发生的概率为12,则事件A 发生的概率为________.答案 3512.求分布列,要检验概率的和是否为1,如果不是,要重新检查修正.还要注意识别独立重复试验和二项分布,然后用公式.如果事件A 在一次试验中发生的概率是p ,那么它在n 次独立重复试验中恰好发生k 次的概率为P n (k )=C k n p k ·(1-p )n -k . [问题12] 若随机变量ξ的分布列如下表,则E (ξ)的值为________.答案209解析 根据概率之和为1,求出x =118,则E (ξ)=0×2x +1×3x +…+5x =40x =209.13.一般地,如果对于任意实数a <b ,随机变量X 满足P (a <X ≤b )=ʃba φμ,σ(x )d x ,则称X 的分布为正态分布.正态分布完全由参数μ和σ确定,因此正态分布常记作N (μ,σ2).如果随机变量X 服从正态分布,则记为X ~N (μ,σ2).满足正态分布的三个基本概率的值是:①P (μ-σ<X ≤μ+σ)=0.682 6;②P (μ-2σ<X ≤μ+2σ)=0.954 4;③P (μ-3σ<X ≤μ+3σ)=0.997 4.[问题13] 已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( )A .0.6B .0.4C .0.3D .0.2 答案 C解析 ∵P (ξ<4)=0.8,∴P (ξ>4)=0.2,由题意知图象的对称轴为直线x =2, P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.易错点1 统计图表识图不准致误例1 如图所示是某公司(共有员工300人)2012年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的大约有________人.错解 由频率分布直方图,员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.10+0.10+0.08)=0.62.∴估计年薪在1.4万元~1.6万元之间约有300×0.62=186(人).找准失分点 本题主要混淆频率分布直方图与条形图纵轴的意义,频率分布直方图中,纵轴(矩形高)表示“频率组距”,每个小矩形的面积才表示落在该区间上的频率,由于概念不清,识图不准导致计算错误.正解 由所给图形可知,员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24.所以员工中年薪在1.4万元~1.6万元之间的共有300×0.24=72(人). 答案 72易错点2 在几何概型中“测度”确定不准致误例2 如图所示,在等腰Rt △ABC 中,过直角顶点C 在∠ACB 内部任意作一条射线CM ,与线段AB 交于点M ,求AM <AC 的概率.错解 记AM <AC 为事件E ,设CA =CB =a ,因为△ABC 是直角三角形, 所以,AB =2a ,在AB 上取一点D ,使AD =AC =a ,那么对线段AD 上的任意一点M 都有AM <AD ,即AM <AC , 因此AM <AC 的概率为P (E )=AD AB =a 2a =22. 找准失分点 据题意,过直角顶点C 在∠ACB 内部作一条射线CM ,射线CM 在∠ACB 内部均匀分布,但是点M 在AB 上的分布不是均匀的.正解 在AB 上取一点D ,使AD =AC ,因为AD =AC =a ,∠A =π4,所以∠ACD =∠ADC =3π8,则P (E )=∠ACD ∠ACB =3π8π2=34.易错点3 分不清是排列还是组合致误例3 如图所示,A ,B ,C ,D 是海上的四个小岛,要建三座桥,将这四个岛连接起来,不同的建桥方案共有多少种?错解 对于有一个中心的结构形式有A 44,对于四个岛依次相连的形式有A 44,∴共有2A 44=48(种).找准失分点 没有分清是排列还是组合. 正解 由题意可能有两种结构,如图:第一种:,第二种:对于第一种结构,连接方式只需考虑中心位置的情况,共有C 14种方法.对于第二种结构,有C 24A 22种方法. ∴总共有C 14+C 24A 22=16(种).易错点4 均匀分组与非均匀分组混淆致误例4 4个不同的小球放入编号为1、2、3、4的4个盒中,则恰有1个空盒的放法共有________种.(用数字作答) 错解 288错误!未找到引用源。
专题八 概率与统计 第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习练重点【新课标全国卷】1.在某次赛车中,50名参赛选手的成绩(单位:min )全部介于13到18之间(包括13和18).现将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18],其频率分布直方图如图所示.若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( )A.11B.15C.35D.392.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[)20,40,[)40,60,[)60,80,[]80,100.若低于60分的人数是15人,则参加英语测试的学生人数是( )A.45B.50C.55D.603.我国是一个农业大国,从事农业工作的人员有5.4亿,如图为某县农村从业人员年龄结构图,为了解该县从业人员在从事农业工作中的实际困难,以推进县乡村振兴工作,某调查机构计划从某县的所有从业人员中随机抽取20人展开某项调研,则所抽取的20人中恰有2人的年龄在20岁以下的概率约为( ) (170.90.167≈,180.90.15≈,190.90.135≈,200.90.122≈)A.0.25B.0.29C.0.32D.0.354.某校高一年级在某次数学测验中成绩不低于80分的所有考生的成绩统计表如下:A.在[90,100]内B.在(100,110]内C.在(110,120]内D.在(120,130]内5.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )A.甲同学:平均数为2,众数为1B.乙同学:平均数为2,方差小于1C.丙同学:中位数为2,众数为2D.丁同学:众数为2,方差大于16.2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,将测试结果按如下方式分成六组:第一组[12,13),第二组[13,14),…,第六组[17,18],得到如下的频率分布直方图.则该100考生的成绩的平均数和中位数(保留一位小数)分别是( )A.15.2 15.3B.15.1 15.4C.15.1 15.3D.15.2 15.37.设样本数据1x ,2x ,…,10x 的平均数和方差分别为1和4,若i i y x a =+(a 为非零常数,1,2,,10i =),则1y ,2y ,…,10y 的平均数和方差分别为( ) A.1a +,4B.1a +,4a +C.1,4D.1,4a +8.已知变量x ,y 之间的一组数据如下表:若y 关于x 的线性回归方程为0.7y x a =+,则a =( ) A.0.1B.0.2C.0.35D.0.459.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得经验回归直线方程0.6754.9y x =+,表中有一个数据模糊不清,请你推断出该数据的值为( )C.68 10.第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下22⨯列联表.参考公式:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.附表:A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性届民中大约有95%的人关注冰雪运动C.有95%的把握认为该市居民是否关注冰雪运动与性别有关D.有99%的把握认为该市居民是否关注冰雪运动与性别有关11.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为_______.12.经市场调查,某款热销品的销售量y(万件)与广告费用x(万元)之间满足回归直线方程 3.5=+.若样本点中心为(45,35),则当销售量为52.5万件时,可估计投入y bx的广告费用为_________________万元.13.某学校为了制订治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:14.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602.15.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):1(优) (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.附:2()()()()K a b c d a c b d =++++,)2kk答案以及解析1.答案:A解析:由题意可得,成绩在[13,15)内的频率为10.080.320.380.22---=.又本次赛车中,共50名参赛选手,所以这50名选手中获奖的人数为500.2211⨯=.故选A. 2.答案:B解析:根据频率分布直方图的特点可知,低于60分的频率是(0.0050.01)200.3+⨯=,则所求学生人数是15500.3=. 3.答案:B解析:由频率分布直方图可得20岁以下的农村从业人员的概率为0.1,所以从所有从业人员中抽取20人,其中恰有2人的年龄在20岁以下的概率为221820C (0.1)(0.9)0.2850.29≈≈,故选B. 4.答案:B解析:由表可知,及格的考生共有401512105284+++++=人,在[90,100]内有40人,在(100,110]内有15人,故及格的所有考生成绩的中位数在(100,110]内.5.答案:B解析:甲同学:若平均数为2,众数为1,则有一次名次应为4,故排除A ;乙同学:平均数为2,设乙同学3次考试的名次分别为1x ,2x ,3x ,则方差()()()2222123122213s x x x ⎡⎤=-+-+-<⎣⎦,则()()()2221232223x x x -+-+-<,所以1x ,2x ,3x 均不大于3,符合题意;丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.故选B. 6.答案:C解析:100名考生成绩的平均数12.50.1013.50.1514.50.15x =⨯+⨯+⨯+15.50.3016.50.2517.50.0515.1⨯+⨯+⨯=.因为前三组频率直方图面积和为0.100.150.150.4++=,前四组频率直方图面积和为0.100.150.150.300.7+++=,所以中位数位于第四组内,设中位数为a ,则(15)0.300.1a -⨯=,解得15.3a ≈,故选C.7.答案:A解析:由题意知i i y x a =+,即()1210110110y x x x a x a a =⨯++++=+=+,方差{}222212101()()()10x a x a x s a x a x a x a ⎡⎤⎡⎤⎡⎤=⨯+-+++-++++-+⎣⎦⎣⎦⎣⎦()()()22212101410x x x x x x ⎡⎤=⨯-+-++-=⎢⎥⎣⎦. 故选A. 8.答案:C解析:本题考查线性回归方程截距的求解.因为11(3456) 4.5,(2.534 4.5) 3.544x y =+++==+++=,所以0.7 3.50.7 4.50.35a y x =-=-⨯=,故选C. 9.答案:C解析:设表中模糊看不清的数据为m .由表中数据得30x =, 3075m y +=,将30730,5m x y +==代入经验回归方程0.6754.9y x =+,得68m =.故选C. 10.答案:C解析:由22⨯列联表中的数据可得()22352515251004.167 3.84160405050K ⨯-⨯⨯=≈>⨯⨯⨯,因此,有95%的把握认为该市居民是否关注冰雪运动与性别有关.故选:C.11.答案:88解析:根据题意,设剔除最高分、最低分之后的13个数据为1a ,2a ,3a ,…,13a ,由这13个数据的平均分为92,方差为16, 知()1231319213a a a a ++++=,()()()222121319292921613a a a ⎡⎤-+-++-=⎣⎦, 解得123131196a a a a ++++=,2221213110240a a a +++=,对于原始得分96,58,1a ,2a ,3a ,…,13a , 其平均数()12313196589015a a a a a =++++++=,其方差为()(()22222212131(9690)(5890)9090)908815s a a a ⎤⎡=-+-+-+-++-=⎣⎦. 12.答案:70解析:本题考查线性回归方程.依题意,将(45,35)代入回归直线方程 3.5y bx =+(提示:回归直线必过样本点中心),得3545 3.5b =⨯+,解得0.7b =,所以回归直线方程为0.7 3.5y x =+.令0.7 3.552.5y x =+=,得70x =. 13.答案:99.5%解析:因为2250(2015510)8.33325253020χ⨯⨯-⨯=≈⨯⨯⨯,又()27.8790.0050.5%P χ==≥,所以我们有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.14.答案:(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%(2)平均数与标准差的估计值分别为30%,17%解析:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=.产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%. (2)1(0.1020.10240.30530.50140.707)0.30100y =⨯-⨯+⨯+⨯+⨯+⨯=, ()52222111(0.40)2(0.20)100100i i i s n y y=⎡=-=⨯-⨯+-⨯⎣∑222240530.20140.4070.0296⎤+⨯+⨯+⨯=⎦,0.020.17s .所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.15.答案:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得25.82055457030K =≈⨯⨯⨯. 由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。
2023全国高考数学统计与概率专题
引言
本文档旨在提供2023全国高考数学统计与概率专题的概述和重点内容。
通过对该专题的了解,学生可以更好地准备和应对高考数学考试。
一、概率计算
1. 确定事件的概率:介绍如何计算事件的概率,包括基本事件和复合事件。
2. 概率分布函数:讲解离散型随机变量和连续型随机变量的概率分布函数。
3. 期望值的计算:介绍如何计算离散型和连续型随机变量的期望值,包括线性期望值的性质。
二、统计推断
1. 抽样方法:介绍简单随机抽样、整群抽样和分层抽样等常用的抽样方法。
2. 参数估计:讨论点估计和区间估计的概念和计算方法,包括样本均值和样本方差的估计。
3. 假设检验:介绍如何进行假设检验,包括设立假设、选择显著性水平和计算检验统计量。
三、相关性和回归分析
1. 相关系数:介绍相关系数的概念和计算方法,包括皮尔逊相关系数和斯皮尔曼相关系数。
2. 线性回归分析:讲解线性回归的原理和应用,包括最小二乘法的计算和回归方程的确定。
结论
本文档简要介绍了2023全国高考数学统计与概率专题的主要内容,包括概率计算、统计推断和相关性回归分析。
学生们可以结合此文档进行针对性的复习和备考,以提高数学成绩。
祝各位同学取得优异的成绩!。
学习必备 欢迎下载 2017高考理科专题 概率与统计(解析) 一、选择题 1. 5个车位分别停放了,,,,,5ABCDE辆不同的车,现将所有车开出后再按,,,,ABCDE的次序停入这5个车位,则在A车停入了B车原来的位置的条件下,停放结束后恰有1辆车停在原来位置上的概率是( ) A. 38 B. 340 C. 16 D. 112 2.如图是八位同学400米测试成绩的茎叶图(单位:秒),则( )
A. 平均数为64 B. 众数为7 C. 极差为17 D. 中位数为64.5 3.五个人围坐在一张圆桌旁,每个人面前放着完全相同的硬币,所有人同时翻转自己的硬币.若 硬币正面朝上, 则这个人站起来; 若硬币正面朝下, 则这个人继续坐着. 那么, 没有相邻的两 个人站起来的概率为( ) A. 516 B. 1132 C. 1532 D. 12 4. 5名学生进行知识竞赛.笔试结束后,甲、乙两名参赛者去询问成绩,回答者对甲说:“你们5人的成绩互不相同,很遗憾,你的成绩不是最好的”;对乙说:“你不是最后一名”.根据以上信息,这5人的笔试名次的所有可能的种数是( ) A. 54 B. 72 C. 78 D. 96 5.已知5件产品中有2件次品,现逐一检测,直至能确定...所有次品为止,记检测的次数为,
则E( ) A. 3 B. 72 C. 185 D. 4 6.将编号为1,2,3,4,5,6的六个小球放入编号为1,2,3,4,5,6的六个盒子,每个盒子放一个小球,若有且只有三个盒子的编号与放入的小球编号相同,则不同的放法总数是 A. 40 B. 60 C. 80 D. 100 7.某厂家为了解广告宣传费与销售轿车台数之间的关系,得到如下统计数据表:根据数据
表可得回归直线方程ˆˆˆybxa,其中ˆ2.4b, ˆˆaybx
,据此模型预测广告费用为
9学习必备 欢迎下载 万元时,销售轿车台数为
A. 17 B. 18 C. 19 D. 20 二、填空题 8.有3女2男共5名志愿者要全部分到3个社区去参加志愿服务,每个社区1到2人,甲、乙两名女志愿者需到同一社区,男志愿者到不同社区,则不同的分法种数为__________. 10.从1,2,3,4,5,6,7这七个数中,随机抽取3个不同的数,则这3个数的和为偶数的概率是________. 三、解答题 11.一企业从某生产线上随机抽取100件产品,测量这些产品的某项技术指标值x,得到的频率分布直方图如图.
(1)估计该技术指标值x平均数x; (2)在直方图的技术指标值分组中,以x落入各区间的频率作为x取该区间值的频率,若4xx,则产品不合格,现该企业每天从该生产线上随机抽取5件产品检测,记不合格
产品的个数为,求的数学期望E. 学习必备 欢迎下载 12.某保险公司针对企业职工推出一款意外险产品,每年每人只要交少量保费,发生意外后可一次性获赔50万元.保险公司把职工从事的所有岗位共分为A、B、C三类工种,根据历史数据统计出三类工种的每赔付频率如下表(并以此估计赔付概率).
(Ⅰ)根据规定,该产品各工种保单的期望利润都不得超过保费的20%,试分别确定各类工种每张保单保费的上限; (Ⅱ)某企业共有职工20000人,从事三类工种的人数分布比例如图,老板准备为全体职工每人购买一份此种保险,并以(Ⅰ)中计算的各类保险上限购买,试估计保险公司在这宗交易中的期望利润. 学习必备 欢迎下载 13.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等极如下表: 质量指标值m 185m 185205m 205m
等级 三等品 二等品 一等品 从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:
(1)根据以上抽样调查数据 ,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品90%”的规定? (2)在样本中,按产品等极用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率; (3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X近似满足~218,140XN,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少? 学习必备 欢迎下载 14. “微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:
(1)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?
附: 22nadbckabcdacbd, 2
0PKk
0.10 0.05 0.025 0.010
0k 2.706 3.841 5.024 6.635
(2)若小王以这40位好友该日走路步数的频率分布来估计其所有微信好友每日走路步数的概率分布,现从小王的所有微信好友中任选2人,其中每日走路不超过5000步的有X人,超过10000步的有Y人,设XY,求的分布列及数学期望. 学习必备 欢迎下载 15.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表: 质量指标值m 185m 185205m 205m
等级 三等品 二等品 一等品 从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:
(Ⅰ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定? (Ⅱ)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率; (Ⅲ)该企业为提高产品质量,开展了“质量提升月”活动,活动后在抽样检测,产品质量指标值X近似满足218,140XN,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少? 学习必备 欢迎下载 16.仪器经过检验合格才能出厂,初检合格率为34:若初检不合格,则需要进行调试,经调试后再次对其进行检验;若仍不合格,作为废品处理,再检合格率为45.每台仪器各项费用如表: 项目 生产成本 检验费/次 调试费 出厂价 金额(元) 1000 100 200 3000 (Ⅰ)求每台仪器能出厂的概率; (Ⅱ)求生产一台仪器所获得的利润为1600元的概率(注:利润出厂价生产成本检验费调试费); (Ⅲ)假设每台仪器是否合格相互独立,记X为生产两台仪器所获得的利润,求X的分布列和数学期望. 学习必备 欢迎下载 17.随着社会发展,淮北市在一天的上下班时段也出现了堵车严重的现象。交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念.记交通指数为T,其范围为[0,10],分别有5个级别:T∈[0,2)畅通;T∈[2,4)基本畅通;T∈[4,6)轻度拥堵;T∈[6,8)中度拥堵;T∈[8,10]严重拥堵.早高峰时段(T≥3 ),从淮北市交通指挥中心随机选取了一至四马路之间50个交通路段,依据交通指数数据绘制的直方图如图所示:
(I)据此直方图估算交通指数T∈[4,8)时的中位数和平均数; (II)据此直方图求出早高峰一至四马路之间的3个路段至少有2个严重拥堵的概率是多少? (III)某人上班路上所用时间若畅通时为20分钟,基本畅通为30分钟,轻度拥堵为35分钟,中度拥堵为45分钟,严重拥堵为60分钟,求此人用时间的数学期望. 学习必备 欢迎下载 18.为研究男女同学空间想象能力的差异,孙老师从高一年级随机选取了20名男生、20名女生,进行空间图形识别测试,得到成绩茎叶图如下,假定成绩大于等于80分的同学为“空间想象能力突出”,低于80分的同学为“空间想象能力正常”.
(1)完成下面22列联表,并判断是否有90%的把握认为“空间想象能力突出”与性别有关;
空间想象能力突出 空间想象能力正常 合计 男生 女生 合计 (2)从“空间想象能力突出”的同学中随机选取男生2名、女生2名,记其中成绩超过90分的人数为,求随机变量的分布列和数学期望.
下面公式及临界值表仅供参考: 22nadbcXabcdacbd 2PXk
0.100 0.050 0.010
k 2.706 3.841 6.635 学习必备 欢迎下载 19.校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类,自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人. (Ⅰ)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类学生数; (Ⅱ)根据抽取的180名学生的调查结果,完成下列列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关? 选择自然科学类 选择社会科学类 合计 男生 女生 合计
附: 22nabbcKabcdacbd,其中nabcd. 2
0PKk
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0K 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828