新课标2018届高考数学二轮复习专题七概率与统计7.2概率统计与统计案例课件
- 格式:ppt
- 大小:2.02 MB
- 文档页数:41
1.以客观题形式考查抽样方法,样本的数字特征和回归分析,独立性检验的基本思路、方法及相关计算与推断.2.本部分较少命制大题,若在大题中考查多在概率与统计、算法框图等知识交汇处命题,重点考查抽样方法,频率分布直方图和回归分析或独立性检验,注意加强抽样后绘制频率分布直方图,然后作统计分析或求概率的综合练习.3.以客观题形式考查古典概型与几何概型、互斥事件与对立事件的概率计算.4.与统计结合在大题中考查古典概型与几何概型.一、统计与统计案例1.抽样方法三种抽样方法的比较2.统计图表(1)在频率分布直方图中:①各小矩形的面积表示相应各组的频率,各小矩形的高=频率组距;②各小矩形面积之和等于1;③中位数左右两侧的直方图面积相等,因此可以估计其近似值.(2)茎叶图当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推). 3.样本的数字特征 (1)众数在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据). (2)中位数样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数.(3)平均数与方差样本数据的平均数x -=1n(x 1+x 2+…+x n ).方差s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定.4.变量间的相关关系(1)利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量x 和y 具有线性相关关系.(2)用最小二乘法求回归直线的方程 设线性回归方程为y ^=b ^x +a ^,则⎩⎪⎪⎨⎪⎪⎧b ^=∑i =1nx i-x -y i-y -∑i =1nx i-x -2=∑i =1nx i y i -n x -y -∑i =1nx 2i -n x-2a ^=y --b ^x -.注意:回归直线一定经过样本的中心点(x -,y -),据此性质可以解决有关的计算问题. 5.回归分析r=∑i =1nx i -x-y i -y-∑i =1nx i -x-2∑i =1ny i -y-2,叫做相关系数.相关系数用来衡量变量x 与y 之间的线性相关程度;|r |≤1,且|r |越接近于1,相关程度越高,|r |越接近于0,相关程度越低.6.独立性检验假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为则K 2=a +b +c +d ad -bc 2a +bc +da +cb +d,若K 2>3.841,则有95%的把握说两个事件有关; 若K 2>6.635,则有99%的把握说两个事件有关; 若K 2<2.706,则没有充分理由认为两个事件有关. 7.随机事件的概率随机事件的概率范围:0≤P (A )≤1;必然事件的概率为1,不可能事件的概率为0. 8.古典概型①计算一次试验中基本事件的总数n ;②求事件A 包含的基本事件的个数m ;③利用公式P (A )=m n计算.9.一般地,如果事件A 、B 互斥,那么事件A +B 发生(即A 、B 中有一个发生)的概率,等于事件A 、B 分别发生的概率的和,即P (A +B )=P (A )+P (B ).10.对立事件:在每一次试验中,相互对立的事件A 和A -不会同时发生,但一定有一个发生,因此有P (A -)=1-P (A ).11.互斥事件与对立事件的关系 对立必互斥,互斥未必对立. 12.几何概型一般地,在几何区域D 内随机地取一点,记事件“该点落在其内部区域d 内”为事件A ,则事件A发生的概率P(A)=d的测度D的测度.考点一事件与概率例1.(2016·课标Ⅱ,18,12分,中)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:设该险种一续保人一年内出险次数与相应概率如下:(1)求一续保人本年度的保费高于基本保费的概率;(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;(3)求续保人本年度的平均保费与基本保费的比值.(3)记续保人本年度的保费为X,则X的分布列为EX=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.因此续保人本年度的平均保费与基本保费的比值为1.23aa=1.23.【变式探究】(2015·广东,4)袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为( )A .1 B.1121 C.1021 D.521解析 从袋中任取2个球共有C 215=105种取法,其中恰好1个白球1个红球共有C 110C 15=50种取法,所以所取的球恰好1个白球1个红球的概率为50105=1021.答案 C考点二 古典概型例2.【2017山东,理8】从分别标有1,2,⋅⋅⋅,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是(A )518 (B )49 (C )59(D )79 【答案】C【解析】标有1, 2, ⋅⋅⋅, 9的9张卡片中,标奇数的有5张,标偶数的有4张,所以抽到的2张卡片上的数奇偶性不同的概率是115425989C C =⨯ ,选C.【变式探究】袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为( )A.521 B.1021 C.1121 D .1【变式探究】从正方形四个顶点及其中心这5个点中,任取2个点,则这2个点的距离不小于该正方形边长的概率为( )A.15B.25C.35D.45解析 从这5个点中任取2个,有C 25=10种取法,满足两点间的距离不小于正方形边长的取法有C 24=6种,因此所求概率P =610=35.故选C. 答案 C考点三 随机数与几何概型例3.【2017课标1,理】如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8 C .12D .π4【答案】B【解析】设正方形边长为a ,则圆的半径为2a ,正方形的面积为2a ,圆的面积为24a .由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,此点取自黑色部分的概率是221248a a ππ⋅=,选B. 【变式探究】 (2016·课标Ⅰ,4,易)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A.13B.12C.23D.34【答案】B 【解析】由题意知,小明在7:50至8:30 之间到达发车站,故他只能乘坐8:00或8:30发的车,所以他等车时间不超过10分钟的概率P =10+1040=12.【变式探究】(2016·课标Ⅱ,10,中)从区间[0,1]随机抽取2n 个数x 1,x 2,…,x n ,y 1,y 2,…,y n ,构成n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( )A.4n mB.2nmC.4m nD.2m n【答案】C 【解析】由题意知,m n =π4,故π=4m n ,即圆周率π的近似值为4m n.考点四 条件概率与相互独立事件的概率例4.【2017课标II ,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:(1) 设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A 的概率;(2) 填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3) 根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01) 附:22()()()()()n ad bc K a b c d a c b d -=++++【答案】(1)0.4092;(2)见解析;(3)52.35kg ().(2)根据箱产量的频率分布直方图得列联表()222006266343815.70510010096104K ⨯⨯-⨯=≈⨯⨯⨯由于15.705 6.635>故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50kg 的直方图面积为()0.0040.0200.04450.340.5++⨯=<,箱产量低于55kg 的直方图面积为()0.0040.0200.044+0.06850.680.5++⨯=>故新养殖法箱产量的中位数的估计值为0.5-0.3450+52.35kg 0.068≈().【变式探究】投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为( )A .0.648B .0.432C .0.36D .0.312解析 该同学通过测试的概率为p =0.6×0.6+C 12×0.4×0.62=0.648.答案 A【变式探究】(2014·新课标全国Ⅱ,5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( )A .0.8B .0.75C .0.6D .0.45解析 由条件概率可得所求概率为0.60.75=0.8,故选A.答案 A考点五 正态分布例5.【2017课标1,理19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2(,)N μσ.(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(3,3)μσμσ-+之外的零件数,求(1)P X ≥及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(3,3)μσμσ-+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,0.212s ==≈,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则(33)0.997 4P Z μσμσ-<<+=,160.997 40.959 2=0.09≈.【答案】(1)0.0416.(2)(i )见解析;(ii )0.09. 【解析】(1)抽取的一个零件的尺寸在()3,3μσμσ-+之内的概率为0.9974,从而零件的尺寸在()3,3μσμσ-+之外的概率为0.0026,故()~16,0.0026X B .因此()()11010.99740.0408P X P X ≥=-==-=.X 的数学期望为160.00260.0416EX =⨯=.(2)(i )如果生产状态正常,一个零件尺寸在()3,3μσμσ-+之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在()3,3μσμσ-+之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.(ii )由9.97,0.212x s =≈,得μ的估计值为ˆ9.97μ=, σ的估计值为ˆ0.212σ=,由样本数据可以看出有一个零件的尺寸在()3,ˆˆˆ3ˆμσμσ-+之外,因此需对当天的生产过程进行检查. 剔除()3,ˆˆˆ3ˆμσμσ-+之外的数据9.22,剩下数据的平均数为()1169.979.2210.0215⨯-=,因此μ的估计值为10.02.162221160.212169.971591.134ii x==⨯+⨯≈∑,剔除()3,ˆˆˆ3ˆμσμσ-+之外的数据9.22,剩下数据的样本方差为()2211591.1349.221510.020.00815--⨯≈,因此σ0.09≈.【变式探究】在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C 为正态分布N (0,1)的密度曲线)的点的个数的估计值为( )附:若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)=0.682 6,P (μ-2σ<X ≤μ+2σ)=0.954 4.A .2 386B .2 718C .3 413D .4 772答案 C【变式探究】(2014·新课标全国Ⅰ,18)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(1)求这500件产品质量指标值的样本平均数x和样本方差s2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2.(ⅰ)利用该正态分布,求P(187.8<Z<212.2);(ⅱ)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数.利用(ⅰ)的结果,求E(X).附:150≈12.2.若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4.解(1)抽取产品的质量指标值的样本平均数x和样本方差s2分别为x-=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.(2)(ⅰ)由(1)知,Z~N(200,150),从而P(187.8<Z<212.2)=P(200-12.2<Z<200+12.2)=0.682 6.(ⅱ)由(ⅰ)知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X~B(100,0.682 6),所以E(X)=100×0.682 6=68.26.考点六离散型随机变量的分布列例6.【2017天津,理16】从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为111 ,, 234.(Ⅰ)设X表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X的分布列和数学期望;(Ⅱ)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率.【答案】(Ⅰ)见解析;(Ⅱ)1148. 【解析】(Ⅰ)解:随机变量X 的所有可能取值为0,1,2,3.()111101112344P X ⎛⎫⎛⎫⎛⎫==-⨯-⨯-= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()11111111111111111123423423424P X ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==⨯-⨯-+-⨯⨯-+-⨯-⨯=⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, ()111111111121112342342344P X ⎛⎫⎛⎫⎛⎫==-⨯⨯+⨯-⨯+⨯⨯-= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()1111323424P X ==⨯⨯=. 所以,随机变量X 的分布列为随机变量X 的数学期望()012342442412E X =⨯+⨯+⨯+⨯=. (Ⅱ)解:设Y 表示第一辆车遇到红灯的个数, Z 表示第二辆车遇到红灯的个数,则所求事件的概率为()()()()()()()10,11,00110P Y Z P Y Z P Y Z P Y P Z P Y P Z +====+=====+==1111111142424448=⨯+⨯=. 所以,这2辆车共遇到1个红灯的概率为1148. 【变式探究】(2016·山东,19,12分,中)甲、乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语.在一轮活动中,如果两人都猜对,则“星队”得3分;如果只有一人猜对,则“星队”得1分;如果两人都没猜对,则“星队”得0分.已知甲每轮猜对的概率是34,乙每轮猜对的概率是23;每轮活动中甲、乙猜对与否互不影响,各轮结果亦互不影响.假设“星队”参加两轮活动,求:(1)“星队”至少猜对3个成语的概率;(2)“星队”两轮得分之和X 的分布列和数学期望EX .解:(1)记事件A :“甲第一轮猜对”,记事件B :“乙第一轮猜对”,记事件C :“甲第二轮猜对”,记事件D :“乙第二轮猜对”,记事件E :“‘星队’至少猜对3个成语”.由题意,E =ABCD +A -BCD +AB -CD +ABC -D +ABCD -. 由事件的独立性与互斥性,得P (E )=P (ABCD )+P (A -BCD )+P (AB -CD )+P (ABC -D )+P (ABCD -)=P (A )P (B )P (C )P (D )+P (A -)P (B )·P (C )P (D )+P (A )P (B -)P (C )P (D )+P (A )P (B )P (C -)P (D )+P (A )P (B )P (C )·P (D -)=34×23×34×23+2×⎝ ⎛14×23×34×23+34×13×34×⎭⎪⎫23=23. 所以“星队”至少猜对3个成语的概率为23.(2)由题意,随机变量X 可能的取值为0,1,2,3,4,6. 由事件的独立性与互斥性,得可得随机变量X 的分布列为所以数学期望EX =0×1144+1×572+2×25144+3×112+4×512+6×14=236.【变式探究】(2015·安徽,17)已知2件次品和3件正品混放在一起,现需要通过检测将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结果.(1)求第一次检测出的是次品且第二次检测出的是正品的概率;(2)已知每检测一件产品需要费用100元,设X 表示直到检测出2件次品或者检测出3件正品时所需要的检测费用(单位:元),求X 的分布列和均值(数学期望).解 (1)记“第一次检测出的是次品且第二次检测出的是正品”为事件A .P (A )=A 12A 13A 25=310.(2)X 的可能取值为200,300,400. P (X =200)=A 22A 25=110,P (X =300)=A 33+C 12C 13A 22A 35=310,P (X =400)=1-P (X =200)-P (X =300)=1-110-310=610. 故X 的分布列为E (X )=200×110+300×310+400×610=350.考点七 均值与方差例7.【2016高考江苏卷】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________▲________. 【答案】0.1【解析】这组数据的平均数为1(4.7 4.8 5.1 5.4 5.5) 5.15++++=,2222221(4.7 5.1)(4.8 5.1)(5.1 5.1)(5.4 5.1)(5.5 5.1)0.15S ⎡⎤∴=-+-+-+-+-=⎣⎦.故答案应填:0.1, 【变式探究】如图,将一个各面都涂了油漆的正方体,切割为125个同样大小的小正方体,经过搅拌后,从中随机取一个小正方体,记它的涂漆面数为X ,则X 的均值E (X )=( )A.126125B.65C.168125D.75解析 由题意可知涂漆面数X 的可能取值为0,1,2,3. 由于P (X =0)=27125,P (X =1)=54125,P (X =2)=36125,P (X =3)=8125,故E (X )=0×27125+1×54125+2×36125+3×8125=150125=65.答案 B考点八 抽样方法例8.【2017天津,理16】从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为111,,234. (Ⅰ)设X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (Ⅱ)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 【答案】(Ⅰ)见解析;(Ⅱ)1148. 【解析】(Ⅰ)解:随机变量X 的所有可能取值为0,1,2,3.()111101112344P X ⎛⎫⎛⎫⎛⎫==-⨯-⨯-= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()11111111111111111123423423424P X ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==⨯-⨯-+-⨯⨯-+-⨯-⨯=⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, ()111111111121112342342344P X ⎛⎫⎛⎫⎛⎫==-⨯⨯+⨯-⨯+⨯⨯-= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()1111323424P X ==⨯⨯=. 所以,随机变量X 的分布列为随机变量X 的数学期望()012342442412E X =⨯+⨯+⨯+⨯=. (Ⅱ)解:设Y 表示第一辆车遇到红灯的个数, Z 表示第二辆车遇到红灯的个数,则所求事件的概率为()()()()()()()10,11,00110P Y Z P Y Z P Y Z P Y P Z P Y P Z +====+=====+==1111111142424448=⨯+⨯=. 所以,这2辆车共遇到1个红灯的概率为1148. 【变式探究】(2016·山东,3,易)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20, 22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .167B .137C .123D .93解析 由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选B. 答案 B【变式探究】(2014·湖南,2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3解析 因为采取简单随机抽样、系统抽样和分层抽取样本时,总体中每个个体被抽中的概率相等,故选D.答案 D考点九 频率分布直方图与茎叶图例9.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32解析 法一 由题意知,x 1+x 2+…+x 10=10x ,s 1则y =1n[(2x 1-1)+(2x 2-1)+…+(2x 10-1)]=1n[2(x 1+x 2+…+x 10)-n ]=2x -1,所以S 22s 1,故选C.答案 C【变式探究】(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( )01228 9 2 5 80 0 0 3 3 8 1 2A .19B .20C .21.5D .23解析 从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,选B.答案 B考点十 变量间的相关关系及统计案例例10.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是()A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析 从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A 选项正确;2007年二氧化硫排放量较2006年降低了很多,B 选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C 选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D 选项错误,故选D.答案 D【变式探究】(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y ∧=b ∧x +a ∧,其中b ∧=0.76,a ∧=y -b∧x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析 回归直线一定过样本点中心(10,8),∵b ∧=0.76,∴a∧=0.4,由y ∧=0.76x +0.4得当x =15万元时,y∧=11.8万元.故选B.答案 B1.【2017课标1,理】如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8 C .12D .π4【答案】B2.【2017浙江,8】已知随机变量i ξ满足P (i ξ=1)=p i ,P (i ξ=0)=1—p i ,i =1,2. 若0<p 1<p 2<12,则A .1E()ξ<2E()ξ,1D()ξ<2D()ξB .1E()ξ<2E()ξ,1D()ξ>2D()ξC .1E()ξ>2E()ξ,1D()ξ<2D()ξD .1E()ξ>2E()ξ,1D()ξ>2D()ξ【答案】A 【解析】112212(),(),()()E p E p E E ξξξξ==∴<111222121212()(1),()(1),()()()(1)0D p p D p p D D p p p p ξξξξ=-=-∴-=---<,选A .3.【2017山东,理5】为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225ii x==∑,1011600i i y ==∑,ˆ4b=.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170 【答案】C【解析】由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C. 4.【2017山东,理8】从分别标有1,2,⋅⋅⋅,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是(A )518 (B )49 (C )59(D )79 【答案】C【解析】标有1, 2, ⋅⋅⋅, 9的9张卡片中,标奇数的有5张,标偶数的有4张,所以抽到的2张卡片上的数奇偶性不同的概率是115425989C C =⨯ ,选C.5.【2017课标II ,理13】一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X 表示抽到的二等品件数,则D X = 。
第二节统计与概率综合及统计案例题型138 抽样方式2013年1.(2013江西文5)总体有编号为01,02,,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为().A.08B.07C.02D.012. (2013湖南文3)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n ().A. 9B.10C.12D.132014年1.(2014四川文2)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是().A.总体B.个体C.样本的容量D.从总体中抽取的一个样本2.(2014重庆文3)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n =( ).A.100B.150C.200D.2503.(2014广东文6)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ).A.50B.40C.25D.204.(2014湖南文3)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( ).A.123p p p =<B. 231p p p =<C.132p p p =<D. 123p p p == 5.(2014湖北文11)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测. 若样本中有50件产品由甲设备生产,则乙设备生产的产品总 数为 件.6.(2014天津文9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取 名学生.2015年1.(2015四川文3)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ).A. 抽签法B. 系统抽样法C. 分层抽样法D. 随机数法 1. 解析 按照各种抽样方法的适用范围可知,应使用分层抽样.故选C.2.(2015福建文13)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______. 2. 解析 由题意得抽样比例为45190020=,故应抽取的男生人数为15002520⨯=(人).3.(2015北京文4)某校老年,中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体情况,在抽取的样本中,青年教师有320人,则该样本的老年人数为( ).A.90B. 100C. 180D. 3003. 解析 依题意,老年教师人数为900320180160043004300⨯=(人).故选C. 2017年1.(2017江苏卷3)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件. 1.解析 按照分层抽样的概念应从丙种型号的产品中抽取60300181000⨯=(件).20330443454365577783210题型139 样本分析——用样本估计总体2013年1. (2013四川文7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据茎叶图如图所示.以组距为5将数据分组成[)[)[)[)0551030353540,,,,,,,,时,所作的频率分布直方图是( ).A.B.C . D.2. (2013山东文10)将某选手的9个得分去掉1个最高分,去掉一个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.11616 B. 367C. 36D.3. (2013辽宁文5) 某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[)[)[)[)20404060608080100,,,,,,,.若低于60分的人数是15人,则该班的学生人数是( ).A. 45B. 50C. 55D. 604.(2013江苏6)抽样统计甲.乙两位设计运动员的5此训练成绩(单位:环),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为5.(2013湖北文12)某学员在一次射击测试中射靶10次,命中环数如下:8779401091x /分7879,,,,5491074,,,,,,则(1)平均命中环数为 ;(2)命中环数的标准差为 .6. (2013辽宁文16)为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 .2014年1.(2014陕西文9)某公司10位员工的月工资(单位:元)为1210,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ). A.x ,22100s +B.100x +,22100s +C. x ,2sD.x +100,2s2.(2014山东文8)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[)[)[)[)[]12,13,13,14,14,15,15,16,16,17,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( ).A. 6B. 8C. 12kPa3.(2014江苏6)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm ),所得数据均在区间[]80130,上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm .(加上原点处数字0)4.(2014新课标Ⅰ文18) 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如图所示频数分布表: 质量指标值分组[)75,85[)85,95[)95,105[)105,115[)115,125频数62638228(1)作出这些数据的频率分布直方图;频率/组距100 90 80 110 120 0.020 0.025 0.030 0.0100.015 底部周长/cm(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?5.(2014北京文18)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).6. (2014新课标Ⅱ文19) 某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:O 75 85 95 105(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.7.(2014广东文17)某车间20名工人年龄数据如表所示:(1)求这20名工人年龄的众数与极差;(2) 以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3) 求这20名工人年龄的方差.2015年1.(2015重庆文4) 重庆市2013年各月的平均气温(C )数据的茎叶图如下:0 8 91 2 5 82 0 03 3 8 3 1 2则这组数据的中位数是( ).A. 19B.20C. 21.5D. 23 1. 解析 将茎叶图各数据从小到大排列,中位数为2020202+=.故选B . 2.(2015湖南文2) 在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.13 0 0 3 4 5 6 6 8 8 8 914 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 150 1 2 2 3 3 3若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间[]139,151上的运动员人数是( ).A. 3B. 4C. 5D. 62. 解析 由茎叶图可知,在区间]151,139[的人数为20,再由系统抽样的性质可知人数为435720=⨯人.故选B. 3.(2015湖北文2) 我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( ).A .134石B .169石C .338石D .1365石 3. 解析 设一石米中有n 粒谷,这批米内夹谷x 石,则281534254x n n ⋅=⋅,得153428169254x ⨯=≈.故选B.4.(2015山东文6)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图. 考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ). A. ①③B. ①④C. ②③D. ②④4.解析 由茎叶图可知,甲的数据为26,28,29,31,31;乙的数据为28,29,30,31,32.所以()12628293131295x =⨯++++=甲,()12829+303132305x =⨯+++=乙. 所以x x <甲乙,①正确; 又()()()()()2222221182629282929293129312955s ⎡⎤=-+-+-+-+-=⎣⎦甲; ()()()()()22222212830293030303130323025s ⎡⎤=-+-+-+-+-=⎣⎦乙.可得22ss >甲乙,所以s s >甲乙.④正确.故选B.5.(2015广东文12) 已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .5. 解析 因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,又样本数据121x +,221x +,⋅⋅⋅,21n x +的和为()122n x x x n ++++,所以样本数据的均值为21x +=11.评注 本题考查均值的性质.6.(2015湖北文14)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.30.9],内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.50.9],内的购物者的人数为. /万元a6. 解析 由频率分布直方图及频率和等于1,可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=,解之得3a =.于是消费金额在区间[]0.50.9,内频率为0.20.10.80.120.130.10.6⨯+⨯+⨯+⨯=, 所以消费金额在区间[]0.50.9,内的购物者的人数为0.6100006000⨯=.7.(2015广东文17)某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示./度(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[)220,240的用户中应抽取多少户?7.解析 ()1由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 得0.0075x =.(2)由图可知,月平均用电量的众数是2202402302+=. 因为()0.0020.00950.011200.450.5++⨯=<, 又()0.0020.00950.0110.0125200.70.5+++⨯=>, 所以月平均用电量的中位数在[)220,240内.设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=, 得224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=(户);月平均用电量为[)240,260的用户有0.00752010015⨯⨯=(户); 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=(户); 月平均用电量为[]280,300的用户有0.0025201005⨯⨯=(户). 抽取比例为11125151055=+++,所以从月平均用电量在[)220,240的用户中应抽取12555⨯=(户).2016年1.(2016山东文3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30] .根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ). A.56B.60C.120D.1401. D 解析 由图可知组距为2.5,每周的自习时间少于22.5小时的频率为0.30=2.5×)0.1+0.02(,所以,每周自习时间不少于22.5小时的人数是140=0.301×200)(-人.故选D.2.(2016上海文4)某次体检,5位同学的身高(单位:m )分别为1.72,1.78,1.80,1.69,1.76,则这组数据的中位数是 (m ).2. 1.76解析 将数据从小到大排序1.69,1.72,1.76,1.78,1.80,故中位数为1.76./小时3.(2016江苏4)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 3. 0.1解析 由题意得 5.1x =,故()22222210.40.300.30.40.15s =++++=.4.(2016四川文16)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[)00.50.5,1⋅⋅⋅,,,[]4,4.5分成9组,制成了如图所示的频率分布直方图. (1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.请说明理由; (3)估计居民月均用水量的中位数.4.解析 (1)由频率分布直方图,可知:月用水量在[]0,05.的频率为0.080.5=0.04.⨯ 同理,在[)(][)[)[)[)0.5,1 1.5,222.53,3.5 3.5,44,4.5,,,,,,等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由()10.04+0.08+0.21+0.25+0.06+0.04+0.020=0.5+0.5a a -⨯⨯,解得0.30.a =(2)由(1)得,100位居民月均水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为3000000.13=36000.⨯(3)设中位数为x 吨.因为前5组的频率之和为0.040.080.15+0.21+0.250.730.5++=>,而前4组的频率之和为0.040.080.150.210.480.5+++=<,所以22.5.x <由()0.5020.50.48x ⨯-=-,解得 2.04.x =故可估计居民月均用水量的中位数为2.04吨.5.(2016北京文17)某市民用水拟实行阶梯水价,每人用水米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直用水量(立方米)方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?w=时,估计该市居民该月(2)假设同组中的每个数据用该组区间的右端点值代替,当3的人均水费.5.解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[](](](](]0.5,1,1,1.5,1.5,2,2,2.5,2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表根据题意,该市居民该月的人均水费估计为⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=10.540.160.1580.2100.25120.15170.05220.05270.05(元).2017年1.(2017全国1文2)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为12n x x x ⋯,,,,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ).A .12n x x x ⋯,,,的平均数 B .12n x x x ⋯,,,的标准差 C .12n x x x ⋯,,,的最大值 D .12n x x x ⋯,,,的中位数 1. 解析 刻画评估这种农作物亩产量稳定程度的指标是标准差.故选B. 2.(2017山东卷文8)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件). 若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( ). A. 3,5B. 5,5C. 3,7D. 5,72. 解析 由于甲组中位数为65,故5y =,计算得乙组平均数为66,故3x =.故选A. 题型140 统计图表与概率的综合2013年1. (2013陕西文5)对一批产品的长度(单位: 毫米)进行抽样检测,下图为检测结果的频率分布直方图. 根据标准,产品长度在区间[)2025,上为一等品, 在区间[)1520,和区间[)2530,上为二等品, 在区间[)1015,和[]3035,上为三等品. 用频率估计概率, 现从该批产品中随机抽取一件, 则其为二等品的概率为( ).0.030.060.040.02353025长度/毫米O0.060.040.02频率/组距101520A. 0.09B. 0.20C. 0.25D. 0.452. (2013重庆文6) 下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[)2230, 内的概率为( ).A. 0.2B. 0.4C. 0.5D. 0.63. (2013安徽文17)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30 名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:甲 乙7 4 55 3 3 2 5 3 3 85 5 4 3 3 3 1 0 06 0 6 9 1 1 2 2 3 3 5 8 6 6 2 2 1 1 0 07 0 0 2 2 2 3 3 6 6 9 7 5 4 4 28 1 1 5 5 8 2 09 0(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为12x x ,,估计12x x -的值. 4.(2013广东文17)从一批苹果中,随机抽取50个,其重量(单位:克)的频数分布表如下:开始结束(1) 根据频数分布表计算苹果的重量在[90,95)的频率;(2) 用分层抽样的方法从重量在[)80,85和[)95,100的苹果中共抽取4个,其中重量在[)80,85的有几个?(3) 在(2)中抽出的4个苹果中,任取2个,求重量在[)80,85和[)95,100中各有1的概率.5. (2013四川文18)某算法的程序框图如图所示,其中输入的变量x 在 12324,,,,这24个整数中都可能随机产生. (1)分别求出按程序框图正确编程运行时输出y 的值为i 的 概率()123i P i =,,; (2)甲、乙两同学依据自己对程序框图的理解,各自编写程序 重复运行n 次后,统计记录了输出y 的值为()123i i =,,的频数 以下是甲、乙所作频数统计表的部分数据.甲的频数统计表(部分) 乙的频数统计表(部分)3014610…………21001027 376 697当2100n =时,根据表中的数据,分别写出甲、乙所编程序各自输出y 的值为(123)i i =,,的频率(用分数表示),并判断两位同学中哪一位所编写程序符合算法要求的可能性较大. 6. (2013湖南文18)某人在如图3所示的直角边长为4米的三角形地块的每个格点(指纵、横直线的交叉点以及三角形的顶点)处都种了一株相同品种的作物.根据历年的种植经验,一株该种作物的年收获量Y (单位:kg )与它的“相近”作物株数X 之间的关系如下表所示:X1 23 4 Y51 4845 42这里,两株作物“相近”是指它们之间的直线距离不超过1米.(1)完成下表,并求所种作物的平均年收获量;Y51484542频数4(2)在所种作物中随机选取一株,求它的年收获量至少为48kg 的概率.运行 次数n输出y 的值 为1的频数输出y 的值 为2的频数输出y 的值 为3的频数3012117…………21001051 696 3532014年1.(2014重庆文17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示:7632(I )求频率分布直方图中a 的值;(II )分别求出成绩落在[)6050,与[)7060,中的学生人数; (III )从成绩在[)7050,的学生中任选2人,求此2人的成绩都在[)7060,中的概率.2015年1.(2015全国Ⅱ文3)根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ). A. 逐年比较,2008年减少二氧化碳排放量的效果显著 B. 2007年我国治理二氧化碳排放显现成效C. 2006年以来我国二氧化碳年排放量呈逐渐减少趋势D. 2006年以来我国二氧化碳年排放量与年份正相关2010年2012年2009年2013年2004年2006年2007年2008年2011年2005年190020001. 解析 由柱形图可以看出,我国二氧化硫排放量呈下降趋势,故年排放量与年份是负相关关系,依题意,需选不正确的.故选D.命题意图 本题考查统计的基本知识,要注意读懂题意和图表,理解相关性有正相关和负相关.2.(2015安徽文17)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[)40,50,[)50,60,,[)80,90,[]90,100.(1)求频率分布图中a 的值;(2)估计该企业的职工对该部门评分不低于80分的概率;(3)从评分在[)40,60的受访职工中,随机抽取2人,求此2人评分都在[)40,50的概率.2. 解析 (1)由频率分布直方图可知,()0.0040.0180.02220.028101a +++⨯+⨯=,解得0.006a =.(2)由频率估计概率,评分不低于80分的概率为()0.0220.018100.4+⨯=. (3)由频率分布直方图可知:在[)40,50内的人数为0.00410502⨯⨯=(人), 在[)50,60内的人数为0.00610503⨯⨯=(人).设[)40,50内的2人评分分别为12,a a ,[)50,60内的3人评分分别为123,,A A A , 则从[)40,60的受访职工中随机抽取2人,2人评分的基本事件有()12,a a ,()11,a A ,()12,a A ,()13,a A ,()21,a A ,()22,a A ,()23,a A ,()12,A A ,()13,A A ,()23,A A ,共10种.其中2人评分都在[)40,50的概率为110. 3.(2015全国Ⅱ文18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得出A 地区用户满意评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表(1)在答题卡上作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B 地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.3. 分析 (1) 根据题意通过两地区用户满意度评分的频率分布直方图可以看出B 地区用户满意评分的平均值高于A 地区用户满意度评分的平均值,B 地区用户满意度评分比较集中,A 地区用户的评分满意度比较分散;(2)由直方图得()A P C 的估计值为0.6.()B P C 的估计值为0.25,所以A 地区的用户满意度等级为不满意的概率大.解析 (1)通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而A 地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”;B C 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得()A P C 的估计值为()0.010.020.03100.6++⨯=,()B P C 的估计值为()0.0050.02100.25+⨯=.所以A 地区用户的满意度等级为不满意的概率大.评注 高考中对统计与概率的考查,主要建立在实际问题中,特别要能读懂题意,分析题目中的数据,并对数据进行处理,在解答中要注意概率的计算方法.2016年1.(2016全国甲文18)某险种的基本保费为a (单元:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:(1)记A 为事件:“一续保人本年度的保费不高于基本保费”,求()P A 的估计值; (2)记B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求()P B 的估计值;(3)求续保人本年度平均保费的估计值.1.解析 (1)由所给数据知,事件A 发生当且仅当一年内出险次数小于2,所以()60500.55200P A +==. (2)由所给数据知,事件B 发生当且仅当一年内出险次数大于等于1且小于等于4,所以3030()0.3200P B +==. (3)由题所求分布列为调查200名续保人的平均保费为0.850.300.25 1.250.15 1.50.15 1.750.1020.05 1.1925a a a a a a a ⨯+⨯+⨯+⨯+⨯+⨯=.2.(2016山东文16)某儿童乐园在“六一”儿童节推出了一项趣味活动.参加活动的儿童需转动如图所示的转盘两次,每次转动后,待转盘停止转动时,记录指针所指区域中的数.设两次记录的数分别为x ,y .奖励规则如下: ①若3xy ,则奖励玩具一个; ②若8xy ,则奖励水杯一个; ③其余情况奖励饮料一瓶.假设转盘质地均匀,四个区域划分均匀.小亮准备参加此项活动. (1)求小亮获得玩具的概率;(2)请比较小亮获得水杯与获得饮料的概率的大小,并说明理由.2.解析 用数对(),x y 表示儿童参加活动先后记录的数,则基本事件空间Ω与点集(){},|,,14,14S x y x y x y =∈∈N N 一一对应.因为S 中元素个数是4416,⨯=所以基本事件总数为16.n =(1)记“3xy ”为事件A .则事件A包含的基本事件共有5个,即()()()()()1,1,1,2,1,3,2,1,3,1,所以()5,16P A =即小亮获得玩具的概率为516. (2)记“8xy ”为事件B ,“38xy <<”为事件C .则事件B 包含的基本事件共有6个,即()()()()()()2,4,3,3,3,44,2,4,3,4,4,所以()63.168P B == 3421则事件C 包含的基本事件共有5个,即()()()()()1,4,2,2,2,3,3,2,4,1,所以()5.16P C = 因为35,816> 所以小亮获得水杯的概率大于获得饮料的概率. 3.(2016全国乙文19)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图. 记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若19n =,求y 与x 的函数解析式;(2)若要求 “需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值; (3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?3.解析 (1)当19x 时,192003800y =⨯=(元);当19x >时,()19200195005005700y x x =⨯+-⨯=-(元),所以3800,,195005700,,19x x y x x x ∈⎧=⎨-∈>⎩N N .(2)由柱状图可知更换易损零件数的频率如表所示.更换的易损零件数16 1718 19 20 21 频率0.060.160.240.240.200.10所以更换易损零件数不大于18的频率为:0.060.160.240.460.5++=<,更换易损零件数不大于19的频率为:0.060.160.240.240.700.5+++=>,故n 最小值为19.(3)若每台都购买19个易损零件,则这100台机器在购买易损零件上所需费用的平均数为:10019200205002105004000100⨯⨯+⨯+⨯⨯=(元);若每台都够买20个易损零件,则这100台机器在购买易损零件上所需费用的平均数为10020200105004050100⨯⨯+⨯=(元).因为40004050<,所以购买1台机器的同时应购买19个易损零件.2017年1.(2017全国3卷文3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线图,下列结论错误的是( ). A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月份D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 1.解析 由图易知月接待游客量是随月份的变化而波动的,有上升也有下降,所以选项A 错误.故选A.评注 与2016年的雷达图考法类似,近年来,对各类图形与图表的理解与表示成为高考的一个热点,总体来说,此类题型属于基础类题型,用排除法解此类问题会比较快,但要注意题目要求选择错误的一项,如果审题不仔细可能会造成失分!2.(2017全国2卷文19)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品产量(单位:kg )的某频率直方图如图所示.(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg ”,估计A 的概率;(修图:下面表中原点处加数字0)(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.箱产量/kg新养殖法旧养殖法箱产量/kg。