创新设计全国通用2020届高考数学二轮复习专题六概率与统计第2讲统计与统计案例训练文
- 格式:doc
- 大小:79.50 KB
- 文档页数:5
2020年高考数学文科二轮复习理科《概率与统计》讲义案及基础题型精讲卷一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。
2.理解超几何分布及其推导过程,并能进行简单的应用。
3.了解条件概率和两个事件相互独立的概念,理解n 次独立重复实验的模型及二项分布,并能解决一些简单的实际问题。
4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。
二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。
2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。
3.有关正态分布的考题多为一道小题。
三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作()P B A ,条件概率公式为()=P B A ()()P AB P A 。
(2)若()=P B A P B (),即()=()()P AB P A P B ,称A 与B 为相互独立事件。
A 与B 相互独立,即A 发生与否对B 的发生与否无影响,反之亦然。
即,A B 相互独立,则有公式()=()()P AB P A P B 。
(3)在n 次独立重复实验中,事件A 发生k ()0k n ≤≤次的概率记作()n P k ,记A 在其中一次实验中发生的概率为()P A p= ,则()()1n kk kn n P k C p p -=- .(二).离散型随机变量分布列、期望、方差及其性质 (1)离散型随机变量ξ的分布列(如表13-1所示). 表13-1①11,i p i n i N θ*≤≤≤≤∈ ;②121n p p p ++=L .(2)E ξ表示ξ的期望:1122=+n np p p E ξξξξ++…,反应随机变量的平均水平,若随机变量ξη,满足=a b ηξ+,则E aE b ηξ=+.(3)D ξ表示ξ的方差:()()()2221122=---n nE p E p E p D ξξξξξξξ+++L ,反映随机变量ξ取值的波动性。
2020 高考数学二轮复习 概率与统计概率内容的新概念 多,相近概念容易混淆,本 就学生易犯 作如下 :型一 “非等可能 ”与 “等可能 ”混同 例 1 两枚骰子,求所得的点数之和 6 的概率.解两枚骰子出 的点数之和2, 3, 4, ⋯ ,12 共 11 种基本事件,所以概率P=111剖析以上 11 种基本事件不是等可能的,如点数和 2 只有 (1, 1),而点数之和6 有 (1, 5)、(2, 4)、 (3, 3)、 (4,2)、 (5, 1)共 5 种.事 上, 两枚骰子共有 36 种基本事件,且是等可能的,所以“所得点数之和6”的概率 P= 5.36型二 “互斥 ”与 “ 立 ”混同例 2把 、黑、白、4 牌随机地分 甲、乙、丙、丁4 个人,每个人分得1 ,事件“甲分得 牌”与“乙分得 牌”是()A . 立事件B .不可能事件C .互斥但不 立事件D .以上均不解A剖析 本 的原因在于把 “互斥 ”与 “ 立”混同,二者的 系与区 主要体 在 :(1)两事件 立,必定互斥,但互斥未必 立; (2) 互斥概念适用于多个事件,但 立概念只适用于两个事件; (3) 两个事件互斥只表明 两个事件不能同 生,即至多只能 生其中一个,但可以都不 生;而两事件 立 表示它 有且 有一个 生.事件 “甲分得 牌 ”与 “乙分得 牌 ”是不能同 生的两个事件,两个事件可能恰有一个 生,一个不 生,可能两个都不 生,所以 C .型三 例 3解“互斥 ”与 “独立 ”混同甲投 命中率 O .8,乙投 命中率 0.7,每人投 3 次,两人恰好都命中 2 次的概率是多少 ?“甲恰好投中两次” 事件 A , “乙恰好投中两次” 事件B , 两人都恰好投中两次事件A+B , P(A+B)=P(A)+P(B): c 32 0.820.2 c 32 0.720.3 0.825剖析本 的原因是把相互独立同 生的事件当成互斥事件来考 , 将两人都恰好投中2 次理解 “甲恰好投中两次”与 “乙恰好投中两次 ”的和.互斥事件是指两个事件不可能同 生;两事件相互独立是指一个事件的 生与否 另一个事件 生与否没有影响,它 然都描 了两个事件 的关系,但所描 的关系是根本不同.解:“甲恰好投中两次 ” 事件 A ,“乙恰好投中两次” 事件 B ,且 A , B 相互独立,两人都恰好投中两次 事件A ·B ,于是 P(A ·B)=P(A) ×P(B)= 0.169类型四例 4错解“条件概率 P(B / A)”与“积事件的概率P(A·B)”混同袋中有 6 个黄色、 4 个白色的乒乓球,作不放回抽样,每次任取一球,取 2 次,求第二次才取到黄色球的概率.记“第一次取到白球”为事件A,“第二次取到黄球”为事件B,”第二次才取到黄球”为事件62C,所以 P(C)=P(B/A)=.93剖析本题错误在于 P(A B)与 P(B/A) 的含义没有弄清 , P(A B) 表示在样本空间S 中 ,A 与 B 同时发生的概率;而P( B/A )表示在缩减的样本空间S A中,作为条件的 A 已经发生的条件下事件 B 发生的概率。
概率及其计算一、考纲解读1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3.掌握古典概型及其概率计算公式。
4.了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义。
二、命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下.三、知识点精讲(一).必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件;②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件。
(二).概率在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。
对于必然事件A ,;对于不可能事件A ,=0(三).两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为Aμ.()P A =AμμΩ。
(四).互斥事件1、互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A与事件B互斥,则()()()U。
P A B P A P B=+2、对立事件事件A,B互斥,且其中必有一个发生,称事件A,B对立,记作B A=。
=或A B ()()=-。
1P A p A3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A,B对立”是”事件A,B互斥“的充分不必要条件。
四、解答题总结1.电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)2.已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.3.某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:以最高气温位于各区间的频率代替最高气温位于该区间的概率。
(通用版)2020版高考数学大二轮复习专题六统计与概率6.3.1统计与统计案例课件理6.3统计与概率大题,-2-,-3-,-4-,-5-,-6-,-7-,1.变量间的相关关系1如果散点图中的点从整体上看大致分布在一条直线的附近,那么我们说变量x和y具有线性相关关系.2线性回归方程若变量x与y具有线性相关关系,有n个样本数据xi,yii1,2,,n,则回归方程为,-8-,2.独立性检验对于取值分别是x1,x2和y1,y2的分类变量X和Y,其样本频数列联表是,-9-,3.超几何分布在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则PXk,k0,1,2,,m,其中mminM,n,且nN,MN,n,M,NN*.4.二项分布一般地,在n次独立重复试验中,事件A发生的次数为X,设每次试验中事件A发生的概率为p,则PXkpkqn-k,其中0p1,pq1,k0,1,2,,n,称X服从参数为n,p的二项分布,记作XBn,p,且EXnp,DXnp1-p.,-10-,5.正态分布一般地,如果对于任意实数ab,随机变量X满足PaXb,xdx,则称X的分布为正态分布.正态分布完全由参数和确定,因此正态分布常记作N,2.如果随机变量X服从正态分布,则记为XN,2.满足正态分布的三个基本概率的值是P-X0.6826;P-2X20.9544;P-3X30.9974.,-11-,6.离散型随机变量的分布列.期望.方差1设离散型随机变量X 可能取的不同值为x1,x2,,xi,,xn,X取每一个值xii1,2,,n的概率PXxipi,则称下表为离散型随机变量X的分布列.2EXx1p1x2p2xipixnpn为X的均值或数学期望.3DXx1-EX2p1x2-EX2p2xi-EX2pixn-EX2pn叫做随机变量X的方差.4均值与方差的性质EaXbaEXb;EEE;DaXba2DX.,6.3.1统计与统计案例,-13-,考向一,考向二,考向三,考向四,样本的数字特征的应用例1xx全国卷2,文19某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.1分别估计这类企业中产值增长率不低于40的企业比例.产值负增长的企业比例;2求这类企业产值增长率的平均数与标准差的估计值同一组中的数据用该组区间的中点值为代表.精确到0.01,-14-,考向一,考向二,考向三,考向四,-15-,考向一,考向二,考向三,考向四,解题心得1在预测总体数据的平均值时,常用样本数据的平均值估计,从而做出合理的判断.2平均数反映了数据取值的平均水平,标准差.方差描述了一组数据围绕平均数波动的大小.标准差.方差越大,数据的离散程度越大,越不稳定.,-16-,考向一,考向二,考向三,考向四,对点训练1为迎接即将举行的集体跳绳比赛,高一年级对甲.乙两个代表队各进行了6轮测试,测试成绩单位次/分钟如下表1补全茎叶图,并指出乙队测试成绩的中位数和众数;2试用统计学中的平均数.方差知识对甲.乙两个代表队的测试成绩进行分析.,-17-,考向一,考向二,考向三,考向四,-18-,考向一,考向二,考向三,考向四,利用回归方程进行回归分析例2xx新疆乌鲁木齐二模,理19某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x单位万元和收益y单位万元的数据如表他们分别用两种模型ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值,-19-,考向一,考向二,考向三,考向四,-20-,考向一,考向二,考向三,考向四,1根据残差图,比较模型,的拟合效果,应选择哪个模型并说明理由;2残差绝对值大于2的数据被认为是异常数据,需要剔除剔除异常数据后求出1中所选模型的回归方程;若广告投入量x18时,该模型收益的预报值是多少,-21-,考向一,考向二,考向三,考向四,-22-,考向一,考向二,考向三,考向四,解题心得在求两变量的回归方程时,由于的公式比较复杂,求它的值计算量比较大,为了计算准确,可将这个量分成几个部分分别计算,最后再合成,这样等同于分散难点,各个攻破,提高了计算的准确度.,-23-,考向一,考向二,考向三,考向四,对点训练2xx山东德州一模,理20改革开放以来,我国经济持续高速增长.如图给出了我国2003年至xx年第二产业增加值与第一产业增加值的差值以下简称为产业差值的折线图,记产业差值为y单位万亿元.1求出y关于年份代码t的线性回归方程;2利用1中的回归方程,分析2003年至xx年我国产业差值的变化情况,并预测我国产业差值在哪一年约为34亿元;3结合折线图,试求出除去xx年产业差值后剩余的9年产业差值的平均值及方差结果精确到0.1.,-24-,考向一,考向二,考向三,考向四,-25-,考向一,考向二,考向三,考向四,-26-,考向一,考向二,考向三,考向四,-27-,考向一,考向二,考向三,考向四,样本的相关系数的应用例3xx四川宜宾二模,理18艾滋病是一种危害性极大的传染病,由感染艾滋病病毒HIV病毒引起,它把人体免疫系统中最重要的CD4T淋巴细胞作为主要攻击目标,使人体丧失免疫功能.下表是近八年来我国艾滋病病毒感染人数统计表,-28-,考向一,考向二,考向三,考向四,1请根据该统计表,画出这八年我国艾滋病病毒感染人数的折线图;2请用相关系数说明能用线性回归模型拟合y 与x的关系;,-29-,考向一,考向二,考向三,考向四,3建立y关于x的回归方程系数精确到0.01,预测xx年我国艾滋病病毒感染人数.,-30-,考向一,考向二,考向三,考向四,解1我国艾滋病病毒感染人数的折线图如图所示.,-31-,考向一,考向二,考向三,考向四,-32-,考向一,考向二,考向三,考向四,-33-,考向一,考向二,考向三,考向四,解题心得对于样本的相关系数的应用的题目,题目一般都给出样本xi,yii1,2,,n的相关系数r的表达式,以及有关的数据,解决这类题的关键是在有关的数据中选择题目需要的数据代入公式即可.,-34-,考向一,考向二,考向三,考向四,对点训练3下图是我国xx年至xx年生活垃圾无害化处理量单位亿吨的折线图.1由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;2建立y关于t的回归方程系数精确到0.01,预测xx年我国生活垃圾无害化处理量.,-35-,考向一,考向二,考向三,考向四,-36-,考向一,考向二,考向三,考向四,-37-,考向一,考向二,考向三,考向四,-38-,考向一,考向二,考向三,考向四,统计图表与独立性检验的综合例4某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间单位min绘制了如下茎叶图,-39-,考向一,考向二,考向三,考向四,1根据茎叶图判断哪种生产方式的效率更高并说明理由;2求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表3根据2中的列联表,能否有99的把握认为两种生产方式的效率有差异,-40-,考向一,考向二,考向三,考向四,解1第二种生产方式的效率更高.理由如下由茎叶图可知用第一种生产方式的工人中,有75的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.由茎叶图可知用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.由茎叶图可知用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.,-41-,考向一,考向二,考向三,考向四,由茎叶图可知用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,学生答出其中任意一种或其他合理理由均可,-42-,考向一,考向二,考向三,考向四,解题心得有关独立性检验的问题解题步骤1作出22列联表;2计算随机变量K2的值;3查临界值,检验作答.,-43-,考向一,考向二,考向三,考向四,对点训练4“共享单车”的出现,为我们提供了一种新型的交通方式.某机构为了调查人们对此种交通方式的满意度,从交通拥堵不严重的A城市和交通拥堵严重的B城市分别随机调查了20个用户,得到了一个用户满意度评分的样本,并绘制出如图茎叶图.1根据茎叶图,比较两城市满意度评分的平均值的大小及方差的大小不要求计算出具体值,给出结论即可;,-44-,考向一,考向二,考向三,考向四,2若得分不低于80分,则认为该用户对此种交通方式“认可”,否则认为该用户对此种交通方式“不认可”,请根据此样本完成下面22列联表,并据此样本分析是否有95的把握认为城市拥堵与认可共享单车有关;3若从此样本中的A城市和B城市各抽取1人,则在此2人中恰有1人认可的条件下,此人来自B城市的概率是多少,-45-,考向一,考向二,考向三,考向四,解1A 城市评分的平均值小于B城市评分的平均值;A城市评分的方差大于B城市评分的方差.222列联表如下.,。
2020年高考第二轮专题复习(教学案):统计与概率考纲指要:“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
统计案例主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用。
对概率考察的重点为互斥事件、古典概型的概率事件的计算为主,了解随机数的意义,能运用模拟方法(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义。
考点扫描:1.三种常用抽样方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样。
2.用样本的数字特征估计总体的数字特征: (1)众数、中位数;(2)平均数与方差。
3.频率分布直方图、折线图与茎叶图。
4.线性回归:回归直线方程。
5.统计案例:相关系数、卡方检验,6.随机变量:随机变量的概念,离散性随机变量的分布列,相互独立事件、独立重复试验公式,随机变量的均值和方差,几种特殊的分布列:(1)两点分布;(2)超几何分布;(3)二项分布;正态分布。
7随机事件的概念、概率;事件间的关系:(1)互斥事件;(2)对立事件;(3)包含; 事件间的运算:(1)并事件(和事件)(2)交事件(积事件)8古典概型:古典概型的两大特点;古典概型的概率计算公式。
9几何概型:几何概型的概念;几何概型的概率公式;几种常见的几何概型。
考题先知:例1.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为:sxx Z -=(其中x 是某位学生的考试分数,x 是该次考试的平均分,s 是该次 考试的标准差,Z 称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此, 又常常再将Z 分数作线性变换转化成其他分数. 例如某次学业选拔考试采用的是T 分数,线性变换公式是:T=40Z+60. 已知在这次考试中某位考生的考试分数是85,这次考试的平均分是70,标准差是25,则该考生的T 分数为 . 分析:正确理解题意,计算所求分数。
专题六 概率与统计 第2讲 统计与统计案例训练 文一、选择题1.(2015·重庆卷)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( ) A.19B.20C.21.5D.23解析 由茎叶图,把数据由小到大排列,处于中间的数为20,20,所以这组数据的中位数为20. 答案 B2.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A.p 1=p 2<p 3 B.p 2=p 3<p 1 C.p 1=p 3<p 2D.p 1=p 2=p 3解析 由于三种抽样过程中每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 答案 D3.(2016·山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) A.56 B.60 C.120D.140解析 由题图知,组距为2.5,故每周的自习时间不少于22.5小时的频率为:(0.16+0.08+0.04)×2.5=0.7,∴人数是200×0.7=140人,故选D. 答案 D4.某车间加工零件的数量x 与加工时间y 的统计数据如下表:现已求得上表数据线性回归方程y =b x +a 中的b 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( ) A.84分钟 B.94分钟 C.102分钟D.112分钟解析 由表中数据得:x =20,y =30,又b ^=0.9,故a ^=30-0.9×20=12,∴y ^=0.9x +12.将x =100代入线性回归方程,得y ^=0.9×100+12=102.∴预测加工100个零件需要102分钟,故选C. 答案 C5.设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A.1+a ,4 B.1+a ,4+a C.1,4D.1,4+a解析x 1+x 2+…+x 1010=1,y i =x i +a ,所以y 1,y 2,…,y 10的均值为1+a ,方差不变仍为4.故选A. 答案 A 二、填空题6.某学校有1 200名学生,现采用系统抽样的方法抽取120人做问卷调查,将1 200人按1,2,…,1 200随机编号,则抽取的120人中,编号落入区间[241,480]的人数为________. 解析 根据系统抽样的特点知,组距为1 200120=10,所以抽取的120人中,编号落入区间[241,480]的人数为(480-241+1)÷10=24. 答案 247.如图所示的茎叶图记录了甲、乙两人在某5次综合测评中的成绩(均为整数),其中一个数字模糊不清,则甲的平均成绩不超过乙的平均成绩的概率为________.解析 由茎叶图可知,x 甲=88+89+90+91+925=90,设模糊不清的数字为a (0≤a ≤9,a ∈N ),则x 乙=83+83+87+90+a +995=88.4+a5.若甲的平均成绩不超过乙的平均成绩,则88.4+a5≥90,解得a ≥8,所以a =8或a =9,所以甲的平均成绩不超过乙的平均成绩的概率为15.答案 158.某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20人,若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”,“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”.得以下2×2列联表:高个 非高个 总计 大脚 5 2 7 非大脚11213. 附:解析 由题意得K 2的观测值k =20×(5×12-1×2)26×14×7×13≈8.802>6.635.而K 2的观测值k>6.635的概率约为0.01,所以在犯错误的概率不超过0.01的前提下认为人的脚的大小与身高之间有关系. 答案 0.01 三、解答题9.(2016·广州模拟)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得:x =0.007 5,所以直方图中x 的值是0.007 5.(2)月平均用电量的众数是220+2402=230.因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.(3)月平均用电量为[220,240]的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).10.(2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.11.(2016·北京东城模拟)在微信群中抢红包已成为一种娱乐,已知某商业调查公司对此进行了问卷调查,其中男性500人,女性400人,为了了解喜欢抢红包是否与性别有关,现采用分层抽样的方法从中抽取了45人的调查结果,并作出频数统计表如下:表1:男性表2:女性(1)性别有关”;,其中n=a+b+c+d.参考公式:K2=(a+b)(c+d)(a+c)(b+d)临界值表:(2)从表求所选2人中至少有1人是“不喜欢”的概率. 解 (1)设从男性中抽取了m 人,则m 500=45500+400,m =25, 从而知从女性中抽取了20人, ∴x =25-20=5,y =20-18=2. 填写完整的2×2列联表如下:而K 2=30×15×25×20=30×15×25×20=8=1.125<2.706,∵1-0.9=0.1,P (K 2≥2.706)=0.10,∴没有90%的把握认为“喜欢抢红包与性别有关”.(2)由(1)知表1中“一般”的有5人,分别记为A ,B ,C ,D ,E ,表2中“不喜欢”的有2人,分别记为a ,b ,则从中随机选取2人,不同的结果为:{A ,B },{A ,C },{A ,D },{A ,E },{A ,a },{A ,b },{B ,C },{B ,D },{B ,E },{B ,a },{B ,b },{C ,D },{C ,E },{C ,a },{C ,b },{D ,E },{D ,a },{D ,b },{E ,a },{E ,b },{a ,b },共21种.设事件M 表示“所选2人中至少有1人是‘不喜欢’”,则M 为“所选2人都是‘一般’”,事件M 所包含的不同的结果为:{A ,B },{A ,C },{A ,D },{A ,E },{B ,C },{B ,D },{B ,E },{C ,D },{C ,E },{D ,E },共10种.∴P (M )=1021,故P (M )=1-P (M )=1-1021=1121.。