2017年高考数学深化复习+命题热点提分专题18统计与统计案例理20170508181
- 格式:doc
- 大小:320.00 KB
- 文档页数:11
2017-2018年高考真题解答题专项训练概率与统计(理科)学生版2017------2018年高考真题解答题专项训练:概率与统计(理科)学生版1.已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I)应从甲、乙、丙三个部门的员工中分别抽取多少人?(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足..的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.2.电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评0.40.20.150.250.20.1率好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“ξk= 1”表示第k类电影得到人们喜欢,“ξk= 0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.3.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工4.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1, 2, ⋯, 17)建立模型①:ŷ=−30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1, 2, ⋯, 7)建立模型②:ŷ=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.5.根据预测,某地第n(n∈N∗)个月共享单车的投放量和损失量分别为a n和b n(单位:辆),其中a n={5n4+15,1≤n≤3−10n+470,n≥4,b n=n+5,第n个月底的共享单车的保有量是前n个月的累计投放量与累计损失量的差.(1)求该地区第4个月底的共享单车的保有量;(2)已知该地共享单车停放点第n个月底的单车容纳量S n=−4(n−46)2+8800(单位:辆). 设在某月底,共享单车保有量达到最大,问该保有量是否超出了此时停放点的单车容纳量?6.某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率。
透视全国高考揭秘命题规律(六)-—概率与统计(全国卷第18题)统计与概率(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.【解】(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B 表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0。
01+0。
02+0.03)×10=0。
6,P(C B)的估计值为(0。
005+0。
02)×10=0。
25.所以A地区用户的满意度等级为不满意的概率大.第一步:从统计图(频率分布直方图、茎叶图、扇形图、条形图、折线图等)提取相关的信息与数据。
第二步:根据统计原理和方法,理清统计量之间的关系.第三步:将问题“翻译”为“数据”,根据问题要求用数据刻画(或估计)问题.回归分析问题(2016·高考全国卷丙)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0。
纵观2012到2016年全国的高考试题从命题来看都会涉及到概率与统计的相关题目,分值也占据17分左右。
从题目的类型来看,以实际应用为主要出发点。
就考查内容而言, 以小题形式出现的是用概率定义或基本事件求事件概率;以大题形式出现的是统计与概率问题综合,列分布列、求期望方差等等。
考查学生对概念和应用基础性的认识,总体上概率与统计部分的考查基本上集中在以下几个热点问题上:热点一、求随机事件的概率事件概率的计算,主要是古典概型问题和几何概型,当所求事件情况较复杂时,一般要分类计算,这就要用到互斥事件的概率加法公式或考虑其对立事件.例如以下问题:1.【2016高考新课标3】小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M I N,中的一,个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是()【答案】C【考点】古典概型.【名师点睛】对古典概型必须明确判断两点:①对于每个随机试验来说,所有可能出现的试验结果数n必须是有限个;②出现的各个不同的试验结果数m其可能性大小必须是相同的.只2.【2014·新课标全国Ⅰ】4位同学各自在周六、周日两天中任选一天参加公益活动,则周六、周日都有同学参加公益活动的概率为( )A.18B.58C.38D.78 【答案】D【解析】由题意知,4位同学各自在周六、周日两天中任选一天参加公益活动有24种情况,而4位同学都选周六有1种情况,4位同学都选周日也有1种情况,故周六、周日都有同学参加公益活动的概率为P =24-1-124=1416=78. 【考点】1、排列和组合;2、古典概型的概率计算公式.【名师点睛】本题主要考查古典概型、排列的应用,以及考查逻辑思维能力、运算求解能力、实际应用能力.求古典概型的概率只要求出基本事件总和与满足条件的基本事件数,则问题易解决.较为复杂的概率问题常常转化为几个互斥事件的和,或采用间接法,通过其对立事件的概率来求解。
压轴题高分策略之集合新定义数学思维的创新是思维品质最高层次,以集合为背景的创新问题是近几年高考命题创新型试题的一个热点,此类题目常常以“问题”为核心,以“探究”为途径,以“发现”为目的,以集合为依托,考查考生理解问题、解决创新问题的能力.常见的命题形式有新概念、新法则、新运算等,这类试题中集合只是基本的依托.一、定义新概念创新集合新定义问题是通过重新定义相应的集合,对集合的知识加以深入地创新,结合原有集合的相关知识和相应数学知识,来解决新定义的集合创新问题.【典例1】【2017四川省成都市高三摸底】设S,T是R的两个非空子集,如果存在一个从S到T的函数y=f(x)满足:(1)T={f(x)|x∈S};(2)对任意x1,x2∈S,当x1<x2时,恒有f(x1)<f(x2),那么称这两个集合“保序同构”.以下集合对不是“保序同构”的是( )A.A=N*,B=N B.A={x|-1≤x≤3},B={x|x=-8或0<x≤10} C.A={x|0<x<1},B=R D.A=Z,B=Q【答案】D【典例2】【2017届宁夏银川一中高三月考理科数学】已知集合M={},若对于任意,存在,使得成立,则称集合M是“垂直对点集”.给出下列四个集合:①M={};②M={};③M={};④M={}.其中是“垂直对点集”的序号是()A.①② B.②③ C.①④ D.②④【答案】D【解析】试题分析:由题意得,对于①中是以轴为渐近线的双曲线,渐进性的夹角是,所以在同一支上,任意,不存在,不满足垂直对点集的定义;在另一支上对任意,不存在,所以不满足“垂直对点集”的定义;对于②,对于任意,存在,使得成立,满足“垂直对点集”的定义,所以正确;对于③中,取点,曲线上不存在另外的点,使得两点与原点的连线互相垂直,所以不满足“垂直对点集”的定义;对于④中,如下图中直角始终存在,对于任意,存在,使得成立,满足“垂直对点集”的定义.考点:新定义的概念及其应用.【易错点拨】本题主要考查了“垂直度点集”的定义,属于中档试题,利用对于任意对于任意,存在,使得成立,是解答本题的关键,同时注意存在与任意的区别是本题的一个易错点.【典例3】【2017重庆市第八中学高三月考】定集合A,若对于任意a,b∈A,有a+b∈A,且a-b∈A,则称集合A为闭集合,给出如下三个结论:①集合A={-4,-2,0,2,4}为闭集合;②集合A={n|n=3k,k∈Z}为闭集合;③若集合A1,A2为闭集合,则A1∪A2为闭集合.其中正确结论的序号是__________.【答案】②【审题指导】(1)准确转化:解决新定义问题时,一定要读懂新定义的本质含义,紧扣题目所给定义,结合题目的要求进行恰当转化,切忌同已有概念或定义相混淆.(2)方法选取:对于新定义问题,可恰当选用特例法、筛选法、一般逻辑推理等方法,并结合集合的相关性质求解.(3)遇到新定义问题,应耐心读题,分析新定义的特点,弄清新定义的性质.按新定义的要求,“照章办事”,逐条分析、验证、运算,使问题得以解决.对于选择题,可以结合选项通过验证,用排除、对比、特值等方法求解.【变式训练】1.已知数集A ={a 1,a 2,…,a n }(1≤a 1<a 2<…<a n ,n ≥2)具有性质P :对任意的i ,j (1≤i ≤j ≤n ),a i a j 与a j a i两数中至少有一个属于A ,则称集合A 为“权集”,则( ) A .{1,3,4}为“权集” B .{1,2,3,6}为“权集”C .“权集”中元素可以有0D .“权集”中一定有元素1【答案】C2. 非空数集A 如果满足:①0A ∉;②若对,x A ∀∈有1A x ∈,则称A 是“互倒集”.给出以下数集:①2{|10}x R x ax ∈++=; ②2{|410}x x x -+<; ③ln 1{|,[,1)(1,]}x y y x e x e=∈⋃; ④22,[0,1)51.[1,2]x x x x x y y +∈+∈⎧⎫⎧⎪⎪⎪⎪⎪⎪=⎨⎨⎬⎪⎪⎪⎪⎪⎪⎩⎩⎭.其中“互倒集”的个数是( ) A .4 B .3 C .2 D .1【答案】C【解析】集合①,当22a -<<时为空集,所以集合①不是“互倒集”;集合②,2{|410}x x x -+<={|22x x <<1x <<,即122x <<1[,1)x e∈时,[,0)y e ∈-,当1(1,]x e ∈时1(0,]y e ∈,所以集合③不是“互倒集”;集合④,2125[,)[2,]552y ∈ 25[,]52=且125[,]52y ∈,所以集合④是“互倒集”.故选C . 二、定义新运算创新集合新运算问题是按照一定的数学规则和要求给出新的集合运算规则,并按照此集合运算规则和要求结合相关知识进行逻辑推理和计算等,从而达到解决问题的目的.【典例4】 【2017天津市耀华中学高三开学考试】设P 和Q 是两个集合,定义集合P -Q ={x |x ∈P ,且x ∉Q },如果P ={x |log 2x <1},Q ={x ||x -2|<1},那么P -Q 等于( )A .{x |0<x <1}B .{x |0<x ≤1}C .{x |1≤x <2}D .{x |0≤x <2}【答案】B【解析】由log 2x <1,得0<x <2,所以P ={x |0<x <2};由|x -2|<1,得1<x <3,所以Q ={x |1<x <3}.由题意,得P -Q ={x |0<x ≤1}.【典例5】 【2017江西省新余市第一中学高三调研】设,A B 是非空集合, 定义{}|,A B x x A x B =∈∉ 且,已知{}2|20,|A x x xB x y ⎧=--≤==⎨⎩,则A B = ( )A .∅B .[]1,2-C .[]1,2D .(]1,2【答案】C【解析】由题意可知()R A B A B Θ= ð,A=,B=(,1)-∞,故[1,)R B =+∞ð,所以()[1,2].R A B A B Θ== ð【典例6】 【2016届四川省成都外国语学校高三月考理科数学】用C(A)表示非空集合A 中的元素个数,定义A*B=⎩⎨⎧<-≥-)()(),()()()(),()(B C A C A C B C B C A C B C A C .若A={1,2},B=}0)2()(|{22=++⋅+ax x ax x x ,且A*B=1,设实数a 的所有可能取值集合是S ,则C(S)=( )A.4B.3C.2D.1【答案】B考点:1、新定义;2、一元二次方程【审题指导】 与集合有关的新概念问题属于信息迁移类问题,它是化归思想的具体运用,是近几年高考的热点问题.通过以上类型可知,集合的新定义问题的解决方法是:(1)紧扣新定义.首先分析新定义的特点,把新定义所叙述的问题的本质弄清楚,并能够应用到具体的解题过程之中,这是破解新定义型集合问题难点的关键所在.(2)用好集合的性质.集合的性质(概念、元素的性质、运算性质等)是破解新定义型集合问题的基础,也是突破口,在解题时要善于从试题中发现可以使用集合性质的一些因素,在关键之处用好集合的性质.【变式训练】1. 对于任意两个正整数,m n ,定义某种运算“※”如下:当,m n 都为正偶数或正奇数时,m ※n =m n +;当,m n 中一个为正偶数,另一个为正奇数时,m ※n =mn .则在此定义下,集合{(,)|M a b a =※16}b =中的元素个数是( )A.18个B.17个C.16个D.15个【答案】B.【解析】因为1+15=16,2+14=16,3+13=16,4+12=16,5+11=16,6+10=16,7+9=16,8+8=16,116=16⨯,集合M 中的元素是有序数对(a,b ),所以集合M 中的元素共有82+1=17⨯个,故选B.2.定义一个集合A 的所有子集组成的集合叫做集合A 的幂集,记为()P A ,用()n A 表示有限集A 的元素个数,给出下列命题:①对于任意集合A ,都有()A P A ∈;②存在集合A ,使得()3n P A =⎡⎤⎣⎦;③用∅表示空集,若A B =∅ ,则()()P A P B =∅ ;④若A B ⊆,则()()P A P B ⊆;⑤若()n A -()1n B =,则()()2n P A n P B =⨯⎡⎤⎡⎤⎣⎦⎣⎦其中正确的命题个数为( )A.4B.3C.2D.1【答案】B【解析】试题分析:对于命题①,A A ⊆,因此()A P A ∈,命题①正确;对于命题②,若集合A 的元素个数为m ,则集合A 的子集共2m个,若()3n P A =⎡⎤⎣⎦,则23m =,解得2log 3m N =∉,命题②错误;对于命题③,若A B =∅ ,由于A ∅⊆, B ∅⊆,因此()P A ∅∈,()P B ∅∈,所以()()P A P B ∅∈⎡⎤⎣⎦ ,则()()P A P B ≠∅ ,命题③错误;对于命题④,若A B ⊆,对集合A 的任意子集E A ⊆,即对任意E ∈()P A ,则E B ⊆,则()E P B ∈,因此()()P A P B ⊆,命题④正确;对于命题⑤,设()n B n =,则()n A =1n +,则集合A 的子集个数为12n +,即()1222n n n P A +==⨯⎡⎤⎣⎦,集合B 的子集个数为2n ,即()n P B =⎡⎤⎣⎦2n ,因此()()2n P A n P B =⨯⎡⎤⎡⎤⎣⎦⎣⎦,命题⑤正确,故正确的命题个数为3,选B. 考点:1.有限集合子集的个数;2.新定义。
最新文件---------------- 仅供参考--------------------已改成-----------word文本 --------------------- 方便更改2017------2018年高考真题解答题专项训练:概率与统计(理科)学生版1.已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I)应从甲、乙、丙三个部门的员工中分别抽取多少人?(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期..望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.2.电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“”表示第k类电影得到人们喜欢,“”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差,,,,,的大小关系.3.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:超过不超过第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:,4.下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.5.根据预测,某地第个月共享单车的投放量和损失量分别为和(单位:辆),其中,,第个月底的共享单车的保有量是前个月的累计投放量与累计损失量的差.(1)求该地区第4个月底的共享单车的保有量;(2)已知该地共享单车停放点第个月底的单车容纳量(单位:辆). 设在某月底,共享单车保有量达到最大,问该保有量是否超出了此时停放点的单车容纳量?6.某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率。
专题18 概率 文【命题热点突破一】古典概型与几何概型例1、【2016高考新课标1卷】某公司的班车在7:00,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )(A )13 (B )12 (C )23 (D )34【答案】B【解析】如图所示,画出时间轴:8:208:107:507:408:308:007:30小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10分钟根据几何概型,所求概率10101402P +==.故选B . 【变式探究】三位学生两位老师站成一排,则老师站在一起的概率为________. 【答案】25【解析】 三位学生两位老师站成一排,有A 55=120(种)站法,老师站在一起,共有A 44A 22=48(种)站法,故老师站在一起的概率为48120=25.【特别提醒】求古典概型的概率的关键是计算基本事件的个数和所求的随机事件含有的基本事件的个数,在计算时要注意不要重复也不要遗漏【变式探究】已知圆O :x 2+y 2=12,直线l :4x +3y =25,则圆O 上的点到直线l 的距离小于2的概率为________. 【答案】16【特别提醒】与角度相关的几何概型问题一般用直接法,或转化为与线段长度、面积有关的几何概型问题.计算与线段长度有关的几何概型的方法是:求出基本事件对应的线段长度、随机事件对应的线段长度,随机事件对应的线段长度与基本事件对应的线段长度之比即为所求.【举一反三】如图所示,大正方形的面积是34,四个全等直角三角形围成一个小正方形,直角三角形的较短直角边长为3,向大正方形内抛撒一颗黄豆(假设黄豆不落在线上),则黄豆恰好落在小正方形内的概率为( )A.117B.217C.317D.417【答案】B【特别提醒】计算与面积相关的几何概型的方法:算出基本事件对应图形的面积和随机事件对应图形的面积,随机事件对应图形的面积与基本事件对应图形的面积之比即为所求.【变式探究】某高二学生练习投篮,每次投篮命中率约为30%,现采用随机模拟的方法估计该生投篮命中的概率:选用计算器产生0到9之间的整数值的随机数,指定0,1,2表示命中,4,5,6,7,8,9表示不命中,再以每3个随机数为一组,代表3次投篮的结果.经随机模拟产生了如下随机数:807 956 191 925 271 932 813 458 569 683431 257 393 027 556 488 730 113 527 989 据此估计该学生3次投篮恰有2次命中的概率为( ) A .0.15 B .0.25 C .0.2 D .0.18 【答案】C【特别提醒】每次命中率约为30%,3次投篮命中2次的概率,可以看作3次独立重复试验恰好成功2次的概率,直接计算为C 23×0.32×0.7=0.189,与随机模拟方法求得的概率具有差异.随机模拟的方法求得的概率具有随机性,两次随机模拟求得的概率值可能是不同的.【命题热点突破二】相互独立事件和独立重复试验 例2、某项比赛规则是:甲、乙两队先进行个人赛,每支参赛队中成绩的前三名队员再代表本队进行团体赛,团体赛是在两队名次相同的队员之间进行,且三场比赛同时进行.根据以往比赛统计:两名队员中个人赛成绩高的队员在各场胜的概率为23,负的概率为13,且各场比赛互不影响.已知甲、乙两队各有5名队员,这10名队员的个人赛成绩如图所示.(1)计算两队在个人赛中成绩的均值和方差; (2)求甲队在团体赛中至少有2名队员获胜的概率. 【解析】:(1)由题中数据可知,x 甲=85+83+86+96+905=88,x 乙=88+84+83+92+935=88,所以s 2甲=15×(9+25+4+64+4)=21.2,s 2乙=15×(0+16+25+16+25)=16.4.(2)设“甲队中参加个人赛成绩为第i 名的队员在团体赛中获胜”为事件A i (i =1,2,3). 由题意可知P (A 1)=23,P (A 2)=P (A 3)=13,且A 1,A 2,A 3相互独立.设“甲队至少有2名队员获胜”为事件E ,则E =A 1A 2A 3+A 1A 2A 3+A 1A 2A 3+A 1A 2A 3, 故P (E )=23×13×23+23×23×13+13×13×13+23×13×13=1127.【特别提醒】在做涉及相互独立事件的概率题时,首先把所求的随机事件分拆成若干个互斥事件的和,其次将分拆后的互斥事件分拆为若干个相互独立事件的乘积,如果某些相互独立事件符合独立重复试验的特点,那么就用独立重复试验的概率计算公式解答.【变式探究】已知2件次品和3件正品混放在一起,现需要通过检验将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结束.(1)求第一次检测出的是次品且第二次检测出的是正品的概率;(2)已知每检测一件产品需要费用100元,设X 表示直到检测出2件次品或者检测出3件正品时所需要的检测费用(单位:元),求X 的分布列和均值(数学期望).故X 的分布列为所以E (X )=200×110+300×310+400×610=350.【命题热点突破三】随机变量的分布列、均值与方差例3、【2016年高考四川】同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,则在2次试验中成功次数X 的均值是 .【答案】32【解析】同时抛掷两枚质地均匀的硬币,可能的结果有(正正),(正反),(反正),(反反),所以在1次试验中成功次数ξ的取值为0,1,2,其中111(0),(1),(2),424P P P ξξξ======在1次试验中成功的概率为113(1)424P ξ≥=+=, 所以在2次试验中成功次数X 的概率为12313(1)C 448P X ==⨯=,239(2)()416P X ===, 则393128162EX =⨯+⨯=. 【变式探究】某银行规定,一张银行卡若在一天内出现3此密码尝试错误,该银行卡将被锁定.小王到该银行取钱时,发现自己忘记了银行卡的密码,但可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定.(1)求当天小王的该银行卡被锁定的概率;(2)设当天小王用该银行卡尝试密码的次数为X ,求X 的分布列和数学期望.所以X 的分布列为所以E (X )=1×16+2×16+3×23=52.【特别提醒】求离散型随机变量分布列的关键有两点:一是确定离散型随机变量的所有可能取值,不要遗漏;二是根据离散型随机变量取值的实际意义求出其各个值的概率.【变式探究】某树苗培育基地为了解该基地内榕树树苗的长势情况,随机抽取了100株树苗,分别测出它们的高度(单位:cm),并将所得数据分组,得到频率分布表如下:(1)求上表中a ,b 的值;(2)估计该基地榕树树苗的平均高度;(3)该基地从高度在区间[108,112]内的树苗中随机选出5株进行育种研究,其中高度在区间[110,112]内的有X 株,求X 的分布列和数学期望.(3)由频率分布表知树苗高度在区间[108,112]内的有9株,在区间[110,112]内的有3株,因此X 的所有可能取值为0,1,2,3.P (X =0)=C 56C 59=6126=121,P (X =1)=C 13C 46C 59=45126=514,P (X =2)=C 23C 36C 59=60126=1021,P (X =3)=C 33C 26C 59=15126=542.故X 的分布列为所以E (X )=0×121+1×514+2×1021+3×542=53.【特别提醒】常见的离散型随机变量的概率分布模型有两个:超几何分布和二项分布.从摸球模型上看,超几何分布是不放回地取球,二项分布是有放回的取球.注意从摸球模型理解这两个分布.【变式探究】将一个半径适当的小球放入如图所示的容器最上方的入口处,小球自由下落,小球在下落的过程中,将遇到如图所示的黑色障碍物,最后落入A 袋或B 袋中.已知小球每次遇到障碍物时,向左、右两边下落的概率分别是13,23.(1)分别求出小球落入A 袋和B 袋中的概率;(2)在容器的入口处依次放入4个小球,记ξ为落入B 袋中的小球个数,求ξ的分布列和数学期望.故ξ的分布列为故ξ的数学期望E(ξ)=4×23=83.【特别提醒】求解离散型随机变量的期望和方差的基本方法:先根据随机变量的意义,确定随机变量可以取哪些值,然后分别求出取这些值时的概率,列出分布列,最后根据公式计算随机变量的数学期望和方差.【命题热点突破四】求解离散型随机变量的分布列、期望与方差,利用期望与方差进行决策问题 例4、某茶厂现有三块茶园,每块茶园的茶叶估值为6万元.根据以往经验,今年5月12日至14日是采茶的最佳时间,在此期间,若遇到下雨,当天茶园的茶叶估值减少为前一天的一半,否则与前一天持平.现有两种采摘方案:方案①:茶厂不额外聘请工人,一天采摘一块茶园的茶叶;方案②:茶厂额外聘请工人,在12日采摘完全部茶叶,额外聘请工人的成本为3.2万元. 根据天气预报,该地区5月12日不降雨,13日和14日这两天降雨的概率均为40%,每天是否下雨互不影响.(1)若采用方案①,求茶厂14日当天采茶的预期收益; (2)从统计学的角度分析,茶厂采用哪种方案更合理.所以ξ的分布列为所以ξ的数学期望E(ξ)=6×925+3×1225+1.5×425=3.84,即茶厂14日当天采茶的预期收益为3.84万元.(2)茶厂若采用方案①,设茶厂13日采茶的预期收益为η万元,则η的可能取值为6和3. 因为P(η=6)=35,P(η=3)=25,所以η的分布列为所以η的数学期望E(η)=6×35+3×25=4.8,所以若茶厂采用方案①,则采茶的总收益为6+4.8+3.84=14.64(万元); 若茶厂采用方案②,则采茶的总收益为6×3-3.2=14.8(万元). 因为14.64<14.8,所以茶厂采用方案②更合理.【易错提醒】 (1)对问题的实际意义理解不透,弄错ξ的取值;(2)求ξ取各个值的概率时出现计算方面的错误;(3)对采用方案①采茶的总预期收益的意义理解错误,不能正确求出采用方案①采茶的总预期收益;(4)找错两种方案优劣的比较标准.【变式探究】为迎接中秋节,某机构举办猜奖活动,参与者需先后回答两道选择题,问题A 有四个选项,问题B 有五个选项,但都只有一个选项是正确的,正确回答问题A 可获奖金m 元,正确回答问题B 可获奖金n 元.活动规定:参与者可任意选择回答问题的顺序,如果第一个问题回答错误,则该参与者猜奖活动终止.假设一个参与者在回答问题前,对这两个问题都很陌生,试确定哪种回答问题的顺序能使该参与者获奖金额的期望值较大?因为E(ξ)-E(η)=(m 4+n 20)-(m 20+n 5)=4m -3n20,所以当m n >34时,E(ξ)>E(η),即先回答问题A ,再回答问题B ,该参与者获奖金额的期望值较大;当m n =34时,E(ξ)=E(η),无论是先回答问题A ,再回答问题B ,还是先回答问题B ,再回答问题A ,该参与者获奖金额的期望值相等;当m n <34时,E(ξ)<E(η),即先回答问题B ,再回答问题A ,该参与者获奖金额的期望值较大. 【高考真题解读】1. 【2016高考新课标1卷】某公司的班车在7:00,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )(A )13 (B )12 (C )23 (D )34【答案】B2.【2016高考新课标3】某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和 平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15C ︒,B 点表示四月的平均最低气温约为5C ︒.下面叙述不正确的是( )(A)各月的平均最低气温都在0C ︒以上 (B)七月的平均温差比一月的平均温差大(C)三月和十一月的平均最高气温基本相同 (D)平均气温高于20C ︒的月份有5个 【答案】D3.【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )(A )56(B )60(C )120(D )140【答案】D【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有200(0.160.080.04) 2.5140⨯++⨯=(人),选D.4.【2016高考新课标2】从区间[]0,1随机抽取2n 个数1x ,2x ,…,n x ,1y ,2y ,…,n y ,构成n 个数对()11,x y ,()22,x y ,…,(),n n x y ,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为(A )4n m (B )2n m (C )4m n (D )2m n【答案】C【解析】利用几何概型,圆形的面积和正方形的面积比为224S R mS R nπ==圆正方形,所以4m n π=.选C.5.【2016年高考北京】袋中装有偶数个球,其中红球、黑球各占一半.甲、乙、丙是三个空盒.每次从袋中任意取出两个球,将其中一个球放入甲盒,如果这个球是红球,就将另一个球放入乙盒,否则就放入丙盒.重复上述过程,直到袋中所有球都被放入盒中,则()A.乙盒中黑球不多于丙盒中黑球B.乙盒中红球与丙盒中黑球一样多C.乙盒中红球不多于丙盒中红球D.乙盒中黑球与丙盒中红球一样多 【答案】C6.【2016高考江苏卷】将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是 ▲ .【答案】5.6【解析】点数小于10的基本事件共有30种,所以所求概率为305.366= 7.【2016年高考四川】同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,则在2次试验中成功次数X 的均值是 .【答案】32【解析】同时抛掷两枚质地均匀的硬币,可能的结果有(正正),(正反),(反正),(反反),所以在1次试验中成功次数ξ的取值为0,1,2,其中111(0),(1),(2),424P P P ξξξ====== 在1次试验中成功的概率为113(1)424P ξ≥=+=, 所以在2次试验中成功次数X 的概率为12313(1)C 448P X ==⨯=,239(2)()416P X ===, 则393128162EX =⨯+⨯=.8.【2016高考新课标2】有三张卡片,分别写有1和2,1和3,2和3.甲,乙,丙三人各取走一张卡片,甲看了乙的卡片后说:“我与乙的卡片上相同的数字不是2”,乙看了丙的卡片后说:“我与丙的卡片上相同的数字不是1”,丙说:“我的卡片上的数字之和不是5”,则甲的卡片上的数字是 .【答案】1和3【解析】由题意分析可知甲的卡片上数字为1和3,乙的卡片上数字为2和3,丙卡片上数字为1和2. 9.【2016高考江苏卷】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________▲________. 【答案】0.1【解析】这组数据的平均数为1(4.7 4.8 5.1 5.4 5.5) 5.15++++=,2222221(4.7 5.1)(4.8 5.1)(5.1 5.1)(5.4 5.1)(5.5 5.1)0.15S ⎡⎤∴=-+-+-+-+-=⎣⎦.故答案应填:0.1, 10.【2016高考山东】在[1,1]-上随机地取一个数k ,则事件“直线y =kx 与圆22(5)9x y -+=相交”发生的概率为 .【答案】3411.【2016高考新课标1卷】(本小题满分12分)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X 表示2台机器三年内共需更换的易损零件数,n 表示购买2台机器的同时购买的易损零件数.(I )求X 的分布列;(II )若要求()0.5P X n ≤≥,确定n 的最小值;(III )以购买易损零件所需费用的期望值为决策依据,在19n =与20n =之中选其一,应选用哪个? 【答案】(I )见解析(II )19(III )19n =所以X 的分布列为(Ⅱ)由(Ⅰ)知44.0)18(=≤X P ,68.0)19(=≤X P ,故n 的最小值为19. (Ⅲ)记Y 表示2台机器在购买易损零件上所需的费用(单位:元).当19=n 时,08.0)500220019(2.0)50020019(68.020019⨯⨯+⨯+⨯+⨯+⨯⨯=EY404004.0)500320019(=⨯⨯+⨯+.当20=n 时,04.0)500220020(08.0)50020020(88.020020⨯⨯+⨯+⨯+⨯+⨯⨯=EY 4080=.可知当19=n 时所需费用的期望值小于20=n 时所需费用的期望值,故应选19=n .12.【2016高考新课标2】某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:设该险种一续保人一年内出险次数与相应概率如下:(Ⅰ)求一续保人本年度的保费高于基本保费的概率;(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率; (Ⅲ)求续保人本年度的平均保费与基本保费的比值. 【答案】(Ⅰ)0.55;(Ⅱ);(Ⅲ)1.23. 【解析】因此所求概率为3.11(Ⅲ)记续保人本年度的保费为X ,则X 的分布列为0.1020.051.23.a a a ⨯+⨯=因此续保人本年度的平均保费与基本保费的比值为1.23 13.【2016年高考四川】(本小题满分12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨)、一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(I)求直方图中a的值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(III)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.a ;(Ⅱ)36000;(Ⅲ)2.9.【答案】(Ⅰ)0.30【解析】14.【2016年高考北京】(本小题13分)A、B、C三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时);(1)试估计C 班的学生人数;(2)从A 班和C 班抽出的学生中,各随机选取一人,A 班选出的人记为甲,C 班选出的人记为乙,假设所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;(3)再从A 、B 、C 三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时),这3个新数据与表格中的数据构成的新样本的平均数记1μ ,表格中数据的平均数记为0μ ,试判断0μ和1μ的大小,(结论不要求证明)【答案】(1)40;(2)38;(3)10μμ<. 【解析】设事件E 为“该周甲的锻炼时间比乙的锻炼时间长”,由题意知,3323133222122111C A C A C A C A C A C A C A C A E = 45352515342414C A C A C A C A C A C A C A因此)()()()()()()()()(3323133222122111C A P C A P C A P C A P C A P C A P C A P C A P E P +++++++=8340115)()()()()()()(45352515342414=⨯=+++++++C A P C A P C A P C A P C A P C A P C A P (3)根据平均数计算公式即可知,01μμ<. 15.【2016高考山东】(本小题满分12分)甲、乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语,在一轮活动中,如果两人都猜对,则“星队”得3分;如果只有一个人猜对,则“星队”得1分;如果两人都没猜对,则“星队”得0分.已知甲每轮猜对的概率是34,乙每轮猜对的概率是23;每轮活动中甲、乙猜对与否互不影响,各轮结果亦互不影响.假设“星队”参加两轮活动,求:(I )“星队”至少猜对3个成语的概率;(Ⅱ)“星队”两轮得分之和为X 的分布列和数学期望EX . 【答案】(Ⅰ)23(Ⅱ)分布列见解析,236=EX 【解析】所以“星队”至少猜对3个成语的概率为23. (Ⅱ)由题意,随机变量X 的可能取值为0,1,2,3,4,6. 由事件的独立性与互斥性,得()1111104343144P X ==⨯⨯⨯=, ()31111211105124343434314472P X ⎛⎫==⨯⨯⨯⨯+⨯⨯⨯== ⎪⎝⎭,()31313112123112122524343434343434343144P X ==⨯⨯⨯+⨯⨯⨯+⨯⨯⨯+⨯⨯⨯=,()32111132134343434312P X ==⨯⨯⨯+⨯⨯⨯= ,()3231321260542=4343434314412P X ⎛⎫==⨯⨯⨯⨯+⨯⨯⨯= ⎪⎝⎭,()32321643434P X ==⨯⨯⨯=.可得随机变量X 的分布列为所以数学期望01234614472144121246EX =⨯+⨯+⨯+⨯+⨯+⨯=.16.【2016高考天津】(本小题满分13分)某小组共10人,利用假期参加义工活动,已知参加义工活动次数为1,2,3的人数分别为3,3,4,.现从这10人中随机选出2人作为该组代表参加座谈会.(I )设A 为事件“选出的2人参加义工活动次数之和为4”,求事件A 发生的概率;(II )设X 为选出的2人参加义工活动次数之差的绝对值,求随机变量X 的分布列和数学期望. 【答案】(Ⅰ)13(Ⅱ)详见解析所以,随机变量X 分布列为随机变量X 的数学期望()0121151515E X =⨯+⨯+⨯=. 17.【2016高考新课标3】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:719.32ii y==∑,7140.17i i i t y ==∑0.55=,7≈2.646.参考公式:相关系数()()niit t y y r --=∑ 回归方程y a b =+ 中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,a y bt =-.【答案】(Ⅰ)理由见解析;(Ⅱ)1.82亿吨. 【解析】(Ⅰ)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,89.232.9417.40))((717171=⨯-=-=--∑∑∑===i i i ii i i iy t yt y y t t,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(Ⅱ)由331.1732.9≈=y 及(Ⅰ)得103.02889.2)())((ˆ71271≈=---=∑∑==i ii i it ty y t tb , 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a, 所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y, 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.1.(2015·广东,4)袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为( )A .1 B.1121 C.1021 D.521【答案】C2.(2015·江苏,5)袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为________.【答案】56【解析】 这两只球颜色相同的概率为16,故两只球颜色不同的概率为1-16=56.3.(2015·陕西,11)设复数z =(x -1)+yi(x ,y ∈R ),若|z|≤1,则y≥x 的概率为( ) A.34+12π B.14-12π C.12-1π D.12+1π【答案】 B【解析】 由|z|≤1可得(x -1)2+y 2≤1,表示以(1,0)为圆心,半径为1的圆及其内部,满足y≥x 的部分为如图阴影所示,由几何概型概率公式可得所求概率为: P =14π×12-12×12π×12=π4-12π =14-12π. 4.(2015·新课标全国Ⅰ,4)投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为( )A .0.648B .0.432C .0.36D .0.312 【答案】 A【解析】 该同学通过测试的概率为p =0.6×0.6+C 12×0.4×0.62=0.648.5.(2015·湖南,7)在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C 为正态分布N(0,1)的密度曲线)的点的个数的估计值为()附:若X ~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.682 6, P(μ-2σ<X≤μ+2σ)=0.954 4.A .2 386B .2 718C .3 413D .4 772 【答案】C6.(2015·山东,8)已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=68.26%,P(μ-2σ<ξ<μ+2σ)=95.44%.)A .4.56%B .13.59%C .27.18%D .31.74% 【答案】 B【解析】 由题意,知P(3<ξ<6)=P (-6<ξ<6)-P (-3<ξ<3)2=95.44%-68.26%2=13.59%.7.(2015·安徽,17)已知2件次品和3件正品混放在一起,现需要通过检测将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结果.(1)求第一次检测出的是次品且第二次检测出的是正品的概率;(2)已知每检测一件产品需要费用100元,设X 表示直到检测出2件次品或者检测出3件正品时所需要的检测费用(单位:元),求X 的分布列和均值(数学期望).8.(2015·福建,16)某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定.小王到该银行取钱时,发现自己忘记了银行卡的密码,但可以确认该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定.(1)求当天小王的该银行卡被锁定的概率;(2)设当天小王用该银行卡尝试密码的次数为X ,求X 的分布列和数学期望. 【解析】 (1)设“当天小王的该银行卡被锁定”的事件为A , 则P(A)=56×45×34=12.(2)依题意得,X 所有可能的取值是1,2,3. 又P(X =1)=16,P(X =2)=56×15=16,P(X =3)=56×45×1=23.所以X 的分布列为所以E(X)=1×16+2×16+3×23=52.9.(2015·重庆,17)端午节吃粽子是我国的传统习俗.设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同,从中任意选取3个.(1)求三种粽子各取到1个的概率;(2)设X 表示取到的豆沙粽个数,求X 的分布列与数学期望.10.(2015·天津,16)为推动乒乓球运动的发展,某乒乓球比赛允许不同协会的运动员组队参加.现有来自甲协会的运动员3名,其中种子选手2名;乙协会的运动员5名,其中种子选手3名.从这8名运动员中随机选择4人参加比赛.(1)设A 为事件“选出的4人中恰有2 名种子选手,且这2名种子选手来自同一个协会”,求事件A 发生的概率;(2)设X 为选出的4人中种子选手的人数,求随机变量X 的分布列和数学期望.11.(2015·山东,19)若n 是一个三位正整数,且n 的个位数字大于十位数字,十位数字大于百位数字,则称n 为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10整除,得-1分;若能被10整除,得1分.(1)写出所有个位数字是5的“三位递增数”;(2)若甲参加活动,求甲得分X 的分布列和数学期望E(X).【解析】 (1)个位数是5的“三位递增数”有125,135,145,235,245,345; (2)由题意知,全部“三位递增数”的个数为C 39=84, 随机变量X 的取值为:0,-1,1,因此 P(X =0)=C 38C 39=23,P(X =-1)=C 24C 39=114,P(X =1)=1-114-23=1142,所以X 的分布列为则E(X)=0×23+(-1)×114+1×1142=421.12.(2015·湖南,18)某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖,每次抽奖都是从装有4个红球、6个白球的甲箱和装有5个红球、5个白球的乙箱中,各随机摸出1个球,在摸出的2个球中,若都是红球,则获一等奖;若只有1个红球,则获二等奖;若没有红球,则不获奖.(1)求顾客抽奖1次能获奖的概率;(2)若某顾客有3次抽奖机会,记该顾客在3次抽奖中获一等奖的次数为X ,求X 的分布列和数学期望.(2)顾客抽奖3次可视为3次独立重复试验,由(1)知,顾客抽奖1次获一等奖的概率为15,所以X ~B ⎝ ⎛⎭⎪⎫3,15.于是P(X =0)=C 03⎝ ⎛⎭⎪⎫150⎝ ⎛⎭⎪⎫453=64125, P(X =1)=C 13⎝ ⎛⎭⎪⎫151⎝ ⎛⎭⎪⎫452=48125,P(X =2)=C 23⎝ ⎛⎭⎪⎫152⎝ ⎛⎭⎪⎫451=12125, P(X =3)=C 33⎝ ⎛⎭⎪⎫153⎝ ⎛⎭⎪⎫450=1125. 故X 的分布列为X 的数学期望为E(X)=3×15=35.。
纵观2012到2016年全国的高考试题从命题来看都会涉及到概率与统计的相关题目,分值也占据17分左右。
从题目的类型来看,以实际应用为主要出发点。
就考查内容而言, 以小题形式出现的是用概率定义或基本事件求事件概率;以大题形式出现的是统计与概率问题综合,列分布列、求期望方差等等。
考查学生对概念和应用基础性的认识,总体上概率与统计部分的考查基本上集中在以下几个热点问题上: 热点一、求随机事件的概率事件概率的计算,主要是古典概型问题和几何概型,当所求事件情况较复杂时,一般要分类计算,这就要用到互斥事件的概率加法公式或考虑其对立事件.例如以下问题: 1.【2016高考新课标3】小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是错误!未找到引用源。
中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( )A.错误!未找到引用源。
B.错误!未找到引用源。
C.错误!未找到引用源。
D.错误!未找到引用源。
【答案】C【考点】古典概型.【名师点睛】对古典概型必须明确判断两点:①对于每个随机试验来说,所有可能出现的试验结果数错误!未找到引用源。
必须是有限个;②出现的各个不同的试验结果数m 其可能性大小必须是相同的.只有在同时满足①、②的条件下,运用的古典概型计算公式错误!未找到引用源。
得出的结果才是正确的.2.【2014·新课标全国Ⅰ】4位同学各自在周六、周日两天中任选一天参加公益活动,则周六、周日都有同学参加公益活动的概率为( )A.18B.58C.38D.78 【答案】D【解析】由题意知,4位同学各自在周六、周日两天中任选一天参加公益活动有24种情况,而4位同学都选周六有1种情况,4位同学都选周日也有1种情况,故周六、周日都有同学参加公益活动的概率为P =24-1-124=1416=78. 【考点】1、排列和组合;2、古典概型的概率计算公式.【名师点睛】本题主要考查古典概型、排列的应用,以及考查逻辑思维能力、运算求解能力、实际应用能力.求古典概型的概率只要求出基本事件总和与满足条件的基本事件数,则问题易解决.较为复杂的概率问题常常转化为几个互斥事件的和,或采用间接法,通过其对立事件的概率来求解。
专题18 统计与统计案例【命题热点突破一】抽样方法某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x ,某件产品A 被抽到的概率为y ,则x ,y 的值分别为( )A .25,14B .20,16C .25,1600D .25,16【答案】D【解析】抽取比例为100600=16,故x =150×16=25,每个个体被抽到的概率均为100600=16.【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.【变式探究】从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.【答案】74【解析】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74. 【命题热点突破二】用样本估计总体【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )(A )56(B )60(C )120(D )140【答案】D【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有200(0.160.080.04) 2.5140⨯++⨯=(人),选D.【变式探究】(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图183所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( )图183A .91,91.5B .91,92C .91.5,91.5D .91.5,92(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.【答案】(1)C (2)6912【解析】(1)中位数为91+922=91.5,平均数为90+-2-3+1+7+4+2+0+38=91.5.(2)根据样本估计总体的思想,可知该地区群众对“键盘侠”持反对态度的概率约为3650,所以该地区9600人中对“键盘侠”持反对态度的大约有9600×3650=6912(人).【特别提醒】 统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.【变式探究】(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图184所示,则原始的茎叶图可能是( )图184图185(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图186所示,数据分组依次如下:[70,90),[90,110),[110,130),[130,150]. 估计该班数学成绩的平均分数为( )图186 A .112 B .114 C .116D.120【答案】(1)B (2)B【命题热点突破三】统计案例例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).(1)应收集多少名女生的样本数据?(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图187所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)解:(1)300×450015 000=90,所以应收集90名女生的样本数据.(2)由频率分布直方图得每周平均参加体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均参加体育运动时间超过4小时的概率约为0.75.(3)由(2)知,300名学生中有300×0.75=225(名)学生每周平均参加体育运动的时间超过4小时,其余75名学生每周平均参加体育运动的时间不超过4小时.又因为抽取的300名学生中有210名男生、90名女生,所以每周平均参加体育运动时间与性别的列联表如下:结合列联表可得K 2的观测值k =300×(165×30-45×60)75×225×210×90=10021≈4.762>3.841.所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.【特别提醒】 在计算K 2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.【变式探究】为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y 之间的关系.(1)求小李这5天的平均投篮命中率;(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率. 解:(1)小李这5天的平均投篮命中率y -= 0.4+0.5+0.6+0.6+0.45=0.5.(2)易知x -=1+2+3+4+55=3,设线性回归方程为y ^=b ^x +a ^,则由公式可得b ^== (-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)(-2)2+(-1)2+02+12+22=0.01, 所以a ^=y --b ^x -=0.5-0.01×3=0.47, 所以y ^=b ^x +a ^=0.01x +0.47.当x =6时,y ^=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.【特别提醒】 回归直线一定过样本点的中心(x ,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.【高考真题解读】1.【2016年高考四川】(本小题满分12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨)、一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(I )求直方图中a 的值;(II )设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (III )若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由. 【答案】(Ⅰ)0.30a ;(Ⅱ)36000;(Ⅲ)2.9. 【解析】(Ⅰ)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1, 解得a=0.30.2.【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()(A)56 (B)60 (C)120 (D)140【答案】D【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有⨯++⨯=(人),选D.200(0.160.080.04) 2.51401.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A .167B .137C .123D .93解析 由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选B. 答案 B2.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32答案 C3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( )0 1 2 28 9 2 5 80 0 0 3 3 8 1 2A .19B .20C .21.5D .23解析从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,选B.答案 B4.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D5.(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y∧=b∧x+a∧,其中b∧=0.76,a∧=y-b∧x.据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元B.11.8万元C.12.0万元D.12.2万元解析 回归直线一定过样本点中心(10,8),∵b ∧=0.76,∴a ∧=0.4,由y ∧=0.76x +0.4得当x =15万元时,y ∧=11.8万元.故选B.答案 B6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析 由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取的志愿者有200.40=50人.所以第三组共有50×0.36=18人,其中有疗效的人数为18-6=12. 答案 C7.(2014·陕西,9)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a(a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a ,4B .1+a ,4+aC .1,4D .1,4+a解析 ∵x 1,x 2,…,x 10的均值x =1,方差s 21=4,且y i =x i +a(i =1,2,…,10),∴y 1,y 2,…,y 10的均值y =110(y 1+y 2+…+y 10)=110(x 1+x 2+…+x 10+10a)=110(x 1+x 2+…+x 10)+a =x +a =1+a ,其方差s 22=110[(y 1-y )2+(y 2-y )2+…+(y 10-y )2]=110[(x 1-1)2+(x 2-1)2+…+(x 10-1)2]=s 21=4.故选A. 答案 A8.(2014·湖南,2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3解析因为采取简单随机抽样、系统抽样和分层抽取样本时,总体中每个个体被抽中的概率相等,故选D.答案 D9.(2014·广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20 B.100,20 C.200,10 D.100,10解析由题图可知,样本容量等于(3 500+4 500+2 000)×2%=200;抽取的高中生近视人数为2 000×2%×50%=20,故选A.答案 A10.(2014·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析420×300=60(名).答案6011.(2015·江苏,2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.解析这组数据的平均数为16(4+6+5+8+7+6)=6.答案 612.(2015·湖南,12)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:1 31 41 5 0 0 3 4 5 6 6 8 8 91 1 12 2 23 34 45 5 56 678 0 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.13.(2015·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解 (1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020, P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
2017高考统计数学真题2017年全国普通高等学校招生统一考试数学科目(理工类)于6月7日上午拉开序幕,本次考试中涉及到统计数学部分的内容。
“2017高考统计数学真题”就是考生们紧张备考的重点之一,而这一部分的真题难度如何、考查的知识点有哪些,我们一起来看看。
一、题目分析2017年高考统计数学部分的真题主要涵盖了描述统计、概率论等内容。
考试形式分为选择题和计算题两部分,难度适中,题目设计偏注重基本概念和基本计算能力的考查。
二、难度评析整体来看,2017年高考统计数学部分的难度适中,考查的内容也主要围绕基本概念和基本计算展开。
选择题方面,涉及到了频数分布、概率计算、抽样调查等知识点,需要考生对概念的理解和计算能力的掌握。
计算题方面,主要考查了样本均值、方差、相关系数等内容,对考生的基本运算能力和应用能力有一定要求。
三、知识点总结根据2017年高考统计数学真题的题目内容,我们可以总结出以下几个重点知识点:1. 频数分布:了解如何通过频数表和分布函数来描述各类别数据的分布情况。
2. 概率计算:掌握基本概率的计算方法,包括排列组合、条件概率、贝叶斯定理等内容。
3. 抽样调查:了解不同抽样方法的特点和应用场景,能够正确选择适当的抽样方式。
4. 样本均值与方差:掌握样本均值与方差的计算方法,了解其在抽样调查中的应用。
5. 相关系数:理解相关系数的定义和计算方法,能够分析两个变量之间的相关关系。
四、备考建议针对2017年高考统计数学真题的考查内容,我们给考生们提出以下备考建议:1. 夯实基础:统计数学是基础数学中的一部分,需要考生具备扎实的基础知识。
建议考生从基本概念入手,逐步扩展应用能力。
2. 做好练习:练习是提高解题能力的有效方法,考生应多做相关练习题,加强对知识点的掌握和运用能力。
3. 注重理解:统计数学有许多概念和方法需要考生理解透彻,而不只是死记硬背。
建议考生多思考、多讨论,加深对知识点的理解。
4. 总结经验:做题时要及时总结经验,对错误的题目进行及时归纳和总结,发现问题并加以解决。
概率与统计是高考必考重点内容之一,高考考查的主要内容有:抽样方法、统计图表,统计数据的数字特征,变量间的关系,随机事件的概率、古典概型、几何概型,以及回归分析与独立性检验,条件概率、正态分布、互斥事件、对立事件、相互独立事件的概率以及独立重复试验和离散型随机变量的分布列与期望。
通过研究近几年全国高考试卷,不难发现新课标对概率与统计模块的考查强调知识的综合性,更注重在知识交汇处命题.试卷具体现出“一小一大”,即一道小题,一道大题,占17分,小题通常出现在客观题中单独考查,大题在解答题中与其它知识综合考查,难度不大.试题背景与日常生活贴近,联系也最为紧密,体现应用的观念与意识,考查学生处理数据的能力,对概率事件的识别及概率的计算能力,以及考查学生的阅读与理解能力、分析问题与解决问题的能力.试题朝着“重基础、重能力、探究与创新”的方向发展.【考纲解读】一、考点及要求说明: A.了解 B.理解 C.掌握二、考点说明1.统计(1)随机抽样①理解随机抽样的必要性和重要性。
②会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。
(2)用样本估计总体①了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。
②理解样本数据标准差的意义和作用,会计算数据标准差。
③能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释。
④会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。
⑤会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
(3)变量的相关性①会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。
②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
2.概率(1)事件与概率①了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别。
高三单元滚动检测卷·数学考生注意:1.本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,共4页。
2.答卷前,考生务必用蓝、黑色字迹的钢笔或圆珠笔将自己的姓名、班级、学号填写在相应位置上。
3.本次考试时间120分钟,满分150分。
单元检测十统计与统计案例第Ⅰ卷一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为()A.13 B.19 C.20 D.512.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()A。
错误!B.nC.[错误!]D.[错误!]+13.已知一组数据:a1,a2,a3,a4,a5,a6,a7构成公差为d的等差数列,且这组数据的方差等于1,则公差d等于()A.±错误!B.±错误!C.±错误!D.无法求解4.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如下列联表:班级与成绩列联表则随机变量χ2A.0.600 B.0.828C.2。
712 D.6。
0045.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为()分54321数人2010303010数A. 3 B.3 C。
错误! D.错误!6。
如图是一次选秀节目上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a2+b2的最小值是( )A.24 B.32C.36 D.487.(2014·重庆)已知变量x与y正相关,且由观测数据算得样本平均数错误!=3,错误!=3.5,则由该观测数据算得的线性回归方程可能是()A.y=0.4x+2。
第3讲统计与统计案例抽样方法自主练透夯实双基抽样方法主要有简单随机抽样、系统抽样和分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.[题组通关]1.某县老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()A.90C.180 D.300C[解析] 设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201 600,故x=180.2.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.[解析] 设第1组抽出的号码为x,则第16组应抽出的号码是8×15+x=126,所以x=6.[答案] 63.利用随机数表法对一个容量为500,编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开始由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),根据下表,读出的第3个数是________.18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71[解析] 最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.[答案] 114解决抽样问题的方法(1)解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.(2)在系统抽样的过程中,要注意分段间隔,需要抽取n 个个体,样本就需要分成n 个组,则分段间隔即为Nn (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.用样本估计总体 高频考点 多维探明1.统计中的四个数字特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即 x =1n (x 1+x 2+…+x n ).(4)方差与标准差方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 2.直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.用统计图表估计总体(2016·福建毕业班质量检测)随着移动互联网的发展,与餐饮美食相关的手机APP软件层出不穷.现从使用A 和B 两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如图.(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数;(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?②如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?说明理由.【解】(1)依题意可得,使用A款订餐软件的50个商家的“平均送达时间”的众数为55分钟.使用A款订餐软件的50个商家的“平均送达时间”的平均数为:15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40(分钟).(2)①使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.②使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40.所以选B款订餐软件.用样本的数字特征估计总体特征(2016·石家庄第一次模拟)为比较甲、乙两地某月11时的气温情况,随机选取该月中的5天,将这5天中11时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论:①甲地该月11时的平均气温低于乙地该月11时的平均气温②甲地该月11时的平均气温高于乙地该月11时的平均气温③甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差④甲地该月11时的气温的标准差大于乙地该月11时的气温的标准差其中根据茎叶图能得到的正确结论的编号为()A.①③B.①④C.②③D.②④【解析】 由茎叶图和平均数公式可得甲、乙两地的平均数分别是30,29,则甲地该月11时的平均气温高于乙地该月11时的平均气温,①错误,②正确,排除A 和B ;又甲、乙两地该月11时的标准差分别是s 甲=4+1+1+45=2,s 乙=9+1+4+45=3105,则甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差,③正确,④错误,故选项C 正确.【答案】C(1)关于平均数、方差的计算样本数据的平均数与方差的计算关键在于准确记忆公式,要特别注意区分方差与标准差,不能混淆,标准差是方差的算术平方根.(2)求解频率分布直方图中相关数据的两个注意点一是小长方形的面积表示频率,其纵轴是频率组距,而不是频率.二是各组数据频率之比等于对应小长方形的高度之比. [题组通关]1.(2016·广州六校教育教学联合体测试)为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75C [解析] 设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60.2.(2016·福州模拟)为了丰富学生的课余生活,某校举办了“你来比划,我来猜”的猜成语活动,若甲、乙两个班级各10个小组参加了此项活动,对其猜对成语的个数进行统计,得到如茎叶图所示的两组数据,对这两个班级10个小组猜对成语的个数的平均数x 甲,x 乙和中位数y 甲,y 乙进行比较,正确的结论是( )A .x 甲>x 乙,y 甲>y 乙B .x 甲<x 乙,y 甲>y 乙C .x 甲>x 乙,y 甲<y 乙D .x 甲<x 乙,y 甲<y 乙D [解析] 由茎叶图得x 甲=19+20+21+23+25+29+32+33+37+4110=28,x 乙=10+26+30+30+34+37+44+46+46+4710=35,y 甲=25+292=27,y 乙=34+372=35.5,所以x 甲<x 乙,y 甲<y 乙,故选D.统计案例 高频考点 多维探明1.线性回归方程方程y ^=b ^x +a ^称为线性回归方程,其中,a ^=y -b ^x ,(x ,y )称为样本点的中心.2.随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .线性回归分析(2016·高考全国卷丙)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:参考公式:相关系数回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:【解】(1)由折线图中数据和附注中参考数据得r =2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得a ^=y -b ^t =1.331-0.103×4≈0.92. 所以,y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.独立性检验(2016·沈阳教学质量检测)为考察某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有实验动物中任取一只,取到“注射疫苗”动物的概率为25.(1)求2×2列联表中的数据x ,y ,A ,B 的值; (2)绘制发病率的条形统计图,并判断疫苗是否有效?(3)能够有多大把握认为疫苗有效?附:K 2=n (ad -bc )2(a +b )(a +c )(c +d )(b +d ),n =a +b +c +d【解】 (1)为事件M , 由已知得P (M )=y +30100=25,所以y =10,B =40,x =40,A =60.(2)未注射疫苗发病率为4060=23,注射疫苗发病率为1040=14.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.(3)K 2=100×(20×10-30×40)250×50×40×60=1 000 00050×20×60=503≈16.67>10.828.所以至少有99.9%的把握认为疫苗有效.解决统计案例应注意的问题(1)求回归直线方程问题的关键有两点:一是把相关数据代入公式准确计算;二是抓住样本中心点(x ,y )必在回归直线上的特性.(2)求解独立性检验问题时要注意:一是2×2列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到K 2之后的结论.[跟踪训练]某城市随机抽取一年内100天的空气质量指数(AQI)的监测数据,结果统计如下:⎩⎪⎨⎪⎧0,0≤x ≤1004x -400,100<x ≤3002 000,x >300,若在本年内随机抽取一天,试估计这一天的经济损失超过400元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为严重污染.根据提供的统计数据,完成下面的2×2列联表,并判断是否有95%的把握认为“该城市本年的空气严重污染与供暖有关”?附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )[解] (1)A . 由y >400,得x >200.由统计数据可知,空气质量指数大于200的频数为35, 所以P (A )=35100=720.(2)根据题设中的数据得到如下2×2列联表:将2×2K 2=100×(22×7-63×8)230×70×85×15≈4.575.因为4.575>3.841,所以有95%的把握认为“该城市本年的空气严重污染与供暖有关”.课时作业1.(2016·长沙四校联考)高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为( )A .13B .17C .19D .21C [解析] 因为47-33=14,所以由系统抽样的定义可知样本中的另一个学生的编号为5+14=19.2.为了判定两个分类变量X 和Y 是否有关系,应用K 2独立性检验法算得K 2的观测值为5,又已知P (K 2≥3.841)=0.05,P (K 2≥6.635)=0.01,则下列说法正确的是( )A .有95%的把握认为“X 和Y 有关系”B .有95%的把握认为“X 和Y 没有关系”C .有99%的把握认为“X 和Y 有关系”D .有99%的把握认为“X 和Y 没有关系”A [解析] 依题意,K 2=5,且P (K 2≥3.841)=0.05,因此有95%的把握认为“X 和Y 有关系”,选A.3.(2016·江西百校联盟模拟)已知对某超市某月(30天)每天顾客使用信用卡的人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .44,45,56B .44,43,57C .44,43,56D .45,43,57B [解析] 由茎叶图可知全部数据为10,11,20,21,22,24,31,33,35,35,37,38,43,43,43,45,46,47,48,49,50,51,52,52,55,56,58,62,66,67,中位数为43+452=44,众数为43,极差为67-10=57.选B.4.某中学高中部有300名学生.为了研究学生的周平均学习时间,从中抽取60名学生,先统计了他们某学期的周平均学习时间(单位:小时),再将学生的周平均学习时间分成5组:[40,50),[50,60),[60,70),[70,80),[80,90],并加以统计,得到如图所示的频率分布直方图.则高中部学生的周平均学习时间为(同一组中的数据用该组区间的中点值作代表)( )A .63.5小时B .62.5小时C .63小时D .60小时A [解析] 在高中部抽取的60名学生中,周平均学习时间分别落在[40,50),[50,60),[60,70),[70,80),[80,90]的人数依次为6,15,24,12,3.所以高中部学生的周平均学习时间为(6×45+15×55+24×65+12×75+3×85)÷60=63.5(小时).故选A.5.(2016·武汉市武昌区调研)在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C 为正态分布N (-1,1)的密度曲线)的点的个数的估计值为( )A .1 193B .1 359C .2 718D .3 413附:若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)=0.682 6,P (μ-2σ<X ≤μ+2σ)=0.954 4 B [解析] 由题意知μ=-1,σ=1,因为P (0<x ≤1)=12[P (-1-2<X ≤-1+2)-P (-1-1<X ≤-1+1)]=12×(0.954 4-0.682 6)=0.135 9,所以落入阴影部分的个数为0.1359×10 000=1 359,故选B.6.对于下列表格所示的五个散点,已知求得的线性回归方程为y ^=0.8x -155.则实数m 的值为(A .8 B .8.2 C .8.4D .8.5 A [解析] 依题意得x =15×(196+197+200+203+204)=200,y =15×(1+3+6+7+m )=17+m 5,回归直线必经过样本点的中心,于是有17+m5=0.8×200-155,由此解得m=8.故选A.7.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.[解析] 设抽取的男生人数为x ,男生有500人,根据分层抽样的特点,知45900=x500,所以x =25.[答案] 258.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数相同,则图中的m +n =________.[解析] 根据茎叶图,得乙的中位数是33,所以甲的中位数也是33,即m =3;甲的平均数x 甲=13×(27+39+33)=33,乙的平均数是x 乙=14×(20+n +32+34+38)=33,所以n=8,所以m +n =11.[答案] 119.某调查机构调查了某地100个新生婴儿的体重,并根据所得数据画出了样本的频率分布直方图(如图所示),则新生婴儿的体重(单位:kg)在[3.2,4.0)的人数是________.[解析] 频率分布直方图反映样本的频率分布,每个小矩形的面积等于样本数据落在相应区间上的频率,故新生婴儿的体重在[3.2,4.0)的人数为100×(0.4×0.625+0.4×0.375)=40.[答案] 4010.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,得到结果如下:则销量每增加1千箱,单位成本约下降________元(结果保留5位有效数字). 附:回归直线的斜率和截距的最小二乘法公式分别为:[解析] 由题意知b ^=1 481-6×72×7179-6×⎝⎛⎭⎫722≈-1.818 2,a ^=71-(-1.818 2)×72≈77.36,所以y ^=-1.818 2x +77.36,所以销量每增加1千箱,则单位成本约下降1.818 2元.[答案] 1.818 211.(2016·河北省“五校联盟”质量检测)为了调查某高中学生每天的睡眠时间,现随机对20名男生和20名女生进行问卷调查,结果如下:(1)生中随机抽取3人,求此3人中恰有一人为“严重睡眠不足”的概率;(2)完成下面2×2列联表,并回答是否有90%的把握认为“睡眠时间与性别有关”?⎝ ⎛⎭⎪⎫K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d [解] (1)设从睡眠时间不足6小时的女生中抽出3人,其中恰有一人为“严重睡眠不足”为事件A .所以P (A )=C 12·C 24C 36=1220=35. (2)列联表如下:K 2=40×(12×6-14×8)20×20×26×14=4091≈0.440<2.706,所以没有90%的把握认为“睡眠时间与性别有关”. 12.(2016·开封市第一次模拟)甲、乙两人参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次.画出茎叶图如图所示,乙的成绩中有一个数的个位数字模糊,在茎叶图中用c 表示.(把频率当作概率)(1)假设c =5,现要从甲、乙两人中选派一人参加数学竞赛,从统计学的角度,你认为派哪位学生参加比较合适?(2)假设数字c 的取值是随机的,求乙的平均分高于甲的平均分的概率. [解] (1)若c =5,则派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2乙=18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.因为x 甲=x 乙,s 2甲<s 2乙,所以两人的平均成绩相等,但甲的成绩比较稳定,派甲参加比较合适. (2)若x 乙>x 甲,则18(75+80×4+90×3+3+5+2+c )>85,所以c >5,所以c =6,7,8,9,又c 的所有可能取值为0,1,2,3,4,5,6,7,8,9, 所以乙的平均分高于甲的平均分的概率为25.13.(2016·武汉调研)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,测得的数据如下:(1)如果y (2)根据(1)所求回归直线方程,预测此车间加工这种零件70个时,所需要的加工时间.附:所以回归直线方程为y ^=0.67x +54.9.(2)由(1)所求回归直线方程可知,在x =70时, y ^=0.67×70+54.9=101.8(分钟).所以预测此车间加工这种零件70个时,所需要的加工时间为101.8分钟.14.(2016·石家庄市第一次模考)某篮球队对篮球运动员的篮球技能进行统计研究,针对篮球运动员在投篮命中时,运动员到篮筐中心的水平距离这项指标,对某运动员进行了若干场次的统计,依据统计结果绘制如下频率分布直方图:(1)依据频率分布直方图估算该运动员投篮命中时,他到篮筐中心的水平距离的中位数; (2)在某场比赛中,考察他前4次投篮命中时到篮筐中心的水平距离的情况,并且规定:运动员投篮命中时,他到篮筐中心的水平距离不少于4米的记1分,否则扣掉1分.用随机变量X 表示第4次投篮后的总分,将频率视为概率,求X 的分布列和数学期望.[解] (1)设该运动员到篮筐中心的水平距离的中位数为x , 因为0.20×1=0.20<0.5,且(0.40+0.20)×1=0.6>0.5, 所以x ∈(4,5).由0.40×(5-x )+0.20×1=0.5,解得x =4.25,所以该运动员到篮筐中心的水平距离的中位数是4.25米.(2)由频率分布直方图可知投篮命中时到篮筐中心距离超过4米的概率为P =35,随机变量X 的所有可能取值为-4,-2,0,2,4. P (X =-4)=⎝⎛⎭⎫254=16625, P (X =-2)=C 14⎝⎛⎭⎫253⎝⎛⎭⎫351=96625,P (X =0)=C 24⎝⎛⎭⎫252⎝⎛⎭⎫352=216625, P (X =2)=C 34⎝⎛⎭⎫251⎝⎛⎭⎫353=216625, P (X =4)=⎝⎛⎭⎫354=81625, X 的分布列为E (X )=(-4)×16625+(-2)×96625+0×216625+2×216625+4×81625=45.。
专题18 统计与统计案例1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人.现采取分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )A.15,5,25 B.15,15,15C.10,5,30 D.15,10,20解析:先确定抽样比为45900=120,则依次抽取的人数分别为120×300=15,120×200=10和120×400=20.故选D.答案:D2.某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是( )A.125 B.5 5C.45 D.3 5解析:由茎叶图知平均值为114+126+128+1324=125,∴s2=14[(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.答案:C3.为了判定两个分类变量X和Y是否有关系,应用K2独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是( )A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”解析:依题意,K2=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”,选A.答案:A4.为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:根据上表提供的数据,求得y关于x的线性回归方程为y=0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )A.67 B.68C.68.3 D.71解析:设表中模糊看不清的数据为m .因为x =10+20+30+40+505=30,又样本中心(x ,y )在回归直线y ^=0.67x +54.9上,所以y =m +3075=0.67×30+54.9,得m =68,故选B.答案:B5.采用系统抽样方法从1 000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A ,编号落入区间[401,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷C 的人数为( ) A .12 B .13 C .14D .156.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的直方图如图所示,假设得分的中位数为m e ,众数为m 0,平均数为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x 【答案】D【解析】 由图知m 0=5.将30名学生的得分从大到小排列,第15个数是5,第16个数是6,所以m e =5.5. 又x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230>5.9,所以m 0<m e <x.7.给出下列四个命题:①质检员每隔10分钟从匀速传递的产品生产流水线上抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②将一组数据中的每个数据都加上同一个常数后,方差不变;③设随机变量ξ服从正态分布N(0,1),若P(ξ≥1)=p ,则P(-1<ξ<0)=12-p ;④在回归直线方程y ^=0.1x +10中,当x 每增加1个单位时,y ^平均增加0.1个单位. 其中真命题的个数是( ) A .1 B .2 C .3 D .4 【答案】C【解析】 ①中的抽样方法是系统抽样,所以①不正确;根据方差的含义,②正确;③中P(ξ≥1)=p ,则P(ξ≤-1)=p ,所以P(-1<ξ<0)=12(1-2p)=12-p ,故③正确;由于x 的系数为0.1,因此x 每增加一个单位,y ^平均增加0.1个单位,故④正确.所以真命题的个数是3.8.已知总体中各个个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a ,b 的取值分别是( ) A .10,11 B .10.5,10.5 C .10,10 D .10,12 【答案】B9.某种产品的广告支出x 与销售额y(单位:万元)之间有如下对应数据:根据上表可得回归直线方程y ^=b ^x +a ^中的b ^为6.5.若要使销售额不低于100万元,则至少需要投入广告费为(x 为整数)( ) A .10万元 B .11万元 C .12万元 D .13万元【答案】D 【解析】 因为x =5,y =50,所以50=6.5×5+a ^,解得a ^=17.5,所以回归直线方程为y ^=6.5x +17.5.由6.5x +17.5≥100,解得x≥16513,因为x 为整数,所以至少需要投入广告费为13万元.10.从气象意义上来说春季进入夏季的标志为:连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数): ①甲地:5个数据的中位数为24,众数为22; ②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.4. 则肯定进入夏季的地区为( ) A .甲、乙、丙 B .甲、丙 C .乙、丙 D .甲 【答案】B11.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程为y ^=b ^x +a ^,根据中间两组数据(4,3)和(5,4)求得的直线方程为y =bx +a ,则b ^________b ,a ^________a .(填“>”或“<”)【答案】< > 【解析】 方法一:画出散点图,粗略估计回归直线的位置,再画出过点(4,3),(5,4)的直线,如图所示.由图易知b ^<b ,a ^>a.方法二:由公式可得b ^=0.7,a ^=0.35.由题意可得b =1,a =-1,所以b ^<b ,a ^>a.12.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1000户.从普通家庭中用简单随机抽样的方法抽取990户,从高收入家庭中用简单随机抽样的方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,请估计该地拥有3套或3套以上住房的家庭所占的比例是________. 【答案】5.7%【解析】 该地拥有3套或3套以上住房的家庭估计有99 000×50990+1000×70100=5700(户),所以所占比例约为5700100 000=5.7%.13.一个容量为20的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8且前4项和S 4=28,则此样本数据的平均数和中位数分别是________. 【答案】23,23【解析】 设公差为d ,则a 1+2d =8,4a 1+6d =28,解得a 1=4,d =2,所以此样本数据的中位数是a 10+a 112=a 1+192d =4+19=23,平均数是S 2020=a 1+192d =23.14.某校在一次期末考试中,全校学生的数学成绩都介于60分到140分之间(满分150分),为了估计该校学生的数学考试情况,从该校2000名学生的数学成绩中随机抽取50名学生的数学成绩,将统计结果按如下方式分成八组:第一组[60,70),第二组[70,80),……,第八组[130,140].该图是按照上述分组得到的频率分布直方图的一部分.(1)求第七组的频率,并将频率分布直方图补充完整;(2)估计该校2000名学生这次考试的数学成绩的平均分(同一组数据使用中间值作代表); (3)估计该校在这次考试中数学成绩在[100,140]的人数.解:(1)由频率分布直方图知第七组的频率为1-(0.004+0.012+0.016+0.03+0.02+0.006+0.004)×10=0.08.完整的频率分布直方图如下图所示.(2)该校2000名学生这次考试的数学成绩的平均分数为65×0.04+75×0.12+85×0.16+95×0.3+105×0.2+115×0.06+125×0.08+135×0.04=97.(3)数学成绩在[100,140]内的频率是(0.02+0.006+0.008+0.004)×10=0.38,所以该校这次考试中数学成绩在[100,140]内的人数约为2000×0.38=760.15.从某大学随机选取7名女大学生,其身高x(单位:cm)和体重y(单位:kg)的有关数据如下表:(1)求出回归方程;(2)利用(1)中的回归方程,分析这7名女大学生的身高和体重的变化,并预测一名身高为172 cm的女大学生的体重.(2)b ^=0.75>0说明身高x 每增加1个单位,体重y 就增加0.75个单位,这表明体重与身高具有正的线性相关关系.对于身高为172 cm 的女大学生,由回归方程可以预测其体重为0.75×172-70.5=58.5(kg). 16.在一次数学测验后,班级学委对选答题的选题情况进行统计,如下表:(1)在统计结果中,如果把几何证明选讲和极坐标与参数方程称为“几何类”,把不等式选讲称为“代数类”,我们可以得到如下2×2列联表.能否认为选做“几何类”或“代数类”与性别有关,若有关,你有多大的把握?(2)在原始统计结果中,如果不考虑性别因素,按分层抽样的方法从选做不同选答题的同学中随机选出7名同学进行座谈.已知这名学委和2名数学课代表都在选做“不等式选讲”的同学中. ①求在这名学委被选中的条件下,2名数学课代表也被选中的概率; ②记抽取到数学课代表的人数为X ,求X 的分布列及数学期望E(X). 下面临界值表仅供参考:②由题意知X 的可能取值为0,1,2. 依题意P(X =0)=C 316C 318=3551;P(X =1)=C 216C 12C 318=517;P(X =2)=C 116C 22C 18=151.从而X 的分布列为所以E(X)=0×3551+1×517+2×151=13.17.某市积极倡导学生参与绿色环保活动,其中代号为“环保卫士——12369”的绿色环保活动小组对2014年全年的空气污染指数API 进行监测,下表是在这一年内随机抽取的100天的统计结果.(1)若该市某企业每天由空气污染造成的经济损失P (单位:元)与空气污染指数API (记为t )的关系为P =⎩⎪⎨⎪⎧0,0≤t≤100,4t -400,100<t≤300,1500,t>300,在这一年内随机抽取一天,估计该天经济损失P 在区间(200,600]内的概率;(2)若本次抽取的样本数据有30天是在供暖季节,其中有8天为重度污染,完成2×2列联表,并判断是否有95%的把握认为该市本年度空气重度污染与供暖有关.下面临界值表供参考:参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)18.某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:为了研究计算的方便,工作人员将上表的数据进行了处理,t =x -2 010,z =y -5,得到下表2:(1)求z 关于t (2)通过(1)中的方程,求出y 关于x 的回归方程;(3)用所求回归方程预测到2020年年底,该地储蓄存款额可达多少?附:对于线性回归方程y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -n x ·y ∑ni =1x 2i -n x 2,a ^=y -b ^x . 解析:(1)t =3,z =2.2,∑5i =1t i z i =45,∑5i =1t 2i =55, b ^=45-5×3×2.255-5×9=1.2,a ^=z -b ^t =2.2-3×1.2=-1.4,∴z =1.2t -1.4.(2)将t =x -2 010,z =y -5,代入z =1.2t -1.4, 得y -5=1.2(x -2 010)-1.4,即y =1.2x -2 408.4. (3)∵y =1.2×2 020-2 408.4=15.6,∴预测到2020年年底,该地储蓄存款额可达15.6千亿元.19.某医院对治疗支气管肺炎的两种方案A ,B 进行比较研究,将志愿者分为两组,分别采用方案A 和方案B 进行治疗,统计结果如下:(1)(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?附:K 2=n ad -bc 2a +bc +d a +c b +d,其中n =a +b +c +d .11 使用方案A 组有效的频率为96120=0.8;使用方案B 组有效的频率为7280=0.9.方案B 组更有效. (2)K 2=200× 96×8-24×72 2120×80×168×32≈3.571<3.841, 所以,不能在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关.。