高中数学精选--概率与统计-资料.ppt
- 格式:ppt
- 大小:888.02 KB
- 文档页数:114
高二数学 概率与统计考试要求1.统计(1)随机抽样① 理解随机抽样的必要性和重要性.② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. (2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.② 理解样本数据标准差的意义和作用,会计算数据标准差. ③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. ④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. (3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. ② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 不要求记忆线性回归方程系数公式()()()1122211,nniiiii i nniii i x ynx y xxyyb a y bxxnxxx-------===---∑∑∑∑用最小二乘法求线性回归方程系数公式:7.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.② 了解两个互斥事件的概率加法公式. (2)古典概型①理解古典概型及其概率计算公式.②会计算一些随机事件所含的基本事件数及事件发生的概率. (3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率. ②了解几何概型的意义.1.课本概念与定理详解(1)随机抽样①简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体数较少. ②系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.③分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.(2)众数、中位数、平均数①众数:在样本数据中,出现次数最多的那个数据.②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.在直方图中取频率为0.5处的频数。
高中数学概率与统计知识点1、概率的定义随机事件A的概率是频率的稳定值;频率是概率的近似值。
2、等可能事件的概率如果一次试验中可能出现的结果有n个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是1/n,如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m/n。
3、互斥事件不可能同时发生的两个事件叫互斥事件。
如果事件A、B互斥,那么事件A+B发生(A、B中有一个发生)的概率,等于事件A、B 分别发生的概率和,即P(A+B)=P(A)+P(B)。
4、对立事件对立事件是指两个事件必有一个发生的互斥事件。
例如:从1~52张扑克牌中任取一张抽到“红桃”与抽到“黑桃”互为互斥事件,因为其中一个不可能同时发生,但又不能保证其中一个必然发生,故不是对立事件。
而抽到“红色牌”与抽到“黑色牌”互为对立事件,因为其中一个必发生。
对立事件的性质:1)对立事件的概率和等于1:P(A)+P(Ä)=P(A+A)=1。
2)互为对立的两个事件一定互斥,但互斥不一定是对立事件。
5、相互独立事件事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互独立事件。
两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P(A·B)=P(A)·P(B)。
相互独立事件的性质:1)如果事件A与B相互独立,那么A与B,A与B,A与B也都相互独立。
2)必然事件与任何事件都是相互独立的。
3)独立事件是对任意多个事件来讲,而互斥事件是对同一实验来讲的多个事件,且这多个事件不能同时发生,故这些事件相互之间必然影响,因此互斥事件一定不是独立事件。
6、独立重复试验若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。
如果在一次试验中某事件发生的概率为P,那么在n次独立重复试验中这个事件恰好发生k 次的概率:P…(k)=CP*(1-P)"-*7、两个事件之间的关系对任何两个事件都有P(A+B)=P(A)+P(B)-P(A·B)。
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m; 等可能事件概率的计算步骤:计算一次试验的基本事件总数n ;设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=kn k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)kk n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复.例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且kn k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-=(Ⅱ)ξ可能的取值为0,1,2.()2172201360190C P C ξ===, ()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=.记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =,∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=, 12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =.∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=. (Ⅱ)同解法一.离散型随机变量的期望与方差随机变量的数学期望和方差 (1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平.⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度.⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p E 1=ξ,D ξ =2p q 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:则比较两名工人的技术水平的高低为 .思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE ,891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ;(Ⅱ)求η的分布列及期望E η.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元).抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件.那么此样本的容量n= .解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例2.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K 组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m=6时,第k 组抽取的号的个位数字为m+k 的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.正态分布与线性回归 1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望E ξ =μ,方差2σξ=D .(3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974 (4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于( ) A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d=90°,则ξ<89的概率为 ; (2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).解答过程:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01.∴Φ(5.080d-)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635.故d 至少为81.1635.小结:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f (x )为增函数,x>0时,f (x )为减函数.。
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布. ②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm=,则k 的范围可以写为k=0,1,…,n.〕 ⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系. 设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n =+-+=+==--,即η~)(b a a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样.二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为n n 2211.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p +q = 1)⑷二项分布:∑=⋅-⋅=-np q pk n k n k E k n k)!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =(如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).S 阴=0.5S a =0.5+S。
专题七 概率与统计第一讲 统计与统计案例1. 随机抽样抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2. 总体分布的估计在研究总体时,常用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确. 3. 线性回归方程(1)对n 个样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^ =y -b ^x ,x 、y 分别是{}x i 、{}y i 的平均数.(2)相关系数r >0,表明两个变量正相关;r <0,表明两个变量负相关;|r |越接近于1,表明两个变量的线性相关性越强;|r |越接近于0,表明两个变量之间几乎不存在线性相关关系;|r |>0.75时,认为两变量有很强的线性相关关系. 4. 独立性检测的一般步骤(1)根据样本数据列出2×2列联表,假设两个变量无关系;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)比较K 2与临界值的大小关系作统计推断.1. (2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11B .12C .13D .14答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 2. (2013·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120答案 B解析 少于60分的学生人数600×(0.05+0.15)=120(人), ∴不少于60分的学生人数为480人.3. (2013·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组 乙组 9 0 9 x 2 1 5 y 8 7424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8答案 C解析 由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10+x =15,x =5.又因9+15+10+y +18+245=16.8,所以y =8,故选C.4. (2012·湖南)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg答案 D解析 由于线性回归方程中x 的系数为0.85, 因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确. 当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确. 5.运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2 解析 x 甲=15(87+91+90+89+93)=90, x乙=15(89+90+91+88+92)=90, s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.题型一 抽样方法例1 (1)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15(2)某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )A .8B .11C .16D .10审题破题 系统抽样的特点是“等距”,分层抽样最重要的是“比例”. 答案 (1)C (2)A解析 (1)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.(2)若设高三学生数为x ,则高一学生数为x 2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500, 解得x =1 600,故高一学生数为800,因此应抽取高一学生数为800100=8.反思归纳 (1)在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.(2)在分层抽样中,要求各层在样本中和总体中所占比例相同.变式训练1 (1)要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( )A .①简单随机抽样法,②系统抽样法B .①分层抽样法,②简单随机抽样法C .①系统抽样法,②分层抽样法D .①②都用分层抽样法 答案 B(2)防疫站对学生进行身体健康调查,采用分层抽样法抽取,某中学高三有学生1 600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有________. 答案 760解析 设该校的女生为x 人,男生为(1 600-x )人,则按照分层抽样,各层的比例为2001 600=18,所以女生抽取x 8,男生抽取1 600-x 8,所以x8+10=1 600-x 8,解得x =760. 题型二 用样本估计总体例2 (2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比审题破题 (1)根据样本频率之和为1,求出参数a 的值;(2)根据频率分布直方图和平均值的计算公式,求出样本平均值;(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在[50,90)之间的人数,进而求解.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为 100-(5+20+40+25)=10(人).反思归纳 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.方差较大的波动较大,方差较小的波动较小.变式训练2 (1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙答案 B解析由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x 甲<x乙,甲的中位数为20,乙的中位数为29,即m甲<m乙.(2)某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100)后,画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为________;平均分为________.答案75%71解析及格的各组的频率是(0.015+0.03+0.025+0.005)×10=0.75,即及格率约为75%;样本的均值为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,以这个分数估计总体的分数即得总体的平均分数约为71.题型三统计案例例3(1)根据上表可得线性回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为() A.63.6万元B.65.5万元C.67.7万元D.72.0万元(2)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20附:参考公式及数据①卡方统计量:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d);则下列说法正确的是( )A .有99%的把握认为环保知识测试成绩与专业有关B .有99%的把握认为环保知识测试成绩与专业无关C .有95%的把握认为环保知识测试成绩与专业有关D .有95%的把握认为环保知识测试成绩与专业无关审题破题 (1)可以通过回归直线过(x ,y )求出a ^,然后进行预报;(2)计算K 2,然后和临界值比较. 答案 (1)B (2)C解析 (1)∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^=b ^x +a ^必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). (2)K 2=40×(14×13-7×6)220×20×21×19≈4.912,3.841<K 2<6.635,所以有95%的把握认为环保知识测试成绩与专业有关.反思归纳 (1)线性回归分析中,回归直线过(x ,y )是解决问题的核心;(2)独立性检验问题要计算卡方值,和临界值比较,说明有多大把握认为两者有关系.变式训练3 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解 (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,又b ^=-20,所以a ^=y -b ^x =80+20×8.5=250,从而线性回归方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.典例(12分)为调查某市学生百米运动成绩,从该市学生中按照男女生比例随机抽取50名学生进行百米测试,学习成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)设m,n表示样本中两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18],求事件“|m-n|>2”的概率;(2)根据有关规定,成绩小于16秒为达标.根据上表数据,能否在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?附:规范解答解(1)从频率分布直方图中可以看出,成绩在[13,14)的人数为50×0.04=2(人),设为a,b;成绩在[17,18]的人数为50×(1-0.38-0.34-0.18-0.04)=3(人),设为A,B,C.[2分] m,n∈[13,14)有ab一种情况;m,n∈[17,18]时有AB,AC,BC三种情况;m,n分别在[13,14)和[17,18]时有aA ,aB ,aC ,bA ,bB ,bC 六种情况,所有基本事件总数为10.[4分] 而事件“|m -n |>2”由6个基本事件即aA ,aB ,aC ,bA ,bB ,bC 组成.所以P (|m -n |>2)=610=35.[6分](2)依题意得到相应的2×2列联表如下:[9分]K 2=50×(24×12-6×8)232×18×30×20≈8.333.由于8.333>6.635,故在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”.故可以根据男女生性别划分达标的标准.[12分]评分细则 (1)计算出成绩在两个区间[13,14),[17,18]内的人数给1分,标记给1分;(2)列举基本事件不全扣1分;(3)卡方值计算正确得1分,和临界值比较得1分,写最后结论得1分.阅卷老师提醒 (1)频率分布直方图和概率的结合是高考考查的热点,解题时要审清题意,把握频率分布直方图所体现的频率分布或数字特征;(2)解决独立性检验问题,要先得到列联表,准确代入公式计算.1. 某校共有学生2 000名,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在( )A.24B .18C .16D .12答案 C解析 由2 000×0.19=380知二年级的学生人数为380+370=750,由于一年级的学生人数为373+377=750,于是三年级的学生人数为2 000-750-750=500,那么三年级应抽取的人数为500×642 000=16(人).2. (2012·山东)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是 ( )A .众数B .平均数C .中位数D .标准差答案 D解析 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.3. 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,设回归方程为y =b x +a ,则点(a ,b )在直线x +45y -10=0的( )A .左上方B .左下方C .右上方D .右下方答案 C解析 依题意得,x =18×(10+20+30+40+50+60+70+80)=45,y =18×(62+68+75+81+89+95+102+108)=85.注意到题中的每一组点(x ,y )均位于直线x +45y -10=0的右上方,因此点(a ^,b ^)必位于直线x +45y -10=0的右上方,故选C.4. 高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本.已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为________. 答案 20解析 由题意可知,可将学号依次为1,2,3,…,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为6+14=20.5. (2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x 的值为 __________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.答案 (1)0.004 4 (2)70解析 (1)(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1, ∴x =0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.6. (2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5, 则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x -7|=3可得x =10或x =4. 由|x -7|=1可得x =8或x =6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.专题限时规范训练一、选择题1. (2013·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是 ( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数 答案 C 解析 x男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91, s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8, s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6. 2. (2013·湖南)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法答案 D解析 总体(100名学生)中的个体(男、女学生)有明显差异,应采用分层抽样. 3. 为了解一片大约10 000株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm 的树木大约有( )A .3 000株B .6 000株C .7 000株D .8 000株答案 C解析 底部周长小于110 cm 的频率为(0.01+0.02+0.04)×10=0.7,所以底部周长小于110 cm 的树木大约有10 000×0.7=7 000株,故选C.4. 如图是2013年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1、a 2,则一定有( )A.a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2大小与m 的值有关答案 B解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.5. 假设学生初一和初二数学成绩是线性相关的.若10个学生初一(x )和初二(y )的数学分数则初一和初二数学分数间的线性回归方程是( )A.y ^=1.218 2x -14.192B.y ^=14.192x +1.218 2C.y ^=1.218 2x +14.192D.y ^=14.192x -1.218 2 答案 A 解析 因为x=71,∑i =110x 2i =50 520,y =72.3,∑i =110x i y i =51 467,所以,b ^=51 467-10×71×72.350 520-10×712≈1.218 2.a ^=72.3-1.218 2×71=-14.192 2,线性回归方程是:y ^=1.218 2x -14.192 2.6. (2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取( )A.08 B .07 C .02 D .01答案 D解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.7. 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3 答案 D解析 逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A 错;由0,0,0,0,0,0,0,0,2,8可知,B 错;由0,0,1,1,2,2,3,3,3,8可知,C 错.D 中x =2. (x 1-2)2+(x 2-2)2+…+(x 10-2)210=3.即(x 1-2)2+(x 2-2)2+…+(x 10-2)2=30.显然(x i -2)2≤30(i =1,2,…,10),x i ∈N *即x i ≤7.8. 有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72答案 B解析 由0.02+0.05+0.15+0.19=0.41, ∴落在区间[2,10)内的频率为0.41×2=0.82. ∴落在区间[10,12)内的频率为1-0.82=0.18.∴样本数据落在区间[10,12)内的频数为0.18×200=36. 二、填空题9. (2013·山东改编)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.答案 367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0) =367. 10.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.11.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.答案 24 23解析 x 甲=110×(19+18+20+21+23+22+20+31+31+35)=24.x 乙=110×(19+17+11+21+24+22+24+30+32+30)=23.12.以下四个命题,其中正确的是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;③在线性回归方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量K 2(χ2)的值越小,“X 与Y 有关系”的把握程度越大. 答案 ②③解析 ①是系统抽样;对于④,随机变量K 2(χ2)的值越小,说明两个变量有关系的把握程度越小. 三、解答题13.(2013·安徽)为调查甲、乙两校高三年级学生某次联考的数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.解 (1)设甲校高三年级学生总人数为n ,由已知条件 30n=0.05,则n =600. 在甲校高三年级抽取的30名学生中成绩在60分及60分以上的人数为25,因此甲校高三年级这次联考的及格率大约是2530=56=83.3%.(2)x 1=[(7+13+24+26+22+2)+40+50×4+60×9+70×9+80×5+90×2]÷30=1 04215;x 2=[(5+14+17+33+20)+40+50×3+60×10+70×10+80×5+90]÷30=2 06930.x 1-x 2=2 08430-2 06930=12.14.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率. 解 (1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,所以,经直观分析,收看新闻节目的观众与年龄是有关的.(2)从题中所给条件可以看出收看新闻节目的共45人,随机抽取5人,则抽样比为545=19,故大于40岁的观众应抽取27×19=3(人).(3)抽取的5名观众中大于40岁的有3人,在20岁到40岁的有2人,记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2)共10个,其中恰有1人为20至40岁的有6个,故所求概率为610=35.。