数学高考复习点拨:二项分布与超几何分布辨析
- 格式:doc
- 大小:406.00 KB
- 文档页数:15
高考数学总复习考点知识专题讲解 专题13 二项分布与超几何分布知识点一 n 重伯努利试验及其特征 1.n 重伯努利试验的概念将一个伯努利试验独立地重复进行n 次所组成的随机试验称为n 重伯努利试验. 2.n 重伯努利试验的共同特征 (1)同一个伯努利试验重复做n 次. (2)各次试验的结果相互独立.思考在相同条件下,有放回地抽样试验是n 重伯努利试验吗? 答案 是.其满足n 重伯努利试验的共同特征. 知识点二 二项分布一般地,在n 重伯努利试验中,设每次试验中事件A 发生的概率为p (0<p <1),用X 表示事件A 发生的次数,则X 的分布列为P (X =k )=C k n p k (1-p )n -k,k =0,1,2,…,n . 称随机变量X 服从二项分布,记作X ~B (n ,p ). 知识点三 二项分布的均值与方差若X ~B (n ,p ),则E (X )=np ,D (X )=np (1-p ).【例1】(2023•大埔县月考)设随机变量~(,)B n p ξ,若() 2.4E ξ=,() 1.44D ξ=,则参数n ,p 的值分别为()A .12,0.4B .12,0.6C .6,0.4D .6,0.6【例2】(2023•永春县月考)设随机变量~(2,)B p ξ,~(3,)B p η,5(1)9P ξ=…,则(2)(P η=…)A .19B .727C .59D .89【例3】(2023•海门市期末)A 、B 两组各3人独立的破译某密码,A 组每个人译出该密码的概率均为1p ,B 组每个人译出该密码的概率均为2p ,记A 、B 两组中译出密码的人数分别为X 、Y ,且12112p p <<<,则()A .()()E X E Y <,()()D X D Y <B .()()E X E Y <,()()D X D Y >C .()()E X E Y >,()()D X D Y < D .()()E X E Y >,()()D X D Y >【例4】(2018•新课标Ⅲ)某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立.设X 为该群体的10位成员中使用移动支付的人数,() 2.4D X =,(4)(6)P X P X =<=,则(p =)A .0.7B .0.6C .0.4D .0.3【例5】(2023•多选•琼中县模拟)若袋子中有2个白球,3个黑球,现从袋子中有放回地随机取球4次,每次取一个球,取到白球记1分,取到黑球记0分,记4次取球的总分数为X ,则()A .3~(4,)5X B B .4(3)25P X ==C .X 的期望8()5E X =D .X 的方差24()25D X =【例6】(2023•武汉模拟)已知离散型随机变量X 服从二项分布(,)B n p ,其中*n N ∈,01p <<,记X 为奇数的概率为a ,X 为偶数的概率为b ,则下列说法中正确的有()A .1a b +=B .12p =时,a b =C .102p <<时,a 随着n 的增大而增大 D .112p <<时,a 随着n 的增大而减小知识点四 超几何分布1.定义:一般地,假设一批产品共有N 件,其中有M 件次品,从N 件产品中随机抽取n 件(不放回),用X 表示抽取的n 件产品中的次品数,则X 的分布列为P (X =k )=C k M C n -k N -MC n N,k =m ,m +1,m +2,…,r .其中n ,N ,M ∈N *,M ≤N ,n ≤N ,m =max{0,n -N +M },r =min{n ,M }. 如果随机变量X 的分布列具有上式的形式,那么称随机变量X 服从超几何分布. 2.均值:E (X )=nM N. 3.超几何分布是不放回抽样,且超几何分布与二项分布的均值相同. 二项分布与超几何分布的关系在n 次试验中,某事件A 发生的次数X 可能服从超几何分布或二项分布.l 联系:在不放回n 次试验中,如果总体数量N 很大,而试验次数n 很小,此时超几何分布可近似转化成二项分布区别:①当这n 次试验是n 重伯努利试验时(如有放回摸球),X 服从二项分布;②当n 次试验不是n 重伯努利试验时(如不放回摸球),X 服从超几何分布。
二项分布与超几何分布辨析超几何分布和二项分布都是离散型分布超几何分布和二项分布的区别:超几何分布需要知道总体的容量,而二项分布不需要;超几何分布是不放回抽取,而二项分布是放回抽取(独立重复)当总体的容量非常大时,超几何分布近似于二项分布.........例1袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列.例2.某市十所重点中学进行高三联考,共有5000名考生,为了了解数学学科的学习情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表: (1)根据上面的频率分布表,求①,②,③,④处的数值;(2)根据上面的频率分布表,在所给的坐标系中画出在区间[]80,150上的频率分布直方图; (3)如果把表中的频率近似地看作每个学生在这次考试中取得相应成绩的概率,那么从总体中任意抽取3个个体,成绩落在[]100,120中的个体数为ξ,求ξ的分布列和数学期望.练习2.为从甲、乙两名运动员中选拔一人参加2010年广州亚运会跳水项目,对甲、乙两名运动员进行培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得出茎叶图如图所示(Ⅰ)从平均成绩及发挥稳定性的角度考虑,你认为选派哪名运动员合适? (Ⅱ)若将频率视为概率,对甲运动员在今后3次比赛成绩进行预测,记这3次成绩中高于80分的次数为ξ,求ξ的分布列及数学期望E ξ。
分组频数 频率 [)80,90 ① ② [)90,100 0.050 [)100,110 0.200 [)110,12036 0.300 [)120,130 0.275 [)130,14012 ③ [)140,1500.050 合计④甲 乙5 32 58 0 3 5 5 4 1 9 8 7 9123510152025 参加人数 活动次数例3.按照新课程的要求, 高中学生在每学期都要至少参 加一次社会实践活动(以下简称活动).某校高一· 一班50名学生在上学期参加活动的次数统计如条 形图所示.(I )求该班学生参加活动的人均次数x ;(II )从该班中任意选两名学生,求他们参加活动 次数恰好相等的概率;(III )从该班中任选两名学生,用ξ表示这两人参加活动次数之差的绝对值,求随机变量ξ的分布列及数学期望E ξ.(要求:答案用最简分数表示)练习3.某校参加高一年级期中考试的学生中随机抽出60名学生,将其数学成绩分成六段[40,50]、[50,60]、…、[90,100]后得到如下部分频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80]内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)若从60名学生中随抽取2人,抽到的学生成绩在[40,60]记0分,在[60,80]记1分,在[80,100]记2分,用ξ表示抽取结束后的总记分,求ξ的分布列和数学期望。
超几何分布和二项分布的联系和区别如何计算恰好有1件次品的概率?这道题目可以用超几何分布和二项分布两种方法来解决。
首先,我们可以使用超几何分布,因为这是一个不放回抽样问题。
根据题目条件,我们可以得到M=0.02n,N=n,n=3,k=1.代入超几何分布的公式,可以得到P(X=1)=0.111.其次,我们也可以使用二项分布,因为这是一个独立重复试验问题。
根据题目条件,我们可以得到n=3,p=0.02,k=1.代入二项分布的公式,可以得到P(X=1)=0.057.因此,两种方法得到的结果略有不同,但可以看出它们之间是有联系的。
二项分布可以看作是超几何分布的一种近似,当样本容量n很大时,二项分布的计算结果可以逼近超几何分布的计算结果。
在进行放回或不放回的方式抽取时,当产品总数分别为500、5000和时,恰好抽到1件次品的概率分别是多少?根据此问题,你对超几何分布与二项分布的关系有何认识?解析:在不放回的方式抽取中,每次抽取时都是从这n件产品中抽取,从而抽到次品的概率都为。
次品数X服从二项分布,恰好抽到1件次品的概率为1P(X=1)=C3×(1-2%)^2×(2%)^1≈0.057.在不放回的方式抽取中,抽到的次品数X是随机变量,X服从超几何分布,X的分布与产品的总数n有关,所以需要分3种情况分别计算。
①当n=500时,产品的总数为500件,其中次品的件数为500×2%=10,合格品的件数为490.从500件产品中抽出3件,其中恰好抽到1件次品的概率为P(X=1)=12C10×C×490×489÷3500×499×498≈0..②当n=5000时,产品的总数为5000件,其中次品的件数为5000×2%=100,合格品的件数为4900.从5000件产品中抽出3件,其中恰好抽到1件次品的概率为P(X=1)=12C100×Cxxxxxxx×4900×4899÷×4999×4998≈0.xxxxxx x。
二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,如何理解它们的关联性同时又能区分两个概率模型呢?本文笔者就此问题予以阐述。
一、超几何分布与二项分布的定义1.一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为P (X=k)=C M k C n-m n-kC Nn,k=0,1,2,…,m其中m=min {M,n},且n ≤N ,M ≤N ,n ,M ,N ∈N*。
其分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
2.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验。
在n 次独立重复试验中,设事件A 发生的次数X ,在每次试验事件A 发生的概率为p,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X=k)=C n k P k(1-p )n-k,k=0,1,2,…,n 。
此时称随机变量X 服从二项分布,记作X ~B (n ,p),并称p 为成功概率。
二、超几何分布与二项分布的区别从它们的定义不难看出超几何分布研究的是试验后的结果(不研究试验中先后取的顺序),并且是无放回的抽取;二项分布研究的是既有研究先后发生的顺序又有试验结果,并且是有放回的抽取。
超几何分布是无放回的抽取,即每做一次试验,下一次再发生同一事件A 的概率已经发生了变化,即每次发生的概率都不相等。
实质上,超几何分布是古典概型的一种特例。
二项分布是有放回的抽取,每做一次试验,发生同一事件A 的概率都相同。
这就是二者之间的区别。
本文笔者举例说明:例1:在装有4个黑球6个白球的袋子中,任取2个,试求:(1)不放回地抽取,取到黑球数X 的分布列;(2)有放回地抽取,取到黑球数的分布列。
解:(1)是不放回地抽取,X 服从超几何分布。
从10个球中任取2球的结果数为C 102,从10个球中任取2个,其中恰有k 个黑球的结果数为C 4k C 62-k,那么从10个球中任取2个,其中恰有k 个黑球的概率为P (X=k )=C 4k C 62-kC 102,k=0,1,2。
考点36 超几何分布与二项分布【思维导图】【常见考法】考点一 超几何分布1.在中华人民共和国成立70周年之际,《我和我的祖国》、《中国机长》、《攀登者》三大主旋律大片在国庆期间集体上映,拉开国庆档电影大幕.据统计《我和我的祖国》票房收入为31.71亿元,《中国机长》票房收人为29.12亿元,《攀登者》票房收入为10.98亿元.已知国庆过后某城市文化局统计得知大量市民至少观看了一部国庆档大片,在已观影的市民中随机抽取了100进行调查,其中观看了《我和我的祖国》的有49人,观看了《中国机长》的有46人,观看了《攀登者》的有34人,统计图如下.(1)计算图中,,a b c 的值;(2)文化局从只观看了两部大片的观众中采用分层抽样的方法抽取了7人,进行观影体验的访谈,了解到他们均表示要观看第三部电影,现从这7人中随机选出4人,用X 表示这4人中将要观看《我和我的祖国》的人数,求X 的分布列及数学期望.【答案】(1)9a =,6b =,6c =;(2)分布列见解析,8()7E X =.【解析】(1)由题意可得274463044918434a b a c b c +++=⎧⎪+++=⎨⎪+++=⎩,解得966a c b =⎧⎪=⎨⎪=⎩,所以9a =,6b =,6c =;(2)记“同时观看了《中国机长》和《我和我的祖国》”的为A 组,共9人; “同时观看了《中国机长》和《攀登者》”为B 组,共6人; “同时观看《我和我的祖国》和《攀登者》”为C 组,共6人; 所以按分层抽样,,,A B C 组被抽取的人数分别为79321⨯=、76221⨯=、76221⨯=; 在被抽取的7人中,没有观看《我和我的祖国》的有2人,∴0,1,2X =,则45471(0)7C P X C ===,1325474(1)7C C P X C ===,2225472(2)7C C P X C ===, 所以X 的分布列如下:∴X 的数学期望()0127777E X =⨯+⨯+⨯=.2.在一次运动会上,某单位派出了由6名主力队员和5名替补队员组成的代表队参加比赛.(1)如果随机抽派5名队员上场比赛,将主力队员参加比赛的人数记为X ,求随机变量X 的数学期望; (2)若主力队员中有2名队员在练习比赛中受轻伤,不宜同时上场;替补队员中有2名队员身材相对矮小,也不宜同时上场,那么为了场上参加比赛的5名队员中至少有3名主力队员,教练员有多少种组队方案?【答案】(1)3011;(2)1?91 【解析】(1)由题可知X 服从超几何分布,X 的可取值为0,1,2,3,4,5,故可得()5551110462C P X C ===;()1465511305146277C C P X C ⋅====; ()236551115025246277C C P X C ⋅====;()326551120030346211C C P X C ⋅====; ()416551175254462154C C P X C ⋅====;()5651161546277C P X C ====. 故()52510025112345777723115477E X =⨯+⨯+⨯+⨯+⨯=630231. (2)要满足题意,则可以是3名主力2名替补;4名主力1名替补;5名主力.若是3名主力2名替补,则共有()()312211424323144C C C C C C +⋅⋅+⋅=种;若是4名主力1名替补,则共有()4131424545C C C C +⋅⋅=种;若是5名主力,则共有41422C C ⋅=种;故要满足题意,共有144452191++=种出场方式.3.为了减少雾霾,还城市一片蓝天,某市政府于12月4日到12月31日在主城区实行车辆限号出行政策,鼓励民众不开车低碳出行,某甲乙两个单位各有200名员工,为了了解员工低碳出行的情况,统计了12月5日到12月14日共10天的低碳出行的人数,画出茎叶图如下: (1)若甲单位数据的平均数是122,求x ;(2)现从如图的数据中任取4天的数据(甲、乙两单位中各取2天),记其中甲、乙两单位员工低碳出行人数不低于130人的天数为1ζ,2ζ,令12=ηζζ+,求η的分布列和期望.【答案】(1)8;(2)答案见解析.【解析】(1)由题意()10510711311511912612013213414112210x ++++++++++=,解得8x =.(2)由题意知,随机变量η的所有可能取值有0,1,2,3,4.()227622101070;45C C p C C η=== ()112736221010911;225C C C p C C η===()222211113674736422101012;3C C C C C C C C p C C η++=== ()211112364734221010223;225C C C C C C p C C η+=== ()223422101024;225C C p C C η===η∴的分布列为:∴()012344522532252255E η=⨯+⨯+⨯+⨯+⨯=. 考点二 二项分布1.一个袋中装有大小形状相同的标号为1,2,3,4,5,6的6个小球,某人做如下游戏,每次从袋中拿一个球(拿后放回袋中)记下标号,若拿出球的标号是奇数,则得1分,否则得0分. (1)求拿2次得分不小于1分的概率;(2)拿4次所得分数ξ的分布列和数学期望()E ξ【答案】(1)34;(2)分布列见解析;期望为2. 【解析】(1)一次拿到奇数的概率3162P ==, 所以拿2次得分为0分的概率为2021124C ⎛⎫= ⎪⎝⎭ 所以拿2次得分不小于1分的概率为2021*******C ⎛⎫-=-= ⎪⎝⎭(2)ξ可以取值:0,1,2,3,4所以()404121601C P ξ⎛⎫= ⎪⎝⎭==()13141112124C P ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭==()22241132228C P ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭== ()31341112324C P ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭==()404411122164P C ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭== 分布列满足二项分布概率1~42B ξ⎛⎫ ⎪⎝⎭,1()=4=22E ξ∴⨯2.2019年春节期间,某超市准备举办一次有奖促销活动,若顾客一次消费达到400元则可参加一次抽奖活动,超市设计了两种抽奖方案.方案一:一个不透明的盒子中装有30个质地均匀且大小相同的小球,其中10个红球,20个白球,搅拌均匀后,顾客从中随机抽取一个球,若抽到红球则顾客获得60元的返金券,若抽到白球则获得20元的返金券,且顾客有放回地抽取3次.方案二:一个不透明的盒子中装有30个质地均匀且大小相同的小球,其中10个红球,20个白球,搅拌均匀后,顾客从中随机抽取一个球,若抽到红球则顾客获得80元的返金券,若抽到白球则未中奖,且顾客有放回地抽取3次.(1)现有两位顾客均获得抽奖机会,且都按方案一抽奖,试求这两位顾客均获得180元返金券的概率; (2)若某顾客获得抽奖机会.①试分别计算他选择两种抽奖方案最终获得返金券的数学期望;②为了吸引顾客消费,让顾客获得更多金额的返金券,该超市应选择哪一种抽奖方案进行促销活动?【答案】(1)1729(2)①10080元,元②第一种抽奖方案. 【解析】(1)选择方案一,则每一次摸到红球的概率为101303p == 设“每位顾客获得180元返金劵”为事件A ,则()33311327P A C ⎛⎫== ⎪⎝⎭所以两位顾客均获得180元返金劵的概率()()1729P P A P A =⋅=(2)①若选择抽奖方案一,则每一次摸到红球的概率为13,每一次摸到白球的概率为23. 设获得返金劵金额为X 元,则X 可能的取值为60,100,140,180.则()3032860327P X C ⎛⎫=== ⎪⎝⎭; ()1213124100339P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭;()223122140339P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭;()33311180327P X C ⎛⎫===⎪⎝⎭. 所以选择抽奖方案一,该顾客获得返金劵金额的数学期望为()842160100140180100279927E X =⨯+⨯+⨯+⨯=(元) 若选择抽奖方案二,设三次摸球的过程中,摸到红球的次数为Y ,最终获得返金劵的金额为Z 元,则13,3Y B ⎛⎫~ ⎪⎝⎭,故()1313E Y =⨯=所以选择抽奖方案二,该顾客获得返金劵金额的 数学期望为()()8080E Z E Y ==(元).②即()()E X E Z >,所以该超市应选择第一种抽奖方案3.某工厂的某种产品成箱包装,每箱20件,每一箱产品在交付用户时,用户要对该箱中部分产品作检验.设每件产品为不合格品的概率都为()01p p <<,且各件产品是否合格相互独立.(1)记某一箱20件产品中恰有2件不合格品的概率为()f p ,()f p 取最大值时对应的产品为不合格品概率为0p ,求0p ;(2)现从某一箱产品中抽取3件产品进行检验,以(1)中确定的0p 作为p 的值,已知每件产品的检验费用为10元,若检验出不合格品,则工厂要对每件不合格品支付30元的赔偿费用,检验费用与赔偿费用的和记为X ,求X 的分布列和数学期望. 【答案】(1)0110p =;(2)分布列见解析;()39E X =. 【解析】(1)20件产品中恰有2件不合格品的概率()()1822201f p C p p =⋅⋅-,()()()()1817222202021181f p C p p C p p '∴=⋅⋅-+⋅⋅--()()()()171722222020121181220C p p p p C p p p ⎡⎤=---=--⎣⎦,令()0f p '=,又01p <<,解得:110p =, ∴当10,10p ⎛⎫∈ ⎪⎝⎭时,()0f p '>;当1,110p ⎛⎫∈ ⎪⎝⎭时,()0f p '<;()f p ∴在10,10⎛⎫ ⎪⎝⎭上单调递增,在1,110⎛⎫⎪⎝⎭上单调递减,∴当110p =时,()f p 取得最大值,即0110p =.(2)由题意得:X 所有可能的取值为:30,60,90,120,()331729301101000P X C ⎛⎫∴==-= ⎪⎝⎭;()2131124360110101000P X C ⎛⎫==⨯⨯-=⎪⎝⎭; ()223112790*********P X C ⎛⎫⎛⎫==⨯⨯-= ⎪ ⎪⎝⎭⎝⎭;()33311120101000P X C ⎛⎫==⨯=⎪⎝⎭; X ∴的分布列为:∴数学期望()306090120391000100010001000E X =⨯+⨯+⨯+⨯=. 考点三 超几何与二项分布综合运用1.某市政府为了引导居民合理用水,决定全面实施阶梯水价,居民用水原则上以住宅为单位(一套住宅为一户).为了了解全市居民月用水量的分布情况,通过抽样,获得了10户居民的月用水量(单位:吨),得到统计表如下:(1)若用水量不超过12吨时,按4元/吨计算水费;若用水量超过12吨且不超过16吨时,超过12吨部分按5元/吨计算水费;若用水量超过16吨时,超过16吨部分按7元/吨计算水费.试计算:若某居民用水17吨,则应交水费多少元?(2)现要在这10户家庭中任意选取3户,求取到第二阶梯水量的户数的分布列与期望;(3)用抽到的10户家庭作为样本估计全市的居民用水情况,从全市依次随机抽取10户,若抽到k 户月用水量为第一阶梯的可能性最大,求k 的值.【答案】(1)75元(2)见解析,910(3)6 【解析】(1)若某居民用水17吨,则需交费124451775⨯+⨯+⨯=(元);(2)设取到第二阶梯电量的用户数为ξ,可知第二阶梯电量的用户有3户,则ξ可取0,1,2,3,()373107024C P C ξ===,()217331021140C C P C ξ===,()12733107240C C P C ξ===,()3331013120C P C ξ===. 故ξ的分布列是 所以()012324404012010E ξ=⨯+⨯+⨯+⨯=; (3)由题可知从全市中抽取10户,其中用电量为第一阶梯的户数X 满足3~10,5X B ⎛⎫ ⎪⎝⎭,于是为()10103255k k k P X k C -⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭,0,1,210k =⋅⋅⋅, 由()()10110111010101101110103232555532325555k k k k k k k k k k k k C C C C -+-++-----⎧⎛⎫⎛⎫⎛⎫⎛⎫≥⎪ ⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭⎨⎪⎛⎫⎛⎫⎛⎫⎛⎫≥ ⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭⎩, 化简得11010110102332k k k k C C C C +-⎧≥⎨≥⎩,解得283355k ≤≤. 因为*k ∈N ,所以6k =.2.某市居民用天然气实行阶梯价格制度,具体见下表:从该市随机抽取10户(一套住宅为一户)同一年的天然气使用情况,得到统计表如下:(1)求一户居民年用气费y (元)关于年用气量x (立方米)的函数关系式;(2)现要在这10户家庭中任意抽取3户,求抽到的年用气量超过228立方米而不超过348立方米的用户数的分布列与数学期望;(3)若以表中抽到的10户作为样本估计全市居民的年用气情况,现从全市中依次抽取10户,其中恰有k 户年用气量不超过228立方米的概率为()P k ,求()P k 取最大值时的值.【答案】(1)(](]()3.25,0,2283.83132.24,228,3484.7435,348,x x y x x x x ⎧∈⎪=-∈⎨⎪-∈+∞⎩;(2)分布列见解析,数学期望为910;(3)6. 【解析】(1)由题意,当(]0,228x ∈时, 3.25y x =;当(]228,348x ∈时, 3.83132.24y x =-;当()348,x ∈+∞时, 4.7435x y -=, 所以年用气费y 关于年用气量x 的函数关系式为(](]()3.25,0,2283.83132.24,228,3484.7435,348,x x y x x x x ⎧∈⎪=-∈⎨⎪-∈+∞⎩.(2)由题知10户家庭中年用气量超过228立方米而不超过348立方米的用户有3户,设取到年用气量超过228立方米而不超过348立方米的用户数为ξ,则ξ可取0,1,2,3,则()373107024C P C ξ===,()217331021140C C P C ξ===, ()12733107240C C P C ξ===,()3331013120C P C ξ===, 故随机变量ξ的分布列为:所以()721719012324404012010E ξ=⨯+⨯+⨯+⨯=. (3)由题意知()()1010320,1,2,3,1055k kkP k C k -⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭,由10110111010101101110103232555532325555k k k k k k k k k k k k C C C C -+--+---+-⎧⎛⎫⎛⎫⎛⎫⎛⎫≥⎪ ⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭⎨⎛⎫⎛⎫⎛⎫⎛⎫⎪≥ ⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭⎩,解得283355k ≤≤,*k N ∈, 所以当6k =时,概率()P k 最大,所以6k =.。
二项分布与超几何分布辨析二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.例 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列; (2)不放回抽样时,取到黑球的个数Y的分布列. 解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为,3次取球可以看成3次独立重复试验,则1~35X B ⎛⎫⎪⎝⎭,.3031464(0)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭∴;12131448(1)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭; 21231412(2)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭;3033141(3)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭. 因此,X 的分布列为2.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101(2)15C C P Y C ===.因此,Y 的分布列为辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样. 超几何分布和二项分布都是离散型分布,超几何分布和二项分布的区别: 超几何分布需要知道总体的容量,而二项分布不需要; 超几何分布是不放回抽取,而二项分布是放回抽取(独立重复) 当总体的容量非常大时,超几何分布近似于二项分布........二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,理解并区分两个概率模型是至关重要的。
下面举例进行对比辨析。
1.有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型。
2.不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型。
因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。
所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的(特别注意:二项分布是在n次独立重复试验的3个条件成立时应用的)。
超几何分布和二项分布的区别:(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是“不放回”抽取,而二项分布是“有放回”抽取(独立重复)。
练习题:1. 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球。
求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列。
2. (2008年四川延考)一条生产线上生产的产品按质量情况分为三类:A类、B类、C类.检验员定时从该生产线上任取2件产品进行一次抽检,若发现其中含有C类产品或2件都是B 类产品,就需要调整设备,否则不需要调整.已知该生产线上生产的每件产品为A类品,B 类品和C类品的概率分别为,和,且各件产品的质量情况互不影响.(1)求在一次抽检后,设备不需要调整的概率;(2)若检验员一天抽检3次,以ξ表示一天中需要调整设备的次数,求ξ的分布列.3. 今天你低碳了吗近来,国内网站流行一种名为“碳排放计算器”的软件,人们可以扰此计算出自己每天的碳排放量。
例如:家居用电的碳排放量(千克)=耗电度数×.785,汽车的碳排放量(千克)=油耗公升数×等。
某班同学利用寒假在两个小区逐户进行了一次生活习惯进否符合低碳观念的调查。
若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”。
这二族人数占各自小区总人数的比例P 数据如下:(I )如果甲、乙来自A 小区,丙、丁来自B 小区,求这4人中恰有2人是低碳族的概率; (II )A 小区经过大力宣传,每周非低碳族中有20%的人加入到低碳族的行列。
如果2周后随机地从A 小区中任选25个人,记ξ表示25个人中低碳族人数,求.ξE4. 在“自选模块”考试中,某试场的每位同学都选了一道数学题,第一小组选《数学史与不等式选讲》的有1人,选《矩阵变换和坐标系与参数方程》的有5人,第二小组选《数学史与不等式选讲》的有2人,选《矩阵变换和坐标系与参数方程》的有4人,现从第一、第二两小组各任选2人分析得分情况.(Ⅰ)求选出的4 人均为选《矩阵变换和坐标系与参数方程》的概率;(Ⅱ)设ξ为选出的4个人中选《数学史与不等式选讲》的人数,求ξ的分布列和数学期望.5. 甲、乙两人参加2010年广州亚运会青年志愿者的选拔.打算采用现场答题的方式来进行,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才能入选.(1)求甲答对试题数ξ的概率分布;(2)求甲、乙两人至少有一人入选的概率.正态分布和线性回归高考要求1.了解正态分布的意义及主要性质2.了解线性回归的方法和简单应用知识点归纳1.正态分布密度函数:22()2()2xf x eμσπσ--=,(σ>0,-∞<x<∞)其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2σμN2.正态分布),(2σμN)是由均值μ和标准差σ唯一决定的分布例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.(1)2221)(xexf-=π,(-∞<x<+∞)(2)2(1)8()22xf x eπ--=,(-∞<x<+∞)解:(1)0,1 (2)1,23.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量ξ~N(μ,σ2),根据定义有:μ=Eξ,σ=Dξ。
正态曲线具有以下性质:(1)曲线在x轴的上方,与x轴不相交。
(2)曲线关于直线x =μ对称。
(3)曲线在x =μ时位于最高点。
(4)当x <μ时,曲线上升;当x >μ时,曲线下降。
并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。
σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x ex f -=π,(-∞<x <+∞)其相应的曲线称为标准正态曲线标准正态总体N (0,1)在正态总体的研究中占有重要的地位任何正态分布的概率问题均可转化成标准正态分布的概率问题5.标准正态总体的概率问题:对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,其中00>x ,图中阴影部分的面积表示为概率0()P x x <只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)例2 设),(~2σμN X ,且总体密度曲线的函数表达式为: 412221)(+--=x x ex f π,x ∈R 。
(1)求μ,σ;(2)求)2|1(|<-x P 的值。
分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。
利用一般正态总体),(2σμN 与标准正态总体N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。
解:(1)由于222)2(2)1(41222121)(--+--⋅==x x x eex f ππ,根据一般正态分布的函数表达形式,可知μ=1,2=σ,故X ~N (1,2)。
(2))2121()2|1(|+<<-=<-x P x P(1(1(1)(1)2(1)120.84131F F =-=Φ-Φ=Φ-Φ-=Φ-=⨯- 6826.0=。
点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。
通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。
9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系. 10.回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性 对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。
两个变量具有相关关系是回归分析的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
11.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度粗略地看,散点分布具有一定的规律12. 回归直线 设所求的直线方程为,^a bx y +=,其中a 、b 是待定系数.1122211()()()n ni i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx====⎧---⎪⎪==⎨--⎪⎪=-⎩∑∑∑∑, ∑==n i i x n x 11,∑==ni i y n y 11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y 与x 的一组观测值,把∑∑∑===----=ni ni i ini i iy y x xy y x xr 11221)()())((=∑∑∑===---ni n i i i ni ii y n y x n x yx n yx 1122221))((叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.14.相关系数的性质: r ≤1,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.一般的,当r ≥ 时,就可以判断其具有很强的相关性,这时求线性回归方程才有意义。