常用统计分布
- 格式:docx
- 大小:32.57 KB
- 文档页数:9
§6.3常用统计量的分布一、样本均值的分布1、单个正态总体下的样本均值的分布2、两个正态总体下的样本均值的分布3、非正态总体下的样本均值的近似分布二、-分布1、分布定义2、分布的性质3、分布的典型模式4、分布的上α分位点2χ2χ2χ2χ2χ三、t-分布1、t 分布的定义2、t(n)的性质3、t(n)的典型模式4、t(n)分布的上α分位点四、F-分布1、F分布的定义2、F分布的性质3、F分布的典型模式4、F分布的上α分位点五、正态总体样本均值与样本方差的分布1、单个正态总体下样本均值与样本方差的分布2、两个正态总体下样本均值差与样本方差比的分布)2.3(1)(1)1()(1)(1)1()(,,,2,1,)(,)(,,,1)1.3(),(~11,,,,),,(1.31222121112212121212n n nX D n X n D X D n nX E n X n E X E n i X D X E X X X X nN X n X nX n X X X X X N X n i i n i i n i i n i i i i n ni i ni i n σσµµσµσµσµσµ=⋅====⋅========∑∑∑∑∑∑======于是有相互独立同分布,故与:由于注的正态分布,即,方差为服从均值为值的一个样本,则样本均为来自服从正态总体设总体定理本均值的分布、单个正态总体下的样一、样本均值的分布"""这点处。
望取值几乎集中在数学期时且当高的集中程度远比总体要的取值于即倍的方差的的方差却只是但有相同的数学期望与由上述可知注µµX n X nX X X X ,,,1,,:2∞→212(1,0.2),,,,,{0.9 1.1}0.95?n X N n X X X X P X n ≤<≥"例 设总体服从正态分布从中抽取容量为的样本欲使样本均值满足不等式试求样本容量最小应为取多大2110.2:~(1,)1.110.910.95{0.9 1.1}0.20.2()()2()1222ni i X X N nnP X n n n n n==⎛⎞⎛⎞−−≤≤<=Φ−Φ⎜⎟⎜⎟⎝⎠⎝⎠=Φ−Φ−=Φ−∑解由题设知故0.951()0.975; 1.96,15.3664222,16n n n n +Φ≥=≥≥即查表得故因此样本容量最少应取。
常见统计分布及其特点统计分布是描述数据集合中数据分布情况的一种方法。
统计学中存在着很多常见的统计分布,每个分布都具有其独特的特点和应用领域。
以下是一些常见的统计分布及其特点的介绍。
1. 正态分布(Normal Distribution)正态分布是最常见的分布之一,也被称为高斯分布。
它的特点是呈钟形曲线,对称分布,均值和标准差完全决定了其形状。
正态分布有广泛的应用,尤其在自然科学和社会科学中。
2. 二项分布(Binomial Distribution)二项分布是指在一系列独立的试验中,每次试验只有两个可能的结果:成功或失败。
每次试验的成功概率由固定的参数p确定。
二项分布的特点是具有两个参数n和p,其中n为试验的次数,p为每次试验的成功概率。
二项分布在生物学、医学、工程等领域中经常被使用。
3. 泊松分布(Poisson Distribution)泊松分布用于描述单位时间内事件发生的次数的概率分布。
这个分布有一个参数λ,表示单位时间内事件的平均发生率。
泊松分布的特点是时间间隔内事件的数量是不确定的,但平均发生率λ是已知的。
泊松分布在物理学、生物学、通信技术等领域中被广泛应用。
4. 均匀分布(Uniform Distribution)均匀分布是指在一个有限的区间内,每个数出现的概率相等。
均匀分布的特点是概率密度函数在区间内是常数。
均匀分布在模拟、随机数生成等领域中经常被使用。
5. 指数分布(Exponential Distribution)指数分布用于描述一个事件发生之间的时间间隔的概率分布。
指数分布的特点是具有一个参数λ,表示事件的平均发生率。
指数分布在可靠性工程、生物学、等领域中被广泛应用。
6. t分布(t Distribution)t分布是用于小样本情况下的假设检验和置信区间估计的重要分布。
与正态分布相比,t分布的尾部更厚,更适合于小样本情况的推断。
t分布在统计学中常用于处理样本容量较小的情况。
7. F分布(F Distribution)F分布是用于分组之间方差的比较的一种分布。
统计学分布类型
统计学分布是根据数据分析所有可能的可能的量的范围,把它们分类成多个分组,并建立相应的概率函数,以描述这些变量出现的可能性。
统计学分布由以下几种类型:
1、正态分布:正态分布是最常见的统计学分布,又称钟形曲线。
它具有两个参数:平均值μ和标准差σ,针对一些机器运行正态分布可以用来模拟变量的分布情况;
2、均匀分布:均匀分布是指变量的概率分布在一个给定的范围内是均匀的,它由两个参数:最小值a和最大值b决定;
3、伽马分布:伽马分布又称卡方分布,是描述连续随机变量采样期望值与其标准差之比的分布。
它包含一个参数,即期望值与标准差之比γ;
4、负指数分布:负指数分布也称指数分布,是一个经典的概率分布,它可以解释一系列以负指数或非负指数的累积概率分布,它包含一个参数λ,它是和具体分布有关的常数;
5、卡方分布:卡方分布是一种统计分布,又称伽马分布,是描述连续随机变量采样期望值与其标准差之比的分布。
卡方分布由一个参数ν决定,变量ν是采样期望与标准差之比;。
统计学常用分布一、引言在统计学中,分布是描述数据变化规律和概率的重要工具。
不同的数据类型和问题背景需要采用不同的分布来描述。
本篇文章将介绍统计学中常用的几种分布,包括正态分布、二项分布与泊松分布、指数分布与对数正态分布、卡方分布与t分布等。
二、正态分布正态分布是最常见的连续概率分布之一,它在自然现象、工程技术和社会科学等领域都有广泛的应用。
正态分布的曲线呈钟形,数据值集中在均值附近,随着远离均值,概率逐渐减小。
正态分布在统计学中具有重要地位,许多统计方法和模型都以正态分布为基础。
三、二项分布与泊松分布1.二项分布:二项分布是用来描述伯努利试验中的随机事件的概率分布,其中每次试验只有两种可能的结果,并且每次试验都是独立的。
二项分布适用于计数数据,尤其在生物实验和可靠性工程等领域有广泛应用。
2.泊松分布:泊松分布是二项分布在伯努利试验次数趋于无穷时的极限形式,常用于描述单位时间内随机事件的次数。
泊松分布在概率论和统计学中具有重要地位,广泛应用于保险、通信和生物医学等领域。
四、指数分布与对数正态分布1.指数分布:指数分布描述的是随机事件之间的独立间隔时间或者随机变量的概率分布。
指数分布常用于描述寿命测试和等待时间等问题,例如电话呼叫的间隔时间和电子元件的寿命等。
2.对数正态分布:对数正态分布在统计学中用于描述那些其自然对数呈正态分布的随机变量。
许多生物学、经济学和社会科学中的数据都服从对数正态分布,例如人的身高、体重以及股票价格等。
五、卡方分布与t分布1.卡方分布:卡方分布在统计学中主要用于描述离散型概率分布。
卡方分布是通过对两个独立的随机变量进行平方和运算得到的,常用于拟合检验和置信区间的计算。
2.t分布:t分布在统计学中广泛应用于样本数据的参数估计和假设检验。
相比于正态分布,t分布在数据量较小或参数偏离正态性时具有更好的稳定性。
t分布在金融、生物医学和可靠性工程等领域有广泛应用。
六、结论在统计学中,不同的数据类型和问题背景需要采用不同的分布来描述。
第八章常用统计分布第一节超几何分布超几何分布的数学形式・超几何分布的数学期望和方差・超几何分布的近似第二节泊松分布泊松分布的数学形式•泊松分布的性质、数学期望和方差・泊松分布的近似2第三节卡方分布(分布)2分布的数学形式,彳分布的性质、数学期望和方差•样本方差的抽样分布第四节F分布F分布的数学形式・F分布的性质、数学期望和方差• F分布的近似一、填空1 •对于超几何分布,随着群体的规模逐渐增大,一般当—<()时,可采用二N项分布来近似。
2•泊松分布只有一个参数(),只要知道了这个参数的值,泊松分布就确定了。
3 •卡方分布是一种()型随机变量的概率分布,它是由()分布派生出来的。
4•如果第一自由度k i或第二自由度k2的F分布没有列在表中,但邻近的第一自由度或第二自由度的F分布已列在表中,对于F a( & , k2)的值可以用()插值法得到。
5. ( )分布具有一定程度的反对称性。
6. ( )分布主要用于列联表的检验。
7. ( 分布用于解决连续体中的孤立事件。
& 2分布的图形随着自由度的增加而渐趋()。
9•当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时(可采用二项分布来近似。
10. ()事件是满足泊松分布的。
二、单项选择1 •已知离散性随机变量X服从参数为2=2的泊松分布,则概率P (3;入)=(A 4/3e 2B 3/3e 2C 4/3e 3D 3/3e 32.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时, ( ) 分布可以用二项分布来近似。
2A t 分布B F 分布C 2 分布D 超几何分布3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概 率分布,应选择( )。
A 二项分布B 超几何分布C 泊松分布D F 分布 4.对于一个样本容量 n 较大及成功事件概率 p 较小的二项分布,都可以用( )来 近似。
A 二项分布 B 超几何分布 C 泊松分布DF 分布。
5.与 F a ( k 1, k 2)的值等价的是()。
A F 1-a( k 1 ,k 2)BF 1-a (k 2 , k 1)C 1/F a ( k 1, k 2)D 1/F 1-a (k 2 , k 1 )6、只与一个自由度有关的是( )A22分布 B 超几何分布C 泊松分布DF 分布三、多项选择1.属于离散性变量概率分布的是()。
A 二项分布B 超几何分布C 泊松分布D F 分布 2.属于连续性变量的概率分布的是( )。
2A 分布B 超几何分布C 泊松分布D F 分布 3.下列近似计算概率的正确方法是()。
A 用二项分布的概率近似计算超几何分布的概率B 用二项分布的概率近似计算泊松分布的概率C 用泊松分布的概率近似计算超二项分布的概率D 用正态分布的概率近似计算超二项分布的概率E 用正态分布的概率近似计算F 分布的概率6.一般地,用泊松分布近似二项式分布有较好的效果是(24. 2 分布具有的性质是(A 恒为正值 C 反对称性 E 可加性5.F 分布具有的性质是(A 恒为正值 C 反对称性 E 可加性)。
B 非对称性 D 随机变量非负性 )。
B 非对称性 D 随机变量非负性)。
A n/N < 0.1B n》10C p w 0.1D k>30E k2>2四、名词解释1.超几何分布2.泊松分布3.卡方分布4.F 分布五、判断题1.在研究对象为小群体时,二项式分布和超几何分布的基本条件都能得到满足。
()2. 成功次数的期望值入是决定泊松分布的关键因素。
()3.泊松分布的数学期望和方差是相等的。
()4. 在计算F 分布的概率时,只需要知道分子的自由度和分母的自由度两个因素就可以了。
()5. k 个独立标准正态变量的平方和被定义为卡方分布。
()6. 卡方分布的随机变量是若干个独立标准正态变量的平方和。
()7. 相互独立的两个卡方变量与其自由度的商的比值为 F 分布的变量。
()8. 当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时泊松分布可采用二项分布来近似。
()9. 泊松分布用于解决连续体中的孤立事件。
()10. F分布具有一定程度的反对称性。
()六、计算题1 .某社区要选派8 名积极申请参加公益活动的居民从事一项宣传活动。
申请者为12名女性居民和8 名男性居民。
社区宣传活动的组织者把他们的名字完全混合后放在一个盒子里,并从中抽取8 个。
试问,抽出 4 名女性居民的概率是多少?2. 有16 名二年级学生和14 名三年级学生选修了社区管理课。
假设所有学生都会来教室上课,而且是随机进入教室的。
试问,当一名学生进入教室时,恰逢已在教室就坐的5位都是三年级的概率是多少?3. 某区进行卫生大检查,现对区内全部40 个单位进行卫生合格验收。
检查团随机抽查4 个单位,只要有 1 个单位不合格就取消该区的卫生评先资格。
如果该区确有10%的单位卫生不合格,试问:(1)抽查的 4 个单位中有 1 个单位是不合格单位的概率是多少?(2)经抽查,该区没被取消评先资格的概率是多少?(3)计算分布的期望值和方差。
4. 设在填写选民证时,1 000个选民证中共有300个错字被发现。
问在一张选民证上有一个错字的概率是多少?5. 某社区对失业者进行某项培训,参加培训的共有100人。
根据以前的培训经验,项目负责人估计有4%的培训者不能掌握这门技术。
问在参加培训的100名失业者中至少有5人为未掌握这项技术的概率是多少?6. 每小时有30个老人穿过一条人行道。
在5分钟内,没有老人穿过该人行道的概率是多少?7. 从一正态总体中抽出一个容量为20的样本。
已知总体的方差为5。
求样本的方差在3.5至U 7.5之间的概率。
&查表求F0.95 (15 , 7)的值。
29 .已知Z0.i=1.64。
求0.1 (1)的值。
10. 已知F o。
01(120 . 12) = 1 . 88, 01( 12) = 1 . 85。
求F o。
1(150 . 12)的值。
11. 一页书上印刷错误的个数X是一个离散型随机变量,它服从参数为(>0)的泊松分布,一本书共400页,有20个印刷错误,求:(1 )任取I页书上没有印刷错误的概率;(2)任取4页书上都没有印刷错误的概率.312. 某种产品表面上疵点的个数X是一个离散型随机变量,它服从参数为=-的泊2松分布,规定表面上疵点的个数不超过2个为合格品,求产品的合格率。
13. 每10分钟内电话交换台收到呼唤的次数X是一个离散型随机变量,它从参数为(>0)的泊松分布,已知每10分钟内收到3次呼唤与收到4次呼唤的可能性相同,求:(1 )平均每10分钟内电话交换台收到呼唤的次数;(2)任意10分钟内电话交换台收到2次呼唤的概率.14. 设离散型随机变量X服从参数为(>0)的泊松分布,且已知概率P{X 1}= 2,求:e(1) 参数值;(2) 概率P{1< X < 3};(3) 数学期望E(3X);⑷方差D(3X).七、问答题1. 简述卡方分布的性质。
2 .简述F分布的性质。
参考答案一、填空21. 0.12.入3.连续,正态4.调和5. F6. 7 .泊松 8.对称 9.超几何分布 10. 稀有二、单项选择1. A2. D3. C4. C5. D6. A三、 多项选择1. ABC2.. AF3. ACDE4. ABE5. ABC6. BC四、 名词解释1.超几何分布超几何分布以样本内的成功事件的个数x 为随机变量。
共有K 个,设从中抽取n 个为一样本,则样本中成功类个数式中:x < K , 0< x < n,0 < K < N 。
超几何分布的数学期望 厂巴,方差宀n(N n)(N宝NN(N 1)2. 泊松分布泊松分布为离散型随机变量的概率分布,随机变量为样本内成功事件的次数。
若 口为成功次数的期望值, 假定它为已知。
而且在某一时空中成功的次数很少, 超过5次的成功概 率可忽不计,那么稀有事件出现的次数 x 的泊松概率分布为xP (x )= P (x ;入)= ex!泊松分布的期望值和方差均等于它的唯一参数入。
3. 卡方分布设随机变量X 1, X 2,…X k ,相互独立,且都服从同一的正态分布 N ( 口,er 2)。
那么,我们可以先把它们变为标准正态变量Z 1, Z 2,…Z k , k 个独立标准正态变量的平方和被定义2 2为卡方分布( 分布)的随机变量若总体单位数为N ,其中成功类 x 的超几何概率分布为P (x )= H (x : N , n , K )x n XC K C N KC N的自由度k2叫做第二自由度。
五、判断题(X ii 1)2k乙2i 1其中k为卡方分布的自由度,它表示定义式中独立变量的个数。
2分布的期望值是自由度k,方差值为自由度的2倍。
4. F分布F分布是连续型随机变量的另一种重要的小样本分布。
设2 ( k1)和2 ( k2)相互独立,那么随机变量F ( k1, k2)= 22(kJ/k1 2服从自由度为(& , k2)的F分布。
其中, 分子上的自由度 &叫做第一自由度,分母上1. ( X ) 6. ( V )3. ( V )8. ( X )4. ( X )9. ( V )5. ( V )10. ( V )六、计算题1. 0.2752. 0.01403. 解:抽到不合格单位数量x服从N= 40、n= 4的超几何分布(1)K= 1时P (x= 1)1C4C36 4 7140 n91390336C4C403125(2)K= 0时P (x= 0) c:c36c:。
1 58905 = 0.913906445(3) K= 4 , N= 40、n= 4= E( x)= nK 440=0.1d 2= D (x) n(N n )(NN (N 1)K)K 4 (40 4)240 (40 1)凹一红‘ =0.33231 4. 入= 0.3, P ( 1;入)=0.22225•提示:用泊松分布近似二项分布; (3;入)一P (4;入)=0.3716. 0.08217. 〜0.758. 0.369 9.2.6910. 1.874七、问答题1•答:(1) 2恒为正值,且(2;k)d 2= 12 2(2) 分布的期望值是自由度k ,方差值为自由度的 2倍,即对 (k )有2 2E( )=k , D( ) = 2k对k v 2,2分布呈L 形。
2分布随自由度k 的增加而渐趋对称。
当 k —R 时,2分布以正态分布为极限。
2•答:2(1) 随机变量F 和随机变量 一样,恒取正值,F 分布密度曲线下总面积亦为 1。
(2) F 分布也是一个连续的非对称分布。