§1.4常用的分布及其分位数(精)
- 格式:doc
- 大小:249.50 KB
- 文档页数:8
布,它们与正态分布一起,是试验统计中常用的分布。
2当X 1、X 2、…、Xn 相互独立且都服从 N(0,1)时,Z=v X i 的i2(n),它的分分布称为自由度等于 布密度p(z )=n 的1 AnX22- n2 0,n-1.+处 2 -u , 0u 2e du ,2分布,记作Zz _2e其他,称为Gamma 函数,且】1 =1,式中的『-=I2分布是非对称分布,具有可加性,即当丫与Z_I - = n 。
2相互独立,且丫2(n ), Z 2(m ),贝y Y+Z 〜2(n+m )。
Y+Z= X+§1.4 常用的分布及其分位数 1.卡平方分布卡平方分布、t 分布及F 分布都是由正态分布所导出的分证明:先令X 1、X 2、…、X n 、X n+1、X n+2、…、X n+m 相互独 立且都服从N(0,1),再根据 2分布的定义以及上述随机变 量的相互独立性,令 丫=X 2+X 2+…+X -, z=x 备+X 2+2+…+Xn+m ,即可得到丫+Z 〜2(n +m )。
2. t 分布若X 与丫相互独立,且X 〜N(0,1) , 丫〜2(n ),则Z =x . 丫的分布称为自由度等于n的t分布,记作Z〜t (n),它的分布密度;z2 V .n丿n 1 ~Y。
”心LP(z)=―;=时(殳)I请注意:t分布的分布密度也是偶函数,且当n>30时,t分布与标准正态分布 N(0,1)的密度曲线几乎重叠为一。
这时,t 分布的分布函数值查 N(0,1)的分布函数值表便可以得到。
3. F分布若X与丫相互独立,且X〜2(n),丫〜2(m), 则Z=X丫的分布称为第一自由度等于n、第二自由度等于n mm的F分布,记作Z〜F (n, m),它的分布密度2P (Z(m nz) 2n mn m------ in——1 z2-,z 0 n m2 20,其他。
请注意:F 分布也是非对称分布,它的分布密度与自由度1的次序有关,当 Z 〜F (n , m )时,刁〜F (m ,n )。
统计学常用分布及其分位数1. 引言在统计学中,分布是指一组数据在各个取值上的分布情况。
统计学常用的分布包括正态分布、均匀分布、二项分布等。
而分位数是衡量分布上部分数据所占比例的一个指标,常用于描述数据的分布形状和集中程度。
本文将介绍统计学常用分布以及它们的分位数。
2. 正态分布及其分位数正态分布是统计学中最重要的分布之一,其分布曲线呈钟形。
它的分布的均值为μ,方差为σ^2。
正态分布的分位数可以通过查找标准正态分布表来获得。
常用的分位数包括:•第一四分位数(Q1):将数据集分为四个部分,该分位数将数据集的前25%数据与后75%数据分开。
•第二四分位数(Q2):也就是中位数,将数据集分为两个相等的部分。
•第三四分位数(Q3):将数据集分为四个部分,该分位数将数据集的前75%数据与后25%数据分开。
3. 均匀分布及其分位数均匀分布是指在一段连续的数据区间内,各个数据点出现的概率是相等的。
均匀分布的分位数可以通过计算来获得。
常用的分位数包括:•下四分位数(Q1):将数据集分为四个部分,该分位数将数据集的前25%数据与后75%数据分开。
•上四分位数(Q3):将数据集分为四个部分,该分位数将数据集的前75%数据与后25%数据分开。
4. 二项分布及其分位数二项分布是常用的离散型分布,用于描述二分法试验在n次独立试验中成功的次数。
二项分布的分位数可以通过计算来获得。
常用的分位数包括:•下百分之P分位数:将数据集分为P%和(100-P)%两部分,下百分之P分位数将数据集的前P%数据与后(100-P)%数据分开。
5.本文介绍了统计学常用的分布及其分位数,分布的选取需要根据具体问题的特点来决定。
在实际应用中,通过计算或查表可以获得分布的分位数,从而对数据集的分布形状和集中程度有更深入的了解。
对于需要进行数据分析和统计推断的问题,了解常用分布及其分位数的特点和应用是非常重要的。
注意:本文只是对统计学常用分布及其分位数进行简要介绍,如需深入学习和应用,请参考相关的统计学教材和资料。
标准正态分布分位数表标准正态分布是统计学中非常重要的一个概念,它是指均值为0,标准差为1的正态分布。
在实际应用中,我们经常需要计算标准正态分布的分位数,以便进行概率统计和推断。
本文将介绍标准正态分布分位数表的相关知识,并提供一份标准正态分布分位数表,以供大家参考使用。
首先,我们来了解一下标准正态分布的概念。
标准正态分布的概率密度函数为:\[f(x) = \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\]其中,x为随机变量,e为自然对数的底。
标准正态分布的分布函数可以用积分形式表示:\[F(x) = \int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt\]标准正态分布的分位数即为给定概率下的随机变量取值。
以α表示给定的概率,标准正态分布的上侧概率为1-α,即P(X > x) = 1-α。
而标准正态分布分位数表则是给定概率α下,对应的随机变量取值x。
接下来,我们给出一份标准正态分布分位数表的部分内容,以便大家在实际应用中参考使用:```。
α Zα。
0.90 1.28。
0.95 1.64。
0.975 1.96。
0.99 2.33。
```。
在上表中,α表示给定的概率,Zα表示对应的标准正态分布分位数。
以α=0.95为例,对应的Zα=1.64,即在标准正态分布下,随机变量取值小于1.64的概率为0.95。
标准正态分布分位数表的使用可以帮助我们进行概率统计和推断。
例如,在假设检验中,我们可以根据标准正态分布分位数表来确定临界值,从而进行假设检验。
在置信区间估计中,我们也可以利用标准正态分布分位数表来确定置信水平对应的临界值。
总之,标准正态分布分位数表是统计学中非常重要的工具,它可以帮助我们进行概率统计和推断,为科学研究和实际应用提供了重要的支持。
希望大家在使用标准正态分布分位数表时,能够结合具体问题加以灵活运用,更好地发挥其作用。
分位数的定义和计算方法
分位数(Quantile),亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。
其中,四分位数是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
具体的计算方法如下:
1. 第一四分位数(Q₁),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
2. 第二四分位数(Q₂),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
3. 第三四分位数(Q₃),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
以上内容仅供参考,建议查阅统计学书籍或咨询专业人士以获取更全面和准确的信息。
分位数的概念和计算
分位数是统计学中常用的一种描述数据分布的方法。
它是把一组数据按大小顺序排列后,将其分成几个等份,每份里的数值大小是相等的,这些等份就称为分位数。
其中,最常用的是四分位数,即将数据分成四等份,分别为第一、第二、第三和第四个四分位数。
第二个四分位数就是中位数,它把数据分成了两个等份,中位数处于数据的正中间。
对于一个有n个数据的数据集,可以按从小到大的顺序排列,然后计算相应位置的分位数。
其中,第k个分位数的位置可以使用以下公式计算:(k/100)(n+1)。
例如,对于一个有20个数据的数据集,要计算第75个百分位数的值,位置为(75/100)(20+1)=15.75,因为要求的是75%的数据都小于等于这个数值,所以可以选取第15个数据和第16个数据的平均值作为第75个百分位数的值。
分位数的计算可以帮助我们更好地理解数据的分布情况,从而更准确地进行数据分析和统计推断。
- 1 -。
§1.4 常用的分布及其分位数1. 卡平方分布卡平方分布、t 分布及F 分布都是由正态分布所导出的分布,它们与正态分布一起,是试验统计中常用的分布。
当X 1、X 2、…、Xn 相互独立且都服从N(0,1)时,Z=∑ii X 2 的分布称为自由度等于n 的2χ分布,记作Z ~2χ(n),它的分布密度 p(z )=⎪⎪⎩⎪⎪⎨⎧>⎪⎭⎫ ⎝⎛Γ--,,00,2212122其他z e x n z n n 式中的⎪⎭⎫ ⎝⎛Γ2n =u d e u u n ⎰∞+--012,称为Gamma 函数,且()1Γ=1,⎪⎭⎫ ⎝⎛Γ21=π。
2χ分布是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。
证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、X n+m 相互独立且都服从N(0,1),再根据2χ分布的定义以及上述随机变量的相互独立性,令Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +,Y+Z= X 21+X 22+…+X 2n+ X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。
2. t 分布 若X 与Y 相互独立,且X ~N(0,1),Y ~2χ(n ),则Z =nY X 的分布称为自由度等于n 的t 分布,记作Z ~ t (n ),它的分布密度P(z)=)()(221n nn ΓΓ+2121+-⎪⎪⎭⎫ ⎝⎛+n n z 。
请注意:t 分布的分布密度也是偶函数,且当n>30时,t分布与标准正态分布N(0,1)的密度曲线几乎重叠为一。
这时, t 分布的分布函数值查N(0,1)的分布函数值表便可以得到。
3. F 分布 若X 与Y 相互独立,且X ~2χ(n ),Y ~2χ(m ), 则Z=mY n X的分布称为第一自由度等于n 、第二自由度等于m 的F 分布,记作Z ~F (n , m ),它的分布密度 p(z)=⎪⎪⎪⎩⎪⎪⎪⎨⎧>+-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ∙。
其他,00,2)(1222222z z n m n z m n m n m m n n 请注意:F 分布也是非对称分布,它的分布密度与自由度的次序有关,当Z ~F (n , m )时,Z1~F (m ,n )。
4. t 分布与F 分布的关系若X ~t(n ),则Y=X 2~F(1,n )。
证:X ~t(n ),X 的分布密度p(x )=⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ221n n n π2121+-⎪⎪⎭⎫ ⎝⎛+n n x 。
Y=X 2的分布函数F Y (y ) =P{Y<y }=P{X 2<y }。
当y ≤0时,F Y (y)=0,p Y (y )=0;当y >0时,F Y (y ) =P{-y <X<y } =x d x p y y )(⎰-=2x d x p y )(0⎰, Y=X 2的分布密度p Y (y )=21)(121221212n y n y n n n n ++-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ∙,与第一自由度等于1、第二自由度等于n的F分布的分布密度相同,因此Y=X2~F(1,n)。
为应用方便起见,以上三个分布的分布函数值都可以从各自的函数值表中查出。
但是,解应用问题时,通常是查分位数表。
有关分位数的概念如下:4. 常用分布的分位数1)分位数的定义分位数或临界值与随机变量的分布函数有关,根据应用的需要,有三种不同的称呼,即α分位数、上侧α分位数与双侧α分位数,它们的定义如下:当随机变量X的分布函数为F(x),实数α满足0 <α<1 时,α分位数是使P{X< xα}=F(xα)=α的数xα,上侧α分位数是使P{X >λ}=1-F(λ)=α的数λ,双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使P{X>λ2}=1-F(λ2)=0.5α的数λ2。
因为1-F(λ)=α,F(λ)=1-α,所以上侧α分位数λ就是1-α分位数x1-α;F(λ1)=0.5α,1-F(λ2)=0.5α,所以双侧α分位数λ1就是0.5α分位数x0.5α,双侧α分位数λ2就是1-0.5α分位数x1-0.5α。
2)标准正态分布的α分位数记作uα,0.5α分位数记作u 0.5α,1-0.5α分位数记作u1-0.5α。
(uα)=α,当X~N(0,1)时,P{X< uα}=F0,1(u0.5α)=0.5α,P{X<u0.5α}= F0,1(u1-0.5α)=1-0.5α。
P{X<u1-0.5α}= F0,1根据标准正态分布密度曲线的对称性,当α=0.5时,uα=0;当α<0.5时,uα<0。
uα=-u1-α。
如果在标准正态分布的分布函数值表中没有负的分位数,则先查出 u1-α,然后得到uα=-u1-α。
(uα)=α,论述如下:当X~N(0,1)时,P{X< uα}= F0,1(u1-α)=1-α,P{X< u1-α}= F0,1(u1-α)=α,P{X> u1-α}=1- F0,1故根据标准正态分布密度曲线的对称性,uα=-u1-α。
例如,u 0.10=-u 0.90=-1.282,u 0.05=-u 0.95=-1.645,u 0.01=-u 0.99=-2.326,u 0.025=-u 0.975=-1.960,u 0.005=-u 0.995=-2.576。
又因为P{|X|< u1-0.5α}=1-α,所以标准正态分布的双侧α分位数分别是u1-0.5α和-u1-0.5α。
标准正态分布常用的上侧α分位数有:α=0.10,u 0.90=1.282;α=0.05,u 0.95=1.645;α=0.01,u 0.99=2.326;α=0.025,u 0.975=1.960;α=0.005,u 0.995=2.576。
3)卡平方分布的α分位数记作2χα(n)。
χα(n)>0,当X~2χ(n)时,P{X<2χα(n)}=α。
2χ0.005(4)=0.21,2χ0.025(4)=0.48,例如,2χ0.05 (4)=0.71,2χ0.95(4)=9.49,2χ0.975(4)=11.1,2χ0.995(4)=14.9。
24)t分布的α分位数记作tα(n)。
当X~t (n)时,P{X<tα(n)}=α,且与标准正态分布相类似,根据t分布密度曲线的对称性,也有tα(n)=-t1-α(n),论述同uα=-u1-α。
例如,t0.95(4)=2.132,t 0.975(4)=2.776,t 0.995(4)=4.604,t 0.005(4)=-4.604,t 0.025(4)=-2.776,t 0.05(4)=-2.132。
另外,当n>30时,在比较简略的表中查不到tα(n),可用uα作为tα(n)的近似值。
5)F分布的α分位数记作Fα(n , m)。
Fα(n , m)>0,当X~F (n , m)时,P{X<Fα(n , m)}=α。
另外,当α较小时,在表中查不出F α(n , m ),须先查F 1-α(m , n ),再求F α(n , m )=),(11n m F α-。
论述如下: 当X ~F(m , n )时,P{X< F 1-α(m , n )}=1-α, P{X 1>),(11n m F α-}=1-α,P{X 1<),(11n m F α-}=α, 又根据F 分布的定义,X 1~F(n , m ),P{X 1<F α(n , m ) }=α, 因此 F α(n , m )= ),(11n m F α-。
例如,F 0.95 (3,4)=6.59,F 0.975 (3,4)=9.98,F 0.99 (3,4)=16.7,F 0.95 (4,3)=9.12,F 0.975 (4,3)=15.1,F 0.99 (4,3)=28.7,F 0.01 (3,4)=7.281,F 0.025 (3,4)=1.151,F 0.05 (3,4)=12.91。
【课内练习】1. 求分位数①χ20.05(8),②χ20.95(12)。
2. 求分位数① t 0.05(8),② t 0.95(12)。
3. 求分位数①F 0.05(7,5),②F 0.95(10,12)。
4. 由u 0.975=1.960写出有关的上侧分位数与双侧分位数。
5. 由t 0.95(4)=2.132写出有关的上侧分位数与双侧分位数。
6. 若X ~χ2(4),P{X<0.711}=0.05,P{X<9.49}=0.95,试写出有关的分位数。
7. 若X ~F(5,3),P{X<9.01}=0.95,Y ~F(3,5),{Y<5.41}= 0.95,试写出有关的分位数。
8. 设X 1、X 2、…、X 10相互独立且都服从N(0,0.09)分布,试求P{X i i2∑>1.44}。
习题答案:1. ①2.73,②21.0。
2. ①-1.860,②1.782。
3. ①1488.,②3.37。
4. 1.960为上侧0.025分位数,-1.960与1.960为双侧0.05分位数。
5. 2.132为上侧0.05分位数,-2.132与2.132为双侧0.1分位数。
6. 0.711为上侧0.95分位数,9.49为上侧0.05分位数,0.711与19.49为双侧0.1分位数。
7. 9.01为上侧0.05分位数,5.41为上侧0.05分位数,1901.与5.41为双侧0.1分位数,1541.与9.01为双侧0.1分位数。
8. 0.1。