当前位置:文档之家› 最常用的统计学概率分布总结(含清晰图)

最常用的统计学概率分布总结(含清晰图)

最常用的统计学概率分布总结(含清晰图)
最常用的统计学概率分布总结(含清晰图)

复习: 统计推断常用概率分布

1.随机变量分布函数

(1)累积分布函数(Cumulative Distribution Function (CDF))

If X is any random variable, then its CDF is defined for any real number x by

P X x

(2)概率密度函数(Probability Density Function (PDF))

The probability density function (PDF) f(x) of a continuous distribution is defined as the derivative of the (cumulative) distribution function F(x),

d

d

so we have

dt

2. 正态分布(normal distribution ) (1)概率密度函数(PDF )

|μ,σ

1σ√2π

e

μ

以上结果可表示为 ~ ,

.

标准正态分布(standard normal distribution )表示为N(0,1)

x μ

~N 0,1

(2) 累积分布函数 (CDF)

1

σ√2π

e

μ

dt

3. Chi-squared ( )分布

如果Z1, Z2 ..., Z n是相互独立的随机变量,且都服从于N(0,1)分布,那么

服从自由度(degree of freedom, df)为n的χ 分布,记为X~χ n . (1)PDF of χ

(2)CDF of χ

4. t-分布(student's t-distribution)

设)n (~Y )1,0(N ~X 2χ和,且X 和Y 相互独立,则称随机变量

n Y X T /=

服从df. 为n 的t-分布,记为T ~ t(n)。 (1)PDF of t-distribution

(2)CDF of t-distribution

5. F-分布

X和Y是相互独立的χ 分布随机变量,d.f分别为m和n,则称随机变量

n/ Y m

/

X

F=

服从df.为 (m, n)的F-分布,且通常写为F~F(m,n)。(1)PDF of F distribution

(2)CDF of F distribution

概率论重要知识点总结

概率论重要知识点总结 概率论重要知识点总结 第一章随机事件及其概率 第一节基本概念 随机实验:将一切具有下面三个特点: (1)可重复性 (2)多结果性 (3)不确定性的试验或观察称为随机试验,简称为试验,常用表示。 随机事件:在一次试验中,可能出现也可能不出现的事情(结果)称为随机事件,简称为事不可能事件:在试验中不可能出现的事情,记为。必然事件:在试验中必然出现的事情,记为Ω。 样本点:随机试验的每个基本结果称为样本点,记作ω.样本空间:所有样本点组成的集合称为样本空间.样本空间用Ω表示.一个随机事件就是样本空间的一个子集。基本事件—单点集,复合事件—多点集一个随机事件发生,当且仅当该事件所包含的一个样本点出现。事件的关系与运算(就是集合的关系和运算)包含关系:若事件发生必然导致事件B发生,则称B 包含A,记为,则称事件A与事件B 相等,记为A=B。 事件的和:“事件A 与事件B 至少有一个发生”是一事件,称此事件为事件A 与事件B 事件的积:称事件“事件A与事件B 都发生”为A 或AB。事件的差:称事件“事件A 发生而事件B 不发生”为事件A 与事件B 的差事件,记为A-B。用交并补可以表示为互斥事件:如果A,B两事件不

能同时发生,即AB=Φ,则称事件A 与事件B 是互不相容事件或互斥事件。互斥时可记为A+B。对立事件:称事件“A不发生”为事件A 的对立事件(逆事件),记为A 。对立事件的性质:事件运算律:设A,B,C为事件,则有: (1)交换律:AB=BA,AB=BA A(BC)=(AB)C=ABC (3)分配律:A(BC)=(AB)(AC)ABAC (4)对偶律(摩根律): 第二节事件的概率 概率的公理化体系:第三节古典概率模型1、设试验E 是古典概型,其样本空间Ω个样本点组成.则定义事件A 的概率为的某个区域,它的面积为μ(A),则向区域上随机投掷一点,该点落在区域假如样本空间Ω可用一线段,或空间中某个区域表示,则事件A 的概率仍可用上式确定,只不过把μ理解为长度或体积即可.第四节条件概率条件概率:在事件B 发生的条件下,事件A 发生的概率称为条件概率,记作乘法公式: P(AB)=P(B)P(A|B)=P(A)P(B|A)全概率公式:设第五节事件的独立性两个事件的相互独立:若两事件A、B 满足P(AB)=相互独立.三个事件的相互独立:对于三个事件A、B、C,若P(AB)=相互独立三个事件的两两独立:对于三个事件A、B、C,若P(AB)=两两独立独立的性质:若A 均相互独立总结: 1.条件概率是概率论中的重要概念,其与独立性有密切的关系,在不具有独立性的场合,它将扮演主要的角色。 2.乘法公式、全概公式、贝叶斯公式在概率论的计算中经常使用,应

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量2222 12n =+X X χ++…X 为 服从自由度为n 的2χ分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值 的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n αχχ,对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量 T = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

概率论与数理统计期末总结

第1章 概率论的基本概念 1.1 随机试验 称满足以下三个条件的试验为随机试验: (1)在相同条件下可以重复进行; (2)每次试验的结果不止一个,并且能事先明确所有的可能结果; (3)进行试验之前,不能确定哪个结果出现。 1.2 样本点 样本空间 随机事件 随机试验的每一个可能结果称为一个样本点,也称为基本事件。 样本点的全体所构成的集合称为样本空间,也称为必然事件。必然事件在每次试验中必然发生。 随机试验的样本空间不一定唯一。在同一试验中,试验的目的不同时,样本 空间往往是不同的。所以应从试验的目的出发确定样本空间。 样本空间的子集称为随机事件,简称事件。 在每次试验中必不发生的事件为不可能事件。 1.3 事件的关系及运算 (1)包含关系 B A ?,即事件A 发生,导致事件B 发生; (2)相等关系 B A =,即B A ?且A B ?; (3)和事件(也叫并事件) B A C ?=,即事件A 与事件B 至少有一个发生; (4)积事件(也叫交事件) B A AB C ?==,即事件A 与事件B 同时发生; (5)差事件 AB A B A C -=-=,即事件A 发生,同时,事件B 不发生; (6)互斥事件(也叫互不相容事件) A 、 B 满足φ=AB ,即事件A 与事件B 不同时发生; (7)对立事件(也叫逆事件) A A -Ω=,即φ=Ω=?A A A A ,。

1.4 事件的运算律 (1)交换律 BA AB A B B A =?=?,; (2)结合律 ()()()()C AB BC A C B A C B A =??=??,; (3)分配律 ()()()()()()C A B A BC A AC AB C B A ??=??=?,; (4)幂等律 A AA A A A ==?, ; (5)差化积 B A AB A B A =-=-; (6)反演律(也叫德·摩根律)B A AB B A B A B A B A ?==?=?=?,。 1.5 概率的公理化定义 设E 是随机试验,Ω为样本空间,对于Ω中的每一个事件A ,赋予一个实数P (A ),称之为A 的概率,P (A )满足: (1)1)(0≤≤A P ; (2)1)(=ΩP ; (3)若事件 ,,, ,n A A A 21两两互不相容,则有 () ++++=????)()()(2121n n A P A P A P A A A P 。 1.6 概率的性质 (1)0)(=φP ; (2)若事件n A A A ,, , 21两两不互相容,则())()()(2121n n A P A P A P A A A P +++=??? ; (3))(1)(A P A P -=; (4))()()(AB P B P A B P -=-。 特别地,若B A ?,则)()(),()()(B P A P A P B P A B P ≤-=-; (5))()()()(AB P B P A P B A P -+=?。

正态分布总结

第13讲 正态分布 教学目的:理解并熟练掌握正态分布的密度函数、分布函数、数字特征及线性性质。 教学重点:正态分布的密度函数和分布函数。 教学难点:正态分布密度曲线的特征及正态分布的线性性质。 教学学时:2学时 教学过程: 第四章 正态分布 §4.1 正态分布的概率密度与分布函数 在讨论正态分布之前,我们先计算积分()? ∞ +∞ --- dx e x 2 2 221σ μσ π。 首先计算? ∞ +∞ --dx e x 2 2 。因为 π θ σπ 20 2 20 2 2 2 2 2 2 22 2 == = ?? ? ?? ? ? ∞ +- +- ∞ +∞ -- ∞ +∞ --rdr e d d e dy e dx e r R x x y x (利用极坐标计算) 所以π 22 2 =? ∞ +∞ -- dx e x 。 记 t x =-σ μ ,则利用定积分的换元法有 ()1 2212121212 2 22 2 2 2 == = = ? ? ? ∞ +∞ -- ∞ +∞ -- ∞ +∞ --- ππ π π σ πσ μdt e dt e dx e t t x 因为 ()0 212 2 2≥-- σ μσ πx e ,所以它可以作为某个连续随机变量的概率密度函数。 定义 如果连续随机变量X 的概率密度为 ()(), ,212 2 2+∞<<∞-= -- x e x f x σ μσ π

则称随机变量X 服从正态分布,记作()2 ,~σμN X ,其中()0,>σ σμ是正态分布的参 数。正态分布也称为高斯(Gauss )分布。 对于1,0==σμ的特殊情况,即如果()1,0~N X ,则称X 服从标准正态分布,它的概率密度记为()x ?,有()2 2 21x e x - = π ?。 函数()2 2 21x e x - = π?的图象的特点: 令()0 22 2 =-= '- x e x x π ?,得驻点0=x 。根据()x ?'的正负性可知, 0=x 是()x ?的 极大值点,该点坐标为???? ? ? π21 , 0。 令()()0 212 2 2 =-= ''- x e x x π ?,得1±=x ,根据()x ?''的正负性可知,函数()x ?在() 1,-∞-和()+∞,1内是凹的,在()1,1-内是凸的, ???? ? ? --2 121, 1e π 和??? ? ? ?- 2 121,1e π 是拐点。 因为021lim 2 2 =- ∞ →x x e π ,所以x 轴是该曲线的渐近线。 根据()x ?的偶函数性质,函数()x ?的图象关于y 轴对称。 根据上述特点作出()x ?的曲线如下:

spss教程常用的数据描述统计:频数分布表等统计学

第二节常用的数据描述统计 本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。 1.数据 这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。 图2-2:数据输入格式示例 1.Frequencies语句 (1)操作 打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。 图2-3:Frequencies定义窗口 把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求

显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一些统计量,及统计图表,还需要进一步设置。 ①Statistics选项 单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下: (ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有: ●Quartiles四分位数,即显示25%、50%、75%的百分位数。 ●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。 Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有: ●Mean 算术平均数 ●Median 中数 ●Mode 众数 ●Sum 算术和 (ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有: ●Std. Deviation 标准差 ●Variance 方差 ●Range 全距 ●Minimum 最小值 ●Maximum 最大值 ●S.E. mean 平均数的标准误 (ⅳ)描述数据分布(Distribution)的统计量 ●Skewness 偏度,非对称分布指数。 ●Kurtosis 峰度,CASE围绕中心点的扩展程度。 另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

项分布、超几何分布、正态分布总结归纳及练习

二项分布?还是超几何分布 二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用 这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析. 8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列; (2)不放回抽样时,取到黑球的个数Y的分布列. 解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率 均为 5 1,3次取球可以看成3次独立重复试验,则1~35X B ?? ???,. 3 3 1464(0)55125P X C ????==?= ? ?????∴; 1 2 131448(1)55125P X C ????==?= ? ?????; 2 1 23 1412(2)55125P X C ????==?= ? ?????; 3 33141(3)55125 P X C ????==?= ? ?????. 因此,X 的分布列为 (2)不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有: 03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101 (2)15 C C P Y C ===. 因此,Y 的分布列为 某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40件产品作为样本 称出它们的重量(单位:克),重量的分组区间为(490,495],(495,500],……,(510,515],由此 得到样本的频率分布直方图,如图4 (1)根据频率分布直方图,求重量超过505克的产品数量, (2)在上述抽取的40件产品中任取2件,设Y 为重量超过505克 的产品数量,求Y 的分布列; (3)从该流水线上任取5件产品,求恰有2件产品的重量超过505 克的概率。

三大抽样分布

三大抽样分布 众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。 三大抽样分布的研究意义 c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。为此,要想研究三大抽样分布,就应该对其发展过程进行研究。统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。 X2分布 x2的早期发展 由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。1891年,X2分布首次被作为统计量的分布导出。Pizzetti在求线性 模型最小二乘估计残差平方和的分布时,通过富氏分析法得出了X2的分布。随着时代的发展,正态分布理论的局限更加明显,更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人,成为了一代统计学巨人。按照他的观点,统计学应该把在模型基础上对观测数据进行有效预测作为基本任务,所以他开创了一族曲线对观测数据进行拟合,使得分布拟台数据的应用范围进一步扩大。 X2模型

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍 2分布,t 分布,F 分布和正态分布的定义及基本性质, 然后 用理论说明2分布,t 分布,F 分布与正态分布的关系,并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2(n )分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme )赫尔默特(Helmert )、皮尔逊分别于1858年、1876年、1900年所发 现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量X 1,X 2,…X n 相互独立,且都来自正态总体 N (0,,),则称 统计量 2 =x ; X ;…+X ;为服从自由度为n 的2分布,记为 2 2 ~ (n ). 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数(X ) e t t x 1dt,x 0, 2 分布的密度函数图形是一个只取非负值 的偏态分布,如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立,则X! X2~ 2g n2); 性质3: n 时,2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件: P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位 数的值已经编制成表供查 分布,是由英国统计学家戈赛特在1908年“student的'笔名 布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立,,则称统计量T —X VY/ n 分布,记为T~t( n). 为 性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布, 记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条 件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查 用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名 首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n .

正态分布、概率

信息系统项目管理师重点知识点:完工概率计算总结 例图: 活动BCD的乐观(m)工期都是9天,最可能(o)工期为12天,最悲观(p)工期都是15天,那么在14天内完成单项活动的概率和完成全部这三项活动的概率是多少 首先计算平均工期(PERT):公式--(乐观时间+4*最可能时间+悲观时间)/ 6 (9+4*12+15)/6=12天; 其次计算标准差:公式--(悲观时间-乐观时间)/ 6 ; (15-9)/6=1天 再计算偏离平均工期:方法--[给出的天数计算(14)-计算出来的平均工期(12)]/标准差(1) (14-12)/1=2 备注:此时得出来的为几,之后就是使用几西格玛 (Sigma)(1σ=68,37%)(2σ=95.46%)(3σ=99.73%)(6σ=99.99966%百万分之三点四) 计算每一项活动在14天内完工的概率是:方法--正态分布概率+西格玛/偏离平均工期数 50%+95.46%/2=97.73% 备注:50%参考正态分布图,95.46参考2西格玛值; 计算全部活动在14天内完工概率是:方法--每一项活动的概率相乘 97.73%*97.73%*97.73%=93.34% 下图为简要正态分布图:

备注:正态分布有50%成功,有50%不成功 如计算将上面的14天,修改为13天; 偏离平均工期就是1天,计算方法:(13-12)/1=1天,则应该使用1西格玛; 计算每一项活动在13天内完工的概率是:方法--正态分布概率+西格玛/偏离平均工期数 50%+68.37%/2=84.19% 备注:50%参考正态分布图,68.37参考1西格玛值; 计算全部活动在13天内完工概率是:方法--每一项活动的概率相乘 84.19%*84.19%*84.19%=59.67% 如果计算为11-15天的概率:最小值的概率+最大值的概率 68.37/2+99.75/2=84.06%

统计学常用分布

二项分布(,)B n p n 为试验次数,p 为每次成功概率 {}x x n x n p X x C p q -== 其中1p q += (),()E X np Var X npq == ()()tX t n E e q pe =+其中t -¥<<¥ 解释:n 重贝努里实验中正好成功x 次的概率 几何分布()Geo p p 为成功概率 ()x P X x pq == 2(),()E X q p Var X q p == ()(1),ln tX t E e p qe t q =-<- 解释:n 重贝努里实验中首次成功正好在第x+1次 负二项分布(,),1NB k p k >,k 为成功次数,01p <<,p 为成功概率 1{}x k x k x P X x C p q +-== 2(),()E X kq p Var X kq p == ()(),ln 1tX k t p E e t q qe =<-- 解释:贝努里实验系列中第k 次成功正好出现在第x +k 次实验上地概率 泊松分布()P l {},0! x P X x e x l l l -==> (),()E X Var X l l == (1)()t tX e E e e l -=,t -¥<<¥ 解释:贝努里概型中的实验次数很大,但每次成功的概率很小,平均成功次数接近于常数

均匀分布(,)U a b 1 (),X f x a x b b a =<<-;(),X x a F x a x b b a -=<<- 2 ()(),()212a b b a E X Var X +-== 11 ()(1)()r r r b a E X r b a ++-=+- 正态分布2(,)N m s 2 1) 2()x X f x m s -- = 2(),()E X Var X m s == 22 1 2()t t tX E e e m s += 对数正态分布2log (,)N m s 2 1 ln () 2()x X f x m s --=2 221 22(),()(1)E X e Var X e e m m s s ++==- 22 1 2()t t t E X e m s += 解释:如果X~2log (,)N m s ,则logX ~2(,)N m s 指数分布()Exp l ()x X f x e l l -=,()1x X F x e l -=- 21 1 (),()E X Var X l l == (1) ()r r r E X l G += 1()(1,X t M t t l l -=-<

二项分布、超几何分布、正态分布总结归纳与练习

二项分布?还是超几何分布 二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用 这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.例 1 袋中有 8 个白球、 2 个黑球,从中随机地连续抽取 3 次,每次取 1 个球.求:( 1)有放回抽样时,取到黑球的个数X的分布列; ( 2)不放回抽样时,取到黑球的个数Y的分布列. 解:( 1)有放回抽样时,取到的黑球数X可能的取值为0,1, 2, 3.又由于每次取到黑球的概率 均为1 , 3 次取球可以看成 3 次独立重复试验,则 1 ,.5X~B 35 0312 ∴ P(X 0) C301 464 ;P(X 1)C31 1 448 ; 5512555125 21 P(X 3) C33 130 P(X 2) C321 412 ;4 1 .5512555125 因此, X 的分布列为 X0123 P 6448121 125125125125 (2)不放回抽样时,取到的黑球数Y可能的取值为0, 1,2,且有: P(Y 0)C20C837 ;P(Y1)C21C82 7 ;P(Y2)C22C81 1 . C10315C10315C10315 因此, Y 的分布列为 Y012 771 P 1515 15 例 2 某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40 件产品作为样本称出它们的重量(单位:克),重量的分组区间为(490,495] , (495,500] ,,, ,(510,515] ,由此得到样本的频率分布直方图,如图4 ( 1)根据频率分布直方图,求重量超过505 克的产品数量 , ( 2)在上述抽取的40 件产品中任取 2 件,设 Y 为重量超过505 克 的产品数量,求Y 的分布列; ( 3)从该流水线上任取 5 件产品,求恰有 2 件产品的重量超过505 克的概率。

二项分布、超几何分布、正态分布总结归纳及练习

二项分布与超几何分布辨析 二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析. 例 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列; (2)不放回抽样时,取到黑球的个数Y的分布列. 解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均 为,3次取球可以看成3次独立重复试验,则1~35X B ?? ???,. 3 03 1464(0)55125P X C ???? ==?= ? ????? ∴; 12 13 1448(1)55125 P X C ???? ==?= ? ?????; 21 231412(2)55125P X C ???? ==?= ? ?????; 3 33 141(3)55125 P X C ???? ==?= ? ?????. 因此,X 的分布列为 X 0 1 2 3 P 64125 48125 12125 1125 2.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有: 03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101 (2)15 C C P Y C ===. 因此,Y 的分布列为 Y 0 1 2 P 715 715 115 辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的. 超几何分布和二项分布都是离散型分布

统计学三大分布与正态分布的差异

申请大学学士学位论文 大学 学士学位论文 统计学三大分布与正态分布的差异年级专业: 学生: 指导教师:

统计学三大分布与正态分布的差异 中文摘要 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策者提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。而对数据的分析过程中就需要利用到数据的分布来研究分类。 在实际遇到的许多随机现象都服从或近似服从正态分布。而由正态分布构造的三大分布在实际中有广泛的应用,因为这三大分布不仅有明确的背景,而且其抽样分布的密度函数有明显表达式,研究三大分布与正态分布有助于研究实际事例,比如经济安全与金融保险领域、人口统计等。 本文讨论了三大分布与正态分布,并将它们之间的密度函数进行比较说明. 第二章介绍了正态分布的定义、性质,三大分布的定义、性质。 第三章介绍了正态分布与三大分布的密度函数,并将它们之间的密度函数进行比较关键词:正态分布;三大分布;密度函数 The Difference between the Three Statistical Distributions and the Normal Distribution Abstract Statistics is a branch of applied mathematics, the mathematical models are mainly established by the probability and statistics theory based on the collecting

统计学名词解释

名词解释 1.统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整 理、分析、表达和解释的一门科学。 2.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据 信息的搜集整理、分析、表达和解释的一门科学。 3.抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样。 4.统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的, 包括参数估计和假设检验。 5.总体:是根据研究目的确定的同质研究对象的全体。 6.概率:是随机事件发生可能性大小的数值度量。 7.同质:是指所研究的观察对象具有某些相同的性质或特征。 8.变异:是同质个体的某项指标之间的差异,即个体差异。 9.正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称 为近似正态分布,如果两端完全对称则称为正态分布。 10.医学参考值范围:又称正常值范围,医学上常将包括绝大多数正常人的某指 标值的波动范围称为该指标的正常值范围。 11.动态数列(dynamic series):是按照一定的时间顺序,将一系列描述某事 物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数。 12.人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口的性 别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女,两个对应的直方图,其形似金字塔。 13.负担系数(dependency ratio):又称抚养比或抚养系数,是指人口中非劳 动年龄人数与劳动年龄人数之比。 14.标准化死亡比(SMR):实际死亡人数与期望死亡人数之比称为标准化死亡比。

贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。

3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,

随机变量及其分布 小结与复习

复习课: 随机变量及其分布列 教学目标 重点:理解随机变量及其分布的概念,期望与方差等的概念;超几何分布,二项分布,正态分布等的特点;会求条件概率,相互独立事件的概率,独立重复试验的概率等. 难点:理清事件之间的关系,并用其解决一些具体的实际问题. 能力点:分类整合的能力,运算求解能力,分析问题解决问题的能力. 教育点:提高学生的认知水平,为学生塑造良好的数学认识结构. 自主探究点:例题及变式的解题思路的探寻. 易错点:容易出现事件之间的关系混乱,没能理解问题的实际意义. 学法与教具 1.学法:讲授法、讨论法. 2.教具:投影仪. 一、【知识结构】 二、【知识梳理】 1.随机变量 ⑴随机变量定义:在随机试验中,使得每一个试验结果都用一个确定的数字表示.在这个对应关系下,数字随着试验结果的变化而变化.像这种随着试验结果变化而变化的变量称为随机变量.简单说,随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量.常用希腊字母x 、y 、ξ、η等表示. ⑵如果随机变量可能取的值可以按次序一一列出(可以是无限个)这样的随机变量叫做离散型随机变量. ⑶如果随机变量可能取的值是某个区间的一切值,这样的随机变量叫做连续型随机变量. 2.概率分布定义(分布列) 设离散型随机变量ξ可能取的值为123,,, ,i x x x x ,ξ取每一个值(1,2, )i x i =的概率 ()i i P x p ξ==,则称表 称为随机变量ξ的概率分布列,简称ξ的分布列. 注:1.离散型随机变量的分布列具有下述两个性质:

(1)0,123≥,,,i p i =;123(2)1p p p +++ = 3.常见的分布列 ⑴二项分布:在一次试验中某事件发生的概率是p ,那么在n 次独立重复试验中这个事件恰发生k 次的概 率为()(1)k k n k n p X k C p p -==-,显然x 是一个随机变量.随机变量x 的概率分布如下: 我们称这样的随机变量x 服从二项分布,记作~(, )X B n p ⑵两点分布列:如果随机变量ξ的分布列为: 这样的分布列称为两点分布列,称随机变量服从两点分布,而称(1)p P ξ==为成功概率.两点分布是特殊的二项分布(1)p ξ~B , ⑶超几何分布:一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有x 件次品数,则事件{} x k =发生的概率为(),0,1,2,3,,k N k M N M n N C C P X k k m C --===.其中{}m i n , m M n =,且*,,,, n N M N n M N N ≤≤∈,则称分布列 为超几何分布列,如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布. 4.条件概率 一般地,设,A B 为两个事件,且()0P A >,称() (|)() P AB P B A P A = 为在事件A 发生的条件下,事件B 发 生的条件概率. 注意:⑴0(|)P B A ≤≤1; ⑵可加性:如果B C 和互斥,那么[]()|(|)(|)P B C A P B A P C A =+ 5.相互独立事件的概率 ⑴相互独立事件的定义: 设,A B 两个事件, ()()()P AB P A P B =若 (即事件A 是否发生对事件B 发生的概率没有影响), 则称事

相关主题
相关文档 最新文档