当前位置:文档之家› 常用21个统计分布总结

常用21个统计分布总结

常用21个统计分布总结
常用21个统计分布总结

● Bernoulli ( p ) 伯努利分布

说明与例:x 为伯努利试验的结果,当试验成功,则x=1,试验失败则x=0。可以把伯努利试验理解为抛硬币,x=1为出现正面

● Binomial ( n, p ) 二项分布

(图以p=0.4,n=5为例)

说明与例:x 是重复n 次的伯努利试验结果,即x=试验成功的次数,可以理解为抛n 次硬币,正面出现的次数。

P X x =p | ()p x 1p -()1x - ; x =01 , ; 0=p ≤1

≤EX p , Var X =p 1p -()=M X t ()1p -()pe t

+=P X x =n | p , ()n x ()

p x

1p -()n x

-=

x 012...n , , , , ; 0=p ≤1

≤EX np , Var X =np 1p -()=M x t ()pe t 1p -()+[]n

=

● Multinomial ( m, p 1, ..., p n ) 多项分布

图略(因为是联合分布的多维分布)

说明与例:多项分布是二项分布的推广,二项分布结果只有两个,而多项分布结果可以有多个,比如仍骰子,x1表示n 次试验点数1出现的次数…x6表示点数6出现的次数。

● Geometric ( p ) 几何分布

(图以p=0.4为例)

说明与例:得到一次成功而进行的伯努利试验次数n ,即前面失败了n-1次,第n 次成功。比如x 可以理解为抛硬币,出现正面所抛的次数

f x 1...x n , , ()m !x 1!...x n !????p 1x

1

... p n x n

=m !i 1=n

p i x i

x i !???=P X x =p | ()p 1p -()x 1- ; x =12... , , ; 0=p ≤1≤EX 1

p ? , Var X =1p -p

2

??=M X t ()pe t

11p -()e t

-?????? , t =log 1p -()-

<

● Hypergeometric

超几何分布

(以N=10,m=5,n=4为例)

说明与例:已知N 个总体中有m 个不合格的产品,现在抽取n 个,出现不合格产品的数量。

● Negative binomial ( r, p )

负二项分布

P X x =N | M K , , ()M x ()N M

-K x -()N K ()???? ; x =01...K , , , =M N K -()-x ≤M ; N M K 0≥ , , ≤EX KM N ?? , Var X =KM N ??N M -()N K -()N N 1-()???????

=P X x =r | p , ()r x +1-x ()p r

1p -()x

;x =

01... , , ;0=p ≤1≤EX r 1p -()p ??? , Var X =r 1p -()

p

2

???=M X t ()p

11p -()e t

-??????()

r

, t =log 1p -()-

<

(改图来自维基百科,反映了一个大致的变动趋势

https://www.doczj.com/doc/e71773832.html,/wiki/%E8%B4%9F%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8

%83)

(这是以r=3,p=0.4为例进行模拟得到的)

说明与例:在一连串伯努利试验中,一件事刚好在第r+k 次试验出现第r 次的概率,如做了3+1次试验,每次成功概率为0.4, 那么该试验刚好在第四次出现第三次成功的概率就为0.1152

● Poisson ( λ )

泊松分布

说明与例:泊松分布多用来描述单位时间(面积)内随机事件发生的次数,参数λ是单位时间(面积)内随机事件的平均发生率,如显微镜下单位分区内的细菌分布数、服务设施在一定时间内受到的服务请求次数等。

● Beta ( α, β )

贝塔分布

其中1

110

(,)(1)(0,0)p q B p q x x dx

p q --=

->>?

P X x =λ | ()e λ-λx

x !??? ; x =01... , , ; 0=λ≤¥

1-()

=f x α | β , ()1

B αβ , ()????x α1-1x -()β1- , 0=x ≤ 1 , α≤0 , β>0

>EX ααβ+??? , Var X =αβ

αβ+()2αβ+1+()????????

=M X t ()1k 1

=¥

r 0=k 1

-αr +αβ+r +????

?(

)

t k

k !??

+

=

说明与例:某变量取某一个有限长度(时间)中的某一段长度(时间)时,该变量表现为贝塔分布,如心理学中认为,一个正常人在整个睡眠中,异相睡眠所占的比例服从贝塔分布。(参考资料:维基百科

https://www.doczj.com/doc/e71773832.html,/wiki/Beta_distribution 贝塔分布的有关性质及应用探讨

https://www.doczj.com/doc/e71773832.html,/view/0a47fd86bceb19e8b8f6ba97.html )

Cauchy (θ, σ )

柯西分布

Mean and variance Do not exist

If X and Y are independent N(0,1), X/Y is Cauchy

f x θ | σ , ()1p σ

?1

1x θ-σ

??

()

2

+??? , σ=0

>

说明与例:柯西分布于正态分布的图形有点像,但柯西分布的图形下降至0的速度更快,如第2张图中,下面的那个是柯西分布。柯西分布用来描述共振行为,如在物理学中描述受迫共振的微分方程的解,在光谱学中描述共振或者其他机制加宽的谱线性状。

● Chi squared ( p )

卡方分布

说明与例: k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。在独立性检验、样本对总体的拟合程度等中常常用到。

● Double exponential ( μ, σ )

双参指数分布

f x p | ()x p 2/1-e x -2

/Γp 2/()2p 2

/?????? ; 0=x ≤¥ ; p <12... , , =EX p , Var X =2p =M X t ()1

12t

-??()

p 2

/ , t =1

2

?<χ2m ()Gamma m

2

?2 , (

)

f x μ | σ , ()12σ

?e x μ-||-σ

/ , σ=0>

(以double exponential(1,2)为例,即把单指数分布exponential(2)右移1个单位,在按照对称

轴x=1反转)

Exponential ( β )

指数分布

以(exponential (2)为例,便于与exponential (1,2)对比)

EX μ , Var X =2σ2

=M X t ()e μt

1σt ()

2-??? , t ||=1

σ?

?e x -β

/ , 0=x ≤¥ , β<0>EX β , Var X =β2

=M X t ()11βt

-?? , t =1

β?

<

(来自维基百科)

说明与例:指数分布常用于等待时间,因为它具有“无记忆性”

即,已经等待了10分钟,再等待5分钟的概率,与已经等待30分钟,再等待50分钟的概率是一样的。

F

F 分布

说明与例:常用于统计检验,如方差分析、估计模型的拟合效果等

f x v 1 | v 2 , ()Γv 1v 2+2??()

Γv 1

2

?()Γv

2

2

?()

?????

v 1

v 2??()

v 1

2

? x v 1

2-()2/1v 1v

2

?()x +()

v 1v 2

+()2/???????=EX v 2

v 2

2

-?? , v 2=2>Var X 2v 2v 2

2-??()

2 v 1

v 2

+2-v 1v 2

4-()??? , v 2=4>EX n

Γv 12n

+2??(

)Γv 22n

-2??()Γv 1

2?()Γv 2

2

?()

???????v 2v 1??()

n

, n =v 22??

v 2

, χv 1

2v 1

?()χv 2

2v

2

?()/=F

1v

, t v 2

=

● Gamma ( α, β )

伽马分布

(来自维基百科)

说明与例:G(a,b)意义是,如果某事件发生一次需要时间b (1/b 即该事件的发生频率),那么x 为等到第a 事件发生时所需的时间),比如,经济衰退发生一次要3年,那么第2次经济衰退的时间就服从G (2,3)的伽马分布(现实中并没求证,只是举个例子)

● Logistic ( μ, β)

逻辑分布

这个分布之前没听说过,在excel 也没有相关函数对其分布进行模拟

● Lognormal (μ, α)

对数正态分布

f x α | β , ()1Γα()β

α

??x α1-e x -β

/ , 0=x ≤¥ , αβ , >0

=M X t ()1

1βt

-??()

α

, t =1

β?

/1e x μ-()-β/+[]2

?????? , β=0

>EX μ , Var X =p 2β2()3

/=M X t ()e μt Γ1βt -()Γ1βt +() , t ||=1

β

?

, ()12p ??√σ???e log x ()μ-()-22σ2

()/x ?????? , 0=x ≤¥

2/+=

(来自维基百科)

说明与例:当x 服从正态分布时,y=exp(x)就服从对数正态分布。变量可以看做是很多很小的独立因子乘积时候,该变量多服从对数正态分布,比如股票投资的长期收益率,它是每天收益率的乘积。

Normal (μ, σ2 )

正态分布

说明与例:最广泛的分布,试验过程中的随机误差多呈现正态分布,很多医学、经济、人口指标都服从或近似服从,如同质群体的身高、红细胞数、血红蛋白量、人的智力等等

f x μ | σ2

, ()1

2p ??√σ

??e

x μ-()-2

2σ2()

/=EX μ , Var X =σ2

=M X t ()e μt σ2t 2

2

/+

=

● Pareto ( α, β )

帕累托分布

说明与例:帕累托来源于对财富的观察:20%的人掌握了80%的财富,因此帕累托分布的例子有:中产阶级崛起之前,财富在个人之间的分布、人类居住区域的大小、油田石油贮备数量(都是前面少部分掌握了最大部分的资源)

● T

T 分布

f x α | β , ()βαβ

x

β1

+?? , 0=αx <¥ , α<0 , β>0>EX βαβ1-?? , β= 1 , Var X >βα

2

β1-()2

β2-()

???? , β=2

>f x v | ()Γv 1+2

??()

Γv

2

?()

???1v p ??√???11x 2

v

?()+()v 1+()2/?????? , v =1... , =EX 0 , v = 1 , Var X >v

v 2

-??=EX n Γn 1+2??()Γv n

-2

??()p ?√Γv

2

?()

??????v n 2/ if n

=F 1v , t v 2=

(来自维基百科)

说明与例:在一些检验中,由于总体标准差是未知的,小样本情况下,再用u 检验会产生很大的误差,用t 检验改进以获得准确的结果,如两样本的t 检验。

Uniform (a, b)

均匀分布

说明与例:当x 在a~b 之间取任何一个值都是等可能时,此时x 服从均匀分布。如掷骰子,x 出现的点数。

f x a | b , ()1

b a

-?? , a =x ≤b ≤EX b a +2?? , Var X =b a -()

2

12??=M X t ()e bt e at

-b a -()t ????

=

Weibull ( γ, β )

威布尔分布

说明与例:寿命常服从这个分布,如滚动轴承的寿命等,因此在生存分析、工业产品制造、可靠性和失效分析、寿险模型等中用到很多

f x γ | β , ()γβ?x γ1-e x -γ

β

/ , 0=x ≤¥ , γ<0 , β>0>EX β1γ/Γ11γ?+() , Var X =β2γ/Γ12γ?+()Γ211γ?+()-[

]=EX n βn γ/Γ1n γ

?+()

=

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

第八章常用计分布

第八章 常用统计分布 第一节 超几何分布 超几何分布的数学形式·超几何分布的数学期望和方差·超几何分布的近似 第二节 泊松分布 泊松分布的数学形式·泊松分布的性质、数学期望和方差·泊松分布的近似 第三节 卡方分布(2 χ分布) 2χ分布的数学形式·2χ分布的性质、数学期望和方差· 样本方差的抽样分布 第四节 F 分布 F 分布的数学形式·F 分布的性质、数学期望和方差·F 分布的近似 一、填空 1.对于超几何分布,随着群体的规模逐渐增大,一般当N n ≤( )时,可采用二项分布来近似。 2.泊松分布只有一个参数( ),只要知道了这个参数的值,泊松分布就确定了。 3.卡方分布是一种( )型随机变量的概率分布,它是由( )分布派生出来的。 4.如果第一自由度1k 或第二自由度2k 的F 分布没有列在表中,但邻近的第一自由度或第二自由度的F 分布已列在表中,对于F α(1k ,2k )的值可以用( )插值法得到。 5.( )分布具有一定程度的反对称性。 6.( )分布主要用于列联表的检验。 7.( )分布用于解决连续体中的孤立事件。 8.2 χ分布的图形随着自由度的增加而渐趋( )。 9.当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时( )可采用二项分布来近似。 10.( )事件是满足泊松分布的。 二、单项选择 1.已知离散性随机变量x 服从参数为λ=2的泊松分布,则概率P (3;λ)=( )。

A 4/3e 2 B 3/3e 2 C 4/3e 3 D 3/3e 3 2.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时,( )分布可以用二项分布来近似。 A t 分布 B F 分布 C 2 χ分布 D 超几何分布 3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概率分布,应选择( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 4.对于一个样本容量n 较大及成功事件概率p 较小的二项分布,都可以用( )来近似。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布。 5.与F α(1k ,2k )的值等价的是( )。 A F 1-α(1k ,2k ) B F 1-α(2k ,1k ) C 1/F α(1k ,2k ) D 1/F 1-α(2k ,1k ) 6、只与一个自由度有关的是( ) A 2χ分布 B 超几何分布 C 泊松分布 D F 分布 三、多项选择 1.属于离散性变量概率分布的是( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 2.属于连续性变量的概率分布的是( )。 A 2 χ分布 B 超几何分布 C 泊松分布 D F 分布 3.下列近似计算概率的正确方法是( )。 A 用二项分布的概率近似计算超几何分布的概率 B 用二项分布的概率近似计算泊松分布的概率 C 用泊松分布的概率近似计算超二项分布的概率 D 用正态分布的概率近似计算超二项分布的概率 E 用正态分布的概率近似计算 F 分布的概率 4.2χ分布具有的性质是( )。 A 恒为正值 B 非对称性 C 反对称性 D 随机变量非负性 E 可加性 5.F 分布具有的性质是( )。 A 恒为正值 B 非对称性 C 反对称性 D 随机变量非负性 E 可加性 6.一般地,用泊松分布近似二项式分布有较好的效果是( )。

大学概率论与数理统计复习资料

第一章 随机事件及其概率 知识点:概率的性质 事件运算 古典概率 事件的独立性 条件概率 全概率与贝叶斯公式 常用公式 ) ()()()()()2(加法定理AB P B P A P B A P -+= ) ,,() ()(211 1 有限可加性两两互斥设n n i i n i i A A A A P A P ∑===) ,(0 )()()()()(互不相容时独立时与B A AB P B A B P A P AB P ==) ()()()()5(AB P A P B A P B A P -==-) () ()()()(时当A B B P A P B A P B A P ?-==-))0(,,()()/()()()6(211 >Ω=∑=i n n i i i A P A A A A B P A P B P 且的一个划分为其中全概率公式 ) ,,()] (1[1)(211 1 相互独立时n n i i n i i A A A A P A P ∏==--=) /()()/()()()4(B A P B P A B P A P AB P ==) (/)()/()3(A P AB P A B P =) () /()() /()()/()7(1 逆概率公式∑== n i i i i i i A B P A P A B P A P B A P )(/)()(/)()1(S L A L A P n r A P ==

应用举例 1、已知事件,A B 满足)()(B A P AB P =,且6.0)(=A P ,则=)(B P ( )。 2、已知事件,A B 相互独立,,)(k A P =6.0)(,2.0)(==B A P B P ,则=k ( )。 3、已知事件,A B 互不相容,,3.0)(=A P ==)(,5.0)(B A P B P 则( )。 4、若,3.0)(=A P ===)(,5.0)(,4.0)(B A B P B A P B P ( )。 5、,,A B C 是三个随机事件,C B ?,事件()A C B - 与A 的关系是( )。 6、5张数字卡片上分别写着1,2,3,4,5,从中任取3张,排成3位数,则排成3位奇数的概率是( )。 某日他抛一枚硬币决定乘地铁还是乘汽车。 (1)试求他在5:40~5:50到家的概率; (2)结果他是5:47到家的。试求他是乘地铁回家的概率。 解(1)设1A ={他是乘地铁回家的},2A ={他是乘汽车回家的}, i B ={第i 段时间到家的},4,3,2,1=i 分别对应时间段5:30~5:40,5:40~5:50,5:50~6:00,6:00以后 则由全概率公式有 )|()()|()()(2221212A B P A P A B P A P B P += 由上表可知4.0)|(12=A B P ,3.0)|(22=A B P ,5.0)()(21==A P A P 35.05.03.04.05.0)(2=?+?=B P (2)由贝叶斯公式 7 4 35.04.05.0)()()|(22121=?== B P B A P B A P 8、盒中12个新乒乓球,每次比赛从中任取3个来用,比赛 后仍放回盒中,求:第三次比赛时取到3个新球的概率。 看作业习题1: 4, 9, 11, 15, 16

spss教程常用的数据描述统计:频数分布表等统计学

第二节常用的数据描述统计 本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。 1.数据 这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。 图2-2:数据输入格式示例 1.Frequencies语句 (1)操作 打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。 图2-3:Frequencies定义窗口 把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求

显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一些统计量,及统计图表,还需要进一步设置。 ①Statistics选项 单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下: (ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有: ●Quartiles四分位数,即显示25%、50%、75%的百分位数。 ●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。 Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有: ●Mean 算术平均数 ●Median 中数 ●Mode 众数 ●Sum 算术和 (ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有: ●Std. Deviation 标准差 ●Variance 方差 ●Range 全距 ●Minimum 最小值 ●Maximum 最大值 ●S.E. mean 平均数的标准误 (ⅳ)描述数据分布(Distribution)的统计量 ●Skewness 偏度,非对称分布指数。 ●Kurtosis 峰度,CASE围绕中心点的扩展程度。 另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

统计学常用分布及其分位数

§1.4 常用的分布及其分位数 1. 卡平方分布 卡平方分布、t 分布及F 分布都是由正态分布所导出的分布,它们与正态分布一起,是试验统计中常用的分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 的分布称为自由度等于n 的2χ分布,记作Z ~2χ(n),它的分 布密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中的??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。分布是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布的定义以及上述随机变量的相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2. t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 的分布称为自由度等于n 的t 分布,记作Z ~ t (n ),它的分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布的分布密度也是偶函数,且当n>30时,t

第八章 记数数据统计法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(fo)与理论次数(fe),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: INCLUDEPICTURE "http://222.178.184.133:8080/courseware/0062/content/pic/0008/010001_clip_image0 01.gif" \* MERGEFORMATINET 这是卡方检验的原始公式,其中当fe越大(fe≥5),近似得越好。显然fo与fe相差越大,卡方值就越大;fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。 拟合性检验的零假设是观测次数与理论次数之间无差异。其中理论次数的计算一般是根据某种理论,按一定的概率通过样本即实际观测次数来计算。这里所说的某种理论,可能是经验规律,也可能是理论分布。确定理论次数是卡方检验的关键。 拟合性检验自由度的确定与两个因素有关:一是分类的项数,二是在计算理论次数时,所用统计量或约束条件的个数,这两者之差即为自由度。由于一般情况下,计算理论次数时只用到“总数”这一统计量,所以自由度一般是分类的项数减1。但在对连续数据分布的配合度检验中,常常会用数据个数、平均数、标准差等统计量来计算理论次数,所以此时的自由度应从总分类项中减去更多的个数。按照检验中理论次数的定义不同,拟合性检验有以下

大学概率论与数理统计必过复习资料试题解析(绝对好用)

《概率论与数理统计》复习提要第一章随机事件与概率1.事件的关系 2.运算规则(1)(2)(3)(4) 3.概率满足的三条公理及性质:(1)(2)(3)对互不相容的事件,有(可以取)(4)(5) (6),若,则,(7)(8) 4.古典概型:基本事件有限且等可能 5.几何概率 6.条件概率(1)定义:若,则(2)乘法公式:若为完备事件组,,则有(3)全概率公式: (4) Bayes公式: 7.事件的独立 性:独立(注意独立性的应用)第二章随机变量与概率分 布 1.离散随机变量:取有限或可列个值,满足(1),(2)(3)对 任意, 2.连续随机变量:具有概率密度函数,满足(1)(2); (3)对任意, 4.分布函数,具有以下性质(1);(2)单调非降;(3)右连续;(4),特别;(5)对离散随机变量,; (6)为连续函数,且在连续点上, 5.正态分布的 概率计算以记标准正态分布的分布函数,则有(1);(2);(3) 若,则;(4)以记标准正态分布的上侧分位 数,则 6.随机变量的函数(1)离散时,求的值,将相同的概率相加;(2)连续,在的取值范围内严格单调,且有一阶连续导 数,,若不单调,先求分布函数,再求导。第三章随机向量 1.二维离散随机向量,联合分布列,边缘分布,有(1);(2 (3), 2.二维连续随机向量,联合密度,边缘密度,有 (1);(2)(4)(3);,3.二维均匀分布,其中为的面积 4.二维正态分布 且; 5.二维随机向量的分布函数有(1)关于单调非降;(2)关 于右连续;(3);(4),,;(5);(6)对 二维连续随机向量, 6.随机变量的独立性独立(1) 离散时独立(2)连续时独立(3)二维正态分布独立,且 7.随机变量的函数分布(1)和的分布的密度(2)最大最小分布第四章随机变量的数字特征 1.期望 (1) 离散时 (2) 连续 时, ;,; (3) 二维时, (4); (5);(6);(7)独立时, 2.方差(1)方差,标准差(2); (3);(4)独立时, 3.协方差 (1);;;(2)(3);(4)时, 称不相关,独立不相关,反之不成立,但正态时等价;(5) 4.相关系数;有, 5.阶原点矩,阶中心矩第五章大数定律与中心极限定理 1.Chebyshev不等式 2.大数定律 3.中心极限定理(1)设随机变量独立同分布, 或,或

常用统计分布

八章 常用统计分布 第一节 超几何分布 超几何分布的数学形式·超几何分布的数学期望和方差·超几何分布的近似 第二节 泊松分布 泊松分布的数学形式·泊松分布的性质、数学期望和方差·泊松分布的近似 第三节 卡方分布(2 χ分布) 2χ分布的数学形式·2 χ分布的性质、数学期望和方差· 样本方差的抽样分 布 第四节 F 分布 F 分布的数学形式·F 分布的性质、数学期望和方差·F 分布的近似 一、填空 1.对于超几何分布,随着群体的规模逐渐增大,一般当 N n ≤( )时,可采用二 项分布来近似。 2.泊松分布只有一个参数( ),只要知道了这个参数的值,泊松分布就确定了。 3.卡方分布是一种( )型随机变量的概率分布,它是由( )分布派生出来的。 4.如果第一自由度1k 或第二自由度2k 的F 分布没有列在表中,但邻近的第一自由度或第二自由度的F 分布已列在表中,对于F α(1k ,2k )的值可以用( )插值法得到。 5.( )分布具有一定程度的反对称性。 6.( )分布主要用于列联表的检验。 7.( )分布用于解决连续体中的孤立事件。 8.2 χ分布的图形随着自由度的增加而渐趋( )。 9.当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时( )可采用二项分布来近似。 10.( )事件是满足泊松分布的。 二、单项选择 1.已知离散性随机变量x 服从参数为λ=2的泊松分布,则概率P (3;λ)=( )。

A 4/3e 2 B 3/3e 2 C 4/3e 3 D 3/3e 3 2.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时,( )分布可以用二项分布来近似。 A t 分布 B F 分布 C 2χ分布 D 超几何分布 3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概率分布,应选择( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 4.对于一个样本容量n 较大及成功事件概率p 较小的二项分布,都可以用( )来近似。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布。 5.与F α(1k ,2k )的值等价的是( )。 A F 1-α(1k ,2k ) B F 1-α(2k ,1k ) C 1/F α(1k ,2k ) D 1/F 1-α(2k ,1k ) 6、只与一个自由度有关的是( ) A 2χ分布 B 超几何分布 C 泊松分布 D F 分布 三、多项选择 1.属于离散性变量概率分布的是( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 2.属于连续性变量的概率分布的是( )。 A 2χ分布 B 超几何分布 C 泊松分布 D F 分布 3.下列近似计算概率的正确方法是( )。 A 用二项分布的概率近似计算超几何分布的概率 B 用二项分布的概率近似计算泊松分布的概率 C 用泊松分布的概率近似计算超二项分布的概率 D 用正态分布的概率近似计算超二项分布的概率 E 用正态分布的概率近似计算 F 分布的概率 4.2 χ分布具有的性质是( )。 A 恒为正值 B 非对称性 C 反对称性 D 随机变量非负性 E 可加性 5.F 分布具有的性质是( )。 A 恒为正值 B 非对称性 C 反对称性 D 随机变量非负性 E 可加性 6.一般地,用泊松分布近似二项式分布有较好的效果是( )。

数理统计中的几种统计推断方法

数理统计中的几种统计推断方法 ——导学文章之九 数理统计的基本问题是根据样本所提供的信息,对总体的分布以及分布的数字特征作出统计推断。统计推断的主要内容分为两大类:一是参数估计问题,另一类是假设检验问题。 本篇文章主要讨论总体参数的点估计、区间估计和假设检验。 一、点估计 1、矩估计 首先讲“矩”的概念, 定义:设X 是随机变量,k 是一正整数,若k EX 存在,则称k EX 为随机变量X 的k 阶原点矩,记为k a ;若存在,则称它为X 的k 阶中心矩,记为k b 。 显然,数学期望EX 就是1阶原点矩,方差DX 就是2阶中心矩。 简单的说就是用样本矩去估计相应的总体矩,用样本矩的连续函数去估计相应的总体矩的连续函数。矩估计法的理论基础是大数定理。因为大数定理告诉我们样本矩依概率收敛于总体的相应矩,样本矩的连续函数依概率收敛于相应总体矩的连续函数。 我们通常样本的均值X 去估计总体的均值E X :即总体为X 时,我们从中取出n 个样本12,,n X X X ,我们认为总体的均值就是1 1 n i i X X n ==∑,(当然这只是对总体均值的一 种估计,当然会有误差) 当2 EX 存在的时候,我们通常用 2 1 1 n i i X n =∑作为总体X 的2EX 的估计 一般地,我们用 1 1 n k i i X n =∑作为总体X 的k EX 的估计,用 1 1 () n k i i X X n =-∑作为总体的 () k E X EX -的估计。 例:设总体X 在[,]a b 上服从均匀分布,参数,a b 未知,12,,n X X X 是一个样本,求,a b 的矩估计量。 解:由矩估计法知道:2 a b EX += 由于2 2 ()DX EX EX =-,因此2 2 2 2 ()() ()124 b a a b EX D X EX -+=+= + 用矩估计法,也即用1 1 n i i X X n == ∑作为E X 的估计,用 2 1 1 n i i X n =∑作为2EX 的估计,

生物统计学 第八章 常用试验设计结果的统计分析

第八章 常用试验设计结果的统计分析 对比法试验结果的统计分析(A )。 A .无法得到无偏误差估计 B .可以得到无偏误差估计 C .无法计算误差方差 D .可以进行误差分析 对比法试验结果的精确程度比间比法(D )。 A .低 B .一样 C .无法比较 D .高 完全随机设计实验,(B )。 A .不可以进行方差分析 B .可以进行方差分析 C .误差方差比较小 D .上述说法均不正确 单因素随机区组实验资料的方差分析,实质上就是(C )。 A .两因素的方差分析 B .单因素的方差分析 C .两因素不具重复观察值的方差分析 D .两因素具重复观察值的方差分析 现有在三个处理,四个区组的完全随机区组设计资料如下,试完成方差分析表A 变异來源 平方和 处理 80 区组 50 误差 总合 150 ( )。 A . 变异來源 平方和 自由度 均方 F 值 处理 80 2 40 12.01 区组 50 3 16.67 5.01 误差 20 6 3.33 总和 150 11 B . 变异來源 平方和 自由度 均方 F 值 处理 80 1 8区组 50 3 16误差 20 6 3. 总和 150 11 C . 变异來源 平方和 自由度 均处理 80 2 4区组 50 3 16误差 20 4 5 总和 150 11 D . 变异來源 平方和 自由度 均处理 80 2 4区组 50 2 25 误差 20 6 3. 总和 150 11 以下是 4 个小麦品种 及 3 种 肥料 试验得到的部分数据 。 请问处理是否有效果?( D 。 变异来源 平 方 和 自由度 均方 品 种 140 肥料 30 误差 总 合 270 11 A .有效果 B .品种有效果 C .肥料有效果 D .没有效果 没有效果 变异来源 平方和 自由度 均方 品 种 (A) 140 3 46.667 肥料 (B) 30 2 15 误差 100 6 16.667 总和 270 11

统计学中的几种统计推断方法

结课论文 报告课程名称统计学前沿专题 年级 2011级 专业统计111 学生姓名赵应国 学号1107010270 指导老师戴老师 理学院

统计学中的几种统计推断方法 数理统计的基本问题是根据样本所提供的信息,对总体的分布以及分布的数字特征作出统计推断。统计推断的主要内容分为两大类:一是参数估计问题,另一类是假设检验问题。 本篇文章主要讨论总体参数的点估计、区间估计和假设检验。 一、点估计 1、矩估计 首先讲“矩”的概念, 定义:设X 是随机变量,k 是一正整数,若k EX 存在,则称k EX 为随机变量X 的k 阶原点矩,记为k a ;若存在,则称它为X 的k 阶中心矩,记为k b 。 显然,数学期望EX 就是1阶原点矩,方差DX 就是2阶中心矩。 简单的说就是用样本矩去估计相应的总体矩,用样本矩的连续函数去估计相应的总体矩的连续函数。矩估计法的理论基础是大数定理。因为大数定理告诉我们样本矩依概率收敛于总体的相应矩,样本矩的连续函数依概率收敛于相应总体矩的连续函数。 我们通常样本的均值X 去估计总体的均值EX :即总体为X 时,我们从中取出n 个样本12,, n X X X ,我们认为总体的均值就是1 1n i i X X n ==∑, (当然这只是对总体均值的一种估计,当然会有误差) 当2 EX 存在的时候,我们通常用21 1n i i X n =∑作为总体X 的2EX 的估计 一般地,我们用11n k i i X n =∑作为总体X 的k EX 的估计,用1 1()n k i i X X n =-∑作为总体的 ()k E X EX -的估计。 例:设总体X 在[,]a b 上服从均匀分布,参数,a b 未知,12,,n X X X 是一个样本, 求,a b 的矩估计量。

常用统计分布

第八章常用统计分布 第一节超几何分布 超几何分布的数学形式?超几何分布的数学期望和方差?超几何分布的近似第二节泊松分布 泊松分布的数学形式?泊松分布的性质、数学期望和方差?泊松分布的近似 2 第三节卡方分布(分布) 2分布的数学形式,彳分布的性质、数学期望和方差?样本方差的抽样分 布 第四节F分布 F分布的数学形式?F分布的性质、数学期望和方差? F分布的近似 一、填空 1 ?对于超几何分布,随着群体的规模逐渐增大,一般当—<()时,可采用二 N 项分布来近似。 2?泊松分布只有一个参数(),只要知道了这个参数的值,泊松分布就确定了。 3 ?卡方分布是一种()型随机变量的概率分布,它是由()分布派生出来的。 4?如果第一自由度k i或第二自由度k2的F分布没有列在表中,但邻近的第一自由度 或第二自由度的F分布已列在表中,对于F a( & , k2)的值可以用()插值法得到。 5. ( )分布具有一定程度的反对称性。 6. ( )分布主要用于列联表的检验。 7. ( 分布用于解决连续体中的孤立事 件。 & 2分布的图形随着自由度的增加而渐趋()。 9?当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时(可采用二项分布来近似。 10. ()事件是满足泊松分布的。

二、单项选择 1 ?已知离散性随机变量X服从参数为2=2的泊松分布,则概率P (3;入)=(

A 4/3e 2 B 3/3e 2 C 4/3e 3 D 3/3e 3 2.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时, ( ) 分布可以用 二项分布来近似。 2 A t 分布 B F 分布 C 2 分布 D 超几何分布 3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概 率分布,应选择( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 4.对于一个样本容量 n 较大及成功事件概 率 p 较小的二项分布,都可以用( )来 近似。 A 二 项分布 B 超几何分布 C 泊松分布 D F 分布。 5.与 F a ( k 1, k 2)的值等价的是( )。 A F 1-a( k 1 , k 2) B F 1- a ( k 2 , k 1) C 1/F a ( k 1, k 2) D 1/F 1- a ( k 2 , k 1 ) 6、只与 一 个自由度有关的是( ) A 2 2 分布 B 超几何分布 C 泊松分布 D F 分布 三、多项选择 1.属于离散性变量概率分布的是( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 2.属于连续性变量的概率分布的是( )。 2 A 分布 B 超几何分布 C 泊松分布 D F 分布 3.下列近似计算概率的正确方法是( )。 A 用二项分布的概率近似计算超几何分布的概率 B 用二项分布的概率近似计算泊松分布的概率 C 用泊松分布的概率近似计算超二项分布的概率 D 用正态分布的概率近似计算超二项分布的概率 E 用正态分布的概率近似计算 F 分布的概率 6.一般地,用泊松分布近似二项式分布有较好的效果是( 2 4. 2 分布具有的性质是( A 恒为正值 C 反对称性 E 可加性 5.F 分布具有的性质是( A 恒为正值 C 反对称性 E 可加性 )。 B 非对称性 D 随机变量非负性 )。 B 非对称性 D 随机变量非负性 )。

统计学常用分布

二项分布(,)B n p n 为试验次数,p 为每次成功概率 {}x x n x n p X x C p q -== 其中1p q += (),()E X np Var X npq == ()()tX t n E e q pe =+其中t -¥<<¥ 解释:n 重贝努里实验中正好成功x 次的概率 几何分布()Geo p p 为成功概率 ()x P X x pq == 2(),()E X q p Var X q p == ()(1),ln tX t E e p qe t q =-<- 解释:n 重贝努里实验中首次成功正好在第x+1次 负二项分布(,),1NB k p k >,k 为成功次数,01p <<,p 为成功概率 1{}x k x k x P X x C p q +-== 2(),()E X kq p Var X kq p == ()(),ln 1tX k t p E e t q qe =<-- 解释:贝努里实验系列中第k 次成功正好出现在第x +k 次实验上地概率 泊松分布()P l {},0! x P X x e x l l l -==> (),()E X Var X l l == (1)()t tX e E e e l -=,t -¥<<¥ 解释:贝努里概型中的实验次数很大,但每次成功的概率很小,平均成功次数接近于常数

均匀分布(,)U a b 1 (),X f x a x b b a =<<-;(),X x a F x a x b b a -=<<- 2 ()(),()212a b b a E X Var X +-== 11 ()(1)()r r r b a E X r b a ++-=+- 正态分布2(,)N m s 2 1) 2()x X f x m s -- = 2(),()E X Var X m s == 22 1 2()t t tX E e e m s += 对数正态分布2log (,)N m s 2 1 ln () 2()x X f x m s --=2 221 22(),()(1)E X e Var X e e m m s s ++==- 22 1 2()t t t E X e m s += 解释:如果X~2log (,)N m s ,则logX ~2(,)N m s 指数分布()Exp l ()x X f x e l l -=,()1x X F x e l -=- 21 1 (),()E X Var X l l == (1) ()r r r E X l G += 1()(1,X t M t t l l -=-<

概率论与数理统计中的三种重要分布

概率论与数理统计中的三种重要分布 摘要:在概率论与数理统计课程中,我们研究了随机变量的分布,具体地研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson 分布、正态分布是概率论中三大重要的分布。因此,在这篇文章中重点介绍二项分布、Poisson 分布和正态分布以及它们的性质、数学期望与方差,以此来进行一次比较完整的概率论分布的学习。 关键词:二项分布;Poisson 分布;正态分布;定义;性质 一、二项分布 二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生 这种分布的重要现实源泉是所谓的伯努利试验。 (一)泊努利分布[Bernoulli distribution ] (两点分布、0-1分布) 1.泊努利试验 在许多实际问题中,我们感兴趣的是某事件A 是否发生。例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。在这一类随机试验中,只有两个基本事件A 与A ,这种只有两种可能结果的随机试验称为伯努利试验。 为方便起见,在一次试验中,把出现A 称为“成功”,出现A 称为“失败” 通常记(),p A P = () q p A P =-=1。 2.泊努利分布 定义:在一次试验中,设p A P =)(,p q A P -==1)(,若以ξ记事件A 发生的次数, 则??? ? ??ξp q 10 ~,称ξ服从参数为)10(<

统计学答案 第八章 抽样与抽样分布

第八章抽样与抽样分布 一、名词解释 1、统计抽样:按照随机原则从被研究现象的总体中,抽取一部分单位进行观察,然后根据 观察的结果运用数理统计的原理,来估计总体综合指标或者对总体综合指标的某种假设进行 检验。 2、重复抽样:是从总体中每抽出一个样本单位后,把结果记录下来,随即将该单位放回到 总体中去,使它和其余的单位在下一次抽选中具有同等被抽中的机会,再抽取第二个单位,直至抽取n个单位为止。 3、不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,这样的抽样方法不可能使一个总体单位被重复抽中,所以称为 不重复抽样。 4、简单随机抽样:在从总体中随机抽取n个单位作为样本时,要使得每一个总体的单位都 有相同的机会(概率)被抽中。 5、分层抽样:在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数 量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。 6、系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称 为系统抽样,也称等距抽样或机械抽样。 7、整群抽样:调查时,先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群, 进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。 8、总体分布:总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的,这些 观察值所形成的相对频数分布就是总体分布。 9、样本分布:是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时, 由该统计量的所有可能取值形成的相对频数分布。 11、比率:是指总体(或样本)中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成 的相对频数分布称为样本比率的抽样分布。 二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。

概率论与数理统计期末复习重要知识点

概率论与数理统计期末复习重要知识点 第二章知识点: 1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。 2.常用离散型分布: (1)两点分布(0-1分布): 若一个随机变量X 只有两个可能取值,且其分布为 12{},{}1(01) P X x p P X x p p ====-<<, 则称X 服从 12 ,x x 处参数为p 的两点分布。 两点分布的概率分布:12{},{}1(01) P X x p P X x p p ====-<< 两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =- (2)二项分布: 若一个随机变量X 的概率分布由式 {}(1),0,1,...,. k k n k n P x k C p p k n -==-= 给出,则称X 服从参数为n,p 的二项分布。记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,. k k n k n P x k C p p k n -==-= 二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =- (3)泊松分布: 若一个随机变量X 的概率分布为{},0,0,1,2,... ! k P X k e k k λ λλ-==>=,则称X 服从参 数为λ的泊松分布,记为X~P (λ) 泊松分布的概率分布:{},0,0,1,2,... ! k P X k e k k λ λλ-==>= 泊松分布的期望: ()E X λ=;泊松分布的方差:()D X λ= 4.连续型随机变量: 如果对随机变量X 的分布函数F(x),存在非负可积函数 ()f x ,使得对于任意实数x ,有 (){}()x F x P X x f t dt -∞ =≤=? ,则称X 为连续型随机变量,称 ()f x 为X 的概率密度函数, 简称为概率密度函数。 5.常用的连续型分布:

常见统计量

?一、T检验 ?用途:?比较两组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1 H1: μ0≠μ1 SPSS中对应?方法: 1、单样本T检验(One-sample Test) (1)??目的:检验单个变量的均值与给定的某个常数是否?一致。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 2、独?立样本T检验(Independent-Samples T Test) (1)??目的:检验两个独?立样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 3、配对样本T检验(Paired-Samples T Test) (1)??目的:检验两个配对样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 ! ?二、?方差分析 ?用途:?比较多组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1=…… H1: μ0,μ1,……不全相等 SPSS中对应?方法: 1、单因素?方差分析(One-way ANOVA) (1)??目的:检验由单?一因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。 2、多因素?方差分析(Univariate) (1)??目的:检验由多个因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。! 三、?非参数检验 ?用途:?比较多组数据之间的差异,独?立性等

相关主题
文本预览
相关文档 最新文档