当前位置:文档之家› 常见统计分布及其特点

常见统计分布及其特点

常见统计分布及其特点
常见统计分布及其特点

入为np。通常

/(*) ?

x>0

x

【附录一】常见分布汇总

一、二项分布

二项分布(Binomial Distribution ),即重复 n 次的伯努利试验 (Bernoulli Experiment ), 用E 表示随机试验的结果,如果事件发生的概率是P,则不发生的概率q=1-p , N次独立重复试验中发生K 次的概率是。

尸(/丸)=(;)沪(1-刃讥二切」)

(fc = th 1,用),

、泊松 poisson 分布

1、概念

当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中

2、特点-- 期望和方差均为入。

3、应用(固定速率出现的事物。)一一在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率入(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布

三、均匀分布 uniform

设连续型随机变量 X的分布函数F(x)=(x-a)/(b-a) , a

则称随机变量X服从[a,b]上的均匀分布,记为 X~U[a,b]。

四、指数分布Exponen tial Distribution

1、概念

当n± 10,p w 0.1时,就可以用泊松公式近似得计算。

2、特点一一无记忆性

(1)这种分布表现为均值越小,分布偏斜的越厉害。

E[X]=扌D[X]=壬

(2 )无记忆性

当s,t >0时有P(T>s+t|T>t)=P(T>s)即,如果T是某一元件的寿命,已知元件使用了t 小时,它总共使用至少 s+t小时的条件概率,与从开始使用时算起它使用至少 s小时的概率相等。

3、应用

在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distributi on

1、概念

2、中心极限定理与正态分布(说明了正态分布的广泛存在,是统计分析的基础)

中心极限定理:设从均值为□、方差为b A2;(有限)的任意一个总体中抽取样本量为n 的样本,当n充分大时,样本均值的抽样分布近似服从均值为□、方差为b A2/n的正态分布。

3、特点一一在总体的随机抽样中广泛存在。

4、应用一一正态分布是假设检验以及极大似然估计法ML的理论基础

定理一:设 X1, X2, X3.。。Xn是来自正态总体 N (卩,S 2)的样本,则有样本均值X~N (卩,S 2/n )――总体方差常常未知,用t分布较多

六、x 2卡方分布(与方差有关)chi-square distribution

1、概念

若n个相互独立的随机变量 E ?、E ?、……、E n,均服从标准正态分布(也称独立同

分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成

一新的随机变量,其分布规律称为卡方分布(chi-square distribution ),其中参数n

称为自由度

【注意】假设随机干扰项呈正态分布。因此,卡方分布可以和 RSS残差平方和联系起来。用

RSS/S 2,所得的变量就是标准正态分布,就服从卡方分布。

常用统计量

统计学基本概念 13.3常用统计量 统计量 设想你参加了一次考试,在知道自己得到了78分后,希望了解自己的成绩在班级上处于什么水平。你会怎样做? 你对自己未来工作收入的预期是什么? 定义:设,,,12n X X X 为取自某总体的样本,若样本函数(),,,12n T T X X X = 中不含有任何未知参数,则称T 为统计量。统计量的分布称为抽样分布。********************************************************** 强国知十三数:境内仓口之数,壮男壮女之数,老弱之数,官士之数,以言说取食者之数,利民之数,马牛刍藁之数。欲强国,不知国十三数,地虽利,民虽众,国愈弱至削。国无怨民曰强国。兴兵而伐,则武爵武任,必胜;按兵而农,粟爵粟任,则国富。兵起而胜敌,按兵而国富者,王。 (秦·商鞅《商君书》) 商鞅(前390~前338年),卫国家,思想家,著名法 家代表人物。应秦孝公求贤令入秦,说服秦孝公变法图强。孝公死后,受到贵族诬害以及秦惠文王的猜忌,车裂而死。其在秦执政二十余年,秦国大治,史称“商鞅变法”。 **********************************************************

统计量是对样本的一种加工。常用的统计量有样本均值、样本方差等。 定义设,,,12n X X X 为取自某总体的样本,则12n X X X X n +++= =1 1n i i X n =∑称为样本均值。 定理设,,,12n X X X 是来自某个总体X 的样本,X 为样本均值, (1)若总体()2,~σμN X ,则~,2X N n σμ?? ?? ?;证明:,,,12n X X X 相互独立,()2~,1,2,k X N k n μσ= ()()()1212n n E X E X E X X X X n E n n n μμ++++++??=== ??? ()()()22121222n n Var X Var X Var X X X X n Var n n n n σσ++++++??=== ??? (2)若总体分布不是正态分布,已知()μ=X E ,()2σ=X D ,则n 较大时,X 的渐近分布为??? ? ??n N 2,σμ,常记为~,2X N n σμ?? ??? 。**********************************************************定义设,,,12n X X X 是来自某个总体X 的样本,X 为样本均值,则 ()22 111n i i S X X n ==--∑称为样本方差。定理设总体X 具有二阶中心矩,()μ=X E ,()2Var X σ=<+∞,,,,12n X X X 为来自该总体的样本,X 和2S 分别是样本均值和样本方差,则()22E S σ=。样本方差是总体方差的无偏估计,样本均值是总体期望的无偏估计。**********************************************************

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

spss教程常用的数据描述统计:频数分布表等统计学

第二节常用的数据描述统计 本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。 1.数据 这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。 图2-2:数据输入格式示例 1.Frequencies语句 (1)操作 打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。 图2-3:Frequencies定义窗口 把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求

显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一些统计量,及统计图表,还需要进一步设置。 ①Statistics选项 单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下: (ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有: ●Quartiles四分位数,即显示25%、50%、75%的百分位数。 ●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。 Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有: ●Mean 算术平均数 ●Median 中数 ●Mode 众数 ●Sum 算术和 (ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有: ●Std. Deviation 标准差 ●Variance 方差 ●Range 全距 ●Minimum 最小值 ●Maximum 最大值 ●S.E. mean 平均数的标准误 (ⅳ)描述数据分布(Distribution)的统计量 ●Skewness 偏度,非对称分布指数。 ●Kurtosis 峰度,CASE围绕中心点的扩展程度。 另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

第39讲统计量和常用统计量

第39讲统计量与常用统计量

110,,X X 在上一讲例3中,为了估计指数分布的参数,进行抽样观测,得到样本和样本值6394,1105,4717,1399,7952,17424,3275,21639,2360,2896. 样本中包含了许多信息。 对于推断总体的参数或分布而言,有些是有用的,重要的信息,有些则并不重要。上例的样本至少提供了两种信息:1)10个灯泡的平均寿命; 2)灯泡寿命的序号(如6394是第1个).—有用且重要的信息—不重要信息

从样本中提取有用的信息来研究总体的分布及各种特征数.——构造统计量.12,12,,...,,,...,). (n n x x x g x x x 一旦有了样本观察值就可以算出统计量的具体值121212,,...,),,...,),,...,) (, (, (. n n n X X X g X X X g X X X 设为样本若不含任何未知参数则称为统计量统计量:样本的不含任何未知参数的函数。 1210(...)10X X X +++10.6916.1. 比如个灯泡的平均寿命是统计量平均寿命的观测值是小时

常用统计量: 2 21 2 2.,1()1 n i i S X X n S S ==--=∑样本方差样本标准差1 .,11 n i i X X n ==∑样本均值

常用统计量: 1 1 11(3.1,2,...)n k k i i n k k i i A X n B X k k k X n ====-=∑∑ 样本矩阶矩: 阶中心矩:2 2,,,11. Excel X S B 根据样本数据,用计算见实验

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

常用的统计量抽样分布总结

常用的统计量抽样分布 一.正态分布 1. ∑==n i i X n X 1 1EX → 2. 2 12)(11∑=--=n i i X X n S ][112 1 2∑=--=n i i X n X n DX → 3. 定理: X ~),(2σμN ,n X X X ,,,21 为X 的样本,则 (1). X ~), (2 n N σμ, (2). 2 2 )1(σ S n -~)1(2-n χ, (3). X 与2S 相互独立。 二.2χ分布 1. 定义 设n X X X ,,,21 独立同分布,且~)1,0(N ,则)(~2122 n X n i i χχ∑== 2. 性质: (1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。 (2). 若X ~)(2n χ,则n EX =,2DX n =。 三.t 分布 1. 定义 设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则n Y X T =~)(n t 。 2. 定理: 设n X X X ,,,21 独立同分布,且~),(2σμN ,则

n S X μ -σ σ μS n X )(-=1 )1() (2 2 ---= n S n n X σσ μ~)1(-n t (因为 n X σ μ-~)1,0(N , 2 2 )1(σ S n -~)1(2-n χ)。 3. 定理: 设1,,,21n X X X 为总体X ~),(21σμN 的样本, 1,,,21n Y Y Y 为总体Y ~),(22σμN 的样本,且Y X ,独立,则 2 12111)()(n n S Y X w +---μμ~)2(21-+n n t ,其中 2 )1()1(212 2 22112 -+-+-=n n S n S n S w 。 证:因为 2 2 11)1(σ S n -~)1(12 -n χ, 2 2 2 2)1(σ S n -~)1(22-n χ, 所以 2 2 2 2211)1()1(σS n S n -+-~)2(212-+n n χ; 又X ~), (1 2 1n N σμ,Y ~), (2 2 2n N σμ, 所以X Y -~), (2 2 1 2 21n n N σσμμ+ +, 所以 2 12111) ()(n n Y X +---σ μμ~)1,0(N ,所以 2 12111)()(n n S Y X w +---μμ 2 12111) ()(n n Y X +---= σμμ/ )2/()1()1(212 2 2 2211-+-+-n n S n S n σ ~)2(21-+n n t 。

统计学常用分布

二项分布(,)B n p n 为试验次数,p 为每次成功概率 {}x x n x n p X x C p q -== 其中1p q += (),()E X np Var X npq == ()()tX t n E e q pe =+其中t -¥<<¥ 解释:n 重贝努里实验中正好成功x 次的概率 几何分布()Geo p p 为成功概率 ()x P X x pq == 2(),()E X q p Var X q p == ()(1),ln tX t E e p qe t q =-<- 解释:n 重贝努里实验中首次成功正好在第x+1次 负二项分布(,),1NB k p k >,k 为成功次数,01p <<,p 为成功概率 1{}x k x k x P X x C p q +-== 2(),()E X kq p Var X kq p == ()(),ln 1tX k t p E e t q qe =<-- 解释:贝努里实验系列中第k 次成功正好出现在第x +k 次实验上地概率 泊松分布()P l {},0! x P X x e x l l l -==> (),()E X Var X l l == (1)()t tX e E e e l -=,t -¥<<¥ 解释:贝努里概型中的实验次数很大,但每次成功的概率很小,平均成功次数接近于常数

均匀分布(,)U a b 1 (),X f x a x b b a =<<-;(),X x a F x a x b b a -=<<- 2 ()(),()212a b b a E X Var X +-== 11 ()(1)()r r r b a E X r b a ++-=+- 正态分布2(,)N m s 2 1) 2()x X f x m s -- = 2(),()E X Var X m s == 22 1 2()t t tX E e e m s += 对数正态分布2log (,)N m s 2 1 ln () 2()x X f x m s --=2 221 22(),()(1)E X e Var X e e m m s s ++==- 22 1 2()t t t E X e m s += 解释:如果X~2log (,)N m s ,则logX ~2(,)N m s 指数分布()Exp l ()x X f x e l l -=,()1x X F x e l -=- 21 1 (),()E X Var X l l == (1) ()r r r E X l G += 1()(1,X t M t t l l -=-<

统计学名词解释

名词解释 1.统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整 理、分析、表达和解释的一门科学。 2.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据 信息的搜集整理、分析、表达和解释的一门科学。 3.抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样。 4.统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的, 包括参数估计和假设检验。 5.总体:是根据研究目的确定的同质研究对象的全体。 6.概率:是随机事件发生可能性大小的数值度量。 7.同质:是指所研究的观察对象具有某些相同的性质或特征。 8.变异:是同质个体的某项指标之间的差异,即个体差异。 9.正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称 为近似正态分布,如果两端完全对称则称为正态分布。 10.医学参考值范围:又称正常值范围,医学上常将包括绝大多数正常人的某指 标值的波动范围称为该指标的正常值范围。 11.动态数列(dynamic series):是按照一定的时间顺序,将一系列描述某事 物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数。 12.人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口的性 别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女,两个对应的直方图,其形似金字塔。 13.负担系数(dependency ratio):又称抚养比或抚养系数,是指人口中非劳 动年龄人数与劳动年龄人数之比。 14.标准化死亡比(SMR):实际死亡人数与期望死亡人数之比称为标准化死亡比。

常见统计分布及其特点

【附录一】常见分布汇总 一、二项分布 二项分布(Binomial Distribution),即重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果, 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是。 二、泊松poisson分布 1、概念 当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧10,p≦时,就可以用泊松公式近似得计算。 2、特点——期望和方差均为λ。 3、应用(固定速率出现的事物。)——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布 三、均匀分布uniform 设连续型随机变量X的分布函数F(x)=(x-a)/(b-a),a≤x≤b 则称随机变量X服从[a,b]上的均匀分布,记为X~U[a,b]。 四、指数分布Exponential Distribution 1、概念 2、特点——无记忆性 (1)这种分布表现为均值越小,分布偏斜的越厉害。

(2)无记忆性 当s,t≥0时有P(T>s+t|T>t)=P(T>s) 即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。 3、应用 在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果 五、正态分布Normal distribution 1、概念 2、中心极限定理与正态分布(说明了正态分布的广泛存在,是统计分析的基础)中心极限定理:设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。 3、特点——在总体的随机抽样中广泛存在。 4、应用——正态分布是假设检验以及极大似然估计法ML的理论基础 定理一:设X1,X2,X3.。。Xn是来自正态总体N(μ,δ2)的样本,则有 样本均值X~N(μ,δ2/n)——总体方差常常未知,用t分布较多 六、χ2卡方分布(与方差有关)chi-square distribution 1、概念 若n个相互独立的随机变量ξ?、ξ?、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和?构成一新的随机变量,其分布规律称为?卡方?分布(chi-square

常用的统计量抽样分布总结

常用的统计量抽样分布 3.定理: X ?N(~;「2 ) , X 1,X 2,…,X n 为X 的样本,则 2 (1). X ?NO,), n 2 (2). ?2 (n-1), a ⑶? X 与S 2 相互独立 二. 2 分布 1. 定义 n 设X 「X 2,…,X n 独立同分布,且?N(0,1),贝U 2 八 X i 2 ~ 2 (n) i=1 2?性质: (1). 若X ?2 (nJ , Y ?2 (门2),且X , Y 独立,则X +Y ?20 (2).若 X ?2 (n),则 EX =n ,DX =2n 。 三. t 分布 1.定义 设X ?N(0,1), Y ?2 (n),且X , Y 独立, 2. 定理: 设X 「X 2, X 独立同分布,且?N(「2 ),则 1. 2. X 』X 「EX n i 4 S 2 二一、(X i n -1 i 4 -X)2 1 n _ [' X -nX ] > DX n -1 i^ 压)。

t(“-1) (n -1)S 2 ◎2 z /“ —1 3. 定理: 设X i ,X 2, ,X n 为总体X ?N (」1,;「2 )的样本, 丫1, 丫2, ,丫为总体Y ?N (J,二2 )的样本,且X,Y 独立,则 2 2 S 2 _ (“1 …1)S ' (“2 1)S 2 S w = 所以(X —?N (0,1),所以 (“1 吊 2(“2—1)S 2 /(“1 “2-2) 计1 t (“「“2 - 2)。 (X - J “ S CJ (因为 a N(0,1), CT 2 (“ -1))。 (X -丫)-( 叫-切?"“1 ?2),其中 S w [丄+丄 n i “2 - 2 证:因为 2 (“1 -1)S 1 (n 1 -1), 2 (“2 -1)S 2 (n 2 - 1), 所以(01 -1)S 12 -(“2 -1)S 2 2 (Ri n 2 2); 2 N(7,), “1 Y ?N (」 所以X -Y ?N(S 」2,—, “2

统计学常用分布及分位数

§1.4 常用的分布及其分位数 1. 卡平方分布 卡平方分布、t 分布及F 分布都是由正态分布所导出的分 布,它们与正态分布一起,是试验统计中常用的分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 的分布称为自由度等于n 的2χ分布,记作Z ~2χ(n),它的分布密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中的??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布的定义以及上述随机变量的相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2. t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 的分布称为自由度等于n 的t 分布,记作Z ~ t (n ),它的分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。

请注意:t 分布的分布密度也是偶函数,且当n>30时,t 分布与标准正态分布N(0,1)的密度曲线几乎重叠为一。这时, t 分布的分布函数值查N(0,1)的分布函数值表便可以得到。 3. F 分布 若X 与Y 相互独立,且X ~2χ(n ),Y ~2χ(m ), 则Z=m Y n X 的分布称为第一自由度等于n 、第二自由度等于m 的F 分布,记作Z ~F (n , m ),它的分布密度 p(z)=???? ?????>++-??? ??Γ??? ??Γ??? ??+Γ?。其他,00,2)(1222222z m n z n m n z m n m n m m n n 请注意:F 分布也是非对称分布,它的分布密度与自由度的次序有关,当Z ~F (n , m )时,Z 1~F (m ,n )。 4. t 分布与F 分布的关系 若X ~t(n ),则Y=X 2~F(1,n )。 证:X ~t(n ),X 的分布密度p(x )=??? ??Γ?? ? ??+Γ221n n n π2121+-???? ??+n n x 。 Y=X 2的分布函数F Y (y ) =P{Y0时,F Y (y ) =P{-y

说明6个基本统计量

说明6个基本统计量(平均数、众数、中位数、极差、方差、标准差) 的数学内涵,学生学习过程中可能产生的困难及主要原因、应对策略; 一.平均数、众数、中位数都是描述一组数据集中趋势的统计量, 它们从不同角度描述一组数据的集中趋势。如某班45名学生在一次考 试的成绩中,平均数为85分,表示全班45名学生的平均成绩为85分; 众数是90分,表示全班得90分的人最多;中位数是87分,表示该班 45名学生成绩中在87分以下和87分以上的数目一样多。 平均数的概念:把一组数据的总和除以这组数据的个数所得的商,叫做这组数据的平均数。 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。 二.数据的集中趋势只是数据分布的一个特征,它所反映的是数据向 其中心值(平均数)聚集的程度,而各数据之间的差异情况如何呢?这 就需要考察数据的分散程度,也称波动情况。数据的分散程度是数据分 布的另一个重要特征,它所反映的是各个数据远离其中心值的程度,因 此也称离中趋势,极差、方差、标准差就是对数据集散程度所作的描述。 极差概念:是一组数据在最大值与最小值的差,它反映了一组数据的波动范围,是刻画数据离散程度的最简单的统计量。 方差是统计中常用的:是指在一组数据中,各数据与它们的平均数的差的平方的平均数。

标准差:是方差的算数平方根。 方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小,目前所研究的是这两组数据的个数相等、平均数相等或比较接近时的情况;并且二者都是在求出平均数的基础上计算的,也就是说,欲求标准差→需求方差,欲求方差→需求平均数。 三.学生学习时可能产生的困难、原因及措施: 1.概念不能顾名思义,不好理解,如①平均数中的加权平均数,可采取方法: 先重点理解“权”的意思,可联系“权力”,有大小;结合英文“权”的单词weight,表示重量,所以“权”是表示数据重要程度的意思。再理解加权平均数的概念:是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。 接下来,举简单例子来运用理解。例如:你的平时成绩是80分,期末考成绩是90分,要计算总的平均成绩,平时占40%、期末占60%的比例来算,所以你的平均成绩是:80×40%+90×60%=86(分)最后的86就是加权平均数,40%、60%分别为平时和期末的权。再如:你所在小组同学一块儿吃西瓜,有1人吃了7块,另外三人都吃了3块,平均每人吃几块?(7+3*3)/4=4(块),其中的1和3为本题的权。 再总结:“权”可以是整数,可以是小数(分数,百分数),“权”即权重、各个数据所占的比例。 ②方差的概念同样是难点,理解方法:解释如下:在表示各个数据与其平均数的偏离程度时,为了防止正偏差与负偏差的相互抵消,取各

常见统计量

?一、T检验 ?用途:?比较两组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1 H1: μ0≠μ1 SPSS中对应?方法: 1、单样本T检验(One-sample Test) (1)??目的:检验单个变量的均值与给定的某个常数是否?一致。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 2、独?立样本T检验(Independent-Samples T Test) (1)??目的:检验两个独?立样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 3、配对样本T检验(Paired-Samples T Test) (1)??目的:检验两个配对样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 ! ?二、?方差分析 ?用途:?比较多组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1=…… H1: μ0,μ1,……不全相等 SPSS中对应?方法: 1、单因素?方差分析(One-way ANOVA) (1)??目的:检验由单?一因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。 2、多因素?方差分析(Univariate) (1)??目的:检验由多个因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。! 三、?非参数检验 ?用途:?比较多组数据之间的差异,独?立性等

常用统计量及其应用

第四章 常用统计量及其应用 第一节 平均数与标准差的概念 一、平均数 反映一组性质相同的观测值的平均水平或集中趋势的统计量,其数学定义为 n x 1= ∑=n i i x 1 平均数在一定程度上代表一组数据的整体水平,体育工作中,常用这一概念来反映事物的某些特征。 例如,某中学的体育平均达标率,学生的平均身高,年龄某地区高考体育加试平均分数等等。 二、标准差 样本平均数描述数据的集中趋势,反映样本数据的平均水平。但是,平均数对整体的代表性是有条件的。 例如,吉斯莫先生经营一家工厂,规模不大,现欲招聘一名工人,汤姆先生参加面试,老板告诉他,本厂全体人员的工资入平均每人每周300元,汤姆一听,欣然接受,上班一天后,来找老板,声称受骗,老板算了一笔帐,汤姆听了无话可说。 平均工资 300元/周 说明:该厂平均工资尽管较高,但由于各个工资相差太大,平均数对整体的代表性较差。这就说明在实际应用中,仅有平均数是不够的,还要考虑到数据的离散程度。在数据相对比较集中时,平均数才具有代表性。 反映样本离散程度的统计量,称之为标准差 设样本观测值为21,x x …,n x 平均数为x ,看看如何来定量计算标准差? 样本的离散程度自然是相对平均数x 而言的为此构造出 )(1 x x i n i -∑ =

但上式各项有正有负,正负抵消 )(1 x x i n i -∑ ==0 所以要反映离散程度的大小可以让上式各项加以绝对值或求平方,但带绝对值后不便于处理,所以,选择后者从而有 21 )(x x i n i -∑ = 上式与样本含量的大小有关,所以,求平均的 n 121 )(x x i n i -∑ = 在实际应用中,上式对总体离散程度的估计往往偏小若以自由度(1-n )代替n ,则是无偏的因此,构造 221 ?)(11s x x n i n i =--∑= 上式中2 s 称为样本方差,还原成原来的量纲 则有 21 )(11x x n S i n i --= ∑= S 称为标准差,反映样本的离散程度。 结束语: 样本平均数反映样本数据的整体水平,但是要结合标准差,标准差反映样本数据的离散程度对于运动成绩,表现为成绩的稳定性。 第6次课(3学时) 教学目的:通过本次课的教学,使学生了解平均数和标准差在体育中的具体应用,掌握利用 平均数和标准差制定评分评价标准的方法。 教学内容:平均数和标准差在体育中的应用 1.标准百分 2.累进计分 3.离差法制定评价标准 4.在制定离差评价表中的应用 教学重点:1.标准百分和累进计分的计分思想 2.离差评价表的制定过程

常见统计分布及其特点

入为np。通常 /(*) ? x>0 x

2、特点一一无记忆性 (1)这种分布表现为均值越小,分布偏斜的越厉害。 E[X]=扌D[X]=壬 (2 )无记忆性 当s,t >0时有P(T>s+t|T>t)=P(T>s)即,如果T是某一元件的寿命,已知元件使用了t 小时,它总共使用至少 s+t小时的条件概率,与从开始使用时算起它使用至少 s小时的概率相等。 3、应用 在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distributi on 1、概念 2、中心极限定理与正态分布(说明了正态分布的广泛存在,是统计分析的基础) 中心极限定理:设从均值为□、方差为b A2;(有限)的任意一个总体中抽取样本量为n 的样本,当n充分大时,样本均值的抽样分布近似服从均值为□、方差为b A2/n的正态分布。 3、特点一一在总体的随机抽样中广泛存在。 4、应用一一正态分布是假设检验以及极大似然估计法ML的理论基础 定理一:设 X1, X2, X3.。。Xn是来自正态总体 N (卩,S 2)的样本,则有样本均值X~N (卩,S 2/n )――总体方差常常未知,用t分布较多 六、x 2卡方分布(与方差有关)chi-square distribution 1、概念 若n个相互独立的随机变量 E ?、E ?、……、E n,均服从标准正态分布(也称独立同 分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成 一新的随机变量,其分布规律称为卡方分布(chi-square distribution ),其中参数n 称为自由度 【注意】假设随机干扰项呈正态分布。因此,卡方分布可以和 RSS残差平方和联系起来。用 RSS/S 2,所得的变量就是标准正态分布,就服从卡方分布。

第八章常用统计分布

第八章 常用统计分布 第一节 超几何分布 超几何分布的数学形式·超几何分布的数学期望和方差·超几何分布的近似 第二节 泊松分布 泊松分布的数学形式·泊松分布的性质、数学期望和方差·泊松分布的近似 第三节 卡方分布(2 χ分布) 2χ分布的数学形式·2χ分布的性质、数学期望和方差· 样本方差的抽样分布 第四节 F 分布 F 分布的数学形式·F 分布的性质、数学期望和方差·F 分布的近似 一、填空 1.对于超几何分布,随着群体的规模逐渐增大,一般当N n ≤( )时,可采用二项分布来近似。 2.泊松分布只有一个参数( ),只要知道了这个参数的值,泊松分布就确定了。 3.卡方分布是一种( )型随机变量的概率分布,它是由( )分布派生出来的。 4.如果第一自由度1k 或第二自由度2k 的F 分布没有列在表中,但邻近的第一自由度或第二自由度的F 分布已列在表中,对于F α(1k ,2k )的值可以用( )插值法得到。 5.( )分布具有一定程度的反对称性。 6.( )分布主要用于列联表的检验。 7.( )分布用于解决连续体中的孤立事件。 8.2 χ分布的图形随着自由度的增加而渐趋( )。 9.当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时( )可采用二项分布来近似。 10.( )事件是满足泊松分布的。 二、单项选择 1.已知离散性随机变量x 服从参数为λ=2的泊松分布,则概率P (3;λ)=( )。

A 4/3e 2 B 3/3e 2 C 4/3e 3 D 3/3e 3 2.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时,( )分布可以用二项分布来近似。 A t 分布 B F 分布 C 2χ分布 D 超几何分布 3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概率分布,应选择( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 4.对于一个样本容量n 较大及成功事件概率p 较小的二项分布,都可以用( )来近似。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布。 5.与F α(1k ,2k )的值等价的是( )。 A F 1-α(1k ,2k ) B F 1-α(2k ,1k ) C 1/F α(1k ,2k ) D 1/F 1-α(2k ,1k ) 6、只与一个自由度有关的是( ) A 2χ分布 B 超几何分布 C 泊松分布 D F 分布 三、多项选择 1.属于离散性变量概率分布的是( )。 A 二项分布 B 超几何分布 C 泊松分布 D F 分布 2.属于连续性变量的概率分布的是( )。 A 2χ分布 B 超几何分布 C 泊松分布 D F 分布 3.下列近似计算概率的正确方法是( )。 A 用二项分布的概率近似计算超几何分布的概率 B 用二项分布的概率近似计算泊松分布的概率 C 用泊松分布的概率近似计算超二项分布的概率 D 用正态分布的概率近似计算超二项分布的概率 E 用正态分布的概率近似计算 F 分布的概率 4.2 χ分布具有的性质是( )。 A 恒为正值 B 非对称性 C 反对称性 D 随机变量非负性 E 可加性 5.F 分布具有的性质是( )。 A 恒为正值 B 非对称性 C 反对称性 D 随机变量非负性 E 可加性 6.一般地,用泊松分布近似二项式分布有较好的效果是( )。

常用统计量及其应用

第四章常用统计量及其应用 第一节平均数与标准差的概念 一、平均数 反映一组性质相同的观测值的平均水平或集中趋势的统计量,其数学定义为 x丄X i n i 4 平均数在一定程度上代表一组数据的整体水平,体育工作中,常用这一概念来反映事物 的某些特征。 例如,某中学的体育平均达标率,学生的平均身高,年龄某地区高考体育加试平均分数—、标准差 样本平均数描述数据的集中趋势,反映样本数据的平均水平。但是,平均数对整体的代 表性是有条件的。 例如,吉斯莫先生经营一家工厂,规模不大,现欲招聘一名工人,汤姆先生参加面试, 老板告诉他,本厂全体人员的工资入平均每人每周300元,汤姆一听,欣然接受,上班一天 后,来找老板,声称受骗,老板算了一笔帐,汤姆听了无话可说。 平均工资300元/周 说明:该厂平均工资尽管较高,但由于各个工资相差太大,平均数对整体的代表性较差。这就说明在实际应用中,仅有平均数是不够的,还要考虑到数据的离散程度。在数据相对比 较集中时,平均数才具有代表性。 反映样本离散程度的统计量,称之为标准差 设样本观测值为x,,x2…x n,平均数为X,看看如何来定量计算标准差? 样本的离散程度自然是相对平均数x而言的为此构造出 n '' (X i -x) i m

但上式各项有正有负,正负抵消 7 (X j - x) = 0 i 4 所以要反映离散程度的大小可以让上式各项加以绝对值或求平方, 但带绝对值后不便于 处理,所 以,选择后者从而有 n ' (X i -X)1 2 i 丄 上式与样本含量的大小有关,所以,求平均的 1 n —' (X i-X)2 n i 4 在实际应用中,上式对总体离散程度的估计往往偏小若以自由度( 是无偏的因此,构 造 n ' (X i -X)2 ?s 2 i 4 S 称为标准差,反映样本的离散程度。 结束语: 样本平均数反映样本数据的整体水平, 但是要结合标准差,标准差反映样本数据的离散 程度对于运动成绩,表现为成绩的稳定性。 第6次课(3学时) 教学目的: 通过本次课的教学, 使学生了解平均数和标准差在体育中的具体应用, 掌握利用 平均数和标准差制定评分评价标准的方法。 教学内容: 平均数和标准差在体育中的应用 教学难点:累进计分法 教学内容的组织安排: 标准百分和累进计分是体育统计的重要内容, 在体育评分和评价中有 重要应用,为了让学生在实际工作中能正确地运用, 教学中重点讲授 1 ?标准百分 2 ?累进计分 3. 离差法制定评价标准 4. 在制定离差评价表中的应用 教学重点:1 ?标准百分和累进计分的计分思想 2 .离差评价表的制定过程 n 一1 )代替n ,则 1 n -1 上式中s 2称为样本方差,还原成原来的量纲 则有 (X i -X)2 n i =1

相关主题
文本预览
相关文档 最新文档