分类资料的假设检验
- 格式:ppt
- 大小:338.00 KB
- 文档页数:40
常用的假设检验方法
常用的假设检验方法包括:1. 单样本t检验:用于比较一个样本的均值是否与已知的总体均值有显著差异。
2. 双样本t检验:用于比较两个独立样本的均值是否有显著差异。
3. 配对样本t检验:用于比较两个相关样本的均值是否有显著差异。
4. 卡方检验:用于比较观察频数与期望频数之间的差异,适用于分类数据。
5. 方差分析(ANOVA):用于比较多个样本的均值是否有显著差异。
6. Wilcoxon符号秩检验:用于比较两个相关样本的中位数是否有显著差异。
7. Mann-Whitney U检验:用于比较两个独立样本的中位数是否有显著差异。
8. Kruskal-Wallis H检验:用于比较多个独立样本的中位数是否有显著差异。
9. McNemar检验:用于比较两个相关样本的比例是否有显著差异,适用于二项分布数据。
10. Fisher精确检验:用于比较两个独立样本的比例是否有显著差异,适用于二项分布数据。
以上是常用的假设检验方法,根据不同的情况和数据类型选择不同的方法进行统计分析。
定性资料常用的统计学方法一、χ2检验χ2检验(chi-square test)是一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
(一)四格表资料的χ2检验例17:为了解吲达帕胺片治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表4 -5-1,试分析吲达帕胺片治疗原发性高血压的有效性。
表4 -5-1 两种疗法治疗原发性高血压的疗效1.四格表χ2检验的原理:对于四格表资料,χ2检验的基本公式为:式中,A为实际频数(actual frequency),T为理论频数(theoreticalfrequency)。
理论频数T根据检验假设H0:π1=π2确定,其中π1和π2分别为两组的总体率。
计算理论频数T的公式为:式中Tij 为第i行第j列的理论频数,ni+和n+j分别为相应行与列的周边合计数,n为总例数。
现以例17为例说明χ2检验的步骤:(1)建立检验假设并确定检验水准。
H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.05(2)计算检验统计量。
按式(4 -5-2)计算T11,然后利用四格表的各行列的合计数计算T12、T21和T22,即T11=(44×41)/70=25.77,T12=44-25.77=18.23T21=41-25.77=15.23,T22=26-15.23=10.77按式(4 -5-3)计算χ2值(3)确定P值,作出推断结论。
以ν=1查χ2分布界值表,得P<0.005。
按α=0.05水准,拒绝H,接受H1,可以认为两组治疗原发性高血压的总体有效率不等,即可以认为吲达帕胺片治疗原发性高血压优于对照组。
2.四格表资料χ2检验的专用公式:在对两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用χ2检验的通用公式(4 -5-1)。
常⽤的假设检验⽅法(U检验、T检验、卡⽅检验、F检验)⼀、假设检验假设检验是根据⼀定的假设条件,由样本推断总体的⼀种⽅法。
假设检验的基本思想是⼩概率反证法思想,⼩概率思想认为⼩概率事件在⼀次试验中基本上不可能发⽣,在这个⽅法下,我们⾸先对总体作出⼀个假设,这个假设⼤概率会成⽴,如果在⼀次试验中,试验结果和原假设相背离,也就是⼩概率事件竟然发⽣了,那我们就有理由怀疑原假设的真实性,从⽽拒绝这⼀假设。
⼆、假设检验的四种⽅法1、有关平均值参数u的假设检验根据是否已知⽅差,分为两类检验:U检验和T检验。
如果已知⽅差,则使⽤U检验,如果⽅差未知则采取T检验。
2、有关参数⽅差σ2的假设检验F检验是对两个正态分布的⽅差齐性检验,简单来说,就是检验两个分布的⽅差是否相等3、检验两个或多个变量之间是否关联卡⽅检验属于⾮参数检验,主要是⽐较两个及两个以上样本率(构成⽐)以及两个分类变量的关联性分析。
根本思想在于⽐较理论频数和实际频数的吻合程度或者拟合优度问题。
三、U检验(Z检验)U检验⼜称Z检验。
Z检验是⼀般⽤于⼤样本(即⼤于30)平均值差异性检验的⽅法(总体的⽅差已知)。
它是⽤标准的理论来推断差异发⽣的概率,从⽽⽐较两个的差异是否显著。
Z检验步骤:第⼀步:建⽴虚⽆假设 H0:µ1 = µ2 ,即先假定两个平均数之间没有显著差异,第⼆步:计算Z值,对于不同类型的问题选⽤不同的计算⽅法,1、如果检验⼀个样本平均数(X)与⼀个已知的总体平均数(µ0)的差异是否显著。
其Z值计算公式为:其中:X是检验样本的均值;µ0是已知总体的平均数;S是总体的标准差;n是样本容量。
2、如果检验来⾃两个的两组样本平均数的差异性,从⽽判断它们各⾃代表的总体的差异是否显著。
其Z值计算公式为:第三步:⽐较计算所得Z值与理论Z值,推断发⽣的概率,依据Z值与差异显著性关系表作出判断。
如下表所⽰:第四步:根据是以上分析,结合具体情况,作出结论。
第六章 分类资料的假设检验题库一、选择题1.2χ分布的形状( )。
A. 同正态分布B. 同t 分布C.为对称分布D. 与自由度ν有关E. 与样本含量n 有关 2.四格表的自由度( )。
A. 不一定等于1B. 一定等于1C. 等于行数×列数D. 等于样本含量-1E. 等于格子数-13.5个样本率作比较,24,01.02χχ>,则在α=0.05的检验水准下,可认为( )。
A. 各总体率不全相等 B. 各总体率均不等 C. 各样本率均不等 D. 各样本率不全相等 E. 至少有两个总体率相等4.测得某地6094人的两种血型系统,结果如下。
欲研究两种血型系统之间是否有联系,应选择的统计分析方法是( )。
某地6094人的ABO 与MN 血型ABO 血型MN 血型M N MN O431 490 902 A 388 410 800 B 495 587 950 AB137 17932A.秩和检验B.2χ检验C.Ridit 检验D.相关分析E.Kappa 检验 5.假定两种方法检测结果的假阳性率和假阴性率均很低。
现有50份血样用甲法检查阳性25份,用乙法检查阳性35份,两法同为阳性和阴性的分别为23份和13份。
欲比较两种方法检测结果的差别有无统计学意义,应选用( )。
A. u 检验B. t 检验C. 配对t 检验D. 配对四格表资料的2χ检验 E. 四格表资料的2χ检验6.某医师欲比较两种疗法治疗2型糖尿病的有效率有无差别,每组各观察了30例,应选用( )。
A.两样本率比较的u 检验B.两样本均数比较的u 检验C. 四格表资料的2χ检验 D. 配对四格表资料的2χ检验 E. 四格表资料2χ检验的校正公式7.用大剂量Vit.E 治疗产后缺乳,以安慰剂对照,观察结果如下:Vit.E 组,有效12例,无效6例;安慰剂组有效3例,无效9例。
分析该资料,应选用( )。
A. t 检验 B.2χ检验 C.F 检验 D.Fisher 精确概率法 E. 四格表资料的2χ检验校正公式8.欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为2组,结果如下。
常见的统计学中的假设检验方法介绍假设检验是统计学中常用的一种方法,用于对给定的样本数据进行推断和决策。
它通过对样本数据与之前建立的假设进行比较,来确定是否拒绝或接受假设。
以下是一些常见的统计学中的假设检验方法的简要介绍。
单样本t检验单样本t检验适用于对一个样本的均值是否与已知的总体均值有显著差异进行检验。
假设检验的步骤包括设置原假设和备择假设、计算样本均值和标准差、计算t值并与临界值进行比较以得出结论。
独立样本t检验独立样本t检验用于比较两个独立样本的均值是否有差异。
这个方法适用于当我们有两个独立的样本,想要确定它们的均值是否来自于同一个总体。
假设检验的步骤与单样本t检验类似。
配对样本t检验配对样本t检验适用于比较同一组被试在两个不同条件下的均值是否有差异。
这个方法适用于当我们有同一组被试在两个不同条件下的成对观测数据时,想要确定这两个条件是否对其均值产生了显著影响。
假设检验的步骤与单样本t检验类似。
卡方检验卡方检验用于比较观察到的频数与期望频数之间的差异是否显著。
这个方法适用于分类数据的分析,可以确定观察到的频数是否符合预期的分布。
假设检验的步骤包括计算卡方统计量、确定自由度,并与临界值进行比较以得出结论。
方差分析方差分析用于比较两个或更多个样本均值之间的差异是否显著。
这个方法适用于当我们有多个样本需要进行比较时,可以确定它们的均值是否存在显著差异。
假设检验的步骤包括设置原假设和备择假设、计算组内和组间均方、计算F统计量并与临界值进行比较以得出结论。
总结以上是常见的统计学中的几种假设检验方法。
每种方法都有其适用的场景和步骤,正确理解和运用这些方法可以帮助我们进行数据分析和推断。
在实际应用中,我们应根据具体问题和数据的特点选择合适的假设检验方法,并进行可靠的统计推断。
医学统计学总结绪论1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。
2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。
3、变异:同质基础上各观察单位某变量值的差异。
数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。
变量无序分类变量:所分类别或属性之间无顺序和程度上的差异分类变量:定性变量有序分类变量:有顺序和程度上的差异4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。
可以分为有限总体和无限总体。
5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。
样本代表性的前提:同质总体,足够的观察单位数,随机抽样。
统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。
6、概率:描述随机事件发生的可能性大小的一个度量。
若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1.小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。
统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。
频数分布有对称分布和偏态分布之分。
后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。
2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。
均数:适用于正态或近似正态的分布的数值变量资料。
样本均数用x表示,总体均数用μ表示。
几何均数:适用于等比级数资料和对数呈正态分布的资料。
注意观察值中不能有零,一组观察值中不能同时有正值和负值。
中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。
3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。
全距:任何资料,一组中最大值与最小值的差。
统计推断或假设检验的常见问题连续变量和分类变量1.所有测量值可以分为四水平:定类(NOMINAL),定序(ORDINAL),定距(INTERVAL),和定比(RATIO).前面两类是分类变量,后面两类是连续变量. 2.定类变量是只能决定类别,例如白人和黑人,民主党和共和党,男人和女人等.定序变量比定类变量进了一步,因为不但可以决定类别,还可以决定各水平的次序.例如高收入,中等收入,和低收入;非常满意,比较满意,比较不满意,和非常不满意等等.但是各个水平间的距离并无意义.例如痛苦程度用1到10表示.用7表示的痛苦大于5,后者又大于3.但你不能说7和5表示的痛苦和5和3表示的痛苦是等距离的.定距变量又进了一步,不但可以知道次序而且可以知道各个水平间距离,而且各个水平间距离有意义.如100度的开水和90度的温水之间等于90度和80度之间的差别.但是注意0度的水不等于无温度.而定比变量则是最高级水平,具有所有定距变量的特性还加上一个0是本身有意义的.例如重量0克等于0重量.凡是定比变量都可以比较两个量的比值.例如重量:4克的物质是2克物质的2倍.但100度的水不是50度水的两倍热,因为它不是定比变量.社会科学中最好的定比变量例子是收入.年薪十万就是五万的两倍.0收入就是没有收入.:5.有人做了一个实验以决定抗生素是否会增加小牛体重. 下列变量是每头牛的测量值:性别, 初始体重, 体重增加数, 肉质品位等级, 其中肉质品位等级以A, B, 或C表示. 这些变量的测量类型是:a)定类, 定比, 定距, 定类b)定类, 定比, 定比, 定类c)定类, 定比, 定比, 定序d)定序, 定比, 定比, 定序e)定序, 定比, 定比, 定类6.有一项研究调查的是火力发电厂对水质的影响. 研究人员先抓鱼并加以标记再把它们放了. 对每条鱼都作了下列记录:性别(0=雌鱼, 1=雄鱼), 鱼身长度(cm), 成熟度(0=幼小, 1=成熟), 体重(g).这些测量值属于:a.定类, 定比, 定类, 定比b.定类, 定距, 定序, 定比c.定类, 定比, 定序, 定比d.定序, 定比, 定类, 定比e.定序, 定距, 定序, 定比无效和备择(或对立)假设7.无效假设和备择(或对立)假设的内容应该由管理决策问题决定.一般来说是由无效假设当稻草人,而真正目的是看备择(或对立)假设能否成立.8.既然无效假设是稻草人,在设立时要使它可能被推翻.办法是令无效假设等于, 大于或小于一个具体的数值(如销售额增加<15, 广告效应=0, 今天的市场分额=昨天的分额,或婴儿出生体重=8斤,)而不是模棱两可的(如销售额增加不等于0, 广告效应不等于0, 今天的市场分额不等于昨天的分额,或婴儿出生体重不等于8斤).9.备择(或对立)假设一定要和无效假设对应,使得一旦无效假设推翻以后就只能接受备择(或对立)假设.10.参看Excel”统计复习2”工作簿Solution一表中关于假设的例题.11.为了保证对应性,一般说来备择(或对立)假设和无效假设符号要相反,内容要一致,即他们是关于同一事件的不同可能性.12.何时作出假设?研究者应该事先决定假设再作检验.这相当于先设立靶子再射击.不能先测验假设中途又改变它!13.* 当假设表示为一个等号后面跟具体数值的时候就称为简单假设.反之不是等号而是大于,小于,或不等号时就称为合成假设.所有两尾备择(或对立)假设都是合成假设.一尾备择(或对立)假设也是合成假设.多数无效假设都是简单假设*14.参看Excel”统计复习2”工作簿Solution一表关于假设的题目一尾测验还是两尾测验?15.当你对某事件了解不多,或无清楚的理论指导,或无过去经验可供参照,或常识/逻辑不能帮忙时,一般都应该用两尾测验.反之可以用一尾.16.例如加了工资以后消费支出一般不大可能降低,公路加宽后不大可能增加交通事故,打了广告后不大可能减低销售额等等都可以用一尾测验.17.能从假设中看出用一尾还是两尾吗?答案是肯定的.要看备择(或对立)假设.如果备择(或对立)假设是带方向性的(如销售额<300,000, 进口车耗油量<国产车,广告后市场份额>广告前等等=就用一尾.反之不带方向性用两尾.18.什么是临界值? 临界值就是门槛值. 就是在概率分布的横轴上的一个或几个关键值. 没有越过那个值就属于大概率事件, 而一旦越过那个值就变成小概率事件, 就认为那里的事件是由机会引起的而不是真实(即大概率)事件.19.为什么要重视临界值? 因为在概率分布给定时, 每个概率值都对应于一个确定的临界值. 概率值用概率曲线下的面积表示, 而临界值用直线即横轴上的值表示. 后者比前者更方便求取. 故在假设检验时都把概率值化为临界值.20.与两尾测验相比,一尾测验需要比较小的临界值即可以达到显著. 统计上把这个现象称为高检验力度(Power). 直观的说, 一尾测验相当于把两个尾部的概率集中到一个尾部. 比如两尾测验时你需要z=1.96才能达到5%的显著水平, 而一尾时只要z=1.645即可. 后者比1.96更加接近概率分布的中部而不是尾部.也就是说我们把门槛值向左移动了.21.参看Excel”统计复习2”工作簿Solution一表中”下列情况的t或z的临界值是什么”那一节中的例题22.在用Excel函数求临界值时,都是假定你已经决定了显著水平而要求相应临界值.这时需要用Normsinv, Tinv, or Chiinv. 注意前两个函数要考虑一尾还是两尾测验. 而卡方测验只有一尾. 因为卡方分布没有负数.23.一定记得把显著水平即概率值除以2以便得到两尾检验的临界值. 而如果是一尾检验直接代入显著水平即可. 例如求5%显著水平的正态分布一尾临界值其公式是Normsinv(0.05), 而求两尾临界值则用Normsinv(0.05/2). 注意不是Normsinv(0.05)/2, 因为不是临界值的1/2, 而是概率即显著水平的1/2. 再说一次: 两尾检验其概率要除以2, 一尾就不需要!24.参看Excel”统计复习2”工作簿Solution一表中”下列情况应该用何检验”那一节中的例题.25.决定用t测验还是正态z检验取决于两个条件, 一是群体方差是否已知, 二是样本大小. 一般大样本即大于50人以上都可以用正态检验. 否则用t检验.26.参看Excel”统计复习2”工作簿Solution一表关于何种检验的总结表I类错误和II类错误27.I类错误称为拒真错误, II类错误则是纳伪错误. 其中的拒真和纳伪都是指无效假设而言. 即当无效假设是真实时你推翻它(I 类错误), 或当无效假设是错误时你未能推翻它(II类错误).28.II类错误概率用β表示, 而I类错误的概率就是显著水平, 用α表示. I类错误的概率可以人为控制; 而II类错误则受三个因素影响: [1]显著水平(即I类错误概率), 一般α越大β越小; [2]样本大小, 一般样本越大β越小即犯II类错误的概率越小; 和[3]效应大小. 后者是指群体真值和无效假设值的差数, 或两个样本间平均数或其它统计值的差异; 一般效应越大则β越小.29.I类错误和II类错误的方向相反. 例如显著水平=0.05时犯II类错误的概率要比显著水平=0.10时要大. 所以一般而言你不能同时减少两类错误的概率.但是如果你有大样本就可以达到这一目标.30.检验力度(Power)等于1-beta, 其中beta是II类错误的概率. 虽然求II类错误也有公式, 但求起来比较难, 因为我们必须知道对立假设下的分布. 所以我们一般不去求它. 只需要知道I类和II类错误的关系, 知道II类错误和检验力度的关系即可.31.I类错误概率, II类错误概率, 检验力度, 以及效应大小的关系看Churchill的PPT最好理解.关于概率分布32.连续变量常常服从正态分布或其它连续分布,例如对数正态(LOGNORMAL), T分布,F分布等.分类变量服从二项分布,多项分布等.33.样本统计值常常用比例表示,比例常常服从二项分布.例如抽烟和不抽烟,听过(或见过)广告和没有见过广告,喜欢和不喜欢某产品,以及是大学生和不是大学生等等.二项分布有两个特点.第一它可以用正态分布逼近.其原因用抛硬币实验很容易理解.如果我们抛一枚硬币6次,纪录正面出现次数,则N=6,P=0.5因为硬币每次出现正面和负面的概率应该相等.则在6次中有3次是正面的概率是33!6!()(1)(3)0.5*0.5!()!3!(3!)6*5*4*3*2*(.125)*(.125).3125(3*2)*(3*2)r n rnP r Pr n rππ-=-==-==类似地其它概率,比如出现1次,0次,2次等等都可以按此公式计算出来.请看E XCEL工作簿”E XCEL统计推断”中”如何计算事件概率”那个表格.这些概率就形成概率分布,后者虽然服从二项分布但可以用正态分布逼近. 34.样本比例的方差特别容易计算,直接等于P*Q(其中Q=1-P).有了方差则标准差和标准误就都好计算了.我们在假设检验中常常要用到这个特性来求方差,标准差和标准误,非常方便!其标准误捷径公式是pσ=标准差捷径公式是σ=方差捷径公式是(1)Vππ=-.其中的π和1-π是指群体的”成功”比例,即某事件出现次数占总次数的比例.对样本来说就是P和Q.请见E XCEL”统计推断2”工作簿中”S OLUTION”一表,其中关于可锐职业顾问公司的例子35.如果变量服从正态分布则大约68%的值位于正负一个标准差之间,大约95%的值位于正负两个标准差之间,大约99%的值位于正负三个标准差之间.其全距(即极大值和极小值之间差数)是大约六个标准差(最后这一点对于计算样本容量很有用)36.对于服从二项分布的变量,不必用”全距等于6个标准差”这一点来求标准差.应该直接代入样本比例求标准差.自由度问题37.自由度是指样本个体中可以自由变化的程度. 每当你的样本增加一个个体你就多了一个自由度, 反之每当你模型中增加一个变量就用去了一个自由度.在求标准差时要计算平均数, 所以N-1就是标准差的自由度.38.计算自由度的方法要看你的检验方法而定. 下列是常见公式.a.如果你有表格数据, 又只有一个变量, 则应该用分类变量水平数目减去一即是自由度. 例如你用表格列出收入变量. 该变量有六类, 则你的自由度等于6-1=5b.如果你有表格数据, 又有两个变量交叉列表, 则应该用行数减一乘以列数减一得到表格自由度. 例如你用表格列出收入和教育水平. 收入有六水平, 教育5水平, 那么你的表格自由度就是(6-1)(5-1)=20.c.求样本方差和标准差时, 其分母都是N-1, 这是因为标准差和方差都是以平均数为基础, 而求平均数要用去一个自由度. 当然求群体方差和标准差时则不需要自由度, 因为群体大, 用不用自由度关系不大.更主要的是群体参数是需要从样本估计的. 虽然样本统计数要用去自由度, 群体参数却不要. 例如群体平均数等于所有样本平均数的平均数. 对于一个样本来说无需减去自由度以求群体平均数.d.T测验一般是用来检验样本平均数是否等于某一群体平均数, 或者检验两个样本平均数是否相等. 这些情况下常常只需要一个自由度来计算平均数. 所以其自由度一般等于1.e.对于回归模型, 要看模型含有多少变量, 总的原则是用了多少变量就失去多少自由度. 不过要记住加上截距所用的一个自由度. 所以其公式是N-k-1, 其中k等于自变量个数. 例如你的回归模型含有两个自变量, 则k=2, 则模型一共用去三个自由度.标准差和标准误39.群体的标准差(或称标准误差)用σ表示,样本的则用S表示.它们是用来测量一个群体或样本中的变异程度的.顾名思义,标准差就是标准化了的差数.那么什么是差数呢?差数是对平均数而言的.换句话说,标准差就是一个群体或样本中的标准化了的偏离平均数的程度.40.标准误和标准差有两件事不一样.第一,标准差是测量每个个体偏离平均数的程度,而标准误是测量每个样本平均数偏离群体平均数的程度.不过这两者的差别其实比听起来小,因为一个样本只能有一个标准差(不论样本有多大),也只能有一个标准误.第二,因为标准差是测量样本内的变异程度,我们无需重复抽样,仅仅用标准差描述手里这个样本.而标准误则是测量样本之间的变异程度,所以一定要引入重复抽样的概念.即假定我们可以或已经抽取了许多独立样本,每次得到一个平均数,然后看这些平均数偏离群体平均数的程度.41.要求标准差,先求方差.其群体方差公式是:22()xNμσ-=∑,其对应样本方差公式是:22()1x xSn-=-∑.有了方差,只要对它开方就有了标准差.而再把标准差除以根号的样本容量就有了标准误:xS=.42.可以求两个样本的方差是否相等,用F检验.如果方差相等在比较样本平均数时就可以用两样本方差的平均数做分母.正态分布43. 正态分布特点是: [1]分布对称, [2]平均数等于中数(M EDIAN )或中位数,众数(M ODE ), [3]大约68%的值位于正负一个标准差之间, 大约95%的值位于正负两个标准差之间,大约99%的值位于正负三个标准差之间, [4]其全距是大约六个标准差(最后这一点对于计算样本容量很有用)44. 正态分布用的最广,乃因为许多其它分布在大样本下都接近正态分布.比如T 分布, 卡方分布,二项分布等.更重要的是不论原群体分布是何性状,如从该群体反复抽样,把各个样本的平均数(或中位数,或众数)记下来得到平均数的抽样分布,其性状都趋近正态. 这个现象是归因于中央极限定理.45. 正态分布另一个特点是参数比较少,只需两个即可以描述分布: 平均数和标准差.46. 正态分布可以是基于原始数据也可以是标准化的数据. 后者平均数是0, 方差为1.只有标准化的正态分布临界值才能直接用于查表求概率. 标准化的公式是: ()x x z s-=. 47. 在E XCEL 中用函数S TDEV ()估计样本标准差, 用S TDEVP ()估计群体标准差, 或S TDEVA ()估计样本标准差, 且要包括逻辑变量或文字内容. 同理, 用V AR ()求样本方差, 用V ARP ()求群体方差, 或V ARA ()如果包括逻辑变量或文字内容.检验假设显著性的三种方法48. 有三种方法检验假设: 临界值法, 概率法, 置信限法 49. 临界值法就是你求出统计值(如t 值, 卡方值, z 值等), 然后求出5%或1%显著水平下的临界值, 再用统计值去比较临界值. 比较的结果是”不怕临界值小, 就怕临界值大”因为临界值越大概率越小. 如果统计值大于临界值,说明结果显著, 应该推翻无效假设. 反之统计值小于临界值, 说明结果不显著, 不能推翻无效假设.50. 临界值法缺点是你只知道结果是否显著,并不知道精确概率.51. 概率法也是先求统计值, 再根据统计值及其相应的自由度求出概率值. 这个方法随着计算机的普及现在最普遍. 以前要查表才能知道概率, 现在只要输入统计值,用Excel 函数即可以求概率. 它的好处是可以知道精确概率值.52. 如何理解概率值? 最容易的方法是把所得概率值看成是机会引起的事件概率. 例如概率=0.33, 说明有33%的机会所观察到的平均数或其它统计值是有机会引起的. 这个概率相当大, 所以我们不能推翻无效假设. 而如果概率=0.01, 说明只有1%的可能是由机会引起. 这说明机会引起的可能性很小. 所以可以推翻无效假设. 总的说来是”不怕概率大, 只怕概率小”, 小了就可以推翻无效假设.53. 置信限法是先求样本统计值如平均数等, 再求样本标准差和标准误. 根据这些样本统计值就可以求群体参数的置信限为样本平均数加上正负两倍的标准误. 如果在置信限中包括0, 说明无效假设不能被推翻. 反之如果置信限不包括0, 说明群体参数不等于0. 该法多用于回归模型参数检验是否为0, 即某一自变量对因变量效应是否为0.54.所有测验(如t测验, 卡方测验, F测验, 正态测验等)统计值都是可以直接和临界值比较的值! 它们只是告诉你在横坐标上的数值而不是概率.55.临界值不是概率, 但每个临界值都对应相应的概率! 所以知道了临界值再求概率是不难的(求法见后).56.注意不要一看到1.96, 2.58等就认为它们代表0.05或0.01的概率. 1.64,1.96还有2.58都是在标准正态分布下才代表0.1, 0.05和0.01等概率. 在其它分布下它们对应的概率要看自由度而定.57.标准正态分布下的临界值我们用字母z表示. 其它分布时一般不用z表示.例如t分布下的临界值就用字母t表示, F分布下的临界值用字母F表示, 卡方分布下的临界值就是卡方值.58.显著水平和置信水平有何关系? 两者都是概率值. 不过显著水平是指尾部的概率而置信水平是指从左到右的累积概率. 换句话说, 当显著水平等于0.05时, 置信水平就等于1-0.05=.95.59.如何计算不同置信水平下的z值?办法有两个. 一是常用的可以直接记忆.如在标准正态分布下的三个z值是很容易记忆的: 1.64, 1.96, 2.58, 分别表示当置信水平是90%, 95%和99%时的临界值. 对于大多数问题来说记忆法就足够了. 第二种方法是用Excel函数计算. 不论函数用的是那种分布, 在Excel的函数名称里都有一个INV, 表示是把计算过程倒过来, 从概率值求临界值(一般是有了临界值即统计值要求概率值. 所以从概率值求临界值就是反过来了).60.套用Excel函数公式时, 其括号内的值就是你的概率值或置信水平. 有两点要注意, 所有求临界值的Excel函数都是基于累积概率, 即从无穷小到所求的那一点. 也就是从左到右. 但另一方面, 这些函数又都假定两尾概率. 所以其通用公式是(1-alpha/2)=(1-显著水平/2).61.例如要求显著水平=0.1时的临界值, 则在标准正态分布下输入的概率值或置信水平就是Normsinv(1-0.1/2)=Normsinv(0.95)=1.6448. 同理当你的置信水平=0.95时则Normsinv(1-0.05/2)=Normsinv(0.975). 最后如置信水平=0.99时有Normsinv(1-0.01/2)=Normsinv(0.995)=2.5758. 62.如果你不想要两尾置信水平, 只要一尾概率, 那么其公式就是(1-alpha). 例如求置信水平=0.95时的一尾临界值z值, 直接把0.95代入Excel函数有Normsinv(0.95)=1.6448. 又如求置信水平=0.99的一尾临界值z值, 直接代入0.99有Normsinv(0.99)=2.326. 上述例子可见一尾测验时的临界值永远小于两尾时的临界值. 换句话说所以统计学家们说一尾检验力度更大.63.在用Excel函数求临界值时,都是假定你已经决定了显著水平而要求相应临界值.这时需要用Normsinv, Tinv, or Chiinv. 第一个函数只要输入概率即可. 第二个和第三个都需要概率加上自由度.64.用Excel函数求概率时, 用NORMSDIST, TDIST和CHIDIST. 和临界值相似, 第一个函数只要输入z值即可. 第二个不但要t值, 还要自由度和一尾还是两尾, 共需三个参数. 最后的卡方分布概率因为是非对称分布, 且卡方不能为负数, 所以不可能用两尾. 只要卡方值加上自由度即可.65.用Excel求置信限没有简单函数,需要求出平均数和标准差,标准误等以后在手工计算置信限.66.最后Excel还有一套直接求概率的函数, 称为TTEST(), FTEST(),CHITEST() 和ZTEST(). 这些函数要求你给出数据所在位置再直接得出其显著性概率. 例如TTEST()第一个参数是数据范围, 第二个是1或2表示是一尾还是两尾检验, 第三个是测验类型, 共有三类: 第一类是成对比较, 第二是不成对但方差相等, 第三是既不成对方差也不等. 所以TTEST(a1:e22,1,1)表示数据范围是从A1到E22,用一尾检验,成对比较, 而TTEST(a1:b22,2,2)表示数据范围是A1到B22, 用两尾检验, 不成对但方差相等.。
交叉分类表(Cross Tabulations)是一种统计学工具,用于总结分类数据并研究两个分类变量之间的关系。
假设检验是交叉分类表分析中的一个重要步骤,以下是其假设检验的步骤:
提出假设:通常包括零假设(H0,又称“无效假设”)和备择假设(H1,又称“对立假设”)。
选择适当的统计方法:根据数据类型和分析目的,选择适当的统计方法进行检验。
计算统计量:根据所选择的统计方法,计算出统计量。
确定显著性水平:在假设检验中,显著性水平是用来判断假设是否成立的临界值。
进行决策:根据计算出的统计量和显著性水平,做出决策。
如果统计量小于显著性水平所对应的临界值,则接受零假设;否则,拒绝零假设。
解释结果:根据决策结果,对数据进行分析并解释。
需要注意的是,在进行假设检验时,需要遵循假设检验的基本原则,如样本独立性、样本代表性、随机抽样等。
同时,应注意假设检验的局限性,如样本量不足、数据质量不高等问题。
假设检验的基本步骤(三)假设检验的基本步骤统计推断1.建立假设检验,确定检验水准H0和H1假设都是对总体特征的检验假设,相互联系且对立。
H0总是假设样本差别来自抽样误差,无效/零假设H1是来自非抽样误差,有单双侧之分,备择假设.检验水准,a=0.05检验水准的含义2.选定检验方法,计算检验统计量选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题,一般计量资料用t检验和u检验;计数资料用χ2检验和u检验。
3.确定P值,作出统计推理P≤a ,拒绝H0,接受H1P> a,按a=0。
05水准,不拒绝H0,无统计学意义或显著性差异假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误(四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论)u检验适用条件t检验适用条件t检验和u检验1.样本均数与总体均数比较2.配对资料的比较/成组设计的两样本均数的比较配对设计的情况:3点3。
两个样本均数的比较(1)两个大样本均数比较的u检验(2)两个小样本均数比较的t检验(五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误)1。
两类错误拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0。
05,犯I型错误概率为0。
05,理论上平均每100次抽样有5次发生此类错误;接受错误的H0称Ⅱ型错误-存伪。
用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0。
9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。
两者的关系:α愈大β愈小;反之α愈小β愈大.2。
假设检验中的注意事项(1)随机化:代表性和均衡可比性(2)选用适当的检验方法(3)正确理解统计学意义(4)结论不绝对(5)单侧与双侧检验的选择四.分类变量资料的统计描述(一)相对数常用指标及其意义1.率2.构成比3.相对比(二)相对数应用注意事项1.观察例数要足够多2.不能犯以比代率的错误3.计算加权平均率或合并率4.可比性,消除混杂因素的影响(可采用标准化方法或分层分析方法。
方差分类模型的假设检验第35卷第4期2007年11月河南师范大学(自然科学版)JournalofHenanNormalUniversity(NaturalScience)Z.35No.4NOV.2007文章编号:1O0O一2367(2007)04—0171—03方差分类模型的假设检验王石青,史慧娟(华北水利水电学院数学与信息科学学院,郑州450008)摘要:主要讨论了对于广泛应用的方差分类模型,如何判断随机区组效应的存在性及是否有显着性差异.通过对区组内分析获得了固定效应是否存在的统计检验方法及两个随机效应是否有显着性差异的检验方法.关键词:方差分类模型;方差分量;区组内分析;假设检验中图分类号:O212.1文献标识码:A近2O年来,线性混合效应模型在生物,医学,经济,金融,环境科学,抽样调查及工程技术领域得到愈来愈广泛的应用,因为模型观测向量的协方差阵含有未知参数,于是关于它的参数估计,假设检验和置信区间往往变得比较复杂.本文考虑如下的方差分类模型E:一鄯+U1a+U2+£,(1)这里为n×1的观测向量,X和u分别是n×,n×t的已知设计矩阵,为×1的固定效应,8为t×1的随机效应向量,其分布分别为N(0,,I),£是n×1误差向量,其分布为N(0,2)且它们彼此独立,和是方差分量,且(X)一r,(u)一m,(u)一z.于是观测向量的协方差阵为cov(y)一;uu+ ;U2U2+I.这样的模型,在生物,医药,经济等领域含一个个体随机效应的区组设计,分群(cluster)抽样,纵向数据(Longitudinaldata)以及经济领域中Panal数据的分析中,可经常遇到.文献[2]仅对含有两个方差分量的线性混合模型,给出了固定效应的精确置信区间及随机效应的方差分量的一致最优无偏检验(UMPIUT)及功效函数.对带有随机区组效应的响应曲面模型,文献[3]获得了区组效应是否存在的统计检验方法,但这种模型也只含有一个随机效应.本文对方差分类模型,应用区组分析对固定效应口中的元素是否存在的假设检验问题给出了统计检验方法,并且给出了两个随机效应是否有显着差异的统计检验方法.本文将采用下列记号:A,tr(A),M(A),(A),A和A分别表示给定矩阵A的转置矩阵,迹,列子空间,秩,广义逆和Moore—Penrose广义逆,记P一A(AA)一A,表示到列子空间M(A)上的正交投影阵,Na—l—P,,V一UU.对固定效应的假设检验首先给出两个引理:引理1[设X~N(,I),A对称,则XAX~2,A幂等,(A)一r.引理2c设X~N(,I),A,A对称,X,AX和X,AX都服从.分布,则它们相互独立A1A2—0.区组内分析是将区组效应看作固定的,涉及到对模型(1)的口中的元素的检验是严格的,以下应用区组内分析对卢中的元素是否存在进行讨论.记S:[Xiuiu],T一[;u;u],其中是相应卢㈤的X的一部分,卢㈤是从卢中剔除卢之后剩余的一1维参数向量.于是总的剩余平方和为:Q一VI一收稿日期:2006—11—29基金项目:河南省自然科学基金(0611052600)作者简介:王石青(1955--),男,河北武安人,华北水利水电学院教授,主要从事数理统计方面的研究河南师范大学(自然科学版)S(SS)一S]—EI一Ps],类似地,Qz—EI一T(TT)一Yli]—EI一P],关于卢的偏回归平方和为:R(I,a,&)一Q.一Q一[Ps—T].显然R(Ia,)/d~.(1),而E(Q)一E[(—Ps)(—Ps)]一E(2夕)一E[()]一trE(2'2)(记一y--Psy),但E()一E(y—Ps)一SIal—PssIal一0,故E(2,)一D()一D[(J 一Ps)]一EI一Ps]D()EI一Ps]一2(一Ps),E(Q1)=trE(2'2)一tra(一Ps)一(trI一trPs)一2(72一r—m一£),由此Ql/d~.(一r—m—一1),利用cochran分解定理可得:Q2/~.(72一r一一£+1),于是在Q与R(la,)独立的情况下,构造Fj一,这个统计量当假设】/72一r—m一£H.:一0(i一1,2,…,)成立时服从自由度为(1,72一r—m一£)的F一分布,于是得到如下定理:定理1当假设H.为真时,F一兰~F(1,一r--m--1)/m分布.】72一r一一£证明由引理2及上述分析过程很容易得证.2方差分量的假设检验现在对模型(1)考虑如下的假设检验问题:假设检验:H.::一;一H1:}≠;,即考虑随机效应8与&之间是否有显着差异的检验问题.基于拟合常数的思想,在模型(1)中暂时视a和&为固定效应,模型拟合之后的残差平方和为:SS一—RSS(卢,8,岛)一Y(j一P(x;Ut;U2)),模型(1)可改写为—X卢+Ula—Ul+Ul已+U2&+£一邵+U1(8一&)+(Ul+U2)岛+£,(2)当H.为真时,即;一;一0时,则模型(2)可变为一郸+(U+U.)+£,同理,模型拟合后的残差平方和为SS柏一—RSS(卢,)一(J一P(xiUl+u.)).直观上,当:一;时,ss柏与ss.应很接近,即ss一ss.相对于SS很小.若不然,就认为随机效应a与已之间有显着差异,即接受H.令F一,其中£一一R(XiuiUz),£一R(X;UiUz)一R(X:U+U.)下面证明在原假设H.为真时,F~F定理2对模型(1)有:1)SS/}~22)若;一;,则~f2'2并且与SS相互独立;3)当假设}一;为真时,F~F证明注意到SS一(J一P(xiU11U1))一£(J一P(X;U1iUz))£,利用引理1,立得ss/~,(1)得证.若}一;,则模型(1)变为—X卢+(ul+U2)+£,因而ss柏一SS一£(P(x÷Uij一P(xIU_+)£,同样由引理1,可知(SS柏一SS)/d~.又由于M(U+Uz)cM(U1iU.),因此,(P(x-U1iU')一P(xiU1))(一P(x!UtiUz))一0,由引理2,可推得ss柏一ss.与SS相互独立.(3)是前面两条的直接结果,定理2证毕.参考文献El3王松桂.线性模型引论[M].北京;科学出版社,2004:256--285.[2]吴密霞,王松桂.线性混合模型中固定效应和方差分量同时最优估计EJ3.中国科学A辑,2004,34(3):373--384(下转第191页)第4期郭克疾等:云南省蛇类新记录一黑背白环蛇l9lE4]吴介云,王政昆,杨士剑,等.野生动物资源一两栖爬行动物EA].载:薛纪如(主编).高黎贡山国家自然保护区Ec].北京:中国林业出版社,1995:326—336.[15][16]熊清华,艾怀森.高黎贡山自然与生物多样性研究[M].北京:科学出版社,2006:489491.中国科学院青藏高原综合科学考察队.横断山区两栖爬行动物EM].北京:科学出版社,1997:229—232.张荣祖.中国动物地理[M].北京:科学出版社,1999:432.赵尔宓,黄美华,宗愉,等.中国动物志,爬行纲(第3卷)有鳞目,蛇亚目[M].北京;科学出版社,1998:179184.袁秀珍,魏传斌.湖北省蛇类新记录EJ].武汉教育学院,2000,l9(3):25—27.王文毅,王春东,郑海强,等.海南岛蛇类新记录一黑背白环蛇[J].海南师范学院(自然科学版),2003,16(1):93—94.罗健,高红英,周元媛.重庆市爬行动物物种多样性研究及保护[J].四川动物,2004,23(3):249—256.王宁,郑光美.北京市爬行动物新纪录一黑背白环蛇[J].四川动物,2005,24(4):489. 陈晓虹,朱命炜,陶立奎.河南蛇类新记录一黑背白环蛇[J].河南师范大学(自然科学版),2006,34(1):153—154.NikolaiI()riov,RobertWMurphyandTheodoreJPapenfuss.ListofsnakeofTam—daomountainridge(Tonkin,Vietnam).[J].RussianJournalofHerpetology,2000,7(1):6980.ASEANcenterforbiodiversity.Biodiversityinformationsharingservice:I,istofReptilesofI aos,Vietnam.[EB/OI].(2007—10—1)./cgi--bin/abiss.exe/spd?SID=1602201471spd:805&su b=0&tx—REhtlm.OTAH.TaxonclmicnotesonLycod0nr"hstrati(Colubridae:Ophidia)fromEastAsia.[J].Jou rnalofTaiwanMuseum,1988,41(1)Lycodonrfrnf——ANewRecordofSnakefromYunnanProvinceGUOKe—ji,MIXiao—qi,DENGXue—jian(1.South—CentralForestryInventory,Planning&DesigningInstituteofStateForestryAdministr ation,Changsha410014,China2.CollegeofLifeSciences,HunanNormalUniversity,Changsha410081,China) Abstract:ThreespecimensofgenusLycodon(ColubridaeFamily)werecollectedfromGaoli gongMountain,YunnanProvince.whichwereidentifiedasLycodonruhstrati——anewrecordofreptilesfromYunnanprovince.Keywords:YunnanProvince;newrecord;Colubridae;Lycodonruhstrati(上接第172页)[3]陶靖轩,李秀兰.混合模型的假设检验口].信阳师范学院(自然科学版),2002,15(4):39o一392E4]王松桂,贾忠贞.矩阵论中不等式[M].合肥:安徽教育出版社,1987:2O一47. TestofHypothesisinaV arianceClassModelW ANGShi—qing,SHIHui—juan (CollegeofMathematicsandInformationSciences,NorthChinaUniversityofWater ConservancyandElectricPower,Zhengzhou450011,China)Abstract:Forthebestappliedvarianceclassmodel,howtojudgetheexistenceandthesignific anceifdifferenceforran—domeffectsofblockingistheimportantproblemdiscussed.Inthispaper,thetestingmethodof statisticsoftheexistenceforthefixed—effectsandtestofthesignificanceofdifferencefortherandomeffectsaregivenbyusingintra —blockanalysis.Keywords:varianceclassmodel;variancecomponent;intra—blockanalysis;testofhypothesis口口口口。