第十一章 非参数检验
- 格式:docx
- 大小:48.76 KB
- 文档页数:7
《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。
2.符号检验的零假设就是配对观察结果的差平均起来等于()。
3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。
4.秩和检验检验统计量U是U1和U2中较()的一个。
5.秩尺度之统计量的均值和标准差只取决于()。
6.()常被用作经验分布与理论分布的比较。
7.绝对值相等的值,应将它们的秩()。
8.符号检验,在分布自由检验中称为()。
9.符号检验和配对符号秩检验,都只适用于()样本。
10.数据序列ABBABAAABABBABBAAAAAB的总游程数是()二、单项选择1.下列检验中,不属于非参数统计的方法的是()。
A总体是否服从正态分布 B 总体的方差是否为某一个值C 样本的取得是否具有随机性D 两组随机变量之间是否相互独立2.下列情况中,最适合非参数统计的方法是()。
A反映两个大学新生成绩的差别B 反映两个大学新生家庭人均收入的差别C 反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3.不属于非参数检验的是()。
A符号检验B游程检验C累计频数检验 D F检验4.在累计频数检验中,卡方的自由度为()。
A n1B 2C n2D n1+n25.配对符号秩检验的效力( )。
A 小于符号检验B 大于t 检验C 介于符号检验与t 检验之间D 无法与符号检验及t 检验比较 6.如果我们说非参数检验的效力是80%,下列哪种解释正确。
( )A 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要80个数据;B 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要80个数据;C 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要20个数据;D 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要20个数据;7.对于秩和检验,U 1、U 2和n 1、 n 2的关系是( )。
第一节 非参数检验的基本概念及特点一、非参数检验(一)什么是“非参数”非参数模型:缺乏总体分布模式的信息。
(二)非参数检验的定义非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验. (三)非参数检验的优点和缺点: 1、优点:一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。
计算简便。
2、缺点:统计效能远不如参数检验方法。
由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息.非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。
(四)非参数检验的特点: 1、它不需要严格的前提假设; 2、特别适用于顺序数据; 3、适用于小样本,且方法简单;4、最大的不足是不能充分利用资料的全部信息;5、不能处理“交互作用”,即多因素情况。
第二节 两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。
秩和检验法也叫Mann —Whitney —Wilcoxon 检验,它常被译为曼-惠特尼-维尔克松检验,简称M —W-W 检验,也称Mann-Whitney U 检验。
秩和检验法与参数检验法中独立样本的t 检验法相对应。
当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。
(一)秩统计量秩统计量指样本数据的排序等级.假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布.这是一个间断而对称的分布,当1n 和2n 都大于10时,秩和T 的分布近期近似正态分布,其平均数和标准差分别为()21211++=n n n T μ ()1212121++=n n n n T σ其检验值为TT σμ-=T Z(二)计算过程1、小样本:两个样本容量均小于10(n 1£10,n 2£10)例11—1:在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学生用针对某一工种的模拟器进行训练,内外让6名学生下车间直接在实习中训练,经过同样的时间后对两组人进行该工种的技术操作考核,结果如下:模拟器组:56,62,42,72,76实习组:68,50,84,78,46,92假设两组学生初始水平相同,则两种训练方式有无显著差异?表11—1 两种训练方式的成绩考核成绩 成绩排列 等级 等级和模拟器组 (5人) 56 42 1 251=T62 56 4 42 62 5 72 72 7 76 76 8 实习组 68 46 2 412=T(6人) 50 50 3 84 68 6 78 78 9 46 84 10929211检验过程:1.建立假设 0H :∑∑=21R R ,即两样本无显著差异 aH :∑∑≠21R R ,即两样本有显著差异2.计算统计量1)将数据从小到大排列,见上表。
第十一章 非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。
例如,两样本平均数比较的t 检验和多个样本平均数比较的F 检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。
本章引入另一类检验——非参数检验(non-parametric test )。
非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。
非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。
当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。
非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。
非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。
例如,非配对资料的秩和检验,其效率为t 检验的86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少13.6%。
非参数检验内容很多,本章只介绍常用的符号检验(sign test ),秩和检验(rank-sum test )和等级相关分析(rank correlation analysis )三种。
第一节 符号检验一、配对资料的符号检验(一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。
每对数据之差为正值用“+”表示,负值用“-”表示。
可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。
若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。
⏹第十一章非参数检验⏹第一节符号检验⏹第二节秩和检验⏹第三节等级相关分析⏹非参数检验是一种与总体分布状况无关的检验方法,它主要是利用样本数据之间的大小比较及大小顺序,对样本及其所属总体作差别检验,而不对总体分布的参数如平均数、标准差等进行估计推断。
⏹优点—计算简便、直观,⏹—易于掌握,检验速度较快⏹缺点—降低了检验的准确性,效率一般要低于参数检验方法⏹本章只介绍常用的—符号检验(sign test)—秩和检验(rank-sum test)—等级相关分析(rank correlation analysis)⏹第一节符号检验一、配对资料的符号检验二、样本中位数与总体中位数比较的符号检验⏹一、配对资料的符号检验1、建立假设无效假设H O:两处理差值d总体中位数=0备择假设H A:两处理差值d总体中位数≠0或d总体中位数<0 (一尾检验)或d总体中位数>0(一尾检验)2、计算差值并赋予符号d>0者记为“+”,总个数记为n+d<0者记为“-”,总个数记为n-d=0记为“0”, 总个数记为n0n= n++ n-检验的统计量为K 为n+、n-中的较小者⏹ 3、统计推断由n查附表15得临界值K0.05(n),K0.01(n),作统计推断:如果K>K0.05(n),P>0.05,则不能否定H O,两个试验处理差异不显著;如果K0.01(n)<K≤K0.05(n),0.01<P≤0.05,则否定H O,接受H A,两个试验处理差异显著;如果K≤K0.01(n),P≤0.01,则否定H O,接受H A,两个试验处理差异极显著。
【例11.1】某研究测定了噪声刺激前后15头猪的心率,结果见表11-1。
问噪声对猪的心率有无影响?⏹表11-1 猪噪声刺激前后的心率(次/分钟)1、提出无效假设与备择假设H O:噪声刺激前后猪的心率差值d总体中位数=0;H A:噪声刺激前后猪的心率差值d总体中位数≠0。
2、计算差值并赋予符号噪声刺激前后的差值符号列于表11-1第4行和第5行,从而得n+=2 ,n-=13,n=2+13=15,K=min{ n+,n-}= n+=2 。
3、统计推断当n=15时,查附表11 得临界值K0.05(15)=3 ,K0.01(15) = 2 ,因为K = 2 = K0.01(15),P≤0.01,表明噪声刺激对猪的心率影响极显著。
⏹二、样本中位数与总体中位数比较的符号检验1、建立假设H O:样本所在的总体中位数=已知总体中位数;H A:样本所在的总体中位数≠已知总体中位数。
(若将备择假设H A中的“≠”改为“<”或“>”,则进行一尾检验)2、计算差值、确定符号及其个数统计样本观察值与已知总体中位数的差值的符号,n= n++ n-检验的统计量K 为n+、n-中的较小者。
3、统计推断(同配对资料的符号检验)注意:样本的配对数少于6对时,不能检验出差别,在7—12对时也不敏感,在20对以上则比较有用。
【例11.2】已知某品种成年公黄牛胸围平均数为140厘米,今在某地随机抽取10头该品种成年公黄牛,测得一组胸围数字:128.1, 144.4 , 150.3 , 146.2, 140.6, 139.7, 134.1, 124.3, 147.9, 143.0(cm)。
问该地成年公黄牛胸围与该品种胸围平均数是否有显著差异?⏹表11-2 成年公黄牛胸围测定值符号检验表1、提出无效假设与备择假设H O:该地成年公黄牛胸围的平均数=140厘米,H A:该地成年公黄牛胸围的平均数≠140厘米。
2、计算差值、确定符号及其个数样本各观测值与总体平均数的差值及其符号列于表11-2,并由此得 n+=6 ,n-=4,n=6+4=10,K=min{ n+,n-}= n-=4 。
3、统计推断由n = 10 ,查附表 11,得K0.05(10)=1,K>K0.05(10),P>0.05,不能否定H O ,表明样本平均数与总体平均数差异不显著,可以认为该地成年公黄牛胸围的平均数与该品种胸围总体平均数相同。
⏹第二节秩和检验秩和检验也叫做符号秩和检验(signed rank-sum test),或称Wilcoxon检验,其统计效率远较符号检验为高。
秩和检验与符号检验法不同,要求差数来自某些对称分布的总体,但并不要求每一差数来自相同的分布。
方法:—将观察值按由小到大的次序排列,—编定秩次,—求出秩和进行假设检验。
一、配对试验资料的符号秩和检验二、非配对试验资料的秩和检验三、多个样本比较的秩和检验四、多个样本两两比较的秩和检验⏹一、配对试验资料的符号秩和检验(Wilcoxon配对法)1、建立假设H O:差值d总体的中位数=0;H A:差值d总体的中位数≠0。
2、秩次和符号求配对数据的差值d;按d绝对值从小到大编秩次;根据原差值正负在各秩次前标上正负号3、统计量T分别计算正秩次及负秩次的和,以绝对值较小的秩和绝对值为检验的统计量T。
4、统计推断根据n(正、负差值的总个数为n)查附表14(1)符号秩和检验用T临界值表,得T0.05(n),T0.01(n)。
如果T>T0.05(n),P>0.05,则不能否定H O,表明两个试验处理差异不显著;如果T0.01(n) <T≤T0.05(n),0.01<P≤0.05,则否定H O,接受H A,表明两个试验处理差异显著;如果T≤T0.01(n),P≤0.01,则否定H O,接受H A,表明两个试验处理差异极显著【例11.3】某试验用大白鼠研究饲料维生素E缺乏与肝脏中维生素A含量的关系,先将大白鼠按性别、月龄、体重等配为10对,再把每对中的两只大白鼠随机分配到正常饲料组和维生素E缺乏饲料组,试验结束后测定大白鼠肝中维生素A的含量如表11-4。
试检验两组大白鼠肝中维生素A的含量是否有显著差异。
⏹表11-3 不同饲料鼠肝维生素A含量资料(国际单位/克)1、提出无效假设与备择假设H O:差值d总体的中位数=0;H A:差值d总体的中位数≠0。
2、编秩次、定符号计算表11-3中配对数据差值d i,将d =0的舍去,共有差值n=8 个。
按绝对值从小到大排列秩次并标上相应的符号,差值绝对值为750的有两个,它们的秩次为3和4,所以其平均秩次为(3+4)/2=3.5,结果见表11-3。
3、确定统计量T此例,正号有7个,其秩次为2,3.5,3.5,5,6,7,8,秩次和为:2+3.5+3.5+5+6+7=35;负号只有1个,其秩次为1,秩次和等于1。
负号秩次和较小,所以T=1。
4、统计推断由n=8查附表10(1)得, T0.05(8)=3,T0.01(n)=0,因为T0.01(8) <T<T0.05(8),0.01<P<0.05,否定H O,接受H A,表明两个试验处理差异显著。
⏹二、非配对试验资料的秩和检验(Wilcoxon非配对法)1、建立假设H O:甲样本所在的总体的中位数=乙样本所在的总体的中位数;H A:甲样本所在的总体的中位数≠乙样本所在的总体的中位数。
2、求两个样本合并数据的秩次将两样本合并后的数据按从小到大的顺序排列,与每个数据对应的序号即为该数据的秩次,最小数值的秩次为“1”,最大数值的秩次为“n1+n2”。
3、确定统计量T将两个样本重新分开,计算各自的秩和。
将较小的样本含量作为n1,其秩和作为检验的统计量T。
若n1=n2,则任取一组的秩和为T。
4、统计推断由n1、(n2–n1)查附表14(2),得接受区域T’0.05——T0.05,T’0.01--T0.01。
若T在T’0.05——T0.05之内,P>0.05,则不能否定H O,若T在T’0.05——T0.05之外但在T’0.01——T0.01之内,0.01<P≤0.05,则否定H O,接受H A;若T在T’0.01——T0.01之外,P<0.01,则否定H O,接受H A,【例11.4】研究两种不同能量水平饲料对5-6周龄肉仔鸡增重(克)的影响,资料如表11-4所示。
问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异?⏹表11-4 两种不同能量水平饲料的肉仔鸡增重及秩和检验1、提出无效假设与备择假设H O:高能量饲料增重总体的中位数=低能量饲料增重总体的中位数;H A:高能量饲料增重总体的中位数≠低能量饲料增重总体的中位数。
2、编秩次将两组数据混合从小到大排列为秩次。
在低能量组有两个“512”,不求平均秩次,其;在高、低两组有一对数据为“585”,需求它们的平均秩次:(8+9)/2=8.5。
结果见表11-4。
3、确定统计量T以较小样本的秩次和为统计量T,即T= 73.5。
4、统计推断由n1=6, n2-n1=9-6=3查附表10(2)得,为31—65,为26—70。
T=73.5在,即26—70之外,P<0.01, 否定H O,接受H A,表明饲料能量高低对肉仔鸡增重的影响差异极显著。
⏹三、多个样本比较的秩和检验(Kruskal-Wallis法,H法)⏹ 1、提出无效假设与备择假设H O:各个样本所分别代表的各总体分布位置相同;H A:各个样本所分别代表的各总体分布位置不完全相同。
⏹2、编秩次、求秩和将各个样本的所有观测值混合后,按照由小到大的顺序排成1,2,…,n个秩次。
不同样本的相同观测值,取平均秩次;一个样本内的相同观测值,不求平均秩次。
按样本把每个观测值的秩次一一相加,求出各样本的秩和。
⏹3、求H值式中,R i为第i个样本的秩次之和;n i为第i个样本的含量;n=∑n i⏹ 4、统计推断根据n,n i查附表10(3),得临界值:H0.05,H0.01。
若H<H0.05,P>0.05,不能否定H O,可以认为各样本代表的各总体分布位置相同;若H0.05≤H<H0.01, 0.01<P≤0.05,否定H O,接受H A,表明各样本所代表的各总体分布位置显著不同;若H≥H0.01, P≤0.01,表明各样本所代表的各总体分布位置极显著不同。
当样本数k>3,n i>5时,不能从附表10(3)中查得H值。
这时H近似地呈自由度为k-1的分布,可对H进行检验。
当相同的秩次较多时,按(11-1)式计算的H值常常偏低,此时应按(11-2)式求校正的H值H C:式中,t j表示某个数重复的次数。
【例11.5】某试验研究三种不同制剂治疗钩虫的效果,用11只大白鼠做试验,分为三组。
每只鼠先人工感染500条钩蚴,感染后第8天,三组分别给服用甲、乙、丙三种制剂,第10天全部解剖检查各鼠体内活虫数,试验结果如表11-5所示。
试检验三种制剂杀灭钩虫的效果有无差异。
⏹表11-7 三种制剂杀灭钩虫效果及秩和检验1、提出无效假设与备择假设H O:三种制剂活虫数总体分布位置相同;H A:三种制剂活虫数总体分布位置不完全相同。
2、编秩次、求秩和三个组观测值混合后的秩次如表11-5所示,最后一行为各组秩次之和。