第八章秩转换的非参数检验(孙振球)资料
- 格式:ppt
- 大小:3.26 MB
- 文档页数:124
目录第八章非参数检验 ________________________________________________________________________ 2第一节非参数检验概述 __________________________________________________________________ 3第二节单样本非参数检验 ________________________________________________________________ 3χ拟合优度检验__________________________________________________________________ 3一、2二、单样本K-S检验___________________________________________________________________ 5三、符号检验 _________________________________________________________________________ 6四、游程检验 _________________________________________________________________________ 7χ的独立性检验_________________________________________________________ 8第三节列联表与2第四节等级相关分析 ___________________________________________________________________ 10一、Spearman等级相关系数____________________________________________________________11二、Kendall等级相关系数 _____________________________________________________________ 12英文摘要与关键词 ______________________________________________________________________ 14习题 _________________________________________________________________________________ 15第八章非参数检验通过本章的学习,我们应该知道:1.非参数检验的优缺点2.常用的单样本非参数检验方法3.列联表与卡方的独立性检验4.S pearman和Kendall 等级相关系数的计算第一节 非参数检验概述非参数检验(nonparametric tests )是相对于参数检验而言的。
秩转换的非参数检验基本概念1.参数检验方法(parametric test):总体分布类型已知的条件下对其参数进行估计或检验。
(如t-test, F- test)2.非参数检验方法(nonparametric test):一种不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法来分析此类资料这种方法不受总体参数的影响,检验的是分布或分布位置,而不是参数。
这样的检验方法称为非参数检验(如基于秩次的检验)3.秩次(rank)):秩统计量,是指全部观察值按某种顺序排列的位序。
在一定程度上反映了等级的高低。
4.秩和(rank sum):同组秩次之和。
在一定程度上反映了等级的分布位置非参数检验的优缺点:优点:无严格的条件限制,且多数非参数统计方法较为简单,易于理解和掌握,应用范围广缺点:对适宜参数统计的资料,若用非参数统计处理,常损失部分信息,降低检验效能。
总结:因此对适合参数统计条件的资料或经变量变换后适合参数统计的资料,应最好用参数统计。
但资料不具备用参数统计的条件时,非参数统计是很有效的分析方法适用范围:(1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下)。
(2)等级资料。
(3)个别数据偏大或数据的某一端无确定的数值。
(4)各总体方差不齐。
检验步骤1、检验假设H0:差值的总体中位数Md=0 H1:差值的总体中位数Md≠0 α=0.052、求差值3、编秩:依差值的绝对值从小到大编秩遇差值为0的对子,舍去不计,同时样本量减一遇差值绝对值相等则取平均秩,称为相同秩(ties)然后按差值的正负对秩次冠以正负号4、求检验统计量:任取正秩和或负秩和为T5、确定P值并做出统计推断(查附表9,内大外小原则)正态近似法(n>50时)超出附表9范围,可用正态近似法作u检验。
两样本比较的秩和检验基本思想:如果H0 成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2).或相差不大,差值很大的概率应很小。
非参数检验是相对于参数检验而言地.参数检验——如果总体分布为已知地数学形式,对其总体参数作假设检验.计量资料——正态分布——假设检验——检验、检验计量资料:不满足参数检验条件地假设检验方法,一变量变换,二非参数检验(等级资料)非参数检验对总体分布不作严格假定(任意分布检验)秩转换————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.秩转换地非参数检验时先将数值变量资料自小到大,或等级资料从弱到强转换成秩后,再计算检验统计量,其特点是假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别敏感.文档来自于网络搜索配对样本比较地符号秩检验符号秩检验符号秩和检验——用于配对样本差值地中位数和比较——用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较———————<—————————————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别.平均秩——相同秩—————————————>———————————单个样本中位数和总体中位数比较—————————————————————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别——用样本各变量值和地差值,即推断差值地总体中为数和是否有差别本法地原理()界值表制作地原理()正态近似法地原理第二节两个独立样本比较地秩和检验————————秩和检验()————用于推断计量资料或等级资料地两个独立样本所来自地两个总体分布是否有差别. ——————推断两个总体分布地位置是否有差别.原始数据地两样本比较————计量资料为原始数据频数表资料和等级资料地两样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理正态近似法地原理、检验第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.原始数据地多个样本比较————计数资料为原始数据——————————频数表资料和等级资料地多个样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理地近似法原理多个独立样本两两比较地法检验————进一步推断两两总体分布位置不同——————————————————随机区组设计多个样本比较地检验多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否相等.、方法步骤————————————————————————————————、本法地原理()界值表制作地原理()近似法地原理————————————>或>——————————、近似法二、多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同秩转换地非参数检验参数检验————如果总体分布为已知地数学形式,对其总体参数作检验假设非参数检验(任意分布检验)————对总体分布不作严格假定,直接对总体分布作假设检验秩转换地非参数检验————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.————先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量.————假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别铭感.应用范围:——————对于计量资料不满足正态和方差齐性条件地小样本资料分布不明地小样本资料一端或两端是不确定数值地资料——————对于等级资料若选行*列表资料地检验,只能推断构成比差别选秩转换地非参数检验,可推断等级强度差别注意:如果已知其计量资料满足(或近似满足)检验或检验条件,当然选检验或检验,因为这时若选秩转换地非参数检验,会降低检验效能.文档来自于网络搜索配对样本比较地符号秩检验(符号秩和检验)————用于配对样本差值地中位数和比较;————用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别检验步骤()建立检验假设,确定检验水平()求检验统计量值()确定值,作出推断结论——————————————《时,查界值表——————————————>时,正态近似法作检验注意:配对等级资料采用符号秩和检验最好选用大样本单个样本中位数和总体中位数比较————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别————用样本各变量值和地差值,即推断差值地总体中位数和是否有差别第二节两个独立样本比较地秩和检验————用于推断两个独立样本所来自地两个总体分布是否有差别.————目地是推断两个总体分布地位置是否有差别、原始数据地两样本比较——————————《和《时,查界值表——————————> 或> 时,用正态近似法作检验频数表资料和等级资料地两样本比较————计数资料为频数表资料,是按数量区间分组————等级资料是按等级分组第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.、原始数据地多个样本比较—————————————————或————查界值表———————且最小样本地例数大于或>时,查界值表、频数表资料和等级资料地多个样本比较二、多个独立样本两两比较地法检验————————————进一步推断两两总体分布位置不同第四节随机区组设计多个样本比较地检验一、多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否有差别.————————————————《和《时,查界值表————————————————>或>时,用近似法多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同————检验。
【孙振球第三版】医学统计学复习题1、总体:根据研究目的确定的同质观察单位的全体。
2、有限总体:是指空间、时间范围限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、计量资料:描述指标,对每个观察单位用定量的方法测量某项指标量的大小所得的资料,有计量单位。
6、计数资料:相对数,将观察单位按性质或类别分类,然后清点各组观察单位的个数所得资料。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I 型错误概率的最大值。
I 型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,须在知道两总体差值δ、α及n时,才能算出。
13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数的大小。
如率、构成比、比等。
14、率:强度相对数,说明某现象发生的频率或强度。
15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。
用来说明各构成部分在总体所占的比重或分布。
16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。
两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。