当前位置:文档之家› 第七章 假设检验(F检验与卡方检验)

第七章 假设检验(F检验与卡方检验)

第7章卡方检验

卡方检验(Chi-square test) stat9@https://www.doczj.com/doc/de11876421.html,

检验(Chi-square test)是现代统计学的创始人 K. Pearson 提出的一种具有广泛用途的统计方法。 该检验可用于两个及多个率(或者构成比)之间的比较,分类资料的关联度分析,拟合优度检验等。 2

一、卡方检验的基本思想 首先介绍一个抽样分布:卡方分布 ?属连续型分布 ?可加性是其基本性质 ?唯一参数,即自由度

(1) 自由度为1的χ2 分布 若Z N ~(,),01则Z 2 的分布称为自由度为1的χ2分布. (Chi-square distribution),记为χ()12或χ2 1(). 图形: 0246810 0.0 0.1 0.2 0.3 2 2 2 0.05(1)0.05/2 2 2 2 0.01(1) 0.01/2 3.84(1.96)6.63(2.5758)Z Z χχ ======

(2) νZ Z Z ,...,,21互相独立,均服从N (,)01, 则22221...νZ Z Z +++的分布称自由度为 ν的χ2 分布, 记为χν()2或)(2νχ,或简记为χ2 . ● 图形: ● 自由度ν很大时,2 () νχ近似地服从正态分布.有 2()2 (),22Z ννχνχννν -=服从均数为,方差为的正态分布

0.0 0.10.20.3 0.40.50 3 6 912 1518 ?¨·??μ ×Y ·?×?óé?è£?1 ×?óé?è£?2×?óé?è£?3×?óé?è£?6 2 /) 12/(2 2 22 )2/(21 )(χνχνχ--??? ? ??Γ= e f 3.84 7.81 12.59 P =0.05的临界值 χ2分布(Chi-square distribution )

SPSS非参数检验之卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示 观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧

非参数统计学讲义(第六章)分布检验和某些卡方检验

非参数统计学讲义 主讲:统计系 袁靖 第六章 分布检验和某些卡方检验 §1 引 言 本章属于拟合优度检验问题,即模型检验或分布的检验,属于非参数检验的范畴。在初等统计中,人们要想知道数据是否服从某一特定分布,可以通过直方图,或P-P 图,Q-Q 图来直接判断,但这种直观的方式很不精确。 本章将介绍几种分布的检验:K-S 检验,Lilliefors 检验和2χ检验。 实际上,K-S 检验是在针对2χ检验的缺点1上提出的。它们是建立在经验分布函数基础上的检验结果。 §2 Kolmogorov 检验 一、基本假设 一般地要检验手中的样本是否来自某个已知0()F x ,假定其真实分布为()F x ,对应的检验类型有 00:()()A H F x F x = 对x ? 10:()()H F x F x ≠ 至少有一个x 00:()()B H F x F x = 对x ? 10:()()H F x F x < 至少有一个x 00:()()C H F x F x = 对x ? 10:()()H F x F x > 至少有一个x 设()S x 为该组数据的经验分布函数,则 () ()i i I X x X x S x n n ≤≤= =∑的目 二、基本方法 Kolmogorov 于三十年代提出了一种基于经验分布的检验方法,基本思想是:由格里文科定理,当n →∞ 时,样本经验分布?n F 以概率1一致收敛到总体分布F ,为此可以定义()S x 到0()F x 的距离为 00((),())sup ()()D S x F x S x F x =- 当H 0成立时,由格氏定理,D 以概率1收敛到0,因此D 的大小可以度量0()F x 对总体分布拟合的好 1 2χ检验与K-S 检验均属拟合优度检验,但2χ检验常用于定类尺度测量数据,K-S 检验还用于定序尺度测量数据;当预期频数较小时,2χ检验常需要合并邻近的类别才能计算,K-S 检验则不需要,因此它能比2 χ检验保留更多的信息;对于 特别小的样本数目,2χ检验不能应用,而K-S 检验则不受限制。此外,2 χ检验需要人为对总体分布的支撑集进行划分, 将总体分布转化成一种导出分布,后果:①样本信息利用不充分;②实际检验的是导出分布对数据的拟合优度,而不是假设分布对数据的拟合优度。

第七章 列联表分析

第七章列联表分析 7.1 列联表(Crosstabs)分析的过程 7.2 列联表的实例分析 7.1 列联表 (Crosstabs) 分析的过程 列联表分析的过程是对两个变量之间关系的分析方法。被分析的变量可以是定类变量也可以是定序变量。系统是通过生成列联表对两个变量进行列联表分析的。 列联表分析的功能可以通过下述操作来实现。 图7-1 列联表分析对话框 1.打开列联表分析对话框 执行下述操作: Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框如图7-1 所示。 2.确定列联分析的变量 从左侧的源变量窗口中选择两个定类变量或定序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。Display clustered bar charts 是在输出结果中显示聚类条图。Suppress table 是隐藏表格,如果选择此项,将不输出R×C 列联表。 3.选择统计分析内容 单击statistics 按钮,打开statistics 对话框,如图7-2 所示。

图7-2statistics 对话框 下面介绍该对话框中的选项和选项栏的内容: (1)Chi-square 是卡方(X2)值选项,用以检验行变量和列变量之间是否独立。适用于定类变量和定序变量。 (2)Correlations 是皮尔逊(Pearson)相关系数r 的选项。用以测量变量之间的线性相关。适用于定序或数值变量(定距以上变量)。 (3)Nominal 是定类变量选项栏。选项栏中的各项是当分析的两个变量都为定类变量时可以选择的参数。 1)Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。 2) Phi and Cramer's V:列联相关的V 系数,由卡方系数修正而得。 3)Lambda:λ系数。 4)Uncertainty Coefficient:不定系数。 (4)Ordinal 是定序变量选项栏。选项栏中的各项是当分析的两个变量都为定序变量时可以选择的参数。 1)Gramma:Gramma 等级相关系数。 2)Somers’d:Somers 等级相关d 系数。 3)Kendall’s tau-b:肯得尔等级相关tau-b 系数。 4)Kendall’s tau-c:肯得尔等级相关tau-c 系数。 (5)Nominal by Interval 选项栏中的Eta 是当一个变量为定类变量,另一个变量为数值变量时,测量两个变量之间关系的相关比率。 系统默认状态是不输出上述参数。如需要可自行选择。上述选择做完以后,单击Continue 返回到Crosstabs 对话框。 4.确定列联表内单元格值的选项 单击Cells(单元格)按钮,打开Cell Display 对话框,如图7-3 所示。

卡方检验 (Chi-square)

卡方检验(Chi-square) ?参数与非参数检验 ?卡方匹配度检验 ?卡方独立性检验 ?卡方检验的前提和限制 ?卡方检验的应用 参数与非参数检验 ?参数检验 ◆用于等比/等距型数据 ◆对参数的前提:正态分布和方差同质 ?非参数检验 ◆不用对参数进行假设 ◆对分布较少有要求,也叫d i s t r i b u t i o n-f r e e t e s t s ◆用于类目/顺序型数据 ◆没有参数检验敏感,效力低 ◆因此在二者都可用时,总是用参数检验 卡方匹配度检验 ?用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度?是对次数分布的检验 ?研究情境 ◆在医生职业中,男的多还是女的多? ◆在三种咖啡中,哪种被国人最喜欢? ◆在北京大学中,各国留学生的比例有代表性吗? 卡方匹配度检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=p n ?d f=C-1 ◆F0:观察次数 ◆f e:期望次数 ◆C:类目的个数 ◆Χ2:统计量 卡方独立性检验 ?检验行和列的两个本来变量彼此有无关联 卡方独立性检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=(r o w t o t a l)(c o l u m n t o t a l)/n, ?d f=(R-1)(C-1)

◆F0:观察次数 ◆f e:期望次数 ◆R:行类目的个数C:列类目的个数◆Χ2:统计量 例:х2检验 1.计算期望次数fe=(fc*fr)/n 2.计算每个单位格的х2值 22 df=(R-1)(C-1)= (3-1)(2-1)=2,х2的临界值为5.99 拒绝Ho,对手表显示的偏好程度与被试的年龄段有关

第7章 SPSS卡方检验与顾客忠诚度分析

第7章 SPSS卡方检验与顾客忠诚度分析什么是客户忠诚?从广义上讲,我们可以这样来理解客户的忠诚:客户长期锁定于你的公司,使用你的产品,并且在下一次购买类似产品时还会选择此公司。客户忠诚只是一个定性的指标,一旦人们希望看到或要得到本公司的客户忠诚指标时候,就出现了客户忠诚度的概念,客户忠诚度就是用来衡量客户忠诚的一个数量指标。 客户忠诚度意味着客户不断地回来找你,来购买你的产品或服务,即便你没有最好的产品、最低的价格或最快的交付手段。你如何来解释这种看上去不合情理的客户行为?很简单:良好的关系。良好的关系建立在一段时间内的同客户发生的所有交互行为之上,它带来了价值和明显的企业收益。客户获得的全部价值不仅包括了他们获得的产品或服务,也获得该产品或服务的方式。那些能将两方面都做得很好的企业常常是其专业领域的佼佼者,他们获得更多的市场份额和利润。 7.1 卡方检验概述 2 检验是利用随机样本的分布与某种特定分布拟合程度的检验,也就是检验观察频数与理论频数之间的紧密程度,常用于离散变量的分布检验。卡方检验最常间的用途就是考察无序分类变量各水平在两组或多组之间的分布是否一致。实际上,除了这个用途之外,卡方检验还有更广泛的应用。具体而言,其用途主要包括以下几个方面。 1)检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均匀分布、是否服从Poisson分布等。 2)检验某个分类变量出现的概率是否等于指定概率。如在36选7的彩票抽奖中,每个数字出现的概率是否各为1/36;掷硬币时,正反两面出现的概率是否均为0.5。 3)检验某两个分类变量是否相互独立。如性别(二分类变量:男、女)是否有使用差异(二分类变量:是、否)有关;产品原料种类(多分类变量)是否与产品合格(二分类变量)有关。 4)检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互

卫生统计学第七章卡方检验 十

卫生统计学第七章卡方检验十 一、题型:A1 题号:1 本题分数:2 四格表资料两样本率比较的χ2检验,正确的一项为 A.χ2值为两样本率比较中u值 B.P<α前提下,χ2值越大,越有理由拒绝H0 C.χ2值大小与样本含量无关 D.每个格子的理论频数与实际频数的差值相等 E.χ2检验只能进行单侧检验 正确答案:B 答案解析:根据专业知识确定四格表资料两样本率比较的χ2检验采用单侧检验或是双侧检验,(也可使用四格表专用公式),可以证明四格表计算得出的χ2值与正态近似法两率比较中u值的平方相等,其大小与样本含量有关,且每个格子的理论频数与实际频数的差的绝对值相等,P<α前提下,自由度一定时,χ2值越大,P值越小,越有理由拒绝H0,故答案为B。 做答人数:0

做对人数:0 所占比例: 0 题号:2 本题分数:2 下列能用χ2检验的是 A.成组设计的两样本均数的比较 B.配对设计差值的比较 C.多个样本频率的比较 D.单个样本均数的比较 E.多个样本均数的比较 正确答案:C 答案解析:χ2检验可用于率或构成比比较的假设检验中,不适宜于均数的比较。 做答人数:0 做对人数:0 所占比例: 0 题号:3 本题分数:2 行×列表的自由度是 A.行数-1 B.列数-1

C.行数×列数 D.(行数-1)×(列数-1) E.样本含量-1 正确答案:D 答案解析:行×列表中,行的自由度=行数-1,列的自由度=列数-1,行×列二维表资料的χ2统计量所对应的自由度=(行数-1)×(列数-1)。做答人数:0 做对人数:0 所占比例: 0 题号:4 本题分数:2 四个百分率做比较,有一个理论数小于5,其他都大于5,则 A.只能做校正χ2检验 B.不能做χ2检验 C.直接采用行×列表χ2检验 D.必须先做合理的合并 E.只能做秩和检验 正确答案:C 答案解析:四个百分率做比较,资料可整理为4×2的行×列表,多个率比较的行×列表资料不适宜采用秩和检验,当满足行×列表资料

卡方检验

Stata第六章卡方检验 本节STATA命令摘要 [by分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow] tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow] ?列联表分析 STATA命令: [by分层变量:]tab2变量1变量2[, allchi2lichi2exactcellcolumnrow] 上述命令中,变量1为行计数变量;变量2为列计数变量;all表示卡方(c2)检验,似然比(likelihoodratio)检验以及一些统计描述指标和检验,但不包括Fisher精确检验;exact表示Fisher精确检验;chi2表示c2检验;lichi2表示likelihoodratio检验;cell表示输出的列联表中显示每个观察计数值占该列联表总观察计数值的比例;row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;coloumn表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例。例:某地调查肝癌病人与健康人饮用“醋冷水”(一种以冷水和醋为主要成分的饮料)的习惯。用group=1表示肝癌组患者和group=2表示健康人;用custom=1表示经常饮用醋冷水;custom=2表示偶尔饮用醋冷水和custom=3表示从不饮用醋冷水。具体资料为:(摘自医学统计方法,金丕焕主编,p163)。

组别经常偶尔从不饮用合计肝癌组26442898 健康组28491794 合计549345192 显然这是一个病例对照研究,所以每组人数是人为确定的,因此只需计算各组"经常","偶而"和"从不饮用"占本组的频数以及检验患肝癌是否与饮水习惯有关。 tab2groupcustom,rowchi2 ->tabulationofgroupbycustom |custom group|123|Total -----------+--------------------------------------------+---------- 1|①264428|98 |②26.5344.9028.57|100.00 -----------+--------------------------------------------+---------- 2|③284917|94 |④29.7952.1318.09|100.00 -----------+--------------------------------------------+---------- Total|⑤549345|192 |⑥28.1248.4423.44|100.00 Pearsonchi2(2)=2.9497Pr=0.229 ①该行表示第一组(肝癌组)的3个观察数;②该行表示第一组的各个观察数的

非参数检验(卡方检验)实验报告

大理大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验)专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

一、实验目的 对分类资料进行卡方检验。 二、实验环境 1、硬件配置:处理器:Intel(R)Core(TM) i5-4210U CPU @1.7GHz 1.7GHz 安装内存 (RAM):4.00GB 系统类型:64位操作系统 2、软件环境:IBM SPSS Statistics 19.0软件 三、实验内容 (包括本实验要完成的实验问题及需要的相关知识简单概述) (1)课本第六章的例6.1-6.5运行一遍,注意理解结果; (2)然后将实验指导书的例1-4运行一遍,注意理解结果。 四、实验结果与分析 (包括实验原理、数据的准备、运行过程分析、源程序(代码)、图形图象界面等) 例6.1 表1 灭螨A和灭螨B杀灭大蜂螨效果的交叉制表 效果 杀灭未杀灭 合计组别灭螨A 32 12 44 灭螨B 14 22 36 合计46 34 80 分析:表1是灭螨A和灭螨B杀灭大蜂螨效果的样本分类的频数分析表,即交叉列联表。 表2 卡方检验 X2值df 渐进Sig. (双侧) 精确Sig.(双侧) 精确Sig.(单侧) Pearson 卡方9.277a 1 .002 连续校正b7.944 1 .005 似然比9.419 1 .002 Fisher 的精确检验.003 .002

有效案例中的N 80 a. 0 单元格(.0%) 的期望计数少于5。最小期望计数为15.30。 b. 仅对2x2 表计算 分析:表2是卡方检验的结果。因为两组各自的结果互不影响,即相互独立。对于这种频数表 格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。 Pearson 卡方:皮尔逊卡方检验计算的卡方值(用于样本数n≥40且所有理论数E≥5); 连续校正b:连续性校正卡方值(df=1,只用于2*2列联表); 似然比:对数似然比法计算的卡方值(类似皮尔逊卡方检验); Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。 不同的资料应选用不同的卡方计算方法。 例6.1为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=7.944,P(Sig)=0.005<0.01,表明灭螨剂A组的杀螨率极显著高于灭螨剂B组。 例6.2 表3 治疗方法* 治疗效果交叉制表 计数 治疗效果 1 2 3 合计治疗方法 1 19 16 5 40 2 16 12 8 36 3 15 13 7 35 合计50 41 20 111 分析:表3是治疗方法* 治疗效果资料分析的列联表。 表4 卡方检验 X2值df 渐进Sig. (双侧) Pearson 卡方 1.428a 4 .839 似然比 1.484 4 .830 线性和线性组合.514 1 .474

第十章 卡方检验..

第十章χ2检验 χ检验的原理 第一节2 χ检验的假设 一、2 (一)分类相互排斥,互不包容 2 χ检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。 (二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。 当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。 (三)期望次数的大小 每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格 χ检验时,每一个单元格的期望次数至少不应低于的标准,当自由度等于1时,在进行2 10,这样才能保证检验的准确性。 另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使χ检验。 用近似的2 χ检验的类别 二、2 (一)配合度检验 配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种2 χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。 (二)独立性检验 独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立 χ检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独性的问题。这种类型的2

卡方检验

卡方(2χ)检验 常用于检验两个或多个样本率(或构成比)之间有无差别,也用于检验配对计数资料的 差异等。 (一)四格表资料的卡方检验 [例7-30] 某医院用甲、乙两种药物治疗十二指肠球部溃疡,结果见表7-12,试问两种药物疗效有无差别? 表7-12 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(a ) 25(b ) 100(a +b ) 75.00 乙 合 计 50(c ) 30(d ) 80(c +d ) 62.50 125 55 180(n ) 69.44 1.四格表2χ检验的基本公式为: ∑ -=T T A 2 2 )(χ (公式7-44) (1)建立假设,确定检验水准 H 0:π1=π2,即两组愈合率相同; H 1: π1≠π2,即两组愈合率不同; α=0.05 (2)计算理论数RC T n n n T C R RC = (公式7-45) 表7-13 两种药物治疗十二指肠球部溃疡效果比较 组 别 愈合人数 未愈合人数 合计 愈合率(%) 甲 75(69.44) 25(30.56) 100 75.00 乙 合 计 50(55.56) 30(24.44) 80 62.50 125 55 180 69.44 (3)计算检验统计量2χ值 按公式7-44计算: =3.27 (4)确定P 值 ν=(R-1)(C-1)。 本例ν=(2-1)(2-1)=1,查2χ界值表,2105.0,χ=3.84,2 1,1.0χ=2.71,故0.1>P >0.05。 (5)做出推断结论 按α=0.05水准,不拒绝H 0,差异无统计学意义。还不能认为两种药物治疗十二指肠球部溃疡疗效有差别。 2.四格表的专用公式 四格表资料还可用专用公式求2χ值。 44 .24)44.2430(56.55)56.5550(56.30)56.3025(44.69)44.6975()(2 22222 -+ -+-+-=-=∑T T A χ

SPSS非参数检验之一卡方检验

SPSS中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为x2佥验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总 体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时,就近似服从X的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q O i E i E i 其中,Oi表示观察频数;Ei表示期望频数或理论频数。可见Q值越大,表示观察频数和理论频数越不接近;Q值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q统计量,由于Q统计量服从K-1个自由度的X平方分布,因此SPSS 将根据X 平方分布表给出Q统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样 本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大 于显著性水平,则不能拒绝零假设HO,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧 郁数是否满足1:1:221:1:1。

第八章卡方检验

第八章
2 χ 检验
次数资料分析
上一张 下一张 主 页
退 出

第一节
性别 男 女
卡方检验的意义和原理
理论次数 T 50 50 100
实际次数 A 51 49 100
问男女比例是否符合1:1, 即与1:1性别比差异是否显著。 性别比差异是否显著。

χ =
2

A—实际次数
(A ? T) T
2
T—理论次数
χ2是度量实际观察次数与理 论次数偏离程度的一个统计量, 论次数偏离程度的一个统计量, χ2越小, 越小,表明实际观察次数与理 论次数越接近; 论次数越接近; χ2 =0,表示两 者完全吻合; 者完全吻合; χ2越大, 越大,表示两者 相差越大。 相差越大。
上一张 下一张 主 页 退 出

在对次数资料进行χ2检验利用连续型随 机变量χ2分布计算概率时, 分布计算概率时,常常偏低, 常常偏低,特 别是当自由度为1时偏差较大。 时偏差较大。 Yates(1934)提出了一个矫正公式, 提出了一个矫正公式,矫正 后的χ2值记为
χ =∑
2 c
( A ? T ? 0.5) T
2
上一张 下一张 主 页
退 出

当自由度大于1时,χ2分布与连续型随机 变量χ2分布相近似 ,这时, 这时,可不作连续性矫 正 , 但 要 求各组内的理论次数不小于5。若 某组的理论次数小于5,则应把它与其相邻的 一组或几组合并, 一组或几组合并,直到理论次数大 于5 为 止。

非参数检验(卡方检验)实验报告

. . 大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验)专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

a. 不假定零假设。 b. 使用渐进标准误差假定零假设。 分析:表11为LPA和FA两种检测结果的的一致性检验。Kappa值是部一致性系数,除数据P值判断一致性有无统计学意义外,根据经验,Kappa≥0.75,表明两者一致性较好0.7>Kappa ≥0.4,表明一致性一般,Kappa<0.4,则表明一致性较差。 本例Kappa值为0.680,P=0.000<0.01,拒绝无效假设,即认为两种检测方法结果存在一致性,Kappa值=0.680,0.7>Kappa≥0.4,表明一致性一般。 例1 表12 周日频数表 观察数期望数残差 1 11 16.0 -5.0 2 19 16.0 3.0 3 17 16.0 1.0 4 1 5 16.0 -1.0 5 15 16.0 -1.0 6 16 16.0 .0 7 19 16.0 3.0 总数112 分析:表12结果显示一周各日死亡的理论数(Expected)为16.0,即一周各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual)。 表13 检验统计量 周日 卡方 2.875a df 6 渐近显著性.824 a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 16.0。 分析:Chi-Square过程,调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验,主要用于分析实际频数与某理论频数是否相符。卡方值X2=2.875,自由度数(df)=6,P=0.824>0.05,差异不显著,即可认为一周各日的死亡危险性是相同的。 例2 表14 二项式检验 类别N 观察比例检验比例精确显著性(双侧)性别组 1 0 12 .30 .50 .017 组 2 1 28 .70

相关主题
文本预览
相关文档 最新文档