当前位置：文档之家› 第九章卡方检验

第九章卡方检验

第九章卡方检验习题

一、是非题

1．比较两个独立样木的四格表资料，用Pearson 2χ检验，则Pearson2χ统计量近似服从自由度为1的2χ分布.

2．当H0成立时，两样本四格表资料中a的理论数T a与实际数a的差异可以理解为抽样误差.

3.当n＜40时，对某个四格表资料用Fisher检验，其P＝0.01，则认为这是一个小概率事件.

4.比较两个独立样本的两分类资料所构成的四格表资料，用Pearson

χ，则可以拒绝H0，但还有可能犯第二类错误.

χ检验，2χ>2

0.05,1

5.对于比较两个独立样本的四格表资料.用Pearson2χ检验．样本量越大，P≤0.05的可能性就越大.

二、选择题

1．配对设计的两个总体率的比较.若用四格表专用公式，设检验水平为α，则（）

A.实际发生第一类错误的概率为α，发生第二类错误的概率β增大

B.实际发生第一类错误的概率＞α.发生第二类错误的概率β不变

C.实际发生第一类错误的概率≠α

D．实际发生第一类错误的概率和第二类错误的概率均不变

2．某成组设计的四格表资料用2χ检验的基本公式算得为a，用专用公式算得为b，则（）

A．a>b B．a=b C．a比b准确D．b比a准确

χ，可认为（）

3．进行四个样本率比较的2χ检验，如2χ＞2

0.01,3

A．各总体率不同或不全相同B．各总体率均不相同

C．各样木率均不相同D．各样本率不同或不全相同

4．当四格表的周边合计不变时，如果某个格的实际频数有变化，则其理沦频数（）

A．增大B．减小C．不变D．随该格实际频数的增减而增减

5．四格表资料的2χ检验的自向度（）

A．不一定等1 B．一定等于l

C．等于格子数减l D．等于样本含量减l

三、筒答题

1．两个独立样本的四格表资料在哪种情况下需要校正？为什么？

2．行×列表资料2χ检验的注意事项是什么？

3．配对四格表和普通四格表有何区别?分析方法有何异同?

第八章卡方检验

第八章 2 χ 检验一、教学大纲要求（一）掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。（1）四格表2χ检验公式的应用条件；（2）不满足应用条件时的解决办法；（3）配对四格表的2 χ检验。 3. 行?列表的2 χ检验。（二）熟悉内容频数分布拟合优度的2 χ检验。（三）了解内容 1．2 χ分布的图形。 2．四格表的确切概率法。二、教学内容精要 (一) 2 χ检验的用途 2χ检验（Chi-square test ）用途较广，主要用途如下： 1．推断两个率及多个总体率或总体构成比之间有无差别 2．两种属性或两个变量之间有无关联性 3．频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1．2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H （比如0H ：21ππ=）成立的条件下，实际频数与理论频数相差不应该很大，即2 χ值不应该很大，若实际计算出的2 χ值较大，超过了设定的检验水准所对应的界值，则有理由怀疑0H 的真实性，从而拒绝0H ，接受H 1（比如1H ：21ππ≠）。 2．基本公式：()∑ -= T T A 2 2 χ，A 为实际频数（Actual Frequency ）,T 为理论频数（Theoretical Frequency ）。四格表2 χ检验的专用公式正是由此公式推导出来的，用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1．率的抽样误差与标准误样本率与总体率之间存在抽样误差，其度量方法： n p ) 1(ππσ-= ，π为总体率，或 (8-1) n p p S p ) 1(-= ， p 为样本率； (8-2) 2．总体率的可信区间当n 足够大，且p 和1-p 均不太小，p 的抽样分布逼近正态分布。

卡方检验法

第八章记数数据统计法—卡方检验法知识引入在各个研究领域中，有些研究问题只能划分为不同性质的类别，各类别没有量的联系。例如，性别分男女，职业分为公务员、教师、工人、……，教师职称又分为教授、副教授、……。有时虽有量的关系，因研究需要将其按一定的标准分为不同的类别，例如，学习成绩、能力水平、态度等都是连续数据，只是研究者依一定标准将其划分为优良中差，喜欢与不喜欢等少数几个等级。对这些非连续等距性数据，要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用：拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同，适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。在计数数据进行统计分析时要特别注意取样的代表性。我们知道，统计分析就是依据样本所提供的信息，正确推论总体的情况。在这一过程中，最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中，所搜集到的有些数据属于定性资料，它们常常是通过调查、访问或问卷获得，除了少数实验可以事先计划外，大部分收集数据的过程是难于控制的。例如，某研究者关于某项教育措施的问卷调查，由于有一部分教师和学生对该项措施存有意见，或对问卷本身有偏见，根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点，所以它是一个有偏样本，若据此对总体进行推论，就会产生一定的偏差，势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时，要特别小心谨慎，防止样本的偏倚性，只有具有代表性的样本才能作出正确的推论。第一节卡方拟合性检验一、卡方检验的一般问题卡方检验应用于计数数据的分析，对于总体的分布不作任何假设，因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明，实际观察次数（f o）与理论次数（f e），又称期望次数）之差的平方再除以理论次数所得的统计量，近似服从卡方分布，可表示为：这是卡方检验的原始公式，其中当f e越大（f e≥5）,近似得越好。显然f o与f e相差越大，卡方值就越大；f o与f e相差越小，卡方值就越小；因此它能够用来表示f o与f e相差的程度。根据这个公式，可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况：

第八章卡方检验与交互分析#(精选.)

第八章卡方检验与交互分析交互分析是社会调查研究中常用方法之一，用于研究两个定类变量的关系。交互分析中用于检验两个变量是否相关的方法叫做卡方检验，也叫独立性检验。卡方检验是建立在观测频次和期望频次之差基础上的一种检验。一、卡方检验的原理例：一项调查得到890个样本的与收入和所处地区的数据，希望分析收入和地区的关系。表1 要检验的H0：收入和地区之间没有相关性，即每一地区的收入分布模式应该是相同的，收入的高低不应随着地区的不同而有所差异。也就是说，如果东部城市的四个收入类别各自比重和中西北部城市的四个收入类别各自比重一致，那么，收入和地区之间是相互独立的。如果这个890人的样本能够反应总体的独立性特征，那么就应该能够观测到两个地区具有相同的收入分布模式，称为期望模式，样本的期望观测频次如下：表2 接下来，计算观测频次f0与期望频次f e之间的偏差(f0-f e)，如果这些偏差比较小，则有利于证明原假设即总体的独立性。反之，则可能推翻原假设。但偏差之和为0，所以对偏差进行平方。但是，为了说明每一个偏差的相对重要性，每一偏差平方和都需要和本组中的期望频次相比较，计算相对(f0-f e)2/f e。然后，将所有组的贡献相加，从而得到度量全部偏差的一个量，叫做卡方

χ2= ，服从自由度为(c-1)(r-1)的卡方分布。如用c 和r 分别表示表中的列数和行数，自由度为(c-1)(r-1)。 f 0 f e 153.3 164.7 80 86 66 71 129.7 139.3 (f 0-f e ) (f 0-f e )2/f e 计算出卡方值后，可根据已知的显著性水平和自由度查卡方分布表，找出临界值，与之作对比。反过来，也可以计算出概值，再根据我们所希望的显著性水平做比较。该例题中计算出χ2为31.6，查表发现对应自由度为3的那一行的所有临界值都小于χ2，因此，概值小于0.001。由于概值如此小，检验水平可以是1%甚至更小，所以一定可以拒绝原假设。也就是说，在总人口中，收入与地区有显著的相关性，二者并不独立。练习题：在电视的收视率调查中，得到性别与收视习惯的联列表如下，试分析性别和收视习惯的关系。男女总频次几乎天天看 38 24 62 偶尔看 31 7 38 总频次 69 31 100 相对频率 0.69 0.31 1.00 解：原假设为“性别和收视习惯相互独立”，如果原假设成立，那么两列期望凭此应通过0.69和0.31分别乘以最后一列总频次而得到。 42.8 19.2 146 172 66 100 51 86 166 103 -7.3 7.3 -14 14 -15 15 36.3 -36.3 0.35 0.32 2.45 2.28 3.41 3.17 10.16 9.46 38 24 31 7

卫生统计学第七章卡方检验十

卫生统计学第七章卡方检验十一、题型：A1 题号：1 本题分数：2 四格表资料两样本率比较的χ2检验，正确的一项为 A．χ2值为两样本率比较中u值 B．P<α前提下，χ2值越大，越有理由拒绝H0 C．χ2值大小与样本含量无关 D．每个格子的理论频数与实际频数的差值相等 E．χ2检验只能进行单侧检验正确答案：B 答案解析：根据专业知识确定四格表资料两样本率比较的χ2检验采用单侧检验或是双侧检验，(也可使用四格表专用公式)，可以证明四格表计算得出的χ2值与正态近似法两率比较中u值的平方相等，其大小与样本含量有关，且每个格子的理论频数与实际频数的差的绝对值相等，P<α前提下，自由度一定时，χ2值越大，P值越小，越有理由拒绝H0，故答案为B。做答人数:0

做对人数:0 所占比例: 0 题号：2 本题分数：2 下列能用χ2检验的是 A．成组设计的两样本均数的比较 B．配对设计差值的比较 C．多个样本频率的比较 D．单个样本均数的比较 E．多个样本均数的比较正确答案：C 答案解析：χ2检验可用于率或构成比比较的假设检验中，不适宜于均数的比较。做答人数:0 做对人数:0 所占比例: 0 题号：3 本题分数：2 行×列表的自由度是 A．行数-1 B．列数-1

C．行数×列数 D．(行数-1)×(列数-1) E．样本含量-1 正确答案：D 答案解析：行×列表中，行的自由度=行数-1，列的自由度=列数-1，行×列二维表资料的χ2统计量所对应的自由度=(行数-1)×(列数-1)。做答人数:0 做对人数:0 所占比例: 0 题号：4 本题分数：2 四个百分率做比较，有一个理论数小于5，其他都大于5，则 A．只能做校正χ2检验 B．不能做χ2检验 C．直接采用行×列表χ2检验 D．必须先做合理的合并 E．只能做秩和检验正确答案：C 答案解析：四个百分率做比较，资料可整理为4×2的行×列表，多个率比较的行×列表资料不适宜采用秩和检验，当满足行×列表资料

卡方检验应用

在计数数据进行统计分析时要特别注意取样的代表性。我们知道，统计分析就是依据样本所提供的信息，正确推论总体的情况。在这一过程中，最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中，所搜集到的有些数据属于定性资料，它们常常是通过调查、访问或问卷获得，除了少数实验可以事先计划外，大部分收集数据的过程是难于控制的。例如，某研究者关于某项教育措施的问卷调查，由于有一部分教师和学生对该项措施存有意见，或对问卷本身有偏见，根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点，所以它是一个有偏样本，若据此对总体进行推论，就会产生一定的偏差，势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时，要特别小心谨慎，防止样本的偏倚性，只有具有代表性的样本才能作出正确的推论。第一节卡方拟合性检验一、卡方检验的一般问题

第十章卡方检验..

第十章χ2检验 χ检验的原理第一节2 χ检验的假设一、2 （一）分类相互排斥，互不包容 2 χ检验中的分类必须相互排斥，这样每一个观测值就会被划分到一个类别或另一个类别之中。此外，分类必须互不包容，这样，就不会出现某一观测值同时划分到更多的类别当中去的情况。（二）观测值相互独立各个被试的观测值之间彼此独立，这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时，常常会违反这个假定。当讨论列联表时，独立性假定是指变量之间的相互独立。这种情况下，这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。（三）期望次数的大小每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格 χ检验时，每一个单元格的期望次数至少不应低于的标准，当自由度等于1时，在进行2 10，这样才能保证检验的准确性。另外，在许多分类研究中会存在这样一种情况，如自由度很大，有几个类别的理论次数虽然很小，但在给以接受的标准范围内，只有一个类别的理论次数低于1。此时，一个简单的处理原则是设法使每一个类别的理论次数都不要低于1，分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中，应运用一个精确的多项检验来避免使χ检验。用近似的2 χ检验的类别二、2 （一）配合度检验配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近，这种2 χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时，这种检验又可称为正态吻合性检验。（二）独立性检验独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立 χ检验适用于探讨两个变量之间是否具有关联（非独立）或无关（独性的问题。这种类型的2

第八章卡方检验

第八章
2 χ 检验
次数资料分析
上一张下一张主页
退出

第一节
性别男女
卡方检验的意义和原理
理论次数 T 50 50 100
实际次数 A 51 49 100
问男女比例是否符合1：1，即与1：1性别比差异是否显著。性别比差异是否显著。

χ =
2
∑
A—实际次数
(A ? T) T
2
T—理论次数
χ2是度量实际观察次数与理论次数偏离程度的一个统计量，论次数偏离程度的一个统计量， χ2越小，越小，表明实际观察次数与理论次数越接近；论次数越接近； χ2 =0，表示两者完全吻合；者完全吻合； χ2越大，越大，表示两者相差越大。相差越大。
上一张下一张主页退出

在对次数资料进行χ2检验利用连续型随机变量χ2分布计算概率时，分布计算概率时，常常偏低，常常偏低，特别是当自由度为1时偏差较大。时偏差较大。 Yates(1934)提出了一个矫正公式，提出了一个矫正公式，矫正后的χ2值记为
χ =∑
2 c
( A ? T ? 0.5) T
2
上一张下一张主页
退出

当自由度大于1时，χ2分布与连续型随机变量χ2分布相近似，这时，这时，可不作连续性矫正，但要求各组内的理论次数不小于5。若某组的理论次数小于5，则应把它与其相邻的一组或几组合并，一组或几组合并，直到理论次数大于5 为止。

文档之家

第九章 卡方检验

第八章卡方检验

卡方检验法

第八章 卡方检验与交互分析#(精选.)

卫生统计学第七章卡方检验 十

卡方检验应用

第十章 卡方检验..

第八章卡方检验

第九章卡方检验

第八章卡方检验与交互分析#(精选.)

卫生统计学第七章卡方检验十

第十章卡方检验..