第十章卡方检验

格式：ppt
大小：583.50 KB
文档页数：43

下载文档原格式

/ 43

卡方检验的原理和步骤

卡方检验的原理和步骤卡方检验（Chi-squared test）是一种用于统计学中的假设检验方法，主要用于检验两个或更多个分类变量之间是否存在相关性。

它的原理和步骤可以概括如下：原理：卡方检验是基于卡方统计量的方法，卡方统计量是通过计算实际观察值与期望理论值之间的差异来判断变量间是否存在相关性。

具体来说，卡方统计量是通过计算每个观察值与对应期望值之间的差异平方的总和来衡量的。

如果差异较小，说明实际观察值与期望值之间较为接近，两个变量间可能不存在相关性；如果差异较大，则说明实际观察值与期望值之间存在较大差异，两个变量间可能存在相关性。

步骤：1.建立假设：在进行卡方检验之前，需要明确两个变量之间的假设。

通常有两种假设：原假设（H0）和备择假设（Ha）。

原假设是指两个变量之间没有相关性，备择假设是指两个变量之间存在相关性。

2.构建列联表：列联表（Contingency table）是用来统计两个或多个分类变量的交叉频次分布的表格。

在卡方检验中，我们需要根据实际观察数据构建列联表。

3.计算期望值：在卡方检验中，我们需要计算期望理论值。

期望理论值是指如果两个变量之间不存在相关性，那么我们可以根据边际总计与变量间的分布来计算出的预期频次。

一般情况下，期望理论值可以通过边际总计和整体频率来计算。

4.计算卡方统计量：在有了观察值和期望理论值后，我们可以通过计算卡方统计量来判断两个变量之间是否存在相关性。

卡方统计量的计算公式为：χ2=∑((O-E)^2/E)，其中χ2为卡方统计量，O为观察值，E为期望理论值。

计算出卡方统计量后，可以根据自由度去查找对应的临界值。

5.决策：根据卡方统计量的计算结果，我们可以通过比较卡方统计量与对应自由度的临界值来进行决策。

如果卡方统计量小于临界值，则接受原假设，即认为两个变量之间没有相关性；如果卡方统计量大于临界值，则拒绝原假设，即认为两个变量之间存在相关性。

6.结论：最后，根据决策结果，我们可以得出结论，即两个变量之间是否存在相关性。

《卡方检验正式》课件

卡方检验的结果可以直接解释为实际意义，例如，如果卡方值较大，则说明观察频数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大，且各分类的期望频数不能太小，否则可能导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感，离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据，如果数据中存在缺失值，需要进行适当的处理。
案例二：市场研究中的卡方检验
总结词
市场研究中，卡方检验用于评估不同市场细分或产品特征与消费者行为之间的关联。
VS
详细描述
在市场研究中，卡方检验可以帮助研究者了解消费者对不同品牌、产品或服务的偏好。例如，通过比较不同年龄段消费者对某品牌的选择比例，企业可以更好地制定市场策略和产品定位。
案例三：社会调查中的卡方检验
小，表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数确定期望频数，可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式，行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理，通过构建原假设和备择假设，利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数，通过卡方值的大小来
评估两者之间的差异程度。
03

第十章卡方检验

2 检验的基本公式，
表，确定其差异是否显著。（常用的方法）
其关键步骤是计算理论次数与确定自由度。（1）将实际次数分布的统计量代入所选的理论分布函数方程，求各分组区间的理论频率，然后乘以总数得各分组区间的理论次数；
16 （2）将分组的数目减去计算理论次数时所用统计量的数目即自由度。
[例10-5] 表10-2所列资料是 552 名中学生的身高次数分布，问这些学生的身高分布是否符合正态分布？
3、去除样本法； 4、使用校正公式。
7
第二节
察次数分布与某理论次数是否有差别。
配合度检验
配合度检验（goodness of fit test）主要用于检验单一变量的实际观
它检验的内容仅涉及一个因素多项分类的计数资料，是一种单因素检验（one-way test）。
一、配合度检验的问题
（一）统计假设
2、根据各组的理论次数与实际次数计算
2 值，得 2 3.905
3、确定自由度。本题共分 11 组，在计算理论次数时，对最高组和最低
组两极端次数进行了合并，合并后为 9 组。在计算理论次数的过程中共用到
平均数、标准差、总数 3 个统计量，故本题的自由度 df=9-3=6 。 4、查
2 表，得 02.05 12.6， 02.01 16.8
表10-2
身高分组 169 ~ 166 ~ 163 ~ 160 ~ 157 ~ 154 ~ 151 ~ 148 ~ Xe 170 167 164 161 158 155 152 149 fo 2 7 22 57 110 124 112 80
书中数字错！
552 名学生身高的理论次数分布及卡方检验
x 15.38 12.38 9.38 6.38 3.38 0.38 -2.62 -5.62 Z 3.03 2.44 1.85 1.26 0.67 0.07 -0.52 -1.11 y 0.0040 0.0203 0.0720 0.1840 0.3187 0.3979 0.3484 0.2154 p 0.0023 0.0120 0.0426 0.1088 0.1885 0.2354 0.2061 0.1274 fe 1 7 24 60 104 130 114 70

《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容，选择合适的行列变量，构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表，以便于进行卡方检验。
计算理论频数
确定期望频数
根据交叉表中的数据，结合各组的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理论频数，为后续的卡方检验提供依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值，该值反映了实际频数与理论频数的差异程度。
自由度的确定
在计算卡方值时，需要确定自由度，自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标，通常选择0.05或0.01作为显著性水平。
判断显著性
根据卡方值和自由度，结合显著性水平判断卡方检验的结果是否显著，从而得出结论。
3.84、6.63等），可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前，需要明确研究的目的和假设，以便有针对性地收集相关数据。
根据研究目的和内容，制定合适的调查问卷或建立数据收集程序，确保数据的完整性和准确性。
详细描述
例如，在市场调研中，我们可以通过卡方检验来分析不同年龄段、性别、职业等人群对于某产品的态度或购买意愿是否有显著差异，从而为产品定位和营销策略提供依据。
实际案例二：医学研究中的应用
总结词
在医学研究中，卡方检验常用于病例对照研究和队列研究中的分类变量关联性分析。
详细描述
例如，在病例对照研究中，我们可以通过卡方检验来比较病例组和对照组在某些基因型、生活方式或暴露因素上的分布是否有统计学差异，从而探讨病因或危险因素。

卡方检验

10.4802
统计决断

双向表的自由度: df=(r -1)(c -1) 查χ2值表，当 df =(3-1)(3-1)=4 时
(24)0.05 9.49
(24)0.01 13.3
9.49 ＜χ2= 10.48 ＜ 13.3，则 0.05 > P > 0.01 结论：学生是否愿意报考师范大学与家庭经济状况有显著关系。
1 ：2 ：1 ？
解：1.提出假设 H0：健康状况好、中、差的人数比例是1：2：1 H1：健康状况好、中、差的人数比例不是1：2：1 2选择检验统计量并计算对点计数据进行差异检验,可选择χ2检验
（3）计算理论次数
fo
fe
13.5 27.0 13.5
54
好中差
总和
15 23 16
54
4、计算卡方值
5、比较决策查χ2值表，当 df =k -1=2 时
(22)0.05 5.99
χ2= 1.22 ＜ 5.99，则 P > 0.05
结论：理论频数与实际频数差异不显著,表明该校老年教师健康状况的人数比例是1：2：1。
χ2的连续性校正
例3：历年优秀学生干部中男女比例为2：8，
今年优秀学生干部中有3个男生，7个女生。问今年优秀学生干部的性别比例与往年是否有显著差异？
六、四格表的χ2检验
如果r×c表的χ2检验所作的结论为差异
显著，这并不意味着各组之间的差异都显著。如果需要进一步知道哪些组差异显著，哪些组差异不显著，还需进行四格表的χ2检验。
1、四格表的含义
四格表是只有两行、两列的双向表。也就
是有两个变量，每一个变量各被分为两类
的双向表
变量Ⅰ 变量 Ⅱ 合计 A C A+C B D B+D 合计 A+B C+D N=A+B+C+D

卫生统计学：第10章卡方检验

T
bc
式中，a, d 为两法观察结果一致的两种情况， b, c为两法观察结果不一致的两种情况。
配对卡方检验公式使用条件：
b+c＞40, 2 (b c)2 , 1
bc
b+c≤40,
2 c
( b c 1)2 bc
,
=1
1、建立检验假设并确定检验水准 H0： π1=π2 ，即两种检测方法阳性率相同 H1 ：π1≠π2 ，即两种检测方法阳性率不同 α=0.05 2、计算检验统计量
T
2
(ad bc)2n
(ab)(ac)(bd)(cd)
2 分布是一连续型分布，而四格表资料属离散型分布，由此计算得的 2 统计量的抽样分布亦呈离散性质。为改善 2 统计量分布的连续
性，则进行连续性校正。
(四)四格表资料检验的校正公式
2 c
( A T 0.5)2 T
(| ad - bc | - n)2 n
2 n(
A2 1) nR nC
(行数 1)(列数 1)
2 2.37, 2 4.11,
0.05 , 3
0.25 , 3
2 2.595 P,3 0.25 p0.5
行×列表χ2检验时的注意事项
1、行×列表中各理论频数不应小于1，并且1≤T＜5 的格子数不宜超过总格子数的1/5，若发生上述情况，可采用下述方法：（1）增大样本含量以增加理论频数。（2）根据专业知识，考虑删去理论频数太小的行或列，将理论频数过小的格子所在的行或列与性质相近的邻行或列中的实际频数合并。（3）改用双向无序R×C 表资料的Fisher确切概率法。
资料类型？设计方案？统计方法是否正确？结论是否正确？
1、建立检验假设并确定检验水准 H0： π1=π2= π3，即三种药物治疗的有效率相同 H1 ：π1≠π2 ≠ π3 ，即三种药物治疗的有效率不全相同 α=0.05

第十章卡方检验

19
第二节单向表的卡方(χ2)检验
二、一个自由度的χ2检验
检验的步骤：
（2）计算χ2值
本例df=1，两组的理论频数均为ft=38>5。
2

f0 ft 2
ft
表10.4 喜欢与不喜欢体育人数的χ2值计算表
f0 ft f0-ft (f0-ft)2 (f0-ft)2/ ft
喜欢 50 38 12 144 3.79 不喜欢 26 38 -12 144 3.79
f0 ft 2
求χ2=5.202
ft
29
第二节单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验检验的步骤：（3）统计决断正态性χ2检验的自由度df=K-3。K是合并后保留下来的组数。 df=7-3=4。自由度df=K-3的原因： 1单向表的χ2检验受到∑(f0-ft)=0一个因子的限制。 2应用Z=(X-X)/ σX的公式计算理论频数时，运用了X和 σX两
12 16 4
3.5
12.25 12.25/16=0.77
非团员 8 4 4
3.5
12.25
12.25/4=3.06
总和 20 20
χ2=3.83
25
第二节单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况检验的步骤：（3）统计决断根据df=1，查χ2值表，χ2(1)0.05=3.84，由于χ2=3.83<3.84=χ2(1)0.05，则P>0.05，于是保留H0而拒绝H1。其结论为：该校共青团员的比率与全区没有显著性差异。
4
第一节卡方(χ2)及其分布
比率和比率之差的假设检验，是对二项分布数据的假设检验。 ——处理一个因素分成两类， ——或者两个因素，每个因素都分为两类的资料。 ——最多只能同时比较两组比率的差异。

卡方检验与列联表

生物统计学·卡方检验与列联表
适合性检验
1. 零假设与备择假设 H0：实际观察次数之比符合9:3:3:1的理论比例。 HA：实际观察次数之比不符合9:3:3:1的理论比例。
2. 选择计算公式由于本例的属性类别分类数 k=4，自由度df = k-1 = 4-1 = 3 > 1，故利用(1)式计算X2。
生物统计学第10讲卡方检验与列联表
2012.10
生物统计学·卡方检验与列联表
内容
卡方检验(Chi Squared Test, 2 Test) •2检验基本概念
• 适合性检验 • 独立性检验
- 列联表 (Contingency Table) - 2×2列联表 - R×C列联表
*总体 2检验 * 两两比较 2检验

n 1 S2
2
n 1 S 2
2
~
2 n 1
生物统计学·卡方检验与列联表
2分布
随自由度的增大，曲线由偏斜渐趋于对称。df≥30
时， 2分布近似正态分布
生物统计学·卡方检验与列联表
2检验基本概念
计数资料2 检验的基本思想：首先假设观察频数(O)与期望频数(E)没有差别，而X2 值表示观察值与理论值的偏差程度。当n较大时，X2 统计量近似服从n-1个自由度的2 分布。
多个因子属性类别数的不同而构成R×C列联表. 而适合性检验只按某一因子的属性类别将如性别、表现型等次数资料归组。 2. 适合性检验按已知的属性分类理论或学说计算理论次数。独立性检验在计算理论次数时没有现成的理论或学说可资利用，理论次数是在两因子相互独立的假设下进行计算。 3. 在适合性检验中确定自由度时，只有一个约束条件：各理论次数之和等于各实际次数之和，自由度为属性类别数减1; 独立性检验的自由度为(R-1)(C-1)

第十章卡方检验

率，也有理论概率，如二项分布、正态分布等。
二、配合度检验的应用
（一）检验无差假说
无差假说，是指各项分类的实计数之间没有差异，也就是假设各项分类之间的机会相等，或概率相等，因此理论次数完全按概率相等的条件计算。即：
1 理论次数=总数× 分类项数
例10-1：随机抽取60名学生，询问他们在高中是否需要文理分科，赞成分科的39人，反对分科的 21人，问他们对分科的意见是否有显著差异？ (p298)
去除样本法
使用校正公式
第二节配合度检验
配合度检验（goodness of fit test）主要用于检验单一变量的实际观察次数分布与某理论次数
是否有差别。由于它检验的内容仅涉及一个因素
多项分类的计数资料，故可以说是一种单因素检验（One-way test)。
一、配合度检验的一般问题
（一）统计假设统计假设如下：
有的人因此用t检验检验两者的差异，这样做行吗？
第一节
2

2
检验的原理
一、检验的假设
（一）分类相互排斥，互不包容
检验中的分类必须相互排斥，这样每一
2
个观测值就会被划分到一个类别或另一个类别之中。此外，分类必须互不包容，这样，就不会出现某一观测值同时划分到更多的类别当中去的情况。
（二）观测值相互独立
3）统计决策
查值表，当df 1时，
2 2 2 0.05
3.84，
2 0.01
6.63 ，
算得值在两者之间，所以， p 0.05或 0.01

2 0.05
2 2 0.01
答：可以推论说，学生们对高中文理分科的态度有显著差异，做这一结论犯错误的概率在 .05至 0 0.01之间。

第十章卡方检验

1.2967
0.4338 0.0960
步骤四
2
fo fe 2 2.3293
fe

自由度 = （R-1）×（C-1）=（2-1）×（4-1）= 3 α = 0.05，查表得：χ²α (3) = 7.815 由于 χ² < χ²α (3)，所以我们不能拒绝虚无假设，即认为四个专业的学生对宿舍管理改革的赞成是一致的，调查数据中的差异是由于抽样的随机性造成的。
Ho：阅读习惯与学历没有关系
Ha：阅读习惯与学历有关系

我们需要利用 χ² 检验来进行独立性检验，这时候需要计算 χ² 统计量，而 χ² 统计量是根据观察值和期望值计算得出来的。因而，首先，我们需要计算期望值。根据列联表中任一单元格频数的 RT CT RT CT 期望值公式来求期望值：f e n n n n 其中，RT 是给定单元格所在行的合计；CT 是给定单元格所在列的合计；n 为观察值的总个数，即样本容量。

只有列数，行数均相同时，我们才可以进行比较，而且要采用同种系数才具有可比性。

克拉默 V 系数

φ 系数没有上限，克拉默 (Gramer) 以 φ 系数为基础提出了 V 相关系数。其计算公式为：
V
n minR 1, C 1
2

其中，min [ (R-1), (C-1) ] 表示取 (R-1) 和 (C-1) 中较小的一个； V 的取值范围 0 ~ 1；
fe
28.8 34.04 10.75 16.46 19.7 23.29 10.75 11.26
（ fo - fe）
9.2 5.96 0.25 - 10.46 1.3 - 1.29 - 1.75 1.74

第十章卡方检验.ppt

况下，4个基本数据当中只有一个可以 Nhomakorabea由取值。
样本率与总体率比较
例： • 全国高血压病调查结果：城市人口高血
压病患病率19.6%； • 某调查获得有高血压病家族史者358人，
其中高血压病者127人（P=35.47%）问：有高血压病家族史者患病率是否高于
一般人群？
实际（A）理论（T）
+
-
合计
127
Mantel-Haenszel Chi-Square
1 15.0822 0.0001
Phi Coefficient
0.5386
Contingency Coefficient
0.4742
Cramer's V
0.5386
关联性分析
• 行×列表的关联 P157：例10-8
Statistic Chi-Square Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V
DF
Value Prob
6 15.3475 0.0177
6 14.7197 0.0226
1 3.5070 0.0611
0.1781
0.1753
0.1259
R × C表资料Chi-Square检验应注意的问题
• 应用条件； • 多重比较问题 • 关联性分析问题 • 等级资料分析问题
– 双向无序单资料的分析 – 单向有序资料的分析 – 双向有序、属性不同资料的分析 – 双向有序、属性相同资料的分析
注意：不同年龄组可以合并，但不同血型就不能合

第10章--卡方检验-(Chi-PPT课件

备择假设：两变量之间有关联或差异显著，一般用文字叙述，不用统计符号。
例题：某学校对学生的课外活动内容进行调查，结果整理成下表：
-
18
应用举例一
女性男性总和
自我知觉
总和
过轻
过重
419
1995
2414
（786.78）（1627.22）
959
855
1814
（591.22）（1222.78）
1378
1995 1938.67
56.33 3173.41
1.37
5816 5816
0
2297.1 3
df=3-1=2 查表，0.05水平上临界值为5.99，故……
df=3-1=2 查表， 0.01水平上临界值为9.21
-
15
三、卡方独立性检验
（一）适用材料主要用于两个或两个以上因素多项分类的计数资料
分析。如果要研究的两个自变量之间是否具有独立性或有无关联或有无“交互作用”的存在，就要应用卡方独立性检验。如果两个子变量是独立的，无关联的，就意味着对其中一个自变量来说，另一个自变量的多项分类次数上的变化是在取样误差的范围之内。假如两个因素是非独立，则称两变量有交互作用。
第十二章非参数检验
-
1
一、参数与非参数检验
参数检验用于等比/等距型数据参数检验的前提：正态分布和方差同质
非参数检验不用对参数进行假设对分布较少有要求，也叫distributionfree tests 用于名义/顺序型数据
-
2
参数统计和非参数统计优缺点
• 参数统计优点：
对资料的分析利用充分统计分析的效率高
于等与临界值才显著），使用9或3均可 • 接受虚无假设

医学统计学课件卡方检验

队列研究中的卡方检验
总结词
在队列研究中，卡方检验用于比较不同暴露水平或不同分组在某个分类变量上的分布差异，以评估暴露因素与疾病发生之间的关系。
详细描述
队列研究是一种前瞻性研究方法，按照暴露因素的不同将参与者分为不同的组，追踪各组的疾病发生情况。通过卡方检验，可以比较不同暴露水平或不同分组在分类变量上的分布差异，如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异，而相关性分析则用于研究两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下，卡方检验的结果可以为相关性分析提供参考，帮助了解变量之间的关联程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$，
其中 $O_{ij}$ 表示实际观测频数，$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较，可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望频数应该大于5。
卡方检验对于样本量较小的情况可能不适用。
观察频数与期望频数应该服从相同的概率分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前，需要明确研究的目的和假设，以便有针对性地收集数据。

(医统)卡方检验

2
观测值的自由度（vi>2），Si为第i组观测值的标准差 2 • 拒绝原假设的条件为： 2 ,
F检验
• 检验两组观测值的方差的齐性 • 原假设： 2 2
1 2
• 检验统计量：
2 2 2 S1 F 2 2 ~ F( 1 , 2 ) 1 S2
• 拒绝条件： F F /2 (1, 2 )或F F1 /2 (1, 2 )
2.拟合优度检验
• B.表征实验分布，即用卡方统计量检验实验分布是否服从某一理论分布（正态、二项等） • 步骤：1.将总体X的取值范围分成k个互不重迭的小区间 • 2.计算落入第i个小区间的样本值的观测频数 • 3. 根据所假设的理论分布, 算出总体X的值落入每个小区间的概率p,于是np就是落入该区间的样本值的理论频数 • 4.计算卡方统计量 • 5.与临界值进行比较，进行决策
χ2 检验数据资料总体检验对象
离散型资料总体分布是未知的
连续型资料假设检验
连续型资料正态分布对总体参数或几个总体参数之差
不是对总体参数的检验，而是对总体分布的假设检验
三、χ2 检验的用途
适合性检验
是指对样本的理论数先通过一定的理
论分布推算出来，然后用实际观测值与理论
数相比较，从而得出实际观测值与理论数之
理论值(E)
696.75 232.25 929
O-E
+8.25 -8.25 0
由于差数之和正负相消，并不能反映实际观测值与理论值相差的大小。
为了避免正、负相抵消的问题，可将实际观测值与理论值的差数平方后再相加，也就是计算：
∑（O－E）2
O－－实际观察的频数 E－－无效假设下的期望频数

卡方检验1011ppt课件

n R nC
多个样本率的比较
例11.3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压的疗效，将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组，分别采用三种方案治疗。一个疗程后观察疗效，结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别？
表11.4 三种方案治疗轻、中度高血压的效果
编号
组别
编号
1
乙药
67
2
甲药
68
3
乙药
69
4
甲药
70
5
乙药
71
6
甲药
72
7
甲药
73
8
乙药
74
9
甲药
75
10
乙药
76
11
甲药
77
组别甲药乙药乙药甲药乙药甲药甲药甲药乙药乙药甲药
患儿编号 1 2 3 4 5
.
.
Table. 结果记录表处理乙药甲药乙药甲药乙药
. .
疗效有效有效无效有效无效
对子 2
C
随机
T
对子 3
C
配对设计
✓ 自身配对 a. 同一对象给予两种不同处理 b. 同一对象处理前后
例11.6 某研究者欲比较心电图和生化测定诊断低钾血症的价值，分别采用两种方法对79名临床确诊的低钾血症患者进行检查，结果见表11.9。问两种方法的检测结果是否不同？
患者编号 1 2 3 4 5
表11.9 两种方法诊断低血钾的结果
心电图
＋－合计
生化测定
＋
－
45
25
4
5
49

练习题解答：第十章交互分类与卡方检验

第十章交互分类与2χ检验练习题：1. 为了研究婆媳分居对于婆媳关系的影响，在某地随机抽取了180个家庭，调查结果如下表所示：（1）计算变量X 与Y 的边际和（即边缘和）X F 和Y F 并填入上表。

（2）请根据表10-26的数据完成下面的联合分布的交互分类表。

表10-27（3）根据表10-27指出关于X 的边缘分布和关于Y 的边缘分布。

（4）根据表10-27指出关于X 的条件分布和关于Y 的条件分布。

解：（1）Y F （从上到下）：50；30；100.X F （从左到右）：115；65.（2）P 11=15/180；P 21=35/180；1Y F N =50/180；P 12=20/180；P 22=10/180；2Y F N =30/180；P 13=80/180；P 23=20/180；3Y F N =100/180；1X F N =115/180；2X F N =65/180.（3）关于X 的边缘分布：x 分居不分居 P(x)115/18065/180关于Y 的边缘分布： y 紧张一般和睦 P(y)50/18030/180100/180（4）关于X 的条件分布有三个：y=“紧张” x 分居不分居 P(x)15/5035/50y=“一般” x 分居不分居 P(x)20/3010/30y=“和睦” x 分居不分居 P(x) 80/10020/100关于y 的条件分布有两个： X=“分居”y紧张一般和睦 P(y)15/11520/11580/115X=“不分居”y紧张一般和睦 P(y)35/6510/6520/652. 一名社会学家关于“利他主义”的研究中，对被调查者的宗教信仰情况进行了分析，得到的结果如下表所示：表10-28（1）根据表10-28的观察频次，计算每一个单元格的期望频次并填入表10-29。

表10-29 （2）根据表10-28和表10-29计算2χ，计算公式为2()2o e ef f f χ-=∑。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

本章教学目的：
推断：
两个总体率或构成比之间有无差别
多个总体率或构成比之间有无差别
两个分类变量之间有无关联性
频数分布拟合优度的检验
检验的基本思想
2
处理组甲乙合计
发生数
未发生数
合计 a+b c+d n
a c a+c
b d b+d
四格表资料的基本形式
基本思想：可通过检验的基本公式来理解。
Chi-Square =57.252
第一节 2× 2表检验
2
目的：推断两个总体率（构成比）是否有差别（和u检验等价）
资料：两样本的两分类个体数排列成四格表资料
四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
2
分布是一连续型分布，而四格
2 连续性校正仅用于 1 的四格表资料，当 2
时，一般不作校正。
四格表资料检验的校正公式

2 c
( A T 0.5) T
2
n 2 (| ad - bc | - ) n 2 2 c = (a +b)(c + d )(a + c)(b+ d )
P151：例10-1
2
2
( AT ) , (行数-1)(列数 1) T
2
式中，A为实际频数（actual frequency）， T为理论频数（theoretical frequency）。
检验统计量的吻合程度。
值反映了实际频数与理论频数
若检验假设 H0:π1=π2 成立，四个格子的实际频数 A 与理论频数T 相差不应该很大，即统计量 2 不应该很大。
DF
Value
Prob
1 3.0922 0.0787 1 2.9330 0.0868 1 1.6871 0.1940 1 3.0250 0.0820 0.2593 0.2510 0.2593
WARNING: 50% of the cells have expected counts less than 5. Chi-Square may not be a valid test.
如果值很大，即相对应的P 值很小，若 P ，则反过来推断A与T相差太大，超出了抽样误差允许的范围，从而怀疑 H0 的正确性，继而拒绝 H0 ，接受其对立假设 H1 ，即 π1≠π2 。
2
2 ( A T ) 值的大小还取决于由公式还可以看出： T 2 ( A T) 个数的多少（严格地说是自由度ν的大小）。由于各 T 2
Statistic Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V
Fisher's Exact Test Cell (1,1) Frequency (F) Left-sided Pr <= F Right-sided Pr >= F 28 0.9852 0.0994
Table Probability (P) Two-sided Pr <= P
0.0845 0.1628
两相关样本率检验（McNemar检验）
配对四格表资料的检验
2
P155：例10-4 ：
检验统计量为
(b c) , 1 bc
2 2

2 c
( b c 1) bc
2
, =1
注意：
本法一般用于样本含量不太大的资料。因
为它仅考虑了两法结果不一致的两种情况 (b, c)，
2
表资料属离散型分布，由此计算得的

2 统计量的抽样分布亦呈离散性质。为
改善统计量分布的连续性，则进行
2
连续性校正。
四格表资料检验公式选择条件：
2
公式；
n 40, T 5，不校正的理论或专用
，校正公式 n 40, 1 T 5 ，直接计算概率。 n 40 或 T 1
DF
Value
Prob
1 2.7384 0.0980 1 2.7481 0.0974 1 1.9455 0.1631 1 2.7184 0.0992 0.1414 0.1400 0.1414
Fisher's Exact Test Cell (1,1) Frequency (F) Left-sided Pr <= F Right-sided Pr >= F 68 0.9726 0.0816
样本率与总体率比较
例： • 全国高血压病调查结果：城市人口高血压病患病率19.6%； • 某调查获得有高血压病家族史者358人，其中高血压病者127人（P=35.47%）问：有高血压病家族史者患病率是否高于一般人群？
实际（A）理论（T）
+ 合计 127 231 358 70.168 287.832 358
2
皆是正值，故自由度ν愈大，值也会愈大；所以只有考虑 2 了自由度ν的影响，值才能正确地反映实际频数 A和理论频数T 的吻合程度。
检验的自由度取决于可以自由取值的格子 2 数目，而不是样本含量 n 。四格表资料只有，即在周边合计数固定的情两行两列， =1 况下， 4 个基本数据当中只有一个可以自由取值。
而未考虑样本含量n和两法结果一致的两种情况 (a, d) 。所以，当 n很大且 a 与 d的数值很大（即
两法的一致率较高）， b与 c的数值相对较小时，即便是检验结果有统计学意义，其实际意义往
往也不大。第二节R ×C表检验2行×列表资料
② 两个样本的构成比比较时，有2行C列，称 2×C表； ③ 多个样本的构成比比较，以及双向无序分类资料关联性检验时，有行列，称为R ×C表。
Table Probability (P) Two-sided Pr <= P
0.0541 0.1217
• P153：例10-2
Statistic Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V

第十章卡方检验

合集下载

卡方检验的原理和步骤

《卡方检验正式》课件

第十章卡方检验

《卡方检验》课件

卡方检验

卫生统计学：第10章卡方检验

第十章卡方检验

卡方检验与列联表

第十章卡方检验

第十章卡方检验

第十章卡方检验.ppt

第10章--卡方检验-(Chi-PPT课件

医学统计学课件卡方检验

(医统)卡方检验

卡方检验1011ppt课件

练习题解答：第十章交互分类与卡方检验

文档推荐

最新文档

第十章 卡方检验

合集下载

卡方检验的原理和步骤

《卡方检验正式》课件

第十章卡方检验

《卡方检验》课件

卡方检验

卫生统计学：第10章 卡方检验

第十章卡方检验

卡方检验与列联表

第十章 卡方检验

第十 章 卡方检验

第十章 卡方检验.ppt

第10章--卡方检验-(Chi-PPT课件

医学统计学课件卡方检验

(医统)卡方检验

卡方检验1011ppt课件

练习题解答：第十章交互分类与卡方检验

文档推荐

最新文档

第十章卡方检验

卫生统计学：第10章卡方检验

第十章卡方检验

第十章卡方检验

第十章卡方检验.ppt