第十章 卡方检验
- 格式:ppt
- 大小:583.50 KB
- 文档页数:43
卡方检验的原理和步骤卡方检验(Chi-squared test)是一种用于统计学中的假设检验方法,主要用于检验两个或更多个分类变量之间是否存在相关性。
它的原理和步骤可以概括如下:原理:卡方检验是基于卡方统计量的方法,卡方统计量是通过计算实际观察值与期望理论值之间的差异来判断变量间是否存在相关性。
具体来说,卡方统计量是通过计算每个观察值与对应期望值之间的差异平方的总和来衡量的。
如果差异较小,说明实际观察值与期望值之间较为接近,两个变量间可能不存在相关性;如果差异较大,则说明实际观察值与期望值之间存在较大差异,两个变量间可能存在相关性。
步骤:1.建立假设:在进行卡方检验之前,需要明确两个变量之间的假设。
通常有两种假设:原假设(H0)和备择假设(Ha)。
原假设是指两个变量之间没有相关性,备择假设是指两个变量之间存在相关性。
2.构建列联表:列联表(Contingency table)是用来统计两个或多个分类变量的交叉频次分布的表格。
在卡方检验中,我们需要根据实际观察数据构建列联表。
3.计算期望值:在卡方检验中,我们需要计算期望理论值。
期望理论值是指如果两个变量之间不存在相关性,那么我们可以根据边际总计与变量间的分布来计算出的预期频次。
一般情况下,期望理论值可以通过边际总计和整体频率来计算。
4.计算卡方统计量:在有了观察值和期望理论值后,我们可以通过计算卡方统计量来判断两个变量之间是否存在相关性。
卡方统计量的计算公式为:χ2=∑((O-E)^2/E),其中χ2为卡方统计量,O为观察值,E为期望理论值。
计算出卡方统计量后,可以根据自由度去查找对应的临界值。
5.决策:根据卡方统计量的计算结果,我们可以通过比较卡方统计量与对应自由度的临界值来进行决策。
如果卡方统计量小于临界值,则接受原假设,即认为两个变量之间没有相关性;如果卡方统计量大于临界值,则拒绝原假设,即认为两个变量之间存在相关性。
6.结论:最后,根据决策结果,我们可以得出结论,即两个变量之间是否存在相关性。
第十章 交互分类与2χ检验练习题:1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示:(1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。
(2) 请根据表10-26的数据完成下面的联合分布的交互分类表。
表10-27(3) 根据表10-27指出关于X 的边缘分布和关于Y 的边缘分布。
(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。
解:(1)Y F (从上到下):50;30;100.X F (从左到右):115;65.(2)P 11=15/180;P 21=35/180;1Y F N =50/180;P 12=20/180;P 22=10/180;2Y F N =30/180;P 13=80/180;P 23=20/180;3Y F N =100/180;1X F N =115/180;2X F N =65/180.(3)关于X 的边缘分布:x 分居 不分居 P(x)115/18065/180关于Y 的边缘分布: y 紧张 一般 和睦 P(y)50/18030/180100/180(4)关于X 的条件分布有三个:y=“紧张” x 分居 不分居 P(x)15/5035/50y=“一般” x 分居 不分居 P(x)20/3010/30y=“和睦” x 分居 不分居 P(x) 80/10020/100关于y 的条件分布有两个: X=“分居”y紧张 一般 和睦 P(y)15/11520/11580/115X=“不分居”y紧张 一般 和睦 P(y)35/6510/6520/652. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示:表10-28(1)根据表10-28的观察频次,计算每一个单元格的期望频次并填入表10-29。
表10-29 (2)根据表10-28和表10-29计算2χ,计算公式为2()2o e ef f f χ-=∑。