38第二节 单向表的卡方检验
- 格式:ppt
- 大小:1.73 MB
- 文档页数:13
记数数据统计法—卡方检验法在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。
例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。
有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。
对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。
卡方检验是专用于解决计数数据统计分析的假设检验法。
本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。
拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。
独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。
在计数数据进行统计分析时要特别注意取样的代表性。
我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。
在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。
在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。
例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。
这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。
因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。
第一节卡方拟合性检验一、卡方检验的一般问题卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。
它由统计学家皮尔逊推导。
理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。
2X 检验或卡方检验和校正卡方检验的计算私立广厦学校 郭捷思在教育学量的研究中,各种各样的统计方法已经被广泛的应用,特别是由于统计软件(如:SPSS )的不断成熟,给教育研究者提供了多种量的研究方法。
但是,这并不是无论什么量的研究都要通过统计软件来实现,也不是所有量的研究一定要运用统计软件才能快捷,简便的实现。
本文将教给大家几种简便的方法来实现卡方检验。
2X 检验(chi-square test )或称卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。
它的零假设是样本来自的总体分布与期望分布或某一理论分布无显著差异。
根据卡方检验基本思想的理论依据,对变量总体分布的检验就可以从对各个观察频数的分析入手。
为检验实际分布与理论分布(期望分布)之间是否存在显著差异,可采用卡方检验统计量。
典型的卡方统计量是pearson 卡方,其基本公式为:∑=-=ki o i e i o i f f f X 12)( 式中k 为子集个数,o f 为观察频数,e f 为期望频数,2X 服从k —1个自由度的卡方分布。
如果2X 值较大,则说明观测频数分布与期望频数分布差距较大;反之,如果2X 值较小,则说明观测频数分布与期望频数分布较接近。
我们将通过代入数据运算这条公式,计算出2X统计量的观测值,并依据卡方分布表计算观测值对应的概率p值。
下面,将通过几个实际例子来探究如何进行卡方检验。
一、四格表资料的卡方检验例1:某学校分别运用传统教学和多媒体教学在两个平行班的数学课上进行试验,目的为了检测两种教学方法对学生的成绩影响是否有差异。
本实验把学生的成绩划分为优秀人数(80分以上)和非优秀人数。
表1:两种教学方法学生成绩优秀率的比较表内这四个数据(斜体)是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的;两种教学的优秀率分别为40%和68.6%,两者的差别可能是抽样误差所致,亦可能是两种教学效果确有所不同。
(完整word版)卡方分布概念及表和查表方法卡方分布概念及表和查表方法若n个相互独立的随机变量斤,农,…,n,E均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,目录1简介2定义3性质4概率表简介X2分布在数理统计中具有重要意义。
* 分布是由阿贝(Abbe)于1863年首先提出的, 后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡皮尔逊(C K ? Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。
定义若n个相互独立的随机变量斤、农、……、En,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和Q = &2‘2构成一新的随机变量,其分布规律称为X 分布(chi-square distribution ),度不同就是另一个i分布。
记为「或者蛙2占(其中?;,一池■:>,为限制条件数)。
r卡方分布是由正态分布构造而成的一个新的分布,当自由度v很大时,誥分布近似为正态分布。
对于任意正整数x,自由度为「的卡方分布是一个随机变量X的机率分布。
性质1)尤2分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数V的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1。
2)'分布的均值与方差可以看出,随着自由度:-的增大,■分布向正无穷方向延伸(因为均值「越来越大),分布曲线也越来越低阔(因为方差越来越大)。
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4)若沁毗丹*互相独立,则:X伽)+/(血)服从*分布,自由度为叫十巾。
5)尤2分布的均数为自由度砂,记为E(* ) = 1仁2 26)尤分布的方差为2倍的自由度(2# ),记为D(雄)=2"。
概率表一…2 匚分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在'分布中得对每个分布编制相应的概率值,这通过分布表中列出不同的自由度来表示,布的概率值,所以i分布中所给出的P值就不象标准正态分布中那样给出了400个不同度不同就是另一个i分布。