当前位置:文档之家› 卡方检验

卡方检验

卡方检验
卡方检验

第八章记数数据统计法—卡方检验法

知识引入

在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。

卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。

在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。

第一节卡方拟合性检验

一、卡方检验的一般问题

卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:

这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

拟合性检验的零假设是观测次数与理论次数之间无差异。其中理论次数的计算一般是根据某种理论,按一定的概率通过样本即实际观测次数来计算。这里所说的某种理论,可能是经验规律,也可能是理论分布。确定理论次数是卡方检验的关键。

拟合性检验自由度的确定与两个因素有关:一是分类的项数,二是在计算理论次数时,所用统计量或约束条件的个数,这两者之差即为自由度。由于一般情况下,计算理论次数时只用到“总数”这一统计量,所以自由度一般是分类的项数减1。但在对连续数据分布的配合度检验中,常常会用数据个数、平均数、标准差等统计量来计算理论次数,所以此时的自由度应从总分类项中减去更多的个数。按照检验中理论次数的定义不同,拟合性检验有以下集中应用。

二、检验无差假设

所谓无差假设,是指各项分类的实计数之间没有差异,也就是说各项分类之间的概率相等(均匀分布),因此理论次数完全按概率相等的条件来计算。即任一项的理论次数都等于总数/分类项数。因此自由度也就等于分类项数减1。

【例1】随机地将麻将色子抛掷300次,检验该色子的六个面是否均匀。结果1-6点向上的次数依次是,43,49,56,45,66,41。

解:每个类的理论次数是300/6 = 50,代入公式:

因此,在0.05的显著性水平下,可以说这个色子的六面是均匀的。

【例2】随机抽取60名高一学生,问他们文理要不要分科,回答赞成的39人,反对的21人,问对分科的意见是否有显著的差异。

解:如果没有显著的差异,则赞成与反对的各占一半,因此是一个无差假设的检验,于是理论次数为60/2=30,代入公式:

所以对于文理分科,学生们的态度是有显著的差异的。

三、检验假设分布的概率

这里的假设分布可以是经验性的,也可以是某理论分布。公式中所需的理论次数则按照这里假设的分布进行计算。

【例3】国际色觉障碍讨论会宣布,每12个男子中,有一个是先天性色盲。从某校抽取的132名男生中有4人是色盲,问该校男子色盲比率与上述比例是否有显著差异?

解:按国际色觉障碍讨论会的统计结果,132人应该有132/12=11人是色盲,剩下的121人非色盲,代入公式有:

因此,在0.05和显著性水平下,该校男子色盲比率与国际色觉障碍讨论会的统计结果有显著差异,显然根据比例可知该校的色盲率小于国际色觉障碍讨论会的统计结果。

【例4】在英语四级考试中,某学生做对了80个四择一选择题中的28题,现在要判断该生是否是完全凭猜测做题。

解:假如该生完全凭猜测做题,那么平均而言每道题做对的可能性是1/4,因此80个题中平均而能做对80/4=20题,代入公式有:

因此,该生可能会做一些题。

四、连续变量分布的拟合性检验

对于一组连续数据,经常需要对其次数分布究竟服从哪种理论分布进行探讨,这一方面的主要应用就是在前面经常所提到的总体正态性检验。首先要将测量数据整理成次数分布表和画出次分布图,并据此选择恰当的理论分布。这些理论分布是多种多样的,例如有正态分布、均匀分布等。然后根据选择的理论分布计算出理论次数,就可以计算卡方统计量并进行显著性检验了。若差异显著,说明所选择的理论分布不合适,可以再选一个理论分布进行检验,直至完全拟合。当然有时也只需检验是否与某确定的理论分布相符,如正态性检验(参见教材有关内容)。

对连续随机变量分布的吻合性检验,关键的步骤是计算理论次数与确定自由度。理论次数的计算是按所选理论分布规律,并利用观测数据的有关统计量来计算各分组(次数分布表中)理论次数。自由度则是用分组数减去计算理论次数时所用统计量的数目。

这种拟合性检验计算较为繁琐,不做要求。

五、小理论次数时的连续性校正

卡方检验中,当某分类理论次数小于5时,卡方统计量不能很好地满足卡方分布,此时需要对卡方统计量进行校正,称为卡方的连续性校正,其公式如下:

尽管采用此方法校正后,卡方统计量能较为接近卡方分布,不过我们仍然建议在实际中最好增大样本的容量,尽量减少出现这种不大服从理论分布的情况。

第二节独立性检验

卡方检验还可以用于检验两个或两个以上因素(各有两项或以上的分类)之间是否相互影响的问题,这种检验称为独立性检验。例如要讨论血型与性格的关系,血型有A、B、AB、O四类,性格采用心理学上的A型性格来划分,即有A型和B型两种,每个人可能是它们之间交叉所形成的8种类型中的一种,那么倒底它们之间有不有关系,就可以用卡方独立性检验。

卡方独立性检验用于检验两个或两个以上因素(各有两项或以上的分类)之间是否相互影响的问题。所谓独立,即无关联,互不影响,就意味着一个因素各个分类之间的比例关系,在另一个因素的各项分类下都是相同的,比如在血型与性格关系中,如果A型性格人群中各血型的比例关系,与B型性格人群中各血型的比例关系相同,就可能说血型与性格相互独立,当然这里的“两者比例相同”在统计的意义下,应表述为“两比例差异不超过误差范围”,因为就算总体之间相互独立,收集到两个比例完全相同的样本的可能是很小很小的,甚至是不可能的。相反,若一个因素各个分类之间的比例关系,在另一个因素的各项分类下是不同的,则它们之间相关。假如A型性格中A型血的比例高于B型性格中A型血的比例,而且达到显著水平,那么就可以说血型与性格之间相关,不相互独立。

卡方独立性检验的零假设是各因素之间相互独立。因此理论次数的计算也是基于这一假设,具体计算时,采用列联表的方式,后面将举例说明。

【例1】某校对学生课外活动内容进行调查,结果整理成下表,表中彩色格子里的数是原始数据的汇总数,括号内的数是理论次数(是按下面将要介绍的原理计算得来的),此外的是原始数据。

由于所有学生参加三项活动的比例是27:18:52,因此如果课外活动的选择与性别没有关系的话,男女生参加这三项活动的比例也应是这同一比例,而男女各自的人数可以计算,所以每格内的理论次数的计算方法如下:

男生中

参加体育活动的理论人数:55×27/97=15.3

参加文娱活动的理论人数:55×18/97=10.2

参加阅读活动的理论人数:55×52/97=29.5

女生中

参加体育活动的理论人数:42×27/97=11.7

参加文娱活动的理论人数:42×18/97= 7.8

参加阅读活动的理论人数:42×52/97=22.5

我们将行列的小计和分别用f x和f y来表示,总人数用N 来表示时,上述计算理论次数的方法可以表示为:

fe ij = fx i× fy j/N

所以,卡方独立性检验的公式可以表示如下,其中最后一个式子比较便于计算,fxy 表示每格的原始数据。

由于在计算理论次数时,用了按每个因素分类的小计和(fx 和fy,其个数分别记为R 个和C 个),和总和N ,而总和又可由按每个因素分类的小计和计算得来,因此若从总分类个数R×C中减去R+C,则将总和重复减去了,因此要补 1 个自由度回来,所以最终独立性检验的自由度表示为:

上述例题最终计算得:

或者:

这两个公式的计算结果有一点点差异,这完全是计算误差即四舍五入引起的。

df = (3-1)(2-1) = 2,而χ20.05(2) = 5.99,所以在0.05的显著性水平下,拒绝零假设,即可以认为性别与课外活动内容有关联,或者说男女生在选择课外活动上存在显著的差异。

四格表独立性检验

对于两个都只作两项分类的因素,它们的数据整理成的是一个2×2 的表格,一般称为四格表,对于四格表教材里给出了一个更简洁的公式:

公式中,a、b、c、d的规定要求是a和d必须呈对角线。该公式的含义非常明确,即当对角线单元格中的次数差异越大时,卡方检验越容易显著,自然也就意味着两变量间的关联越密切。掌握了一般的R*C表计算后,四格表计算相对简单地多。这里不再展开。

注意,在独立性检验中,同样存在某格的理论次数小于等于 5 的问题,如同拟合性检验中一样,我们仍然建议在实际中最好增大样本的容量,尽量减少出现这种不大服从理论分布的情况。

此外,在独立性检验中,若拒绝了零假设,即各因素之间有关联,则如同方差分析中仅判定了存在交互作用一样,只是一个总体的结果,并不能回答具体关联的形式的问题。如果各因素之间独立,则到此为止,若各因素间有关联,还应该作进一步的分析,具体搞清楚各变量的次数间是如何关联的。对此卡方检验有一些办法,但不如参数检验中那样严格。卡方独立性检验一般也仅限于两变量间的关联考察,对于多个名义型变量,往往采用分拆一个变量分别进行独立性检验的办法,然后试图整合多次检验的结果。这种做法就显得更牵强一些。

品质相关

卡方检验既然是用来解决变量间关联性的,则也可以构造和积差相关或等级相关系数一样的相关程度的度量,称为品质相关。常用的品质相关有以下几种:

1、Φ相关系数

Φ相关只适用于四格表,它要求两变量是不同性质的。Φ相关的公式实际上是根据四格表的卡方值变换而来的,通过变换使得其取值大约在正负1之间,这样便于联系一般的相关系数的含义进行解释。在卡方检验一节,我们曾讲到卡方值的大小反映了实际次数与理论次数之间差异的大小,而独立性检验中的理论次数是根据两变量独立的假设计算出来的,因此卡方值的大小也就反映了两变量距独立有多远,离独立越远就越相关,因此卡方值本身就反映了两变量间相关的程度。Φ相关的计算公式如下:

Φ相关系数依分子的正负号可取正负值。不过,所有的品质相关几乎都不是独立构造的,而都是对卡方检验中卡方统计量的变换。因此实际上,只要进行了卡方独立性检验,则这两步过程就一次解决了。计算品质相关系数只是为了更好地理解两变量间关系的密切程度。

2、列联相关C系数

列联相关实际上是将Φ相关的适用情况从四格表扩展到一般的列联表。列联相关公式的来历也基本上与Φ相关相同。列联相关公式为:

该系数的取值也在0和1之间,不会取到1。与使用Φ相关一样,使用列联相关之前,最好先检验两变量是否相关,只有两变量相关时,这一系数才有意义。

阅读材料

班上要选班长,有两名候选人A和B,他们获得的票数分别是45和49。班主任认为票数悬殊太小,不足以说明B更受欢迎,因此决定让二者各任一周班长,两周后再进行公开投票。B很不服气,认为老师偏心,请你为他主持公道,你能不能用统计学的知识来说明这次投票的结果?先想一想

这个案例可以用卡方分布来检验两名候选人的票数是否有显著差异。

得出的显著性水平是0.68,显然,二者所得票数确实无显著差异,老师的决策是对的。

最新卡方检验表

文化程度识字量X2 P 100个以下100个上 3.44 0.100 高中以上16 13 高中以下0 3 X=4.74 X=6.399 保育员高级操作技能考核复习提纲

一、简答题(每题10分,共30分) 1. 请简述幼儿园日常消毒的内容有哪些? (10分) 常用物品清洁消毒、物体表面清洁消毒、空气清洁消毒、手清洁消毒、垃圾及排泄物处理。 ... 2. 请简要阐述保育员全日观察的内容有哪些?(10分) 如发热答:观察幼儿精神状况,面色、食欲,大便性质、次数和睡眠等。幼儿发热时:观察其精神状态、面色、呼吸及其他伴随症状如:呕吐、头痛、皮疹等。 3. 请简要阐述急救的原则有哪些?(10分) 4. 请简述培养婴幼儿文明进餐习惯的注意事项。(10分) 答:进餐定时定位,饮食定量,专心进餐,不偏食,注意饮食卫生,学习餐桌文明。 5. 请简要阐述照料体弱儿进餐的原则有哪些?(10分) (1)区分体弱儿与正常儿 (2)根据体弱儿的特点进行个别照顾; (3)循序渐进地养成体弱儿的良好饮食习惯 (4)照顾体弱儿的进进餐需要,但不强迫体弱儿进餐。 6. 请简要阐述如何培养婴幼儿的良好睡眠习惯?(10分) ?培养婴幼儿独自入睡的习惯 ?培养婴幼儿按时睡眠和按时起床的习惯 ?培养婴幼儿正确的睡眠姿势 7. 请简述组织婴幼儿盥洗的原则有哪些?(10分) ?强调盥洗的纪律要求,卫生要求以及注意事项 ?对盥洗的组织应该有计划性 ?全面照顾,及时督促,仔细检查,达到清洁自身同时对他们有教育作用 ?培养婴幼儿自理能力 ?尽量减少婴幼儿的等待时间 ?培养婴幼儿良好的盥洗习惯 ?组织形式灵活 8. 请简要阐述组织婴幼儿盥洗的方法。(10分) 9. 请简要阐述对肥胖儿进餐的照顾方法有哪些?(10分) ?限制进食量

第七章 列联表分析

第七章列联表分析 7.1 列联表(Crosstabs)分析的过程 7.2 列联表的实例分析 7.1 列联表 (Crosstabs) 分析的过程 列联表分析的过程是对两个变量之间关系的分析方法。被分析的变量可以是定类变量也可以是定序变量。系统是通过生成列联表对两个变量进行列联表分析的。 列联表分析的功能可以通过下述操作来实现。 图7-1 列联表分析对话框 1.打开列联表分析对话框 执行下述操作: Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框如图7-1 所示。 2.确定列联分析的变量 从左侧的源变量窗口中选择两个定类变量或定序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。Display clustered bar charts 是在输出结果中显示聚类条图。Suppress table 是隐藏表格,如果选择此项,将不输出R×C 列联表。 3.选择统计分析内容 单击statistics 按钮,打开statistics 对话框,如图7-2 所示。

图7-2statistics 对话框 下面介绍该对话框中的选项和选项栏的内容: (1)Chi-square 是卡方(X2)值选项,用以检验行变量和列变量之间是否独立。适用于定类变量和定序变量。 (2)Correlations 是皮尔逊(Pearson)相关系数r 的选项。用以测量变量之间的线性相关。适用于定序或数值变量(定距以上变量)。 (3)Nominal 是定类变量选项栏。选项栏中的各项是当分析的两个变量都为定类变量时可以选择的参数。 1)Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。 2) Phi and Cramer's V:列联相关的V 系数,由卡方系数修正而得。 3)Lambda:λ系数。 4)Uncertainty Coefficient:不定系数。 (4)Ordinal 是定序变量选项栏。选项栏中的各项是当分析的两个变量都为定序变量时可以选择的参数。 1)Gramma:Gramma 等级相关系数。 2)Somers’d:Somers 等级相关d 系数。 3)Kendall’s tau-b:肯得尔等级相关tau-b 系数。 4)Kendall’s tau-c:肯得尔等级相关tau-c 系数。 (5)Nominal by Interval 选项栏中的Eta 是当一个变量为定类变量,另一个变量为数值变量时,测量两个变量之间关系的相关比率。 系统默认状态是不输出上述参数。如需要可自行选择。上述选择做完以后,单击Continue 返回到Crosstabs 对话框。 4.确定列联表内单元格值的选项 单击Cells(单元格)按钮,打开Cell Display 对话框,如图7-3 所示。

卡方检验法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数 (f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布, 可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

非参数统计列联表卡方检验

非参数统计期末大作业 一、Wilcoxon符号秩检验 某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取16位被 调查者,让起给产品打分。现有数据如下 不看广告62 83 96 99 71 60 97 100 看广告87 92 90 86 94 95 82 91 分析广告效应是否显著。 1、手算 建立假设: H0:广告效应不显著 H1:广告效应显著 不看广告组记为x,看广告组记为y。 X Y D=x-y |D| |D|的秩D的符号 62 87 -25 25 7 - 83 92 -9 9 2.5 - 96 90 6 6 1 + 99 86 13 13 4 + 71 94 -23 23 6 - 60 95 -35 35 8 - 97 82 15 15 5 + 100 91 9 9 2.5 + 由表可知: T+=1+4+5+2.5=12.5 T-=7+2.5+6+8=23.5 根据n=8,T+和T-中较大者T-=23.5,查表得,T+的右尾概率为0.230到0.273,在显著性水平下,P值显然较大,故没有理由拒绝原假设,表明广 告效应不显著。

2、Spss 在spss中输入八组数据(数据1): 选择非参数检验中的两个相关样本检验 对话框中选择Wilcoxon,输出如下结果(输出1): Ranks N Mean Rank Sum of Ranks 看广告- 不看广告Negative Ranks 4a 3.12 12.50

Positive Ranks 4b 5.88 23.50 Ties 0c Total 8 a. 看广告< 不看广告 b. 看广告> 不看广告 c. 看广告= 不看广告 由上表,负秩为4,正秩也为4,同分的情况为0,总共8。负秩和为12.5,正秩和为23.5,与手算结果一致 Test Statistics b 看广告- 不看广 告 Z -.771a Asymp. Sig. (2-tailed) .441 a. Based on negative ranks. b. Wilcoxon Signed Ranks Test 由上表,Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著性结果为0.441,明显大于0.05,因此在的显著性水平下,没有理由拒绝原假设,即表明广告效应不显著,与手算的结论一致。 3、R语言(R语言1) 输入语句: x=c(62,83,96,99,71,60,97,100) y=c(87,92,90,86,94,95,82,91) wilcox.test(x,y,exact=F,cor=F) 输出结果: Wilcoxon rank sum test data: x and y W = 33, p-value = 0.9164 alternative hypothesis: true location shift is not equal to 0 由输出结果可知,P=0.9164,远大于 =0.05,因此没有理由拒绝原假设,即广告效应并不显著,与以上结果一致。

卡方检验临界值表

自由度 0.50 0.25 0.10 0.05 0.03 0.01 10.455 1.323 2.706 3.841 5.024 6.6352 1.386 2.773 4.605 5.9917.3789.2103 2.366 4.108 6.2517.8159.34811.3454 3.357 5.3857.7799.48811.14313.2775 4.351 6.6269.23611.07012.83315.0866 5.3487.84110.64512.59214.44916.8127 6.3469.03712.01714.06716.01318.47587.34410.21913.36215.50717.53520.09098.34311.38914.68416.91919.02321.666109.34212.54915.98718.30720.48323.2091110.34113.70117.27519.67521.92024.7251211.34014.84518.54921.02623.33726.2171312.34015.98419.81222.36224.73627.6881413.33917.11721.06423.68526.11929.1411514.33918.24522.30724.99627.48830.5781615.33819.36923.54226.29628.84532.0001716.33820.48924.76927.58730.19133.4091817.33821.60525.98928.86931.52634.8051918.33822.71827.20430.14432.85236.1912019.33723.82828.41231.41034.17037.5662120.33724.93529.61532.67135.47938.9322221.33726.03930.81333.92436.78140.2892322.33727.14132.00735.17238.07641.6382423.33728.24133.19636.41539.36442.9802524.33729.33934.38237.65240.64644.3142625.33630.43535.56338.88541.92345.6422726.33631.52836.74140.11343.19546.9632827.33632.62037.91641.33744.46148.2782928.33633.71139.08742.55745.72249.5883029.33634.80040.25643.77346.97950.8923130.33635.88741.42244.98548.23252.1913231.33636.97342.58546.19449.48053.4863332.33638.05843.74547.40050.72554.7763433.33639.14144.90348.60251.96656.0613534.33640.22346.05949.80253.20357.3423635.33641.30447.21250.99854.43758.6193736.33642.38348.36352.19255.66859.8933837.33543.46249.51353.38456.89661.1623938.33544.53950.66054.57258.12062.4284039.33545.61651.80555.75859.34263.6914140.33546.69252.94956.94260.56164.9504241.33547.76654.09058.12461.77766.2064342.33548.84055.23059.30462.99067.45944 43.33549.91356.36960.48164.20168.710 显著性水平(a )卡方检验临界值表

卡方检验模型验证方法

卡方检验模型验证方法模型参数的验证方法主要使用卡方拟合度检验( Chi-square Goodness-of-fit Test )结合最大似然 估计( Maximum Likelihood Estimation ),并且使用QQ图(Quantile-Quantile Plot)证明验证结果。 具体的说,就是先假定采集的样本数据符合某一分布,通过最大似然估计方法估计出该分布的参数,然后代入并用卡方检验计算相对于该分布的偏差。实践中我们对于一组样本数据,计算所有常见分布的偏差值,选取偏差最小的分布做为该样本的拟合结果。另外,从QQ图直观上看,该分布做为拟合结果描绘出的曲线 必须近似为接近参考线的直线(见3.3),否则我们就将数据拆分为多个部分进行分段的拟合(如对终端请求包大小的拟合)。 1.1 卡方拟合度检验卡方检验是一种大样本假设检验法,用于检验随机事件中提出的样本数据是否符合某一给定分布。 它需要较 大量的样本数据及已知的待检验概率分布函数。 1.1.1 卡方检验原理对于一个服从二项分布的随机变量Y服从Binomial( n, p) ,均值为,方差 。 由中心极限定理,符合标准正态分布N (0, 1),所以服从自由度为1的卡方分布。 设服从Binomial( n, p1 ), , , 则 有 所以 同理对于k个随机变量,均值分别为 , 在数据拟合时,先对数据分组,每组数据的实际个数即为随机变量

,,,则数据拟合即为判断 是否符合分布, 该卡方分布的自由度为k-1-nep(k为随机变量个数,nep为估计参数的个数)。 1.1.2 卡方检验步骤:假定样本服从某一给定分布。根据样本数据用最大似然法估计分布的密度函数参数。设定置信度,对n个样本数据排序。 把排序后的数据分成k组,确定每组的上下限,(上下限确定方法不同对验证能力有影响, 每组数据不少于5个),为了方便起见,本项目中采用平均划分分组间隔,即使为常数, 对于所有的成立。 计算每组数据实际个数,第i组实际个数为。 计算每组数据期望个数,第i组期望个数为: 连续:,其中F(x)为待验证的概率分布函数, 离散:。 计算。 理论上说如果,则数据符合分布函数为F(x)的分布, 其中,nep为估计的参数的个数。但是由于实际采集的数据并非完全地符合某一分布, 总存在一定的偏差,计算出的值并不满足这个条件, 所以我们使用的拟合标准为采用卡方估计值最小的分布作为验证结果。

卡方检验法

记数数据统计法—卡方检验法 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

统计方法卡方检验

卡方统计量 卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

卡方检验临界值表

卡方检验临界值表 自由度显著性水平(a) 0.500.250.100.050.030.01 10.4551.3232.7063.8415.0246.635 2 1.3862.7734.6055.9917.3789.210 3 2.3664.1086.2517.8159.34811.345 4 3.3575.3857.7799.48811.14313.277 5 4.3516.6269.23611.07012.83315.086 6 5.3487.84110.64512.59214.44916.812 7 6.3469.03712.01714.06716.01318.475 87.34410.21913.36215.50717.53520.090 98.34311.38914.68416.91919.02321.666 109.34212.54915.98718.30720.48323.209 1110.34113.70117.27519.67521.92024.725 1211.34014.84518.54921.02623.33726.217 1312.34015.98419.81222.36224.73627.688 1413.33917.11721.06423.68526.11929.141 1514.33918.24522.30724.99627.48830.578 1615.33819.36923.54226.29628.84532.000 1716.33820.48924.76927.58730.19133.409 1817.33821.60525.98928.86931.52634.805 1918.33822.71827.20430.14432.85236.191 2019.33723.82828.41231.41034.17037.566 2120.33724.93529.61532.67135.47938.932 2221.33726.03930.81333.92436.78140.289 2322.33727.14132.00735.17238.07641.638 2423.33728.24133.19636.41539.36442.980 2524.33729.33934.38237.65240.64644.314 2625.33630.43535.56338.88541.92345.642 2726.33631.52836.74140.11343.19546.963 2827.33632.62037.91641.33744.46148.278 2928.33633.71139.08742.55745.72249.588 3029.33634.80040.25643.77346.97950.892 3130.33635.88741.42244.98548.23252.191 3231.33636.97342.58546.19449.48053.486

卡方检验临界值表

卡方检验临界值表 自由度显著性水平(a ) 0.50 0.25 0.10 0.05 0.03 0.01 1 0.455 1.323 2.706 3.841 5.024 6.635 2 1.386 2.77 3 4.605 5.991 7.378 9.210 3 2.366 4.108 6.251 7.815 9.348 11.345 4 3.357 5.38 5 7.779 9.488 11.143 13.277 5 4.351 6.62 6 9.236 11.070 12.833 15.086 6 5.348 7.841 10.645 12.592 14.449 16.812 7 6.346 9.037 12.017 14.067 16.013 18.475 8 7.344 10.219 13.362 15.507 17.535 20.090 9 8.343 11.389 14.684 16.919 19.023 21.666 10 9.342 12.549 15.987 18.307 20.483 23.209 11 10.341 13.701 17.275 19.675 21.920 24.725 12 11.340 14.845 18.549 21.026 23.337 26.217 13 12.340 15.984 19.812 22.362 24.736 27.688 14 13.339 17.117 21.064 23.685 26.119 29.141 15 14.339 18.245 22.307 24.996 27.488 30.578 16 15.338 19.369 23.542 26.296 28.845 32.000 17 16.338 20.489 24.769 27.587 30.191 33.409 18 17.338 21.605 25.989 28.869 31.526 34.805 19 18.338 22.718 27.204 30.144 32.852 36.191 20 19.337 23.828 28.412 31.410 34.170 37.566 21 20.337 24.935 29.615 32.671 35.479 38.932 22 21.337 26.039 30.813 33.924 36.781 40.289 23 22.337 27.141 32.007 35.172 38.076 41.638 24 23.337 28.241 33.196 36.415 39.364 42.980 25 24.337 29.339 34.382 37.652 40.646 44.314 26 25.336 30.435 35.563 38.885 41.923 45.642 27 26.336 31.528 36.741 40.113 43.195 46.963 28 27.336 32.620 37.916 41.337 44.461 48.278 29 28.336 33.711 39.087 42.557 45.722 49.588 30 29.336 34.800 40.256 43.773 46.979 50.892 31 30.336 35.887 41.422 44.985 48.232 52.191 32 31.336 36.973 42.585 46.194 49.480 53.486

如何用excel数据表计算卡方检验的p值

如何用EXCEL的统计函数进行统计卡方检验(χ2) 卡方(χ2)常用以检验两个或两个以上样本率或构成比之间差别的显著性分析,用以说明两类属性现象之间是否存在一定的关系。 卡方检验常采用四格表,如图5-4-18所示,比较的A、B两组数据分别用a、b、c、d表示,a为A组的阳性例数,b 为A组的阴性例数,c为B组的阳性例数,d为B组的阴性例数。 用EXCEL进行卡方检验时,数据的输入方式按实际值和理论值分别输入四个单元格,如图5-4-18所示。 (1)比较的A、B两组数据分别用a、b、c、d表示。a=52,为A组的阳性例数;b=19,为A组的阴性例数;c=39,为B组的阳性例数;d=3,为B组的阴性例数。根据公式计算理论值T11、T12、、T21和T22。将实际值和理论值分别输入如图所示的四个单元格(图5-4-19)。 选择表的一空白单元格,存放概率p值的计算结果,将鼠标器移至工具栏的“fx”处,鼠标器左键点击工具栏的“fx”快捷键,打开函数选择框。 (2)在函数选择框的“函数分类”栏选择“统计”项,然后在“函数名”栏内选择“CHITEST”函数,用鼠标器点击“确定”按钮,打开数据输入框(图5-4-20)。 (3)在“Actual_range”项的输入框内输入实际值(a、b、c、d)的起始单元格和结束单元格的行列号,在“Expected_range”项的输入框内输入理论值(T11、T12、T21、T22)的起始单元格和结束单元格的行列号,起始单元格和结束单元格的行列号之间用“:”分隔(图5-4-20)。 在数据输入完毕后,p值的计算结果立即显示。用鼠标器点击“确定”按钮,观察计算结果。 图5-4-18 四格表图5-4-19 四格表数据输入

卡方检验

第十二章假设测定I V:卡方测定 (The Chi Square Test) 壹、本单元目标 1、举例说明卡方测定适用的情况。 2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性 (independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。 3、说明如何将假设测定的逻辑运用在交叉表的分析上。 4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结 果。 5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。 贰、简介 本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。 这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。 参、双变项交叉表 卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

8.2 多个独立样本R×C列联表资料的卡方检验

第八章c 2 检验 二、多个独立样本R×C列联表资料的c 2 检验

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? 2.1 频率的比较

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效 组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 2.1 多个独立样本频率的比较 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? c 2 (A, B ) =4.419,P =0.036,P ’=0.108

2.2 独立样本频率的比较 表 8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布 分组A 型 B 型 O 型 AB 型合计 儿童30 38 32 12 112 成人19 30 19 9 77 合计49 68 51 21 189 c 2 0.75,3 =1.21,P >0.75 2 2 11 (1)0.695 R C i j i j i j A n n m c == =- = ??

卡方检验

作业2 卡方测验 (一)1.资料:P144习题7.4。 2.数据说明:大麦杂交F2代芒性状表型有钩芒、长芒、短芒三种,测验三种性状是否符 合9:3:4比例。 3.结果。 FREQ 过程 检验 gouxing 频数百分比百分比 --------------------------------------- 钩芒 348 56.13 56.25 长芒 115 18.55 18.75 短芒 157 25.32 25.00 指定比例的 卡方检验 ------------------------- 卡方 0.0409 自由度 2 渐近的 Pr >卡方 0.9798 精确的 Pr >= 卡方 0.9797 样本大小 = 620 4.分析。 H0:三种性状符合9:3:4;H A:不符合。显著水平:α=0.05 υ=2 χ20.05,2=5.99>χ2.因此接受无效假设,无显著差异。 5.程序代码。 optionps=32767ls=255nocenter; data xiti7_4; x 'F:'; x 'cd "F:\"'; infile 'xiti7_4.csv' dsd; inputgouxing$ zhushu; run; procfreq data=xiti7_4 order=data; weightzhushu; tablesgouxing/nocumtestp=(56.2518.7525);/*ratio of 9:3:4*/ exactpchi; run; (二)1.资料:P144习题7.6。

2.数据说明:某杂交组F2得到四种表型,B_C_,B_cc,bbC_,bbcc。判断四种表型实际 观察次数是否符合9:3:3:1的比例,判断是连锁遗传还是独立遗传。 3.结果。 FREQ 过程 检验 biaoxing 频数百分比百分比 ---------------------------------------- B-C- 132 58.41 56.25 B-cc 42 18.58 18.75 bbC- 38 16.81 18.75 bbcc 14 6.19 6.25 指定比例的 卡方检验 ------------------------- 卡方 0.6431 自由度 3 渐近的 Pr >卡方 0.8865 精确的 Pr >= 卡方 0.8915 样本大小 = 226 4.分析。 H0:四种表型符合9:3:3:1;H A:不符合。显著水平:α=0.05 υ=3 χ20.05,3=7.815>χ2.因此接受无效假设,无显著差异。 5.程序代码。 optionps=32767 ls=255 nocenter; data xiti7_6; filenamedatafile 'F:\xiti7_6.csv'; infiledatafilefirstobs=9 dsd; lengthbiaoxing $4; inputbiaoxing $ guanchacishu; run; proc freq data=xiti7_6 order=data; weightguanchacishu; tablesbiaoxing / nocumtestp=(56.25 18.75 18.75 6.25);/*ratio of 9:3:3:1*/ exactpchi; run;

相关主题
文本预览
相关文档 最新文档