当前位置:文档之家› (完整版)T检验F检验和卡方检验

(完整版)T检验F检验和卡方检验

(完整版)T检验F检验和卡方检验
(完整版)T检验F检验和卡方检验

什么是Z检验?

Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数>平均数的差异是否显著。

当已知标准差时,验证一组数的均值是否与某一期望值相等时,用Z检验。

Z检验的步骤

第一步:建立虚无假设,即先假定两个平均数之间没有显著差异。

第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。

1、如果检验一个样本平均数()与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为:

其中:

是检验样本的平均数;

μ0是已知总体的平均数;

S是样本的方差;

n是样本容量。

2、如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:

其中:

是样本1,样本2的平均数;

S1,S2是样本1,样本2的标准差;

n1,n2是样本1,样本2的容量。

第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如下表所示:

第四步:根据是以上分析,结合具体情况,作出结论。

Z检验举例

某项教育技术实验,对实验组和控制组的前测和后测的数据分别如下表所示,比较两组前测和后测是否存在差异。

实验组和控制组的前测和后测数据表

前测实验组n1 = 50 S1a = 14

控制组n2 = 48 S2a = 16

后测实验组n1 = 50 S1b = 8

控制组n2 = 48 S2b = 14

由于n>30,属于大样本,所以采用Z检验。由于这是检验来自两个不同总体的两

个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。

计算前要测Z的值:

∵|Z|=0.658<1.96

∴ 前测两组差异不显著。

再计算后测Z的值:

∵|Z|= 2.16>1.96

∴ 后测两组差异显著。

T检验,亦称student t检验(Student's t

test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。

t检验是对各回归系数的显著性所进行的检验,是指在多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验。t检验还可以用来检验样本为来自一元正态分布的总体的期望,即均值;和检验样本为来自二元正态分布的总体的期望是否相等)

目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。

自由度:v=n –1

T检验注意事项

要有严密的抽样设计随机、均衡、可比

选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)

单侧检验和双侧检验

单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能

性大。

假设检验的结论不能绝对化

不能拒绝H0,有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类错误

正确理解P值与差别有无统计学意义P越小,不是说明实际差别越大,而

是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无

专业上的实际意义并不完全相同

假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H 0成立与否的概率。

适用条件

(1) 已知一个总体均数;(2) 可得到一个样本均数及该样本标准误;(3) 样本来自正态或近似正态总体。

F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。

其中要判断两总体方差是否相等,就可以用F检验。简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。

F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S^2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t 检验。样本标准偏差的平方,即(“^2”是表示平方):S^2=∑(X-X平均)^2/(n-1) 两组数据就能得到两个S^2值,S大^2和S小^2 F=S 大^2/S小^2 由表中f大和f小(f为自由度n-1),查得F表,然后计算的F值与查表得到的F表值比较,如果 F < F表表明两组数据没有显著差异; F ≥ F表表明两组数据

存在显著差异

T检验与F检验的差异:

T检验用来检测数据的准确度系统误差

F检验用来检测数据的精密度偶然误差

在定量分析过程中常遇到两种情况:第一是样本测量的平均值与真值不一致;第二是两组测量的平均值不一致。上述不一致是由于定量分析中的系统误差和偶然误差引起的。因此,必须对两组分析结果的准确度或精密度是否存在显著性差异做出判断(显著性试验)。统计检验的方法很多,在定量分析中最常用T检验与F检验,分别用于检测两组分析结果是否存在显著的系统误差与偶然误差。两组数据的显著性检验顺序是先F检验后T检验。

X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成

比之间差别的显著性,也可检验两类事物之间是否存在一定的关系

SPSS非参数检验之卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示 观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

卡方检验 (Chi-square)

卡方检验(Chi-square) ?参数与非参数检验 ?卡方匹配度检验 ?卡方独立性检验 ?卡方检验的前提和限制 ?卡方检验的应用 参数与非参数检验 ?参数检验 ◆用于等比/等距型数据 ◆对参数的前提:正态分布和方差同质 ?非参数检验 ◆不用对参数进行假设 ◆对分布较少有要求,也叫d i s t r i b u t i o n-f r e e t e s t s ◆用于类目/顺序型数据 ◆没有参数检验敏感,效力低 ◆因此在二者都可用时,总是用参数检验 卡方匹配度检验 ?用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度?是对次数分布的检验 ?研究情境 ◆在医生职业中,男的多还是女的多? ◆在三种咖啡中,哪种被国人最喜欢? ◆在北京大学中,各国留学生的比例有代表性吗? 卡方匹配度检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=p n ?d f=C-1 ◆F0:观察次数 ◆f e:期望次数 ◆C:类目的个数 ◆Χ2:统计量 卡方独立性检验 ?检验行和列的两个本来变量彼此有无关联 卡方独立性检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=(r o w t o t a l)(c o l u m n t o t a l)/n, ?d f=(R-1)(C-1)

◆F0:观察次数 ◆f e:期望次数 ◆R:行类目的个数C:列类目的个数◆Χ2:统计量 例:х2检验 1.计算期望次数fe=(fc*fr)/n 2.计算每个单位格的х2值 22 df=(R-1)(C-1)= (3-1)(2-1)=2,х2的临界值为5.99 拒绝Ho,对手表显示的偏好程度与被试的年龄段有关

卡方独立性检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

无差检验、独立性检验 SPSS

作业6: 1.无差检验 随机从某市抽取90名教师,其中高级职称有30名,中级职称有42名,初级职称有18名。若假设规定高、中、初级职称比为2:6:2,试问这一调查结果是否与规定相一致? 注:上表中“1”表示高级职称、“2”表示中级职称、“3”表示初级职称。 (2)研究假设 零假设:这一调查结果与规定一致。 备择假设:这一调查结果与规定不一致。 (3)操作说明 1.输入数据。保存为“数据1”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案” 对话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使 之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数 据编辑框。 3.卡方检验。单击“分析”菜单下的“非参数检验”,选项中得“卡方检验”命令。 在弹出的“卡方检验”对话框中,因为要对高级职称、中级职称、初级职称的人数 进行分析,所以在对话框左侧的列表中选择“职称”变量,单击“添加”按钮使之 添加到“检测变量列表”框中。在“期望值”框中得“数值”处输入理论上高级职 称、中级职称、初级职称的比例2:6:2,然后单击“确定”按钮,SPSS开始进行卡 方检验。 (4)生成图表及结果解释 从第一个表格中可以看出高、中、初级职称的实际观测值、理论值和两者之间的差异个数;从第二个表格中可以看出自由度df=2,X2=10.667>9.210= X20.01 (2), P<0.01,所以拒绝零假设,支持备择假设,即这一调查结果与规定不一致。

2.独立性检验 在研究初中厌学学生意志力时,某研究得到下表样本资料,试问厌学学生的意志力水平是否与年级有关? (1)原始数据 (2)研究假设 零假设:厌学学生的意志力水平与年级无关。 备择假设:厌学学生的意志力水平与年级有关。 (3)操作说明 1. 输入数据。保存为“数据2”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案”对 话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数据编辑框。 3.独立性检验。单击“分析”菜单下的“描述统计”中得“交叉表”选项,在弹出的“交叉表”对话框中,将左边列表中得“年级”添加到“行”变量框中,将左边列表框中得“意志力水平”添加到“列”变量中。点击“统计量”按钮,在弹出的对话框中,选择“卡方检验”单选项。点击“继续”按钮,返回到“交叉表”对话框中,点击“确定”。SPSS开始进行独立性检验。 (4)生成图表及结果解释。

《独立性检验》

《独立性检验的基本思想及其初步应用》教学设计 东北师范大学附属实验学校李宇 一、教学内容与内容解析 1.内容: 独立性检验的基本思想及实施步骤 2.内容解析: 本节课是人教A版(选修)2—3第三章第二单元第二课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。 在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。 学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。 教学重点:理解独立性检验的基本思想及实施步骤. 二、教学目标与目标解析 1.目标: ①知识与技能目标 通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步

骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。 ②过程与方法目标 通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。这一直觉来自于观测数据,即样本。问题是这种来自于样本的印象能够在多大程度上代表总体。这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。 ③情感态度价值观目标 通过本节课的学习,加强数学与现实生活的联系。以科学的态度评价两个分类变量有关系的可能性。培养学生运用所学知识,解决实际问题的能力。教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。 2.目标解析: 独立性检验是考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.因此,在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力. 新课标指出:学生的数学学习内容应当是现实的、有趣的和富有挑战性的。从心理学的角度看,青少年有一种好奇的心态、探究的心理。因此,紧紧地抓住学生的这一特征,利用学生身边的问题“玩电脑游戏与注意力集中是否有关系”,设计教学情境,使学生在观察、讨论等活动中,逐步提高数据分析能力。 三、教学问题诊断分析 1.本节课的内容独立性检验对学生来说是全新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。 2.独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个

知识讲解 独立性检验的基本思想及其初步应用(文、理)

独立性检验的基本思想及其初步应用 编稿:赵雷审稿:李霞 【学习目标】 1. 了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用 2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用. 【要点梳理】 要点一、分类变量 有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。 要点诠释: (1)对分类变量的理解。 这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。 (2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。 要点二、2×2列联表 1. 列联表 用表格列出的分类变量的频数表,叫做列联表。 2. 2×2列联表 对于两个事件A ,B ,列出两个事件在两种状态下的数据,如下表所示: 这样的表格称为2×2列联表。 要点三:卡方统计量公式 为了研究分类变量X 与Y 的关系,经调查得到一张2×2列联表,如下表所示 统计中有一个有用的(读做“卡方”)统计量,它的表达式是: 22 ()()()()() n ad bc K a b c d a c b d -=++++(n a b c d =+++为样本容量)。 要点四、独立性检验

1. 独立性检验 通过2×2列联表,再通过卡方统计量公式计算2K 的值,利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。 2. 变量独立性的判断 通过对2K 统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断: ①如果2K ≤3.841时,认为事件A 与B 是无关的。 ②如果2K >3.841时,有95%的把握说事件A 与事件B 有关; ③如果2 K >6.635时,有99%的把握说事件A 与事件B 有关; 要点诠释: (1)独立性检验一般是指通过计算2K 统计量的大小对两个事件是否有关进行判断; (2)独立性检验的基本思想类似于反证法。即在H 0:事件A 与B 无关的统计假设下,利用2K 统计量的大小来决定在多大程度上拒绝原来的统计假设H 0,即拒绝“事件A 与B 无关”,从而认为事件A 与B 有关。独立性检验为假设检验的特例。 (3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。 3.独立性检验的基本步骤及简单应用 独立性检验的步骤: 要推断“A 与B 是否有关”,可按下面步骤进行: (1)提出统计假设H 0:事件A 与B 无关(相互独立); (2)抽取样本(样本容量不要太小,每个数据都要大于5); (3)列出2×2列联表; (4)根据2×2列联表,利用公式:22 ()()()()() n ad bc K a c b d a b c d -=++++,计算出2 K 的值; (5)统计推断:当2 K >3.841时,有95%的把握说事件A 与B 有关; 当2 K >6.635时,有99%的把握说事件A 与B 有关; 当2K >10.828时,有99.9%的把握说事件A 与B 有关; 当2K ≤3.841时,认为事件A 与B 是无关的. 要点诠释: ① 使用2 K 统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5.

非参数检验(卡方检验)实验报告

大理大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验)专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

一、实验目的 对分类资料进行卡方检验。 二、实验环境 1、硬件配置:处理器:Intel(R)Core(TM) i5-4210U CPU @1.7GHz 1.7GHz 安装内存 (RAM):4.00GB 系统类型:64位操作系统 2、软件环境:IBM SPSS Statistics 19.0软件 三、实验内容 (包括本实验要完成的实验问题及需要的相关知识简单概述) (1)课本第六章的例6.1-6.5运行一遍,注意理解结果; (2)然后将实验指导书的例1-4运行一遍,注意理解结果。 四、实验结果与分析 (包括实验原理、数据的准备、运行过程分析、源程序(代码)、图形图象界面等) 例6.1 表1 灭螨A和灭螨B杀灭大蜂螨效果的交叉制表 效果 杀灭未杀灭 合计组别灭螨A 32 12 44 灭螨B 14 22 36 合计46 34 80 分析:表1是灭螨A和灭螨B杀灭大蜂螨效果的样本分类的频数分析表,即交叉列联表。 表2 卡方检验 X2值df 渐进Sig. (双侧) 精确Sig.(双侧) 精确Sig.(单侧) Pearson 卡方9.277a 1 .002 连续校正b7.944 1 .005 似然比9.419 1 .002 Fisher 的精确检验.003 .002

有效案例中的N 80 a. 0 单元格(.0%) 的期望计数少于5。最小期望计数为15.30。 b. 仅对2x2 表计算 分析:表2是卡方检验的结果。因为两组各自的结果互不影响,即相互独立。对于这种频数表 格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。 Pearson 卡方:皮尔逊卡方检验计算的卡方值(用于样本数n≥40且所有理论数E≥5); 连续校正b:连续性校正卡方值(df=1,只用于2*2列联表); 似然比:对数似然比法计算的卡方值(类似皮尔逊卡方检验); Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。 不同的资料应选用不同的卡方计算方法。 例6.1为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=7.944,P(Sig)=0.005<0.01,表明灭螨剂A组的杀螨率极显著高于灭螨剂B组。 例6.2 表3 治疗方法* 治疗效果交叉制表 计数 治疗效果 1 2 3 合计治疗方法 1 19 16 5 40 2 16 12 8 36 3 15 13 7 35 合计50 41 20 111 分析:表3是治疗方法* 治疗效果资料分析的列联表。 表4 卡方检验 X2值df 渐进Sig. (双侧) Pearson 卡方 1.428a 4 .839 似然比 1.484 4 .830 线性和线性组合.514 1 .474

SPSS非参数检验之一卡方检验

SPSS中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为x2佥验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总 体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时,就近似服从X的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q O i E i E i 其中,Oi表示观察频数;Ei表示期望频数或理论频数。可见Q值越大,表示观察频数和理论频数越不接近;Q值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q统计量,由于Q统计量服从K-1个自由度的X平方分布,因此SPSS 将根据X 平方分布表给出Q统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样 本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大 于显著性水平,则不能拒绝零假设HO,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧 郁数是否满足1:1:221:1:1。

高中数学第三章统计案例-3.1独立性检验卡方检验素材

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2χ检验的基本计算

非参数检验(卡方检验)实验报告

. . 大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验)专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

a. 不假定零假设。 b. 使用渐进标准误差假定零假设。 分析:表11为LPA和FA两种检测结果的的一致性检验。Kappa值是部一致性系数,除数据P值判断一致性有无统计学意义外,根据经验,Kappa≥0.75,表明两者一致性较好0.7>Kappa ≥0.4,表明一致性一般,Kappa<0.4,则表明一致性较差。 本例Kappa值为0.680,P=0.000<0.01,拒绝无效假设,即认为两种检测方法结果存在一致性,Kappa值=0.680,0.7>Kappa≥0.4,表明一致性一般。 例1 表12 周日频数表 观察数期望数残差 1 11 16.0 -5.0 2 19 16.0 3.0 3 17 16.0 1.0 4 1 5 16.0 -1.0 5 15 16.0 -1.0 6 16 16.0 .0 7 19 16.0 3.0 总数112 分析:表12结果显示一周各日死亡的理论数(Expected)为16.0,即一周各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual)。 表13 检验统计量 周日 卡方 2.875a df 6 渐近显著性.824 a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 16.0。 分析:Chi-Square过程,调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验,主要用于分析实际频数与某理论频数是否相符。卡方值X2=2.875,自由度数(df)=6,P=0.824>0.05,差异不显著,即可认为一周各日的死亡危险性是相同的。 例2 表14 二项式检验 类别N 观察比例检验比例精确显著性(双侧)性别组 1 0 12 .30 .50 .017 组 2 1 28 .70

《独立性检验》教案3

《独立性检验》教案3 教学内容: 人教版数学高中选修2—2《独立性检验》 教学目标: 1、分类变量的概念 2. 列联表及利用2x2列联表以及统计量卡方对两个变量进行独立性检验 3、理解独立性检验的思想并掌握独立性检验的实际应用 教学重点: 列联表及利用2x2列联表以及统计量卡方对两个变量进行独立性检验 教学难点: 对临界值的理解。 知识链接: 1、复习独立性检验的步骤。 2、可信程度。 教学过程: 1. 分类变量概念 方法与规律: 看是否是分类变量只需看变量的不同值是否表示个体的不同类别 例下列不是分类变量的是: A. 人的性别 B. 国籍 C. 商品的等级 D. 身高 反思: 2. 列联表与独立性检验 方法与规律:推断X与Y有关系可按下列步骤进行: (1)找相关数据,做列联表并画出等高条形图,初略判断两变量是否相关 (2)独立性检验方法判定两边量是否有关 H: X与Y没有关系 ①假设 ②根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a, k 然后查表1-11确定临界值 o K的观测值k ③利用公式(1),计算随机变量2 ④如果,就判断“X与Y有关系”,这种判断犯错误的概率不超过a,否则,就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关系”,或则在样本数据中没有发现足

够证据支持结论“X与Y有关系”, 例1 某县对在职的71名高中数学教师就支持旧的数学教材作了调查,结果如下表所示: 分析:根据独立性检验思想,由公式计算出的观测值,然后与临界值比较得出结论。独立性检验能帮租我们对日常生活中的实际问题做出合理的推断与预测。因此要在学习中通过案例分析,理解和掌握独立性检验的方法,体会其基本思想在在解决实际问题中的应用,以提高我们分析和处理问题的能力。

相关主题
文本预览
相关文档 最新文档