当前位置:文档之家› x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算
x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算

x2检验(chi-square test)或称卡方检验

x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理

的比较)两类。

一、四格表资料的x2检验

例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如

表20-11,问两种疗法有无差别?

表20-11 两种疗法治疗卵巢癌的疗效比较

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。

这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:

式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即

53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表

20-11资料为例检验如下。

检验步骤:

1.建立检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数(TRC),计算公式为:

TRC=nR.nc/n 公式(20.13)

式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC

为与理论数同列的合计数,n为总例数。

第1行1列:43×53/87=26.2

第1行2列:43×34/87=16.8

第2行1列:44×53/87=26.8

第2行2列:4×34/87=17.2

以推算结果,可与原四项实际数并列成表20-12:

表20-12 两种疗法治疗卵巢癌的疗效比较

因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直

接求出,示范如下:

T1.1=26.2

T1.2=43-26.2=16.8

T2.1=53-26.2=26.8

T2.2=44-26.2=17.2

3.计算x2值按公式20.12代入

4.查x2值表求P值

在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001

(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的

疗效比单用化疗佳。

通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,

x2的界值也相应增大。

二、四格表的专用公式

对于四格表资料,还可用以下专用公式求x2值。

式中a、b、c、d各代表四格表中四个实际数,现仍以表20-12为例,将上式符号标记如下(表20-13),并示范计算。

表20-13 两种疗法治疗卵巢肿瘤患者的疗效

计算结果与前述用基本公式一致,相差0.01用换算时小数点后四舍五入所

致。

三、四格表x2值的校正

x2值表是数理统计根据正态分布中的定义计算出来的。是一种近似,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:

如果用四格表专用公式,亦应用下式校正:

例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表20-14.

试比较两种疗法效果有无差异?

表20-14 两种疗法效果比较的卡方较正计算

从表20-14可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正

公式(20.15)检验。步骤如下:

1.检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数:(已完成列入四格表括弧中)

3.计算x2值:应用公式(20.15)运算如下:

查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.

按α=0.05水准,接受H0,两种疗效差异无统计学意义。

如果不采用校正公式,而用原基本公式,算得的结果x2=4.068,则结论就

不同了。

如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

四、行×列表的卡方检验(x2test for R×C table)

适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相

同,简单计算公式如下:

式中n为总例数;A为各观察值;nR和nC为与各A值相应的行和列合计的

总数。

例20.9北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑

日照卫生标准的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检

验。

表20-15居室朝向与室内婴幼儿佝偻病患病率比较

/P>

该表资料由2行4列组成,称2×4表,可用公式(20.17)检验。

(一)检验步骤

1.检验假设

H0:四类朝向居民婴幼儿佝偻病患病率相同。

H1:四类朝向居民婴幼儿佝偻病患率不同。

α=0.05

2.计算x2值

3.确定P值和分析

本题v=(2-1)(4-3)=3,据此查附表20-1:

x20.01(3)=11.34,本题x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。

(二)行×列表x2检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损

害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资料合并。

2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说

有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

五、配对计数资料x2检验(x2test of paired comparison of enumeration

data)

在计量资料方面,同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同;在计数资料方面亦如此。例如表20-16是28份咽喉涂抹标本,每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中,观察白喉杆菌生长情

况,试比较两种培养基的效果。

表20-16 两种白喉杆菌培养基培养结果比较

从表中资料可见有四种结果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我们目的是比较两种培养基的培养结果有无差异,则(a)、(d)两种结果是一致的,对差异比较毫无意义,可以不计,我们只考虑结果不同的(b)和(c),看其差异有无意义,可以应用以下简易公式计算:

检验步骤:

1.检验假设

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算x2值

3.确定P值和分析配对资料v=1,查附表20-1得知x20.05(1)=3.84,x2>x0.05(1),P<0.05,按α=0.05水准,拒绝H0,可以认为甲培养基的白喉

杆菌生长效率较高。

如果b+c>40,则可采用:

此外还有两种以上处理方法的比较,可参阅预防医学专业的医学统计方法有

关章节。

附表20-1 x2界值表

x2值表

佚名

注:自由度的符号本书统一用ν,但若沿用n’也不为错。

χ2分布临界值表

2χ分布临界值表 ()(){}2P n n αχχα=2 1-> n 0.995 0.99 0.975 0.95 0.90 0.75 0.25 0.10 0.05 0.025 0.01 0.005 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 38 40 41 42 43 44 45 __ 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 13.787 14.458 15.134 15.815 16.501 17.192 17.887 18.586 19.289 19.996 20.707 21.421 22.138 22.859 23.584 24.311 __ 0.020 0.115 0.297 0.554 0.872 1.239 1.646 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.879 13.565 14.257 14.954 15.655 16.362 17.074 17.789 18.509 19.233 19.960 20.691 21.426 22.164 22.906 23.650 24.398 25.148 25.901 0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791 17.539 18.291 19.047 19.806 20.569 21.336 22.106 22.878 23.654 24.433 25.215 25.999 26.785 27.575 28.366 0.004 0.103 0.352 0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493 19.281 20.072 20.867 21.664 22.465 23.269 24.075 24.884 25.695 26.509 27.326 28.144 28.965 29.987 30.612 0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.042 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.042 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599 21.434 22.271 23..100 23.952 24.797 25.643 26.492 27.343 28.196 29.051 29.907 30.765 31.625 32.487 33.350 0.102 0.575 1.213 1.923 2.675 3.455 4.255 5.071 5.899 6.737 7.584 8.438 9.299 10.165 11.037 11.912 12.792 13.675 14.562 15.452 16.344 17.240 18.137 19.037 19.939 20.843 21.749 22.657 23.567 24.478 25.390 26.304 27.219 28.136 29.054 29.973 30.893 31.815 32.737 33.660 34.585 35.510 36.436 37.363 38.291 1.323 2.773 4.108 5.385 6.626 7.841 9.037 10.219 11.389 12.549 1 3.701 1 4.845 1 5.984 17.117 18.245 19.369 20.489 21.605 22.718 23.828 24.935 2 6.039 2 7.141 2 8.241 2 9.339 30.435 31.528 32.620 33.711 34.800 35.887 36.973 38.058 39.141 40.223 41.304 42.383 43.462 44.539 45.616 46.692 47.766 48.840 49.913 50.985 2.706 4.605 6.251 7.779 9.236 10.645 12.017 1 3.362 1 4.684 1 5.987 17275 18.549 19.812 21.064 22.307 23.542 24.769 25.989 27.204 28.412 29.615 30.813 32.007 33.196 34.382 35.563 3 6.741 3 7.916 39.087 40.256 41.422 42.585 43.745 44.903 46.059 47.212 4 8.363 4 9.513 50.660 51.805 52.949 54.090 55.230 56.369 57.505 3.841 5.991 7.815 9.488 11.071 12.592 1 4.067 1 5.507 1 6.919 18.307 19.675 21.026 22.362 23.685 24.966 26.296 2 7.587 2 8.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773 44.985 46.194 47.400 48.602 4 9.802 50.998 52.192 53.384 54.572 55.758 56.942 58.124 59.304 60.481 61.656 5.024 7.378 9.348 11.143 12.833 14.449 1 6.013 1 7.535 19.023 20.483 21.920 23.337 24.736 16.119 27.488 2 8.845 30.191 31.526 32.852 34.170 35.479 36.781 38.076 3 9.364 40.646 41.923 43.194 44.461 45.722 46.979 48.232 49.480 50.725 51.966 53.203 54.437 55.668 56.896 58.120 59.342 60.561 61.777 62.990 64.201 65.410 6.635 9.210 11.345 13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 2 7.688 29.141 30.578 32.000 33.409 34.805 36.191 37.566 3 8.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 4 9.588 50.892 52.191 53.486 54.776 56.061 57.342 58.619 59.892 61.162 62.428 63.691 64.950 66.206 67.459 68.710 69.957 7.879 10.597 12.838 14.860 16.750 18.548 20.278 21.955 23.589 25.188 26.757 28.299 29.819 31.319 32.801 34.267 35.718 37.156 38.582 39.997 41.401 42.796 44.181 45.559 46.928 48.290 49.645 50.993 52.336 53.672 55.003 56.328 57.648 58.964 60.275 61.581 62.883 64.181 65.476 66.766 68.053 69.336 70.616 71.893 73.166

卡方检验习题

2 检验 练习题 一、最佳选择题 1.四格表的周边合计不变时,如果实际频数有变化,则理论频数()。 A.增大 B.减小 C.不变 D.不确定 E.随a格子实际频数增减而增减 2.有97份血液标本,将每份标本一分为二,分别用血凝试验法和ELISA法对轮状病毒进行诊断,诊断符合情况见下表,欲比较何种诊断方法的诊断符合率较高,用()统计方法 两种诊断方法的诊断结果 血凝试验法ELISA法 合计符合不符合 符合74882

不符合14115 合计88997 A.连续性校正2χ检验 B.非连续性校正2χ检 验 C.确切概率法 D.配对2χ检验 (McNemar检验) E.拟合优度2χ检验 3.做5个样本率的2检验,每组样本量均为50,其自由度为 ()。 A 249 B 246 C 1 D 4 E 9 4.对四格表资料做2χ检验时,如果将四格表的行与列对调,则对 调前后的()。 A.校正2χ值不等 B.非校正2χ值不等 C.确切概率检验的P值不等 D.非校正2χ值相等 E.非校正2χ值可能相等,也可能不等

二、问答题 1.简述2χ检验的基本思想。 2.四格表2χ检验有哪两种类型各自在运用上有何注意事项 3.什么情况下使用Fisher确切概率检验两个率的差别 4.在回顾性研究和前瞻性研究的四格表中,各自如何定义优势比 三、计算题 1.前列腺癌患者121名中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症者1人。试分析两种手术的合并症发生率有无差异 2.苏格兰西南部两个地区献血人员的血型记录见下表,问两地的血型分布是否相同 两地献血人员的血型分布 地区血型 合计A B O AB

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计 最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加

最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广. 个独立样本率比较的χ2检验属四格表资料χ2检验。这类资料在医学研究中较为多见。 例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下: 有效无效有效率(%) 试验组 12 1 对照组 3 8 可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。在读取统计结果时,应当注意χ2检验的适用条件,正确选择Pearson卡方检验、Yates校正卡方检验、Fisher 精确概率法(本法不属于χ2检验)。 第三节四格表资料的Fisher确切概率法 前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4)计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。该法是由年)提出的,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。 下面以例8-1介绍其基本思想与检验步骤。 例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生儿的HBV总体感染率有无差别?

卡方分布表

WORD格式 x 2 分布临界值表(卡方分布) P n' 0.995 0.99 0.975 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.025 0.01 0.005 1 ????0.0 2 0.1 0.45 1.32 2.71 3.84 5.02 6.6 3 7.88 2 0.01 0.02 0.02 0.1 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.6 3 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.3 4 12.84 4 0.21 0.3 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86 5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75 6 0.68 0.8 7 1.24 1.64 2.2 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55 7 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.4 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.96 9 1.73 2.09 2.7 3.33 4.17 5.9 8.34 11.39 14.68 16.92 19.02 21.67 23.59 10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19 11 2.6 3.05 3.82 4.57 5.58 7.58 10.34 13.7 17.28 19.68 21.92 24.72 26.76 12 3.07 3.57 4.4 5.23 6.3 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.3 13 3.57 4.11 5.01 5.89 7.04 9.3 12.34 15.98 19.81 22.36 24.74 27.69 29.82 14 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32 15 4.6 5.23 6.27 7.26 8.55 11.04 14.34 18.25 22.31 25 27.49 30.58 32.8 16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.3 28.85 32 34.27 17 5.7 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72 18 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.6 25.99 28.87 31.53 34.81 37.16 19 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.2 30.14 32.85 36.19 38.58 20 7.43 8.26 9.59 10.85 12.44 15.45 19.34 23.83 28.41 31.41 34.17 37.57 40 21 8.03 8.9 10.28 11.59 13.24 16.34 20.34 24.93 29.62 32.67 35.48 38.93 41.4 22 8.64 9.54 10.98 12.34 14.04 17.24 21.34 26.04 30.81 33.92 36.78 40.29 42.8 23 9.26 10.2 11.69 13.09 14.85 18.14 22.34 27.14 32.01 35.17 38.08 41.64 44.18 24 9.89 10.86 12.4 13.85 15.66 19.04 23.34 28.24 33.2 36.42 39.36 42.98 45.56 25 10.52 11.52 13.12 14.61 16.47 19.94 24.34 29.34 34.38 37.65 40.65 44.31 46.93 26 11.16 12.2 13.84 15.38 17.29 20.84 25.34 30.43 35.56 38.89 41.92 45.64 48.29 27 11.81 12.88 14.57 16.15 18.11 21.75 26.34 31.53 36.74 40.11 43.19 46.96 49.64 28 12.46 13.56 15.31 16.93 18.94 22.66 27.34 32.62 37.92 41.34 44.46 48.28 50.99 29 13.12 14.26 16.05 17.71 19.77 23.57 28.34 33.71 39.09 42.56 45.72 49.59 52.34 30 13.79 14.95 16.79 18.49 20.6 24.48 29.34 34.8 40.26 43.77 46.98 50.89 53.67 40 20.71 22.16 24.43 26.51 29.05 33.66 39.34 45.62 51.8 55.76 59.34 63.69 66.77 50 27.99 29.71 32.36 34.76 37.69 42.94 49.33 56.33 63.17 67.5 71.42 76.15 79.49 60 35.53 37.48 40.48 43.19 46.46 52.29 59.33 66.98 74.4 79.08 83.3 88.38 91.95 70 43.28 45.44 48.76 51.74 55.33 61.7 69.33 77.58 85.53 90.53 95.02 100.42 104.22 80 51.17 53.54 57.15 60.39 64.28 71.14 79.33 88.13 96.58 101.88 106.63 112.33 116.32 90 59.2 61.75 65.65 69.13 73.29 80.62 89.33 98.64 107.56 113.14 118.14 124.12 128.3 100 67.33 70.06 74.22 77.93 82.36 90.13 99.33 109.14 118.5 124.34 129.56 135.81 140.17 专业资料

SPSS非参数检验之一卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q () 2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大

于显著性水平,则不能拒绝零假设HO,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。

卡方检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

卡方分布标准表格.doc

文地址 x2分布界表(卡方分布) P n' 0.995 0.99 0.975 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.025 0.01 0.005 1 ????0.0 2 0.1 0.45 1.32 2.71 3.84 5.02 6.6 3 7.88 2 0.01 0.02 0.02 0.1 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.6 3 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.3 4 12.84 4 0.21 0.3 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86 5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75 6 0.68 0.8 7 1.24 1.64 2.2 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55 7 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.4 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.96

9 1.73 2.09 2.7 3.33 4.17 5.9 8.34 11.39 14.68 16.92 19.02 21.67 23.59 10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19 11 2.6 3.05 3.82 4.57 5.58 7.58 10.34 13.7 17.28 19.68 21.92 24.72 26.76 12 3.07 3.57 4.4 5.23 6.3 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.3 13 3.57 4.11 5.01 5.89 7.04 9.3 12.34 15.98 19.81 22.36 24.74 27.69 29.82 14 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32 15 4.6 5.23 6.27 7.26 8.55 11.04 14.34 18.25 22.31 25 27.49 30.58 32.8 16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.3 28.85 32 34.27 17 5.7 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72 18 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.6 25.99 28.87 31.53 34.81 37.16 19 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.2 30.14 32.85 36.19 38.58

SPSS 确切概率法(1)

SPSS 确切概率法 1.什么时候使用确切概率? 当n很小时,因为不服从卡方分布(不能有单元格的期望小于1,不能有20%以上的单元格期望值小于5),所以不能用卡方检验,这时系统会在分析结果的最后给出警告(WARNING: 50% of the cells have expected counts less than 5. Chi-Square may not be a valid test),提示用户采用确切概率法分析。 2.确切概率的思想是什么? fisher精确检验其思想是在固定各边缘和的条件下,根据超几何分布(见概率分布),可以计算观测频数出现任意一种特定排列的条件概率。把实际出现的观测频数排列,以及比它呈现更多关联迹象的所有可能排列的条件概率都算出来并相加,若所得结果小于给定的显著性水平(比如给定的显著水平为0.05),则判定所考虑的两个属性存在关联,从而拒绝h0。 3.怎么操作? 例1.(1)录入数据

(1)加权:Data——Weight Cases:Weight case by(选入“频数”) (3)卡方检验:Analyze——Descriptive

Statistics——Crosstabs:Row(选入性别),Column(选入咨询内容);点击Statistics:选择Chi-square;点击Continue,点击OK。见图3,4。 4 分析结果:χ2值与P值,依次看“Chi-Square Tests”表的第1行,红色字体部分。

补充:第2行是校正的卡方值与P值,第4行是Fisher确切概率法计算的P值。 通常规定: (1)当两组总样本量n≥40且所有的单元格的理论频数T≥5时,看第1行的结果;当P≈检验水准时,看第4行的结果。(2)当两组总样本量n≥40但有1≤理论频数T<5时,看第2行的结果;或者看第4行的结果。 (3)当两组总样本量n<40,或最小理论频数T<1时,看第4行的结果。 例2某研究者调查了一匹高血压患者的血压控制情况和肥胖度,数据见文件tables.sav,为列举格式。汇总如下表,试分析两者之间有无关系。

卡方检验正态分布

卡方拟和检验的编程实现 摘要 针对一些总体分布的检验不能用现成的软件实现这一问题,本文论述了怎样应用matlab实现总体分布的检验,这里我们以正态分布为例,这里我们选用了总体分布的卡方检验,卡方检验是在总体分布未知的情况下,根据来自总体的样本,检验关于总体分布的假设的一种检验方法。 关键词:分布的检验 matlab 总体样本。 使用卡方检验分布时在总体X 的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法. 使用卡方检验对总体分布进行检验时,我们先提出原假设: H0:总体X的分布函数为F(x) 然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设. 这种检验通常称作拟合优度检验,它是一种非参数检验. 在用卡方检验假设H0时,若在H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验. 分布拟合的卡方检验的基本原理和步骤如下: 1.将总体X的取值范围分成k个互不重迭的小区间,记作A1, A2, …,

Ak . 2. 把落入第i 个小区间Ai 的样本值的个数记作fi , 称为实测频数. 所有实测频数之和f1+ f2+ …+ fk 等于样本容量n. 3. 根据所假设的理论分布,可以算出总体X 的值落入每个Ai 的概率pi,于是npi 就是落入Ai 的样本值的理论频数. 皮尔逊引进如下统计量表示经验分布与理论分布之间的差异: 卡方统计量2 χ=∑=-r k k k k np np n 12)( 用上述原理检验是否服从分布: 以下为一个筛子投掷四十次的数据:1 4 4 6 3 4 5 2 4 6 3 4 4 2 3 6 3 1 3 4 4 5 2 2 3 3 3 1 5 1 2 2 4 5 5 5 1 3 2 5 程序如下: 输入数据: 运行结果:

卡方分布表

精品文档 . x 2 分布临界值表(卡方分布) n ' P 0.995 0.99 0.975 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.025 0.01 0.005 1 …………0.02 0.1 0.45 1.32 2.71 3.84 5.02 6.63 7.88 2 0.01 0.02 0.02 0.1 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.6 3 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.34 12.84 4 0.21 0.3 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86 5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75 6 0.68 0.87 1.24 1.64 2.2 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55 7 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.4 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.96 9 1.73 2.09 2.7 3.33 4.17 5.9 8.34 11.39 14.68 16.92 19.02 21.67 23.59 10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19 11 2.6 3.05 3.82 4.57 5.58 7.58 10.34 13.7 17.28 19.68 21.92 24.72 26.76 12 3.07 3.57 4.4 5.23 6.3 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.3 13 3.57 4.11 5.01 5.89 7.04 9.3 12.34 15.98 19.81 22.36 24.74 27.69 29.82 14 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32 15 4.6 5.23 6.27 7.26 8.55 11.04 14.34 18.25 22.31 25 27.49 30.58 32.8 16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.3 28.85 32 34.27 17 5.7 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72 18 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.6 25.99 28.87 31.53 34.81 37.16 19 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.2 30.14 32.85 36.19 38.58 20 7.43 8.26 9.59 10.85 12.44 15.45 19.34 23.83 28.41 31.41 34.17 37.57 40 21 8.03 8.9 10.28 11.59 13.24 16.34 20.34 24.93 29.62 32.67 35.48 38.93 41.4 22 8.64 9.54 10.98 12.34 14.04 17.24 21.34 26.04 30.81 33.92 36.78 40.29 42.8 23 9.26 10.2 11.69 13.09 14.85 18.14 22.34 27.14 32.01 35.17 38.08 41.64 44.18 24 9.89 10.86 12.4 13.85 15.66 19.04 23.34 28.24 33.2 36.42 39.36 42.98 45.56 25 10.52 11.52 13.12 14.61 16.47 19.94 24.34 29.34 34.38 37.65 40.65 44.31 46.93 26 11.16 12.2 13.84 15.38 17.29 20.84 25.34 30.43 35.56 38.89 41.92 45.64 48.29 27 11.81 12.88 14.57 16.15 18.11 21.75 26.34 31.53 36.74 40.11 43.19 46.96 49.64 28 12.46 13.56 15.31 16.93 18.94 22.66 27.34 32.62 37.92 41.34 44.46 48.28 50.99 29 13.12 14.26 16.05 17.71 19.77 23.57 28.34 33.71 39.09 42.56 45.72 49.59 52.34 30 13.79 14.95 16.79 18.49 20.6 24.48 29.34 34.8 40.26 43.77 46.98 50.89 53.67 40 20.71 22.16 24.43 26.51 29.05 33.66 39.34 45.62 51.8 55.76 59.34 63.69 66.77 50 27.99 29.71 32.36 34.76 37.69 42.94 49.33 56.33 63.17 67.5 71.42 76.15 79.49 60 35.53 37.48 40.48 43.19 46.46 52.29 59.33 66.98 74.4 79.08 83.3 88.38 91.95 70 43.28 45.44 48.76 51.74 55.33 61.7 69.33 77.58 85.53 90.53 95.02 100.42 104.22 80 51.17 53.54 57.15 60.39 64.28 71.14 79.33 88.13 96.58 101.88 106.63 112.33 116.32 90 59.2 61.75 65.65 69.13 73.29 80.62 89.33 98.64 107.56 113.14 118.14 124.12 128.3 100 67.33 70.06 74.22 77.93 82.36 90.13 99.33 109.14 118.5 124.34 129.56 135.81 140.17

附表四卡方分布表

αdf 14E-050 0.0010.0040.016 2.71 3.841 5.024 6.6357.879 20.010.020.0510.1030.211 4.61 5.9917.3789.21 10.6 30.0720.120.2160.3520.584 6.257.8159.34811.3512.84 40.2070.3 0.4840.711 1.0647.789.48811.1413.2814.86 50.4120.550.831 1.145 1.619.2411.0712.8315.0916.7560.6760.87 1.237 1.635 2.20410.612.5914.4516.8118.55 70.989 1.24 1.69 2.167 2.83312 14.0716.0118.4820.28 8 1.344 1.65 2.18 2.733 3.4913.415.5117.5420.0921.969 1.735 2.09 2.7 3.325 4.16814.716.9219.0221.6723.59 10 2.156 2.56 3.247 3.94 4.865 16 18.3120.4823.2125.19 11 2.603 3.05 3.816 4.575 5.57817.319.6821.9224.7326.7612 3.074 3.57 4.404 5.226 6.30418.521.0323.3426.2228.3 13 3.565 4.11 5.009 5.8927.04219.822.3624.7427.6929.82 14 4.075 4.66 5.629 6.5717.79 21.123.6926.1229.1431.32 15 4.601 5.23 6.2627.2618.54722.32527.4930.5832.816 5.142 5.81 6.908 7.9629.31223.5 26.3 28.85 32 34.27 0.9950.990.9750.950.010.005 0.90.10.050.025

统计方法卡方检验

卡方统计量 卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

相关主题
文本预览
相关文档 最新文档