习题卡方检验图文稿
- 格式:docx
- 大小:150.01 KB
- 文档页数:6
试验数据的正态性检验数据的转换及卡方检验文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]试验数据的正态检验、数据的转换和卡方检验目录在对试验数据进行方差分析前,应对数据的三性(即同质性、独立性和正态性)进行检验。
本文介绍对资料的正态性进行检验的方法,主要介绍3种检验方法:(1)频数检验——作频率分布图、看偏度系数和峰度系数,(2)作Q-Q图检验,(3)非参数检验——单个样本K-S检验。
下面以两个试验数据为例,例1为84头育肥猪的体重数据,通常符合正态分布。
例2为生长育肥猪7个试验处理组的腹泻率(百分数资料)统计结果,这类资料往往不符合正态,而大多数人以为是符合正态分布,进行方差分析的,因而不能得出正确的结论,却可能得出错误结论。
一、符合正态分布的例子【例1】 84头生长育肥猪的“体重”数据如表1-1,检验该数据是否呈正态分布。
表1-1 84头育肥猪的“体重”数据(排序后)检验方法一:频数检验——作频率分布图、看偏度系数和峰度系数步骤1:数据录入SPSS中,如图1-1。
图1-1 体重数据录入SPSS中步骤2:在SPSS里执行“分析—>描述统计—>频率”,然后弹出“频率”对话框(图1-2a),变量选择“体重”;再点右边的“统计量”按钮,弹出图“频率:统计量”对话框(图1-2b),选择“偏度”和“丰度”(图1-2b);再点右边的“图表”按钮,弹出图“频率:图表”对话框(图1-2c),选择“直方图”,并选中“在直方图显示正态曲线”图1-2a “频率”对话框图1-2b “频率:统计量”对话框图1-2c “频率:图表”对话框设置完后点“确定”后,就会出来一系列结果,包括2个表格和一个图,我们先来看看“统计量”表,如下:统计量体重N有效84缺失0偏度.040偏度的标准误.263峰度-.202峰度的标准误.520偏度系数=0.040,峰度系数-0.202;两个系数都小于1,可认为近似于正态分布。
卡方检验四格表例题卡方检验是用于比较两个或多个样本之间是否存在显著差异的统计方法。
在四格表中,卡方检验可用于比较两个样本的性别、年龄、地区等因素之间的关系是否存在显著差异。
下面是一个例子: 假设我们要比较甲乙两个社区的死亡率是否存在显著差异。
我们随机从甲乙两个社区中各抽取了 100 名居民进行调查,发现甲社区的死亡率为千分之 5.4,乙社区的死亡率为千分之 8.3。
我们需要使用卡方检验来比较这两个社区的死亡率是否存在显著差异。
首先,我们需要画出一个四格表,列出甲乙两个社区的性别、年龄、地区等信息,如下所示:| 甲社区 | 乙社区 || ------ | ------ || 男 | 女 || 5.4 | 8.3 || 男 | 男 || 5.4 | 5.4 || 女 | 女 || 8.3 | 8.3 |接下来,我们可以计算出两个社区的死亡率之间的差异,可以使用卡方检验来进行假设检验。
卡方检验的基本思想是,根据样本数据计算出期望频数和实际频数之间的差异,然后通过卡方值来表达这种差异的程度。
在四格表中,卡方值可以表示为:卡方值 = (列交叉项的期望频数 - 列交叉项的实际频数) / 列交叉项的期望频数例如,在上面的示例中,甲社区的男性和女性的死亡率期望频数为 5.4 和 8.3,而实际频数为 5.4 和 5.4,因此卡方值 = (5.4 - 5.4) / 5.4 = 0。
最后,我们需要根据卡方值和原假设提出一个统计结论。
在本例中,原假设为两个社区的死亡率不存在显著差异,即 H0: μ1 = μ2,其中μ1 和μ2 分别表示甲社区和乙社区的死亡率。
我们要求出 P 值,P 值是指我们在零假设成立的情况下,观察到的卡方值至少大于该值的概率。
在本例中,卡方值为 0,P 值 = 0.999,这意味着我们几乎完全可以拒绝零假设,认为甲乙两个社区的死亡率存在显著差异。
需要注意的是,卡方检验只是一种统计方法,不能保证结论绝对正确。
作业2 卡方测验(一)1.资料:P144习题7.4。
2.数据说明:大麦杂交F2代芒性状表型有钩芒、长芒、短芒三种,测验三种性状是否符合9:3:4比例。
3.结果。
FREQ 过程检验gouxing 频数百分比百分比---------------------------------------钩芒 348 56.13 56.25长芒 115 18.55 18.75短芒 157 25.32 25.00指定比例的卡方检验-------------------------卡方 0.0409自由度 2渐近的 Pr >卡方 0.9798精确的 Pr >= 卡方 0.9797样本大小 = 6204.分析。
H0:三种性状符合9:3:4;H A:不符合。
显著水平:α=0.05 υ=2χ20.05,2=5.99>χ2.因此接受无效假设,无显著差异。
5.程序代码。
optionps=32767ls=255nocenter;data xiti7_4;x 'F:';x 'cd "F:\"';infile 'xiti7_4.csv' dsd;inputgouxing$ zhushu;run;procfreq data=xiti7_4 order=data;weightzhushu;tablesgouxing/nocumtestp=(56.2518.7525);/*ratio of 9:3:4*/exactpchi;run;(二)1.资料:P144习题7.6。
2.数据说明:某杂交组F2得到四种表型,B_C_,B_cc,bbC_,bbcc。
判断四种表型实际观察次数是否符合9:3:3:1的比例,判断是连锁遗传还是独立遗传。
3.结果。
FREQ 过程检验biaoxing 频数百分比百分比----------------------------------------B-C- 132 58.41 56.25B-cc 42 18.58 18.75bbC- 38 16.81 18.75bbcc 14 6.19 6.25指定比例的卡方检验-------------------------卡方 0.6431自由度 3渐近的 Pr >卡方 0.8865精确的 Pr >= 卡方 0.8915样本大小 = 2264.分析。
习题卡方检验
集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)
计数资料统计分析————习题
1.220.05,n x x ≥ 则( )
A.P ≥0.05
B.P ≤0.05
C.P <0.05
D.P =0.05
E.P >0.05
2.2x 检验中,自由度v 的计算为( )
A.行×列(R ×C )
B.样本含量n
C.n-1
D.(R -1)(C -1)
E.n
2.四格表卡方检验中,2x <20.05(1)x ,可认为?
A.两样本率不同
B.两样本率相同
C.两总体率不同
D.两总体率相同
E.样本率与总体率不同
3.分析计数资料时,最常用的显着性检验方法是( )
A.t 检验法
B.正态检验法
C.秩和检验法
D.2x 检验法
E.方差分析
4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( )
A.不变
B.愈大
C.愈小
D.与2x 值相等
E.与2x 值无关
5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文
2x >20.01(1)x ,乙论文2x >20.05(1)x 。
若甲乙两论文的样本量相同,则可认为( )
A.两论文结果有矛盾
B.两论文结果基本一致
C.甲论文结果更可信
D.甲论文结果不可信
E.甲论文说明两总体的差别大
6.计算R ×C 表的专用公式是( )
A. 22
()()()()()ad bc n x a b a c b d c d -=++++
B. B.
2 2
()
b c x
b c
-
=
+
C.
2
21
R C
A
x n
n n
⎛⎫=-
⎪
⎝⎭
∑
D.
()2 2
0.5
b c
x
b c
--
=
+
E.
2 2
()
A T x
T
-=∑
7.关于行×列表2x检验,正确的应用必须是()
A.不宜有格子中的实际数小于5 B.不宜有格子中的理论数小于5 C.不宜有格子中的理论数小于5 或小于1
D.不宜有1/5 以上的格子中的理论数小于5 或有一个格子中的理论数小于l
E.不宜有1/5 以上的格子中的实际教小于5 或有一个格子中的实际数小于1
8.R×C 表的2x检验中,P<0.05 说明()
A.被比较的n 个样本率之间的差异有显着性
B.样本率间差别没有显着性
C.任何两个率之间差别均有显着性
D.至少某两个样本率是差别有显着性
E.只有两个样本率间差别有显着性
9.四个样本率作比较,
22
0.01,(3)
χχ
>,可认为()
A.各总体率不等或不全相等 B.各总体率均不相等 C.各样本率均不相等
D.各样本率不等或不全相等
E.各总体率相等
10.配对四格表资料需用校正公式的条件()
A.1<T<5 和n>40
B.b+c<40
C.T<1 或n<40
D.T>1 n>40
E.a+c<40
11.配对资料2x值专用公式是()
A.
2
2
()
()()()()
ad bc n
x
a b a c b d c d
-
=
++++
B.
2 2
()
b c x
b c
-
=
+
C.
2
21
R C
A
x n
n n
⎛⎫=-
⎪
⎝⎭
∑
D.
()2 2
0.5
b c
x
b c
--
=
+
E.
2 2
()
A T x
T
-=∑
12.在x2 检验中,四格表的校正公式是:
A.
2
2
()
()()()()
ad bc n
x
a b a c b d c d
-
=
++++
B.
2 2
()
b c x
b c
-
=
+
C.
2
21
R C
A
x n
n n
⎛⎫=-
⎪
⎝⎭
∑
D.
()2 2
0.5
b c
x
b c
--
=
+
E.
2 2
()
A T x
T
-=∑
13.作四格表卡方检验,当N>40,且__________时,应该使用校正公式
A T<5
B T>5
C T<1
D T>5
E 1<T<5
14.四格表资料的卡方检验时无需校正,应满足的条件是( )。
A.总例数大于40
B.理论数大于5
C.实际数均大于l
D.总例数大于40且理论数均大于或等于5
E.总例数小于40
15.某防疫站同时用乳胶凝聚法与常规培养法对110 份乳品作细菌检查,结果如下:
问欲对比两种检验方法的结果有无差别,应采用什么方法()
A.u 检验
B.列联表2x检验
C.配对四格表2x检验
D.配对四格表校正2x检验
E.四格表2x检验
答案
1-5:BDDDCC 6-10:CDDAB 11-15:BAEDD。