第七章 X2检验
- 格式:pdf
- 大小:1.88 MB
- 文档页数:23
题目:三个率比较的卡方检验,若P0.05,则结论是?()
选项A:至少有两个总体率有差别
选项B:总体率之间两两有差别
选项C:三个样本率各不相同
选项D:两两样本率之间各不相同
答案:至少有两个总体率有差别
题目:三行四列表作χ2检验,当有4个格子的理论频数1T5时,以下哪项可取?()
选项A:增加样本例数
选项B:仍做χ2检验
选项C:作校正的χ2检验
选项D:应进行适当的合并
答案:增加样本例数
题目:五个样本率比较的χ2检验,若结论拒绝无效假设,如果要推断它们彼此之间不同,或某两者之间有差别,可用什么方法?()
选项A:方差分析
选项B:χ2分割法
选项C:秩和检验
选项D:LSD法
答案:χ2分割法
题目:作多个样本率的假设检验,其检验假设是?()
选项A:π1=π2=……=πn
选项B:X1=X2= (X)
选项C:P1=P2 =……=Pn
选项D:m1= m2=……=mn
答案:π1=π2=……=πn
题目:四行四列表作χ2检验,当有2个格子的理论频数T1时,以下哪项可取?()选项A:仍做χ2检验
选项B:增加样本例数
选项C:应进行适当的合并
选项D:作校正的χ2检验
答案:增加样本例数
题目:行列表资料的χ2检验的目的之一是?()
选项A:推断其总体效应是否不同
选项B:推断其样本效应是否不同
选项C:推断其样本率或构成比是否不同
选项D:推断其总体率或构成比是否不同
答案:推断其总体率或构成比是否不同。
第七章1下列不能用X2检验的是。
A. 成组设计的两样本频率的比较B. 配对设计的两样本频率的比较C. 多个样本频率的比较D. 频率发布的比较E. 等级资料实验效应的比较2.通常分析四格表在情况下需用Fisher精确概率计算法。
A.T<5B.T<1或n<40C.T<1且n<40D.1≤T<5且n<40E.T<5或n<403.三个样本频率比较,X2>X2,可以认为。
0.01(2)A.各总体频率不等或不全相等 B.各总体频率均不相等 C.各样本频率均不相等 D.各样本频率不等或不全相等 E.各总体频率相等4.当四格表的周边合计数不变时,如果某格的实际数有变化,则其理论频数。
A.增大 B.减小 C.不变 D.不确定 E.随该格实际频数的增减而增减5.对于总合计数 n为500的5个样本率的资料做X2检验,其自由度为。
A.499 B.496 C.1 D.4 E.9 6.从甲、乙两篇论文中,查到同类研究的两个率比较的四格表资料以及χ2检验结果,甲论文χ2>χ20.01(1),乙论文χ2>χ20.05(1)。
若甲、乙两论文的样本量相同,则可认为。
A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信D.甲论文结果不可信 E.甲论文说明两总体的差别大7.用两种方法检查已确诊的乳腺癌患者120名,甲法检出率为60%,乙法检出率为50%,甲乙两法的一致检出率为35%,则整理成四格表后表中的d(即两法均未检出者)为。
A.30 B.18 C.24 D.48 E.428.用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用。
A .普通四格表χ2检验B .配对四格表χ2检验C . u 检验D .t 检验E .秩和检验9. 两组二分类资料发生率比较,样本总例数100,则2χ检验自由度为 。
A. 1B. 4C. 95D. 99E. 10010.设两定性因素为A 和B ,每因素的两水平用+和-表示,则配对四格表的因素和水平搭配为:A .A+,A -,B+,B - B .A+A -,A -A+,B+B -,B -B+C .A+A+,A -A -,B+B+,B -B -D .A+B+,A+B -,A -B+,A -B -E .以上都不是11.三行四列表作2χ检验当有4个格子的1<T<5时, 。
第七章 次数资料分析---χ2检验第一节 χ2检验的原理与方法1.χ2分布χ2分布是从正态分布派生出来的一种分布。
⏹[定义]设X 1,X 2,X 3,…,X n 相互独立同分布,且X i ~N(0,1),则随机变量χ2= x i 2n i=1的分布称为具有n 个自由度的χ2分布。
记作: χ2 = x i 2n i=1 ~χ2(n ) 即:n 个标准正态分布的随机变量的平方和,服从自由度为n 的χ2分布。
⏹[推论]若随机变量X 1,X 2,X 3,…,X n 相互独立,且X i ~N(μ, σ2),则χ2= (x i −μ)2σ2n i=1~χ2(n)⏹[自由度]在计算χ2的过程中,如果有一个统计量代替了其中的一个参数,则其自由度为(n-1);如果有两个统计量代替了其中的两个参数,则其自由度为(n-2)。
χ2= ~χ2(n-1)22212)1()(σσS n x x ni i -=-∑=2.χ2分布的性质⏹χ2分布的“可加性”—在进行χ2统计分析时,可将相邻的数据合并在一起统计⏹χ2分布为非对称的连续性分布,分布区间为[0,+∞]⏹χ2分布曲线因自由度不同而异不同自由度的概率分布密度曲线 2χ 3.χ2检验的基本原理与方法χ2检验是与计数数据相关联的,因而用于计数资料或间断性数据的检验。
⏹[基本原理] 用于实际观测值(O )与理论推算值(E )之间的偏离程度来计算χ2值的大小,根据χ2的概率来检验观测值与理论值的差异程度和符合程度的大小。
⏹[检验方法]按照假设检验的一般步骤,对计数资料进行右尾检验。
如果有k 组资料,则检验统计量的值按下式计算:χ2=(A i −T i )2T iki=1【k:类别;A i :实际观测值;T i :理论推算值】⏹[连续性矫正] 当自由度df ≧2时,一般不作连续性矫正。
但在自由度df =1时,需进行连续性矫正,统计量计算公式:x c2= (∣A i −T i ∣−0.5)2T iki=1第二节 适合性检验1.适合性检验的定义所谓适合性检验,就是检验某一试验结果类别频数的划分是否符合某一理论比例。
第七章X2检验X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。
一、两个率的比较(一)X2检验的基本公式下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。
两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。
造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。
为了区别这两种情况,应当进行X2检验。
其基本步骤如下:1.首先将资料写成四格表形式,如表3.6。
将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。
2.建立检验假设为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。
即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。
上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。
当H0被拒绝时,就意味着接受其对立假设即备择假设H1。
此例备择假设为两总体病死率不相等,记为H1:π1≠π2因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。
一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。
3.计算理论频数根据“检验假设”推算出来的频数称理论频数,符号为T。
计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。
用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。
后者为81.25人。
然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。
计算理论频数也可用下式(3.4)TRC=nRnC/N (3.4)式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。
统计学重点知识点基本统计⽅法第⼀章概论1. 总体(Population ):根据研究⽬的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。
2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,⽤希腊字母表⽰,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采⽤拉丁字字母表⽰,是在参数附近波动的随机变量。
3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第⼆章计量资料统计描述1. 集中趋势:均数(算术、⼏何)、中位数、众数2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或⽅差)、变异系数(CV )3. 正态分布特征:①X 轴上⽅关于X =µ对称的钟形曲线;②X =µ时,f(X)取得最⼤值;③有两个参数,位置参数µ和形态参数σ;④曲线下⾯积为1,区间µ±σ的⾯积为68.27%,区间µ±1.96σ的⾯积为95.00%,区间µ±2.58σ的⾯积为99.00%。
4. 医学参考值范围的制定⽅法:正态近似法:/2X u S α±;百分位数法:P 2.5-P 97.5。
第三章总体均数估计和假设检验1. 抽样误差(Sampling Error ):由个体变异产⽣、随机抽样造成的样本统计量与总体参数的差异。
抽样误差不可避免,产⽣的根本原因是⽣物个体的变异性。
2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式:X σσ=误差的⼤⼩。
3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。
4. t 分布特征:①单峰分布,以0为中⼼,左右对称;②形态取决于⾃由度ν,ν越⼩,t 值越分散,t 分布的峰部越矮⽽尾部翘得越⾼;③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t分布的特例。
第七章 X2检验Chi-square testX2分布——计数资料第一节四格表资料的X2检验一、X2检验的基本思想1、X2分布(1)X2分布是一种连续型分布:X2分布(chi-square distribution)只有一个参数,即自由度。
当自由度V《2时,曲线呈L形随着V的增加,曲线逐渐趋于对称当自由度V—00无穷时,X2分布趋近正态分布(2)X2分布的一个基本性质是它的可加性:(X1+X2)——X2 (V1+V2)(3)X2 分布的界值:X2值愈大,P值愈小;反之,X2值愈小,P值愈大。
2、X2检验的基本思想四格表(fourfold table)资料PearsonX2——X2={Σ(A-T)2/T } V =(行数-1)(列数-1)A为实际频数(actual frequency)T为理论频数(theoretical frequency)——根据检验假设H0:π1=π2确定的。
T(RC)=nRnC/nT(RC)为第R行(row)第C列(column)的理论频数,nR为相应行的合计,nC为相应列的合计,n为总列数。
X2值反映了实际频数与理论频数的吻合程度。
3、X2检验的步骤H0::π1=π2,即试验组与对照组——总体有效率相等H1::π1≠π2,即——————————————不等ɑ=0.05——T值——V——P值二、四格表资料X2检验的专用公式X2=(ad-bc)2n/(a+b)(a+c)(d+b)(d+c)a,b,c,d为四格表的实际频数;(a+b)(a+c)(d+b)(d+c)是周边合计数;n为总例数,n=a+b+c+d. 四格表资料X2检验的校正公式三、X2C=(Iad-bcI-n/2)2n/(a+b)(a+c)(d+b)(d+c)(1)当n》40且所有的T》5时,用X2检验的基本公式或四格表资料X2检验的专有公式;(2)当n》40但有1《T《5时,用四格表资料X2检验的校正公式。
(3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。