医学统计学:假设检验

  • 格式:pdf
  • 大小:732.30 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

假设检验

一、假设检验的一般原理

【例1】某妇产科医师测量瑶族妇女50例,得到骨盆入口前后径的均数为12.0cm,标准差为0.9cm;测量侗族妇女50例,得到骨盆入口前后径的均数为11.4cm,标准差为1.2cm。从中能有什么启示。

首先一个问题:能否认为瑶族妇女骨盆入口前后径大于侗族妇女?

其次一个问题:如果不能认为瑶族妇女骨盆入口前后径大于侗族妇女,那么怎么解释?

这在医学上是非常常见的问题。在抽样研究中,遇到两个(这是最简单的形式,多个的问题将在后面介绍)样本指标不同,我们决不可冒然下结论,因为可能存在抽样误差的影响问题。具体地说:瑶族妇女与侗族妇女的骨盆入口前后径不同,有两个可能性,一是种族差异的问题,即因为种族差异导致瑶族妇女骨盆入口前后径大于侗族妇女,这是真实差异;另一是瑶族妇女骨盆入口前后径与侗族妇女完全一致,这里所出现的差异,是抽样导致的,即恰好在瑶族妇女中抽到一些骨盆入口前后径较大的人,在侗族妇女中抽到一些骨盆入口前后径较小的人,于是出现了这一结果,这纯粹是抽样引起的误差。

到底哪一个可能性大呢,需要进行统计推断,即进行假设检验(经常也被称为“显著性检验”)。如果检验结果表明抽样误差的可能性大,则认为瑶族妇女骨盆入口前后径与侗族妇女一致;如果检验结果表明抽样误差的可能性小,则认为瑶族妇女骨盆入口前后径与侗族妇女不一样。

归纳一下:

真实差异大差别有统计学意义总体不同样本信息的差异可能性

抽样误差大差别无统计学意义总体相同

二、假设检验的基本步骤

首先界定一下用词:假定说有两种人,就说是两个种群的人(就是两个总体)。如果说有两组人,就说是分别从两种人(两个总体)中抽样得到的两个样本。

好,开始假设检验的具体步骤。

1、建立假设:

两组人的差别由抽样误差导致,于是认为两种人是一致的。

显然这个假设的反面是:两组人的差别不是抽样误差导致,两种人实际上不一样。

2、求统计量:

按照公式计算(详见后述)。

3、判断:

比较情况P值情况判断结果

统计量≤界值P≥0.05 差别无统计学意义

统计量>界值P<0.05 差别有统计学意义

4、结论:

如果两组人的差别无统计学意义,则认为差别是抽样误差导致的,不是真实的差别,于是认为两种人相同(既然相同,就是一种人了)。如果两组人的差别有统计学意义,则认为差别不是抽样误差导致的,而是因为不同种的人本身就存在这样差别,于是认为两种人不同(既然不同,就肯定是两种人了)。

三、假设检验需要注意的问题

(一)假设检验的前提

假设检验的一个重要前提是抽样研究要严格遵循样本具有代表性的原则,即保证样本具有代表性的正确方法是:随机抽样、足够的样本含量。千万不要以为抽样误差可以估计,则怎么抽样都可以,因为抽样误差可以估计是在抽样遵循样本具有代表性这一基础上得到的。这就说明研究的设计非常重要,应当严格遵守科学、严谨的基本

要求。

(二)第一类错误和第二类错误

假设检验只是一种对可能性的判断,同学们在日常生活中也可能有所体会,即使是万分之一的可能性,有时也会发生,不然就没有“只怕万一”一说了。所以,进行假设检验也存在担风险的问题,统计学上有第一类错误(Ⅰ型错误)和第二类错误(Ⅱ型错误)之说。

所谓“第一类错误”是指正确的假设被拒绝了,即虽然P<0.05,但事实上两组人的差别还是由于抽样误差导致的,即两种人没有差别。

所谓“第二类错误”是指错误的假设被接受了,即虽然P>0.05,但事实上两组人的差别不是由于抽样误差导致的,而是真实的差别,即两种人确实不同。

正因为如此,提示我们对任何事情的判定都不能武断,哲学中学到的辩证和一分为二,这种观点十分重要。当结果在专业上实在无法解释时,要考虑有无第一类错误或第二类错误发生,结论切不可绝对。

(三)单侧检验与双侧检验

常规情况下,我们建议初学者都采用双侧检验,因为你们缺乏系统的专业知识。但如果有了一定的专业知识后,比如,某种可能有降压作用的药物,在临床使用中最差也只是维持血压保持在原有水平上不变,不会使血压上升,这时就可以采用单侧检验了。

(四)显著性差别与“显著”

翻译的缘由,之前的统计学在介绍“假设检验”时,使用的是“显著性检验”(tests of significance);在判断结果时,也使用“差别具有显着性意义”(the data are statistically significant)。于是引起了一些不必要的用词误解。

统计学中所使用的“差别具有显著性意义”或“显著性差别”等词语,都属于统计学的专业术语,和“显著”、“厉害”、“很”等日常用词不同。因此在判断结果时可以使用“显著与否”作为“是否抽样误差引起的”标识,但在结论中绝对不可乱用显著二字。道理很简单,我们只是在推断总体,这意味着总体是未知的,那么你怎么可以对一个未知的东西说差别大不大,大到什么程度呢?

有必要深刻理解假设检验的思想,从而进一步巩固对统计推断方法的认识。在此,为帮助大家提高认识,先举一个选择题的例子。

已知均数差别的假设检验,得到P<0.05,可知:

A.两样本均数有差别;

B.两样本均数差别有统计学意义;

C.两总体均数有差别;

D.两总体均数差别有统计学意义。

在多选方式中,A、B、C三个答案是对的。实际上,这3个答案就简要地说明了显著性检验的基本思想。抽样研究得到两个样本,测量获得的资料经过统计描述,发现两个样本均数存在差别(比如之前例子中说的,抽样研究得到瑶族妇女和侗族妇女骨盆入口前后径的差别),于是就考虑这两个样本均数的差别可能是由两个方面的因素导致的:一是抽样误差所致,如果抽样误差的可能性很大,那么就可以认为两个样本所代表的两个总体是相同的,或者说两个样本来自同一个总体;二是真实的差异,即两个样本所代表的总体是不同的,本身就存在差异。那么到底两个样本均数的差别主要是什么因素所致呢?要解决这个问题,就必须进行假设检验。检验结果经过判断,得到P <0.05,说明两个样本均数的差别有统计学意义(亦即两个样本均数由于抽样误差导致的差别的可能性小于5%,属于小概率事件,几乎属于不可能)。根据这个判断结果,可以下这样的结论:两个样本来自不同的总体,即两总体均数不同(说的是:假定我们研究了所有瑶族妇女和侗族妇女的骨盆入口前后径,那会发现瑶族妇女的骨盆入口前后径确实大于侗族妇女)。

四、假设检验与置信区间估计的联系

假设检验与总体均数置信区间估计都属于统计推断的方法。同样是统计推断方法,假设检验方法与总体均数置信区间估计方法的结果会不会一致呢?