简明医学统计学教程
- 格式:doc
- 大小:563.50 KB
- 文档页数:13
医学统计学(医学统计方法)教学大纲(供五年制临床医学、护理、口腔专业)前 言本大纲供五年制医学系临床医学专业、护理专业、口腔专业《医学统计学》(《医学统计方法》教学用,是对医学统计学教学提出的基本要求。
其内容可通过讲课,实习或其它方式进行教学,讲授时不一定按此顺序,可根据情况作些调整。
内容分作二级要求:第一级是学生必须掌握的内容,教师一般应于理论课讲授,亦为实习课与考试的重点。
第二级是要求熟悉的内容,教师应选择性讲授,未讲授部分由学生自学。
本大纲规定教学时数为36学时,其中讲授27学时,实习9学时。
《医学统计学》是应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的重要工具。
生物医学的研究对对象是随机现象,其表现不仅受该事物本质规律的制约,同时还受偶然因素的影响,只有用医学统计学方法才能揭示被偶然因素掩盖的本质规律。
学习医学统计学方法对医学科学研究和疾病防治工作有重要意义,是医学生需掌握的基本知识。
第一章 医学统计学的基本内容一、目的和要求㈠ 掌握几个基本概念。
㈡ 熟悉统计资料的基本内容。
㈢ 熟悉统计工作的基本步骤。
㈣ 熟悉统计图和统计表基本内容二、教学内容㈠ 统计中的几个基本概念:总体、样本、变异、概率。
㈡ 统计资料的类型1、计量资料与数值变量2、计数资料与分类变量3、变量的转化㈢ 统计工作的步骤统计工作可分为设计、搜集资料、整理资料和分析资料四个步骤:1、设计2、搜集资料3、整理资料4、分析资料以上四个步骤是紧密联系,不可分割的整体,任何一步的缺陷,都会影响统计分析的结果。
㈣ 统计图和统计表1、统计表的基本结构、种类和编制统计表的注意事项。
2、统计图的概念、绘制统计图的基本要求及常用统计图的绘制方法与注意事项。
第二章 数值变量资料的统计分析第一节 数值变量的统计描述一、目的和要求㈠ 掌握平均水平指标和离散程度的计算方法和各个指标的适用条件。
㈡ 了解频数表的编制方法及用途。
医学统计学完整版课件一、教学内容本节课的教学内容来自于《医学统计学》的第五章,主要内容包括:描述性统计、概率分布、参数估计、假设检验、置信区间、p值和假设检验的类型。
二、教学目标1. 使学生了解描述性统计、概率分布、参数估计、假设检验等基本概念。
2. 培养学生运用医学统计学方法分析和解决实际问题的能力。
3. 帮助学生掌握置信区间、p值和假设检验的类型的计算和应用。
三、教学难点与重点1. 教学难点:概率分布、参数估计、假设检验的计算和应用。
2. 教学重点:置信区间、p值和假设检验的类型的概念和计算。
四、教具与学具准备1. 教具:多媒体课件、黑板、粉笔。
2. 学具:笔记本、笔、计算器。
五、教学过程1. 实践情景引入:通过一个医学研究案例,引出描述性统计、概率分布、参数估计、假设检验等概念。
2. 讲解描述性统计:介绍频数、频率、均数、中位数、标准差等基本统计量,并通过实例讲解如何计算和解读。
3. 讲解概率分布:介绍二项分布、正态分布等常见概率分布的性质和计算方法,并通过实例进行解释。
4. 讲解参数估计:介绍参数估计的概念、方法,讲解最大似然估计、点估计和区间估计等,并通过实例进行演示。
5. 讲解假设检验:介绍假设检验的基本原理、步骤,讲解t检验、卡方检验等常见假设检验方法,并通过实例进行解释。
6. 讲解置信区间:介绍置信区间的概念和计算方法,讲解如何判断假设检验的结果。
7. 讲解p值:介绍p值的概念和意义,讲解如何判断p值的大小。
8. 假设检验的类型:讲解单样本、双样本和配对样本假设检验的特点和应用。
六、板书设计板书设计如下:1. 描述性统计:频数、频率、均数、中位数、标准差2. 概率分布:二项分布、正态分布3. 参数估计:点估计、区间估计4. 假设检验:t检验、卡方检验5. 置信区间:概念、计算方法6. p值:概念、判断方法7. 假设检验的类型:单样本、双样本、配对样本七、作业设计1. 作业题目:(1)请解释描述性统计、概率分布、参数估计、假设检验的概念。
简明医学统计学教程作为一名临床医师,或是医学生,不管你愿意不愿意,都必须写论文。
医学论文有别于其他论文,我们那些“神圣”的数据都必须进行统计学处理,这时,大多数人会遇到一个难题,大学时期学过的《医学统计学》早就忘得差不多了,重新翻开统计学书本,基本上也是看得云里雾里。
为了不让同学们再次重温早年学习统计学时的那种痛苦的体验,我不自量力,特编写《医学统计学傻瓜教程》,本教程有别于其他任何的统计学教程,其特点是略去一些高深难懂的统计学原理及计算公式,直奔解决实际问题的方法,小学小用,大学大用,另有妙用。
你不需要任何的统计学基础,为了不引起你的反感,不会出现任何一道数学公式。
本教程分“基础篇”及“提高篇”两个部分,学完“基础篇”即可解决绝大多数的统计学问题,学完“提高篇”,“降龙十八掌”的武功已修练到“第10层”,足以让你的同事对你刮目相看。
整个学习时间约需要2~3小时,在学习之前,我们需要到网上下载一个小工具,即《临床医师统计学助手 V10.0》,因为进行统计学处理时最令人头痛的问题是烦琐的计算,则全部由预存在本软件内的计算公式来完成。
这是一个全“傻瓜化”的教程,“基础篇”及“提高篇”各由数个实例组成,只要认真看完这些实例,将实际中碰到的问题对号入座即可,接下来我们开始轻松愉快的学习过程。
一、基础篇1、均数与标准差【例1】本组105 例,男55例,女50例;平均年龄:62.3±6.1岁,所有入选病例均符合1999年WHO高血压诊断标准。
举这个例子是为了说明“均数”与“标准差”的概念。
我实在不愿意多花时间阐述一些概念性的东西,但是由于“标准差”的概念实在太重要了。
【例1】中的数据“62.3±6.1”,“62.3”就是年龄的均数,均数的概念大家都懂,那么后面的“6.1”是什么呢?它就是标准差。
有人可能会问,表达一组人的平均年龄,用均数就够了,为什么还要加一个标准差呢?先看下面的一个例子:有两组人,第1组身高(cm):98、99、100、101、102;第2组身高(cm):80、90、100、110、120,这两组人虽然身高的均数都是100cm,但是,仔细观察,第1组的身高很接近,第2组的身高差别很大,故仅仅用一个平均数表达一组数据的特征是不完整的,还需要用另一个指标来表达其参差不齐的程度,这就是标准差。
统计学上对一组测量结果的数据都要用“均数±标准差”表示,习惯表达代号是:x±s,具体例子如:平均收缩压120±10.2mmHg。
我想现在同学们都已知道标准差是什么东东了,那么,标准差是怎样得到的呢?有一个比较复杂的计算公式,我们不必去深究这个公式是怎么样的,只需知道标准差越小,说明数据越集中,标准差越大,说明数据越分散。
撰写医学论文的第一步是收集原始数据,如:第1组身高(cm):98、99、100、101、102;第2组身高(cm):80、90、100、110、120。
在论文中并不是直接给出原始数据,而是要以x±s方式表示。
利用软件《临床医师统计学助手 V10.0》,只要输入原始数据,就能自动计算出均数及标准差,即第1组平均身高:100±1.58cm;第2组平均身高:100±15.81cm,如下图。
2、两样本均数t检验【例2】目的研究中药板兰根对“非典”疗效。
方法将36例“非典”患者随机分为治疗组19例,采用常规治疗+板兰根口服,对照组17例,仅采用常规治疗。
结果治疗组平均退热时间3.28±1.51d;对照组平均退热时间5.65±1.96d,两组间对照差别有极显著意义(p<0.01)结论中药板兰根对“非典”有显效疗效,实为国之瑰宝。
这是最常见的一种统计学数据处理类型,统计学述语叫做“两样本均数差别t检验”,说得通俗易懂一些,就是检验两组方法所得到的数据到底有没有差异,或者说,差异是否有意义。
我们平时的思维习惯是,数据的大小还用得着检验吗?这是小学生都会的问题,但是统计学可不是这样简单的看问题。
可能还没有说明白这个问题,下面举一个简单的例子。
我们的目的是得出这样一个结论:“北京出产的西瓜比上海出产的西瓜大”。
最可靠的方法是把全部的北京产西瓜和全部的上海产西瓜都称重量,得到两个均数,然后比大小即可,可是智商正常的人并不会这样去做,通常的做法是,随机选一部分北京的西瓜和一部分上海的西瓜,先让这两部分西瓜比大小,然后推断到底那里的西瓜大。
这种方法是“窥一斑可见全豹”,统计学述语叫做“由样本推断总体”,事实上,我们所做的医学科研都是基于这种方法。
再回到上面的例子,假如我们有二种做法:A、随机选2个北京西瓜,平均重量是5.6±0.3kg;再随机选2个上海西瓜,平均重量是4.3±0.25kg;B、随机选1000个北京西瓜,平均重量是5.6±0.3kg;再随机选1000个上海西瓜,平均重量是4.3±0.25kg。
凭我们的直觉和生活常识,由B推出“北京的西瓜比上海西瓜大”这个结论的把握性就非常的大,而A则基本上推不出这个结论。
为什么这样说呢?北京全部的西瓜叫“总体”,随机选择的2个西瓜叫“样本”,通常我们不会拿“总体”去比大小,这太困难了,而总是拿“样本”去比大小,这样就可能会有一个问题,你所抽到的样本,可能都是最大的西瓜,也可能都是最小的西瓜,这样由样本来推断总体就可能会出现错误(抽样误差),如何来解决这个问题呢,这就是统计学所研究的问题,总体来说,样本量越小,抽样误差越大,由样本推断总体的把握性越低,从上面例子中,相对B而言,A的可靠性就很低。
现在,终于可以引出我们的主题了,统计学处理本质是研究由样本差异推断总体差异的把握性有多大,这种把握性在统计学上用p值表示。
如p<0.05或P<0.01,可以理解为由样本差异推断总体差异的把握性达95%或99%以上;如P>0.05,可以理解为这种把握性在95%以下。
上面所讲的实已为统计学之精髓,也是本教程最艰难的部分,建议多看几遍。
如果天生愚鲁,还是不明白,也没有关系,我们可以简单的理解为所谓统计学处理,实际上是为了弄明白两组数据的差异由抽样误差造成的可能性有多少?这种抽样误差的可能性由p值来表示,p<0.05或p<0.01,说明抽样误差的可能性很小(低于5%或1%),两组数据差异有显著意义;p>0.05,说明抽样误差的可能性很大(高于5%),两组数据差异没有显著意义。
所以,统计学处理的中心任务是求p值。
那么如何求p值呢?这里本来需要例举出一大堆的数学计算公式,但是现在不这样做,我们由软件来直接计算。
结合【例2】,具体操作如下。
【例2】中一共有6个数据:第一组均数(X1)、标准差(S1)、例数(N1)与第二组均数(X2)、标准差(S2)、例数(N2),把这6个数据输入软件对应的框内,该软件就会利用预先存储的公式自动计算t值,并得出p<0.01,由此判断两组间的差别具有极显著的意义(如果没有想成为统计学专家,就不必去理解“t值”是什么了,知道“t值”是为了求“p 值”用的就可以了),如下图。
3、配对计量资料t检验【例3】目的研究音乐胎教对胎儿运动技能培养的效果。
方法 10例28~32周孕妇,分别记录听音乐(水浒传电视剧主题曲)前每小时的胎动次数及听音乐后每小时的胎动次数,结果数据如下表所示,音乐胎教后胎动次数增多,差别有显著意义(p<0.0525)结论音乐胎教可增强胎儿运动技能,对培养我国运动天才有现实意义。
序号胎教前胎动次数胎教后胎动次数1 25 302 23 223 30 354 24 225 16 206 20 247 24 288 12 159 26 2810 18 16显然【例3】与【例2】有所不同,主要是【例3】两组间的数据可以前后配对的。
我们经常碰到这种情况,即同一个体做两次处理,如治疗前检测某一指标,治疗后再检测某一指标,而后做治疗前后配对比较,以判断疗效。
这种情况如何进行统计学处理呢?在软件中选择“配对资料t检验”,分别输入上面的2组数据,软件自动计算p<0.05,差别有显著意义,如下图。
可能同学们会问,【例3】的情况,也可以把胎教前视为对照组,求得平均胎动次数是:21.8±5.31,胎教后视为治疗组,求得平均胎动次数是:24.0±6.31,然后套用【例2】的方法,用“两样本均数t检验”行不行?这样虽无大错误,但是将会导致检验效率的下降,就是说,如果数据差异较大时,两种方法均可,如果数据差异较小时,用“配对t检验”会显示出差异有意义,而用“两样本均数t检验”时,可能差异无意义。
切记,非配对资料误用配对t检验,则是错误的。
4、计数资料卡方检验【例4】目的研究医患关系对重症病人死亡率的影响。
方法根据问卷调查对收住重症监护病房的病人分为“医患关系良好组”与“医患关系紧张组”,比较两组间的住院死亡率。
结果“医患关系良好组”25例,住院间死亡3例,死亡率13.6%,“医患关系紧张组”23例,住院间死亡9例,死亡率39.1%,两组间差别有显著意义(p<0.05)结论医患关系紧张增加重症病人的住院死亡率,可能与医师害怕挨打而治疗方案趋向保守有关。
这又是一个非常常见的一种统计学数据处理类型。
【例4】中所提供的数据是“比例”,或百分数,与前面三个例子不同,前面三个例子所提供的数据则是直接在病人身上测量到的数据,如收缩压120±10.2mmHg、身高100±15.81cm等,我们把【例4】中的数据叫做计数资料,而【例1、2、3】中的数据叫做计量资料。
计数资料无法用“均数±标准差”形式表示,只能用比例表示,如:死亡率13.6%、30例中显效10例(10/30)等。
显然,对于计数资料,再用t检是不适合了,必须用卡方检验。
卡方检验的步骤是:先求出X2值(类似于t检验时先求t 值),然后进行判断:⑴ 如果X2<3.84,则p>0.05;⑵ 如果X2>3.84,则p<0.05;⑶ 如果X2>6.63,则p<0.01。
解释一下,上面的两个数字“3.84”与“6.63”是查“X2界值表”得来的,只要记住即可。
所以,卡方检验的关键是求出X2值。
为了求出X2值,必须先介绍“四表格”概念。
“四表格”的形式如下,关键数据是 a、b、c、d 四个数,X2值就是通过这四个数据计算出来的(这里仍不介绍公式,由软件计算。
)。
现将【例4】中的数据填入“四表格”即如下图。
当你学会了填“四表格”数据之后,就能利用软件非常容易的进行卡方检验了,本软件提供与“四表格”完全相同的界面,选择“计数资料卡方检验”,把数据填写正确之后,就自动计算X2值并判断结果,【例4】X2=4.702>3.84,故p<0.05,如下图。