医学统计学-析因分析
- 格式:ppt
- 大小:700.50 KB
- 文档页数:21
医学统计学分析基本思路指南第一篇:医学统计学分析基本思路指南医学统计学分析基本思路指南医学统计学的学习一定要以理解为主。
对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。
这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。
对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。
尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。
但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。
更实际的分析思路是:(1)先确定研究目的,根据研究目的选择方法。
不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。
二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。
三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。
(2)明确数据您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010、766085044自信我会是您人生路上不可或缺的论文好秘书类型,根据数据类型进一步确定方法。
不同数据类型采用的统计方法也不同。
定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。
分类资料可用的方法有χ2检验、对数线性模型、logistic 回归等。
图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。
(3)选定统计方法后,需要利用统计软件具体实现统计分析过程。
SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。
(4)统计结果的输出并非数据分析的完成。
医学统计学中常用的分析方法医学统计学是现代医学研究中必不可少的一个领域。
医学统计学是通过数据量化来描述和分析人群的疾病发病率、死亡率等重要指标。
在医疗领域中,各种慢性病、癌症等疾病的诊断和治疗,都需要依托经验数据以及一系列科学的研究手段,从而获得越来越准确的分析结果。
下面我们就来介绍医学统计学中常用的分析方法。
一、描述统计学在医治领域中,描述统计学的作用就是通过对样本的描述来深入了解总体特征。
常见的该类统计学指标有平均数、标准差以及四分位数等。
一个样本和你常遇到的人群数据不同,但也表现出自己的普遍特征。
描述统计学可以利用样本中的数据特征,了解该群体的规律和变化趋势,有助于研究者对整个群体的认识。
例如,在研究一种癌症的发病率时,描述统计学可以看到该癌症发病人群的年龄分布、性别分布等特征。
二、参数检验参数检验是将样本得到的数据运用到总体上分别进行推断的方法,用来检验研究者的假定是否成立。
参数检验的结果常表示为 t 值或 F 值等统计指标,这些指标可以在制定检测的同时告诉我们这些检测是否显著。
其中,t 值的大小表示两个样本之间的差别是否显著;F 值的大小表示方差是否显著。
基于参数检验可以根据样本数据,对推论进行延伸并推断总体信息状态。
三、协方差分析协方差分析是用来研究自变量对因变量的影响是否显著,同时控制与自变量无关的某些变量的干扰。
举个例子:人体中身高和体重间的关系是正相关的,但如果控制年龄变量的干扰之后,协方差分析可能会发现身高和体重间的关系并不如之前想象得那么紧密。
协方差分析可以对多个变量之间的关系进行分析和推断。
在医疗领域,随着研究越来越复杂,可能会引入多个干扰因素。
通过协方差分析,可以发现自变量对因变量的影响是否显著,并且还可以刻画各个因素对研究结果的影响程度。
四、生存分析生存分析主要是针对生命活动中发生的事件,例如人类、动物生存时间等等。
在医疗领域,生存分析主要用来研究生存时间和死亡原因的相关性,预测某疾病的患者数量,以及病人存活时间的评估等。
1、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。
2、标准误:将样本统计量的标准差称为标准误。
3、均数的标准误:样本均数的标准差也称为均数的标准误(SEM),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明了均数抽样误差的大小。
4、u分布:若某一随机变量X服从总体均数为υ、总体标准差为σ的正态分布N(υ,σ2),则通过u变换(X-u/σ)可将一般正态分布转化为标准正态分布N(0,1 2),即u分布。
5、t分布:在实际工作中,由于σ-X未知,用S-X代替,则-X-υ/S-X不再服从标准正态分布,而服从t分布。
6、可信区间:是按照预先给定的概率(1-α)所确定的包含总体均数的区间估计范围。
其确切含义为:如果能够进行重复抽样试验,平均有1-α(如95%)的可信区间包含了总体均数,而不是总体均数落在该可信区间。
7、假设检验:也称为显著性检验,是利用小概率反证法思想,从问题的对立面(Ho)出发间接判定要解决的问题(H1)是否成立。
然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。
8、Ⅰ型错误:拒绝了实际上成立的Ho,这类“弃真”的错误称之。
Ⅱ型错误:“接受”了实际上不成立的Ho,这样的“取伪”的错误称之。
9、检验效能:1-β,即把握度,指当两总体确有差异,按规定检验水准α所能发现该差异的能力。
10、变量转换:是指原始数据作某种函数转换,如转换为对数值等。
1、方差分析:又称变异数分析或 F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。
2、单向方差分析(one way analysis of variance)是指处理因素只有一个。
这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。
3均方:每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(mean square,MS)4、LSD-t检验:即最小显著性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。
生物统计学析因设计的方差分析两因素方差分析析因设计(factorial design):在一批试验中可以研究多个因素(或处理)。
两因素随机效应型(random-effect model)固定效应型(fixed-effect model)混合效应型(mixed-effect model)1.单独效应单独效应(simple effect)是指其他因素的水平固定时,同一因素不同水平间的差别。
2.主效应主效应(main effect)指某一因素各水平间的平均差别。
它与单独效应的区别是,主效应所指的某因素各水平间的平均差别是综合了其他因素各水平与该因素每一水平所有组合的情况。
3.交互效应(interaction)如果一个处理因素的单独效应随另一因素水平变化而变化,而且变化的幅度超出随即波动的程度,则称两因素间存在交互作用。
一、固定效应型两因素两水平的析因分析固定效应型∑∑∑∑∑∑∑=====⋅⋅⋅⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅-=+--=-=-=ai bj nk ij ijk e ai bj j i ij AB b j j B ai i A x x SS x x x x n SS x x an SS x x bn SS 11121121212)()()()(SS T =SS A + SS B + SS AB + SS e1-=a SS MS AA 1-=b SS MS BB )1)(1(--=b a SS MS ABAB)1(-=n ab SS MS ee ν= a-1ν= b-1ν= (a-1)(b-1)ν= ab (n-1)固定模型方差分析表(A B固定)变异来源平方和自由度均方FA因素SS A a-1 MS A MS A /MS e (6-20)B因素SS B b-1 MS B MS B/MS e (6-21)AB交互作用SS AB (a-1)(b-1) MS AB MS AB /MS eab(n-1) MS e误差SSeabn-1总和SST若A、B无交互作用,F= MS A /MS W (6-22)AF B= MS A /MS W (6-23)MS W=(SSe+ SS AB)/ (νe+ νAB) (6-19)例 6.1 将20只家兔随机等分4组,每组5只,进行神经损伤后的缝合试验。
absolute frequency频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。
age-sexpyramid人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。
它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。
Analysis of Variance,简称ANOVA方差分析:又称F检验,是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别。
binomial distribution二项分布:对只有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。
Coefficient of variation变异系数:是衡量资料中各观测值变异程度的一个统计量,用标准差与平均数的比值来表示。
confidence interval可信区间:按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间。
constituent ratio构成比:是指事物内部某一组成部分观察单位数与事物内部各组成部分观察单位总数之比,常用百分数表示。
Correlation coefficient相关系数:又称Pearson积距相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。
dependent variable因变量:指实验中由于实验变量而引起的变化和结果。
Dynamic Series动态数列:按时间顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势Error误差:观察值与真实值之间的差,一般偏差也称误差。
experimental effect实验效应:处理因素作用于受试对象长生的反应或结局。
factor analysis析因分析:是将两个或多个实验因素的各水平进行全面组合的实验,能够分析各实验因素的单独效应、主效应和因素间的交相呼应geometricmean几何均数:变量对数值的算数均数的反对数。