常用医学统计学方法汇总
- 格式:doc
- 大小:125.50 KB
- 文档页数:11
医学统计学一、介绍医学统计学是医学领域中一门重要的学科,它通过收集、整理和分析医学数据,为医学研究和临床决策提供科学依据。
医学统计学的主要任务是使用统计方法分析各种医学数据,从中提取有意义的信息,并对结果的可靠性和有效性进行评估。
在医学研究中,医学统计学起着至关重要的作用,帮助研究人员通过数据分析对疾病的发病机制、病理生理过程和治疗效果等进行评估。
二、常见统计方法1. 描述统计学描述统计学是医学统计学的基础,它主要用于对医学数据的数量特征进行描述和总结。
常见的描述统计学方法包括:•平均值:用于描述数据的中心趋势。
•标准差:用于描述数据的离散程度。
•百分位数:用于描述数据的分布情况。
2. 推断统计学推断统计学是医学统计学的核心,它基于样本数据对总体进行推断。
常见的推断统计学方法包括:•假设检验:用于检验研究假设的真实性。
•置信区间:用于估计总体参数的范围。
•方差分析:用于比较多个样本的均值差异。
3. 生存分析生存分析是医学统计学中的一项重要内容,它主要用于研究患者的生存时间和相关因素。
常见的生存分析方法包括:•生存曲线:用于描述患者生存时间的分布情况。
•生存率:用于描述患者在某一时间点存活的概率。
•Cox比例风险模型:用于研究生存时间和危险因素的关系。
三、应用领域医学统计学广泛应用于医学研究和临床实践中,对于评估疾病的风险因素、制定预防策略、确定诊断标准和评估治疗效果等方面都起着至关重要的作用。
以下是医学统计学在不同领域的应用示例:1. 流行病学研究医学统计学在流行病学研究中发挥着重要作用。
通过收集大量的样本数据,并运用相关的统计方法,可以研究疾病的发病规律、危险因素和暴露因素等,为疾病的预防和控制提供科学依据。
2. 临床试验医学统计学在临床试验中的应用也非常重要。
通过对试验组和对照组的数据进行比较分析,可以评估新药物或治疗方法的疗效和安全性,为临床决策提供可靠依据。
3. 医疗质量评估医学统计学可以用于医疗质量评估,通过对不同医疗机构之间的数据进行比较分析,评估医疗服务的质量,为改善医疗质量提供参考。
医学统计学统计分析方法一.T检验二.F检验(方差分析)三.X2检验(卡方检验)四.非参数检验(秩和检验)五.回归分析六.生存分析一T检验1.单样本t检验(样本均数与总体均数比较t检验)2.配对样本t检验(配对资料)3.两样本t检验(成组t检验)完全随机设计4.近似t检验(两小样本均数两总体方差不等)5.数据转换(对数转换:几何均数t检验,平方根转换,平方根反正弦,倒数变换)二F检验(方差分析)1.两样本方差比较的F检验:Levene检验2.多个样本方差比较(也适用于两样本)Bartlett检验(正态资料)Levene检验(可不具正态)完全随机设计资料的方差分析:正态+方差齐:单因素方差分析(one factor ANOVA)和单向分类的方差分析(one way ANOVA)或成组t检验非正态或方差不齐:变量变换后采用单向分类方差分析或Kruskal-Wills H检验随机区组设计资料的方差分析正态+方差齐:双向分类的方差分析或配对t检验非正态或方差不齐:变量变换后采用双向分类的方差分析或Friedman M检验拉丁方设计资料:三向多个样本均数间的多重比较①LSD-t检验(最小显著差异t检验)②Dunnet-t检验③SNK-q检验(多个样本均数两两的全面比较)3.多因素方差分析4.重复测量设计方差分析5.协方差分析(将线性回归分析与方差分析结合)三X2检验(卡方检验)1.四格表的X2检验2.配对四格表的X2检验3.四格表资料的Fisher 确切概率法4.行×列表X2检验(多个样本率样本构成比双向无序分类资料的关联性检验)5.多个样本率的多重比较(X2分割法)R×C表资料分类及检验方法的运用1.双向无序:X2检验(样本率构成比)2.单向有序:分组变量有序,指标变量无序:X2检验(分析不同年龄组各种传染病的构成)。
分组无序,指标有序:秩转换的非参数检验(疗效按等级分组)3.双向有序:一致性检验或Kappa检验4.双向有序属性不同:非参数检验,等级分析,线性趋势检验四非参数检验(秩和检验)1.符合秩和检验(配对资料Wilcoxon符号秩和检验)配对样本差值的中位数是否为0或单个样本中位数与总体样本中位数2.两样本秩和检验(两个独立样本Wilcoxon秩和检验)两个样本是否来自同一总体(两个总体分布位置是否有差别)T值3.多个独立样本比较的Kruskal Wallis H检验(多个样本是否来自同一总体)H值进一步两两比较:Nemenyi法检验4.随机区组设计多个样本比较Friedman M检验M值进一步两两比较:q检验五回归分析1.双变量回归(1)直线回归与直线相关线性相关关系:pwcorr 变量名1 变量名2 … 变量名m, sig线性回归:reg回归方程假设检验:方差分析与t检验相关系数的假设检验::计算r后进行t检验(2)秩相关(等级相关)秩和相关分析:spearman变量1变量2 Spearman秩相关r s相同秩较多时r s的校正①加权直线回归②两条直线回归直线的比较③曲线拟合多元线性回归分析多元线性回归分析:regress+多个因素coef(回归系数)3.Logistic回归分析(二分类资料)成组资料:logistic回归logistic回归:logistic因变量变量1 变量2…变量m OR 配对资料:条件logistic回归条件logistic回归:clogit因变量变量1 变量2…变量m,strata(配对编号变量) [or]有序logistic回归:多分类logistic回归(无序)六生存分析1.描述分析乘积极限法(Kaplan-Meier法)2.比较分析Log-lank检验与Breslow检验3.影响因素分析半参数法:cox回归cox Haz Ratio(相对风险度) RR七meta分析:OR RRRD:(差值的区间与0比较)OR/RR:(定性资料)区间与1比较。
计量资料:一、 描述性分析集中趋势:对称——算术均数偏态——中位数等比——几何均数离散趋势:对称——方差、标准差偏态——四分位数间距均数悬殊或单位不同的资料比较——变异系数二、 统计推断(根据样本推断总体)1.参数(均数)估计 总体方差未知——总体方差已知——参考值范围:单双侧 正态分布—— 偏态分布——百分位数法二者的含义、用途2.假设检验(1)均数的比较(正态)单个样本、配对(与两独立样本的区别)两样本(方差齐——t 检验方差不齐——校正t 检验或秩和检验或变量转换) 多样本:方差齐 完全随机设计方差分析随机区组设计方差分析),(2/2/n s u x n s u x αα+-),(2/2/n s v t x n s v t x αα+-Su X 2α±S u X α-Su X α+方差不齐——秩和检验或变量转换非正态:秩和检验或变量转换F—+—>t两两比较:SNK 任两个对比LSD 一对或几对比较Dunnet 实验与对照组比较t——>F F=t2(2)方差比较两个方差:F检验(正态)多个方差:Bartlett(正态)Levene检验假设检验注意事项计数资料一、描述性分析频率或严重程度——率比重或构成——构成比一指标为另一指标的若干倍或百分比——相对比应用注意:不能以比代率、可比性、样本率不能直接对比率或构成比比较:1.若某因素内部构成不同并且影响比较,进行标化二、统计推断1.参数估计二项分布率的估计:查表或正态法泊松分布均数估计:查表或正态法2.假设检验单个样本率:直接法或二项分布U检验泊松分布U检验(率很小)两样本率的比较:四格表2χ检验(校正)二项分布U检验(n大、np>5,n(1-p)>5)泊松分布U检验((率很小)精确概率法多个率或构成比比较:2χ检验(理论数不能小于1或小于的理论数不能多于5分1)两两比较:任两个对比、实验与对照组比较等级资料:-----效应比较秩和检验两变量关系:1.定量(计量资料)正态pearson相关回归非正态秩相关2.无序分类定性2 检验和列联相关系数3. 有序分类定性(1)单向有序分组有序、指标无序卡方检验分组无序、指标有序秩和检验(2)双向有序属性相同Kappa检验属性不同线性趋势秩相关。
医学统计学方法1. 引言医学统计学是医学研究中不可或缺的一门学科,它通过应用统计学的原理和方法,对医学数据进行收集、整理、分析和解释,从而为医学研究提供可靠的依据。
本文将介绍医学统计学的基本概念、常用方法以及在医学研究中的应用。
2. 医学统计学的基本概念2.1 总体与样本在医学研究中,我们通常关注的是一个特定人群或物体的某种特征。
这个人群或物体称为总体,而从总体中选取出来的一部分个体则称为样本。
通过对样本进行观察和测量,我们可以对总体进行推断。
2.2 参数与统计量参数是描述总体特征的数值,例如总体均值、方差等。
由于很难获得总体所有个体的数据,我们通常通过样本来估计参数。
样本所得到的数值称为统计量,例如样本均值、样本方差等。
2.3 假设检验与置信区间在医学研究中,我们经常需要判断某种治疗方法是否有效、某种因素是否与疾病有关等。
假设检验是一种常用的统计方法,它通过对样本数据进行分析,判断总体参数是否符合某种假设。
置信区间则是对总体参数的估计范围。
3. 常用的医学统计学方法3.1 描述统计学描述统计学是对数据进行整理、总结和展示的方法。
常用的描述统计学方法包括:频数分布表、直方图、散点图等。
这些方法可以帮助我们了解数据的分布特征、集中趋势和离散程度。
3.2 推断统计学推断统计学是根据样本数据对总体进行推断的方法。
常用的推断统计学方法包括:参数估计和假设检验。
参数估计可以帮助我们估计总体参数,并给出其置信区间;假设检验可以帮助我们判断某个假设是否成立。
3.3 生存分析生存分析是研究个体发生某个事件(如死亡、复发)所需时间的方法。
常用的生存分析方法包括:生存函数曲线、危险比(hazard ratio)等。
生存分析可以帮助我们评估治疗效果、预测疾病进展等。
3.4 回归分析回归分析是研究因变量与自变量之间关系的方法。
常用的回归分析方法包括:线性回归、 logistic回归等。
回归分析可以帮助我们探索影响因素、预测结果等。
统计学中的医学统计方法统计学在医学领域中扮演着重要的角色,它提供了一种科学的方法来分析医学数据、评估治疗效果和探索潜在的病因。
本文将介绍几种常用的医学统计方法,包括描述性统计、假设检验、回归分析和生存分析。
1. 描述性统计描述性统计是医学统计学中最基础的方法之一。
它通过对医学数据的总结和整理,来描述数据的特征和分布。
其中常用的统计指标包括均值、中位数、标准差等。
例如,在一个临床试验中,医生可以使用描述性统计来总结患者的年龄分布、性别比例等基本信息。
2. 假设检验假设检验是医学统计学中用来判断一个观察结果是否具有统计学意义的方法。
该方法基于样本数据对总体参数进行推断,并对研究假设进行验证。
常见的假设检验方法包括t检验和卡方检验。
例如,医生可以使用假设检验来判断一种新药物的疗效是否显著优于常规治疗。
3. 回归分析回归分析是一种用于探索变量之间关系的统计方法。
它可以帮助医生理解不同因素对医学结果的影响程度,并用于预测和解释结果。
常见的回归分析方法有线性回归和逻辑回归。
例如,在研究心脏病发作的风险因素时,医生可以使用回归分析来确定各种危险因素对心脏病发作的贡献程度。
4. 生存分析生存分析是一种用于研究事件发生时间的统计方法,尤其在医学领域中被广泛应用于研究疾病的生存率和预后。
生存分析可以帮助医生评估治疗方法的有效性和预测患者的生存时间。
常见的生存分析方法包括Kaplan-Meier 生存曲线和Cox比例风险模型。
例如,在肿瘤研究中,医生可以使用生存分析来评估不同治疗方法对患者生存率的影响。
总结:统计学在医学领域中有着广泛的应用,它提供了一系列方法来分析和解释医学数据。
本文介绍了描述性统计、假设检验、回归分析和生存分析等几种常用的医学统计方法。
了解和掌握这些方法对于医学研究和临床实践具有重要意义,能够帮助医生做出科学的决策,提高医疗质量和患者的健康水平。
医学统计学数据分析和研究方法医学统计学是医学领域中不可或缺的一门学科,它为研究者提供了分析和解读医学数据的方法和工具。
通过对大量医学数据的分析,可以揭示疾病的发病机制、评估治疗的效果、预测病情的进展等信息,对医学研究和临床实践起到了重要的作用。
本文将介绍医学统计学的一些常用的数据分析和研究方法。
一、描述统计分析描述统计分析是医学统计学的基础,用于对医学数据进行整体的描述和总结。
常用的描述统计分析方法包括频数分布、均值和标准差、中位数和百分位数、方差和相关系数等。
通过这些统计指标,可以了解数据的分布情况、集中趋势和离散程度。
以临床试验为例,研究人员通过随机分组的方法,将患者分为实验组和对照组,观察不同治疗方案的效果。
描述统计分析可以帮助研究人员计算每个组的患者数量、计算不同治疗组的平均生存时间,从而初步判断治疗的有效性。
二、推断统计分析推断统计分析是医学统计学中的重要内容,通过对抽样数据进行分析,推断出总体的特征。
常用的推断统计分析方法包括假设检验、置信区间、方差分析和回归分析等。
假设检验是一种常用的统计方法,用于判断样本数据和总体数据之间是否存在显著差异。
在临床实践中,研究人员可以利用假设检验方法比较两种治疗方法的效果是否有显著差异。
通过设定显著性水平,计算出p值,从而判断差异是否具有统计学意义。
置信区间是对总体参数的估计,它可以反映参数的可信程度。
临床研究中,研究人员经常使用置信区间来估计相对风险、绝对风险差、药物效应值等参数。
置信区间的宽度可以反映估计的精确程度,更窄的置信区间意味着估计值更可靠。
三、生存分析生存分析是医学统计学中用于研究患者生存时间和事件发生率的方法。
常用的生存分析方法有Kaplan-Meier生存曲线、Cox比例风险模型等。
在临床研究中,生存分析方法常用于评估不同治疗方案对患者生存时间的影响。
通过绘制Kaplan-Meier生存曲线,可以比较不同治疗组的生存曲线是否有显著差异。
医学常用统计方法
医学常用的统计方法包括:
1. 描述统计学:描述统计学用于总结和展示医学数据的基本特征,如均值、中位数、标准差、范围等。
2. 推断统计学:推断统计学用于从样本数据中推断总体的特征,包括参数估计和假设检验。
参数估计用于估计总体参数的值,例如利用样本均值估计总体均值。
假设检验用于检验关于总体参数的假设,例如检验两个样本均值是否相等。
3. 相关分析:相关分析用于研究变量之间的相关关系,包括皮尔逊相关系数和斯皮尔曼等级相关系数等。
4. 方差分析:方差分析用于比较多个样本之间的均值差异,例如单因素方差分析和多因素方差分析。
5. 回归分析:回归分析用于研究自变量和因变量之间的关系,包括一元线性回归和多元线性回归等。
6. 生存分析:生存分析用于研究时间至事件发生的概率,包括生存函数、生存率和生存分布函数等。
7. 交叉表分析:交叉表分析用于研究不同变量之间的关系,包括卡方检验和列联分析等。
医学研究中经常将这些统计方法结合使用,以便更全面地分析和解释研究结果。
医学统计学统计方法
医学统计学是一门研究医学领域中的数据分析和统计方法的学科。
医学研究需要进行数据收集、数据分析和结果解释,统计方法则可以帮助研究者从大量数据中提取有用信息,评估结果的可靠性和有效性,并进行统计推断。
下面是一些常见的医学统计学统计方法:
1. 描述统计:用于描述和总结数据集的基本特征。
包括平均值、中位数、百分比、标准差、方差等。
2. 推断统计:用于从样本数据中推断总体特征的统计方法。
常见的推断统计方法包括假设检验和置信区间。
- 假设检验:用于测试一个或多个假设是否成立。
研究者根据样本数据进行假设检验,以得出关于总体的结论。
常见的假设检验方法包括t检验、方差分析、卡方检验等。
- 置信区间:用于估计总体参数的范围。
置信区间表示了对总体参数的估计范围,并给出了相应的置信水平。
常见的置信区间方法包括正态分布置信区间、二项分布置信区间等。
3. 回归分析:用于建立和验证变量之间关系的统计方法。
回归分析可以帮助研
究者确定自变量和因变量之间的关系,并预测因变量的未知值。
常见的回归分析方法包括线性回归、逻辑回归、生存分析等。
4. 生存分析:用于分析事件发生时间的统计方法。
生存分析适用于研究有时间相关性的事件(如存活时间、复发时间),可以评估幸存率、风险比等。
常见的生存分析方法包括Kaplan-Meier曲线、Cox比例风险模型等。
此外,医学统计学还涉及因子分析、聚类分析、判别分析、非参数统计方法等其他统计方法。
医学研究者经常在实践中根据研究目的和数据特点选择适当的统计方法进行数据分析和解释结果。
医学统计学常用分析方法小结一、统计描述
(一)计量资料
1、集中趋势、离散趋势指标计算:
均数、标准差:
几何均数:(1)
中位数、四分位数间距:
2、95%可信区间估计
3、95%正常值范围估计(采用百分位数法)
(二)计数资料
1、常用相对数指
2、率的标准化
二、假设检验
(一)t检验
1、配对t检验
2、两样本均数比较t检验
3、两样本几何均数比较t检验
(二)方差分析
1、成组设计方差分析及两两比较:
2、随机区组设计方差分析及两两比较:
(三)卡方检验
1、四格表卡方检验:成组设计两样本率比较
2、配对四格表卡方检验:配对两样本率比较
3、行列表卡方检验:多样本率比较、构成比比较
4、四格表确切概率法。
(四)秩和检验(等级资料)
1、配对设计秩和检验
2、两样本比较秩和检验
3、多样本比较秩和检验
三、相关回归分析
1、直线回归分析:
2、直线相关分析
3、秩相关分析。
选择合适的统计学方法1连续性资料1.1 两组独立样本比较检用成组的Wilcoxon检验。
1.4 多组随机区组样本比较1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。
如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。
1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。
如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。
****需要注意的问题:(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。
因为统计学上有中心极限定理,假定大样本是服从正态分布的。
(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。
正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。
2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.3 R×C表资料的统计分析2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。
(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。
(3)如果要作相关性分析,可采用Pearson相关系数。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。
对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。
Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
Kendall's tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。
对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据; 计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。
计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,3PearsonKendall's tau-bSpearman:Spearmanspearman(斯伯曼/斯皮尔曼)相关系数斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。
它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究Kendall's相关系数肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。
适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,又i比说U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。
在这种情况下总体方差通常是已知的。
虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。
均值检验时不同的数据使用不同的统计量使用MEANS过程求若干组的描述统计量,目的在于比较。
因此必须分组求均值。
这是与Descriptives过程不同之处。
检验单个变量的均值是否与给定的常数之间存在差异,用One-Sample T Test 单样本T检验过程。
检验两个不相关的样本是否来自来具有相同均值的总体,用Independent-Samples T test 独立样本t检验过程。
如果分组样本不独立,用Paired Sample T test 配对t检验。
么本体感觉、平衡功能反映了脑卒中偏瘫患者运动功能的特征,分别称为研究的本体感觉指标、平衡功能指标,影响本体感觉和平衡功能的有关因素,比如年龄、性别、病种、病程等,称为研究的年龄指标、性别指标、病种指标和病程指标。
变量即观察变量,也称变化的量,实际上就是观察指标,一般特指用于数学、统计或软件计算的分析指标。
例如,脑卒中偏瘫患者运动功能的本体感觉、平衡功能指标,在统计计算时,分别称为本体感觉变量和平衡功能变量。
按变量是否影响其它变量或是否受到其它变量的影响有影响变量和结果变量之分。
影响变量,也称自变量,是指自身变化并影响结果变量变化的量;结果变量,又称因变量,是指随影响变量变化而变化的量,看作是影响变量变化的结果。
如果分析康复训练对冠心病患者有氧运动功能的影响,那么康复训练可看作是影响变量,有氧运动功能则为结果变量;如果分析不同性别之间冠心病患者有氧运动功能是否存在统计学差异,那么性别是影响变量,有氧运动功能是结果变量。
分清楚变量的性质,即什么是结果变量、什么是影响变量,是选择统计分析方法的第一步。
一般而言,那些相对固有的、不易改变的特征(如性别、籍贯等)或易于被人控制的处理因素(如实验分组、疫苗接种与否等)作为影响变量或影响因素;而那些容易变化、较难确定的观察效应或结局(如疗效、患病与否等)作为结果变量,看成是最后观察的结果。
但影响变量和结果变量的划分是相对的,视研究目的和具体情况而定,有时甚至不加区分。
从数据库、数据分析的角度来看,变量是指那些能反映数据库数据的内在数量关系,可用于统计计算包括软件计算的指标。
一般而言,不同的研究目的决定了不同的数据库,实际上决定了组成数据库的不同变量。
变量的类型分为数值变量和分类变量。
数值变量,又称定量变量,是指能用定量方法测定的、具有数值大小、高低或多少的指标,变量值一般有度量衡单位,可以带小数点,如身高、体重、血压等;分类变量,又称定性变量,是指能用定性的方法确定的、观察单位某项属性或特征分类的指标。
根据分类变量的分类项数和各项数间有无等级程度差异分为二项分类变量、多项无序分类变量、多项有序分类变量,如表1。
表1 分类变量的不同类别与举例从应用统计学选择统计分析方法的角度考虑,变量可考虑分为数值变量、多项有序分类变量、多项无序分类变量、二项分类变量四种。
此外,不同类别变量可遵循下列顺序转化:数值变多变量之间的关系,如Logistic 回归分析;多个数值变量与多个数值变量之间的关系,如典则相关等。
表2 两变量关系分析的统计方法因此,医学论文的作者,在分清楚数据库中分析变量的性质、类型和降级转化关系时,可以应用表2 迅速确定首选的统计方法以及备选或次选的统计方法,应用相关软件或计算工具快速实现统计分析。
医学论文的编审和读者也可应用该表2,准确判断作者是否正确选择了统计学分析方法,甚至分析错误选择统计方法的原因与后果。
如,欲评价某种药物的降舒张压效果,试验组用该降压药、对照组不用药,假如测量的舒张压值符合t 检验的条件(正态分布、方差齐等),很明显该数据首选f 检验的统计方法。
如果降级转化可以选择Wilcoxon 秩和检验,如果降压效果转化为有效和无效两种情况,甚至可以选择四格表X2 检验。
但需要注意的是,如此降级选择统计方法,可能出现假阴性或漏诊错误,即把差异有统计学意义的结果(有降压效果)当作差异无统计学意义的结果(无降压效果)看待,从而低估药物的作用,在论文讨论中至少要加以必要的说明,否则统计方法不能视为正确有效,可作为退修或退稿处理。
五、熟悉常用的统计分析软件统计分析软件是统计分析的必备工具,常用的统计分析软件有:统计分析系统SAS、社会学统计程序包SPSS、微软公司电子表格系统Microsoft Office Excel 等。
SAS(statistics analysis system) 是统计分析系统的英文缩称,最早由北卡罗来纳大学的两位生物统计学研究生编制,1976 年由SAS 软件研究所正式推出。
SAS 完全针对专业用户进行设计,以编程为主。
其最大特点是分析模块调用,功能强大,深浅皆宜,简短编程即可同时对多个数据文件进行分析。
但对一般用户而言,人机界面不太友好,最初编写使用程序时可能会存在各种难度。
SPSS(statistical package for the social science) 是社会学统计程序包的英文缩称,20 世纪60 年代末由美国斯坦福大学的3 位研究生研制,1975 年由芝加哥sPss 总部推出。
sPss 系统的最大特点是菜单操作,方法齐全,绘制图形、表格较为方便,输出结果比较直观。
但其统计分析功能略显逊色,特别是难以同时分析处理多个数据文件。