当前位置：文档之家› 临床研究常用统计方法概述

临床研究常用统计方法概述

金雪娟周俊时智英葛均波

(复旦大学附属中山医院，上海市心血管病研究所，上海200032) 经过周密设计和科学实施的临床研究还需要规范的数据管理和统计分析，才能得到可靠的结论。随着计算机技术和统计分析软件发展，近年来，统计理论和方法发展非常迅速。临床医师日常繁忙的工作使得他们很少有时间系统学习医学统计理论，及时了解一些实用、有效的新方法。在此，我们介绍目前临床研究最常用的一些统计分析方法，以实用、易懂为原则，重点综述各种方法的适用条件。

1 几个基本概念和统计量

1.1 数据的类型

数据(Data)是统计分析的基础。统计分析方法的选择取决于不同的数据类型。最常见的数据类型有两种，分类数据(Categorical Data)或称定性数据(Qualitative Data)和定量数据(Qulantitative Data) 或称计量数据(Numerical Data)。

分类数据类型：分类数据的分层大于2时，又称为多分类数据(Polytomous Data)。分类数据类型有无序(Nominal Categorial)和有序(Ordinal Categorieal)。无序数据如性别(男、女)、血型(A、B、O、AB 型)等。有序数据如肿瘤的分级(I级、II级、III级)、疼痛的程度(轻、中、重)等，以及在临床研究设计中，经常看到的“非常好、好、一般、差”这样的数据类型。不同类型的分类数据在统计分析方法上也不同，并不是大家所熟悉的x2检验所能全部涵盖的。

定量数据类型：包括连续性数据(Continuous Data)，如身高、体重以及不连续性数据(Discrete Data)，如妇女的产次，疾病的复发次数等。

1.2 常用的描述性统计量

最常用的描述集中趋势的统计量为算术均数(Arithmetic Mean)，但其值易受极端值影响。可以采用

中位数(Median)、修整均数（Trimmed Mean，去除最大和最小值后的算术均数）或Winsorized均数（Winsorized Mean，极端值用最接近的非极端值替代后的算术均数）来代替。对于数值呈几何分布的资料，则可采用几何均数(Geometric Mean)。

临床研究论文中常采用均数±标准差或均数±标准误来表示定量数据的分布特征。标准差(Standard Deviation)为方差(Variance)的平方根，表示个体数值与样本均数间的离散程度；标准误(Standard Error)为均数的标准差，表示样本统计量与总体参数间的离散程度，标准误越小，总体均数的95%可信区间(confident interval，CI)越窄，也就是说样本均数对总体均数的代表性越好。虽然不同的统计学家对论文中应该引用哪种表达方式有争议，但两种方式均用于描述正态分布的计量数据。在医学论文中，采用标准差或标准误应该说明。对于非对称数据只用均数±标准差或标准误表达是不恰当的，可以采用中位数结合四分位数间距(Inter-quartile Range)表示。

1.3 显著性水平(a)和P值

为了说明统计学显著性差异，通常把P值与参考值a比较，如果P

参阅已经发表的文献，常发现这样的问题，研究者设立了A、B和C组3个组，在统计检验时，先把A与B比较，然后B与C比较，再A与C比较，这是需要极力避免的。多重比较会增加I类错误的概率。假设有K个中心，同时参与某临床实验，如果按各个中心分别统计，则a = 1 - ( 1 - 0.05 ) K。当K等于1、2、3、4时，a值依次为0.050、0.098、0.243、0.185，随着独立检验次数的增加，a值也增加。

1.4 统计分析软件的选择

统计软件非常多，目前临床研究常用并且比较权威的统计软件有SAS(Statistics AnalysisSystem)、SPSS(Statistical Package for the Social Science)、STATA(Statisties / Data Analysis) 和Splus 等。STATA灵巧方便，价格也能为个人用户所承受。SSPS的菜单式操作，使用简便，而且介绍SPSS的书籍比较多，目前已经成为国内非统计专业人员统计的首选软件。SAS是主要针对专业统计用户设计的软件，在数据处理和统计分析领域，被誉为国际上的标准软件系统。国际上大部分著名高校和生物统计机构均使用SAS作为统计分析工具，一些最新的统计方法在SPSS和STAT中没有包括，需要选用SAS处理。

2 临床研究常用统计方法选择的原则

2.1 单组资料的分析

如果数据呈正态分布，则采用单样本t检验(One-Sample Test)；如果数据呈非正态分布，可以采用相应的非参数统计方法Wilcoxon符号等级检验(Wilcoxon Signed-Rank Test)。

2.2 两组资料的分析

首先，需要判别数据为定量数据还是分类数据。如果是定量数据，数据的分布特征呈正态，则选择两样本t检验(Two-Sample Test)；如果定量数据呈非正态分布，则选择Wilcoxon等级和检验(Wileoxon Rank Sum Test)。

对于分类数据，卡方检验(Chi-Square Test)被广泛运用。但值得注意的是，如果行列表中有1/5以上的格子理论频数小于5，或有飞个格子理论频数小于1，卡方检验将导致分析的偏性。此时，可以采用Fishe's 精确概率法(Fishe's Exact Test)计算P值。

2.3 三组或以上资料的分析

与两组资料分析类似，如果数据为定量资料呈正态分布，则采用单因素方差分析(One way ANOVA)；如果定量数据，呈非正态分布，则选择Kruskal一Wallis检验(Kruskal一Wallis Test)。

对于分类数据，多分类无序数据采用卡方检验(Chi-Square Test)或Fish's精确概率法；多分类有序数据可采用Cochran-Mantel-Haenszel 检验(Cochran-Mantel-Haenszel Test)。

2.4 生存分析(Analyzing Researeh Questions about Survival)

分析一段时间后生存、死亡或其它事件发生情况需要采用生存分析，例如，研究者想了解心脏移植后

病人生存天数是否与不同的手术方式有关。生存分析的目的通常是为了描述研究人群的事件发生时间(生存时间、suvival time)的分布特征，比较不同组的生存时间或研究生存时间是否与研究变量有关。

单因素生存分析可以采用Log-Rank检验(Log-Rank Test)；多因素可以考虑选择比例风险模型(Cox Proportional Hazards Model)。需要注意的是，在临床研究中经常包含重复测量数据，如病人从心脏移植至死亡发生期间，重复测量了多次心功能值，对于这种资料，可以采用SAS PHREG中，重复测量资料的cox模型的运用。

2.5 相关性分析(Researeh Question Sabout Relationships among Variables)

许多临床研究涉及对一组研究对象2个连续性变量的相互关系的研究。如用2个不同的指标测定心功能，拟评价这2个指标是否一致，这就需要涉及相关(Correlation)和一致性(Agreement)的评价。

当数据为正态分布时，Pearson相关系数(Pearson's relation Coefficient)可以评价2个指标的相关性。当数据分布非正态，相应的非参数统计量为Spearman's等级相关系数(Spearman's Rank Correlation Coeffielent)以及Kendall's Tau-b等级相关系数(Kendall's Tau-b Rank Correlation Coeffielent)，两者类似，但更多的统计学家推荐使用后者。

对一致性的评价，定量数据可以采用Concordance相关系数(Concordance Correlation Coeffieient)，分类数据采用Kappa分析(Cohen's Kappa statistic)。

值得注意的是，相关性与一致性的区别。如在临床研究中，希望评价一个新的方法是否等同于原来的方法，需要使用一致性分析。

2.6 多因素分析(StatlstiealMethodSfo:MultipleVariables)

临床研究的对象常常为病人，与有严格实验条件控制的动物实验不同，除了研究的因素外，常需要控制许多混杂因素或协变量，统计分析需要采用多因素模型对协变量进行校正。统计分析软件和程序的使用为多因素分析提供了可能。根据反应变量的类型，可以采用多元线形回归(Muiriple Linear Regression)、协方差分析(ANOVA，Analysis of Covariance)以及Logistic回归(Logistic Regression)等。

2.7 重复测量数据的分析(Methods for Analyzing Repeated Measures Data)

定量数据可以采用重复测量方差分析(Repeated-Measures ANOVA)以及混合效应模型

(MixeD-effects linear Model)。对于分类数据，可以广义估算方程(Generalized Estimated Evluation，GEE)拟合Logistic模型。表1总结了常用的多因素分析方法以及选择原则以及对应的SAS步。

表1 多因素分析方法与SAS

自变量

反应变量－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

连续性数据分类数据重复

测量

3. 小结

临床工作者花费了大量心血收集到的宝贵资料，需要有适当的统计分析和结果呈现。目前国内统计书籍中介绍的方法常常不能满足充分利用研究信息的需要。我们对各种常用统计方法的选择作了概述，实际运用时，还需要参阅相应的SAS程序。

医学统计学

第一单元概述 1. 研究设计应包括那几方面内容？答：包括：专业设计和统计设计。专业设计是针对专业问题进行的研究设计，如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计，如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷，都不能在统计分析阶段弥补和纠正。第二单元资料描述性统计 1. 描述计量资料的集中趋势和离散趋势的指标有哪些？各指标的适用范围如何？答：集中趋势的指标有：算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置，尤其是正态分布资料；几何均数用来描述等比资料和对数正态分布资料的集中位置；中位数可用于任何资料。描述离散趋势有：极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布，但两个指标都不能反映变异程度；方差和标准差常用于资料为近似正态分布；变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2. 变异系数和标准差有何区别和联系？答：区别： 1.计算公式不同：CV=S/X*100% ，标准差是方差的平方根。 2.单位不同：变异系数无量纲，标准差量纲和原指标一致。 3.用途不同。联系：都是适用于对称分布的资料，尤其是正态分布的资料，并且由公式所知，在均数一定时，CV 与s 呈正比。 3. 频数表的用途有哪些？答： 1.描述资料的频数分布的特征； 2.便于发现一些特大或特小的可疑值； 3.将频数表作为陈述资料的形式，便于进一步的统计分析和处理； 4.当样本量足够大时，可以以频数表作为概率的估计值。 4. 用相对数时应注意哪些问题？答：1.在实践工作中，应注意各相对数的含义，避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量，如资料的总数过少，直接报告原数据更为可取。 3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下，从样本估计值推断总体相对数应该考虑抽样误差，因此需要对相对数指标进行参数估计和假设检验。第三单元医学统计推断基础 1. 正态分布和标准正态分布的联系和区别？答：联系：均为连续型随机变量分布。区别：标准正态分布是一种特殊的正态分布（均数为0，标准差为1）。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4. 简述二项的应用条件？答：条件为： 1.每次试验只会发生两种互斥的可能结果之一，即两种互斥结果的概率之和为1；2.每次试验产生某种结果固定不变； 3.重复试验是相互杜立的，即任何一次试验结果的出现不会影响其他试验结果的概率。 5. 简述Q-Q 图法的基本原理？答：U-变换可以把一个一般正态分布变量变换为标准正态分布变量，反之，U-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q 图法实际上就是首先求的小于某个x 的积累频率，再通过该积累频率求得相应的u 值，如果该变量服从正态分布，则点（u，x）应近似在一条直线上（u —变换直线），否则（u, x）不会近似在一条直线上。Q —Q图法正是根据（u, x）是否近似在一条直线上来判断是否为正态分布。第四单元参数估计与参考值范围的估计 1. 均数的标准差和标准误的区别和联系？答：区别和联系：标准差是描述个体值变异程度的指标，为方差的算术平方根，该变异不能通过统计方法来控制；而标准误则是指样本统计量的标准差，均数的标准误实质上是样本均

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。**绝不能对其中的两

医学统计学分析基本思路指南

医学统计学分析基本思路指南医学统计学的学习一定要以理解为主。对于初学者，不必强记一大堆的公式，也不要死钻牛角尖，非要弄明白为什么这种方法叫“t检验”、“F检验”，为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题，感兴趣的读者可以查阅统计学史。对于只想应用的人来讲，你只要了解在什么情况下应该用什么方法，什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验，然后选定统计量，然后怎么怎么。但实际中我们拿到一堆数据的时候，不会坐在桌上先列出零假设和备择假设，也不会满座子地计算统计量。更实际的分析思路是: （1）先确定研究目的，根据研究目的选择方法。不同研究目的采用的统计方法不同，常见的研究目的主要有三类：一是差异性研究，即比较组间均数、率等的差异，可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析，即分析两个或多个变量之间的关系，可用的方法有相关分析。三是影响性分析，即分析某一结局发生的影响因素，可用的方法有线性回归、logistic回归、Cox回归等。（2）明确数据您身边的论文好秘书：您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表，扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书类型，根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。（3）选定统计方法后，需要利用统计软件具体实现统计分析过程。SAS中，不同的统计方法对应不同的命令，只要方法选定，便可通过对应的命令辅之以相应的选项实现统计结果的输出。（4）统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果，需要从中选择自己需要的部分，并做出统计学结论。但统计学结论不同于专业结论，最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择，可供读者参考。

医学统计学总结

医学统计学总结一.绪论 1，医学统计学：运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学。 2，医学统计学的主要内容： 1）统计研究设计调查研究设计和实验研究设计 2）医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A：资料的搜集与整理B：常用统计描述，集中趋势和离散趋势，相对数，相关系数，回归系数，统计表，统计图C：统计推断，如参数估计和假设检验。 3）医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3，统计工作步骤： 1）设计明确研究目的和研究假说，确定观察对象与观察单位，样本含量和抽样方法，拟定研究方案，预期分析指标，误差控制措施，进度与费用。 2）搜集材料 A，搜集材料的原则及时、准确、完整 B，统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表，二是经常性工作记录，三是专题调查或专题实验。 C，资料贮存 3）整理资料a检查核对b设计分组c拟定整理表d归表 4）分析资料统计分析包括统计描述和统计推断 4，同质（homogeneity）：指被研究指标的影响因素相同。变异(variation)：同质基础上的各观察单位间的差异。变量(variable)：收集资料过程中，根据研究目的确定同质观察单位，再对每个观察单位的某项特征进行测量或观察，这种特征称为变量 5，总体（population）根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是：同质性样本（sample）从总体中随机抽取部分观察单位，其变量值的集合构成样本。样本必须具有代表性。代表性是指样本来自同质总体，足够的样本含量和随机抽样的前提。

常用医学统计学方法汇总

选择合适的统计学方法 1 连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t 检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验；（2）采用非参数检验,如Wilcoxon 检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t '检验；（2）采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t 检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon 的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1 资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe 法，SNK 法等。 1.3.2 资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal －Wallis 法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni 法校正P 值，然后用成组的Wilcoxon 检验。 1.4 多组随机区组样本比较 1.4.1 资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD 检验，Bonferroni 法，tukey 法，Scheffe 法，SNK 法等。 1.4.2 资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman 检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni 法校正P 值，然后用符号配对的Wilcoxon 检验。 **** 需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD 检验，Bonferroni 法，tukey 法，Scheffe 法，SNK 法等。** 绝不能对其中的两组直接采用t检验，这样即使得出结果也未必正确**

医学统计方法小结

统计方法小结首次分享者：yanyan已被分享22次评论(0)复制链接分享转载删除一、两组或多组计量资料的比较 1.两组资料： 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性，则作成组t检验 (2)若方差不齐，则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料，则用成组的Wilcoxon秩和检验 2.多组资料： 1)若大样本资料或服从正态分布，并且方差齐性，则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：LSD检验，Bonferroni检验等）进行两两比较。 2)如果小样本的偏态分布资料或方差不齐，则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：用成组的Wilcoxon秩和检验，但用Bonferroni方法校正P值等）进行两两比较。二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料： (1)小样本时：用二项分布进行确切概率法检验； (2)大样本时：用U检验。 2)多分类资料：用Pearson c2检验（又称拟合优度检验）。 2. 四格表资料 1)n>40并且所以理论数大于5，则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5，则用校正c2或用Fisher’s 确切概率法检验 3)n￡40或存在理论数<1，则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类，列变量为有序多分类变量，则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%，则用Pearson c2 (2)n￡40或理论数小于5的格子数>行列表中格子总数的25%，则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标，并且为无序多分类变量，行变量为有序多分类变量，作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量，可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量，

医学统计学 (2)

第一单元概述 1.研究设计应包括那几方面内容？答：包括：专业设计和统计设计。专业设计是针对专业问题进行的研究设计，如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计，如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷，都不能在统计分析阶段弥补和纠正。第二单元资料描述性统计 1.描述计量资料的集中趋势和离散趋势的指标有哪些？各指标的适用范围如何？答：集中趋势的指标有：算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置，尤其是正态分布资料；几何均数用来描述等比资料和对数正态分布资料的集中位置；中位数可用于任何资料。描述离散趋势有：极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布，但两个指标都不能反映变异程度；方差和标准差常用于资料为近似正态分布；变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2.变异系数和标准差有何区别和联系？答：区别：1.计算公式不同：CV=S/X*100%，标准差是方差的平方根。2.单位不同：变异系数无量纲，标准差量纲和原指标一致。3.用途不同。联系：都是适用于对称分布的资料，尤其是正态分布的资料，并且由公式所知，在均数一定时，CV与s呈正比。 3.频数表的用途有哪些？答：1.描述资料的频数分布的特征；2.便于发现一些特大或特小的可疑值；3.将频数表作为陈述资料的形式，便于进一步的统计分析和处理；4.当样本量足够大时，可以以频数表作为概率的估计值。 4.用相对数时应注意哪些问题？答：1.在实践工作中，应注意各相对数的含义，避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量，如资料的总数过少，直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下，从样本估计值推断总体相对数应该考虑抽样误差，因此需要对相对数指标进行参数估计和假设检验。第三单元医学统计推断基础 1.正态分布和标准正态分布的联系和区别？答：联系：均为连续型随机变量分布。区别：标准正态分布是一种特殊的正态分布（均数为0，标准差为1）。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4.简述二项的应用条件？答：条件为：1.每次试验只会发生两种互斥的可能结果之一，即两种互斥结果的概率之和为1；2.每次试验产生某种结果固定不变；3.重复试验是相互杜立的，即任何一次试验结果的出现不会影响其他试验结果的概率。 5.简述Q-Q图法的基本原理？答：u－变换可以把一个一般正态分布变量变换为标准正态分布变量，反之，u－变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率，再通过该积累频率求得相应的u值，如果该变量服从正态分布，则点（u，x）应近似在一条直线上（u－变换直线），否则（u，x）不会近似在一条直线上。Q－Q图法正是根据（u，x）是否近似在一条直线上来判断是否为正态分布。第四单元参数估计与参考值范围的估计 1.均数的标准差和标准误的区别和联系？答：区别和联系：标准差是描述个体值变异程度的指标，为方差的算术平方根，该变异不能

常用医学统计学方法的选择

常用医学统计学方法的选择 1. 多组率的比较用卡方检验（χ2检验，chi-square test) 直接用几个率的数值比较，与直接用原始数据录入比较，结果会有什么不同？卡方值会受样本量的影响，样本越多，卡方值越大。 2.多组计量资料比较采用方差分析(F检验) ，不能用t检验。当方差分析结果为P<0.05时，只能说明k组总体均数之间不完全相同。若想进一步了解哪两组的差别有统计学意义，需进行多个均数间的多重比较，即SNK-q检验(多个均数两两之间的全面比较)、LSD-t检验(适用于一对或几对在专业上有特殊意义的均数间差别的比较)和Dunnett检验(适用于k-1个实验组与一个对比组均数差别的多重比较)。 3.非正态分布多组数据之间比较选用非参数检验、单样本中位数检验（符号检验和Wilcoxon 检验）、双样本中位数检验（Mann-Whitney 检验）、方差分析（Kruskal-Wallis、Mood 中位数和Friedman 检验） 4.按血糖水平从低到高分成多组，进行多组之间死亡率的比较，由于死亡率同样受年龄、性别、病史、您身边的论文好秘书：您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表，扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响，所以需选取合适统计方法实现“调整年龄、性别等危险因素后，按血糖分组进行死亡率的比较（由血糖从低到高分成的4组）”。 ①年龄是定量变量（是数值），调整年龄的方法可在Logistic回归中运用，连续性变量年龄加入covariate中，当成协变量，就可以调整年龄，age-adjusted odds ratio就能得到了。 ②性别性别是二分类变量，不是定量变量，不可在LOGISTIC回归里比较。调整性别可在卡方检验中采取分层的方法比较。如果为多分类LOGISTIC回归，在选择用multinomianl LOGISTIC回归中，可选入年龄等进入covariate，观察年龄的配比情况。可把性别选入factors(自变量)。这样可以实现调整年龄、性别等危险因素。 5.回顾性研究(1)临床妊娠率和女性年龄的关系+(2)男性影响临床妊娠的精子参数比较：数据类型及变量的说明：y：计量拟采用的分析方法：卡方检验拟采用的分析软件：spss 原始数据附件及格式：word表能否用其他方法统计分析：可用卡方分割，调整检验水准（根据比较的次数N，校正后的检验水准为0.05/N）。 6.重复t检验：多个样本均数间的两两比较(又称多重比较)不宜用t检验，因为重复数次，t 检验将增加第一类错误的概率，使检验效率降低。此时宜用方差分析，并在此基础上用两两比较方法(如．SNK、LSD、Duncan法等)。对于同一对均数间的差异，用t检验无显著性，而两两比较可能有显著性，可见错误选用统计方法将推出错误结论。统计方法的选择: 分计量、计数、等级资料三

3-医学统计方法

《医学统计方法》试题医学统计方法概述（10题） 1．某次研究进行随机抽样，测量得到该市120名健康成年男子的血红蛋白数，则本次研究总体为： A.所有成年男子 B．该市所有成年男子 C．该市所有健康成年男子 D．120名该市成年男子 E．120名该市健康成年男子 2．医学统计的研究内容是 A．研究样本B．研究个体C．研究变量之间的相关关系D．研究总体E．研究资料或信息的收集.整理和分析 3．总体应该由 A．研究对象组成B．研究变量组成C．研究目的而定 D．同质个体组成E．个体组成 4. 在统计学中，参数的含义是 A．变量B．参与研究的数目C．研究样本的统计指标 D．总体的统计指标E．与统计研究有关的变量 5．调查某单位科研人员论文发表的情况，统计每人每年的论文发表数应属于 A．计数资料 B．计量资料 C．总体 D．个体 E．样本 6．统计学中的小概率事件，下面说法正确的是： A．反复多次观察，绝对不发生的事件 B．在一次观察中，可以认为不会发生的事件 C．发生概率小于0.1的事件 D．发生概率小于0.001的事件 E．发生概率小于0.1的事件 7、统计上所说的样本是指： A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 8、以舒张压≥12.7KPa为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属（）资料。 A、计算 B、计数 C、计量 D、等级 E、都对 9、红细胞数(1012L-1)是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 10、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体答案：1C 2E 3D 4D 5A 6B 7D 8B 9B 10D

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料； ④分布不明众数频数最多的观察值不拘分布形式，概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料； ④分布不明变异系数标准差与均数的相对比 ①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些？分别适用于什么分析目的？常用统计图的适用资料及实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散点图双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数定性资料统计描述常用的统计指标及其适用场合指标计算公式适用场合频率 n/N 估计总体中某一结局发生的概率频率分布 n 1/N ，n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率强度阳性人数/总观察人时数估计总体中单位时间内某一结局发生的概率比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定？参考值范围（%）正态分布法百分位数法双侧单侧双侧单侧下限上限下限上限 90 S X 64.1± S X 1.28－ S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1－ S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33－ S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1．标准差与标准误的区别与联系？

医学统计学各种资料比较_选择方法小结

医学统计学各种资料比较选择方法小结一、两组或多组计量资料的比较 1.两组资料： 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性，则作成组t检验 (2)若方差不齐，则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料，则用成组的Wilcoxon秩和检验 2.多组资料： 1)若大样本资料或服从正态分布，并且方差齐性，则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：LSD检验，Bonferroni检验等）进行两两比较。 2)如果小样本的偏态分布资料或方差不齐，则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：用成组的Wilcoxon秩和检验，但用Bonferroni方法校正P值等）进行两两比较。二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料： (1)小样本时：用二项分布进行确切概率法检验； (2)大样本时：用U检验。

2)多分类资料：用Pearson c2检验（又称拟合优度检验）。 2. 四格表资料 1)n>40并且所以理论数大于5，则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5，则用校正c2或用Fisher’s 确切概率法检验 3)n￡40或存在理论数<1，则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类，列变量为有序多分类变量，则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%，则用Pearson c2 (2)n￡40或理论数小于5的格子数>行列表中格子总数的25%，则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标，并且为无序多分类变量，行变量为有序多分类变量，作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量，可以作Spearman相关分析

医学统计工作基本步骤(详细)

*医学统计工作的基本步骤 1设计主要指统计设计，是影响研究能否成功的最关键环节，是提高观察或实验质量的重要保证。内容包括对资料搜集，整顿和分析全过程的设想与安排。实验设计的三大原则：随机化，重复，对照。 2搜集资料：目的指应采取措施使能取得准确可靠的原始数据。来源：统计报表，工作记录，专题调查或实验研究，统计年鉴和统计数据专辑。要求：随机性和样本含量足够大 3整顿资料：将原始数据净化，系统化和条理化，为下一步计算和分析打好基础过程。 4分析资料：在表达数据特征的基础上，阐明事物的内在联系和规律性，包括两方面：统计描叙和统计推断 17均数的可信区间与参考值范围的区别？均数的可信区间与参考值范围的区别主要体现在含义，计算公式和用途三个方面的不同。（1）意义：均数的可信区间是按预先给定的概率，确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数，要么不包含。但可以说：该区间可多大（如当a=0.05时为95%）的可能包含了总体均数。而参考值范围是指‘正常人’的解剖，生理生化某项指标的波动范围。均数的可信区间计算公式（1）σ未知：X±指均数可信区间的用途：估计总体均数，参考值范围是指判断观察对象的某项指标是否正常。 7.假设检验与区间估计的关系：置信区间具有假设检验的主要功能；置信区间在回答差别有无统计学意义的同时，还可以提示差别是否具有实际意义；假设检验可以报告确切的P值，还可以对检验的功效做出估计。 1.标准差与标准误的区别：标准差是衡量观察值的离散趋势，描述正态分布资料的频数。标准误是样本均数的变异程度，表示抽样误差的大小，用于总体均数区间估计。两者联系：两者都是变异指标。在样本含量一定时，S越大标准误也越大，即在抽取相同例数的前提下，标准差越大，抽到的样本均数的抽样误差也越大。 2.P值和α：P值时从样本求得H0条件下随机抽样得到目前的统计量以及更极端统计量的概率，反映样本信息是否支持H0，也反映做出拒绝或不拒绝H0决定的理由充分程度。α时人为确定的小概率，容许犯第二类错误的概率，用作门槛，称检验水平。在假设检验中，通常时将P与α对比来得到结论，。 3.标准正态分布与t分布有何不同：t分布为抽样分布，标准正态分布为理论分布。t分布比标准正态分布的峰值低，且尾部瞧得更高。随着自由度的增大，t分布逐渐趋于标准正态分布。当自由度趋于无穷大时，t分布趋近于标准正态分布。 4.假设检验中，当P<0.05时，拒绝H0的理论依据。P值是指从H0规定的总体随机抽得等于及大于现有样本获得的检验统计量值的概率。当P<0.05时，说明在H0成立的条件下，得到现有检验结果的概率小于通常确定的小怪绿时间标准的0.05。因小概率事件在一次试验中几乎不可能发生，现的确发生了，说明现在样本信息不支持H0，所以怀疑原假设H0不成立，拒绝H0。 5.t检验应用的条件：对单样本t检验要求资料服从正态分布；配对t检验要求差值服从正态分布；对两样本t检验则要求数据均服从正太分布，且两样本对应的两总体方差相等。 6.I型错误和Ⅱ型错误得区别与联系：I型错误是指拒绝了实际成立的H0所犯的弃真的错误，其概率大小用α表示，Ⅱ型错误是指接受了实际上不成立的H0所犯的取伪错误，其概率用β表示。当样本含量N确定时，α越小β越大，反之，α越大β越小。了解这两类错误的实际意义在于，若在应用中要重点减少α，则取α=0.05；若要在应用中要重点减少β，则取α=0.10或-。20甚至更高。 7.假设检验和区间估计有何联系：假设检验用于推断质的不同即判断两个或多个总体参数是否不等，而可信区间用于说明量的大小即推断总体参数的范围。两者有联系也有区别，假设检验与区间估计的联系在于可信区间也可以回答假设检验的问题，若算得的可信区间若包含了H0，则按α水准，不拒绝H0，若不包含H0，则按照α水准，拒绝H0，接受H1。也就是说在判断两个总体参数不等时，假设检验和可信区间时完全等价的。 1.方差分析的基本思想和应用条件是什么。方差分析的基本思想时根据试验设计的类型，将全部测量值总的离均差平方和及其自由度分解为两个或多个部分，除随机误差作用外，每个部分的编译可由某个因素的作用加以解释。通过比较不同变异来源的均方，借助F分布做出统计推断，从而推论各种研究因素对试验结果有无影响。应用条件：各样本是互相独立的随机样本，均服从正态分布；相互比较的各样本的具有方差齐性。

医学统计学案例分析

医学统计学案例分析评述医学期刊论著：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄45.6 岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论著未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确

医学统计学案例分析

医学统计学案例分析案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞de疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检2验，得连续性校正χP,，差异无统计学意义，故认为中西药治=，疗急性心肌梗塞de疗效基本相同。表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12 2 14 西药 6 7 13 合计 18 9 27 【问题1-5】 (1) 这是什么资料, (2) 该资料属于何种设计方案, (3) 该医师统计方法是否正确,为什么, 【【分析】 (1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。 (2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。 2(3) 患者总例数n=27,40，该医师用χ检验是不正确de。当n,40或T,1时，2不宜计算χ值，需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析,卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎de疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验(有效=1，无效=0)进行假设检验，结

检验(有效=1，无效=0)进行进行果t,，P,，差异有统计学意义假设检验，结果t,，P,，差异有统计学意义，故认为中西药治疗胃炎de疗效有差别，中药疗效高于西药。【问题1-1】【 (1)这是什么资料,(2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料，即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布de计量资料，不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别，应用四格表资料de 检验(chi-square test)。【例1-2】 2003年某医院用中药和西药治疗非典病人40人，结果见表1-1。表1-1 中药和西药治疗非典病人有效率de比较药物有效无效合计有效率(,) 中药 28 1414 西药 2 10 12 合计 16 24 40 某医师认为这是完全随机设计de2组二分类资料，可用四格表de检验。其步骤如下: 1(建立检验假设，确定检验水准 [ H:两药de有效率相等，即0 π,π12

医学统计知识点整理

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。变异：同质的基础上个体间的差异。 “同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的二、总体与样本 1、总体：是根据研究目的所确定的，同质观察对象（个体）所构成的全体。 2、样本：是从总体中随机抽取的部分观察单位变量值的集合。三、参数与统计量总体参数：根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量：根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的，抽样研究的目的就是用样本统计量来推断总体参数，包括区间估计和假设检验四、误差：实测值与真值之差★ 1.随机误差：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差：是一类恒定不变或遵循一定变化规律的误差，其产生原因往往是可知的或可能掌握的。 3.非系统误差：过失误差，可以避免或清除。五、概率是用来描述事件发生可能性大小的一个量值，常用P表示。概率取值0~1。统计上一般将P≤0.05或P≤0.01的事件称为小概率事件，表示其发生的概率很小，可以认为在一次抽样中不会发生。第二节统计资料的类型★ 变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。表现为数值

医学统计学各种资料比较选择方法小结

一、两组或多组计量资料的比较 1.两组资料： 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性，则作成组t检验 (2)若方差不齐，则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料，则用成组的Wilcoxon秩和检验 2.多组资料： 1)若大样本资料或服从正态分布，并且方差齐性，则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：LSD检验，Bonferroni检验等）进行两两比较。 2)如果小样本的偏态分布资料或方差不齐，则作Kruskal Wallis的统计检验。如果Krus kal Wallis的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：用成组的Wilcoxon秩和检验，但用Bonferroni方法校正P值等）进行两两比较。二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料： (1)小样本时：用二项分布进行确切概率法检验； (2)大样本时：用U检验。 2)多分类资料：用Pearson c2检验（又称拟合优度检验）。 2. 四格表资料 1)n>40并且所以理论数大于5，则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5，则用校正c2或用Fisher’s 确切概率法检验 3)n￡40或存在理论数<1，则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则行评分的CMH c 2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类，列变量为有序多分类变量，则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%，则用Pearson c2

(完整)常用医学统计学方法的选择

(完整)常用医学统计学方法的选择编辑整理：尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（(完整)常用医学统计学方法的选择）的内容能够给您的工作和学习带来便利。同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为(完整)常用医学统计学方法的选择的全部内容。

常用医学统计学方法的选择 1。多组率的比较用卡方检验(χ2检验,chi—square test) 直接用几个率的数值比较，与直接用原始数据录入比较,结果会有什么不同？卡方值会受样本量的影响，样本越多，卡方值越大. 2。多组计量资料比较采用方差分析（F检验），不能用t检验。当方差分析结果为P<0。05时,只能说明k组总体均数之间不完全相同。若想进一步了解哪两组的差别有统计学意义，需进行多个均数间的多重比较，即SNK—q检验（多个均数两两之间的全面比较）、LSD-t检验（适用于一对或几对在专业上有特殊意义的均数间差别的比较）和Dunnett检验 (适用于k-1个实验组与一个对比组均数差别的多重比较）。 3。非正态分布多组数据之间比较选用非参数检验、单样本中位数检验（符号检验和 Wilcoxon 检验）、双样本中位数检验(Mann—Whitney 检验）、方差分析（Kruskal—Wallis、Mood 中位数和 Friedman 检验） 4。按血糖水平从低到高分成多组，进行多组之间死亡率的比较，由于死亡率同样受年龄、性别、病史、您身边的论文好秘书：您的原始资料与构思,我按您的意思整理成优秀论文论著，并安排出版发表，扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响,所以需选取合适统计方法实现“调整年龄、性别等危险因素后,按血糖分组进行死亡率的比较（由血糖从低到高分成的4组）”。 ①年龄是定量变量（是数值），调整年龄的方法可在Logistic回归中运用，连续性变量年龄加入covariate中，当成协变量，就可以调整年龄，age—adjusted odds ratio就能得到了。②性别性别是二分类变量，不是定量变量，不可在LOGISTIC回归里比较。调整性别可在卡方检验中采取分层的方法比较。如果为多分类LOGISTIC回归,在选择用multinomianl LOGISTIC回归中，可选入年龄等进入covariate,观察年龄的配比情况。可把性别选入factors（自变量）。这样可以实现调整年龄、性别等危险因素。 5.回顾性研究（1)临床妊娠率和女性年龄的关系+（2)男性影响临床妊娠的精子参数比较：数据类型及变量的说明：y：计量拟采用的分析方法：卡方检验拟采用的分析软件：spss 原始数据附件及格式：word表能否用其他方法统计分析：可用卡方分割，调整检验水准(根据比较的次数N，校正后的检验水准为0.05/N)。 6。重复t检验:多个样本均数间的两两比较（又称多重比较)不宜用t检验，因为重复数次， t检验将增加第一类错误的概率，使检验效率降低。此时宜用方差分析,并在此基础上用两两比较方法（如．SNK、LSD、Duncan法等). 对于同一对均数间的差异,用t检验无显著性,而两两比较可能有显著性，可见错误选用统计方法将推出错误结论。统计方法的选择: 分计量、计数、等级资料三