SPSS数据分析的医学统计方法选择
- 格式:doc
- 大小:130.00 KB
- 文档页数:18
医学统计学之卡方检验SPSS操作卡方检验(Chi-Square Test)是一种常用的统计方法,用于比较两个或多个分类变量的分布是否存在差异。
该方法主要用于处理分类数据,例如比较男女性别和吸烟与否对癌症发生的关系。
在SPSS(Statistical Package for the Social Sciences)软件中,进行卡方检验的操作主要分为数据准备、假设设定和计算步骤。
第一步:数据准备首先,需要在SPSS中导入数据。
假设我们需要在一个样本中比较男女性别和吸烟与否的关系,我们可以将性别和吸烟状况作为两个分类变量,分别用“Male”和“Female”表示性别,“Smoker”和“Non-smoker”表示吸烟状况。
将这些数据输入到SPSS中的一个数据表中。
第二步:假设设定接下来,需要设置假设。
在卡方检验中,我们通常有一个原假设和一个备择假设:-原假设(H0):两个或多个分类变量之间没有显著差异。
-备择假设(H1):两个或多个分类变量之间存在显著差异。
在本例中,原假设可以是“性别和吸烟状况之间没有显著差异”,备择假设可以是“性别和吸烟状况之间存在显著差异”。
第三步:计算步骤进行卡方检验的计算步骤如下:1.打开SPSS软件并导入数据。
2. 选择“分析(Analyse)”菜单,然后选择“非参数检验(Nonparametric Tests)”子菜单,最后选择“卡方(Chi-Square)”选项。
3.在弹出的对话框中选择两个分类变量(性别和吸烟状况),并将它们添加到变量列表中。
4.点击“确定(OK)”按钮,开始进行卡方检验的计算。
5.SPSS将计算卡方统计量的值和相关的P值。
如果P值小于指定的显著性水平(通常为0.05),则可以拒绝原假设,接受备择假设。
这样,就完成了卡方检验的SPSS操作。
需要注意的是,卡方检验是一种只能说明变量之间是否存在关系的方法,不能用于确定因果关系。
此外,在进行卡方检验之前,需要确保样本符合一些假设,例如每个单元格的期望频数应该大于5、如果不满足这些假设,可以考虑使用其他适用的统计方法。
spss试题及答案医学1. 单选题:在SPSS中,进行描述性统计分析的命令是?- A. DESCRIPTIVES- B. FREQUENCIES- C. CROSSTABS- D. MEANS答案:A2. 多选题:以下哪些选项是SPSS中用于数据输入的方法?- A. 数据编辑器- B. 导入Excel文件- C. 导入文本文件- D. 从数据库中导入答案:A, B, C, D3. 判断题:在SPSS中,可以通过“变换”菜单下的“计算变量”功能来创建新变量。
- 正确- 错误答案:正确4. 填空题:在SPSS中,使用________命令可以进行相关性分析。
答案:CORRELATIONS5. 简答题:请简述在SPSS中进行t检验的步骤。
答案:首先,需要打开数据文件或创建新的数据文件。
然后,选择“分析”菜单下的“比较均值”选项。
接着,选择“独立样本T检验”或“配对样本T检验”,根据需要选择相应的变量和组别。
最后,点击“确定”执行分析。
6. 操作题:打开SPSS软件,创建一个新的数据文件,输入以下数据:| 编号 | 年龄 | 性别 | 身高(cm) | 体重(kg) |||||-|-|| 1 | 25 | 男 | 175 | 65 || 2 | 30 | 女 | 165 | 55 || 3 | 28 | 男 | 180 | 70 || 4 | 22 | 女 | 170 | 60 |答案:操作步骤如下:- 打开SPSS软件。
- 点击“文件”菜单,选择“新建”。
- 选择“数据”选项卡,点击“数据视图”。
- 在数据视图中,按照表格格式输入上述数据。
7. 分析题:使用SPSS进行卡方检验,以判断性别和身高是否有关联。
答案:首先,需要将性别和身高变量编码为数值型数据。
然后,选择“分析”菜单下的“描述统计”选项,选择“交叉表”。
在“交叉表”对话框中,将性别变量放入“行”框中,将身高变量放入“列”框中。
点击“统计”按钮,勾选“卡方”选项,然后点击“继续”和“确定”执行分析。
如何选择合适的医学统计分析方法我是一位现代互联网思维的老师,今天我想和大家分享一些关于如何选择合适的医学统计分析方法的观点。
在医学研究中,统计分析是必不可少的工具,它可以帮助我们从大量的数据中提取有用的信息,从而得出科学的结论。
然而,由于医学研究的复杂性和多样性,选择合适的统计分析方法并不是一件容易的事情。
首先,我们需要明确研究的目的和问题。
不同的研究目的和问题需要不同的统计分析方法。
例如,如果我们想要比较两组病人的治疗效果,我们可以使用 t 检验或方差分析。
如果我们想要探索多个变量之间的关系,我们可以使用相关分析或回归分析。
因此,在选择统计分析方法之前,我们需要明确我们的研究目的和问题,并确定我们想要回答的具体研究问题。
其次,我们需要考虑数据的类型和分布。
医学研究中常见的数据类型包括连续型数据、分类型数据和顺序型数据。
对于连续型数据,我们可以使用 t 检验、方差分析或回归分析等方法。
对于分类型数据,我们可以使用卡方检验或 Fisher 精确检验。
对于顺序型数据,我们可以使用秩和检验。
此外,我们还需要考虑数据的分布情况。
如果数据符合正态分布,我们可以使用参数统计方法,如 t 检验和方差分析。
如果数据不符合正态分布,我们可以使用非参数统计方法,如秩和检验和 Mann-Whitney U 检验。
另外,我们还需要考虑样本量的大小。
样本量的大小对统计分析的结果有重要影响。
如果样本量较小,我们可能无法检测到真实的效应。
如果样本量较大,我们可能会发现一些微小的差异,但这些差异可能没有实际意义。
因此,在选择统计分析方法时,我们需要根据样本量的大小来确定合适的方法。
一般来说,当样本量较小时,我们可以使用非参数统计方法,因为它们对样本量的要求较低。
当样本量较大时,我们可以使用参数统计方法,因为它们具有更高的统计功效。
此外,我们还需要考虑研究设计的特点。
医学研究中常见的研究设计包括前瞻性研究、回顾性研究和实验研究。
SPSS数据分析的医学统计方法选择医学统计方法是指在医学研究中使用统计学方法对数据进行分析和解释的方法。
SPSS作为一种统计分析软件,可以用于医学研究中的数据处理和分析。
在选择SPSS数据分析的医学统计方法时,需要考虑研究目的、变量类型、样本大小等因素。
以下是一些常用的医学统计方法,可以在SPSS中使用:描述性统计分析:描述性统计分析是对数据进行基本的统计描述,包括算术平均数、中位数、众数、标准差、方差等。
可以使用SPSS中的描述统计功能进行分析。
t检验:t检验用于比较两组样本之间的差异,例如比较两种不同治疗方法的效果差异。
SPSS中的独立样本t检验和配对样本t检验功能可以使用该方法。
方差分析(ANOVA):方差分析用于比较三个或以上样本之间的差异,例如比较不同年龄组之间的生理指标差异。
SPSS中的单因素和多因素方差分析功能可以使用该方法。
相关分析:相关分析用于分析两个或多个变量之间的相关关系,例如分析年龄和血压之间的关系。
SPSS中的相关分析功能可以使用该方法。
回归分析:回归分析用于探究一个或多个自变量对一个因变量的影响程度,例如探究血糖水平与体重、血压、年龄等变量之间的关系。
SPSS中的线性回归和多元回归功能可以使用该方法。
生存分析:生存分析用于研究时间到事件(如患病、死亡)之间的关系,例如研究其中一种治疗方法对生存时间的影响。
SPSS中的生存分析功能可以使用该方法。
聚类分析:聚类分析用于对样本进行分类分组,例如将患者根据疾病病情进行分组。
SPSS中的聚类分析功能可以使用该方法。
主成分分析:主成分分析用于降维和提取数据中的主要方差成分,例如将多个生理指标转化为一个综合指标。
SPSS中的主成分分析功能可以使用该方法。
逻辑回归分析:逻辑回归分析用于探究自变量与因变量之间的关系,并进行分类预测,例如预测其中一种疾病的风险因素。
SPSS中的逻辑回归功能可以使用该方法。
以上仅是医学研究中常用的一些统计方法,在选择时应根据研究需求和实际情况进行选择。
SPSS数据分析的医学统计方法选择目录数据分析的统计方法选择小结........................................................................错误!未定义书签。
目录 (1)●资料1 (2)完全随机分组设计的资料 (2)配对设计或随机区组设计 (3)变量之间的关联性分析 (4)●资料2 (5)1.连续性资料 (5)1.1两组独立样本比较 (5)1.2两组配对样本的比较 (5)1.3多组完全随机样本比较 (6)1.4多组随机区组样本比较 (6)2.分类资料 (6)2.1四格表资料 (6)2.2 2×C表或R×2表资料的统计分析 (7)2.3 R×C表资料的统计分析 (7)2.4 配对分类资料的统计分析 (8)●资料3 (8)一、两个变量之间的关联性分析 (8)二、回归分析 (9)●资料4 (10)一.统计方法抉择的条件 (10)1.分析目的 (10)2.资料类型 (10)3.设计方法 (11)4.分布特征及数理统计条件 (12)二.数据资料的描述 (13)1.数值变量资料的描述 (13)2.分类变量资料的描述 (13)三.数据资料的比较 (14)1.假设检验的基本步骤 (14)2.假设检验结论的两类错误 (15)3.假设检验的注意事项 (15)4.常用假设检验方法 (16)四.变量间的相关分析 (17)1.数值变量(计量资料)的关系分析 (18)2.无序分类变量(计数资料)的相关分析 (18)3.有序分类变量(等级资料)等级相关 (18)●资料1完全随机分组设计的资料一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。
医学统计学与spss软件实现方法答案
医学统计学是运用统计学原理和方法来分析和解释医学研究数据的学科。
而SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,可以进行各种统计分析和数据管理。
下面是使用SPSS软件实现医学统计学方法的一般步骤:
1. 数据准备与输入:将医学研究数据导入SPSS软件中,确保数据格式正确且完整。
2. 数据清洗与处理:对数据进行清洗,包括处理缺失值、异常值、去除重复数据等。
3. 描述性统计:使用SPSS软件计算各种描述性统计指标,如均值、中位数、标准差等。
4. 推断性统计:根据研究目标选择相应的统计方法,如t检验、方差分析、回归分析、生存分析等,并进行数据分析和解释。
5. 结果展示与报告:使用SPSS软件生成统计分析结果的图表或表格,并进行结果解读和撰写研究报告。
需要注意的是,在进行医学统计学分析时,应确保数据的质量和准确性,并选择适当的分析方法,严格按照统计原理进行分析和解释。
此外,SPSS软件使用较为广泛,相关的操作手册、教程和学习资源较多,可以通过网上搜索或参考相关书籍进一步学习和了解SPSS软件的具体使用方法和技巧。
常用医学统计学方法的选择1. 多组率的比较用卡方检验(χ2检验,chi-square test)直接用几个率的数值比较,与直接用原始数据录入比较,结果会有什么不同?卡方值会受样本量的影响,样本越多,卡方值越大。
2.多组计量资料比较采用方差分析(F检验) ,不能用t检验。
当方差分析结果为P<0.05时,只能说明k组总体均数之间不完全相同。
若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的多重比较,即SNK-q检验(多个均数两两之间的全面比较)、LSD-t检验(适用于一对或几对在专业上有特殊意义的均数间差别的比较)和Dunnett检验(适用于k-1个实验组与一个对比组均数差别的多重比较)。
3.非正态分布多组数据之间比较选用非参数检验、单样本中位数检验(符号检验和Wilcoxon 检验)、双样本中位数检验(Mann-Whitney 检验)、方差分析(Kruskal-Wallis、Mood 中位数和Friedman 检验)4.按血糖水平从低到高分成多组,进行多组之间死亡率的比较,由于死亡率同样受年龄、性别、病史、您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响,所以需选取合适统计方法实现“调整年龄、性别等危险因素后,按血糖分组进行死亡率的比较(由血糖从低到高分成的4组)”。
①年龄是定量变量(是数值),调整年龄的方法可在Logistic回归中运用,连续性变量年龄加入covariate中,当成协变量,就可以调整年龄,age-adjusted odds ratio就能得到了。
②性别性别是二分类变量,不是定量变量,不可在LOGISTIC回归里比较。
调整性别可在卡方检验中采取分层的方法比较。
如果为多分类LOGISTIC回归,在选择用multinomianl LOGISTIC回归中,可选入年龄等进入covariate,观察年龄的配比情况。
医学论文数据统计分析之多因素logistic回归分析背景:近期经常收到一些关于影响因素对相关疾病危害程度分析的咨询,其实可以通过SPSS进行多因素logistic回归分析实现。
多因素logistic回归分析是多个二元logistic回归模型描述各类与参考分类相比的各因素的综合分析。
工具:SPSS 19.0实例:代谢综合征中相关因素,包括: BMI、血压、血糖和血脂(甘油三酯)对产生结石危害程度分析。
BMI分为偏高和正常;血压分为偏高和正常;血糖分为高血糖和正常;血脂分为偏高和正常。
此外,校正因素包括年龄和性别,其中年龄分为小于36岁,36-50岁和大于50岁。
结石包括:草酸钙、尿酸和碳酸磷灰石三种类型。
说明: 本实例纯属为操作说明使用,结论不具有科学依据。
1、将整理好的数据导入SPSS软件工作表中,具体排列方式见下表。
2、选择分析-回归-多项logistic回归,进入“多项logistic回归”主对话框,其中因变量选择结石类型;BMI、血压、血糖和甘油三酯作为因子。
具体见下图。
3、点击“参考类别”进入话框,本例参考类别选择“最后类别”,类别顺序“升序”,点击继续。
具体见下图。
4、打开“模型”对话框,指定“主效应”后点击继续。
具体见下图。
5、打开“统计”对话框,按照下图勾选相应的选项后点击继续。
6、打开“保存”对话框,按照下图勾选相应的选项后点击继续。
7、点击“确定”按钮,软件开始建模。
8、结果解读,主要研读的是“参数估计表”,详见下图。
(1) 第二列B值,反应的各个影响因素不同水平在模型中的拟合系数,正负号表示其与结石类型是正还是反相关。
(2) 第六列是瓦尔德检验显著性值,若<0.05,说明自变量因素对因变量不同分类水平的变化有显著影响。
本例中血糖就是显著的影响因素。
(3) Exp(B)值即论文中常见的OR值,本例中空腹血糖被认为是草酸钙结石相关的重要危险因素。
9、将年龄和性别加到自变量中,重复前面所述的操作,得到校正结果,见下表。
医学统计学SPSS生存分析实例生存分析(Survival Analysis)是一种统计方法,用于研究时间事件、生存时间和失败时间。
它可以用于预测生存时间,比如病人生存时间的分析,或者预测其中一种设备故障的时间分析等。
下面是一个医学统计学SPSS生存分析的实例,我们使用一份研究糖尿病患者的数据集进行分析。
该数据集包含了500名糖尿病患者的相关信息,包括患病时年龄、性别、BMI指数、高血压、吸烟等等。
我们的目标是分析不同因素对患者生存时间的影响。
首先,我们导入数据集并检查数据的完整性和准确性。
然后,我们进行数据预处理,包括对缺失数据的处理和离群值的处理。
接下来,我们使用Kaplan-Meier方法生成生存曲线。
生存曲线显示了患者在不同时间点的生存概率。
通过比较生存曲线,我们可以确定哪些因素对患者的生存时间有显著影响。
我们使用SPSS的Survival Analysis模块进行生存分析。
首先,我们选择一个目标变量,比如患者的生存时间。
然后,我们选择要分析的预测变量,比如年龄、性别、BMI指数、高血压和吸烟。
我们还可以选择分组变量,比如患者的病情程度,以便进一步比较。
接下来,我们进行分析。
SPSS将为每个预测变量生成相应的生存曲线和生存函数。
我们可以通过观察曲线的交叉点、陡峭程度和95%置信区间等指标来确定哪些因素对生存时间有显著影响。
在我们的实例中,我们发现年龄、BMI指数和高血压对患者的生存时间有显著影响。
年龄越大,BMI指数越高,高血压越严重的患者生存时间越短。
性别和吸烟并没有显著影响。
最后,我们可以使用Cox回归模型进行更进一步的生存分析。
Cox回归模型可以用于计算患者的风险比(Risk Ratio),以评估各个变量对生存时间的贡献度。
我们可以根据回归系数和风险比来评估不同因素的相对重要性。
总结起来,医学统计学SPSS生存分析可以帮助我们理解不同因素对患者生存时间的影响。
通过研究生存曲线,我们可以评估治疗方法的有效性,优化诊断和治疗流程,并提供更好的病人护理。
SPSS在医学科研中的运用引言SPSS〔Statistical Package for the Social Sciences〕是一款功能强大的统计分析软件,广泛应用于各个领域的研究中,包括医学科研。
SPSS提供了一系列的统计分析和数据处理工具,可以帮助研究者对医学数据进行分析、可视化和解释。
本文将探讨SPSS在医学科研中的运用,介绍其常用的功能和方法。
数据导入与清洗在医学科研中,数据收集是一个重要且常见的步骤。
SPSS可以通过导入数据文件的方式将已收集的数据导入到软件中进行后续的分析。
SPSS支持导入多种数据格式,包括Excel、CSV等,使研究者能够轻松地将数据转化为SPSS可识别的格式。
在导入数据后,常常需要对数据进行清洗。
SPSS提供了一系列的数据清洗工具,可以帮助研究者删除异常值、处理缺失数据等。
通过这些工具,研究者可以保证后续的分析结果的准确性和可靠性。
描述统计分析描述统计分析是医学科研中常用的分析方法之一。
它通过对数据的概括和分析,揭示出数据的特征和规律。
SPSS提供了丰富的描述统计分析工具,包括均值、标准差、频数、百分比等。
研究者可以使用这些工具对数据进行描述和汇总,进一步了解数据的特点。
统计检验统计检验是医学科研中重要的分析方法之一。
它通过对样本数据进行假设检验,判断样本之间、样本和总体之间是否存在显著性差异。
SPSS提供了多种统计检验方法,包括t 检验、方差分析、相关分析等。
研究者可以根据实际需求选择适宜的统计检验方法,并使用SPSS进行分析。
回归分析回归分析是医学科研中常用的预测和建模方法之一。
它用于研究因变量与自变量之间的关系,并建立预测模型。
SPSS提供了多种回归分析工具,包括线性回归、逻辑回归、多项式回归等。
研究者可以使用这些工具进行回归分析,并得到相关的模型结果和参数估计。
生存分析生存分析是医学科研中常用的分析方法之一。
它用于研究事件发生的时间和概率,并分析其与其他因素之间的关系。
Spss操作要点详细版第一章导论——SPSS介绍学习目标:初步认识SPSS软件的内容一、SPSS界面说明SPSS for Windows是SPSS/PC的Windows版本,具有Windows软件的共同特点,其界面十分友好,打开SPSS程序就会出现图1-2界面。
标题栏菜单栏工具栏数据栏标签图1-2 SPSS 11.5 for Windows 界面该界面为SPSS 的数据编辑窗口,其组成部分及主要功能如下:1。
标题栏:功能与其它Windows软件一致。
2.菜单栏:由10个菜单项组成,每个菜单包括一系列功能。
各菜单的主要功能如下。
2.1 File:文件操作菜单。
单击Fil e,有图1-3下拉菜单,主要功能包括:·New:新建数据编辑窗口、语句窗口、结果输出窗口等;·Open和Open Database:打开数据编辑窗口、语句窗口、结果输出窗口等;·Read Text Data:读入文本文件;·Save和Save As:保存文件;·Display Data Info:显示数据的基本信息;·Prin t和Print Preview:将数据管理窗口中的数据以表格的形式打印出来。
图1-3 File菜单项的下拉菜单图1-4 Edit菜单项的下拉菜单2.2 Edit:文件编辑菜单。
主要用于数据编辑,如图1-4,主要功能包括:·UndoRedo或modify cell values:撤消或恢复刚修改过的观测值;·cut,copy,paste:剪切、拷贝、粘贴指定的数据;·paste variables:粘贴指定的变量;·clear:清除所选的观测值或变量;·find:查找数据。
2.3 View:视图编辑菜单。
用于视图编辑,进行窗口外观控制。
包含显示/隐藏切换、表格特有的隐藏编辑/显示功能及字体设置等功能。
SPSS数据分析得医学统计方法选择目录数据分析得统计方法选择小结........................................................................错误!未定义书签。
目录 (1)●资料1 (2)完全随机分组设计得资料 (2)配对设计或随机区组设计 (3)变量之间得关联性分析 (4)●资料2 (5)1、连续性资料 (5)1、1两组独立样本比较 (5)1、2两组配对样本得比较 (5)1、3多组完全随机样本比较 (5)1、4多组随机区组样本比较 (6)2.分类资料 (6)2、1四格表资料 (6)2、2 2×C表或R×2表资料得统计分析 (6)2、3 R×C表资料得统计分析 (7)2、4 配对分类资料得统计分析 (7)●资料3 (8)一、两个变量之间得关联性分析 (8)二、回归分析 (8)●资料4 (9)一.统计方法抉择得条件 (9)1.分析目得 (9)2.资料类型 (10)3.设计方法 (11)4.分布特征及数理统计条件 (11)二.数据资料得描述 (12)1.数值变量资料得描述 (12)2.分类变量资料得描述 (13)三.数据资料得比较 (13)1.假设检验得基本步骤 (14)2.假设检验结论得两类错误 (14)3.假设检验得注意事项 (15)4.常用假设检验方法 (15)四.变量间得相关分析 (17)1.数值变量(计量资料)得关系分析 (17)2.无序分类变量(计数资料)得相关分析 (17)3.有序分类变量(等级资料) 等级相关 (18)●资料1完全随机分组设计得资料一、两组或多组计量资料得比较1.两组资料:1)大样本资料或服从正态分布得小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组得Wilcoxon秩与检验2)小样本偏态分布资料,则用成组得Wilcoxon秩与检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机得方差分析。
如果方差分析得统计检验为有统计学意义,则进一步作统计分析:选择合适得方法(如:LSD 检验,Bonferroni检验等)进行两两比较。
2)如果小样本得偏态分布资料或方差不齐,则作Kruskal Wallis得统计检验。
如果Kruskal Wallis得统计检验为有统计学意义,则进一步作统计分析:选择合适得方法(如:用成组得Wilcoxon秩与检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料得统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson χ2检验(又称拟合优度检验)。
2. 四格表资料1)n>40并且所以理论数大于5,则用Pearson χ22)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正χ2或用Fisher’s 确切概率法检验3)n≤40或存在理论数<1,则用Fisher’s 检验3. 2×C表资料得统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分得CMH χ2或成组得Wilcoxon秩与检验2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势χ2检验3)行变量与列变量均为无序分类变量(1)n>40并且理论数小于5得格子数<行列表中格子总数得25%,则用Pearson χ2(2)n≤40或理论数小于5得格子数>行列表中格子总数得25%,则用Fisher’s 确切概率法检验4. R×C表资料得统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH χ2或Kruskal Wallis得秩与检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis得CMH χ23)列变量与行变量均为有序多分类变量,可以作Spearman相关分析4)列变量与行变量均为无序多分类变量,(1)n>40并且理论数小于5得格子数<行列表中格子总数得25%,则用Pearson χ2(2)n≤40或理论数小于5得格子数>行列表中格子总数得25%,则用Fisher’s 确切概率法检验三、Poisson分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。
2)观察值较大时:用正态近似得U检验。
2.两个样本比较:用正态近似得U检验。
配对设计或随机区组设计四、两组或多组计量资料得比较1.两组资料:1)大样本资料或配对差值服从正态分布得小样本资料,作配对t检验2)小样本并且差值呈偏态分布资料,则用Wilcoxon得符号配对秩检验2.多组资料:1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组得方差分析。
如果方差分析得统计检验为有统计学意义,则进一步作统计分析:选择合适得方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman得统计检验。
如果Fredman得统计检验为有统计学意义,则进一步作统计分析:选择合适得方法(如:用Wilcoxon得符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料得统计分析1.四格表资料1)b+c>40,则用McNemar配对χ2检验或配对边际χ2检验2)b+c≤40,则用二项分布确切概率法检验2.C×C表资料:1)配对比较:用McNemar配对χ2检验或配对边际χ2检验2)一致性问题(Agreement):用Kap检验变量之间得关联性分析六、两个变量之间得关联性分析1.两个变量均为连续型变量1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析七、回归分析1.直线回归:如果回归分析中得残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量得线性回归,称为简单回归),否则应作适当得变换,使其满足上述条件。
2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,X p)可以为连续型变量、有序分类变量或二分类变量。
如果回归分析中得残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要得影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能得混杂因素变量,以校正这些混杂因素对结果得混杂作用3.二分类得Logistic回归:应变量为二分类变量,自变量(X1,X2,…,X p)可以为连续型变量、有序分类变量或二分类变量。
1)非配对得情况:用非条件Logistic回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要得影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能得混杂因素变量,以校正这些混杂因素对结果得混杂作用2)配对得情况:用条件Logistic回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要得影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能得混杂因素变量,以校正这些混杂因素对结果得混杂作用4.有序多分类有序得Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,X p)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要得影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能得混杂因素变量,以校正这些混杂因素对结果得混杂作用5.无序多分类有序得Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,X p)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要得影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能得混杂因素变量,以校正这些混杂因素对结果得混杂作用八、生存分析资料:(要求资料记录结局与结局发生得时间,如:死亡与死亡发生得时间)1.用Kaplan-Meier方法估计生存曲线2.大样本时,可以寿命表方法估计3.单因素可以用Log-rank比较两条或多条生存曲线4.多个因素时,可以作多重得Cox回归1)观察性研究:可以用逐步线性回归寻找(拟)主要得影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能得混杂因素变量,以校正这些混杂因素对结果得混杂作用●资料21、连续性资料1、1两组独立样本比较1、1、1资料符合正态分布,且两组方差齐性,直接采用t检验。
1、1、2资料不符合正态分布(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后得数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。
1、1、3资料方差不齐(1)采用Satterthwate得t’检验;(2)采用非参数检验,如Wilcoxon检验。
1、2两组配对样本得比较1、2、1两组差值服从正态分布,采用配对t检验。
1、2、2两组差值不服从正态分布,采用wilcoxon得符号配对秩与检验。
1、3多组完全随机样本比较1、3、1资料符合正态分布,且各组方差齐性,直接采用完全随机得方差分析。
如果检验结果为有统计学意义,则进一步作两两比较,两两比较得方法有LSD检验,Bonferroni 法,tukey法,Scheffe法,SNK法等。
1、3、2资料不符合正态分布,或各组方差不齐,则采用非参数检验得Kruscal-Wallis 法。
如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组得Wilcoxon检验。
1、4多组随机区组样本比较1、4、1资料符合正态分布,且各组方差齐性,直接采用随机区组得方差分析。
如果检验结果为有统计学意义,则进一步作两两比较,两两比较得方法有LSD检验,Bonferroni 法,tukey法,Scheffe法,SNK法等。
1、4、2资料不符合正态分布,或各组方差不齐,则采用非参数检验得Fridman检验法。
如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对得Wilcoxon检验。