相加混合模型-EmpowerStats
- 格式:pdf
- 大小:575.12 KB
- 文档页数:9
混合效应模型r语言
混合效应模型是一类常用的统计模型,它可以同时考虑固定效应和随机效应,以更准确地描述数据的变化趋势。
在 R 语言中,可以
使用 lme4 包来拟合混合效应模型。
首先,需要了解固定效应和随机效应的概念。
固定效应是指不随机变化的因素,比如实验中的处理组别、时间、气候等。
随机效应则是指随机变化的因素,比如实验中的个体差异、实验室差异等。
在 lme4 包中,可以使用函数 lmer() 来拟合线性混合效应模型。
例如,假设我们有一组数据,其中 y 是因变量,x1、x2 是两个自变量,且每个样本有一个对应的随机效应 z:
```
data <- read.csv('data.csv')
model <- lmer(y ~ x1 + x2 + (1|z), data=data)
summary(model)
```
其中,`(1|z)` 表示 z 是一个随机效应,括号里的 1 表示只考虑 z 对 y 的影响,不考虑 z 对 x1、x2 的影响。
`summary()` 函
数可以输出模型的系数和显著性检验结果。
在实际应用中,混合效应模型常用于分析长期观测数据、实验数据等,可以更全面地考虑随机因素的影响。
在使用时,还需注意模型的假设条件、模型拟合的稳定性等问题。
- 1 -。
多⽔平统计分析模型(混合效应模型)⼀、概述普通的线性回归只包含两项影响因素,即固定效应(fixed-effect)和噪声(noise)。
噪声是我们模型中没有考虑的随机因素。
⽽固定效应是那些可预测因素,⽽且能完整的划分总体。
例如模型中的性别变量,我们清楚只有两种性别,⽽且理解这种变量的变化对结果的影响。
那么为什么需要 Mixed-effect Model?因为有些现实的复杂数据是普通线性回归是处理不了的。
例如我们对⼀些⼈群进⾏重复测量,此时存在两种随机因素会影响模型,⼀种是对某个⼈重复测试⽽形成的随机噪声,另⼀种是因为⼈和⼈不同⽽形成的随机效应(random effect)。
如果将⼀个⼈的测量数据看作⼀个组,随机因素就包括了组内随机因素(noise)和组间随机因素(random effect)。
这种嵌套的随机因素结构违反了普通线性回归的假设条件。
你可能会把⼈员(组间的随机效应)看作是⼀种分类变量放到普通线性回归模型中,但这样作是得不偿失的。
有可能这个factor的level很多,可能会⽤去很多⾃由度。
更重要的是,这样作没什么意义。
因为⼈员ID和性别不⼀样,我们不清楚它的意义,⽽且它也不能完整的划分总体。
也就是说样本数据中的路⼈甲,路⼈⼄不能完全代表总体的⼈员ID。
因为它是随机的,我们并不关⼼它的作⽤,只是因为它会影响到模型,所以不得不考虑它。
因此对于随机效应我们只估计其⽅差,不估计其回归系数。
混合模型中包括了固定效应和随机效应,⽽随机效应有两种⽅式来影响模型,⼀种是对截距影响,⼀种是对某个固定效应的斜率影响。
前者称为 Random intercept model,后者称为Random Intercept and Slope Model。
Random intercept model的函数结构如下Yij = a0 + a1*Xij + bi + eija0: 固定截距a1: 固定斜率b: 随机效应(只影响截距)X: 固定效应e: 噪声混合线性模型有时⼜称为多⽔平线性模型或层次结构线性模型由两个部分来决定,固定效应部分+随机效应部分,⼆、R语⾔中的线性混合模型可⽤包1、nlme包这是⼀个⽐较成熟的R包,是R语⾔安装时默认的包,它除了可以分析分层的线性混合模型,也可以处理⾮线性模型。
generalized additive mixed modeling1. 引言1.1 概述在统计建模中,回归模型是一种常见的分析工具,用于研究变量之间的关系。
然而,传统的回归模型通常对数据的线性关系做出了限制,无法很好地拟合复杂的非线性关系。
为了解决这个问题,广义可加混合模型(Generalized Additive Mixed Modeling, GAMM)应运而生。
GAMM是一种灵活而强大的统计建模方法,它结合了广义可加模型(Generalized Additive Model, GAM)和混合效应模型(Mixed Effects Model)。
通过引入非线性平滑函数和随机效应,GAMM能够更准确地描述变量之间的复杂关系,并考虑到数据中可能存在的随机变异。
本文将详细介绍GAMM的理论基础、模型框架和参数估计方法。
同时,我们还将探讨GAMM在各个领域中的应用,并与传统回归模型以及混合效应模型进行比较和评估。
最后,我们将总结目前对于GAMM方法的认识,并提出未来研究方向。
1.2 文章结构本文共分为五个部分。
首先,在引言部分概述了GAMM的背景和研究意义。
接下来,第二部分将介绍GAMM的理论基础、模型框架和参数估计方法。
第三部分将详细探讨GAMM在生态学、社会科学和医学研究中的应用案例。
第四部分将与其他回归模型和传统混合模型进行比较,并对GAMM方法的优缺点及局限性进行讨论。
最后,在第五部分中,我们将总结全文的主要内容,并提出对未来研究方向的建议。
1.3 目的本文旨在全面介绍广义可加混合模型(GAMM)这一统计建模方法,以及其在不同领域中的应用。
通过对GAMM的理论基础、模型框架和参数估计方法进行详细描述,读者可以了解到该方法如何解决传统回归模型无法处理非线性关系问题的局限性。
同时,通过实际案例研究,读者可以进一步了解GAMM在生态学、社会科学和医学研究等领域中的应用效果。
此外,通过与其他回归模型和传统混合模型进行比较,本文还旨在评估GAMM方法的优势和局限性。
Python混合效应模型混合效应模型(Mixed Effects Model)是一种统计模型,用于分析具有多层结构的数据。
Python是一种功能强大的编程语言,提供了许多用于统计建模和数据分析的库和工具。
在本文中,我们将介绍如何使用Python进行混合效应模型的建模和分析。
什么是混合效应模型?混合效应模型是一种用于处理具有多层结构数据的统计模型。
在许多研究领域,数据往往具有层次结构,例如学生在学校中的成绩数据,医生在不同医院中的病人数据等。
混合效应模型可以同时考虑个体水平和群体水平的变异,从而更准确地估计因素对结果的影响。
Python中的混合效应模型库在Python中,有几个库可以用于建立和分析混合效应模型。
其中最常用的是statsmodels和lme4。
statsmodels是一个强大的统计建模库,它提供了许多经典的统计模型,包括混合效应模型。
lme4是R语言中非常流行的混合效应模型库,它的Python接口是Pymer4。
在本文中,我们将使用statsmodels来进行混合效应模型的建模和分析。
首先,我们需要安装statsmodels库:pip install statsmodels数据准备在进行混合效应模型分析之前,我们需要准备数据。
假设我们有一个关于学生成绩的数据集,其中包含学生的成绩、学校的信息以及其他一些可能影响成绩的因素。
我们的目标是建立一个模型,用这些因素来预测学生的成绩。
首先,我们需要导入所需的库和数据集:import pandas as pdimport statsmodels.api as sm# 导入数据data = pd.read_csv('data.csv')数据集应该包含以下列:•学生ID:每个学生的唯一标识符•学校ID:每个学校的唯一标识符•成绩:学生的成绩•因素1:可能影响成绩的因素1•因素2:可能影响成绩的因素2•…建立混合效应模型在进行混合效应模型分析之前,我们需要确定模型的结构。
混合效应模型结果解读
混合效应模型(Mixed Effects Model)是一种统计模型,用于分析多层次数据或重复测量数据的效应。
它将固定效应和随机效应结合起来,考虑了在不同层次上的变异性。
在解读混合效应模型的结果时,我们通常要关注以下几个方面:
1.固定效应(Fixed Effects):固定效应是指在模型中设定的固定变量的效应。
它们表示了不同自变量的平均效应,并且在所有层次上都是一致的。
我们可以关注固定效应的估计值和统计显著性,以了解自变量对因变量的影响。
2.随机效应(Random Effects):随机效应是指在模型中设定的随机变量的效应。
它们表示了不同层次上的个体差异或组内变异。
我们可以关注随机效应的方差估计值,以了解不同层次上的变异程度。
3.模型拟合度(Model Fit):我们可以通过检查模型的拟合度指标,如似然比、AIC、BIC等来评估模型的拟合度。
较小的AIC和BIC值表示模型拟合度较好。
4.显著性检验:对于固定效应,我们可以通过检查估计值与标准误差的比值(t值)来进行显著性检验。
通常,如果p值小于设定的显著性水平(例如0.05),则认为效应是显著的。
5.解释效应:在解读模型结果时,我们也要考虑解释效
应。
通过检查固定效应的估计值和符号,我们可以了解到自变量对因变量的影响方向和程度。
需要注意的是,混合效应模型的结果解释需要结合具体的研究背景和问题来进行。
在解读结果时,我们应该综合考虑所有相关的因素,并保持谨慎和全面性。
另外,如果模型结果不符合预期,我们也应该考虑可能的解释和进一步的分析。
【混合效应模型:探究实验设计中的深层次关系】混合效应模型是一种统计分析方法,广泛应用于实验设计和数据分析领域。
它可以帮助研究人员探究实验中的深层次关系,从而对研究对象进行更全面、深入的理解。
在本文中,我们将从简单的概念介绍开始,逐步深入探讨混合效应模型的原理、应用及其对实验设计的影响,以便读者能更好地理解和应用这一统计工具。
一、混合效应模型的基本概念1. 混合效应模型是多层次统计模型的一种,它可以同时考虑个体差异和组内相关性。
2. 在实验设计中,混合效应模型适用于分层、分组或重复测量设计,可以帮助研究人员分析实验结果中不同层次因素的影响。
二、混合效应模型的原理与应用1. 混合效应模型基于固定效应和随机效应的组合,可以在考虑个体差异的同时探究组内关联性。
2. 通过混合效应模型,研究人员可以更全面地理解实验结果中不同因素的作用,从而更准确地进行推断和预测。
3. 混合效应模型在实践中的应用非常广泛,尤其适用于教育、医学、社会科学等领域的研究。
三、混合效应模型与实验设计的关系1. 混合效应模型的运用可以使实验设计更加灵活多样,能够更好地满足研究需求。
2. 在实验设计中,合理地运用混合效应模型可以提高数据分析的效率和准确性,为研究结论的可靠性提供保障。
四、个人观点与理解个人觉得混合效应模型在实验设计和数据分析中的作用非常重要,它可以帮助研究人员更全面地理解实验结果,提高实验设计的灵活性和准确性。
通过合理地运用混合效应模型,可以更好地发现实验结果中隐藏的规律,为研究的深入和实际应用提供有力支持。
总结回顾本文从混合效应模型的基本概念开始介绍,逐步深入探讨了其原理、应用及其与实验设计的关系。
通过对混合效应模型的全面阐述,希望读者能更好地理解和应用这一统计工具,从而在实验研究中取得更好的效果。
通过本篇文章的阐述,相信读者对混合效应模型这一统计工具已有了更深入的理解,并能够更好地运用于实际的研究工作中。
【混合效应模型】是一个十分重要的概念,希望读者能够对此有更深刻的认识。
线性混合模型与多层次建模在统计学中,线性混合模型(Linear Mixed Model,LMM)和多层次建模(Multilevel Modeling,MLM)是两个重要的概念和方法。
它们被广泛应用于各个领域,如心理学、教育学、医学研究等。
本文将对线性混合模型与多层次建模进行介绍和比较,并探讨它们的应用和优势。
线性混合模型是一种特殊的线性回归模型,适用于数据存在相关性、随机效应和层次结构的情况。
在线性混合模型中,固定效应用于整个样本,而随机效应则考虑了个体间的差异。
随机效应可以理解为多个子群体的均值或斜率的变化,而固定效应则是全局的均值或斜率。
与线性回归模型相比,线性混合模型有几个显著的优势。
首先,线性混合模型可以更好地处理重复测量或者来自相同个体的相关数据。
其次,线性混合模型可以正确地估计随机效应的方差,从而提供更准确的参数估计和推断。
最后,线性混合模型可以处理样本结构复杂的数据,比如多层次数据或群组随机化试验。
多层次建模是一种特殊的线性混合模型,它在处理多层数据时具有特殊的优势。
多层次建模允许随机效应在不同层次上变化,从而将个体间的差异和群组间的差异捕捉到模型中。
这使得多层次建模在分析来自多个层次的数据时能够更好地处理层级结构。
举个例子来说明多层次建模的应用。
假设我们研究不同学校学生的成绩,我们可以将学生作为第一层级(个体层),学校作为第二层级(群组层)。
多层次建模可以同时估计学生和学校的影响,从而更准确地测量学生之间和学校之间的差异。
此外,多层次建模还可以通过引入层级效应来控制层级之间的变异,从而减小估计出的固定效应的偏倚。
与线性混合模型相比,多层次建模的优势在于更好地处理了层级结构数据的特点。
多层次建模可以更准确地估计层级间和层级内的方差,充分利用了数据的分层结构。
此外,多层次建模还可以估计层级间的相关性,揭示了群组之间的联系和关系。
总结起来,线性混合模型和多层次建模是两种重要的统计方法,用于处理数据中存在相关性、随机效应和层次结构的情况。
应用Empower Stats软件实现诊断准确性试验的Meta分析陶圆;刘俊华;何倩;喻亚宇;许杨鹏;张超;田国祥;牛玉明【期刊名称】《中国循证心血管医学杂志》【年(卷),期】2016(008)008【摘要】Empower Stats软件是一款基于R语言进行数据分析的统计软件。
该软件具有快速实现分析思路、全面的分析功能、直观的数据、强大的数据预处理功能、快速分享分析结果等特点。
无需编程,就能运用R程序进行数据管理、处理和分析,功能强大而操作简便,所以该软件广为科研统计者所青睐。
但其缺陷在于对诊断准确性试验的Meta分析不能直接得出敏感度、特异度的似然比,本文将以实例的形式系统展示Empower Stats软件用于实现诊断准确性试验Meta分析的两项模块:随机(混合)效应模型Meta分析和根据敏感度特异度生成SROC曲线。
%Empower Stats software is a statistics software based on R language to realize data analysis. This software possesses the features of quickly accomplishing thinking of analysis, comprehensive function, intuitive data, powerful data preprocessing function and rapidly sharing the results. Without programming, R program can be used for data management, processing and analysis, and it is powerful and easy to operate, so the software is widely favored by scientific researchers. However, it doesn’t provide straightforward likelihood ratio of sensitivity and specificity in the Meta-analysis of diagnostic test accuracy (DTA). In the article, two modules of using EmpowerStats software to realize the Meta-analysis of DTA weresystematically displayed with examples including random (mixed) effective model Meta-analysis and creating ROC curve according to sensitivity and specificity.【总页数】4页(P907-910)【作者】陶圆;刘俊华;何倩;喻亚宇;许杨鹏;张超;田国祥;牛玉明【作者单位】442000 十堰,十堰市太和医院附属湖北医药学院循证医学中心; 442000 十堰,十堰市太和医院湖北医药学院附属医院医务处;442000 十堰,十堰市太和医院湖北医药学院附属医院医务处;442000 十堰,十堰市太和医院附属湖北医药学院循证医学中心; 442000 十堰,湖北医药学院口腔医学院12级;442000 十堰,十堰市太和医院附属湖北医药学院循证医学中心; 442000 十堰,湖北医药学院口腔医学院12级;442000 十堰,十堰市太和医院附属湖北医药学院循证医学中心; 442000 十堰,湖北医药学院口腔医学院12级;442000 十堰,十堰市太和医院附属湖北医药学院循证医学中心;100700 北京,陆军总医院干四科;442000 十堰,十堰市太和医院附属湖北医药学院循证医学中心; 442000 十堰,十堰市太和医院附属湖北医药学院口腔科【正文语种】中文【中图分类】R4【相关文献】1.应用R软件meta4diag程序包实现诊断准确性试验的Meta分析 [J], 何倩;王晓娜;喻亚宇;桂裕亮;张超;牛玉明2.应用R软件bamdit程序包实现诊断准确性试验的Meta分析 [J], 王权;何倩;吴君怡;陶圆;张超;牛玉明3.应用R软件metamisc程序包及CopulaREMADA程序包实现诊断准确性试验的Meta分析 [J], 王权;杨廉洁;何倩;喻亚宇;许杨鹏;张超4.应用R软件Metatron程序包实现诊断准确性试验Meta分析及程序包汇总比较[J], 何倩;孙艳玲;陶圆;吴君怡;桂裕亮;张超;牛玉明5.应用R软件HSROC程序包联合RevMan 5软件实现诊断准确性试验Meta分析 [J], 周建国;田旭;田金徽;周权;马虎因版权原因,仅展示原文概要,查看原文内容请购买。
统计学中线性混合模型的参数估计方法统计学是一门研究数据收集、分析和解释的学科。
在统计学中,线性混合模型是一种常用的模型,用于处理具有多层次结构的数据。
线性混合模型的参数估计方法是统计学中的重要内容之一,本文将探讨线性混合模型的参数估计方法。
一、线性混合模型的概念与应用线性混合模型是一种广泛应用于各个领域的统计模型,特别适用于处理具有层次结构的数据。
在实际应用中,我们常常会遇到数据存在多层次结构的情况,例如,研究中的观察单位可能存在分组,而每个分组内的观察值之间可能存在相关性。
线性混合模型能够很好地处理这种情况,并提供了更准确的参数估计结果。
二、固定效应的参数估计方法在线性混合模型中,固定效应是指不随观察单位变化而变化的参数。
固定效应的参数估计方法可以通过最小二乘法来实现。
最小二乘法是一种常用的参数估计方法,通过最小化观察值与模型预测值之间的差异来估计模型参数。
在线性混合模型中,最小二乘法可以用于估计固定效应的参数。
三、随机效应的参数估计方法在线性混合模型中,随机效应是指随观察单位变化而变化的参数。
随机效应的参数估计方法有多种,常用的方法包括最大似然估计法和广义最小二乘法。
最大似然估计法是一种常用的参数估计方法,它通过寻找使观察数据出现的概率最大的参数值来估计模型参数。
在线性混合模型中,最大似然估计法可以用于估计随机效应的参数。
广义最小二乘法是一种通过最小化观察值与模型预测值之间的加权平方差来估计模型参数的方法。
在线性混合模型中,广义最小二乘法可以用于估计随机效应的参数。
四、混合效应的参数估计方法在线性混合模型中,混合效应是指同时包含固定效应和随机效应的参数。
混合效应的参数估计方法可以通过联合估计固定效应和随机效应来实现。
常用的方法包括最大似然估计法和EM算法。
最大似然估计法可以通过最大化观察数据出现的概率来估计混合效应的参数。
在线性混合模型中,最大似然估计法可以用于估计混合效应的参数。
EM算法是一种通过迭代求解隐变量的期望和模型参数的极大似然估计值的方法。
混合截面模型stata命令全文共四篇示例,供读者参考第一篇示例:混合截面模型(Mixed Cross-Sectional Model)是一种常用的统计分析方法,适用于对跨时间和跨个体的数据进行建模和分析。
在实际研究中,我们常常会遇到同时包含时间序列和横截面数据的情况,此时混合截面模型就可以很好地处理这类复杂数据。
本文将介绍如何使用Stata软件进行混合截面模型的建模和分析。
我们需要了解混合截面模型的基本原理。
混合截面模型结合了固定效应模型和随机效应模型的特点,可以同时考虑时间序列和横截面数据的特征。
在混合截面模型中,我们通常假设数据集中包含两个层次的数据,即时间层次和个体层次。
时间层次表示数据在不同时间点的变化,个体层次表示不同个体之间的差异。
通过混合截面模型,我们可以探究时间和个体因素对于变量之间关系的影响。
在Stata软件中,进行混合截面模型的建模和分析通常使用的命令是xtmixed。
该命令结合了mixed命令和xt命令的功能,可以很方便地进行混合截面模型的拟合和检验。
在使用xtmixed命令时,我们需要指定模型的结构和变量之间的关系,同时还需要考虑控制变量和随机效应的处理方式。
下面我们将通过一个具体的例子来演示如何使用Stata进行混合截面模型的建模和分析。
假设我们有一个数据集,包含了多个城市在2019年和2020年的GDP和人口数据,我们想探究GDP与人口数量之间的关系,并考虑时间和城市因素对其影响。
我们需要导入数据并查看数据的基本情况。
可以使用命令如下:```use datafile.dta, clearsummarize```接下来,我们使用xtmixed命令进行混合截面模型的拟合。
假设我们考虑一个简单的模型,GDP与人口数量之间的线性关系,并控制了城市的固定效应。
命令如下:```xtmixed gdp population || city_id: , cov(unstructured)```在上面的命令中,gdp表示因变量,population表示自变量,city_id表示城市的标识符。
相加混合模型
本模块使用广义混合模型或相加混合模型(GAMM: generalize additive mixed model)检验危险因素(X)和结果变量(Y)之间的联系。
相加混合模型是广义相加模型与混合模型的结合,在广义相加模型中可以指定平滑曲线拟合项,在混合模型中可以引进随机效应(可以是随机截距或/和随机时间斜率)。
它主要是用于重复测量资料的分析。
数据中一般有时间变量(T),结果变量随时间(T)变化,同时所研究的危险因素(X)又对结果变量(Y)可能有影响作用。
危险因素(X)可以是固定的也可以随时间(T)变化。
如果危险因素(X)随时间(T)变化,每次重复测量都测量了危险因素(X)与结果变量(Y)的值,还可以分析危险因素(X)的滞后效应,反映危险因素(X)变化在前,结果(Y)变化在后。
滞后效应分析要结合数据操作菜单下在多条记录内计算统计量模块,首先对数据进行预处理,然后用该模块分析。
建立回归模型的目的是把危险因素(X)的作用从时间(T)的作用中区别出来,分析危险因素(X)是否有作用? 是什么样的作用?
如何模拟时间变量(T)与结果变量(Y)的关系:
可以用二种方式拟合时间(T)与结果变量(Y)的关系:
1.不假定时间变量(T)与结果变量(Y)是直线的关系或是二次项的曲线(时
间加上时间平方项)的关系,用平滑曲线拟合时间(T)与结果变量(Y)的关系。
此时时间变量(T)不能被指定为随机效应,模型的随即效应仅限于随机截距。
2.如果结果变量(Y)随时间呈直线性变化,用时间变量(T)的一次项来拟
合。
如果时间变量(T)与结果变量(Y)的关系不完全是直线关系,在模型中要考虑是否应引进时间的平方项(T2)。
如果每个个体的重复测量时间是固定的,时间变量(T)是个分类型的变量,也可以按分类型变量拟合时间(T)的作用。
如何拟合危险因素(X)与结果变量(Y)的关系:
1.如果危险因素(X)是固定的(一般是基线测量值),主要看危险因素(X)
与时间(T)的交互作用,如果有交互作用表示危险因素(X)不同,结果变量(Y)随时间(T)的变化速度(斜率)不同。
2.如果所研究的危险因素(X)随时间(T)变化,这时时间(T)与结果(Y)
有关,又与危险因素(X)有关,模型中需要调整时间(T)的作用才能正确观察危险因素(X)的作用。
因此对时间(T)的作用拟合得充分与否直接影响对危险因素(X)作用的评估是否正确,参考上面如何拟合时间(T)的作用。
拟合危险因素(X)的作用可以首先用平滑曲线(使用基本统计菜单下的广义相加混合模型曲线拟合X),观察危险因素(X)与结果(Y)是否是直线性关系,然后考虑是否可以采用(1)直线拟合;(2)加上二次项的曲线拟合;(3)把危险因素(X)分组,按分类型变量拟合。
如果暴露(X)不随时间变化,如何拟合暴露(X)与时间(T),系统给出如下模型供选择,并可自动比较几个常用模型。
1)如果T是连续性变量
(1)Y = X + T
(2)Y = X + T + T2
(3)Y = X + T + X*T
(4)Y = X + T + T2 + X*T + X*T2
(5)Y = X + s(T)
2)如果X是分类变量
(1)Y = X + factor(T)
(2)Y = X + factor(T) + X*factor(T)
其中:Y= 结果变量,X=危险因素,T=时间,T2=时间的平方项,C=其它协变量
系统自动用似然比检验进行模型之间的比较,判断如何拟合时间(T)及是否存在X与T的交互作用。
例1(输入界面)对两组小白鼠分别与0、1、2、4周测量了某指标(固定
然后调用该模块,输入界面如下:
输出结果:
结果变量: Value
暴露变量: GROUP
调整变量: None
Results in table: β (95%CI) Pvalue / OR (95%CI) Pvalue
此表用易侕统计软件 () 和R软件生成,生成日期: 2016-04-18
Detailed outputs:
Outcome: Value
结果解释
首先给出最终被选模型:Y=GROUP+tmp.TIME+GROUP*tmp.TIME
tmp.TIME 表示时间变量,该模型中时间按连续性变量分析,tmp.TIME的回归系数0.5 表示GROUP=0组,Y随T的变化为每周增加0.5,95%可信区间0.5-0.6,P<0.001。
GROUP*tmp.TIME项为交互作用项,回归系数-0.2表示GROUP=1组Y随时间变化的斜率与GROUP=0组的差为0.2,P=0.005,即每周变化为0.5-0.2=0.3。
这个斜率差值反映两组的差异。
下面给出模型间的比较的似然比检验过程。
结果解释
以模型1为例,模型1是将时间(T)按分类变量分析:
intercept 项回归系数0.6表示GROUP=0,T=0点Y的测量值的均数,其P=0.017表示与0比差异显著;
GROUP项的回归系数0.1表示T=0时点,GROUP=1与GROUP=0两组Y的差异为0.1,p=0.743,差异不显著;
factor(T)1项回归系数0.7表示GROUP=0组、T=1与T=0两个时点的差异为0.7,p<0.001;
factor(T)2项回归系数1.1表示GROUP=0组、T=2与T=0两个时点的差异为1.1,p<0.001;
factor(T)4项回归系数2.2表示GROUP=0组、T=4与T=0两个时点的差异为2.2,p<0.001;
GROUP*factor(T)1项的回归系数-0.3表示T=1与T=0两个时点的差,GROUP=1组比GROUP=0组少0.3,p=0.214;
GROUP*factor(T)2项的回归系数-0.3表示T=2与T=0两个时点的差,GROUP=1组比GROUP=0组少0.3,p=0.169;
GROUP*factor(T)4项的回归系数-0.7表示T=4与T=0两个时点的差,GROUP=1组比GROUP=0组少0.7,p=0.008;
上面三个是交互作用项,反映两组时点变化的差异,即时间与分组的交互作用。
模型2与模型1相比,剔除了GROUP与factor(T)的交互作用项。
结果似然比检验p=0.023有显著差异,表示不能用模型2替代模型1.
模型3把时间T按连续性变量,用T加T2拟合Y与T的关系,并有X与T、X与T2的交互作用项。
模型4从模型3中剔除交互作用项。
两模型比较的似然比检验p=0.012,差异显著,表示不能用模型4替代模型3。
模型5是从模型3中剔除T2项,直线拟合T。
模型6是在模型5的基础上剔除GROUP与T的交互作用项。
两模型比较的似然比检验p=0.0003,差异显著,表示不能用模型6替代模型5。
最后一个表是比较模型1、3、5,模型3与模型1相比,LRT(似然比检验)p=0.646,差异不显著,模型5与模型1相比,似然比检验p=0.908,差异不显著。
模型5与模型3相比,p=0.934差异不显著。
这些比较的结果表示模型5最佳。
同理系统自动对模型2、4、6之间也作了相互比较。
基于前面的结果,无交互作用模型不能替代有交互作用的模型,因此这部分结果可以忽略。
例2.分析几个国家逐年malaria incidence与男、女肿瘤死亡率(cancermortality.male, cancermortality.female)的关系(危险因素X与结果变量Y均随时间变化),输入界面如下:
输出结果:
结果变量: CANCERMORTALITY.MALE; CANCERMORTALITY.FEMALE 暴露变量: MALARIA INCIDENCE
调整变量: None
Results in table: β (95%CI) Pvalue / OR (95%CI) Pvalue
此表用易侕统计软件 () 和R软件生成,生成日期:
2016-06-05
Detailed outputs:
Outcome: CANCERMORTALITY.MALE
Exposure: MALARIA INCIDENCE
Outcome: CANCERMORTALITY.FEMALE
Exposure: MALARIA INCIDENCE
结果解释
本例用平滑曲线拟合时间(YEAR)与结果变量(CANCERMORTALITY.MALE, CANCERMORTALITY.FEMALE)的关系,这样充分调整了时间的作用后,观察危险因素(MALARIA INCIDENCE)对结果变量的作用。
MALARIA INCIDENCE 每增加1个单位,CANCERMORTALITY.MALE增加-0.66,95%可信区间-0.93至-0.39,
p<0.001;CANCERMORTALITY.FEMALE增加-0.97,95%可信区间-1.30至-0.63,p<0.001。
曲线拟合YEAR与结果变量的关系如下图所示:。