当前位置:文档之家› 生存分析

生存分析

生存分析
生存分析

生存分析

第一节 Life Tables过程

14.1.1 主要功能

14.1.2 实例操作

第二节 Kaplan-Meier过程

14.2.1 主要功能

14.2.2 实例操作

第三节 Cox Regression过程

14.3.1 主要功能

14.3.2 实例操作

在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。

第一节 Life Tables过程

14.1.1 主要功能

调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。

返回目录返回全书目录

14.1.2 实例操作

[例14-1]用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。

14.1.2.1 数据准备

激活数据管理窗口,定义变量名:随访月数的变量名为TIME,是否死亡的变量名为DEATH,分组(即中药组与对照组)的变量名为GROUP。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2。

14.1.2.2 统计分析

激活Statistics菜单选Survival中的Life Tables...项,弹出Life Tables对话框(图14.1)。从对话框左侧的变量列表中选time,点击?钮使之进入time框;在Display Time Intervals栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through框中输入48,在by框中输入2。选death,点击?钮使之进入Status框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Life Tables对话框。选group,点击?钮使之进入Factor框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable对话框,定义分组的范围,在Mininum框中输入1,在Maxinum框中输入2,点击Continue钮返回Life Tables对话框。

图14.1 生存资料的寿命表分析对话框

点击Options...钮弹出Life Tables: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图;在Compare Levels of First Factor栏中选Overall项,要求作组间生存状况的比较。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。

14.1.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

共有26个观察对象进入分析。系统先显示中药组(group = 1)的生存状况寿命表,按用户指定,从0月起,隔2个月直至42个月(原指定从0—48个月,但因42个月后,生存概率已为0,故42个月后至48个月的生存状况不再显示),分别显示进入该时点例数(Number Entrng this Intrvl)、从该时点失去的例数(Number Wdrawn Durong Intrvl)、该时点暴露于死亡危险的例数(Number Exposd to Risk)、该时点死亡的例数(Number of Termnl Events)、该时点死亡概率(Propn Terminating)、该时点生存概率(Propn Surviving)、该时点末生存率(Propn Surv at End)、单位时点的累积概率(Cumul Probability Densty)、该时点风险比例(Hazard Rate)、生存率的标准误(SE of Cumul Surviving)、单位时点累积概率的标准误(SE of Probability Densty)、风险比例的标准误(SE of Hazard Rate)。如本例,用中药+化疗的方式治疗白血病患者,至8个月时,死亡率为17.39%,生存概率为82.61%,生存率为66.38%,风险比例为9.52%。至42个月时,生存概率和生存率均为0,此时风险比例为100%。中药组的50%生存率在19.44个月。

对照组同类结果的显示,因在16个月时生存概率已为0,故仅从0月起,隔2个月至16个月止。分析显示,单纯用化疗,白血病患者的半数生存率约在16个月多一点,比中药组少三个月。

Number Number Number Number Cumul SE of SE of

Intrvl Entrng Wdrawn Exposd of Propn Propn Propn Proba- Cumul Proba- SE o Start this During to Termnl Termi- Sur- Surv bility Hazard Sur- bility Haza Time Intrvl Intrvl Risk Events nating viving at End Densty Rate viving Densty R ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ .0 16.0 .0 16.0 .0 .0000 1.0000 1.0000 .0000 .0000 .0000 .0000 .000 2.0 16.0 .0 16.0 1.0 .0625 .9375 .9375 .0313 .0323 .0605 .0303 .03 4.0 15.0 1.0 14.5 .0 .0000 1.0000 .9375 .0000 .0000 .0605 .0000 .00 6.0 14.0 .0 14.0 2.0 .1429 .8571 .8036 .0670 .0769 .1019 .0441 .05 8.0 12.0 1.0 11.5 2.0 .1739 .8261 .6638 .0699 .0952 .1231 .0458 .06 10.0 9.0 1.0 8.5 .0 .0000 1.0000 .6638 .0000 .0000 .1231 .0000 .00 12.0 8.0 1.0 7.5 1.0 .1333 .8667 .5753 .0443 .0714 .1348 .0420 .07 14.0 6.0 .0 6.0 .0 .0000 1.0000 .5753 .0000 .0000 .1348 .0000 .00 16.0 6.0 .0 6.0 .0 .0000 1.0000 .5753 .0000 .0000 .1348 .0000 .00 18.0 6.0 1.0 5.5 1.0 .1818 .8182 .4707 .0523 .1000 .1453 .0489 .09 20.0 4.0 .0 4.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 22.0 4.0 .0 4.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 24.0 4.0 1.0 3.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 26.0 3.0 1.0 2.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 28.0 2.0 .0 2.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 30.0 2.0 1.0 1.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 32.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 34.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 36.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 38.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 40.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 42.0 1.0 .0 1.0 1.0 1.0000 .0000 .0000 .2354 1.0000 .0000 .0727 .00

The median survival time for these data is 19.44

Life Table

Survival Variable TIME

for GROUP = 2

Number Number Number Number Cumul SE of SE of

Intrvl Entrng Wdrawn Exposd of Propn Propn Propn Proba- Cumul Proba- SE o Start this During to Termnl Termi- Sur- Surv bility Hazard Sur- bility Haza Time Intrvl Intrvl Risk Events nating viving at End Densty Rate viving Densty R ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ .0 10.0 1.0 9.5 .0 .0000 1.0000 1.0000 .0000 .0000 .0000 .0000 .000 2.0 9.0 1.0 8.5 1.0 .1176 .8824 .8824 .0588 .0625 .1105 .0553 .06 4.0 7.0 .0 7.0 .0 .0000 1.0000 .8824 .0000 .0000 .1105 .0000 .00 6.0 7.0 2.0 6.0 1.0 .1667 .8333 .7353 .0735 .0909 .1628 .0678 .09 8.0 4.0 .0 4.0 .0 .0000 1.0000 .7353 .0000 .0000 .1628 .0000 .00 10.0 4.0 1.0 3.5 1.0 .2857 .7143 .5252 .1050 .1667 .2122 .0918 .16

接着显示两组比较的结果。系统采用Gehan比分检验法,得u = 0.012,P = 0.9113,即中药组与对照组的生存率无差别。

最后,系统输出生存率曲线图(图14.2)。从图中可见,对照组(group = 2)在8个月前一段时点的生存率均较中药组(group = 1)略低,而8-12个月这一段其生存率又较中药组略高,12个月后再又下降。但在治疗中加用中药,对个别患者而言,20个月后依然有一定的生存率。

返回目录返回全书目录

第二节 Kaplan-Meier过程

14.2.1 主要功能

调用此过程,系统将采用Kaplan-Meier方法,对病例随访资料进行生存分析,在对应于每一实际观察事件时点上,作生存率的评价。

返回目录返回全书目录

14.2.2 实例操作

[例14-2]25例某癌症病人在不同时期经随机化分配到A、B治疗组进行治疗,同时随访观察至1974年5月31日结束,资料整理后如下表,试对其结果进行生存率分析。

14.2.2.1 数据准备

激活数据管理窗口,定义变量名:随访天数为TIME,是否死亡为DEATH,治疗方式为TREAT。变量TIME按原数值输入,DEATH为是的输入1、否的输入0,TREAT为A的输入1、为B的输入2。

14.2.2.2 统计分析

激活Statistics菜单选Survival中的Kaplan-Meier...项,弹出Kaplan-Meier对话框(图14.3)。从对话框左侧的变量列表中选time,点击?钮使之进入time框;选death,点击?钮使之进入Status框,点击Define Event...钮弹出Kaplan-Meier:Define Event for Status Variable 对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Kaplan-Meier对话框。选treat,点击?钮使之进入Factor框。

图14.3 Kaplan-Meier法生存率分析对话框

点击Save... 钮弹出Kaplan-Meier:Save New Variables对话框,选Survival项,要求将各观察样例的生存率存入原始数据库中。点击Continue钮返回Kaplan-Meier对话框。

点击Options...钮弹出Kaplan-Meier: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。

14.2.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

先对A治疗组资料进行分析。将原资料按生存天数的大小顺次排列,再逐例显示生存状态(Status,即死亡为1、生存为2)、生存率(Cumulative Survival)、生存率标准误(Standard Error)、累积死亡例数(Cumulative Event)和尚存活人数(Number Remaining)。如本例,A 组共12人,死亡6人,生存6人,存活率为50.00%;平均生存时间为1023天,标准误为

276,95%可信区间为482—1563天。B组共13人,死亡12人,生存1人,存活率为7.69%;平均生存时间为607天,标准误为226,95%可信区间为163—1051天。

系统按用户的请求输出生存率曲线图(图14.4)。从图中可见,生存天数为200左右之前,A、B两组的生存率相近,而后,A组维持约50%的生存率,B组则不断下降。

最后系统将各观察对象的生存率计算结果,逐一送入原始数据库保存(图14.5),变量名为sur_1。用户从中可见,如A组治疗8天死亡者,其8天的生存率为83.333%;又如B 组治疗180天死亡者,其180天的生存率为53.846%。

返回目录返回全书目录第三节 Cox Regression过程

14.3.1 主要功能

调用此过程可完成对病例随访资料中事件发生时点与一系列相关独立变量之间关系的评价,即建立Cox回归模型(亦称比例风险模型)。

第一、二节介绍的方法,仅仅是对生存资料作较简单的统计,即描述和分析一个因素(如治疗方式)对生存时间的影响。而在Cox回归模型中,某一时点t,除了有一个本底风险量

h0(t)外,第i个影响因素可使该本底风险量h0(t)增至e βixi

倍而成为h0(t)·e

βixi

。因

此如果有k个因素同时影响生存过程,那么时点t的风险量(常称之为风险函数)表达为:h(t) = h0(t) ·e

(β1x1+β2x2+...+βkxk)

返回目录返回全书目录

14.3.2 实例操作

[例14-3]某医师在研究急性白血病患者的生存率时,收集了33名患者的资料,按Ag 阳、阴性分组(Ag阳性组17例,Ag阴性组16例),同时考察白细胞数的影响作用。试据下表资料作Cox回归模型的分析。

14.3.2.1 数据准备

激活数据管理窗口,定义变量名:生存月数为TIME,是否死亡为DEATH,白细胞数为WBC,Ag阳性与否为AG。TIME按原数据输入,DEATH是的输入1、否的输入0,WBC亦按原数据输入,AG阳性的输入1、阴性的输入2。

14.3.2.2 统计分析

激活Statistics菜单选Survival中的Cox Regression...项,弹出Cox Regression对话框(图14.6)。从对话框左侧的变量列表中选time,点击?钮使之进入time框;选death,点击?钮使之进入Status框,点击Define Event...钮弹出Cox Regression:Define Event for Status Variable 对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Cox Regression对话框。选wbc和ag,点击?钮使之进入Covariates框。

图14.6 Cox回归模型分析对话框

在Method 处有一下拉菜单,系统提供7种回归运算方法让用户选择: 1、Enter :所有自变量强制进入回归方程; 2、Forward: Conditional :以假定参数为基础作似然比概率检验,向前逐步选择自变量; 3、Forward: LR :以最大局部似然为基础作似然比概率检验,向前逐步选择自变量; 4、Forward: Wald :作Wald 概率统计法,向前逐步选择自变量; 5、Backward: Conditional :以假定参数为基础作似然比概率检验,向后逐步选择自变量; 6、Backward: LR :以最大局部似然为基础作似然比概率检验,向后逐步选择自变量; 7、Backward: Wald :作Wald 概率统计法,向后逐步选择自变量。 本例因自变量较少,故选用Enter 法。 点击Plots...钮弹出Cox Regression:Plots 对话框,在Polts Type 栏中选Survival 项,要求绘制生存率曲线图,同时选Hazard 项,要求绘制风险量变化图。然后点击Continue 钮返回Cox Regression 对话框。 点击Save... 钮弹出Cox Regression:Save New Variables 对话框,在Survival 栏中选Function 项,要求将生存率计算结果存入原数据库;在Diagnostics 处选Hazard function 项,要求将风险函数计算结果存入原数据库;再选X*Beta 项,要求计算各自变量与其系数的乘积并存盘。完成选择后点击Continue 钮返回Cox Regression 对话框。 点击Options...钮弹出Cox Regression:Options 对话框,在Model Statistics 栏中选At last step 项,要求只显示回归方程拟合过程的最终结果;同时选Display baseline function 项,要求显示各样本的本底风险量。之后点击Continue 钮返回Cox Regression 对话框,再点击OK 钮即完成分析。

14.3.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 系统显示共有33例样本进入分析,其中29例在观察期内死亡,4例仍存活,存活率为12.1%。Cox 回归方程拟合结果的χ2检验,χ2值为11.773,P = 0.0028,表明AG 与WBC 两自变量对生存状态均有作用。得到风险量增加倍数为e

(0.0089×WBC - 1.1219×AG)

,其中白

细胞数的变量系数为正值,意味着白细胞数愈高,死亡风险愈大;Ag 的变量系数为负,意味着Ag 阳性者,死亡风险小。

接着,系统显示各生存时点(亦即各样本)的本底风险量(Cum Hazard)、生存率(Survival)、生存率的标准误(SE)和本底风险量的标准误(SE of Cum hazard)。并提示将在原数据库中产生三个新的变量,即生存率、风险比例和风险量倍数。

从输出的Cox模型生存率曲线图(图14.7)中可见,随时间的延长,患者生存率逐渐下降,接近160个月时,生存率几乎为0。

下图为Cox模型的风险量曲线图,其趋势也十分明显,即随时间的延长,患者在生存上所经历的死亡风险愈来愈大,到140个月时,大约是起初(0个月)的5倍。

系统在原始数据库中将生存率以变量sur_1、风险比例以变量haz_1和风险量倍数以变量xbe_1存盘(图14.9)。用户从中可见,如经治疗后1月内死亡、其白细胞数为100.0×109 /L、Ag阳性者,生存率为94.592%、风险比例为5.560%、风险量倍数为0.08695;又如经治疗后26月内尚存活、其白细胞数为32.0×109 /L、Ag阳性者,生存率为66.318%、风险比例为41.070%、风险量倍数为-0.51874。

生存分析的概念

一、生存分析的概念: 将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。 研究生存现象和响应时间数据及其统计规律的一门学科。 对一个或多个非负随机变量(生存时间)进行统计分析研究。 对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。 在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计规律的分析与推断方法的学科。 二、“生存时间”(Survival Time)的概念 生存时间也叫寿命、存活时间、失效时间等等。 医学:疾病发生时间、治疗后疾病复发时间 可靠性工程系:元件或系统失效时间 犯罪学:重罪犯人的假释时间 社会学:首次婚姻持续时间 人口学:母乳喂养新生儿断奶时间 经济学:经济危机爆发时间、发行债券的违约时间

保险精算学:保险人的索赔时间、保险公司某一索赔中所付保费 汽车工业:汽车车轮转数 市场学中:报纸和杂志的篇幅和订阅费 三、生存分析的应用领域:社会学,保险学,医学,生物学,人口学,医学,经济学,可靠性工程学等 六、生存分析研究的目的 1、描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。 2、比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。统计方法log-rank检验等。 3、影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。统计方法Cox比例风险回归模型等。 4、预测:建立Cox回归预测模型。 主要研究内容 描述生存过程:研究人群生存状态的规律,研究生存率曲线的变动趋势,是人寿保险业的基础。 生存过程影响因素分析及结局预测:识别与反应、生存及疾病等相关风险因素,预测生存结局,在临床中应用的非常广泛。 七、主要分析方法

SPSS数据分析—生存分析

生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间。这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等。 生存时间有两个特点: 1.存在删失,是指由于某种原因导致生存时间没用被准确或完整的记录下来,这种情况很常见,如果不存在删失,那么生存分析和一般统计方法没用太大区别,但是一旦出现删失,就必须考虑其影响,一般统计方法将不再适用。 2.生存时间非负,且分布常常右偏,导致基于正态分布理论的常规统计方法不适用。用生存分析就可以解决以上问题。 生存分析的几个就基本概念 1.事件 也称为失效事件,是指由研究者所规定的事件的结局,这在生存分析中是一个非常重要的概念,其定义应该非常明确,并且应该在研究开始阶段就要确定。失效事件并不一定是消极的,也可以是正面、积极的,这取决于研究目的。 2.生存时间 指从某一时间点起到所关心的事件也就是实效事件发生前的这段时间,生存时间的起点需要人为规定 3.删失 是指观察对象的终止观察并不是由于实效事件的发生,而是由于其他原因导致终止,这种情况往往不知道终止的时间点,因此会造成其时间数据不完整,并且删失需要在各组之间随机,如果删失的出现并不随机,则不能用生存分析 4.生存函数 用于描述生存时间分布的工具,当t=0时,生存函数取值为1,随着时间推移t 增大,生存函数的取值逐渐减小。 5.风险函数 也是用于描述生存时间分布,表示随机变量T已至时点t的条件下,在接下来的一瞬间失效事件发生的概率 生存分析的基本内有 1.刻画生存时间分布 2.生存时间分布的组间比较 3.评价生存时间分布影响因子的效果 生存分析可以分为参数法、半参数法、非参数法三种,参数法相当于非线性回归,半参数法有Cox回归,非参数法有寿命表法和Kaplan-Meier法,

卫生统计学生存分析

一、选择题 1.生存分析中的生存时间是指_____________。 A 手术至死亡的时间 B 观察开始到观察结束的时间 C 起始事件到终点事件间隔的时间 D 发病到痊愈的时间 E 出生到死亡的时间 2.食管癌患者术后随访资料进行生存分析,其中的删失值可以是_____________。 A 患者失访 B 患者死于车祸 C 患者死于其它肿瘤 D 观察期结束仍存活 E 以上都是 3.生存分析中的结果变量是_____________。 A 生存时间 B 是否删失 C 生存率D生存时间与随访结局 E 生存时间与生存率 4.关于生存概率与生存率,叙述正确的是_____________。 A 生存率不会随时间增加B生存概率随时间增加而加大 C生存概率一定大于生存率D生存概率一定小于生存率 E 生存概率一定等于生存率 5.关于生存曲线正确的描述是_____________。 A 纵坐标为生存概率 B 此曲线是严格下降的 C 曲线平缓,表示预后较好 D 横坐标中点为中位生存期 E 寿命表法生存曲线呈阶梯型 6.Cox模型要求数据满足的假设条件为_____________。 A 自变量服从正态分布 B 应变量为二项分类数据 C 各自变量满足方差齐性D变量满足比例风险假定 E 协变量为数值变量 二、简答题 1.Cox回归与logistic回归都可作临床研究中的预后分析,二者的主要区别何在?2.请简述Cox回归中回归系数与RR值的关系。

三、计算分析题 1.将符合手术治疗适应征的21例乳腺癌患者随机分为两组,一组10例接受手术治疗,另一组11例在术后同时接受化疗,其生存时间如表23-13。(1)试估计两种疗法的生存率及生存曲线。(2)比较两种疗法的生存率有无差别。 表21例乳腺癌患者两种疗法的生存时间(月) 手术组 6 9 13 15 18 19 19 20 22 24 手术+化疗组10 14 15 16+19 19 20 20+24 26 28 2.以下是女性心绞痛患者诊断后的生存数据,试用寿命表法估计其生存率并估计中位生存期。

生存分析概念

OS :death for any cause;DSS:cancer or its treatment; DFS:any type of treatment failure ; disease-specific survival应该是没有算因其他原因而死亡的,overall survival应该是总的算上其他的原因 无病生存期(Disease-free survival,DFS)的定义是指从随机化开始至疾病复发或由于疾病进展导致患者死亡的时间。该指标也常作为抗肿瘤药物III期临床试验的主要终点。某些情况下,DFS与OS 相比,作为终点比较难以记录,因为它要求认真随访,及时发现疾病复发,而且肿瘤患者的死亡原因也很难确定。肿瘤患者常有合并症(如,心血管病),这些合并症可能会干扰对DFS的判断。并且,肿瘤患者常死于医院外,不能常规进行尸检。总生存期(Overall survival,OS)的定义是指从随机化开始至因任何原因引起死亡的时间。该指标常常被认为是肿瘤临床试验中最佳的疗效终点。如果在生存期上有小幅度的提高,可以认为是有意义的临床受益证据。作为一个终点,生存期应每天进行评价,可通过在住院就诊时,通过与患者直接接触或者通过电话与患者交谈,这些相对比较容易记录。确认死亡的日期通常几乎没有困难,并且死亡的时间有其独立的因果关系。当记录至死亡之前的失访患者,通常截止到最后一次有记录的、与患者接触的时间。2 h0 d8 V8 C: h# j; l4 k$ M PFS(progression-free survival)是指观察受试者进入试验到肿瘤发生恶化或死亡的时间长度,受试者只要“肿瘤恶化”或“死亡”二者其一先发生,则达到研究的终点; PFS(progression-free survival)定义为由随机至第一次发生疾病进展或任何原因死亡的时间。PFS与TTP不同之处在于PFS可包括有患者死亡时间,因而与OS有更好的相关性。但当多数的死亡事件与肿瘤无关时,TTP则是一个可被接受的终点指标。PFS可反映肿瘤生长,并能在得出生存期受益结果之前被评价,且不会受到后续治疗的干扰,但将其正式批准为多个不同恶性肿瘤的生存期替代

生存分析基本记忆(一)

生存分析重点记忆 生存分析(survival analysis )是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。 生存分析的内容:对于具有某些性质的一类人群,则可以通过对数据的分析来得到活过一定时间的概率。 如果关心不同治疗手段的效果,则可以通过数据分析来比较这些方法,看它们是否有效,还能建立可以预测的量化的模型。 生存分析主要任务? 描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。 比较生存过程:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。统计方法有log-rank 检验等。 分析危险因素:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。统计方法cox 比例风险回归模型等。 (预后:指预测疾病的可能病程和结局。它既包括判断疾病的特定后果,如康复,某种症状、体征和并发症等其它异常的出现或消失及死亡。) 预测:建立cox 回归预测模型。 生存时间 终点事件与起始事件之间的时间间隔。 终点事件指研究者所关心的特定结局。 起始事件是反映研究对象生存过程的起始特征的事件。 生存时间的类型 1. 完全数据(complete data ):从起点至死亡(死于所研究疾病)所经历的时间。 2. 截尾数据(删失数据,censored data ):从起点至截尾点所经历的时间。 截尾的原因主要有3种: ○ 1失访:失去联系 ②退出:死于非研究因素或其他非处理因 素、改变治疗方案等导致退出研究。 ③终止:指观察研究期限结束时仍未出现结局。 死亡概率、死亡率: 死亡概率(mortality probability):是指某单位时段期初的观察对象在该单位时段内死亡的可能性大小。 该时段期初观察人数某单位时段内死亡数=q 若该时段内有删失,则分母用校正人口数: 删失数期初观察人数校正人口数21-= 死亡率(mortality rate):指单位时间内研究对象的死亡频率或强度,即平均每千人(或万 人、百人等)中的死亡人数。 1000?=该时段平均人口数 某单位时段内死亡数m ‰ 平均人口数= 2 1(该时段期初人口数+期末人口数)

生存分析论文

《生存分析论文》 题目:基于非参数分析法 研究改进手术对患者生存时间的影响专业: 班级: 姓名: 2015年6月25日

摘要 生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。 临床随访,又称为前瞻性研究(prospective study),本文采用此方法进行两组肾移植的病人手术后的生存时间和结局的研究。 研究过程中主要面临的问题有: (1)结局及生存时间据需要考虑—经典的统计分析方法不能同时分析结局和生存时间; (2)随访研究中研究对象可能会失访或死于其他疾病;或因研究经费和时间的限制不可能等到所有的对象都出现结局---截尾(censoring)或终检。 生存分析能解决以上问题。 本文通过比较A组和B组两组实验数据来探究改进手术对患者生存时间的影响,通过最后结果可以看出,改进手术组会大大提高患者生存率,因此,今后医生应致力于手术改良,以多加提高患者的生存率。 关键词 Kaplan-Meier估计 Nelson-Aalen估计 Cox模型 SAS软件

一、估计原理 1.乘积极限法(Kaplan-Meier ) Kaplan-Meier 分析方法,又称乘法极限估计、PL 法或最大似然估计法,是由Kaplan 和Meier 在1958年提出的一种求生存函数的非参数方法。寿命表分析适用于大样本情况,在处理小样本时,为充分利用每个数据所包含的信息,Kaplan-Meier 分析便成为首选的分析工具。 乘积极限法(Kaplan-Meier )适用于离散数据,它用于建立时刻t 上的生存函数。Kaplan-Meier 法是根据t 时刻及其之前各时间点上的条件生存率的乘积,来估计时刻t 的生存函数S(t)和它的标准误SE(S(t))。设12t t tk ≤≤≤代表k 个观察对象的生存时间,设i n 为i t 时刻开始之前生存的个体数目,即危险集的大小(i=1,2,…,k ),再设i d 表示生存时间的截尾性质,i=1,2,…,k 。又令i p 表示观察对象在时刻i t 的条件生存率,即对于i=1,2,…,k ,有: i i i i n d p n -= ,其中1,0i i i i d ?=?? 如果第个生存时间t 是完全数据;,如果第i 个生存时间t 是截尾数据; 那么,观察对象在时刻t i 时的条件死亡率如下: 1i i q p =- 对于i=1,2,…,k ,Kaplan-Meier 法定义时刻t i 上的生存函数和它的标准误的估计公式如下: 0(),1,2, .(())(i i k k i i S t p i k SE S t S t ∧ =∧∧ = ==除了生存函数,均数和中位数也是反映一组生存时间平均水平常用的统计指标。但由于生存资料多呈偏正态分布,因而更适宜选用中位数,包括百分位数等指标。 2.log-rank 检验 Log-rank 检验的渐进平均值E 和方差V :

生存分析知识点总结

生存分析知识点总结 09统计(经济分析1班)周姗琪 32009121215 一、基本概念 1、生存分析:将事件的结果和出现此结果所经历的时间结合起来分析的统计 分析方法。研究生存现象和响应时间数据及其统计规律的一门学科。对一个或多个非负随机变量(生存时间)进行统计分析研究。对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。 2、生存时间:生存时间也叫寿命、存活时间、失效时间等等 3、研究目的: ①描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函 数曲线。统计方法包括K-M法、寿命表法。 ②比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了 解哪种治疗方案较优。统计方法log-rank检验等。 ③影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为 改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。统计方法Cox比例风险回归模型等。 ④预测:建立Cox回归预测模型。 4、研究内容:描述生存过程和对生存过程影响因素分析及结局预测。 5、主要分析方法:参数法方法、非参数方法、半参数方法。 二、生存分析数据类型 1、完全数据:每个个体确切的生产时间都是知道的。这样的数据称为完全数 据。但在实际的生存分析中,数据在很多情况下是很难完全观察到的。 2、删失:在研究结束时,无法获得某些个体确切的生存时间。 ①右删失:在进行观察或调查时,一个个体的确切生存时间不知道,而只知道 其生存时间大于时间L,则称该个体的生存时间在L上是右删失的,并称L 为右删失数据。 ②左删失:研究对象在时刻Ct开始接受观察,而在此之前我们感兴趣的时间 已经发生,这就是左删失。 ③区间删失:若个体的确切生存时间不知道,只知道其生存时间在两个观察时 间L和R之间(L

生存分析

生存分析 本数据资料主要探讨不同处理对生存时间的影响,数据中,treat为连续变量,num2_treat为二分类变量,num3_treat为三分类等级变量。共纳入病人200例,进行生存分析步骤如下: 1.生存资料的定义: 命令:stset[时间变量] [截尾变量] 对应本数据为:stset time mortality 结果: 1)其中time指随访时间,即产生预期结果或者截尾时的时间减去纳入随访时的初始时间得到的天数。 2)Mortality为截尾变量,Stata视变量mortality不等于0的非缺失值为出现预期结果。3)Stata会同时产生4个新的变量: _st代表:数据中该条记录是否被定义为生存资料。 _d 代表:数据中该条记录是否出现预期结果。 _t 代表:数据中观察对象被随访的时间。 _t0 代表:数据中观察对象第一次被观察到的时间(开始过程的时间为0) 2.生存资料的描述。 1)计算中位生存时间的命令: stsum[if 表达式] ,[by(分组变量)选择项] 对应本数据:stsum,by(num2_treat) 结果:

由于两组中截尾数据出现的较早,故25%、50%和75%生存时间无法估计,Stata用缺失值表示。 4)stci命令可以用来计算中位生存时间、平均生存时间、生存时间的百分数及其可信区间。 命令:stci [if 表达式],[by(分组变量) 选择项] 其中选择项有:median(计算中位生存时间);rmean(计算平均生存时间) P(#)(生存时间的百分数);level(#)(可信区间的可信度)对应本数据:stci,by(num2_treat) median 结果: 同样由于两组中截尾数据出现的较早,故中位生存时间无法估计,Stata用缺失值表示。 stci,by(num2_treat) rmean 结果:

第9章生存分析思考与练习参考答案

! 第19章生存分析 思考与练习参考答案 一、最佳选择题 1. 下列有关生存时间的定义中正确的是( E )。 A.流行病学研究中,从开始接触某危险因素至某病发病所经历的时间 B.乳腺增生症妇女治疗后阳性体征消失至首次复发的时间 C.肺癌患者从手术治疗开始到死亡的时间 D.急性白血病患者从治疗开始到缓解的时间 ! E.以上均正确 2. 教材表19-18表是急性白血病患者药物诱导后缓解至首次复发的随访记录。 教材表19-18 急性白血病患者药物诱导后缓解至首次复发的随访记录编号缓解日期终止观察日期结局生存时间/天 1 复发 158 2 死亡 91 3 复发 147 4 失访 96 : 5 缓解 119 …………… 生存时间属删失数据的有(C)。 A.1号和3号 B.1号和2号 C.2号、4号和5号 D.2号、3号和4号 E.1号、2号和3号 3. 下列有关log-rank检验的描述中正确的是(A)。 A.log-rank检验是各组生存率的整体比较 B.log-rank检验是各组生存率某时间点的比较 : C.log-rank检验属生存曲线比较的参数法 D.log-rank检验中,各组实际死亡数必等于理论死亡数

E.log-rank检验的自由度为1 4. Log-rank检验与Breslow检验相比,( B )。 A.log-rank检验对组间死亡近期差异敏感 B.log-rank检验对组间死亡远期差异敏感 C.Breslow检验对组间死亡远期差异敏感 D.两者对组间死亡远期差异同样敏感 — E.两者对组间死亡近期差异同样敏感 5. Cox回归模型要求两个不同个体在不同时刻t的风险函数之比(D)。 A.随时间增加而增加 B.随时间增加而减小 C.开始随时间增加而增加,后来随时间增加而减小 D.不随时间改变 E.视具体情况而定 二、思考题 。 1. 生存分析的主要用途及其统计学方法有哪些 答:生存分析在生物医学领域主要解决如下问题。 估计:即根据一组生存数据估计它们所来自的总体的生存率及其他一些有关指标。如根据白血病化疗后的缓解时间资料,估计不同时间的缓解率、缓解率曲线以及半数生存期。估计生存率常用寿命表法和Kaplan-Meier(K-M)法。 比较:即比较不同受试对象生存数据的相应指标是否有差别。最常见的是比较各组的生存率是否有差别,如比较不同方案治疗白血病的缓解率曲线,以了解哪种治疗方案较优。生存曲线比较常用log-rank检验和Breslow检验。 影响因素分析:其目的是为了研究影响生存时间长短的因素,或在排除一些因素影响的情况下,研究某个或某些因素对生存率的影响。例如,为改善白血病患者的预后,应了解影响患者预后的主要因素,包括患者的年龄、病程、白细胞数、化疗方案等。影响因素分析常用Cox回归。

生存分析知识总结

生存分析知识总结 一、生存分析の基本概念 生存分析是将事件の结果和出现此结果所经历の时间结合起来分析の统计分析方法。研究生存现象和响应时间数据及其统计规律の一门学科。对一个或多个非负随机变量(生存时间)进行统计分析研究。对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度の统计分析方法。在综合考虑相关因素(内因和外因)の基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生の时间(也叫寿命、存活时间或失效时间,统称生存时间)有关の问题提供相关の统计规律の分析与推断方法の学科。 生存时间也叫寿命、存活时间、失效时间等等。比如:医学上包括疾病发生时间、治疗后疾病复发时间;可靠性工程系为元件或系统失效时间;犯罪学方面是重罪犯人の假释时间;社会学上指首次婚姻持续时间;人口学上包括母乳喂养新生儿断奶时间;经济学包括经济危机爆发时间、发行债券の违约时间;保险精算学包括保险人の索赔时间、保险公司某一索赔中所付保费;汽车工业包括汽车车轮转数;市场学中有报纸和杂志の篇幅和订阅费。这些也可以说明,生存时间可以不是具体の时间。 二、生存分析の历史 生存分析方法最早可上溯至十九世纪の死亡寿命表。现代の生存分析则开始于二十世纪三十年代工业科学中の相关应用。 二次世界大战时期,武器装备の可靠性研究,这一研究兴趣延续到战后。此时生存分析都集中在参数模型。二十世纪六七十年代,医学研究中大量临床试验の出现,要求方法学有新の突破,导致了生存分析の研究开始转向非参数方法。D.R. Cox在72年提出の比例风险模型为此做出了划时代の贡献。 现在,生存分析方法の在医学领域得到了广泛の应用,而通过医学研究要求の不断提高,这一方法也得到了飞速の发展。 三、生存分析の研究目の,内容和具体方法 (一)研究目の主要由以下五个方面 1.描述生存过程:估计不同时间の总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。 2.比较:比较不同处理组の生存率,如比较不同疗法治疗脑瘤の生存率,以了解哪种治疗方案较优。统计方法log-rank检验等。 3.影响因素分析:研究某个或某些因素对生存率或生存时间の影响作用。如为改善脑瘤病人の预后,应了解影响病人预后の主要因素,包括病人の年龄、性别、病程、肿瘤分期、治疗方案等。

生存分析概念

“ 一、生存分析的概念: 将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。 研究生存现象和响应时间数据及其统计规律的一门学科。 对一个或多个非负随机变量(生存时间)进行统计分析研究。 对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计 分析方法。 在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工 程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经 济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发 生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计 规律的分析与推断方法的学科。 二、生存时间”(Survival Time)的概念 生存时间也叫寿命、存活时间、失效时间等等。 医学:疾病发生时间、治疗后疾病复发时间 可靠性工程系:元件或系统失效时间 犯罪学:重罪犯人的假释时间 社会学:首次婚姻持续时间 人口学:母乳喂养新生儿断奶时间 经济学:经济危机爆发时间、发行债券的违约时间 保险精算学:保险人的索赔时间、保险公司某一索赔中所付保费 汽车工业:汽车车轮转数 市场学中:报纸和杂志的篇幅和订阅费 三、生存分析的应用领域:社会学,保险学,医学,生物学,人口学,医学,经济学,可 靠性工程学等 六、生存分析研究的目的 1、描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统 计方法包括 Kaplan-Meier (K-M )法、寿命表法。 2、比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗

SPSS生存分析过程

SPSS Survival(生存分析)菜单 SPSS Survival 菜单包括Life Tables 过程、Kaplan-Meier 过程、Cox Regression 过程、Cox w/Time-Dep Cov 过程。这里只介绍Life Tables 过程和Kaplan-Meier 过程。 Life Tables 过程 Life Tables 过程用于: 1、估计某生存时间的生存率。 2、绘制各种曲线如生存函数、风险函数曲线等。 3、对某一研究因素不同水平的生存时间分布进行比较,控制另一因素后对研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平之间进行两两比较。 一、建立数据文件 定义两个列变量:时间变量:取名“ time”,label 标上“ survival time(week) 。” 生存状态变量:取名“ status”并赋值:0= “删失” ,1= “死亡”。二、操作过程从菜单选择 1 、Analyze==>Survival ==>Life Tables 2、Time 框:选入time 3、Display Time Intervals 框:在by 前面的框内填入生存时间上限,本例 填入20(此区间必须包括生存时间的最大值) ;在by 后面的框内填入生存时间的组距,本例填入5,以保证结果列出“1 5- ”的组段。

4、 StatUS 框:选入 StatUs ;击 define events 钮,在 SingIe value 框右边的空 格中输入1 5、 单击OPtiOn 按钮,弹出对话框: Life TabIe(S)输出寿命表,系统默认 Plots:选SUrViVaI (累积生存函数曲线) 击 COntinUe 6、单击OK 钮 附:界面说明 J Lire Tabled ____ I Tim?: 口加 Status : ^d(∪ Factor: Ey FaCtor: JPti OlkE .一 图1 寿命表主对话框 【Time 】框 选入生存时间变量 【DiSPIay Time InterVaIS 】框 欲输出生存时间范围及组距。 DiSPlay Time Interval≡ 0 20

生存分析

生存分析 第一节 Life Tables过程 14.1.1 主要功能 14.1.2 实例操作 第二节 Kaplan-Meier过程 14.2.1 主要功能 14.2.2 实例操作 第三节 Cox Regression过程 14.3.1 主要功能 14.3.2 实例操作 在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。 第一节 Life Tables过程 14.1.1 主要功能 调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。 返回目录返回全书目录 14.1.2 实例操作

[例14-1]用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。 14.1.2.1 数据准备 激活数据管理窗口,定义变量名:随访月数的变量名为TIME,是否死亡的变量名为DEATH,分组(即中药组与对照组)的变量名为GROUP。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2。 14.1.2.2 统计分析 激活Statistics菜单选Survival中的Life Tables...项,弹出Life Tables对话框(图14.1)。从对话框左侧的变量列表中选time,点击?钮使之进入time框;在Display Time Intervals栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through框中输入48,在by框中输入2。选death,点击?钮使之进入Status框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Life Tables对话框。选group,点击?钮使之进入Factor框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable对话框,定义分组的范围,在Mininum框中输入1,在Maxinum框中输入2,点击Continue钮返回Life Tables对话框。

生存分析知识总结

生存分析知识总结 一、生存分析的基本概念 生存分析是将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。研究生存现象和响应时间数据及其统计规律的一门学科。对一个或多个非负随机变量(生存时间)进行统计分析研究。对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计规律的分析与推断方法的学科。 生存时间也叫寿命、存活时间、失效时间等等。比如:医学上包括疾病发生时间、治疗后疾病复发时间;可靠性工程系为元件或系统失效时间;犯罪学方面是重罪犯人的假释时间;社会学上指首次婚姻持续时间;人口学上包括母乳喂养新生儿断奶时间;经济学包括经济危机爆发时间、发行债券的违约时间;保险精算学包括保险人的索赔时间、保险公司某一索赔中所付保费;汽车工业包括汽车车轮转数;市场学中有报纸和杂志的篇幅和订阅费。这些也可以说明,生存时间可以不是具体的时间。 二、生存分析的历史 生存分析方法最早可上溯至十九世纪的死亡寿命表。现代的生存分析则开始于二十世纪三十年代工业科学中的相关应用。 二次世界大战时期,武器装备的可靠性研究,这一研究兴趣延续到战后。此时生存分析都集中在参数模型。二十世纪六七十年代,医学研究中大量临床试验的出现,要求方法学有新的突破,导致了生存分析的研究开始转向非参数方法。D.R. Cox在72年提出的比例风险模型为此做出了划时代的贡献。 现在,生存分析方法的在医学领域得到了广泛的应用,而通过医学研究要求的不断提高,这一方法也得到了飞速的发展。 三、生存分析的研究目的,内容和具体方法 (一)研究目的主要由以下五个方面 1.描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。 2.比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。统计方法log-rank检验等。 3.影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。

关于生存分析

关于生存分析 一、生存分析基本概念 1、事件(Event) 指研究中规定的生存研究的终点,在研究开始之前就已经制定好。根据研究性质的不同,事件可以是患者的死亡、疾病的复发、仪器的故障,也可以是下岗工人的再就业等等。 2、生存时间(Survival time) 指从某一起点到事件发生所经过的时间。生存是一个广义的概念,不仅仅指医学中的存活,也可以是机器出故障前的正常运行时间,或者下岗工人再就业前的待业时间等等。有的时候甚至不是通用意义上的时间,比如汽车在出故障前的行驶里程,也可以作为生存时间来考虑。 3、删失(Sensoring) 指由于所关心的事件没有被观测到或者无法观测到,以至于生存时间无法记录的情况。常由两种情况导致:(1)失访;(2)在研究终止时,所关心的事件还未发生。 4、生存函数(Survival distribution function) 又叫累积生存率,表达式为S(t)=P(T>t),其中T为生存时间,该函数的意义是生存时间大于时间点t的概率。t=0时S(t)=1,随着t的增加S(t)递减(严格的说是不增),1-S(t)为累积分布函数,表示生存时间T不超过t的概率。 二、生存分析的方法 1、生存分析的主要目的是估计生存函数,常用的方法有Kaplan-Meier法和寿命表法。对于分组数据,在不考虑其他混杂因素的情况下,可以用这两种方法对生存函数进行组间比较。 2、如果考虑其他影响生存时间分布的因素,可以使用Cox回归模型(也叫比例风险模型),利用数学模型拟合生存分布与影响因子之间的关系,评价影响因子对生存函数分布的影响程度。这里的前体是影响因素的作用不随时间改变,如果不满足这个条件,则应使用含有时间依存协变量的Cox回归模型。 三、实例 要研究某种新药治疗相对于常规药物治疗对生存率有无改善,收集以下数据: months:生存时间(单位月),为连续变量。 group:1=治疗组,2=对照组 status:0=出现结局,1=失访,2=实验结束时仍存活 三、操作步骤 菜单选择:

16种常用数据分析方法

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别; B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。 适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。 A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析 检査测量的可信度,例如调查问卷的真实性。 分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度

第9章生存分析思考与练习参考答案

第19章生存分析 思考与练习参考答案 一、最佳选择题 1. 下列有关生存时间的定义中正确的是( E )。 A.流行病学研究中,从开始接触某危险因素至某病发病所经历的时间 B.乳腺增生症妇女治疗后阳性体征消失至首次复发的时间 C.肺癌患者从手术治疗开始到死亡的时间 D.急性白血病患者从治疗开始到缓解的时间 E.以上均正确 2. 教材表19-18表是急性白血病患者药物诱导后缓解至首次复发的随访记录。 教材表19-18 急性白血病患者药物诱导后缓解至首次复发的随访记录 编号缓解日期终止观察日期结局生存时间/天 1 2000.04.01 2000.09.06 复发158 2 2001.11.05 2002.02.05 死亡91 3 2000.07.15 2000.12.10 复发147 4 2001.05.20 2001.08.2 5 失访96 5 2002.09.03 2002.12.31 缓解119 …………… 生存时间属删失数据的有(C)。 A.1号和3号B.1号和2号C.2号、4号和5号 D.2号、3号和4号E.1号、2号和3号 3. 下列有关log-rank检验的描述中正确的是(A)。 A.log-rank检验是各组生存率的整体比较 B.log-rank检验是各组生存率某时间点的比较 C.log-rank检验属生存曲线比较的参数法 D.log-rank检验中,各组实际死亡数必等于理论死亡数 E.log-rank检验的自由度为1 4. Log-rank检验与Breslow检验相比,( B )。 A.log-rank检验对组间死亡近期差异敏感

B.log-rank检验对组间死亡远期差异敏感 C.Breslow检验对组间死亡远期差异敏感 D.两者对组间死亡远期差异同样敏感 E.两者对组间死亡近期差异同样敏感 5. Cox回归模型要求两个不同个体在不同时刻t的风险函数之比(D)。 A.随时间增加而增加 B.随时间增加而减小 C.开始随时间增加而增加,后来随时间增加而减小 D.不随时间改变 E.视具体情况而定 二、思考题 1. 生存分析的主要用途及其统计学方法有哪些? 答:生存分析在生物医学领域主要解决如下问题。 估计:即根据一组生存数据估计它们所来自的总体的生存率及其他一些有关指标。如根据白血病化疗后的缓解时间资料,估计不同时间的缓解率、缓解率曲线以及半数生存期。估计生存率常用寿命表法和Kaplan-Meier(K-M)法。 比较:即比较不同受试对象生存数据的相应指标是否有差别。最常见的是比较各组的生存率是否有差别,如比较不同方案治疗白血病的缓解率曲线,以了解哪种治疗方案较优。生存曲线比较常用log-rank检验和Breslow检验。 影响因素分析:其目的是为了研究影响生存时间长短的因素,或在排除一些因素影响的情况下,研究某个或某些因素对生存率的影响。例如,为改善白血病患者的预后,应了解影响患者预后的主要因素,包括患者的年龄、病程、白细胞数、化疗方案等。影响因素分析常用Cox回归。 生存预测:具有不同因素水平的个体生存预测估计,如根据白血病患者的年龄、病程、白细胞数等预测该患者k年(月)生存率。生存预测常用Cox回归。 2. 生存率估计的K-M法和寿命表法是如何利用删失数据的?

相关主题
文本预览
相关文档 最新文档