第19章 生存分析与Cox模型——【SPSS精品教程】
- 格式:pptx
- 大小:1.07 MB
- 文档页数:30
一、生存分析基本概念1、事件(Event)指研究中规定的生存研究的终点,在研究开始之前就已经制定好。
根据研究性质的不同,事件可以是患者的死亡、疾病的复发、仪器的故障,也可以是下岗工人的再就业等等。
2、生存时间(Survival time)指从某一起点到事件发生所经过的时间。
生存是一个广义的概念,不仅仅指医学中的存活,也可以是机器出故障前的正常运行时间,或者下岗工人再就业前的待业时间等等。
有的时候甚至不是通用意义上的时间,比如汽车在出故障前的行驶里程,也可以作为生存时间来考虑。
3、删失(Sensoring)指由于所关心的事件没有被观测到或者无法观测到,以至于生存时间无法记录的情况。
常由两种情况导致:(1)失访;(2)在研究终止时,所关心的事件还未发生。
4、生存函数(Survival distribution function)又叫累积生存率,表达式为S(t)=P(T>t),其中T为生存时间,该函数的意义是生存时间大于时间点t的概率。
t=0时S(t)=1,随着t的增加S(t)递减(严格的说是不增),1-S(t)为累积分布函数,表示生存时间T不超过t的概率。
二、生存分析的方法1、生存分析的主要目的是估计生存函数,常用的方法有Kaplan-Meier法和寿命表法。
对于分组数据,在不考虑其他混杂因素的情况下,可以用这两种方法对生存函数进行组间比较。
2、如果考虑其他影响生存时间分布的因素,可以使用Cox回归模型(也叫比例风险模型),利用数学模型拟合生存分布与影响因子之间的关系,评价影响因子对生存函数分布的影响程度。
这里的前体是影响因素的作用不随时间改变,如果不满足这个条件,则应使用含有时间依存协变量的Cox回归模型。
下面用一个例子来说明SPSS中Cox回归模型的操作方法。
例题要研究胰腺癌术中放疗对患者生存时间的影响,收集了下面所示的数据:操作步骤:SPSS变量视图菜单选择:点击进入Cox主对话框,如下,将time选入“时间”框,将代表删失的censor变量选入“状态”框,其余分析变量选入“协变量”框。
生存分析:cox回归建模转自【Memo_Cleon】生存分析是分析生存时间的统计学方法,其因变量需要用生存时间和结局状态两个变量来刻画,可以将终点事件是否发生以及发生终点事件所经历的时间相结合起来。
生存分析的主要内容有生存时间的分布描述、生存时间分布的组间比较以及生存时间分布的影响因子的效果评估。
在SPSS中其分析过程存在于菜单"分析(Analyze)>>生存分析(Survival)"中。
本次笔记内容:▪几个概念▪寿命表法▪Kaplan-Meier法▪Cox比例风险模型回归▪含时依协变量的Cox回归【1】几个概念失效事件(Failure Event):常被简称为事件,研究者规定的终点结局,医学研究中可以是患者死亡,也可以是疾病的发生、某种治疗的反应、疾病的复发等。
与之对应的起始事件可以是疾病的确诊、某种治疗的开始等。
生存时间(Survival Time):常用t表示,从规定的起始事件开始到失效事件出现所持续的时间。
对于失访者,是失访前最后一次随访的时间。
删失/截尾(Censoring):由于某些原因在随访中并没有观测到失效事件而不知道确切的生存时间,此部分数据即删失数据。
常见原因有失访、患者退出试验、事件发生是由于非研究性疾病(如研究病人发生脑卒中后的生存时间,结果病人因为车祸死亡)、研究结束时研究对象仍未发生失效事件。
删失数据的生存时间为起始事件到截尾点所经历的时间。
生存函数(Survival Function)与风险函数(Hazard Function):生存函数也称为积累生存函数/概率(Cumulative Survival Function)或生存率,符号S(t),表示观察对象生存时间越过时间点t的概率,t=0时生存函数取值为1,随时间延长生存函数逐渐减小。
以生存时间为横轴、生存函数为纵轴连成的曲线即为生存曲线。
风险函数表示生存时间达到t后瞬时发生失效事件的概率,用h(t)表示,h(t)=f(t)/S(t)。
第19章⽣存分析案例辨析及参考答案第19章⽣存分析案例辨析及参考答案案例19-1某医师收集30例肺癌术后患者的⽣存情况,有1例由于电话和地址错误⽆法随访到患者,他设计了以下⼏种处理⽅法:①把该病例去掉;②把这例患者写⼊SPSS数据,但末次随访时间空⽩,让SPSS⾃动去分析;③因为某⼀天(⽐如2006年9⽉1⽇)想随访这例患者但是没有随访到,所以将末次随访时间写为随访当天的⽇期。
另欲分析肺癌术后患者的中位⽣存期,计算结果为10个⽉,但是检查原始数据发现,⽣存时间为10个⽉的这个患者⼀直存活到随访结束,似乎与中位⽣存期的定义相⽭盾。
请问:(1)该医师对这例失访患者的处理是否恰当?为什么?正确的处理⽅法是什么?(2)另有1例患者死于脑梗死,⽣存分析时应如何处理?(3)该医师的发现是否与中位⽣存期的定义相⽭盾?为什么?案例辨析(1)该医师对这例失访患者的三种处理都不恰当。
(2)死于脑梗死的病例同样应当作为删失病例。
(3)属于概念不清⽽产⽣的怀疑。
正确做法(1)应作为删失病例,删失⽣存时间的计算为从⼿术切除到最后⼀次随访的时间。
(2)死于脑梗死的病例应当作删失病例,删失⽣存时间的计算为从⼿术切除到死于脑梗死的时间。
(3)该医师的发现与中位⽣存期的定义并不⽭盾,中位⽣存期不能与个体⽣存时间相混淆。
案例19-2 评价A、B两种治疗⽅案对某病的治疗效果,A组(group=0)12⼈,B组(group =1)13⼈。
患者分组后检查其肾功能(kidney),功能正常者记为0,异常者记为1。
治疗后⽣存时间为time(天),⽣存结局status=0表⽰删失,status=1表⽰死亡。
原始数据见教材表19-11。
教材表19-11 25例某病患者两种治疗⽅法的⽣存情况No. group kidney time status No. group kidney time status1 0 1 8 1 14 1 0 632 12 0 0 852 0 15 1 0 2 240 03 0 1 52 1 16 1 0 195 14 0 0 220 1 17 1 0 76 15 0 1 63 1 18 1 0 70 16 0 0 8 1 19 1 1 13 17 0 0 1 976 0 20 1 1 23 18 0 0 1 296 0 21 1 0 1 296 19 0 0 1 460 0 22 1 0 210 110 0 1 63 1 23 1 0 700 111 0 0 1 328 0 24 1 1 18 112 0 0 365 0 25 1 0 1 990 013 1 0 180 1甲医师以⽣存结局为观察指标,整理得A、B两组死亡情况(教材表19-12)。
一、生存分析基本概念1、事件(Event)指研究中规定的生存研究的终点,在研究开始之前就已经制定好。
根据研究性质的不同,事件可以是患者的死亡、疾病的复发、仪器的故障,也可以是下岗工人的再就业等等。
2、生存时间(Survival time)指从某一起点到事件发生所经过的时间。
生存是一个广义的概念,不仅仅指医学中的存活,也可以是机器出故障前的正常运行时间,或者下岗工人再就业前的待业时间等等。
有的时候甚至不是通用意义上的时间,比如汽车在出故障前的行驶里程,也可以作为生存时间来考虑。
3、删失(Sensoring)指由于所关心的事件没有被观测到或者无法观测到,以至于生存时间无法记录的情况。
常由两种情况导致:(1)失访;(2)在研究终止时,所关心的事件还未发生。
4、生存函数(Survival distribution function)又叫累积生存率,表达式为S(t)=P(T>t),其中T为生存时间,该函数的意义是生存时间大于时间点t的概率。
t=0时S(t)=1,随着t的增加S(t)递减(严格的说是不增),1-S(t)为累积分布函数,表示生存时间T不超过t的概率。
二、生存分析的方法1、生存分析的主要目的是估计生存函数,常用的方法有Kaplan-Meier法和寿命表法。
对于分组数据,在不考虑其他混杂因素的情况下,可以用这两种方法对生存函数进行组间比较。
2、如果考虑其他影响生存时间分布的因素,可以使用Cox回归模型(也叫比例风险模型),利用数学模型拟合生存分布与影响因子之间的关系,评价影响因子对生存函数分布的影响程度。
这里的前体是影响因素的作用不随时间改变,如果不满足这个条件,则应使用含有时间依存协变量的Cox回归模型。
下面用一个例子来说明SPSS中Cox回归模型的操作方法。
例题要研究胰腺癌术中放疗对患者生存时间的影响,收集了下面所示的数据:操作步骤:SPSS变量视图菜单选择:点击进入Cox主对话框,如下,将time选入“时间”框,将代表删失的censor变量选入“状态”框,其余分析变量选入“协变量”框。