当前位置:文档之家› 第十四章 生存分析

第十四章 生存分析

第十四章生存分析

第一节 Life Tables过程

14.1.1 主要功能

14.1.2 实例操作

第二节 Kaplan-Meier过程

14.2.1 主要功能

14.2.2 实例操作

第三节 Cox Regression过程

14.3.1 主要功能

14.3.2 实例操作

在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。

第一节 Life Tables过程

14.1.1 主要功能

调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。

返回目录返回全书目录14.1.2 实例操作

[例14-1]用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。

14.1.2.1 数据准备

激活数据管理窗口,定义变量名:随访月数的变量名为TIME,是否死亡的变量名为DEATH,分组(即中药组与对照组)的变量名为GROUP。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2。

14.1.2.2 统计分析

激活Statistics菜单选Survival中的Life Tables...项,弹出Life Tables对话框(图14.1)。从对话框左侧的变量列表中选time,点击 钮使之进入time框;在Display Time Intervals 栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through框中输入48,在by框中输入2。选death,点击 钮使之进入Status框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Life Tables对话框。选group,点击 钮使之进入Factor框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable对话框,定义分组的范围,在Mininum框中输入1,在Maxinum框中输入2,点击Continue钮返回Life Tables对话框。

图14.1 生存资料的寿命表分析对话框

点击Options...钮弹出Life Tables: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图;在Compare Levels of First Factor栏中选Overall项,要求作组间生存状况的比较。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。

14.1.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

共有26个观察对象进入分析。系统先显示中药组(group = 1)的生存状况寿命表,按用户指定,从0月起,隔2个月直至42个月(原指定从0—48个月,但因42个月后,生存概率已为0,故42个月后至48个月的生存状况不再显示),分别显示进入该时点例数(Number Entrng this Intrvl)、从该时点失去的例数(Number Wdrawn Durong Intrvl)、该时点暴露于死亡危险的例数(Number Exposd to Risk)、该时点死亡的例数(Number of Termnl Events)、该时点死亡概率(Propn Terminating)、该时点生存概率(Propn Surviving)、该时点末生存率(Propn Surv at End)、单位时点的累积概率(Cumul Probability Densty)、该时点风险比例(Hazard Rate)、生存率的标准误(SE of Cumul Surviving)、单位时点累积概率的标准误(SE of Probability Densty)、风险比例的标准误(SE of Hazard Rate)。如本例,用中药+化疗的方式治疗白血病患者,至8个月时,死亡率为17.39%,生存概率为82.61%,生存率为66.38%,风险比例为9.52%。至42个月时,生存概率和生存率均为0,此时风险比例为100%。中药组的50%生存率在19.44个月。

对照组同类结果的显示,因在16个月时生存概率已为0,故仅从0月起,隔2个月至16个月止。分析显示,单纯用化疗,白血病患者的半数生存率约在16个月多一点,比中药组少三个月。

Number Number Number Number Cumul SE of SE of

Intrvl Entrng Wdrawn Exposd of Propn Propn Propn Proba- Cumul Proba- SE o Start this During to Termnl Termi- Sur- Surv bility Hazard Sur- bility Haza Time Intrvl Intrvl Risk Events nating viving at End Densty Rate viving Densty R ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ .0 16.0 .0 16.0 .0 .0000 1.0000 1.0000 .0000 .0000 .0000 .0000 .000 2.0 16.0 .0 16.0 1.0 .0625 .9375 .9375 .0313 .0323 .0605 .0303 .03 4.0 15.0 1.0 14.5 .0 .0000 1.0000 .9375 .0000 .0000 .0605 .0000 .00 6.0 14.0 .0 14.0 2.0 .1429 .8571 .8036 .0670 .0769 .1019 .0441 .05 8.0 12.0 1.0 11.5 2.0 .1739 .8261 .6638 .0699 .0952 .1231 .0458 .06 10.0 9.0 1.0 8.5 .0 .0000 1.0000 .6638 .0000 .0000 .1231 .0000 .00 12.0 8.0 1.0 7.5 1.0 .1333 .8667 .5753 .0443 .0714 .1348 .0420 .07 14.0 6.0 .0 6.0 .0 .0000 1.0000 .5753 .0000 .0000 .1348 .0000 .00 16.0 6.0 .0 6.0 .0 .0000 1.0000 .5753 .0000 .0000 .1348 .0000 .00 18.0 6.0 1.0 5.5 1.0 .1818 .8182 .4707 .0523 .1000 .1453 .0489 .09 20.0 4.0 .0 4.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 22.0 4.0 .0 4.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 24.0 4.0 1.0 3.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 26.0 3.0 1.0 2.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 28.0 2.0 .0 2.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 30.0 2.0 1.0 1.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 32.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 34.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 36.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 38.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 40.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .00 42.0 1.0 .0 1.0 1.0 1.0000 .0000 .0000 .2354 1.0000 .0000 .0727 .00

The median survival time for these data is 19.44

Life Table

Survival Variable TIME

for GROUP = 2

Number Number Number Number Cumul SE of SE of

Intrvl Entrng Wdrawn Exposd of Propn Propn Propn Proba- Cumul Proba- SE o Start this During to Termnl Termi- Sur- Surv bility Hazard Sur- bility Haza Time Intrvl Intrvl Risk Events nating viving at End Densty Rate viving Densty R ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ .0 10.0 1.0 9.5 .0 .0000 1.0000 1.0000 .0000 .0000 .0000 .0000 .000 2.0 9.0 1.0 8.5 1.0 .1176 .8824 .8824 .0588 .0625 .1105 .0553 .06 4.0 7.0 .0 7.0 .0 .0000 1.0000 .8824 .0000 .0000 .1105 .0000 .00 6.0 7.0 2.0 6.0 1.0 .1667 .8333 .7353 .0735 .0909 .1628 .0678 .09 8.0 4.0 .0 4.0 .0 .0000 1.0000 .7353 .0000 .0000 .1628 .0000 .00 10.0 4.0 1.0 3.5 1.0 .2857 .7143 .5252 .1050 .1667 .2122 .0918 .16

接着显示两组比较的结果。系统采用Gehan比分检验法,得u = 0.012,P = 0.9113,即中药组与对照组的生存率无差别。

最后,系统输出生存率曲线图(图14.2)。从图中可见,对照组(group = 2)在8个月前一段时点的生存率均较中药组(group = 1)略低,而8-12个月这一段其生存率又较中药组略高,12个月后再又下降。但在治疗中加用中药,对个别患者而言,20个月后依然有一定的生存率。

返回目录返回全书目录

第二节 Kaplan-Meier过程

14.2.1 主要功能

调用此过程,系统将采用Kaplan-Meier方法,对病例随访资料进行生存分析,在对应于每一实际观察事件时点上,作生存率的评价。

返回目录返回全书目录

14.2.2 实例操作

[例14-2]25例某癌症病人在不同时期经随机化分配到A、B治疗组进行治疗,同时随访观察至1974年5月31日结束,资料整理后如下表,试对其结果进行生存率分析。

14.2.2.1 数据准备

激活数据管理窗口,定义变量名:随访天数为TIME,是否死亡为DEATH,治疗方式为TREAT。变量TIME按原数值输入,DEATH为是的输入1、否的输入0,TREAT为A的输入1、为B的输入2。

14.2.2.2 统计分析

激活Statistics菜单选Survival中的Kaplan-Meier...项,弹出Kaplan-Meier对话框(图14.3)。从对话框左侧的变量列表中选time,点击 钮使之进入time框;选death,点击 钮使之进入Status框,点击Define Event...钮弹出Kaplan-Meier:Define Event for Status Variable 对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Kaplan-Meier对话框。选treat,点击 钮使之进入Factor框。

图14.3 Kaplan-Meier法生存率分析对话框

点击Save... 钮弹出Kaplan-Meier:Save New Variables对话框,选Survival项,要求将各观察样例的生存率存入原始数据库中。点击Continue钮返回Kaplan-Meier对话框。

点击Options...钮弹出Kaplan-Meier: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。

14.2.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

先对A治疗组资料进行分析。将原资料按生存天数的大小顺次排列,再逐例显示生存状态(Status,即死亡为1、生存为2)、生存率(Cumulative Survival)、生存率标准误(Standard Error)、累积死亡例数(Cumulative Event)和尚存活人数(Number Remaining)。如本例,A 组共12人,死亡6人,生存6人,存活率为50.00%;平均生存时间为1023天,标准误为

276,95%可信区间为482—1563天。B组共13人,死亡12人,生存1人,存活率为7.69%;平均生存时间为607天,标准误为226,95%可信区间为163—1051天。

Factor TREAT = A

Time Status Cumulative Standard Cumulative Number

Survival Error Events Remaining

8 1 1 11

8 1 .8333 .1076 2 10

52 1 .7500 .1250 3 9

63 1 4 8

63 1 .5833 .1423 5 7

220 1 .5000 .1443 6 6

365 0 6 5

852 0 6 4

1296 0 6 3

1328 0 6 2

1460 0 6 1

1976 0 6 0

Number of Cases: 12 Censored: 6 ( 50.00%) Events: 6

Survival Time Standard Error 95% Confidence Interval

Mean: 1023 276 (482, 1563 )

(Limited to 1976 )

Median: 220 . ( ., . )

Factor TREAT = B

Time Status Cumulative Standard Cumulative Number

Survival Error Events Remaining

13 1 .9231 .0739 1 12

18 1 .8462 .1001 2 11

23 1 .7692 .1169 3 10

70 1 .6923 .1280 4 9

76 1 .6154 .1349 5 8

180 1 .5385 .1383 6 7

195 1 .4615 .1383 7 6

210 1 .3846 .1349 8 5

632 1 .3077 .1280 9 4

700 1 .2308 .1169 10 3

1296 1 .1538 .1001 11 2

1990 0 11 1

系统按用户的请求输出生存率曲线图(图14.4)。从图中可见,生存天数为200左右之前,A、B两组的生存率相近,而后,A组维持约50%的生存率,B组则不断下降。

最后系统将各观察对象的生存率计算结果,逐一送入原始数据库保存(图14.5),变量名为sur_1。用户从中可见,如A组治疗8天死亡者,其8天的生存率为83.333%;又如B 组治疗180天死亡者,其180天的生存率为53.846%。

返回目录返回全书目录第三节 Cox Regression过程

14.3.1 主要功能

调用此过程可完成对病例随访资料中事件发生时点与一系列相关独立变量之间关系的评价,即建立Cox回归模型(亦称比例风险模型)。

第一、二节介绍的方法,仅仅是对生存资料作较简单的统计,即描述和分析一个因素(如治疗方式)对生存时间的影响。而在Cox回归模型中,某一时点t,除了有一个本底风险量

h0(t)外,第i个影响因素可使该本底风险量h0(t)增至e βixi

倍而成为h0(t)·e

βixi

。因

此如果有k个因素同时影响生存过程,那么时点t的风险量(常称之为风险函数)表达为:h(t) = h0(t) ·e

(β1x1+β2x2+...+βkxk)

返回目录返回全书目录

14.3.2 实例操作

[例14-3]某医师在研究急性白血病患者的生存率时,收集了33名患者的资料,按Ag 阳、阴性分组(Ag阳性组17例,Ag阴性组16例),同时考察白细胞数的影响作用。试据下表资料作Cox回归模型的分析。

14.3.2.1 数据准备

激活数据管理窗口,定义变量名:生存月数为TIME,是否死亡为DEATH,白细胞数为WBC,Ag阳性与否为AG。TIME按原数据输入,DEATH是的输入1、否的输入0,WBC亦按原数据输入,AG阳性的输入1、阴性的输入2。

14.3.2.2 统计分析

激活Statistics菜单选Survival中的Cox Regression...项,弹出Cox Regression对话框(图14.6)。从对话框左侧的变量列表中选time,点击 钮使之进入time框;选death,点击 钮使之进入Status框,点击Define Event...钮弹出Cox Regression:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue 钮返回Cox Regression对话框。选wbc和ag,点击 钮使之进入Covariates框。

图14.6 Cox回归模型分析对话框

在Method处有一下拉菜单,系统提供7种回归运算方法让用户选择:

1、Enter:所有自变量强制进入回归方程;

2、Forward: Conditional:以假定参数为基础作似然比概率检验,向前逐步选择自变量;

3、Forward: LR:以最大局部似然为基础作似然比概率检验,向前逐步选择自变量;

4、Forward: Wald:作Wald概率统计法,向前逐步选择自变量;

5、Backward: Conditional:以假定参数为基础作似然比概率检验,向后逐步选择自变量;

6、Backward: LR:以最大局部似然为基础作似然比概率检验,向后逐步选择自变量;

7、Backward: Wald:作Wald概率统计法,向后逐步选择自变量。

本例因自变量较少,故选用Enter法。

点击Plots...钮弹出Cox Regression:Plots对话框,在Polts Type栏中选Survival项,要求绘制生存率曲线图,同时选Hazard项,要求绘制风险量变化图。然后点击Continue钮返回Cox Regression对话框。

点击Save... 钮弹出Cox Regression:Save New Variables对话框,在Survival栏中选Function项,要求将生存率计算结果存入原数据库;在Diagnostics处选Hazard function项,要求将风险函数计算结果存入原数据库;再选X*Beta项,要求计算各自变量与其系数的乘积并存盘。完成选择后点击Continue钮返回Cox Regression对话框。

点击Options...钮弹出Cox Regression:Options对话框,在Model Statistics栏中选At last step项,要求只显示回归方程拟合过程的最终结果;同时选Display baseline function项,要求显示各样本的本底风险量。之后点击Continue钮返回Cox Regression对话框,再点击OK 钮即完成分析。

14.3.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

系统显示共有33例样本进入分析,其中29例在观察期内死亡,4例仍存活,存活率为12.1%。Cox回归方程拟合结果的χ2检验,χ2值为11.773,P = 0.0028,表明AG与WBC

两自变量对生存状态均有作用。得到风险量增加倍数为e

(0.0089×WBC - 1.1219×AG)

,其中白

细胞数的变量系数为正值,意味着白细胞数愈高,死亡风险愈大;Ag 的变量系数为负,意味着Ag 阳性者,死亡风险小。

接着,系统显示各生存时点(亦即各样本)的本底风险量(Cum Hazard )、生存率(Survival )、生存率的标准误(SE )和本底风险量的标准误(SE of Cum hazard )。并提示将在原数据库中产生三个新的变量,即生存率、风险比例和风险量倍数。

从输出的Cox模型生存率曲线图(图14.7)中可见,随时间的延长,患者生存率逐渐下降,接近160个月时,生存率几乎为0。

下图为Cox模型的风险量曲线图,其趋势也十分明显,即随时间的延长,患者在生存上所经历的死亡风险愈来愈大,到140个月时,大约是起初(0个月)的5倍。

系统在原始数据库中将生存率以变量sur_1、风险比例以变量haz_1和风险量倍数以变量xbe_1存盘(图14.9)。用户从中可见,如经治疗后1月内死亡、其白细胞数为100.0×109 /L、Ag阳性者,生存率为94.592%、风险比例为5.560%、风险量倍数为0.08695;又如经治疗后26月内尚存活、其白细胞数为32.0×109 /L、Ag阳性者,生存率为66.318%、风险比例为41.070%、风险量倍数为-0.51874。

第十四章spss之生存分析2张文彤

第十四章活着--Survival菜单详解(下) (医学统计之星:董伟) 上次更新日期: 13.1 Life Tables过程 13.1.1 界面说明 13.1.2 结果解释 13.2 Kaplan-Meier过程 13.2.1 界面说明 13.2.2 结果解释 13.3 Cox Regression过程 13.3.1 界面说明 13.3.2 结果解释 13.4 Cox w/Time-Dep Cov过程 13.4.1 界面说明 13.4.2 结果解释 §13.3 Cox Regression过程上面给大家介绍的是两种生存分析方法,但它们只能研究一至两个因素对生存时间的影响,当对生存时间的影响因素有多个时,它们就无能为力了,下面我给大家介绍Cox Regression过程,这是一种专门用于生存时间的多变量分析的统计方法。 Cox Regression过程主要用于:

1、用以描述多个变量对生存时间的影响。此时可控制一个或几个因素,考察其他因素对生存时间的影响,及各因素之间的交互作用。 例13.3 40名肺癌患者的生存资料(详见胡克震主编的《医学随访统计方法》1993,77页) 生存时间状态生活能力评分年龄诊断到研究时间鳞癌小细胞癌腺癌疗法癌症类别411 1 70 64 5 1 0 0 1 1.00 126 1 60 63 9 1 0 0 1 1.00 118 1 70 65 11 1 0 0 1 1.00 注:原数据库是用亚变量定义肺癌分类:0,0,0为其它癌;1,0,0为鳞癌;0,1,0为小细胞癌;0,0,1为腺癌。表中的最后一个变量是我加上去的癌症类别,1为鳞癌;2为小细胞癌;3为腺癌;4为其它癌。实践表明结果与用亚变量计算一样。 13.3.1 界面说明 图9 Cox回归主对话框

第19章 生存分析思考与练习参考答案

第19章生存分析 思考与练习参考答案 一、最佳选择题 1. 下列有关生存时间的定义中正确的是( E )。 A.流行病学研究中,从开始接触某危险因素至某病发病所经历的时间 B.乳腺增生症妇女治疗后阳性体征消失至首次复发的时间 C.肺癌患者从手术治疗开始到死亡的时间 D.急性白血病患者从治疗开始到缓解的时间 E.以上均正确 2. 教材表19-18表是急性白血病患者药物诱导后缓解至首次复发的随访记录。 教材表19-18 急性白血病患者药物诱导后缓解至首次复发的随访记录编号缓解日期终止观察日期结局生存时间/天 1 2000.04.01 2000.09.06 复发158 2 2001.11.05 2002.02.05 死亡91 3 2000.07.15 2000.12.10 复发147 4 2001.05.20 2001.08.2 5 失访96 5 2002.09.03 2002.12.31 缓解119 …………… 生存时间属删失数据的有(C)。 A.1号和3号B.1号和2号C.2号、4号和5号 D.2号、3号和4号E.1号、2号和3号 3. 下列有关log-rank检验的描述中正确的是(A)。 A.log-rank检验是各组生存率的整体比较 B.log-rank检验是各组生存率某时间点的比较 C.log-rank检验属生存曲线比较的参数法 D.log-rank检验中,各组实际死亡数必等于理论死亡数 E.log-rank检验的自由度为1 4. Log-rank检验与Breslow检验相比,( B )。 A.log-rank检验对组间死亡近期差异敏感

B.log-rank检验对组间死亡远期差异敏感 C.Breslow检验对组间死亡远期差异敏感 D.两者对组间死亡远期差异同样敏感 E.两者对组间死亡近期差异同样敏感 5. Cox回归模型要求两个不同个体在不同时刻t的风险函数之比(D)。 A.随时间增加而增加 B.随时间增加而减小 C.开始随时间增加而增加,后来随时间增加而减小 D.不随时间改变 E.视具体情况而定 二、思考题 1. 生存分析的主要用途及其统计学方法有哪些? 答:生存分析在生物医学领域主要解决如下问题。 估计:即根据一组生存数据估计它们所来自的总体的生存率及其他一些有关指标。如根据白血病化疗后的缓解时间资料,估计不同时间的缓解率、缓解率曲线以及半数生存期。估计生存率常用寿命表法和Kaplan-Meier(K-M)法。 比较:即比较不同受试对象生存数据的相应指标是否有差别。最常见的是比较各组的生存率是否有差别,如比较不同方案治疗白血病的缓解率曲线,以了解哪种治疗方案较优。生存曲线比较常用log-rank检验和Breslow检验。 影响因素分析:其目的是为了研究影响生存时间长短的因素,或在排除一些因素影响的情况下,研究某个或某些因素对生存率的影响。例如,为改善白血病患者的预后,应了解影响患者预后的主要因素,包括患者的年龄、病程、白细胞数、化疗方案等。影响因素分析常用Cox回归。 生存预测:具有不同因素水平的个体生存预测估计,如根据白血病患者的年龄、病程、白细胞数等预测该患者k年(月)生存率。生存预测常用Cox回归。 2. 生存率估计的K-M法和寿命表法是如何利用删失数据的? 答:常见的右删失数据表示真实的生存时间未知,只知道比观察到的删失时间要长。因此,生存率估计的K-M法和寿命表法计算期初例数时,都利用了删失数据提供的这部分信息。

生存分析

生存分析 本数据资料主要探讨不同处理对生存时间的影响,数据中,treat为连续变量,num2_treat为二分类变量,num3_treat为三分类等级变量。共纳入病人200例,进行生存分析步骤如下: 1.生存资料的定义: 命令:stset[时间变量] [截尾变量] 对应本数据为:stset time mortality 结果: 1)其中time指随访时间,即产生预期结果或者截尾时的时间减去纳入随访时的初始时间得到的天数。 2)Mortality为截尾变量,Stata视变量mortality不等于0的非缺失值为出现预期结果。3)Stata会同时产生4个新的变量: _st代表:数据中该条记录是否被定义为生存资料。 _d 代表:数据中该条记录是否出现预期结果。 _t 代表:数据中观察对象被随访的时间。 _t0 代表:数据中观察对象第一次被观察到的时间(开始过程的时间为0) 2.生存资料的描述。 1)计算中位生存时间的命令: stsum[if 表达式] ,[by(分组变量)选择项] 对应本数据:stsum,by(num2_treat) 结果:

由于两组中截尾数据出现的较早,故25%、50%和75%生存时间无法估计,Stata用缺失值表示。 4)stci命令可以用来计算中位生存时间、平均生存时间、生存时间的百分数及其可信区间。 命令:stci [if 表达式],[by(分组变量) 选择项] 其中选择项有:median(计算中位生存时间);rmean(计算平均生存时间) P(#)(生存时间的百分数);level(#)(可信区间的可信度)对应本数据:stci,by(num2_treat) median 结果: 同样由于两组中截尾数据出现的较早,故中位生存时间无法估计,Stata用缺失值表示。 stci,by(num2_treat) rmean 结果:

第十五章 生存分析第一节生存资料的特点

第十五章生存分析 第一节生存资料的特点 前面有关章节介绍了多种定量资料和定性资料的统计分析方法。下面是一个临床实例,请思考该资料的特点,应选用何种统计方法进行统计分析较为合适。 某医生将22例肺癌患者随机分为两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,随访时间(月)如下(带“+”号的数据表示患者至少存活了多少个月)。试比较化疗和放化疗联合治疗肺癌的疗效是否有差别。 化疗组1,2,3,5,6,9+,11,13,16,26,37+ 放化疗联合组10,11+,14,18,22,22,26,32,38,40+,42+ 该医生的研究目的是评价化疗和放化疗联合治疗两种临床治疗措施的疗效。临床治疗措施的疗效评价,一方面要看治疗措施所引起的“结局”(该资料中,即为“生存”或“死亡”),另一方面还要看得到这种结局所经历的时间长短(该资料中,即为患者接受化疗或放化疗联合治疗后存活多长时间,或患者接受化疗或放化疗联合治疗后多长时间发生死亡)。显然,结局为“生存”且存活时间越长,其疗效就越好。反之,结局为“死亡”且存活时间越短,其疗效就越差。结局虽然都是“死亡”,但能够使患者生存时间越长的临床治疗措施的疗效就越好。 从前面几个章节所学习的内容来看,可以考虑的方法有t检验、方差分析或秩和检验。但t检验和方差分析都要求所比较的两个样本来自正态分布总体,而该资料两个组中均有带“+”号的数据,其提供的信息不完整,如“9+”表示该患者至少存活了9个月,但准确死亡时间不清楚,这就导致两个样本的总体分布不明确,不满足t检验和方差分析的应用条件。退一步说,即使该资料满足t检验和方差分析的应用条件,但由于这两种方法均只是比较患者接受化疗和放化疗联合治疗后的生存时间有无差别,并未分析两种治疗措施的结局有无差别,因而达不到综合评价这两种治疗措施疗效的目的。因此,不宜采用t检验或方差分析。秩和检验虽不对样本所来自的总体作严格限定,但它也只能比较患者接受两种治疗措施后的生存时间有无差别,并不能分析两种治疗措施的结局有无差别,因而也达不到综合评价这两种治疗措施疗效的目的。因此,该资料也不适宜采用秩和检验。 那么,能否将其转变为定性资料后采用定性资料的统计分析方法进行分析?

第14章 创新

思考题 1.什么是创新?创新具有哪些原则? 答:组织在经济活动过程中,为达到目标,对各种资源进行新的、更有效的整合的行为过程。创新不仅包括创造新技术、新产品、新材料、新工艺,也包括创造新市场、新的管理制度和管理方法等。 4.什么是技术创新?具有什么特点?包括哪些方面? 答:技术创新是创新的重要组成部分,是创新活动中最重要的因素。从广义上说,技术创新是在科学技术上的新发现、新发明转化为社会生产力全过程的活动;从狭义上说或,技术创新是指在生产技术或服务技术方面改进或革新的一系列活动。技术创新包括以下几个方面:(1)产品创新。对一个企业而言,生产的产品是企业生存与发展的根本,企业的产品在市场上的受欢迎程度是企业市场竞争成败的主要原因。产品创新包括老产品的改造与新产品的开发。这种改造与开发是指对产品的结构、性能、材质、技术特征等一方面或几方面的改进或发明。它可以是利用新发明、新技术开发出一种全新的产品;也可以是在原有产品基础上部分采用新技术生产出来的满足新需要的换代型产品。 (2)工艺创新。工艺创新是指生产工艺的改革与操作方法的改进。生产工艺是企业生产产品的总体流程与方法,包括工艺过程、工艺参数和工艺配方等。生产工艺改进的典型案例为汽车生产方式的改变,汽车生产由传统的手工生产模式转向现在的流水线生产模式,极大地提高了汽车企业的生产率。操作方法是指劳动者利用生产设备在

个体生产环节对原材料、零部件或半成品进行加工的方法。 (3)材料创新。材料是企业产品和生产手段的基础,也是生产工艺和加工方法作用的对象。材料创新一方面是指寻找和发现现有材料的新用途,生产出新的产品以满足社会的需要,另一方面是指利用新技术与新知识制造新的合成材料。材料创新有着广泛的应用前景,如在制造业中广泛采用的各种新型材料就是材料创新的成功典范。(4)手段创新。手段创新主要是指企业生产的物质条件的改造与更新。企业应当注意生产手段的创新,以生产优质、低成本的产品占领市场。生产手段的创新主要包括两个方面:一方面是将先进的科学技术用于改进或革新现有的设备;另一方面是用更先进、更经济的生产手段取代现有的陈旧的、效率低下的生产手段。 6.技术创新的基本战略是什么? 答:(1)自主创新。所谓自主创新,是指企业主要依靠着自身的技术力量进行研究开发,并在此基础上,实现科技成果的商品化,最终获得市场的认可。自主创新具有率先性,因为一种新技术或者一种新产品的率先创新者只有一家,而其他采用这项技术、生产这种产品的企业都是创新的跟随者或模仿者,“北大方正”推出电子出版系统便是一个自主创新的典型实例。自主创新要求企业有雄厚的研究开发实力和研究成果积累,处于技术的领先地位,否则是做不到率先创新的。 (2)模仿创新。所谓模仿创新,是指在率先创新的示范影响和利益诱导之下,企业通过合法手段(如通过购买专有技术或专利许可的方式)引进技术,并在率先者技术的基础上进行改进的一种创新形

生存分析

Chapter7 Survival Models Our?nal chapter concerns models for the analysis of data which have three main characteristics:(1)the dependent variable or response is the waiting time until the occurrence of a well-de?ned event,(2)observations are cen-sored,in the sense that for some units the event of interest has not occurred at the time the data are analyzed,and(3)there are predictors or explanatory variables whose e?ect on the waiting time we wish to assess or control.We start with some basic de?nitions. 7.1The Hazard and Survival Functions Let T be a non-negative random variable representing the waiting time until the occurrence of an event.For simplicity we will adopt the terminology of survival analysis,referring to the event of interest as‘death’and to the waiting time as‘survival’time,but the techniques to be studied have much wider applicability.They can be used,for example,to study age at marriage, the duration of marriage,the intervals between successive births to a woman, the duration of stay in a city(or in a job),and the length of life.The observant demographer will have noticed that these examples include the ?elds of fertility,mortality and migration. 7.1.1The Survival Function We will assume for now that T is a continuous random variable with prob-ability density function(p.d.f.)f(t)and cumulative distribution function (c.d.f.)F(t)=Pr{T≤t},giving the probability that the event has oc-curred by duration t. G.Rodr′?guez.Revised September,2007

第十四章 生存分析

第十四章生存分析的Stata实现 本章使用的STATA命令: 结局变量为1表示失效事件发生 例14-2 McKelvey et al(1976)收集了3期的某型淋巴瘤患者的生存时间(天)。分别是6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253,255+,270+,310+,316+,335+,346+。现用Kaplan-Meier法计算生存率。

Stata命令为: stset time,failure(d) sts list sts graph 结果为:

例14-3 下面是来自于Berkson & Gage(1950)的一个研究队列。为了叙述方便,把原来的出院后的生存时间改称为某恶性肿瘤术后生存时间。共有374名患者进入研究队列。 表14-3 寿命表法计算生存率的计算用表 (1) (2) (3) (4) (5) (6) (7) (8) (9) 序号术后生存 年数 期初观察 例数 期内 死亡 期内截尾 人数 校正期初 人数 死亡 概率 生存 概率 生存率t n d c n c=n-c/2 q=d/n c p=1-q S(t) 1 0~374 90 0 374 0.2406 0.7594 0.7594 2 1~284 76 0 284 0.2676 0.7324 0.5561 3 2~208 51 0 208 0.2452 0.7548 0.4198 4 3~157 2 5 12 151 0.165 6 0.8344 0.3503 5 4~120 20 5 117.5 0.1702 0.8298 0.2907 6 5~95 7 9 90.5 0.0773 0.9227 0.2682 7 6~79 4 9 74.5 0.0537 0.9463 0.2538 8 7~66 1 3 64.5 0.0155 0.9845 0.2498 9 8~62 3 5 59.5 0.0504 0.9496 0.2372 10 9~54 2 5 51.5 0.0388 0.9612 0.2280 11 10+47 21 26 34 0.6176 0.3824 0.0872 Stata数据格式为:

第9章生存分析思考与练习参考答案

! 第19章生存分析 思考与练习参考答案 一、最佳选择题 1. 下列有关生存时间的定义中正确的是( E )。 A.流行病学研究中,从开始接触某危险因素至某病发病所经历的时间 B.乳腺增生症妇女治疗后阳性体征消失至首次复发的时间 C.肺癌患者从手术治疗开始到死亡的时间 D.急性白血病患者从治疗开始到缓解的时间 ! E.以上均正确 2. 教材表19-18表是急性白血病患者药物诱导后缓解至首次复发的随访记录。 教材表19-18 急性白血病患者药物诱导后缓解至首次复发的随访记录编号缓解日期终止观察日期结局生存时间/天 1 复发 158 2 死亡 91 3 复发 147 4 失访 96 : 5 缓解 119 …………… 生存时间属删失数据的有(C)。 A.1号和3号 B.1号和2号 C.2号、4号和5号 D.2号、3号和4号 E.1号、2号和3号 3. 下列有关log-rank检验的描述中正确的是(A)。 A.log-rank检验是各组生存率的整体比较 B.log-rank检验是各组生存率某时间点的比较 : C.log-rank检验属生存曲线比较的参数法 D.log-rank检验中,各组实际死亡数必等于理论死亡数

E.log-rank检验的自由度为1 4. Log-rank检验与Breslow检验相比,( B )。 A.log-rank检验对组间死亡近期差异敏感 B.log-rank检验对组间死亡远期差异敏感 C.Breslow检验对组间死亡远期差异敏感 D.两者对组间死亡远期差异同样敏感 — E.两者对组间死亡近期差异同样敏感 5. Cox回归模型要求两个不同个体在不同时刻t的风险函数之比(D)。 A.随时间增加而增加 B.随时间增加而减小 C.开始随时间增加而增加,后来随时间增加而减小 D.不随时间改变 E.视具体情况而定 二、思考题 。 1. 生存分析的主要用途及其统计学方法有哪些 答:生存分析在生物医学领域主要解决如下问题。 估计:即根据一组生存数据估计它们所来自的总体的生存率及其他一些有关指标。如根据白血病化疗后的缓解时间资料,估计不同时间的缓解率、缓解率曲线以及半数生存期。估计生存率常用寿命表法和Kaplan-Meier(K-M)法。 比较:即比较不同受试对象生存数据的相应指标是否有差别。最常见的是比较各组的生存率是否有差别,如比较不同方案治疗白血病的缓解率曲线,以了解哪种治疗方案较优。生存曲线比较常用log-rank检验和Breslow检验。 影响因素分析:其目的是为了研究影响生存时间长短的因素,或在排除一些因素影响的情况下,研究某个或某些因素对生存率的影响。例如,为改善白血病患者的预后,应了解影响患者预后的主要因素,包括患者的年龄、病程、白细胞数、化疗方案等。影响因素分析常用Cox回归。

第十四章生存分析的SAS实现

第十四章生存分析的SAS实现 例14-2 McKelvey et al(1976)收集了3期的某型淋巴瘤患者的生存时间(天)。分别是6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253,255+,270+,310+,316+,335+,346+。 SAS分析程序 SAS软件输出结果

SAS软件输出结果解释 该结果包含四个部分:第一部分用乘积极限法估计了生存率(Survival),死亡率(Failure),生存率的标准误(Survival Standard Error),死亡例数(Number Failed)和该时间点前的生存例数(Number Left)。其中带有*号的表示截尾;第二部分给出了关于生存时间的描述性统计量,包括75%,50%和25%分位数以及相应的95%的可信区间(95% Confidence Interval),还有均数(Mean)和标准误(Standard Error)从结果可以看出平均生存时间为181.701天;第三部分列出了完全数据(Failed),截尾数据(Censored)的例数,以及截尾数据占全部数据的百分比(Percent Censored)。最后是生存曲线图。 教材中的说明 现用Kaplan-Meier法计算生存率,步骤如下: (1)将所有生存时间按从小到大顺序排列(见表14-2第(2)列)并标上序号(第(1)列)。 (2)列出各t时点前的存活病例数n(第(3)列)、各个时间点的死亡人数d (第(4)列)和截尾人数c(第(5)列)。

(3)计算各t 时刻的死亡概率/q d n =(第(6)列)。例如生存时间为32天时,死亡概率为1/170.058824q ==。 (4)计算各t 时刻的生存概率1p q =-(第(7)列)。例如生存时间为32天时,生存概率为1-0.0588240.941176p ==。 (5)计算各t 时刻的生存率12()i i S t p p p = (第(8)列)。例如生存时间为32天时,生存率为18171616 (32)0.94117619181719 S = ??==,由此验证了在没有截尾数据的情况下,式(14-4)与式(14-5)是相同的。 (6)以时间t 为横指标,生存率为纵指标,作生存曲线图(图14-1)。 表14-2 Kaplan-Meier 法计算生存率的计算用表 (1) (2) (3) (4) (5) (6) (7) (8) 序号 生存 天数 t 时刻前 的例数n t 时刻 死亡数d t 时刻后 截尾人数c 死亡 概率q 生存 概率p 生存率 S (t ) 1 6 19 1 0 0.052632 0.947368 0.947368 2 19 18 1 0 0.055556 0.944444 0.894737 3 32 17 1 0 0.058824 0.941176 0.842105 4 42 16 2 0 0.125000 0.875000 0.736842 6 43 14 0 1 0.000000 1.000000 0.736842 7 94 13 1 0 0.076923 0.923077 0.680162 8 126 12 0 1 0.000000 1.000000 0.680162 9 169 11 0 1 0.000000 1.000000 0.680162 10 207 10 1 0 0.100000 0.900000 0.612146 11 211 9 0 1 0.000000 1.000000 0.612146 12 227 8 0 1 0.000000 1.000000 0.612146 13 253 7 1 0 0.142857 0.857143 0.524696 14 255 6 0 1 0.000000 1.000000 0.524696 15 270 5 0 1 0.000000 1.000000 0.524696 16 310 4 0 1 0.000000 1.000000 0.524696 17 316 3 0 1 0.000000 1.000000 0.524696 18 335 2 0 1 0.000000 1.000000 0.524696 19 346 1 0 1 0.000000 1.000000 0.524696

第十四章 生存分析

第十四章生存分析 第一节 Life Tables过程 14.1.1 主要功能 14.1.2 实例操作 第二节 Kaplan-Meier过程 14.2.1 主要功能 14.2.2 实例操作 第三节 Cox Regression过程 14.3.1 主要功能 14.3.2 实例操作 在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。 第一节Life Tables过程 14.1.1主要功能 调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。 14.1.2实例操作 [例14-1]用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。

14.1.2.1数据准备 激活数据管理窗口,定义变量名:随访月数的变量名为TIME,是否死亡的变量名为DEATH,分组(即中药组与对照组)的变量名为GROUP。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2。 14.1.2.2统计分析 激活Statistics菜单选Survival中的Life Tables...项,弹出Life Tables对话框(图14.1)。从对话框左侧的变量列表中选time,点击 钮使之进入time框;在Display Time Intervals栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through框中输入48,在by框中输入2。选death,点击 钮使之进入Status框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Life Tables对话框。选group,点击 钮使之进入Factor框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable对话框,定义分组的范围,在Mininum框中输入1,在Maxinum框中输入2,点击Continue钮返回Life Tables对话框。

第14章生存分析实现

第十四章生存分析 本章使用的STATA命令: 例14-2 McKelvey et al(1976)收集了3期的某型淋巴瘤患者的生存时间(天)。分别是6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253,255+,270+,310+,316+,335+,346+。现用Kaplan-Meier法计算生存率。 解:STATA数据为: STATA命令为:

stset time,failure(d=1) sts list sts graph 结果为:

例14-3下面是来自于Berkson & Gage(1950)的一个研究队列。为了叙述方便,把原来的出院后的生存时间改称为某恶性肿瘤术后生存时间。共有374名患者进入研究队列。 表14-3 寿命表法计算生存率的计算用表 (1) (2) (3) (4) (5) (6) (7) (8) (9) 序号术后生存 年数 期初观察 例数 期内 死亡 期内截尾 人数 校正期初 人数 死亡 概率 生存 概率 生存率t n d c n c=n-c/2 q=d/n c p=1-q S(t) 1 0~374 90 0 374 0.2406 0.7594 0.7594 2 1~284 76 0 284 0.2676 0.7324 0.5561 3 2~208 51 0 208 0.2452 0.7548 0.4198 4 3~157 2 5 12 151 0.165 6 0.8344 0.3503 5 4~120 20 5 117.5 0.1702 0.8298 0.2907 6 5~95 7 9 90.5 0.0773 0.9227 0.2682 7 6~79 4 9 74.5 0.0537 0.9463 0.2538 8 7~66 1 3 64.5 0.0155 0.9845 0.2498 9 8~62 3 5 59.5 0.0504 0.9496 0.2372 10 9~54 2 5 51.5 0.0388 0.9612 0.2280 11 10+47 21 26 34 0.6176 0.3824 0.0872 解:STATA数据为: time w d 1 90 1 2 76 1 3 51 1

第十六章 生存分析习题

第十六章生存分析习题 一、选择题: 1.研究某种死因对居民生命的影响,最优方法是: A 计算死因别死亡率 B 计算年龄组死因死亡率 C 计算年龄组病死率 D 编制去死因寿命表 E 计算标准化死因死亡率 2.在人口分析和人口预测时,经常需要确定人口的死亡率。但是,由于死亡率受社会、经济、文化及医疗卫生条件等诸因素的影响,存在一定的波动。同时,在一些人口资料不完整或人口数量太少的地区,也得不到有关的资料。这时,可以借助一些数理统计的方法,将世界各地的大量的寿命表汇集起来,进行分析,归纳出几种死亡模式,对各种模式按照其不同的平均预期寿命水平编制出一组寿命表,供人们参考,这种寿命表是: A 队列寿命表 B 现时寿命表 C 简略寿命表 D 去死因寿命表 E 模型寿命表 3.在寿命表中,用于评价居民健康水平的最优指标是: A 生存人年总数 B 生存人年数 C 预期寿命 D 死亡概率 E 尚存人数4.寿命表的用途,不包括下列哪一项: A 评价国家或地区居民健康水面 B 描述疾病的时间分布特征 C 进行人口预测 D 研究人口再生产状况 E 研究人群的生育、发育及疾病发展规律5.生存分析中的生存时间为 A.确诊至死亡的时间 B.出院至失访的时间 C.手术至死亡的时间 D.观察开始至观察终止的时间 E.观察开始至失访的时间 6.关于肝癌治疗的随访资料作生存分析,可当作截尾值处理的是 A.死于肝癌 B.死于意外死亡 C.死于其它肿瘤 D.a.c 都是 E.b.c 都是二、问答题: 1、生存资料中,截尾数据的含义及其出现的原因是什么? 2、Cox 回归模型中,偏回归系数i β的意义是什么? 3、Cox 回归模型与logistic 回归模型相比有何不同?三、计算题: 1、为研究急性淋巴细胞性白血病病人的生存时间与其预后因素的关系,某研究者测得 50例急性淋巴细胞性白血病病人的生存时间(单位)及有关预后因素资料,1x 为入院时白细胞数(L /109 ?),2x 为淋巴结浸润度(分为0、1、2三级),3x 为缓解出院后的巩固治疗(有巩固治疗时3x =1,否则3x =0),随访的终点事件是死于白血

SPSS新手简明教程 (14)

第十四章 生存分析 第一节 Life Tables过程 14.1.1 主要功能 14.1.2 实例操作 第二节 Kaplan-Meier过程 14.2.1 主要功能 14.2.2 实例操作 第三节 Cox Regression过程 14.3.1 主要功能 14.3.2 实例操作 在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。 第一节 Life Tables过程 14.1.1 主要功能 调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。 返回目录 返回全书目录14.1.2 实例操作

[例14-1] 用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。 14.1.2.1 数据准备 激活数据管理窗口,定义变量名:随访月数的变量名为TIME ,是否死亡的变量名为DEATH ,分组(即中药组与对照组)的变量名为 GROUP 。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2。 14.1.2.2 统计分析 激活Statistics 菜单选Survival 中的Life Tables...项,弹出Life Tables 对话框(图14.1)。从对话框左侧的变量列表中选time ,点击钮使之进入time 框;在Display Time Intervals 栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through 框中输入48,在by 框中输入2。选death ,点击钮使之进入Status 框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable 对话框,在Single value 栏中输入1,表明death = 1为发生死亡事件者;点击Continue 钮返回Life Tables 对话框。选group ,点击钮使之进入Factor 框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable 对话框,定义分组的范围,在Mininum 框中输入1,在Maxinum 框中输入2,点击Continue 钮返回Life Tables 对话框。

第13章:生存分析

第13章生存分析 生存分析(Survival analysis)是研究特定人群生存过程的统计分析方法。对急性病的疗效考核,一般可用治愈率或病死率等,但对肿瘤、结核等慢性病,其预后不是短期内能明确判断的,帮上述指标不适用。为评价慢性病的疗效,通常可对慢性病病人进行长期随防,统计一定期限后的生存、死亡情况,然后用生存分柝方法作统计推断。 生存分析中用生存时间的长短评价慢性病的疗效。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的病人从发病到死亡或从确诊到死亡所经历的时间。广义地讲,“死亡”可定义为某研究目的的“结果”的发生,例如宫内节育器的失落,疾病的痊愈,女孩月经初潮的到来等(生存分析中往往统指各种“死亡”为失效)。相应的“生存”时间为,放节育器到节育器失落所经历的时间,接受某治闻开始到治俞所经历的时间,从女孩出生到月经初潮到来所经历的时间。不论是广义定义还狭义定义,生存时间均有三个要素:起点、终点和时间尺度(天,周,月,年等)。 理想的生存时间资料是对每个被研究对象,研究者兼掌握其生存时间的起点,又掌握其生存时间的终点(即研究目的的“结果”发生的时间),也就是研究者掌握每个研究对象的“生存时间”的全部信息。但实际工作中难以得到每个研究对象的这种“完全”的生存时间资料。有时,研究者没有掌握研究对象生存时间的起点,也有的是丢失生存过程中间的某段时间的信息,或缺少终点的信息,无论发生三种情况中的哪一,所得的数据资料均是不完全的,生存分析中称这种资料为不完全数据资料(censord data)。能处理不完全数据资料是生存分析的一个优点。 医学随访资料可能出现这些情况:被防对象因搬迁等原因而失去联系(失访);被访者死于其他疾病或非本病的其他原因;或者被访者直到研究者总结工作时仍活着。对这些对象,观察到的生存时间只有起点,没有终点,所得的资料是上述三种不完全数据资料中的第三种。生存分析中,称这种不完全数据为截尾数据。 生存时间是一个随机变量。例如,研究患某病的病人从确诊到死亡所经历的时间T,显然T的取值因人而异,即T是一个变量,而且T的变化不能预先确定(即使性别、年龄、体质等有关因素均已知的情况下,其取值也不能预先确定),这表明T不是一个普通的变量,而是一个随机变量。 在生存分析中,常用生存率(或称生存函数),风险率(或称危险率、风险函数),生存时间T的分布函数或密度函数描述生存过程。 T的分布函数F(t)为生存时间T不超过时点t的概率,即F(t)=Pr(T<=t)。生存时间的密度函数f(t)是F(t)的导数,f(t)=F’(t), f(t)描述所有个体在时点单位时间内死亡的危险性。生存率S(t)是指生存时间T超过时点t的概率,即S(t)=Pr(T>t)=1-F(t)。 例如5年生存率是指生存时间T超过5年的概率,记为S(5)。风险率h(t)是密度函数与生存率的比,即h(t)=f(t)/s(t),风险率h(t)描述已活过时点t的个体在时点t后单位时间内死亡的危险性。 实际工作中,得不到所有患者的生存时间资料,就不可能得到T的总体分布,只能利用样本资料近似地描述T的分布,对T的分布作出有关的推断。若有大样本的完全数据资料,则可以借助频数分布表近似描述T的分布。 例设有100名某病患者生存时间数据资料

相关主题
文本预览
相关文档 最新文档