第十六章 生存分析(答案) 医学统计学习题
- 格式:pdf
- 大小:117.42 KB
- 文档页数:2
考核分为3部分:1. 平时成绩,主要以到课情况为依据。
一般占总成绩10%左右。
2. 上机SAS软件操作考试。
一般占总成绩的20%~40%。
3. 期末卷面理论考核,占总成绩的50%~70%。
下面的统计学试题供同学们参考:《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体(population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异(variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是:A.这300名高血压患者B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0<P<1C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
原题目:医学统计学的生存分析
生存分析是医学统计学中常用的方法之一,用于研究某个事件发生或终止的时间,并分析这个事件与其他相关因素的关系。
本文将介绍生存分析的基本概念、应用场景和常用方法。
1. 基本概念
生存分析是一种统计方法,用于研究个体观测时间的分布和影响这个时间的因素。
其中,个体观测时间指的是从某个初始时间点开始,到某个事件发生或终止的时间间隔。
2. 应用场景
生存分析在医学领域中有着广泛的应用,特别是在研究疾病的发展、治疗效果和生存率等方面。
它可以帮助研究人员比较不同治疗方案的效果,评估疾病的预后和风险因素,并进行患者生存时间的预测。
3. 常用方法
生存分析的常用方法包括Kaplan-Meier曲线、Cox比例风险模型和Log-rank检验等。
Kaplan-Meier曲线是用来描述生存分析结果
的一种方法,可以根据不同组别或不同因素的生存时间进行比较。
Cox比例风险模型可以用来评估各个因素对生存时间的影响,并得到相对风险的估计值。
Log-rank检验则用于比较不同组别或不同因素下的生存时间差异是否显著。
在进行生存分析时,需要注意以下几点:
- 数据收集要准确可靠,避免遗漏或错误的观测;
- 样本量要足够大,以保证结果的可靠性;
- 统计方法要恰当选择,根据研究目的和数据特点采用合适的方法;
- 结果的解读要谨慎,避免过度解读或误导性的解释。
综上所述,生存分析在医学统计学中是一项重要的研究方法,可以帮助研究人员了解事件发生或终止的时间分布规律,并评估影响时间的因素。
在进行生存分析时,需要遵循科学的方法和原则,以确保研究结果的可靠性和准确性。
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
第十六章 生存分析习题一、选择题:1.研究某种死因对居民生命的影响,最优方法是:A 计算死因别死亡率B 计算年龄组死因死亡率C 计算年龄组病死率D 编制去死因寿命表E 计算标准化死因死亡率2. 在人口分析和人口预测时,经常需要确定人口的死亡率。
但是,由于死亡率受社会、经济、文化及医疗卫生条件等诸因素的影响,存在一定的波动。
同时,在一些人口资料不完整或人口数量太少的地区,也得不到有关的资料。
这时,可以借助一些数理统计的方法,将世界各地的大量的寿命表汇集起来,进行分析,归纳出几种死亡模式,对各种模式按照其不同的平均预期寿命水平编制出一组寿命表,供人们参考,这种寿命表是:A 队列寿命表B 现时寿命表C 简略寿命表D 去死因寿命表E 模型寿命表3. 在寿命表中,用于评价居民健康水平的最优指标是:A 生存人年总数B 生存人年数C 预期寿命D 死亡概率E 尚存人数 4. 寿命表的用途,不包括下列哪一项:A 评价国家或地区居民健康水面B 描述疾病的时间分布特征C 进行人口预测D 研究人口再生产状况E 研究人群的生育、发育及疾病发展规律 5.生存分析中的生存时间为A.确诊至死亡的时间B.出院至失访的时间C.手术至死亡的时间D.观察开始至观察终止的时间E. 观察开始至失访的时间6. 关于肝癌治疗的随访资料作生存分析,可当作截尾值处理的是A.死于肝癌B.死于意外死亡C.死于其它肿瘤D.a.c 都是E. b.c 都是 二、问答题:1、生存资料中,截尾数据的含义及其出现的原因是什么?2、Cox 回归模型中,偏回归系数i β的意义是什么?3、Cox 回归模型与logistic 回归模型相比有何不同? 三、计算题:1、 为研究急性淋巴细胞性白血病病人的生存时间与其预后因素的关系,某研究者测得50例急性淋巴细胞性白血病病人的生存时间(单位)及有关预后因素资料,1x 为入院时白细胞数(L /109⨯),2x 为淋巴结浸润度(分为0、1、2三级),3x 为缓解出院后的巩固治疗(有巩固治疗时3x =1,否则3x =0),随访的终点事件是死于白血病,原始数据的整理格式见下表。
医学统计学课后习题答案医学统计学课后习题答案在医学领域中,统计学是一门非常重要的学科。
通过统计学的方法,我们可以对医学数据进行分析和解释,从而得出科学的结论和推断。
在医学统计学的学习过程中,课后习题是非常重要的一环。
通过解答习题,我们可以巩固所学的知识,并且更好地理解统计学的应用。
下面是一些医学统计学课后习题的答案,希望对大家的学习有所帮助。
1. 什么是样本均值和总体均值?它们之间有什么区别?样本均值是指从总体中抽取的一组样本数据的平均值。
总体均值是指整个总体中所有个体的平均值。
样本均值是对总体均值的估计。
区别:样本均值是通过抽样得到的估计值,而总体均值是真实的未知参数。
样本均值可以通过多次抽样得到不同的值,而总体均值是固定的。
2. 什么是标准差和方差?它们之间有什么关系?标准差是指一组数据的离散程度或者分散程度。
方差是标准差的平方。
关系:标准差是方差的平方根。
3. 什么是假设检验?在医学研究中有什么应用?假设检验是一种统计学方法,用于对两个或多个样本数据进行比较,从而判断它们之间是否存在显著差异。
在医学研究中,假设检验可以用于判断某种治疗方法是否有效,或者某种药物是否有副作用等。
4. 什么是P值?如何解释P值?P值是指在假设检验中,根据观察到的样本数据计算得到的一个概率值。
P值可以用来判断观察到的差异是否由随机因素引起。
解释P值:如果P值小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为观察到的差异是显著的。
如果P值大于显著性水平,则不能拒绝原假设,认为观察到的差异可能是由随机因素引起的。
5. 什么是置信区间?如何解释置信区间?置信区间是指对总体参数的一个估计范围。
置信区间由一个下限和一个上限组成。
解释置信区间:例如,对于一个置信水平为95%的置信区间,意味着在多次抽样中,有95%的置信区间会包含真实的总体参数值。
置信区间越窄,对总体参数的估计越准确。
6. 什么是卡方检验?在医学研究中有什么应用?卡方检验是一种用于比较两个或多个分类变量之间是否存在关联的统计方法。
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
第十六章生存分析(答案)
一、选择题
1、D
2、E
3、C
4、B
5、D
6、E
二、问答题
1、(1)在生存资料中,截尾值指尚未观察到研究对象出现反应时,即由于某种原因停止了
随访,这时记录到的时间信息是不完整的,这种生存资料称为截尾值。
(2)出现截尾值的原因主要有以下3种情况:①失访;②退出;③终止。
2、Cox 回归模型中,偏回归系数i β的意义是,当其它协变量不变时,i X 每变化一个单位,
相对危险度的自然对数变化i β个单位。
3、Cox 回归模型与logistic 回归模型具有相似之处,即在估计出回归系数后可以得到协变量对应的相对危险度。
但Cox 回归模型不仅考虑了事件发生的结果,同时也利用了生存时间提供的信息,而logistic 回归模型是一种概率模型,只考虑了事件是否发生,而不考虑事件发生所需要的时间长短。
三、计算题:
1、(1)Cox 回归模型参数估计和假设检验结果见下表
表cox 回归模型计算及检验结果(621.332
=χ,000.0=P )
变量偏回归系数偏回归系数标准误Wald P 值OR 值OR 值95%可信区间下限上限x10.0010.0020.3600.548 1.0010.997 1.005x20.4540.206 4.8460.028 1.574 1.051 2.358x3
-1.886
0.377
25.050
0.000
0.152
0.0720.317
由上表可见,在05.0=α检验水准上,所建立的Cox 回归模型成立(621.332
=χ,
000.0=P );入院时白细胞数(1x )的偏回归系数无统计学意义,淋巴结浸润度(2x )和
缓解出院后的巩固治疗(3x )的偏回归系数均有统计学意义。
Cox 回归模型为:[])886.1454.0001.0exp()(),(3210x x x t h X t h i -+=。
以上结果可解释为:淋巴结浸润度(2x )和缓解出院后的巩固治疗(3x )均对急性淋巴细胞性白血病病人的生存时间产生影响。
在控制了入院时白细胞数(1x )与缓解出院后的巩固治疗(3x )的作用下,淋巴结浸润度浸润度每增加一个等级,死于白血病的危险性增加57%;在控制了入院时白细胞数(1x )与淋巴结浸润度(2x )的作用下,接受巩固治疗者(13=x )死于白血病的危险性比不接受巩固治疗者死于白血病的危险性降低84.8%。
(2)生存曲线:根据协变量均值绘制的生存曲线见下图
图16.3根据协变量均值绘制的生存曲线
由上图可见,多数病人的生存月数都不超过20个月,其中位生存时间大约为12个月。