《医学统计学》疑难解析
- 格式:doc
- 大小:43.50 KB
- 文档页数:2
医学统计学复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。
总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。
例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。
从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。
抽取样本的目的是用样本的信息推论总体特征。
2.简述3种变量类型的特征。
(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。
第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?2.全距、四分位数间距、方差、标准差、变异系数各有何特点?3.制定医学参考值范围的一般原则是什么?(1)抽取样本含量足够大的“正常人”。
一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。
(2)对抽取的正常人进行准确而统一的测定,控制测量误差。
(3)判断是否需要分组制定参考值范围。
第十五章数值变量的统计推断2.参考值范围与可信区间有何区别(1)意义不同:参考值范围是指同质总体中包括一定数量(如95%或99%)个体值的估计范围。
可信区间是指按一定的可信度来估计总体参数所在范围。
(2)计算方法不同:参考值范围用uS计算。
可信区间用t,S或uS计算,前者用标准差,后者用标准误。
3.何谓假设检验其一般步骤是什么所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。
《医学统计学》完整课件完整版一、教学内容本节课的教学内容来自于《医学统计学》的第五章,主要内容包括:t检验、方差分析、秩和检验。
二、教学目标1. 使学生了解并掌握t检验、方差分析、秩和检验的基本原理和应用。
2. 培养学生运用医学统计学方法分析和解决实际问题的能力。
3. 帮助学生建立正确的统计学思维方式,提高科学研究素养。
三、教学难点与重点1. 教学难点:t检验、方差分析、秩和检验的计算方法和应用。
2. 教学重点:t检验、方差分析、秩和检验的基本原理和操作步骤。
四、教具与学具准备1. 教具:多媒体教学设备、黑板、粉笔。
2. 学具:教材、笔记本、计算器。
五、教学过程1. 实践情景引入:以一项临床试验为例,介绍t检验在医学研究中的应用。
2. t检验:(1)讲解t检验的基本原理和适用条件。
(2)演示t检验的计算过程,并列举实例进行分析。
(3)引导学生通过教材示例,自行完成t检验的计算和分析。
3. 方差分析:(1)介绍方差分析的基本原理和适用条件。
(2)演示方差分析的计算过程,并列举实例进行分析。
(3)引导学生通过教材示例,自行完成方差分析的计算和分析。
4. 秩和检验:(1)讲解秩和检验的基本原理和适用条件。
(2)演示秩和检验的计算过程,并列举实例进行分析。
(3)引导学生通过教材示例,自行完成秩和检验的计算和分析。
六、板书设计板书内容主要包括t检验、方差分析、秩和检验的基本原理、适用条件、计算方法和实例分析。
七、作业设计1. 题目:某临床试验中,研究者比较了两种药物的治疗效果,随机抽取了60名患者,分别给予甲药和乙药治疗,疗程为4周。
治疗结束后,对患者的疗效进行了评价。
假设评价结果如下:甲药组:痊愈20人,显效15人,有效10人,无效5人。
乙药组:痊愈18人,显效12人,有效8人,无效12人。
请运用t检验分析两种药物的治疗效果是否存在显著性差异。
答案:(略)2. 题目:某研究者对某疾病的治疗方法进行了临床试验,随机抽取了80名患者,分别给予甲法和乙法治疗,疗程为6个月。
医学统计学案例辨析及参考答案非凡文印提供松园7号楼目录目录 (2)第1章绪论 (3)第2章统计描述 (5)第3章概率分布 (9)第4章参数估计 (12)第5章假设检验 (14)第6章两样本定量资料的比较 (16)第7章多组定量资料的比较 (19)第8章定性资料的比较 (22)第9章关联性分析 (25)第10章简单线性回归分析 (27)第11章多重线性回归分析 (31)第12章实验设计 (34)第13章临床试验设计 (36)第14章调查设计 (37)第15章样本含量估计 (39)第16章随机区组设计和析因设计资料的分析 (42)第17章重复测量设计和交叉设计资料的分析 (44)第18章 Logistic回归 (47)第19章生存分析 (51)第20章对数线性模型在高维列联表资料分析中的应用 (54)第21章多元统计方法简介 (57)第22章时间序列分析 (58)第24章基因表达谱分析的生物信息学方法 (60)第25章 Meta分析 (61)第26章医学论文的统计学报告要求 (65)第1章绪论案例辨析及参考答案案例1-1某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。
得出的结论是:“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。
请问其结论合理吗?为什么?应该如何?案例辨析①样本不能代表总体。
总体是“大学生”,而样本仅为某地三年制职业技术学院学生;②社会学调查的样本含量显得不足;③“理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选”的意思,不符合统计学要求。
正确做法应在论文的题目中明确调查的时间范围和地点,还应给“大学生”下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。
【临床】医学统计学--名词解释+问答题医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与样本例数的关系:随着样本量的增加,样本标准差稳定于总体标准差;随着样本量的增加,样本标准误减少并趋于0。
医学统计学案例辨析及参考答案非凡文印提供松园7号楼目录目录 (2)第1章绪论 (3)第2章统计描述 (5)第3章概率分布 (9)第4章参数估计 (12)第5章假设检验 (14)第6章两样本定量资料的比较 (16)第7章多组定量资料的比较 (19)第8章定性资料的比较 (22)第9章关联性分析 (25)第10章简单线性回归分析 (27)第11章多重线性回归分析 (31)第12章实验设计 (34)第13章临床试验设计 (36)第14章调查设计 (37)第15章样本含量估计 (39)第16章随机区组设计和析因设计资料的分析 (42)第17章重复测量设计和交叉设计资料的分析 (44)第18章 Logistic回归 (47)第19章生存分析 (51)第20章对数线性模型在高维列联表资料分析中的应用 (54)第21章多元统计方法简介 (57)第22章时间序列分析 (58)第24章基因表达谱分析的生物信息学方法 (60)第25章 Meta分析 (61)第26章医学论文的统计学报告要求 (65)第1章绪论案例辨析及参考答案案例1-1某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。
得出的结论是:“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。
请问其结论合理吗?为什么?应该如何?案例辨析①样本不能代表总体。
总体是“大学生”,而样本仅为某地三年制职业技术学院学生;②社会学调查的样本含量显得不足;③“理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选”的意思,不符合统计学要求。
正确做法应在论文的题目中明确调查的时间范围和地点,还应给“大学生”下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。
第一章绪论1资料类型计量资料、计数资料、等级资料的定义及区别.计量资料――可以用度量衡来测量的数据.如高血压,身高等资料.分析方法可用t检验,F 检验等.计数资料――按属性或特征分类后计算观察单位的个数得到的资料.可以有二分类或多分类资料.如性别为二分类资料,血型为多分类资料.分析方法可用率的u检验或卡方检验等.等级资料―按照程度的大小或高低分为若干等级.清点各等级的观察单位个数.也称为有序分类资料.分析方法可用秩和检验.或Ridit分析. 注意事项:处理资料时先搞清楚资料类型,再选用正确的统计分析方法.2 总体、样本、抽样误差的意义.总体――根据研究目的确定的同质研究对象的某特征的集合.总体是相对的,可有无限总体和有限总体.样本――由总体中随机抽取的有代表性的一部分.抽样误差――由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差.第二章定量资料1描述集中趋势的统计指标,意义和应用条件.定量资料的集中趋势是用平均数来描述的.平均数是分析定量资料的基本指标,它代表一组同质变量值的集中趋势或平均水平.平均数常作为一组资料的代表值,可用于组间的分析比较.常用的平均数有算术均数、几何均数和中位数.均数:即算术均数,适用于对称分布或近似对称分布的资料.习惯上以希腊字母表示总体均数(population mean),以表示样本均数(sample mean).几何均数:常用于变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等,简记为G表示其平均水平.中位数:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M).在全部变量值中,大于和小于中位数的变量值的个数相等.用中位数表示平均水平主要适用于:①变量值中出现个别特小或特大的数值;②资料的分布呈明显偏态,即大部分的变量值偏向一侧;③变量值分布一端或两端无确定数值,只有小于或大于某个数值;④资料的分布不清.百分位数:是一种位置指标,以Px表示.百分位数是将频数等分为一百的分位数.一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大.用于偏态资料的频数分布资料.众数:全部实测值中出现最多的数字.众数在医学上常用于描述某病或某次食物中毒的潜伏期.2描述离散趋势的统计指标,意义和应用条件.极差(range,简记为R)亦称全距,即一组变量值中最大值与最小值之差,反映变量值的离散范围.R值大,离散度就大;R值小,离散度就小.极差由于易受两端值的影响而不稳定.所以使用较少.四分位间距:将数据两端各去掉25%,取中间50%的数据,这样可先计算P25和P75,求出P75与P25之差,即为四分位数间距(quartile interval 简记为Q).四分位间距由于不易受两端值的影响而较为稳定.尽管四分位数间距比极差稳定,但仍然是两点间的距离,也不能反映出所有变量值的离散情况.用于偏态分布的资料.方差:对于正态分布资料,为了能反映每个变量值的离散大小,往往以均数作为比较的标准.变量值与均数之差越小,说明离散度越小;反之,离散度越大.为反映总体变量值的离散度大小,可计算总体中每个变量值X与总体均数之差的和,即Σ(X- ),称离均差和.由于X- 有正有负,即Σ(X- )=0,这样仍不能反映总体离散度大小,故计算Σ(X- )2,称为离均差平方和.由于Σ(X- )2的大小与总体中变量值的个数N的多少有关,为了消除N的影响,取其均数即为方差(variance),总体方差用表示.方差可以较全面地反映变量值的变异情况.用于正态分布资料.标准差:将方差开方即得标准差(standard deviation),它与原始变量值单位相同.总体标准差用表示,样本标准差用S表示.用于正态分布资料.变异系数:是标准差与算数均数的比值,是一个不带量纲的相对数.主要适用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较. 第三章t-检验t-检验与u-检验各自的概念、意义、应用条件和区别.t-检验:服从自由度为n-1的t分布.以t分布为理论依据的检验称为t检验.由t分布公式可知,│t│值与样本均数和总体均数之差成正比,与标准误成反比 .在t分布中│t│值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小,说明在抽样中获得此│t│值以及更大│t│值的机会就越小,这种机会的大小是用概率P来表示的.│t│值越大,则P值越小;反之,│t│值越小,P值越大.在同一自由度下,│t │≥ ,则P≤ ;反之,│t│<,则P> .t检验的适用条件:①样本来自正态总体或近似正态总体;②两样本总体方差相.③用于小样本n<100的资料.u-检验:当样本含量越大即逐渐增大时,t分布逐渐逼近于u分布,当=≦时,t分布就完全成为u分布.u分布是t-分布的特例.在u分布中│u│值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小,这种机会的大小也是用概率P来表示的.│u│值越大,则P值越小;反之,│u│值越小,P值越大.在同一自由度下,│u│≥ ,则P≤ ;反之,│u│<,则P> .u检验的适用条件:①资料呈正态分布.②方差齐性.③用于大样本n>100的资料.第四章方差分析1 用途:单因素、双因素、拉丁方设计、析因设计、正交设计资料.单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用.其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低.双因素方差分析是按照随机区组设计的原则来分析两个因素对试验结果的影响及作用.其中一个因素称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素.两个因素相互独立,且无交互影响.双因素方差分析使用的样本例数较少,分析效率高,是一种经常使用的分析方法.但双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意.拉丁方设计是在随机区组的基础上发展起来的,它可安排一个已知的对实验结果有影响的非处理因素,增加了试验的均衡性,起到减少误差、提高效率的作用.一般用g行×g列个格子代表行区组和列区组不同水平的g2 个组合,g个拉丁字母代表处理因素的g个水平.用来分析行、列及字母三个因素对试验结果的影响及作用.析因设计:涉及到两个或两个以上的实验因素,各因素在实验中所处的地位基本相等,且各因素之间可能存在交互作用.正交设计:在因素较多(3个以上),因素水平数不太大,要考虑交互作用项少且为一级交互作用时,可采用正交设计.在做正交设计时,应根据研究目的具体情况选择合适的正交表.2 应用条件:方差齐、正态分布、两个或两个以上样本的比较.3 F检验与t-检验区别F检验用于2个及以上样本统计检验,t-检验只能用于2个样本或单样本的统计检验第五章计数资料的描述(相对数)1率与构成比的区别、意义.率(rate)又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度.构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布.常以百分数表示.构成比只能说明事物各组成部分的比重或分布,并不说明某现象发生频率或强度.二者概念和计算方法都不同,所得结论也不同.2 标准化法的意义.标准化法(standardization method)的意义是:当两组或多组率之间比较时,当各组内部的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等明显不同时,则不能直接比较两组或多组的总率,得出结论.只有消除混杂因素的干扰,才能正确地反映死亡率的真实情况.采用标化法时,若比较的两组或多组率当内部构成不同时,需要按统一的“标准”进行调整,使之具备可比性,称之为标准化法.第六章率的检验1 率的u-检验:意义、应用条件np>5;n(1-p)>5当样本含量n足够大,且样本率p和(1-p)均不太小,如np与n(1-p)均≥5时,样本率p也是以总体率为中心呈正态分布或近似正态分布的.这时,两率差别的假设检验可用u检验.率的u-检验包样本率与总体率比较的u检验和两样本率比较的u检验2 率的X2检验:意义、应用条件,与率的u-检验的区别.意义:检验(chi-square test)是一种用途较广的假设检验方法,常用于检验两个或多个样本率及构成比之间有无差别,还用来检验配对定性资料及两种属性或特征之间是否有关系等.应用条件:四格表及行×列表基本公式(T≥5,且N>40);四格表专用公式(T≥5,且N>40);四格表校正公式(1<T<5,且N>40);若T≤1或N≤40时,用精确概率法;行×列表简化公式(不能有1/5以上格子T<5或任一格T<1) ;配对四格表资料的检验公式:b+c>40,若b+c≦40时用其校正公式;区别: X2检验用于两样本、多样本、构成比的检验;率的u-检验用于两样本.第八章秩和检验1 秩和检验的应用条件.配对设计资料的秩和检验(又称Wilcoxon配对法):n>50, 正态近似法u检验,当n≤50时,查表法;两样本比较的秩和检验(Wilcoxon两样本比较法)当n1≤10,n2-n1≤10时查表法当n1>20,n2-n1>10时u检验完全随机设计多个样本比较的秩和检验(Kruskal-Wallis法,即H检验):主要适用于不宜用方差分析检验的定量资料以及多组等级资料的比较;若组数k=3,每组例数ni≤5时,用查表法,若组数k>3,或每组例数ni >5时,H分布近似服从的分布,可查界值,表当各样本的相同秩次较多时(如超过25%),如等级资料,由宜用校正公式Hc.随机区组设计资料的秩和检验:当用方差分析方法来处理随机区组设计(配伍组设计)资料不能满足方差分析的要求时,则可用秩和检验来处理.秩和检验资料类型:计量资料(两样本、配对资料、多样本);等级资料(两样本、多样本)第九章相关回归1 相关的概念、意义.相关:两变量在数量上存在相互协同变化的关系称为相关.包括直线相关和曲线相关.意义:用于分析双变量正态分布资料.用相关系数(r)表示两变量相关关系.当r为正值时称正相关,表示一变量随另一变量的增加而增加;当r为负值时称负相关,表示一变量随另一变量的增加而减少;|r|愈接近1,表示两变量的相关愈密切.2 回归的概念、意义,与相关的区别与联系.回归:反应两变量间的数量依存变化关系.用回归系数和回归方程是描述两变量间的数量关系与相关的区别与联系:①在资料上,相关分析要求两变量x与y均为服从正态分布的随机变量;回归分析要求y是正态随机变量,而x可以不是正态随机变量而是一确定值,也可以是正态随机变量②在意义上,相关反映两变量相关关系;回归反映两变量间的数量依存变化关③在应用上,说明两变量间的相关程度及相关方向用相关;说明两变量间的数量依存变化关系用回归.联系:①对同一组数据,r与b的符号一致. ②对同一组数据,r与b的假设检验是等价的.第十章实验设计实验设计的基本要素:受试对象,处理因素,试验效应受试对象:验前须对研究对象的条件作明确的规定,即明确纳入标准、排除标准、剔除标准,以确保研究对象的同质性,同时要确保研究的样本有代表性.处理因素:同一研究中应始终保持一致,即标准化.同时对实验结果有影响的非处理因素即混杂因素,在设计中尽可能找出,以控制并削弱其影响.试验效应:据客观、精确、敏感或特异的原则选择适宜指标反映试验效应.实验设计的基本原则:对照、随机、重复、均衡四原则。