医学统计学(第二版)思考与练习答案
- 格式:doc
- 大小:1.62 MB
- 文档页数:46
第三章实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。
内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。
据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。
该结论是否正确?如果不正确,请说明理由。
三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复B. 随机化、对照、盲法C. 随机化、重复、盲法D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。
7天后观察两组幼猪的存活情况。
该研究采用的是A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照5. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。
、SPSS 基本功能广Frequencies描述性分析丿D eSCriptiVeS Explore一般线性模型相关与回归分析 非参数检验 图表分析:条图、直方图、饼图、线图、散 点图等 输出管理:对输出结果复制、编辑等均数比较< CrosstabsSPSS 基「 本2 功、台匕正态分布日疋量资料的统」计推<偏态分布单样本设计t检验配对设计检验成组设计检验I完全随机设计方差分析以上空」随机区组设计方差分析厂两组均数比较三组及数比较4I重复测量方差分析■析因设计方差分析r配对设计秩和检验单样本设计秩和检验成组设计秩和检验1 •参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2 •非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广, 可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2 •非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯n型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯n型错误第一章绪论1•举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
《医学统计学》第二版习题(五年制临床医学等本科生用)习题(一)单项选择题绪论部分1.观察单位为研究中的()。
A.样本B.全部对象C.影响因素D.个体2.总体是由()。
A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指()。
A.参与个体数B.总体的统计指标C.样本的统计指标D.样本的总和5.关于随机抽样,下列那一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好第二章6.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差9.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距C.右偏态D.偏态12.对数正态分布是一种()分布。
A.正态B.近似正态C.左偏态D.右偏态14.()小,表示用该样本均数估计总体均数的可靠性大。
A.变异系数B.标准差C.标准误D.极差A.算术平均数B.中位数C.几何均数D.平均数16.变异系数CV的数值()。
A.一定大于1B.一定小于1C.可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是()。
A.2B.1C.2.5D.0.519.关于标准差,那项是错误的()。
A.反映全部观察值的离散程度B.度量了一组数据偏离平均数的大小C.反映了均数代表性的好坏D.不会小于算术均数20.中位数描述集中位置时,下面那项是错误的()。
的平均水平,用那种指标较好()。
A.平均数B.几何均数C.算术均数D.中位数22.一组变量的标准差将()。
第二章1•答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。
几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。
中位数和百分位数:中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。
理论上数据集中有一半数比中位数小,另一半比中位数大。
中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。
所谓开口”资料,是指数据的一端或者两端有不确定值。
百分位数(percentile)是一种位置指标,以 P X表示,一个百分位数 P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。
故百分位数是一个界值,也是分布数列的一百等份分割值。
显然,中位数即是P50分位数。
即中位数是一特定的百分位数。
常用于制定偏态分布资料的正常值范围。
2•答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。
极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。
极差大,说明资料的离散程度大。
用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。
其缺点是:1•不灵敏;2•不稳定。
四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q=Q u — Q L ,其间包含了全部观察值的一半。
所以四分位数间距又可看成中间一半观察值的极差。
医学统计学复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。
总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。
例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。
从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。
抽取样本的目的是用样本的信息推论总体特征。
2.简述3种变量类型的特征。
(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。
第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?2.全距、四分位数间距、方差、标准差、变异系数各有何特点?3.制定医学参考值范围的一般原则是什么?(1)抽取样本含量足够大的“正常人”。
一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。
(2)对抽取的正常人进行准确而统一的测定,控制测量误差。
(3)判断是否需要分组制定参考值范围。
第十五章数值变量的统计推断2.参考值范围与可信区间有何区别(1)意义不同:参考值范围是指同质总体中包括一定数量(如95%或99%)个体值的估计范围。
可信区间是指按一定的可信度来估计总体参数所在范围。
(2)计算方法不同:参考值范围用uS计算。
可信区间用t,S或uS计算,前者用标准差,后者用标准误。
3.何谓假设检验其一般步骤是什么所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。
《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的容;(2)备查项目保证分析项目填写得完整和准确的容;(3)其他项目大型调查表的前言和表底附注。
习题答案第一章思考题答案1.某医生收治200名患者,随机分成2组,每组100人。
一组用A药,另一组用B药。
经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么a)A药组的疗效高于B药组。
(对,但不提倡这样说,原因是容易被误解)b)A药的疗效高于B药。
(不对,这是针对总体而言的)2.某校同一年级的A班和B班用同一试卷进行一次数学测验。
经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。
(对)b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班。
(不对,一次考试只是一次抽样的结果)c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存在抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。
(对)d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体A,B班所有学生的这次考试成绩构成了一个总体B。
(对)3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么a)如果变量取值中含有小数点,则该变量为连续型变量。
(不对,离散型变量取值也可以定义为取值含有小数点)b)如果资料为离散型变量的取值,则该资料一定为分类资料。
(不对,如白细胞计数,这是离散型的资料,但不具有分类性质)c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博,并记为90个早博/24小时,故该资料也有量纲。
根据定义,应认为该资料为计量资料。
(本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)第二章习题的答案1. 是非题(1) 不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。
(错)(2) 少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
医学统计学课后习题答案医学统计学课后习题答案在医学领域中,统计学是一门非常重要的学科。
通过统计学的方法,我们可以对医学数据进行分析和解释,从而得出科学的结论和推断。
在医学统计学的学习过程中,课后习题是非常重要的一环。
通过解答习题,我们可以巩固所学的知识,并且更好地理解统计学的应用。
下面是一些医学统计学课后习题的答案,希望对大家的学习有所帮助。
1. 什么是样本均值和总体均值?它们之间有什么区别?样本均值是指从总体中抽取的一组样本数据的平均值。
总体均值是指整个总体中所有个体的平均值。
样本均值是对总体均值的估计。
区别:样本均值是通过抽样得到的估计值,而总体均值是真实的未知参数。
样本均值可以通过多次抽样得到不同的值,而总体均值是固定的。
2. 什么是标准差和方差?它们之间有什么关系?标准差是指一组数据的离散程度或者分散程度。
方差是标准差的平方。
关系:标准差是方差的平方根。
3. 什么是假设检验?在医学研究中有什么应用?假设检验是一种统计学方法,用于对两个或多个样本数据进行比较,从而判断它们之间是否存在显著差异。
在医学研究中,假设检验可以用于判断某种治疗方法是否有效,或者某种药物是否有副作用等。
4. 什么是P值?如何解释P值?P值是指在假设检验中,根据观察到的样本数据计算得到的一个概率值。
P值可以用来判断观察到的差异是否由随机因素引起。
解释P值:如果P值小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为观察到的差异是显著的。
如果P值大于显著性水平,则不能拒绝原假设,认为观察到的差异可能是由随机因素引起的。
5. 什么是置信区间?如何解释置信区间?置信区间是指对总体参数的一个估计范围。
置信区间由一个下限和一个上限组成。
解释置信区间:例如,对于一个置信水平为95%的置信区间,意味着在多次抽样中,有95%的置信区间会包含真实的总体参数值。
置信区间越窄,对总体参数的估计越准确。
6. 什么是卡方检验?在医学研究中有什么应用?卡方检验是一种用于比较两个或多个分类变量之间是否存在关联的统计方法。
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
《医学统计学》资料整理:医学统计学课程思考题及答案医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。
样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。
2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。
3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。
4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。
A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。
A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。
因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。
u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。
医学统计学思考题第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
一、SPSS 基本功能SPSS基本功能数据管理统计分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等描述性分析均数比较一般线性模型相关与回归分析非参数检验生存分析FrequenciesDescriptivesExploreCrosstabs 统计资料的类型资料类型定量资料:用定量的方法获得的数值资料计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料定量资料的统计推断正态分布两组均数比较单样本设计t检验配对设计t检验成组设计t检验三组及以上均数比较完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析偏态分布配对设计秩和检验单样本设计秩和检验成组设计秩和检验资料类型定量资料计数资料等级资料统计分析统计描述统计推断相对数总体率的估计假设检验u检验卡方检验4假设检验参数检验非参数检验正态分布等级资料偏态分布资料分布类型未知方差不齐,且不易变换达到齐性数据一端或两端不确定的资料1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料 参数检验➢ 优点:资料信息利用充分;检验效能较高 ➢ 缺点:对资料的要求高;适用范围有限 ➢ 优点:适用范围广,可适用于任何类型的资料 ➢ 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
《医学统计学》(第2版)练习思考题第一章 绪论一、最佳选择题1.医学统计学研究的对象是( c )A .医学领域的某种小概率事件B .疾病的预防与治疗C .有变异的医学事件D .各种类型的数据E .医学中的必然事件2.从总体中抽取样本的目的是( c )A .研究样本统计量B .研究典型案例C .由样本统计量推断总体参数D .计算统计指标E .研究总体统计量3.用样本推断总体,具有代表性的样本是指( d )A .在总体中随意抽取任意个体B .剔除总体中偏大或偏小后的部分个体C .总体中最容易获得的部分个体D .依照随机原则抽取总体中的部分个体E .挑选总体中的有代表性的部分个体4.下列资料属于等级资料的是(C )A .红细胞计数B .门诊就诊人数C .患者的病情分级D .ABO 血型分型E .成年男性的体重资料5.关于随机抽样误差,下列不正确的是(A )A .不可避免B .可尽量减小C .无方向性D .可间接地计算出它的大小E .与样本含量大小无关6.关于概率的说法,下列不正确的是(A )A .某种事件发生的频率即概率B .大小在10≤≤PC.在实际中,概率是难以获得的D.随机事件的概率为1<P0< E.某事件发生的概率为05P时,称为小概率事件≤.0二、简答题1.医学统计学与数理统计学有什么区别与联系?P12.资料类型有哪几类?根据分析需要,如何将其相互转化?P63.医学统计工作包括那几个基本步骤?P74.医学统计学的主要内容是什么?P35.统计学的特点和基本思想是什么?P36.如何正确认识医学统计学的作用?P8第二章实验设计与调查设计一、最佳选择题1.实验设计和调查设计的根本区别是( D )A.实验设计是以动物为研究对象B.调查设计是以人为研究对象C.实验设计可以随机分组D.调查设计不可以随机分组E.实验设计可以人为设置处理因素2.实验设计的三个基本要素是( D )A.随机、对照、均衡B.随机、对照、重复C.随机、对照、盲法D.处理因素、研究对象、实验效应E.受试对象、处理因素、综合指标3.在实验设计中,选择实验效应指标时应注意( E )A.特异性B.灵敏性C.客观性D.精确性E.以上都是4.实验设计应遵循的基本原则是( A )A.随机、对照、均衡、重复B.随机、对照、盲法、重复C.随机、配对、盲法、均衡D.随机、配伍、对照、重复E.随机、盲法、对照、实用5.实验设计中影响样本含量大小的因素为( E )σA.αB.βC.参数的容许误差δD.总体标准差E.以上都是6.在常用的调查研究抽样中,抽样误差由大到小的顺序为(C )A.整群抽样≥单纯随机抽样≥分层抽样≥系统抽样B.分层抽样≥系统抽样≥单纯随机抽样≥整群抽样C.单纯随机抽样≥整群抽样≥系统抽样≥分层抽样D.整群抽样≥单纯随机抽样≥系统抽样≥分层抽样E.整群抽样≥分层抽样≥系统抽样≥单纯随机抽样1.实验设计的基本原则是什么?基本要素包括哪些?P13P122.何谓随机?随机的目的是什么?P133.决定样本含量的依据有哪些?. 决定样本含量的依据有哪些?答:决定样本含量的依据有:①犯Ⅰ类错误的概率α,即检验水准。
医学统计学思考练习第1章绪论思考与练习参考答案一、最佳选择题1. 研究中的基本单位是指( D )。
A.样本 B. 全部对象C.影响因素 D. 个体 E. 总体2. 从总体中抽取样本的目的是( B )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指( B )。
A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。
A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。
A.受测量精密度限制B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小三、思考题2. 某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。
因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。
样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。
即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。
3. 某地区有10万个7岁发育正常的男孩,为了研究这些7岁发育正常男孩的身高和体重,在该人群中随机抽取200个7岁发育正常的男孩,测量他们的身高和体重,请回答下列问题。
(1) 该研究中的总体是什么?答:某地区10万个7岁发育正常的男孩。
(2) 该研究中的身高总体均数的意义是什么?答:身高总体均数的意义是: 10万个7岁发育正常的男孩的平均身高。
(3) 该研究中的体重总体均数的意义是什么?答:体重总体均数的意义是: 10万个7岁发育正常的男孩的平均体重(4) 该研究中的总体均数与总体是什么关系?答:总体均数是反映总体的统计学特征的指标。
第三章实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。
内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。
据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。
该结论是否正确?如果不正确,请说明理由。
三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复B. 随机化、对照、盲法C. 随机化、重复、盲法D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。
7天后观察两组幼猪的存活情况。
该研究采用的是A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照5. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。
第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,。
不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
二、案例辨析题统计描述时,常见错误是对定量资料的描述均采用均数、标准差,。
正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。
本资料的血清总胆固醇的频数分布图如下:图4-1 血清甘油三酯(TG)的频数分布可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:集中趋势指标150150122(1.7/26 1.75)/2 1.755X M X ⎛⎫⎛⎫+ ⎪⎪⎝⎭⎝⎭⎛⎫=+ ⎪ ⎪⎝=+=⎭ (mmol/L)离散程度指标 四分位数间距= 7525 2.10 1.340.76P P -=-= (mmol/L)三、最佳选择题1. B2. E3. B4. C5. D6. E7. A8. D9. D四、综合分析题 1. 解:输出结果频数图4-4 尿总砷的频数分布图由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。
输出结果图4-5 尿总砷对数的频数分布图由图可见lgx 分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。
(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。
输出结果频数频数结果中的Mean 表示尿总砷对数值的均数为- 1.1831,求其反对数,得到几何均数0.0656(μg/L)G =。
2. 解:(1) 已知健康人的血清TC 服从正态分布,故采用正态分布法制定95%的参考值范围。
下限: 1.96 4.84 1.960.96 2.96X S -=-⨯=(mmol/L)上限: 1.96 4.84 1.960.96 6.72X S +=+⨯=(mmol/L)该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为 2.96 mmol/L~6.72mmol/L 。
(2) 45~55岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,查表确定正态分布曲线下面积。
由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。
11 3.25 4.841.660.96X Z μσ--===-22 5.25 4.840.430.96X Z μσ--===查标准正态分布曲线下的面积表(附表2)得:1()(1.66)0.0485Z Φ=Φ-=2()1(0.43)10.33360.6664Z Φ=-Φ-=-=21()()0.66640.04850.617961.79%D Z Z =Φ-Φ=-==该市45~55岁健康男性居民中,血清总胆固醇在3.25mmol/L~5.25mmol/L 范围内的比例为61.79%。
(3) 作标准化变换3.804.841.080.96X Z μσ--===-查标准正态分布曲线下的面积表(附表2)得:()( 1.08)0.140114.01%Z Φ=Φ-==该市45~55岁健康男性居民中,血清总胆固醇低于 3.80mmol/L 所占的比例为14.01%。
3. 解: 输出结果跟骨硬度指数图4-8 跟骨硬度指数的频数分布图由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。
输出结果Statistics即该地区30~35岁健康女性的SI 的95%参考值范围为(58.02, 143.66)。
频数50 60 70 80 90 100 110 120 130 140 150第五章定性资料的统计描述【习题解析】一、思考题1.①计算相对数应时有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。
2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。
两者在实际应用时容易混淆,要注意区别。
3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。
4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。
5. ①标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。
但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。
因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。
②样本的标准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。
③注意标准化方法的选用。
如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。
但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。
④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。
此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
二、案例辨析题该结论不正确。
因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。
三、最佳选择题1. B2. A3. D4. E5. D6. D7. C8. C9. B四、综合分析题 1. 解:表5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系分 组 调查人数经常吸烟经常吸烟率(%)是否 COPD 患者 356 231 125 64.89 非COPD 患者47918329638.20COPD 患者的经常吸烟率:231/356×100%=64.89% 非COPD 患者经常吸烟率:183/479×100%=38.20% COPD 患者的经常吸烟率比非COPD 患者高26.69%231296=2.989125183OR 比值比()⨯=⨯还需进一步对OR 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果2. 解:表5-4 某地居民1998~2004年某病死亡率(1/10万)动态变化年份 符号 死亡率 绝对增长量发展速度增长速度累计 逐年 定基比 环比 定基比 环比1998~ a 0 160.5 — ——— — — 1999~ a 1 144.2 -16.3 -16.3 0.90 0.90 -0.10 -0.10 2000~ a 2 130.0 -30.5 -14.2 0.81 0.90 -0.19 -0.10 2001~ a 3 120.2 -40.3 -9.8 0.75 0.92 -0.25 -0.08 2002~ a 4 85.6 -74.9 -34.6 0.53 0.71 -0.47 -0.29 2003~ a 5 69.5 -91.0 -16.1 0.43 0.81 -0.57 -0.19 2004~a 638.5-122.0-31.00.240.55-0.76-0.45该病死亡率的平均发展速度0.79== 该病死亡率的平均增长速度=1=0.791=0.21---平均发展速度3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg 阳性率的影响,应先进行标准化再进行比较。
根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。
表5-5 直接法计算某地不同年龄、性别人群的HBsAg 标准化阳性率(%)年龄组 标准人口数i N男性女性 原阳性率i p预期阳性数i i N p原阳性率 i p预期阳性数i i N p0~ 1081 2.30 24.90 2.32 25.09 20~ 1473 2.71 39.97 2.72 40.02 40~ 1546 6.06 93.63 6.46 99.86 60~ 1408 7.52 105.85 8.60 121.04 合 计5508(N )5.11264 (i i N p ∑)4.86286(i i N p ∑)男性HBsAg 标准化阳性率:264100% 4.79%5508p '=⨯= 女性HBsAg 标准化阳性率:286100% 5.19%5508p '=⨯= 可见,经标准化后女性HBsAg 阳性率高于男性。