医学统计学(高等教育出版社第二版)思考与练习答案
- 格式:doc
- 大小:1.58 MB
- 文档页数:46
医学统计学试题及答案习题《医学统计学》第二版 (五年制临床医学等本科生用)(一) 单项选择题1. 观察单位为研究中的( d )。
A. 样本 B .全部对象 C. 影响因素 D. 个体2. 总体是由 ( c ) 。
A. 个体组成B.研究对象组成 C . 同质个体组成 D. 研究指标组成3. 抽样的目的是(b )。
A. 研究样本统计量B. 由样本统计量推断总体参数C. 研究典型案例研究误差D.研究总体统计量4. 参数是指(b )。
A. 参与个体数B.总体的统计指标C.样本的统计指标 D .样本的总和5. 关于随机抽样,下列那一项说法是正确的(a)。
A. 抽样时应使得总体中的每一个个体都有同等的机会被抽取B. 研究者在抽样时应精心挑选个体,以使样本更能代表总体C. 随机抽样即随意抽取个体D. 为确保样本具有更好的代表性,样本量应越大越好6 . 各观察值均加(或减)同一数后(b)。
A.均数不变,标准差改变B.均数改变,标准差不变C. 两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用(a )。
A.变异系数 B .差 C. 极差 D. 标准差8.以下指标中( d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C. 中位数D. 标准差9.偏态分布宜用( c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后, ( b)不变。
A. 算术均数B.标准差C. 几何均数D.中位数11. ( a )分布的资料,均数等于中位数。
A.对称B. 左偏态C. 右偏态D.偏态12.对数正态分布是一种(c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用(c)描述其集中趋势。
A.均数B.标准差C. 中位数D. 四分位数间距14. (c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是(c )。
第三章实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。
内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。
据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。
该结论是否正确?如果不正确,请说明理由。
三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复B. 随机化、对照、盲法C. 随机化、重复、盲法D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。
7天后观察两组幼猪的存活情况。
该研究采用的是A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照5. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。
第三章实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。
内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。
据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。
该结论是否正确?如果不正确,请说明理由。
三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复B. 随机化、对照、盲法C. 随机化、重复、盲法D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。
7天后观察两组幼猪的存活情况。
该研究采用的是A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照5. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。
第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
、SPSS 基本功能广Frequencies描述性分析丿D eSCriptiVeS Explore一般线性模型相关与回归分析 非参数检验 图表分析:条图、直方图、饼图、线图、散 点图等 输出管理:对输出结果复制、编辑等均数比较< CrosstabsSPSS 基「 本2 功、台匕正态分布日疋量资料的统」计推<偏态分布单样本设计t检验配对设计检验成组设计检验I完全随机设计方差分析以上空」随机区组设计方差分析厂两组均数比较三组及数比较4I重复测量方差分析■析因设计方差分析r配对设计秩和检验单样本设计秩和检验成组设计秩和检验1 •参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2 •非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广, 可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2 •非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯n型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯n型错误第一章绪论1•举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
医学统计学复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。
总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。
例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。
从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。
抽取样本的目的是用样本的信息推论总体特征。
2.简述3种变量类型的特征。
(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。
第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?2.全距、四分位数间距、方差、标准差、变异系数各有何特点?3.制定医学参考值范围的一般原则是什么?(1)抽取样本含量足够大的“正常人”。
一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。
(2)对抽取的正常人进行准确而统一的测定,控制测量误差。
(3)判断是否需要分组制定参考值范围。
第十五章数值变量的统计推断2.参考值范围与可信区间有何区别(1)意义不同:参考值范围是指同质总体中包括一定数量(如95%或99%)个体值的估计范围。
可信区间是指按一定的可信度来估计总体参数所在范围。
(2)计算方法不同:参考值范围用uS计算。
可信区间用t,S或uS计算,前者用标准差,后者用标准误。
3.何谓假设检验其一般步骤是什么所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
习题三解答1. 设随机变量X 的分布率为X -2 -1 0 1 p0.40.30.20.1求E (X )、V (X )、E (3X 2+5)。
解:()(2)0.4(1)0.300.210.11E X =-⨯+-⨯+⨯+⨯=-22222()(2)0.4(1)0.300.210.12E X =-⨯+-⨯+⨯+⨯= 22()()[()]211V X E X E X =-=-= 22(35)3()532511E X E X +=+=⨯+=2. 设盒中有2个白球和3个黑球,从中任意摸出3个球。
记X 为摸到的白球数,求E (X )和V (X )。
解: 0,1,2X =33351(0)10C P X C ===2132356(1)10C C P X C === 1232353(2)10C C P X C === ()0(0)1(1)2(2)163012 1.2101010E X P X P X P X =⨯=+⨯=+⨯==⨯+⨯+⨯= 2222163()012 1.8101010E X =⨯+⨯+⨯= 222()()[()] 1.8 1.20.36V X E X E X =-=-=3.设随机变量X 的概率函数为51)(==k X P ,k=1,2,…,5求E (X )、E (X 2)和E [(X +2)2]。
()1(1)2(2)3(3)4(4)5(5)1(12345)35E X P X P X P X P X P X ==+=+=+=+==++++=22222222222()1(1)2(2)3(3)4(4)5(5)1(12345)115E X P X P X P X P X P X ==+=+=+=+==++++= 222()()[()]1132V X E X E X =-=-=2222221[(2)](34567)275E X +=++++=或222[(2)](44)()4()41143427E X E X X E X E X +=++=++=+⨯+= 4. 某实验室给每位学生发1只小白兔做实验,若实验不成功可发第2只,如此最多发给3只。
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。
不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
二、案例辨析题统计描述时,常见错误是对定量资料的描述均采用均数、标准差。
正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。
本资料的血清胆固醇的频数分布图如下:图4-1 血清甘油三酯(TG)的频数分布可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:集中趋势指标150150122(1.7/26 1.75)/2 1.755X M X ⎛⎫⎛⎫+ ⎪⎪⎝⎭⎝⎭⎛⎫=+ ⎪ ⎪⎝=+=⎭ (mmol/L)离散程度指标 四分位数间距= 7525 2.10 1.340.76P P -=-= (mmol/L)三、最佳选择题1. B2. E3. B4. C5. D6. E7. A8. D9. D四、综合分析题 1. 解:输出结果频数图4-4 尿总砷的频数分布图由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。
输出结果图4-5 尿总砷对数的频数分布图由图可见lgx 分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。
(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。
输出结果频数频数结果中的Mean 表示尿总砷对数值的均数为- 1.1831,求其反对数,得到几何均数0.0656(μg/L)G =。
2. 解:(1) 已知健康人的血清TC 服从正态分布,故采用正态分布法制定95%的参考值范围。
下限: 1.96 4.84 1.960.96 2.96X S -=-⨯=(mmol/L)上限: 1.96 4.84 1.960.96 6.72X S +=+⨯=(mmol/L)该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为 2.96 mmol/L~6.72mmol/L 。
(2) 45~55岁健康男性居民的血清总胆固醇分布为正态分布,需作标准化变换后,查表确定正态分布曲线下面积。
由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。
11 3.25 4.841.660.96X Z μσ--===-22 5.25 4.840.430.96X Z μσ--===查标准正态分布曲线下的面积表(附表2)得:1()(1.66)0.0485Z Φ=Φ-=2()1(0.43)10.33360.6664Z Φ=-Φ-=-=21()()0.66640.04850.617961.79%D Z Z =Φ-Φ=-==该市45~55岁健康男性居民中,血清总胆固醇在3.25mmol/L~5.25mmol/L 范围内的比例为61.79%。
(3) 作标准化变换3.804.841.080.96X Z μσ--===-查标准正态分布曲线下的面积表(附表2)得:()( 1.08)0.140114.01%Z Φ=Φ-==该市45~55岁健康男性居民中,血清总胆固醇低于 3.80mmol/L 所占的比例为14.01%。
3. 解: 输出结果跟骨硬度指数图4-8 跟骨硬度指数的频数分布图由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。
输出结果Statistics即该地区30~35岁健康女性的SI 的95%参考值范围为(58.02, 143.66)。
频数50 60 70 80 90 100 110 120 130 140 150第五章定性资料的统计描述【习题解析】一、思考题1.①计算相对数应时有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。
2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。
两者在实际应用时容易混淆,要注意区别。
3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。
4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。
5. ①标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。
但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。
因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。
②样本的标准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。
③注意标准化方法的选用。
如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。
但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。
④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。
此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
二、案例辨析题该结论不正确。
因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。
三、最佳选择题1. B2. A3. D4. E5. D6. D7. C8. C9. B四、综合分析题 1. 解:表5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系分 组 调查人数经常吸烟经常吸烟率(%)是否 COPD 患者 356 231 125 64.89 非COPD 患者47918329638.20COPD 患者的经常吸烟率:231/356×100%=64.89% 非COPD 患者经常吸烟率:183/479×100%=38.20% COPD 患者的经常吸烟率比非COPD 患者高26.69%231296=2.989125183OR 比值比()⨯=⨯还需进一步对OR 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果2. 解:表5-4 某地居民1998~2004年某病死亡率(1/10万)动态变化年份 符号 死亡率 绝对增长量发展速度增长速度累计 逐年 定基比 环比 定基比 环比1998~ a 0 160.5 — ——— — — 1999~ a 1 144.2 -16.3 -16.3 0.90 0.90 -0.10 -0.10 2000~ a 2 130.0 -30.5 -14.2 0.81 0.90 -0.19 -0.10 2001~ a 3 120.2 -40.3 -9.8 0.75 0.92 -0.25 -0.08 2002~ a 4 85.6 -74.9 -34.6 0.53 0.71 -0.47 -0.29 2003~ a 5 69.5 -91.0 -16.1 0.43 0.81 -0.57 -0.19 2004~a 638.5-122.0-31.00.240.55-0.76-0.45该病死亡率的平均发展速度0.79== 该病死亡率的平均增长速度=1=0.791=0.21---平均发展速度3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg 阳性率的影响,应先进行标准化再进行比较。
根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。
表5-5 直接法计算某地不同年龄、性别人群的HBsAg 标准化阳性率(%)年龄组 标准人口数i N男性女性 原阳性率i p预期阳性数i i N p原阳性率 i p预期阳性数i i N p0~ 1081 2.30 24.90 2.32 25.09 20~ 1473 2.71 39.97 2.72 40.02 40~ 1546 6.06 93.63 6.46 99.86 60~ 1408 7.52 105.85 8.60 121.04 合 计5508(N )5.11264 (i i N p ∑)4.86286(i i N p ∑)男性HBsAg 标准化阳性率:264100% 4.79%5508p '=⨯= 女性HBsAg 标准化阳性率:286100% 5.19%5508p '=⨯= 可见,经标准化后女性HBsAg 阳性率高于男性。