医学统计学第二版高等教育出版社课后习题答案
- 格式:doc
- 大小:75.00 KB
- 文档页数:18
习题《医学统计学》第二版(七年制临床医学用)(一)最佳选择题1。
描述一组偏态分布资料的变异度,以( )指标较好。
A。
全距 B。
标准差C。
变异系数 D. 四分位数间距E.方差2.用均数和标准差可以全面描述( )资料的特征.A。
正偏态分布 B. 负偏态分布C. 正态分布 D。
对称分布E.对数正态分布3。
各观察值均加(或减)同一数后()。
A. 均数不变,标准差改变B. 均数改变,标准差不变C。
两者均不变 D。
两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用().A. 变异系数B. 方差C. 极差D. 标准差E.四分位数间距5.偏态分布宜用( )描述其分布的集中趋势。
A。
算术均数 B。
标准差C. 中位数D. 四分位数间距E.方差6。
各观察值同乘以一个不等于0的常数后,( )不变.A.算术均数 B. 标准差C。
几何均数 D. 中位数E.变异系数7。
()分布的资料,均数等于中位数.A. 对数正态 B。
正偏态C. 负偏态 D。
偏态E.正态8。
对数正态分布是一种( )分布.(说明:设X变量经Y=lg X变换后服从正态分布,问X变量属何种分布?)A. 正态B. 近似正态C. 左偏态D. 右偏态E.对称9。
最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。
A. 均数 B。
标准差C。
中位数 D. 四分位数间距E.几何均数10。
血清学滴度资料最常用来表示其平均水平的指标是()。
A。
算术平均数 B。
中位数C。
几何均数 D.变异系数E.标准差11.( )小,表示用该样本均数估计总体均数的可靠性大。
A. CVB. S R E 。
四分位数间距12.两样本均数比较的t 检验,差别有统计学意义时,P 越小,说明( )。
A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E 。
越有理由认为两总体均数相同13. 甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( )。
第三章实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。
内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。
据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。
该结论是否正确?如果不正确,请说明理由。
三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复B. 随机化、对照、盲法C. 随机化、重复、盲法D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。
7天后观察两组幼猪的存活情况。
该研究采用的是A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照5. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。
第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
医学统计学课后习题答案(第2版高等教育出版社)第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
《医学统计学》部分习题参考答案颜虹主编第二版第三章统计描述一、最佳选择题1.C2.A3.D4.B5.E6.E7.C8.D9.C10.C11.A12.D三、计算分析题P53-1素食前X1素食后X2X1-X2平均187.75平均168.25平均19.5中位数179中位数165中位数19标准差33.18885标准差26.79593标准差16.80838方差1101.5方差718.0217方差282.5217 4)第四章常见的概率分布一、最佳选择题1.D2.D3.B4.D5.B6.E7.E8.C9.D10.C11.C三、计算分析题P73-41120124.4 1.15793.8u -==-2125124.40.1578953.8u -==查标准正态分布表得1()( 1.1579)( 1.16)0.123u Φ=Φ-≅Φ-=2()(0.15795)(0.16)1(0.16)10.43640.5636u Φ=Φ≅Φ=-Φ-=-=21()()0.56360.1230.4406u u Φ-Φ=-=该地身高界于120cm 到125cm 范围内的8岁男童比例为44.06%。
20044.06%89()⨯≈人200名8岁男童中身高界于120~125cm 范围的人数约为89人。
P73-5Poisson 0.99967Binominal 0.9998P73-6解:(1)由题意可知,随机误差变量X 服从正态分布,其中μ=2,σ=4。
要求测量误差的绝对值不超过3的概率,即求P P ≤≤≤(X 3)=(-3X 3),作标准化变化132 1.254u --==-2320.254u -==1()( 1.25)0.1056u Φ=Φ-=2()(0.25)1(0.25)10.40130.5987u Φ=Φ-Φ-=-=21()()0.59870.10560.4931u u Φ-Φ=-=即测量误差的绝对值不超过3的概率为0.4931。
(2)根据题意,以Y 表示测量误差的绝对值不超过3,则Y 服从二项分布,其中n=3,0.4931π=,根据题意,至少有1次误差的绝对值不超过3的概率为003033(1)1(0)1(1)10.50690.86975P Y P Y C ππ-≥=-==--=-=P73-7解:根据医学知识可知健康成人血清总胆固醇值过高或过低为异常,故应制定双侧医学参考值范围因为已经假定血清总胆固醇值服从正态分布,故可用正态分布法求该指标的95%医学参考值范围,即 1.96μσ±。
《医学统计学》部分习题参考答案颜虹主编第二版第三章统计描述一、最佳选择题1.C2.A3.D4.B5.E6.E7.C8.D9.C10.C11.A12.D三、计算分析题P53-1素食前X1素食后X2X1-X2平均187.75平均168.25平均19.5中位数179中位数165中位数19标准差33.18885标准差26.79593标准差16.80838方差1101.5方差718.0217方差282.5217 4)第四章常见的概率分布一、最佳选择题1.D2.D3.B4.D5.B6.E7.E8.C9.D10.C11.C三、计算分析题P73-41120124.4 1.15793.8u -==-2125124.40.1578953.8u -==查标准正态分布表得1()( 1.1579)( 1.16)0.123u Φ=Φ-≅Φ-=2()(0.15795)(0.16)1(0.16)10.43640.5636u Φ=Φ≅Φ=-Φ-=-=21()()0.56360.1230.4406u u Φ-Φ=-=该地身高界于120cm 到125cm 范围内的8岁男童比例为44.06%。
20044.06%89()⨯≈人200名8岁男童中身高界于120~125cm 范围的人数约为89人。
P73-5Poisson 0.99967Binominal 0.9998P73-6解:(1)由题意可知,随机误差变量X 服从正态分布,其中μ=2,σ=4。
要求测量误差的绝对值不超过3的概率,即求P P ≤≤≤(X 3)=(-3X 3),作标准化变化132 1.254u --==-2320.254u -==1()( 1.25)0.1056u Φ=Φ-=2()(0.25)1(0.25)10.40130.5987u Φ=Φ-Φ-=-=21()()0.59870.10560.4931u u Φ-Φ=-=即测量误差的绝对值不超过3的概率为0.4931。
(2)根据题意,以Y 表示测量误差的绝对值不超过3,则Y 服从二项分布,其中n=3,0.4931π=,根据题意,至少有1次误差的绝对值不超过3的概率为003033(1)1(0)1(1)10.50690.86975P Y P Y C ππ-≥=-==--=-=P73-7解:根据医学知识可知健康成人血清总胆固醇值过高或过低为异常,故应制定双侧医学参考值范围因为已经假定血清总胆固醇值服从正态分布,故可用正态分布法求该指标的95%医学参考值范围,即 1.96μσ±。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
医学统计学第二版钟晓妮课后题答案l.统计中所说的总体是指:() [单选题] *A根据研究目的确定的同质的研究对象的全体(正确答案)B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.统计学的主要作用是 : () [单选题] *A使分析更为简单B避免计算出现错误C改善数据质量D克服个体变异的影响E探测随机现象的规律(正确答案)3.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本4.测量身高、体重等指标的原始资料叫:() [单选题] * A计数资料B计量资料(正确答案)C等级资料D分类资料E有序分类资料5某种新疗法治疗某病患者41人,治疗结果如下:()[单选题] *A计数资料B计量资料C无序分类资料D有序分类资料(正确答案)E数值变量资料6.正态分布曲线的位置参数是: () [单选题] *AαBβC µ(正确答案)DσEχ7.医学统计学的基本内容是: () [单选题] *A统计设计、数据整理与核查、统计描述、统计推断(正确答案)B收集资料、整理资料、设计、统计推断C统计设计、收集资料、统计推断、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断8.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: () [单选题] *A抽样误差B系统误差(正确答案)C随机误差D责任事故E以上都不对9.以下何者不是实验设计应遵循的原则 : () [单选题] *A对照的原则B随机原则C重复原则D交叉的原则(正确答案)E以上都不对10.对于配对设计的t检验,其检验假设H0是:() [单选题] *A两样本均数相同B两样本均数不同C两总体均数相同D两样本均数不同E配对数据的差值总体均数为0(正确答案)11.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 : () [单选题] * A 算术均数B几何均数C 中位数(正确答案)D 标准差E 变异系数12.各观察值均加(或减)同一数后: () [单选题] *A均数不变,标准差改变B均数改变,标准差不变C两者均不变(正确答案)D两者均改变E以上均不对13.比较某地1990~1997年肝炎发病率宜绘制 : () [单选题] *A直条图B构成图C普通线图(正确答案)D直方图E统计地图14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24以上(小时),问该食物中毒的平均潜伏期为多少小时? () [单选题] *A 5B 5.5C 6(正确答案)D l0E 1215.比较12岁男孩身高和体重的变异程度大小,宜采用的指标是: () [单选题] * A全距B标准差C方差D变异系数(正确答案)E极差16.对于正态或近似正态分布的资料,描述其变异程度应选用的指标是 : () [单选题] *A变异系数B离均差平方和C极差D 四分位间距E标准差(正确答案)17.以下不属于统计表的基本组成的是:() [单选题] *A.标题B.标目C.线条D.时间(正确答案)E.数字18.某项指标95%医学参考值范围表示的是: () [单选题] *A在此范围“异常”的概率大于或等于95%B 在此范围“正常”的概率大于或等于95%C 在“异常”总体中有95%的人在此范围之外D 在“正常”总体中有95%的人在此范围(正确答案)E 在人群中检测指标有5%的可能超出此范围19.20世纪50年代,发现某省部分地区的居民因长期饮用深井高碘水导致高碘性甲状腺肿,随机抽查得到该地区甲乙两村常住居民的高碘性甲状腺肿患病率,甲村为20.6%,乙村为25.3%,则甲乙两村该病的合计患病率为:() [单选题] *A两村患病率的几何平均数得29.11%B 两村患病率相加得45.9%C 两村患病率相乘得5.21%D 两村患病率的平均数得22.95%E 甲乙两村调查人群中患该病总人数除以调查总人数(正确答案)20.药物A对于治疗普通肺炎的有效率为67.0%,药物B治疗普通肺炎的有效率为65.7%,为了分析A药和B药对于普通肺炎的有效率是否不同,经过两独立样本的t检验计算t值,最后查表得到的P=0.035,那么该研究中最后应该下的研究结论应该是:() [单选题] *A药物A与药物B治疗普通肺炎的有效率相同B 尚不能认为药物A与药物B治疗普通肺炎的有效率相同(正确答案)C 尚不能认为药物A与药物B治疗普通肺炎的有效率不同D 药物A治疗普通肺炎的有效率优于药物BE 无法下结论21.以下属于离散型变量指标的是:() [单选题] *A身高B 体重C 住院病人数D 血液中血红蛋白含量(正确答案)E 某地年降水量22.小概率事件是指:() [单选题] *A统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件(正确答案)B 统计学上一般把P≤0.5或P≤0. 1的事件称为小概率事件C 统计学上一般把P≤0.05或P>0.01的事件称为小概率事件D 统计学上一般把P≤0.25的事件称为小概率事件E 发生概率足够小的事件23.在绘制频数分布表的过程中,组限在每组中: () [单选题] *A只包含下限而不包含上限(正确答案)B 只包含上限而不包含下限C 既包含下限又包含上限D 可自行选择包含上限或下限E 上限和下限均不包含24.以下几幅图中属于正偏态分布的是: ( A ) [单选题]A(正确答案)BC DE25.描述抗体滴度集中趋势适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数26.算术均数与中位数相比,其特点是:() [单选题] * A不易受极端值的影响B 能充分利用数据的信息(正确答案)C 抽样误差较大D 更适用于偏态分布资料E 更适用于分布不明资料27.医学参考值范围的计算方法主要有:() [单选题] *A百分位数法和估计值法B 百分位数法和正态分布法(正确答案)C 百分位数法和查表法D 正态分布法和查表法E 查表法和公式计算法28.比较两个不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以:()[单选题] *A排除对结果有不良影响的个体B 增大样本量C 采用标准化率(正确答案)D 更改相关数据E 通过统计软件消除影响29.统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差,将后者称为均数的: () [单选题] *A标准值B 标准差C 标准化率D 标准误(正确答案)E 标准方差30.以下变量适合用单侧检验进行分析的是:() [单选题] * A血铅水平(正确答案)B 血压C 呼吸次数D 血红蛋白含量E 3岁男童正常身高3l.统计学中所谓的样本通常是指:() [单选题] *A总体中有代表性的一部分观察单位(正确答案)B可测量的生物性样品C统计量D某一变量的测量值E数据中的一部分观测值32.医学统计学研究的对象是:() [单选题] *A医学中的小概率事件B各种类型的数据C动物和人的本质D疾病的预防与治疗E医学中具有不确定性结果的事物(正确答案)33.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本34,下列观测结果属于有序数据的是:() [单选题] *A收缩压测量值B脉搏数C住院天数D病情程度(正确答案)E四种血型35.两样本均数比较,其差别有统计学意义是指 :() [单选题] *A两样本均数的差别具有实际意义B两总体均数的差别具有实际意义C两样本和两总体均数的差别都具有实际意义D有理由认为两样本均数有差别E有理由认为两总体均数有差别(正确答案)36.不可完全消除的误差类型是:() [单选题] *A系统误差B 随机误差(正确答案)C 抽样误差D 人为误差E 机械误差37.正态曲线下,横轴上从均数到+∞的面积是:() [单选题] *A 50%(正确答案)B 95%C 97.5%D 99%E 不能确定(与标准差的大小有关)38.6人接种流感疫苗一个月后测定抗体滴度为1:20,1:40,1:80,1:160,1:320,求平均滴度应选用的指标是:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数39.描述两端无确定数值数据的平均水平适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数E 中位数(正确答案)40.以下变量中,属于分类变量的是: () [单选题] *A脉搏B血型(正确答案)C肺活量D红细胞计数E血压41.减少抽样误差的有效途径是:() [单选题] *A避免系统误差B控制随机测量误差C增大样本含量(正确答案)D减少样本含量E以上都不对42.样本是总体的 : () [单选题] *A有价值的部分B有意义的部分C有代表性的部分(正确答案)D任意一部分E典型部分43.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:() [单选题] * A统计设计B收集资料C整理资料D分析资料(正确答案)E以上均不对44.统计工作的步骤正确的是:() [单选题] *A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料(正确答案)D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断45.表示血清学滴度资料平均水平最常计算 :() [单选题] *A算术均数B几何均数(正确答案)C中位数D全距E率46.一种新的治疗方法不能治愈病人,但能延长病人寿命,那么则会发生的情况是 :() [单选题] *A 该病患病率增加(正确答案)B 该病发病率增加C 该病患病率下降D 该病发病率下降E 以上都不对47.计算标化死亡率的目的是:() [单选题] *A 减少死亡率估计的抽样误差B 减少死亡率估计的系统误差C 便于进行不同地区的死亡率比较D 便于进行不同时间的死亡率比较E 消除不同人群内部构成不同的影响(正确答案)48.统计推断的目的是: () [单选题] *A参数估计B假设检验C统计描述D用样本信息推断总体特征(正确答案)E以上均不对49.两样本均数比较时,其无效假设是:() [单选题] * A.两个总体均数不同B.两个样本均数不同C.两个总体均数相同(正确答案)D.两个样本均数相同E.以上均不对50.实验设计的三个基本要素是: () [单选题] *A化学因素、物理因素、研究对象B 研究者、受试对象、效果C 受试对象、背景因素、实验效应D 处理因素、实验效应、受试对象(正确答案)E 干扰因素、实验场所、处理因素。
习题三解答1. 设随机变量X 的分布率为X -2 -1 0 1 p0.40.30.20.1求E (X )、V (X )、E (3X 2+5)。
解:()(2)0.4(1)0.300.210.11E X =-⨯+-⨯+⨯+⨯=-22222()(2)0.4(1)0.300.210.12E X =-⨯+-⨯+⨯+⨯= 22()()[()]211V X E X E X =-=-= 22(35)3()532511E X E X +=+=⨯+=2. 设盒中有2个白球和3个黑球,从中任意摸出3个球。
记X 为摸到的白球数,求E (X )和V (X )。
解: 0,1,2X =33351(0)10C P X C ===2132356(1)10C C P X C === 1232353(2)10C C P X C === ()0(0)1(1)2(2)163012 1.2101010E X P X P X P X =⨯=+⨯=+⨯==⨯+⨯+⨯= 2222163()012 1.8101010E X =⨯+⨯+⨯= 222()()[()] 1.8 1.20.36V X E X E X =-=-=3.设随机变量X 的概率函数为51)(==k X P ,k=1,2,…,5求E (X )、E (X 2)和E [(X +2)2]。
()1(1)2(2)3(3)4(4)5(5)1(12345)35E X P X P X P X P X P X ==+=+=+=+==++++=22222222222()1(1)2(2)3(3)4(4)5(5)1(12345)115E X P X P X P X P X P X ==+=+=+=+==++++= 222()()[()]1132V X E X E X =-=-=2222221[(2)](34567)275E X +=++++=或222[(2)](44)()4()41143427E X E X X E X E X +=++=++=+⨯+= 4. 某实验室给每位学生发1只小白兔做实验,若实验不成功可发第2只,如此最多发给3只。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
2.简述调查设计的基本内容。
①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。
3.试比较常用的四种概率抽样方法的优缺点。
(1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。
缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。
(2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。
缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。
但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。
(3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。
缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。
(4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。
4.常用的非概率抽样方法有哪些?有偶遇抽样、立意抽样、定额抽样、雪球抽样等。
5.简述调查问题的顺序安排。
调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题在前,难答题在后④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题⑤敏感问题一般放在最后。
此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。
第四章定量资料的统计描述1.均数、中位数、几何均数的适用范围有何异同?相同点是都用于描述定量资料的集中趋势。
不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料③中位数用于不对称分布资料、两端无确切值的资料以及分布不明确的资料。
2.同一资料的标准差是否一定小于均数?同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小。
表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3.极差、四分位数间距、标准差、变异系数的适用范围有何异同?相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确的资料的离散程度③标准差用于描述正态分布或近似正态分布资料的离散程度④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4.正态分布有哪些基本特征?①正态曲线在横轴上方均数处最高②正态分布以均数为中心,左右对称③正态分布有两个参数,即位置参数μ和形态参数σ④正态曲线下的面积分布有一定规律,正态曲线与横轴间的面积恒等于1。
曲线下区间(μ-1.96σ,μ+1.96σ)内的面积为95.00%;区间(μ-2.58σ,μ+2.58σ)内的面积为99.00%5.制定医学参考值范围时,正态分布法和百分位数法分别适用于何种资料?①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积的规律制定医学参考值范围,服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
第五章、定性资料的统计描述1.应用相对数时需要注意哪些问题?①应有足够的观察单位数;②不能以构成比代替率;③计算观察单位数不等的及格率的合计率和平均率时,不能简单的把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率和平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样品率或样品构成比的比较应作检验假设。
2.为什么不能以构成比代替率?率是指某现象实际发生数和某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占比重,不能说明某现象发生的频率或强度大小。
3.标准化率计算的直接法和间接法的应用有何区别?如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。
4.常用动态数列分析指标有哪几种?各有何用途?绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内个环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展速度;与平均增长速度是说明事物在一定时间内逐年的平均增长速度。
5.率的标准化需要注意那些问题?①仅用于相互间的比较,实际水平应采用未标化率来反映。
②样品的标化率是样品指标,存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。
③注意直接法和间接法的选用。
④各年龄组若出现明显交叉,或呈非平行变化趋势时,不适合采用标准化法,宜分层比较各年龄组率。
此外,对于因其他条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
第六章总体均数的估计1、什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些?抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。
这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。
决定均数抽样误差大小的因素主要为样本含量和标准差。
2、样本均数的抽样分布有何特点?样本均数的抽样分布特点有:1、各样本均数未必等于总体均数;2、样本均数之间存在差异;3、样本均数服从正态分布;4、样本均数的变异范围较原变量的变异范围小;5、随着样本含量的增加,样本均数的变异范围逐渐缩小。
3、阐述标准差与标准误的区别与联系。
标准差与标准误的区别在于:1、计算公式不同;2、统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;3、用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。
标准差与标准误的联系:当样本量n一定时,标准误随标准差的增加而增加,公式为:看小抄。
4、如何运用抽样分布规律估计总体均数?中心极限定理:从均数为u,标准差为σ的正态总体中进行独立随机抽样,其样本均数服从均数为u,标准差为σ/根号下u的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时(n大于等于50),其样本均数的分布近似于均数为u,标准差为σ/根号下u的正态分布。
σx越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。
反之,σx越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。
5、阐述总体均数的置信区间与医学参考值范围的区别。
第七章假设检验1、解释零假设与备择假设的含义。
零假设又称无效假设或无差异假设,记为H0,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示目前的差异是因为比较的对象之间存在本质不同造成的。
2、简述假设检验的基本步骤。
假设检验的基本步骤如下:(1)建立检验假设,确定检验水准。
(2)计算检验统计量。
(3)确定P值,作出统计推断。
3、比较单侧检验与双侧检验的区别。
选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。
例如,在临床试验中,比较甲、乙两种治疗方法的疗效有无差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。
如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。
若从专业角度无法确定的情况下,一般应采用双侧检验。