第一章绪论
1.下列关于概率的说法,错误的是
A. 通常用P表示
B. 大小在0%与100%之间
C. 某事件发生的频率即概率
D. 在实际工作中,概率是难以获得的
E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件
[参考答案] C. 某事件发生的频率即概率
2.下列有关个人基本信息的指标中,属于有序分类变量的是
A. 学历
B. 民族
C. 血型
D. 职业
E. 身高
[参考答案] A. 学历
3.下列有关个人基本信息的指标,其中属于定量变量的是
A. 性别
B. 民族
C. 职业
D. 血型
E. 身高
[参考答案] E. 身高
4.下列关于总体和样本的说法,不正确的是
A. 个体间的同质性是构成总体的必备条件
B. 总体是根据研究目的所确定的观察单位的集合
C. 总体通常有无限总体和有限总体之分
D. 一般而言,参数难以测定,仅能根据样本估计
E. 从总体中抽取的样本一定能代表该总体
[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是
A. 所有糖尿病患者
B. 所有成都市居民
C. 2007年所有成都市居民
D. 2007年成都市居民中的糖尿病患者
E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民
6.简述小概率事件原理。
答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。
7.举例说明参数和统计量的概念
答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的
8.举例说明总体和样本的概念
答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从
此总体中随机抽取2000人,分别测得其红细胞数,组成样本,其样本含量为2000。
第二章调查研究设计
1. 以下五个问题中,最符合调查问卷设计要求的是
A.你一个月工资多少?
B.你一个月吃多少克盐?
C.你是否有婚外恋:①有②无
D.你和你的妈妈认为女孩几岁结婚比较好?
E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可
[参考答案]E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可2.普查是一种全面调查的方法,与抽样调查相比,叙述正确的是
A.确定对象较为简单
B.适于发病率较低疾病的调查
C.不易获得反映平均水平的统计指标
D.因涉及面广,可产生较大的抽样误差
E.更易统一调查技术,提高调查质量[参考答案]A.确定对象较为简单
3. 欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为
A.单纯随机抽样
B.整群抽样
C.分层抽样
D,典型调查
E.普查
[参考答案]D.典型调查
4. 某县有30万人口,其中农村人口占80%,现欲对农村妇女的计划生育措施情况进行调查,调查对象应为
A. 该县所有的已婚夫妻
B.该县所有的农村妇女
C.该县所有的育龄期妇女
D.该县所有的已婚妇女
E.该县所有已婚育龄期农村妇女
[参考答案]E.该县所有已婚育龄期农村妇女
5. 为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于
A. 单纯随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
E.多阶段抽样
[参考答案]B.系统抽样
6. 下列关于调查设计的叙述,正确的是
A. 明确调查目的是调查研究最核心的问题
B.采用抽样调查还是普查是由该地区的经济水平决定的
C.调查设计出现缺陷时,可以通过相应的统计分析方法弥补
D.一旦制定了调查研究计划,在实际操作过程中,就不可改变
E.调查的质量控制主要在调查问卷设计阶段
[参考答案]A.明确调查目的是调查研究最核心的问题
7. 条件相同时,下列抽样方法中抽样误差最大的是
A. 单纯随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
E.无法直接比较
[参考答案]E.整群抽样
8. 以下抽样方法中不属于概率抽样的是
A. 单纯随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
E.雪球抽样
[参考答案]E.雪球抽样
9. 实验性研究与观察性研究的根本区别在于
A. 抽样方法不同
B.研究对象不同
C.是否设立对照组
D.假设检验方法不同
E.是否人为施加干预措施
[参考答案]E.是否人为施加干预措施
10. 简述调查问题的顺序安排。
答:调查问题顺序安排总原则:①符合逻辑;②一般问题在前,特殊问题在后;③易答题在前,难答题在后;④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题;⑤敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。
11. 常用的非概率抽样方法有哪些?答:常用的非概率抽样方法有偶遇抽样、立意抽样、定额抽样、雪球抽样等。
12. 试比较常用的四种概率抽样方法的优缺点。
答:单纯随机抽样的优点是均数(或率)及标准误的计算简便。缺点是当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。系统抽样的优点是:①易于理解,简便易行;
②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。系统抽样的缺点是:①当总体的观察单位按顺序有周期趋势或单调增(或减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不得随意更改,否则可能造成另外的系统误差。②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。分层抽样的优点是:①减少抽样误差:分层后增加了层内的同质性,因而观察值的变异度减小,各层的抽样误差减小,在样本含量相等的情况下其标准误一般均小于单纯随机抽样、系统抽样和整群抽样的标准误;②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施;③还可对不同层进行独立分析。其缺点是当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。整群抽样的优点是便于组织,节省经费,容易控制调查质量。缺点是当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差。
13. 简述调查设计的基本内容。
答:调查设计的基本内容包括:①明确调查目的和指标;②确定调查对象和观察单位;③确定调查方法;④确定调查方式;
⑤确定调查项目和调查表;⑥制定资料整理分析计划;⑦制定调查的组织计划。
14. 调查研究的主要特点是什么?
答:调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施。②不能用随机化分组来平衡混杂因素对调查结果的影响。
第三章实验研究设计
1. 药品上市后应用阶段进行的临床试验属于
A. I期临床试验
B. II期临床试验
C. III期临床试验
D. IV期临床试验
E.现场试验
[参考答案] D. IV期临床试验
2. 临床试验的统计分析主要包括
A.可比性分析、疗效评价、安全性评价
B.可比性分析、优效性分析、劣效性分析
C.可比性分析、安全性评价、可行性分析
D.优效性分析、等效性分析、安全性评价
E.疗效评价、安全性评价、可行性分析
[参考答案] A.可比性分析、疗效评价、安全性评价
3. 在某临床试验中,将180例患者随机分为两组,试验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用控制偏倚的方法有
A.单盲、多中心
B.随机化、多中心
C.随机化、单盲
D.随机化、双盲双模拟
E.双盲双模拟、多中心
[参考答案] D.随机化、双盲双模拟
4. 将两个或多个处理因素的各水平进行组合,对所有可能的组合都进行实验,该实验设计方案是
A.随机区组设计
B.完全随机设计
C.析因设计
D.配对设计
E.交叉设计
[参考答案] C.析因设计
5. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成
A.选择性偏倚
B.测量性偏倚
C.混杂性偏倚
D.信息偏倚
E.失访性偏倚
[参考答案] C.混杂性偏倚
6. 观察指标应具有
A.灵敏性、特异性、准确度、精密度、客观性
B.灵敏性、变异性、准确度、精密度、客观性
C.灵敏性、特异性、变异性、均衡性、稳定性
D.特异性、准确度、稳定性、均衡性、客观性
E.灵敏性、变异性、准确度、精密度、均衡性
[参考答案] A.灵敏性、特异性、准确度、精密度、客观性
7. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅给予实验组该疗法治疗,不给予对照组任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是
A. 空白对照
B. 安慰剂对照
C. 实验对照
D. 标准对照
E. 自身对照
[参考答案] A. 空白对照
8. 实验组与对照组主要不同之处在于
A.处理因素
B.观察指标
C.抽样误差
D.观察时间
E. 纳入、排除受试对象的标准
[参考答案] A.处理因素
9. 实验设计的三个基本原则是
A.随机化、对照、重复
B.随机化、对照、盲法
C.随机化、重复、盲法
D.均衡、对照、重复
E.盲法、对照、重复
[参考答案] A.随机化、对照、重复
10. 实验设计的三个基本要素是
A.处理因素、实验效应、实验场所
B.处理因素、实验效应、受试对象
C.受试对象、研究人员、处理因素
D.受试对象、干扰因素、处理因素
E.处理因素、实验效应、研究人员
[参考答案] B.处理因素、实验效应、受试对象
11. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠体内血管紧张素的影响,并分析两药的交互作用。你认为该研究最好采用何种实验设计方案?并说明理由。答:该研究最好采用2×2析因设计的实验方案,如表所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间有无交互作用。因此本例采用2×2析因设计既可分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。
12. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠体内血管紧张素的影响,并分析两药的交互作用。请帮该研究者实现32只大鼠的随机分组。
答:对于2×2析因设计,可采用完全随机化的方法将所有受试对象分到4个处理组。先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第2列最上端开始纵向连续取32个两位数字。对随机数字从小到大排序,事先规定,序号为1~8的豚鼠分为A 组,序号为9~16的大鼠分为B组,序号为17~24的大鼠分为C组,序号为25~32的大鼠分为D组
13. 某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?
答:先将6对小鼠按体重从小到大的顺序编号,再从随机数字表中任一行或列,如第18行最左端开始横向连续取12个两位数字。事先规定,每一对中,随机数较小者序号为1,对应于A组,随机数较大者序号为2,对应于B组。
14. 欲将16只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组,剩下8只作为对照组。该分组方法是否正确?若不正确,请说明理由。
答:该分组方法不正确,不是随机分组的方式。随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,破坏了随机化原则。
15. 三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。
答:该结论不正确。研究某治疗方案对某疾病的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有正确设立对照才能较好地控制非处理因素对实验结果的影响,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入了38例消化性溃疡患者,并未设立相应的对照组。而且这38例患者接受治疗的时间为2000年至2006年,时间跨度太大,对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。
16临床试验中使用安慰剂的目的是什
么?
答:临床试验中使用安慰剂,目的在于控制由于受试对象和试验观察者的心理因素引起的偏倚,提高依从性,还可控制疾病自然进程的影响,显示试验药物的效应。
17. 什么是交叉设计?它有何优缺点?答:交叉设计是一种特殊的自身对照设计,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。其中2′2交叉设计是最为简单的一种交叉设计,首先将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段实验结束后,经过适当的时间间隔(即清理阶段),两组再交换处理措施进行第二阶段的实验,这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适用于具有自愈倾向或病程较短的疾病研究。交叉设计的优点有:①节约样本含量;②能够控制个体差异和时间对处理因素的影响;③在临床试验中同等地考虑了每个患者的利益。其缺点有:①处理时间不能太长;②当受试对象的状态发生根本变化时,如死亡、治愈等,后一阶段的处理将无法进行;③受试对象一旦在某一阶段退出试验,就会造成数据缺
失,增加统计分析的困难;④不能用于具有自愈倾向或病程较短的疾病研究。
18. 什么是配对设计?它有何优缺点?答:配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、提高实验效率;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低实验效率。在临床试验中,配对的过程还可能延长实验时间。
19. 实验研究中,随机化的目的是什么?答:实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对数据资料进行统计推断的前提。
20. 实验研究根据对象的不同可分为哪几类?
答:根据受试对象不同,实验研究可分为动物实验、临床试验和现场试验三类。动物实验的受试对象可以是动物,或者是器官、细胞、血清等生物材料;临床试验的受试对象通常为患某种疾病的患者,持续时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是正常人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。
第四章定量资料的统计描述
1.正态分布曲线下(μ±1.64σ)区间的面积占总面积的
A. 90%
B. 95%
C. 97.5%
D. 99%
E. 不能确定
[参考答案] A. 90%
2. 关于均数与标准差,下列说法正确的是
A. 均数可能是负数,标准差不可能
B. 标准差可能是负数,均数不可能
C. 两者都不可能为负数
D. 两者都可能为负数
E. 以上都不对
[参考答案] A. 均数可能是负数,标准差不可能
3. CV越大,表示
A. 资料变异程度越大
B. 资料变异程度越小
C.均数越大
D. 样本含量越大
E. 均数的代表性越好
[参考答案] A. 资料变异程度越大
4.当资料两端含有不确切值时,描述其变异度宜用
A. R
B.CV
C. S2
D.S
E.四分位数间距
[参考答案] E.四分位数间距
5.以下分布形式或资料类型中,适宜用均数与标准差进行统计描述的是
A.正偏态分布
B.负偏态分布
C.对称分布
D.开口资料
E.任意分布
[参考答案] D. 开口资料
6.开医学研究中,反映一组血清抗体滴度资料的平均水平,根据经验,常选用口资料
A.算数均数
B.中位数
C.几何均数
D.众数
E.和
[参考答案] C.几何均数
7.数据分布类型无法确定时,描述集中位置宜选用
A.算数均数
B.中位数
C.几何均数
D.众数
E.和
[参考答案] B.中位数
8.描述一组正态分布资料变量值的平均水平,宜选用A.变异系数
B.方差
C.几何均数
D.标准差
E.算数均数
[参考答案] E.算数均数
9.频数分布的两个重要特征是
A. 总体与样本
B. 集中趋势与离散趋势
C. 统计量与参数
D. 标准差与标准误
E. 样本均数与总体均数
[参考答案] B. 集中趋势与离散趋势
10.抽样调查某市45~55岁健康男性居民的血脂水平,184名45~55岁健康男性居民的血清总胆固醇(TC)的xbar=4.84mmol/L,s=0.98mmol/L,已知健康人的血清总胆固醇服从正态分布。估计该市45~55岁健康男性居民中,血清总胆固醇在3.25mmol/L~5.25mmol/L范围内的比例。
答:45~55岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。
查标准正态分布曲线下的面积表(附表2)得:
该市45~55岁健康男性居民中,血清总胆固醇在3.25 mmol/L~5.25mmol/L范围内的比例为61.79%
11.抽样调查某市45~55岁健康男性居民的血脂水平,184名45~55岁健康男性居民的血清总胆固醇(TC)的xbar=4.84mmol/L,s=0.96mmol/L,已知健康人的血清总胆固醇服从正态分布。估计该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围
答:已知健康人的血清总胆固醇服从正态分布,故采用正态分布法制定95%
的参考值范围
该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为2.96 mmol/L~6.72mmol/L
12.某省抗癌协会癌症康复会对189名会员进行了生存质量评价,量表包括躯体功能、心理功能、症状不良反应和社会功能四个维度,共计22个条目,总分为220分,得分越高则生存质量越高。资料如下,据此资料计算集中位置指标和离散程度指标。计算结果为:集中位置指标xbar=135.77分,离散程度指标s=30.60
分。以上分析是否恰当?为什么?
答:大多数观察值集中在较大值一端,呈负偏态分布,故不宜使用均数和标准差。应计算中位数和四分位数间距,计算结果为
集中位置指标:M=139分
离散程度指标:四分位数间距QU-QL=157-119=38分
13.什么情况下用正态分布法或百分位数法制定医学参考值范围?
答:①通过大量调查证实或经正态性检验符合正态分布的指标或近似正态分布的指标,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的指标,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的指标,应使用百分位数法制定医学参考值范围。
14.何谓医学参考值范围?制定参考值范围的一般步骤有哪些?
答:医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标观察值的波动范围,一般用作判定正常和异常的参考标准。制定医学参考值范围的步骤包括确定观察对象和抽取足够的观察单位、统一测定方法、决定是否分组制定参考值范围、确定取双侧或单侧参考值范围、选定适当的百分界限、选择制定医学参考值范围的方法。
15.正态分布有哪些基本特征?
答:正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的总面积恒等于1,曲线下区间(μ-1.96σ, μ+1.96σ)内的面积为
95.00%,区间(μ-2.58σ, μ+2.58σ)
内的面积为99.00%。
16.极差、四分位数间距、标准差、变异系数的适用范围有何异同?
答:极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较各组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
17.均数、中位数、几何均数的适用范围有何异同?
答:均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中位置。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值以及分布不明确的资料。
第五章定性资料的统计描述
1 计算标准化率时,宜采用间接法的情况是
A.已知被标准化组的年龄别死亡率与年龄别人口数
B.已知被标准化组的死亡总数与年龄别人口数
C.已知标准组年龄构成与死亡总数D.已知标准组的人口总数与年龄别人口数E.被标化组各年龄段人口基数较大
[参考答案] B.已知被标准化组的死亡总数与年龄别人口数2 下列不属于相对比的指标是
A. RR
B. OR
C. 病死率
D. CV
E. 性别比
[参考答案] C. 病死率
3经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为89.94/10万,但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,而乙地为93.52/10万,发生此现象最有可能的原因是
A. 甲地的诊断技术水平更高
B. 乙地的恶性肿瘤防治工作做得比甲地更好
C. 甲地的老年人口在总人口中所占比例比乙地多
D. 乙地的老年人口在总人口中所占比例比甲地多
E. 甲地的男性人口在总人口中所占比例比乙地多
[参考答案] C. 甲地的老年人口在总人口中所占比例比乙地多
4.标准化死亡比SMR最初含义是指
A. 实际死亡数/预期死亡数
B. 预期死亡数/实际死亡数
C. 实际发病数/预期发病数
D. 预期发病数/实际发病数
E. 预期发病数/预期死亡
[参考答案] A. 实际死亡数/预期死亡数5.某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为
A. 率
B. 构成比
C. 发病率
D. 相对比
E. 时点患病率
[参考答案] B. 构成比
6.试就表5-4资料分析比较甲、乙两厂职工的高血压患病率。
答:因为甲乙两厂的年龄构成有所不同,为了消除年龄构成的不同对高血压患病率的影响,应先进行标准化再进行比较。根据本题资料,以两厂合计人口为标准人口,已知被标化组的年龄别患病率,采用直接法计算标准化患病率
7.表5-2为一抽样研究资料,试填补空白处数据并根据最后三栏结果作简要分析。
答:最后三栏结果的简要分析:恶性肿瘤死亡占总死亡的比例(%)为:各年龄组恶性肿瘤死亡数除以各年龄组总死亡人数后乘100得到的值,表示各年龄组死亡人口中,恶性肿瘤死亡所占的比例。恶性肿瘤死亡率(1/10万)为:各年龄组恶性肿瘤死亡数除以各年龄组总人数
后乘100000得到的值,表示各年龄组总人口中,恶性肿瘤死亡出现的频率。年龄别死亡率(‰)为:各年龄组死亡数除以各年龄组总人数后乘1000得到的值,表示各年龄组总人口中,死亡出现的频率。
8.某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。可计算出这样一些相对数,依次说明各指标的含义
答:
9.某地1965年和1970年几种主要急性传染病发病情况如表5-1。某医师根据此资料中痢疾与乙脑由1965年的44.2%与3.4%分别增加到1970年的51.9%和5.2%,认为该地1970年痢疾与乙脑的发病率升高。该结论是否正确?为什么?
答:该结论不正确。因为该医生所计算的指标是构成比,只能说明不同年份,痢疾与乙脑在几种传染病发病人数中所占的比重发生了变化,不能说明两种传染病感染发生的频率或强度,该医生犯了以构成比代替率的错误。
10.率的标准化需要注意哪些问题?
答:①标准化法的目的是为了通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择标准不同,计算出的标准化率也不相同。因此标准化率是用
于相互间的比较,实际水平应采用未标化率来反映。②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。
③注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
11.常用动态数列分析指标有哪几种?各有何用途?
答:常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。
标准化率计算的直接法和间接法的应用有何区别?
对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。
12.为什么不能以构成比代替率?
答:率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。
13.应用相对数时需要注意哪些问题?答:①计算相对数应有足够的观察单位数;
②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验;⑥某些情况下只能使用绝对数。
第六章总体均数的估计
1.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为11
2.8 mmHg,又从该地随机抽取10名7
岁正常男孩,测得其平均收缩压为
90.5mmHg,标准差为10.4 mmHg,7岁正常男孩收缩压的总体均数的95%置信区间为A.90.5±1.96×10.4
B.90.5±t0.05/2,9×10.4/?10 C.120.2±1.96×10.4
D.120.2±t0.05/2,9×10.4
E.120.2±t0.05/2,9×10.4/?10
[参考答案] B.90.5±t0.05/2,9×
10.4/?10
2.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为112.8 mmHg,又从该地随机抽取10名7
岁正常男孩,测得其平均收缩压为
90.5mmHg,标准差为10.4 mmHg,则下列说法正确的是
A.112.8mmHg与120.2mmHg不同是由于系统误差
B.112.8mmHg与120.2mmHg不同是由于两总体均数不同
C.90.5mmHg与112.8mmHg不同是由于抽样误差
D.90.5mmHg与120.2mmHg不同是由于抽样误差
E.90.5mmHg与112.8mmHg不同是因为两总体均数不同
[参考答案] E.90.5mmHg与112.8mmHg不同是因为两总体均数不同
3.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,后者反映的是
A.个体变异的大小
B.抽样误差的大小
C.系统误差的大小
D.总体的平均水平
E.样本的平均水平
[参考答案] A.个体变异的大小
4.总体均数的95%置信区间的含义是A.总体95%的个体值在该区间内
B.样本95%的个体值在该区间内
C.平均每100个总体均数,有95个在该区间内
D.平均每100个样本(样本含量相同)均数,有95个在该区间内
E.平均每100个样本(样本含量相同),有95个样本所得的区间包含总体均数
[参考答案] E.平均每100个样本(样本含量相同),有95个样本所得的区间包含总体均数。
5.关于置信区间,下列叙述中错误的是A.99%置信区间优于95%置信区间
B.置信区间的精确度反映在区间的长度C.当样本含量确定时,准确度与精确度是矛盾的
D.置信区间的准确度反映在置信度1-a 的大小上
E.当置信度1-a确定时,增加样本含量可提高精确度
[参考答案] A.99%置信区间优于95%置信区间6.从同一总体中随机抽取多个样本,分别估计总体均数的95%置信区间,则精确度较高的是
A.均数大的样本
B.均数小的样本
C.标准差小的样本
D.标准误大的样本
E.标准误小的样本
[参考答案] E.标准误小的样本
7.关于t分布,下列叙述错误的是
A.分布是以0为中心,左右对称的一簇单峰曲线
B.自由度越小,曲线越低平
C.当自由度为¥时,t分布就是标准正态分布
D.自由度相同时,|t|越大,其尾部概率值P越小
E.自由度越大,尾部概率相同时,t界值越大
[参考答案] E.自由度越大,尾部概率相同时,t界值越大
8.表示均数抽样误差大小的统计指标是A.全距
B.标准差
C.标准误
D.变异系数
E.四分位数间距
[参考答案] C.标准误
9.某实验室随机测定了100名正常成人血浆内皮素(ET)含量(ng/L),得均数为81.0(ng/L),标准差18.2(ng/L)。①计算抽样误差;②试估计正常成人ET含量(ng/L)总体均数的95%置信区间。
答:①标准误为1.82;②由于该样本为大样本, 故用公式
估计正常人ET含量的95%置信区间为(77.38, 84.60)ng/L。
10.从某疾病患者中随机抽取25例,其红细胞沉降率(mm/h)的均数为9.15,标准差为2.13。试估计其总体均数的95%置信区间和99%置信区间。
答:由于该样本为小样本,故用公式
估计总体均数95%置信区间为
(8.27,10.03)mm/h;
估计总体均数99%置信区间为(7.96, 10.34)mm/h。
11.2005年随机抽取某市400名7岁男孩作为研究对象, 计算得其平均身高为122.5 cm, 标准差为5.0 cm。请估计该市7岁男孩身高的总体均数。某学生的回答如下:“该市2005年7岁男孩平均身高的点估计值为122.5 cm,按公式计算得到其总体均数的95%置信区间为(112.7, 132.3) cm”。请问该学生的回答是否恰当?为什么?
答:该学生误用医学参考值范围的公式来计算总体均数的95%置信区间。医学参考值范围与均数的置信区间的主要区别在于,计算医学参考值范围时应该用标准差,计算置信区间时应该用标准误。此例中样本含量较大,可用Z值代替t值,故置信区间的计算公式为。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.0,123.0)cm。
12.如何运用抽样分布规律估计总体均数?
答:数理统计的中心极限定理:从均数为m,标准差为s的正态总体中进行独立随机抽样,其样本均数服从均数为m,标准差为s/?n的正态分布;即使是从非正态总体(均数为m,标准差为s)中进行独立随机抽样,当样本含量逐渐增加时,其样本均数的分布逐渐逼近于均数为m,标准差为
s/?n的正态分布。标准误越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,标准误越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。
13.阐述标准差与标准误的区别与联系。
答:标准差与标准误的区别与联系,见表6-1:
14.样本均数的抽样分布有何特点?
答:样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数基本服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。
15.什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些?
答:抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。
16.阐述总体均数的置信区间与医学参考值范围的区别。
答:总体均数置信区间与医学参考值范围的区别见表
6-2
第七章假设检验
1.下列关于I型错误概率α和II型错误概率b的说法不正确的是
A.当样本量确定时,α越小,b越大B.当样本量确定时,α越大,b越小C.欲减小犯I型错误的概率,可取较小αD.欲减小犯II型错误的概率,可取较大α
E.若样本含量足够大,可同时避免犯这两型错误[参考答案] E.若样本含量足够大,可同时避免犯这两型错误
2.样本均数与已知总体均数比较的t检验时,P值越小说明
A.样本均数与已知总体均数差别越小B.样本均数与已知总体均数差别越大C.样本所对应的总体均数与已知总体均数差别越大
D.越有理由认为样本均数与已知总体均数不同
E.越有理由认为样本所对应的总体均数与已知总体均数不同
[参考答案] E.越有理由认为样本所对应的总体均数与已知总体均数不同
3.下列关于单侧检验和双侧检验的说法正确的是
A.采用单侧检验更好
B.采用双侧检验更好
C.采用单、双侧检验都无所谓
D.根据专业知识确定采用单侧检验还是双侧检验
E.根据检验统计量的计算结果确定采用单侧检验还是双侧检验
[参考答案] D.根据专业知识确定采用单侧检验还是双侧检验
4.在样本均数与已知总体均数比较的t检验中,结果t=3.24,t0.05/2,n=2.086,t0.01/2,n=2.086,按检验水准α=0.05,可认为此样本均数
A.与该已知总体均数不同
B.与该已知总体均数差异很大
C.所对应的总体均数与已知总体均数差异很大
D.所对应的总体均数与已知总体均数相同E.所对应的总体均数与已知总体均数不同[参考答案] E.所对应的总体均数与已知总体均数不同
5.有关样本均数的与总体均数的比较,检验统计量t越大
A.说明总体参数差别越大
B.说明总体参数差别越小
C.说明样本统计量差别越大
D.说明样本统计量差别越小
E.越有理由认为两总体参数不等
[参考答案] E.越有理由认为两总体参数不等
6.假设检验时,所犯II型错误概率最小的检验水准α为
A.0.01
B.0.025 C.0.05
D.0.10
E.0.20
[参考答案] E.0.20
7.假设检验时,若检验水准α=0.05,则下列关于检验结果的说法正确的是
A.若P≤0.05,则不拒绝H0,此时可能犯II型错误
B.若P≤0.05,则拒绝H0,此时可能犯II型错误
C.若P≤0.05,则不拒绝H0,此时可能犯I型错误
D.若P>0.05,则拒绝H0,此时可能犯I 型错误
E.若P>0.05,则不拒绝H0,此时可能犯II型错误
[参考答案] E.若P>0.05,则不拒绝H0,此时可能犯II型错误
8.假设检验的基本步骤是
A.计算检验统计量、确定P值、做出推断结论
B.建立无效假设、建立备择假设、确定检验水准
C.建立无效假设、计算检验统计量、确定P值
D.确定单侧检验或双侧检验、选择
E.检验、估计I型错误概率和II型错误概率
[参考答案]E.检验、估计I型错误概率和II型错误概率
9.比较两药疗效时,下列可作单侧检验的情形是
A.已知A药与B药均有效
B.已知A药与B药均无效
C.已知A药不会优于B药
D.已知A药与B药差不多好
E.不知A药好还是B药好
[参考答案] C.已知A药不会优于B药
10.为了比较非洛地平与常规药物治疗高血压的疗效差异,某医生随机抽取100名
原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其均数为21.5mmHg,标准差为8.0mmHg。现已知常规药能使高血压患者的血压平均下降20mmHg。该医生对其进行了t检验,零假设是m=m0,备择假设是m≠m0,检验水准a=0.05。计算得t=1.875,按n=100查t 界值表,得0.05
答:该结论是错误的。因为在进行两均数比较的假设检验时,当P≤0.05时,说明两总体均数相同是一小概率事件,我们认为在一次试验中几乎不会发生,于是得出拒绝H0,接受H1的结论,即使犯错误,概率也小于5%;但是当P>0.05时,对于不拒绝H0认为两总体均数相同这一结论无任何概率保证,得出错误结论的概率可能很大。故本例正确的说法应该是:按
a=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为非洛地平与常规药物治疗高血压的疗效不同
11.解释I型错误、II型错误和检验效能,并说明它们之间的关系。
答:拒绝实际成立的H0所犯的错误称为I 型错误,记为a。不拒绝实际不成立的H0所犯的错误称为II型错误,记为b。如果两个总体参数间确实存在差异,即H1成立(例如m≠m0),按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为(1-b)。三者的关系为:当样本量固定时,a与b 成反比,与(1-b)成正比。如果把a设置得很小,势必增大犯II型错误的概率,从而降低检验效能;反之,如果重点在于减少b,势必增加犯I型错误的概率,从而降低了置信度
12.举例说明单侧检验与双侧检验的选择。答:选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。例如,在临床试验中,比较甲、乙两种治疗方法的疗效是否有差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。若从专业角度无法确定的情况下,一般应采用双侧检验。
13.简述假设检验的基本步骤。
答:假设检验的基本步骤如下:(1)建立检验假设,确定检验水准;(2)计算检验统计量;(3)确定P值,做出统计推断
14.解释零假设与备择假设的含义。
答:零假设又称无效假设,记为H0,表示其差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示其差异是因为比较的对象之间存在本质不同造成的。
15.经研究显示,汉族正常成年男性无名指长度的均数为10.1cm。某医生记录了某地区12名汉族正常成年男性无名指长度(cm)资料如下:
10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.37 10.11 10.27
问该地区正常成年男性无名指长度是否大于一般汉族成年男性?
答:本题是样本均数与总体均数的比较,用单样本资料的t检验
16.已知服用某种营养素一个疗程后,受试者某项生化指标平均增加52个单位。一家研究所对该营养素进行改进后,随机抽取受试者36名服用新产品一个疗程,测得该生化指标平均增加了53个单位,标准差为2.0个单位。问该营养素新产品是否比旧产品的效果好?
第八章 t检验
1.为研究两种方法的检测效果,将24名患者配成12对,采用配对t检验进行统计分析,则其自由度为:A. 24
B. 12
C. 11
D. 23
E. 2
医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-
医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。
第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D )
1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0
医学统计学试题及答案 The latest revision on November 22, 2020
医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同
6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小
《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关
7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描
医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr 第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r 一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料 医学统计学试题和答案 (一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数 第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必 医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 医学统计学试题及答案 1、2、3套 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图 B百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似 正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C标准差 D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数 不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资 料的t检验时,自由度是(D ) (A)n 1+ n 2 (B)n 1+ n 2 –1 (C)n 1+ n 2 +1 (D)n 1+ n 2 -2 10、标准误反映(A) A抽样误差的大小 B总体参数的波动大小 C重复实验准确度的高低 D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关 分析。令对相关系数检验的t值为t r ,对回归系数检验的t值为t b , 二者之间具有什么关系?(C) l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2 医学统计学试题 姓名____________分数_________ 选择题(每个2分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A )A相对比 B 构成比C定基比D率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )A n1+ n2 B n1+ n2–1 C n1+ n2 +1 D n1+ n2 -2 10、标准误反映(A)A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C) A tr>tb B tr 医学统计学历年常考总结试题3元第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制() A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是() A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用() A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是() A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为() (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为() A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验() A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时, 自由度是() (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映() A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的( ) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系 数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?() A t r>t b B t r (一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数 第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计 试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分) 3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别医学统计学部分试题及答案解析
医学统计学试题及答案
医学统计学练习题与答案
医学统计学试题和答案.doc
医学统计学题库完整
医学统计学试题及答案
医学统计学试题及答案1、2、3套
医学统计学试题及其答案
医学统计学选择题及答案个
医学统计学模拟试卷与答案
(完整word版)医学统计学试题和答案
医学统计学题库完整
医学统计学历年考题及答案