当前位置:文档之家› 医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案

医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案

医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案
医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案

一、SPSS 基本功能

SPSS

基本功能数据管理

统计分析

图表分析:条图、直方图、饼图、线图、散点图等

输出管理:对输出结果复制、编辑等

描述性分析

均数比较

一般线性模型

相关与回归分析

非参数检验

生存分析

Frequencies

Descriptives

Explore

Crosstabs 统计资料的类型

资料类型定量资料:用定量的方法获得的数值资料

计数资料:按性质或类别分组后清点各组

个数

等级资料:半定量资料

定量资料的统计推断正态分布

两组均

数比较

单样本设计t检验

配对设计t检验

成组设计t检验

三组及

以上均

数比较

完全随机设计方差分析

随机区组设计方差分析

重复测量方差分析

析因设计方差分析

偏态分布

配对设计秩和检验

单样本设计秩和检验

成组设计秩和检验

资料类型定量资料

计数资料

等级资料

统计分析统计描述

统计推断

相对数

总体率的估计

假设检验

u检验

卡方检验

4

假设检验

参数检验

非参数检验

正态分布等级资料偏态分布资料分布类型未知

方差不齐,且不易变换达到齐性

数据一端或两端不确定的资料

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数

2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用范围广,可适用于任何类型资料 参数检验

优点:资料信息利用充分;检验效能较高 缺点:对资料的要求高;适用范围有限 2.非参数检验

优点:适用范围广,可适用于任何类型的资料 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验

对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误

构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。

第二章调查研究设计

1.调查研究主要特点是什么?

调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

2.简述调查设计的基本内容。

①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。

3.试比较常用的四种概率抽样方法的优缺点。

(1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。

(2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。

(3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。

(4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。

4.常用的非概率抽样方法有哪些?

有偶遇抽样、立意抽样、定额抽样、雪球抽样等。

5.简述调查问题的顺序安排。

调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题在前,难答题在后④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题⑤敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。

二、最佳选择题

1. 实验性研究与观察性研究的根本区别在于

A. 抽样方法不同

B. 研究对象不同

C. 是否设立对照组

D. 假设检验方法不同

E. 是否人为施加干预措施

2. 以下抽样方法中不属于概率抽样的是

A. 单纯随机抽样

B. 系统抽样

C. 整群抽样

D. 分层抽样

E. 雪球抽样

3. 条件相同时,下列抽样方法中抽样误差最大的是

A. 单纯随机抽样

B. 系统抽样

C. 分层抽样

D. 整群抽样

E. 无法直接比较

4. 下列关于调查设计的叙述,正确的是

A. 明确调查目的是调查研究最核心的问题

B. 采用抽样调查还是普查是由该地区的经济水平决定的

C. 调查设计出现缺陷时,可以通过相应的统计分析方法弥补

D. 一旦制定了调查研究计划,在实际操作过程中,就不可改变

E. 调查的质量控制主要在调查问卷设计阶段

5. 为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于

A. 单纯随机抽样

B. 分层抽样

C. 系统抽样

D. 整群抽样

E. 多阶段抽样

6. 某县有30万人口,其中农村人口占80%,现欲对农村妇女的计划生育措施情况进行调查,调查对象应为

A. 该县所有的已婚夫妻

B. 该县所有的农村妇女

C. 该县所有的育龄期妇女

D. 该县所有的已婚妇女

E. 该县所有已婚育龄期农村妇女

7. 欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为

A. 单纯随机抽样

B. 整群抽样

C. 分层抽样

D. 典型调查

E. 普查

8. 普查是一种全面调查的方法,与抽样调查相比,叙述正确的是

A.确定普查观察单位非常简单

B.普查适于发病频率较低疾病的调查

C.普查不易获得反映平均水平的统计指标

D.因涉及面广普查可产生较大的抽样误差

E.普查更易统一调查技术,提高调查质量

9. 以下五个问题中,最符合调查问卷设计要求的是

A.你一个月工资多少?

B.你一个月吃多少克盐?

C.你是否有婚外恋:①有②无

D.你和你的妈妈认为女孩几岁结婚比较好?

E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可

1.E

2.E

3.D

4.A

第三章实验研究设计

【思考与练习】

一、思考题

1. 实验设计根据对象的不同可分为哪几类?

2. 实验研究中,随机化的目的是什么?

3. 什么是配对设计?它有何优缺点?

4. 什么是交叉设计?它有何优缺点?

5. 临床试验中使用安慰剂的目的是什么?

二、案例辨析题

“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治

疗的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,

无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队

卫生所中推广。该结论是否正确?如果不正确,请说明理由。

三、最佳选择题

1. 实验设计的三个基本要素是

A. 处理因素、实验效应、实验场所

B. 处理因素、实验效应、受试对象

C. 受试对象、研究人员、处理因素

D. 受试对象、干扰因素、处理因素

E. 处理因素、实验效应、研究人员

2. 实验设计的三个基本原则是

A. 随机化、对照、重复

B. 随机化、对照、盲法

C. 随机化、重复、盲法

D. 均衡、对照、重复

E. 盲法、对照、重复

3. 实验组与对照组主要不同之处在于

A. 处理因素

B. 观察指标

C. 抽样误差

D. 观察时间

E. 纳入、排除受试对象的标准

4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是

A. 空白对照

B. 安慰剂对照

C. 实验对照

D. 标准对照

E. 自身对照

5. 观察指标应具有

A. 灵敏性、特异性、准确度、精密度、客观性

B. 灵敏性、变异性、准确度、精密度、客观性

C. 灵敏性、特异性、变异性、均衡性、稳定性

D. 特异性、准确度、稳定性、均衡性、客观性

E. 灵敏性、变异性、准确度、精密度、均衡性

6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成

A. 选择性偏倚

B. 测量性偏倚

C. 混杂性偏倚

D. 信息偏倚

E. 失访性偏倚

7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是

A. 随机区组设计

B. 完全随机设计

C. 析因设计

D. 配对设计

E. 交叉设计

8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本试

验中采用的控制偏倚的方法有

A. 单盲、多中心

B. 随机化、多中心

C. 随机化、单盲

D. 随机化、双盲双模拟

E. 双盲双模拟、多中心

9. 临床试验的统计分析应主要包括

A. 可比性分析、疗效评价、安全性评价

B. 可比性分析、优效性分析、劣效性分析

C. 可比性分析、安全性评价、可行性分析

D. 优效性分析、等效性分析、安全性评价

E. 疗效评价、安全性评价、可行性分析

10. 药品上市后应用阶段进行的临床试验属于

A. I期临床试验

B. II期临床试验

C. III期临床试验

D. IV临床试验

E. 现场试验

四、综合分析题

1. 欲将16只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组,剩下8只作为对照组。该分组方法是否正确?若不正确,请说明理由。

2. 某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?

3. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠血管紧张素的影响,并欲分析两药联合应用是否更为有效。

(1) 你认为该研究最好采用何种实验设计方案?并说明理由。

(2) 请帮该研究者实现32只大鼠的随机分组。

【习题解析】

一、思考题

1. 根据受试对象不同,实验可以分为动物实验、临床试验和现场试验三类。动物实验的受试对象为动物,也可以是器官、细胞或血清等生物材料;临床试验的受试对象通常为患者,持续时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是未患某种疾病

的人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。

2. 实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。

3. 配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。用以配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。

配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、实验效率较高;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低效率。在临床试验中,配对的过程还可能延长实验时间。

4. 交叉设计是一种特殊的自身对照设计。其中2 2交叉设计首先是将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段结束后,两组交换处理措施进行第二阶段的实验,这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适于具有自愈倾向或病程较短的疾病研究。

交叉设计的优点有:①节约样本含量;②能够控制个体差异和时间对处理因素的影响;③在临床试验中同等地考虑了每个患者的利益。其缺点有:①处理时间不能太长;②当受试对象的状态发生根本变化时,后一阶段的处理将无法进行;③受试对象一旦在某一阶段退出试验,就会造成数据缺失。

5. 临床试验中使用安慰剂,目的在于消除由于受试对象和试验观察者的心理因素引起的偏倚,还可控制疾病自然进程的影响,显示试验药物的效应。

二、案例辨析题

该结论不正确。

研究某治疗方案对某病患者的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有设立了对照才能较好地控制非处理因素对实验结果的影响,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入38例消化性溃疡患者,并未设立相应的对照组。而且这38例患者接受治疗的时间为2000年至2006年,时间跨度太大,可能对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。

三、最佳选择题

1.B

2.A 3A. 4.A 5.A 6.C 7.C 8.D 9.A 10.D

四、综合分析题

1. 解:该分组方法不正确。

随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,因此破坏了随机化原则。

2. 解:先将6对小鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第18行最左端开始横向连续取12个两位数字。事先规定,每一对中,随机数较小者序号为1,对应于A 组,随机数较大者序号为2,对应于B组。分配结果见表3-1。

表3-1 配对设计的12只小鼠随机分组的结果

对子数 1 2 3 4 5 6

动物编号 1.1 1.2 2.1 2.2 3.1 3.2 4.1 4.2 5.1 5.2 6.1 6.2 随机数12 96 88 17 31 65 19 69 02 83 60 75 序号 1 2 2 1 1 2 1 2 1 2 1 2 组别 A B B A A B A B A B A B

SPSS操作

数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量number和pair,再点击Data View标签,录入数据(见图3-1,图3-2)。

图3-1 Variable View窗口内定义要输入的变量number和pair

图3-2 Data View窗口内录入数据

分析:

Transform→Random Number Generators …

Active Generator Initialization

Set Starting Point

Fixed Value

Value: 键入20071222 设定随机种子为20071222

OK

Transform→Comput e…

Target Valuable: 键入random

Numeric Expression: RV.Uniform(0,1) 产生范围在0~1之间的伪随机数

OK

Transform→Rank Cases…

Variables(s): random

By: pair 对每个对子中的两个伪随机数进行排序

OK

注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。

File→New→Syntax,打开Syntax窗口,键入如下程序:

input program. 开始数据录入程序段

numeric k b n number pair (F8.0)/random(F8.6).

string treat(A1).

compute k=2. 处理组为2

compute b=6. 对子数为6

compute n=b*k.

loop number=1 to n.

compute pair=rnd((number-1)/k+0.5).

end case.

compute k=lag(k).

end loop.

end file.

end input program. 结束数据录入程序段

set seed 20071222. 设定随机种子为20071222

compute random=uniform(1). 产生范围在0~1之间的伪随机数

rank variables=random by pair. 对伪随机数排序

formats rrandom(F3.0).

compute

根据伪随机数的序号进行分组treat=substr("ABCDEFGHIJKLMN

",rrandom,1).

list number pair treat. 结果中显示受试对象编号及被

分到的处理组

在Syntax窗口中选择Run→All 提交运行。

注:程序中的b(即对子数)可根据实际情况赋予不同的值。随机区组设计受试对象的分配也可以用此程序来实现,仅需将k值设为处理组数,b值设为相应的区组数。

结果及解释

Data View窗口

图3-3 SPSS编程实现受试对象随机分配结果

Output窗口

List

number pair treat

1 1 A

2 1 B

3 2 A

4 2 B

5 3 B

6 3 A

7 4 A

8 4 B

9 5 B

10 5 A

11 6 B

12 6 A

编程实现随机分配的结果见data view窗口(图3-3)或output 窗口。可以看出12只小鼠被随机分配到A组和B组。在用此程序进行随机分组前,规定A组表示实验组,B组表示对照组。则1,3,6,7,10,12号小鼠被分到实验组,2,4,5,8,9,11号小鼠被分到对照组。

3. 解:

(1) 该研究最好采用2×2析因设计的实验方案,如表3-2所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。因此既可分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。

表3-2 MEL和TXL对32只大鼠血管紧张素影响的析因设计

MEL

TXL

(用)b1(不用)b2

(用)a1a1b1a1b2

(不用)a2a2b1a2b2

(2) 先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第2列最上端开始纵向连续取32个两位数字。对随机数字排序,事先规定,序号为1~8的豚鼠分为A 组,序号为9~16的大鼠分为B组,序号为17~24的大鼠分为C组,序号为25~32的大鼠分为D组,分配结果见表3-3。

表3-3 32只大鼠随机分组的结果

编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 随机数17 36 77 43 28 22 76 68 39 71 35 50 96 93 87 56 序号 1 8 25 11 5 4 22 19 9 20 7 14 30 28 27 15 分组 A A D B A A C C B C A B D D D B 编号17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 随机数72 96 94 64 44 76 17 17 76 29 80 40 56 65 43 96 序号21 31 29 17 13 23 2 3 24 6 26 10 16 18 12 32 分组 C D D C B C A A C A D B B C B D

SPSS操作

数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量number,见图3-4。再点击Data View标签,录入变量number的值,即从1~32。

图3-4 Variable View窗口内定义要输入的变量number

分析:

Transform→Random Number Ge nerators…

Active Generator Initialization

Set Starting Point

Fixed Value

Value: 键入20071222 设定随机种子为20071212

Transform→Compute…

Target Valuable: 键入random

Numeric Expression: RV.Uniform(0,1) 产生范围在0~1之间的伪随机数

Transform→Rank Cases…

Variables(s): random 对伪随机数排序

Transform→Recode→Into Different Variables…

Input Variable Output Variable: Rrandom 原变量名为伪随机数的序号Rrandom Output Variable

Name: 键入treat 新变量名为treat

点击

Old Value

Range: 键入1 through 8

Output variables are strings

New Value

Value: 键入A Rrandom值为1~8时,treat值为A

Old New: 点击

Old Value

Range: 键入9 through 16

New Value

Value: 键入B Rrandom值为9~16时,treat值为B

Old New: 点击

Old Value

Range: 键入17 through 24

New Value

Value: 键入C Rrandom值为17~24时,treat值为C

Old New: 点击 Old Value

Range: 键入25 through 32 New Value

Value: 键入D Rrandom 值为25~32时,treat 值为D Old New: 点击

注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS 的Syntax 窗口中用编程来完成本题。

File→New→Syntax ,打开Syntax 窗口,键入如下程序: input program.

开始数据录入程序段 numeric n k number group (F8.0)/random(F8.6). string treat(A1).

compute n=32. 受试对象总数为32 compute k=4. 4个处理组 loop number=1 to n. end case.

compute n=lag(n). compute k=lag(k). end loop.

end file.

end input program. 结束数据录入程序段

compute random=uniform(1). 产生范围在0~1之间的伪随机数 set seed 20071222. 设定随机种子为20071222 rank variables=random .

对伪随机数排序 compute group = trunc((rrandom-1)*k/n ). formats group(F3.0).

compute

treat=substr("ABCDEFGHIJKLMN",group+1,1).

根据伪随机数的序号进行分组

list number treat.

结果中显示受试对象编号及被分到的处理组

注:程序中的n(受试对象总数)、k(即处理组数)可根据实际情况赋予不同的值。 输出结果

Data View窗口(由于篇幅限制,仅列出前16例受试对象的分组情况)

图3-5 SPSS编程实现受试对象随机分配结果

Output窗口

List

number treat number Treat

1 D 17 C

2 D 18 C

3 B 19 B

4 C 20 C

5 D 21 B

6 D 22 A

7 B 23 C

8 C 24 D

9 D 25 C

10 A 26 A

11 D 27 B

12 B 28 A

13 C 29 A

14 B 30 A

15 A 31 B

16 A 32 D

编程实现随机分配的结果见data view 窗口(图3-5)或output 窗口。可以看出32只大鼠被随机分配到A 、B 、C 、D 组。在用此程序进行随机分组前,事先规定A 、B 、C 、D 分别对应于对照组、MEL 组、TXL 组和MEL+TXL 组。从分配结果中可以看出:10,15,16,22,26,28,29,30号大鼠被分到对照组;3,7,12,14,19,21,27,31号大鼠被分到MEL 组;4,8,13,17,18,20,23,25号大鼠被分到TXL 组;1,2,5,6,9,11,24,32号大鼠被分到MEL+TXL 组。

第四章 定量资料的统计描述

【习题解析】 一、思考题

1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。

2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。

3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。

4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间( 2.58, 2.58)μσμσ-+内的面积为9

5.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。

5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。 二、案例辨析题

统计描述时,常见错误是对定量资料的描述均采用均数、标准差。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清胆固醇的频数分布图如下:

图4-1 血清甘油三酯(TG)的频数分布

可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:

集中趋势指标150150122(1.7/26 1.75)/2 1.755X M X ????+ ?

???

????

=+ ? ??=+=? (mmol/L)

离散程度指标 四分位数间距= 7525 2.10 1.340.76P P -=-= (mmol/L)

三、最佳选择题

1. B

2. E

3. B

4. C

5. D

6. E

7. A

8. D

9. D

四、综合分析题 1. 解:输出结果

图4-4 尿总砷的频数分布图

由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。 输出结果

频数

频数

图4-5 尿总砷对数的频数分布图

由图可见lgx 分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。

(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。

0.0656(μg/L)G =。

2. 解:

(1) 已知健康人的血清TC 服从正态分布,故采用正态分布法制定95%的参考值范围。

下限: 1.96 4.84 1.960.96 2.96X S -=-?=(mmol/L)

上限: 1.96 4.84 1.960.96 6.72X S +=+?=(mmol/L)

该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为 2.96 mmol/L~6.72mmol/L 。

(2) 45~55岁健康男性居民的血清总胆固醇分布为正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。

11 3.25 4.84

1.660.96X Z μ

σ--=

=

=-

22 5.25 4.840.430.96

X Z μσ--===

查标准正态分布曲线下的面积表(附表2)得: 1()( 1.66)0.0485Z Φ=Φ-=

2()1(0.43)10.33360.6664Z Φ=-Φ-=-=

21()()0.66640.04850.617961.79%D Z Z =Φ-Φ=-==

医学统计学(李晓松主编 第2版 高等教育出版社)附录 第3章思考与练习答案

第三章实验研究设计 【思考与练习】 一、思考题 1. 实验设计根据对象的不同可分为哪几类? 2. 实验研究中,随机化的目的是什么? 3. 什么是配对设计?它有何优缺点? 4. 什么是交叉设计?它有何优缺点? 5. 临床试验中使用安慰剂的目的是什么? 二、案例辨析题 “三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。 三、最佳选择题 1. 实验设计的三个基本要素是 A. 处理因素、实验效应、实验场所 B. 处理因素、实验效应、受试对象 C. 受试对象、研究人员、处理因素 D. 受试对象、干扰因素、处理因素 E. 处理因素、实验效应、研究人员 2. 实验设计的三个基本原则是 A. 随机化、对照、重复 B. 随机化、对照、盲法 C. 随机化、重复、盲法 D. 均衡、对照、重复 E. 盲法、对照、重复

3. 实验组与对照组主要不同之处在于 A. 处理因素 B. 观察指标 C. 抽样误差 D. 观察时间 E. 纳入、排除受试对象的标准 4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是 A. 空白对照 B. 安慰剂对照 C. 实验对照 D. 标准对照 E. 自身对照 5. 观察指标应具有 A. 灵敏性、特异性、准确度、精密度、客观性 B. 灵敏性、变异性、准确度、精密度、客观性 C. 灵敏性、特异性、变异性、均衡性、稳定性 D. 特异性、准确度、稳定性、均衡性、客观性 E. 灵敏性、变异性、准确度、精密度、均衡性 6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成 A. 选择性偏倚 B. 测量性偏倚 C. 混杂性偏倚 D. 信息偏倚 E. 失访性偏倚 7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是 A. 随机区组设计 B. 完全随机设计

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

医学统计学试题和答案解析

第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D )

李晓松医学统计学作业题

实践一、数值变量的整理与描述 题1 在某市做调查获得102名7岁男童坐高资料如下图所示: (1)计算平均数与标准差; (2)计算中位数与四分位数间距。 实践二正态分布理论与应用 题1抽样调查某市45-55岁健康男性居民的血脂水平,184名45-55岁健康 男性居血清总胆固醇(TC)的X=4. 84 mmol/L, S=0.96 mmol/L.(健康人的血 清总胆固醇服从正态分布)。 (1)估计该市45 ~55岁健康男性居民的血清总胆固醇的95%参考值范围; (2)估计该市45 ~55岁健康男性居民中,血清总胆固醇住3.25-5.25 mmol/L范 围内的比例; (3)估计该市45 ~55岁健康男性居民中,血清总胆固醇低于3.80 mrnoUL所占 的比例。 实践三率的标准化在医学研究中的应用 题1:对某地不同年龄、性别人群的HBsAg阳性率进行检测,结果如下表所示,试着对该地男、女HBsAg阳性率进行率的标准化。 提示:标准组的选择可以用合并人群,也可以任选其中一组作为标准组 表某地不同年龄、性别人群的HBsAg阳性率(%) 年龄组男性女性 检查数阳性数阳性率检查数阳性数阳性率 0~ 521 12 2.30 560 13 2.32 20~ 516 14 2.71 957 26 2.72 40~ 710 43 6.06 836 54 6.46 60~ 838 63 7.52 570 49 8.60 合计2585 132 5.11 2923 142 4.86

实验四 总体均数估计在医学研究中的运用 题1 从某疾病患者中随机抽取25例,其红细胞沉降率(mm/h )的均数为9.15,标准差为2.13。假定该类患者的红细胞沉降率服从正态分布,试估计该总体均数的95%的置信区间。 ()()某实验随机测定了100名正常人血浆内皮素ET 含量ng/L , 得均数X =81.0标准差S =18.2, (1)计算抽样误差指标 ( 2)估计正常人血浆内皮素的95%总体均数可题 2 信区间。 实验五 假设检验与t 检验 题1 经研究显示,汉族成年男子的环指长度的总体均数为10.1cm.某医生记录 了某地区12名汉族正常成年男子的环指长度(cm )分别为:10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.37 10.11 10.27 问:该地区正常成年男子的环指长度是否大于一般成年男子? 题2 将18名某疾病患者随机分成两组,分别用A/B 两种药物治疗,观察前后的血红蛋白含量如下表: 表 疾病患者经A 、B 两种药物治疗前后的血红蛋白的变化结果(g/L ) A 药 物 患者编号 1 2 3 4 5 6 7 8 9 治疗前 36 44 53 56 62 58 45 43 26 治疗后 47 62 68 87 73 58 69 49 50 B 药 物 患者编号 10 11 12 13 14 15 16 17 18 治疗前 56 49 67 58 73 40 48 36 29 治疗后 81 86 70 62 84 76 58 49 60 问 (1)A 药物是否有效? (2)B 药物是否有效? (3)A 、B 药物之间疗效有无差别?

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学名解

医学统计学复习题 一、名词解释 1、几何均数 2、四分位数间距 3、方差 4、变异 5、概率 6、总体 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、随机误差 14、样本 15、随机抽样 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的( )。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2. 在进行成组设计的t 检验之前,要注意两个前题条件,一是各样本是否来自正态总体,二是( )。 A.核对数据 B.总体方差是否相等 C.求 D.作变量变换 E.处理缺失值 3. 描述某地某年流行性乙脑患者的年龄分布,宜选择的统计图是( )。 A.直方图 B.线图 C.直条图 D.圆图 E.箱式图 4.参数是指( ) 。 s 、s x x 和

A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.实验设计的基本原则是()。 A.随机化、盲法、设置对照 B.重复、随机化、配对 C.随机化、盲法、配对 D.随机化、重复、设置对照 E.重复、随机化、盲法 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中,不属于集中趋势指标的是()。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料,均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的 指标该选()。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据 11.实验研究中设立实验组和对照组的原则是()。 A. 实验因素和非实验因素在两组中均不同 B.实验因素和非实验因素在两组中均相同 C.实验因素在两组中齐同,非实验因素在两组中不同 D.实验因素在两组中不同,非实验因素在两组中齐同 E. 以上都不是 12.一些以老年人为主的慢性病患者,年龄分布的集中位置偏向于年龄大的一侧,称为()。 A.正偏态分布 B.负偏态分布 C.对数正态分布 D.正态分布 E.对称分布 13.编制频数分布时,组距通常是()。 A.极差的1/20 B.极差的1/10 C.极差的1/5 D.极差的1/4 E.极差的1/2 14.以下适宜描述计量资料离散趋势的指标有()。 A.均数、标准差、方差 B.极差、标准差、中位数 C.均数、中位数、变异系数 D.标准差、四分位数间距、变异系数 E.几何均数、标准差、变异系数 15.下列指标中,适和描述偏态分布的离散趋势的指标是( ) 。 A.平均偏差 B.四分位数间距 C.标准差 D. 方差 E. 变异系数 16.下列关于标准差的说法中错误的是()。 A.标准差一定大于0 B.标准差和观察指标有相同的度量衡单位 C.同一资料的标准差一定小于均数 D.标准差常用于描述正态分布资料的变异程度 E.方差和标准差属于描述变异程度的同类指标 17. 变异系数的值( ) 。 A.一定大于1 B.一定小于1 C.可以大于1,可以小于1 D.一定比标准差小 E.一定比均数小 18.观察指标分别为身高和体重的两组数据。欲比较其变异程度的大小,宜选用()。 A.平均偏差 B.四分位间距 C.标准差 D.方差 E.变异系数 19.正态分布有两个参数()。 A. 和 S B. μ和σ C. 和σ D. μ和 S E. μ和 CV x x

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学课后思考题答案(李晓松版)

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。 (1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。 (2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。 (3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。 (4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料

医学统计学试题和答案.doc

医学统计学试题和答案

(一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

李晓松医学统计学作业题

李晓松医学统计学作业题-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

实践一、数值变量的整理与描述 题1 在某市做调查获得102名7岁男童坐高资料如下图所示: (1)计算平均数与标准差; (2)计算中位数与四分位数间距。 实践二正态分布理论与应用 题1抽样调查某市 45-55岁健康男性居民的血脂水平,184名45-55岁健康 男性居血清总胆固醇(TC)的X =4. 84 mmol/L, S=0.96 mmol/L.(健康人的血 清总胆固醇服从正态分布)。 (1)估计该市45 ~55岁健康男性居民的血清总胆固醇的95%参考值范围; (2)估计该市45 ~55岁健康男性居民中,血清总胆固醇住3.25-5.25 mmol/L范 围内的比例; (3)估计该市45 ~55岁健康男性居民中,血清总胆固醇低于3.80 mrnoUL所占 的比例。 实践三率的标准化在医学研究中的应用 题1:对某地不同年龄、性别人群的HBsAg阳性率进行检测,结果如下表所示,试着对该地男、女HBsAg阳性率进行率的标准化。

提示:标准组的选择可以用合并人群,也可以任选其中一组作为标准组 表 某地不同年龄、性别人群的HBsAg 阳性率(%) 年龄组 男性 女性 检查数 阳性数 阳性率 检查数 阳性数 阳性率 0~ 521 12 2.30 560 13 2.32 20~ 516 14 2.71 957 26 2.72 40~ 710 43 6.06 836 54 6.46 60~ 838 63 7.52 570 49 8.60 合计 2585 132 5.11 2923 142 4.86 实验四 总体均数估计在医学研究中的运用 题1 从某疾病患者中随机抽取25例,其红细胞沉降率(mm/h )的均数为9.15,标准差为2.13。假定该类患者的红细胞沉降率服从正态分布,试估计该总体均数的95%的置信区间。 ()()某实验随机测定了100名正常人血浆内皮素ET 含量ng /L , 得均数X =81.0标准差S =18.2, (1)计算抽样误差指标 ( 2)估计正常人血浆内皮素的95%总体均数可题 2 信区间。 实验五 假设检验与t 检验 题1 经研究显示,汉族成年男子的环指长度的总体均数为10.1cm.某医生记录 了某地区12名汉族正常成年男子的环指长度(cm )分别为:10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.37 10.11 10.27 问:该地区正常成年男子的环指长度是否大于一般成年男子?

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学试题及答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

相关主题
文本预览
相关文档 最新文档