当前位置:文档之家› 《医学统计学》习题与答案

《医学统计学》习题与答案

《医学统计学》习题与答案
《医学统计学》习题与答案

一、最佳选择题

1.卫生统计工作的步骤为 c

A.统计研究调查、搜集资料、整理资料、分析资料

B.统计资料收集、整理资料、统计描述、统计推断

C.统计研究设计、搜集资料、整理资料、分析资料

D.统计研究调查、统计描述、统计推断、统计图表

E.统计研究设计、统计描述、统计推断、统计图表

2.统计分析的主要内容有

A.统计描述和统计学检验

B.区间估计与假设检验

C.统计图表和统计报告

D.统计描述和统计推断

E.统计描述和统计图表

3.统计资料的类型包括

A.频数分布资料和等级分类资料

B.多项分类资料和二项分类资料

C.正态分布资料和频数分布资料

D.数值变量资料和等级资料

E.数值变量资料和分类变量资料

4.抽样误差是指

A.不同样本指标之间的差别

B.样本指标与总体指标之间由于抽样产生的差别

C.样本中每个体之间的差别

D.由于抽样产生的观测值之间的差别

E.测量误差与过失误差的总称

5.统计学中所说的总体是指

A.任意想象的研究对象的全体

B.根据研究目的确定的研究对象的全体

C.根据地区划分的研究对象的全体

D.根据时间划分的研究对象的全体

E.根据人群划分的研究对象的全体

6.描述一组偏态分布资料的变异度,宜用

A.全距

B.标准差

C.变异系数

D.四分位数间距

E.方差

7.用均数与标准差可全面描述其资料分布特点的是

A.正偏态分布

B.负偏态分布

C.正态分布和近似正态分布

D.对称分布

E.任何分布

8.比较身高和体重两组数据变异度大小宜采用

A.变异系数

B.方差

C.极差

D.标准差

E.四分位数间距

9.频数分布的两个重要特征是

A.统计量与参数

B.样本均数与总体均数

C.集中趋势与离散趋势

D.样本标准差与总体标准差

E.样本与总体

10.正态分布的特点有

A.算术均数=几何均数

B.算术均数=中位数

C.几何均数=中位数

D.算术均数=几何均数=中位数

E.以上都没有

11.正态分布曲线下右侧5%对应的分位点为

A.μ+1.96σ

B.μ-1.96σ

C.μ+2.58σ

D.μ+1.64σ

E.μ-2.58σ

12.下列哪个变量为标准正态变量 A.s x μ- B.σ

μ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指

A.该指标在所有人中的波动范围

B.该指标在所有正常人中的波动范围

C.该指标在绝大部分正常人中的波动范围

D.该指标在少部分正常人中的波动范围

E.该指标在一个人不同时间的波动范围

14.下列哪一变量服从t 分布 A. σμ

-x B. σμ

-x C. x x σμ

- D. x s x x - E. x

s x μ- 15.统计推断的主要内容为

A.统计描述与统计图表

B.参数估计和假设检验

C.区间估计和点估计

D.统计预测与统计控制

E.参数估计与统计预测

16.可信区间估计的可信度是指

A.α

B.1-α

C.β

D.1-β

E.估计误差的自由度

17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大

A.变异系数

B.标准差

C.标准误

D.极差

E.四分位数间距

18.两样本比较作t 检验,差别有显著性时,P 值越小说明

A.两样本均数差别越大

B.两总体均数差别越大

C.越有理由认为两总体均数不同

D.越有理由认为两样本均数不同

E.I 型错误越大

19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小

A.α=0.05

B.α=0.01

C.α=0.10

D.α=0.20

E.α=0.02

20.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高

A.α=0.01

B.α=0.10

C.α=0.05

D.α=0.20

E.α=0.02

21.在假设检验中,P 值和α的关系为

A. P 值越大,α值就越大

B. P 值越大,α值就越小

C. P 值和α值均可由研究者事先设定

D. P 值和α值都不可以由研究者事先设定

E. P 值的大小与α值的大小无关

22.假设检验中的第二类错误是指

A.拒绝了实际上成立的0H

B.不拒绝实际上成立的0H

C.拒绝了实际上成立的1H

D.不拒绝实际上不成立的0H

E.拒绝0H 时所犯的错误

23.方差分析中,组内变异反映的是

A. 测量误差

B. 个体差异

C. 随机误差,包括个体差异及测量误差

D. 抽样误差

E. 系统误差

24.方差分析中,组间变异主要反映

A. 随机误差

B. 处理因素的作用

C. 抽样误差

D. 测量误差

E. 个体差异

25.多组均数的两两比较中,若不用q 检验而用t 检验,则

A. 结果更合理

B. 结果会一样

C. 会把一些无差别的总体判断有差别的概率加大

D. 会把一些有差别的总体判断无差别的概率加大

E. 以上都不对

26.说明某现象发生强度的指标为

A.构成比

B.相对比

C.定基比

D.环比

E. 率

27.对计数资料进行统计描述的主要指标是

A.平均数

B.相对数

C.标准差

D.变异系数

E.中位数

28.构成比用来反映

A.某现象发生的强度

B.表示两个同类指标的比

C.反映某事物内部各部分占全部的比重

D.表示某一现象在时间顺序的排列

E.上述A 与C 都对

29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为

A. 1p +2p

B. (1p +2p )/2

C. 21p p ?

D. 2

12211n n p n p n ++ E. 2

)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比

A. 中位数

B. 几何均数

C. 均数

D. 标准差

E. 变异系数

31.发展速度和增长速度的关系为

A.发展速度=增长速度一1

B. 增长速度=发展速度一1

C.发展速度=增长速度一100

D.增长速度=发展速度一100

E.增长速度=(发展速度一1)/100

32.SMR 表示

A.标化组实际死亡数与预期死亡数之比

B.标化组预期死亡数与实际死亡数之比

C.被标化组实际死亡数与预期死亡数之比

D.被标化组预期死亡数与实际死亡数之比

E.标准组与被标化组预期死亡数之比

33.两个样本率差别的假设检验,其目的是

A.推断两个样本率有无差别

B.推断两个总体率有无差别

C.推断两个样本率和两个总体率有无差别

D.推断两个样本率和两个总体率的差别有无统计意义

E.推断两个总体分布是否相同

34.用正态近似法进行总体率的区间估计时,应满足

A. n 足够大

B. p 或(1-p )不太小

C. np 或n(1-p)均大于5

D. 以上均要求

E. 以上均不要求

35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则

A. 两样本率相差很大

B. 两总体率相差很大

C. 两样本率和两总体率差别有统计意义

D. 两总体率相差有统计意义

E. 其中一个样本率和总体率的差别有统计意义

36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2

χ的关系为

A. u 值较2χ值准确

B. 2χ值较u 值准确

C. u=2χ

D. u=2χ

E. 2χ=u

37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的

条件为

A. A ≥5

B. T ≥5

C. A ≥5且 T ≥5

D. A ≥5 且n ≥40

E. T ≥5 且n ≥40

38.三个样本率比较得到2χ>2)2(01.0χ,可以为

A.三个总体率不同或不全相同

B.三个总体率都不相同

C.三个样本率都不相同

D.三个样本率不同或不全相同

E.三个总体率中有两个不同

39.四格表2χ检验的校正公式应用条件为

A. n>40 且T>5

B. n<40 且T>5

C. n>40 且 1

D. n<40 且1

E. n>40 且T<1

40.下述哪项不是非参数统计的优点

A.不受总体分布的限定

B.简便、易掌握

C.适用于等级资料

D.检验效能高于参数检验

E.适用于未知分布型资料

41.秩和检验和t 检验相比,其优点是

A.计算简便,不受分布限制

B.公式更为合理

C.检验效能高

D.抽样误差小

E.第二类错误概率小

42.等级资料比较宜用

A. t 检验

B. u 检验

C.秩和检验

D.2χ检验

E.F 检验

43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用

A. t 检验

B. u 检验

C.秩和检验

D.F 检验

E.2χ检验

44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文

)1(01.02χχ>,乙文2)1(05.02χχ>,可认为

A.两文结果有矛盾

B.两文结果基本一致

C.甲文结果更可信

D.乙文结果更可信

E.甲文说明总体间的差别更大

45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制

A.普通线图

B.直方图

C.统计地图

D.半对数线图

E.圆形图

46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用

A.普通线图

B.直方图

C.统计地图

D.半对数线图

E.圆形图

47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名

高血压患者,99名非高血压患者,整理后的资料是:

A.计量资料

B.计数资料

C.多项分类资料

D.等级资料

E.既是计量资料又是分类资料

48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。欲评价该资料的集中趋势

和离散程度,最合适的指标是:

───────────────────────────────────

潜伏期(小时) 12- 24- 36- 48- 60- 72- 84- 96- 108- 合计

───────────────────────────────────

病例数 1 10 18 14 5 4 4 2 2 60

_______________________________________________________________________

A.均数和标准差

B.几何均数和全距

C.中位数和四分位数间距

D.均数和方差

E.均数和变异系数

49.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,结果如下。最合适描述其集中趋势的指标是:

抗体滴度: 1:8 1:16 1:32 1:64 1:128 1:256 合计

例数: 2 6 5 11 4 2 30

A.均数

B.几何均数

C.百分位数

D. 中位数

E.标准差

50.某市1998年调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞含量,结果如下。欲估计该市居民发汞值的95%医学参考值范围,宜计算:

发汞值(μmol/kg)1.5~ 3.5~ 5.5~ 7.5~ 9.5~ 11.5~ 13.5~15.5~

人数: 20 66 80 28 18 6 2 2 A. X ±1.96S B. X +1.645S

C. P2.5~P97.5

D. P95

E.P5

51.现随机抽取调查某市区某年男孩200人出生体重,得均数为 3.29(kg),标准差为

0.438(kg)。按95%可信度估计该市男孩出生体重均数所在范围,宜用:

A. X ±1.96S

B. X ±1.96Sx

C. X ±t

0.05,v S D. X ±t

0.01,v

S

E.μ±1.96σx

52. 测定尿铅含量有甲乙两种方法。现用甲乙两法检测相同样品,结果如下。要比较两法测得的结果有无差别,宜用:

10名患者的尿样分别用两法测定尿铅结果

───────────────────

样品号甲法乙法

───────────────────

1 2.74 4.49

2 0.54 1.24

.. .. ..

9 3.85 5.81

10 1.82 3.35

──────────────────

A.配对设计t检验 B.两样本均数的t检验

C.两样本均数的u检验

D.协方差分析

E. 配对设计u检验

53. 测得10名正常人和10名病毒性肝炎患者血清转铁蛋白的含量(g/L),结果如下,比较患者和正常人的转铁蛋白是否有显著性差别,用:

正常人 2.65 2.72 2.85 2.91 2.55 2.76 2.82 2.69 2.64 2.73

病毒性肝炎患者 2.36 2.15 2.52 2.28 2.31 2.53 2.19 2.34 2.31 2.41

A. 两样本均数的u检验

B.样本均数与总体均数的t检验

C. 两样本均数的t检验

D. 配对设计t检验

E. 先作方差齐性检验, 再决定检验方法

54. 从9窝大鼠的每窝中选出同性别、体重相近的2只,分别喂以水解蛋白和酪蛋白

饲料,4周后测定其体重增加量,结果如下,比较两种饲料对大鼠体重的增加有无显著

性影响,宜用:

窝编号 1 2 3 4 5 6 7 8 9

含酪蛋白饲料组 82 66 74 78 82 76 73 90 92

含水解蛋白饲料组15 28 29 28 24 38 21 37 35

A.单因素方差分析

B.协方差分析

C. 配对设计t检验

D.两样本均数的t检验

E. 配对设计u检验

55.已知正常人乙酰胆碱酯酶活力的平均数为1.44U,现测得10例慢性气管炎患者乙酰

胆碱酯酶活力分别为:1.50,2.19,2.32,2.41,2.11,2.54,2.20,2.22 1.42,2.17。欲比较慢性气管炎患者乙酰胆碱酯酶活力的总体均数与正常人有无显著性的差别,用: A. 两样本均数的t检验 B. 配对设计t检验

C. 两样本均数的u检验

D. 样本均数与总体均数的t检验

E. 样本均数与总体均数的u检验

56. 某医院用中药治疗8例再生障碍性贫血患者,其血红蛋白(g/L)治疗前后变化的结

果如下,治疗前后血红蛋白(g/L)值是否有显著性差别,可用:

患者编号 1 2 3 4 5 6 7 8

治疗前血红蛋白 68 65 55 75 50 70 76 65

治疗后血红蛋白 128 82 80 112 125 110 85 80

A. 样本均数与总体均数的t检验

B. 两样本均数的t检验

C. 配对设计t检验

D. 两样本均数的u检验

E.协方差分析

57. 应用免疫酶法对鼻咽癌患者和非癌患者分别测定11人的血清病毒VCA-LOG抗体滴度,其倒数如下,比较两组患者的血清病毒的VCA-LOGA 抗体滴度倒数平均水平之间有

无显著性的差别,宜用:

鼻咽癌患者 5 20 40 80 80 80 160 160 320 320 640

非癌患者 5 10 10 20 20 20 40 40 80 80 80

A. 配对设计t检验

B. 两样本均数的t检验

C. 两样本几何均数的t检验(方差齐时)

D. 两样本均数的u检验

E. 样本均数与总体均数的t检验

58.下表是甲、乙两医院治疗同一种疾病的情况,如比较甲、乙两医院的总治愈率有

无差别,应用:

───────────────────────────────────

甲医院乙医院

病情──────────────────────────────治疗人数治愈人数治愈率(%) 治疗人数治愈人数治愈率(%) ───────────────────────────────────

轻 100 80 80.0 300 210 70.0

重 300 180 60.0 100 50 50.0 ───────────────────────────────────

合计 400 260 65.0 400 260 65.0 ───────────────────────────────────

A.按病情轻重分别比较

B.四格表的X 2检验

C.两样本率的u 检验

D.四格表的确切概率法

E.先作率的标准化,再对标化率作假设检验

59. 某研究室用甲乙两种血清学方法检查422例确诊的鼻咽癌患者,得结果如下表. 分

析两种检验结果之间有无差别,检验公式是:

──────────────────────────

乙法

甲法 ───────── 合计

+ -

──────────────────────────

+ 261 110 371

- 20 31 39

──────────────────────────

合计 281 141 422

────────────────────────── A. c b c b x +-=22

)( B.))()()(()(22d b c a d c b a n bc ad x ++++-= C.))()()(()2/(22d b c a d c b a n n bc ad x ++++--= D.)1(2

2

-=∑C R n n A n x E.!

!!!!)!()!()!()!(n d c b a d b c a d c b a P ++++=

60. 有20例急性心肌梗塞并发休克病人,分别采用西药和中西药结合的方法抢救,疗

效如下,比较两组病死率有无差别,宜用

治疗转归

组别 合计

康复 死亡

西药组 6 5 11

中西药组 9 0 9

合计 15 5 20

A.两样本率的u 检验

B.四格表的X 2 检验

C. 四格表的校正X 2 检验

D.2×2表的X 2检验

E. 四格表的确切概率法

61.为研究血型与胃溃疡、胃癌的关系,得下表资料,AB 型因例数少省略去,问各组血

型构成差别有无统计意义,宜用:

血 型 ────────── 合计

O A B

────────────────────

胃溃疡993 679 134 1806 胃癌 393 416 84 893 对照 2902 2652 570 6097 ────────────────────

4288 3720 788 8796 ────────────────────

A. 3×3表的X2检验

B.4×4表的X2检验

C. 3×3列联表的X2检验

D. 4×4列联表的X2检验

E.秩和检验

62.某山区小学男生80人,其中肺吸虫感染23人,感染率为28.75%;女生85人,感染13人,感染率为15.29%,如比较男女生的肺吸虫感染率有无差别,可用:

A.两样本率的u检验

B.四格表的X2 检验

C.2×2表的X2检验

D. 四格表的确切概率法

E.以上方法均可

63. 二种方案治疗急性无黄疸型病毒肝炎180例,结果如下。比较二组疗效有无差别,宜用:

例数

组别

无效好转显效痊愈合计

西药组 49 31 5 15 100

中西药组 45 9 22 4 80

合计 94 40 27 19 180

A. 3×3表的X2检验

B. 2×4表的X2检验

C. 3×3列联表的X2检验

D. 2×4列联表的X2检验

E.成组设计两样本比较的秩和检验

64.四种呼吸系疾病痰液内嗜酸性白细胞的含量如下。比较各组间的嗜酸性白细胞的含

量有无差别,宜用:

含量支气管扩张肺气肿肺癌病毒性呼吸系统感染

— 0 3 5 3

+ 2 5 7 5

++ 9 5 3 3

+++ 6 2 2 0

合计 17 15 17 11

A. 成组设计的方差分析

B. 成组设计的多个样本的秩和检验

C.配伍组设计的方差分析

D.配伍组设计的多个样本的秩和检验

E.4×4表的X2检验

65.三种药物治疗某病的观察结果如下.检验何种药物疗效较好,宜用:

药物

疗效

A B C 合计

治愈 15 4 1 20

显效 49 9 15 73

好转 31 50 45 126

无效 5 22 24 51

合计 100 85 85 270

A. 4×3表的X2检验

B. 4×3列联表的X2检验

C. 5×4表的X2检验

D. 5×4列联表的X2检验

E. 成组设计的多个样本的秩和检验

66.某地1952和1998年三种死因别死亡率如下表,将此资料绘制成统计图,宜用:

某地1952和1998年三种死因别死亡率

死因 1952 1998

肺结核 165.2 27.4

心脏病 72.5 83.6

恶性肿瘤 57.2 178.2

A.直条图

B.百分条图

C.圆图

D.线图

E.直方图

67.图示下表资料,应选用的统计图是:

某市1949~1953年15岁以下儿童结核病和白喉死亡率(1/10万)

年份结核病死亡率白喉死亡率

1949 150.2 20.1

1950 148.0 16.6

1951 141.0 14.0

1952 130.1 11.8

1953 110.4 10.7

A.条图

B.百分条图

C.圆图

D.线图或半对数线图

E.直方图

68.某人测得140名一年级男性大学生第一秒肺通气量(FEV1),结果如下.图示此资料宜用: FEV1 频数

2.0- 1

2.5- 3

3.0- 11

3.5- 38

4.0- 46

4.5-26

5.0-5.5 12

───────

合计137

──────────────

A.条图

B.百分条图

C.圆图

D.线图或半对数线图

E.直方图

69.我国1988年部分地区的死因构成如下表.图示此资料宜用:

我国1988年部分地区的死因构成

死因构成比(%)

呼吸系病 25.70

脑血管病 16.07

恶性肿瘤 15.04

损伤与中毒 11.56

心脏疾病 11.41

其它 20.22

合计 100.00

A.条图

B.百分条图或圆图

C.半对数线图

D.线图

E.直方图

70.某地一年级10名女大学生的体重和肺活量数据如下.图示此资料宜用:

编号 1 2 3 4 5 6 7 8 9 10

体重(kg) 42 42 46 46 50 50 52 52 58 58

肺活量(L) 2.5 2.2 2.8 2.5 3.1 3.2 3.6 3.5 3.8 3.6

A.条图

B.散点图

C.半对数线图

D.线图

E.直方图

71.某医院观察三种药物驱钩虫的疗效,服药后7天得粪检钩虫卵阴转率(%)如下,问这三种药疗效是无差别,宜用:

三种药物驱钩虫的疗效比较

──────────────────────────────

药物治疗例数阴转例数阴转率(%)

──────────────────────────────

复方敌百虫片 37 28 75.7

纯敌百虫片 38 18 47.4

灭虫宁 34 10 29.4

──────────────────────────────

A. 3×2表的X2检验

B. 3×2列联表的X2检验

C. 3×3表的X2检验

D. 3×3列联表的X2检验

E. 4×4表的X2检验

72.对15个猪肝给予某种处理,在处理前后各采一次肝外表的涂抹标本进行细菌培养,结果如下.欲比较处理前后的带菌情况有无差别,宜用:

带菌情况

处理合计

阳性阴性

前 7 8 15

后 2 13 15

合计 9 21 30

A. 2×2表的X2检验

B. 2×2列联表的X2检验

C. 3×3表的X2检验

D. 3×3列联表的X2检验

E. 四格表的确切概率法

二、辩析题。要求先判断对错,然后给出理由。

例题:由于t 检验效率高于秩和检验,在做两小样本均数检验时,均应使用t检验。

答:不正确。因为t 检验属参数检验,只有满足参数检验的条件才能采用t 检验。

1.等级资料的比较只能采用秩和检验。

2.抽样误差是不可避免的,但其大小是可以控制的。

3.开口资料只要呈正态分布,也可用均数反映其集中趋势。

4.统计学的假设检验是对总体特征的假设,其结论是完全正确的。

5.在直线回归分析中,|b|值越大,回归线越陡。

6.同一资料根据不同分析目的可采用不同的统计分析方法。

7.在两个同类的研究中,A研究结果P<0.01,B研究结果P<0.05,就表明前者两样本均数差别大,后者两样本均数相差小。

8.标准差越大,表示个体差异就越大。

9.若两组计量资料的单位相同,可使用标准差来比较其变异大小,而不必考虑采用变异系数。

10.当V=∞时,t分布的t值就是标准正态分布的u值。

11.秩相关分析不要求两变量呈正态分布。

12.在科学研究中,如实测值与真实值不一致即为误差,且这种称为抽样误差。

13.在统计分析中,只要标准差大于均数,该指标的频数分布就不呈正态分布。

14.在假设检验中,无论是否拒绝H0,都有可能犯错误。

15.当资料分布的末端无确切数据时不能计算平均数。

16.在卡方检验中,只要P<0.05,就可认为两样本率不同。

17.在样本含量确定后,个体差异越大,抽样误差越小。

18.用频数表加权法计算的均数比用直接法计算的均数准确。

19.普查由于没有抽样误差,结果最准确。

20.不同计量单位资料的变异度比较只能用变异系数。

21.理论上秩和检验可用于任何分布型资料的比较。

三、名词解释

1、变异:即同质的观察单位之间某项特征所存在的差异。

2、总体:根据研究目的确定的同质观察单位某项变量值的集合。

3、样本:从总体中随机抽取的部分观察单位某项变量值的集合组成样本。

4、概率:描述随机事件发生可能性大小的数值,用P表示,0≤P≤1。

5、中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值。

6、变异系数:标准差S与均数X之比用百分数表示。公式是CV=S/X×100%。

7、参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计。

8、可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围。

9、抽样误差:由于总体中存在个体变异,随机抽样所得样本仅仅是总体的一部分,从而造成样本统计量与总体参数之间的差异,称抽样误差。

10、P值:指由H

所规定的总体中作随机抽样,获得等于及大于( 或等于及小于)现有样本检验统计量的概率,P的取值范围在0-1之间。

11、检验效能(1-β):又称把握度,即两总体确实有差别, 按α水准能发现它们有差别的能力。

12、检验水准:用于判断是否拒绝H

的概率标准,用α表示,一般取α=0.05,P>

α,不拒绝H

0;P≤α,拒绝H

13、第一类错误:拒绝了实际上是成立的H

所产生的错误,即"弃真",其概率大小为α。

14、第二类错误:接受了实际上不成立的H

所产生的错误,即"存伪",其概率大小用β表示,一般β是未知的,其大小与α有关。

15、假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析。

16、构成比:又称构成指标。它说明一事物内部各组成部分所占的比重或分布。

构成比=(某一组成部分的观察单位数/同一事物各组成的观察单位总数)×100%。

17、率:又称频率指标。它说明某现象发生的频率或强度。

率=(发生某现象的观察单位数/可能发生该现象的观察单位总数)×K。

18、率的标准化法:采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性。

19、参数统计: 在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知, 统计推断的目的就是对这些未知参数进行估计或检验。

20、非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验。

21、相关系数: 说明两变量间相关关系的密切程度与相关方向的指标,用r表示。

22、回归系数b:即回归直线的斜率,它表示当X变动一个单位时,Y平均改变b个单位。

23、偏回归系数bi: 在其它自变量保持恒定时,Xi每增(减)一个单位时y平均改变bi个单位。

24、决定系数: 相关系数或复相关系数的平方,即r2或R2。它表明由于引入有显著性相关的自变量,使总平方和减少的部分,r2或R2越接近1, 说明引入相关变量的效果越好。

25、计量资料:用定量方法对每个观察对象测定某项指标量的大小,所得的资料称为计量资料。

26、计数资料: 先将观察单位按某种属性或类别分组,然后清点各组的观察单位数

所得资料,称为计数资料。

27、等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

四、简答题

1、统计资料可以分成几类?

答: 根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。

2、不同类型统计资料之间的关系如何?

答: 根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。

3、频数分布有哪两个重要特征?

答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。

4、标准差有什么用途?

答: 标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。

5、变异系数(CV)常用于哪几方面?

答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。

6、制定参考值范围有几种方法?各自适用条件是什么?

答: 制定参考值范围常用方法有两种: ①正态分布法: 此法是根据正态分布的原理,依据公式:

X±uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按: X±1.96S计算;95%单侧参考值范围是: 以过低为异常者,则计算: X-1.645S,过高为异常者,计算X+1.645S。若为对数正态分布资料,先求出对数值的均数及标准差,求得

正常值范围的界值后,反对数即可。②百分位数法。用P

2.5~P

97.5

估计95%双侧参考值范

围;P

5或P

95

为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),

计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。

7、计量资料中常用的集中趋势指标及适用条件各是什么?

答: 常用的描述集中趋势的指标有: 算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;③中位数: 用M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。

8、标准差,标准误有何区别和联系?

答: 标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。

9、统计推断包括哪几方面内容?

答: 统计推断包括: 参数估计及假设检验两方面。参数估计是指由样本统计量( 样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X±uσ

X

X±uS

X

来估计。假设检验是根据样本所提供的信息,推断总体参数是否相等。

10、假设检验的目的和意义是什么?

答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。

11、何谓假设检验?其一般步骤是什么?

答: 所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法根据样本所提供的信息,对所提出的假设作出拒绝或不拒绝的结论的过程。

假设检验一般分为五个步骤: ①建立假设:包括: H

0,称无效假设;H

1

: 称备择假设;

②确定检验水准:检验水准用α表示,α一般取0.05;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P

值;⑤推断结论:如P>α,则接受H

0,差别无统计学意义;如P≤α,则拒绝H

,差

别有统计学意义。

12、假设检验有何特点?

答: 假设检验的特点是: ①统计检验的假设是关于总体特征的假设;②用于检验的方法是以检验统计量的抽样分布为理论依据的;③作出的结论是概率性的,不是绝对的肯定或否定。

13、如何正确理解差异有无显著性的统计学意义?

答: 在假设检验中,如P≤α,则结论是: 拒绝H

0,接受H

1

,习惯上又称“显著”,

此时不应该误解为相差很大,或在医学上有显著的(重要的)价值;相反,如果P>α,结论是不拒绝H

。习惯上称“不显著”,不应理解为相差不大或一定相等。有统计学意义( 差异有显著性)不一定有实际意义;如某药平均降低血压5mmHg,经检验有统计学意义,但在实际中并无多大临床意义,不能认为该药有效。相反,无统计学意义,并不一定无实际意义。如用新疗法治疗某病,有效率与旧疗法无差异,此时无统计学意义,如果新疗法方法简便,省钱,更容易为病人接受,则新疗法还是有实际意义。

14、参考值范围与可信区间区别是什么?

答: (1)意义不同: 参考值范围是指同质总体中包括一定数量(如95%或99%) 个体值的估计范围,如95%参考值范围,意味该数值范围只包括95%的个体值,有5%的个体值不在此范围内。可信区间是指按一定的可信度来估计总体参数所在范围。如95%的可信区间,意味着做100次抽样,算得100个可信区间,平均有95个可信区间包括总体参数(估计正确)有5个可信区间不包括总体均数(估计错误)。(2)计算方法不同: 参考值

范围用X±u

αS计算。可信区间用X±t

α、ν

S

x

或X±u

α

S

x

计算;前者用标准差,后者用标

准误。

15、X2检验有何用途?

答: X2检验有以下应用: ①推断两个或两个以上总体率(或构成比)之间有无差别;

②检验两变量之间有无相关关系;③检验频数分布的拟合优度。

16、四格表资料的u检验和X2检验的应用条件有何异同?

答:(1) 相同点:四格表资料的u检验是根据正态近似原理进行的,凡能用u检验对两样本率进行检验的资料,均能使用X2检验,两者是等价的,即u2=X2;u检验和X2检验都存在连续校正的问题。(2) 不同点:由于u分布可确定单、双侧检验界值,可使用u检验进行单侧检验;满足四格表u检验的资料,可计算两率之差的95%可信区间,以分析两率之差有无实际意义;X2检验可用于2×2列联表资料有无关联的检验。

17、参数检验与非参数检验有何区别? 各有何优缺点?

答: 参数检验是检验总体参数是否有差别,而非参数检验是检验总体分布的位置是否相同。参数检验的优点是能充分利用样本资料所提供的信息,因此,检验效率较高。其缺点是有较严格的使用条件,如要求总体的分布呈态分布,各总体方差要相等,有些资料不满足使用条件,就不能用参数检验。非参数检验的优点是适用范围广。它不要求资料分布的形式,另外可用于等级资料或不能确切定量的资料。缺点是不能充分利用样本所提供的信息,因此检验效率较低,产生第二类错误较大。

18、非参数检验适用于哪些情况?

答: 非参数检验应用于以下情况: ①不满足参数检验的资料,如偏态分布资料;②分布不明的资料;③等级资料或开口资料。

19、直线回归与相关有何区别和联系?

答: 1、区别: ①在资料要求上,回归要求因变量y 服从正态分布,自变量x 是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;相关要求两个变量x、y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。②在应用上,说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。2、联系: ①对一组数据若同时计算r与b,则它们的正负号是一致的;②r与b的假设检验是等价的,即对同一样本,二者的t值相等。③可用回归解释相关。

20、常用的统计图有哪几种?它们的适用条件是什么?

答: 常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及园图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适

用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。⑥散点图: 适用于成对数据,反映散点分布的趋势。

五、分析应用题

1.某医师用甲乙两疗法治疗小儿单纯消化不良,结果如下表:欲比较两种疗法的治愈率是否相同,应使用何种统计方法?

━━━━━━━━━━━━━━━━━━━━

疗法治疗人数治愈人数治愈率(%)

────────────────────

甲 13 6 46.2

乙 18 8 44.4

─────────────────

合计 31 14 45.2

━━━━━━━━━━━━━━━━━━━━

答:这是一个四格表资料,作两样本率的比较,由于n较小(n=31),应采用四格表确切概率法(直接计算概率法)进行检验。

2. 为观察骨质增生丸对大骨节病的疗效,于治疗前测量踝关节的伸屈幅度,治疗80天后复测,两次测量所得的成对数据的差值可表示治疗的作用,结果如下。欲比较大骨节病人服骨质增生丸前后关节伸屈幅度的差异有无显著性,应用何种统计方法?

患者号 1 2 3 4 5 6 7 8 9 10 11 12 13 14

变化幅度 0 0 0 0 0 1 1 1 2 2 -2 3 5 9

答:由于治疗前后关节伸屈幅度的差值为偏态分布,故应用配对设计差值的符号秩和检验。

3.有甲、乙两个医院某传染病各型治愈率资料,见下表。经X2检验,X2=0.9044,P=0.3409,按α=0.05,可以认为,甲、乙两个医院对该种传染病总治愈率没有差异。该统计分析是否正确?如不正确,应如何进行分析?

甲、乙两个医院某传染病各型治愈率

病型甲医院乙医院

患者数治愈率(%)患者数治愈率(%)

普通型 300 60.0 100 65.0

重型 100 40.0 300 45.0

暴发型 100 20.0 100 25.0

合计 500 48.0 500 45.0

答:该统计分析是错误的。因为某传染病不同病型其治愈率不同,而甲乙两医院所治疗的病人,其病型构成不一样,因此两家医院总的治愈率没有可比性,应对其进行标准化后再比较。

4. 根据下表资料,欲分析胆麻片对慢性气管炎的疗效是否优于复方江剪刀草合剂,可以应用什么统计分析方法?

复方江剪刀草合剂与胆麻片对慢性气管炎的疗效

疗效

药物无效好转显效控制

复方江剪刀草合剂

胆麻片 9 51 21 11

答:这是一个单向有序列联表(等级)资料,可以采用秩和检验进行比较。

5. 某部队共有1200人,在某段时间内患某病人数有120人,其中男性114人(95%),女性6人(5%)。某卫生员进行统计分析后说:该病的两性发病率之间相差非常显著,由此得出结论“该病男性易得”。你对这个结论有何看法?为什么?

答:这个结论值得怀疑。因为1200人中男性和女性的人数并不知道,因此该资料仅能计算构成比,而不能计算男女性的发病率,。若1200人中,只有6名女性,则结论正好与卫生员得出的结论相反。

6.某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,若要了解治疗前后之间的差别有无显著性意义,应当选择哪种检验方法,为什么?

患者编号 1 2 3 4 5 6 7

治疗前血红蛋白 65 75 50 76 65 72 68

治疗后血红蛋白 82 112 125 85 80 105 128

答:用配对t检验。因为该资料是同一受试对象治疗前后比较,属于配对设计,而且例数仅有7例,所以选用配对t检验。

7.某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下。求其平均滴度用什么指标合适,请说出理由。

抗体滴度1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计

例数 2 6 5 10 4 2 1 30

答:用几何均数描述,因为该抗体滴度资料呈对数正态分布,要正确描述其平均水平,应该用几何均数。

8.145名食物中毒病人的潜伏期如下表,选择适应的指标求其平均潜伏期,请说出理由。

145名食物中毒病人的潜伏期

潜伏期人数

0~ 17

6~ 46

12~ 38

18~ 32

24~ 6

30~ 0

36~ 4

42~48 2

答:用中位数。因为该资料是正偏态分布,适合用中位数描述其平均水平。

9.某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,若要了解治疗前后之间的差别有无显著性意义,应当选择哪种检验方法,为什么?

患者编号 1 2 3 4 5 6 7

治疗前血红蛋白65 75 50 76 65 72 68

治疗后血红蛋白82 112 125 85 80 105 128

答:用配对t检验。因为该资料是同一受试对象治疗前后比较,属于配对设计,而且例数仅有7例,所以选用配对t检验。

10.活动型结核患者的平均心率一般为86次/分,标准差为6.5次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为7.8次/分,要比较该院活动型结核患者与一般活动型结核患者的心率有无差别,应当选择哪种检验方法,为什么?

答:用样本均数与总体均数比较的t检验。因为已知一般活动型结核患者的平均心率,可看为总体均数。而36名该院的活动型结核患者的心率均数可看为一个样本均数。比较两者有无差别,宜用样本均数与总体均数比较的t检验。

11.某医生调查了维吾尔族与回族居民血型构成,资料见下表,他要比较两民族血型分布是否相同,选择用R×C表卡方检验,是否正确?为什么?

维吾尔族与回族居民血型构成比调查结果

民族血型构成比(%)调查例数

A B O AB

维吾尔族29.21 31.92 27.50 11.37 1513

回族27.23 28.34 35.94 8.49 1355

答:对的。因为由上表可知,血型是无序分类变量,要比较两组无序分类变量的构成宜用行×列表的卡方检验。

12. 某地抽样调查144名正常成年男子红细胞数(万/立方毫米), 此资料符合正态分布, 现计算其均数为537.8(万/立方毫米),标准差为40.9(万/立方毫米),标准误为3.66(万/立方毫米), 故该地正常成年男子红细胞的95%可信区间下限为537.8-1.96×40.9=457.64(万/立方毫米); 上限为537.8+1.96×4 0.9=617.96(万/立方毫米)。该分析正确否? 为什么?

答:错。题目要求计算95%可信区间,可是在具体计算时,误用了是95%参考值范围的公式。正确的计算:下限为537.8-1.96×3.66,上限为537.8+1.96×3.66。13. 某地1968年与1971年几种主要急性传染病情况如下表。某医师根据此资料中痢疾与乙脑由1968年的44.2%与3.4%分别增加到1971年的51.9%和5.2%,认为该地1971年痢疾与乙脑的发病率升高了,值得注意!你的看法如何?为什么?

━━━━━━━━━━━━━━━━━━━━

1968年1971年

病种──────────────

病例数%病例数%

━━━━━━━━━━━━━━━━━━━━

痢疾4206 44.2 3079 51.9

麻疹2813 29.6 1465 24.7

流脑1650 17.3 824 13.9

乙脑327 3.4 310 5.2

白喉524 5.5 256 4.3

────────────────────

合计9520 100.0 5934 100.0

━━━━━━━━━━━━━━━━━━━━

答:错。表中计算的是构成比,结论中误把它当成发病率来解释,犯了以比代率的错误。

相关主题
文本预览
相关文档 最新文档