当前位置:文档之家› 医学统计学(第二版)思考与练习答案

医学统计学(第二版)思考与练习答案

医学统计学(第二版)思考与练习答案
医学统计学(第二版)思考与练习答案

第四章 定量资料的统计描述

【习题解析】

一、思考题

1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。

2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。

3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。

4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间( 2.58, 2.58)μσμσ-+内的面积为9

5.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。

5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参

考值范围。 二、案例辨析题

统计描述时,常见错误是对定量资料的描述均采用均数、标准差。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清胆固醇的频数分布图如下:

图4-1 血清甘油三酯(TG)的频数分布

可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:

集中趋势指标150150122(1.7/26 1.75)/2 1.755X M X ????+ ?

???

????

=+ ? ??=+=? (mmol/L)

离散程度指标 四分位数间距= 7525 2.10 1.340.76P P -=-= (mmol/L)

三、最佳选择题

1. B

2. E

3. B

4. C

5. D

6. E

7. A

8. D

9. D

四、综合分析题 1. 解:输出结果

频数

图4-4 尿总砷的频数分布图

由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。 输出结果

图4-5 尿总砷对数的频数分布图

由图可见lgx 分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。

(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。 输出结果

频数

频数

结果中的Mean 表示尿总砷对数值的均数为- 1.1831,求其反对数,得到几何均数0.0656(μg/L)G =。

2. 解:

(1) 已知健康人的血清TC 服从正态分布,故采用正态分布法制定95%的参考值范围。

下限: 1.96 4.84 1.960.96 2.96X S -=-?=(mmol/L)

上限: 1.96 4.84 1.960.96 6.72X S +=+?=(mmol/L)

该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为 2.96 mmol/L~6.72mmol/L 。

(2) 45~55岁健康男性居民的血清总胆固醇分布为正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。

11 3.25 4.84

1.660.96X Z μ

σ--=

=

=-

22 5.25 4.840.430.96

X Z μσ--===

查标准正态分布曲线下的面积表(附表2)得:

1()(1.66)0.0485

Z Φ=Φ-=

2()1(0.43)10.33360.6664Z Φ=-Φ-=-=

21()()0.66640.04850.617961.79%D Z Z =Φ-Φ=-==

该市45~55岁健康男性居民中,血清总胆固醇在3.25mmol/L~5.25mmol/L 范围内的比例为61.79%。 (3) 作标准化变换

3.80

4.84

1.080.96

X Z μ

σ

--=

=

=-

查标准正态分布曲线下的面积表(附表2)得:

()( 1.08)0.140114.01%Z Φ=Φ-==

该市45~55岁健康男性居民中,血清总胆固醇低于 3.80mmol/L 所占的比例为14.01%。

3. 解: 输出结果

跟骨硬度指数

图4-8 跟骨硬度指数的频数分布图

由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。

输出结果

Statistics

即该地区30~35岁健康女性的SI 的95%参考值范围为(58.02, 143.66)。

频数

50 60 70 80 90 100 110 120 130 140 150

第五章定性资料的统计描述

【习题解析】

一、思考题

1.①计算相对数应时有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。

2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。

3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。

4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。

5. ①标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。②样本的标准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。③注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,

宜采用间接法。④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。

二、案例辨析题

该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。

三、最佳选择题

1. B

2. A

3. D

4. E

5. D

6. D

7. C

8. C

9. B

四、综合分析题 1. 解:

表5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系

分 组 调查人数

经常吸烟

经常吸烟率(%)

否 COPD 患者 356 231 125 64.89 非COPD 患者

479

183

296

38.20

COPD 患者的经常吸烟率:231/356×100%=64.89% 非COPD 患者经常吸烟率:183/479×100%=38.20% COPD 患者的经常吸烟率比非COPD 患者高26.69%

231296

=

2.989125183

OR 比值比()?=?

还需进一步对OR 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。 输出结果

2. 解:

表5-4 某地居民1998~2004年某病死亡率(1/10万)动态变化

年份 符号 死亡率 绝对增长量

发展速度

增长速度

累计 逐年 定基比 环比 定基比 环比

1998~ a 0 160.5 — —

— — — 1999~ a 1 144.2 -16.3 -16.3 0.90 0.90 -0.10 -0.10 2000~ a 2 130.0 -30.5 -14.2 0.81 0.90 -0.19 -0.10 2001~ a 3 120.2 -40.3 -9.8 0.75 0.92 -0.25 -0.08 2002~ a 4 85.6 -74.9 -34.6 0.53 0.71 -0.47 -0.29 2003~ a 5 69.5 -91.0 -16.1 0.43 0.81 -0.57 -0.19 2004~

a 6

38.5

-122.0

-31.0

0.24

0.55

-0.76

-0.45

该病死亡率的平均发展速度0.79== 该病死亡率的平均增长速度=1=0.791=0.21---平均发展速度

3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg 阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。

表5-5 直接法计算某地不同年龄、性别人群的HBsAg 标准化阳性率(%)

年龄组 标准人口数

i N

男性

女性 原阳性率

i p

预期阳性数

i i N p

原阳性率 i p

预期阳性数

i i N p

0~ 1081 2.30 24.90 2.32 25.09 20~ 1473 2.71 39.97 2.72 40.02 40~ 1546 6.06 93.63 6.46 99.86 60~ 1408 7.52 105.85 8.60 121.04 合 计

5508(N )

5.11

264 (i i N p ∑)

4.86

286(i i N p ∑)

男性HBsAg 标准化阳性率:264

100% 4.79%5508p '=

?= 女性HBsAg 标准化阳性率:286

100% 5.19%5508

p '=

?= 可见,经标准化后女性HBsAg 阳性率高于男性。 输出结果

注:将SPSS 输出的sp1的和除以sp 的和,得男性HBsAg 标准化阳性率;sp2的和除以sp 的和,得女性HBsAg 标准化阳性率。

第六章 总体均数的估计

【习题解析】

一、思考题

1.抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。 2.样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的

变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。 3

.标准差与标准误的区别在于:①计算公式:标准差为S =,标准

误为X S =

;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。

标准差与标准误的联系:当样本量n 一定时,标准误随标准差的增加而增加,公式为:n

S S X =

4.数理统计的中心极限定理:从均数为μ,标准差为σ的正态总体中进行独立随机抽样,其样本均数服从均数为μ,标准差为n /σ的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时)50(≥n ,其样本均数的分布逐渐逼近于均数为μ,标准差为n /σ的正态分布。X σ越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,X σ越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。

计算总体均数置信区间的通式为:),(,2/,2/X X S t X S t X νανα+-;当样本含量较大时,例如100n >,t 分布近似标准正态分布,可用Z 值代替t 值,作为置信区间的近似计算,相应的置信度为(1)α-时,总体均数的置信区间为:

),(2/2/X X S Z X S Z X αα+-。

5.置信区间与医学参考值范围的区别见表6-1。

表6-1 均数的置信区间与医学参考值范围的区别

区别 均数的置信区间

医学参考值范围

意义

按一定的置信度(α-1)估计的总体均数所在的区间范围

大多数“正常人”的某项解剖、生理、生化指标的波动范围

计算 公式

①σ未知:(X X S t X S t X νανα,2/,2/,+-) ②σ未知而n 较大: (X X S Z X S Z X 2/2/,αα+-)

①正态分布法: 双侧95%的参考值范围为(S X S X 96.1,96.1+-) ②偏态分布法:

③σ已知:(X X Z X Z X σσαα2/2/,+-)

单侧下限95%的参考值范围为5P > 单侧上限95%的参考值范围为95P <

用途 用于总体均数的估计或假设检验

判断观察对象的某项指标正常与否,为临床诊断提供参考

二、案例辨析题

该学生误用医学参考值范围的公式来计算总体均数的95%置信区间,正确计算公式为:),(2/2/X X S Z X S Z X αα+-,二者的主要区别在于,计算医学参考值范围时应该用“标准差”,计算置信区间时应该用标准误。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.01,122.99)。

三、最佳选择题

1.C 2.E 3.E 4.A 5.E 6.A 7.E 8.B

四、综合分析题

1.解:由于该样本为小样本,故用公式X X S ±2.064估计总体均数95%置信区间为(8.27, 10.03)mm/h ;用公式 2.797X X S ±估计总体均数99%置信区间为(7.96, 10.34)mm/h 。 输出结果

Descriptives

Statistic Std. Error

红细胞沉降率 Mean

9.1481 .42563

95% Confidence Interval for Mean Lower Bound

8.2697

Upper Bound 10.0266 5% Trimmed Mean 9.1795 Median 9.4288 Variance 4.529 Std. Deviation 2.12816

Minimum 5.01 Maximum 12.68 Range

7.67

Interquartile Range

2.73

Skewness -.250 .464

Kurtosis

-.429

.902

Descriptives

Statistic Std. Error

红细胞沉降率 Mean

9.1481 .42563

99% Confidence Interval for Mean Lower Bound

7.9576

Upper Bound 10.3386 5% Trimmed Mean 9.1795 Median 9.4288 Variance 4.529 Std. Deviation 2.12816

Minimum 5.01 Maximum 12.68 Range

7.67 Interquartile Range 2.73 Skewness -.250 .464

Kurtosis

-.429

.902

2.解:①抽样误差为1.82;②由于该样本为大样本, 故用公式X S Z X 2/α±估计正常人ET 含量的95%置信区间为(77.43, 84.57)ng/L 。 输出结果

Descriptives

Statistic Std. Error 血浆内皮素 Mean

80.9891 1.82033

95% Confidence Interval for Mean Lower Bound

77.3771

Upper Bound 84.6010 5% Trimmed Mean 80.8639 Median 79.5837 Variance 331.362 Std. Deviation 18.20334 Minimum 34.02 Maximum 129.20 Range

95.17

Interquartile Range

21.75

3.解:①由于两样本均为小样本, 故用公式0.05/2,X X t S ν ±估计总体均数95%置信区间,肺心病组血液二氧化碳分压的95%置信区间为(7.86 , 13.10)kpa ;慢性支气管炎合并肺气肿组血液二氧化碳分压的95%置信区间为(5.41 , 6.83)kpa 。

②由于方差不齐,应当选择方差不齐时的结果。两组患者的血液二氧化碳分压差值的95%置信区间为(1.66, 7.05)kpa ,该区间不包含0,可以认为肺心病患者与慢性支气管合并肺气肿患者的均数不同,肺心病患者较高。 输出结果

Descriptives

组别

Statistic Std. Error 二氧化碳压 肺心病组 Mean 10.4782

1.26564

95% Confidence Interval for Mean

Lower Bound

7.8600

Upper Bound

13.0964 5% Trimmed Mean 10.2266 Median 10.3473 Variance 38.444 Std. Deviation 6.20035

Minimum 1.59 Maximum 24.30 Range

22.71 Interquartile Range 7.13 Skewness .615 .472

Kurtosis -.030 .918 慢性支气管炎合并肺气肿组 Mean 6.1228

.33809

95% Confidence Interval for Mean

Lower Bound

5.4151

Upper Bound

6.8304 5% Trimmed Mean 6.1266

Median 6.0160

Variance 2.286 Std. Deviation 1.51198

Minimum 2.93 Maximum 9.25 Range

6.32 Interquartile Range 1.78 Skewness -.081 .512

Kurtosis

.192

.992

Group Statistics

Independent Samples Test

【习题解析】

一、思考题

1.理论根据是小概率事件和小概率反证法。P 值表示0H 成立时,出现等于及大于(或等于及小于)现有样本统计量的概率。0.05P 则表示在0H 成立的前提下,得到现有样本统计量的概率为小概率事件,所以拒绝0H 。

2.t 检验中是选择单侧检验还是双侧检验,需要根据专业知识来确定。例如,根据专业知识能确定未知总体均数μ不会大(小)于标准值0μ(单样本t 检验),则可用单侧检验,否则,采用双侧检验。

3.配对t 检验的应用条件是资料为配对设计,且数据差值服从正态分布。 4.理论上讲α应取得大一些,如0.10或0.20,目的是减少犯II 型错误的概率;在实际应用中,常取0.10α=。

5.变量变换的目的在于使变换后的资料满足正态分别或方差齐性等条件,便于进一步的统计分析。

6.可以,大样本两组均数的Z 检验是两组均数比较t 检验的近似。

二、案例辨析题

该医生的分析结果是错误的。正确作法应是分别将甲、乙两药各自治疗前后的血沉值作差值,比较两组差值的均值是否有差别,具体步骤如下:

(1) 正态性检验

分别对甲、乙两种药物治疗前后的血沉差值12d d 、进行正态性检验。

甲药: 0.0050.687 1.96SKEW Z =< 0.3601.3341.96K U R T

Z =< 乙药: 0.369 1.96SKEW Z =< 0.2321.3341.96K U R T

Z =< 故,甲药、乙药两组资料的差值12d d 、均服从正态分布。 (2) 方差齐性检验

1) 建立检验假设,确定检验水准

0H : 22

12σσ=,两差值总体方差相等

1H : 2212σσ≠,两差值总体方差不等

0.10α=

2)计算检验统计量

22

12

2() 1.932 1.134() 1.814

S F S ===2较大较小 11221101911019v n v n =-=-==-=-=,

3) 确定P 值,作出统计推断

查F 界值表(附表4),得0.10P >,按0.10α=的水准,不拒绝0H ,差异不

具有统计学意义,尚不能认为两差值总体方差不等。

(3) 以差值12d d 、为资料,作两组均值t 检验 1) 建立检验假设,确定检验水准

0H :12μμ=,即甲、乙两种药物的疗效无差别 1H :12μμ≠,即甲、乙两种药物的疗效有差别

0.05α=

2) 计算检验统计量

3.10X X t =

=

=

12218v n n =+-=

3) 确定P 值,作出统计推断 查t 界值表(附表3),得0.05

0.1P <<,按0.5

α=水准,拒绝0H ,接受1H ,

差异具有统计学意义,可认为甲、乙两种药物的疗效有差别。由于乙种药物治疗前后血沉值的差值较大(均数为5.8),故乙药物治疗效果要好于甲药。

输出结果

三、最佳选择题

1.E

2.C

3.C

4.B

5.E

6.E

7.C

四、综合分析题

1. 解:本题应进行单样本t 检验,可按如下步骤完成:

(1) 资料的正态性检验

0.3120.564 1.96SKEW Z =<, 1.2471.091 1.96KURT Z =<

故资料服从正态分布。 (2) 单样本t 检验

1) 建立检验假设,确定检验水准

072H μ=:,即该山区成年男子的脉搏与一般成年男子脉搏无差别

172H μ≠:,即该山区成年男子的脉搏与一般成年男子脉搏有差别

0.05α=

2) 计算检验统计量

由原始资料计算得:73.69, 2.983X S ==,于是

2.27X X X t S μ-=

=== 116115v n =-=-=

3) 确定P 值,作出统计推断 查t 界值表(附表3),得0.020.05

P <<,按0.05α=水准,

拒绝0H ,接受1H ,差异有统计学意义,可以认为该山区成年男子脉搏与一般成年男子脉搏有差别。 输出结果

2.解:本题应采用配对t 检验,完成步骤如下:

(1) 分别作甲、乙两药治疗前后差值12d d 、的正态性检验 由案例辨析题中的结论可知,资料1

2d d 、均服从正态分布。

(2) 对甲、乙两药分别作配对t 检验 甲药:

1) 建立检验假设,确定检验水准

100d H μ=:,即甲药治疗前后血沉值无差别 110d H μ≠:,即甲药治疗前后血沉值有差别

0.05α=

2) 计算检验统计量

1

132

3.2010

d

d n

=

=

=∑ 1 1.93d S =

=

11 3.20 5.250.61d d d d d t S S =

=====

19v n =-=

3) 确定P 值,作出统计推断

查t 界值表(附表3),得0.001P <,按0.05α=水准,拒绝0H ,差异有统计学意义,即甲药降低血沉有效。 乙药:

1) 建立检验假设,确定检验水准

20:0d H μ=,即乙药治疗前后血沉值无差别

21:0d H μ≠,即乙药治疗前后血沉值有差别

0.05α=

2) 计算检验统计量

2

258

5.8010

d

d n

=

=

=∑

2 1.81d S ==

2210.13d d d d t S S =

==== 19v n =-=

3) 确定P 值,作出统计推断

查t 界值表(附表3),得0.001P <,按0.05α=水准,拒绝0H ,差异有统计学意义,即乙药降低血沉有效。 输出结果

3.解:本题资料为抗体滴度数据,一般服从对数正态分布,宜采用成组设计的两小样本几何均数比较的t 检验。

(1) 将原始数据取常用对数值后分别记为1X 、2X (2) 正态性检验

用SPSS 统计软件算得变量1X 、2X 的正态性检验结果。

1X :0.1040.661 1.96

SKEW Z =<

0.6411.279

1.96

KURT Z =<

2

X :

0.216 1.96

SKEW Z =< 1.0411.4001.96K U R T

Z =< 故,1X ,2X 两组资料均服从正态分布。 (3) 方差齐性检验

1) 建立检验假设,确定检验水准

0H :22

12σσ=,两总体方差相等 1H :2212σσ≠,两总体方差不等

0.10α=

2) 计算检验统计量

11122211 2.790.459 2.270.23n X S n X S ======,,;,, ,于是

22

12

2()0.45 3.83()0.23S F S ===2较大较小

11221111101918v n v n =-=-==-=-=,

3) 确定P 值,作出统计推断

查F 界值表(附表4),得0.10P <。按0.10α=水准,拒绝0H ,差异有统计学意义,故可认为两总体方差不相等。

(4) 两样本均数(12X X ,)的t '检验

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

医学统计学习题答案1

习题答案 第一章思考题答案 1.某医生收治200名患者,随机分成2组,每组100人。一组用A药,另一组用B药。经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么? a)A药组的疗效高于B药组。(对,但不提倡这样说,原因是容易被误解) b)A药的疗效高于B药。(不对,这是针对总体而言的) 2.某校同一年级的A班和B班用同一试卷进行一次数学测验。经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么? a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。(对) b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班。(不对,一次考试只是一 次抽样的结果) c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存 在抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。(对) d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体 A,B班所有学生的这次考试成绩构成了一个总体B。(对) 3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么? a)如果变量取值中含有小数点,则该变量为连续型变量。(不对,离散型变量取值也可以定义为取值含有小数点) b)如果资料为离散型变量的取值,则该资料一定为分类资料。(不对,如白细胞计数,这是离散型的资料,但不具有分类性质) c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博, 并记为90个早博/24小时,故该资料也有量纲。根据定义,应认为该资料为计量资料。 (本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

医学统计学试题和答案解析

第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D )

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学练习题及答案_9

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学练习题及答案 一、单向选择题 1. 医学统计学研究的对象是 E. 有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 E. 依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D. 病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B. 能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是D. 数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E. 提供数据和描述数据的分布特征 1. 变异系数主要用于 A.比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 E. 标准差 3. 某项指标95%医学参考值范围表示的是D. 在正常总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B.数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B的含量(mg/dl) 呈明显偏态分布,描述其个体差异的统计指标应使用 E.四分位数间距 1. 样本均数的标准误越小说明 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D. 个体差异 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为C. 正态分布 4. 假设检验的目的是 D. 检验总体参数是 1 / 7

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学习题

《医学统计学》习题集 第一章绪论 1.下面的变量中,属于分类变量的是( B )。 A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压 2.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料本属于( A )。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义 变量资料 % 第二章定量资料的统计描述 1.欲比较身高(cm)和体重(kg)哪个指标变异程度大,应采用(D )。 A.标准差 B.极差 C.四分位数间距 D.变异系数 2.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为( B )天。 . 3.调查测定某地107名正常人尿铅含量(mg/L)如下: 0~ 4~ 8~ 12~ 16~ 20~ |24~ 28~ 合计尿铅 含量 例数14 22 29 18 —15 6 1 2 107 (1)描述该资料的集中趋势,宜用(B )。 A.均数 B.中位数 C.几何均数 D.极差 (2)描述该资料的离散趋势,宜用(C )。 . A.极差 B.变异系数 C.四分位间距 D.标准差 第三章定性资料的统计描述 1.某医院某年住院病人中胃癌患者占5%,则( B )。

%是强度指标 B. 5%是频率指标 C. 5%是相对比指标 D. 5%是绝对数 — 2.某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论 为( D )。 A.该病男性易得 B.该病女性易得 C.该病男性、女性易患 程度相等 D.尚不能得出结论 3.一项新的治疗方法可延长病人的生命,但不能治愈该病,则最有可能 发生的情况是( A )。 A.该病的患病率增加 B.该病的患病率减少 C.该病的发病率增加 D.该病的发病率减少 - 4.某市有30万人口,2002年共发现2500名肺结核患者,全年总死亡人数为3000,其中肺结核死亡98人,要说明肺结核死亡的严重程度,最好应用()。 A. 肺结核的病死率 B.肺结核死亡人数 C.肺结核死亡率 D.肺结核死亡构成 第四章统计表与统计图 1.根据某地6-16岁学生近视情况的调查资料,反映患者的年龄分布可用 ()。 A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式条图 $ 2.表达某地两年几种疾病的患病率可用()。 A.直方图 B.单式条图 C.复式条图 D.线图 E.百分直条图 3.欲比较两家医疗机构近15年来床位数的增加速度,应当使用的统计图 为()。

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学课后答案解析

第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题和答案.doc

医学统计学试题和答案

(一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学习题参数估计基础

实习六参数估计基础 [实习目的与要求] 1、掌握均数及频率标准误的计算;掌握总体均数95%和99%置信区间的计算及适用条件; 掌握总体概率的95%和99%置信区间的计算及适用条件 2、熟悉t分布的特征。 (一)最佳选择题 1. 表示均数抽样误差大小的统计指标是________。 A. 标准差 B. 方差 C. 均数标准差 D. 变异系数 E. 样本标准误 S表示________。 2. x A. 总体均数 B. 样本均数的标准差 C. 总体均数离散程度 D. 变量x的离散程度 E. 变量x的可靠程度 3. 标准误越大,则表示此次抽样得到的样本频率_________。 A. 系统误差大 B. 可靠程度越大 C. 抽样误差越大 D. 可比性越差 E. 代表性越差 4. 要减小抽样误差,通常的做法是_________。 A. 适当增加样本例数 B. 将个体变异控制在一个范围内 C. 严格挑选观察对象 D. 增加抽样次数 E. 减小系统误差 5. 关于t分布的图形,下述那项是错误的______。 A. 当ν趋于∞时,标准正态分布是t分布的特例 B. 当ν逐渐增大,t分布逐渐逼近标准正态分布 C. ν越小,则t分布的尾部越高 D. t分布是一条以ν为中心左右对称的曲线 E. t分布是一簇曲线,故临界值因自由度的不同而不同 6. 已知某地25岁正常成年男性的平均收缩压为,从该地随机抽取20名25岁正常成年男性,测得其平均收缩压为。与不同,原因是_________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 个体差异太大 7. 从上题的同一地区中再随机抽取20名8岁男孩,测得其平均收缩压为,标准差为。与不同,原因是________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 样本均数不可比 8. 用上题的样本,估计该地8岁正常男孩的平均收缩压的95%的置信区间为_______。 A. ±19,2/05.0t? B. ±? C. ±19,2/05.0t?20 D.

医学统计学第二版高等教育出版社课后习题答案剖析

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

检验专业《医学统计学》习题集

检验专业《医学统计学》习题集 第一章医学统计中的基本概念 一、名词解释 1、总体: 2、样本: 3、变量: 4、概率: 5、数值变量资料: 6、分类变量资料: 7、等级资料: 8、统计推断: 二、选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差E.仪器故障误差 6. 医学统计工作的基本步骤有: A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析、统计描述、统计推断 D、选择对象、计算均数、参数估计和假设检验 E、整理分析、计算均数、标准误、标准差 7.概率P=0,则表示: A.某事件必然发生 B.某事件必然不发生 C.某事件发生的可能性很小 D.某事件发生的可能性很大 E.以上均不对 8.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:

A.统计设计 B.收集资料 C.整理资料 D.分析资料 E.以上均不对 9.下列的变量中是分类变量的是: A.身高 B.体重 C.年龄 D.血型 E.血压 10.下列变量中是数值变量的是: A.性别 B.年龄 C. 血型 D.职业 E.疗效 11.随机事件的概率是: A. P=0 B. P=1 C. P=-0.5 D.-0.5﹤P<0.5 E.0﹤P<1 12.用样本作推断,样本应是: A.总体中典型的一部分 B. 总体中任一部分 C. 总体中随机抽取的一部分 D. 总体中按比例分配的一部分 E. 总体中信息明确的一部分 13.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数82363 1 该资料的类型是: A. 数值变量资料 B.计量资料 C. 无序分类资料 D.有序分类资料 E.以上都不是 三、填空题 1、医学统计工作的基本步骤有__________、_________、_________和_________。 2、医学统计资料的来源主要有___________、___________、__________。 3、作为统计分析的原始资料,一般应满足_______性、________性和____________性要求。 4、统计分析包括____________和____________两方面的内容。 四、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? 2.抽样中要求每一个样本应该具有哪三性? 3.什么是两个样本之间的可比性? 第二章集中趋势的统计描述 一、选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 P百分位数A. 中位数 B. 几何均数 C. 均数 D. 95 E. 频数分布 2. 算术均数与中位数相比,其特点是 A.不易受极端值的影响B.能充分利用数据的信息 C.抽样误差较大D.更适用于偏态分布资料 E.更适用于分布不明确资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大

相关主题
文本预览
相关文档 最新文档