当前位置：文档之家› 医学统计学(点睛之笔很经典)

医学统计学(点睛之笔很经典)

Chapter 基本概念

显著性检验（test of significance ）：计算P 值医学统计工作的内容： 1、实验设计：最关键最重要 2、收集资料：最基础原始资料：实验数据

现场调查资料医疗卫生工作记录报表报告卡质量控制——精度和偏倚

3、整理资料

（1）资料的逻辑检查（坏数）（2）一致性检查

（3）原始数据加工：频数分布表

4、分析资料：统计描述（表、图、离散趋势、集中趋势）和统计推断统计描述类型的选择：

集中趋势离散趋势对称、正态 μ，x S SS ，，对数正态 G S lgX 偏态及其他 M Q ，R 单位不同或均数差别大 CV

医学统计的资料类型：计量资料、计数资料、等级分组资料医学统计学的对象：有变异的事物总体和样本：

总体（population ）的特性：同质性、大量性、差异性。抽样的要求：代表性、随机性、可靠性、可比性。样本的三性：代表性、随机性、可靠性。

抽样

总体样本

参数

统计量

推断

可靠性（reliability ）：实验的结果要具有可重复性。即由科研课题的样本得出的结论所推测总体的结论有较大的可信度。

两样本间具有：可比性。

误差的类别：

1、系统误差（system error ）：在资料的收集过程中，由于仪器初始状态没有调零、标准试剂未经矫正、标准指定偏高或偏低等原因，造成的观察结果的倾向性的偏大或偏小。必须克服。

2、随机测量误差（random measurement error ）：在避免系统误差的情况下，由于各种偶然因素的影响造成对同一对象多次测量值的不一致。

3、抽样误差（sampling error ）：由于抽样造成的的样本统计量与总体参数之间的差别。不可避免。样本含量越大，抽样误差越小。如均数的抽样误差：|-|μ。

概率（probability ）：P （A ）

小概率事件：P ≤0.05（有统计学意义）或P ≥0.01（有高度统计学意义）。

Chapter 集中趋势的统计描述

手工整理资料频数表（frequency table ）的步骤： 1、求极差（全距） 2、确定组数、组距参考组距=全距 / 组数 3、确定组段

4、手工编制划记表直方图（histogram ）：高度：各组的频数纵轴宽度：组距横轴表示组限均数（average ）：

适用：对称分布或偏度不大的资料，尤其适合正态分布。

1、算术均数（mean ）：n

∑=X X

2、加权均数：n

∑=

X f X

3、几何均数：

n ∑-= X lg lg G 1

，n

∑-=M 1 X lg f lg G

中位数（median ）：观察值按照从小到大排列时，居中心位置的数值。

适用于1、分布明显成偏态时，2、频数分布的一端或两端无确切数值时。不便于统计计算。

f f n 5.0L M M

M ?-+=）（

M ：中位数；L M ：M 所在组的上限；f L ：M 所在组之前积累的频数；f M ：M 所在组的频数；i ：组距。百分位数（percentile ）：Px 。在一组中找到这样一个数值P ，全部观察值的x%小于P 。P 75、P 25描述资料离散程度。

f f x%n L P x

x X ?-?+=）（

众数：一组观察值中，出现频率最高的那个观察值。若为分组资料，则为频率最高组的组中值。适用于大样本，但粗糙。

Chapter 离散程度的统计描述

离散的表述指标：

1、按间距计算：极差、四分位数间距

2、按平均差距：离均差平方和、方差、标准差、变异系数极差（range ，R ）：即全距。粗略。适用于任何分布。

四分位数间距（quartile ，Q ）：一组观察值按大小排序后，分成四个数目相等的段落，每个段落观察值的数目占总例数的25%。去掉两端含有极端数值的25%，取中间的50%的观察值的数据范围即为~。

越大则数据变异越大。适用于偏态分布。 Q=P 75 - P 25

离均差平方和（sum of square of deviation ）：

∑∑∑-==n

X X X -X SS 2

）（）（

方差（variance ）：

样本方差

-n X -X SS

S 2

2∑=

）（ν

总体方差

X -X SS

S 2

2∑=

）（ν

标准差（standard deviations ）：

S S 2

适用于近似正态分布。

p.s.1、可用于合并资料的直接计算

2、与均数结合可以完整概括一个正态分布。

变异系数（CV ）：用于均属相差交大或单位不同的几组数据观察值的比较。

CV=

%100X

? 正态分布（normal distribution ）： 1、正偏态分布：高峰向左，长尾向右负偏态分布：高峰向右，长尾向左。

2、μ和σ是正态分布总体的两个参数，对应样本统计量中的S 和X 。实际应用中μ和σ通常未知，可以将S 和X 作为总体参数的估计量使用。

注意对比：1

-n X -X S

∑=

）（ N

-X 2

∑

=）

（μσ 2、μ是位置参数，σ是变异参数。描述方法：N （μ，σ2）

3、曲线下面积的意义：X 1~X 2出现的概率。 μ±σ 68.3%

μ±1.96σ （单侧μ±1.645σ） 95% μ±2.58σ（单侧μ±2.33σ） 99%

标准正态分布（standard~）：是μ=0，σ=1的正态分布。

对于任何参数为μ、σ的正态分布，都可以通过变量变换转化成标准正态分布：σ

-x u =

。

医学参考值范围（reference value range ）的制定方法： 1、选择足够数量的正常人作为参照样本 2、对选定的参照样本进行准确的测定 3、决定取单侧范围还是双侧范围值 4、选择适当的百分范围 5、估计参考值范围的界限

Chapter 抽样误差与可信区间

中心极限定理：在样本含量很大的情况下（n ≥50），无论样本测量量（X ）服从什么分布，样本均数的抽样分布都近似服从以μ为均数的正态分布N （μ，σ2/n ）

标准误（standard error ）：样本均数X 之间变异的标准差。n

σ=

实际工作中总体标准差σ 未知，，用样本的标准差S 代替：n

S S X =

标准误（公式）的意义： 1、与标准差的联系：在样本含量一定的情况下，标准误与标准差成正比。

（1）当观察值的变异（标准差）较小时，样本均数之间的抽样误差较小，抽到的样本均数与总体均属可能相

差较小，用X 估计μ的可靠性较好

（2）当观察值的变异较大时，样本均数之间的抽样误差较大，抽到的样本均数与总体均属可能相差较大，用X 估计μ的可靠性较差。

2、与样本含量的关系：与其平方根成反比，说明在同一总体中随机抽样，样本含量越大，标准误越小。

3、标准误反映了样本均数间的离散程度，也反映了样本均数与总体均数的差异。

参数估计（parameter estimation ）：指偶那个过样本参数估计总体参数，是统计推断的重要内容之一。常用方法有点估计、区间估计。

点估计（point ~）：使用单一数值直接作为总体参数的估计值。适用于各种资料。

区间估计（interval ~）：按照预先给定的概率计算出一个区间，使它能够包含总体参数。给定的概率（1-α）称为可信度。计算得到的区间称为可信区间（confidence interval ，CI ）

可信区间通常包括两个数值界定的可信限（confidence limit ），分别为上限、下限。

总体均数估计的95%可信区间表示：该区间有95%的概率包含总体均数μ。注意不可以说“总体均数有95%的概率落在这个区间里”。

可信区间估计效果的比较： 1、（1-α）越接近1越好，概率↑ 2、区间宽度越窄越好，精确度↑

但两者是矛盾的。一般选择（1-α）=95%。

t 分布（t distribution ）：是以0为中心的对称分布；当∞→ν时，t 分布的极限分布就是标准正态分布。

在正态分布的总体中进行抽样，

/S -x μ

服从自由度1n -=ν的t 分布。

t 的大小与α、自由度有关。

可信区间的计算：

S ?-να,2/t X （，）X S ?+να,2/t X

若n ≥50，则t 分布接近标准正态分布，则简化

X S ?-2/u X α（，）X S ?+2/u X α

若σ已知，则可简化为

σα?-2/u X （，）X σα?+2/u X

96.1u 05.0=，58.2u 01.0=

Chapter 假设检验

假设检验（hypothesis test ）：目的：比较总体参数有无差别

基本思想：首先对所需比较的总体提出一个无差别的假设，然后通过样本数据推断是否拒绝这一假设。基本方法：反证法和小概率事件。基本步骤：

1、建立假设和确定检验水准

无效假设（null hypothesis ）：H 0：μ=μ0（或μd =0），总体均数无差别。备择假设（alternative ~）：H 0：μ≠μ0（或μd ≠0），总体均数有差别

假设有单侧和双侧两种。应用单侧检验一定要有过硬的专业知识。一般选用双侧检验，因为双侧检验得出

有显著差别的结论，单侧检验结论也一定是显著差别；然而反之不亦然。

检验水准亦称显著性水准（significance level ），用α表示，是预先设定的拒绝域的概率值。一般取0.05。

3、确定P 值、做出统计推断结论

P 值的意义：假设检验下结论的主要依据，指在原假设成立的条件下，观察到的样本差别是由机遇所致的概率。

结论：

1、p<α,样本数据差异显著，有统计学意义，拒绝H 0，接受H 1

2、P>α，样本数据差异不显著，无统计学意义，根据现有样本不足以拒绝H 0（不等于接受H 0）。单样本的t 检验：条件：μ，X ，S ，n

1、H 0：μ=μ0 ，α=0.05，双侧检验

2、t=

/S -x μ

，1n -=ν

3、να,2/t

配对样本t 检验：

条件：n ，指标1、指标2（d ，∑d ，∑d 2） 1、H 0：μd =0，α=0.05 2、t=

S n

d //d S d

∑=

3、να,2/t

成组设计实验的两样本均数比较条件：n1，n2，X 1，X 2，S1，S2 1、H 0：μ1=μ2 ，

2、u=

121

21/S /n S X X n +-

3、96.1u 05.0=，58.2u 01.0=

F 检验：

条件：表格略

1、H 0：各组总体均数相同， H 1：各组总体均数不全相同

2、E

E TR

TR E TR SS SS MS MS F νν//=

=，

v TR =k-1，v E =n-k

3、F 符合自由度为（k-1，n-k ）的F 分布。

F 值接近1，则可认为均值只来源于随机波动。若F>1，且F>F α,(k-1,n-k)，则P<α,……。

假设检验中的两类错误：

1、第一类错误：当H 0为真时，拒绝H 0接受H 1。又称假阳性错误（阳性指两者总体参数有差异）。检验水

准α是预先规定的犯第一类错误的概率的最大值。

2、第二类错误：当H 0为假时，不拒绝H 0。又称假阴性错误。概率大小用β表示，只取单侧，一般未知。可证，α越大β越小，α越小β越越大。若要同时减少第一类错误和第二类错误，唯一方法是增大样本含量。

简单四格表的2

χ检验：

有效无效合计药物1 a b a+b=n1 药物2 c

c+d=n0

合计

a+c=m1 b+d=m0 N

1、H 0：21ππ=，α=0.05

2、1=ν

当n ≥40，且所有T ≥5时，四格表专用公式

)

)()(c )((2

2d b c a d b a n

bc ad ++++-=

）（χ 当n ≥40，但有1

)

)()(c )((1||2

2d b c a d b a n

bc ad ++++--=

）（χ 当n ≤40，或有T ≤1时，使用Fisher 确切概率公式

!!!a )()()c ()(2

n d c b d b c a d b a ！！！！！++++=χ

3、2105.0，χ=3.84，2

101.0，χ=6.63

配对四格表2

χ检验：

对照组病例组

合计有暴露史无暴露史有暴露史 a b a+b=n1 无暴露史 c d c+d=n0 合计

a+c=m1

b+d=m0

1、H 0：21ππ=，α=0.05

2、1=ν

，

当b+c ≥40时，c

b c -b 2

+=）

（χ

当b+c <40时，c

b 1|

c -b |2

+-=）（χ

3、2105.0，χ=3.84，2

101.0，χ=6.63

行*列资料的2

χ检验：

有效无效合计药物1 a b n1 药物2 c d n2 药物3 e f n3 合计

1、H 0：各组有效率相同， H 1：各组有效率不全相同

2、）（1n n A n C

R 2

-=∑

χ， =ν（行数-1）（列数-1）

3、2

ναχ，

Chapter 相对数及其应用

相对数（relative number ）：是两个有关的据对数之比，也可以是两个有关的统计指标之比。常用的有：率、

比值比、构成比。

率（rate ）：表示在一定的范围内某现象的发生数与可能发生的总数之比。构成比（constitute ratio ）：表示某事物内部组成部分在总体中的比重。

相对比（relative ratio ）：A 、B 两有关联的指标之比，用以描述两者的对比水平。如RR 。

研究生医学统计学试题

试卷编号：卷课程名称：医学统计学适用专业：科学学位专业：班级姓名：学号：学院 (系 )：考试日期：题号一二三四五六七八九十总分统分题分30152530100签名得分考生注意事项： 1、本试卷共6 页，请查看试卷中是否有缺页或破损。如有立即举手报告以便更换。 2、考试结束后，考生不得将试卷、答题纸和草稿纸带出考场。一、最佳选择题(每题 2 分，共 30 分) 得评阅把每题的答案填入下表中： 123456789101112131415 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势，以指标为好。 A. 算术平均数； B. 几何平均数； C. 中位数； D. 变异系数 2、比较成人身高和儿童身高的离散趋势，宜用。 A. 标准差； B. 变异系数； C. 方差； D. 离均差平方和 3、对于正态分布资料，X +1.96S，所对应的面积占总面积的。 A. 95% ； B. 99% ； C. 47.5%； D. 49.5% 4、下列说法哪个是错误的？中位数适用于描述资料。 A. 最小组段无下限； B. 最大组段无上限； C. 偏态分布； D. 正态分布 5、大，表示用该样本均数估计总体均数的可靠性小。 A. S X； B. S； C.CV； D. Q U—Q L 6、某地 1992年随机抽取 100名健康女性，算得其血清总蛋白含量的均数为74g/L ，标准差为 4g/L ，则其 95%的可信区间为。

7、两样本均数比较的t 检验，分别取以下检验水准，以所取第二类错误最大。 A. α =0.01； B. α=0.05； C. α =0.10； D.α=0.20 8、两样本均数比较的t 检验结果， P<0.05 ，可认为。 A. 两样本均数不等； B. 两样本均数相等； C. 两总体均数不等； D. 两总体均数相等 9、完全随机设计的方差分析结果，P≤ 0.05，可认为。 A. 各样本均数不等或不全等； B. 各样本均数都不相等； C. 各总体均数不等或不全等； D. 各总体均数都不相等 10、某地某年肝炎发病人数占总人数的5%，这是该地该年肝炎的。 A. 年发病率； B. 年患病率； C. 患病构成比； D. 患者平均数 11、已知甲县人口较乙县年青，今欲比较两县死亡率的高低，适当的比较方法是。 A.将两县的总死亡率直接比较； B.对年龄进行标准化后，再比较两县总死亡率； C.将两县的总死亡率进行 t 检验后再比较； D.将两县的总死亡率进行χ2检验后再比较 12、下面哪一点不是Poisson 分布的性质。 A. λ =σ2； B. 当λ≥ 20 时，近似正态分布； C. 可加性； D. 相互影响性 13、χ2检验中理论数T 的计算式为。 A. n r (1 n c ) ； B. (1 n r ) n c； C. n r n c； D. n r n c N N N N 14、已知两组计量资料方差不齐，可用检验。 A. t 检验； B. U 检验； C. F 检验； D. 秩和检验 15、对一组既做相关分析又做回归分析的资料，有。 A. b=r ； B. t b=t r； C. b=a； D. r=1

(完整版)医学统计学第六版课后答案

第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果，需要对其进行统计描述和统计推断，统计描述可以使数据更容易理解，统计推断则可以使用概率的方式给出结论，两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律，使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率，并使结果更加准确和可靠，数据整理主要是对数据进行归类，检查数据质量，以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征，统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图，统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标，由样本数据计算得到，参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生，随机测量误差是生物体的自然变异和各种不可预知因素产生的误差，抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

医学统计学基本概念

习题-医学统计学基本概念选择题： 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压，调查某地1000 人，记录每人是否患有高血压。最后清点结果，其中有10 名高血压患者，有990 名非高血压患者。（） A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指（） A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是（） A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级（轻、中、重） E.疾病疗效（有效、无效） 4、总体是由（） A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是（） A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是（） A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样，下列哪一项说法是正确的（） A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体，以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性，样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是（） A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是：() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

医学统计学试题及答案

医学统计学试题及答案集团文件发布号：（9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案习??题《医学统计学》第二版??（五年制临床医学等本科生用）（一）??单项选择题 1．观察单位为研究中的( d??)。 A．样本? ?? ??B. 全部对象 C．影响因素? ?? ?????D. 个体2．总体是由（ c ）。 A．个体组成? ?? ?B. 研究对象组成 C．同质个体组成? ?? ? D. 研究指标组成 3．抽样的目的是（b??）。 A．研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C．研究典型案例研究误差? ???D. 研究总体统计量 4．参数是指（b? ?）。 A．参与个体数? ???B. 总体的统计指标 C．样本的统计指标? ? ??D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变? ?? ? B.均数改变，标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a??）。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中（? ?d）可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用（? ?c）描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（? ?b）不变。 A．算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.（ a??）分布的资料，均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种（ c ）分布。

2001级研究生医学统计学试卷

2001级研究生卫生统计学试卷 2002.1.5. 姓名学号得分一．选择题：（每小题2分，共30分）（ d ）1.在众多的变异指标中，有一种可以用以比较单位不同的两组定量资料（同一组内的数据单位相同）的变异性大小，它就是：（A）标准差（B）相关系数（C）标准误（D）变异系数（d ）2.在进行显著性检验时，通常要先给定α值，根据样本数据计算出某统计量的值之后便可计算出一个p值来。可以说α值与p值之间有如下关系：（A）p=2α（B）p=α （C）p与α值在数量上有关，但无法简单地将其表达出来（D）p与α值在数量上无关，但可按它们之间的大小作出统计推断（ d ）3.有些人在处理定量资料时习惯于用多次t检验代替方差分析和两两比较，这样做将会导致：（A）计算量增大（B）假阴性错误率增大（C）试验误差大（D）假阳性错误率增大（ b ）4.为了解两种治疗方法对原发性肝癌的疗效，随机把病人分成两组，一组用5-氟尿嘧啶+辅助治疗，另一组用安慰剂+辅助治疗。治疗结果按缓解、死亡划分。第一组12人，7人缓解、5人死亡；第二组11人，4人缓解、7人死亡，要分析两种疗法的治疗效果之间的差别有无显著性意义，应选用的统计方法是：（A）χ2检验（B）Fisher的精确概率（C）t检验（D）秩和检验（a ）5.某医生测得男、女各50人淋巴细胞计数L（%）（即占白细胞数的百分比），想用成组设计资料的t检验分析男、女两性之间的差别有无显著性意义，在作检验前最好对数据作（）变换。（A）平方根（B）对数（C）平方根反正弦（D）倒数（ a ）6.有5份血清的抗体效价分别为：1:80、1:20、1:320、1:40、1:640，最合适反映此资料平均水平的指标是：（A）几何均数（B）算术均数（C）中位数（D）标准差（ b ）7.若分析肺活量和身高之间的数量关系，拟用身高值预测肺活量值，则采用（A）相关分析（B）直线回归分析（C）方差分析（D）χ2检验（ c ）8.用二项分布直接计算概率法检验，H0：π=0.45，H1：π<0.45，当随机样本含

医学统计学试题及答案

《医学统计学》课程考试试题（A卷）（评卷总分：100分，考试时间：120分钟，考核方式：□开卷 V 闭卷）一、选择题（每题1分，共62分，只选一个正确答案） 1、医学科研设计包括（ D ） A．物力和财力设计 B．数据与方法设计 C．理论和资料设计 D．专业与统计设计 2、医学统计资料的分析包括（ D ） A．数据分析与结果分析 B．资料分析与统计分析 C．变量分析与变量值分析 D．统计描述与统计推断 3、医学资料的同质性指的是（ D ） A．个体之间没有差异 B．对比组间没有差异 C．变量值之间没有差异 D．研究事物存在的共性 4、离散型定量变量的测量值指的是（ D ） A．可取某区间内的任何值 B、可取某区间内的个别值 C．测量值只取小数的情况 D．测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是（ A ） A．无序二分类变量 B、定量变量． C．等级变量 D．无序多分类变量 6、计量资料编制频数表时，组距的选择（ D ） A．越大越好 B．越小越好 C．与变量值的个数无关 D．与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选（ D ）A．极差 B．方差 C．标准差 D．变异系数 8、若要用方差描述一组资料的离散趋势，对资料的要求是（ D ）A．未知分布类型的资料 B．等级资料 C．呈倍数关系的资料 D．正态分布资料 9、频数分布两端没有超限值时，描述其集中趋势的指标也可用（ D ） A．标准差 B．几何均数 C．相关系数 D．中位数 10、医学统计工作的步骤是（ A ） A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析，统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法，其正确的是（ A ） A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间（小时）分别为3, 4，5，3，2，5.5，2.5，6，6.5, 7,其中位数是（ B ） A．4 B．4.5 C．3 D．2 13、调查一组正常成年女性的血红蛋白，如果资料属于正态分布，描

医学统计学课后答案.

第二章 1.答：在统计学中用来描述集中趋势的指标体系是平均数，包括算术均数，几何均数，中位数。均数反映了一组观察值的平均水平，适用于单峰对称或近似单峰对称分布资料的平均水平的描述。几何均数：有些医学资料，如抗体的滴度，细菌计数等，其频数分布呈明显偏态，各观察值之间呈倍数变化(等比关系)，此时不宜用算术均数描述其集中位置，而应该使用几何均数（geometric mean ）。几何均数一般用G 表示，适用于各变量值之间成倍数关系，分布呈偏态，但经过对数变换后成单峰对称分布的资料。中位数和百分位数：中位数（median ）就是将一组观察值按升序或降序排列，位次居中的数，常用M 表示。理论上数据集中有一半数比中位数小，另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述，也适用于开口资料的描述。所谓“开口”资料，是指数据的一端或者两端有不确定值。百分位数（percentile ）是一种位置指标，以P X 表示，一个百分位数P X 将全部观察值分为两个部分，理论上有X ％的观察值比P X 小，有（100-X ）％观察值比P X 大。故百分位数是一个界值，也是分布数列的一百等份分割值。显然，中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答：常用来描述数据离散程度的指标有：极差、四分位数间距、标准差、方差、及变异系数，尤以方差和标准差最为常用。极差（range ，记为R ），又称全距，是指一组数据中最大值与最小值之差。极差大，说明资料的离散程度大。用极差反映离散程度的大小，简单明了，故得到广泛采用，如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是：1.不灵敏； 2.不稳定。四分位数间距（inter-quartile range ）就是上四分位数与下四分位数之差，即：Q ＝Q U －Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似，数值大，说明变异度大；反之，说明变异度小。常用于描述偏态分布资料的离散程度。极差和四分位数间距均没有利用所研究资料的全部信息，因此仍然不足以完整地反映资料的离散程度。方差（variance ）和标准差（standard deviation ）由于利用了所有的信息，而得到了广泛应用，常用于描述正态分布资料的离散程度。变异系数（coefficient of variance ，CV ）亦称离散系数（coefficient of dispersion ），为标准差与均数之比，常用百分数表示。变异系数没有度量衡单位，常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答：常用的相对数指标有：比，构成比和率。比（ratio ），又称相对比，是A 、B 两个有关指标之比，说明A 为B 的若干倍或百分之几，它是对比的最简单形式。其计算公式为比＝A /B 率(rate)又称频率指标，用以说明某现象发生的频率或强度。常以百分率(％)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为：）比例基数（单位总数可能发生某现象的观察单位数实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标，它说明一种事物内部各组成部分所占的比重或

流行病学与医学统计试题及答案【通用】.doc

全科岗位培训统计与流行病学试题单位学号姓名得分请从A、B、C、D、E 5个备选答案中选择一个正准答案。 1.下面的变量中，属于定性变量的是（B） A.脉搏 B.血型 C.肺活量 D.身高 E.体重 2.下面的变量中，属于定量变量的是（D） A.种族 B.性别 C.职业 D.血压 E.白细胞分类 3.关于统计量的描述，正确的是（C） A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是由样本数据计算出的统计指标 D.总体中信息明确的一部分 E.总体参数的估计值 4.常见的统计资料类型包括（E） A.定量资料 B.分类资料 C. A和B都是 D. A和B都不是 E.定量资料、分类资料、等级资料 5.如果在区域卫生规划中，随机调查了10个社区服务中心的资料，其中有8个已经实现了规划目标，达到80％规划完成率，该资料属于（C） A.定量资料 B.总体资料 C.分类资料 D.等级资料 E.无法判断 6.统计工作的基本步骤包括（D） A.设计、分析 B.收集、整理 C. A和B都不是 D. A和B都是 E.数据分析与整理 7.按随机化原则抽取的样本对总体有较好的（E） A.典型性 B.随意性 C.控制性 D.限制性 E.代表性 8.用图表示某地区近30年三种疾病的发病率在各年度的动态发展速度情况，应绘制（B） A.普通线图 B.半对数线图 C.直条图 D.直方图 E.百分条图 9.下列属于描述定量变量集中趋势的指标是（A） A.几何均数 B.全距 C.标准差 D.百分位数 E.四分位数间距）的条件下，样本标准差的大小（D） 10.在服从正态分布N（μ，2

A.与集中趋势有关 B.与观察例数无关 C.与算术均数有关 D.与个体的变异程度有关 E.以上都不对 11.编制频数表的时候要求（C） A.组距一定要相等 B.组段越多越好 C.组距不一定要相等 D. A和B都是 E. B和C都是 12.如果一组数据没有起始值或者截尾值，应该用什么描述其集中趋势（E） A.几何均数 B.算术均数 C.百分位数 D.标准差 E.中位数 13.四分位间距适用于何种资料（D） A.偏态分布 B.正态分布 C.对称分布 D.任何分布 E.对数正态分布 14.对于临床上计算尿铅的95%正常值可用哪个百分位数表示（A） A. P0～P95 B. P2.5～P97.5 C. P5～P95 D. P5～P100 E. P5～P95 15.一般比较婴儿和成人的体重变异度大小用哪个指标好（A） A.变异系数 B.方差 C.标准差 D.标准误 E.离均差平方和 16.某地疾病构成情况应该画（C） A.直方图 B.线图 C.百分条图或圆图 D.直条图 E.半对数线图 17.现测得10名乳腺癌患者化疗后血清尿素氮含量（mmol/L）分别为3.25，3.96， 4.38，4.01， 5.16，4.21，3.78，4.05，4.17，4.12，其均数、中位数为（E） A. 2.55，3.22 B. 3.67，3.98 C. 4.03，4.52 D. 4.22，4.23 E. 4.11，4.085 18.下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度，用何种指标比较手术前后数据的变异情况较为合适（E）手术前后患者血催乳素浓度（ng/ml）例号血催乳素浓度例号血催乳素浓度术前术后术前术后 1 276 41 6 266 43 2 880 110 7 500 25 3 1600 280 8 1760 300 4 324 61 9 500 215 5 398 105 10 220 92 A.标准差 B.四分位数间距 C.方差 D.全距 E.变异系数 19.现有某病患者200人，其中儿童20人，成年人180人，分别占10％和90％，则（E）

流行病学与医学统计学

流行病学一、流行病学概述 1、流行病学主要是研究疾病和健康状态和事件在人群中的分布和影响分布的因素以及防制对策的学科。流行病学与临床医学的区别在于研究疾病的病因学。 2、疾病的分布：以疾病的频率为指标，描述疾病在不同人群、不同时间、不同地点的分布现象。（简称疾病的三间分布）。（1）研究疾病分布的意义：获得与病因假设有关的资料及与流行因素有关的资料；判断疾病的传染性；疾病流行规律和特点；可为分析流行病学研究提供基础信息（2）时间分布特征：短期波动；季节性；周期性；长期变异。（3）地区分布的表现形式：全球性（世界性）；地方性(endemic)；局部地区分布。研究疾病的地区分布时可按自然因素的差异、社会因素的差异、行政区划的不同来分析、国家间、国内和城乡间的不同来分析。二、流行病学常用的指标 1、率（rate ）：表示在一定条件下某现象实际发生的例数与可能发生该现象的总例数之比，来说明单位时间内某现象发生的频率或强度。 2、比(ratio) ：两个数相除所得的值，说明两者的相对水平，常用倍数或百分比表示。 3、构成比(proportion)：说明某一事物内部各组成部分所占的比重或分布，常以百分数表示。 4、反映发病及患病水平的指标：（1）发病率：表示一定期间内（通常1年）特定人群中发生某病新病例出现的频率。（2）患病率：亦称现患率，流行率。特定时间内一定人群中某病新旧病病例数所占的比例。（3）罹患率(attack rate)：在某一局限范围，短时间内的发病率。 k ?=同时期暴露人口数某病新病例数一定期间内的某人群中发病率 k ?=同期观察人口数病新旧病例数特定时间内某人群中某患病率患病率与发病率的区别比较项目患病率发病率分子新旧病例总和新发病例数获得渠道横断面调查发病报告或队列研究指标性质静态指标动态指标

医学统计学研究生题库

医学统计学复习练习题库研究生教材使用一、最佳选择题 1．卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2．统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3．统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4．抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6．描述一组偏态分布资料的变异度，宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距

E.方差

7．用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8．比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9．频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10．正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11．正态分布曲线下右侧5％对应的分位点为 A.μ+1.96σ B.μ-1.96σ C.μ+2.58σ D.μ+1.64σ E.μ-2.58σ 12．下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13．某种人群（如成年男子）的某个生理指标（如收缩压）或生化指标（如血糖水平）的正常值范围一般指 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 14．下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. x s x μ- 2．统计分析的主要内容有

医学统计学课后答案解析

第二章 1?答：在统计学中用来描述集中趋势的指标体系是平均数，包括算术均数，几何均数，中位数。均数反映了一组观察值的平均水平，适用于单峰对称或近似单峰对称分布资料的平均水平的描述。几何均数：有些医学资料，如抗体的滴度，细菌计数等，其频数分布呈明显偏态，各观察值之间呈倍数变化（等比关系），此时不宜用算术均数描述其集中位置，而应该使用几何均数（geometric mean）。几何均数一般用G表示，适用于各变量值之间成倍数关系，分布呈偏态，但经过对数变换后成单峰对称分布的资料。中位数和百分位数：中位数（median）就是将一组观察值按升序或降序排列，位次居中的数，常用M表示。理论上数据集中有一半数比中位数小，另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述，也适用于开口资料的描述。所谓开口”资料，是指数据的一端或者两端有不确定值。百分位数（percentile）是一种位置指标，以P X表示，一个百分位数P X将全部观察值分为两个部分，理论上有X%的观察值比P X小，有（100-X）%观察值比P X大。故百分位数是一个界值，也是分布数列的一百等份分割值。显然，中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答：常用来描述数据离散程度的指标有：极差、四分位数间距、标准差、方差、及变异系数，尤以方差和标准差最为常用。极差（range,记为R）,又称全距，是指一组数据中最大值与最小值之差。极差大，说明资料的离散程度大。用极差反映离散程度的大小，简单明了，故得到广泛采用，如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是：1?不灵敏；2?不稳定。四分位数间距（inter-quartile range）就是上四分位数与下四分位数之差，即：Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似，数值大，说明变异度大；反之，说明变异度小。常用于描述偏态分布资料的离散程度。极差和四分位数间距均没有利用所研究资料的全部信息，因此仍然不足以完整地反映资料的离散程度。方差（variance）和标准差（standard deviation）由于利用了所有的信息，而得到了广泛应用，常用于描述正态分布资料的离散程度。变异系数（coefficient of variance , CV）亦称离散系数（coefficient of dispersion ）, 为标准差与均数之比，常用百分数表示。变异系数没有度量衡单位，常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答：常用的相对数指标有：比，构成比和率。比（ratio）,又称相对比，是A、B两个有关指标之比，说明A为B的若干倍或百分之几，它是对比的最简单形式。其计算公式为比二A/B 率（rate）又称频率指标，用以说明某现象发生的频率或强度。常以百分率（%）、千分率（%。）、万分率（1/万）、十万分率（1/10万）等表示。计算公式为：率.= 实际发生某现象的观察单位数迸比例基数（K）可能发生某现象的观察单位总数构成比（proportion）又称构成指标，它说明一种事物内部各组成部分所占的比重或

第五章流行病学和医学统计学基本知识练习

第五章流行病学和医学统计学基本知识练习(一) 单选题 1.比较身高和体重两组数据变异度大小宜采用() A变异系数 B方差 C极差 D标准差 2.用某种诊断方法判断为阳性的人中,实际有病的人所占的比例称() A.灵敏度 B特异度 C阳性预测值 D阴性预测值 3.-组变量值的标准差将() A.随变量值的个数n的增大而增大 B随变量值的个数n的增加而减小 C随变量值之间的变异增大而增大 D随系统误差的减小而减小 4.各观察值均加(或减)一个常数后() A均数不变,标准差改变 B均数改变,标准差不变 C两者均不变 D两者均改变多选题 1.对一项新的诊断试验进行研究和评价时,其评价标准应注意() A同金标准诊断方法进行同步盲法比较B有足够的样本量 C诊断界值的确定要合理 D要评价真实性和可靠性 E注意研究对象的代表性 2.下列属于描述性研究方法的有() A病例对照研究 B队列研究 C现况研究D筛检 E生态学研究 3.筛检的主要用途() A诊断疾病 B治疗疾病 C预防疾病 D开展监测 E了解疾病自然史 4.绘制统计图的基本要求有() A.要有标题,位于图体下方中央位置B绘制有坐标轴的图形纵横轴要有标目 C要有备注 D同一张图内比较要用不同颜色或样式的线条E纵横轴比列以5:7为宜5.以下哪些为分析性研究() A生态学研究B横断面研究 C病例对照研究D社区干预试验

E队列研究6.对统计推断的假设检验说法正确的是() A.是统计推断的核心 B利用一个样本信息判断另一个样本特征 Ct检验、方差分析属参数检验 D秩和检验属非参数检验 E把需要判断的总体特征称作假设 7.流行病学的主要特征有() A.群体特征B以分布为起点的特征C社会医学的特征D对比的特征E预防为主的特征 8.一般来说哪些疾病可进行筛检() A.对该疾病可采用有效的第三级预防措施 B人群患病率高 C易于诊断但无治疗方法的疾病 D借医学干预能改变自然史的疾病E°检程序比较复杂 9.发病率常用于() A.评价慢性病的控制效果 B反映得病的风险C描述疾病的分布 D探讨发病因素 E提出病因假设 10.描述变量值集中趋势的统计学指标包括D评价疾病的防治效果 A算术平均数 B调和平均数C中位数 D几何平均数 E百分位数 11.下面关于实验性研究的说法正确的是() A实验性研究属于前瞻性研究 B与观察性研究根本的不同之处是有人为干预措施 C某种疾病的危险因素分布广泛不易确定高危人群时需采用社区试验 D研究对象可以进行随机分组 E通常设有对照组 12.关于队列研究的叙述,下列哪些选项是正正确的是() A前瞻性队列研究的观察方向是从“因”到果 B历史性队列研究的观察方向是从“因”到果 C历史性队列研究的观察方向是从“果”到因 D历史性队列研究的“因”与“果”同时出现 E历史性队列研究的“因”与“果”可能都已存在 13.以下属于计量资料的有() A.身高 B体重 C血细胞计数 D某病阳性人数 E心电图 14.现况调查的目的和用途有() A描述疾病的分布特点 B早期发现病人 C直接验证病因假设E治疗病人 15.医学统计工作的基本步骤包括()

医学统计学第二版高等教育出版社课后习题答案剖析

第一章绪论 1.举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体，这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值（即变量值）的集合，通常有无限总体和有限总体之分，前者指总体中的个体是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体是有限的，它是指特定时间、空间中有限个研究个体。但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中，该地2007年全部正常成年男子的红细胞数就构成一个总体，从此总体中随即抽取2000人，分别测的其红细胞数，组成样本，其样本含量为2000人。 2.简述误差的概念。误差泛指实测值与真实值之差，一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差；非随机误差中最常见的为系统误差，系统误差也叫偏倚，是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的，而参数是他们想知道的。一般情况下，这些参数是难以测定的，仅能够根据样本估计。显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。当某事件发生的概率小于或等于0.05时，统计学上习惯称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就

【名师精品】健康管理师练习题：第五章流行病学和医学统计学基本知识

第五章流行病学和医学统计学基本知识 1队列研究属于以下哪种流行病学研究方法() ?A描述性研究 ?B分析性研究 ?C实验性研究 ?D理论性研究 2下列哪一条是队列研究的缺点() ?A样本代表性差，易产生选择性偏倚 ?B不能计算发病率 ?C不适用于罕见病的研究 ?D暴露测量不可靠，易产生信息偏倚 3一组变量值的标准差将() ?A随变量值的个数N的增大而增大 ?B随变量值的个数N的增加而减小 ?C随变量值之间的变异增大而增大 ?D随系统误差的减小而减小 4关于流行病学，下面错误的说法是() ?A它的研究对象是人群 ?B它属于预防医学的范畴 ?C它已深入临床医学的研究中 ?D它只研究传染病 5对一项新的诊断试验进行研究和评价时，其评价标准应注意() ?A同金标准诊断方法进行同步盲法比较

?B有足够的样本量 ?C诊断界值的确定要合理 ?D要评价真实性和可靠性 ?E注意研究对象的代表性 6将未患某病而有或无暴露因素的人群作为研究对象，其研究是() ?A队列研究 ?B病例对照研究 ?C现况研究 ?D普查 7病例对照研究的特点主要有() ?A研究开始时已有一批可供选择的病例 ?B研究对象按发病与否分成病例组与对照组 ?C被研究因素的暴露状况是通过回顾获得的 ?D是由因及果的推理顺序 ?E经两组暴露率或水平比较，分析暴露与疾病的联系 8一般来说哪些疾病可进行筛检() ?A对该疾病可采用有效的第三级预防措施 ?B人群患病率高 ?C易于诊断但无治疗方法的疾病 ?D借医学干预能改变自然史的疾病 ?E筛检程序比较复杂 9一项病例对照研究，400名病例中有暴露史者200例，而400名对照中有暴露史者100例，有暴露史的发病率()

研究生医学统计学试题

南昌大学医学院硕士生试卷试卷编号：卷课程名称：医学统计学适用专业：科学学位专业：班级姓名：学号：学院 (系 )：考试日期：题号一二三四五六七八九十总分统分题分 30 15 25 30 100 签名得分考生注意事项： 1、本试卷共 6 页，请查看试卷中是否有缺页或破损。如有立即举手报告以便更换。 2、考试结束后，考生不得将试卷、答题纸和草稿纸带出考场。一、最佳选择题 (每题 2 分，共 30 分) 得评阅把每题的答案填入下表中： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势，以指标为好。 A. 算术平均数； B. 几何平均数； C. 中位数； D. 变异系数 2、比较成人身高和儿童身高的离散趋势，宜用。 A. 标准差； B. 变异系数； C. 方差； D. 离均差平方和 3、对于正态分布资料， X +1.96S ，所对应的面积占总面积的。 A. 95% ； B. 99% ； C. 47.5%； D. 49.5% 4、下列说法哪个是错误的？中位数适用于描述资料。 A. 最小组段无下限； B. 最大组段无上限； C. 偏态分布； D. 正态分布 5、大，表示用该样本均数估计总体均数的可靠性小。 A. S X ； B. S ； C.CV ； D. Q U —Q L 6、某地 1992 年随机抽取 100 名健康女性，算得其血清总蛋白含量的均数为 74g/L ，标准差为 4g/L ，则其 95%的可信区间为。

医学统计学课后习题答案(第2版高等教育出版社)

医学统计学课后习题答案(第2版高等教育出版社) 第一章绪论 1.举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体，这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值（即变量值）的集合，通常有无限总体和有限总体之分，前者指总体中的个体是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体是有限的，它是指特定时间、空间中有限个研究个体。但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中，该地2007年全部正常成年男子的红细胞数就构成一个总体，从此总体中随即抽取2000人，分别测的其红细胞数，组成样本，其样本含量为2000人。 2.简述误差的概念。误差泛指实测值与真实值之差，一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差；非随机误差中最常见的为系统误差，系统误差也叫偏倚，是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的，而参数是他们想知道的。一般情况下，这些参数是难以测定的，仅能够根据样本估计。显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时，统计学上习惯称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就是所谓的小概率事件原理，它是进行统计推断的重要基础。第二章调查研究设计 1.调查研究主要特点是什么？调查研究的主要特点是：①研究的对象及其相关因素（包括研究因素和非研究因素）是客观存在的，不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。（1）单纯随机抽样优点是：均数（或率）及标准误的计算简便。缺点是：当总体观察单位数较多时，要对观察单位一一编号，比较麻烦，实际工作中有时难以办到。（2）系统抽样优点是：①易于理解，简便易行②容易得到一个按比例分配的样本，由于样本相应的顺序号在总体中是均匀散布的，其抽样误差小于单纯随机抽样。缺点是：①当总体的观察单位按顺序有周期趋势或单调递增（或递减）趋势，系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形，一旦确定了抽样间隔，就必须严格遵守，不能随意更改，否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差，因此这样计算得到的抽样误差一般偏大。（3）分层抽样优点是：①减少抽样误差：分层后增加了层内的同质性，因而观测值的变异度减小，各层的抽样误差减小，在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用

医学统计学课后习题与答案

医学统计学第一章绪论答案名词解释：（1）同质与变异：同质指被研究指标的影响因素相同，变异指在同质的基础上各观察单位（或个体）之间的差异。（2）总体和样本：总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。（3）参数和统计量：根据总体个体值统计算出来的描述总体的特征量，称为总体参数，根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。（4）抽样误差：由抽样造成的样本统计量和总体参数的差别称为抽样误差。（5）概率：是描述随机事件发生的可能性大小的数值，用p表示（6）计量资料：由一群个体的变量值构成的资料称为计量资料。（7）计数资料：由一群个体按定性因数或类别清点每类有多少个个体，称为计数资料。。（8）等级资料：由一群个体按等级因数的级别清点每类有多少个体，称为等级资料。是非题： 1.× 2.× 3.× 4.× 5.√ 6.√ 7.× 单选题： 1.C 2.E 3.D 4.C 5.D 6.B 第二章计量资料统计描述及正态分布答案名词解释： 1. 平均数是描述数据分布集中趋势（中心位置）和平均水平的指标 2. 标准差是描述数据分布离散程度（或变量变化的变异程度）的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布，这种正态分布称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围，医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题： 1.计量，计数，等级

2. 设计，收集资料，分析资料，整理资料。 3. σ μχ-=u （变量变换）标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. σμ96.1± σμ58.2± 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 （0.1） 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础，合理分组 16. 均数，均数，μ，σ，规律性 17. 标准差 18. 单位不同，均数相差较大是非题： 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题： 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B 问答题： 1．均数﹑几何均数和中位数的适用范围有何异同？答:相同点,均表示计量资料集中趋势的指标。不同点:表2-5.