当前位置：文档之家› 医学统计学概念

医学统计学概念

医学统计学：运用概率论、数理统计的原理和方法，结合医学实践，进行科学推断的一门应用统计学。侧重于人的生物学、医学方面，没有生物学研究的面宽。但是，它对病人和病种的选择具有临床医学的特点，例如：极重病例和轻型病例不宜作实验对象。

生物统计学：是以动物、植物、微生物为主要研究对象，渗透到工业、农业、医学等领域，比医学统计研究的面更宽。研究的侧重点是生物因素。

卫生统计学：侧重于研究人群健康状况及卫生事业管理方面的数据搜集、整理和分析。其研究目的旨在为确定卫生方针政策，加强卫生事业的管理，为评价卫生措施的效果提供依据。

正常人：不是指任何器官、组织的形态、机能都正常的人，而是指排除了有关疾病和因素对所研究指标有影响的同质人群为正常人。

计量资料：用定量的方法测定观察单位某项指标量的大小的资料。其特点，每个观察单位有度量衡单位，如身高(cm)、体重( kg )、浓度（mg/L )等，其分布为连续型的，常用的指标有平均数、标准差、标准误等。

计数资料：将观察单位按某种属性或类别分组计数，得到各组观察单位的个数。此类资料为间断型，常用相对数（率、构成比、相对比）等相对指标描述。

等级资料（或半定量资料）：将观察单位按某种属性的不同程度分组计数，得到各组的单位数（每个单位未确切定量）。其典型特点就是有顺序性。

总体（Population）：是根据研究目的确定的同质研究对象的全体, 即性质相似研究对象中所有观察单位某种变量值的集合。

样本(Sample) ：是在总体中随机抽取的有代表性的一部分。

参数（Parameter）：是根据总体分布特征而计算的总体数值，以描述总体分布特征。如:σ、π等。

统计量（Statistic）：根据样本分布特征而计算得到的数值（指标），如：S、P 等。指标：是衡量研究结果的标志。如平均数、发病率、治愈率等。

概率：又称机率或然率，是指某事件在一定时间、地点、条件下发生的可能性大小的度量。0为不可能事件，1为必然事件。

频率：样本的实际发生率，设在相同条件下，独立重复进行n次试验，事件A出现f次，则事件A出现的频率为f/n.样本频率总是围绕概率上下波动，样本含量n越大，波动幅度越小，频率越接近概率。

平均数（average）：统计学用平均数这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有算术平均，几何平均和中位数。

均数（mean）：算数均数简称均数，可用于反映一组呈对称分布的变量值在数量上的平均水平。

几何均数（geometric mean）：可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平，在医学上常适用于免疫学的指标。

中位数（median）：是将n个变量值从小到大排列，位置居于中间的那个数。当n为奇数时取位次居中的变量值，当n为偶数时取位次居中的两个变量值的均数。它适用于各种分布类型的资料，尤其是偏态分布资料和一端或两端无确切数值的资料。

百分位数（percentile）：是一种位置指标，用Px来表示，读作第X百分位数。一个百分位数Px将全部变量值分为两部分，在Px处若无相同变量值，则在不包含Px的全部变量值有X%的变量值小于它，（100-X）%变量值大于它。故百分位数是一个界值，其重要用途是确定医学参考值范围。中位数实际上是第50百分位数。

全距（极差）：极差即一组变量值的最大值与最小值之差。但极差不能反映所有数据的变异大小且极差受样本含量n的影响较大。

方差：离均差平方和除以N，就得到了方差，方差（variance）也称均方差(mean square deviation)反映一组数据的平均离散水平。

标准差（standard deviation）：是方差的正平方根，其单位与原变量值的单位相同。

变异系数（coefficient of variation)：记为CV，多用于观察指标单位不同时，如身高与体重的变异程度的比较，或均数相差较大时，如儿童身高与成人身高变异程度的比较。

抽样误差(Sampling Error)：是同质的生物个体，不可避免的存在个体差异，使其样本指标的数值与总体指标的数值有差异。抽样误差是用抽样方法，在抽样过程中形成和产生的误差叫抽样误差。这种误差客观存在，无法避免，但有一定的规律可循

标准误（standard error of mean）：样本均数的标准差称为标准误。它反映样本均数间的离散程度，也反映样本均数与相应总体均数间的差异，因而说明了均数抽样误差的大小。

可信区间（confidence level）：从固定样本含量的已知总体中进行重复随机抽样试验，根据每个样本可算得一个可信区间

参数估计：是指用样本指标值（统计量）推断总体指标值（参数）。参数估计有点估计和区间估计两种方法。

假设检验：过去称显著性检验（signifecance test）它是利用小概率反证法思想，从问题的对立面（H0）出发间接判断要解决的问题（H）是否成立。即在假设H0成立的条件下计算检验统计量，然后根据获得的P值来判断。

第一类误差（type 1 error）：拒绝了实际上成立的H0，这类弃真的错误称为1型错误。概率大小也可用a表示。

第二类误差（type 2 error)：接受了实际上不成立的H0，这类取伪的错误称为2型错误。其概率大小用表示。

t分布：若X为服从标准正态分布N（0,1）的随机变量，则证明了t=X--u除以Sx-服从自由度v=n-1的t分布（t-distribution）曲线以0为中心，两边对称。曲线的变化与自由度v有关。V趋于无穷大时，t分布趋向标准正态分布。

相关系数（r）：说明两个有直线关系的双变量（x、y）间相关方向和密切程度的指标。

回归系数（b)：说明两个有直线关系的双变量（x、y）斜率关系的指标。

计量资料描述的两大趋势：集中趋势（平均水平指标）和离散趋势（离散程度指标）。

分类变量资料的统计描述：常用指标－相对数（率、构成比、相对比），二项分布和poisson 分布（含U检验、确切概率法）。

统计推断：参数估计，假设检验

等级资料：平均数\相对数（H-检验、秩和检验等）

方差分析

总变异：全部测量值大小不同，这种变异称为总变异。总变异的大小可以用离均差平方和(sum of squares of deviations from mean，SS)表示，即各测量值Xij与总均数差值的平方和，记为SS总。总变异SS总反映了所有测量值之间总的变异程度。

组间变异：各处理组由于接受处理的水平不同，各组的样本均数也大小不等，这种变异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示，记为SS组间。

组内变异：在同一处理组中，虽然每个受试对象接受的处理相同，但测量值仍各不相同，这种变异称为组内变异（误差）。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示，记为SS组内, 表示随机误差的影响。

常用相对数

强度相对数：说明某现象发生的频率或强度，又称为率。常以百分率（%）、千分率（‰）、万分率（1/万）、十万分率（1/10万）等表示。率=某时期内发生某现象的观察单位数除以同期可能发生某现象的观察单位总数×比例基数

结构相对数：表示事物内部某一部分的个体数与该事物各部分个体数的总和之比，用来说明各构成部分在总体中所占的比重或分布，又称为构成比或百分比。构成比=某一组成部分的观察单位数除以同一事物各组成部分的观察单位数×100%

相对比（ratio）即两个有关指标之比，说明两指标间的比例关系。两个指标可以是性质相同，如不同时期发病数之比；也可以性质不同，如医院的门诊人次与病床数之比。通常以倍数或百分数（%）表示，相对比=甲指标除以乙指标×100%式中两指标可以是绝对数、相对数或平均数

几种常用的实验设计方法

（一）完全随机设计（completely random design)

它是最简单最常用的一种实验设计。它仅涉及一个处理因素，故又称单因素设计。其设计将受试对象同质个体随机分配到各个处理组或对照组中进行实验观察，或者分别从不同总体中随机抽样进行对比观察。

完全随机设计资料的统计分析方法有

t检验：数值变量资料呈正态、方差齐的两处理组的比较。

F检验，又名方差分析：可用两组或多处理组比较;

卡方检验、二项分布、Poisson分布、Fisher确切概率法：用于分类变量资料的比较。

秩和检验、中位数、Ridit分析等：可用两组或多组非正态分布的计量资料、等级资料、或其它自由分布资料的比较。

（二）配对设计（paired design）

配对设计是将受试对象按某些特征或条件一一配成对子，然后分别把每对中的两个受试对象，随机分配到实验组和对照组。这种实验能缩小受试对象间的个体差异，减少实验误差，提高实验效率。这种设计十分强调每对受试对象的齐同性、均衡性。

（三）配伍组设计（randomized block design）

配伍组设计亦称区组设计，其特点与配对设计一样，实际上是配对设计的扩展，每个配伍组有3个或3个以上的受试对象。在设计时，先将性质相同或相近的实验对象归为一区组，每个区组的例数就是处理组数；再将区组随机化，即各区组内的实验对象用随机化的方法，决定其被分配到哪一个处理组中。每个区组有较好的同质性。

处理组

配伍组 A B C D

Ⅰ 1 4 3 2

Ⅱ 5 6 8 7

Ⅲ10 9 12 11

Ⅳ16 14 13 15

配伍组设计优缺点：

优点：

1. 非处理因素控制得较好，各处理间可比性好;

2. 因增加了区组信息，统计效率提高了;

3. 区组间条件不同，一样可做实验，作区组间的对比，有利于搜集资料。

4. 各区组实验可在不同时间完成，误差不变，有利于实验实施。

缺点：

1. 样本完全随机化难;

2. 一个区组发生意外，该区组全部作费。

(四）交叉实验设计（cross design）

交叉设计是一种特殊的自身配对（两次配对），也属多因素实验设计。

注意：

1. 前后两阶段相隔的时间要足够，至少前一段产生的效果不复存在;

2. 如果实验能导致实验对象发生永久性的效果，就不能用这种设计。

（五）盲法设计

单盲：受试者不知道

双盲：受试者、执行者不知道

三盲：子课题设计者、受试者、执行者不知道

盲法关键是保密

（六）拉丁方实验设计（Latin square design)

拉丁方实验设计是参照K个拉丁字母排列的K×K 个随机方阵（拉丁方）所作的三个因素、等水平,无交互影响的实验。

临床试验( Clinical trial )设计

临床实验设计是研究疾病临床阶段的规律的实验，研究：

病因与机理，寻找早期诊断指标；

制定疾病临床分型，研究疗效；

多用复合指标。

一、临床试验设计的特点

（一）病例的选择：受试对象的诊断必须明确可靠。对疾病的分期、病型、病情必须定出统一的诊断标准。通常选反应稳定、中等病情比较合适。

不宜选作实验的对象：

1. 存在影响反应结果的并发症;

2. 危重状态;

3. 多种疗效无效;

4. 不能合作者

（二）设立对照：一般不设无处理对照组

（三）疗效的选择：研究者常需要多种治疗方法中选定一个或几个有效的方法。

（四）试验的偏性：为消除偏倚的影响，常采用双盲法和安慰剂（心理暗示治疗）。（五）效果评价：治疗法的选择、疗效指标的拟定和指标的分析。指标分单一和复合指标两种能全面评价分析多用复合指标。

二、临床设计常用设计方法

（一）完全随机化设计（completely random design)

（二）配对设计（pained design)

（三）交叉设计（cross-over design)

调查设计survey design

一、调查设计的意义及应用常用的调查有：

1. 居民健康状况调查

2. 流行病学调查

3. 病因调查

4. 临床远期疗效观察

5. 卫生学调查

(一）选题: 注意了解国内外动态，理论意义，应用价值

(二）明确调查目的，确定指标为什么要进行研究？解决什么问题？一个或几个问题？指标的灵敏度、特异度、客观性、精确性

(三）确定调查对象和观察单位

(四) 确定调查项目和制定调查表格

1.项目：分析项与备考项

2.调查表格：一览表和单一表

（五）调查范围与调查方式

1.调查范围：是根据目的而确定的空间范围、时间范围、数量范围（观察的例）。

2.调查方式：

(1) 直接法亲自检查

(2) 询问法回顾性调查

(3) 填表法病史调查

(4) 通讯法追踪调查

(1) 普查(overall survey) 是对被研究对象中的所有观察单位进行调查。

(2). 抽样调查(sampling survey) 是从总体中抽取一定数量的观察单位组成样本然后用样本推断总体，用样本统计量来估计总体参数。优点：“省、快、细、准”

常用的抽样方法：

Ⅰ单纯随机抽样(simple random sampling)

是在总体中以完全随机抽样的方法抽取的有代表性的一部分观察单位而组成的样本为单纯随机抽样。方法最简单，但较浪费一定资源。

(1)均数的标准误

(2)率的标准误

Ⅱ系统抽样(systematic sampling)机械抽样/等距抽样

Ⅲ分层抽样(stratified sampling)先按，对主要研究指标影响较大的某种特征，将总体分成若干类别（层stratum），再从每一个层随机抽取一定数量的观察单位，组成样本。

优点：

（1）组成样本的各个观察单位性质相同，误差小。

（2）分层抽样便于对不同层分别进行抽样。

（3）分层抽样便于对不同层分别进行统计分析。

Ⅳ整群抽样(cluster sampling)

先将总体按照某种与研究指标无关的特征划分为k 个?°群?±，每个群包含着若干个单位，然后再随机抽取k 个?°群?±，由抽取的各个?°群?±的全部观察单位组成的样本，即为整群抽样

优点：便于组织调查，节省调查成本。

缺点：误差大。

(三)典型调查(typical survey)是在对事物作全面分析的基础上，有目的地选定典型单位进行调查。

(四)病例对照研究（回顾性研究）是比较某病患者与未患该病暴露于某可能的危险因素的百分比差异，分析这些因素是否与该病存在联系。

(五)定群研究（队列研究、前瞻性研究）

是将特定人群分为暴露于某因素与未暴露于该因素的两组，或不同暴露水平的两组，追踪观察一定时间，比较两组的结果，是一种“从因到果”的研究方法。

误差最小的是分层抽样，而整群抽样的群数多，群内调查数少，则可减小抽样误差。

医学统计知识点整理(1)

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。变异：同质的基础上个体间的差异。 “同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的二、总体与样本 1、总体：是根据研究目的所确定的，同质观察对象（个体）所构成的全体。 2、样本：是从总体中随机抽取的部分观察单位变量值的集合。三、参数与统计量总体参数：根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量：根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的，抽样研究的目的就是用样本统计量来推断总体参数，包括区间估计和假设检验四、误差：实测值与真值之差★ 1.随机误差：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差：是一类恒定不变或遵循一定变化规律的误差，其产生原因往往是可知的或可能掌握的。 3.非系统误差：过失误差，可以避免或清除。五、概率是用来描述事件发生可能性大小的一个量值，常用P表示。概率取值0~1。统计上一般将P≤0.05或P≤0.01的事件称为小概率事件，表示其发生的概率很小，可以认为在一次抽样中不会发生。第二节统计资料的类型★

变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。表现为数值大小，带有度、量、衡单位。如身高（cm）、体重(kg)、血红蛋白（g）等。二、无序分类变量资料又称为定性资料或计数资料：将观察对象按观察对象的某种类别或属性进行分组计数，分组汇总各组观察单位后得到的资料。分类：二分类：+ -；有效，无效；多分类：ABO血型系统特点：没有度量衡单位，多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料，又称为计数资料。因为是按照变量的血型分类，血型表现为互不相容的属性。所以本题选C。【例题单选】测量正常人的脉搏数所得的变量是（） A.二分类变量 B.多分类变量 C.定量变量 D.定性变量【答案】C 【解析】脉搏数有数值大小，有度量衡，所以这个资料属于定量资料。本题选C。三、有序分类变量资料半定量资料或等级资料：将观察对象按观察对象的某种属性的不同程度分成等级后分组计数，分组汇总各组观察单位后得到的资料。特点：每一个观察单位没有确切值，各组之间有性质上的差别或程度上的不同举例：- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学最佳选择题

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学最佳选择题医学统计学最佳选择题一、绪论医学统计学最佳选择题一、绪论 1.下面的变量中，属于分类变量的是 A.脉搏 B.血型C.肺活量 D.红细胞计数 E.血压 2.下面的变量中，属于数值变量的是 A.性别 B.体重 C.血型 D.职业 E.民族 3.下列有关个人基本信息的指标，其中属于有序分类变量的是 A.学历 B.民族 C.职业 D.血型 E.身高 4.若要通过样本作统计推断，样本应是 A.总体中典型的一部分 B.总体中任意部分C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分E.总体中信息明确的一部分 5. 统计量是指 A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的量 E.是由样本数据计算出来的统计指标 6.下列关于概率的说法，错误的是 A.通常用 P 表示 B.大小在 0～1 之间 C.某事件发生的频率即概率 D.在实际工作中，概率是难以获得的 E.某事件发生的概率 P0.05 时，称为小概率事件。 7.减少抽样误差的有效途径是 A.避免系统误差 B.控制随机测量误差 C.增大样本含量 D.减少样本含量 E.以上都不对二、定量资料的统计描述 1．用均数和标准差能用于全面描述下列哪种资料的特征 A.正偏态分布 B.负偏态分布 C.正态分布 D.对数正态分布 E.任意分布 2．当各观察值呈倍数变 1 / 13

医学统计学基本概念

习题-医学统计学基本概念选择题： 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压，调查某地1000 人，记录每人是否患有高血压。最后清点结果，其中有10 名高血压患者，有990 名非高血压患者。（） A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指（） A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是（） A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级（轻、中、重） E.疾病疗效（有效、无效） 4、总体是由（） A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是（） A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是（） A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样，下列哪一项说法是正确的（） A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体，以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性，样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是（） A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是：() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

医学统计学试题和答案解析

第一套试卷及参考答案一、选择题 (4０分） 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式Ｂ负偏态分布 C 正偏态分布Ｄ正态分布与近似正态分布 3、要评价某市一名５岁男孩得身高就是否偏高或偏矮，其统计方法就是( A ） A 用该市五岁男孩得身高得９5%或９9%正常值范围来评价Ｂ用身高差别得假设检验来评价Ｃ用身高均数得9５％或９９%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（ A ) Ａ变异系数 B 方差Ｃ标准差 D 四分位间距５、产生均数有抽样误差得根本原因就是（ A ) A、个体差异Ｂ、群体差异Ｃ、样本均数不同Ｄ、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为（ A ）（A)相对比（B) 构成比（C)定基比 (D)率 7、统计推断得内容为（ D ) A、用样本指标估计相应得总体指标Ｂ、检验统计上得“检验假设”C、A与Ｂ均不就是Ｄ、Ａ与Ｂ均就是 8、两样本均数比较用t检验，其目得就是检验（ C ) Ａ两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本，样本含量分别为n1与n２，在进行成组设计资料得ｔ检验时,自由度就是（ D ） (A） n1+ n2 (B) n1+ n2–１（C) n1＋ n2 +1 (D）n1+ ｎ2-２ 10、标准误反映（ A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得（Ｃ） A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小Ｄ纵向距离最小１2、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为ｔr,对回归系数检验得ｔ值为ｔb,二者之间具有什么关系？（Ｃ) A t r>t b B t r〈t b C t r= tｂ D二者大小关系不能肯定 13、设配对资料得变量值为x１与x2,则配对资料得秩与检验（D ) A分别按ｘ1与x2从小到大编秩Ｂ把x１与x2综合从小到大编秩Ｃ把x１与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、０5，ν可认为( A ) Ａ各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同Ｄ各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原，其中甲年级调查3５人，阳性人数4人；乙年级调查40人,阳性人数８人。该资料宜选用得统计方法为（ A ） A.四格表检验 B、四格表校正检验 C t检验 D U检验 1６、为调查我国城市女婴出生体重：北方n1=5385，均数为3、０8kg,标准差为0、５3kｇ；南方n２=4８96,均数为3、1０ｋg,标准差为０、34kｇ,经统计学检验，p=0、０034〈0、０1,这意味着( D )

医学统计学试题及答案

《医学统计学》课程考试试题（A卷）（评卷总分：100分，考试时间：120分钟，考核方式：□开卷 V 闭卷）一、选择题（每题1分，共62分，只选一个正确答案） 1、医学科研设计包括（ D ） A．物力和财力设计 B．数据与方法设计 C．理论和资料设计 D．专业与统计设计 2、医学统计资料的分析包括（ D ） A．数据分析与结果分析 B．资料分析与统计分析 C．变量分析与变量值分析 D．统计描述与统计推断 3、医学资料的同质性指的是（ D ） A．个体之间没有差异 B．对比组间没有差异 C．变量值之间没有差异 D．研究事物存在的共性 4、离散型定量变量的测量值指的是（ D ） A．可取某区间内的任何值 B、可取某区间内的个别值 C．测量值只取小数的情况 D．测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是（ A ） A．无序二分类变量 B、定量变量． C．等级变量 D．无序多分类变量 6、计量资料编制频数表时，组距的选择（ D ） A．越大越好 B．越小越好 C．与变量值的个数无关 D．与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选（ D ）A．极差 B．方差 C．标准差 D．变异系数 8、若要用方差描述一组资料的离散趋势，对资料的要求是（ D ）A．未知分布类型的资料 B．等级资料 C．呈倍数关系的资料 D．正态分布资料 9、频数分布两端没有超限值时，描述其集中趋势的指标也可用（ D ） A．标准差 B．几何均数 C．相关系数 D．中位数 10、医学统计工作的步骤是（ A ） A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析，统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法，其正确的是（ A ） A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间（小时）分别为3, 4，5，3，2，5.5，2.5，6，6.5, 7,其中位数是（ B ） A．4 B．4.5 C．3 D．2 13、调查一组正常成年女性的血红蛋白，如果资料属于正态分布，描

医学统计学最佳选择题

医学统计学最佳选择题一、绪论 1、下面的变量中,属于分类变量的就是 A、脉搏 B、血型 C、肺活量 D、红细胞计数 E、血压 2、下面的变量中,属于数值变量的就是 A、性别 B、体重 C、血型 D、职业 E、民族 3、下列有关个人基本信息的指标,其中属于有序分类变量的就是 A、学历 B、民族 C、职业 D、血型 E、身高 4、若要通过样本作统计推断,样本应就是 A、总体中典型的一部分 B、总体中任意部分 C、总体中随机抽取的一部分 D、总体中选取的有意义的一部分 E、总体中信息明确的一部分 5、统计量就是指 A、就是统计总体数据得到的量 B、反映总体统计特征的量 C、就是根据总体中的全部数据计算出的统计指标 D、就是用参数估计出来的量 E、就是由样本数据计算出来的统计指标 6、下列关于概率的说法,错误的就是 A、通常用P表示

B、大小在0～1之间 C、某事件发生的频率即概率 D、在实际工作中,概率就是难以获得的 E、某事件发生的概率P≤0、05时,称为小概率事件。 7、减少抽样误差的有效途径就是 A、避免系统误差 B、控制随机测量误差 C、增大样本含量 D、减少样本含量 E、以上都不对二、定量资料的统计描述 1.用均数与标准差能用于全面描述下列哪种资料的特征 A、正偏态分布 B、负偏态分布 C、正态分布 D、对数正态分布 E、任意分布 2.当各观察值呈倍数变化(等比关系)时,平均数宜用 A、均数 B、几何均数 C、中位数 D、相对数 E、四分位数间距 3、某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标就是 A、M B、G C、X D、P95 E、CV 4、对于正态分布的资料 ,理论上 A、均数比中位数大

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误（ɑ错误）: H0为真时却被拒绝，弃真错误 Ⅱ型错误（β错误）: H0为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义:①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S x =S/√n ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

医学统计学最佳选择题

医学统计学最佳选择一、绪论 1. 下面的变量中，属于分类变量的是 A. 脉搏 B. 血型 C. 肺活量 D. 红细胞计数 E. 血压 2. 下面的变量中，属于数值变量的是 A. 性别 B. 体重 C. 血型 D. 职业 E. 民族 3. 下列有关个人基本信息的指标，其中属于有序分类变量的是 A. 学历 B. 民族 C. 职业 D. 血型 E. 身高 4. 若要通过样本作统计推断，样本应是 A. 总体中典型的一部分 B. 总体中任意部分 C. 总体中随机抽取的一部分 D. 总体中选取的有意义的一部分 E. 总体中信息明确的一部分 5. 统计量是指

A. 是统计总体数据得到的量 B. 反映总体统计特征的量 C. 是根据总体中的全部数据计算出的统计指标 D. 是用参数估计出来的量 E. 是由样本数据计算出来的统计指标 6. 下列关于概率的说法，错误的是 A. 通常用P 表示 B. 大小在0?1之间 C .某事件发生的频率即概率 D. 在实际工作中，概率是难以获得的 E. 某事件发生的概率P< 0.05时，称为小概率事件。 7. 减少抽样误差的有效途径是 A. 避免系统误差 B. 控制随机测量误差 C. 增大样本含量 D. 减少样本含量

E. 以上都不对二、定量资料的统计描述 1用均数和标准差能用于全面描述下列哪种资料的特征 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D.对数正态分布 E. 任意分布 2. 当各观察值呈倍数变化（等比关系）时，平均数宜用 A.均数 B.几何均数 C.中位数 D.相对数 E.四分位数间距 3. 某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是 A. M B. G C. X D. P95 E. CV 4. 对于正态分布的资料，理论上 A.均数比中位数大 B. 均数比中位数小 C. 均数等于中位数 D. 均数与中位数无法确定孰大孰小 E. 以上说法均不准确 5. 当资料两端含有不确定值时，描述其变异度宜采用

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法，错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中，概率是难以获得的 E. 某事件发生的概率很小，在单次研究或观察中时，称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中，属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标，其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法，不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言，参数难以测定，仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中，总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。答：当某事件发生的概率很小，习惯上认为小于或等于0.05时，统计学上称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就是所谓小概率事件原理，它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答：某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的，而参数是他们想知道的。一般情况下，这些参数是难以测定的，仅能根据样本估计。显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念答：研究人员通常需要了解和研究某一类个体，这个类就是总体。总体是根据研究目的所确定的观察单位的集合，通常有无限总体和有限总体之分，前者指总体中的个体数是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体数是有限的，它是指特定时间、空间中有限个研究个体。但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。例如在一项关于2007

医学统计学试题和答案.doc

医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（ b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C．研究典型案例研究误差 4．参数是指（ b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（a）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A. 均数不变，标准差改变 B. 均数改变，标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用（a ）。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中（d）可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用（c）描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后，（b）不变。 A．算术均数 B. 标准差 C. 几何均数 D.中位数 11.（ a）分布的资料，均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.（ c）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是（c ）。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体，具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比，其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布，其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A ．比较不同计量指标的变异程度 2. 对于近似正态分布的资料，描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4．应用百分位数法估计参考值范围的条件是B ．数据服从偏态分布 5．已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布，描述其个体差异的统计指标应使用 E ．四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ～9.1×109 /L ，其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差，应该使用的方法是 E.增加样本含量 5．两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学题库完整

第一章绪论习题一、选择题 1．统计工作和统计研究的全过程可分为以下步骤:（D ） A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中，习惯上把（B ）的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3～8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下：0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是（ A ）。 4.分别用两种不同成分的培养基（A 与B ）培养鼠疫杆菌，重复实验单元数均为5个，记录48小时各实验单元上生长的活菌数如下，A ：48、84、90、123、171；B ：90、116、124、225、84。该资料的类型是（C ）。 5.空腹血糖测量值，属于（ C ）资料。 6.用某种新疗法治疗某病患者41人，治疗结果如下：治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是（B ）。 7.某血库提供6094例ABO 血型分布资料如下：O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是（D ）。 8. 100名18岁男生的身高数据属于（C ）。二、问答题 1．举例说明总体与样本的概念. 答：统计学家用总体这个术语表示小异的对象全体，通常称为目标总体，而资料常来源于目标总体的一个较小总体，称为研究总体。实际中由于研究总体的个体众多，甚至无限多，因此科学的办法是从中抽取一部分具有代表性的个体，称为样本。例如，关于吸烟与肺癌的研究以英国成年男子为总体目标，1951年英国全部注册医生作为研究总体，按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2．举例说明同质与变异的概念答:同质与变异是两个相对的概念。对于总体来说，同质是指该总体的共同特征，即该总体区别于其他总体的特征；变异是指该总体部的差异，即个体的特异性。例如，某地同性别同年龄的小学生具有同质性，其身高、体重等存在变异。 3．简要阐述统计设计与统计分析的关系答：统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的，统计设计在前，然而一定的统计设计

医学统计学试题及答案

第一套试卷及参考答案一、选择题（40分） 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（ B ） A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮，其统计方法是（A ） A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（ A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍，该指标为（A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t检验时，自由度是（D ）（A）n1+ n2（B）n1+ n2–1 （C）n1+ n2 +1 （D）n1+ n2 -2 10、标准误反映（A ） A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) Ａ垂直距离的平方和最小Ｂ垂直距离最小Ｃ纵向距离的平方和最小Ｄ纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r，对回归系数检验的t值为t b，二者之间具有什么关系？（C） A t r>t b B t rχ20.05,ν可认为（A ） A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原，其中甲年级调查35人，阳性人数4人；乙年级调查40人，阳性人数8人。该资料宜选用的统计方法为（ A ） A．四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重：北方n1=5385，均数为3.08kg，标准差为0.53kg；南方n2=4896，均数为3.10kg，标准差为0.34kg，经统计学检验，p=0.0034<0.01，这意味着（D ） A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

(完整word版)医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.（ c ）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是（ c ）。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学总复习练习题(含答案)

一、最佳选择题 1．卫生统计工作的步骤为C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2．统计分析的主要内容有D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3．统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4．抽样误差是指B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指B

A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6．描述一组偏态分布资料的变异度，宜用D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差 7．用均数与标准差可全面描述其资料分布特点的是C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8．比较身高和体重两组数据变异度大小宜采用A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9．频数分布的两个重要特征是C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10．正态分布的特点有B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11．正态分布曲线下右侧5％对应的分位点为D

医学统计学试题及其答案

l．统计中所说的总体是指： A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2．概率P=0，则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3．抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4．测量身高、体重等指标的原始资料叫： B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5．某种新疗法治疗某病患者41人，治疗结果如下：治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是： D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6．样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7．将计量资料制作成频数表的过程，属于统计工作哪个基本步骤：C A统计设计B收集资料C整理资料D分析资料E以上均不对8．统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9．良好的实验设计，能减少人力、物力，提高实验效率；还有助于消除或减少： B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10．以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11．表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12．某计量资料的分布性质未明，要计算集中趋势指标，宜选择 C A X B G C M D S E C V 13．各观察值均加（或减）同一数后： B A均数不变，标准差改变B均数改变，标准差不变 C两者均不变D两者均改变E以上均不对14．某厂发生食物中毒，9名患者潜伏期分别为：16、2、6、3、30、2、l O、2、24+(小时)，问该食物中毒的平均潜伏期为多少小时 C A5B5．5C6D10E1 2

(完整版)医学统计学试题及答案[1]

医学统计学试题及答案医学试题精选2009-12-20 12:28:11 阅读6171 评论0 字号：大中小订阅第一套试卷及参考答案一、选择题（40分） 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（ B ） A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮，其统计方法是（ A ） A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（ A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍，该指标为（A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t检验时，自由度是（ D ）（A）n1+ n2 （B）n1+ n2–1 （C）n1+ n2 +1 （D）n1+ n2 -2

医学统计学基本概念[资料]

医学统计学基本概念 1.医学统计学是以医学理论为指导，应用概率论与数理统计的有关原理和方法，研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤：（1）设计（2）收集资料（3）整理资料（4）分析资料；或者分三步：（1）研究设计（2）资料分析（3）结论。 3.定量资料：又称为数值变量资料，特点：（1）各观察值之间有量的差别；（2）数据间有连续性。它是指变量的取值不止是可列个，而是可取某区间[a,b]，（-oo,oo）上的一切值。 4.定性资料：又称为分类资料、分类变量资料（包括二项分类、多项分类资料），特点：（1）各观察值之间有质的差别；（2）数据间有离散性。它是指变量的取值有限的，至多是可列多个。附：无序分类：二项分类、多项分类 5.等级资料：又称为半定量资料，有序分类，指各类之间有程度的差别。特点：（）各观察单位间或者相同，或者存在质的差别；（2）各等级间只有顺序，而无数值大小，故等级之间不可度量。 6.个体individual：即每个观察单位。 7.总体population：根据研究目的确定的同质观察单位的全体。 8.样本：是从总体中随机抽取部分观察单位，其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters：描述某总体特征的统计指标称为总体参数，简称参数。如总体均数、总体标准差等。特点：参数是未知的，固有的，不变的！ 10.统计量：描述某样本特征的的统计指标称为样本统计量，简称统计量。特点：统计量是已知的，变化的，有误差的！ 11.概率probability：是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件：（1）可重复性：相同条件下可重复进行；（2）随机性：出现两种机两种以上结果；（3）偶然性：实验前不能肯定将出现哪种结果。 13.频率的稳定性：在重复试验中，事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p，频率的这一特性称为频率的稳定性。 14.概率的统计定义：频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性，因而是可以被认识和度量的。这个常数p就称为事件A出现的概率(probability)，记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出，频率为一变量，是样本统计量，而概率为常数，是一总体参数。实践中，当试验次数足够多时，可以近似地将频率作为概率的一个估计。 15.小概率原理：当某事件发生的概率小于或等于0.05时，统计学通常称该事件为小概率事件，其涵义为该事件发生的可能性很小，进而认为其在一次抽样中不可能发生，此即为小概率原理。 16.同质（homogeneity）：性质相同的事物称为同质的。 17.变异(variation)：同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异，而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化，因此需要确定其波动范围，即正常值范围，简称正常值(normal value)。 19.正常值范围(normal ranges)，是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error)：样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计：由样本信息估计总体参数称为参数估计，包括点估计和区间估计。 23.点估计(point estimation) ：直接用样本统计量作为总体参数的估计值。这种估计方法简单，但未考虑抽样误差的大小。 24.区间估计(interval estimation) ：按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围，这个范围称作可信度为1-α的可信区间(confidence interval, CI)，又称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是：每100个样本所算得的100(1-α)％可信区间，平均有100(1-α)个包含了总体参数。如取α=0.05，则每100个样本所算得的100个95％可信区间，平均有95个包含总体参数在内，有5个不包含总体参数。 26.可信区间的两个要素：第一个要素是可靠性，常用可信度1-α的大小表示；第二个要素是精确性，常用可信区间的长度CU-CL衡量。 27.均数95%可信区间，其涵义是：如果重复100次抽样，每次样本含量均为n，每个样本均按（见课本P42）构建可信区间，则在此100个可信区间内，理论上有95个包含总体均数，而有5个不包含总体均数。 28.可信度为95%的CI的涵义：每100个样本，按同样方法计算95%的CI，平均有95%的CI包含了总体参数。这里的95%，指的是方法本身！而不是某个区间！ 29.第一类错误（I型错误）：拒绝了实际上成立的H0假设，称为“假阳性”, 用α来表示。 30.第二类错误（II型错误）：不拒绝实际上不成立的H0，称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效：1-β称检验效能(power of a test)，过去称把握度。为当两总体确有差异，按检验水准α所能发现该差异的能力。1-β只取单尾。 32.完全随机设计：根据某一试验因素，将试验对象完全按随机设计分为若干个组，每个组的样本例数可以相等，也可以不等，分别求出各组试验结果的均数，即为单因素多个样本均数，单个因素可以有多个水平，R>2 33.随机区组设计又称配伍组设计(Random Block Design)：即两因素多个样本均数的比较(或称两因素方差分析，two way analysis of variance）。 34.绝对数：在计数资料中，各组的观察数称绝对数。 35.相对数：是两个有联系的指标的比，计数资料的统计描述主要是相对数（relative number）。 36.率（rate）：说明某现象发生的频率或强度，常用%、‰、1/万、1/10万等作单位，表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常以保留1-2位整数为宜。